Technologie

Comment fonctionne la conduite autonome de bout en bout, sans cartes ?

Une nouvelle génération de véhicules autonomes abandonne les cartes HD et les règles codées à la main au profit d'un seul réseau neuronal qui apprend à conduire comme les humains, en observant la route.

R
Redakcia
5 min de lecture
Partager
Comment fonctionne la conduite autonome de bout en bout, sans cartes ?

L'ancienne méthode : la conduite par comité

Depuis plus d'une décennie, l'approche dominante pour les voitures autonomes est le pipeline modulaire. Les ingénieurs décomposent la tâche de conduite en une chaîne de modules spécialisés (perception, suivi, prédiction, planification et contrôle), chacun ayant son propre code, ses propres entrées et ses propres sorties. Un capteur lidar alimente une carte 3D ; la carte alimente un planificateur de mouvement ; le planificateur alimente un contrôleur qui tourne le volant.

Cette architecture est logique, transparente et facile à déboguer. En cas de problème, les ingénieurs peuvent remonter la panne jusqu'à un module spécifique. Mais elle présente un défaut fondamental : l'information est perdue à chaque transfert. De petites erreurs dans un module s'accumulent tout au long de la chaîne. Et comme chaque composant est réglé indépendamment, le système n'est aussi performant que son maillon le plus faible.

Pire encore, les systèmes traditionnels dépendent de cartes haute définition, des modèles 3D au centimètre près de chaque route, marquage au sol et bordure de trottoir. La construction et la maintenance de ces cartes sont coûteuses et lentes, c'est pourquoi la plupart des services de robotaxis fonctionnent encore dans une poignée de villes géorepérées.

La nouvelle méthode : un seul réseau, du capteur à la direction

La conduite autonome de bout en bout remplace toute la chaîne modulaire par un seul grand réseau neuronal. Des images brutes de la caméra entrent ; un plan de conduite sort. Le réseau apprend la perception, la prédiction et la planification simultanément, optimisant chaque couche vers un seul objectif : conduire en toute sécurité.

Le concept n'est pas nouveau (des chercheurs en ont démontré des versions de base dans les années 1980), mais les récentes avancées en matière d'apprentissage profond, d'architectures de transformateurs et de clusters de calcul massifs l'ont rendu pratique. Selon une étude exhaustive publiée sur arXiv, la communauté de la conduite autonome a connu une croissance rapide des cadres de bout en bout qui utilisent des données brutes de capteurs pour générer directement des plans de mouvement du véhicule.

L'idée clé est que l'optimisation conjointe est plus efficace que le réglage isolé. Lorsque la perception et la planification partagent le même signal de gradient, le réseau apprend à prêter attention à ce qui compte réellement pour la conduite, et pas seulement à ce qu'un ingénieur humain a décidé d'étiqueter.

Qui construit cela ?

Trois entreprises sont à la pointe de la poussée du bout en bout. Tesla a remplacé environ 300 000 lignes de C++ codées à la main par un seul réseau neuronal dans son logiciel Full Self-Driving, en commençant par la version 12 en 2024 et en s'étendant considérablement avec FSD v13, qui intègre le stationnement, la conduite et la marche arrière dans un modèle unifié. Le système prend la vidéo de huit caméras et produit directement des commandes de direction, d'accélération et de freinage.

La société londonienne Wayve a poussé la philosophie sans carte le plus loin. Soutenue par Microsoft et SoftBank, la plateforme de Wayve a démontré la conduite autonome dans plus de 90 villes sans aucune cartographie HD préalable, s'adaptant à de nouvelles zones géographiques en quelques semaines plutôt qu'en quelques années. La startup israélienne Imagry poursuit une vision similaire, qualifiant son approche de conduite « indépendante du lieu ».

Avantages et risques

Les avantages sont convaincants. Les systèmes de bout en bout sont nettement plus évolutifs car ils ne nécessitent pas de cartes HD coûteuses pour chaque nouvelle route. Ils gèrent les cas extrêmes avec plus d'élégance car le réseau a vu des millions de scénarios de conduite réels pendant la formation. Et ils sont plus efficaces sur le plan du calcul : un seul modèle au lieu d'une douzaine.

Mais les risques sont réels. Les réseaux de bout en bout sont des boîtes noires. Lorsque la voiture fait une erreur, les ingénieurs ne peuvent pas facilement remonter l'erreur jusqu'à un point de décision spécifique, ce qui rend la certification et la réglementation plus difficiles. Ces systèmes nécessitent également d'énormes ensembles de données d'entraînement : Tesla s'appuie sur des milliards de kilomètres de données de flotte, une ressource que peu de concurrents peuvent égaler. Comme l'ont noté des chercheurs de l'UC Berkeley, combler le fossé d'interprétabilité entre les systèmes modulaires et les systèmes de bout en bout reste un défi ouvert.

Quelles sont les prochaines étapes ?

De nombreuses équipes explorent maintenant des architectures hybrides qui combinent l'apprentissage de bout en bout avec des contrôles de sécurité modulaires, en utilisant des réseaux neuronaux pour la planification, mais en conservant des garde-fous basés sur des règles pour le freinage d'urgence et l'évitement des collisions. Selon une recherche publiée dans la revue Sensors, ces hybrides visent à capturer l'adaptabilité de l'apprentissage profond sans sacrifier la transparence exigée par les régulateurs.

Le passage des pipelines codés à la main à l'intelligence de conduite apprise reflète une tendance plus large de l'IA : remplacer les fonctionnalités conçues par l'homme par des modèles qui découvrent leurs propres représentations. La question de savoir si les systèmes de bout en bout peuvent s'avérer suffisamment sûrs pour gagner la confiance du public (et l'approbation réglementaire) déterminera si la prochaine génération de voitures autonomes finit par quitter la zone géorepérée.

Cet article est également disponible dans d'autres langues :

Articles connexes