Hogyan működik a végponttól végpontig terjedő önvezetés – nincs szükség térképekre

A régi módszer: Bizottsági vezetés

Több mint egy évtizede az önvezető autók domináns megközelítése a moduláris rendszer volt. A mérnökök a vezetési feladatot speciális modulok láncára bontják – érzékelés, követés, előrejelzés, tervezés és irányítás –, amelyek mindegyikének saját kódja, saját bemenetei és saját kimenetei vannak. Egy lidar szenzor egy 3D-s térképet táplál; a térkép egy mozgástervezőt; a tervező pedig egy vezérlőt, amely elfordítja a kormányt.

Ez az architektúra logikus, átlátható és könnyen debugolható. Ha valami elromlik, a mérnökök a hibát egy adott modulra tudják visszavezetni. De van egy alapvető hibája: információ vész el minden átadásnál. Egy modulban lévő kis hibák összeadódnak a láncon keresztül. És mivel minden alkatrészt külön hangolnak, a rendszer csak annyira jó, mint a leggyengébb láncszeme.

Ráadásul a hagyományos rendszerek nagy felbontású térképektől függenek – centiméter pontosságú 3D-s modellektől minden útról, sávjelzésről és járdaszegélyről. E térképek elkészítése és karbantartása költséges és lassú, ezért a legtöbb robotaxi szolgáltatás még mindig csak néhány körülhatárolt városban működik.

Az új módszer: Egyetlen hálózat, szenzortól a kormányzásig

A végponttól végpontig terjedő autonóm vezetés a teljes moduláris láncot egy egyetlen nagy neurális hálózattal helyettesíti. Nyers kamerafelvételek mennek be; egy vezetési terv jön ki. A hálózat egyszerre tanulja meg az érzékelést, az előrejelzést és a tervezést, minden réteget egyetlen cél felé optimalizálva: a biztonságos vezetést.

A koncepció nem új – a kutatók az 1980-as években bemutattak alapvető verziókat –, de a mélytanulás, a transzformátor architektúrák és a hatalmas számítási klaszterek terén elért legújabb eredmények gyakorlatiassá tették. Az arXiv-on közzétett átfogó felmérés szerint az autonóm vezetési közösség a végponttól végpontig terjedő keretrendszerek gyors növekedését tapasztalta, amelyek nyers szenzor bemenetet használnak a jármű mozgásterveinek közvetlen generálásához.

A legfontosabb felismerés az, hogy a közös optimalizálás felülmúlja az izolált hangolást. Amikor az érzékelés és a tervezés ugyanazt a gradiens jelet osztja meg, a hálózat megtanul figyelni arra, ami valójában számít a vezetéshez – nem csak arra, amit egy emberi mérnök úgy döntött, hogy felcímkéz.

Ki építi ezt?

Három vállalat vezeti a végponttól végpontig terjedő törekvést. A Tesla körülbelül 300 000 sornyi kézzel kódolt C++ kódot cserélt le egyetlen neurális hálózatra a Full Self-Driving szoftverében, kezdve a 2024-es 12-es verzióval, és drámaian bővítve az FSD v13-mal, amely a parkolást, a vezetést és a hátramenetet egyetlen egységes modellbe integrálja. A rendszer nyolc kamera videóját veszi fel, és közvetlenül kormányzási, gyorsítási és fékezési parancsokat ad ki.

A londoni székhelyű Wayve vitte a legtovább a térkép nélküli filozófiát. A Microsoft és a SoftBank támogatásával a Wayve platformja több mint 90 városban mutatott be autonóm vezetést mindenféle korábbi HD térképezés nélkül – hetek, nem évek alatt alkalmazkodva az új földrajzi területekhez. Az izraeli Imagry startup hasonló elképzelést követ, megközelítését „helyfüggetlen” vezetésnek nevezve.

Előnyök és kockázatok

Az előnyök meggyőzőek. A végponttól végpontig terjedő rendszerek drámaian jobban skálázhatók, mert nincs szükségük drága HD térképekre minden új úthoz. Az extrém eseteket kecsesebben kezelik, mert a hálózat a képzés során valós vezetési szcenáriók millióit látta. És számításigényesebbek is – egy modell egy tucat helyett.

De a kockázatok valósak. A végponttól végpontig terjedő hálózatok fekete dobozok. Amikor az autó hibázik, a mérnökök nem tudják könnyen visszavezetni a hibát egy adott döntési pontra, ami megnehezíti a tanúsítást és a szabályozást. Ezek a rendszerek hatalmas képzési adatkészleteket is igényelnek – a Tesla a flottájából származó adatok milliárdjait használja fel, amihez kevés versenytárs tud felérni. Ahogy a UC Berkeley kutatói megjegyezték, a moduláris és a végponttól végpontig terjedő rendszerek közötti értelmezhetőségi szakadék áthidalása továbbra is nyitott kérdés.

Mi következik

Sok csapat most hibrid architektúrákat vizsgál, amelyek a végponttól végpontig terjedő tanulást moduláris biztonsági ellenőrzésekkel kombinálják – neurális hálózatokat használva a tervezéshez, de megtartva a szabályalapú védőkorlátokat a vészfékezéshez és az ütközés elkerüléséhez. A Sensors folyóiratban megjelent kutatás szerint ezek a hibridek a mélytanulás alkalmazkodóképességét kívánják megragadni anélkül, hogy feláldoznák a szabályozók által megkövetelt átláthatóságot.

A kézzel kódolt rendszerekről a tanult vezetési intelligenciára való áttérés az AI egy szélesebb körű trendjét tükrözi: az ember által tervezett funkciók felváltása olyan modellekkel, amelyek saját reprezentációkat fedeznek fel. Az, hogy a végponttól végpontig terjedő rendszerek bizonyítani tudják-e, hogy elég biztonságosak ahhoz, hogy elnyerjék a közbizalmat – és a szabályozói jóváhagyást –, eldönti, hogy az önvezető autók következő generációja végre maga mögött hagyja-e a körülhatárolt területet.

Hogyan működik a végponttól végpontig terjedő önvezetés – nincs szükség térképekre

A régi módszer: Bizottsági vezetés

Az új módszer: Egyetlen hálózat, szenzortól a kormányzásig

Ki építi ezt?

Előnyök és kockázatok

Mi következik

Kapcsolódó cikkek

Hogyan működik az Air Force One – a repülő Fehér Ház

Hogyan működik az EU Polgári Védelmi Mechanizmusa

Hogyan működnek az amerikai katonai bázisok Európában – és miért

Hogyan Működik a Polipok Intelligenciája – Egy Megosztott Elme

Hogyan működik az Air Force One – a repülő Fehér Ház

Hogyan működik a háborús jogkörökről szóló határozat – és miért hagyják figyelmen kívül az elnökök

Hogyan Működik a Triple Crown – A Lóversenyzés Legnehezebb Díja

Hogyan térképezi fel a NASA SPHEREx űrtávcsöve az egész eget 102 színben

Ne maradjon le az új cikkekről!