Ako funguje autonómne riadenie typu end-to-end – bez potreby máp

Starý spôsob: Riadenie prostredníctvom komisie

Už viac ako desať rokov je dominantným prístupom k samo-riadiacim autám modulárny systém. Inžinieri rozdeľujú úlohu riadenia do reťazca špecializovaných modulov – vnímanie, sledovanie, predikcia, plánovanie a riadenie – každý s vlastným kódom, vlastnými vstupmi a vlastnými výstupmi. Lidar senzor dodáva 3D mapu; mapa dodáva plánovač pohybu; plánovač dodáva ovládač, ktorý otáča volantom.

Táto architektúra je logická, transparentná a ľahko sa ladí. Keď sa niečo pokazí, inžinieri môžu vystopovať zlyhanie až k špecifickému modulu. Má to však zásadnú chybu: informácie sa strácajú pri každom odovzdávaní. Malé chyby v jednom module sa kumulujú v celom reťazci. A pretože každá súčasť je ladená nezávisle, systém je len taký dobrý, ako jeho najslabší článok.

Čo je horšie, tradičné systémy závisia od máp s vysokým rozlíšením – centimetrovo presných 3D modelov každej cesty, značenia jazdných pruhov a obrubníka. Vytváranie a údržba týchto máp je nákladná a pomalá, a preto väčšina robotaxi služieb stále funguje len v niekoľkých geograficky ohraničených mestách.

Nový spôsob: Jedna sieť, od senzora po riadenie

Autonómne riadenie typu end-to-end nahrádza celý modulárny reťazec jedinou veľkou neurónovou sieťou. Vstupom je surový záznam z kamery; výstupom je plán riadenia. Sieť sa učí vnímanie, predikciu a plánovanie súčasne, optimalizujúc každú vrstvu smerom k jednému cieľu: bezpečnému riadeniu.

Koncept nie je nový – výskumníci demonštrovali základné verzie už v 80. rokoch – ale nedávne pokroky v hlbokom učení, architektúrach transformátorov a rozsiahlych výpočtových klastroch ho urobili praktickým. Podľa komplexného prieskumu publikovaného na arXiv, autonómna komunita riadenia zaznamenala rýchly rast end-to-end rámcov, ktoré používajú surový senzorový vstup na priame generovanie plánov pohybu vozidla.

Kľúčovým poznatkom je, že spoločná optimalizácia prekonáva izolované ladenie. Keď vnímanie a plánovanie zdieľajú rovnaký gradientový signál, sieť sa učí venovať pozornosť tomu, čo je skutočne dôležité pre riadenie – nielen tomu, čo sa ľudský inžinier rozhodol označiť.

Kto to buduje?

Tri spoločnosti vedú snahu o end-to-end riešenia. Tesla nahradila približne 300 000 riadkov ručne kódovaného C++ jedinou neurónovou sieťou vo svojom softvéri Full Self-Driving, počnúc verziou 12 v roku 2024 a dramaticky sa rozšírila s FSD v13, ktorá integruje parkovanie, riadenie a cúvanie do jedného zjednoteného modelu. Systém prijíma video z ôsmich kamier a priamo vydáva príkazy na riadenie, zrýchlenie a brzdenie.

Londýnska spoločnosť Wayve posunula filozofiu bez máp najďalej. Platforma Wayve, podporovaná spoločnosťami Microsoft a SoftBank, demonštrovala autonómne riadenie vo viac ako 90 mestách bez akéhokoľvek predchádzajúceho HD mapovania – prispôsobuje sa novým geografickým oblastiam v priebehu týždňov, nie rokov. Izraelský startup Imagry sleduje podobnú víziu a nazýva svoj prístup „riadenie nezávislé od polohy“.

Výhody a riziká

Výhody sú presvedčivé. End-to-end systémy sú dramaticky škálovateľnejšie, pretože nevyžadujú drahé HD mapy pre každú novú cestu. Zvládajú okrajové prípady elegantnejšie, pretože sieť videla počas tréningu milióny scenárov riadenia v reálnom svete. A sú výpočtovo efektívnejšie – jeden model namiesto tucta.

Riziká sú však reálne. End-to-end siete sú čierne skrinky. Keď auto urobí chybu, inžinieri nemôžu ľahko vystopovať chybu k špecifickému rozhodovaciemu bodu, čo sťažuje certifikáciu a reguláciu. Tieto systémy tiež vyžadujú obrovské tréningové datasety – Tesla čerpá z miliárd najazdených kilometrov dát z vozového parku, čo je zdroj, ktorému sa len málo konkurentov môže vyrovnať. Ako poznamenali výskumníci z UC Berkeley poznamenali, prekonanie medzery v interpretovateľnosti medzi modulárnymi a end-to-end systémami zostáva otvorenou výzvou.

Čo bude nasledovať

Mnohé tímy teraz skúmajú hybridné architektúry, ktoré kombinujú end-to-end učenie s modulárnymi bezpečnostnými kontrolami – používajú neurónové siete na plánovanie, ale zachovávajú pravidlá založené na ochranných zábranách pre núdzové brzdenie a predchádzanie kolíziám. Podľa výskumu publikovaného v časopise Sensors, cieľom týchto hybridov je zachytiť prispôsobivosť hlbokého učenia bez toho, aby obetovali transparentnosť, ktorú vyžadujú regulátori.

Posun od ručne kódovaných systémov k učenej inteligencii riadenia odráža širší trend v AI: nahrádzanie funkcií navrhnutých ľuďmi modelmi, ktoré objavujú svoje vlastné reprezentácie. Či sa end-to-end systémy preukážu ako dostatočne bezpečné na to, aby si získali dôveru verejnosti – a regulačné schválenie – rozhodne o tom, či budúca generácia samo-riadiacich áut konečne opustí geografické ohraničenie.

Ako funguje autonómne riadenie typu end-to-end – bez potreby máp

Starý spôsob: Riadenie prostredníctvom komisie

Nový spôsob: Jedna sieť, od senzora po riadenie

Kto to buduje?

Výhody a riziká

Čo bude nasledovať

Podobné články

Ako funguje Air Force One – lietajúci Biely dom

Ako funguje Mechanizmus EÚ v oblasti civilnej ochrany

Ako fungujú americké vojenské základne v Európe – a prečo

Ako funguje inteligencia chobotníc – decentralizovaná myseľ

Ako funguje Air Force One – lietajúci Biely dom

Ako funguje Triple Crown – najťažšia cena v dostihovom športe

Ako teleskop SPHEREx od NASA zmapuje celú oblohu v 102 farbách

Ako funguje rotujúce predsedníctvo v Bezpečnostnej rade OSN

Nenechajte si ujsť nové články!