Svetové modely: Miliardová stávka umelej inteligencie na fyzickú realitu
V roku 2026 sa odvetvie umelej inteligencie presúva od jazykových modelov k „svetovým modelom“ – systémom, ktoré chápu a simulujú trojrozmernú realitu – a miliardy dolárov prúdia do spoločností World Labs Fei-Fei Li, AMI Labs Yanna LeCuna a Google DeepMind.
Za hranicami textu: vzniká nový paradigmu
Po celé roky dosahovala umelá inteligencia najdramatickejšie pokroky prostredníctvom jazyka – rozsiahlych modelov trénovaných na texte, schopných písať eseje, odpovedať na otázky a generovať kód. Rastúci počet výskumníkov však tvrdí, že tieto jazykové modely, hoci sú impozantné, sú voči fyzickému svetu v podstate slepé. V roku 2026 prúdia miliardy dolárov do alternatívy: svetových modelov, systémov umelej inteligencie navrhnutých na pochopenie a simuláciu trojrozmernej reality.
Miliardová stávka Fei-Fei Li
Najvýraznejší signál prišiel 18. februára, keď World Labs získalo v novom kole financovania 1 miliardu dolárov, čím sa hodnota startupu vyšplhala na približne 5 miliárd dolárov. Spoločnosť World Labs, ktorú založila priekopníčka umelej inteligencie Fei-Fei Li – profesorka zo Stanfordu, ktorá vytvorila ImageNet a pomohla naštartovať éru hlbokého učenia – buduje to, čo nazýva „priestorovou inteligenciou“: umelú inteligenciu, ktorá dokáže vnímať, uvažovať a generovať koherentné trojrozmerné prostredia.
Medzi podporovateľov patria spoločnosti Nvidia, AMD, Andreessen Horowitz a Autodesk, ktorá sama prispela sumou 200 miliónov dolárov. Obidve spoločnosti plánujú integrovať technológiu World Labs priamo do profesionálnych nástrojov na 3D dizajn, počnúc zábavným priemyslom. Vlajkový produkt spoločnosti, Marble, umožňuje používateľom generovať celé 3D svety z obrázkov, videí alebo textových podnetov.
LeCunova kontroverzná stávka
Len pár týždňov predtým Yann LeCun, jeden z „krstných otcov“ hlbokého učenia a dlhoročný vedecký riaditeľ laboratória umelej inteligencie spoločnosti Meta, oznámil, že po 12 rokoch opúšťa spoločnosť, aby založil AMI Labs, a získal 500 miliónov eur pri hodnotení 3 miliardy eur. Tento startup so sídlom v Paríži a pobočkami v Montreale, New Yorku a Singapure je postavený na LeCunovom dlhoročnom presvedčení, že veľké jazykové modely sú slepou uličkou na ceste k všeobecnej inteligencii.
„Škálovanie LLM nám neumožní dosiahnuť AGI,“opakoval LeCun. AMI Labs bude vyvíjať modely sveta pomocou JEPA (Joint Embedding Predictive Architecture), rámca, ktorý LeCun ako prvý zaviedol v spoločnosti Meta a ktorý učí umelú inteligenciu nielen predpovedať nasledujúce slovo, ale aj rozumieť kauzálnej dynamike fyzického prostredia.
Interaktívne svety DeepMind
Google DeepMind sa v auguste 2025 rozhodne zapojil do súťaže s Genie 3, prvým svetovým modelom schopným generovať interaktívne prostredia v reálnom čase. Na základe textovej výzvy Genie 3 vytvára dynamické, navigovateľné 3D scény s rýchlosťou 24 snímok za sekundu a rozlíšením 720p, pričom si zachováva konzistentnosť po dobu niekoľkých minút – čo je dramatický skok oproti limitu 10 až 20 sekúnd, ktorý mal jeho predchodca. Časopis TIME ho označil za jeden z najlepších vynálezov roku 2025. Google ho odvtedy sprístupnil predplatiteľom AI Ultra prostredníctvom prototypovej webovej aplikácie s názvom Project Genie.
Šéf DeepMind Demis Hassabis sa pripojil k kritike LeCuna: jazykové modely napriek silnému benchmarkovému výkonu postrádajú interné modely sveta potrebné na zachytenie kauzality a fyzikálnej dynamiky – základov skutočnej inteligencie.
Prečo jazykové modely nestačia
Hlavným argumentom proti LLM je architektúra. Tieto modely sa učia štatistické vzory v texte; dokážu opísať padajúci predmet bez toho, aby chápali gravitáciu. Modely sveta sa naopak učia predpovedať, ako sa prostredie mení v čase v reakcii na akcie, a vytvárajú vnútornú reprezentáciu fyzikálnej kauzality, ktorú samotný jazyk nedokáže poskytnúť.
Toto rozlíšenie má hlboké praktické dôsledky. Roboty riadené modelmi sveta môžu plánovať a vykonávať fyzické úlohy; priestorová umelá inteligencia môže pomáhať architektom, filmárom a vedcom spôsobmi, ktoré generovanie textu nedokáže. Otázka pre rok 2026 už nie je, či sú modely sveta dôležité, ale aký prístup, aká architektúra a aká spoločnosť budú definovať ďalšiu éru umelej inteligencie.