Hogyan működik a neuro-szimbolikus MI – és miért fontos?
A neuro-szimbolikus MI egyesíti a neurális hálózatokat a szabályalapú logikával, hogy olyan rendszereket hozzon létre, amelyek úgy gondolkodnak, mint az emberek, csökkentik az energiafelhasználást, és kiküszöbölik a mai nagyméretű nyelvi modelleket sújtó hallucinációkat.
Két agy, egy gép
A modern mesterséges intelligenciának kettős személyisége van. Az egyik oldalon a neurális hálózatok állnak – erőteljes mintázatfelismerő motorok, amelyek hatalmas adathalmazokból tanulnak, de nem tudják megmagyarázni a gondolkodásukat, és rendszeresen tényeket gyártanak. A másik oldalon a szimbolikus MI található, a szabályalapú logika, amely az 1980-as években uralta a területet: átlátható és pontos, mégis merev és szűk látókörű. A neuro-szimbolikus MI mindkettőt egyetlen architektúrába olvasztja, és egyre több kutatás sugallja, hogy ez a hibrid lehet a kulcs ahhoz, hogy a MI megbízható, hatékony és sokkal képességesebb legyen.
Mi az a neuro-szimbolikus MI?
Lényegében egy neuro-szimbolikus rendszer három rétegből áll. Egy neurális percepciós réteg nyers, strukturálatlan adatokat – képeket, hangot, szöveget – dolgoz fel mélytanulás segítségével a minták és jellemzők felismerésére. Egy szimbolikus következtetési réteg formális logikát, tudásgráfokat és explicit szabályokat alkalmaz a neurális réteg által találtak értelmezésére. Egy integrációs réteg összeköti a kettőt, oda-vissza továbbítva az információkat, hogy a mintázatfelismerés és a logikai következtetés erősítse egymást.
Gondoljunk erre úgy, mint a különbségre egy olyan gyermek között, aki fel tud ismerni egy macskát egy fényképen (neurális), és egy olyan között, aki azt is tudja, hogy a macskák emlősök, az emlősök melegvérűek, és a melegvérű állatoknak táplálékra van szükségük (szimbolikus). A neuro-szimbolikus gyermek lát is és gondolkodik is.
Miért oldja meg a hallucinációs problémát?
A nagyméretű nyelvi modellek, mint például a ChatGPT, statisztikai valószínűség alapján generálnak szöveget, nem pedig megértés alapján. Ezért produkálnak néha magabiztosan hangzó értelmetlenségeket – az úgynevezett hallucinációkat. Artur Garcez, a Londoni City St George's Egyetem számítástechnika professzora szerint a neuro-szimbolikus MI "a válasz a nagyméretű nyelvi modellek képtelenségére, hogy abbahagyják a hallucinálást", mert a szimbolikus korlátok arra kényszerítik a kimeneteket, hogy inkább ellenőrizhető logikai szabályokat kövessenek, mint puszta valószínűséget.
A Világgazdasági Fórum kiemelte, hogy a neuro-szimbolikus rendszerek "nem produkálnak hallucinációkat", és "teljesen átlátható és ellenőrizhető" döntéshozatalt kínálnak – ezek a tulajdonságok elengedhetetlenek az olyan nagy tétekkel járó területeken, mint az egészségügy, a pénzügy és a jog.
100-szoros energiaelőny
A Tufts Egyetemen Matthias Scheutz vezette kutatócsoport nemrégiben bemutatta, hogy mennyire hatékony lehet ez a megközelítés. A neuro-szimbolikus vizuális-nyelvi-akció (VLA) modellek – olyan robotrendszerek, amelyek kamera bemenetet és nyelvi utasításokat kombinálnak fizikai feladatok elvégzéséhez – tesztelése során a csapat drámai eredményekről számolt be:
- 95%-os pontosság egy szabványos Hanoi tornyai feladaton, szemben a hagyományos VLA modell 34%-ával
- 78%-os siker a rejtvény egy nem látott, nehezebb változatán, míg a standard modellek 0%-ot értek el
- A képzés 34 perc alatt befejeződött, a több mint 36 óra helyett
- A képzési energia körülbelül 1%-át és a végrehajtási energia 5%-át használta fel a standard megközelítésekhez képest
"Egy neuro-szimbolikus VLA olyan szabályokat alkalmazhat, amelyek korlátozzák a próbálkozások és tévedések számát a tanulás során" – magyarázta Scheutz. Az arXiv-on közzétett eredményeket a bécsi IEEE ICRA 2026 konferencián mutatják be.
Valós alkalmazások ma
A neuro-szimbolikus elvek már számos nagy hírnevű MI-rendszert alátámasztanak. A Google DeepMind AlphaFold-ja, amely gyógyszerkutatáshoz jósolja meg a fehérjeszerkezeteket, a tanult neurális mintákat biokémiai korlátokkal kombinálja. Az Amazon vásárlási asszisztense, a Rufus nagyméretű nyelvi modelleket használ, amelyeket a termékkatalógusokhoz és az árazási logikához kötött szimbolikus rétegek korlátoznak a hamis termékállítások megakadályozása érdekében.
Az IBM Research, amely az MIT-vel együttműködve a Watson AI Labon keresztül dolgozik, a neuro-szimbolikus MI-t "a mesterséges általános intelligenciához vezető útnak" nevezi, és a COVID-19 gyógyszerkutatástól az IQ-teszt stílusú absztrakt gondolkodásig terjedő területeken alkalmazta.
A jövő útja
Ahogy a MI-rendszerek belépnek az orvostudományba, az autonóm járművekbe és a kritikus infrastruktúrába, a magyarázhatóság és a megbízhatóság iránti igény csak nőni fog. A tiszta neurális hálózatok lenyűgözően skálázhatók, de továbbra is átlátszatlanok; a tiszta szimbolikus rendszerek átláthatóak, de törékenyek. A neuro-szimbolikus MI egy középutat kínál: olyan gépeket, amelyek képesek tanulni a zavaros valós adatokból és gondolkodni arról, amit tanultak – az energia töredékének felhasználásával. Akár a MI "harmadik hullámát" képviseli, akár egyszerűen egy szükséges korrekciót, a hibrid megközelítés gyorsan halad a kutatólaboratóriumokból a világszerte működő termelési rendszerek felé.