Ako funguje hľadanie chýb pomocou AI – a prečo to mení bezpečnosť

Starý spôsob hľadania chýb

Kybernetickí bezpečnostní experti sa desaťročia spoliehali na dve hlavné metódy hľadania zraniteľností softvéru: manuálnu kontrolu kódu a fuzzing. Manuálna kontrola znamená, že ľudský expert číta zdrojový kód riadok po riadku a hľadá chyby. Je to dôkladné, ale bolestivo pomalé – skúsený audítor môže skontrolovať niekoľko tisíc riadkov denne v kódovej základni, ktorá obsahuje milióny.

Fuzzing využíva odlišný prístup. Automatizované nástroje bombardujú program náhodnými, chybnými alebo neočakávanými vstupmi v nádeji, že vyvolajú pády, ktoré odhalia skryté nedostatky. Služba OSS-Fuzz od spoločnosti Google, spustená v roku 2016, použila túto techniku na nájdenie viac ako 10 000 bezpečnostných zraniteľností vo viac ako 1 000 open-source projektoch. Ale aj OSS-Fuzz dosahuje v priemere len približne 30 % pokrytie kódu, pričom rozsiahle úseky kódu zostávajú netestované.

Obidve metódy majú zásadné obmedzenie: ťažko sa vyrovnávajú s logickými chybami – nedostatkami, ktoré nespôsobujú zjavné pády, ale umožňujú útočníkom manipulovať s chovaním programu jemnými, nebezpečnými spôsobmi.

Ako AI mení hru

Hľadanie chýb pomocou AI funguje inak ako tradičné nástroje. Namiesto toho, aby slepo hádzali náhodné vstupy do softvéru, moderné rozsiahle jazykové modely (LLM) dokážu čítať a rozumieť kódu, uvažovať o tom, čo má robiť, a vytvárať konkrétne hypotézy o tom, kde sa môžu chyby skrývať. Potom vytvárajú cielené testovacie prípady navrhnuté na potvrdenie alebo vyvrátenie týchto hypotéz.

Záleží na tom, pretože prístup AI kombinuje silné stránky, ktoré boli predtým oddelené. Rovnako ako ľudský audítor, modely AI rozumejú logike a zámeru programu. Rovnako ako fuzzer, dokážu pracovať strojovou rýchlosťou v rozsiahlych kódových základniach. Výsledkom je systém, ktorý zachytáva chyby, ktoré tradičné nástroje nedokážu.

Spoločnosť Google demonštrovala tento hybridný prístup integráciou LLM do OSS-Fuzz. AI generuje fuzz ciele – špecializované testovacie funkcie – pre nedostatočne testované časti kódu. V jednom projekte, open-source XML parser tinyxml2, testy generované AI zvýšili pokrytie kódu z 38 % na 69 % bez akéhokoľvek manuálneho zásahu. Zopakovanie tohto výsledku ručne by vývojárovi zabralo približne celý pracovný deň – a je tu tisíce projektov, ktoré treba pokryť.

Od fuzzingu k autonómnemu hackingu

Najnovšia generácia AI nástrojov na hľadanie chýb ide ďaleko za hranice inteligentnejšieho fuzzingu. Claude Mythos Preview od spoločnosti Anthropic, predstavený prostredníctvom iniciatívy Project Glasswing, predstavuje zásadnú zmenu v schopnostiach. Model dokáže autonómne plánovať viacstupňové vyšetrovania, identifikovať nezverejnené zraniteľnosti, písať exploit kód a spájať viacero nedostatkov do úplných útočných ciest – a to všetko bez ľudského vedenia.

Výsledky sú pozoruhodné. Mythos Preview odhalil tisíce zraniteľností s vysokou závažnosťou vo všetkých hlavných operačných systémoch a webových prehliadačoch, podľa spoločnosti Anthropic. Medzi objavmi:

27-ročná chyba v OpenBSD, jednom z najviac bezpečnostne posilnených operačných systémov, zneužiteľná prostredníctvom jednoduchého sieťového pripojenia
16-ročná chyba vo FFmpeg, široko používanej knižnici na spracovanie videa, ktorú automatizované testovacie nástroje spustili päť miliónov krát bez toho, aby ju kedy zachytili
Viacnásobné zreťazené zraniteľnosti v jadre Linuxu umožňujúce úplnú eskaláciu privilégií z bežného používateľského prístupu na úplnú kontrolu systému

Na benchmarku CyberGym pre reprodukciu zraniteľností dosiahol Mythos Preview skóre 83,1 %, v porovnaní s 66,6 % pre svojho predchodcu.

Obrancova dilema

Hľadanie chýb pomocou AI vytvára paradox, ktorý kybernetická bezpečnostná komunita nazýva problém dvojakého použitia. Tá istá schopnosť, ktorá pomáha obrancom nájsť a opraviť zraniteľnosti, by mohla pomôcť útočníkom objaviť a zneužiť ich. Model, ktorý je dostatočne výkonný na ochranu každého operačného systému, je tiež dostatočne výkonný na jeho kompromitovanie.

Odpoveďou spoločnosti Anthropic bolo obmedziť prístup. Namiesto verejného vydania Mythos Preview spoločnosť spustila Project Glasswing ako chránený obranný program, ktorý zdieľa model s viac ako 40 organizáciami, ktoré budujú alebo udržiavajú kritickú softvérovú infraštruktúru. Spoločnosť sa zaviazala poskytnúť až 100 miliónov dolárov v úveroch na používanie a 4 milióny dolárov v priamych daroch organizáciám pre bezpečnosť open-source na podporu tohto úsilia.

Širší priemysel sa uberá podobným smerom. Spoločnosti Microsoft, Google a ďalšie veľké technologické spoločnosti integrujú AI agentov do svojich bezpečnostných pracovných postupov – nie na nahradenie ľudských analytikov, ale na zvládnutie obrovského objemu kódu, ktorý by žiadny tím ľudí nemohol manuálne skontrolovať.

Prečo na tom záleží

Softvér, ktorý prevádzkuje modernú infraštruktúru – operačné systémy, prehliadače, šifrovacie knižnice, serverové frameworky – obsahuje miliardy riadkov kódu, z ktorých väčšina bola napísaná pred desaťročiami. Tradičné metódy sa ukázali ako nedostatočné na zabezpečenie všetkého. Hľadanie chýb pomocou AI neodstraňuje potrebu kvalifikovaných bezpečnostných expertov, ale dramaticky rozširuje to, čo je možné: skenovanie kódových základní v rozsahu a hĺbke, ktoré boli predtým nepredstaviteľné, a zachytávanie nedostatkov, ktoré prežili nezistené celú generáciu.

Prebiehajú preteky medzi obrancami, ktorí nasadzujú tieto nástroje na opravu zraniteľností, a protivníkmi, ktorí sa snažia využiť tú istú technológiu na útok. To, ako sa tieto preteky vyvinú, ovplyvní bezpečnosť digitálnej infraštruktúry, na ktorej je svet závislý.

Ako funguje hľadanie chýb pomocou AI – a prečo to mení bezpečnosť

Starý spôsob hľadania chýb

Ako AI mení hru

Od fuzzingu k autonómnemu hackingu

Obrancova dilema

Prečo na tom záleží

Podobné články

Ako funguje Air Force One – lietajúci Biely dom

Ako funguje Mechanizmus EÚ v oblasti civilnej ochrany

Ako fungujú americké vojenské základne v Európe – a prečo

Ako funguje inteligencia chobotníc – decentralizovaná myseľ

Ako funguje Air Force One – lietajúci Biely dom

Ako funguje Triple Crown – najťažšia cena v dostihovom športe

Ako teleskop SPHEREx od NASA zmapuje celú oblohu v 102 farbách

Ako funguje rotujúce predsedníctvo v Bezpečnostnej rade OSN

Nenechajte si ujsť nové články!