Technológie

Ako fungujú AI čipy na mieru – a prečo ich Big Tech stavia

Technologickí giganti ako Google, Amazon a Meta navrhujú vlastné AI čipy na mieru, nazývané ASIC, aby znížili závislosť od GPU Nvidia, znížili náklady a optimalizovali výkon pre špecifické AI úlohy.

R
Redakcia
4 min čítania
Zdieľať
Ako fungujú AI čipy na mieru – a prečo ich Big Tech stavia

Prečo Big Tech prestal nakupovať hotové riešenia

Roky GPU od Nvidie poháňali prakticky každú úlohu umelej inteligencie na planéte. Ale prebieha tichá revolúcia: najväčšie technologické spoločnosti na svete navrhujú vlastné kremíkové čipy na mieru. Google, Amazon, Meta a Microsoft investovali miliardy do aplikačne špecifických integrovaných obvodov (ASIC) – čipov, ktoré sú účelovo vytvorené pre AI, a nie prevzaté zo sveta hier.

Motivácia je priamočiara. Univerzálne GPU sú všestranné, ale táto všestrannosť má svoju cenu: premárnené tranzistory, nadmerná spotreba energie a vysoká cena stanovená jediným dominantným dodávateľom. Čipy na mieru sľubujú zmenu všetkých troch premenných naraz.

Čo je to ASIC?

ASIC je čip navrhnutý od základov pre jednu konkrétnu úlohu. Na rozdiel od GPU, ktoré dokáže spúšťať tisíce rôznych algoritmov, ASIC priamo do svojich obvodov „zašije“ konkrétne matematické operácie – ako napríklad násobenie matíc, ktoré je kľúčové pre neurónové siete. Výsledkom je procesor, ktorý vykonáva svoju cieľovú úlohu rýchlejšie a s menšou spotrebou energie ako univerzálna alternatíva.

Podľa Centra pre bezpečnosť a vznikajúce technológie Georgetownskej univerzity, AI čipy spadajú do troch širokých kategórií: GPU pre flexibilné trénovanie, FPGA pre rekonfigurovateľnú inferenciu a ASIC pre vysoko optimalizovanú akceleráciu s pevnou funkciou. Každý z nich vypĺňa inú medzeru, ale ASIC poskytujú najlepší výkon na watt, keď sú úlohy predvídateľné a vo veľkom objeme.

Ako prebieha proces návrhu

Vývoj AI čipu na mieru nie je ani rýchly, ani lacný. Jeden návrh ASIC môže stáť stovky miliónov dolárov a trvať dva až tri roky od konceptu po výrobu. Spoločnosti zvyčajne spolupracujú so špecializovanými dizajnérskymi firmami – Broadcom a Marvell sú dvaja dominantní hráči – ktoré poskytujú bloky duševného vlastníctva, technológiu prepojenia a rozsiahle odborné znalosti v oblasti architektúry čipov.

Po dokončení návrhu putuje do zlievarne ako TSMC na výrobu. Pretože sú obvody natrvalo vyleptané do kremíka, nie je priestor na chyby: ak sa modely AI posunú k zásadne odlišným matematickým operáciám, čip na mieru sa môže stať zastaraným. Táto nepružnosť je ústredným kompromisom prístupu ASIC.

Kto čo stavia

Google bol priekopníkom tohto trendu. V roku 2013 inžinieri vypočítali, že zavedenie hlasového vyhľadávania pre 300 miliónov používateľov by si vyžadovalo zdvojnásobenie celej kapacity dátových centier spoločnosti, ak by sa spoliehala výlučne na konvenčné procesory. Prvá Tensor Processing Unit (TPU) bola uvedená do výroby už o 15 mesiacov neskôr, podľa CNBC. TPU od spoločnosti Google odvtedy dosiahli svoju šiestu generáciu, Trillium, a dominujú viac ako 70 percentám trhu s AI čipmi pre cloudové servery na mieru.

Amazon vstúpil do pretekov po akvizícii izraelského startupu Annapurna Labs v roku 2015. Jeho čipy Trainium, teraz vo svojej druhej generácii, uprednostňujú šírku pásma pamäte a efektivitu prepojenia pred hrubou priepustnosťou s pohyblivou desatinnou čiarkou – architektonické voľby prispôsobené úlohám rozsiahlych jazykových modelov, ktoré dominujú modernej AI, uvádza WebProNews. Meta medzitým vyvinula svoj vlastný ASIC s názvom Meta Training and Inference Accelerator (MTIA), optimalizovaný pre modely odporúčaní a hodnotenia, ktoré poháňajú jej reklamný biznis.

GPU nikam neodchádzajú – zatiaľ

Vlastné ASIC vynikajú v inferencii – spúšťaní natrénovaného modelu na generovanie predpovedí – kde sú úlohy predvídateľné a objem je obrovský. Ale trénovanie nových modelov, najmä špičkových systémov, si stále vyžaduje flexibilitu GPU a vyspelý softvérový ekosystém CUDA od spoločnosti Nvidia.

Priemyselné údaje od Counterpoint Research predpovedajú, že dodávky vlastných ASIC vzrastú v roku 2026 o 44,6 percenta, zatiaľ čo dodávky GPU vzrastú o 16,1 percenta – rozdiel, ktorý ilustruje, kam smeruje dynamika. Analytici očakávajú, že ASIC strojnásobia svoje celkové dodávky do roku 2027.

Prečo na tom záleží

Posun smerom ku kremíku na mieru pretvára ekonomiku umelej inteligencie. Spoločnosti, ktoré kontrolujú vlastné dodávky čipov, môžu znížiť náklady, zlepšiť energetickú účinnosť a znížiť závislosť od jedného dodávateľa. Pre spotrebiteľov sa to premieta do rýchlejších služieb AI a potenciálne nižších cien. Pre spoločnosť Nvidia to znamená, že najlukratívnejší zákazníci sa stávajú aj konkurentmi – napätie, ktoré bude definovať polovodičový priemysel na dlhé roky.

Tento článok je dostupný aj v iných jazykoch:

Zostaňte v obraze!

Sledujte nás na Facebooku a nič vám neunikne.

Sledujte nás na Facebooku

Podobné články