Jak fungují AI čipy na míru – a proč je velké technologické firmy vyvíjejí
Technologičtí giganti jako Google, Amazon a Meta navrhují vlastní AI čipy na míru, takzvané ASIC, aby snížili závislost na GPU od Nvidie, snížili náklady a optimalizovali výkon pro specifické AI úlohy.
Proč velké technologické firmy přestaly nakupovat hotové produkty
Po léta GPU od Nvidie poháněly prakticky každou úlohu umělé inteligence na planetě. Nyní ale probíhá tichá revoluce: největší světové technologické společnosti navrhují vlastní křemíkové čipy na míru. Google, Amazon, Meta a Microsoft investovaly miliardy do aplikačně specifických integrovaných obvodů (ASIC) – čipů, které jsou účelově vytvořeny pro AI, a nikoli převzaty ze světa her.
Motivace je jednoduchá. Univerzální GPU jsou sice všestranné, ale tato všestrannost má svou cenu: zbytečné tranzistory, nadměrná spotřeba energie a vysoká cena stanovená jediným dominantním dodavatelem. Čipy na míru slibují změnit všechny tři proměnné najednou.
Co je to ASIC?
ASIC je čip navržený od základu pro jeden konkrétní úkol. Na rozdíl od GPU, které může spouštět tisíce různých algoritmů, ASIC „natvrdo“ zapojuje konkrétní matematické operace – jako je násobení matic, které je klíčové pro neuronové sítě – přímo do svých obvodů. Výsledkem je procesor, který provádí cílovou úlohu rychleji a s menší spotřebou energie než univerzální alternativa.
Podle Centra pro bezpečnost a nové technologie Georgetownské univerzity se AI čipy dělí do tří širokých kategorií: GPU pro flexibilní trénování, FPGA pro rekonfigurovatelné inference a ASIC pro vysoce optimalizovanou akceleraci s pevnou funkcí. Každý z nich zaplňuje jinou niku, ale ASIC poskytují nejlepší poměr výkonu a spotřeby energie, když jsou úlohy předvídatelné a objemné.
Jak probíhá proces návrhu
Vývoj AI čipu na míru není ani rychlý, ani levný. Návrh jediného ASIC může stát stovky milionů dolarů a trvat dva až tři roky od konceptu po výrobu. Společnosti obvykle spolupracují se specializovanými návrhářskými firmami – Broadcom a Marvell jsou dva dominantní hráči – které poskytují bloky duševního vlastnictví, technologii propojení a hluboké odborné znalosti v oblasti architektury čipů.
Jakmile je návrh dokončen, putuje do slévárny, jako je TSMC, k výrobě. Protože jsou obvody trvale vyleptány do křemíku, není zde prostor pro chyby: pokud se modely AI posunou k zásadně odlišným matematickým operacím, může se čip na míru stát zastaralým. Tato nepružnost je ústředním kompromisem přístupu ASIC.
Kdo co vyrábí
Google byl průkopníkem tohoto trendu. V roce 2013 inženýři spočítali, že zavedení hlasového vyhledávání pro 300 milionů uživatelů by vyžadovalo zdvojnásobení celkové kapacity datových center společnosti, pokud by se spoléhala pouze na konvenční procesory. První Tensor Processing Unit (TPU) se dostala do výroby pouhých 15 měsíců poté, uvádí CNBC. TPU od Googlu od té doby dosáhly své šesté generace, Trillium, a dominují více než 70 procentům trhu s AI čipy na míru pro cloudové servery.
Amazon vstoupil do závodu po akvizici izraelského čipového startupu Annapurna Labs v roce 2015. Jeho čipy Trainium, nyní ve své druhé generaci, upřednostňují šířku pásma paměti a efektivitu propojení před hrubou propustností s plovoucí desetinnou čárkou – architektonické volby vyladěné pro úlohy velkých jazykových modelů, které dominují moderní AI, uvádí WebProNews. Společnost Meta mezitím vyvinula vlastní ASIC s názvem Meta Training and Inference Accelerator (MTIA), optimalizovaný pro modely doporučení a hodnocení, které pohánějí její reklamní podnikání.
GPU nikam neodcházejí – zatím
Vlastní ASIC vynikají v inferenci – spouštění natrénovaného modelu pro generování predikcí – kde jsou úlohy předvídatelné a objem je obrovský. Ale trénování nových modelů, zejména špičkových systémů, stále vyžaduje flexibilitu GPU a vyspělý softwarový ekosystém CUDA od Nvidie.
Průmyslová data od Counterpoint Research předpovídají, že dodávky vlastních ASIC porostou v roce 2026 o 44,6 procenta, zatímco dodávky GPU porostou o 16,1 procenta – rozdíl, který ilustruje, kam směřuje dynamika. Analytici očekávají, že ASIC ztrojnásobí své celkové dodávky do roku 2027.
Proč na tom záleží
Posun směrem k vlastnímu křemíku mění ekonomiku umělé inteligence. Společnosti, které kontrolují vlastní dodávky čipů, mohou snížit náklady, zlepšit energetickou účinnost a snížit závislost na jediném dodavateli. Pro spotřebitele se to promítá do rychlejších služeb AI a potenciálně i nižších cen. Pro společnost Nvidia to znamená, že nejlukrativnější zákazníci se zároveň stávají konkurenty – napětí, které bude definovat polovodičový průmysl v nadcházejících letech.