DeepSeek V4: Kínai, Trillió Paraméteres, Multimodális MI

Újabb lövés hallatszik az MI világában?

Alig több mint egy évvel azután, hogy az R1 következtetési modelljük elemzők szerint egy "Sputnik pillanatot" idézett elő az amerikai technológiai cégek számára, a kínai DeepSeek MI laboratórium a következő jelentős kiadására készül. A TechNode jelentése szerint, a Financial Times-ra hivatkozva, a vállalat a tervek szerint 2026 márciusának első hetében mutatja be a DeepSeek V4-et – stratégiailag időzítve Kína éves parlamenti ülései, a "Két Ülés" elé, amelyek március 4-én kezdődtek.

A bevezetés a vállalat első jelentős modellkiadása az R1 2025 januári bemutatkozása óta, és jelentős előrelépést jelent az ambíciók terén: a V4-et egy natívan multimodális rendszerként írják le, amely képes szöveget, képeket és videót generálni egyetlen egységes architektúrán belül – ahelyett, hogy a vizuális képességeket egy szöveges alapra csavaroznák, ahogy azt sok nyugati modell tette.

Mitől más a V4

A modell architektúrája a Mixture-of-Experts (MoE) tervezésen alapul, a tesztkörnyezetekből származó korai szivárgások szerint körülbelül egy trillió teljes paraméterrel és körülbelül 32 milliárd aktív paraméterrel következtetésenként. Ez a megközelítés – minden lekérdezést csak a teljes hálózat egy töredékén keresztül irányítva – ugyanaz a hatékonysági trükk, amelyet a DeepSeek a korábbi modellekben is alkalmazott, hogy drámaian alacsonyabb számítási költségek mellett is élvonalbeli teljesítményt nyújtson.

Számos, a korai benchmark adatok összesítését tartalmazó jelentés szerint a belső tesztek azt mutatják, hogy a V4 felülmúlhatja a vezető nyugati modelleket, beleértve a Claude-ot és a ChatGPT-t is a hosszú kontextusú kódolási feladatokban, a kontextusablak állítólag egymillió tokenre terjed ki. Ezeket a számokat még nem ellenőrizték függetlenül közzétett benchmarkokon keresztül, és óvatosan kell kezelni őket a hivatalos eredmények közzétételéig.

Ha megerősítik, már a árazási következmények is zavaróak lennének. Az elemzők becslése szerint az API hozzáférés ára 0,10 és 0,30 dollár között lehetne millió bemeneti tokenenként – ez töredéke annak, amit a hasonló amerikai modellek jelenleg felszámítanak.

A hardver dimenzió

Talán a V4 leginkább geopolitikailag jelentős aspektusa az, hogy mi futtatja. A TechNode szerint a DeepSeek a kínai MI chipgyártókkal, a Huawei-jel és a Cambriconnal dolgozott együtt, hogy optimalizálja a V4-et a legújabb hardvereikhez. Az iparági normáktól eltérően a vállalat nem adott korai hozzáférést az Nvidia-nak és az AMD-nek – a domináns amerikai chipgyártóknak –, ehelyett a Huawei-nek adott előzetes hozzáférést a teljesítmény finomhangolásához.

"A gyorsuló optimalizálási ütemtervek – amelyek most hónapokról hetekre rövidültek – csökkentik a szállítói függőséget és gyengítik a hagyományos chipgyártók előnyeit" – jegyezte meg Ben Bajarin, a Creative Strategies elemzője, amint azt az Open Source For You idézte. A lépés egy szándékos jelzés: Kína egy olyan MI szoftvercsomagot épít, amely kínai szilíciumon fut.

A nyílt forráskód stratégiai fegyverként

A DeepSeek a tervek szerint nyílt forráskódú licenc alatt adja ki a V4-et, folytatva azt a mintát, amely a labornak aránytalanul nagy globális befolyást biztosított. Korábbi modelljei több mint 75 millió letöltést gyűjtöttek a Hugging Face-en, lehetővé téve a fejlesztők számára világszerte, hogy licencdíjak nélkül telepítsék és finomhangolják azokat.

Ez a nyílt forráskódú stratégia felerősíti a versenyhelyzetet az OpenAI, az Anthropic és a Google számára – amelyek saját fejlesztésű modelljei olyan költség- és hozzáférhetőségi kihívással néznek szembe, amelyet semmilyen szabályozási válasz nem tud könnyen kezelni. Ahogy a Digital Watch Observatory megjegyezte, az elemzők minden DeepSeek kiadást úgy tekintenek, mint ami megerősíti a laboratórium pozícióját Kína de facto nemzeti MI bajnokaként, függetlenül attól, hogy ez volt-e az eredeti szándék.

Mi következik

A szélesebb verseny mindkét oldalon felgyorsul. Egy könnyebb "V4 Lite" változat, körülbelül 200 milliárd paraméterrel, állítólag belső tesztelésre került, bővítve a telepítési lehetőségeket. Eközben a nyugati MI laboratóriumok szorosan figyelnek: az Anthropic 2026 február végén nyilvánosan azzal vádolta a DeepSeeket és más kínai laboratóriumokat, hogy nagyszabású kampányokat folytatnak a modell képességeinek jogosulatlan adatgyűjtés útján történő kinyerésére – ez a vád aláhúzza, hogy az amerikai ipar mennyire komolyan veszi a versenyhelyzetet.

Akár megfelel a V4 a kiszivárgott specifikációinak, akár nem, a DeepSeek pályája egyértelmű: gyorsabb kiadások, olcsóbb következtetés, nyílt súlyok és hardver, amely megkerüli az amerikai exportellenőrzéseket. A globális MI tájképnek új, állandó kihívója van.

DeepSeek V4: Kínai, Trillió Paraméteres, Multimodális MI

Újabb lövés hallatszik az MI világában?

Mitől más a V4

A hardver dimenzió

A nyílt forráskód stratégiai fegyverként

Mi következik

Kapcsolódó cikkek

Hogyan működik az Air Force One – a repülő Fehér Ház

Hogyan működik az EU Polgári Védelmi Mechanizmusa

Hogyan működnek az amerikai katonai bázisok Európában – és miért

Hogyan Működik a Polipok Intelligenciája – Egy Megosztott Elme

Hogyan működik az Air Force One – a repülő Fehér Ház

Hogyan működik a háborús jogkörökről szóló határozat – és miért hagyják figyelmen kívül az elnökök

Hogyan Működik a Triple Crown – A Lóversenyzés Legnehezebb Díja

Hogyan térképezi fel a NASA SPHEREx űrtávcsöve az egész eget 102 színben

Ne maradjon le az új cikkekről!