Technologia

DeepSeek V4: Chiński Model AI z Bilionem Parametrów i Obsługą Wielu Modali

Chińskie laboratorium AI DeepSeek przygotowuje się do wydania V4 – swojego pierwszego natywnie multimodalnego flagowego modelu, zoptymalizowanego pod kątem krajowych chipów Huawei i Cambricon, a nie sprzętu Nvidia. Model ma zostać udostępniony na licencji open-source, co może ponownie wstrząsnąć globalnymi rynkami AI.

R
Redakcia
Share
DeepSeek V4: Chiński Model AI z Bilionem Parametrów i Obsługą Wielu Modali

Kolejny strzał słyszalny w świecie AI?

Zaledwie rok po tym, jak model rozumowania R1 wywołał, jak to określili analitycy, "moment Sputnika" dla amerykańskich firm technologicznych, chińskie laboratorium AI DeepSeek przygotowuje się do kolejnej ważnej premiery. Według doniesień TechNode, powołującego się na Financial Times, firma planowała zaprezentować DeepSeek V4 w pierwszym tygodniu marca 2026 roku – strategicznie przed dorocznymi sesjami parlamentarnymi Chin, „Dwoma Sesjami”, które rozpoczęły się 4 marca.

Premiera oznacza pierwsze tak duże wydanie modelu przez firmę od czasu debiutu R1 w styczniu 2025 roku i stanowi znaczący krok naprzód w ambicjach: V4 jest opisywany jako natywnie multimodalny system zdolny do generowania tekstu, obrazów i wideo w ramach jednej, ujednoliconej architektury – zamiast dołączania możliwości wizualnych do bazy tekstowej, jak to zrobiło wiele zachodnich modeli.

Co wyróżnia V4

Architektura modelu opiera się na projekcie Mixture-of-Experts (MoE), a wczesne przecieki ze środowisk testowych sugerują około biliona parametrów ogółem i około 32 miliardy aktywnych parametrów na przebieg wnioskowania. To podejście – kierowanie każdego zapytania tylko przez ułamek całej sieci – to ta sama sztuczka zwiększająca wydajność, której DeepSeek używał w poprzednich modelach, aby zapewnić przełomową wydajność przy znacznie niższych kosztach obliczeniowych.

Według wielu raportów agregujących wczesne dane benchmarkowe, wewnętrzne testy wskazują, że V4 może przewyższać wiodące zachodnie modele, w tym Claude i ChatGPT, w zadań kodowania z długim kontekstem, a okno kontekstowe ma sięgać miliona tokenów. Dane te nie zostały jeszcze niezależnie zweryfikowane za pomocą opublikowanych benchmarków i należy je traktować z ostrożnością do czasu opublikowania oficjalnych wyników.

Jeśli to się potwierdzi, same implikacje cenowe byłyby przełomowe. Analitycy szacują, że dostęp do API może kosztować od 0,10 do 0,30 USD za milion tokenów wejściowych – ułamek tego, co obecnie pobierają porównywalne modele amerykańskie.

Wymiar sprzętowy

Być może najbardziej geopolitycznie istotnym aspektem V4 jest to, na czym działa. DeepSeek współpracował z chińskimi producentami chipów AI, Huawei i Cambricon, aby zoptymalizować V4 pod kątem ich najnowszego sprzętu, jak podaje TechNode. W znaczącym odejściu od norm branżowych firma wstrzymała wczesny dostęp dla Nvidii i AMD – dominujących amerykańskich dostawców chipów – zamiast tego przyznając Huawei wcześniejszy dostęp w celu dostrojenia wydajności.

„Przyspieszenie harmonogramów optymalizacji – obecnie skróconych z miesięcy do tygodni – zmniejsza zależność od dostawców i osłabia tradycyjne przewagi producentów chipów”, zauważył analityk Ben Bajarin z Creative Strategies, cytowany przez Open Source For You. Ten ruch jest celowym sygnałem: Chiny budują stos oprogramowania AI, który działa na chińskim krzemie.

Open Source jako broń strategiczna

DeepSeek planuje udostępnić V4 na licencji open-source, kontynuując wzorzec, który dał laboratorium ogromny globalny wpływ. Jego poprzednie modele zgromadziły ponad 75 milionów pobrań na Hugging Face, umożliwiając programistom na całym świecie wdrażanie i dostrajanie ich bez opłat licencyjnych.

Ta strategia open-source wzmacnia presję konkurencyjną na OpenAI, Anthropic i Google – których zastrzeżone modele stoją w obliczu wyzwania związanego z kosztami i dostępnością, któremu żadna reakcja regulacyjna nie może łatwo zaradzić. Jak zauważyło Digital Watch Observatory, analitycy postrzegają każde wydanie DeepSeek jako wzmacniające pozycję laboratorium jako de facto narodowego mistrza AI dla Chin, niezależnie od tego, czy taki był pierwotny zamiar.

Co dalej

Szerszy wyścig przyspiesza po obu stronach. Lżejszy wariant „V4 Lite” z około 200 miliardami parametrów podobno wszedł w fazę testów wewnętrznych, poszerzając opcje wdrażania. Tymczasem zachodnie laboratoria AI uważnie obserwują: Anthropic pod koniec lutego 2026 roku publicznie oskarżył DeepSeek i inne chińskie laboratoria o prowadzenie zakrojonych na szeroką skalę kampanii mających na celu wydobycie możliwości modelu poprzez nieautoryzowane gromadzenie danych – oskarżenie, które podkreśla, jak poważnie amerykański przemysł traktuje obecnie zagrożenie konkurencyjne.

Niezależnie od tego, czy V4 spełni swoje ujawnione specyfikacje, trajektoria DeepSeek jest jasna: szybsze wydania, tańsze wnioskowanie, otwarte wagi i sprzęt, który omija amerykańskie kontrole eksportu. Globalny krajobraz AI ma nowego, stałego konkurenta.

Ten artykuł jest dostępny także w innych językach:

Powiązane artykuły