DeepSeek V4: Chinas multimodales KI-Modell mit Billionen Parametern

Ein weiterer Paukenschlag in der KI-Welt?

Etwas mehr als ein Jahr, nachdem sein R1-Reasoning-Modell von Analysten als ein "Sputnik-Moment" für amerikanische Technologieunternehmen bezeichnet wurde, bereitet das chinesische KI-Labor DeepSeek seine nächste große Veröffentlichung vor. Laut einem Bericht von TechNode, der sich auf die Financial Times beruft, plante das Unternehmen, DeepSeek V4 in der ersten Märzwoche 2026 vorzustellen – strategisch günstig vor den jährlichen Parlamentssitzungen Chinas, den "Zwei Sitzungen", die am 4. März begannen.

Die Markteinführung ist die erste größere Modellveröffentlichung des Unternehmens seit dem Debüt von R1 im Januar 2025 und stellt einen bedeutenden Schritt nach oben in Bezug auf den Ehrgeiz dar: V4 wird als ein nativ multimodales System beschrieben, das in der Lage ist, Text, Bilder und Videos innerhalb einer einzigen, einheitlichen Architektur zu generieren – anstatt visuelle Fähigkeiten an eine reine Textbasis anzuhängen, wie es viele westliche Modelle getan haben.

Was V4 anders macht

Die Architektur des Modells basiert auf einem Mixture-of-Experts (MoE)-Design, wobei frühe Leaks aus Testumgebungen auf rund eine Billion Gesamtparameter und etwa 32 Milliarden aktive Parameter pro Inferenzdurchlauf hindeuten. Dieser Ansatz – bei dem jede Anfrage nur durch einen Bruchteil des gesamten Netzwerks geleitet wird – ist der gleiche Effizienztrick, den DeepSeek in früheren Modellen verwendet hat, um Spitzenleistungen zu deutlich geringeren Rechenkosten zu erzielen.

Laut mehreren Berichten, die frühe Benchmark-Daten zusammenfassen, deuten interne Tests darauf hin, dass V4 führende westliche Modelle wie Claude und ChatGPT bei Coding-Aufgaben mit langem Kontext übertreffen könnte, wobei sich das Kontextfenster Berichten zufolge auf eine Million Token erstreckt. Diese Zahlen wurden noch nicht durch veröffentlichte Benchmarks unabhängig verifiziert und sollten bis zur Veröffentlichung offizieller Ergebnisse mit Vorsicht behandelt werden.

Sollten sich diese bestätigen, wären allein die Auswirkungen auf die Preisgestaltung disruptiv. Analysten schätzen, dass der API-Zugang zwischen 0,10 und 0,30 US-Dollar pro Million Eingabe-Token kosten könnte – ein Bruchteil dessen, was vergleichbare US-Modelle derzeit verlangen.

Die Hardware-Dimension

Der vielleicht geopolitisch bedeutendste Aspekt von V4 ist, was es antreibt. DeepSeek hat laut TechNode mit den chinesischen KI-Chipherstellern Huawei und Cambricon zusammengearbeitet, um V4 für deren neueste Hardware zu optimieren. In einer bemerkenswerten Abweichung von den Branchennormen verweigerte das Unternehmen Nvidia und AMD – den dominierenden US-Chipherstellern – den frühen Zugang und gewährte stattdessen Huawei vorab Zugang zur Leistungsoptimierung.

"Die Beschleunigung der Optimierungszeitpläne – die jetzt von Monaten auf Wochen verkürzt werden – reduziert die Abhängigkeit von Anbietern und schwächt die traditionellen Vorteile der Chiphersteller", bemerkte der Analyst Ben Bajarin von Creative Strategies, wie von Open Source For You zitiert. Der Schritt ist ein bewusstes Signal: China baut einen KI-Software-Stack auf, der auf chinesischem Silizium läuft.

Open Source als strategische Waffe

DeepSeek plant, V4 unter einer Open-Source-Lizenz zu veröffentlichen und setzt damit ein Muster fort, das dem Labor einen überproportionalen globalen Einfluss verschafft hat. Seine früheren Modelle wurden über 75 Millionen Mal auf Hugging Face heruntergeladen, was es Entwicklern weltweit ermöglicht, sie ohne Lizenzgebühren einzusetzen und zu verfeinern.

Diese Open-Source-Strategie verstärkt den Wettbewerbsdruck auf OpenAI, Anthropic und Google – deren proprietäre Modelle vor einer Kosten- und Zugänglichkeitsherausforderung stehen, die keine regulatorische Reaktion leicht bewältigen kann. Wie das Digital Watch Observatory feststellte, betrachten Analysten jede DeepSeek-Veröffentlichung als eine Verstärkung der Positionierung des Labors als faktischer nationaler KI-Champion für China, unabhängig davon, ob dies die ursprüngliche Absicht war oder nicht.

Was als Nächstes kommt

Das breitere Rennen beschleunigt sich auf beiden Seiten. Eine leichtere "V4 Lite"-Variante mit rund 200 Milliarden Parametern hat Berichten zufolge interne Tests durchlaufen, was die Einsatzmöglichkeiten erweitert. In der Zwischenzeit beobachten westliche KI-Labore die Entwicklung genau: Anthropic beschuldigte Ende Februar 2026 DeepSeek und andere chinesische Labore öffentlich, groß angelegte Kampagnen zur Extraktion von Modellfähigkeiten durch unbefugte Datenerfassung durchzuführen – eine Anschuldigung, die unterstreicht, wie ernst die US-Industrie die Wettbewerbsbedrohung inzwischen nimmt.

Ob V4 seine durchgesickerten Spezifikationen erfüllt oder nicht, DeepSeeks Kurs ist klar: schnellere Veröffentlichungen, billigere Inferenz, offene Gewichte und Hardware, die US-Exportkontrollen umgeht. Die globale KI-Landschaft hat einen neuen, dauerhaften Herausforderer.

DeepSeek V4: Chinas multimodales KI-Modell mit Billionen Parametern

Ein weiterer Paukenschlag in der KI-Welt?

Was V4 anders macht

Die Hardware-Dimension

Open Source als strategische Waffe

Was als Nächstes kommt

Verwandte Artikel

So funktioniert die Air Force One – Das fliegende Weiße Haus

Wie der EU-Zivilschutzmechanismus funktioniert

Wie US-Militärbasen in Europa funktionieren – und warum

Wie die Intelligenz von Kraken funktioniert – ein verteilter Geist

So funktioniert die Air Force One – Das fliegende Weiße Haus

So funktioniert die Triple Crown – Der härteste Preis im Pferderennsport

Wie NASAs SPHEREx den gesamten Himmel in 102 Farben kartiert

Wie die Präsidentschaft im UN-Sicherheitsrat rotiert

Verpassen Sie keine neuen Artikel!