DeepSeek plus Huawei-Chips sollen China an KI-Spitze katapultieren

DeepSeek steht kurz vor dem Release des neuen Modells R2. Gerüchten zufolge soll es mit 1,2 Billionen Parametern arbeiten und dabei 97% günstiger sein als GPT-4. Eine Besonderheit: Das Modell wurde vollständig auf chinesischen Huawei-Chips trainiert.

Witold Pryjda, 02.05.2025 16:36 Uhr

Chinas KI-Riese setzt auf Kosteneffizienz

Der chinesische KI-Entwickler DeepSeek bereitet die Veröffentlichung seines neuen Sprachmodells R2 vor. Nach Informationen, die in chinesischen und westlichen Medien kursieren, könnte das Modell die KI-Landschaft erneut massiv verändern. Der Nachfolger des im Januar 2025 veröffentlichten R1-Modells soll mit beachtlichen technischen Daten aufwarten und könnte erneut ein kleines Beben durch die Technikwelt schicken.

Das neue Modell setzt auf eine hybride MoE-Architektur (Mixture of Experts), die eine fortschrittliche Version bestehender MoE-Implementierungen darstellt. Diese Architektur ermöglicht es, mit 1,2 Billionen dynamisch aktivierbaren Parametern zu arbeiten, wobei der tatsächliche Rechenaufwand nur etwa 78 Milliarden Parameter beträgt. Zum Vergleich: Das Vorgängermodell R1 verfügte über etwa 600 Milliarden Parameter.

Kostensenkung und Innovation

Die wohl bemerkenswerteste Eigenschaft des neuen Modells ist seine Kosteneffizienz. Laut dem chinesischen Portal Jiuyangongshe (via Wccftech) soll DeepSeek R2 bei der Verarbeitung von Text-Tokens 97,3 Prozent günstiger sein als OpenAIs GPT-4. Dies würde das Modell besonders attraktiv für Unternehmenskunden machen, die auf kosteneffiziente KI-Lösungen angewiesen sind. Jiuyangongshe gilt in China als eine der führenden Informationsquellen für Entwicklungen im KI-Bereich und hat in der Vergangenheit bereits mehrfach zuverlässige Vorabinformationen zu neuen Technologien veröffentlicht.

Für das Training des Modells hat DeepSeek nach Berichten verschiedener Quellen ausschließlich chinesische Hardware verwendet. Das Unternehmen nutzte Huaweis Ascend 910B KI-Chips und erreichte dabei eine Cluster-Auslastung von 82 Prozent. Die Rechenleistung wird mit 512 PetaFLOPS bei FP16-Genauigkeit angegeben, was etwa 91 Prozent der Leistung eines vergleichbaren Nvidia A100-Clusters entsprechen soll.

DeepSeek R2 bringt offenbar auch signifikante Verbesserungen in der multimodalen Verarbeitung. Im Gegensatz zum Vorgängermodell R1, das keine Bildverarbeitungsfunktionen besaß, soll R2 über fortschrittliche visuelle Fähigkeiten verfügen.

Wer steckt hinter DeepSeekP?

DeepSeek wurde 2021 von ehemaligen Mitarbeitern von Baidu und anderen chinesischen Technologieunternehmen gegründet. Das Unternehmen hat sich schnell zu einem wichtigen Akteur in der chinesischen KI-Landschaft entwickelt. Mit dem R1-Modell gelang DeepSeek Anfang 2025 der Durchbruch auf internationaler Ebene, als das Modell in mehreren Benchmark-Tests westliche Konkurrenzprodukte übertraf.

Was haltet ihr von dieser Entwicklung? Könnte DeepSeek mit seinem R2-Modell tatsächlich die westlichen KI-Anbieter unter Druck setzen? Teilt eure Gedanken dazu in den Kommentaren!

Zusammenfassung

DeepSeek plant Veröffentlichung des KI-Modells R2 mit 1,2 Bio. Parametern
R2 soll 97% günstiger als GPT-4 sein und nutzt hybride MoE-Architektur
Training erfolgte ausschließlich auf chinesischen Huawei Ascend 910B Chips
Rechenleistung entspricht 91% eines vergleichbaren Nvidia A100-Clusters
R2 verfügt im Gegensatz zum Vorgänger über fortschrittliche Bildverarbeitung
DeepSeek wurde 2021 von ehemaligen Mitarbeitern chinesischer Tech-Firmen gegründet
R1-Modell übertraf Anfang 2025 westliche Konkurrenz in Benchmark-Tests

Siehe auch:

Thema:

DeepSeek

Gefällt dir dieser Artikel? WinFuture in der Google-Suche bevorzugen WinFuture auf folgen

Kommentieren0

Hinweis einsenden

Weitere Nachrichten zum Thema KI-Studie: Wer Karriere machen will, sollte auf ChatGPT & Co. verzichtenWer braucht schon den Westen? Huawei baut komplette Chip-IndustrieDeepSeek V3.1 fordert OpenAI und Co. mit Open-Source-KI herausDeepSeek muss neue KI verschieben, weil Huawei-Chips zu schlecht sindDeepSeek veröffentlicht V3, bereitet OpenAI und Co. KopfschmerzenSenf dazu: Datenkrake Google schlägt wieder zu (Gemini vs. DeepSeek)