DeepSeek plus Huawei-Chips sollen China an KI-Spitze katapultieren
DeepSeek steht kurz vor dem Release des neuen Modells R2. Gerüchten zufolge soll es mit 1,2 Billionen Parametern arbeiten und dabei 97% günstiger sein als GPT-4. Eine Besonderheit: Das Modell wurde vollständig auf chinesischen Huawei-Chips trainiert.
Das neue Modell setzt auf eine hybride MoE-Architektur (Mixture of Experts), die eine fortschrittliche Version bestehender MoE-Implementierungen darstellt. Diese Architektur ermöglicht es, mit 1,2 Billionen dynamisch aktivierbaren Parametern zu arbeiten, wobei der tatsächliche Rechenaufwand nur etwa 78 Milliarden Parameter beträgt. Zum Vergleich: Das Vorgängermodell R1 verfügte über etwa 600 Milliarden Parameter.
Für das Training des Modells hat DeepSeek nach Berichten verschiedener Quellen ausschließlich chinesische Hardware verwendet. Das Unternehmen nutzte Huaweis Ascend 910B KI-Chips und erreichte dabei eine Cluster-Auslastung von 82 Prozent. Die Rechenleistung wird mit 512 PetaFLOPS bei FP16-Genauigkeit angegeben, was etwa 91 Prozent der Leistung eines vergleichbaren Nvidia A100-Clusters entsprechen soll.
DeepSeek R2 bringt offenbar auch signifikante Verbesserungen in der multimodalen Verarbeitung. Im Gegensatz zum Vorgängermodell R1, das keine Bildverarbeitungsfunktionen besaß, soll R2 über fortschrittliche visuelle Fähigkeiten verfügen.
Was haltet ihr von dieser Entwicklung? Könnte DeepSeek mit seinem R2-Modell tatsächlich die westlichen KI-Anbieter unter Druck setzen? Teilt eure Gedanken dazu in den Kommentaren!
Siehe auch:
Chinas KI-Riese setzt auf Kosteneffizienz
Der chinesische KI-Entwickler DeepSeek bereitet die Veröffentlichung seines neuen Sprachmodells R2 vor. Nach Informationen, die in chinesischen und westlichen Medien kursieren, könnte das Modell die KI-Landschaft erneut massiv verändern. Der Nachfolger des im Januar 2025 veröffentlichten R1-Modells soll mit beachtlichen technischen Daten aufwarten und könnte erneut ein kleines Beben durch die Technikwelt schicken.Das neue Modell setzt auf eine hybride MoE-Architektur (Mixture of Experts), die eine fortschrittliche Version bestehender MoE-Implementierungen darstellt. Diese Architektur ermöglicht es, mit 1,2 Billionen dynamisch aktivierbaren Parametern zu arbeiten, wobei der tatsächliche Rechenaufwand nur etwa 78 Milliarden Parameter beträgt. Zum Vergleich: Das Vorgängermodell R1 verfügte über etwa 600 Milliarden Parameter.
Kostensenkung und Innovation
Die wohl bemerkenswerteste Eigenschaft des neuen Modells ist seine Kosteneffizienz. Laut dem chinesischen Portal Jiuyangongshe (via Wccftech) soll DeepSeek R2 bei der Verarbeitung von Text-Tokens 97,3 Prozent günstiger sein als OpenAIs GPT-4. Dies würde das Modell besonders attraktiv für Unternehmenskunden machen, die auf kosteneffiziente KI-Lösungen angewiesen sind. Jiuyangongshe gilt in China als eine der führenden Informationsquellen für Entwicklungen im KI-Bereich und hat in der Vergangenheit bereits mehrfach zuverlässige Vorabinformationen zu neuen Technologien veröffentlicht.Für das Training des Modells hat DeepSeek nach Berichten verschiedener Quellen ausschließlich chinesische Hardware verwendet. Das Unternehmen nutzte Huaweis Ascend 910B KI-Chips und erreichte dabei eine Cluster-Auslastung von 82 Prozent. Die Rechenleistung wird mit 512 PetaFLOPS bei FP16-Genauigkeit angegeben, was etwa 91 Prozent der Leistung eines vergleichbaren Nvidia A100-Clusters entsprechen soll.
DeepSeek R2 bringt offenbar auch signifikante Verbesserungen in der multimodalen Verarbeitung. Im Gegensatz zum Vorgängermodell R1, das keine Bildverarbeitungsfunktionen besaß, soll R2 über fortschrittliche visuelle Fähigkeiten verfügen.
Wer steckt hinter DeepSeekP?
DeepSeek wurde 2021 von ehemaligen Mitarbeitern von Baidu und anderen chinesischen Technologieunternehmen gegründet. Das Unternehmen hat sich schnell zu einem wichtigen Akteur in der chinesischen KI-Landschaft entwickelt. Mit dem R1-Modell gelang DeepSeek Anfang 2025 der Durchbruch auf internationaler Ebene, als das Modell in mehreren Benchmark-Tests westliche Konkurrenzprodukte übertraf.Was haltet ihr von dieser Entwicklung? Könnte DeepSeek mit seinem R2-Modell tatsächlich die westlichen KI-Anbieter unter Druck setzen? Teilt eure Gedanken dazu in den Kommentaren!
Zusammenfassung
- DeepSeek plant Veröffentlichung des KI-Modells R2 mit 1,2 Bio. Parametern
- R2 soll 97% günstiger als GPT-4 sein und nutzt hybride MoE-Architektur
- Training erfolgte ausschließlich auf chinesischen Huawei Ascend 910B Chips
- Rechenleistung entspricht 91% eines vergleichbaren Nvidia A100-Clusters
- R2 verfügt im Gegensatz zum Vorgänger über fortschrittliche Bildverarbeitung
- DeepSeek wurde 2021 von ehemaligen Mitarbeitern chinesischer Tech-Firmen gegründet
- R1-Modell übertraf Anfang 2025 westliche Konkurrenz in Benchmark-Tests
Siehe auch:
- DeepSeek veröffentlicht V3, bereitet OpenAI und Co. Kopfschmerzen
- Senf dazu: Datenkrake Google schlägt wieder zu (Gemini vs. DeepSeek)
- DeepSeek führt in China zu Ansturm auf Nvidias H20-Chips
- Nächstes Land geht gegen DeepSeek-KI vor, untersagt App-Downloads
- DeepSeek taucht plötzlich auf einer mysteriösen Prestige-Domain auf
Thema:
Videos zum Thema KI
- KI hält in Kameras Einzug: Was sie dort tut und was es bringt
- Super Bowl 2026: OpenAI lässt uns mit Codex Neues erschaffen
- Super Bowl 2026: Claude verrät, wie man einen Sixpack bekommt
- Super Bowl 2026: Oakley Meta-Brillen halten epische Sportmomente fest
- Super Bowl 2026: Base44 zeigt, wie KI jeden zum Programmierer macht
Interessante Links
Neue Nachrichten
- Nur jetzt: Media Markt und Saturn starten 19%-MwSt.-Rabatt für alle
- FritzBox-Labor im Anmarsch: Problem bei MLO-fähigen Geräten behoben
- 1,1 Mio. MacBook Neo: Apple reißt das Einstiegssegment an sich
- Studie kommt zum Schluss, dass Solarsegel keine abwegige Idee sind
- Airbus A350-1000ULR: 22-Stunden-Langstreckenjet absolviert Erstflug
- Kernfusion: Start-up Xcimer aktiviert derzeit größten privaten Laser
- "Zerschneiden" eines Photons erzeugt unendlich viele neue Lichtteilchen
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!