John Carmack attestiert Nvidias DGX Spark enttäuschende Leistung

John Carmack kritisiert Nvidias neues DGX Spark AI-System scharf: Das 3999 Dollar teure Gerät erreicht nur die Hälfte der verspro­che­nen Leistung, zieht weniger als die Hälfte der angegebenen 240 Watt Strom und wird trotzdem heiß.
Nvidia, DGX Spark, Nvidia DGX Spark
Nvidia

Carmack deckt Performance-Probleme auf

John Carmack, Mitbegründer von id Software und ehemaliger CTO von Oculus VR, hat ernüchternde erste Hands-on-Testergebnisse zu Nvidias neuem DGX Spark AI-System veröffentlicht. Das kompakte System, das als "Desktop-Supercomputer" für KI-Entwicklung beworben wird, erreicht in der Praxis deutlich weniger Leistung als angegeben.

Das Gerät zieht laut Carmacks Tests nur etwa 100 Watt Leistung - weniger als die Hälfte der spezifizierten 240 Watt. Noch problematischer: Die gemessene Rechenleistung liegt bei nur 480 TFLOPS in FP4 oder etwa 60 TFLOPS in BF16-Workloads, was deutlich unter den Erwartungen liegt. Nvidia bewirbt das System mit bis zu einem PFLOPS Leistung.


Carmack teilte seine Erkenntnisse auf X mit und sorgte damit für Diskussionen in der Entwicklergemeinschaft. Der Programmierer, der als Pionier der 3D-Grafik-Programmierung gilt und maßgeblich an Spielen wie Doom und Quake beteiligt war, bringt jahrzehntelange Erfahrung in der Hardware-Optimierung mit. Seine Kritik wiegt daher besonders schwer.

Überhitzung trotz gedrosselter Leistung

Besonders bedenklich ist, dass das DGX Spark bereits bei der reduzierten Leistungsaufnahme Überhitzungsprobleme zeigt. Carmack berichtete, dass das Gerät selbst bei 100 Watt sehr heiß wird. Zudem erwähnte er Berichte anderer Nutzer über spontane Neustarts während längerer Berechnungen - ein Hinweis auf mögliche thermische Probleme.

Awni Hannun, leitender Entwickler von Apples MLX-Framework, bestätigte ähnliche Erfahrungen in eigenen Microbenchmarks mit PyTorch und MLX. Auch er stellte fest, dass das System nur etwa 60 TFLOPS bei BF16-Matrixoperationen erreicht. Das deutet darauf hin, dass die Performance-Probleme nicht auf Carmacks spezifische Testkonfiguration beschränkt sind.

"Sparsity"-Marketing

Die Diskrepanz erklärt sich durch Nvidias Verwendung von "strukturierter Sparsity" in den Leistungsangaben. Das Hardwarefeature überspringt Nullwerte in neuronalen Netzwerken und kann theoretisch die Rechengeschwindigkeit verdoppeln. Allerdings profitieren nur speziell optimierte Workloads davon, was in der allgemeinen Nutzung selten der Fall ist. Bei normalen, dichten Operationen ohne Sparsity liegt die tatsächliche Leistung etwa bei der Hälfte der beworbenen Werte.

Nvidia-CEO Jensen Huang stellt den DGX Spark vor

Das DGX Spark basiert auf dem GB10 Blackwell SuperChip, einer Kombination aus einem MediaTek ARM-Prozessor und Nvidias Blackwell-GPU. Das Besondere am System sind die 128 GB einheitlicher Systemspeicher, die nahtlos zwischen CPU und GPU geteilt werden. Das System läuft unter DGX OS und kostet in der Grundkonfiguration 3999 Dollar.

Technische Spezifikationen im Detail

Der GB10-Chip vereint 20 ARM v9.2-Kerne in zwei Clustern mit jeweils 16 MB geteiltem L3-Cache. Das Speichersystem nutzt LPDDR5X-9400 über einen 256-Bit-Bus und bietet etwa 301 GB/s Rohbandbreite. Für Hochgeschwindigkeits-I/O sorgt eine ConnectX-7 NIC mit PCIe Gen 5 x8-Verbindung, die Netzwerkgeschwindigkeiten bis 200 Gbps ermöglicht.

Die Blackwell-Architektur wurde ursprünglich für Rechenzentren entwickelt und soll deutliche Verbesserungen bei der KI-Performance bieten. Nvidia hatte das DGX Spark als erschwingliche Alternative zu den deutlich teureren DGX-Systemen positioniert, die oft sechsstellige Beträge kosten. Das kompakte Format sollte KI-Entwicklung auch für kleinere Teams und Unternehmen zugänglich machen.

Trotz der enttäuschenden Leistungswerte könnte das DGX Spark für bestimmte Anwendungsfälle interessant bleiben: Die 128 GB Speicher ermöglichen es, Modelle zu laden, die für die meisten Desktop-Systeme zu groß sind. Das System eignet sich besonders für kleinere Modelle und Prototyping, weniger für Produktionsumgebungen mit hohen Performance-Anforderungen.

Was haltet ihr von Carmacks Kritik an der DGX Spark? Sind die Performance-Probleme ein Dealbreaker oder rechtfertigt der große Speicher den Preis? Teilt eure Erfahrungen mit KI-Hardware in den Kommentaren.

Zusammenfassung
  • John Carmack kritisiert Nvidias DGX Spark wegen halber Leistung
  • Das 3999-Dollar-Gerät erreicht nur 480 TFLOPS statt 1 PFLOPS
  • Trotz reduzierter Leistungsaufnahme von 100 Watt wird das System sehr heiß
  • Diskrepanz erklärt sich durch Nvidias Verwendung von strukturierter Sparsity
  • GB10 Blackwell SuperChip bietet 128 GB einheitlichen Systemspeicher
  • Das System könnte für kleinere Modelle und Prototyping geeignet bleiben
  • Awni Hannun bestätigte ähnliche Erfahrungen in eigenen Microbenchmarks

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Nvidia Aktienkurs in Euro
GeForce RTX 4070 Ti im Preisvergleich
Derzeit keine Angebote im Preisvergleich
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!