Nvidia hat neue Blackwell-Probleme:
Server-Chips sollen überhitzen

Nvidias neue Blackwell-KI-Chips stoßen auf unerwartete Herausforde­rungen: Überhitzungsprobleme in Server-Racks sorgen für Verzöge­rungen und Bedenken bei Kunden. Der Chipgigant steht unter Druck, schnell Lösungen zu finden, um die Auslieferung nicht zu gefährden.
Logo, Nvidia, Gpu, Grafikkarte, Geforce, Grafik, Nvidia Geforce, Schriftzug

Hitzige Angelegenheit für Nvidia

Nvidia, der weltweit wertvollste Chiphersteller, steht vor einer heiklen Situation. Die mit Spannung erwarteten Blackwell-KI-Chips, die als (enorm wichtige) Nachfolger der Hopper- und Ada-Lovelace-Mikroarchitekturen gelten, bereiten dem Unternehmen unerwartete Kopfschmerzen. Einem Bericht zufolge überhitzen die neuen Grafikprozessoren (GPUs) in Server-Racks mit hoher Kapazität, was zu Verzögerungen und Bedenken bei wichtigen Kunden wie Google, Meta und Microsoft führt.

Die Probleme treten insbesondere in Servern auf, die bis zu 72 Prozessoren beherbergen und einen Stromverbrauch von bis zu 120 Kilowatt pro Rack aufweisen können. Diese enormen Leistungsanforderungen führen zu Überhitzungsproblemen, die nicht nur die GPU-Leistung beeinträchtigen, sondern auch die Gefahr von Komponentenschäden bergen. Nvidia sah sich als Folge bereits gezwungen, das Design seiner Server-Racks mehrfach zu überarbeiten.

Wie The Information berichtet (via Toms Hardware), hat Nvidia in den letzten Monaten seine Zulieferer angewiesen, Änderungen am Design der Server-Racks für die neue Blackwell-GPU vorzunehmen. Diese Anpassungen kommen wohlgemerkt zu einem späten Zeitpunkt im Produktionsprozess und könnten neue Verzögerungen bei der Auslieferung zur Folge haben. Ein Nvidia-Sprecher betonte gegenüber Reuters die enge Zusammenarbeit mit führenden Cloud-Service-Anbietern und bezeichnete die Designänderungen als Teil des normalen Entwicklungsprozesses.


Nicht erste Hürde für Blackwell

Dies ist nicht die erste Hürde, die Nvidia mit seiner Blackwell-Architektur nimmt. Bereits zuvor musste das Unternehmen die Produktionsanlaufphase aufgrund eines Designfehlers verschieben. Die B100- und B200-GPUs von Nvidia verwenden TSMCs CoWoS-L-Packaging-Technologie, um ihre beiden Chiplets zu verbinden. Diese komplexe Technologie erfordert eine präzise Positionierung der LSI-Brücken (Local Silicon Interconnect), um wie vorgesehen zu funktionieren.

Für Nvidia steht viel auf dem Spiel: Als führender Anbieter von KI-Chips für Rechenzentren muss das Unternehmen nicht nur die Erwartungen der Kunden erfüllen, sondern auch dem immer größer werdenden Erfolgsdruck der Anleger standhalten.

Nvidia selbst bleibt aber bewusst optimistisch. Das Unternehmen hat bereits Schritte unternommen, um die Produktionszuverlässigkeit zu verbessern, einschließlich Modifikationen an den oberen Metallschichten des GPU-Siliziums und den Bump-Strukturen. Die endgültige Überarbeitung der Blackwell-GPUs ging Ende Oktober in die Massenproduktion, was bedeutet, dass Nvidia voraussichtlich ab Ende Januar mit der Auslieferung dieser Prozessoren beginnen kann.

Zusammenfassung
  • Nvidias neue Blackwell-KI-Chips zeigen Überhitzungsprobleme in Server-Racks
  • Server-Racks mit 72 Prozessoren verbrauchen bis zu 120 Kilowatt Leistung
  • Designänderungen der Server-Racks wurden kurzfristig von Nvidia angeordnet
  • Produktionsstart musste bereits wegen eines Designfehlers verschoben werden
  • Blackwell-GPUs nutzen TSMCs CoWoS-L-Packaging-Technologie für Chiplets
  • Massenproduktion der überarbeiteten GPUs startete Ende Oktober 2024
  • Die Auslieferung der neuen Prozessoren soll Ende Januar 2025 beginnen

Siehe auch:


Nvidia Aktienkurs in Euro
GeForce RTX 4070 Ti im Preisvergleich
Derzeit keine Angebote im Preisvergleich
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!