Blackwell B200: Nvidia will seinen bisherigen Super-Chip noch toppen

Der H100-Chip hat Nvidia zum Multimilliarden-Dollar-Unternehmen aufsteigen lassen. Während die Konkurrenz versucht, einen Teil vom Kuchen zurückzuholen, setzt der Konzern nun mit dem Blackwell B200 noch einen drauf.
Logo, Nvidia, Gpu, Grafikkarten, Geforce, RTX, Raytracing, icon
BoliviaInteligente / Unsplash

20 Petaflops pro Chip

Laut Nvidia bietet der neue B200-Grafikprozessor, der auf Berechnungen im KI-Bereich optimiert ist, mit seinen 208 Milliarden Transistoren eine FP4-Leistung von bis zu 20 Petaflops. Ein GB200-"Superchip"-Modul, das zwei dieser GPUs mit einer einzelnen Grace-CPU kombiniert, kann laut des Herstellers eine enorme Leistungssteigerung bei LLM-Inferenz-Workloads bieten und ist gleichzeitig potenziell wesentlich effizienter. Laut Nvidia werden Betriebskosten und Energieverbrauch im Vergleich zu einer H100 um das 25-fache gesenkt.

Um ein KI-Modell mit 1,8 Billionen Parametern zu trainieren, wären laut Nvidia bisher 8000 Hopper-GPUs und 15 Megawatt Energie erforderlich gewesen. Heute, so Nvidia-Chef Jensen Huang, schaffen das 2000 Blackwell-GPUs und verbrauchen dabei nur vier Megawatt. Bei einem GPT-3 LLM-Benchmark mit 175 Milliarden Parametern habe der GB200 laut Nvidia eine etwas bescheidenere siebenfache Leistung im Vergleich zum Vorgänger H100. Nvidia Blackwell B200GB200-Modul mit zwei GPUs und einer CPU Eine der entscheidenden Neuerungen in dem System ist eine verbesserte Transformer-Engine der zweiten Generation, die die Rechenleistung, die Bandbreite und die Modellgröße verdoppelt. Ein zweiter entscheidender Unterschied ergibt sich nur, wenn man eine große Anzahl dieser GPUs miteinander verbindet: Enthalten ist nämlich ein NVLink-Switch der nächsten Generation, der bis zu 576 GPUs mit einer bidirektionalen Bandbreite von 1,8 Terabyte pro Sekunde miteinander kommunizieren lässt.

Bestellungen schon da

Nvidia gibt an, dass seine Systeme auf Zehntausende von GB200-Superchips skalieren können, die über 800-Gbit/s-Netzwerke mit dem neuen Quantum-X800 InfiniBand (für bis zu 144 Verbindungen) oder Spectrum-X800 Ethernet (für bis zu 64 Verbindungen) miteinander verbunden sind.

Nvidia hat nach eigenen Angaben bereits Bestellungen der großen Datenzentren-Betreiber Amazon, Google, Microsoft und Oracle vorliegen. Diese wollen die NVL72-Racks, in denen 36 CPUs und 72 Grafikprozessoren arbeiten, in ihre Cloud-Service-Angebote integrieren. Wie umfangreich die Bestellungen sind, ist allerdings unklar.

Zusammenfassung
  • Nvidia H100-Chip macht Firma zum Milliardenkonzern
  • Neuer B200-Grafikprozessor, optimiert für KI-Berechnungen
  • GB200-Superchip senkt Betriebskosten und Energieverbrauch
  • Training von KI-Modellen nun mit weniger GPUs möglich
  • Verbesserte Transformer-Engine verdoppelt Rechenleistung
  • NVLink-Switch verbindet bis zu 576 GPUs
  • Systeme skalierbar über Quantum-X800 InfiniBand oder Ethernet
  • Große Datenzentren wie Amazon und Google ordern NVL72-Racks

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Nvidia Aktienkurs in Euro
GeForce RTX 4070 Ti im Preisvergleich
Derzeit keine Angebote im Preisvergleich
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!