Blackwell B200: Nvidia will seinen bisherigen Super-Chip noch toppen

Der H100-Chip hat Nvidia zum Multimilliarden-Dollar-Unternehmen aufsteigen lassen. Während die Konkurrenz versucht, einen Teil vom Kuchen zurückzuholen, setzt der Konzern nun mit dem Blackwell B200 noch einen drauf.

Christian Kahle, 19.03.2024 09:21 Uhr

BoliviaInteligente / Unsplash

20 Petaflops pro Chip

Laut Nvidia bietet der neue B200-Grafikprozessor, der auf Berechnungen im KI-Bereich optimiert ist, mit seinen 208 Milliarden Transistoren eine FP4-Leistung von bis zu 20 Petaflops. Ein GB200-"Superchip"-Modul, das zwei dieser GPUs mit einer einzelnen Grace-CPU kombiniert, kann laut des Herstellers eine enorme Leistungssteigerung bei LLM-Inferenz-Workloads bieten und ist gleichzeitig potenziell wesentlich effizienter. Laut Nvidia werden Betriebskosten und Energieverbrauch im Vergleich zu einer H100 um das 25-fache gesenkt.

Um ein KI-Modell mit 1,8 Billionen Parametern zu trainieren, wären laut Nvidia bisher 8000 Hopper-GPUs und 15 Megawatt Energie erforderlich gewesen. Heute, so Nvidia-Chef Jensen Huang, schaffen das 2000 Blackwell-GPUs und verbrauchen dabei nur vier Megawatt. Bei einem GPT-3 LLM-Benchmark mit 175 Milliarden Parametern habe der GB200 laut Nvidia eine etwas bescheidenere siebenfache Leistung im Vergleich zum Vorgänger H100. Nvidia Blackwell B200

GB200-Modul mit zwei GPUs und einer CPU Eine der entscheidenden Neuerungen in dem System ist eine verbesserte Transformer-Engine der zweiten Generation, die die Rechenleistung, die Bandbreite und die Modellgröße verdoppelt. Ein zweiter entscheidender Unterschied ergibt sich nur, wenn man eine große Anzahl dieser GPUs miteinander verbindet: Enthalten ist nämlich ein NVLink-Switch der nächsten Generation, der bis zu 576 GPUs mit einer bidirektionalen Bandbreite von 1,8 Terabyte pro Sekunde miteinander kommunizieren lässt.

Bestellungen schon da

Nvidia gibt an, dass seine Systeme auf Zehntausende von GB200-Superchips skalieren können, die über 800-Gbit/s-Netzwerke mit dem neuen Quantum-X800 InfiniBand (für bis zu 144 Verbindungen) oder Spectrum-X800 Ethernet (für bis zu 64 Verbindungen) miteinander verbunden sind.

Nvidia hat nach eigenen Angaben bereits Bestellungen der großen Datenzentren-Betreiber Amazon, Google, Microsoft und Oracle vorliegen. Diese wollen die NVL72-Racks, in denen 36 CPUs und 72 Grafikprozessoren arbeiten, in ihre Cloud-Service-Angebote integrieren. Wie umfangreich die Bestellungen sind, ist allerdings unklar.

Zusammenfassung

Nvidia H100-Chip macht Firma zum Milliardenkonzern
Neuer B200-Grafikprozessor, optimiert für KI-Berechnungen
GB200-Superchip senkt Betriebskosten und Energieverbrauch
Training von KI-Modellen nun mit weniger GPUs möglich
Verbesserte Transformer-Engine verdoppelt Rechenleistung
NVLink-Switch verbindet bis zu 576 GPUs
Systeme skalierbar über Quantum-X800 InfiniBand oder Ethernet
Große Datenzentren wie Amazon und Google ordern NVL72-Racks

Siehe auch:

Thema:

Nvidia

Kommentieren1

Hinweis einsenden

Weitere Nachrichten zum Thema Nvidia und Ubisoft: KI-Einsatz bringt NPCs mit realistischem VerhaltenNvidia-Chef: Konkurrenz schlägt uns nichtmal mit verschenkten ChipsAMD holt gegen Nvidia auf: Marktanteile im GPU-Rennen wachsenEnde einer Ära: Nvidia stellt Produktion der GeForce GTX-Serie ein