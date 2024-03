Der H100-Chip hat Nvidia zum Multimilliarden-Dollar-Unternehmen aufsteigen lassen. Während die Konkurrenz versucht, einen Teil vom Kuchen zurückzuholen, setzt der Konzern nun mit dem Blackwell B200 noch einen drauf.

20 Petaflops pro Chip

Bestellungen schon da

Laut Nvidia bietet der neue B200-Grafikprozessor, der auf Berechnungen im KI-Bereich optimiert ist, mit seinen 208 Milliarden Transistoren eine FP4-Leistung von bis zu 20 Petaflops. Ein GB200-"Superchip"-Modul, das zwei dieser GPUs mit einer einzelnen Grace-CPU kombiniert, kann laut des Herstellers eine enorme Leistungssteigerung bei LLM-Inferenz-Workloads bieten und ist gleichzeitig potenziell wesentlich effizienter. Laut Nvidia werden Betriebskosten und Energieverbrauch im Vergleich zu einer H100 um das 25-fache gesenkt.Um ein KI-Modell mit 1,8 Billionen Parametern zu trainieren, wären laut Nvidia bisher 8000 Hopper-GPUs und 15 Megawatt Energie erforderlich gewesen. Heute, so Nvidia-Chef Jensen Huang, schaffen das 2000 Blackwell-GPUs und verbrauchen dabei nur vier Megawatt. Bei einem GPT-3 LLM-Benchmark mit 175 Milliarden Parametern habe der GB200 laut Nvidia eine etwas bescheidenere siebenfache Leistung im Vergleich zum Vorgänger H100.Eine der entscheidenden Neuerungen in dem System ist eine verbesserte Transformer-Engine der zweiten Generation, die die Rechenleistung, die Bandbreite und die Modellgröße verdoppelt. Ein zweiter entscheidender Unterschied ergibt sich nur, wenn man eine große Anzahl dieser GPUs miteinander verbindet: Enthalten ist nämlich ein NVLink-Switch der nächsten Generation, der bis zu 576 GPUs mit einer bidirektionalen Bandbreite von 1,8 Terabyte pro Sekunde miteinander kommunizieren lässt.Nvidia gibt an, dass seine Systeme auf Zehntausende von GB200-Superchips skalieren können, die über 800-Gbit/s-Netzwerke mit dem neuen Quantum-X800 InfiniBand (für bis zu 144 Verbindungen) oder Spectrum-X800 Ethernet (für bis zu 64 Verbindungen) miteinander verbunden sind.Nvidia hat nach eigenen Angaben bereits Bestellungen der großen Datenzentren-Betreiber Amazon, Google, Microsoft und Oracle vorliegen. Diese wollen die NVL72-Racks, in denen 36 CPUs und 72 Grafikprozessoren arbeiten, in ihre Cloud-Service-Angebote integrieren. Wie umfangreich die Bestellungen sind, ist allerdings unklar.