Nvidia warnt: Rowhammer-Angriffe auf GDDR6-GPUs, so sichert man ab
Forscher haben bewiesen: Rowhammer-Angriffe funktionieren jetzt auch auf Grafikkarten. Ihre "GPUHammer"-Methode reduzierte die Genauigkeit von KI-Modellen von 80 auf 0,1 Prozent. Doch wie schützt man sich davor?
Bei diesem Angriffstyp wird eine DRAM-Speicherzeile wiederholt zugegriffen - oder "gehämmert" -, was durch elektrische Interferenzen zu Bit-Flips in benachbarten Bereichen führen kann.
Die Forscher entwickelten spezielle Techniken, um die einzigartigen Eigenschaften von GPU-Speichersystemen zu nutzen. GDDR6-Speicher unterscheidet sich durch höhere Taktraten und komplexere Timing-Parameter von traditionellem RAM. Besonders riskant sind Angriffe in Cloud-Umgebungen, wo mehrere Nutzer gemeinsam eine GPU verwenden.
Ein potenzieller Angreifer könnte theoretisch KI-Modelle sabotieren oder sensible Daten kompromittieren. Die Manipulation erfordert jedoch präzise Kontrolle und spezifische Angriffsbedingungen.
Was haltet ihr von Nvidias Empfehlung, ECC zu aktivieren? Würdet ihr die Performance-Einbußen für mehr Sicherheit in Kauf nehmen? Teilt eure Gedanken dazu in den Kommentaren!
Siehe auch:
Rowhammer-Angriff auf GPU-Speicher
Sicherheitsforscher der University of Toronto haben eine Schwachstelle in Grafikkarten-Speichersystemen aufgedeckt. Ihre Methode, genannt "GPUHammer", demonstriert, dass Rowhammer-Angriffe, die ursprünglich 2014 für traditionelle Arbeitsspeicher aufgekommen waren, nun auch auf moderne GDDR6-Grafikspeicher übertragbar sind.Bei diesem Angriffstyp wird eine DRAM-Speicherzeile wiederholt zugegriffen - oder "gehämmert" -, was durch elektrische Interferenzen zu Bit-Flips in benachbarten Bereichen führen kann.
Proof-of-Concept
In einem Proof-of-Concept zeigten die Forscher, wie sich die Genauigkeit neuronaler Netze von 80 auf 0,1 Prozent reduzieren ließ - und dies durch einen einzelnen Bit-Flip.Die Forscher entwickelten spezielle Techniken, um die einzigartigen Eigenschaften von GPU-Speichersystemen zu nutzen. GDDR6-Speicher unterscheidet sich durch höhere Taktraten und komplexere Timing-Parameter von traditionellem RAM. Besonders riskant sind Angriffe in Cloud-Umgebungen, wo mehrere Nutzer gemeinsam eine GPU verwenden.
Ein potenzieller Angreifer könnte theoretisch KI-Modelle sabotieren oder sensible Daten kompromittieren. Die Manipulation erfordert jedoch präzise Kontrolle und spezifische Angriffsbedingungen.
Wie funktioniert ein Rowhammer-Angriff?
-
1.
AngriffsmethodeEin Angreifer bringt das System dazu, bestimmte Speicherzeilen sehr oft hintereinander zu lesen. Dadurch entstehen elektrische Störungen, die dazu führen, dass Bits in benachbarten Zeilen "umkippen" (von 0 auf 1 oder umgekehrt).
-
2.
Bit-FlipsDiese gezielten Bit-Flips können genutzt werden, um kritische Daten wie Zugriffsrechte oder kryptographische Schlüssel zu manipulieren.
-
3.
SoftwarebasiertFür den Angriff ist in der Regel keine spezielle Hardware oder physischer Zugriff nötig - es reicht oft schon ein speziell geschriebenes Programm oder sogar ein präpariertes JavaScript auf einer Webseite.
-
4.
Privilegien-EskalationAngreifer können durch gezielte Bit-Flips höhere Rechte auf einem System erlangen, z. B. Root- oder Administratorrechte.
-
5.
DatenmanipulationEs ist möglich, Daten im Speicher zu verändern oder auszulesen, auf die der Angreifer keinen Zugriff haben sollte.
-
6.
Cloud-GefahrBesonders kritisch ist Rowhammer in Cloud-Umgebungen, wo mehrere Nutzer denselben physischen Speicher teilen. Hier kann ein Angreifer sogar aus einer virtuellen Maschine heraus andere VMs angreifen.
-
7.
Schwer zu patchenDa es sich um ein Hardwareproblem handelt, lässt sich Rowhammer nicht einfach durch ein Software-Update beheben. Viele Systeme bleiben daher anfällig, solange sie betroffene Speicherchips verwenden.
Schutzmaßnahmen
Nvidia empfiehlt nun als Gegenmaßnahme die Aktivierung von System-Level Error-Correcting Code (ECC). Diese Technologie kann Bit-Flips erkennen und korrigieren, kommt aber mit erheblichen Leistungseinbußen von bis zu 50 Prozent. Das Ganze hat aber noch ein Problem: Nicht alle Grafikkarten unterstützen ECC - während professionelle Modelle wie die A6000 oder H100 die Funktion besitzen, fehlt sie bei Consumer-Grafikkarten vollständig.Was haltet ihr von Nvidias Empfehlung, ECC zu aktivieren? Würdet ihr die Performance-Einbußen für mehr Sicherheit in Kauf nehmen? Teilt eure Gedanken dazu in den Kommentaren!
Welche GPUs sind von GPUHammer betroffen?
Die GPUHammer-Attacke wurde erfolgreich auf einer NVIDIA RTX A6000 mit GDDR6 demonstriert. Andere GDDR6-basierte GPUs wie die RTX 3080 zeigten keine Bitflips, was auf Unterschiede im DRAM-Design, Temperatur oder Fertigung zurückzuführen sein könnte.
GPUs mit HBM-Speicher wie die A100 oder neuere Modelle mit GDDR7 (z. B. RTX 5090) waren in den Tests nicht betroffen. Diese verfügen über integrierten ECC-Schutz, der einfache Bitflips maskieren kann.
GPUs mit HBM-Speicher wie die A100 oder neuere Modelle mit GDDR7 (z. B. RTX 5090) waren in den Tests nicht betroffen. Diese verfügen über integrierten ECC-Schutz, der einfache Bitflips maskieren kann.
Wie funktioniert ein Rowhammer-Angriff?
Bei Rowhammer werden bestimmte Speicherzellen durch häufiges Auslesen (Hammering) so stark belastet, dass benachbarte Zellen elektrische Störungen erfahren und ihre Bitwerte kippen - sogenannte Bitflips.
GPUHammer nutzt diese Technik auf GDDR6-Speicher, indem es gezielt DRAM-Bänke identifiziert, mit hoher Parallelität hämmert und die Hammering-Zeit mit Speicher-Refresh-Zyklen synchronisiert, um Schutzmechanismen wie TRR zu umgehen.
GPUHammer nutzt diese Technik auf GDDR6-Speicher, indem es gezielt DRAM-Bänke identifiziert, mit hoher Parallelität hämmert und die Hammering-Zeit mit Speicher-Refresh-Zyklen synchronisiert, um Schutzmechanismen wie TRR zu umgehen.
Welche Gefahren birgt GPUHammer konkret?
Die größte Gefahr liegt in der Manipulation von Daten in gemeinsam genutzten GPU-Umgebungen. In der Proof-of-Concept-Studie konnte ein einzelner Bitflip die Genauigkeit von ML-Modellen von 80 % auf 0,1 % senken.
In Cloud- oder HPC-Umgebungen mit mehreren Nutzern könnten Angreifer so fremde Modelle sabotieren, Daten korrumpieren oder Dienste gezielt stören - ohne physischen Zugriff auf das System.
In Cloud- oder HPC-Umgebungen mit mehreren Nutzern könnten Angreifer so fremde Modelle sabotieren, Daten korrumpieren oder Dienste gezielt stören - ohne physischen Zugriff auf das System.
Wie kann ich mich gegen GPUHammer schützen?
Die effektivste Maßnahme ist das Aktivieren von ECC (Error Correcting Code) auf unterstützten GPUs. Dies korrigiert alle bisher beobachteten Einzelbitfehler automatisch.
ECC lässt sich per nvidia-smi -e 1 aktivieren (Reboot erforderlich). Alternativ kann der ECC-Status über Tools wie Redfish API oder NSM Type 3 geprüft werden. NVIDIA empfiehlt ECC besonders für ML- und Cloud-Workloads.
ECC lässt sich per nvidia-smi -e 1 aktivieren (Reboot erforderlich). Alternativ kann der ECC-Status über Tools wie Redfish API oder NSM Type 3 geprüft werden. NVIDIA empfiehlt ECC besonders für ML- und Cloud-Workloads.
Beeinträchtigt ECC die GPU-Leistung?
Ja, ECC kann die Leistung um bis zu 10 % bei ML-Inferenzaufgaben senken und etwa 6,25 % des verfügbaren Speichers beanspruchen. In manchen Fällen wurden sogar bis zu 50 % Leistungsverlust berichtet - allerdings bei extremen Workloads.
Trotz dieser Einbußen überwiegt in sicherheitskritischen Umgebungen der Schutz vor Datenkorruption oder Angriffen. Besonders in Multi-Tenant-Setups ist ECC dringend zu empfehlen.
Trotz dieser Einbußen überwiegt in sicherheitskritischen Umgebungen der Schutz vor Datenkorruption oder Angriffen. Besonders in Multi-Tenant-Setups ist ECC dringend zu empfehlen.
Sind neuere GPUs wie H100 sicher?
Ja, aktuelle GPUs wie die H100 (HBM3) oder Blackwell B200 verfügen über integrierten On-Die-ECC-Schutz, der standardmäßig aktiviert ist. Dieser erkennt und korrigiert Bitfehler ohne Nutzereingriff.
Allerdings könnten zukünftige Angriffe mit Multi-Bit-Flips diesen Schutz umgehen - wie bei ECCploit gezeigt. Daher bleibt auch bei neuen GPUs Wachsamkeit geboten.
Allerdings könnten zukünftige Angriffe mit Multi-Bit-Flips diesen Schutz umgehen - wie bei ECCploit gezeigt. Daher bleibt auch bei neuen GPUs Wachsamkeit geboten.
Wie aufwendig ist ein GPUHammer-Angriff?
Der Angriff erfordert tiefes Verständnis der GPU-Architektur, präzise Kontrolle über Speicherzuweisungen und hohe Zugriffsraten. Zudem muss der Angreifer in einer zeitlich geteilten GPU-Umgebung arbeiten, um fremde Daten zu beeinflussen.
Die Komplexität macht GPUHammer derzeit zu einem gezielten Angriffsszenario - etwa in Cloud-Umgebungen mit gemeinsam genutzter Hardware. Für typische Endanwender ist das Risiko aktuell gering.
Die Komplexität macht GPUHammer derzeit zu einem gezielten Angriffsszenario - etwa in Cloud-Umgebungen mit gemeinsam genutzter Hardware. Für typische Endanwender ist das Risiko aktuell gering.
Wie erkenne ich, ob ECC aktiviert ist?
Über die Kommandozeile lässt sich ECC mit nvidia-smi --query-gpu=ecc.mode.current --format=csv prüfen. Ein "Enabled"-Status zeigt an, dass der Schutz aktiv ist.
Alternativ können Administratoren über BMC-Schnittstellen wie Redfish oder Tools wie NVIDIA SMBPBI den ECC-Status auslesen und verwalten. Diese Methoden erfordern jedoch administrative Rechte und ggf. Zugang zum NVIDIA Partner Portal.
Alternativ können Administratoren über BMC-Schnittstellen wie Redfish oder Tools wie NVIDIA SMBPBI den ECC-Status auslesen und verwalten. Diese Methoden erfordern jedoch administrative Rechte und ggf. Zugang zum NVIDIA Partner Portal.
Zusammenfassung
- Sicherheitsforscher entdeckten 'GPUHammer'-Angriffe auf GDDR6-Speicher
- Bit-Flips durch elektrische Interferenzen können KI-Genauigkeit zerstören
- Rowhammer-Methode wurde speziell für Eigenschaften von GPUs angepasst
- Besonders in Cloud-Umgebungen mit geteilten GPUs besteht erhöhtes Risiko
- Nvidia empfiehlt ECC-Aktivierung, die Leistungseinbußen von bis zu 50% bringt
- ECC-Schutz ist nur in professionellen Grafikkartenmodellen verfügbar
Siehe auch:
- RTX 5090: Nächster Käufer erlebt beim Auspacken böse Überraschung
- Nvidia-Shop trollt Kunden: RTX 4040 "Brick Edition" ist ein Backstein
- Ironie: Ausgerechnet teure RTX-GPUs stürzen bei fordernder Grafik ab
- Nvidia lässt Gamer sitzen: RTX-Produktion fällt wohl KI-Chips zum Opfer
- Betrug bei RTX 5090: Käufer erhalten reihenweise (fast) leere Kartons
Thema:
Nvidia Aktienkurs in Euro
Videos zum Thema Nvidia
- AMD Radeon RX 6700 XT: So schlägt sich die betagte Grafikkarte heute
- Alter Gaming-PC: So lässt sich ein i7-8700K per GPU-Upgrade retten
- Etoe Seal Pro: Günstiger Beamer mit einigen Stärken im Test
- Ultimea Poseidon E100: Solider Full-HD-LED-Beamer im Test
- Firebat Huan 16 Pro: Gaming-Notebook mit klaren Schwächen im Test
Neue Nvidia-Downloads
Beliebt im Preisvergleich
- PCIe:
Beiträge aus dem Forum
Weiterführende Links
Neue Nachrichten
- Nur für 3 Stunden: Riesiger 85" Mini-LED-TV bei Media Markt im Angebot
- Zero Trust: Windows Server startet verschlüsselte Namensauflösung
- Nvidia GPU RTX Pro 6000: Preis steigt um krasse 55 Prozent
- Google Earth: Flugsimulator jetzt kostenlos im Browser nutzbar
- iPhone Fold Ultra im Hands-on-Video: Alle Details im Überblick
- Tesla-Autopilot: Fahrer hebeln Sicherheitssystem mit 8-€-Gadget aus
- Spiele bis zu 95 % schneller laden: Riesiger Boost für AMD-GPUs ist da
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!
Alle Kommentare zu dieser News anzeigen