Quellcode, der den KI-Boom ausgelöst hat, steht zum Download bereit

In einem Studentenzimmer mit zwei Grafikkarten begann die moderne KI-Revolution. Jetzt macht Google den historischen Code von AlexNet öffentlich - jenem System, das 2012 die Grundlagen für heutige KI-Anwendungen wie ChatGPT legte.

John Woll, 25.03.2025 16:47 Uhr

Künstliche Intelligenz, Zukunftstechnologie, Deep Learning, Maschinelles Lernen, 3D-Rendering, KI-Technologie, Bildverarbeitung, neuronales Netzwerk, Technologie-Hintergrund, Computervision, AlexNet, Leuchtreklame, Neonschrift, digitale Schaltkreise

Historischer Code wird Open Source

Das neuronale Netzwerk AlexNet gilt als Wegbereiter des modernen KI-Booms. Nun haben das Computer History Museum (CHM) und Google gemeinsam den originalen Quellcode als Open Source veröffentlicht. Die Software, die 2012 für einen Durchbruch in der Bilderkennung sorgte, steht ab sofort auf der GitHub-Seite zu AlexNet zum Download bereit.

AlexNet kombinierte erstmals drei entscheidende Technologien: Tiefe neuronale Netze, große Bilderdatenbanken und Grafikprozessoren (GPU). Das System wurde von den damaligen Studenten Alex Krizhevsky und Ilya Sutskever zusammen mit ihrem Doktorvater Geoffrey Hinton an der University of Toronto entwickelt. Anders als frühere KI-Systeme musste AlexNet nicht manuell programmiert werden, welche Merkmale es in Bildern erkennen sollte - es lernte diese Muster selbstständig aus den Trainingsdaten.

Es gibt Repositories mit Code namens "AlexNet" auf GitHub, allerdings sind viele davon nicht der Originalcode, sondern Nachbildungen, die auf dem berühmten Paper basieren. CHM ist stolz darauf, den Quellcode der Version von 2012 zu präsentieren
CHM

Wie Ars Technica berichtet, arbeitete das CHM fünf Jahre lang mit Google an der Veröffentlichung des Codes. Da Google 2013 das Startup DNNresearch der AlexNet-Entwickler übernommen hatte, besaß der Konzern die Rechte am Quellcode. Die Freigabe ermöglicht nun erstmals einen Blick in die authentische Implementierung - bisher kursierten im Netz vor allem Nachbauten des Systems.

Studentenbude bis Nobelpreis

Die Geschichte von AlexNet ist auch die Geschichte eines ungewöhnlichen Entwicklungsprozesses: Das Training des neuronalen Netzes fand auf zwei Nvidia-Grafikkarten in Krizhevskys Schlafzimmer im Haus seiner Eltern statt. Als Trainingsdaten diente ImageNet, eine von der Stanford-Professorin Fei-Fei Li initiierte Datenbank mit Millionen kategorisierter Bilder.

Bei der Präsentation 2012 auf einer Computer-Vision-Konferenz in Florenz erkannte der KI-Pionier Yann LeCun sofort die Bedeutung: Er bezeichnete AlexNet als "unmissverständlichen Wendepunkt in der Geschichte der Computer-Vision". Tatsächlich revolutionierte das System die Forschung - vor AlexNet nutzte kaum ein Paper im Computer-Vision-Bereich neuronale Netze, danach fast alle. Details liefert das Original-Papier "ImageNet-Klassifizierung mit Deep Convolutional Neuronal Networks" (PDF)
AlexNet

Sutskever, Krizhevsky, Hinton ... AlexNet

... und der AlexNet-Trainigspc (CHM)

Die drei Entwickler gingen später getrennte Wege: Sutskever wurde Mitgründer von OpenAI und brachte dort ChatGPT auf den Weg. Krizhevsky verließ Google 2017, um an neuen Deep-Learning-Techniken zu arbeiten. Hinton erhielt 2024 den Physik-Nobelpreis und warnt heute vor den Gefahren künftiger KI-Systeme. Er selbst fasst die Rollenverteilung beim AlexNet-Projekt mit Humor zusammen:

"Ilya dachte, wir sollten es machen, Alex brachte es zum Laufen, und ich bekam den Nobelpreis."
Geoffrey Hinton

Innovationen von AlexNet:

Besteht aus 8 Schichten:
5 Faltungsschichten (Convolutional Layers): Scannen Bilder in kleinen Abschnitten, um grundlegende Merkmale wie Kanten und Formen zu erkennen.
3 voll verbundene Schichten (Fully Connected Layers): Fassen die erkannten Merkmale zusammen, um die finale Klassifizierung zu treffen.

ReLU-Aktivierungsfunktion:

Setzt negative Werte auf Null, lässt positive unverändert - dadurch wird die Berechnung vereinfacht und das Lernen beschleunigt.

Einsatz von GPUs:

Hardware: Zwei NVIDIA GTX 580 GPUs mit jeweils ca. 3 GB dediziertem Speicher.
Technik: Durch Datenparallelität und die Nutzung der CUDA-Plattform wurden rechenintensive Faltungsoperationen auf hunderten kleiner Rechenkernen gleichzeitig abgearbeitet, was das Training deutlich beschleunigte.

Datenaugmentation:

Erzeugt künstlich mehr Trainingsbilder (z. B. durch Spiegeln oder Zuschneiden), um das Netzwerk robuster gegen Variationen zu machen.

Drop-out-Technik:

Schaltet zufällig Neuronen während des Trainings ab, um Überanpassung (Overfitting) zu verhindern und die Generalisierungsfähigkeit zu verbessern.

Erfolg bei ImageNet:

Trainiert mit ca. 1,2 Millionen Bildern in 1000 Kategorien, was zu einer deutlich besseren Erkennungsleistung führte als bei früheren Methoden.

Der Originalcode eines der wichtigsten KI-Meilensteine liegt nun offen. Was haltet ihr davon? Wird der Einblick in den Code zu neuen Erkenntnissen führen? Teilt eure Einschätzungen in den Kommentaren!

Zusammenfassung

AlexNet-Quellcode von 2012 durch Google und CHM veröffentlicht
KI-System kombinierte tiefe neuronale Netze, große Bilddatenbanken und GPUs
Training erfolgte auf zwei Nvidia-Grafikkarten in Krizhevskys Schlafzimmer
Revolutionierte Computer-Vision-Forschung und legte Grundstein für KI-Boom
Entwickler Sutskever, Krizhevsky und Hinton gingen später getrennte Wege
Innovationen: ReLU-Aktivierung, GPU-Nutzung und Datenaugmentation
Trainiert mit 1,2 Millionen Bildern in 1000 Kategorien auf ImageNet

Siehe auch:

Thema:

Open Source

Kommentieren0

Hinweis einsenden

Weitere Nachrichten zum Thema KI-Blase platzt bereits: Viele leer stehende Datenzentren in ChinaKI gegen Kultspiel: Darum scheitert Claude spektakulär an PokémonKI-Forscher: Firmen investieren Milliarden Dollar in eine SackgasseArk: Survival Evolved - Fans wegen peinlichen KI-Trailers stinksauerClaude geht online: Anthropics KI durchsucht jetzt auch das InternetGmail wird schlauer: Neue KI-Suche findet wichtige E-Mails schneller