Quellcode, der den KI-Boom ausgelöst hat, steht zum Download bereit
In einem Studentenzimmer mit zwei Grafikkarten begann die moderne KI-Revolution. Jetzt macht Google den historischen Code von AlexNet öffentlich - jenem System, das 2012 die Grundlagen für heutige KI-Anwendungen wie ChatGPT legte.
AlexNet kombinierte erstmals drei entscheidende Technologien: Tiefe neuronale Netze, große Bilderdatenbanken und Grafikprozessoren (GPU). Das System wurde von den damaligen Studenten Alex Krizhevsky und Ilya Sutskever zusammen mit ihrem Doktorvater Geoffrey Hinton an der University of Toronto entwickelt. Anders als frühere KI-Systeme musste AlexNet nicht manuell programmiert werden, welche Merkmale es in Bildern erkennen sollte - es lernte diese Muster selbstständig aus den Trainingsdaten.
Bei der Präsentation 2012 auf einer Computer-Vision-Konferenz in Florenz erkannte der KI-Pionier Yann LeCun sofort die Bedeutung: Er bezeichnete AlexNet als "unmissverständlichen Wendepunkt in der Geschichte der Computer-Vision". Tatsächlich revolutionierte das System die Forschung - vor AlexNet nutzte kaum ein Paper im Computer-Vision-Bereich neuronale Netze, danach fast alle. Details liefert das Original-Papier "ImageNet-Klassifizierung mit Deep Convolutional Neuronal Networks" (PDF)
Sutskever, Krizhevsky, Hinton ...
... und der AlexNet-Trainigspc (CHM)
Die drei Entwickler gingen später getrennte Wege: Sutskever wurde Mitgründer von OpenAI und brachte dort ChatGPT auf den Weg. Krizhevsky verließ Google 2017, um an neuen Deep-Learning-Techniken zu arbeiten. Hinton erhielt 2024 den Physik-Nobelpreis und warnt heute vor den Gefahren künftiger KI-Systeme. Er selbst fasst die Rollenverteilung beim AlexNet-Projekt mit Humor zusammen:
ReLU-Aktivierungsfunktion:
Einsatz von GPUs:
Datenaugmentation:
Drop-out-Technik:
Erfolg bei ImageNet:
Der Originalcode eines der wichtigsten KI-Meilensteine liegt nun offen. Was haltet ihr davon? Wird der Einblick in den Code zu neuen Erkenntnissen führen? Teilt eure Einschätzungen in den Kommentaren!
Siehe auch:
Historischer Code wird Open Source
Das neuronale Netzwerk AlexNet gilt als Wegbereiter des modernen KI-Booms. Nun haben das Computer History Museum (CHM) und Google gemeinsam den originalen Quellcode als Open Source veröffentlicht. Die Software, die 2012 für einen Durchbruch in der Bilderkennung sorgte, steht ab sofort auf der GitHub-Seite zu AlexNet zum Download bereit.AlexNet kombinierte erstmals drei entscheidende Technologien: Tiefe neuronale Netze, große Bilderdatenbanken und Grafikprozessoren (GPU). Das System wurde von den damaligen Studenten Alex Krizhevsky und Ilya Sutskever zusammen mit ihrem Doktorvater Geoffrey Hinton an der University of Toronto entwickelt. Anders als frühere KI-Systeme musste AlexNet nicht manuell programmiert werden, welche Merkmale es in Bildern erkennen sollte - es lernte diese Muster selbstständig aus den Trainingsdaten.
Es gibt Repositories mit Code namens "AlexNet" auf GitHub, allerdings sind viele davon nicht der Originalcode, sondern Nachbildungen, die auf dem berühmten Paper basieren. CHM ist stolz darauf, den Quellcode der Version von 2012 zu präsentierenWie Ars Technica berichtet, arbeitete das CHM fünf Jahre lang mit Google an der Veröffentlichung des Codes. Da Google 2013 das Startup DNNresearch der AlexNet-Entwickler übernommen hatte, besaß der Konzern die Rechte am Quellcode. Die Freigabe ermöglicht nun erstmals einen Blick in die authentische Implementierung - bisher kursierten im Netz vor allem Nachbauten des Systems.
Studentenbude bis Nobelpreis
Die Geschichte von AlexNet ist auch die Geschichte eines ungewöhnlichen Entwicklungsprozesses: Das Training des neuronalen Netzes fand auf zwei Nvidia-Grafikkarten in Krizhevskys Schlafzimmer im Haus seiner Eltern statt. Als Trainingsdaten diente ImageNet, eine von der Stanford-Professorin Fei-Fei Li initiierte Datenbank mit Millionen kategorisierter Bilder.Bei der Präsentation 2012 auf einer Computer-Vision-Konferenz in Florenz erkannte der KI-Pionier Yann LeCun sofort die Bedeutung: Er bezeichnete AlexNet als "unmissverständlichen Wendepunkt in der Geschichte der Computer-Vision". Tatsächlich revolutionierte das System die Forschung - vor AlexNet nutzte kaum ein Paper im Computer-Vision-Bereich neuronale Netze, danach fast alle. Details liefert das Original-Papier "ImageNet-Klassifizierung mit Deep Convolutional Neuronal Networks" (PDF)
Sutskever, Krizhevsky, Hinton ...
... und der AlexNet-Trainigspc (CHM)
Die drei Entwickler gingen später getrennte Wege: Sutskever wurde Mitgründer von OpenAI und brachte dort ChatGPT auf den Weg. Krizhevsky verließ Google 2017, um an neuen Deep-Learning-Techniken zu arbeiten. Hinton erhielt 2024 den Physik-Nobelpreis und warnt heute vor den Gefahren künftiger KI-Systeme. Er selbst fasst die Rollenverteilung beim AlexNet-Projekt mit Humor zusammen:
"Ilya dachte, wir sollten es machen, Alex brachte es zum Laufen, und ich bekam den Nobelpreis."Innovationen von AlexNet:
- Besteht aus 8 Schichten:
- 5 Faltungsschichten (Convolutional Layers): Scannen Bilder in kleinen Abschnitten, um grundlegende Merkmale wie Kanten und Formen zu erkennen.
- 3 voll verbundene Schichten (Fully Connected Layers): Fassen die erkannten Merkmale zusammen, um die finale Klassifizierung zu treffen.
- Setzt negative Werte auf Null, lässt positive unverändert - dadurch wird die Berechnung vereinfacht und das Lernen beschleunigt.
- Hardware: Zwei NVIDIA GTX 580 GPUs mit jeweils ca. 3 GB dediziertem Speicher.
- Technik: Durch Datenparallelität und die Nutzung der CUDA-Plattform wurden rechenintensive Faltungsoperationen auf hunderten kleiner Rechenkernen gleichzeitig abgearbeitet, was das Training deutlich beschleunigte.
- Erzeugt künstlich mehr Trainingsbilder (z. B. durch Spiegeln oder Zuschneiden), um das Netzwerk robuster gegen Variationen zu machen.
- Schaltet zufällig Neuronen während des Trainings ab, um Überanpassung (Overfitting) zu verhindern und die Generalisierungsfähigkeit zu verbessern.
- Trainiert mit ca. 1,2 Millionen Bildern in 1000 Kategorien, was zu einer deutlich besseren Erkennungsleistung führte als bei früheren Methoden.
Der Originalcode eines der wichtigsten KI-Meilensteine liegt nun offen. Was haltet ihr davon? Wird der Einblick in den Code zu neuen Erkenntnissen führen? Teilt eure Einschätzungen in den Kommentaren!
Zusammenfassung
- AlexNet-Quellcode von 2012 durch Google und CHM veröffentlicht
- KI-System kombinierte tiefe neuronale Netze, große Bilddatenbanken und GPUs
- Training erfolgte auf zwei Nvidia-Grafikkarten in Krizhevskys Schlafzimmer
- Revolutionierte Computer-Vision-Forschung und legte Grundstein für KI-Boom
- Entwickler Sutskever, Krizhevsky und Hinton gingen später getrennte Wege
- Innovationen: ReLU-Aktivierung, GPU-Nutzung und Datenaugmentation
- Trainiert mit 1,2 Millionen Bildern in 1000 Kategorien auf ImageNet
Siehe auch:
- KI gegen Kultspiel: Darum scheitert Claude spektakulär an Pokémon
- KI-Forscher: Firmen investieren Milliarden Dollar in eine Sackgasse
- Ark: Survival Evolved - Fans wegen peinlichen KI-Trailers stinksauer
- Claude geht online: Anthropics KI durchsucht jetzt auch das Internet
- Gmail wird schlauer: Neue KI-Suche findet wichtige E-Mails schneller
Thema:
Beliebte Open-Source-Downloads
Videos zum Thema
Beiträge aus dem Forum
Weiterführende Links
Neue Nachrichten
- Aktuelle Technik-Blitzangebote von Amazon im Überblick
- The Witcher: CD Projekt plant angeblich neues Multiplayer-Spiel
- Forscher bauen aus alten Handys erstaunlich leistungsstarke Server
- Xbox-Exodus: Chef von Microsofts Spielestudios geht
- Galaxy A27: Samsung leakt sein neues Jedermann-Smartphone selbst
- Spiele als Dauerwerbesendung: EA plant Reklame 'direkt im Gameplay'
- Nutzen umstritten, UK bannt dennoch Social Media für Unter-16-Jährige
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!