Molmo-KI: Mit wenig Aufwand und Hirnschmalz auf GPT-4o-Niveau

KI-Modelle können auch leistungsfähig werden, ohne mit gigantischen Ressourcen große Datenmengen auszuwerten. Das belegen einmal mehr Forscher, die ein Open-Source-Modell zeigen können, das in einigen Bereichen sogar OpenAIs GPT-4o übertrifft.

Christian Kahle, 26.09.2024 10:49 Uhr

Ki, Künstliche Intelligenz, Cpu, Forschung, Prozessor, Chip, Wissenschaft, AI, Artificial Intelligence, Stockfotos, Science, Wissenschaftler, Gehirn, scientist, Bot, Binärcode, Kopf, Gehirnchip, Binär, Denken, Hirnforschung, Gehirnwellen, Hirnsteuerung, Künstliches Gehirn, Hirn, cyberkinetic, Gedanke, cyberkinetics

Strukturierte Daten

Entwickelt wurde das KI-Modell namens Molmo vom Allen Institute for Artificial Intelligence (AI2), das vom inzwischen verstorbenen Microsoft-Mitbegründer Paul Allen aufgebaut wurde. Multimodale Sprachmodelle wie Molmo sollen laut AI2 genauso leistungsfähig sein wie die proprietären Modelle von Unternehmen wie OpenAI, Google und Anthropic. Besonders das größte Molmo-Modell mit 72 Milliarden Parametern übertreffe in einigen Tests sogar OpenAIs GPT-4o, das schätzungsweise über eine Billion Parameter verfügt, hieß es.

AI2 führt diesen Erfolg auf eine effizientere Datenbeschaffung und die Trainingsmethoden zurück. Ali Farhadi, Chef von AI2, betonte, dass dies ein Beweis dafür sei, dass Open-Source-Entwicklungen im Bereich der Künstlichen Intelligenz (KI) inzwischen auf Augenhöhe mit geschlossenen, proprietären Modellen sind. Der große Vorteil von Open-Source-Modellen liege darin, dass Entwickler auf ihnen aufbauen und eigene Anwendungen entwickeln können.

Ein wichtiger Unterschied zu anderen großen KI-Modellen ist die gezielte Datenaufbereitung. Während viele KI-Systeme auf riesigen, oft unsortierten Datensätzen trainiert werden, wurde Molmo mit nur 600.000 handverlesenen Bildern und deutlich weniger Parametern trainiert. Diese hochwertigere Datengrundlage führe laut AI2 zu besseren Ergebnissen bei gleichzeitig geringerem Rechenaufwand.

Ein weiterer entscheidender Faktor war der Einsatz von menschlichen Helfern, die die Bilder im Detail beschrieben haben. Diese Beschreibungen wurden dann mithilfe von KI in Trainingsdaten umgewandelt, was den Prozess effizienter gestaltete.

Spezialfähigkeit Pointing

Eine besondere Fähigkeit des Modells ist das sogenannte "Pointing", also die Möglichkeit, auf spezifische Elemente eines Bildes zu verweisen. In einer Demonstration konnte Molmo unter anderem Objekte wie Liegestühle auf dem Übersichtsfoto einer Marina identifizieren und zählen. Diese Funktion könnte laut Farhadi in Zukunft für komplexe Aufgaben, wie die Interaktion mit Benutzeroberflächen, entscheidend sein.

Die Veröffentlichung von Molmo soll einen wichtigen Impuls für die Entwicklung neuer Anwendungen durch die Community geben. Farhadi sieht großes Potenzial in der Weiterentwicklung durch die Open-Source-Community und betont, dass offene Modelle wie Molmo eine effiziente und kostengünstige Alternative zu den milliardenschweren proprietären Modellen darstellen können.

Zusammenfassung

Molmo übertrifft teilweise OpenAIs GPT-4o
Entwickelt vom Allen Institute for Artificial Intelligence
72 Milliarden Parameter starkes Modell
Effiziente Datenbeschaffung und Trainingsmethoden
Open-Source-Modell ermöglicht eigene Entwicklungen
Molmo nutzt nur 600000 handverlesene Bilder
Menschliche Helfer beschreiben Bilder für das Training
Molmo kann spezifische Bildinhalte identifizieren
Veröffentlichung fördert Entwicklung durch die Community

Siehe auch:

Thema:

Künstliche Intelligenz

Kommentieren3

Hinweis einsenden

Weitere Nachrichten zum Thema Existenzielle Bedrohung? Pionier LeCun: KI dümmer als eine HauskatzeGPT-4o mini: OpenAIs neues KI-Modell spart Kosten bei mehr LeistungChatGPT für Biologie: KI-Modell kann völlig neue Proteine "schreiben"Google stellt seine neuen KI-Modelle vor: stärker, schneller, nützlicher