Molmo-KI: Mit wenig Aufwand und Hirnschmalz auf GPT-4o-Niveau

KI-Modelle können auch leistungsfähig werden, ohne mit gigantischen Ressourcen große Datenmengen auszuwerten. Das belegen einmal mehr Forscher, die ein Open-Source-Modell zeigen können, das in einigen Bereichen sogar OpenAIs GPT-4o übertrifft.
Ki, Künstliche Intelligenz, Cpu, Forschung, Prozessor, Chip, Wissenschaft, AI, Artificial Intelligence, Stockfotos, Science, Wissenschaftler, Gehirn, scientist, Bot, Binärcode, Kopf, Gehirnchip, Binär, Denken, Hirnforschung, Gehirnwellen, Hirnsteuerung, Künstliches Gehirn, Hirn, cyberkinetic, Gedanke, cyberkinetics

Strukturierte Daten

Entwickelt wurde das KI-Modell namens Molmo vom Allen Institute for Artificial Intelligence (AI2), das vom inzwischen verstorbenen Microsoft-Mitbegründer Paul Allen aufgebaut wurde. Multimodale Sprachmodelle wie Molmo sollen laut AI2 genauso leistungsfähig sein wie die proprietären Modelle von Unternehmen wie OpenAI, Google und Anthropic. Besonders das größte Molmo-Modell mit 72 Milliarden Parametern übertreffe in einigen Tests sogar OpenAIs GPT-4o, das schätzungsweise über eine Billion Parameter verfügt, hieß es.

AI2 führt diesen Erfolg auf eine effizientere Datenbeschaffung und die Trainingsmethoden zurück. Ali Farhadi, Chef von AI2, betonte, dass dies ein Beweis dafür sei, dass Open-Source-Entwicklungen im Bereich der Künstlichen Intelligenz (KI) inzwischen auf Augenhöhe mit geschlossenen, proprietären Modellen sind. Der große Vorteil von Open-Source-Modellen liege darin, dass Entwickler auf ihnen aufbauen und eigene Anwendungen entwickeln können.


Ein wichtiger Unterschied zu anderen großen KI-Modellen ist die gezielte Datenaufbereitung. Während viele KI-Systeme auf riesigen, oft unsortierten Datensätzen trainiert werden, wurde Molmo mit nur 600.000 handverlesenen Bildern und deutlich weniger Parametern trainiert. Diese hochwertigere Datengrundlage führe laut AI2 zu besseren Ergebnissen bei gleichzeitig geringerem Rechenaufwand.

Ein weiterer entscheidender Faktor war der Einsatz von menschlichen Helfern, die die Bilder im Detail beschrieben haben. Diese Beschreibungen wurden dann mithilfe von KI in Trainingsdaten umgewandelt, was den Prozess effizienter gestaltete.

Spezialfähigkeit Pointing

Eine besondere Fähigkeit des Modells ist das sogenannte "Pointing", also die Möglichkeit, auf spezifische Elemente eines Bildes zu verweisen. In einer Demonstration konnte Molmo unter anderem Objekte wie Liegestühle auf dem Übersichtsfoto einer Marina identifizieren und zählen. Diese Funktion könnte laut Farhadi in Zukunft für komplexe Aufgaben, wie die Interaktion mit Benutzeroberflächen, entscheidend sein.

Die Veröffentlichung von Molmo soll einen wichtigen Impuls für die Entwicklung neuer Anwendungen durch die Community geben. Farhadi sieht großes Potenzial in der Weiterentwicklung durch die Open-Source-Community und betont, dass offene Modelle wie Molmo eine effiziente und kostengünstige Alternative zu den milliardenschweren proprietären Modellen darstellen können.

Zusammenfassung
  • Molmo übertrifft teilweise OpenAIs GPT-4o
  • Entwickelt vom Allen Institute for Artificial Intelligence
  • 72 Milliarden Parameter starkes Modell
  • Effiziente Datenbeschaffung und Trainingsmethoden
  • Open-Source-Modell ermöglicht eigene Entwicklungen
  • Molmo nutzt nur 600000 handverlesene Bilder
  • Menschliche Helfer beschreiben Bilder für das Training
  • Molmo kann spezifische Bildinhalte identifizieren
  • Veröffentlichung fördert Entwicklung durch die Community

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!