Mistral AI kontert Metas Llama 3.1 mit Large 2: Ein effizientes KI-Modell, das trotz geringerer Parameterzahl mit GPT-4 konkurrieren soll. Der Wettbewerb im KI-Markt spitzt sich zu, während Fragen nach echten Innovationen und der Zukunft offener Modelle im Raum stehen.

Technische Merkmale und Fähigkeiten

Leistungsvergleich und Benchmarks

Verfügbarkeit und Lizenzmodell

Mistral AI: Ein aufstrebender Stern am KI-Himmel

Vergleich mit Llama 3.1

Zukunftsaussichten und Herausforderungen

Zusammenfassung Mistral AI stellt effizientes KI-Modell Large 2 vor

Modell konkurriert mit GPT-4 trotz weniger Parameter

Optimiert für Codegenerierung und logisches Denken

Unterstützt viele Sprachen, einschließlich Chinesisch

Erreicht hohe Genauigkeit im MMLU-Benchmark

Verfügbar auf Cloud-Plattformen wie Amazon Bedrock

Lizenzmodell trennt kommerzielle von nicht-kommerzieller Nutzung

Nur einen Tag nach der Veröffentlichung von Metas Llama 3.1 hat das französische KI-Startup Mistral AI sein neuestes Sprachmodell Mistral Large 2 vorgestellt.Mistral Large 2 soll mit seinen 123 Milliarden Parametern in puncto Leistung mit deutlich größeren Modellen wie Llama 3.1 (405 Milliarden Parameter) oder GPT-4 von OpenAI mithalten können. Dabei verspricht Mistral AI eine höhere Effizienz und geringere Betriebskosten. Das Modell wurde in verschiedenen Bereichen wie Codegenerierung, mathematischem Denken und Logik optimiert.Ein wichtiger Aspekt ist die Effizienz des Modells. Mistral Large 2 erreicht seine Leistung mit weniger als einem Drittel der Parameter von Llama 3.1. Dies könnte in der Praxis zu einer kostengünstigeren Nutzung führen, was besonders für Unternehmen und Entwickler attraktiv sein dürfte, die KI-Lösungen in großem Maßstab einsetzen möchten.Mistral Large 2 verfügt über ein Kontextfenster von 128.000 Token, was der Verarbeitung sehr langer Texte entspricht - etwa einem Buch von 300 Seiten. Dies entspricht der Kapazität von GPT-4 und Llama 3.1, übertrifft aber deutlich die 4.096 Token des ursprünglichen ChatGPT.Eine der Stärken von Mistral Large 2 ist seine verbesserte Mehrsprachigkeit. Das Modell unterstützt neben den gängigen europäischen Sprachen wie Englisch, Deutsch, Französisch, Spanisch und Italienisch auch Arabisch, Hindi, Russisch, Chinesisch, Japanisch und Koreanisch.Ein Blick auf die vom Unternehmen veröffentlichten Benchmarks zeigt die Stärken des neuen Modells. In Tests zur Codegenerierung wie HumanEval und MBPP schneidet Mistral Large 2 ähnlich gut ab wie GPT-4 und übertrifft dabei Llama 3 in einigen Bereichen. Besonders beeindruckend ist die Leistung in verschiedenen Programmiersprachen: Bei C++ erreicht das Modell eine Genauigkeit von 84,5%, bei Java 84,2% und bei TypeScript sogar 86,8%.Im oft zitierten LLM-Benchmark MMLU (Massive Multitask Language Understanding) erreicht die vortrainierte Version von Mistral Large 2 eine Genauigkeit von 84%. Damit setzt es laut Mistral AI einen neuen Bestwert "auf der Pareto-Front der Leistung/Kosten offener Modelle."Diese Zahlen sind beachtenswert, wenn man bedenkt, dass Mistral Large 2 mit deutlich weniger Parametern auskommt als seine Konkurrenten. Es bleibt jedoch abzuwarten, wie sich diese Leistung in realen Anwendungsszenarien bewährt.Mistral AI betont, dass bei der Entwicklung von Large 2 besonderer Wert auf die Minimierung von Halluzinationen gelegt wurde. Das Modell wurde darauf trainiert, vorsichtiger und kritischer in seinen Antworten zu sein. Es soll eher zugeben, wenn es keine Lösung finden kann oder nicht über genügend Informationen verfügt, als falsche oder irreführende Antworten zu liefern.Mistral Large 2 ist ab sofort über verschiedene Cloud-Plattformen wie Google Vertex AI, Amazon Bedrock, Azure AI Studio und IBM WatsonX verfügbar. Es kann zudem auf Mistrals eigener Le Plateforme und bei HuggingFace ausprobiert werden. Allerdings erhilten wir bei unseren Testversuchen auf HuggingFace heute morgen nur Fehlermeldungen.Interessant ist das Lizenzmodell: Für Forschung und nicht-kommerzielle Zwecke steht das Modell unter einer offenen Lizenz zur Verfügung. Für die kommerzielle Nutzung ist jedoch eine kostenpflichtige Lizenz erforderlich.Diese Strategie ermöglicht es Mistral AI, von der Innovationskraft der Open-Source-Community zu profitieren, während gleichzeitig ein Geschäftsmodell für den Unternehmenseinsatz etabliert wird. Es bleibt abzuwarten, wie dieses Modell von Entwicklern und Unternehmen angenommen wird.Mistral AI, gegründet im April 2023 von ehemaligen Mitarbeitern von Meta und Google DeepMind, hat sich in kurzer Zeit zu einem bedeutenden Player im KI-Sektor entwickelt . Das Unternehmen hat kürzlich eine Finanzierungsrunde von 600 Millionen Euro abgeschlossen, was seine Bewertung auf stolze 5,8 Milliarden Euro katapultierte.Der Name "Mistral" leitet sich übrigens von einem starken Wind ab, der in Südfrankreich weht - ein passender Name für ein Unternehmen, das die KI-Landschaft aufmischen möchte.Die schnelle Folge von Modellveröffentlichungen - Llama 3.1 von Meta am einen Tag , Mistral Large 2 am nächsten - zeigt, wie intensiv der Wettbewerb im Bereich der großen Sprachmodelle geworden ist. Experten sprechen bereits von einem "roten Ozean", einem Markt, in dem viele Anbieter um dieselben Kunden konkurrieren.Während Llama 3.1 mit seinen 405 Milliarden Parametern auf Größe und Open-Source-Verfügbarkeit setzt, punktet Mistral Large 2 mit Effizienz und fokussierter Leistung. Llama 3.1 wurde auf über 15 Billionen Token trainiert und nutzte mehr als 16.000 Nvidia H100 GPUs für das Training - eine enorme Investition, die die Ressourcen kleinerer Unternehmen übersteigt.Mistral AI hingegen setzt auf ein schlankeres Modell, das trotz geringerer Größe konkurrenzfähige Leistung erbringen soll. Dies könnte für viele Anwender attraktiv sein, die leistungsfähige KI-Modelle einsetzen möchten, aber nicht über die Ressourcen verfügen, um Modelle wie Llama 3.1 zu betreiben.In diesem Umfeld wird es für Unternehmen zunehmend schwieriger, sich durch inkrementelle Verbesserungen zu differenzieren. Die wahre Herausforderung liegt darin, echte Innovationen zu entwickeln, die neue Anwendungsfelder erschließen oder bestehende Probleme auf revolutionäre Weise lösen.Während Mistral Large 2 zweifellos eine beeindruckende technische Leistung darstellt, bleibt die Frage, ob es ausreicht, um sich langfristig im hart umkämpften KI-Markt zu behaupten. Die nächsten Monate werden zeigen, ob Mistral AI oder einer seiner Konkurrenten den entscheidenden Durchbruch schafft, der das Feld der KI grundlegend verändert.Für Nutzer bedeutet diese rasante Entwicklung einerseits eine große Auswahl an leistungsfähigen KI-Modellen. Andererseits stellt sich die Herausforderung, aus der Vielzahl der Angebote die für den jeweiligen Anwendungsfall am besten geeignete Lösung auszuwählen.