Job-Killer KI? - Dafür scheitert sie noch zu oft an einfachsten Aufgaben
Die neuesten KI-Modelle wirken manchmal so beeindruckend, dass so manche verschiedene Jobs in den Firmenverwaltungen in Gefahr sehen. In der Praxis zeigt sich allerdings, dass die Systeme viel zu oft an einfachen Aufgaben scheitern, um eine Gefahr darzustellen.
GPT-4-Turbo schaffte in dem Test nur 79 Prozent der Fragen zu einem SEC-Bericht richtig zu beantworten. Andere KI-Systeme schnitten noch deutlich schlechter ab. Oftmals verweigerten die sogenannten großen Sprachmodelle die Antwort oder "halluzinierten" Zahlen und Fakten, die nicht in den SEC-Filings enthalten waren.
"Diese Art von Leistungsrate ist einfach absolut inakzeptabel", sagte Patronus AI-Mitbegründer Anand Kannappan gegenüber dem US-Sender CNBC. "Sie muss viel, viel höher sein, damit das wirklich automatisiert und produktionsreif funktioniert."
Die Fähigkeit, wichtige Zahlen schnell zu extrahieren und Analysen von Finanzberichten durchzuführen, wurde immerhin als eine der vielversprechendsten Anwendungen für Chatbots angesehen, seit ChatGPT Ende letzten Jahres veröffentlicht wurde.
SEC-Filings sind voll von wichtigen Daten, und wenn ein Bot sie genau zusammenfassen oder schnell Fragen zu ihrem Inhalt beantworten könnte, würde er dem Nutzer in der wettbewerbsintensiven Finanzbranche einen Vorsprung verschaffen. Allerdings tut man weiterhin gut daran, den Algorithmen nicht zu vertrauen und ihre Ergebnisse noch einmal von geschulten Mitarbeitern prüfen zu lassen.
Siehe auch:
GPT-4-Turbo scheitert oft
Das zeigen beispielsweise auch neue Untersuchungen durch das Startup Patronus AI. Selbst die beste getestete Modellkonfiguration, OpenAIs GPT-4-Turbo, schaffte es viel zu oft nicht, Fragen zum Inhalt von SEC-Berichten korrekt zu beantworten. Dabei sind diese gesetzlich vorgeschriebenen Mitteilungen an die US-Börsenaufsicht in aller Regel besonders gut und formal strukturiert.GPT-4-Turbo schaffte in dem Test nur 79 Prozent der Fragen zu einem SEC-Bericht richtig zu beantworten. Andere KI-Systeme schnitten noch deutlich schlechter ab. Oftmals verweigerten die sogenannten großen Sprachmodelle die Antwort oder "halluzinierten" Zahlen und Fakten, die nicht in den SEC-Filings enthalten waren.
"Diese Art von Leistungsrate ist einfach absolut inakzeptabel", sagte Patronus AI-Mitbegründer Anand Kannappan gegenüber dem US-Sender CNBC. "Sie muss viel, viel höher sein, damit das wirklich automatisiert und produktionsreif funktioniert."
Kontrolle ist besser
Die Ergebnisse verdeutlichen einige der Herausforderungen, mit denen KI-Modelle konfrontiert sind, wenn große Unternehmen, insbesondere in regulierten Branchen wie dem Finanzsektor, versuchen, Spitzentechnologie in ihre Abläufe einzubinden - sei es für den Kundenservice oder die Forschung.Die Fähigkeit, wichtige Zahlen schnell zu extrahieren und Analysen von Finanzberichten durchzuführen, wurde immerhin als eine der vielversprechendsten Anwendungen für Chatbots angesehen, seit ChatGPT Ende letzten Jahres veröffentlicht wurde.
SEC-Filings sind voll von wichtigen Daten, und wenn ein Bot sie genau zusammenfassen oder schnell Fragen zu ihrem Inhalt beantworten könnte, würde er dem Nutzer in der wettbewerbsintensiven Finanzbranche einen Vorsprung verschaffen. Allerdings tut man weiterhin gut daran, den Algorithmen nicht zu vertrauen und ihre Ergebnisse noch einmal von geschulten Mitarbeitern prüfen zu lassen.
Zusammenfassung
- KI-Modelle scheitern oft an einfachen Aufgaben
- Patronus AI testet GPT-4-Turbo mit SEC-Berichten
- Beste KI beantwortet nur 79% der Fragen richtig
- Große Sprachmodelle liefern oft falsche Daten
- Patronus AI fordert höhere Leistungsraten
- KI im Finanzsektor hat mit Herausforderungen zu kämpfen
- Nutzer sollten KI-Ergebnisse überprüfen lassen
Siehe auch:
Thema:
Videos zum Thema KI
- KI hält in Kameras Einzug: Was sie dort tut und was es bringt
- Super Bowl 2026: OpenAI lässt uns mit Codex Neues erschaffen
- Super Bowl 2026: Claude verrät, wie man einen Sixpack bekommt
- Super Bowl 2026: Oakley Meta-Brillen halten epische Sportmomente fest
- Super Bowl 2026: Base44 zeigt, wie KI jeden zum Programmierer macht
Beiträge aus dem Forum
Interessante Links
Neue Nachrichten
- Aktuelle Technik-Blitzangebote von Amazon im Überblick
- 1&1 krempelt Mobilfunktarife um: Jetzt teils mehr für weniger Geld
- Starlink-Konkurrent: Amazon hat genügend Satelliten, um zu starten
- Intel hebt Preise für beliebte Budget-Gaming-CPUs still und heimlich an
- FritzOS 8.25: Neues FritzBox-Update erreicht weitere Modelle
- WM 2026 für 4,99 Euro: Waipu.tv haut 4K-Stick (fast) gratis raus
- Samsung verklagt eine Stadt in NRW: Streit um Schul-iPads eskaliert
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!
Alle Kommentare zu dieser News anzeigen