VALL-E: Microsofts KI-Tool imitiert Stimmen nach nur drei Sekunden
KI-Tools, die Bilder und Texte quasi aus dem Nichts erschaffen, sind das Thema der Stunde, bekannte Vertreter sind ChatGPT und DALL-E. In beiden hat Microsoft seine Finger im Spiel. Nun kommt eine weitere KI hinzu und die ist die wohl unheimlichste: Denn Vall-E imitiert Stimmen.
Künstliche Intelligenzen waren lange Zeit bzw. oftmals nicht viel mehr als ein leeres Schlagwort, um relativ banales Maschinenlernen zu beschreiben. Letzteres ist zwar immer noch zentral, die Ergebnisse sind aber mittlerweile so beeindruckend, dass das Wort Intelligenz langsam tatsächlich zutreffen kann. Das zeigen die OpenAI-Lösungen ChatGPT und DALL-E nur zu gut.
Microsoft, das zu den Geldgebern von OpenAI gehört, hat (direkt) auch seine eigene KI-Forschung und hat auch für diese einen Namen gewählt, der an DALL-E angelehnt ist: VALL-E. Dabei handelt es sich um eine Anwendung, die in der Lage ist, Stimmen nachzuahmen. Das Besondere dabei ist, dass VALL-E ein gerade einmal drei Sekunden langes Sample erfordert, um die menschliche Stimme bzw. eine bestimmte Person glaubhaft nachahmen zu können.
Die Qualität ist allerdings schwankend: Manche Aufnahmen klingen überzeugend und natürlich, andere hingegen eher blechern und künstlich. Allerdings sollte man hier vor allem bedenken, dass die Ausgangslage eben ein drei Sekunden langes Sample war. Je mehr man die KI "füttert", desto besser wird auch das Ergebnis, zudem lernt auch die KI selbst noch dazu.
VALL-E ist derzeit noch nicht öffentlich verfügbar, man kann also nicht selbst ausprobieren, wie gut bzw. überzeugend das Tool arbeitet - das ist aber vielleicht auch gut so, denn man kann erahnen, welchen Schaden ein solches Tool sowie die dazugehörigen Fakes anrichten könnten.
Siehe auch:
Microsoft, das zu den Geldgebern von OpenAI gehört, hat (direkt) auch seine eigene KI-Forschung und hat auch für diese einen Namen gewählt, der an DALL-E angelehnt ist: VALL-E. Dabei handelt es sich um eine Anwendung, die in der Lage ist, Stimmen nachzuahmen. Das Besondere dabei ist, dass VALL-E ein gerade einmal drei Sekunden langes Sample erfordert, um die menschliche Stimme bzw. eine bestimmte Person glaubhaft nachahmen zu können.
Auch für Tonfall und Emotionen
Wie AITopics berichtet (via Windows Central) wurde das Tool mit 60.000 Stunden an englischen Sprachdaten trainiert. Eine Besonderheit ist dabei, dass die KI-Stimme in der Lage ist, den Tonfall und die Emotionen eines Sprechers nachzuahmen. In einer dazugehörigen Studie haben Forscher der Cornell University mehrere Stimmen bzw. Sätze generiert, diese sind via GitHub auch zu hören.Die Qualität ist allerdings schwankend: Manche Aufnahmen klingen überzeugend und natürlich, andere hingegen eher blechern und künstlich. Allerdings sollte man hier vor allem bedenken, dass die Ausgangslage eben ein drei Sekunden langes Sample war. Je mehr man die KI "füttert", desto besser wird auch das Ergebnis, zudem lernt auch die KI selbst noch dazu.
VALL-E ist derzeit noch nicht öffentlich verfügbar, man kann also nicht selbst ausprobieren, wie gut bzw. überzeugend das Tool arbeitet - das ist aber vielleicht auch gut so, denn man kann erahnen, welchen Schaden ein solches Tool sowie die dazugehörigen Fakes anrichten könnten.
Siehe auch:
Thema:
Videos zum Thema OpenAI
- Super Bowl 2026: OpenAI lässt uns mit Codex Neues erschaffen
- Anthropic Claude macht sich über Werbung in ChatGPT lustig
- Super Bowl 2025: OpenAI heißt uns im KI-Zeitalter willkommen
- Microsoft stellt das neue Bing und vieles mehr für Windows 11 vor
- Bing mit ChatGPT: Microsoft stellt seinen "Kopilot fürs Netz" vor
Beliebte OpenAI-Downloads
Interessante Links
Neue Nachrichten
- Nach tödlichem Angriff: Bahn startet versprochene Bodycams im IC/ICE
- Amazon bietet jetzt auch MyFlexBox-Stationen als Alternative an
- Es wird eng für Kim Dotcom, er verliert seine jüngste Berufung
- Effektiv mtl. nur 0,95 Euro: Apple Watch 11 mit 20 GB Telekom-Flat
- Games nur noch digital: Sony bestätigt Aus für alle Disc-Spiele
- Die Google-KI Gemini blickt bald durch die Frontkamera im Auto
- Microsofts BlueHammer-Lücke wird von Ransomware ausgenutzt
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!
Alle Kommentare zu dieser News anzeigen