Computer-Stimmen sollen bald natürlich klingen

Künstliche Stimmen, die mit dem Computer generiert werden, sollen zukünftig deutlich menschlicher klingen. Das Ziel ist es dabei, ein selbstlernendes System zu schaffen, das breit eingesetzt werden kann.

Die Entwicklung einer entsprechenden Technologie erfolgt an der Universität des Saarlandes. Hierzu übersetzt der Professor für Phonetik und Phonologie Bernd Möbius Laute in Zahlen und sucht und glättet Störstellen mit einem Rechenverfahren. Daraus soll ein mathematisches Modell der menschlichen Sprache abgeleitet werden, das es möglich macht, jedem beliebigen Gegenstand eine beliebige Stimme zu verleihen - ohne künstlich zu klingen.

"Den habe ich mir ganz anders vorgestellt" - das Phänomen tritt zu Tage bei Radiomoderatoren oder Leuten, die bisher nur am Telefon miteinander zu tun hatten: Wer Menschen ausschließlich von ihrer Stimme her kennt, macht sich ein bestimmtes Bild. Da kann eine junge Frau älter wirken, ein kräftiger Mann dünner oder ein blonder Haarträger eher dunkelhaarig. Menschliche Stimmen wecken die Phantasie.

"Betrachtet man die Hirntätigkeit beim Hören, ruft eine natürliche Stimme Aktivität in Arealen hervor, die für Gefühle und Assoziationen verantwortlich sind. Bei der klassischen Computerstimme ist das anders. Hört der Mensch eine künstliche Stimme bleiben diese Areale stumm", erklärte Möbius.


Zwar seien moderne Computerstimmen in Auskunfts- oder Dialogsystemen vom blechernen Klang der abgehackten Wörter ohne Betonung bereits weit entfernt. Trotzdem hört das verwöhnte und seit jeher auf Stimmen spezialisierte menschliche Ohr die feinen Unterschiede, ob Mensch oder Maschine spricht. Werden Sätze aus Laut- und Wortschnipseln zusammengesetzt, entlarvt es selbst feinste Sprünge sofort. Fließende Sprachmelodien und sonstige Eigenheiten machen den besonderen Charakter natürlicher Stimmen aus. Fehlen sie, klingt die Stimme künstlich - und sie weckt auch keinerlei Gefühl.

Diese Charakteristika der menschlichen Stimme will Möbius herausfinden, um sie in künstliche Stimmen hineinzurechnen und Sprungstellen und Störfaktoren aus ihnen herauszuholen. "Der Hörer soll sich eine Person hinter der Stimme vorstellen", sagte er.

Hierzu begibt sich der Forscher mit seinem Team gewissermaßen auf die mikroskopische Ebene und betrachtet die Sprache in ihren kleinsten Einzelteilen. Zugrunde liegt ein digitalisierter Textkorpus, den ein Sprecher im Tonstudio eingesprochen hat. Die Phonetiker verwenden hier unter anderem die so genannte "Diphonsynthese". Ein Diphon ist ein kurzer Sprach-Abschnitt, der in der Mitte eines Lautsegments beginnt und in der Mitte des folgenden Lautsegments endet. "Unsere Sprache kennt 45 Laute und etwa 2000 Diphone, jedes davon ist etwa 100 Millisekunden lang. Mit diesem Instrumentarium können wir auf lautlicher Ebene die gesamte Sprache abdecken", erläutert Möbius.

In den Diphonen liegen die größten Probleme der künstlichen Stimmen verborgen: Sie enthalten etwa den Übergang zwischen den Lauten - winzige Schallsegmente, die bei der Verknüpfung der Sprachbausteine die verräterischen Sprünge hinterlassen. Diese Übergänge verkettet Möbius neu und glättet sie auf diese Weise, wodurch unstete Holperer und Sprungstellen aus der Computersprache verschwinden sollen. "Anzahl und Häufigkeit der Übergänge lassen sich außerdem verringern, wenn es gelingt, längere Bausteine wie Silben oder ganze Wörter, die in den Sprachaufnahmen bereits verfügbar sind, wieder zu verwenden", führte er aus.
Diese Nachricht empfehlen
Videos zum Thema
 
Hello and welcome to the Aperture Science Enrichment Center ;) (sry, hab grad den Trailer zu Pacific Rim gesehen und konnte nicht anders)
 
@Slurp: The cake is a LIE!
 
@dodnet: the cake is so 2007 ;)
 
@Slurp: L-l-look at you, hacker. A p-p-pathetic creature of meat and bone, panting and sweating as you r-run through my corridors-s. H-h-how can you challenge a perfect, immortal machine?
 
@davidsung: Uh, Shodan... chapeau. Aber wenn wir schon dabei sind: I'm sorry Dave, I'm afraid I can't do that ^^


Alle Kommentare zu dieser News anzeigen

Schreiben Sie uns Ihre Meinung, bewerten Sie Kommentare oder diskutieren Sie mit anderen WinFuture.de Lesern!

Melden Sie sich jetzt kostenlos an
oder verwenden Sie Ihren bestehenden Zugang.

Wöchentlicher Newsletter

Beliebte Videos

powered by veeseo

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

WinFuture wird gehostet von Artfiles