Pilotprojekt für Transkription von TV-Sendungen

Forschung & Wissenschaft Der Bayerische Rundfunk und das European Media Laboratory (EML) starten ein Pilotprojekt zur automatischen Transkription der Sendungen der "BR Alpha Forum"-Reihe.

Die automatische Umwandlung von gesprochener Sprache in Text hat in den letzten Jahren große Fortschritte erzielt. Gründe dafür liegen in den kontinuierlich verbesserten Erkennungsalgorithmen, der wachsenden Rechnerleistung und der Möglichkeit, riesige Datenmengen zu verarbeiten. Auch am EML habe man ein entsprechendes System entwickelt, teilten die Forscher mit.


In dem neuen Projekt mit dem Bayerischen Rundfunk wird das Transkriptionssystem an die Sendung "BR Alpha Forum" angepasst. "BR Alpha Forum" ist eine tägliche Sendung, in der Persönlichkeiten aus Politik und Wirtschaft, Wissenschaft und Gesellschaft, Religion und Kultur in 45 Minuten ausführlich zu Wort kommen.

Im Forschungsprojekt wird das Transkriptionssystem mit bereits ausgestrahlten Sendungen von BR Alpha Forum gefüttert. Es "lernt" anhand der Manuskripte das Vokabular, das in dieser Sendung verwendet wird. Außerdem "hört" es den Sprechern genau zu und trainiert so die akustische Spracherkennung.

"Wir trainieren die Spracherkennungssysteme mit vielen Texten und gesprochenen Aufnahmen der entsprechenden Domäne", sagte EML-Forschungs- und Entwicklungsleiter Siegfried Kunzmann. Erkennungsfehler werden mit grammatikalischer Analyse und Korrektur verbessert und "nicht-gesprochene" Satzzeichen eingefügt. Damit erreichen die Forscher eine verbesserte Textdarstellung und -strukturierung. Als Ergebnis der automatischen Transkription liegen dann sowohl der gesprochene Text mit Zeichensetzung als auch die Zeitzuordnung für jedes Wort vor.

Das Pilotprojekt von EML und Bayerischem Rundfunk hat zum Ziel, die BR Alpha Forum-Gespräche automatisch zu transkribieren und in Vortragsmanuskripte umzuwandeln. "Außerdem soll die Suche und Wiedergabe von Sendungen im Video-Archiv über freie Suchbegriffe möglich werden", so Herbert Tillmann, Direktor Produktion und Technik beim Bayerischen Rundfunk.
Diese Nachricht empfehlen:
 
Respekt für die Entwickler. Wer selber mal händisch transkibiert hat weis, wie schwierig das schon für nen Menschen ist.
 
@LoD14: Funktionierte das nicht iwie mit dem Program Logox. Oder versteh ich das gerade falsch?
 
aha, man füttert also mit bayrischem material... na das könnte wirklich problematisch werden. warum man aber hier offensichtlich gez gelder verbraucht erschließt sich mir nicht. was is der nutzen davon? vor allem hat doch das gar nichts mehr mit dem grundauftrag des öffentlichen fernsehens zu tun? mir geht das irgendwie zu weit, ganz unangetastet was man mit den forschungsergebnissen anfängt.
 
@Rikibu: naja, also von forschungsergebnissen hab ich noch mehr, weil die sind ja nicht für katz, im gegensatz zu irgendwelchem gejodelt mit florian silbereisen...
 
@Rikibu: Du möchtest also Gehörschwachen Menschen das Recht auf Fernsehen absprechen? Und doch, das fällt genau unter Bildungsauftrag. Mit dieser Technik lässt sich dann das umständliche Versorgen dieser Zielgruppe (welche in Anbetracht lauter MP3-Player zunimmt) mit Untertiteln via Videotext umgehen, da die Technik einfach das Tonsignal des Films umsetzt, was dann auch bei den Privaten angewandt werden kann, welche die Gruppe der Gehörschwachen und-losen vollkommen auslässt.


Alle Kommentare zu dieser News anzeigen

Schreiben Sie uns Ihre Meinung, bewerten Sie Kommentare oder diskutieren Sie mit anderen WinFuture.de Lesern!

Melden Sie sich jetzt kostenlos an
oder verwenden Sie Ihren bestehenden Zugang.

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

Community

  • Neue Kommentare
  • Neue Mitglieder

WinFuture wird gehostet von Artfiles

MSDN Online

News zu IT Pro- und Dev-Tools