FTD.de » Wissen » Googeln im Radio und Fernsehen

Merken   Drucken   08.01.2006, 18:54 Schriftgröße: AAA

Googeln im Radio und Fernsehen  

Am Anfang war ein Star-Trek-Fan - und das Bedürfnis, alles über die Serie zu wissen. Lars Mainka und ein Mitarbeiter saßen abends beim Bier zusammen, als plötzlich die Frage im Raum stand: "Warum kann man die Folgen eigentlich nicht nach bestimmten Wörtern durchsuchen?" von Stephan Zimprich
Szene aus der Science-Fiction-Serie Raumschiff Enterprise (Star Trek)   Szene aus der Science-Fiction-Serie Raumschiff Enterprise (Star Trek)
Zwei Jahre später ist die Antwort marktreif. Noch im Januar bietet das Wismarer Unternehmen Comvision mit "Audioclipping" eine Technik an, die es ermöglicht, Radio- und Fernsehbeiträge nach Schlüsselwörtern zu durchforsten - und das Ergebnis als geschriebenen Text zusammenzustellen.
"Das Ziel von Audioclipping ist, multimediale Inhalte speziell in Nachrichten und Reportagen für Suchabfragen greifbar zu machen", sagt Mainka, Technischer Direktor bei Comvision. Anfangs soll die Technologie vor allem für Medienbeobachtung eingesetzt werden: Die Software hört beispielsweise bei unzähligen Radiosendern mit und liefert dem Kunden alle Stellen, in denen das Suchwort auftaucht, mit Datum, Uhrzeit und Sender.
Um die akustischen Signale in computerlesbare Daten umzuwandeln, nutzt Comvision einen Erkenner des US-Unternehmens Nuance. Die Software teilt die Wellenformen der digitalisierten Sprache in Phone und Phoneme auf. Das sind kleinste, unteilbare Lauteinheiten, die aneinander gereiht ein Wort oder einen Satz ergeben. Doch erst das so genannte Sprachmodell hinter dem Erkenner setzt die Einzelteile zu einem sinnvollen Kontext zusammen.
Das Sprachmodell ordnet jedem gelieferten Lautsplitter bestimmte Daten zu. Die Software berechnet die Wahrscheinlichkeit, wann ein Phonem typischerweise auf ein anderes folgt. Dabei haben die Tüftler für jede Sprachkonvention ein eigenes Modell entwickelt, für die typische Nachrichtensprache genauso wie für jedes Fachgebiet. "Die Bild-Zeitung hat als Sprachmodell ein niedriges Niveau, während die FTD einiges voraussetzt", sagt Mainka.
Das Problem: Sprache ist beweglich. Sie bleibt niemals gleich, neue Begriffe tauchen auf und verschwinden wieder, Gewohnheiten in Satzbau und Aussprache schleichen sich ein und verändern sich. Schwierig für die Entwickler sind auch so genannte Homophone. Das sind Wörter mit identischer Aussprache wie beispielsweise "Waise" und "Weise". Erst regelmäßig in der Nähe auftauchende Wörter, wie "Halb" vor "Waise" ermöglichen es dem Programm, eine eindeutige Entscheidung zu treffen.
Mit steigenden Rechenkapazitäten sind weitere Anwendungen vorstellbar. Daran wollen die Entwickler von Comvision gemeinsam mit dem Infrastrukturanbieter Unisys arbeiten. Am Ende könnte eine Art "Audiogoogle" stehen, eine On-Demand-Suchmaschine, die nicht Texte, sondern multimediale Inhalte nach Schlüsselwörtern durchpflügt. So ließen sich Podcasts, Internet-TV und Audiostreams in die Suche einbeziehen.
Alexander Mehler, Computerlinguist von der Universität Bielefeld, hält die Technik für vielversprechend. "Klingt sehr gut", sagt er, schränkt aber ein: "Die tatsächliche Leistungsfähigkeit wird man erst beurteilen können, wenn man weiß, wie schnell die Suchabfragen in der Praxis funktionieren."
Geschäftsführer Manfred Büttner rechnet mit einem Marktpotenzial in Europa von 25 bis 30 Mio. Euro in den nächsten zwei Jahren allein für die Audioclipping-Anwendung. Die Entwicklungskosten bewegten sich bislang im niedrigen siebenstelligen Bereich und wurden teils privat, teils über staatliche Förderung des Landes Mecklenburg-Vorpommern aufgebracht.
Audioclipping
Innovation Die neue Technik soll Nachrichten und Reportagen im Radio, Fernsehen oder Internet gezielt nach bestimmten Suchbegriffen durchstöbern. Sie hört beispielsweise Radiosender mit und liefert alle Stellen, in denen das Suchwort auftaucht, mit Datum, Uhrzeit und Sender.
Technik Die Software wandelt akustische Signale in computerlesbare Daten um. Dafür teilt sie die digitalisierte Sprache in kleinste, unteilbare Lauteinheiten. Ein Sprachmodell ordnet die Lautsplitter bestimmten Abfragedaten zu.
Anwendung Ziel ist eine Art "Audiogoogle", eine Suchmaschine, die multimediale Inhalte nach bestimmten Wörtern durchsucht. Auch Podcasts, Internet-TV und Audiostreams ließen sich damit in die Suche einbeziehen.
  • Aus der FTD vom 09.01.2006
    © 2006 Financial Times Deutschland,
Bookmarken   Drucken   Senden   Leserbrief schreiben   Fehler melden  
Kommentare
Kommentar schreiben Pflichtfelder*




Den Parameter für die jeweilige Rubrik anpassen: @videoList
  impulse startet Projekt impulse Wissen
impulse startet Projekt impulse Wissen

Wie sorgt man dafür, dass ein Unternehmen innovativ bleibt? Wie viel Bauchgefühl ist bei der Auswahl von neuen Mitarbeitern erlaubt? Antworten auf solche Fragen bietet künftig das neue Wissenskompendium impulse Wissen. mehr

Meistgelesen
 



LEBEN

mehr Leben

NATUR

mehr Natur

TECHNIK

mehr Technik

QUIZ

mehr Quiz

 
© 1999 - 2012 Financial Times Deutschland
Aktuelle Nachrichten über Wirtschaft, Politik, Finanzen und Börsen

Börsen- und Finanzmarktdaten:
Bereitstellung der Kurs- und Marktinformationen erfolgt durch die Interactive Data Managed Solutions AG. Es wird keine Haftung für die Richtigkeit der Angaben übernommen!

Über FTD.de | Impressum | Datenschutz | Disclaimer | Mediadaten | E-Mail an FTD | Sitemap | Hilfe | Archiv
Mit ICRA gekennzeichnet

VW | Siemens | Apple | Gold | MBA | Business English | IQ-Test | Gehaltsrechner | Festgeld-Vergleich | Erbschaftssteuer
G+J Glossar
Partner-Angebote