Dienstag, 10. Dezember 2013

Saarbrücker Sprachforscher gewinnen internationalen Wettbewerb

 

Sprachforscher der Universität des Saarlandes haben einen Wettbewerb in der automatischen Sprachverarbeitung gewonnen. Das Saarbrücker Verfahren zur Textanalyse konnte im internationalen Vergleich am besten Informationen und Zusammenhänge aus großen Texten herausfiltern. Mit einer Trefferquote von 37,3 Prozent lagen die Forscher vor allen anderen Teams, wie z.B. der kalifornischen Stanford University. 18 führende Sprachforscher-Gruppen hatten sich an dem so genannten Benchmark des US-amerikanischen Nationalen Instituts für Standards und Technologie (NIST) in Maryland beteiligt. Die Saarbrücker Gruppe war die einzige aus Deutschland, aus Europa nahmen Forscher aus Dublin, Barcelona und Alicante teil.

Das NIST ist eine für Standardisierungsprozesse zuständige Bundesbehörde, vergleichbar der Physikalisch-Technischen Bundesanstalt. Sie hat den weltweiten Wettbewerb ausgerichtet, an dem das Team des Lehrstuhls für Sprach- und Signalverarbeitung der Saar-Universität unter Leitung von Dietrich Klakow und Benjamin Roth teilnahm. Die Forschergruppen traten wie in einem Sportwettkampf gegeneinander an, um herauszufinden, wer Informationen am besten automatisch aus einer sehr großen Menge Text herausfiltern kann. Aufgabe war es, mit dem Computer 40 Eigenschaften bekannter und weniger bekannter Personen oder Organisationen zu extrahieren. Zum Beispiel die Informationen, dass eine Person mit einer anderen verheiratet ist oder wieviele Mitarbeiter eine Firma beschäftigt. Der Computer muss hierzu selbstständig Beziehungen verknüpfen und die richtigen Schlüsse ziehen. „Die Herausforderung liegt darin, dass der Computer automatisch den Sinn von Texten erkennt und auf Fragen selbstständig passende Antworten findet. Wir bringen dem Computer hierzu bei, die Bedeutung und Zusammenhänge längerer Texte zu erfassen“, erklärt Professor Klakow.

Das Saarbrücker Textanalyse-System lieferte von Trefferquote und Genauigkeit her die besten Ergebnisse. „Es handelt sich um ein komplexes System, das wir aus mehreren Sprachverarbeitungs-Modulen zusammengestellt haben“, erläutert Benjamin Roth. „Diese Module arbeiten mit statistischen Verfahren. Mithilfe von mathematischen Algorithmen kann der Computer in großen Textmengen Muster und Strukturen der Sprache erfassen. Aus einem unstrukturierten Textbestand sucht er sich die richtigen Informationen zusammen“, erklärt der Sprachverarbeitungsexperte. Dabei trainieren die Forscher den Computer, Zusammenhänge und Bezüge in großen Textmengen optimal für die Vorhersage neuer Fakten zu nutzen. Mit diesen maschinellen Computer-Lernverfahren sollen etwa Suchmaschinen und Sprachdialogsysteme verbessert werden.

Dietrich Klakow, der bereits mit dem Google Research Award ausgezeichnet wurde, ist mit seiner Sprachforschung am Exzellenzcluster „Multimodal Computing and Interaction“ der Universität des Saarlandes beteiligt. Er forscht unter anderem auch an Spracherkennungssystemen, also wie der Computer Sprachsignale besser verarbeiten und gesprochene Sprache automatisch verstehen kann. Hier arbeitet Klakow zum Beispiel daran, einzelne Stimmen aus dem Stimmengewirr einer Menschenmenge herauszufiltern und diese räumlich zu orten. Außerdem erforscht er, wie Störgeräusche gefiltert werden können, etwa bei Sprachdialogsystemen im Auto oder bei Informationsportalen auf Bahnhöfen. Wie die maschinelle Sprachverarbeitung weiter verbessert werden kann, untersucht auch das von Professor Klakow geleitete Scale-Projekt "Speech Communication with Adaptive Learning", das im Rahmen des Marie-Curie-Programms von der Europäischen Union gefördert wird. Das Marie-Curie Programm ermöglicht jungen Wissenschaftlern, während ihrer Promotion gleichzeitig von zwei europäischen Universitäten betreut zu werden und an internationalen Forschungsprojekten teilzunehmen. Benjamin Roth wird für seine Forschung über die Extraktion von Fakten und Informationen aus großen Textmengen mittels statistischer Methoden im Rahmen einer „Google Europe Fellowship in Natural Language Processing“ gefördert.

Kontakt für die Medien: Professor Dr. Dietrich Klakow
Tel. 0681/302-58122; E-Mail: dietrich.klakow@lsv.uni-saarland.de
Weitere Informationen: www.nist.gov/tac/

Ein Pressefoto für den kostenlosen Gebrauch finden Sie unter www.uni-saarland.de/pressefotos. Bitte beachten Sie die Nutzungsbedingungen.

Hinweis für Hörfunk-Journalisten: Sie können Telefoninterviews in Studioqualität mit Wissenschaftlern der Universität des Saarlandes führen, über Rundfunk-Codec (IP-Verbindung mit Direktanwahl oder über ARD-Sternpunkt 106813020001). Interviewwünsche bitte an die Pressestelle (0681/302-2601, oder -64091).