Forschung

Die Fachrichtung Sprachwissenschaft und Sprachtechnologie ist eine der führenden Forschungseinrichtungen in Europa. Das aktuelle Spitzenprojekt ist der Sonderforschungsbereich Information Density and Linguistic Encoding (SFB 1102), der von der Deutschen Forschungsgemeinschaft (DFG) gefördert wird.

Seit 1992 sind unsere Fachrichtung bzw. ihre Vorgänger (“Übersetzen und Dolmetschen” und “Computerlinguistik und Phonetik”) ununterbrochen an großen Verbundprojekten beteiligt

Aktuell sind unsere Forschungsgruppen an einer Vielzahl von europäischen und national geförderten Projekten beteiligt. Alle laufenden und abgeschlossenen Forschungsprojekte sind auf den Webseiten der Lehrstühle zu finden. Die Forschungsgruppen interessieren sich für eine Reihe von spannenden Forschungsthemen.

Prof. Dr. Matthew Crocker: Psycholinguistics

Wie kommt es, dass Menschen Sprache in Echtzeit verstehen, also dass sie ein sprachliches Signal - Wort für Wort - schnell in eine mentale Repräsentation dessen, was kommuniziert wird, umwandeln können? Um dieser Frage nachzugehen, verwenden wir fortschrittliche, hochauflösende experimentelle Methoden wie die Blickbewegungsregistrierung (Eye-Tracking) und Messungen der Hirnaktivität im EEG-Signal, die kleinste Variationen in der kognitiven Leistung zu jedem Wort zeigen und sogar verschiedene Stadien des Sprachverständnisprozesses erfassen können. In unseren Experimenten untersuchen wir zum Beispiel die Wechselwirkung von Bedeutung und Wahrnehmung: Wie Menschen aufgrund des Gehörten, ihrer Kenntnis über die Welt und der Informationen in der visuellen Umgebung vorausahnen, was als Nächstes kommt.

Diese Experimentergebnisse werden dann zusammengeführt, um die Entwicklung von computationalen Theorien des Verständnises der menschlichen Sprache zu entwickeln. Wir entwickeln Modelle künstlicher neuronaler Netze, die nicht nur inkrementell die Bedeutung von Äußerungen bestimmen, sondern diese Bedeutung auch dazu nutzen, die sich entwickelnden Wahrnehmungen des eingehenden Signals zu lenken, ähnlich wie Menschen es tun. Darüber hinaus zielen unsere Berechnungsmodelle darauf ab, die Organisation des Netzwerks des Sprachverstehens im Gehirn widerzuspiegeln, wie sie durch neurophysiologische Belege nachzuvollziehen ist.

Mehr lesen

Prof. Dr. Vera Demberg: Informatik und Computerlinguistik

Ziel unserer Forschungsgruppe ist es, Forschung zu natürlichen Sprachverarbeitungssystemen, Psycholinguistik und kognitiver Modellierung zusammenzuführen. Aktuelle Forschungsschwerpunkte sind das Verstehen von Phänomenen auf Diskursebene (wie Kohärenzrelationen, pragmatische Inferenzen und die Integration zwischen Wissen und dem sprachlichen Signal) und die Generierung kohärenter Texte, die auf eine Vielzahl unterschiedlicher Nutzer zugeschnitten werden können.

Mehr lesen

Prof. Dr. Josef van Genabith: Translationsorientierte Sprachtechnologie

Maschinelle Übersetzung ist der automatisierte Prozess, bei dem Eingaben in einer Sprache in eine andere Sprache konvertiert werden. Unsere Forschungsschwerpunkte sind

  • maschinelle Übersetzung von Text und Gebärdensprache
  • Übersetzung von Dokumenten und Dialogen
  • mehrsprachige Embeddings und Übersetzungen
  • ressourcenarme und ressourcenreiche Szenarien
  • multimodale Post-Editing-Schnittstellen
  • automatische Erkennung von Translationese (d.h. charakteristische linguistische Aspekte von Übersetzungen)
     

Mehr lesen

Prof. Dr. Josef van Genabith: Sprachtechnologie und Multilingualität (MLT) bei DFKI

MLT führt Grundlagen-, angewandte und auftragsbezogene Forschung und Entwicklung durch. Das MLT hat vier Forschungsgruppen:

  • Maschinelle Übersetzung (MÜ)
  • Frage-Antwort- und Informationsextraktions-Systeme (QA/IE)
  • Talking Robots (TR)
  • Daten und Ressourcen (D&R)
     

Mehr lesen

Prof. Dr. Michael Hahn: Language, Computation, and Cognition

Unsere Gruppe forscht an der Schnittstelle von maschinellem Lernen, Sprache und Kognition. Wir sind an folgenden Themen interessiert:

  • Maschinelle Sprachverarbeitung: Wie können Maschinen Sprachverständnis erlernen? Wir untersuchen ihre Grenzen, wo sie hinter dem Menschen zurückbleiben und wie sie menschenähnlicher gemacht werden können.
  • Sprache und Kognition: Wie verstehen Menschen Sprache? Wir modellieren das menschliche Sprachverständnis mit neuronalen Netzen und testen diese Modelle in psycholinguistischen Experimenten.
  • Computerbasierte Typologie: Warum sind menschliche Sprachen so wie sie sind? Wir erstellen computergestützte Modelle der Sprachentwicklung und der Faktoren, die diese Entwicklung beeinflussen.

Mehr lesen

Prof. Dr. Dietrich Klakow: Spoken Language Systems

Maschinelles Lernen ist bereits seit langem das Paradigma hinter vielen Systemen,  die natürlicher Sprache verarbeiten. In den letzten Jahren haben sich tiefe neuronale Netze zum dominierenden Paradigma entwickelt. Ein tiefgreifendes Verständnis der Funktionsweise neuronaler Netze ist unerlässlich, um das Thema voranzubringen. Darüber hinaus gibt es viele spezifische Fragen wie

  • ressourcenarme Sprachverarbeitung: Können neuronale Netze auf winzigen Mengen von Trainingsdaten trainiert werden?
  • Neuronale Netze & Datensicherheit: Wie speichern neuronale Netze Informationen? Wie kann dies genutzt oder verhindert werden?
  • Sentiment Analyse und Hassspracherkennung
  • Computer Vision & Sprache: Wie können Informationen aus der realen Welt die Sprachverarbeitungssysteme verbessern?
  • Dialogsysteme: multimodaler Dialog, Interaktionsanalyse, Dialogmanagement
     

Mehr lesen

Prof. Dr. Alexander Koller: Computerlinguistik

Unsere Forschungsgruppe interessiert sich für eine Reihe von Themen der Computerlinguistik, die von syntaktischem und semantischem Parsing über die Generierung natürlicher Sprache bis hin zu Dialogsystemen reichen. Die Gruppe hat sowohl einen schnellen und akkuraten semantischen Parser entwickelt, der über verschiedene Typen von semantischen Repräsentationen arbeitet, als auch Parsing und Generierungsalgorithmen, die über viele verschiedene Grammatikformalismen generalisieren. Die Gruppe hat Erfahrung mit der groß angelegten Evaluierung interaktiver NLG-Systeme und wartet das DialogOS-System für die zügige Entwicklung gesprochener Dialogsysteme. Auf methodologischer Ebene geht es u.a. um die Frage, wie die Arbeit zwischen symbolischen und neuronalen Methoden am besten aufgeteilt werden kann, um genaue, robuste und effiziente Systeme zu entwickeln, die dennoch sprachliche Prinzipien respektieren.

Mehr lesen

Computational Linguistics at Saarland University!

Prof. Dr. Bernd Möbius: Phonetik und Phonologie

Die Forschung in der Phonetik an der Universität des Saarlandes umfasst sowohl linguistische Phonetik als auch Sprachtechnologie. Zu den aktiven Forschungsgebieten gehören Sprachproduktion und -wahrnehmung, Prosodie, phonetische Eigenschaften von Diskurs und Dialog sowie Sprachsynthese. Ein zentrales Thema unserer Forschung ist die Integration phonetischen Wissens in die Sprachtechnologie. Unsere Gruppe hat sich intensiv mit der Sprachsynthese befasst, einem wunderbaren Rahmen für die Implementierung und Erprobung von komputationellen Modellen für linguistische und phonetische Prozesse. Zuletzt konzentrierte sich unsere Forschung auf experimentelle Methoden und Computermodelle, um verschiedene Aspekte der Sprachproduktion, der Wahrnehmung und des Zweitsprachenerwerbs zu untersuchen.

Mehr lesen

Prof. Dr. Elke Teich: Englische Sprach- und Übersetzungswissenschaft

Sprache variiert gemäß verschiedener Faktoren, wie soziale Gruppe, Geschlecht/Gender, Diskursziel, Medium oder Zeit. So könnte uns z.B. interessieren, wie die Menschen im 19. Jahrhundert im Vergleich zur  heutigen Zeit Einstellungen und Meinungen zum Ausdruck brachten; oder die Art und Weise, wie sich in der Spätmoderne ein Kanon an wissenschaftlicher Terminologie ausbildete; oder was distinktive Merkmale im  Sprachgebrauch von Männern und Frauen im privaten vs. öffentlichen Umfeld sind. Aus der Sicht der Sprachtheorie werfen Erkenntnisse über Sprachgebrauch ein Licht auf soziale Normen und Identitäten, soweit Unterschiede im Sprachgebrauch diese widerspiegeln, aber auch auf die grundlegenden Prinzipien der Kommunikation. Wir untersuchen synchrone und diachrone sprachliche Variation auf der Grundlage repräsentativer Korpora mit Hilfe von computerlinguistischen Methoden, von n-Gramm-Modellen über Topic-Modelle bis hin zu Word Embeddings, und passen fortlaufend neue computationelle Methoden an unsere Analysebedürfnisse an. Dazu gehört auch die Visualisierung von Sprachmodellen wie z.B. diachrone Word Embeddings oder Surprisal im Text.

Das Studium der menschlichen Übersetzung beinhaltet die Analyse von Übersetzung als Produkt und Prozess. Wir fokussieren Übersetzung als Produkt mit besonderer Berücksichtigung von Variation in der Translation auf der Grundlage von parallelen und multilingual vergleichbaren Corpora. Relevante Dimensionen von Variation sind Translationsmodus (Übersetzen vs. Dolmetschen), Sprachenpaar, Übersetzungsrichtung und Expertise (Lerner vs. Experte).  Die Analyse hebt auf die spezifischen sprachlichen Eigenschaften von Übersetzungen ab ("translationese") und impliziert Methoden der Komparation. Wir entwickeln neuartige Methoden der Komparation basierend auf statistischen und neuronalen Sprachmodellen kombiniert mit informationstheoretischen Maßen zur Exploration und Bewertung von Unterschieden und Gemeinsamkeiten entlang der relevanten Dimensionen von Übersetzung. Die Resultate unserer Forschung finden in der Übersetzungswissenschaft sowie in der maschinellen Übersetzung und verwandten Technologien Anwendung.

Mehr lesen

Jun.-Prof. Dr. Annemarie Verkerk: Language Science

Der Vergleich von Sprachen ist von zentraler Bedeutung, um sie verstehen zu können. Wie man fundierte Vergleiche anstellt, ist jedoch eine andere Frage. Wir arbeiten an der Schnittmenge von linguistischer Typologie, Korpuslinguistik und Computerlinguistik und nutzen dabei modernste Methodologien, um Themen wie Wortstellung, Negation und Nominalklassifikation zu beleuchten. Zwei Hauptschwerpunkte sind die korpusbasierte Typologie und die Anwendung vergleichender phylogenetischen Methoden für die Typologie. Dies hat uns dazu veranlasst, ein paralleles Korpus (CIEP, Corpus of Indo-European Prose) aufzubauen und informationstheoretische Maße wie Entropie und Surprisal zur Beschreibung der sprachübergreifenden Variabilität zu verwenden. Der Schwerpunkt der Gruppe beschränkt sich nicht nur auf indo-europäische Sprachen; wir arbeiten auch an weltweiten Proben, Austronesisch und Bantu. 

Mehr lesen