Laufende Projekte

SFB 1102 - Informationsdichte und sprachliche Kodierung

Sprache stellt ein breites Spektrum an Ausdrucksmöglichkeiten für die Kommunikation bereit. Der Sonderforschungsbereich geht von einem rational gesteuerten Sprachnutzer aus und beschäftigt sich mit der Hypothese, dass Sprachgebrauch u.a. von dem Ziel geleitet wird, die in einer Äußerung enthaltene Informationsmenge so zu modulieren, dass erfolgreich Kommunikation gewährleistet ist. Variation im Sprachsystem wird üblicherweise mit dem Konzept der Komplexität in Verbindung gebracht. Dies erweist sich aber als nicht hinreichend präzise für eine adäquate Modellierung sprachlicher Prozesse und meist werden nur einzelne Ebenen des Sprachsystems betrachtet. Neuere linguistische Forschungsarbeiten weisen auf eine Korrelation zwischen Komplexität in der Verarbeitung und kontextuell bestimmter Vorhersagbarkeit hin. Dies legt die Annahme nahe, dass Komplexität durch den Shannonschen Informationsbegriff adäquat repräsentiert werden kann, hier als "Surprisal" bezeichnet. Der Sonderforschungsbereich verfolgt die Hypothese, dass Verarbeitungskomplexität durch Surprisal reflektiert wird und dass Variation im Sprachgebrauch durch optimale Informationsverteilung über ein sprachliches Signal charakterisiert werden kann. Sprecher nutzen die verfügbare sprachliche Variation in ihren Kodierungen, indem sie die Abfolge, Dichte und Spezifizität eines Ausdrucks modulieren und so Informationsspitzen und -senken vermeiden. Diese Perspektive kann auf alle Ebenen des Sprachsystems angewandt werden und verspricht daher neue Erkenntnisse über den Charakter der dem Sprachsystem inhärenten Variation und ihrem Nutzen im Sprachgebrauch. Surprisal kann für alle sprachlichen Einheiten bestimmt werden, vom Phonem über syntaktische Phrasen bis hin zu ganzen Sätzen, und es stehen entsprechende Kodierungsmöglichkeiten zur Verfügung, von der akustischen Realisierung bis hin zur Textstrukturierung. Übergeordnetes Ziel des Sonderforschungsbereichs ist es, zu untersuchen, zu welchem Grad Surprisal und verwandte informationstheoretische Konzepte eine einheitliche Erklärung für die beobachteten Variationsmuster auf verschiedenen sprachlichen Ebenen und im Zusammenspiel der Ebenen liefern können. [mehr...]

NFDI Text+

Ziel von Text+ ist der Aufbau einer Basisinfrastruktur für die text- und sprachbasierten wissenschaftlichen Disziplinen, von der Linguistik über die Literaturwissenschaft bis hin zur Kulturwissenschaft und Geschichte. Die Infrastruktur ist auf Sprach- und Textdaten ausgerichtet und wird sich zunächst auf digitale Sammlungen, lexikalische Ressourcen und Editionen konzentrieren.

Weitere Informationen finden Sie auf der DFG-Webseite und unter Text+.