Linguistische Autorschaftserkennung

Autorschaftserkennung ist ein zentrales Gebiet der forensischen Linguistik.

Automatische Autorerkennung ist die Anwendung von computerlinguistischen Methoden zur Bestimmung des*r Autor*in eines Dokuments. Verwandte Methoden werden auch zur Autorprofilierung eingesetzt, bei der nur bestimmte Eigenschaften des*r Autor*in (z.B. Alter, Muttersprache, Geschlecht) hergeleitet werden. Für beide Aufgaben werden linguistische Informationen genutzt, die auf der Variabilität der individuellen Sprachverwendung beruhen. Anwendungsgebiete der Autorerkennung reichen von historischen Texten, deren Autorschaft angezweifelt wird, zu forensischen Anwendungen (wie bei der Zuordnung von Schmähschriften oder Expresserbriefen).

In diesem Seminar lernen wir verschiedene Vorgehensweisen zur Autorerkennung anhand von linguistischen Merkmalen kennen und vergleichen diese. Programmierkenntnisse werden nicht vorausgesetzt, aber eine gewisse Bereitschaft zur Beschäftigung mit formalen und mathematischen Modellen für die Repräsentation und Verarbeitung von Texten wird erwartet.

Anforderungen:
- wöchentliches Lesen der Literatur und Bearbeitung von vorbereitenden Diskussionsfragen
- Vorstellung eines Artikels in einem Referat
- aktive Beteiligung an der Diskussion

Die Literatur liegt größtenteils nur auf Englisch vor! Bereitschaft zum Lesen englischer Artikel wird vorausgesetzt.

Semester: WiSe 2024/25