Automatische Autorerkennung ist die Anwendung von
computerlinguistischen Methoden zur Bestimmung des*r Autor*in eines
Dokuments. Verwandte Methoden werden auch zur Autorprofilierung
eingesetzt, bei der nur bestimmte Eigenschaften des*r Autor*in (z.B.
Alter, Muttersprache, Geschlecht) hergeleitet werden. Für beide Aufgaben
werden linguistische Informationen genutzt, die auf der Variabilität
der individuellen Sprachverwendung beruhen. Anwendungsgebiete der
Autorerkennung reichen von historischen Texten, deren Autorschaft
angezweifelt wird, zu forensischen Anwendungen (wie bei der Zuordnung
von Schmähschriften oder Expresserbriefen).
In diesem Seminar lernen
wir verschiedene Vorgehensweisen zur Autorerkennung anhand von
linguistischen Merkmalen kennen und vergleichen diese.
Programmierkenntnisse werden nicht vorausgesetzt, aber eine gewisse
Bereitschaft zur Beschäftigung mit formalen und mathematischen Modellen
für die Repräsentation und Verarbeitung von Texten wird erwartet.
Anforderungen:-
wöchentliches Lesen der Literatur und Bearbeitung von vorbereitenden
Diskussionsfragen- Vorstellung eines Artikels in einem Referat- aktive
Beteiligung an der Diskussion
Die Literatur liegt größtenteils nur auf Englisch vor! Bereitschaft zum Lesen englischer Artikel wird vorausgesetzt.
- Kursleiter/in: Tatjana Scheffler