Ein der herausragenden Aufgaben der Statistik ist die Reduktion der Komplexität von Daten, um Muster und Regelmäßigkeiten überhaupt erkennbar zu machen. Zu diesem Zweck wurden verschiedene statistische Methoden entwickelt, um Untersuchungsobjekte zu klassifizieren und zu Gruppen zusammenzufassen.

Das Seminar behandelt fortgeschrittene statistische Klassifikationsverfahren und Verfahren zur Beschreibung von Ähnlichkeiten sowie deren rechentechnische Umsetzung mit dem Statistikprogramm R.

Die geplanten Themen der Veranstaltung sind:

  • Ziele von Klassifikationsverfahren und Gütekriterien für Klassifikationen
  • Abstandsmaße
  • Multidimensionale Skalierung
  • Hierarchische und nicht-hierarchische Clusteranalyseverfahren
  • Modellbasierte Klassifikationsverfahren (Latente Klassenanalyse)
  • Klassifikationsbäume und maschinelles Lernen
  • Validierung von Klassifikationslösungen
Im Seminar werden Auswertungen mit der kostenlosen Open Source-Software „R“ (www.r project.org) durchgeführt. R ist eine flexible, freie Software zur Analyse von empirischen Daten, die nicht nur in weiten Teilen der akademischen Forschung verbreitet ist, sondern auch in vielen Bereichen der Wirtschaft Verwendung findet.
Semester: ST 2024