Abschnittsübersicht

    • Allgemeine Informationen zur Lerneinheit
      Klicken Sie hier für mehr Informationen zu den Inhalten, Lernzielen und Voraussetzungen.
      Inhalt

      Die Lerneinheit Deskriptive Statistik behandelt grundlegende Methoden für eine einfache deskriptive Datenanalyse. Sie besteht aus 6 Kapiteln:

      • Eine statistische Untersuchung
      • Häufigkeitsverteilung
      • Grafische Darstellungen einer Häufigkeitsverteilung
      • Kennzahlen für die Lage
      • Kennzahlen für die Streuung, Schiefe und Wölbung
      • Zweidimensionale Datenanalyse

      Lernziele

      Am Ende dieser Lerneinheit können Sie

      • einfache eindimensionale Datensätze deskriptiv analysieren, um mithilfe dessen kontextabhängige Fragestellungen zu beantworten. Dazu gehört, dass Sie eine geeignete Grafik zur Darstellung der Häufigkeitsverteilung aussuchen und diese auf Lage, Streuung, Schiefe und Wölbung der Häufigkeitsverteilung untersuchen.
      • einfache Methoden auf zweidimensionale Datensätze anwenden, um diese auf mögliche Zusammenhänge der beiden Merkmale zu untersuchen. Dabei können Sie außerdem den Unterschied zwischen statistischer Korrelation und Kausalität erklären.
      • die Limitationen einer deskriptiven Datenanalyse benennen. So können Sie erklären, warum die Ergebnisse einer deskriptiven Analyse mit Unsicherheiten behaftet sind, wenn Sie diese auf die Grundgesamtheit übertragen möchten.

      Voraussetzungen

      Diese Lerneinheit basiert auf den Inhalten der Veranstaltung "Deskriptive Statistik" für Erstsemester der Bachelorstudiengänge B.Sc. Statistik und B.Sc. Data Science an der TU Dortmund. Sie fordert lediglich grundlegende Mathematikkenntnisse. Stochastikkenntnisse sind hingegen in dieser Lerneinheit nicht notwendig.

      Autor:innen

      Diese Lerneinheit zur deskriptiven Statistik wurde von Christina Mathieu und Roland Fried unter Mithilfe von Merle Mendel und Klemens Schmidt an der Technischen Universität Dortmund entwickelt.

    • Kapitel 1: Eine statistische Untersuchung
    • Dieses Kapitel dient der Einführung in eine deskriptive statistische Analyse. Dazu werden zunächst die Schritte und Grundbegriffe einer statistischen Untersuchung eingeführt. Bei statistischen Analysen untersuchen wir sogenannte Merkmale. Diese werden auf verschiedenen Skalenniveaus gemessen, die hier vorgestellt werden.
    • In dieser Aufgabe sollen Sie noch einmal die Grundbegriffe einer statistischen Untersuchung rekapitulieren, indem Sie einen Lückentext ausfüllen.
    • In dieser Aufgabe ordnen Sie verschiedenen Merkmalen das zugeörige Skalenniveau zu.
    • Kapitel 2: Häufigkeitsverteilung
    • In diesem Kapitel wird das Konzept der Häufigkeitsverteilung eines Merkmals mit gegebener Stichprobe beschrieben, die dazu dient Daten sinnvoll zusammenzufassen. Dazu werden absolute und relative Häufigkeiten von Merkmalsausprägungen eingeführt.
    • In dieser Aufgabe berechnen Sie absolute und relative Häufigkeiten.
    • Kapitel 3: Grafische Darstellungen einer Häufigkeitsverteilung
    • In diesem Kapitel werden eine Reihe von grafischen Methoden zur Darstellung von Häufigkeitsverteilungen beschrieben. Diese müssen je nach Merkmalstyp passend gewählt werden. Bei den grafischen Darstellungen handelt es sich um: Stab- und Balkendiagramm, Kreisdiagramm, Histogramm, Häufigkeitspolygon und die empirische Verteilungsfunktion. Weiter wird ein kurzer Überblick über die Kerndichteschätzung und den Boxplot gegeben.
    • In dieser Aufgabe klassieren Sie zunächst eine nominal skalierte Stichprobe und berechnen die absoluten und relativen Häufigkeiten der Klassen. Schließlich überlegen Sie noch welches Balkendiagramm zur den gegebenen Daten gehört.
    • In dieser Aufgabe klassieren Sie eine gegebene Stichprobe nach gegebenen Voraussetzungen und berechnen die relativen Häufigkeiten sowie die Häufigkeitsdichte (d.h. Balkenhöhe der Histogrammbalken) der einzelnen Klassen.
    • In dieser Aufgabe zeichnen Sie eine empirische Verteilungsfunktion für eine gegebene Stichprobe.
    • In dieser Aufgabe wird Ihnen eine empirische Verteilungsfunktion gezeigt und Sie müssen Fragen zu der zugrundeliegenden Stichprobe beantworten.
    • Kapitel 4: Kennzahlen für die Lage
    • In diesem Kapitel wird das Konzept von Kennzahlen vorgestellt. Diese reduzieren die Informationen einer Stichprobe auf eine Zahl, welche dann eine gewisse Eigenschaft beschreibt. Wir beschäftigen uns besonders mit Kennzahlen der Lage und stellen dazu den Modalwert, das arithmetische Mittel, das geometrische Mittel, den Median und das \(p\)-Quantil vor. Außerdem wird der Boxplot eingeführt, welcher eine auf 5 Kennzahlen beruhende grafische Darstellung der Häufigkeitsverteilung ist.
    • In dieser Aufgabe liegen klassierte Daten vor und es muss ein arithmetisches Mittel berechnet werden. Dieses wird mit dem exakten arithmetischen Mittel der Ursprungsstichprobe verglichen.
    • In dieser Aufgabe werden verschiedene Lagemaße berechnet und entschieden in welchem Kontexten diese angewendet werden können.
    • In dieser Aufgabe wird das arithmetische Mittel und der Median berechnet und die Ergebnisse miteinander verglichen.
    • In dieser Aufgabe soll eine Wegstrecke optimiert werden. Dabei kann die Eigenschaft eines bestimmten Lagemaßes genutzt werden.
    • In dieser Aufgabe werden verschiedene Quantile für zwei Merkmale und Stichproben berechnet. Zusätzlich werden Sie Verständnisfragen zu Quantilen beantworten.
    • In dieser Aufgabe sehen Sie einen Boxplot und müssen dazu eine passende Stichprobe angeben.
    • In dieser Aufgabe sehen Sie einen Boxplot und müssen einige Fragen zu der zugrundeliegenden Stichprobe beantworten.
    • In dieser Aufgabe wird Ihnen eine Stichprobe gegeben und Sie müssen die Kennzahlen, die Sie zum Zeichnen eines verfeinerten Boxplots benötigen, angeben. Sie erhalten zum Schluss grafisches Feedback zu Ihrer Eingabe.
    • Kapitel 5: Kennzahlen für die Streuung, Schiefe und Wölbung
    • In diesem Kapitel wird das Thema Kennzahlen aus dem vorherigen Kapitel fortgesetzt. Kennzahlen reduzieren eine Stichprobe auf einen einzelnen Wert, der eine Eigenschaft der Häufigkeitsverteilung beschreibt. Wir konzentrieren uns nun auf Streuungsmaße und stellen dazu die Spannweite, den pp-Quantilsabstand, die empirische Varianz und Standardabweichung, die mediane absolute Distanz und die Entropie vor. Weiter besprechen wir die Schiefe und Wölbung von unimodalen Häufigkeitsverteilungen und geben jeweils eine Kennzahl dazu an.
    • In dieser Aufgabe werden Sie verschiedene Streuungsmaße berechnenen und zu diesen Verständnisfragen beantworten.
    • In dieser Aufgabe vergleichen wir die mittlere Jahrestemperaturen zweier Orte.
    • In dieser Aufgabe werden Sie anhand verschiedener Histogramme Fragen zur Schiefe und Wölbung beantworten.
    • Kapitel 6: Zweidimensionale Datenanalyse
    • Dieses Kapitel behandelt die zweidimensionale deskriptive Datenanalyse. Diese fokussiert sich auf die Untersuchung das Zusammenhangs zweier Merkmale. Dazu führen wir zunächst die zweidimensionale Häufigkeitsverteilung ein und erklären das Konzept von statistisch unabhängigen oder abhängigen Merkmalen. Um die Stärke eines statistischen Zusammenhangs zu quantifizieren kann man Zusammenhangsmaße verwenden. Hierzu besprechen wir verschiedene Kontingenzmaße und Korrelationsmaße. Letztere beschreiben insbesondere die Stärke eines linearen Zusammenhangs zweier mindestens ordinal skalierter Merkmale. Für einen linearen Zusammenhang können wir schließlich ein einfaches lineares Regressionsmodell bestimmen.
    • Diese Aufgabe beschäftigt sich mit der Abhängigkeit oder Unabhängigkeit von zweier in einer Stichprobe enthaltenen Merkmale.
    • Diese Aufgabe beschäftigt sich mit den bedingten Häufigkeiten einer zweidimensionalen Stichprobe.
    • In dieser Aufgabe werden Sie den Korrelationskoeffizient nach Pearson und den Korrelationskoeffizient nach Spearman berechnen sowie Verständnisfragen zu diesen beantworten.
    • In dieser Aufgabe werden die Koeffizienten \(\alpha\) und \(\beta\) einer Regressionsgerade Schritt-für-Schritt berechnet.
    • In dieser Aufgabe werden die Koeffizienten \(\alpha\) und \(\beta\) einer Regressionsgerade berechnet und eine Vorhersage für eine neue Beobachtung getroffen.