Section outline

    • Allgemeine Informationen zur Lerneinheit
      Klicken Sie hier fĂŒr mehr Informationen zu den Inhalten, Lernzielen und Voraussetzungen.
      Inhalt

      Die Lerneinheit Deskriptive Statistik behandelt grundlegende Methoden fĂŒr eine einfache deskriptive Datenanalyse. Sie besteht aus 6 Kapiteln:

      • Eine statistische Untersuchung
      • HĂ€ufigkeitsverteilung
      • Grafische Darstellungen einer HĂ€ufigkeitsverteilung
      • Kennzahlen fĂŒr die Lage
      • Kennzahlen fĂŒr die Streuung, Schiefe und Wölbung
      • Zweidimensionale Datenanalyse

      Lernziele

      Am Ende dieser Lerneinheit können Sie

      • einfache eindimensionale DatensĂ€tze deskriptiv analysieren, um mithilfe dessen kontextabhĂ€ngige Fragestellungen zu beantworten. Dazu gehört, dass Sie eine geeignete Grafik zur Darstellung der HĂ€ufigkeitsverteilung aussuchen und diese auf Lage, Streuung, Schiefe und Wölbung der HĂ€ufigkeitsverteilung untersuchen.
      • einfache Methoden auf zweidimensionale DatensĂ€tze anwenden, um diese auf mögliche ZusammenhĂ€nge der beiden Merkmale zu untersuchen. Dabei können Sie außerdem den Unterschied zwischen statistischer Korrelation und KausalitĂ€t erklĂ€ren.
      • die Limitationen einer deskriptiven Datenanalyse benennen. So können Sie erklĂ€ren, warum die Ergebnisse einer deskriptiven Analyse mit Unsicherheiten behaftet sind, wenn Sie diese auf die Grundgesamtheit ĂŒbertragen möchten.

      Voraussetzungen

      Diese Lerneinheit basiert auf den Inhalten der Veranstaltung "Deskriptive Statistik" fĂŒr Erstsemester der BachelorstudiengĂ€nge B.Sc. Statistik und B.Sc. Data Science an der TU Dortmund. Sie fordert lediglich grundlegende Mathematikkenntnisse. Stochastikkenntnisse sind hingegen in dieser Lerneinheit nicht notwendig.

      Autor:innen

      Diese Lerneinheit zur deskriptiven Statistik wurde von Christina Mathieu und Roland Fried unter Mithilfe von Merle Mendel und Klemens Schmidt an der Technischen UniversitÀt Dortmund entwickelt.

    • Kapitel 1: Eine statistische Untersuchung
    • Dieses Kapitel dient der EinfĂŒhrung in eine deskriptive statistische Analyse. Dazu werden zunĂ€chst die Schritte und Grundbegriffe einer statistischen Untersuchung eingefĂŒhrt. Bei statistischen Analysen untersuchen wir sogenannte Merkmale. Diese werden auf verschiedenen Skalenniveaus gemessen, die hier vorgestellt werden.
    • In dieser Aufgabe sollen Sie noch einmal die Grundbegriffe einer statistischen Untersuchung rekapitulieren, indem Sie einen LĂŒckentext ausfĂŒllen.
    • In dieser Aufgabe ordnen Sie verschiedenen Merkmalen das zugeörige Skalenniveau zu.
    • Kapitel 2: HĂ€ufigkeitsverteilung
    • In diesem Kapitel wird das Konzept der HĂ€ufigkeitsverteilung eines Merkmals mit gegebener Stichprobe beschrieben, die dazu dient Daten sinnvoll zusammenzufassen. Dazu werden absolute und relative HĂ€ufigkeiten von MerkmalsausprĂ€gungen eingefĂŒhrt.
    • In dieser Aufgabe berechnen Sie absolute und relative HĂ€ufigkeiten.
    • Kapitel 3: Grafische Darstellungen einer HĂ€ufigkeitsverteilung
    • In diesem Kapitel werden eine Reihe von grafischen Methoden zur Darstellung von HĂ€ufigkeitsverteilungen beschrieben. Diese mĂŒssen je nach Merkmalstyp passend gewĂ€hlt werden. Bei den grafischen Darstellungen handelt es sich um: Stab- und Balkendiagramm, Kreisdiagramm, Histogramm, HĂ€ufigkeitspolygon und die empirische Verteilungsfunktion. Weiter wird ein kurzer Überblick ĂŒber die KerndichteschĂ€tzung und den Boxplot gegeben.
    • In dieser Aufgabe klassieren Sie zunĂ€chst eine nominal skalierte Stichprobe und berechnen die absoluten und relativen HĂ€ufigkeiten der Klassen. Schließlich ĂŒberlegen Sie noch welches Balkendiagramm zur den gegebenen Daten gehört.
    • In dieser Aufgabe klassieren Sie eine gegebene Stichprobe nach gegebenen Voraussetzungen und berechnen die relativen HĂ€ufigkeiten sowie die HĂ€ufigkeitsdichte (d.h. Balkenhöhe der Histogrammbalken) der einzelnen Klassen.
    • In dieser Aufgabe zeichnen Sie eine empirische Verteilungsfunktion fĂŒr eine gegebene Stichprobe.
    • In dieser Aufgabe wird Ihnen eine empirische Verteilungsfunktion gezeigt und Sie mĂŒssen Fragen zu der zugrundeliegenden Stichprobe beantworten.
    • Kapitel 4: Kennzahlen fĂŒr die Lage
    • In diesem Kapitel wird das Konzept von Kennzahlen vorgestellt. Diese reduzieren die Informationen einer Stichprobe auf eine Zahl, welche dann eine gewisse Eigenschaft beschreibt. Wir beschĂ€ftigen uns besonders mit Kennzahlen der Lage und stellen dazu den Modalwert, das arithmetische Mittel, das geometrische Mittel, den Median und das \(p\)-Quantil vor. Außerdem wird der Boxplot eingefĂŒhrt, welcher eine auf 5 Kennzahlen beruhende grafische Darstellung der HĂ€ufigkeitsverteilung ist.
    • In dieser Aufgabe liegen klassierte Daten vor und es muss ein arithmetisches Mittel berechnet werden. Dieses wird mit dem exakten arithmetischen Mittel der Ursprungsstichprobe verglichen.
    • In dieser Aufgabe werden verschiedene Lagemaße berechnet und entschieden in welchem Kontexten diese angewendet werden können.
    • In dieser Aufgabe wird das arithmetische Mittel und der Median berechnet und die Ergebnisse miteinander verglichen.
    • In dieser Aufgabe soll eine Wegstrecke optimiert werden. Dabei kann die Eigenschaft eines bestimmten Lagemaßes genutzt werden.
    • In dieser Aufgabe werden verschiedene Quantile fĂŒr zwei Merkmale und Stichproben berechnet. ZusĂ€tzlich werden Sie VerstĂ€ndnisfragen zu Quantilen beantworten.
    • In dieser Aufgabe sehen Sie einen Boxplot und mĂŒssen dazu eine passende Stichprobe angeben.
    • In dieser Aufgabe sehen Sie einen Boxplot und mĂŒssen einige Fragen zu der zugrundeliegenden Stichprobe beantworten.
    • In dieser Aufgabe wird Ihnen eine Stichprobe gegeben und Sie mĂŒssen die Kennzahlen, die Sie zum Zeichnen eines verfeinerten Boxplots benötigen, angeben. Sie erhalten zum Schluss grafisches Feedback zu Ihrer Eingabe.
    • Kapitel 5: Kennzahlen fĂŒr die Streuung, Schiefe und Wölbung
    • In diesem Kapitel wird das Thema Kennzahlen aus dem vorherigen Kapitel fortgesetzt. Kennzahlen reduzieren eine Stichprobe auf einen einzelnen Wert, der eine Eigenschaft der HĂ€ufigkeitsverteilung beschreibt. Wir konzentrieren uns nun auf Streuungsmaße und stellen dazu die Spannweite, den pp-Quantilsabstand, die empirische Varianz und Standardabweichung, die mediane absolute Distanz und die Entropie vor. Weiter besprechen wir die Schiefe und Wölbung von unimodalen HĂ€ufigkeitsverteilungen und geben jeweils eine Kennzahl dazu an.
    • In dieser Aufgabe werden Sie verschiedene Streuungsmaße berechnenen und zu diesen VerstĂ€ndnisfragen beantworten.
    • In dieser Aufgabe vergleichen wir die mittlere Jahrestemperaturen zweier Orte.
    • In dieser Aufgabe werden Sie anhand verschiedener Histogramme Fragen zur Schiefe und Wölbung beantworten.
    • Kapitel 6: Zweidimensionale Datenanalyse
    • Dieses Kapitel behandelt die zweidimensionale deskriptive Datenanalyse. Diese fokussiert sich auf die Untersuchung das Zusammenhangs zweier Merkmale. Dazu fĂŒhren wir zunĂ€chst die zweidimensionale HĂ€ufigkeitsverteilung ein und erklĂ€ren das Konzept von statistisch unabhĂ€ngigen oder abhĂ€ngigen Merkmalen. Um die StĂ€rke eines statistischen Zusammenhangs zu quantifizieren kann man Zusammenhangsmaße verwenden. Hierzu besprechen wir verschiedene Kontingenzmaße und Korrelationsmaße. Letztere beschreiben insbesondere die StĂ€rke eines linearen Zusammenhangs zweier mindestens ordinal skalierter Merkmale. FĂŒr einen linearen Zusammenhang können wir schließlich ein einfaches lineares Regressionsmodell bestimmen.
    • Diese Aufgabe beschĂ€ftigt sich mit der AbhĂ€ngigkeit oder UnabhĂ€ngigkeit von zweier in einer Stichprobe enthaltenen Merkmale.
    • Diese Aufgabe beschĂ€ftigt sich mit den bedingten HĂ€ufigkeiten einer zweidimensionalen Stichprobe.
    • In dieser Aufgabe werden Sie den Korrelationskoeffizient nach Pearson und den Korrelationskoeffizient nach Spearman berechnen sowie VerstĂ€ndnisfragen zu diesen beantworten.
    • In dieser Aufgabe werden die Koeffizienten \(\alpha\) und \(\beta\) einer Regressionsgerade Schritt-fĂŒr-Schritt berechnet.
    • In dieser Aufgabe werden die Koeffizienten \(\alpha\) und \(\beta\) einer Regressionsgerade berechnet und eine Vorhersage fĂŒr eine neue Beobachtung getroffen.