Section outline

    • Dieser Selbstlernkurs Grundlagen der Statistik mit R deckt grundlegende Themenbereiche der Statistik ab, wie sie typischerweise in der Bachelorphase an Hochschulen gelehrt werden. Er ist im Projekt DigStat - Digitale Lerneinheiten in der Statistik in Zusammenarbeit von vier Arbeitsgruppen an vier UniversitĂ€ten in Nordrhein-Westfalen entstanden. Mehr Informationen zu DigStat finden Sie auf der Projektwebseite.

      Aufbau

      Der Kurs ist in fĂŒnf Lerneinheiten gegliedert. Jede Lerneinheit besteht aus digitalen Skripten und STACK-Aufgaben.

      Die erste Lerneinheit bietet einen schnellen und praxisnahen Einstieg in die Statistik-Software R. Sie können R hier installieren, falls Sie R nicht auf Ihrem Rechner installiert haben. ZusÀtzlich empfehlen wir die Installation einer integrierten Entwicklungsumgebung (IDE), wie zum Beispiel RStudio. Alternativ zur Installation können Sie die Web-Version webR direkt im Browser verwenden.

      Die weiteren Lerneinheiten erklÀren grundlegende statistische Methoden und Verfahren, illustrieren diese mit passenden Beispielen und zeigen, wie man sie in R anwendet. Sobald die Grundlagen von R bekannt sind, können alle Lerneinheiten unabhÀngig voneinander bearbeitet werden, innerhalb einer Lerneinheit bauen die Kapitel jedoch aufeinander auf.

      Lernziele

      Die erfolgreiche Bearbeitung der Grundlagen der Statistik mit R verfolgt die folgenden ĂŒbergeordneten Lernziele:

      • Sie können grundlegende Fragestellungen der Statistik beschreiben, einschlĂ€gige statistische Methoden und Verfahren benennen und sie auf reale DatensĂ€tze anwenden.
      • Sie können Daten aus verschiedenen Datenquellen in R aufbereiten, indem Sie mithilfe entsprechender Befehle ein R-Skript schreiben, um die anschließende statistische Analyse durchzufĂŒhren.
      • Sie können verschiedene statistische Verfahren zur Lösung eines Problems gegenĂŒberstellen, indem Sie die Rahmenbedingungen und mathematischen Modellannahmen vergleichen, um entsprechende Grenzen dieser Verfahren abzuschĂ€tzen und ein fĂŒr den vorliegenden Datensatz geeignetes Verfahren zu identifizieren.
      • Sie können einschĂ€tzen, inwiefern der Einsatz eines statistischen Verfahrens gerechtfertigt ist, indem Sie die mathematischen Modellannahmen bei einer konkreten Datenlage ĂŒberprĂŒfen, um die Aussagekraft der Ergebnisse, beispielsweise einer Studie, im Sinne der Statistical Literacy kritisch zu beurteilen.

      Spezifische Lernziele einer Lerneinheit werden jeweils zu deren Beginn im Detail beschrieben.

      Zielgruppe

      Grundlagen der Statistik mit R ist an alle gerichtet, die die Grundlagen der Statistik mathematisch verstehen und anwenden wollen. Dieser Kurs eignet sich sowohl fĂŒr das Selbststudium als auch fĂŒr den Einsatz in Lehrveranstaltungen, etwa zur Vor- oder Nachbereitung von Vorlesungen oder zur Vorbereitung auf PrĂŒfungen. Die Themen sind insbesondere fĂŒr Studierende der folgenden StudiengĂ€nge interessant:

      • Mathematik und Statistik
      • Data Science und Datenjournalismus
      • Ingenieurwissenschaften
      • Physik, Informatik, Pharmazie, Psychologie

      Danksagung

      Das Projekt DigStat - Digitale Lerneinheiten in der Statistik wurde im Rahmen der Förderlinie OERContent.nrw vom Ministerium fĂŒr Kultur und Wissenschaft NRW gemeinsam mit der Digitalen Hochschule NRW gefördert.

      Wir bedanken uns außerdem bei zahlreichen Studierenden und Dozierenden, die unsere Materialien verwendet und kontrolliert haben.

    • Dieses Dokument enthĂ€lt Informationen zur Verwendung der im Rahmen des Projekts DigStat veröffentlichten Materialien in Lehrveranstaltungen sowie zu ihrer Weiterentwicklung. Es richtet sich insbesondere an Dozierende, welche diese Materialien in ihrer Lehre einsetzen möchten.
    • Allgemeine Informationen zur Lerneinheit
      Klicken Sie hier fĂŒr mehr Informationen zu den Inhalten, Lernzielen und Voraussetzungen.
      Inhalt

      Die Lerneinheit EinfĂŒhrung in R bietet einen praxisnahen Einstieg in die Anwendung der Statistik-Software R. Sie besteht aus 4 Kapiteln:

      • EinfĂŒhrung
      • Wie bekomme ich meine Daten in R hinein?
      • Erste Befehle anhand eines Datensatzes
      • Datenanalyse mit R

      Lernziele

      Am Ende dieser Lerneinheit können Sie

      • die unterschiedlichen Elemente der BenutzeroberflĂ€chen von R, RStudio und WebR identifizieren. Sie kennen die Vor- und Nachteile der verschiedenen Tools fĂŒr die Datenanalyse.
      • Daten in R importieren. Sie sind in der Lage, Daten manuell durch Eingabe von Vektoren und Dataframes in R zu importieren, vorhandene DatensĂ€tze aus eigenen Dateien automatisiert einzulesen sowie Zusatzpakete mit DatensĂ€tzen aus R zu installieren.
      • Daten erkunden und filtern. Sie können DatensĂ€tze aus Zusatzpaketen installieren, grundlegende Funktionen zur Datenerkundung anwenden sowie Operatoren und logische VerknĂŒpfungen zur Filterung der Daten gezielt einsetzen.
      • numerische Datenanalysen durchfĂŒhren. Sie können numerische Zusammenfassungen erstellen, um zentrale KenngrĂ¶ĂŸen eines Datensatzes zu bestimmen und damit wesentliche Eigenschaften der Daten zu analysieren.
      • grafische Zusammenfassungen von DatensĂ€tzen erzeugen. Sie können grafische Darstellungen wie SĂ€ulen-, Histogramm- und Streudiagramme mithilfe des ggplot2-Pakets erzeugen, um die Verteilung und Beziehungen der Daten visuell zu analysieren.

      Voraussetzungen

      FĂŒr diese Lerneinheit sind keine speziellen Vorkenntnisse erforderlich. Die EinfĂŒhrung in die Arbeit mit R erfolgt anhand beispielhafter Aufgaben, die grundlegende Konzepte abdecken. Einfaches Interesse und die Bereitschaft, sich mit den Beispielen auseinanderzusetzen, sind alles, was Sie hier benötigen.

      Autor:innen

      Diese Lerneinheit wurde von Herold Dehling, Michael Kallweit, Daniel Meißner, Farhad Razeghpour und Katrin Rolka unter Mithilfe von Christian MĂŒller an der Ruhr-UniversitĂ€t Bochum entwickelt.

    • Dieses Skript bietet Ihnen einen praxisnahen Einstieg in die Anwendung von R. Mithilfe theoretischer ErklĂ€rungen, praktischer Beispiele und Aufgaben lernen Sie, R fĂŒr die Verarbeitung, Visualisierung und Interpretation von Daten einzusetzen.
    • In dieser Aufgabe nutzen Sie R, um die HĂ€ufigkeiten von Merkmalen in einer Datenmenge zu bestimmen. Dabei wenden Sie grundlegende statistische Auswertungsmethoden an.
    • In dieser Aufgabe nutzen Sie R, um die Quartile in der Verteilung eines Merkmals zu berechnen und den Interquartilsabstand zu bestimmen. Außerdem interpretieren Sie die Aussagekraft des Interquartilsabstands in Bezug auf die Streuung der Werte in einer Datenmenge.
    • In dieser Aufgabe verwenden Sie R, um zentrale statistische KenngrĂ¶ĂŸen wie den Mittelwert, die Standardabweichung und die Spannweite anhand eines Datensatzes zu berechnen.
    • Allgemeine Informationen zur Lerneinheit
      Klicken Sie hier fĂŒr mehr Informationen zu den Inhalten, Lernzielen und Voraussetzungen.
      Inhalt

      Die Lerneinheit Deskriptive Statistik behandelt grundlegende Methoden fĂŒr eine einfache deskriptive Datenanalyse. Sie besteht aus 6 Kapiteln:

      • Eine statistische Untersuchung
      • HĂ€ufigkeitsverteilung
      • Grafische Darstellungen einer HĂ€ufigkeitsverteilung
      • Kennzahlen fĂŒr die Lage
      • Kennzahlen fĂŒr die Streuung, Schiefe und Wölbung
      • Zweidimensionale Datenanalyse

      Lernziele

      Am Ende dieser Lerneinheit können Sie

      • einfache eindimensionale DatensĂ€tze deskriptiv analysieren, um mithilfe dessen kontextabhĂ€ngige Fragestellungen zu beantworten. Dazu gehört, dass Sie eine geeignete Grafik zur Darstellung der HĂ€ufigkeitsverteilung aussuchen und diese auf Lage, Streuung, Schiefe und Wölbung der HĂ€ufigkeitsverteilung untersuchen.
      • einfache Methoden auf zweidimensionale DatensĂ€tze anwenden, um diese auf mögliche ZusammenhĂ€nge der beiden Merkmale zu untersuchen. Dabei können Sie außerdem den Unterschied zwischen statistischer Korrelation und KausalitĂ€t erklĂ€ren.
      • die Limitationen einer deskriptiven Datenanalyse benennen. So können Sie erklĂ€ren, warum die Ergebnisse einer deskriptiven Analyse mit Unsicherheiten behaftet sind, wenn Sie diese auf die Grundgesamtheit ĂŒbertragen möchten.

      Voraussetzungen

      Diese Lerneinheit basiert auf den Inhalten der Veranstaltung "Deskriptive Statistik" fĂŒr Erstsemester der BachelorstudiengĂ€nge B.Sc. Statistik und B.Sc. Data Science an der TU Dortmund. Sie fordert lediglich grundlegende Mathematikkenntnisse. Stochastikkenntnisse sind hingegen in dieser Lerneinheit nicht notwendig.

      Autor:innen

      Diese Lerneinheit zur deskriptiven Statistik wurde von Christina Mathieu und Roland Fried unter Mithilfe von Merle Mendel und Klemens Schmidt an der Technischen UniversitÀt Dortmund entwickelt.

    • Kapitel 1: Eine statistische Untersuchung
    • Dieses Kapitel dient der EinfĂŒhrung in eine deskriptive statistische Analyse. Dazu werden zunĂ€chst die Schritte und Grundbegriffe einer statistischen Untersuchung eingefĂŒhrt. Bei statistischen Analysen untersuchen wir sogenannte Merkmale. Diese werden auf verschiedenen Skalenniveaus gemessen, die hier vorgestellt werden.
    • In dieser Aufgabe sollen Sie noch einmal die Grundbegriffe einer statistischen Untersuchung rekapitulieren, indem Sie einen LĂŒckentext ausfĂŒllen.
    • In dieser Aufgabe ordnen Sie verschiedenen Merkmalen das zugeörige Skalenniveau zu.
    • Kapitel 2: HĂ€ufigkeitsverteilung
    • In diesem Kapitel wird das Konzept der HĂ€ufigkeitsverteilung eines Merkmals mit gegebener Stichprobe beschrieben, die dazu dient Daten sinnvoll zusammenzufassen. Dazu werden absolute und relative HĂ€ufigkeiten von MerkmalsausprĂ€gungen eingefĂŒhrt.
    • In dieser Aufgabe berechnen Sie absolute und relative HĂ€ufigkeiten.
    • Kapitel 3: Grafische Darstellungen einer HĂ€ufigkeitsverteilung
    • In diesem Kapitel werden eine Reihe von grafischen Methoden zur Darstellung von HĂ€ufigkeitsverteilungen beschrieben. Diese mĂŒssen je nach Merkmalstyp passend gewĂ€hlt werden. Bei den grafischen Darstellungen handelt es sich um: Stab- und Balkendiagramm, Kreisdiagramm, Histogramm, HĂ€ufigkeitspolygon und die empirische Verteilungsfunktion. Weiter wird ein kurzer Überblick ĂŒber die KerndichteschĂ€tzung und den Boxplot gegeben.
    • In dieser Aufgabe klassieren Sie zunĂ€chst eine nominal skalierte Stichprobe und berechnen die absoluten und relativen HĂ€ufigkeiten der Klassen. Schließlich ĂŒberlegen Sie noch welches Balkendiagramm zur den gegebenen Daten gehört.
    • In dieser Aufgabe klassieren Sie eine gegebene Stichprobe nach gegebenen Voraussetzungen und berechnen die relativen HĂ€ufigkeiten sowie die HĂ€ufigkeitsdichte (d.h. Balkenhöhe der Histogrammbalken) der einzelnen Klassen.
    • In dieser Aufgabe zeichnen Sie eine empirische Verteilungsfunktion fĂŒr eine gegebene Stichprobe.
    • In dieser Aufgabe wird Ihnen eine empirische Verteilungsfunktion gezeigt und Sie mĂŒssen Fragen zu der zugrundeliegenden Stichprobe beantworten.
    • Kapitel 4: Kennzahlen fĂŒr die Lage
    • In diesem Kapitel wird das Konzept von Kennzahlen vorgestellt. Diese reduzieren die Informationen einer Stichprobe auf eine Zahl, welche dann eine gewisse Eigenschaft beschreibt. Wir beschĂ€ftigen uns besonders mit Kennzahlen der Lage und stellen dazu den Modalwert, das arithmetische Mittel, das geometrische Mittel, den Median und das \(p\)-Quantil vor. Außerdem wird der Boxplot eingefĂŒhrt, welcher eine auf 5 Kennzahlen beruhende grafische Darstellung der HĂ€ufigkeitsverteilung ist.
    • In dieser Aufgabe liegen klassierte Daten vor und es muss ein arithmetisches Mittel berechnet werden. Dieses wird mit dem exakten arithmetischen Mittel der Ursprungsstichprobe verglichen.
    • In dieser Aufgabe werden verschiedene Lagemaße berechnet und entschieden in welchem Kontexten diese angewendet werden können.
    • In dieser Aufgabe wird das arithmetische Mittel und der Median berechnet und die Ergebnisse miteinander verglichen.
    • In dieser Aufgabe soll eine Wegstrecke optimiert werden. Dabei kann die Eigenschaft eines bestimmten Lagemaßes genutzt werden.
    • In dieser Aufgabe werden verschiedene Quantile fĂŒr zwei Merkmale und Stichproben berechnet. ZusĂ€tzlich werden Sie VerstĂ€ndnisfragen zu Quantilen beantworten.
    • In dieser Aufgabe sehen Sie einen Boxplot und mĂŒssen dazu eine passende Stichprobe angeben.
    • In dieser Aufgabe sehen Sie einen Boxplot und mĂŒssen einige Fragen zu der zugrundeliegenden Stichprobe beantworten.
    • In dieser Aufgabe wird Ihnen eine Stichprobe gegeben und Sie mĂŒssen die Kennzahlen, die Sie zum Zeichnen eines verfeinerten Boxplots benötigen, angeben. Sie erhalten zum Schluss grafisches Feedback zu Ihrer Eingabe.
    • Kapitel 5: Kennzahlen fĂŒr die Streuung, Schiefe und Wölbung
    • In diesem Kapitel wird das Thema Kennzahlen aus dem vorherigen Kapitel fortgesetzt. Kennzahlen reduzieren eine Stichprobe auf einen einzelnen Wert, der eine Eigenschaft der HĂ€ufigkeitsverteilung beschreibt. Wir konzentrieren uns nun auf Streuungsmaße und stellen dazu die Spannweite, den pp-Quantilsabstand, die empirische Varianz und Standardabweichung, die mediane absolute Distanz und die Entropie vor. Weiter besprechen wir die Schiefe und Wölbung von unimodalen HĂ€ufigkeitsverteilungen und geben jeweils eine Kennzahl dazu an.
    • In dieser Aufgabe werden Sie verschiedene Streuungsmaße berechnenen und zu diesen VerstĂ€ndnisfragen beantworten.
    • In dieser Aufgabe vergleichen wir die mittlere Jahrestemperaturen zweier Orte.
    • In dieser Aufgabe werden Sie anhand verschiedener Histogramme Fragen zur Schiefe und Wölbung beantworten.
    • Kapitel 6: Zweidimensionale Datenanalyse
    • Dieses Kapitel behandelt die zweidimensionale deskriptive Datenanalyse. Diese fokussiert sich auf die Untersuchung das Zusammenhangs zweier Merkmale. Dazu fĂŒhren wir zunĂ€chst die zweidimensionale HĂ€ufigkeitsverteilung ein und erklĂ€ren das Konzept von statistisch unabhĂ€ngigen oder abhĂ€ngigen Merkmalen. Um die StĂ€rke eines statistischen Zusammenhangs zu quantifizieren kann man Zusammenhangsmaße verwenden. Hierzu besprechen wir verschiedene Kontingenzmaße und Korrelationsmaße. Letztere beschreiben insbesondere die StĂ€rke eines linearen Zusammenhangs zweier mindestens ordinal skalierter Merkmale. FĂŒr einen linearen Zusammenhang können wir schließlich ein einfaches lineares Regressionsmodell bestimmen.
    • Diese Aufgabe beschĂ€ftigt sich mit der AbhĂ€ngigkeit oder UnabhĂ€ngigkeit von zweier in einer Stichprobe enthaltenen Merkmale.
    • Diese Aufgabe beschĂ€ftigt sich mit den bedingten HĂ€ufigkeiten einer zweidimensionalen Stichprobe.
    • In dieser Aufgabe werden Sie den Korrelationskoeffizient nach Pearson und den Korrelationskoeffizient nach Spearman berechnen sowie VerstĂ€ndnisfragen zu diesen beantworten.
    • In dieser Aufgabe werden die Koeffizienten \(\alpha\) und \(\beta\) einer Regressionsgerade Schritt-fĂŒr-Schritt berechnet.
    • In dieser Aufgabe werden die Koeffizienten \(\alpha\) und \(\beta\) einer Regressionsgerade berechnet und eine Vorhersage fĂŒr eine neue Beobachtung getroffen.
    • Allgemeine Informationen zur Lerneinheit
      Klicken Sie hier fĂŒr mehr Informationen zu den Inhalten, Lernzielen und Voraussetzungen.
      Inhalt

      Die Lerneinheit SchÀtztheorie behandelt grundlegende mathematische Methoden zur SchÀtzung unbekannter Parameter auf Grundlage von Daten. Sie besteht aus 4 Kapiteln:

      • SchĂ€tzer
      • SchĂ€tzmethoden
      • GĂŒtekriterien fĂŒr PunktschĂ€tzer
      • Konfidenzintervalle

      Lernziele

      Am Ende dieser Lerneinheit können Sie

      • SchĂ€tzprobleme in einem Sachkontext modellieren, indem Sie den Sachkontext durch ein statistisches Modell beschreiben, um das SchĂ€tzproblem mathematisch zu analysieren.
      • einen SchĂ€tzer konstruieren, indem Sie die Maximum-Likelihood-Methode oder die Momentenmethode anwenden, um mithilfe dieses SchĂ€tzers aus gegebenen Daten einen SchĂ€tzwert fĂŒr einen unbekannten Modellparameter zu berechnen.
      • einen SchĂ€tzer anhand verschiedener QualitĂ€tskriterien beurteilen, indem Sie KenngrĂ¶ĂŸen wie den Bias und den MSE berechnen, um ihn mit anderen SchĂ€tzern zu vergleichen.
      • Konfidenzintervalle bei normalverteilten Daten berechnen, indem Sie die entsprechenden Formeln fĂŒr Ein- oder Zweistichprobenprobleme anwenden, um SchĂ€tzunsicherheiten zu quantifizieren.
      • asymptotische Eigenschaften einer Folge von SchĂ€tzern oder Konfidenzintervallen visualisieren, indem Sie in R zufĂ€llige Daten simulieren, um die Auswirkungen großer StichprobenumfĂ€nge auf die SchĂ€tzgenauigkeit und -prĂ€zision zu untersuchen.

      Voraussetzungen

      FĂŒr diese Lerneinheit benötigen Sie Grundkenntnisse aus einer einfĂŒhrenden Bachelor-Vorlesung zur Stochastik oder Wahrscheinlichkeitsrechnung. Insbesondere werden die folgenden Themen als bekannt vorausgesetzt: Verteilungen von Zufallsvariablen und Zufallsvektoren, bedingte Wahrscheinlichkeiten, stochastische UnabhĂ€ngigkeit, Produkte von Verteilungen, Erwartungswert und Varianz, Gesetz der großen Zahlen, Normalverteilung und zentraler Grenzwertsatz.

      An manchen Stellen sind Beispiele und Aufgaben enthalten, fĂŒr deren VerstĂ€ndnis und Bearbeitung Sie elementare Kenntnisse in der Statistik-Software R sowie der Paketsammlung tidyverse benötigen.

      Autor:innen

      Diese Lerneinheit wurde von Axel BĂŒcher, Kathrin Möllenhoff und Christian MĂŒller an der Heinrich-Heine-UniversitĂ€t DĂŒsseldorf entwickelt.

    • Kapitel 1: SchĂ€tzer
    • In diesem Kapitel behandeln wir den theoretischen Rahmen und das grundlegende Vorgehen der SchĂ€tztheorie. Wir ĂŒbertragen Sachkontexte in statistische Modelle und definieren den Begriff des SchĂ€tzers.
    • In dieser Aufgabe lernen Sie, einen gegebenen Sachkontext durch ein statistisches Modell zu beschreiben. Der Sachkontext ist hier die Lebensdauer von GlĂŒhlampen.
    • In dieser Aufgabe lernen Sie, einen gegebenen Sachkontext durch ein statistisches Modell zu beschreiben. Der Sachkontext ist hier die Anzahl der in einer Stadt zugelassenen Taxis.
    • In dieser Aufgabe lernen Sie, einen gegebenen Sachkontext durch ein statistisches Modell zu beschreiben. Der Sachkontext ist hier die Messung der StromstĂ€rke in einer elektrischen Schaltung.
    • In dieser Aufgabe lernen Sie, eine SchĂ€tzfunktion zu verwenden, um aus einer Stichprobe einen SchĂ€tzwert zu berechnen. Der Sachkontext ist hier die Lebensdauer von GlĂŒhlampen.
    • In dieser Aufgabe lernen Sie, eine SchĂ€tzfunktion zu verwenden, um aus einer Stichprobe einen SchĂ€tzwert zu berechnen. Der Sachkontext ist hier die Anzahl der in einer Stadt zugelassenen Taxis.
    • Kapitel 2: SchĂ€tzmethoden
    • In diesem Kapitel behandeln wir mathematische Verfahren, mit denen SchĂ€tzer konstruiert werden können. Wir erklĂ€ren jeweils das Prinzip, das dem Verfahren zugrunde liegt, und wenden es auf ausfĂŒhrlich durchgerechnete Beispiele an.
    • In dieser Aufgabe lernen Sie, einen Maximum-Likelihood-SchĂ€tzer zu berechnen. Die Zufallsvariablen folgen hier einer Gammaverteilung.
    • In dieser Aufgabe lernen Sie, einen Maximum-Likelihood-SchĂ€tzer zu berechnen. Die Zufallsvariablen folgen hier einer geometrischen Verteilung.
    • In dieser Aufgabe lernen Sie, einen Maximum-Likelihood-SchĂ€tzer zu berechnen. Die Zufallsvariablen folgen hier einer Gumbel-Verteilung.
    • In dieser Aufgabe lernen Sie, einen Maximum-Likelihood-SchĂ€tzer zu berechnen. Die Zufallsvariablen folgen hier einer Normalverteilung.
    • In dieser Aufgabe lernen Sie, einen Maximum-Likelihood-SchĂ€tzer zu berechnen. Die Zufallsvariablen folgen hier einer Pareto-Verteilung.
    • In dieser Aufgabe lernen Sie, einen Maximum-Likelihood-SchĂ€tzer zu berechnen. Die Zufallsvariablen folgen hier einer Poisson-Verteilung.
    • In dieser Aufgabe lernen Sie, einen Maximum-Likelihood-SchĂ€tzer zu berechnen. Die Zufallsvariablen folgen hier einer Weibull-Verteilung.
    • In dieser Aufgabe lernen Sie, den MomentenschĂ€tzer fĂŒr den Parameter einer Exponentialverteilung zu berechnen.
    • In dieser Aufgabe lernen Sie, die MomentenschĂ€tzer fĂŒr die beiden Parameter einer Gammaverteilung zu berechnen.
    • In dieser Aufgabe lernen Sie, den MomentenschĂ€tzer fĂŒr den Parameter einer geometrischen Verteilung zu berechnen.
    • In dieser Aufgabe lernen Sie, die MomentenschĂ€tzer fĂŒr die beiden Parameter einer kontinuierlichen Gleichverteilung zu berechnen.
    • In dieser Aufgabe lernen Sie, die MomentenschĂ€tzer fĂŒr die beiden Parameter einer Lomax-Verteilung zu berechnen.
    • Kapitel 3: GĂŒtekriterien fĂŒr PunktschĂ€tzer
    • In diesem Kapitel behandeln wir mathematische Kriterien, mit denen die QualitĂ€t von PunktschĂ€tzern beurteilt werden kann. Wir untersuchen diese Eigenschaften eines SchĂ€tzers theoretisch und visualisieren sie mithilfe von Simulationen in R.
    • In dieser Aufgabe lernen Sie, einen SchĂ€tzer auf Erwartungstreue zu ĂŒberprĂŒfen und einen erwartungstreuen SchĂ€tzer zu konstruieren.
    • In dieser Aufgabe lernen Sie, gegebene SchĂ€tzer auf Erwartungstreue zu ĂŒberprĂŒfen und im Sinne der Effizienz zu vergleichen.
    • In dieser Aufgabe lernen Sie, gegebene SchĂ€tzer auf Erwartungstreue zu ĂŒberprĂŒfen und im Sinne der MSE-Effizienz zu vergleichen.
    • In dieser Aufgabe lernen Sie, den MSE von verschiedenen SchĂ€tzern im Bernoulli-Modell zu berechnen und die SchĂ€tzer auf MSE-Konsistenz zu ĂŒberprĂŒfen.
    • In dieser Aufgabe lernen Sie, in der mathematischen Modellierung einer Interview-Situation einen erwartungstreuen SchĂ€tzer zu konstruieren und diesen mit einem bereits bekannten SchĂ€tzer im Sinne der Effizienz zu vergleichen.
    • Kapitel 4: Konfidenzintervalle
    • In diesem Kapitel behandeln wir die Berechnung von Konfidenzintervallen, mit denen SchĂ€tzunsicherheiten quantifiziert werden. Wir leiten fĂŒr verschiedene SchĂ€tzprobleme Formeln zur Berechnung von Konfidenzintervallen her und visualisieren sie mithilfe von Simulationen in R.
    • In dieser Aufgabe lernen Sie, aus gegebenen Daten ein Konfidenzintervall fĂŒr einen unbekannten Erwartungswert zu berechnen. Der Sachkontext ist hier die QualitĂ€tskontrolle bei der AbfĂŒllung von reinem Ethanol.
    • In dieser Aufgabe lernen Sie, aus gegebenen Daten ein Konfidenzintervall fĂŒr einen unbekannten Erwartungswert zu berechnen. Der Sachkontext ist hier die Zubereitung einer isotonischen Kochsalzlösung.
    • In dieser Aufgabe lernen Sie, in einem Zweistichprobenproblem aus gegebenen Daten ein Konfidenzintervall fĂŒr die Differenz der beiden unbekannten Erwartungswerte zu berechnen. Der Sachkontext ist hier die QualitĂ€tskontrolle bei der Produktion von Tabletten eines bestimmten Arzneimittels.
    • In dieser Aufgabe lernen Sie, eine untere Schranke fĂŒr den Stichprobenumfang zu berechnen, sodass ein Konfidenzintervall zu einer gegebenen Irrtumswahrscheinlichkeit eine vorher festgelegte Genauigkeit einhĂ€lt. Der Sachkontext ist hier die QualitĂ€tskontrolle bei der AbfĂŒllung von reinem Ethanol.
    • In dieser Aufgabe lernen Sie, eine untere Schranke fĂŒr den Stichprobenumfang zu berechnen, sodass ein Konfidenzintervall zu einer gegebenen Irrtumswahrscheinlichkeit eine vorher festgelegte Genauigkeit einhĂ€lt. Der Sachkontext ist hier die Zubereitung einer isotonischen Kochsalzlösung.
    • In dieser Aufgabe lernen Sie, aus gegebenen Daten ein Konfidenzintervall fĂŒr eine unbekannte Varianz zu berechnen. Der Sachkontext ist hier die QualitĂ€tskontrolle bei der AbfĂŒllung von reinem Ethanol.
    • In dieser Aufgabe lernen Sie, aus gegebenen Daten ein Konfidenzintervall fĂŒr eine unbekannte Varianz zu berechnen. Der Sachkontext ist hier die Zubereitung einer isotonischen Kochsalzlösung.
    • Allgemeine Informationen zur Lerneinheit
      Klicken Sie hier fĂŒr mehr Informationen zu den Inhalten, Lernzielen und Voraussetzungen.
      Inhalt

      Die Lerneinheit Statistische Hypothesentests behandelt allgemeine Grundlagen der Test-Theorie. Außerdem werden Tests verschiedenen Typs eingefĂŒhrt und deren Anwendung an Beispielen verdeutlicht. Sie besteht aus 9 Kapiteln:

      • Inhaltliche EinfĂŒhrung und Grundbegriffe
      • Gauß-Test als einfĂŒhrendes Beispiel fĂŒr parametrische Tests
      • Einstichproben-t-Test
      • Zweistichproben-t-Test (unverbunden)
      • t-Tests fĂŒr verbundene Stichproben
      • Hypothesentests in der linearen Regression und Simpson's Paradox
      • F-Test
      • Mann-Whitney-U-Test als Beispiel fĂŒr einen nicht-parametrischen Test
      • Chi-Quadrat-UnabhĂ€ngigkeitstest als Beispiel fĂŒr einen semi-parametrischen Test

      Die folgende Abbildung zeigt die BezĂŒge zwischen den genannten Kapiteln. Knotenpunkte mit abgerundeten Ecken symbolisieren Unterthemen, die in dem hierarchisch höher angesiedelten Kapitel behandelt werden. Die Pfeile geben eine grobe Orientierung, in welcher Reihenfolge die Kapitel bearbeitet werden sollten. Verbindungen ohne Pfeil stellen SpezialfĂ€lle der darĂŒberliegenden Tests dar.

      aufbau.png
      Lernziele

      Am Ende dieser Lerneinheit können Sie

      • die grundlegenden Begriffe im Kontext statistischen Testens benennen.
      • die Unterschiede zwischen parametrischen und nichtparametrischen Tests erlĂ€utern.
      • zu einem vorliegenden Datensatz die passende Testart auswĂ€hlen und einen entsprechenden Test anwenden.

      Voraussetzungen

      Grundkenntnisse in Wahrscheinlichkeitsrechnung werden vorausgesetzt. Beispielsweise sollten Binomial- und Normalverteilung bekannt sein.

      Autor:innen

      Diese Lerneinheit wurde von Riko Kelter, Alexander Schnurr und Susanne Spies unter Mithilfe von Annika Hirth an der UniversitÀt Siegen entwickelt.

    • Das einfĂŒhrende Video zur Lerneinheit Statistische Hypothesentests gibt einen Überblick ĂŒber Aufbau und Inhalt der Materialien und mögliche Einsatzszenarien.
    • Kapitel 1: Inhaltliche EinfĂŒhrung
    • Das Video gibt eine EinfĂŒhrung in die Theorie statistischer Hypothesentests. Es erlĂ€utert grundlegende Konzepte und Objekte, die in der Theorie statistischen Testens nötig sind. WeiterfĂŒhrende Informationen finden sich auch im Kapitel zum Gauß-Test, das einen Einstieg in die Arbeit mit den restlichen Materialien bietet und viele der im Video angeschnittenen Konzepte aufgreift.
    • Wir behandeln in diesem Kapitel das Thema statistische Signifikanz von Hypothesentests und p-Werte. In der Auswertung von wissenschaftlichen Studien sind diese Begriffe von zentraler Bedeutung und sorgen nach wie vor oft fĂŒr MissverstĂ€ndnisse. Ein solides VerstĂ€ndnis vom Konzept statistischer Signifikanz und p-Werten ist daher unerlĂ€sslich, um statistische Ergebnisse korrekt interpretieren zu können.
    • In dieser Aufgabe lernen Sie, wie Sie den p-Wert eines Hypothesentests interpretieren.
    • In dieser Aufgabe lernen Sie, wie Sie einen Binomialtest zur ÜberprĂŒfung einer Hypothese verwenden. In Aufgabenteil (a) stellen Sie eine Hypothese auf. In Teil (b) fĂŒhren Sie den Test durch. Dazu können sie R verwenden.
    • Kapitel 2: Gauß-Test
    • Wir behandeln in diesem Kapitel den Gauss-Test als einfĂŒhrendes Beispiel fĂŒr einen parametrischen Hypothesentest. Die Herleitung der Teststatistik sowie praktische Beispiele veranschaulichen, wie der Test in R angewendet wird.
    • In dieser Aufgabe lernen Sie in fĂŒnf Teilaufgaben, wie Sie einen Zweistichproben-Gaußtest zur ÜberprĂŒfung einer Hypothese verwenden.
    • In dieser Aufgabe lernen Sie in fĂŒnf Teilaufgaben, wie Sie einen Einstichproben-Gauß-Test zur ÜberprĂŒfung einer Hypothese verwenden.
    • In dieser Aufgabe lernen Sie, wie Sie mithilfe eines Gauß-Tests den Mittelwert einer Stichprobe ĂŒberprĂŒfen.
    • In dieser Aufgabe lernen Sie, wie Sie mithilfe eines Gauß-Tests den Mittelwert zweier Stichproben vergleichen.
    • In dieser Aufgabe lernen Sie, wie Sie den Z-Test anwenden.
    • Kapitel 3: Einstichproben-t-Test
    • Wir behandeln in diesem Kapitel den Einstichproben-t-Test. Der Hypothesentest ist unter den am hĂ€ufigsten in der Praxis eingesetzten parametrischen Tests. Der Einstichproben-t-Test verallgemeinert den Gauß-Test fĂŒr eine Stichprobe und setzt die Varianz ebenfalls als unbekannt voraus. Ein praktisches Beispiel veranschaulicht, wie der t-Test in R angewendet wird.
    • In dieser Aufgabe lernen Sie in fĂŒnf Teilaufgaben, wie Sie einen zweiseitigen Einstichproben-t-Test zur ÜberprĂŒfung einer Hypothese verwenden.
    • In dieser Aufgabe lernen Sie, wie Sie ein Konfidenzintervall berechnen. In Aufgabenteil (a) bestimmen Sie den dazugehörigen Standardfehler. In Teil (b) bestimmen Sie die Intervallgrenzen.
    • In dieser Aufgabe lernen Sie in fĂŒnf Teilaufgaben, wie Sie einen einseitigen Einstichproben-t-Test zur ÜberprĂŒfung einer Hypothese verwenden und auswerten.
    • Kapitel 4: Zweistichproben-t-Test (unverbunden)
    • Wir behandeln in diesem Kapitel den t-Test fĂŒr zwei unverbundene Stichproben. Dieser ist einer der am hĂ€ufigsten in der Praxis eingesetzten parametrischen Hypothesentests. Die Unterschiede zwischen Student’s und Welch’s t-Test werden diskutiert und die Teststatistik motiviert und erlĂ€utert. Praktische Beispiele veranschaulichen, wie der Test in R angewendet wird.
    • In dieser Aufgabe lernen Sie in fĂŒnf Teilaufgaben, wie Sie einen Zweistichproben-t-Test zur ÜberprĂŒfung einer Hypothese verwenden.
    • Kapitel 5: t-Test fĂŒr verbundene Stichproben
    • Wir behandeln in diesem Kapitel den t-Test fĂŒr zwei verbundene Stichproben. Der Hypothesentest ist unter den am hĂ€ufigsten in der Praxis eingesetzten parametrischen Tests. Der t-Test fĂŒr zwei verbundene Stichproben wird beispielsweise angewandt, wenn zwei Messungen derselben Individuen beziehungsweise Beobachtungseinheiten zu unterschiedlichen Zeitpunkten gemacht wurden und diese Messungen damit nicht mehr unabhĂ€ngig voneinander sind. Es wird gezeigt, dass der t-Test fĂŒr zwei verbundene Stichproben sich auf den Einstichproben-t-Test zurĂŒckfĂŒhren lĂ€sst, die Teststatistik wird motiviert und erlĂ€utert. Ein praktisches Beispiel veranschaulicht, wie der t-Test fĂŒr zwei verbundene Stichproben in R angewendet wird.
    • In dieser Aufgabe lernen Sie, wie Sie einen zweiseitigen Zweistichproben-t-Test zur ÜberprĂŒfung einer Hypothese verwenden.
    • Kapitel 6: Hypothesentests in der linearen Regression
    • Wir behandeln in diesem Kapitel den t-Test fĂŒr Regressionskoeffizienten im linearen Regressionsmodell.
    • In dieser Aufgabe lernen Sie in fĂŒnf Teilaufgaben, wie Sie einen t-Test fĂŒr Regressionskoeffizienten zur ÜberprĂŒfung einer Hypothese verwenden.
    • In dieser Aufgabe lernen Sie in zwei Teilaufgaben, wie Sie einen t-Test fĂŒr Regressionskoeffizienten zur ÜberprĂŒfung einer Hypothese verwenden.
    • Kapitel 7: Der F-Test
    • Wir behandeln in diesem Kapitel den F-Test fĂŒr zwei Stichproben. Dieser eignet sich dazu, zwei Stichproben aus unterschiedlichen, normalverteilten Populationen auf Unterschiede in den Varianzen zu prĂŒfen.
    • In dieser Aufgabe lernen Sie, wie Sie einen einseitigen F-Test zur ÜberprĂŒfung einer Hypothese zur Varianz zweier Stichproben anwenden.
    • Kapitel 8: Ein nicht-parametrischer Test
    • Wir behandeln in diesem Kapitel den Mann-Whitney-U-Test fĂŒr zwei unverbundene Stichproben, welcher eine nichtparametrische Alternative zum t-Test fĂŒr zwei unverbundene Stichproben darstellt. Wir erlĂ€utern die Idee hinter dem Test, zeigen die DurchfĂŒhrung in R anhand eines Anwendungsbeispiels und diskutieren Vor- und Nachteile sowie die Voraussetzungen des Tests.
    • In dieser Aufgabe lernen Sie, wie Sie einen U-Test zur ÜberprĂŒfung einer Hypothese zur Verteilung zweier Merkmale verwenden.
    • Kapitel 9: Ein semi-parametrischer Test
    • Wir behandeln in diesem Kapitel den Chi-Quadrat-UnabhĂ€ngigkeitstest und dessen Anwendung in Kontingenztafeln.
    • In dieser Aufgabe lernen Sie in drei Teilaufgaben, wie Sie einen Chi-Quadrat-UnabhĂ€ngigkeitstest zur ÜberprĂŒfung einer Hypothese verwenden.
    • In dieser Aufgabe lernen Sie in fĂŒnf Teilaufgaben, wie Sie einen Chi-Quadrat-UnabhĂ€ngigkeitstest zur ÜberprĂŒfung einer Hypothese verwenden.
    • Allgemeine Informationen zur Lerneinheit
      Klicken Sie hier fĂŒr mehr Informationen zu den Inhalten, Lernzielen und Voraussetzungen.
      Inhalt

      Die Lerneinheit Lineare Regression behandelt das einfache und das multiple lineare Regressionsmodell sowie die Implementation in R. Sie besteht aus 4 Kapiteln:

      • Einfache lineare Regression
      • Hypothesentests und Konfidenzintervalle bei der einfachen linearen Regression
      • Multiple lineare Regression
      • Bestimmtheitsmaß und F-Test

      Lernziele

      Am Ende dieser Lerneinheit können Sie

      • Experimente modellieren, deren Ergebnisse vom Wert einer oder mehrerer erklĂ€renden Variablen und vom Zufall abhĂ€ngen.
      • die Kleinste-Quadrate-Methode zur SchĂ€tzung der Parameter im linearen Regressionsmodell erklĂ€ren und anwenden.
      • Hypothesentests ĂŒber die unbekannten Parameter durchfĂŒhren.
      • das Bestimmtheitsmaß \(R^2\) erklĂ€ren und interpretieren.
      • eine Streuungszerlegung durchfĂŒhren, das Ergebnis interpretieren und den F-Test anwenden.
      • praktische Berechnungen zu konkreten Daten mithilfe von R durchfĂŒhren und die Ergebnisse interpretieren.

      Voraussetzungen

      Die Bearbeitung dieser Lerneinheit setzt Kenntnisse im Umfang der Lerneinheiten zur SchÀtz- und Testtheorie sowie Grundkenntnisse in R voraus. ZusÀtzlich sind Kenntnisse der Analysis und der Linearen Algebra erforderlich.

      Autor:innen

      Diese Lerneinheit wurde von Herold Dehling und Daniel Meißner unter Mithilfe von Elias Kaiser an der Ruhr-UniversitĂ€t Bochum entwickelt.

    • Kapitel 1: Einfache lineare Regression
    • In diesem Kapitel behandeln wir die einfache lineare Regression. Wir erklĂ€ren das zugrunde liegende statistische Modell und wie mithilfe der Kleinste-Quadrate-Methode SchĂ€tzwerte fĂŒr die Parameter der Regressionsgeraden ermittelt werden können.
    • In dieser Aufgabe lernen Sie, wie Sie eine Regressionsgerade bestimmen, indem Sie die Steigung und den \(y\)-Achsenabschnitt aus zusammengefassten Daten schĂ€tzen. Weiter lernen Sie, wie man Konfidenzintervalle fĂŒr die Parameter bestimmt.
    • In dieser Aufgabe lernen Sie, wie Sie eine lineare Regression mithilfe von R ausfĂŒhren. Zur Bearbeitung der Aufgabe ist R nicht notwendig.
    • Kapitel 2: Hypothesentest und Konfidenzintervalle bei der einfachen linearen Regression
    • In diesem Kapitel behandeln wir einen Hypothesentest und Konfidenzintervalle fĂŒr die einfache lineare Regression. Wir erklĂ€ren, wie Konfidenzintervalle berechnet werden und wie die Hypothese getestet werden kann, dass die Regressionsgerade eine vorgegebene Steigung \(\beta_0\)​ aufweist. Insbesondere werden wir erklĂ€ren, wie die Hypothese getestet werden kann, dass die erklĂ€rende Variable keinen Einfluss auf die abhĂ€ngige Variable hat.
    • In dieser Aufgabe lernen Sie, wie Sie in einem einfachen linearen Modell einen Hypothesentest zum Einfluss der unabhĂ€ngigen Variable auf die abhĂ€ngige Variable durchfĂŒhren.
    • In dieser Aufgabe lernen Sie, wie Sie die lineare AbhĂ€ngigkeit zwischen zwei Variablen mithilfe einer R-Ausgabe bestimmen.
    • Kapitel 3: Multiple lineare Regression
    • In diesem Kapitel stellen wir das multiple lineare Regressionsmodell vor, das zur Modellierung von Experimenten dient, bei denen das Ergebnis von mehreren erklĂ€renden Variablen abhĂ€ngt. Zur SchĂ€tzung der Parameter werden wir die Kleinste-Quadrate-Methode vorstellen, die Eigenschaften des SchĂ€tzers analysieren und Konfidenzintervalle bestimmen. Weiter werden wir zeigen, wie man Daten mithilfe des multiplen linearen Regressionsmodells in R analysieren kann.
    • In dieser Aufgabe lernen Sie, wie man die Designmatrix eines linearen Regressionsmodells angibt, wie man den Kleinste-Quadrate-SchĂ€tzer bestimmt und wie man einen kĂŒnftigen Wert der abhĂ€ngigen Variablen zu vorgegebenen Werten der erklĂ€renden Variablen vorhersagen kann.
    • Kapitel 4: Bestimmtheitsmaß und F-Test
    • In diesem Kapitel stellen wir zunĂ€chst zum multiplen linearen Regressionsmodell das Bestimmtheitsmaß \(R^2\) vor, das auch unter dem Namen multipler Korrelationskoeffizient bekannt ist. Das Bestimmtheitsmaß gibt an, welcher Anteil der Streuung in den Ergebnissen der Experimente durch das Modell erklĂ€rt wird. Weiter werden wir den F-Test vorstellen, mit dessen Hilfe wir Hypothesen ĂŒber die Parameter im multiplen linearen Regressionsmodell testen können. Schließlich werden wir erklĂ€ren, wie man die vorgestellten Verfahren in R bei gegebenen Daten ausfĂŒhren kann.
    • In dieser Aufgabe lernen Sie, wie Sie in einem linearen Regressionsmodell zu einem gegebenen Datensatz das Bestimmtheitsmaß mithilfe von R berechnen und wie Sie einen F-Test fĂŒr die Hypothese, dass einige der erklĂ€renden Variablen keinen Einfluss auf die abhĂ€ngige Variable haben, durchfĂŒhren.