Die Normalapproximation

Wenn unter bestimmten Bedingungen an die Parameter einer Verteilung sich diese einer anderen Verteilung annähert, kann durch eine Approximation die Berechnung von Wahrscheinlichkeiten mitunter stark vereinfacht werden, ohne einen allzu großen Fehler im Ergebnis zu erzeugen. Oft liegt solchen Approximationen ein Grenzwertsatz zugrunde.

Mit der Normalapproximation kann die Binomialverteilung durch die Normalverteilung angenähert werden. Sie basiert auf dem zentralen Grenzwertsatz von de Moivre-Laplace: Besitzt \(S_n\) eine Binomialverteilung mit Parametern \(n\) und \(p\) und ist \(\Phi\) die Verteilungsfunktion der Standardnormalverteilung, dann gilt für alle \(t\in\mathbb{R}\) \[\lim_{n\to\infty}\left|P\left(\frac{S_n-np}{\sqrt{np(1-p)}}\leq t\right)-\Phi(t)\right|=0.\] Die standardisierte Zufallsvariable \[S_n^*=\frac{S_n-np}{\sqrt{np(1-p)}}\] ist also approximativ standardnormalverteilt. Mit Rechenregeln für die Normalverteilung ist \(S_n\) selbst dann approximativ \(\text{N}(np,np(1-p))\)-verteilt. Die Binomialverteilung \(\text{Bin}(n,p)\) kann daher für große Werte von \(n\) durch die Normalverteilung \(\text{N}(np,np(1-p))\) approximiert werden: \[P(t_1<S_n\leq t_2)\approx\Phi\left(\dfrac{t_2-np}{\sqrt{np(1-p)}}\right)-\Phi\left(\dfrac{t_1-np}{\sqrt{np(1-p)}}\right).\] Als Faustregel sollte \(np(1-p)\geq9\) gelten, was ausdrückt, dass einerseits \(n\) groß und andererseits \(p\) weder zu klein noch zu groß sein sollte.

Sind \(t_1\) und \(t_2\) ganzzahlig, kann in der obigen Formel eine sogenannte Stetigkeitskorrektur angewendet werden, um die Approximation zu verbessern. Hierbei wird statt der Wahrscheinlichkeit des Intervalls \((t_1,t_2]\) die Wahrscheinlichkeit des um \(0.5\) verschobenen Intervalls \((t_1+0.5,t_2+0.5]\) angenähert: \[P(t_1<S_n\leq t_2)=P(t_1+0.5<S_n\leq t_2+0.5)\approx\Phi\left(\dfrac{t_2+0.5-np}{\sqrt{np(1-p)}}\right)-\Phi\left(\dfrac{t_1+0.5-np}{\sqrt{np(1-p)}}\right).\]

In den folgenden interaktiven Grafiken ist die Normalapproximation auf der Ebene der Dichtefunktionen visualisert. Die linke Grafik zeigt in blau die Zähldichte der Binomialverteilung mit Parametern \(n\) und \(p\) und in rot die Dichtefunktion der Normalverteilung mit Parametern \(\mu=np\) und \(\sigma^2=np(1-p)\). Die rechte Grafik zeigt die Differenz zwischen der Zähldichte der Binomialverteilung und der Dichtefunktion der Normalverteilung, also die Genauigkeit der Normalapproximation.

Verändern Sie die Werte von \(n\) und \(p\) über die Schieberegler oder die Eingabefelder.

In der folgenden Grafik wird die Normalapproximation auf der Ebene der Verteilungsfunktionen veranschaulicht. In blau ist für eine \(\text{Bin}(n,p)\)-verteilte Zufallsvariable \(S_n\) die Verteilungsfunktion der standardisierten Zufallsvariablen \[S_n^*=\frac{S_n-np}{\sqrt{np(1-p)}}\] gezeichnet; wird die Stetigkeitskorrektur angewendet, zeigt die blaue Kurve stattdessen die Verteilungsfunktion von \[S_n^*=\frac{S_n+0.5-np}{\sqrt{np(1-p)}}.\] Die rote Kurve ist die Verteilungsfunktion \(\Phi\) der Standardnormalverteilung.

Verändern Sie die Werte von \(n\) und \(p\) über die Schieberegler oder die Eingabefelder. Kontrollieren Sie über die Radiobuttons, ob die Stetigkeitskorrektur angewendet werden soll.

Zum Nachdenken

Beschreiben Sie mithilfe der interaktiven Grafik die Veränderung der Dichten, der Verteilungsfunktionen und des Approximationsfehlers, wenn Sie die Werte von \(n\) bzw. \(p\) verändern. Wie wirkt sich die Stetigkeitskorrektur auf die Verteilungsfunktion der standardisierten Zufallsvariablen \(S_n^*\) aus?

Wird bei festem \(p\) der Wert von \(n\) vergrößert, verringert sich die maximale Betragsdifferenz zwischen der Zähldichte der Binomialverteilung und der Dichtefunktion der Normalverteilung und der Approximationsfehler wird kleiner. Mit größer werdendem \(n\) nähert sich auch die Verteilungsfunktion von \(S_n^*\) immer mehr der Verteilungsfunktion der Standardnormalverteilung an. Wird bei festem \(n\) der Wert von \(p\) verringert oder vergrößert, wird der Approximationsfehler dagegen größer. Nur wenn \(p\) in der Nähe von \(1/2\) liegt, ist die Approximation bereits bei kleinem \(n\) sehr gut.

Wird die Stetigkeitskorrektur angewendet, liegen die Funktionswerte an den Sprungstellen der stückweise linearen, rechtsstetigen Verteilungsfunktion von \(S_n^*\) näher am entsprechenden Funktionswert von \(\Phi\) als ohne Anwendung der Stetigkeitskorrektur. Da genau diese Funktionswerte zur Berechnung von Intervallwahrscheinlichkeiten mit ganzzahligen Intervallgrenzen benötigt werden, ergibt die Normalapproximation mit Stetigkeitskorrektur in vielen Fällen eine genauere Approximation als die Normalapproximation ohne Stetigkeitskorrektur.