Das Galtonbrett und das Kapteynbrett

Eine der wichtigsten theoretischen Aussagen der Stochastik ist der zentrale Grenzwertsatz, der besagt, dass sich die Verteilung einer Summe von unabhängigen und identisch verteilten Zufallsvariablen mit endlicher Varianz für eine immer größer werdende Zahl an Summanden immer mehr einer Normalverteilung annähert. Das Galtonbrett (nach Francis Galton, 1822 - 1911) veranschaulicht diese Gesetzmäßigkeit des Zufalls im Spezialfall von Zufallsexperimenten mit nur zwei möglichen Ausgängen. In diesem Spezialfall ist der zentrale Grenzwertsatz auch als Satz von de Moivre-Laplace bekannt (nach Abraham de Moivre, 1667 - 1754, und Pierre-Simon Laplace, 1749 - 1827).

Das Kapteynbrett (nach Jacobus Cornelius Kapteyn, 1851 - 1922) ist eine multiplikative Version des Galtonbretts für Produkte von Zufallsvariablen mit zwei möglichen Ausgängen. Als Grenzwert stellt sich hierbei eine Log-Normalverteilung ein.

Galtonbrett

Auf dem Galtonbrett sind \(n\) Reihen mit Hindernissen angebracht, die eine darauf fallende Kugel mit Wahrscheinlichkeit \(p\) nach rechts oder mit Wahrscheinlichkeit \(1-p\) nach links ablenken, wodurch sich die horizontale Position der Kugel um \(+1\) oder um \(-1\) verändert. Nachdem die Kugel von einem Hindernis abgelenkt wurde, fällt sie in der darunter liegenden Reihe auf ein weiteres Hindernis und wird erneut mit Wahrscheinlichkeit \(p\) nach rechts oder mit Wahrscheinlichkeit \(1-p\) nach links abgelenkt. Nach dem Hindernis in der letzten Reihe fällt die Kugel in eines von \(n+1\) Fächern. Wenn mehrere Kugeln das Galtonbrett durchlaufen haben, bilden die in den Fächern liegenden Kugeln annähernd die Form der Dichtefunktion einer Normalverteilung.

Auf dem folgenden interaktiven Galtonbrett wird die Anzahl der Kugeln in jedem Fach gezählt und ein Histogramm relativer Häufigkeiten gezeichnet, das bei einer großen Zahl an Kugeln ebenfalls eine gute Approximation an die eingezeichnete Dichtefunktion einer Normalverteilung ergibt. Die genauen Parameter dieser Normalverteilung werden unten in den Aufgaben hergeleitet.

Mit den Buttons können Sie das Galtonbrett starten, stoppen oder zurücksetzen. Die Buttons mit einer Zahl simulieren sofort entsprechend viele Durchläufe von Kugeln.

Kugeln gesamt 0
Fach Kugeln pro Fach
0 0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
9 0
10 0

Zum Nachdenken

(a) Erklären Sie, wie sich die Gesamtveränderung der horizontalen Position einer Kugel nach \(n\) Hindernissen auf dem Galtonbrett durch eine Summenvariable beschreiben lässt.

Dass die Kugel beim Aufprall auf ein Hindernis zufällig nach rechts oder nach links abgelenkt wird, ist ein Zufallsexperiment mit zwei möglichen Ausgängen, also ein Bernoulli-Experiment. Wenn eine Ablenkung nach rechts als 'Erfolg' kodiert wird, wird die Ablenkungsrichtung am \(i\)-ten Hindernis durch eine Zufallsvariable \(Y_i\) beschrieben, die eine Bernoulli-Verteilung mit Parameter \(p\) besitzt. \(Y_i=0\) bedeutet eine Ablenkung nach links und \(Y_i=1\) bedeutet eine Ablenkung nach rechts. Durchläuft die Kugel das Galtonbrett, wird dieses Bernoulli-Experiment \(n\)-mal unabhängig wiederholt, da die Kugel in jeder der \(n\) Reihen auf genau ein Hindernis trifft. In welches Fach die Kugel schließlich fällt, wird daher durch die Binomialverteilung mit Parametern \(n\) und \(p\) beschrieben.

Der Wert, um den sich die horizontale Position der Kugel am \(i\)-ten passierten Hindernis verändert, wird durch eine Zufallsvariable \(X_i\) mit einer Zweipunktverteilung auf der Menge \(\{-1,1\}\) modelliert. Fällt die Kugel nach links, verändert sich die horizontale Position um \(X_i=-1\), fällt die Kugel nach rechts, verändert sich die horizontale Position um \(X_i=1\). Zwischen der Fallrichtung \(Y_i\) und der Positionsänderung \(X_i\) besteht der Zusammenhang \(X_i=2Y_i-1\). Die Gesamtveränderung der horizontalen Position der Kugel setzt sich additiv aus den zufälligen Veränderungen \(X_i\) an den passierten Hindernissen zusammen und wird somit durch die Summenvariable \[S_n=\sum_{i=1}^nX_i\] beschrieben. \(S_n\) nimmt Werte in \(\{-n,-n+2,\ldots,n-2,n\}\) an. Beispielsweise ist \(S_n=-n\), wenn die Kugel jedes Mal nach links fällt, und \(S_n=n\) bedeutet, dass die Kugel jedes Mal nach rechts abgelenkt wurde.

(b) Nach dem zentralen Grenzwertsatz besitzt die Summenvariable aus (a) für großes \(n\) approximativ eine Normalverteilung. Berechnen Sie die Parameter dieser Normalverteilung, also ihren Erwartungswert und ihre Varianz.

Nach dem zentralen Grenzwertsatz besitzt \(S_n\) für große Werte von \(n\) approximativ eine Normalverteilung mit den Parametern \begin{align*} \mu_n &=\text{E}(S_n)\\ &=\sum_{i=1}^n\text{E}(X_i)\\ &=\sum_{i=1}^n\big(2\text{E}(Y_i)-1\big)\\ &=\sum_{i=1}^n(2p-1)\\ &=n(2p-1) \end{align*} und \begin{align*} \sigma_n^2 &=\text{Var}(S_n)\\ &=\sum_{i=1}^n\text{Var}(X_i)\\ &=\sum_{i=1}^n4\text{Var}(Y_i)\\ &=\sum_{i=1}^n4p(1-p)\\ &=4np(1-p). \end{align*} Mit der Verteilungsfunktion \(\Phi\) der Standardnormalverteilung gilt genauer \[\lim_{n\to\infty}\left|P\left(\frac{S_n-n(2p-1)}{\sqrt{4np(1-p)}}\leq t\right)-\Phi(t)\right|=0\quad\text{für alle }t\in\mathbb{R}.\] Beim interaktiven Galtonbrett ist diese Approximation durch Vergleichen des Histogramms relativer Häufigkeiten mit der Dichtefunktion der Normalverteilung zu erkennen. Wenn sich also das Gesamtergebnis eines zufälligen Vorgangs additiv aus den Teilergebnissen sehr vieler einzelner Zufallsexperimente zusammensetzt, eignet sich zur stochastischen Modellierung eine Normalverteilung.

Kapteynbrett

Auf dem Kapteynbrett sind \(n\) Reihen mit Hindernissen angebracht, die eine darauf fallende Kugel mit Wahrscheinlichkeit \(p\) nach rechts oder mit Wahrscheinlichkeit \(1-p\) nach links ablenken, wodurch die horizontale Position der Kugel um einen festen Faktor \(c\) gestreckt oder um den Faktor \(1/c\) gestaucht wird. Nachdem die Kugel von einem Hindernis abgelenkt wurde, fällt sie in der darunter liegenden Reihe auf ein weiteres Hindernis und wird erneut mit Wahrscheinlichkeit \(p\) nach rechts oder mit Wahrscheinlichkeit \(1-p\) nach links abgelenkt. Nach dem Hindernis in der letzten Reihe fällt die Kugel in eines von \(n+1\) Fächern. Wenn mehrere Kugeln das Kapteynbrett durchlaufen haben, bilden die in den Fächern liegenden Kugeln annähernd die Form der Dichtefunktion einer Log-Normalverteilung.

Auf dem folgenden interaktiven Kapteynbrett wird die Anzahl der Kugeln in jedem Fach gezählt und ein Histogramm relativer Häufigkeiten gezeichnet, das bei einer großen Zahl an Kugeln ebenfalls eine gute Approximation an die eingezeichnete Dichtefunktion einer Log-Normalverteilung ergibt. Die genauen Parameter dieser Log-Normalverteilung werden unten in den Aufgaben hergeleitet. Der Wert von \(c\) ist hier \(c=1.2\), d.h. die horizontale Position einer Kugel wird nach jedem Hindernis mit \(1.2\) multipliziert, falls sie nach rechts fällt, bzw. durch \(1.2\) dividiert, falls sie nach links fällt. Dies wird durch die gestreckte bzw. gestauchte Form der dreiecksförmigen Hindernisse veranschaulicht.

Mit den Buttons können Sie das Kapteynbrett starten, stoppen oder zurücksetzen. Die Buttons mit einer Zahl simulieren sofort entsprechend viele Durchläufe von Kugeln.

Kugeln gesamt 0
Fach Kugeln pro Fach
0 0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
9 0
10 0

Zum Nachdenken

(a) Erklären Sie, wie sich die Gesamtveränderung der horizontalen Position einer Kugel nach \(n\) Hindernissen auf dem Kapteynbrett durch eine Produktvariable beschreiben lässt.

Dass die Kugel beim Aufprall auf ein Hindernis zufällig nach rechts oder nach links abgelenkt wird, ist ein Zufallsexperiment mit zwei möglichen Ausgängen, also ein Bernoulli-Experiment. Wenn eine Ablenkung nach rechts als 'Erfolg' kodiert wird, wird die Ablenkungsrichtung am \(i\)-ten Hindernis durch eine Zufallsvariable \(Y_i\) beschrieben, die eine Bernoulli-Verteilung mit Parameter \(p\) besitzt. \(Y_i=0\) bedeutet eine Ablenkung nach links und \(Y_i=1\) bedeutet eine Ablenkung nach rechts. Durchläuft die Kugel das Kapteynbrett, wird dieses Bernoulli-Experiment \(n\)-mal unabhängig wiederholt, da die Kugel in jeder der \(n\) Reihen auf genau ein Hindernis trifft. In welches Fach die Kugel schließlich fällt, wird daher durch die Binomialverteilung mit Parametern \(n\) und \(p\) beschrieben.

Der Wert, um den sich die horizontale Position der Kugel am \(i\)-ten passierten Hindernis verändert, wird durch eine Zufallsvariable \(X_i\) mit einer Zweipunktverteilung auf der Menge \(\{c^{-1},c\}\) modelliert. Fällt die Kugel nach links, verändert sich die horizontale Position um den Faktor \(X_i=c^{-1}\), fällt die Kugel nach rechts, verändert sich die horizontale Position um den Faktor \(X_i=c\). Zwischen der Fallrichtung \(Y_i\) und der Positionsänderung \(X_i\) besteht der Zusammenhang \(X_i=c^{2Y_i-1}\). Die Gesamtveränderung der horizontalen Position der Kugel setzt sich multiplikativ aus den zufälligen Veränderungen \(X_i\) an den passierten Hindernissen zusammen und wird somit durch die Produktvariable \[T_n=\prod_{i=1}^nX_i\] beschrieben. \(T_n\) nimmt Werte in \(\{c^{-n},c^{-n+2},\ldots,c^{n-2},c^n\}\) an. Beispielsweise ist \(T_n=c^{-n}\), wenn die Kugel jedes Mal nach links fällt, und \(T_n=c^n\) bedeutet, dass die Kugel jedes Mal nach rechts abgelenkt wurde.

(b) Wie kann die Produktvariable aus (a) in eine Summenvariable transformiert werden?

Durch Transformation mit dem Logarithmus wird aus der Produktvariablen \(T_n\) die Summenvariable \(\displaystyle S_n=\log(T_n)=\sum_{i=1}^n\log(X_i)\).

(c) Nach dem zentralen Grenzwertsatz besitzt die Summenvariable aus (b) für großes \(n\) approximativ eine Normalverteilung. Berechnen Sie die Parameter dieser Normalverteilung, also ihren Erwartungswert und ihre Varianz. Welche approximative Verteilung besitzt dann die ursprüngliche Produktvariable aus (a)?

Nach dem zentralen Grenzwertsatz besitzt \(S_n=\log(T_n)\) für große Werte von \(n\) approximativ eine Normalverteilung mit den Parametern \begin{align*} \mu_n &=\text{E}(\log(T_n))\\ &=\sum_{i=1}^n\text{E}(\log(X_i))\\ &=\sum_{i=1}^n\text{E}((2Y_i-1)\log(c))\\ &=\log(c)\sum_{i=1}^n(2\text{E}(Y_i)-1)\\ &=\log(c)\sum_{i=1}^n(2p-1)\\ &=n(2p-1)\log(c) \end{align*} und \begin{align*} \sigma_n^2 &=\text{Var}(\log(T_n))\\ &=\sum_{i=1}^n\text{Var}(\log(X_i))\\ &=\sum_{i=1}^n\text{Var}((2Y_i-1)\log(c))\\ &=\log^2(c)\sum_{i=1}^n4\text{Var}(Y_i)\\ &=\log^2(c)\sum_{i=1}^n4p(1-p)\\ &=4np(1-p)\log^2(c). \end{align*} Somit besitzt \(T_n\) selbst approximativ eine Log-Normalverteilung mit denselben Parametern \(\mu_n=n(2p-1)\log(c)\) und \(\sigma_n^2=4np(1-p)\log^2(c)\). Mit der Verteilungsfunktion \(\Phi\) der Standardnormalverteilung gilt genauer \[\lim_{n\to\infty}\left|P\left(\frac{T_n-n(2p-1)\log(c)}{\sqrt{4np(1-p)\log^2(c)}}\leq t\right)-\Phi\big(\log(t)\big)\right|=0\quad\text{für alle }t>0.\] Beim interaktiven Kapteynbrett ist diese Approximation durch Vergleichen des Histogramms relativer Häufigkeiten mit der Dichtefunktion der Log-Normalverteilung zu erkennen. Wenn sich also das Gesamtergebnis eines zufälligen Vorgangs multiplikativ aus den Teilergebnissen sehr vieler einzelner Zufallsexperimente zusammensetzt, eignet sich zur stochastischen Modellierung eine Log-Normalverteilung.

Zum Weiterlesen