Minimalitätseigenschaft des Erwartungswerts

Der Erwartungswert einer Zufallsvariablen gibt die im Mittel zu erwartende Beobachtung an und ist ein sinnvolles Maß für die Lage der Verteilung der Zufallsvariablen. Als Streuungsmaß wird oft die Varianz verwendet, die als die mittlere quadratische Abweichung der Zufallsvariablen vom Erwartungswert definiert ist. Dass hierbei Abweichungen vom Erwartungswert \(\text{E}(X)\), und nicht von einer anderen reellen Zahl \(a\) berechnet werden, ist durch die im Folgenden visualisierte Minimalitätseigenschaft des Erwartungswerts motiviert.

Für eine Zufallsvariable \(X\) mit endlichem zweiten Moment und eine beliebige reelle Zahl \(a\) ist die mittlere quadratische Abweichung der Zufallsvariablen von \(a\) gleich \[\text{E}((X-a)^2)=\text{E}(X^2-2aX+a^2)=\text{E}(X^2)-2\text{E}(X)a+a^2.\] Aufgefasst als Funktion in \(a\) ist das eine nach oben geöffnete Parabel \(f(a)\). In der folgenden interaktiven Grafik wird diese am Beispiel einer \(\text{Bin}(10,p)\)-verteilten Zufallsvariablen visualisiert.

In der linken Grafik ist die Zähldichte der Binomialverteilung mit \(n=10\) und variabel einstellbarem \(p\in(0,1)\) geplottet. Die Flächen der als Quadrat gezeichneten Punkte sind proportional zum mit der jeweiligen Wahrscheinlichkeit gewichteten quadratischen Abstand der Realisierung \(k\) vom Wert \(a\), also proportional zu \((k-a)^2\cdot\text{Bin}(10,p)(\{k\})\). In der rechten Grafik wird in Abhängigkeit von \(a\) der Wert \[\text{E}((X-a)^2)=\sum_{k=0}^{10}(k-a)^2\cdot\text{Bin}(10,p)(\{k\})\] geplottet, der proportional zur Summe der Flächeninhalte der Quadrate in der linken Grafik ist.

Verändern Sie die Werte von \(p\) und \(a\) über die Schieberegler oder die Eingabefelder. Den Wert von \(a\) können Sie auch in der linken Grafik durch Verschieben des roten Dreiecks entlang der horizontalen Achse verändern.


Zum Nachdenken

Bei welchem Wert von \(a\) wird in der linken Grafik die Summe der Flächeninhalte minimal, wenn der Wert von \(p\) vorgegeben ist? Welchen Funktionswert nimmt dann die Parabel in der rechten Grafik an? Erklären Sie anschließend rechnerisch, wie sich die Varianz von \(X\) als Lösung des Minimierungsproblems \(\min\limits_{a\in\mathbb{R}}\text{E}((X-a)^2)\) ergibt.

In der rechten Grafik ergibt sich die oben beschriebene Parabel \(f(a)=\text{E}(X^2)-2\text{E}(X)a+a^2\). Sie besitzt genau eine globale Minimalstelle, die man als Nullstelle der ersten Ableitung erhält. Diese Ableitung ist \(f'(a)=-2\text{E}(X)+2a\) mit der Nullstelle \(a=\text{E}(X)\). Somit ist \[\min_{a\in\mathbb{R}}\text{E}((X-a)^2)=\min_{a\in\mathbb{R}}f(a)=f(\text{E}(X))=\text{E}\big((X-\text{E}(X))^2\big)=\text{Var}(X).\] Im Beispiel der Binomialverteilung ist die Minimalstelle \(\text{E}(X)=np=10p\) und der Funktionswert an der Minimalstelle ist \(\text{Var}(X)=np(1-p)=10p(1-p)\).

Grafisch bedeutet dies, dass die Summe der Flächeninhalte der Quadrate in der linken Grafik genau dann minimal wird, wenn \(a\) mit dem Erwartungswert von \(X\) übereinstimmt. In der rechten Grafik kann dann als Funktionswert die Varianz von \(X\) abgelesen werden.