Zufallsgrößen

Einführung

Ergebnisse von Zufallsexperimenten sind im Allgemeinen keine Zahlen, sondern beliebige Elemente (beim Münzwurfe sind die Ergebnisse z.B. “Kopf” und “Zahl”). Von solchen Ergebnissen können Wahrscheinlichkeiten bestimmt werden, aber keine Kennzahlen wie einen Mittelwert (beim Münzwurf ist die Frage “Welches Ergebnis werfe ich im Durchschnitt?” sinnlos). Dazu ist es nötig, dass wir Ergebnissen Zahlen zuordnen.

Eine Zufallsgröße $X$ ordnet jedem Ergebnis eines Zufallsexperiment eine reelle Zahl zu. Wir sprechen in der Regel direkt von Werten einer Zufallsgröße $x_1, x_2, \ldots $ und ihren Wahrscheinlichkeiten $P(X=x_1)$, $P(X=x_2)$, $\ldots$. Die Wahrscheinlichkeitsverteilung einer Zufallsgröße stellen wir häufig tabellarisch oder mit Histogrammen dar.

Biathlet A

Ein Biathlet A absolviert eine Schießeinheit mit fünf Schüssen auf Zielscheiben. Die Zufallsgröße $X$ beschreibt die Anzahl der Fehlschüsse. Aus langfristigen Beobachtungen ergeben sich die folgenden Wahrscheinlichkeiten für die möglichen Werte von $X$:

Fehlschüsse $x_i$ $0$ $1$ $2$ $3$ $4$ $5$
$P(X = x_i)$ $0{,}03$ $0{,}33$ $0{,}57$ $0{,}03$ $0{,}04$ $0$

Beispielsweise bedeutet $P(X=2)=0{,}19$, dass die Wahrscheinlichkeit, mit der Biathlet A genau zweimal das Ziel verfehlt, 19 % beträgt. Das zugehörige Histogramm hat folgende Darstellung:

Biathlet B

Die Wahrscheinlichkeitsverteilung sowie das Histogramm eines weiteren Biathleten B könnten wie folgt aussehen:

Fehlschüsse $x_i$ $0$ $1$ $2$ $3$ $4$ $5$
$P(X = x_i)$ $0{,}37$ $0{,}16$ $0{,}18$ $0{,}08$ $0{,}09$ $0{,}12$

Kenzahlen

Der Erwartungswert

Wie lässt sich nun feststellen, welcher Biathlet der treffsicherere ist? Um dies zu entscheiden, können wir die Werte der Zufallsgröße unter Berücksichtigung ihrer Wahrscheinlichkeiten zusammenfassen. Dazu verwenden wir den Erwartungswert. Er gibt uns den Wert, den wir im Mittel erwarten können, wenn ein Zufallsexperiment sehr oft wiederholt wird.

Der Erwartungswert einer (diskreten) Zufallsgröße $X$ ergibt sich aus der Summe der Produkte der einzelnen Werte $x_i$ mit ihren jeweiligen Wahrscheinlichkeiten $P(X = x_i)$:

\[\begin{align*} E(X) &= x_1 \cdot P(X = x_1) + x_2 \cdot P(X = x_2) + \ldots + x_n \cdot P(X = x_n) \\ &= \sum_{i=1}^{n} x_i \cdot P(X = x_i) \end{align*}\]

In der Statistik, in der Wahrscheinlichkeiten häufig als relative Häufigkeiten interpretiert werden, entspricht der Erwartungswert dem gewichteten arithmetischen Mittel. Das bedeutet: Häufigere (wahrscheinlichere) Werte fließen stärker in den Mittelwert ein als seltenere.

Der Erwartungswert von Biathlet A

\[\begin{align*} E(X) &= 0 \cdot 0{,}03 + 1 \cdot 0{,}33 + 2 \cdot 0{,}57 + 3 \cdot 0{,}03 + 4 \cdot 0{,}04 + 5 \cdot 0 \\ &= 0 + 0{,}33 + 1{,}14 + 0{,}09 + 0{,}16 + 0 \\ &= 1{,}72 \end{align*}\]

Der Erwartungswert beträgt also $1{,}72$. Das bedeutet: Biathlet A verfehlt im Mittel etwa $1{,}72$-mal das Ziel.

Der Erwartungswert von Biathlet B

\[\begin{align*} E(X) &= 0 \cdot 0{,}37 + 1 \cdot 0{,}16 + 2 \cdot 0{,}18 + 3 \cdot 0{,}08 + 4 \cdot 0{,}09 + 5 \cdot 0{,}12 \\ &= 0 + 0{,}16 + 0{,}36 + 0{,}24 + 0{,}36 + 0{,}60 \\ &= 1{,}72 \end{align*}\]

Der Erwartungswert für Biathlet B beträgt also $1{,}72$. Auch Biathlet B verfehlt im Mittel etwa $1{,}72$-mal das Ziel .

Wären die Erwartungswerte der beiden Biathleten unterschiedlich gewesen, hätten wir eine fundierte Entscheidungsgrundlage gehabt, um zu entscheiden, welcher der treffsicherere Biathlet ist.

1. Info
Formel für den Erwartungswert:

‘Zeile der Werte mal Zeile der Wahrscheinlichkeiten’:

\[E(X) = x_1 \cdot P(X = x_1) + x_2 \cdot P(X = x_2) + \ldots + x_n \cdot P(X = x_n)\]

Die Standardabweichung

Wie lassen sich die Werte der Biathleten noch unterscheiden? Im Mittel erwarten wir die gleiche Anzahl an Fehlschüssen. Hilfreich könnte es jedoch sein, festzustellen, wie stark die Werte schwanken. Anhand der Histogramme erkennen wir, dass bei Biathlet B die Werte deutlich stärker schwanken: Biathlet A hat fast immer nur 1 oder 2 Fehlschüsse, während Biathlet B eine größere Bandbreite an möglichen Fehlschüssen aufweist.

Wir suchen nun eine Kennzahl, mit der wir genau messen können, wie stark eine Zufallsgröße von ihrem Erwartungswert abweicht. Die grundlegende Idee ist es, die Summe der quadrierten, mit den Wahrscheinlichkeiten gewichteten Abweichungen vom Erwartungswert zu betrachten und anschließend die Wurzel zu ziehen. Diese Kennzahl nennen wir Standardabweichung $\sigma(X)$ (lies: Sigma von X):

\[\begin{align*} \sigma(X) &= \sqrt{(x_1-E(X))^2 \cdot P(X = x_1) + (x_2-E(X))^2 \cdot P(X = x_2) + \ldots + (x_n-E(X))^2 \cdot P(X = x_n)} \\ &= \sqrt{\sum_{i=1}^{n} (x_i - E(X))^2\cdot P(X=x_i)} \end{align*}\]

Auch der Ausdruck unter der Wurzel eignet sich, die Schwankungen zu messen. Er wird Varianz genannt und mit $\sigma^2$ bezeichnet.

Die Standardabweichung von Biathlet A

Der Erwartungswert ist bekanntlich $E(X) = 1{,}72$. Wir berechnen zunächst die Varianz:

\[\begin{align*} \sigma^2(X) &= (0 - 1{,}72)^2 \cdot 0{,}03 + (1 - 1{,}72)^2 \cdot 0{,}33 + (2 - 1{,}72)^2 \cdot 0{,}57 + (3 - 1{,}72)^2 \cdot 0{,}03 + (4 - 1{,}72)^2 \cdot 0{,}04 + (5 - 1{,}72)^2 \cdot 0 \\ &= (2{,}9584) \cdot 0{,}03 + (0{,}5184) \cdot 0{,}33 + (0{,}0784) \cdot 0{,}57 + (1{,}6384) \cdot 0{,}03 + (5{,}1984) \cdot 0{,}04 + (10{,}7584) \cdot 0 \\ &= 0{,}0888 + 0{,}1700 + 0{,}0447 + 0{,}0492 + 0{,}2079 + 0 \\ &= 0{,}5606 \end{align*}\]

Die Varianz beträgt also $0{,}5606$.

Nun ziehen wir die Wurzel, um die Standardabweichung zu erhalten:

\[\sigma(X) = \sqrt{0{,}5606} \approx 0{,}75\]

Die Standardabweichung von Biathlet A beträgt also ungefähr $0{,}75$.

Die Standardabweichung von Biathlet B

Auch hier beträgt der Erwartungswert $E(X) = 1{,}72$. Wir berechnen zunächst die Varianz:

\[\begin{align*} \sigma^2(X_B) &= (0 - 1{,}72)^2 \cdot 0{,}37 + (1 - 1{,}72)^2 \cdot 0{,}16 + (2 - 1{,}72)^2 \cdot 0{,}18 + (3 - 1{,}72)^2 \cdot 0{,}08 + (4 - 1{,}72)^2 \cdot 0{,}09 + (5 - 1{,}72)^2 \cdot 0{,}12 \\ &= 2{,}9584 \cdot 0{,}37 + 0{,}5184 \cdot 0{,}16 + 0{,}0784 \cdot 0{,}18 + 1{,}6384 \cdot 0{,}08 + 5{,}1984 \cdot 0{,}09 + 10{,}7584 \cdot 0{,}12 \\ &= 1{,}0956 + 0{,}0829 + 0{,}0141 + 0{,}1311 + 0{,}4679 + 1{,}2909 \\ &= 3{,}0825 \end{align*}\]

Nun ziehen wir die Wurzel, um die Standardabweichung zu berechnen:

\[\sigma(X) = \sqrt{3{,}0825} \approx 1{,}75\]

Die Standardabweichung von Biathlet B beträgt also ungefähr $1{,}75$. Die Anzahl der Fehlschüsse schwankt hier also stärker um den Erwartungswert als bei Biathlet A.

2. Info
Formel für die Standardabweichung:

‘Zeile der quadrierten Abweichungen vom Erwartungswert mal Zeile der Wahrscheinlichkeiten’:

\[\sigma(X) = \sqrt{(x_1-E(X))^2 \cdot P(X = x_1) + (x_2-E(X))^2 \cdot P(X = x_2) + \ldots + (x_n-E(X))^2 \cdot P(X = x_n)}\]

Interpretationen

Vergleich der Biathleten A und B

Die Erwartungswerte der beiden Biathleten sind gleich: $E(X_A)=1,72$ und $E(X_B)=1,72$. Das bedeutet, dass sie im Mittel die gleiche Anzahl an Fehlschüssen haben.

Die Standardabweichungen entscheiden sich allerdings deutlich: $\sigma(X_A) \approx 0{,}75$ und $\sigma(X_B) \approx 1{,}75$. Eine präzise Interpretation der Standardabweichungen ist an dieser Stelle nicht unmittelbar möglich. Vereinfacht gesagt, liegt ein Großteil der Werte in einem Intervall von etwa einer Standardabweichung um den Erwartungswert. Dieses Intervall umfasst also die „häufigen“ Werte der Zufallsgröße.

Für Biathlet A gilt:

\[\begin{align*} E(X_A) - \sigma(X_A) &\approx 1{,}72 - 0{,}75 = 0{,}97 \\ E(X_A) + \sigma(X_A) &\approx 1{,}72 + 0{,}75 = 2{,}47 \end{align*}\]

Das bedeutet, dass die Anzahl der Fehlschüsse bei A meistens zwischen 1 und 2 liegt.

Für Biathlet B gilt:

\[\begin{align*} E(X_B) - \sigma(X_B) &\approx 1{,}72 - 1{,}75 = -0{,}03 \\ E(X_B) + \sigma(X_B) &\approx 1{,}72 + 1{,}75 = 3{,}47 \end{align*}\]

Biathlet B hat also häufig 0 bis 3 Fehlschüsse.

Welcher Biathlet ist nun der “Bessere”? Diese Frage lässt sich nicht pauschal beantworten. Zunächst haben wir festgestellt, dass die Erwartungswerte der beiden Biathleten gleich sind, was bedeutet, dass sie im Mittel gleich viele Fehlschüsse erzielen. Allerdings zeigt die Standardabweichung, dass die Fehlschüsse bei Biathlet B stärker schwanken als bei Biathlet A.

Die Entscheidung, welcher Biathlet der “Bessere” ist, hängt letztlich von der Präferenz des Entscheiders ab. Biathlet A ist konstanter, während Biathlet B mehr Schwankungen aufweist. Dies könnte in verschiedenen Kontexten unterschiedliche Bedeutung haben:

Letztlich hängt die Entscheidung davon ab, ob der Fokus auf Konstanz oder auf der Fähigkeit liegt, auch in schwierigen Situationen hohe Leistungen zu bringen.

Allgemeine Situationen

In vielen Anwendungssituationen ist eine kleine Standardabweichung vorteilhaft, weil sie weniger Unsicherheit bedeutet. So ist es für die meisten Menschen vorteilhaft, monatlich in etwa die gleichen Einnahmen und Ausgaben zu haben, da sie dadurch mehr Planungssicherheit gewinnen. Das Gleiche gilt für Unternehmen oder Regierungen, die ebenfalls von stabilen Einnahmen und Ausgaben profitieren, um langfristig erfolgreich agieren zu können.

3. Info
Bedeutung des Erwartungswerts und der Standardabweichung:
  • Erwartungswert $E(X)$: Langfristiger Mittelwert
  • Standardabweichung $\sigma(X)$: Maß für die Schwankung

Aufstellen von Verteilungen

Soll die Wahrscheinlichkeitsverteilungen einer Zufallsgröße aufgestellt werden, so benötigen wir

  1. die Wahrscheinlichkeiten des zugrunde liegenden Zufallsexperiments (z.B. in Form eines Baumdiagramms) und
  2. eine weitere Information, die jedem Ergebnis eine reelle Zahl zuordnet.

Zur übersichtlichen Darstellung kann im Anschluss das Histogramm einer Zufallsgröße erstellt werden.

4. Info
Auf der Wahrscheinlichkeitsverteilung einer Zufallsgröße
  1. Zeile: Welche Werte nimmt die Zufallsgröße an?
  2. Zeile: Welche Wahrscheinlichkeiten gehören zu den einzelnen Werten?

Vervollständigung von Verteilungen

Häufig stehen wir vor der Aufgabe, eine teilweise gegebene Verteilung zu vervollständigen.

5. Info
Fehlende Wahrscheinlichkeit:

Die Wahrscheinlichkeitsverteilung laute

$x_i$ $-4$ $-2$ $-1$ $2$ $5$
$P(X = x_i)$ $0{,}07$ $0{,}06$   $0{,}41$ $0{,}44$

Hier kann leicht der fehlende Wert berechnet werden, da die Summe der Wahrscheinlichkeiten 1 ergeben muss. Daher ist

\[\begin{align*} P(X = -1) & = 1 - (0,07 + 0,06 + 0,41 + 0,44) \\ & = 1 - 0,98 \\ & = 0,02 \end{align*}\]
6. Info
Fehlender Wert:

Die Wahrscheinlichkeitsverteilung laute

$x_i$ $-5$ $x$ $0$ $1$ $4$
$P(X = x_i)$ $0{,}05$ $0{,}39$ $0{,}37$ $0{,}09$ $0{,}1$

Außerdem ist bekannt, dass $E(X)=-0{,}93$.

Um $x$ zu berechnen, verwenden wir die Definition des Erwartungswerts:

\[-0{,}93 = (-5 \cdot 0{,}05) + (x \cdot 0{,}39) + (0\cdot 0{,}37) + (1 \cdot 0{,}09) + (4 \cdot 0{,}10)\]

Diese Gleichung können wir nach $x$ auflösen

\[\begin{align*} -0{,}93 & = -0{,}25 + 0{,}39x + 0{,}09 + 0{,}40\\ -0{,}93 & = 0{,}39x + 0{,}24 \quad |-0{,}24\\ -1{,}17 & =0{,}39x \quad |:0{,}39\\ x&=-3 \end{align*}\]
7. Info
Zwei fehlende Wahrscheinlichkeiten:

Die Wahrscheinlichkeitsverteilung laute

$x_i$ $-4$ $-2$ $-1$ $1$ $4$
$P(X = x_i)$ $0{,}15$ $0{,}27$ $x$ $0{,}08$ $y$

Außerdem ist bekannt, dass $E(X)=0{,}29$

Da wir zwei Unbekannte haben, sind auch zwei Gleichungen nötig, um sie zu bestimmen:

  1. Die Summe der Wahrscheinlichkeiten muss 1 ergeben:

    \[0{,}15 + 0{,}27 + x + 0{,}08 +y = 1\]
  2. Der gegebene Erwartungswert:

    \[0{,}29 = (-4 \cdot 0{,}15) + (-2 \cdot 0{,}27) + (-1 \cdot x) + (1 \cdot 0{,}08) + (4 \cdot y)\]

Die Gleichungen lassen sich vereinfachen:

  1. $x + y = 0{,}5$
  2. $- x + 4y = 1{,}35$

Nun gibt es verschiedene Techniken, dieses Gleichungssystem zu lösen. Wir lösen zunächst nach $x$ auf:

  1. $x = 0{,}5 - y $
  2. $x = 4y - 1{,}35 $

und setzen gleich: $0{,}5 -y = 4y - 1{,}35$. Es folgt $1{,}85 = 5y$ und so $y=0{,}37$. Nun folgt $x=0{,}5 - 0{,}37 = 0{,}13$.

Login

Melde dich mit deinem Account an

Noch kein Account? Jetzt registrieren