Binomialverteilung

Einführung

Ein Bernoulli-Experiment ist ein Zufallsexperiment mit nur zwei möglichen Ergebnissen: Treffer oder Niete. Die Wahrscheinlichkeit für einen Treffer wird in der Regel mit $p$ bezeichnet, für eine Niete mit $q=1-p$. Wird ein Bernoulli-Experiment $n$-mal hintereinander bei gleichbleibender Trefferwahrscheinlichkeit durchgeführt, so sprechen wir von einer Bernoulli-Kette der Länge $n$. Eine gleichbleibende Trefferwahrscheinlichkeit bedeutet im Übrigen, dass die auftretenden Ereignisse voneinander unabhängig sind. Eine Zufallsgröße, die bei einer Bernoulli-Kette die Anzahl der Treffer angibt, heißt binomialverteilt. Aufgrund dieser klaren Struktur werden sich viele systematische Rechenverfahren ergeben.

1. Info
Bedingungen der Binomialverteilung:
  • Es gibt eine feste Anzahl an Versuchen (Stufen).
  • Es gibt es in jedem Versuch genau zwei mögliche Ausgänge.
  • Die Wahrscheinlichkeit für einen Treffer ist in jedem Versuch gleich.

Die Bernoulli-Formel

Herleitung

Wir betrachten eine Bernoulli-Kette der Länge $n$ mit Trefferwahrscheinlichkeit $p$ und fragen nach der Wahrscheinlichkeit für genau $k$ Treffer. Das zugehörige Baumdiagramm hat folgende Gestalt:

Anzahl der Pfade mit k Treffern:
Pfadendwahrscheinlichkeit:
Wahrscheinlichkeit für genau k Treffer:

Um die Wahrscheinlichkeit für genau $k$ Treffer zu berechnen, benötigen wir die erstens Anzahl der Pfade mit genau $k$ Treffern und zweitens die Endwahrscheinlichkeit eines solchen Pfades.

Damit ergibt sich mit der Pfadadditionsregel die Bernoulli-Formel für genau $k$ Treffer:

\[P(X=k)=\binom{n}{k}\cdot p^k\cdot (1-p)^{n-k}\]

Diese Formel bildet die Grundlage für viele Wahrscheinlichkeitsberechnungen. Sie ist in einigen Taschenrechnern als Funktion integriert und in Tafelwerken dokumentiert.

Anwendung

Eine Basketballspielerin habe von der Freiwurflinie eine Trefferwahrscheinlichkeit von 70 % und wirft 4 Mal. Wie groß ist die Wahrscheinlichkeit, dass sie genau 3 Treffer erzielt?
$$ \begin{align*} P(X=4)&=\binom{4}{3}\cdot 0{,}7^3\cdot (1-0{,}7)^{4-3}\\ &=0{,}4116 \end{align*} $$
Ein Virentest erkennt eine Infektion mit 92 % Wahrscheinlichkeit. Bei 12 getesteten infizierten Personen: Wie groß ist die Wahrscheinlichkeit, dass genau 11 positive Tests erfolgen?
$$ \begin{align*} P(X=11)&=\binom{12}{11}\cdot 0{,}92^{11}\cdot 0{,}08^{12-11}\\ &=0{,}2855 \end{align*} $$
Die Wahrscheinlichkeit, dass ein Paket zu spät geliefert wird, beträgt 10 %. Bei 8 Sendungen: Wie wahrscheinlich ist es, dass genau 2 zu spät ankommen?
$$ \begin{align*} P(X=2)&=\binom{8}{2}\cdot 0{,}1^2\cdot 0{,}9^{8-2}\\ &=0{,}1488 \end{align*} $$

Interpretationen

Durch den häufigen Einsatz von Taschenrechnern oder Tafelwerken gerät die Bedeutung der Bernoulli-Formel in den Hintergrund. Dabei ist gerade diese Formel die Grundlage dafür, dass solche Hilfsmittel Wahrscheinlichkeiten so zuverlässig angeben können. Es ist daher wichtig, die Formel auch inhaltlich interpretieren zu können.

2. Info
Interpretation der Bernoulli-Formel $P(X=k)=\binom{n}{k}\cdot p^k\cdot (1-p)^{n-k}$
  • $n$: Anzahl der Versuche
  • $p$: Trefferwahrscheinlichkeit
  • $1-p$: Nietenwahrscheinlichkeit
  • $k$: Anzahl der Treffer
  • $P(X=k)$: Wahrscheinlichkeit für genau $k$ Treffer

Intervallwahrscheinlichkeiten

Im vorherigen Abschnitt interessierten wir uns für die Wahrscheinlichkeit für genau $k$ Treffer. In diesem Abschnitt erweitern wir die Fragestellung und fragen nach der Wahrscheinlichkeit, dass die Anzahl der Treffer in einem vorgegebenen Bereich liegt.

Beispiel

Eine Basketballsperin habe von der Dreierlinie eine Trefferwahrscheinlichkeit von 10% und wirft 20 Mal. Die Zufallsgröße $X$, die die Anzahl der Treffer angibt, ist binomialverteilt mit $n=20$ und $p=0{,}1$.

Wie groß ist die Wahrscheinlchkeit für höchstens 2 Treffer? Höchstens 2 Treffer bedeutet, dass sie 0, 1 oder 2 Mal trifft. Die gesuchte Wahrscheinlichkeit wird mit $P(X\leq 2)$ bezeichnet und ist

\[\begin{align*} P(X \leq 2) &= P(X = 0) + P(X = 1) + P(X = 2) \\ &= \binom{20}{0} \cdot 0{,}1^0 \cdot 0{,}9^{20} + \binom{20}{1} \cdot 0{,}1^1 \cdot 0{,}9^{19} + \binom{20}{2} \cdot 0{,}1^2 \cdot 0{,}9^{18}\\ &=0,1216 + 0,2702 + 0,2852\\ &=0,6769. \end{align*}\]

Die Bernoulli-Formel muss also lediglich mehrmals nacheinander angewendet werden.

Symbolische Formulierungen

Damit wir die Bernoulli-Formel geeignet anwenden können, müssen wir gut auf die Beschreibung des gesuchten Bereichs achten: Um welche Trefferanzahlen geht es? Dazu ist es hilfreich, textuelle Beschreibungen in symbolische umzuformen.

Beschreiben Sie die folgenden Wahrscheinlichkeiten symbolisch (weiterhin ist $n=8$).

Wahrscheinlichkeit für genau 6 Treffer
$$ P(X=6) $$
Wahrscheinlichkeit für höchstens 4 Treffer
$$ P(X\leq 4)=P(X=0)+P(X=1)+\ldots+P(X= 4) $$
Wahrscheinlichkeit für mindestens 12 Treffer
$$ P(X\geq 12)=P(X=12)+P(X=13)+\ldots+P(X= 20) $$
Wahrscheinlichkeit für weniger als 10 Treffer
$$ P(X< 10)=P(X=0)+P(X=1)+\ldots+P(X=9) $$
Wahrscheinlichkeit für mehr als 7 Treffer
$$ P(X> 7)=P(X=8)+P(X=9)+\ldots+P(X= 20) $$
Wahrscheinlichkeit für mehr als 11 und höchstens 18 Treffer
$$ P(11< X\leq 18)=P(X=12)+P(X=13)+\ldots+P(X= 18) $$
Wahrscheinlichkeit zwischen einschließlich 2 und ausschließlich 9 Treffer
$$ P(2\leq X<9)=P(X=2)+P(X=3)+\ldots+P(X= 8) $$

Wir beobachten die folgenden Regeln:

\[P(X<k)=P(X\leq k-1)\] \[P(X>k)=P(X\geq k+1)\] \[P(a\leq X\leq b)=P(X\leq b) - P(X\leq a-1)\]

Das Gegenereignis zu “mindestens $k$ Treffer” ist “höchstens $k-1$ Treffer”. Der Satz von der Gegenwahrscheinlichkeit lautet hier also

\[P(X\geq k)=1-P(X\leq k-1).\]

Berechnungen

Für Bereichswahrscheinlichkeiten werden die Bernoulli-Formeln mehrfach nacheinander angewendet. Dies kann bei vielen Summanden aufwendig und fehleranfällig sein. Typischerweise werden Bereichswahrscheinlichkeiten daher mit Tafelwerken oder Taschenrechnern bestimmt. In Tafelwerken befinden sich in der Regel die kumulierten Wahrscheinlichkeiten $P(X\leq k)$.

3. Info
Tafelwerke: Gesuchte Wahrscheinlichkeiten auf Wahrscheinlichkeiten der Art $P(X\leq k)$ zurückführen.
\[\begin{align*} P(X=k)&=P(X\leq k)-P(X\leq k-1)\\ P(X\geq k)&=1-P(X\leq k-1)\\ P(a<X<b)&=P(X\leq b-1)-P(X\leq a)\\ \end{align*}\]
4. Info
Taschenrechner: Direktes Bestimmen der Bereichswahrscheinlichkeiten.
\[P(a\leq X\leq b)=Bcd(a;b;n;p)\]

Weitere Hinweise

Bevor wir Bereichswahrscheinlichkeiten bestimmen können, müssen wir die folgenden Fragen beantworten:

Beispiele

Wir suchen die Wahrscheinlichkeiten der angegebnen Ereignisse

  1. mit Hilfe kumulierter Wahrscheinlichkeiten,
  2. mit Hilfe des Taschenrechners.

Die Basketballspielerin erzielt (weiterhin ist $n=20$ und $p=0{,}1$)

genau 6 Treffer.
$$ \begin{align*} P(X=6) &= P(X\leq 6) - P(X\leq 5) = 0{,}9976 - 0{,}9887 = 0{,}0089 \\ P(X=6) &= Bcd(6;6;20;0{,}1) = 0{,}0089 \end{align*} $$
höchstens 4 Treffer.
$$ \begin{align*} P(X\leq 4) &= 0{,}9568 \\ P(X\leq 4) &= Bcd(0;4;20;0{,}1) = 0{,}9568 \end{align*} $$
mindestens 6 Treffer.
$$ \begin{align*} P(X\geq 6) &= 1 - P(X\leq 5)=1-0{,}9887= 0{,}0113 \\ P(X\geq 6) &= Bcd(6;20;20;0{,}1) = 0{,}0113 \end{align*} $$
weniger als 3 Treffer.
$$ \begin{align*} P(X<3) &= P(X\leq 2)=0{,}6769 \\ P(X<3) &= Bcd(0;2;20;0{,}1) = 0{,}6769 \end{align*} $$
mehr als 3 Treffer.
$$ \begin{align*} P(X>3) &= 1 - P(X\leq 3)=1-0{,}8670=0{,}1330 \\ P(X>3) &= Bcd(4;20;20;0{,}1) = 0{,}1330 \end{align*} $$
mehr als 1 und höchstens 5 Treffer.
$$ \begin{align*} P(1 < X \leq 5) &= P(X\leq 5) - P(X\leq 1)=0{,}9887-0{,}3917=0{,}5970 \\ P(1 < X \leq 5) &= Bcd(2;5;20;0{,}1) = 0{,}5970 \end{align*} $$
einschließlich 3 und ausschließlich 9 Treffer.
$$ \begin{align*} P(3 \leq X < 9) &= P(X\leq 8) - P(X\leq 2)=0{,}9999-0{,}6769 = 0{,}3230 \\ P(3 \leq X < 9) &= Bcd(3;8;20;0{,}1) = 0{,}3230 \end{align*} $$
weniger als 4 oder mehr als 7 Treffer.
Das gegebene Ereignis setzt sich aus den beiden Ereignisse $X<4$ und $X>7$ zusammen: $$ \begin{align*} P(X<4 \text{ oder } X>7) &= P(X\leq 3) + (1 - P(X\leq 7))=0{,}8670 + 0{,}0004=0{,}8674 \\ P(X<4 \text{ oder } X>7) &= Bcd(0;3;20;0{,}1) + Bcd(8;20;20;0{,}1) =0{,}8670 + 0{,}0004=0{,}8674 \end{align*} $$
in höchstens 13% der Würfe Treffer.
Hier berechnen wir zunächst die Intervallgrenzen: $0,13\cdot 20=2,6$. Dann haben wir: $$ \begin{align*} P(X \leq 2{,}6) &= P(X \leq 2) = 0{,}6769\\ P(X \leq 2{,}6) &= Bcd(0;2;20;0{,}1) = 0{,}6769 \end{align*} $$
in mehr als einem Drittel der Würfe Treffer.
Hier berechnen wir zunächst die Intervallgrenzen: $\frac{20}{3} \approx 6{,}7$. Dann haben wir: $$ \begin{align*} P(X > 6{,}7) &= P(X > 7) = 1 - P(X \leq 6) = 1 - 0{,}9986 = 0{,}0024 \\ P(X > 6{,}7) &= P(X > 7)= Bcd(7;20;20;0{,}1) = 0{,}0024 \end{align*} $$
höchstens 15 Fehlwürfe.
Hier geht es um die Fehlwürfe und nicht um die Treffer. Daher ist hier $p=0{,}9$. $$ \begin{align*} P(X \leq 15)&=0{,}0432\\ P(X \leq 15)&=Bcd(0;15;20;0{,}9)=0{,}0432 \end{align*} $$
nur im ersten und letzten Wurf ein Treffer.
Es liegt keine binomialverteilte Zufallsgröße vor, da es nicht um die Anzahl der Treffer von 20 Würfen geht, sondern um eine konkrete Wurffolge: 1. Treffer, 2. Fehlwurf, 2. Fehlwurf,..., 19. Fehlwurf, 20. Treffer. Das Ereignis entpricht also genau einem Pfad im Baumdiagramm. $$ P(\text{1. und 20. Treffer, Rest Fehlwurf})=0{,}1^2 \cdot 0{,}9^{18}=0{,}0015 $$
im 3. und 14. Wurf einen Treffer.
Hier geht es nur um den 3. und 14. Wurf, alles andere ist irrelevant. Daher ist $$ P(\text{ 3. und 14. Treffer})=0{,}1\cdot 0{,}1=0{,}01 $$
5. Info
Kurzfragen zur Berechnung von Bereichswahrscheinlichkeiten:
  • Binomialverteilt?
  • $n$ und $p$ ?
  • Treffer im Sachzusammenhang?
  • Intervallgrenzen inklusive korrekter Rundung?

Histogramme

Wie jede Zufallsgröße können binomialverteilte Zufallsgrößen in Histogrammen dargestellt werden. Es gibt zwei Varianten:

6. Info
Histogramm der Einzelwahrscheinlichkeiten
  • Die Wahrscheinlichkeiten der Art $P(X=k)$ können direkt abgelesen werden.
  • Bei Wahrscheinlichkeiten der Form $P(a\leq X\leq b)$ ermitteln wir alle Balken, die innerhalb des Intervalls $[a;b]$ liegen, und addieren deren Wahrscheinlichkeiten.
7. Info
Histogramm der kumulierten Wahrscheinlichkeiten
  • Die kumulierten Wahrscheinlichkeiten $P(X\leq k)$ können direkt abgelesen werden.
  • Die Einzelwahrscheinlichkeiten $P(X=k)$ können als Stufenhöhen aufgefasst werden:
\[P(X=k)=P(X\leq k)- P(X\leq k-1).\]
  • Die Wahrscheinlichkeiten der Form $P(a\leq X\leq b)$ entsprechen dann den Höhen mehrerer Stufen:
\[P(a\leq X\leq b)=P(X\leq b)- P(X\leq a-1).\]

Bestimmung von n, p und k

Mit Hilfe der Bernoulli-Formel $P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}$ lassen sich Intervallwahrscheinlichkeiten binomialverteilter Zufallsgrößen betimmen:

\[\begin{align*} P(X\leq k)&=P(X=0) + P(X=1) + \ldots P(X=k)\\ &=\binom{n}{0}p^0(1-p)^{n} + \binom{n}{1}p^{1}(1-p)^{n-1} + \ldots + \binom{n}{k}p^k(1-p)^{n-k}\\ & =\sum_{i=0}^k \binom{n}{i}p^i(1-p)^{n-i} \end{align*}\]

Wie wir gesehen haben, lässt sich dieser komplizierte Ausdruck mit Hilfe von Tafelwerken oder Taschenrechnern bestimmen. Das bedeutet: Wenn $n$, $p$ und $k$ gegeben sind, können wir die Wahrscheinlickeit $P(X\leq k)$ bestimmen.

Wir ändern nun die Perspektive: Angenommen $P(X\leq k)$ und z.b. $p$ und $k$ seien gegeben. Was ist dann $n$?

Dazu müsste die oben erwähnte Formel nach $n$ aufgelöst werden. Dies ist jedoch nicht elementar möglich. Stattdessen probieren wir mit Hilfe von Wertetabellen systematisch aus.

Beispiel 1

Gegegen: $P(X\leq 3)\approx 0{,}71$ und $p=0,4$

Gesucht: $n$

Mit Hilfe eines Tafelswerks und Taschenrechners stellen wir folgende Tabelle auf:

$n$ $P(X\leq 3)$
1 1,0000
2 1,0000
3 1,0000
4 0,9744
5 0,9130
6 0,8208
7 0,7102
8 0,5941
9 0,4826
10 0,3823

Wir entnehmen der Tabelle, dass $P(X\leq 3)=0{,}7102\approx 0{,}71$ für $n=7$ ist.

Beispiel 2

Gegegen: $P(X\geq 14)\approx 0{,}15$ und $n=20$

Gesucht: $p$

Mit Hilfe eines Tafelswerks und Taschenrechners stellen wir folgende Tabelle auf:

$p$ $P(X\geq 14)$
0,51 0,0688
0,52 0,0814
0,53 0,0958
0,54 0,1119
0,55 0,1299
0,56 0,1499
0,57 0,1719
0,58 0,1959
0,59 0,2220
0,60 0,2500

Wir entnehmen der Tabelle, dass $P(X\geq 14)=0{,}1499\approx 0{,}15$ für $p=0{,}56$ ist.

Beispiel 3

Gegegen: $P(X\leq k)\approx 0{,}10$ und $n=200$ und $p=0{,}9$

Gesucht: $k$

Mit Hilfe eines Tafelswerks und Taschenrechners stellen wir folgende Tabelle auf:

$k$ $P(X\leq k)$
171 0,0271
172 0,0434
173 0,0672
174 0,1005
175 0,1449
176 0,2017
177 0,2710
178 0,3516
179 0,4408
180 0,5345

Wir entnehmen der Tabelle, dass $P(X\leq 174)=0{,}1005\approx 0{,}10$. Es ist also $k=174$.

Häufig stehen wir auch vor der Frage, dass ein minimales oder maximales $n$, $p$ oder $k$ gesucht ist, so dass eine vorgegebene Wahrscheinlichkeit unter- oder überschritten wird. Dazu suchen wir die zwei benachbarte Einträge in der Wahrscheinlichkeitstabelle, zwischen denen die vorgegebene Wahrscheinlichkeit liegt.

8. Info
Beispiel zur Bestimmung von $n$:

Der Besitzer eines Restaurants untersucht, wie viele Gäste vegetarische Gerichte bestellen. Allgemeine Statistiken zeigen, dass 61% aller Gäste vegetarische Gerichte bestellen. Wie viele Gerichte müssen mindestens untersucht werden, damit die Wahrscheinlichkeit für mindestens 144 vegetarische Gerichte mindestens 29% beträgt?

Gegeben ist $p=0{,}61$ und $k=144$. Gesucht ist das kleinste $n$, so dass $P(X\geq 144)\geq 0{,}29$ ist. Wir bestimmen:

\[\begin{align*} \text{für }n=228 \text{ gilt: } P(X\geq 144)=0{,}2753<0{,}29\\ \text{für }n=229 \text{ gilt: } P(X\geq 144)=0{,}3042\geq 0{,}29 \end{align*}\]

Das kleinste $n$, für das $P(X\geq 144)\geq 0{,}29$ gilt, ist also $n=229$.

9. Info
Beispiel zur Bestimmung von $p$:

Ein Unternehmen untersucht, wie zufrieden seine Mitarbeiter sind. Dazu werden 274 Mitarbeiter befragt. Wie hoch muss der Anteil der zufriedenen Mitarbeiter mindestens sein, damit die Wahrscheinlichkeit für höchstens 142 zufriedene Mitarbeiter höchstens 31% beträgt (auf 2 NKS gerundet)?

Gegeben ist $n=274$ und $k=142$. Gesucht ist das kleinste $p$, so dass $P(X\leq 142)\leq 0{,}31$ ist. Wir bestimmen:

\[\begin{align*} \text{für }p=0{,}53 \text{ gilt: } P(X\leq 142)=0{,}3706>0{,}31\\ \text{für }p=0{,}54 \text{ gilt: } P(X\leq 142)=0{,}2538\leq 0{,}31 \end{align*}\]

Das kleinste $p$, für das $P(X\leq 142)\leq 0{,}31$ gilt, ist also $p=0{,}54$.

10. Info
Beispiel zur Bestimmung von $k$:

Ein potentieller Werbepartner studiert den Bekanntheitsgrad einer Influencerin. An einer Umfrage zum Bekanntheitsgrad der Influencerin nehmen 158 User teil. Man weiß, dass jeder 2. User der Influencerin folgt. Wie viele Follower der Influencerin dürfen höchstens in der Stichprobe vorhanden sein, damit die Wahrscheinlichkeit für mindestens diese Anzahl der Follower der Influencerin mindestens 87% beträgt?

Gegeben ist $n=158$ und $p=0{,}5$. Gesucht ist das größte $k$, so dass $P(X\geq k)\geq 0{,}87$ ist. Wir bestimmen:

\[\begin{align*} \text{Es gilt: } P(X\geq 72)=0{,}8837\geq 0{,}87\\ \text{Es gilt: } P(X\geq 73)=0{,}8495< 0{,}87 \end{align*}\]

Das größte $k$, für das $P(X\geq k)\geq 0{,}87$ gilt, ist also $k=72$.

Erwartungswert und Standardabweichung

Die Formeln

Wir erinnern daran, dass der Erwartungswert den im langfristigen Mittel zu erwartenden Wert einer Zufallsgröße beschreibt und die Standardabweichung ein Maß für deren Schwankung ist. Bei der Binomialverteilung verwenden wir häufig das Symbol $\mu$ für den Erwartungswert und wie gewohnt $\sigma$ für die Standardabweichung.

Die allgemeinen Berechnungsmethoden für Zufallsgrößen vereinfachen sich bei der Binomialverteilung. Es gilt:

\[\mu=n\cdot p\] \[\sigma=\sqrt{n\cdot p\cdot (1-p)}\]

Exkurs: Beweise

Für den Erwartungswert $\mu=E(X)$ gilt:

\[\begin{align*} E(X) &= \sum_{i=0}^n x_i \cdot P(X = x_i) && \text{Definition des Erwartungswerts} \\ &= \sum_{k=0}^n k \cdot P(X = k) && \text{Index umbenannt: } x_i \to k \\ &= \sum_{k=0}^n k \cdot \binom{n}{k} \cdot p^k \cdot (1 - p)^{n - k} && \text{Wahrscheinlichkeit bei Binomialverteilung} \\ &= \sum_{k=0}^n k \cdot \frac{n!}{k! (n - k)!} \cdot p^k \cdot (1 - p)^{n - k} && \text{Binomialkoeffizient ausgeschrieben} \\ &= \sum_{k=1}^n \frac{n \cdot (n - 1)!}{(k - 1)! (n - k)!} \cdot p^k \cdot (1 - p)^{n - k} && \text{Zähler } k = n \cdot \frac{(n - 1)!}{(k - 1)!} \text{ und } k=0 \text{ entfällt, da Summand } 0 \\ &= np \cdot \sum_{k=1}^n \binom{n - 1}{k - 1} \cdot p^{k - 1} \cdot (1 - p)^{n - k} && \text{Faktoren ausgelagert, Umformung in Binomialkoeffizient} \\ &= np \cdot \left( (p+(1-p)\right)^{n - 1} && \text{Binomischer Lehrsatz mit } n-1 \text{ und } k-1 \\ &= np && \text{da } ( p+1-p)^{n - 1} = 1 \end{align*}\]

Der Beweis für die Standardabweichung,

\[\sqrt{n\cdot p\cdot (1-p)}= \sqrt{\sum_{i=1}^{n} (x_i - E(X))^2\cdot P(X=x_i)},\]

ist noch aufwendiger und wird hier übersprungen.

11. Info
Bestimmung von $\mu$ und $\sigma$

Direktes Anwenden der Formeln $\mu=n\cdot p$ und $\sigma=\sqrt{n\cdot p\cdot (1-p)}$.

Kombination der Formeln

In den beiden Gleichungen

\[\mu=n\cdot p \text{ und } \sigma=\sqrt{n\cdot p\cdot (1-p)}\]

werden die vier Größen $n$, $p$, $\mu$ und $\sigma$ miteinander verknüpft. Damit können wir häufig, wenn zwei Werte dieser vier Größen bekannt sind, die Werte der anderen beiden Größen berechnen.

12. Info
Bestimmung von $p$ und $\sigma$

Umstellen der Formeln $\mu=n\cdot p$ und $\sigma=\sqrt{n\cdot p\cdot (1-p)}$.

Beispiel: Polizisten kontrollieren in der Nähe einer Diskothek insgesamt 200 Autofahrer. Sie gehen davon aus, dass unter diesen etwa 25 alkoholisierte Personen am Steuer sitzen. Mit welcher Wahrscheinlichkeit ist ein kontrollierter Autofahrer alkoholisiert? Wie groß ist die Standardabweichung der binomialverteilten Zufallsgröße, die die Anzahl alkoholisierter Fahrer beschreibt?

Gegeben sind $n=200$ und $\mu=25$, gesucht sind $p$ und $\sigma$. Wegen $\mu=n\cdot p$ ist $25=200 \cdot p$ und so $p=\frac{25}{200}=0{,}4$. Dann ist $\sigma=\sqrt{200\cdot 0{,}4\cdot (1-0{,}4)}=6{,}9282$.

13. Info
Bestimmung von $n$ und $\sigma$

Umstellen der Formeln $\mu=n\cdot p$ und $\sigma=\sqrt{n\cdot p\cdot (1-p)}$.

Beispiel: Auf einem gebührenpflichtigen Parkplatz parken erfahrungsgemäß 15 % der Autofahrer ohne gültigen Parkschein. Eine Mitarbeiterin des Ordnungsamts beginnt ihren Dienst mit 12 Überweisungsträgern, die sie bei festgestellten Verstößen hinter die Scheibenwischer der Fahrzeuge legt. Mit wie vielen Fahrzeugen ohne gültigen Parkschein rechnet die Mitarbeiterin an diesem Tag? Wie groß ist die Standardabweichung der binomialverteilten Zufallsgröße, die die Anzahl der Falschparker beschreibt?

Gegeben sind $p=0{,}15$ und $\mu=12$, gesucht sind $n$ und $\sigma$. Wegen $\mu=n\cdot p$ ist $12=n \cdot 0{,}15$ und so $n=\frac{12}{0{,}15}=80$. Dann ist $\sigma=\sqrt{80\cdot 0{,}15\cdot (1-0{,}15)}=3{,}1937$.

14. Info
Bestimmung von $p$ und $\sigma$

Umstellen der Formeln $\mu=n\cdot p$ und $\sigma=\sqrt{n\cdot p\cdot (1-p)}$.

Beispiel: Im Rahmen einer Umfrage vor einer Wahl wurde untersucht, wie viele Wahlberechtigte noch unentschlossen sind. Es wird die Zufallsgröße betrachtet, die die Anzahl der unentschlossenen Wahlberechtigten angibt. Die Auswertung erfolgte mithilfe einer statistischen Software. In der Ergebnisübersicht sind folgende Werte angegeben: $\mu=175$ und $\sigma=10{,}6653$. Wie viele Wahlberechtigte wurden befragt? Mit welcher Wahrscheinlichkeit ist ein zufällig ausgewählter Wahlberechtigter noch unentschlossen?

Gegeben sind $\mu=175$ und $\sigma=10{,}6653$, gesucht sind $n$ und $p$. Wegen $\mu=n\cdot p$ und $\sigma=\sqrt{n\cdot p\cdot (1-p)}$ ist $\sigma=\sqrt{\mu\cdot (1-p)}$. Mit Werten ergibt sich:

\[\begin{align*} 10{,}6653&=\sqrt{175\cdot (1-p)}\quad |()^2\\ 113{,}7486&=175\cdot (1-p)\quad|:175\\ 0{,}65&=1-p\quad\\ p&=0{,}35 \end{align*}\]

Dann ist $n=\frac{175}{0{,}35}=500$.

15. Info
Bestimmung von $n$ und $\mu$

Umstellen der Formeln $\mu=n\cdot p$ und $\sigma=\sqrt{n\cdot p\cdot (1-p)}$.

Beispiel: Eine Maschine produziert ein bestimmtes Bauteil. Erfahrungsgemäß ist etwa jedes zehnte Bauteil fehlerhaft. Bei einer Qualitätskontrolle ergibt sich eine Standardabweichung von $4{,}6476$ für die Anzahl fehlerhafter Bauteile. Wie viele Bauteile wurden kontrolliert? Wie viele fehlerhafte Bauteile werden in der Stichprobe erwartet?

Gegeben sind $p=0{,}1$ und $\sigma=4{,}6476$, gesucht sind $n$ und $\mu$. Wegen $\sigma=\sqrt{n\cdot p\cdot (1-p)}$ ist:

\[\begin{align*} 4{,}6476&=\sqrt{n\cdot 0{,}1\cdot (1-0{,}1)}\quad |()^2\\ 21,6002&=n\cdot 0{,}09\quad |:0{,}09\\ n&=240 \end{align*}\]

Dann ist $\mu=240\cdot 0{,}1=24$.

Umgebungen des Erwartungswerts

Häufig interssieren wir uns dafür, was die “normalen” Werte einer Zufallsgröße sind, welche Werte sie also typischerweise annimmt. Dies lässt sich beispielsweise in folgenden Situationen beobachten:

Wir betrachten beispielhaft die Binomialverteilung mit $n=10$ und $p=0{,}4$:

Was versteht man nun genau unter normalen Werten bzw. dem Normbereich?

Es handelt sich dabei um einen Bereich, in dem die Zufallsgröße mit hoher Wahrscheinlichkeit ihre Werte annimmt. Wie hoch diese Wahrscheinlichkeit genau sein soll, ist nicht allgemein festgelegt. Daher ist die Definition eines Normbereichs in gewissem Sinne subjektiv.

Allgemein gilt: Die größte Wahrscheinlichkeit liegt beim Erwartungswert $\mu = n \cdot p$ vor. Falls $\mu$ nicht ganzzahlig ist, ist einer der benachbarten ganzzahligen Werte am wahrscheinlichsten. Im betrachteten Beispiel liegt der Erwartungswert bei $\mu = 4$ und seine Wahrscheinlichkeit ist $P(X=\mu)=0{,}2508$. Auch die benachbarten Werte treten mit vergleichsweise hoher Wahrscheinlichkeit auf: $P(X=3)=0{,}2150$ und $P(X=5)=0{,}2007$. Ein möglicher Normbereich wäre $[3;5]$, die Zufallsgröße hat mit einer Wahrscheinlichkeit von $0{,}2508 + 0{,}2150 + 0{,}2007=0{,}6665$ ihre Werte in diesem Bereich.

Es gibt verschiedene Möglichkeiten, Umgebungen des Erwartungswerts anzugeben:

  1. Absolute Umgebung
  2. Relative Umgebung
  3. Sigma-Umgebung

Absolute Umgebungen

Eine mögliche Idee ist es, Normbereiche mit Hilfe absoluter Abweichungen vom Erwartungswert anzugeben.

16. Info
Beispiel: $n=25$ und $p=0{,}3$. Wie groß ist die Wahrscheinlichkeit, dass $X$ um höchstens $2$ vom Erwartungswert abweicht?

Wir berechnen $\mu=7{,}5$. Gesucht ist:

\[\begin{align*} P(\mu-2\leq X\leq \mu +2)&=P(7{,}5-2\leq X\leq 7{,}5 +2)\\ &=P(5{,}5\leq X\leq 9{,}5)\\ &=P(6\leq X\leq 9) \\ &=0{,}6171 \end{align*}\]

Alternativ könnten wir auch nach der Wahrscheinlichkeit für ‘nicht-normale’ Werte fragen: Mit welcher Wahrscheinlichkeit weicht $X$ um mehr als $2$ vom Erwartungswert ab (symbolisch: $P(|\mu-X|>2)$)? Dies entspricht dem Gegenereignis zum oben betrachteten Ereignis, daher ist

\[P(|\mu-X|>2)=1-0{,}6171=0{,}3929\]

Relative Umgebungen

Um die Höhe des Erwartungswerts berücksichtigen zu können, betrachten wir nun alternativ eine relative Abweichung vom Erwartungswert.

17. Info
Beispiel: $n=25$ und $p=0{,}3$. Wie groß ist die Wahrscheinlichkeit, dass $X$ um höchstens $10\%$ vom Erwartungswert abweicht?

Wir berechnen $\mu=7{,}5$. Gesucht ist:

\[\begin{align*} P(0{,}9\cdot \mu\leq X\leq 1{,}1\cdot \mu)&=P(0{,}9\cdot 7{,}5\leq X\leq 1{,}1\cdot 7{,}5)\\ &=P(6{,}75\leq X\leq 8{,}25)\\ &=P(7\leq X\leq 8) \\ &=0{,}3363 \end{align*}\]

Alternativ könnten wir auch nach der Wahrscheinlichkeit für ‘nicht-normale’ Werte fragen: Mit welcher Wahrscheinlichkeit weicht $X$ um mehr als $10\%$ vom Erwartungswert ab (symbolisch: $P(|\mu-X|>0{,}1\cdot\mu=0{,}75)$)? Dies entspricht dem Gegenereignis zum oben betrachteten Ereignis, daher ist

\[P(|\mu-X|>0{,}75)=1-0{,}3363=0{,}6637\]

Sigma-Umgebungen

Eine gute Idee ist es, Normbereiche mit Hilfe der Standardabweichung $\sigma$ anzugeben, da $\sigma$ ein Maß für die Schwankung ist: Schwanken die Werte der Zufallsgröße relativ stark, sollte auch der Normbereich relativ groß gefasst werden.

18. Info
Beispiel: $n=25$ und $p=0{,}3$. Wie groß ist die Wahrscheinlichkeit, dass $X$ um höchstens die doppelte Standardabweichung vom Erwartungswert abweicht?

Wir berechnen $\mu=7{,}5$ und $\sigma\approx 2{,}29$. Gesucht ist:

\[\begin{align*} P(\mu-2\sigma\leq X\leq \mu+2\sigma)&=P(7{,}5-2\cdot 2{,}29\leq X\leq 7{,}5+2\cdot 2{,}29)\\ &=P(2{,}92\leq X\leq 12{,}08)\\ &=P(3\leq X\leq 12) \\ &=0{,}9736 \end{align*}\]

Alternativ könnten wir auch nach der Wahrscheinlichkeit für ‘nicht-normale’ Werte fragen: Mit welcher Wahrscheinlichkeit weicht $X$ um mehr als die doppelte Standardabweichung vom Erwartungswert ab (symbolisch: $P(|\mu-X|>2\sigma)$)? Dies entspricht dem Gegenereignis zum oben betrachteten Ereignis, daher ist

\[P(|\mu-X|>2\sigma)=1-0{,}9736=0{,}0264\]

Exkurs: Bedeutung der Standardabweichung

Zur Festlegung von Normbereichen eignen sich Sigma-Umgebungen besser als absolute oder relative Umgebungen.

Um dies zu veranschaulichen, betrachten wir die Umgebungswahrscheinlichkeiten

  1. in Abhängigkeit von $n$ bei festem $p$,
  2. in Abhängigkeit von $p$ bei festem $n$.

Man erkennt, dass die Umgebungswahrscheinlichkeiten bei absoluten und relativen Umgebungen stark von $n$ und $p$ abhängen. Im Gegensatz dazu bleiben die Wahrscheinlichkeiten bei Sigma-Umgebungen vergleichsweise konstant.

In diesem Zusammenhang gelten die sogenannten Sigma-Regeln: Die Wahrscheinlichkeiten für die Sigma-Umgebungen konvergieren für $n\to\infty$ gegen folgende Werte:

Als Faustregel hat sich die sogenannte Laplace-Bedingung etabliert. Sie besagt, dass für $\sigma>3$ die Sigma-Regeln angewendet werden können.

Eine weitere tiefe theoretische Begründung für die Bedeutung der Standardabweichung: Die Binomialverteilung konvergiert für $n\to\infty$ gegen die Normalverteilung (die sogenannte ‘Glockenkurve’). Die Normalverteilung hat ihr Maximum beim Erwartungswert $\mu$ und ihre Wendestellen gerade bei $\mu-\sigma$ und $\mu+\sigma$.

Login

Melde dich mit deinem Account an

Noch kein Account? Jetzt registrieren