i

Zusammenfassung - Prognoseintervalle für Häufigkeiten

Die Ausgangssituation

Folgende Situation betrachten wir hier: Ein Zufallsexperiment soll wiederholt, unter gleichen Bedingungen, durchgeführt werden. Wir möchten eine Prognose darüber machen, wie häufig ein bestimmtes Ereignis dabei eintritt. Wir gehen hier davon aus, dass die Anzahl $n$ der Wiederholungen und die Wahrscheinlichkeit $p$ des Ergebnisses bekannt sind.

Eine erste grobe Punktschätzung über die zu erwartende absolute Häufigkeit wird durch die Berechnung des Produkts $n \cdot p$ erhalten.

Betrachte das 120-fache Werfen eines Standardwürfels. Als Treffer wird die Augenzahl $6$ angesehen. Es ist zu erwarten, dass in dieser Würfelserie etwa $120 \cdot \frac{1}{6} = 20$ Treffer vorkommen.

Solche Punktschätzungen liefern erste grobe Anhaltspunkte für erwartete absolute Häufigkeiten. Sie liefern aber keine Information über die zu erwartenden – und in der Praxis zu beobachteten – Schwankungen der Häufigkeiten.

Ziel ist es hier, präzise Aussagen über erwartete Schwankungen mit Hilfe von Prognoseintervallen zu treffen.

Für die Herleitung solcher präzisen Aussagen ist es günstig, die wiederholte Durchführung des Zufallsexperiments als Bernoulli-Kette mit den Parametern $n$ (Anzahl der Wiederholungen) und $p$ (Wahrscheinlichkeit des betrachteten Ergebnisses) anzusehen. Wir gehen hier davon aus, dass diese beiden Parameter bekannt sind. Als Treffer gilt das betrachtete Ereignis beim Zufallsexperiment. Mit der Zufallsgröße $X$ beschreiben wir die absolute Trefferhäufigkeit bei dieser Bernoulli-Kette.

Die zu klärende Fragestellung können wir jetzt so formulieren:

Leitfrage

In welchen Bereichen werden voraussichtlich die absoluten und relativen Trefferhäufigkeiten bei Bernoulli-Ketten liegen?

Schätzung absoluter Häufigkeiten

Absolute Trefferhäufigkeiten werden mit Hilfe der Zufallsgröße $X$ (für die Anzahl der Treffer) erfasst.

Als Beispiel betrachten wir wieder das 120-fache Werfen eines Standardwürfels. Als Treffer wird die Augenzahl $6$ angesehen. Die Prognoseintervalle für gängige vorgegebene Sicherheitswahrscheinlichkeiten können mit folgendem Applet bestimmt werden:

Zum Herunterladen: prognoseintervalle4.ggb

Für vorgegebene Wahrscheinlichkeiten werden folgende Prognoseintervalle erhalten:

Sicherheitswahrscheinlichkeit Prognoseintervall
$89.02\%$ $13.3047 \leq X \leq 26.6953$
$96.37\%$ $11.9983 \leq X \leq 28.0017$
$99.02\%$ $9.4672 \leq X \leq 30.5328$

Die Werte können wie folgt gedeutet werden: In ca. $99\%$ aller Würfelserien mit $120$ Würfelwürfen liegt das Trefferergebnis $6$ im Prognoseintervall $9, \cdots , 31$.

Prognoseintervalle für absolute Trefferhäufigkeiten werden meist mit Hilfe des Erwartungswerts $\mu = E(X)$ und Vielfachen der Standardabweichung $\sigma = \sigma(X)$ beschrieben:

$r\sigma$-Prognoseintervall für die absolute Trefferhäufigkeit:

$\mu - r \cdot \sigma \leq X \leq \mu + r \cdot \sigma$

Die Vielfachen von $\sigma$ werden so gewählt, dass die Wahrscheinlichkeit der Prognoseintervalle ganz bestimmte Werte annimmt – die sogenannten Sicherheitswahrscheinlichkeiten.

$P(\mu - r \cdot \sigma \leq X \leq \mu - r \cdot \sigma)$ $r \cdot \sigma$
$90\%$ $1.64 \cdot \sigma$
$95\%$ $1.96 \cdot \sigma$
$99\%$ $2.58 \cdot \sigma$

Beachte, dass es sich hierbei nur um Näherungswerte handelt, die umso besser passen, je größer der Parameter $n$ der Binomialverteilung ist.

Für Würfelserien mit $120$ Würfelwürfen und dem Trefferergebnis $6$ wird für die Sicherheitswahrscheinlichkeit von $99\%$ das Prognoseintervall $9, \cdots , 31$ für die absolute Trefferhäufigkeit erhalten.

Schätzung relativer Häufigkeiten

Relative Trefferhäufigkeiten werden erhalten, indem absolute Trefferhäufigkeiten durch die Länge $n$ der Bernoulli-Kette dividiert werden.

Für Würfelserien mit $120$ Würfelwürfen und dem Trefferergebnis $6$ werden z.B. folgende Prognoseintervalle erhalten:

$99\%$-Prognoseintervall für die absolute Trefferhäufigkeit:

$9.4672 \leq X \leq 30.5328$

$99\%$-Prognoseintervall für die relative Trefferhäufigkeit:

$\frac{9.4672}{120} \approx 0.0789 \leq \frac{X}{120} \leq 0.2544 \approx \frac{30.5328}{120}$

Mit dem folgenden Applet kannst du auch andere Beispielrechnungen durchführen.

Zum Herunterladen: prognoseintervalle5.ggb

Im Applet wird die Struktur der Prognoseintervalle mit Hilfe des Erwartungswerts und Vielfachen der Standardabweichung verdeutlicht.

$r\sigma$-Prognoseintervall für die absolute Trefferhäufigkeit:

$\mu - r \cdot \sigma \leq X \leq \mu + r \cdot \sigma$

$r\sigma$-Prognoseintervall für die relative Trefferhäufigkeit:

$\frac{\mu}{n} - r \cdot \frac{\sigma}{n} \leq \frac{X}{n} \leq \frac{\mu}{n} + r \cdot \frac{\sigma}{n}$

Mit den Formeln für den Erwartungswert und die Standardabweichung bei binomialverteilten Zufallsgrößen folgt:

$\frac{\mu}{n} = \frac{n \cdot p}{n} = p$

$\frac{\sigma}{n} = \frac{\sqrt{n \cdot p\cdot(1-p)}}{n} = \frac{\sqrt{n} \cdot \sqrt{p\cdot(1-p)}}{\sqrt{n}\cdot\sqrt{n}} = \frac{\sqrt{p\cdot(1-p)}}{\sqrt{n}}$

Hieraus ergibt sich:

$r\sigma$-Prognoseintervall für die relative Trefferhäufigkeit:

$p - r \cdot \frac{\sqrt{p\cdot(1-p)}}{\sqrt{n}} \leq \frac{X}{n} \leq p + r \cdot \frac{\sqrt{p\cdot(1-p)}}{\sqrt{n}}$

Da $r$ bei einer vorgegebenen Sicherheitswahrscheinlichkeit und $p$ bei einer vorgegebenen Bernoulli-Kette feste Zahlen sind, wird ein Prognoseintervall erhalten, dessen Breite umgekehrt proportional zur Wurzel aus der Länge $n$ der Bernoulli-Kette ist.

Die Breite des $r\sigma$-Prognoseintervalls für die relative Trefferhäufigkeit ist umgekehrt proportional zur Wurzel aus der Länge $n$ der betrachteten Bernoulli-Kette.

Es gilt demnach: Wird die Länge $n$ der Versuchsreihe vervierfacht, dann halbiert sich die Breite des $\dots\%$-Prognoseintervalls für die relative Trefferhäufigkeit.

Im folgenden Applet wird dieser Zusammenhang mit Hilfe des $\frac{1}{\sqrt{n}}$-Trichters verdeutlicht.

Zum Herunterladen: prognoseintervalle3.ggb

Für die praktische Durchführung von Versuchsreihen bedeutet das: Soll ein Prognoseintervall für relative Häufigkeiten halbiert werden, muss die Versuchsreihe 4-mal so lang gewählt werden.

Einschätzung relativer Häufigkeiten

Wie wird mit den Ergebnissen von Versuchsreihen umgegangen, die als eher ungewöhnlich erscheinen?

Mit den Sicherheitswahrscheinlichkeiten und den dazugehörigen Prognoseintervallen wird eine Möglichkeit erhalten, um Ergebnisse realer Versuchsreihen einzuschätzen.

Bei einer Würfelserien mit einem Standardwürfel mit $120$ Würfelwürfen wird 11-mal die $3$ und 33-mal die $4$ geworfen. Für beide Augenzahlen ist eine absolute Häufigkeit von etwa 20 zu erwarten. Stimmt hier etwas nicht mit dem Standardwürfel?

Zum Herunterladen: wuerfelnSWVersuchsreihe1.ggb

Zur Einschätzung dieser Ergebnisse betrachten wir die bereits ermittelten Prognoseintervalle für eine Bernoulli-Kette mit $n = 120$ und $p = \frac{1}{6}$.

Sicherheitswahrscheinlichkeit Prognoseintervall
$89.02\%$ $13.3047 \leq X \leq 26.6953$
$96.37\%$ $11.9983 \leq X \leq 28.0017$
$99.02\%$ $9.4672 \leq X \leq 30.5328$

Das Ergebnis „11-mal die $2$“ liegt im $96\%$-Prognoseintervall. Das Ergebnis „33-mal die $4$“ liegt dagegen außerhalb des $99\%$-Prognoseintervalls.

Beide Ergebnisse sind durchaus möglich. Das Ergebnis „33-mal die $4$“ würde aber als signifikante Abweichung (auf dem $99\%$-Niveau) von den Erwartungen bezeichnt werden. Hier sind dann durchaus Zweifel angebracht, dass es sich um bei dem benutzten Würfel um einen Standardwürfel mit $P(4) = \frac{1}{6}$ handelt.

Suche

v
6.7.1.6
o-mathe.de/stochastik/schaetzen/haeufigkeiten/zusammenfassung
o-mathe.de/6.7.1.6

Rückmeldung geben