o-mathe | Schätzen von Häufigkeiten » Zusammenfassung - Prognoseintervalle für Häufigkeiten

Zusammenfassung - Prognoseintervalle für Häufigkeiten

Die Ausgangssituation

Folgende Situation betrachten wir hier: Ein Zufallsexperiment soll wiederholt, unter gleichen Bedingungen, durchgeführt werden.

Wir möchten eine Prognose darüber machen, wie häufig ein bestimmtes Ereignis dabei eintritt.

Wir gehen hier davon aus, dass die Anzahl $n$ der Wiederholungen und die Wahrscheinlichkeit $p$ des Ergebnisses bekannt sind.

Punktschätzung

Eine erste grobe Punktschätzung über die zu erwartende absolute Häufigkeit erhalten wir durch die Berechnung des Produkts $n \cdot p$.

Betrachte das 120-fache Werfen eines Standardwürfels. Als Treffer wird die Augenzahl $6$ angesehen. Es ist zu erwarten, dass in dieser Würfelserie etwa $120 \cdot \frac{1}{6} = 20$ Treffer vorkommen.

Solche Punktschätzungen liefern erste grobe Anhaltspunkte für erwartete absolute Häufigkeiten. Sie liefern aber keine Information über die zu erwartenden – und in der Praxis zu beobachteten – Schwankungen der Häufigkeiten.

Ziel ist es, hier präzise Aussagen über erwartete Schwankungen mit Hilfe von Prognoseintervallen zu treffen.

Für die Herleitung solcher präziser Aussagen ist es günstig, die wiederholte Durchführung des Zufallsexperiments als Bernoulli-Kette mit den Parametern $n$ (Anzahl der Wiederholungen) und $p$ (Wahrscheinlichkeit des betrachteten Ergebnisses) anzusehen.

Wir gehen hier davon aus, dass diese beiden Parameter bekannt sind. Als Treffer gilt das betrachtete Ereignis beim Zufallsexperiment. Mit der Zufallsgröße $X$ beschreiben wir die absolute Trefferhäufigkeit bei dieser Bernoulli-Kette.

Die zu klärende Fragestellung können wir jetzt so formulieren:

Leitfrage

In welchen Bereichen werden voraussichtlich die absoluten und relativen Trefferhäufigkeiten bei Bernoulli-Ketten liegen?

Schätzung absoluter Häufigkeiten

Absolute Trefferhäufigkeiten werden mit Hilfe der Zufallsgröße $X$ (für die Anzahl der Treffer) erfasst.

Beispiel

Als Beispiel betrachten wir wieder das 120-fache Werfen eines Standardwürfels. Als Treffer wird die Augenzahl $6$ angesehen. Die Prognoseintervalle für gängige vorgegebene Sicherheitswahrscheinlichkeiten können mit folgendem Applet bestimmt werden:

Zum Herunterladen: prognoseintervalle4.ggb

Für vorgegebene Wahrscheinlichkeiten erhalten wir folgende Prognoseintervalle:

Sicherheitswahrscheinlichkeit	Prognoseintervall
$89.02\%$	$13.3047 \leq X \leq 26.6953$
$96.37\%$	$11.9983 \leq X \leq 28.0017$
$99.02\%$	$9.4672 \leq X \leq 30.5328$

Die Werte können wie folgt gedeutet werden: In ca. $99\%$ aller Würfelserien mit $120$ Würfelwürfen liegt das Trefferergebnis $6$ im Prognoseintervall $9, \cdots , 31$.

Wir können solche Prognoseintervalle exakt berechnen, dazu nutzen wir meist die kumulierte Binomialverteilung.

Faustformeln für Prognoseintervalle

Neben der exakten Berechnung mithilfe der Binomialverteilung kann man auch rein aus den Kennwerten – dem Erwartungswerts $\mu = E(X)$ und der Standardabweichung $\sigma = \sigma(X)$ – Intervalle angeben. Diese beschreiben dann Näherungswerte.

$r\sigma$-Prognoseintervalle für absolute Häufigkeiten

Bei ausreichend großer Standardabweichung kann man für jedes Vielfache der Standardabweichung angeben, mit welcher Wahrscheinlichkeit die Trefferzahl maximal so weit vom Erwartungswert entfernt liegen wird.

Mit anderen Worten: Wir erhalten für jedes $r$ eine Wahrscheinlichkeit dafür, dass

$\mu - r \cdot \sigma \leq X \leq \mu + r \cdot \sigma$

Die Vielfachen von $\sigma$ werden so gewählt, dass die Wahrscheinlichkeit der Prognoseintervalle ganz bestimmte Werte annimmt – die sogenannten Sicherheitswahrscheinlichkeiten.

$P(\mu - r \cdot \sigma \leq X \leq \mu + r \cdot \sigma)$	$r \cdot \sigma$
$90\%$	$1.64 \cdot \sigma$
$95\%$	$1.96 \cdot \sigma$
$99\%$	$2.58 \cdot \sigma$

Beachte, dass es sich hierbei nur um Näherungswerte handelt, die umso besser passen, je größer der Parameter $n$ der Binomialverteilung ist. In der Regel nutzt man folgende Bedingung für die Anwendung der Faustformeln:

Laplace-Bedingung

Die Faustformeln auf dieser Seite gelten, wenn die Standardabweichung größer ist als 3.

Beispiel

Für Würfelserien mit $120$ Würfelwürfen und dem Trefferergebnis $6$ wird für die Sicherheitswahrscheinlichkeit von $99\%$ das Prognoseintervall $9, \cdots , 31$ für die absolute Trefferhäufigkeit erhalten.

Schätzung relativer Häufigkeiten

Relative Trefferhäufigkeiten erhalten wir, indem wir absolute Trefferhäufigkeiten durch die Länge $n$ der Bernoulli-Kette dividieren.

Beispiel

Für Würfelserien mit $120$ Würfelwürfen und dem Trefferergebnis $6$ werden z. B. folgende Prognoseintervalle erhalten:

$99\%$-Prognoseintervall für die absolute Trefferhäufigkeit:

$9.4672 \leq X \leq 30.5328$

$99\%$-Prognoseintervall für die relative Trefferhäufigkeit:

$\frac{9.4672}{120} \approx 0.0789 \leq \frac{X}{120} \leq 0.2544 \approx \frac{30.5328}{120}$

Mit dem folgenden Applet kannst du auch andere Beispielrechnungen durchführen.

Zum Herunterladen: prognoseintervalle5.ggb

Im Applet wird die Struktur der Prognoseintervalle mit Hilfe des Erwartungswerts und Vielfachen der Standardabweichung verdeutlicht.

$r\sigma$-Prognoseintervall für die relative Trefferhäufigkeit

Teilt man die Faustregeln oben durch die Wiederholungszahl $n$ erhält man Intervalle der Form:

$\frac{\mu}{n} - r \cdot \frac{\sigma}{n} \leq \frac{X}{n} \leq \frac{\mu}{n} + r \cdot \frac{\sigma}{n}$

Für diese gelten dieselben Faustregeln, solange die Laplace-Bedingung erfüllt ist.

Mit den Formeln für den Erwartungswert und die Standardabweichung bei binomialverteilten Zufallsgrößen folgt:

$\frac{\mu}{n} = \frac{n \cdot p}{n} = p$

$\frac{\sigma}{n} = \frac{\sqrt{n \cdot p\cdot(1-p)}}{n} = \frac{\sqrt{n} \cdot \sqrt{p\cdot(1-p)}}{\sqrt{n}\cdot\sqrt{n}} = \frac{\sqrt{p\cdot(1-p)}}{\sqrt{n}}$

Hieraus ergibt sich:

$r\sigma$-Prognoseintervall für die relative Trefferhäufigkeit (vereinfacht)

Die $r\sigma$-Prognoseintervalle für die relative Trefferhäufigkeit lässt sich auch so berechnen:

$p - r \cdot \frac{\sqrt{p\cdot(1-p)}}{\sqrt{n}} \leq \frac{X}{n} \leq p + r \cdot \frac{\sqrt{p\cdot(1-p)}}{\sqrt{n}}$

Da $r$ bei einer vorgegebenen Sicherheitswahrscheinlichkeit und $p$ bei einer vorgegebenen Bernoulli-Kette feste Zahlen sind, erhalten wir ein Prognoseintervall, dessen Breite umgekehrt proportional zur Wurzel aus der Länge $n$ der Bernoulli-Kette ist.

Die Breite des $r\sigma$-Prognoseintervalls für die relative Trefferhäufigkeit ist umgekehrt proportional zur Wurzel aus der Länge $n$ der betrachteten Bernoulli-Kette.

Es gilt demnach: Wird die Länge $n$ der Versuchsreihe vervierfacht, dann halbiert sich die Breite des $\dots\%$-Prognoseintervalls für die relative Trefferhäufigkeit.

Im folgenden Applet wird dieser Zusammenhang mit Hilfe des $\frac{1}{\sqrt{n}}$-Trichters verdeutlicht.

Zum Herunterladen: prognoseintervalle3.ggb

Für die praktische Durchführung von Versuchsreihen bedeutet das:

Soll ein Prognoseintervall für relative Häufigkeiten halbiert werden, muss die Versuchsreihe 4-mal so lang gewählt werden.

Einschätzung relativer Häufigkeiten

Leitfrage

Wie gehen wir mit den Ergebnissen von Versuchsreihen um, die eher ungewöhnlich erscheinen?

Mit den Sicherheitswahrscheinlichkeiten und den dazugehörigen Prognoseintervallen erhalten wir eine Möglichkeit, um Ergebnisse realer Versuchsreihen einzuschätzen.

Beispiel

Bei einer Würfelserien mit einem Standardwürfel mit $120$ Würfelwürfen wird 11-mal die $3$ und 33-mal die $4$ geworfen. Für beide Augenzahlen ist eine absolute Häufigkeit von etwa 20 zu erwarten. Stimmt hier etwas nicht mit dem Standardwürfel?

Zum Herunterladen: wuerfelnSWVersuchsreihe1.ggb

Zur Einschätzung dieser Ergebnisse betrachten wir die bereits ermittelten Prognoseintervalle für eine Bernoulli-Kette mit $n = 120$ und $p = \frac{1}{6}$.

Sicherheitswahrscheinlichkeit	Prognoseintervall
$89.02\%$	$13.3047 \leq X \leq 26.6953$
$96.37\%$	$11.9983 \leq X \leq 28.0017$
$99.02\%$	$9.4672 \leq X \leq 30.5328$

Das Ergebnis „11-mal die $2$“ liegt im $96\%$-Prognoseintervall. Das Ergebnis „33-mal die $4$“ liegt dagegen außerhalb des $99\%$-Prognoseintervalls.

Beide Ergebnisse sind durchaus möglich.

Das Ergebnis „33-mal die $4$“ würden wir aber als signifikante Abweichung (auf dem $99\%$-Niveau) von den Erwartungen bezeichnen. Hier sind dann durchaus Zweifel angebracht, dass es sich um bei dem benutzten Würfel um einen Standardwürfel mit $P(4) = \frac{1}{6}$ handelt.

Zusammenfassung - Prognoseintervalle für Häufigkeiten

Die Ausgangssituation

Punktschätzung

Leitfrage

Schätzung absoluter Häufigkeiten

Beispiel

Faustformeln für Prognoseintervalle

$r\sigma$-Prognoseintervalle für absolute Häufigkeiten

Laplace-Bedingung

Beispiel

Schätzung relativer Häufigkeiten

Beispiel

$r\sigma$-Prognoseintervall für die relative Trefferhäufigkeit

$r\sigma$-Prognoseintervall für die relative Trefferhäufigkeit (vereinfacht)

Einschätzung relativer Häufigkeiten

Leitfrage

Beispiel

Suche

Rückmeldung geben