Zusammenfassung - Vertrauensintervalle für Wahrscheinlichkeiten
Die Ausgangssituation
Wenn Forscher untersuchen wollen, wie groß der Anteil in einer großen Grundgesamtheit ist, der eine bestimmte Eigenschaft hat (z. B. eine bestimmte Partei wählen wollen), dann befragen sie nicht alle Mitglieder dieser Grundgesamtheit, sondern nur stichprobenartig eine Teilmenge dieser Grundgesamtheit. Sie versuchen dann, aus dem empirisch ermittelten Anteil in der Stichprobe auf den unbekannten Anteil in der Grundgesamtheit zu schließen.
Wenn die Grundgesamtheit viel größer als die betrachtete Teilmenge ist, dann kann die Befragung als Bernoulli-Kette angesehen werden, wobei die betrachtete Eigenschaft als Treffer gewertet wird. Folgende Frage ergibt sich dann:
Leitfrage
Wie können bei Bernoulli-Ketten mit unbekannter Trefferwahrscheinlichkeit aus einer gegebenen Trefferhäufigkeit bei einer Durchführung der Bernoulli-Kette möglichst verlässliche Intervalle für die Trefferwahrscheinlichkeit bestimmt werden?
Vertrauensintervalle experimentell ermitteln
Wir gehen von folgender Situation aus:
- Wir betrachten eine Bernoulli-Kette mit bekannter Länge $n$ (z. B.: $n = 100$) und unbekannter Trefferwahrscheinlichkeit $p$.
- Bei einer Durchführung der Bernoulli-Kette wird eine absolute Trefferhäufigkeit $X = k$ erhalten (z. B.: $X = 63$).
- Mit Hilfe der Trefferhäufigkeit $X = k$ möchten wir die unbekannte Trefferwahrscheinlichkeit $p$ abschätzen.
- Die Sicherheitswahrscheinlichkeit soll dabei einen vorgegebenen Standardwert betragen (z. B. $95\%$).
Zum Herunterladen: vertrauensintervalle1.ggb
Eine Punktabschätzung für die Trefferwahrscheinlichkeit $p$ folgt direkt aus der relativen Trefferhäufigkeit $\frac{X}{n}$:
$p = \frac{k}{n}$
Hier gilt: $p = \frac{k}{n} = \frac{63}{100} = 0.63$
Bei einer Intervallabschätzung für die Trefferwahrscheinlichkeit
wird ein Bereich für die Trefferwahrscheinlichkeit bestimmt, für den die betrachtete Trefferhäufigkeit nicht unwahrscheinlich ist.
Dabei wird von einer vorgegebenen Sicherheitswahrscheinlichkeit (wie z. B. $95\%)$ ausgegangen.
Ein Wert für $p$ heißt verträglich mit der betrachteten Häufigkeit $X = k$, wenn die betrachtete Häufigkeit $X = k$ im Prognoseintervall (zur vorgegebenen Sicherheitswahrscheinlichkeit) liegt.
Das Vertrauensintervall (auch Konfidenzintervall genannt) zur betrachteten Häufigkeit $X = k$ umfasst alle Werte für $p$, die mit $X = k$ (für die vorgegebene Sicherheitswahrscheinlichkeit) verträglich sind.
Die folgende Tabelle verdeutlicht $95\%$-Prognoseintervalle für die absolute Trefferhäufigkeit $X$ und ermittelt jeweils, ob die betrachtete Trefferhäufigkeit $X = 63$ in diesem Intervall liegt.
betrachteter $p$-Wert | $95\%$-Prognoseintervall für die Trefferhäufigkeit $X$ | Verträglichkeit von $p$ mit $X = k$ |
---|---|---|
$p = 0.53$ | $44 \leq X \leq 62$ | $X = 63$ liegt nicht im $95\%$-Prognoseintervall |
$p = 0.54$ | $45 \leq X \leq 63$ | $X = 63$ liegt im $95\%$-Prognoseintervall |
$\dots$ | ||
$p = 0.71$ | $63 \leq X \leq 79$ | $X = 63$ liegt im $95\%$-Prognoseintervall |
$p = 0.72$ | $64 \leq X \leq 80$ | $X = 63$ liegt nicht im $95\%$-Prognoseintervall |
Somit erhalten wir folgendes $95\%$-Vertrauensintervall für $p$ zur Trefferhäufigkeit $X = 63$:
$0.54 \leq p \leq 0.71$
Vertrauensintervalle rechnerisch bestimmen
Ein Vertrauensintervall für $p$ zur Trefferhäufigkeit $X = k$ kann auch mit Hilfe der relativen Trefferhäufigkeit $\frac{k}{n}$ bestimmt werden.
Es werden dann Prognoseintervalle für die relative Trefferhäufigkeit $\frac{X}{n}$ verwendet.
Das Vorgehen ist völlig analog zum Vorgehen mit absoluten Trefferhäufigkeiten.
Zum Herunterladen: vertrauensintervalle2.ggb
Wir betrachten weiterhin eine Sicherheitswahrscheinlichkeit von $95\%$. Für diese Sicherheitswahrscheinlichkeit können die Prognoseintervalle für die relative Trefferhäufigkeit so abgeschätzt werden:
$p - 1.96 \sqrt{\frac{p\cdot(1-p)}{n}} \leq \frac{X}{n} \leq p + 1.96 \sqrt{\frac{p\cdot(1-p)}{n}} \leq \frac{X}{n}$
Für den maximalen Wert für $p$, für den die relative Häufigkeit $0.63$ noch im $95\%$-Prognoseintervall liegt, gilt (näherungsweise) folgende Gleichung:
$p - 1.96 \sqrt{\frac{p\cdot(1-p)}{n}} = 0.63$
Analog gilt für den minimalen Wert für $p$, für den die relative Häufigkeit $0.63$ noch im $95\%$-Prognoseintervall liegt, (näherungsweise) folgende Gleichung:
$p + 1.96 \sqrt{\frac{p\cdot(1-p)}{n}} = 0.63$
Das Auflösen dieser Gleichungen nach $p$ liefert (näherungsweise) die Grenzen des $95\%$-Vertrauensintervall für $p$.
Zum Herunterladen: vertrauensintervalle3_cas.ggb
Mit dem Gleichungslösungstool erhalten wir folgendes $95\%$-Vertrauensintervall für $p$ zur Trefferhäufigkeit $X = 63$:
$0.53 \leq p \leq 0.72$
Beachte, dass hier gerundete Werte benutzt werden, die dazu führen können, dass die Grenzen nicht genau mit den experimentell ermittelten übereinstimmen.
Vertrauensintervalle vergleichen
Eine Schätzung der Trefferhäufigkeit $p$ ist umso besser, je kleiner die Breite des Vertrauensintervalls für $p$ ist. Mit dem Gleichungslösungstool oben können folgende $95\%$-Vertrauensintervalle für $p$ zur Trefferhäufigkeit $X = 63$ bestimmt werden:
Stichprobenumfang $n$ | relative Trefferhäufigkeit $\frac{X}{n}$ | $95\%$-Vertrauensintervall für die Trefferwahrscheinlichkeit $p$ |
---|---|---|
$n = 100$ | $\frac{X}{n} = 0.63$ | $0.53 \leq p \leq 0.72$ |
$n = 200$ | $\frac{X}{n} = 0.63$ | $0.56 \leq p \leq 0.69$ |
$n = 400$ | $\frac{X}{n} = 0.63$ | $0.58 \leq p \leq 0.68$ |
$n = 800$ | $\frac{X}{n} = 0.63$ | $0.60 \leq p \leq 0.66$ |
$\dots$ | $\dots$ | $\dots$ |
$n = 3200$ | $\frac{X}{n} = 0.63$ | $0.61 \leq p \leq 0.65$ |
Wie zu erwarten wird die Schätzung immer genauer (bei gegebener relativer Trefferhäufigkeit), je größer der Stichprobenumfang $n$ ist.
Oft ist umgekehrt zur Abschätzung einer vorgegebenen maximalen Abweichung (von z. B. $1\%$ ) eine Abschätzung des erforderlichen Stichprobenumfangs interessant.
Ausgangspunkt ist diese Bedingung:
$1.96 \sqrt{\frac{p\cdot(1-p)}{n}} \leq 0.01$
Quadrieren liefert:
$1.96^2 \frac{p\cdot(1-p)}{n} \leq 0.01^2$
Auflösen nach $n$ ergibt:
$n \geq \frac{1.96^2}{0.01^2} \cdot p \cdot (1-p)$
Es gilt $p \cdot (1-p) \leq 0.25$ (für alle $p$ mit $0 \leq p \leq 1$). Also:
$\frac{1.96^2}{0.01^2} \cdot \underbrace{p \cdot (1-p)}_{\leq 0.25} \leq \frac{1.96^2}{0.01^2} \cdot 0.25 = 9604$
Für $n = 9604$ gilt demnach:
$n = \underbrace{\frac{1.96^2}{0.01^2} \cdot 0.25}_{9604} \geq \frac{1.96^2}{0.01^2} \cdot p \cdot (1-p) $
Bei einem Stichprobenumfang $n \geq 9604$ kann also davon ausgegangen werden, dass die unbekannte Trefferwahrscheinlichkeit $p$ mit einem $95\%$-Vertrauensintervall bis auf $1\%$ genau abgeschätzt wird.