Zusammenfassung - Vertrauensintervalle für Wahrscheinlichkeiten
Die Ausgangssituation
Wenn Forscher untersuchen wollen, wie groß der Anteil in einer großen Grundgesamtheit ist, der eine bestimmte Eigenschaft hat (z. B. eine bestimmte Partei wählen wollen), dann befragen sie nicht alle Mitglieder dieser Grundgesamtheit, sondern nur stichprobenartig eine Teilmenge dieser Grundgesamtheit. Sie versuchen dann, aus dem empirisch ermittelten Anteil in der Stichprobe auf den unbekannten Anteil in der Grundgesamtheit zu schließen.
Wenn die Grundgesamtheit viel größer als die betrachtete Teilmenge ist, dann kann die Befragung als Bernoulli-Kette angesehen werden, wobei die betrachtete Eigenschaft als Treffer gewertet wird. Folgende Frage ergibt sich dann:
Leitfrage
Wie können bei Bernoulli-Ketten mit unbekannter Trefferwahrscheinlichkeit aus einer gegebenen Trefferhäufigkeit bei einer Durchführung der Bernoulli-Kette möglichst verlässliche Intervalle für die Trefferwahrscheinlichkeit bestimmt werden?
Vertrauensintervalle experimentell ermitteln
Wir gehen von folgender Situation aus:
- Wir betrachten eine Bernoulli-Kette mit bekannter Länge
(z. B.: ) und unbekannter Trefferwahrscheinlichkeit . - Bei einer Durchführung der Bernoulli-Kette wird eine absolute Trefferhäufigkeit
erhalten (z. B.: ). - Mit Hilfe der Trefferhäufigkeit
möchten wir die unbekannte Trefferwahrscheinlichkeit abschätzen. - Die Sicherheitswahrscheinlichkeit soll dabei einen vorgegebenen Standardwert betragen (z. B.
).
Zum Herunterladen: vertrauensintervalle1.ggb
Eine Punktabschätzung für die Trefferwahrscheinlichkeit
Hier gilt:
Bei einer Intervallabschätzung für die Trefferwahrscheinlichkeit wird ein Bereich für die Trefferwahrscheinlichkeit bestimmt, für den die betrachtete Trefferhäufigkeit nicht unwahrscheinlich ist.
Dabei wird von einer vorgegebenen Sicherheitswahrscheinlichkeit (wie z. B.
Ein Wert für
Das Vertrauensintervall (auch Konfidenzintervall genannt) zur betrachteten Häufigkeit
Die folgende Tabelle verdeutlicht
betrachteter | Verträglichkeit von | |
---|---|---|
Somit erhalten wir folgendes
Vertrauensintervalle rechnerisch bestimmen
Ein Vertrauensintervall für
Es werden dann Prognoseintervalle für die relative Trefferhäufigkeit
Zum Herunterladen: vertrauensintervalle2.ggb
Wir betrachten weiterhin eine Sicherheitswahrscheinlichkeit von
Für den maximalen Wert für
Analog gilt für den minimalen Wert für
Das Auflösen dieser Gleichungen nach
Zum Herunterladen: vertrauensintervalle3_cas.ggb
Mit dem Gleichungslösungstool erhalten wir folgendes
Beachte, dass hier gerundete Werte benutzt werden, die dazu führen können, dass die Grenzen nicht genau mit den experimentell ermittelten übereinstimmen.
Vertrauensintervalle vergleichen
Eine Schätzung der Trefferhäufigkeit
Stichprobenumfang | relative Trefferhäufigkeit | |
---|---|---|
Wie zu erwarten wird die Schätzung immer genauer (bei gegebener relativer Trefferhäufigkeit), je größer der Stichprobenumfang
Oft ist umgekehrt zur Abschätzung einer vorgegebenen maximalen Abweichung (von z. B.
Ausgangspunkt ist diese Bedingung:
Quadrieren liefert:
Auflösen nach
Es gilt
Für
Bei einem Stichprobenumfang