i

Zusammenfassung - Vertrauensintervalle für Wahrscheinlichkeiten

Die Ausgangssituation

Wenn Forscher untersuchen wollen, wie groß der Anteil in einer großen Grundgesamtheit ist, der eine bestimmte Eigenschaft hat (z. B. eine bestimmte Partei wählen wollen), dann befragen sie nicht alle Mitglieder dieser Grundgesamtheit, sondern nur stichprobenartig eine Teilmenge dieser Grundgesamtheit. Sie versuchen dann, aus dem empirisch ermittelten Anteil in der Stichprobe auf den unbekannten Anteil in der Grundgesamtheit zu schließen.

Stichprobe -> Grundgesamtheit

Wenn die Grundgesamtheit viel größer als die betrachtete Teilmenge ist, dann kann die Befragung als Bernoulli-Kette angesehen werden, wobei die betrachtete Eigenschaft als Treffer gewertet wird. Folgende Frage ergibt sich dann:

Leitfrage

Wie können bei Bernoulli-Ketten mit unbekannter Trefferwahrscheinlichkeit aus einer gegebenen Trefferhäufigkeit bei einer Durchführung der Bernoulli-Kette möglichst verlässliche Intervalle für die Trefferwahrscheinlichkeit bestimmt werden?

Vertrauensintervalle experimentell ermitteln

Wir gehen von folgender Situation aus:

  • Wir betrachten eine Bernoulli-Kette mit bekannter Länge n (z. B.: n=100) und unbekannter Trefferwahrscheinlichkeit p.
  • Bei einer Durchführung der Bernoulli-Kette wird eine absolute Trefferhäufigkeit X=k erhalten (z. B.: X=63).
  • Mit Hilfe der Trefferhäufigkeit X=k möchten wir die unbekannte Trefferwahrscheinlichkeit p abschätzen.
  • Die Sicherheitswahrscheinlichkeit soll dabei einen vorgegebenen Standardwert betragen (z. B. 95%).

Zum Herunterladen: vertrauensintervalle1.ggb

Eine Punktabschätzung für die Trefferwahrscheinlichkeit p folgt direkt aus der relativen Trefferhäufigkeit Xn:

p=kn

Hier gilt: p=kn=63100=0.63

Bei einer Intervallabschätzung für die Trefferwahrscheinlichkeit wird ein Bereich für die Trefferwahrscheinlichkeit bestimmt, für den die betrachtete Trefferhäufigkeit nicht unwahrscheinlich ist.
Dabei wird von einer vorgegebenen Sicherheitswahrscheinlichkeit (wie z. B. 95%) ausgegangen.

Ein Wert für p heißt verträglich mit der betrachteten Häufigkeit X=k, wenn die betrachtete Häufigkeit X=k im Prognoseintervall (zur vorgegebenen Sicherheitswahrscheinlichkeit) liegt.

Das Vertrauensintervall (auch Konfidenzintervall genannt) zur betrachteten Häufigkeit X=k umfasst alle Werte für p, die mit X=k (für die vorgegebene Sicherheitswahrscheinlichkeit) verträglich sind.

Die folgende Tabelle verdeutlicht 95%-Prognoseintervalle für die absolute Trefferhäufigkeit X und ermittelt jeweils, ob die betrachtete Trefferhäufigkeit X=63 in diesem Intervall liegt.

betrachteter p-Wert95%-Prognoseintervall für die Trefferhäufigkeit XVerträglichkeit von p mit X=k
p=0.5344X62X=63 liegt nicht im 95%-Prognoseintervall
p=0.5445X63X=63 liegt im 95%-Prognoseintervall
p=0.7163X79X=63 liegt im 95%-Prognoseintervall
p=0.7264X80X=63 liegt nicht im 95%-Prognoseintervall

Somit erhalten wir folgendes 95%-Vertrauensintervall für p zur Trefferhäufigkeit X=63:

0.54p0.71

Vertrauensintervalle rechnerisch bestimmen

Ein Vertrauensintervall für p zur Trefferhäufigkeit X=k kann auch mit Hilfe der relativen Trefferhäufigkeit kn bestimmt werden.
Es werden dann Prognoseintervalle für die relative Trefferhäufigkeit Xn verwendet. Das Vorgehen ist völlig analog zum Vorgehen mit absoluten Trefferhäufigkeiten.

Zum Herunterladen: vertrauensintervalle2.ggb

Wir betrachten weiterhin eine Sicherheitswahrscheinlichkeit von 95%. Für diese Sicherheitswahrscheinlichkeit können die Prognoseintervalle für die relative Trefferhäufigkeit so abgeschätzt werden:

p1.96p(1p)nXnp+1.96p(1p)nXn

Für den maximalen Wert für p, für den die relative Häufigkeit 0.63 noch im 95%-Prognoseintervall liegt, gilt (näherungsweise) folgende Gleichung:

p1.96p(1p)n=0.63

Analog gilt für den minimalen Wert für p, für den die relative Häufigkeit 0.63 noch im 95%-Prognoseintervall liegt, (näherungsweise) folgende Gleichung:

p+1.96p(1p)n=0.63

Das Auflösen dieser Gleichungen nach p liefert (näherungsweise) die Grenzen des 95%-Vertrauensintervall für p.

Zum Herunterladen: vertrauensintervalle3_cas.ggb

Mit dem Gleichungslösungstool erhalten wir folgendes 95%-Vertrauensintervall für p zur Trefferhäufigkeit X=63:

0.53p0.72

Beachte, dass hier gerundete Werte benutzt werden, die dazu führen können, dass die Grenzen nicht genau mit den experimentell ermittelten übereinstimmen.

Vertrauensintervalle vergleichen

Eine Schätzung der Trefferhäufigkeit p ist umso besser, je kleiner die Breite des Vertrauensintervalls für p ist. Mit dem Gleichungslösungstool oben können folgende 95%-Vertrauensintervalle für p zur Trefferhäufigkeit X=63 bestimmt werden:

Stichprobenumfang nrelative Trefferhäufigkeit Xn95%-Vertrauensintervall für die Trefferwahrscheinlichkeit p
n=100Xn=0.630.53p0.72
n=200Xn=0.630.56p0.69
n=400Xn=0.630.58p0.68
n=800Xn=0.630.60p0.66
n=3200Xn=0.630.61p0.65

Wie zu erwarten wird die Schätzung immer genauer (bei gegebener relativer Trefferhäufigkeit), je größer der Stichprobenumfang n ist.

Oft ist umgekehrt zur Abschätzung einer vorgegebenen maximalen Abweichung (von z. B. 1% ) eine Abschätzung des erforderlichen Stichprobenumfangs interessant.

Ausgangspunkt ist diese Bedingung:

1.96p(1p)n0.01

Quadrieren liefert:

1.962p(1p)n0.012

Auflösen nach n ergibt:

n1.9620.012p(1p)

Es gilt p(1p)0.25 (für alle p mit 0p1). Also:

1.9620.012p(1p)0.251.9620.0120.25=9604

Für n=9604 gilt demnach:

n=1.9620.0120.2596041.9620.012p(1p)

Bei einem Stichprobenumfang n9604 kann also davon ausgegangen werden, dass die unbekannte Trefferwahrscheinlichkeit p mit einem 95%-Vertrauensintervall bis auf 1% genau abgeschätzt wird.

Suche

6.7.2.6
o-mathe.de/stochastik/schaetzen/wahrscheinlichkeiten/zusammenfassung
o-mathe.de/6.7.2.6

Rückmeldung geben