Binomialverteilung Wahrscheinlichkeit von bestimmter Erfolgswahrscheinlichkeit ausrechnen?

...komplette Frage anzeigen

2 Antworten

Da geht es um sog. Inferenzen. Setup: es sei X ~ Bin(n;P), wobei n ne Konstante ist und P selber eine Verteilung zugrunde liegt(!). Sei nun µ die W-keitsverteilung von P. Dh µ ist ein W-keitsmaß auf [0, 1].

Es findet nun das Ereignis E(n,k) statt. Wir wissen nun bloß, dass ℙ[E(n,k) | P=p] = (n über k)pᵏ(1–p)ⁿ¯ᵏ =: b(n,k;p).

Was wir bestimmen müssen ist die Verteilung von P unter der Bedingung, dass E(n,k). D. h., wir suchen nach dem W-keitsmaß auf [0, 1], nennen wir es ν, so dass gilt

ν[A] = ℙ[P ∈ A | E(n,k)]

für alle A⊆[0, 1] messbar. Betrachte nun ein messbares A⊆[0, 1]. Wir haben

ℙ[E(n,k) & P ∈ A] = ∫ᴬ ℙ[E(n,k) | P=p] µ(dp)

(das Integral der bedingten W-keiten bzgl. des W-keitsmaßes für P und das alles über über A). Mit Bayesianischen Überlegungen erhalten wir deshalb

ν[A] = ℙ[P ∈ A | E(n,k)] = ℙ[E(n,k)&P∈A]/ℙ[E(n,k)]        = ∫ᴬ b(n,k;p) µ(dp) / ℙ[E(n,k)].

Damit haben wir eindeutig die von den Evidenzen bedingten Verteilung von P und können dies sogar als „Dichte“ beschreiben: die „Wahrscheinlichkeitsdichte“ von P=p ist f.s.

∂ν/∂µ = b(n,k;p) / ℙ[E(n,k)]                               = b(n,k;p) / ∫ b(n,k;q) µ(dq).

Statt (∂ν/∂µ)(p) können wir etwa schreiben „dℙ[P=p]/dp“, wobei niemand das wirklich schreibt. Stattdessen fügt man noch nen Buchstaben hinzu und beschreibt diese Funktion als etwas wie ρ. Also ρ(p) = b(n,k;p) / ∫ b(n,k;q) µ(dq).

Der genau Wert von ρ(p)  hängt ja offensichtlich von der apriori Verteilung, µ, ab. Denn gilt ρ ~ b(n,k;·), d. h. die Gestalt der Dichtefunktion von µ unabhängig!

Häufig aber benutzt man in diesem Falle die apriori Verteilung µ = Uniformverteilung auf [0, 1]. Dann haben wir

∫ b(n,k;q) µ(dq) = ∫ (n über k)qᵏ(1–q)ⁿ¯ᵏ dq = 1/(n+1)

(da schreibe ich jetzt nicht alle Schritte auf!).

Also gilt ρ(p) = (n+1)·b(n,k;p). Zusammengefasst: du kannst die W-keit nach der binomischen Verteilung wie üblich berechnen, dann multiplizierst du dies mit (n+1), und die Wahrscheinlichkeitsdichte von dem Ereignis P=p zu erhalten. Dies wird idR ein Wert > 1 sein. Aber das liegt daran, dass es sich um die Dichte nicht das Maß handelt. Konkret hast du:

Dichte, dass P=p, ist gleich (n+1)·(n über 0)p⁰(1–p)ⁿ¯⁰ = (n+1)·(1–p)ⁿ = 101·2¯¹⁰⁰ = 7,967495143·10¯²⁹.

Die ist nochmals ausdrücklich NICHT die W-keit. Die W-keit, dass P=0,5 ist gleich absoluter 0.

kreisfoermig 08.07.2017, 07:50

(Ach ja. Der Inferenz-Teil. Statt die auf den Evidenzen basierende Verteilung zu bestimmen, nimmt man an, dass P=p für ein p so sein muss, damit ℙ[E(n,k) | P=p] maximal ist.

D. h. wir optimieren (n über k)pᵏ(1–p)ⁿ¯ᵏ nach p. Da kommen wir nicht drum herum: die Lösung ist das langweilige p* = k/n. In deinem Falle p=0.

Bei den Inferenzen geht es also nicht wirklich darum, die Verteilung des Parameters wie oben zu bestimmen, sonde den Wert irgendwie festzulegen.)

2
kreisfoermig 08.07.2017, 09:24

Mit dem Wert der Dichte kann man nun nichts anfangen—man kann kein Urteil sinnvoll bewerten. Sinnvoller ist natürlich die W-keit. Doch wie gesagt gilt ℙ[P=p] = 0 für jedes p.

Stattdessen ist es sinnvoller zu fragen, wie Wahrscheinlich ist es, gegeben diese Evidenzen, dass P mindestens 0,3 oder irgendwas ist, bzw. höchstens 0,3, usw. Hierfür berechnet man mit der o. s. Formel

ℙ[P ≤ p | E(n,k)] = ∫ᴬ b(n,k;q) µ(dq) / ℙ[E(n,k)], wobei A=[0, p]

                          = (n+1)(n über k) ∫ qᵏ(1–q)ⁿ¯ᵏ dp von q=0 bis p.

Für k=0 ist der Ausdruck sehr einfach: ℙ[P ≤ p | E(n,k)] = 1 – pⁿ⁺¹. Mit n=100 und p=0,5 ist dies beinah 1.

Mit diesem Ausdruck können wir einen Schwellenwert bestimmen: wir hatten ja 0 Erfolge. Also stellt sich die Frage, wie der größte Wert sein müsste, damit dies geschehen kann. Natürlich müsste es heißen, wie groß—mit Wahrscheinlichkeit z = 99% oder so—dürfte der Wert von p sein? Dann setzen wir ℙ[P ≤ p | E(n,k)] ≥ z ⟺ 1 – (1–p)ⁿ⁺¹ ≥ z ⟺ p ≥ 1–(1–z)^{1/(n+1)}. Also wäre der Schwellenwert bspw. 1–(1–0,99)^{1/101} ≈ 0,04457 = 4,457%. Das ist nun sehr nützlich! Wir wissen also anhand der Evidenz, dass mit 99% Sicherheit der P-Wert zw. 0 und 4,457% liegt.

3
kreisfoermig 08.07.2017, 17:21
@kreisfoermig

statt »ℙ[P ≤ p | E(n,k)] = 1 – pⁿ⁺¹« musste es »ℙ[P ≤ p | E(n,k)] = 1 – (1–p)ⁿ⁺¹« heißen. Damit habe aber eh weiter gearbeitet, sodass die weiteren Aussagen gelten so wie sie da stehen.

1

Mir ist Deine Frage nicht ganz klar geworden.

Verstehe ich das richtig:
Du hast ein Bernoulli-Experiment, das mit der Wahrscheinlichkeit p mit "Erfolg" endet. Dieses Experiment führst Du n mal durch. Du interessierst Dich für die Wkeit, dass unter diesen n Versuchen genau k mit "Erfolg" enden. Richtig?

Dafür gibt es eine Formel:

P(X = k) = (n über k) · p^k · (1-p)^(n-k)

Da brauchst Du jetzt nur noch Deine Werte einzusetzen und auszurechnen.

kreisfoermig 10.07.2017, 07:41

Er will wissen, gegeben die Evidenzen, dass in B(n=100,P) die Anzahl der Erfolge k(=0 oder so) ist, wie der Parameter P verteilt ist.

Ausgehend von der apriori Annahme P ~ U([0,1]) erhält man die Verteilung F(p) = 1 – (1–p)ⁿ⁺¹. In diese Formel, nicht in die binomische Formel müssen Werte eingesetzt werden.

Mit allgemeinen Werte für n & k gilt F(p) = (n+1)·(n über k)·B(p; k+1, n–k+1), wobei B die unvollständige Beta-Funktion ist.

0

Was möchtest Du wissen?