Statistischer Test?
Ich muss 10 zufällige natürliche Zahlen ziehen (in einem Intervall von 114 bis 2147) und schauen wie viele davon Vielfachen der Primzahl 19 sind und diese Zahlen dann mit anderen Primzahlen von 2 bis 97 vergleichen. Wie bestimme ich nun den p-Wert?
Die Zahlen sind: 114, 2147, 209, 798, 285, 133, 152, 1192, 121 und 279.
Die Chance eine Vielfache der Zahl 19 zu bekommen liegt bei p=0.052
Wie schaue ich jetzt ob die gezogenen Zahlen im Zusammenhang mit der 19 zusammenhängen?
1 Antwort
Du musst sie durch 19 teilen und schauen, ob's aufgeht. Da hast Du aber einen sehr merkwürdigen Zufallsgenerator, die 1. 7 Zahlen sind alle Vielfache von 19, die anderen 3 nicht.
Wie Du den p-Wert bestimmst? bei 19 ist jede 19. Zahl durch 19 teilbar, also p=1/19=0,0526315789, bei 2 ist jede 2. Zahl durch 2 teilbar, also p=1/2=0,5, bei 3 p=1/3=0,3333333333, etc., bei 97 jede 97., also p=1/97=0,0103092784
Welches Ergebnis? Was ist denn Deine Hypothese, die Du verwerfen willst?
Ob die gezogenen Zahlen per Zufall erhalten worden sind oder der Zufallsgenerator präperiert war. Normalerweise würde man nicht erwarten dass von 10 Zahlen 7 davon Vielfachen der 19 sind.
Zunächst solltest Du Dir ein Signifikanzniveau vorgeben, z.B. 5% oder 1%. Dann musst Du über die Binomialverteilung ausrechnen, wie wahrscheinlich Dein Ergebnis zusammen mit noch unwahrscheinlicheren ist, also 7 oder mehr 19er-Vielfache, also P(X>=7), wenn X die Anzahl der gezogenen 19er-Vielfachen bezeichnet. Da die kumulierte Binomialverteilung von unten kumuliert wird, müsstest Du also P(X<=6) berechnen und das von 1 abziehen, hier also 1-0,99999988=0,00000012, und das ist deutlich kleiner als 0,05 oder 0,01, also signifikant für beide Niveaus.
P.S. Ich habe mir die Formeln in Excel zurechtgelegt, Mit einem Taschenrechner sollte das genauso gehen.
Danke. Letzte Frage: Was ist mit dem kritischen Wert? Muss ich den festlegen?
Nein, den musst Du aus Deiner Verteilungsannahme und dem festgelegten Signifikanzniveau errechnen. Das ist in Deinem Fall die Anzahl der 19er-Vielfachen, bei denen Du die Hypothese p<=1/19 zum ersten Mal ablehnst. Bei einem Vielfachen weniger würdest Du diese diese Hypothese nicht ablehnen können, hättest also eine Ws >=5% bzw. >=1% je nach Signifikanzniveau
Also wäre das jetzt in meinem Fall 2 Vielfachen der 19? Das wäre p=0.07.
Wie kommst Du auf 0,07?
Deine Binomialverteilung ist
B(k | 1/19, 10) = (10 über k) * (1/19)^k * (18/19)^(10-k)
Das aufsummiert von k=0 bis k=1 ergibt P(X<=1) = 0,9059, also P(X>1) = 1-0,9059 = 0,0941 > 0,05, damit kannst Du die Nullhypothese nicht ablehnen.
Bis k=2 ergibt sich P(X<=2) = 0,9868, also P(X>2) = 0,0132 <0,05, aber >0,01, damit kannst Du für k=2 die Nullhypothese ablehnen auf dem 5%-Niveau, aber nicht auf dem 1%-Niveau. k=2 ist tatsächlich der kritieche Wert fürs 5%-Niveau.
Bis k=3 ergibt sich P(X<=3) = 0,9988, also P(X>3) = 0,0012 < 0,01. Für das 1%-Niveau ist also der kritische Wert 3
Korrektur: kritische Werte sind 3 und 4, denn P(X>2)=P(X>=3) und P(X>3)=P(X>=4)
Ich habe es jetzt ausgerechnet und komme auf dasselbe Ergebnis, Danke. Wenn ich nun sagen wir mal 1 Vielfache bekomme dann ist ja die Wahrscheinlichkeit deutlich höher als p=0.09. Ist der kritische Wert also einfach die Schranke ab wann es kein Zufall mehr ist?
Genau. Du musst allerdings berücksichtigen, dass der Test einseitig ist. Es war klar, dass die 7 zuviel sind, deswegen hat man die ganzen 5% (1%) Ablehnungsbereich nach oben (rechts) gelegt. Oft hat man einen zweiseitigen Test, dann werden die 5% (1%) aufgeteilt auf 2,5% (0,5%) zuviel und 2,5% (0,5%) zuwenig. Bei der Primzahl 2 statt 19 sind ja nur 4 Zahlen dabei, also eher zuwenig. Dann kann man einseitig links testen oder beidseitig. Vermutlich führt hier aber beides nicht zur Ablehnung
Danke dir für die Hilfe. Ich habe es Mut dem Ablehnungsbereich verstanden. Sollte ich als Signifikanzniveau 0.05 oder 0.01 nehmen? Was wäre in dem Fall besser geeignet?
Und wie überprüfe ich ob das Ergebnis statistisch signikfant ist?