Was zeigt der Likelihood-ratio/quotiententest?

2 Antworten

Sowas kommt raus, wenn Nichtmathematiker Mathematik betreiben wollen... Wieso macht man einen Test, den man nicht versteht? Das ergibt einfach keinen Sinn, aber gut, dann dürftet ihr wohl gar keine statistischen Verfahren mehr verwenden...

Also der Likelihood-Ratio macht Folgendes:

Ich habe Realisierungen/Daten x1, ..., xn und ich will wissen, ob mein gesuchter Parameter aus irgendeinem Teilbereich des Parameterraums stammt (könnte beispielsweise auch nur ein Wert sein). Unter der Nullhypothese stammt der Parameter aus diesem Bereich. 

Jetzt schätze ich über die Likelihood-Funktion meinen Parameter (erstmal allgemein bezogen auf den ganzen Parameterraum) und erhalte somit auch eine maximierte Likelihood für die zugrundeliegenden Zufallsvariablen X1, ..., Xn (die sind bei dir hoffentlich unabhängig!). Dasselbe mache ich jetzt nochmal, nur dass ich jetzt ausschließlich Parameter aus dem Teilbereich aus der Nullhypothese anschauen. Damit erhalte ich erneut eine Likelihood.

Nun betrachte ich den Quotienten aus der Likelihood für die Nullhypothese durch die Likelihood des allgemeinen Falls. Was wird jetzt vermutlich passieren, wenn die Nullhypothese stimmt? Naja dann steckt der wahre Parameter bereits in dem Parameterraumteilbereich drin und die optimierte Likelihood über diesen Bereich sollte dieselbe sein wie die über den ganzen Parameterraum! Dann teilen wir zwei gleiche Werte durcheinander, also ist der Quotient 1. 

Naja weil aber in den Daten der Zufall drinsteckt, können wir nicht erwarten, dass das so rauskommt, aber wir können erwarten, dass der Wert nahe bei 1 ist, genauer knapp unter 1 ist (beachte, dass ein Wert über 1 nie möglich ist, da der Nenner (ML über alle Parameter) immer größer/besser sein muss als der Zähler (ML über den Parameterteilbereich). Also nehmen wir unsere Nullhypothese nur dann an, wenn unsere Teststatistik nahe bei 1 liegt bzw. möglichst groß ist.

Jetzt kommt das nächste Problem, das man in der mathematischen Statistik immer bei der Konstruktion von Tests hat. Man braucht eine Verteilung der Teststatistik, aber die verhält nicht ziemlich blöd. Asymptotisch schöner verhält sich dagegen -2log(Likelihoodquotienten) und das sollte der von dir zitierte LR-Wert sein, den dir R ausgespuckt hat. Dieses Gerät verhält sich asymptotisch Chi-Quadrat-verteilt und damit kann ich mir nun einen schönen Test aufbauen: 

Wenn die Nullhypothese (immer noch Parameter stammt aus Teilbereich des Parameterraums bla bla) stammt, dann muss der Quotient (welcher eben nur Werte zwischen 0 und 1 haben kann) möglichst groß sein. Der Logarithmus davon wäre dann ein Wert knapp unter 0, während er unter der Alternativhypothese eher bei noch größeren negativen Werten liegen würde. -2log(Quotient) ist dann unter H0 war kleines Positives und unter H1 was großes Positives. Also wählt man einen einseitigen Chi-Quadrat-Test, bei dem H0 abgelehnt wird, wenn -2log(Quotient) größer als das 0,95-Quantil oder was auch immer ist.

Du hast -2log(Quotient) = 25,353, was bei 15 Freiheitsgraden einem p-Wert von 0,045 entspricht. Das heißt, dass die Teststatistik beispielsweise zu groß ist, um H0 zu einem Signifikanzniveau von 0,05 anzunehmen. Dein wahrer Parameter ist also ein anderer bzw. wie es wohl in deinem Fall ist, deine Parameter in beiden Geschlechtergruppen sind nicht dieselben.

TypMitGitarre 
Fragesteller
 30.03.2017, 20:22

dh die Nullhypothese wird abgelehnt, würde man die Nullhypothese dann bei LR=29,556 df=23 p=0,163 annehmen?

0
Drainage  30.03.2017, 20:25
@TypMitGitarre

Hast du überhaupt verstanden, was Signifikanztests und p-Wert zu bedeuten haben? Anscheinend nicht.

Der p-Wert ist immer das Signifikanzniveau an der Grenze zwischen Ablehnung und Nicht-Ablehnung der Nullhypothese. Wählst du ein Signifikanzniveau darüber, so lehnst du ab. Wählst du eins darunter (hier wohl eher üblich), lehnst du nicht ab.

0
TypMitGitarre 
Fragesteller
 30.03.2017, 20:39
@Drainage

beim ersten beispiel verwirft man H0 (unterschiede in den teilstichproben) nicht, weil p unter dem Signifikanzniveau von 0,05 liegt - beim 2. Beispiel verwirft man H0, weil p>0,05. Ist das so richtig?

0

Nur noch eine Ergänzung wegen Deines letzten Kommentars, zum Verständnis des p-Wertes:

Bei einem Signifikanztest, also ob die Nullhypothese stimmt (bzw. es keinen Hinweis gibt, die Nullhypothese abzulehnen), etwa auf dem 5% Niveau, besagt ein p-Wert < 0,05, dass die Wahrscheinlichkeit, dass der gefundene Statistik-Wert (LR in Deinem Fall) so groß oder noch größer ist, eben kleiner als 5% ist, sofern die Nullhypothese tatsächlich gilt. Dass Du dieses Signifikanzniveau (vorher!) gewählt hast, bedeutet ja gerade, dass Du bei einem solch unwahrscheinlichen Ergebnis die Nullhypothese ablehnst.

Falls Du ein solches Signifikanzniveau, eben von 5%, gewählt hast, solltest Du Dir aber auch im klaren darüber sein, dass die Nullhypothese trotzdem richtig sein könnte. Diese 5% besagen nur, dass Du bei 20 (völlig voneinander unabhängigen) Stichproben aus der einen Grundgesamtheit, die Du betrachtest, wenn dort die Nullhypothese gilt, ein signifikantes Ergebnis im Mittel 1* und ein nicht signifikantes Ergebnis 19* erwartet wird. Und wenn Du also auf Grund des p-Wertes von < 5% die Nullhypothese ablehnst, bist Du Dir damit nur zu 95% sicher, denn mit 5% Wahrscheinlichkeit hätte Deine Stichprobe ja auch aus der Grundgesamtheit stammen können, in der die Nullhypothese gilt.

Und noch weiter (vielleicht erst in meiner nächsten Antwort, wenn hier die Zeit endet): Die Nullhypothese H0 ist nicht die eines Unterschiedes, sondern die der Gleichheit, und die willst Du ja ablehnen mit genügend hoher Sicherheit, nämlich 95%. Einen Unterschied zur Nullhypothese zu machen, erfordert einen Äquivalenztest, keinen Signifikanztest. Und der funktioniert ganz anders. So jetzt habe ich es doch noch geschafft.