Was ist der Unterschied zwischen Residuen und Störvariablen?

4 Antworten

Es gibt keinen! Das Rediduum ist der Unterschied zwischen geschätztem Wert (aus der Regression) und dem tatsächlichen Wert.

Man kann eine x,y-Wertemenge durch eine Regression beschreiben. Diese besteht aus einer Rgeressionsgleichung und einer Störvariablen, die den Unterschied zwischen prognostiziertem und tatsächlichem Wert ausdrückt.

Will man z.B. die Abhängigkeit des Auftretens einer Leberzirrhose vom Alkoholkonsum schätzen, könnte Tabakkonsum eine Störvariable sein oder auch Geschlecht oder Alter oder allgemeiner Gesundheitszustand etc.. Es geht also um Einfluss mehrerer Regressoren Xi auf eine Zielgröße Y, wobei ein Regressor (hier Alkoholkonsum, X1) oder auch mehrere Hauptuntersuchungsziel ist (sind), und die anderen Größen eben Störfaktoren, deren Nichtberücksichtigung das Ergebnis verfälschen würde. Eine Verfälschung tritt insbesondere ein, wenn die Verteilung der Störfaktoren in der Stichprobe anders ist als in der Grundgesamtheit. Ergebnis wären Betas für alle Xi (Betai), wobei man dann sagt, der Einfluss des Hauptfaktors (Beta1) ist adjustiert um die Störfaktoren. Residuum ist immer der unerklärte Rest Y - Summe (Xi * Betai).

Hey :-) Soweit ich weiß, bedeutet "Residuum" (Plural Residuen) auch "Restvarianz", "Fehlervarianz" oder "unsystematische Varianz". Also eine Variabilität, die existiert, aber nur schwer erklärt werden kann (sie entsteht zufällig) ... man möchte so wenig wie möglich Restvarianz haben, weil man die ja nicht gut erklären kann, im Vergleich zur systematischen Varianz, die (mehr oder weniger) geplant war.

Störvariablen stören eine Messung. Das sind alles Dinge, die nicht gewollt sind oder die unkontrolliert ablaufen. Ich denke mal, dass die Effekte vieler Störvariablen dann in einer großen Restvarianz münden könnten. So, als wäre eine Störvariable ein Puzzleteil und das Residuum dann das ganze Puzzle dazu.

Hat dir das geholfen?

Die zweiten sind unbekannt, die ersten ergeben sich als die Abweichung der Datenmenge von der Regressionsfunktion und dienen als Schätzer für die zweiten.