Wann verwende ich in der Statistik die Mittlere quadratische Abweichung und wann die Stichprobenvarianz?

1 Antwort

Die Varianz wird normalerweise v.a. in Formeln verwendet, in Artikeln etc. wird eher die Standardabweichung berichtet.

Die Standardabweichung kann man auch hernehmen um abzuschaetzen wieviel % der Beobachtungen in einem bestimmten Wertebereich befinden (z.B. +/- 2 SD = ca. 95%), falls die Daten Normalverteilt sind.

Und wieder hat justanotherdude eine Frage beantwortet, die nicht gestellt wurde.

Zu dieser Frage: Zunächst mal ist mittlere quadratische Abweichung - es ist ja wohl die Abweichung vom Mittelwert gemeint - dasselbe wie Varianz, so ist sie definiert, der Mittelwert der quadrierten Abweichungen vom Mittelwert. Der Unterschied besteht zwischen 2 anderen Begriffen, der empirischen und der Grundgesamtheits-Varianz.

Die Varianz einer Stichprobe kannst Du immer ausrechnen, wenn Du die Stichprobe hast, man nennt sie eben Stichprobenvarianz oder auch empirische Varianz.

Normalerweise ist man aber an der Varianz in der Grundgesamtheit interessiert, z.B. des Einkommens in allen deutschen Haushalten. Du wirst das aber in der Regel nur für einen kleinen Teil, nämlich eine Stichprobe von vielleicht ein paar 1000 Haushalten kennen. Du kannst die Varianz der Grundgesamtheit also nur schätzen. Klar würde man da naiv erstmal einfach die Stichprobenvarianz nehmen. Man kann aber durch Berechnungen zeigen, dass diese Schätzung systematisch daneben liegt, zu kleine Zahlen liefert, Fachausdruck: nicht erwartungstreu ist. Das liegt daran, dass Du bei der Berechnung der Stichprobenvarianz von einem festen Mittelwert ausgehst, nämlich dem Stichprobenmittelwert. Aber dieser Mittelwert schätzt den Grundgesamtheits-Mittelwert (zwar erwartungstreu aber) unsicher, die Mittelwert-Schätzung selber hat ja auch eine Varianz (Wenn Du verschiedene Stichproben ziehst, wirst Du jedesmal einen anderen Mittelwert bekommen). Und diese Unsicherheit bewirkt, dass die Schätzung etwas größer ausfallen muss, Du musst praktisch die MW-Schätzungsvarianz dazuaddieren. Rechnerisch geht das, indem Du die Summe der quadrierten Abweichungen nicht durch n, wenn n die Größe der Stichprobe ist, sondern durch n-1 teilst.

Damit siehst Du auch, je größer Deine Stichprobe, desto geringer der Unterschied zwischen empirischer und Grundgesamtheits-Varianz

0

Was möchtest Du wissen?