Stochastik: Standardabweichung!= durchschnittliche Abweichung vom Mittelwert?
Hallo,
ich schreibe in 2-3 Wochen mein Matheabitur und es läuft schon ganz gut. Was ich mich jedoch schon immer gefragt habe: Warum rechnet man die Standardabweichung so aus, wie man es tut und macht das nicht gar keinen Sinn?
In der Schule rechnet man die Standardabweichung wie folgt aus:
erstens: Mittelwert/Erwartungswert bestimmen:
- Bei Binomialverteilungen gilt ja µ = n*p
- Bei Normalverteilungen muss man ja alle Ergebnisse addieren und dann durch die Anzahl teilen, dann hat man den Durchschnittswert µ.
zweitens: Varianz berechnen:
- Binominal: var = v(x) = n*p*q
- Normal: ((µ-ergebnis 1)^2+...+(µ-letztes Ergebnis)^2)/n
drittens:
- sigma = var^(1/2) [also Wurzel aus var]
Für Binominal kann man stattdessen auch gleich sigma = (n*p*(1-p))^(1/2) rechnen. Mit hoch einhalb ist natürlich Wurzel gemeint, das Zeichen habe ich nur gerade nicht.
sooo und jetzt zum Beispiel wieso das keinen Sinn für mich macht:
Füllstand einer 250ml Flasche:
0x unter 248ml
2x 248ml
3x 249ml
20x 250ml
3x 251ml
2x 252ml
0x über 252ml
Mittelwert ist offensichtlich 250, kann man wenn man will mit Schritt eins berechnen. Nun zur Varianz:
var = (2*(250-248)^2 + 3*(250-249)^2 + 20*(250-250)^2 + 3*(250-251)^2 + 2*(250-252)^2)/30
<=> var = (2*(2)^2 + 3*(1)^2 + 0 + 3*(-1)^2 + 2*(-2)^2)/30
<=> var = (8 + 3 + 3 + 8)/30
<=> var = 22/30 = 11/15
Standardabweichung:
sigma = var^(1/2) | einsetzten
sigma = (11/15)^(1/2) | [Wurzel aus 11/15]
= 0,8563 [ml] | auf vier Nachkommastellen gerundet.
So. Und jetzt steht in jedem Schulbuch und überall im Internet: Wenn man eine zufällige Flasche untersucht liegt der Füllstand im Durchschnitt 0,8563ml vom Mittelwert 250ml entfernt.
Ich sehe nun aber: Es sind 30 Flaschen getestet worden. Bei 20 Flaschen war die Abweichung vom Mittelwert 250ml 0. Bei jeweils 6 Flaschen lag der Füllstand um einen Milliliter daneben. Bei vier lag er 2 Milliliter daneben.
Also:
durchschnittliche Abweichung = (20*0 + 6 * 1 + 4 * 2) / 30
= 10/30 = 1/3
Also liegt bei einer zufällig untersuchten Flasche der Füllstand im Durchschnitt 1/3ml und nicht sigma = 0,8563ml entfernt. Das macht überhaupt keinen Sinn... Was sagt die Standardabweichung denn dann aus?
Danke im Voraus
2 Antworten
Du hast völlig recht mit Deiner Berechnung der mittleren absoluten Abweichung, engl. MAD für mean absolute deviation (MAD bezeichnet allerdings oft auch median absolute deviation). Dass man diese nicht als Standardabweichung bezeichnet, hat denke ich 2 Gründe:
1. historisch, eine eigentlich gesuchte mittlere Abweichung (ohne absolut) wäre immer 0, also quadriert man erst um nur positiv gemachte Werte zu mitteln, mit Beträgen zu rechnen ist vielleicht nicht so alt.
2.) rechentechnisch, mit den quadrierten Werten lässt sich später in statistischen Verfahren viel besser rechnen.
Was sie aussagt: bei der Standardabweichung werden größere Abweichungen stärker gewichtet als bei der MAD.
"So. Und jetzt steht in jedem Schulbuch und überall im Internet: Wenn man eine zufällige Flasche untersucht liegt der Füllstand im Durchschnitt 0,8563ml vom Mittelwert 250ml entfernt."
Sowas habe ich noch nie im Internet auf einer halbwegs kompetenten Statistikseite und schon gar nicht in einem Lehr-oder Schulbuch gesehen, dass jemand Standardabweichung mit durchschnittlicher |absoluter| (Du hast das bei Deiner Rechnung missachtet) Abweichung verwechselt. Hast Du mal ein Beispiel?