Statistik: Mean + SD über 100%? (Mittelwert + Standardabweichung über 100%?)

2 Antworten

Vom Fragesteller als hilfreich ausgezeichnet

mittelwert liegt ja nicht über 100, sondern darunter - also kein hinweis, dass der mittelwert falsch wäre.

bei SD kann es schon mal vorkommen, dass sie quasi über die skala hinausgeht. sie ist nur die durchschnittliche abweichung vom mittelwert und sie hat kein vorzeichen (weil sie die wurzel aus der varianz ist und die varianz auf auf einer quadrierten differenz beruht). daher bedeutet es nicht, dass tatsächlich messungen existieren, die über 100% liegen. man muss also nicht von einem fehler ausgehen.

Ja, das mag ja sein. Aber kann ich denn dann in einem solchen Fall die Werte dann in % angeben? Das sieht doch irgendwie merkwürdig aus, 94 +/- 9 %. Irgendwie statistisch konstruiert (weiß nicht wie ich das besser formulieren soll). Ist mir bisher noch in keiner Arbeit aufgefallen, solch ein Fall. In Worten heißt das doch so viel wie, dass im Schnitt 94% überlebten, es aber auch vorkam, dass 103% oder nur 85% überlebten in einzelnen Replikaten. Oder müsste ich in diesem Fall den SEM heranziehen? Rohdaten: 10,10,10,8,9 (sind doch nur n=5, aber das spielt ja keine Rolle für die Frage).

0
@leonius0815

da SD kein vorzeichen hat, heisst es eben nicht, dass es zwingend werte zwischen 85 und 103 gibt. es sollte also keiner meinen, dass es ein fehler ist. ich habe das selbst schon öfter gesehen. wenn man standardabweichung einfach als SD = x angibt, dann sieht es nicht so aus, als existierten werte zwischen 85 und 103.

SEM ist eine umrechnung von SD. wenn SD rechnerisch falsch wäre, dann wäre SEM genauso falsch. wenn dir SEM lieber ist, da SEM kleine werte sind, spricht nichts dagegen, SEM anzugeben. SEM anzugeben wäre nicht ungewöhnlich.

dass es nur 5 werte sind, spielt für streuung und mittelwert keine rolle.

0

Das ist doch einfach nur ein Hinweis auf eine stark unsymmetrische Verteilung, bei einem Mittelwert von 94% und einer SD von 9% muss eine der 6 Überlebensraten weit unter 94% liegen, sonst käme (Summe Einzelrate -94%)^2/5 (die SD) =9% ja nie zustande, nach oben ist die maximal mögliche Abweichung ja 6%.

Bei einer solch schiefen Verteilung sollte man eher mit Median und Quartilen arbeiten statt mit Mean und SD. Auch ist die Frage, warum arbeitet man hier mit 6 Replikaten a 10 Tieren, statt einfach mit einer Stichprobe a 60 Tieren. Dann könnte man auch die in der Survival-Analyse bekannte Kaplan-Meier-Schätzung des Medians mit seinem Konfidenzbereich vornehmen. Mehr Details führen hier zu weit, das hier nur als Anregung für weitere Recherchen.

Was möchtest Du wissen?