Statistik: Mean + SD über 100%? (Mittelwert + Standardabweichung über 100%?)

2 Antworten

Vom Fragesteller als hilfreich ausgezeichnet

mittelwert liegt ja nicht über 100, sondern darunter - also kein hinweis, dass der mittelwert falsch wäre.

bei SD kann es schon mal vorkommen, dass sie quasi über die skala hinausgeht. sie ist nur die durchschnittliche abweichung vom mittelwert und sie hat kein vorzeichen (weil sie die wurzel aus der varianz ist und die varianz auf auf einer quadrierten differenz beruht). daher bedeutet es nicht, dass tatsächlich messungen existieren, die über 100% liegen. man muss also nicht von einem fehler ausgehen.

Ja, das mag ja sein. Aber kann ich denn dann in einem solchen Fall die Werte dann in % angeben? Das sieht doch irgendwie merkwürdig aus, 94 +/- 9 %. Irgendwie statistisch konstruiert (weiß nicht wie ich das besser formulieren soll). Ist mir bisher noch in keiner Arbeit aufgefallen, solch ein Fall. In Worten heißt das doch so viel wie, dass im Schnitt 94% überlebten, es aber auch vorkam, dass 103% oder nur 85% überlebten in einzelnen Replikaten. Oder müsste ich in diesem Fall den SEM heranziehen? Rohdaten: 10,10,10,8,9 (sind doch nur n=5, aber das spielt ja keine Rolle für die Frage).

0
@leonius0815

da SD kein vorzeichen hat, heisst es eben nicht, dass es zwingend werte zwischen 85 und 103 gibt. es sollte also keiner meinen, dass es ein fehler ist. ich habe das selbst schon öfter gesehen. wenn man standardabweichung einfach als SD = x angibt, dann sieht es nicht so aus, als existierten werte zwischen 85 und 103.

SEM ist eine umrechnung von SD. wenn SD rechnerisch falsch wäre, dann wäre SEM genauso falsch. wenn dir SEM lieber ist, da SEM kleine werte sind, spricht nichts dagegen, SEM anzugeben. SEM anzugeben wäre nicht ungewöhnlich.

dass es nur 5 werte sind, spielt für streuung und mittelwert keine rolle.

0

Das ist doch einfach nur ein Hinweis auf eine stark unsymmetrische Verteilung, bei einem Mittelwert von 94% und einer SD von 9% muss eine der 6 Überlebensraten weit unter 94% liegen, sonst käme (Summe Einzelrate -94%)^2/5 (die SD) =9% ja nie zustande, nach oben ist die maximal mögliche Abweichung ja 6%.

Bei einer solch schiefen Verteilung sollte man eher mit Median und Quartilen arbeiten statt mit Mean und SD. Auch ist die Frage, warum arbeitet man hier mit 6 Replikaten a 10 Tieren, statt einfach mit einer Stichprobe a 60 Tieren. Dann könnte man auch die in der Survival-Analyse bekannte Kaplan-Meier-Schätzung des Medians mit seinem Konfidenzbereich vornehmen. Mehr Details führen hier zu weit, das hier nur als Anregung für weitere Recherchen.

Statistik : Wann Median , Modalwert , arithmetisches Mittel?

Hey , Ich frage mich, wie kann ich entscheiden was ich wählen muss.

Beispiel :

Sagen wir ich nehme Bewertungen wie bei Amazon. Von 5 bis 1 Sternen. Sagen wir 20 geben 5 , 15 geben 3 , 3 geben 2 und 7 geben 1.

Meiner Meinung nach wäre der Median nicht geeignet, weil es dann zwischen 3 und 2 wäre und wir sehen ja deutlich, dass dort die wenigsten Werte sind. Ebenso würde ich eher nicht den Modalwert nehmen, da das Produkt dann durchschnittlich sehr gut bewertet werden würde, dies würde aber die negativen Bewertungen missachten. Ich glaube ich würde das arithmetische mittel nehmen, damit alle Werte gleich berücksichtigt werden. Würdet ihr sagen das stimmt? Ihr könnt gerne weitere solche Beispiele machen. LG.

...zur Frage

Statistik: Ist eine inverse Korrelation das gleiche wie eine negative Korrelation?

Statistik: Ist eine inverse Korrelation das gleiche wie eine negative Korrelation?

...zur Frage

Was ist der Unterschied zwischen Konsistenz und Unverzerrtheit bei einem Schätzer?

...zur Frage

Welche Variablen in Moderatoranalyse bei Regression?

Hallo zusammen,

ich bin mir unsicher welche Variablen ich in meine Analyse aufnehmen muss. Meine Studie ist die Folgende: ich möchte überprüfen, wie Marken werben sollen, d.h. welchen Wert sie den Konsumenten primär bieten sollten um eine Markenbindung zu erreichen. Ich habe hier mit mehrern Items den Unterhaltungswert, den Informationsgehalt und den Ökonomischen Nutzen der Werbung unterschiedlicher Marken abgefragt und ebenfalls die Markenbindung. Somit habe ich 3 unabhängige Variablen und eine abhängige (die Markenbindung). Als Moderator kommen hinzu das Involvement und der expressive sowie der funktionalle Markennutzen. Also zB. wäre herauszufinden ob bei High-involvement Marken der Zusammenhang zwischen dem informationsgehahlt der Werbung und der Markenbindung höher ist als bei low-involvement Produkten. Alle Variablen wurden auf einer 5-stufigen Likert-Skala abgefragt. Ich habe dann jeweils die Items einer Variable addiert und durch die anzahl dividiert um den jeweiligen wert für die Variable zu erhalten (bspw für die höhe der Markenbindung).

Nun möchte ich die Moderatoren testen. Hierfür multipliziere ich je die UV mit der Moderatorvariable und erhalte eine neue Variable (das Produkt dieser, im Folgenden Moderatorprodukt genannt) Nun bin ich mir unsicher, welche Variablen ich genau in die Regression aufnehmen kann: Wenn ich bei Spss eine Regression durführe dann füge ich zum einen die Abhängige Variable Markenbindung ein. Zum anderen füge ich die erklärenden Variablen ein. Ich habe in meinem Modell 3 Unabhängige Variable und 3 Moderatoren. Kann ich quasi alles zusammen prüfen und alle 3 UV und alle 3 Moderatorvariablen sowie die 9 Moderatorprodukte in einer Regression einfügen? Oder muss ich um den Moderatoreinfluss zu testen immer eine einzelne Regression durchführen, in welche ich bei den erklärenden Variablen nur die Moderatorvariable, die UV und das Moderatorprodukt einfüge? Und dies dann 9x (3 UV x 3 Moderatorvariablen) wiederholen, also 9 einzelne Regressionen durchführen um die Moderatoreffekte zu überprüfen. Also ist es so, dass ich: a) eine Regression mit allen 9 Moderatorprodukten durchführen kann (9 erklärende Variablen in Regression)? b) eine Regression mit den 9 Moderatorprodukten sowie den 3 UV und den 3 Moderatorvariablen durchführen (15 erklärende Variablen in Regression)? c) je immer nur ein Moderatorprodukt und der entsprechenden UV und Moderatorvariable (3 erklärende Variablen in Regression)einfügen? Dies würde ich dann 9x wiederholen müssen.

Meine Stichprobe beträgt 270. Die Ergebnisse der Regression mit den 9 Moderatorprodukten (Möglichkeit a) erscheinen mir Plausibel. Wenn ich zusätzlich zu den 9 Moderatorprodukten noch die 3 UV und die 3 Moderatorvariablen in die Regression als erklärende Vraiablen aufnehme (Möglichkeit b), sind meine Ergbnisse komplett anders. Plötzlich sind die Moderatoren so dann nicht mehr signifikant. Ich bin daher verunsichert, welche Variablen ich aufnehmen muss.

Vielen, vielen Dank!!

...zur Frage

Messung IQ?

Hallo, ich muss für Psychologie eine kleine Ausarbeitung über die Definition und Messung des heutigen IQs schreiben und versteh es noch nicht so ganz. Ich weiß dass man da dann Aufgaben bekommt und für die Bearbeitung dieser Aufgaben bekommt man dann am Ende Rohwerte, welche mit einer Normtabelle verglichen werden. Ich versteh aber nicht wie dann aus diesen Rohwerten letztendlich die IQ Punkte ermittelt werden und was es mit der Standardabweichung von 15 und dem Mittelwert 100 zu tun hat. Außerdem soll ich erklären, warum bei einem Kind zu einem Zeitpunkt der IQ zum Beispiel 106 beträgt wenn er 23 Aufgaben richtig hat und wenn das gleiche Kind 2 Jahre später wieder einen Iq Test macht und 4 Aufgaben mehr richtig hat der IQ plötzlich nur noch bei 100 liegt! Kann mir das vielleicht jemand von euch erklären? Schon mal danke für die Hilfe!

...zur Frage

Was möchtest Du wissen?