In R: Boxplots mit zusätzlichen Mittelwerten und Standardabweichung?

... komplette Frage anzeigen

1 Antwort

Keine Antwort (ich kann kein R), sondern nur eine Rückfrage: Wozu brauchst Du die Standardabweichung gezeichnet? Welche Frage willst Du mit ihrem Eintrag ober- und unterhalb vom Mittelwert beantworten?

Wenn Du schon die Boxplots hast, siehst Du ja, ob die Verteilung in etwa symmetrisch ist und damit vielleicht sogar normal verteilt sein könnte. Natürlich ist die Standardabweichung interessant, als Zahl, aber im unsymmetrischen Fall nicht ihre Lage ober- und unterhalb vom Mittelwert.

Im symmetrischen Fall würde mich eher interessieren, ob die Verteilung denn tatsächlich sogar normal sein könnte, oder ob sie schmaler oder breiter ist. Und dazu könnte man die Quartile mit einem entsprechenden Vielfachen der Standardabweichung vergleichen. Zwischen den Quartilen liegen ja 50% der Daten, aber bei Normalverteilung zwischen MW-SD und MW+SD ca. 67%. Da würde ich mir also das 0,x-fache der SD heraussuchen, sodass zwischen MW-0,x*SD und MW+0,x*SD 50% der normalverteilten Daten liegen. Wenn diese Linien dann ungefähr mit den Box-Kanten zusammenfallen, dann hättest Du ein Indiz für Normalverteilung, sonst ein Gegenargument (ob der MW auf dem Median liegt oder nicht, ist natürlich ein weiteres Indiz/Gegenargument)

Ein anderen Sinn dafür, eine SD in den Boxplot einzutragen, fällt mir leider nicht ein, habe ich auch noch nie gesehen, und ich habe schon viele Boxplots gesehen und auch gemacht (mit SAS)

Antwort bewerten Vielen Dank für Deine Bewertung

Was möchtest Du wissen?