Boxplots?
Ich habe eine Frage über den Boxplots. Und zwar sagt man ja, dass der Boxpott aus vier Abschnitte besteht, die jeweils 25% der Daten ausmachen. So kann man beispielsweise im Bezug auf dieses Beispiel sagen, dass jeweils 25% der Schüler/innen 2 und 3en geschrieben haben. Aber wenn ich 25% ausrechne von den insgesamt 20 Schülern dann stimmt das nicht so ganz mit den Daten, die der Boxplot darstellt überein. Woran liegt das?
So kann man beispielsweise im Bezug auf dieses Beispiel sagen, dass jeweils 25% der Schüler/innen 2 und 3en geschrieben haben.
Wie kommst du darauf?
Weil die Datenmenge vom linken whisker bis zum Quartil jeweiks 25% der Datenmenge ausmachen. Ein Boxplot besteht aus jeweils 4 Teilen, wobei jeder einzelne 25% entspricht!
1 Antwort
Antwort ist recht einfach : je weniger Daten da sind ( je kleiner das n ) , desto ungenauer sind die Quartile .
Man kann eben nicht erwarten, dass die Grenzen von 25 , 50 , 75 genau eingehalten werden.
Das ist aber normal
Ja klar . Sinn ergibt das auch so , wenn man zum Beispiel mehrere SchulKlassen mit Boxplots vergleicht
Wenn man es genauer haben will , dann liest man eben die Verteilung .
Hier liegt mit n = 20 schon ein durch 4 teilbares n vor . Eigentlich Ideal .
Aber es gibt eben nach 5 Daten keinen Sprung von 1 auf 2
Vielleicht noch mal die Definition von Quartilen beachten : Es heißt nicht das unter Q1 GENAU die ersten 25% liegen . Sondern es liegen 25% der Daten darunter .
Also würde die Darstellung als Boxplot nur wirklich Sinn ergeben, wenn viele Daten gegeben wären. Und um so mehr Daten, desto genauer die statistischen Kennzahlen?