Wird beim Boxplot der Median in die Quartile miteinbezogen?
Ich hoffe die Frage ist verständlich: Ich habe zum Beispiel 12 Werte, und ermittle den Median, d.h. die 6. und die 7. Zahl.
Dann will ich das untere Quartil berechnen, muss ich nun die 6. Zahl wieder miteinbeziehen, obwohl sie ja zum Median gehört?
3 Antworten
Beispiel:
18 Werte: 11,6,7,8,13,10,8,7,5,2,9,4,4,5,8,2,3,6
sortiert: 2,2,3,4,4,5,5,6,6,7,7,8,8,8,9,10,11,13
davon Median: (6+7)/2 = 6.5
Untere Hälfte: 2,2,3,4,4,5,5,6,6
davon Median: 4 = Q1
Obere Hälfte: 7,7,8,8,8,9,10,11,13
davon Median: 8 = Q3
Min, Max: 2 und 13
Das ergibt folgenden Box-Plot:

Das untere Quartil oder 1. Quartil ist der kleinste Wert, der zusammen mit allen kleineren Werten mindestens 25% der Stichprobe umfasst, und gleichzeitig der größte Wert, der zusammen mit allen größeren Werten mindestens 75% der Stichprobe umfasst. Ob man den Median auch berechnet oder nicht, ist völlig unerheblich. Bei einer Stichprobengröße von 18 ist 25% 4,5, wegen mindestens also der 5. Wert, und die oberen 75% müssen 13,5 Werte enthalten, wegen mindestens also der 14. Wert von oben, was identisch mit dem 5. Wert von unten ist. Hat man hingegen eine Stichprobengröße, die durch 4 teilbar ist wie z.B. 12, dann bilden die untersten 3 Werte genau 1/4, und der 4.-12. Wert, also 9 Zahlen, genau 3/4 der Stichprobe. Sind 3. und 4. Wert nicht gleich, so kann als 1. Quartil nach der genannten Definition jeder Wert zwischen dem 3. und 4. Wert gelten, man nimmt dann praktisch immer, wie es Rammstein53 für den Median getan hat, die Mitte zwischen diesen beiden Werten.
Deine Ausdrucksweise ist übrigens nicht korrekt, der Median ist nicht die 6. und die 7. Zahl, sondern man kann jede Zahl dazwischen, aber nicht die beiden Zahlen selbst (wenn sie nicht dieselben Zahlen sind) als Median nehmen, und nimmt halt meist deren Mittelwert dafür. In diesem Sinne gehört auch nicht die 6. (oder die 7.) Zahl zum Median, sondern der Median liegt bei bzw. über der 6. und bei bzw. unter der 7. Zahl.
Die Zahlen Q1, Median (=Q2) und Q3 werden völlig selbständig berechnet und dann in den Boxplot eingetragen.
Daten verschwinden nicht.
"und ermittle den Median, d.h. die 6. und die 7. Zahl"
Du meinst , du nimmst diese Zahlen und davon den Mittelwert
das kann daher auch eine Zahl sein , die kein Datum ist
.
Q1 , das untere Quartil hat gar nix mit der 6. Zahl zu tun
.
Mit der 3. oder 4. (jenachdem wie ihr die Q definiert habt.
.
25 % der Daten sind kleiner oder gleich diesem Wert. Dann der 3.