Wie kann ich bei R den Mittelwert berechnen, wenn ich zwei Variablen habe?
Ich habe einen Datensatz indem unter anderem Geschlecht und Körpergröße gelistet sind. ich wüsste, wie ich den Mittelwert für die Körpergröße berechnen kann, aber ich soll den Mittelwert für die Körpergröße der Männer berechnen. Bekomme ich eine Art neuen Datensatz dafür? Ich muss danach nämlich auch noch die Standardabweichung, Schiefe und den den Exzess der Männerkörpergröße bestimmen.
Schonmal Danke im Voraus!
1 Antwort
Ich würde dir sehr raten, dich an diesem ausgezeichneten Buch zu orientieren, das sich auf die beliebten Tidyverse-Bibliotheken konzentriert: https://r4ds.hadley.nz/
Wenn dein Datensatz ein Dataframe oder Tibble ist, kannst du so auf die gewünschten Dinge filtern oder gruppieren, etwa nach diesem Schema:
library(tidyverse)
daten |> group_by(geschlecht) |> summarise(groesse_mittel = mean(groesse, na.rm=TRUE))
Mit summarise() kannst du dann auch die Standardabweichung etc. rechnen.
Es gibt in altmodischem R ohne Tidyverse auch andere Möglichkeiten, aber ich würde das heute gar nicht mehr verwenden. Außer das wird z.B. von der Uni verlangt.
Vielen Dank, uns wurde nichts zu Tidyverse gesagt, deswegen denke ich, dass wir es auf die altmodische Art machen sollen. Weißt du zufällig wie das geht?