RStudio: Datensätze mit unterschiedlicher Anzahl Daten bereinigen?
Hallo
Ich habe zwei Datensätze (beide habe die selben "Beobachtungen" (z.B 1-10), nur der zweite hat zusätzlich mehr als der erste z.B 1-12). Wie kann ich diese zusammenführen, und die zusätzlichen, aus dem zweiten, die nicht mit denen aus dem ersten Übereinstimmen werden gelöst (sodass ich nur 1-10 habe, mit den Werten aus beiden Datensätzen, 11 und 12 brauche ich nicht)?
Die Zahl 1-10 ist nur zum Verständnis es handelt sich um über 500 Werte.
Vielen Dank
1 Antwort
Mir ist nach der Beschreibung nicht ganz klar, wie die Daten ausschauen und in welcher Form sie vorliegen.
Prinzipiell kannst du dafür die diversen Join-Funktionen nutzen: https://dplyr.tidyverse.org/reference/mutate-joins.html
Das wäre der klassische Fall eines Inner Join, d.h. nur wenn es die Gegenparts auf beiden Seiten gibt.
Kannst du mir dabei vielleicht helfen den code zu verstehen? Ich komme mit diesem inner_join nicht ganz draus. Bekomme immer fehler.
z.B Gewinnzahlen von ca 500 Unternehmen, über verschiedene Jahre. Nun hat aber Jahr 2015 z.B 450 Unternehmen und Jahr 2019 hat 490 Unternehmen. Ich möchte die Werte für diese "40" die 2015 noch nicht da waren, löschen.
Also sozusagen die beiden Datensätze vergleichen und wenn Unternehmen X 2015 noch nicht da war, dann sollen diese Gewinndaten nicht übernommen werden.