Frage von vanixx 27.08.2010

Korrelationskoeffizient

  • Hilfreichste Antwort von HWSteinberg 28.08.2010
    1 Mitglied fand diese Antwort hilfreich

    Korrelation kann man gut mit einem Scatterplot veranschaulichen, z.B. Größe auf x- und Gewicht auf y-Achse. Ergibt sich eine Zigarre von links unten nach rechts oben, d.h. ist ziemlich klar, dass größere Größe mit größerem Gewicht korreliert, so geht der Korrelationskoeffizient gegen 1; wenn es genau eine Gerade ergibt (egal wie steil), ist er genau 1. Von rechts unten nach links oben geht er gegen -1. Gibt es mehr oder weniger einen Kreis oder eine waagrechte oder senkrechte Ellipse, so geht die Korrelation gegen 0.

    Hat man Größen, bei denen es nicht auf den genauen Abstand ankommt, z.B Einkommen (etwa gegen Alter), wo die Unterschiede nach unten ja immer kleiner und nach oben immer größer werden - hier würden wenige Werte ganz weit oben die Punktwolke deutlich nach oben verziehen -, ersetzt man die konkreten Zahlen gern durch ihre Rangplätze und berechnet danach den Korrelationskoeffizient, das ist nun der nach Spearman, der mit den ursprünglichen Zahlen ist der nach Pearson

    Die Berechnung ist so: Man nimmt für beide Merkmale den Mittelwert (bei Spearman also den mittleren Rangplatz), zieht ihn für jeden einzelnen Datenpunkt ab und multipliziert dies für beide Merkmale. Damit ergibt sich, wenn beide Merkmale oberhalb vom Mittelwert oder beide unterhalb vom Mittelwert liegen, eine positive Zahl, andernfalls eine negative. Diese Produkte addiert man nun für alle Datenpunkte auf und normiert das mit der Kovarianz, d.h. dass die maximal bzw. minimal mögliche Korrelation 1 bzw. -1 wird.

    Damit ist auch klar, dass viele unterschiedlich gerichtete Paare (x > Mittelwert, y < Mittelwert bzw. umgekehrt) den Korrelationkoeffizienten in Richtung -1 ziehen, gleichgerichtete in Richtung 1 und beide ausgeglichen in Richtung 0.

    Bei dem Beispiel Einkommen wird der Mittelwert durch einige sehr hohe Werte nach oben gezogen, sodass viel mehr Werte unter dem Mittelwert liegen als über ihm. Das wird vermieden, wenn man die Zahlen durch Rangplätze ersetzt. Das beleuchtet auch noch mal den Unterschied bzw. die Adäquatheit von Pearson und Spearman

  • Antwort von alphalpha 27.08.2010
    1 Mitglied fand diese Antwort hilfreich

    Pearson: Geeignet bei Intervallskalenniveau. Berechnet wird der Korrelationskoeffizient für den lineren Zusammenhang zweier Variablen. Wertebereich -1 bis +1 (perfekter negativer bzw. posiver Zusammenhang). Wert 0: Es existiert kein linearer Zusammenhang. Spearman: Realibilitätsanalyse (Zuverlässigkeitsstatistik); überprüft Items oder Variablen, die zu einer gemeinsamen Skala zusammengefasst werden sollen. Ich hoffe, das hilft ein bißchen weiter!

  • Antwort von Pilot00521 17.06.2013

    Ist ganz simpel: r berechnet sich aus Kovarianz geteilt durch die Standardabweichungen. Unterschied Pearson/Spearman s.o.

Du kennst die Antwort? Frage beantworten
Bitte noch eine Antwort ... Frage erneut stellen
Diese Frage und Antworten teilen:

Verwandte Fragen

Fragen Sie die Community –

anonym und kostenlos!