Frage zu Korrelationskoeffizient?

1 Antwort

Vom Fragesteller als hilfreich ausgezeichnet

Der Korrelationskoeffizient ist wie folgt definiert



Die Standardabweichungen sqrt(var(x)) und sqrt(var(y)) werden entweder mit n (Standardabweichung der Grundgesamtheit) oder (n-1) (Standardabweichung der Stichprobe) im Nenner berechnet. Diese Unterscheidung macht nur bei kleinen Stichproben Sinn.

Weil die Verwendung des Teilers n bzw. (n-1) auch bei der Berechnung der Covarianz eingeht, kürzt sich dieser Teiler beim Korrelationskoeffizient heraus, spielt also keine Rolle (erste Formel in der Frage).

In der zweiten Formel ist cov(x,y) exakt mit dem Teiler n dargestellt. Das muss dann aber auch für die Terme Sx und Sy gelten, d.h. vor den Summen in den beiden Wurzeln muss dann ebenfalls der Faktor 1/n stehen.

ch56789  28.07.2019, 15:56

Oder man könnte es so sagen: Bei der oberen Formel das 1/n wurde gekürzt. (Nachdem man jeweils 1/Wurzel(n) aus den Wurzeln der Varianzen im Nenner gezogen hat.)

Dabei sieht man auch sehr schön, dass es für den Korrelationskoeffizient egal ist, ob man die Standardabweichung/Kovarianz der Grundgesamtheit (1/n) oder die der Stichprobe (1/(n-1)) verwendet. Der Korrelationskoeffizient ändert sich nicht, solange man bei Kovarianz und Standardabweichung gleich vorgeht.

1