Korrelationskoeffizient

...komplette Frage anzeigen

2 Antworten

Diese Frage hat mich nicht losgelassen. Darum habe ich mich erstmalig in meinem Leben einmal gründlich mit Korrelation befasst. Die Sache funktioniert so, dass Du eine so genannte Korrelationsmatrix aufstellst. Mit den Elementen

a11 = Varianz(x) , a12 = Kovarianz(x,y)

a21 = Kovarianz(x,y) , a22 = Varianz(y)

Varianz = Standardabweichung von normalverteilten Zahlen zum Quadrat

Berechnungsvorschrift 1/n*Sum( [xi - mµ]^2) 

Die Standardabweichung wäre die Wurzel daraus.

Die Kovarianz wird wie folgt berechnet:

Cov(x,y) = 1/n*Sum([xi-mµx]*[yi-mµy])

Der Korrelationskoffezient  kor = Cov(x,y)/(Wurzel [var(x))*Wurzel[var(y)])

Die Kovarianzmatrix selbst in ihrer bestehenden Form ist noch nicht geeignet eine Simulation zu erstellen. Jedoch handelt es sich um eine positiv definite Matrix, die zudem noch symmetrisch ist. Darum gelingt eine Cholesky-Zerlegung der Matrix. Die untere Dreiecksmatrix ist dann schon geeignet um Korrelationsbindungen zu simulieren. Greift man die untere Zeile heraus und macht gezielte Umformungen, die den Korrelationskoeffizienten als Vorgabe hineinbringt, dann kommt man zu folgendem Formelwerk:

z1 und z2 sind normalverteilte unabhängige Zufallszahlen.

kor ist der Korrelationskoeffizient

y1 = z1 :    Einfache Durchschaltung einer Zufallszahl mit bestimmtem Mittelwert und bestimmter wählbarer Standardabweichung

y2 = kor*z1 + Wurzel(1-kor*kor)*z2

In angehängtem Bild kannst Du das Beispiel einer 85% Korrelation sehen. Der Excel Schieberegler erlaubt die Einstellung des Wertes kor im Wertebereich [-1 .. +1]

Hier noch ein link zur Excelanwendung. Keine Angst es ist trotz Schieberegler kein Makro enthalten.

https://dl.dropboxusercontent.com/u/22840008/korrelation.xlsx

85% Korrelation - (Mathematik, Korrelationskoefficient)
Antwort bewerten Vielen Dank für Deine Bewertung
Kommentar von infernoo1
10.12.2015, 10:48

Vielen dank für der ausführliche Antwort.

0

Sagen wir einmal: Es gibt ein Konzept.

Am Ende läuft es darauf hinaus, dass Du Dir zuvor einen Zufallsgenerator laufen lässt, der die Zufallsvariablen X oder Y erzeugt. Ich meine entweder X oder Y. Nehmen wir X. Du stellst den Zufallsgenerator so ein, dass Deine Variablen die gewünschten statischen Eigenschaften haben. Also Mittelwert, Standardabweichung und Anzahl der Variablen. Dann nimmst Du die Formel mit der Du den Korrelationskoeffizienten ausrechnest  und betrachtest zunächst nur eine begrenzte Anzahl von Variablen. Meinetwegen 3 Stück. Im nächsten Schritt formulierst Du die Summe aus und zwar für jedes einzelne x. Am Ende erhälts Du drei Gleichungen mit den Variablen y1, y2, y3 . Zur Bestimmung von y1, y2 und y3 ist die Auflösung des Gleichungssystem nötig.

Die nötigen Zufallsgeneratoren und selbst die Möglichkeit der Gleichungsauflösung werden Dir in Excel angeboten.

Antwort bewerten Vielen Dank für Deine Bewertung
Kommentar von infernoo1
03.12.2015, 19:23

Das bedeutet es ist nicht möglich die beider zufalls variablen zu bestimmen. Und es muss mindestens 1variable generieren um das zweite zu berechnen.(das habe ich mir schon gedacht)

Nun zu dein Antwort, angenommen ich habe habe die 3 Variablen ausgerechnet wie komme ich nun auf die restlichen variablen?

Beispiel: ich generiere für X 1000 Zufallszahlen danach nehme ich 10 davon und berechne anhand die korrelationskoeffizen die 10 variablen von Y. Wie kann ich dann auf die restlichen zahlen kommen wenn ich auch für Y 1000 zahl habn möchte.

Ich nutze für die berechnung Matlab aber wenn Sie einen Excel beispiel haben dann gerne :)

0

Was möchtest Du wissen?