Frage von infernoo1, 32

Korrelationskoeffizient

ist es möglich anhand der korrelationskoeffizient und der mittelwert con 2 unbekannten Random variable diese variablen zu deffinieren?....

hmmm anders formuliert: gegeben ist: 1- korrelationskoeffizient 2- Mittelwert (mu(X) und mu(Y)) gesucht: Random variablen (X und Y).

gibt es dafür ein formel?

danke

Hilfreichste Antwort - ausgezeichnet vom Fragesteller
von ProfFrink, 15

Diese Frage hat mich nicht losgelassen. Darum habe ich mich erstmalig in meinem Leben einmal gründlich mit Korrelation befasst. Die Sache funktioniert so, dass Du eine so genannte Korrelationsmatrix aufstellst. Mit den Elementen

a11 = Varianz(x) , a12 = Kovarianz(x,y)

a21 = Kovarianz(x,y) , a22 = Varianz(y)

Varianz = Standardabweichung von normalverteilten Zahlen zum Quadrat

Berechnungsvorschrift 1/n*Sum( [xi - mµ]^2) 

Die Standardabweichung wäre die Wurzel daraus.

Die Kovarianz wird wie folgt berechnet:

Cov(x,y) = 1/n*Sum([xi-mµx]*[yi-mµy])

Der Korrelationskoffezient  kor = Cov(x,y)/(Wurzel [var(x))*Wurzel[var(y)])

Die Kovarianzmatrix selbst in ihrer bestehenden Form ist noch nicht geeignet eine Simulation zu erstellen. Jedoch handelt es sich um eine positiv definite Matrix, die zudem noch symmetrisch ist. Darum gelingt eine Cholesky-Zerlegung der Matrix. Die untere Dreiecksmatrix ist dann schon geeignet um Korrelationsbindungen zu simulieren. Greift man die untere Zeile heraus und macht gezielte Umformungen, die den Korrelationskoeffizienten als Vorgabe hineinbringt, dann kommt man zu folgendem Formelwerk:

z1 und z2 sind normalverteilte unabhängige Zufallszahlen.

kor ist der Korrelationskoeffizient

y1 = z1 :    Einfache Durchschaltung einer Zufallszahl mit bestimmtem Mittelwert und bestimmter wählbarer Standardabweichung

y2 = kor*z1 + Wurzel(1-kor*kor)*z2

In angehängtem Bild kannst Du das Beispiel einer 85% Korrelation sehen. Der Excel Schieberegler erlaubt die Einstellung des Wertes kor im Wertebereich [-1 .. +1]

Hier noch ein link zur Excelanwendung. Keine Angst es ist trotz Schieberegler kein Makro enthalten.

https://dl.dropboxusercontent.com/u/22840008/korrelation.xlsx

Kommentar von infernoo1 ,

Vielen dank für der ausführliche Antwort.

Antwort
von ProfFrink, 32

Sagen wir einmal: Es gibt ein Konzept.

Am Ende läuft es darauf hinaus, dass Du Dir zuvor einen Zufallsgenerator laufen lässt, der die Zufallsvariablen X oder Y erzeugt. Ich meine entweder X oder Y. Nehmen wir X. Du stellst den Zufallsgenerator so ein, dass Deine Variablen die gewünschten statischen Eigenschaften haben. Also Mittelwert, Standardabweichung und Anzahl der Variablen. Dann nimmst Du die Formel mit der Du den Korrelationskoeffizienten ausrechnest  und betrachtest zunächst nur eine begrenzte Anzahl von Variablen. Meinetwegen 3 Stück. Im nächsten Schritt formulierst Du die Summe aus und zwar für jedes einzelne x. Am Ende erhälts Du drei Gleichungen mit den Variablen y1, y2, y3 . Zur Bestimmung von y1, y2 und y3 ist die Auflösung des Gleichungssystem nötig.

Die nötigen Zufallsgeneratoren und selbst die Möglichkeit der Gleichungsauflösung werden Dir in Excel angeboten.

Kommentar von infernoo1 ,

Das bedeutet es ist nicht möglich die beider zufalls variablen zu bestimmen. Und es muss mindestens 1variable generieren um das zweite zu berechnen.(das habe ich mir schon gedacht)

Nun zu dein Antwort, angenommen ich habe habe die 3 Variablen ausgerechnet wie komme ich nun auf die restlichen variablen?

Beispiel: ich generiere für X 1000 Zufallszahlen danach nehme ich 10 davon und berechne anhand die korrelationskoeffizen die 10 variablen von Y. Wie kann ich dann auf die restlichen zahlen kommen wenn ich auch für Y 1000 zahl habn möchte.

Ich nutze für die berechnung Matlab aber wenn Sie einen Excel beispiel haben dann gerne :)

Kommentar von ProfFrink ,

Hab's gerade mit Excel versucht. Es ist mir nicht gelungen. Habe auch zu wenig Erfahrung mit diesem Zeugs. Ich glaube, ich habe mich hier zu weit aus dem Fenster gelehnt. Vielleicht übernimmt ein anderer den Ball.

Kommentar von ProfFrink ,

Dieses Ding ist wirklich nur mit der Lösung eines Gleichungssystems zu knacken. Du musst Dich schlau machen bezüglich Kovarianzmatrizen. In Deinem Fall wäre das eine 2x2 Matrix. Und diese muss dann mit der Methode der Cholesky-Zerlegung aufgelöst werden. Billiger ist das nicht zu haben. Wenn ich nicht so müde wäre, würde ich das heute noch programmieren.

Kommentar von infernoo1 ,

danke tz :) werde ich mal weiter versuchen :)

Keine passende Antwort gefunden?

Fragen Sie die Community

Weitere Fragen mit Antworten