Habe Korrelationskoeffizient, suche p-Wert...

3 Antworten

A. Vielleicht antwortet hier noch jemand, der sofort weiß, was in diesem Zusammenhang "p-Wert" bedeutet, den man aus "dem X^2" berechnet, und ob und wie dieser mit eine Korrelationsquotienten zusammenhängt. Ich zähle nicht dazu.

Wenn sich so schnell niemand meldet, könnte hilfreich sein, wenn du deine Fragestellung so umformulierst, dass sie definierbare Begriffe enthält.


B. Eine Statistik, die erst überlegt wird, wenn Daten schon erhoben sind, kann allenfalls das Ergebnis zu beschreiben.

Ganz allgemein: Wenn Statistik etwas beurteilen soll, etwa ob zwischen zwei Größen ein Zusammenhang besteht, musst du vor der Datenerhebung festlegen und begründen, warum ein bestimmtes statistisches Verfahren zur Entscheidung über eine Hypothese (bzw. gegen die korrespondierende Nullhypothese) geeignet ist.

Wenn du erst Daten erhebst, dir dann überlegst, was herauskommen kann oder soll, und im dritten Schritt ein Verfahren wählst, das die gewünschte Entscheidung untermauert, ist das Datenmanipulation, und die entsprechende Arbeit wertlos.


C. Im Folgenden gehe ich davon aus, dass das Ergebnis nur anschaulich dargestellt werden soll (keine beurteilende, sondern beschreibende Statistik; diese ist auch nach der Datenerhebung formal zulässig). Sei

n die Anzahl der Studiensubjekte (Umfrageteilnehmer, Bakterien, was auch immer),

k die Anzahl der betrachteten Eigenschaften, die jeweils 5 bis 6 Wertmöglichkeiten haben.

Du kannst die Ergebnisse als n verschiedene k-dimensionale (Spalten-)Vektoren schreiben. Für eines der n Studiensubjekt X (bzw. Y) nimmt jede Vektor-Koordinate x_ i (bzw. y_ i) eine der 5 oder auch 6 Wertmöglichkeiten an.

Um darzustellen, inwieweit die Gesamtheit der Eigenschaften von X und Y übereinstimmt, kannst du den Kosinus des Winkels zwischen den Vektoren X und Y als Maß verwenden. Dieser ist zu berechnen mit:

cos (X, Y) = < X, Y > / ( | X | * | Y | )

= ( ∑ x_ i * y_ i ) / √ ( ( ∑ ( x_ i)² ) * ( ∑ (y _i)² ) );

wobei i = 1,...,k , < X, Y > Skalarprodukt, | X | bzw. | Y | Vektorbetrag .

Dieses Maß des Zusammenhangs zwischen X und Y hat folgende Eigenschaften:

  • Du bekommst immer einen Wert -1 ≤ cos(X, Y) ≤ +1

  • cos(X, Y) kann als Kosinus eines kleinste positiven Winkel φ aufgefasst werden, den zwei Pfeile einnehmen. Dann lässt sich φ = arccos ( cos (X, Y) ) mit der entsprechenden Funktion bestimmen (auf Taschenrechner "cos hoch minus 1"). Das veranschaulicht die Ergebnisse ganz sinnig: Die Pfeile können auseinanderstreben (φ nahe 180°), einander "egal sein", also zueinander quer liegen (φ nahe 90°), oder eng beieinander sein (φ nahe 0°).

  • In der Schulmathematik wird das Verfahren zur Bestimmung des Winkels zwischen Vektoren verwendet; seine anschauliche Bedeutung hat also für k = 2 und k = 3 geläufig (auch für Statistik-Muffel). Der Kosinus ist aber ganz entsprechend für beliebige endliche Dimension definierbar.

Du hast mit B völlig recht! Mit der Berechnung von p ist wohl die Signifikanz gemeint: http://de.wikipedia.org/wiki/P-Wert

0
@murksi1

Danke für den Hinweis. - Nur weiß ich halt nicht, ob die Fragestellerin überhaupt eine Nullhypothese testen will.

Was hilft ihr nun? Theoretisch ließe sich sicher ("so tun, als ob" [das aller vorher passiert wäre], und) eine Hypothese / Nullhypothese formulieren wie etwa:

"Der Korrelationskoeffizient überschreitet (dem Betrage nach) ...".

Aber dann ist wieder die Frage, welcher Wahrscheinlichkeitsfunktion der Korrelationskoeffizienten folgt, und wie die eigentliche Aufgabenstellung diese Wahrscheinlichkeitsfunktion begründet. Nur sagt EinevomTeam bisher dazu nichts.

Wenn es aber doch nur um Beschreibung geht. ... siehe C.

0

Der p-Wert ist eine Kenngröße, die bei statistischen Tests berechnet wird. Deiner Beschreibung nach kann ich leider nicht entnehmen, ob du überhaupt einen durchführst. Allgemein sollte man eine ungefähre Vorstellung davon haben, was man mit den Daten bezweckt und im Notfall einen passenden Test durchführen. Beim Vorliegen zweier Datenreihen lassen sich unterschiedliche Tests bei unterschiedlichen Bedingungen durchführen. Man kann zum Beispiel testen, ob die zuständigen Merkmale gleiche Erwartungswerte haben.

In welchem Winkel müsste man einen 100g schweren Ball von einer Höhe von 1,80m abwerfen, um die maximale Wurfweite zu erreichen?

Mir ist mal wieder eine meiner grandiosen, unnützen Fragen eingefallen, die ich unbedingt beantwortet haben möchte.

Die Wurfbahn hat näherungsweise die Form einer (nach unten geöffneten, breiten) Parabel.

Sagen wir, der Mensch steht am Punkt s₀ und wirft einen Ball mit m = 0,2kg von einer Höhe von 1,80m ab.

Wäre die Wurfbahn exakt eine Parabel, müsste der Öffnungsfaktor nur nahe genug an 0 herankommen, damit die zweite Nullstelle unendlich weit weg ist.

Unendlich weit zu werfen, ist aber logischerweise physikalisch unmöglich.

Es spielen offensichtlich Luftreibung, Wurfkraft, Ballgewicht, Erdanziehungskraft, etc. eine Rolle.

Da ich aber physikalisch nicht ganz so gut veranlagt bin, muss ich euch fragen:

Der Ball hat einen Durchmesser von 4cm und ein Gewicht von 0,2kg.

Da ich keinen plausiblen Wert für die Wurfkraft eines Menschen gefunden habe, muss ich diesen als Variable verwenden.

Die Luftreibung des (angenommen perfekt runden) Balls müsste doch auch einfach zu berechnen sein.

Ich habe aber absolut keinen blassen Schimmer, wie...

Wie berechnet man also, in welchem Winkel man den Ball abwerfen muss bzw. wie groß die Steigung am Punkt s₀ sein muss, damit der Ball maximal weit fliegt?

Danke im Voraus. ;)

LG Willibergi

...zur Frage

Wie kann man den pH-Wert mit dem Taschenrechner herausfinden?

Wie berechnet man den pH-Wert mit dem Taschenrechner?
 

...zur Frage

Was bedeutet der Korrelationswert?

Zum Beispiel in dem Satz:

"Zwischen Schulnoten und Intelligenz besteht eine Korrelation von 0.5."

Heißt das, dass wer einen hohen IQ hat mit einer Wahrscheinlichkeit von 50% auch gute Leistung in der Schule erbringt oder wie?

Was sagt diese Zahl bei Korrelationen aus?

...zur Frage

Statistik: multiple Regression oder Korrelation?

Hallo zusammen,

ich stehe vor zwei Problemen bei der Datenauswertwertung:

1) ich bin mir unsicher ob ich eine Korrelation oder Regression anwenden muss. DIe Situation ist die Folgende:ich muss überprüfen ob die (metrisch skalierten) Variablen A, B und C die (metrisch skalierte) Variable D signifikant beeinflussen (bzw. Zusammenhang besteht, es handelt sich hierbei nur um eine Querschnittsstudie). DIe Variablen sind nicht normalverteilt, daher würde nur eine Rangkorrelation nach Spearman in Frage kommen. Jedoch wendet man bei der Fragestellung normalerweise eine Regression an, richtig? Die unabhängigen Variablen korrelieren nicht miteinander, daher wäre dies möglich. Jedoch sind die Residuen nicht normalverteilt. Arbeite ich dann besser mit einer Korrelation?

2) Mein zweites Problem betrifft die Analyse nach den Moderatoren. Diese sind ebenfalls metrisch skaliert, ich würde diese aber einfach nach mediansplit teilen. Wenn ich nun den Datensatz aufteile und je eine Korrelation bzw Regression durchführe, erhalte ich sehr stark unterschiedliche Korrelationen (Beispiel: Bei Gruppe A ist die Korrelation von A zu D 0,9 und bei Gruppe B ist die Korrelation von A zu D 0,2). Die unterschiede in den Korrelationen müssten eigentlich signifikant sein, jedoch würde ich dies gerne mit einem Test bestätigen bzw auf einer wissenschaftlichen Grundlage arumentieren dass der Unterschied signifikant ist. Ich habe bereits gelesen dass es hier keinen Test in SPSS gibt, aber gibt es eine mathematische Formel? Einen internetrechner würde ich ungern als wisschenaftliche quelle angeben. Bzw. ist es überhaupt korrekt den Moderatoreffekt so zu überprüfen?

Ich bin für jede Hilfe wahnsinnig dankbar!! Viele Grüße, Anna

...zur Frage

Pks wert? pks?

Hallo,

wie berechnet man Pks/Pkb wert im allgemein?

Falls ich ausgangskonz. und pH werten kenne, wie geht es dann?

Danke

...zur Frage

Welche Variablen in Moderatoranalyse bei Regression?

Hallo zusammen,

ich bin mir unsicher welche Variablen ich in meine Analyse aufnehmen muss. Meine Studie ist die Folgende: ich möchte überprüfen, wie Marken werben sollen, d.h. welchen Wert sie den Konsumenten primär bieten sollten um eine Markenbindung zu erreichen. Ich habe hier mit mehrern Items den Unterhaltungswert, den Informationsgehalt und den Ökonomischen Nutzen der Werbung unterschiedlicher Marken abgefragt und ebenfalls die Markenbindung. Somit habe ich 3 unabhängige Variablen und eine abhängige (die Markenbindung). Als Moderator kommen hinzu das Involvement und der expressive sowie der funktionalle Markennutzen. Also zB. wäre herauszufinden ob bei High-involvement Marken der Zusammenhang zwischen dem informationsgehahlt der Werbung und der Markenbindung höher ist als bei low-involvement Produkten. Alle Variablen wurden auf einer 5-stufigen Likert-Skala abgefragt. Ich habe dann jeweils die Items einer Variable addiert und durch die anzahl dividiert um den jeweiligen wert für die Variable zu erhalten (bspw für die höhe der Markenbindung).

Nun möchte ich die Moderatoren testen. Hierfür multipliziere ich je die UV mit der Moderatorvariable und erhalte eine neue Variable (das Produkt dieser, im Folgenden Moderatorprodukt genannt) Nun bin ich mir unsicher, welche Variablen ich genau in die Regression aufnehmen kann: Wenn ich bei Spss eine Regression durführe dann füge ich zum einen die Abhängige Variable Markenbindung ein. Zum anderen füge ich die erklärenden Variablen ein. Ich habe in meinem Modell 3 Unabhängige Variable und 3 Moderatoren. Kann ich quasi alles zusammen prüfen und alle 3 UV und alle 3 Moderatorvariablen sowie die 9 Moderatorprodukte in einer Regression einfügen? Oder muss ich um den Moderatoreinfluss zu testen immer eine einzelne Regression durchführen, in welche ich bei den erklärenden Variablen nur die Moderatorvariable, die UV und das Moderatorprodukt einfüge? Und dies dann 9x (3 UV x 3 Moderatorvariablen) wiederholen, also 9 einzelne Regressionen durchführen um die Moderatoreffekte zu überprüfen. Also ist es so, dass ich: a) eine Regression mit allen 9 Moderatorprodukten durchführen kann (9 erklärende Variablen in Regression)? b) eine Regression mit den 9 Moderatorprodukten sowie den 3 UV und den 3 Moderatorvariablen durchführen (15 erklärende Variablen in Regression)? c) je immer nur ein Moderatorprodukt und der entsprechenden UV und Moderatorvariable (3 erklärende Variablen in Regression)einfügen? Dies würde ich dann 9x wiederholen müssen.

Meine Stichprobe beträgt 270. Die Ergebnisse der Regression mit den 9 Moderatorprodukten (Möglichkeit a) erscheinen mir Plausibel. Wenn ich zusätzlich zu den 9 Moderatorprodukten noch die 3 UV und die 3 Moderatorvariablen in die Regression als erklärende Vraiablen aufnehme (Möglichkeit b), sind meine Ergbnisse komplett anders. Plötzlich sind die Moderatoren so dann nicht mehr signifikant. Ich bin daher verunsichert, welche Variablen ich aufnehmen muss.

Vielen, vielen Dank!!

...zur Frage

Was möchtest Du wissen?