SPSS statistik regression?
Hallo kennt sich hier jemand mit SPSS aus?
ich habe meine Daten bereits vorbereitet und wollte eine lineare regression machen. Hab die Mittelwerte ausgerechnet.
Mein Problem ist, dass die Voraussetzungen der linearen Regression nicht erfüllt sind und auch nur teils durch die Transformation einer Variable.
Kann mir bitte einer einen Ratschlag geben, was ich jetzt machen soll..
Danke danke danke
1 Antwort
Klingt weniger nach einer speziellen SPSS-Frage als nach einer allgemein statistischen Frage?
Welche Forschungsfrage soll Deine Regression beantworten? Wie groß ist Deine Stichprobe und wie viele unabhängige Variablen hast Du?
Welche Voraussetzungen meinst Du sind nicht erfüllt? Da gib es oft Missverständnisse.
Transformieren sollte man in aller Regel sein lassen, wenn es dafür keinen sachlichen Grund gibt (also nicht beliebig herumtransformieren wegen vermeintlich nicht erfüllter Annahmen).
Was wird mit Pearson bezeichnet, der standardisierte Regressionskoeffizient beta? Und aus der Beschreibung wird nicht klar, ob eine multiple Regression mit 3 Prädiktoren oder drei einfach lineare Regressionen gerechnet werden.
Normalverteilt sollen nicht Variablen, sondern die Modellfehler (Residuen) sein (und zwar in der Grundgesamtheit, aus der die Daten stammen). Bei n > 30, spätestens n > 50 ist das aber egal, dann schaden nicht-normalverteilte Residuen der Zuverlässigkeit des F-Tests und der Tests der Koeffizienten nicht.
Welches der vielen möglichen Streudiagramme Du meinst, weiß ich leider nicht, ich rate mal, ist es vorhergesagter Wert vs. tatsächlicher Wert der AV? Residuen versus AV-Werte? Wenn Deine abhängige Variable exakt 9 Stufen hat, ergibt es sich da doch zwangsläufig, dass das Diagramm so aussieht. Das hat mit Nichtlinearität aber nichts zu tun.
NB sind nicht Variablen linear, sondern Beziehungen zwischen Variablen, darauf solltest Du bei der Formulierung achten (Gutachter könnten Anstoß nehmen).
Danke erstmal für die Antwort!
Meine abhängige Variable ist das Burnout-Risiko und die unabhängigen Variablen sind Neurotizismus, Studienzufriedenheit und Selbstmitgefühl.
Die Hypothesen sind dann also:
N begünstigt Burnout
SZ verringert Burnout
SM verringert Burnout
hab standardisierte Tests verwendet (n=167)
Wenn ich nun die lineare regression mache, dann zeigt sich ein positiver zusammenhang. Beispiel: Neurotizismus und Burnout-Risiko Korrelation (Pearson): .491 und siginifikant/ Rquadrat ist .241.
So und es gibt ja jetzt für die Regression voraussetzungen. Heißt, die müssen linear und normalverteilt sein… der Shapiro Wilk test zeigt aber keine normalverteilung und das streudiagramm sieht auch ganz seltsam aus. da bilden sich 9 reihen mit punkten die gestapelt sind. also sieht auch nicht aus als würden die variablen linear sein
Was mach ich hier falsch?…