Ist bei einem t-Test für unabhängige Stichproben die Gruppengröße wichtig?

2 Antworten

Hm - ob der kritische Wert für Normalverteilung tatsächlich bei nur 50 liegt, ist umstritten, einige Untersuchungen setzen die Grenze bei N = 1000! - Zum Problem selbst: Auf die Schnelle find ich da keine Belege, kannst Du was mit Wilcoxon's Rank-Sum Test anfangen? (z.B. http://www.lrz-muenchen.de/~wlm/ilm_w4.htm oder auch bei Wiki)

Das mit dem N=50 habe ich aus Eckstein, 2008, Angewandte Statistik mit SPSS. Da meine Gruppen doch deutlich größer sind als 50 hab ich das mal so akzeptiert. Die grundsätzliche Frage, ob die Gruppengröße beim unabhängigen t-Test eine Rolle spielt, bleibt also erstmal weiter bestehen :) Den Rank-Sum-Test kenne ich noch nicht, schaue ich mir aber gleich mal an. Dann kann ich ja auch mal gucken, ob sich die Ergebnisse stark vom t-Test unterscheiden. Danke!

0

Zu Deiner Frage betreffend Vergleich zweier Gruppen mit verschiedenen Stichprobengrössen: Das steht in jedem Statistik-Lehrbuch und auch im Wiki: http://de.wikipedia.org/wiki/T-Test. Zuerst musst Dir im klaren sein, ob es sich um unabhängige oder verbundene (abhängige) Stichproben handelt. Falls die Daten nicht normalvereilt sind, kannst Du im Fall von 2 unabhängigen Stichproben den Mann-Whitney-U-Test (=Wilcoxon-Rangsummentest) verwenden, bei abhängigen den Wilcoxon-Vorzeichen-Rang-Test. Betreffend der Frage der Normalverteilung: Falls die Grundpopulation NICHT normalverteilt ist, kann trotzdem angenommen werden, dass der Mittelwert einer Stichprobengrösse ab 30 (nach meinen Angaben) normalverteilt ist. Die tiefere Begründung liegt im zentralen Grenzwerttheorem. Wenn die Stichprobengrösse kleiner als 30 ist, so muss VORAUSGESETZT werden, dass die Grundpopulation normalverteilt ist. Wenn das der Fall ist, dann so haben die Stichprobenmittelwerte (n<30) eine t-Verteilung. Noch eine dritte Bemerkung: Du hast ja ziemlich grosse Stichproben. Bilde ein Histogramm und schaue nach, ob die Daten langschwänzig sind. Wenn dass der Fall sind, kannst Du die Daten transformieren (log oder Wurzel oder Potenz, dann wieder mit Histogramm überprüfen). Es ist z.B. üblich, dass bei Zähldaten die Wurzel gezogen wird, bei Prozentwerten den arcsin etc., nachzulesen z.B. im Lothar Sachs, angewandte Statistik).

Danke für die Antwort (auch noch mal an Silmarillion). Entschuldigung, dass hatte ich oben nicht geschrieben: Die Stichproben sind unabhängig. Deswegen hatte ich ja auch den t-Test für unabhängige Stichproben gemacht, jeweils ohne NV-Test (wegen der SP-Größe) und mit Levene-Test (Varianzhomogenität). Das mit dem Mann-Whitney-U-Test schaue ich mir noch einmal an, allerdings hat ein erster Durchlauf im SPSS sehr komische Ergebnisse gelieftert (MW war ca. um Faktor 100 zu groß) Langschwänzigkeit von Daten habe ich auch noch nie gehört, klingt interessant. Den Sachs habe ich leider nicht, aber ich gucke mal, was ich sonst so finde.

Ob mein Vorgehen im Grundsatz aber richtig ist weiß ich jetzt immer noch nicht so genau. Daher noch mal kurz: Ist der t-test für unabhängige SPn unter folgenden Voraussetzungen (auch) ok: *zwei unabhängigen SPn mit deutlich unterschiedlicher Größe *auf NV-Prüfung wird verzichtet *Varianzhomogenität liegt vor

0
@studibubi

Wenn die Abweichung von der Normalverteilung sehr stark ist (z.B. vollkommen unsymmetrisch), ist der t-Test ungeeignet. Bei so großen Stichproben wie Du sie hast ist der Rangsummentest praktisch gleichwertig mit dem t-Test falls doch Normalverteilung vorliegt, und wenn nicht, auf jeden Fall vorzuziehen. Mit der Gleichwertigkeit meine ich die Power, d.h. tatsächlich vorhandene Gruppenunterschiede mit dem Test auch zu entdecken.

Im übrigen glaube ich nicht, dass Du bei einem Wilcoxon-Rangsummentest mit SPSS einen MW geliefert bekommst, wahrscheinlich ist es der U-Wert, der mit dem mittleren RANGPLATZ, nicht mittlerem Wert, irgendwie zusammenhängt. Der kann natürlich ganz unterschiedlich sein. Bei diesem Test werden nämlich aus den Daten beider Gruppen, auf- oder absteigend sortiert nach der Größe, zusammen Ränge gebildet, d.h. Zahlen von 1 bis N1+N2, wenn N1 und N2 die beiden Gruppengrößen sind, in Deinem Fall also 1 bis 700. Dann werden diese Rangplätze wieder ihren Gruppen zugeordnet, und der Test prüft praktisch, ob sich die Ränge der beiden Gruppen gut durchmischen, oder ob eine Gruppe zu höheren Rängen als die andere neigt. Da hier alle Werte, also ganzen Zahlen, nach Definition gleiche Abstände zum Nachbarn haben (nämlich 1), entsteht hier auch keine Verteilungsfrage (NV ja/nein), es gibt keine Bereiche, wo die Zahlen dichter oder weniger dicht liegen; Histogramme wären überall gleich hoch.

Bei beiden Tests spielt die Unterschiedlichkeit der Gruppengröße definitiv keine Rolle für ihre Eignung, solange beide eine Mindestgröße haben. Diese Mindestgrößen sind aber viel kleiner als Deine. Die Größen sind viel mehr für die Power der Tests relevant

0
@HWSteinberg

ganz herzlichen Dank nochmal für die ausführliche Antwort! dann werde ich mir den mann-whitney-u-test (bzw wilcoxon rangsummen test) noch mal anschauen, wenn der so deutliche vorzüge hat. hatte nur nicht ganz begriffen, wo ich da die für mich wichtigen kennwerte finde, aber das sollte ja rauszubekommen sein... :)

0

Welchen Test für Unterschiedshypothese?

Hallo zusammen,

im Rahmen meiner Bachelorarbeit mache ich eine Kundenzufriedenheitsanalyse mittels Fragebogen. Nun habe ich Gruppe A (8 Mitarbeiter) und Gruppe B (100 Kunden) den selben Fragebogen ausfüllen lassen und den Median jeder Frage berechnet, um herauszufinden ob sich die Ergebniss der Gruppe A mit denen der Gruppe B decken. Weiß jemand welchen Test man anwenden kann, um herauszufinden ob sich die Antworten von Gruppe A und Gruppe B decken oder unterscheiden? Bin für jede Hilfe dankbar.

...zur Frage

Wie gebe ich Daten in SPSS (Statistikprogramm) ein, wenn ich zwei Verschiedene Erhebungszeitpunkte habe?

Ich schreibe gerade meine Bachelorarbeit über das Thema Vorlesen und Spracherwerb. Jetzt habe ich meine Erhebung schon gemacht und habe nun logischerweise zwei Erhebungszeitpunkte. Vor dem Vorlesen und nach dem Vorlesen. Ich habe vorher und nachher den selben Fragebogen mit den Kindern gemacht. Da es in meiner BA darum geht nur bestimmte Wörter in den Wortschatz zu integrieren, habe ich 6 Wörter ausgewählt und zu jedem Wort 4 Beispielsätze vorbereitet. Die Kinder mussten mir dann immer sagen, ob die Sätze so stimmen oder nicht (z.B. "Die Maus ist groß").

Variabeln wie "Geschlecht", "Alter" und "Personenkennziffer" sind ja sehr leicht einzugeben, aber wie kann ich ausdrücken, dass es zwei verschiedene Zeitpunkte gab? Mir ist klar, dass ich dann einen T-Test für unabhängige Stichproben machen muss, aber ich muss es erst man hinbekommen die Daten einzugeben.

...zur Frage

T-Test:abhängig oder unabhängig Stichprobe?

Hallo, ich habe eine empirische Untersuchung durchgeführt. Es gibt zwei Stichproben Gruppe 1 (Experimental-) und Gruppe 2 (Kontrollgruppe). Es findet eine Eingangsmessung statt und nach mehreren Wochen eine Ausgangsmessung.Messen möchte ich die Veränderung der Maximalkraft. Handelt es sich bei den Stichproben um eine anhängige oder unabhängige Stichprobe? Ist es richtig, dass ich zur Auswertung den t-test für unabhängige Stichproben wähle. Vielen Dank

...zur Frage

Was möchtest Du wissen?