Das Diktat von Max und Murat?
In der gestrigen Folge von "Hart aber Fair" gab es ein Beispiel: Einen großen Haufen an Lehramtsanwärtern wurden Diktate vorlegt, welche absolut identisch waren. Gleiche Schrift, Fehler, nur der Name war unterschiedlich. Beim einen war es Max, beim anderen Murat. Die Lehrer sollten diese Benoten und haben im Schnitt "Murat" eine Note gegeben welche um 0.3 schlechter war als die von Max. [Das soll dann ein Beweiß für Rassismus sein]
Ich weiß nicht ob ich Spinne oder einen Denkfehler habe... ABER: Fehlt da nicht was? Eine Vergleichsgruppe? Mehrere Testläufe? Oder ist das in diesem Fall unnötig? Und falls es NICHT unnötig ist, wieso ist das keinen aufgefallen? Das musste doch durch so viele Instanzen?
6 Antworten
Du hättest zwar recht, dass man derartiges mehrmals wiederholen sollte, um wirklich ein halbwegs seriöses Ergebnis zu bekommen
Aber
Seien wir mal ganz ehrlich. Sehr viele Lehrer bewerten nicht objektiv sondern subjektiv. Das habe ich in meiner damaligen Schulzeit sehr häufig beobachten können.
Häufig sind es jene, die sich beim Lehrer einschleimen und so sogar wertvolle Tipps bekommen, die sie den anderen Schülern nicht geben. Wenn es dazu noch kommt, dass der Lehrer den Schüler sympatisch vorkommt, dann hat er schon die halbe Miete.
Darum gings zwar nicht, aber stimmt schon. Meine Englischaufsätze werden nicht mehr korrigiert sondern einfach direkt mit 15 Punkten benotet. Lehrer sind halt nur Menschen ^^
ein solcher Test ist ab einer gewissen Anzahl schon aussagekräftig. Wie sollte denn die Vergleichsgruppe aussehen? Und jeder Lehramtsanwärter ist ein Testdurchlauf. Also würde das schon passen. Allerdings hat der Test in diese Fall einen Haken. Bei einem Diktat legt der Lehrer ja vorher einen Notenschlüssel fest, also bei .. Fehlern ist es Note ... Ob nun Murat oder Max diese Anzahl an Fehlern erreichen ist dann egal, denn .. Fehler sind nun mal Note ... Deshalb ist ein Diktat einfach die falsche Wahl für so einen Test, weil die Überprüfung der Anzahl der Fehler einfach rein objektiv erfolgen kann. Interessanter wäre es wenn man einen Aufsatz prüfen lässt der ja viele subjektive Bewertungen beinhaltet.
Warum eine Vergleichsgruppe? Warum mehrere Läufe?
Wichtig für eine wie-auch-immer-geartete Aussage ist die Zusammensetzung der Lehramtsanwärter.
Das wurde in dem Fall dadurch erreicht, dass mehrere Personen die Murats und mehrere Person die Maxs korrigiert haben.
Hätte nur eine Person einen Murat und die andere Person einen Max korrigiert, dann könnte es Zufall gewesen sein.
Dadurch, dass man die Anzahl der Korrektoren aber erhöht hat, wird der Zufall ausgeschlossen bzw. minimiert und die Statistik entsteht.
Vergleichsgruppen könnte man machen in dem man beide Diktate noch von einer Gruppe Lehramtsanwärter aus Sachsen oder von einer Gruppe Lehramtsanwärter mit Migrationshintergrund korrigieren lässt.
Nein wurde es nicht. Hier wurde ein einmaliger Schnitt gezogen. Ein einfacher Kontrollversuch wäre zu überprüfen ob bei zwei Diktaten OHNE Namen ebenfalls Unterschiede vorliegen würden :)
Kommt darauf an, auf welche Aussage Du mit Deiner Studie abzielen willst. Auf die Frage:
Werden Personen mit ausländischen Namen bei gleicher Leistung gegenüber Personen mit deutschen Namen bevor- oder benachteiligt?
Dafür reicht der bisherigen Versuchsaufbau.
Man könnte einer dritten Gruppe Lehramtsanwärter die Klausuren vorlegen, z.B. nur mit zufälligen Zahlencodes versehen.
Dann würde die Fragestellung passen: Beeinflusst die Angabe des Namens auf Klausuren die Korrektur.
Spaßeshalber würde ich statt Max und Murat noch Mandy dazunehmen.
Die Frage bei "Versuchsaufbauten" ist immer: Was will ich mit dem Ergebnis aussagen.
Die beiden Fragen hängen doch zusammen? Die benachteiligung des Ausländers basiert doch nur auf Basis des namens?!
Wenn man die Studie ganz genau einordnen will, dann sagt die Studie nur aus, dass Personen mit dem Namen Murat bei gleicher Leistung schlechter beurteilt werden als Personen mit dem Namen Max.
Das Murat ein Ausländer ist, steht nirgends. Mehr Aussagekraft gäbe es sicher noch durch weitere Namen. Da wird es aber schwierig, denn sobald weibliche Namen hinzugenommen werden, kommt ein neues Kriterium hinzu.
Also im Enddeffekt sagt die Studie... nichts mit dem man arbeiten kann? Außer wenn man jetzt für den spezifischen Fall argumentierne will?
Richtig.
Dem guten alten Winston Churchill wird die Aussage angedichtet: Trau keiner Statistik die Du nicht selber gefälscht hast.
Wenn der Verband der Tabakindustrie und der Verband der deutschen Krankenkasse jeweils eine Studie in Auftrag geben, wie viele durch den Genuss von Tabakwaren sterben. Ich wette mit Dir, da kommen zwei unterschiedliche Ergebnisse raus.
Das Thema berührt eine Frage, die ich schon gestellt habe. Da findest du auch links zur Studie selbst, welche deine Fragen beantworten.
Das Beispiel war ja kein Beweis sondern ein Beispiel. Es zeigt ein Phänomen, das ein Index für (unbewußtem) Rassismus sein kann.
Aber warum verpackt man das als Beweis? Warum gibt man sich die Mühe hunderte einen Versuch machen zu lassen, wenn für ein Beispiel auch... gar kein Versuch notwendig gewesen wäre.
Wer hat das als Beweis für irgendwas angekündigt?
Ist übrigens nicht der erste Versuch in dieser Richtung.
Naja, sie haben als so verpackt. Ich meine sogar, dass die das als Beweis verwenden wollten. Müsste ich in der Mediathek nachschauen. ^^
Naja, du musst doch beweisen, dass es kein Zufall war :)