Hallo,
man könnte es sich ja einfach machen und sagen: 40 % von 500 sind 200.
Finde ich unter den 500 Befragten mehr als 200, die sich den Klingelton heruntergeladen haben, ist der Anteil höher als 40 %.
So geht's natürlich nicht, denn es kann ja sein, daß die Quote auf alle Handybenutzer bezogen zwar bei 40 % liegt, daß man aber bei der Stichprobe zufällig überdurchschnittlich viele Klingeltonkäufer erwischt hat.
Die Frage, womit sich ein solcher Hypothesentest beschäftigt, lautet: Wo kann ein Ergebnis noch als zufällig angesehen werden; wo deutet es auf eine tatsächlich erfolgte Änderung hin, also: Wo hört der Zufall auf?
Entscheidet man sich etwa für eine Irrtumswahrscheinlichkeit von 10 %, bedeutet das, man läßt alle Ergebnisse durchgehen, die innerhalb von 90 % Wahrscheinlichkeit entstehen können. Erhält man ein Ergebnis, das außerhalb dieser Grenze liegt, also höchstens noch in 10 % aller Fälle zufällig entstehen kann,
hält man das für signifikant und sieht als erwiesen an, daß sich die Quote tatsächlich erhöht hat und das Ergebnis nicht nur rein zufällig entstanden ist.
Dazu betrachtet man die berühmte Glockenkurve der Standardnormalverteilung. Die gibt an, wie groß die Wahrscheinlichkeit für eine bestimmte Abweichung vom Erwartungswert ist. Dabei hat der Erwartungswert den höchsten Ausschlag, davor und dahinter geht's nach unten und nähert sich der Null an.
Erwartungswert ist hier 200. Die Wahrscheinlichkeit, daß man bei der Befragung zwischen 0 und 200 Klingeltonkäufer antrifft, liegt bei 50 %.
Zwischen 0 und 210 findet man zu etwa 82 %.
Zu 90 % findet man zwischen 0 und 214 Klingeltonkäufer.
Ab dem 215. steigt die Wahrscheinlichkeit auf über 90 % und überschreitet damit den Bereich, den man dem Zufall zugestanden hatte, denn ab 215 Nutzer sinkt die Wahrscheinlichkeit auf unter 10 %, daß man zufällig auf sie stößt.
Wie kommt man auf die Prozentzahlen? Indem man uzunächst die Standardabweichung berechnet. Die wäre bei der Standardnormalverteilung die Wurzel aus dem Produkt von Erwartungswert (200) und der Gegenwahrscheinlichkeit von 40 %, also 60 % (100-40) oder 0,6.
Wurzel aus 200*0,6 ist etwa 10,95. Das ist eine Standardabweichung.
Nun kann man in einer Tabelle für die Verteilungsfunktion der Standardnormalverteilung nachschlagen, zu welcher Abweichung in Standardabweichungen vom Erwartungswert welcher Prozentsatz gehört.
Ebenso kann man natürlich nachschlagen, welche Abweichung zu einem bestimmten Prozentsatz gehört. Zu 90 % gehört laut Tabelle der Wert 1,28.
1,28*10,95=14,016, was abgerundet 14 ergibt. Mit 14 Klingeltonnutzern über dem Durchschnitt wäre das Ergebnis zu 90 % Wahrscheinlichkeit noch im Rahmen einer zufälligen Abweichung nach oben zu erwarten, falls der Anteil bei 40 % liegt; ab 15 überm Schnitt müßte man den Toleranzbereich auf über 90 % erweitern, wodurch das Risiko stiege, daß man eine tatsächliche Erhöhung der Quote auch noch als Zufall abtut und die Hypothese - die Quote hat sich erhöht - verwirft, obwohl sie eigentlich richtig war.
Natürlich würde ich andererseits in fast 10 % aller Fälle falschliegen, falls ich die Hypothese annehme, obwohl sie falsch ist, denn theoretisch kann ich bei 40 % Quote bei der Stichprobe auch mehr als 214 mit Klingelton erwischen. Sogar alle 500 könnten zusätzliche Klingeltöne erworben haben, obwohl der tatsächliche Durchschnitt aller Nutzer immer noch bei nur 40 % läge. Das wäre aber unwahrscheinlicher als ein Sechser beim Lotto, sogar sehr viel unwahrscheinlicher.
Bei den Hypothesentests muß man sich also entscheiden, welchen Toleranzbereich man wählt. Die Gefahr eines Irrtums ist in jedem Fall gegeben - man möchte das Risiko dafür aber möglichst klein halten, ohne daß die ganze Rechnung völlig weltfremd wird. Die 10 % Irrtumswahrscheinlichkeit sind also ein Kompromiss.
Wähle ich den Toleranzbereich zu hoch, übersehe ich leichter eine tatsächliche Quotensteigerung; wähle ich ihn zu niedrig, kann ich zu leicht eine Erhöhung feststellen, die in Wirklichkeit gar nicht da ist. Bei 201 Klingeltonnutzern bereits zu jubeln wäre das Ergebnis eines viel zu kleinen Toleranzbereiches.
Herzliche Grüße,
Willy