Statistik: Varianz und Vertrauensbereich

...komplette Frage anzeigen

3 Antworten

Tut mir leid, aber sie haben fast gar nichts, jedenfalls inhaltlich, miteinander zu tun, allerdings hängen sie rechentechnisch schon zusammen.

Die Varianz ist eine von mehreren Kenngrößen einer Verteilung und soll eine Schwankungsbreite darstellen. Nimmst Du zum Beispiel die Körpergrößen aller ausgewachsenen Männer in Deutschland, so gibt es hier einen Mittelwert und eine "Standardabweichung", d.h. eine Art Mittelwert aller Abweichungen der einzelnen Körpergrößen von diesem Mittelwert. Die Varianz ist das Quadrat dieser Standardabweichung. Zum Berechnen nimmt man die quadrierten Abweichungen vom Mittelwert und dann deren Mittelwert, man berechnet also erst die Varianz und daraus als Wurzel die interpretatorisch geeignetere Standardabweichung. Quadrate nimmt man hier, da das Berechnen und vor allem weitere Ableitungen davon einfacher sind.

Der Vertrauensbereich oder das Konfidenzintervall spielt erst dann eine Rolle, wenn man eine Stichprobe aus der Grundgesamtheit zieht, um eine Kenngröße der Verteilung zu schätzen. Will man z.B. die mittlere Körpergröße der vielleicht 35 Millionen ausgewachsenen deutschen Männer schätzen, könnte man eine Stichprobe von 1000 oder 10000 oder ... Männern ziehen, deren mittlere Körpergröße berechnen und annehmen, dass diese Schätzung mit dem Wert in der Grundgesamtheit übereinstimmt, was natürlich nicht immer der Fall sein muss. Daher möchte man hier ein Intervall um den Schätzwert herum angeben, in dem der tatsächliche Wert mit z.B. 95%-iger (auch 90% oder 99% sind üblich) Sicherheit liegt. Wenn man nun ein paar Annahmen über die Verteilung der Körpergröße trifft, kann man das tatsächlich abschätzen. Z.B. kann man annehmen, dass die Körpergröße in der Grundgesamtheit der 35 Millionen normalverteilt ist und eine bestimmte Varianz hat. Dann bezeichnet man die mittleren 95% der Normalverteilung mit dem Stichprobenmittelwert und der Grundgesamtheitsvarianz, geteilt durch die Stichprobengröße, als das 95%-Konfidenzintervall (In Deiner Ausdrucksweise: Stichprobenmittelwert +- 1,96*Grundgesamtheitsstandardabweichung / Wurzel (n) ). Man lässt hier also die rechten und linken 2,5%-Schwänze weg. In der Regel wird man aber auch die Grundgesamtheitsvarianz nicht kennen und abschätzen müssen, dazu nimmt man wiederum die Stichprobenvarianz zu Hilfe, die natürlich auch mit einer Schätzunsicherheit behaftet ist. Dies führt dann dazu, dass man, noch immer Normalverteilung in der Grundgesamtheit vorausgesetzt, das Konfidenzintervall für den Grundgesamtheits-Mittelwert aus einer Normalverteilung mit der Stichprobenvarianz, diesmal geteilt durch Stichprobengröße - 1 (also 999 bzw 9999 mit obigen Zahlen), nimmt, also praktisch kein Unterschied in großen Stichproben. Verlässt man nun noch die Annahme einer Normalverteilung, so hat man trotzdem nicht verloren, da nach dem "zentralen Grenzwertsatz" die Verteilung der Mittelwerte aus Stichproben, die "groß genug" sind, doch annähernd normal ist, egal was für eine Verteilung der Einzelwerte in der Grundgesamtheit vorliegt. Klar wird ja hier auch , wie Du sagst, je größer die Stichprobe, desto kleiner der Vertrauensbereich, und das ist doch sogar sehr sinnvoll! Und auch klar wird, je kleiner die Varianz in der Grundgesamtheit, desto kleiner der Vertrauensbereich für einen Stichprobenmittelwert. Im Übrigen heißt 95%-Vertrauensbereich, dass 95% aller denkbaren Stichproben aus der Grundgesamtheit ihren Mittelwert in diesem Bereich um den Grundgesamtheits-Mittelwert haben, die 5% weiteren denkbaren Stichproben liegen daneben (man könnte ja das äußerst unwahrscheinliche Pech haben, im Lotto zu gewinnen - äh ich meine die 1000 größten Männer in der Stichprobe zu erwischen).

Zusammenfassend: Die Varianz ist ein Maß für die Schwankungsbreite einer Verteilung, der Vertrauensbereich ein Maß für die Schätzgenauigkeit einer Kenngröße einer Verteilung, wobei diese Kenngröße vieles sein kann, meist der Mittelwert, aber auch die Varianz selbst, oder z.B. Median, Quartile, Schiefe und alle möglichen sonstigen Kenngrößen. Vertrauensbereiche für die Schätzgenauigkeit solcher anderen Kenngrößen sind allerdings nicht so geläufig.

Wenn du eine Messung gemacht hast gibst eine Messunsicherheit an und, wenn dieses nicht Vorgegeben ist, das Vertrauensniveau (Vertrauensbereich). Als Messunsicherheit verwendest du n-fache der Standartabweichung. Ist n = 1 (also Messunsicherheit einfach nur Standartabweichung) entspricht das einem Vertrauensniveau von 68%, was bedeutet das eine erneute Messung mit 68%iger Wahrscheinlichkeit wieder innerhalb deiner Messunsicherheitsgrenzen liegt.

Zur zweiten frage: Wenn man mehrere Messwerte hat, kann man von diesen die Standartabweichung (in deiner frage s) und den Mittelwert m berechnen. s ist aber die Standartabweichung der einzelmessung, du willst aber am Ende sagen "Ergebnis = m +- s", du benötigst also die "Standartabweichung des Mittelwertes". Diese erhält man indem man s/sqrt(n) rechnet, mit n = Anzahl der Einzelmessungen.

kurz und versztändlich! Danke

0

Den Vertrauenbereich nennt man auch den Konfidenzintervall. Hier wird die Grenzen des Bereichs in dem die gültigen Messwerte liegen sollen geschätzt und in Prozent ausgedrückt. Werte ausserhalb des Konfidenzbereich werden ignoriert..

Das ist der Unterschied zur Varianzanalyse, den hier werden alle Meßwerte mitgenommen.

Was möchtest Du wissen?