a) lässt sich für λ≥1 tatsächlich durch die Ableitung zeigen, sie ist immer negativ:



Der erste Summand ist negativ und bis auf den Vorfaktor -λ, der ≤-1 ist, und den letzten Summanden unter dem Summenzeichen gleich dem 2. Summanden, er enthält damit sogar einen Summanden mit negativem Vorzeichen mehr. Für 0<λ<1 ist damit, lasst man vorne den Summanden für k=x weg, die Summe positiv, und dass dieser letzte Summand das wettmacht, ist mir nicht gelungen zu zeigen. In Excel habe ich die streng fallende Monotonie aber mit λ=0.1, 0.2, 0.3, 0.4, 0.5 und 1 bestätigen können. Ob man da irgendwie benutzen kann, dass unter dem Summenzeichen der Beginn der Talorreihe von e^λ steht, ist mir nicht klar.

b) nach https://de.wikipedia.org/wiki/Poisson-Verteilung Abschnitt Konfidenzintervall scheint man die Chi²-Vertelung zu benötigen.

c) hier weiß ich über meine Excel-Berechnung nur, dass für λ=5 Werte von x≥9 eine Ws von 1-0,9319 = 0,0681, und Werte von x>9 eine Ws von 1-0,9682 = 0,0378 haben, aber mir ist nicht ganz klar, ob das die Frage trifft. Es geht ja wohl darum, bei festem x ein λ zu schätzen, nicht umgekehrt.

...zur Antwort

Ich denke Du hast hier Binomialverteilungen mit p=0,15% und jeweils n=2000 und n=4000. Da die Std.Abw. Wurzel(n*p*(1-p)) ist, sind sie verschieden. Wenn Du das standardisieren, relativieren, willst unabhängig von n, müsstest Du durch n teilen, sodass bleibt: Wurzel(p*(1-p)/n). Ist doch klar, je größer die Stichprobe (2000 bzw. 4000 Wörter) und p bleibt gleich, desto gesicherter ist der Falsch-Anteil, streut also geringer um den "wahren" Wert (p) herum.

Man könnte sich auch auf den Standpunkt stellen, die Varianz (also ohne Wurzel) an der Stichprobengröße zu relativieren, dann bleibt tatsächlich einfach p*(1-p) übrig

...zur Antwort

Irgendwie kann da was nicht stimmen. Die Likelihood-Funktion ist definiert auf einem oder mehreren unbekannten Parameter(n) einer Verteilungsfamilie wie MW und StD bei Normalverteilung oder p bei der Binomialverteilung. Hier gibt es keinen unbekannten Parameter, die Zähldichte ist ja



Uniform heißt ja, dass jedes Ergebnis die gleiche Ws hat, und da es 3N+1 mögliche Ergebnisse gibt, ist die Einzel-Ws eben 1/(3N+1). Wenn ich eine Stichprobe (by the way, was ist eine mathematische Stichprobe im Ggs zu einer allgemeinen Stichprobe?) der Größe n habe, werden alle n Einzel-Ws für die Stichprobe multipliziert, mit n Ziehungen, alle ja gleiche Ws, ergibt sich hier also

und das wird niemals 0 und hat auch keine Ableitung, mit der ich einen ML-Schätzer für - ja für welchen Parameter? - bestimmen könnte.

P.S. nach 5 Minuten:

Man könnte allerdings N als unbekannten Parameter betrachten, und dann bekäme man eine maximale Likelihood, wenn N möglichst klein ist. Dazu nimmt man aus der Stichprobe Minimum xmin und Maximum xmax und nimmt dann das kleinste ^N, für das gilt ^N ≤ xmin und xmax ≤ 2(^N). Eine sehr eigenwillige Aufgabenstellung.

...zur Antwort

Sie soll bei der Einschätzung helfen, wie weit "durchschnittlich" die Werte um den Mittelwert auseinanderklaffen. Besser nimmt man allerdings die Standardabweichung dazu, deren Wurzel, denn nur die hat die gleiche Maßeinheit. Wenn man was in cm misst, hat die Varianz cm², nur deren Wurzel wieder cm, sodass man MW und Varianz in Relation betrachten kann.

Warum quadriert man aber überhaupt für die Varianz die Abstände zum MW, bevor man diese zur Varianz mittelt? Weil ohne die Quadrierung der mittlere Abstand zum MW 0 wäre, es gibt ja Abweichungen nach oben und nach unten, und der MW ist ja gerade so definiert, dass die sich ausgleichen.

...zur Antwort

Wenn es um die Wahrscheinlichkeit geht, die Nullhypothese fälschlicherweise abzulehnen, wählst Du ja ein festes Signifikanzniveau, z.B. 5%, damit diese Wahrscheinlichkeit kleiner bleibt oder eben höchstens 5% ist. Wenn der Test nun signifikant ausfällt, dann ist die Irrtumswahrscheinlichkeit in der Tat nicht größer.

...zur Antwort

Ja qunatitativ, mehr oder weniger macht Sinn. Verhältnisskala. verdoppeln, halbieren etc. macht Sinn

...zur Antwort

Genau das ist doch der Zusammenhang, den Du untersuchen willst. Wenn bei Männern wie bei Frauen gleichhäufig die gleiche Betrugsart überwiegt, sind Geschlecht und relevantere Betrugsart unabhängig, ansonsten besteht ein Zusammenhang, den Du gerade mit dem Chi²-Test untersuchst.

S.a. https://www.empirical-methods.hslu.ch/entscheidbaum/zusammenhaenge/pearson-chi-quadrat/

...zur Antwort

a) Für p 0,5 einzusetzen, ist deswegen richtig, weil die Binomialverteilung für p=0,5 die höchste Streuung hat (Maximum von p*(1-p) = p - p² liegt bei p=0,5) und damit bei gleichem alpha das breiteste Konfidenzintervall. damit würde bei p≠0,5 das notwendige n nicht größer, sondern meist kleiner als das für p=0,5 sein.

In Deiner Formel wolltest Du richtigerweise das 97,5%- (=1-5%/2) Quantil einsetzen, hast da aber einen Zahlendreher drin, es ist 1,96 und es folgt n≥384,146 als mindestens 385

Die b) solltest Du mit Deinem Wissen lösen können, vorausgesetzt für die Einkaufssumme wird Normalverteilung angenommen

Die c) ist für die Zufriedenheit nicht eindeutig lösbar. Man kommt für p=0,5 wie gesagt das größte KI, aber 0,5 ist nicht vorausgesetzt, und Du müsstest für jedes p (also von p=1/385 bis p=384/385) ein eigenes KI ausrechnen - oder halt als Formel angeben, aber das wäre dann ja kein konkretes KI mehr.

...zur Antwort

"Wie viel % der Zuschauer, von denen man weiß, dass ..." sagt doch ganz klar, dass es hier um die kleinere Grundgesamtheit geht, die eben diese Bedingung (pos.M.) erfüllt. Wieviel % von den anderen, ohne pos.M., wie alt sind, ist irrelevant.

Es gibt die gemeinsame Ws (pos.M. und >25J) aus allen Zuschauern. Für Deine Aufgabe nimmt man die mit pos.M. heraus und setzt sie auf 100%, das ist die Bedingung, unter der man den Anteil der >25J ermitteln soll.

Deine Vereinigung ist eine oder-Verknüpfung und besteht aus den 3 Teilgruppen (pos.M. und >25J), (pos.M. und ≤25J) und (nicht pos.M. und >25J)

...zur Antwort

b) die leere Menge (beide unter 4 -> Summe höchstens 6)

c) Liste alle Kombinationen auf. Ihre Anzahl ist der Einsatz in €, den Du theoretisch zahlen musst, um jede Kombi 1* zu bekommen. Dann multipliziere die Gewinn-Kombis mit 2 und die Verlier-Kombis mit 0 und addiere sie alle. Die Gewinnchance ist der Quotient aus dieser Summe und der Anzahl (Anzahl Gewinne mit Höhe des Gewinns gegen Anzahl Ergebnisse mit Höhe des Einsatzes)

d) Wenn dieser Quotient größer 1 ist, ist es ein günstiges Spiel, wenn er gleich 1 ist, ein faires Spiel (gleiche Gewinn- wie Verlust-Chancen), und sonst ein ungünstiges Spiel.

...zur Antwort

Die Varianz hier zu betrachten, ist ganz falsch, wie GuteAntwort2021 im Nachtrag bemerkt hat.

Eine Standardabweichung ist selbst nie eine Prozentzahl (Es sei denn, die Zahlen die in die Statistik eingehen sind selbst %-Zahlen, z.B. Arbeitslosenzahlen im Ländervergleich), sondern hat die gleiche Einheit wie die Ausgangsdaten (cm, kg, Jahre, ...).

Man kann aber natürlich die Standardabweichung in Relation zum Mittelwert sehen, wie GuteAntwort2021's Beispiel mit MW=25, StdAbw=5, ergibt 20%. Das nennt man dann auch Variationskoeffizient.

...zur Antwort

Standardabweichung und Varianz findest Du überall im Netz, sicher auch mit Erklärvideos. Du hast 15 Länder. Wenn Du die nach Anzahl der Gegentore multiplizierst, findest Du den Median auf Platz 8 (mindestens 15/2 der Länder links und mindestens 15/2 der Länder rechts von diesem Wert einschließlich diesem Wert). Ähnlich findest Du das 1. Quartil auf Platz 4 (mindestens 15/4 der Länder links und 3*15/4 der Länder rechts von diesem Wert einschließlich diesem Wert) und das 3. Quartil auf Platz 12 (mindestens 3*15/4 der Länder links und 15/4 der Länder rechts von diesem Wert einschließlich diesem Wert). Diese beiden Anzahlen von Gegentoren voneinander abziehen und Du hast den Interquartilsabstand. Die Interpretation der StdAbw. schau Dir in den genannten Videos oder Text-Links an

...zur Antwort

Einen Verteilungswert gibt es nicht. Du meinst wohl die Verteilung mit all ihren Funktionswerten.

Ich weiß zwar nicht, was der "Wahrscheinlichkeitsraum aus i)" ist, aber ich nehme an, es ist Ω = {1,2,3,...,n-2,n-1,n} mit P(i)=1/n für alle i aus Ω. Für X1 ist P dann die Abbildung P: Ω->{1/n}. Das ist hier nur die Abbildung jedes einzelnen Elementes aus Ω, nicht aller möglichen, also auch mehr-elementigen, Teilmengen von Ω, aber so wie ich das verstehe, ist nur danach gefragt.

Für X2, wenn j die gezogene Zahl bei X1, hast Du dann ja n+m Kugeln in der Urne, wobei auf m+1 Kugeln j steht, und alle anderen Zahlen von 1 bis n kommen nur einmal vor. Ω hat sich ja nicht verändert, es sind ja keine neuen Zahlen auf den Kugeln, nur eine Zahl kommt halt öfters vor, hat also größere Ws. P für eine Kugel ist dann
P: Ω->{1/(n+m), (m+1)/(n+m)} mit P(j)=(m+1)/(n+m) und P(i)=1/(n+m) für alle i≠j.

Dass E(X1+X2) = E(X1)+E(X2) ist, solltest Du wissen, wenn Du so eine Aufgabe gestellt bekommst, und auch wie man diese beiden berechnet, nämlich indem Du jeweils jedes Ergebnis i mit seiner Ws P(i) multiplizierst und sie alle aufaddierst.

...zur Antwort

Suche mal nach "ROC-Kurve und AUC" Du findest z.B. https://www.acomed-statistik.de/roc-kurve.html. Die Suche nach "ROC Curve" bringt auch Erklärvideos, allerdings auf englisch. Einfache Ja/Nein-Antworten zu Deinen Fragen gebe ich nicht. Versuche lieber, es zu verstehen.

...zur Antwort

Mit der bedingten Ws hievst Du die Teilmenge der noch betrachteten Ergebnisse (x>= 4 wird weggelssen) auf das Niveau 100%. P(X<4) ist sicher < 100%, aber durch die Bedingung wird es auf 100% gesetzt.

...zur Antwort

Die Frage ist schon sehr merkwürdig formuliert. Ein Signifikanzniveau gibt man vor, z.B. 5%, 1%, 10%, 0,1% sind üblich (in dieser Reihenfolge), aber Deine Zahlen 1,5%, 0,5%, 2% sind theoretisch auch möglich. Wenn dann die Stichprobe einen p-Wert unter diesem jeweiligen Niveau ergibt, verwirft man die 0-Hypothese, andernfalls nicht.

Vielleicht sind die Fragen so gemeint: Ich habe einen p-Wert zwischen 2 und 5 bekommen, und habe mich vorher für alternative Signifikanzniveaus 1,5, 0,5, 2 und 5 entschieden. In diesem Falle wären dann alle 4 Aussagen wahr. Wäre der p-Wert zwischen 1,5 und 2 gewesen, dann wäre die 3. Aussage falsch. (Ich setze voraus, der p-Wert ist nicht exakt auf einer der Grenzen gelandet). Etc.

...zur Antwort

Das Residuum ist die Zufallsschwankung, die übrigbleibt, wenn man dem linearen Modell Glauben schenkt und die (den) Modellparameter so bestimmt hat, dass dieser Rest eben so klein wie möglich bleibt.

Nimmt man z.B. bei Heranwachsenden Alter als unabhängige Größe und Gewicht als abhängige, dann bestimmt man die Regressionsgerade so, dass die Summe der quadrierten Abstände der Gewichte so klein wie möglich wird. Dieser Varianzanteil wird durch das Alter nicht erklärt. Gleichalte Heranwachsende können ja durchaus verschieden schwer sein. In der Tendenz erklärt das Alter aber dann das Gewicht. Möglicherweise kann man den unerklärten Varianzanteil verringern, wenn man noch das Gewicht der Mutter und/oder des Vaters als weitere unabhängige Variable einbezieht.

Da das Wachstum in Kleinkindjahren schneller vorangeht als das Alter, ist hier auch das lineare Modell nicht ganz geeignet. Das trägt auch zur Nichterklärung bei. Für das Wachstum hat man in der Biologie eine Kurve herausgefunden (keine Gerade!), die den Zusammenhang besser darstellt, die Gompertzkurve. Google mal wenns Dich interessiert.

...zur Antwort

MW1:  Es folgen  und nun zieh die vorletzte von der letzten Zeile ab und fertig

...zur Antwort