Stochastik: Panini-Album?

Hallo liebe Matheexperten:

Ich mache in 2 Wochen mein Matheabi, und fühle mich recht gut vorbereitet. Aus privatem Interesse ist mir etwas eingefallen, nur weiß ich nicht, wie ich so eine Aufgabe angehe.

In einem Stickeralbum sind 650 Sticker. Ein Pack enthält 5 Sticker, die unterschiedlich sind. Wie viele Packungen muss ich kaufen, um mit 95% Wahrscheinlichkeit alle 650 Sticker zu bekommen.

Gibt es für so etwas eine Formel? Über einen linksseitigen Test komme ich wahrscheinlich nicht drauf, weil sich die Wahrscheinlichkeit, fehlende Sticker zu erhalten, ja mit jedem "Treffer" ändert. Gibt es da eine Formel/Lösungsweg? Gerne auch mit anderen Zahlen.

Danke schonmal!

1 Antwort

YStoll

18.04.2016, 01:03

39769 (in etwa)

Ich habe jetzt eine ganze Weile darüber nachgedacht und die Info, dass eine Packung 5 verschiedene Sticker enthält, außer Acht gelassen.

Sei n die größe des Stickeralbums, hier also 650 und p mit 0<p<1 die geforderte Erfolgswahrscheinlichkeit, hier also 0.95.

Dann lautet die Formel meiner Überlegung nach

1+Sum[log[j/n,1-p^(1/n-1)], {j, 1, n-1}]

mit dem Link sieht man es anschaulicher, dort habe ich dein n und p eingefügt.
Man muss vermutlich den ganzen Link mit copy&paste übernehmen.

http://www.wolframalpha.com/input/?i=1%2BSum[log[j%2F650,1-0.95^%281%2F%28650-1%29%29],+{j,+1,+650-1}]

Meine Überlegung:

Ich habe einen Stapel mit Stickern und ziehe einen, bis ich einen habe, den ich vorher noch nicht hatte.

In der "nullten" Runde muss ich nur einmal ziehen, denn ganz am Anfang habe ich auf jeden Fall noch keine Karten und eine neue kann deshalb nicht schon in meinem Besitz sein.
In der ersten Runde habe ich schon einen verschiedenen und ziehe k_1 Sticker, die Chance einen neuen zu kriegen ist 649/650 pro Sticker und somit 1-1/650^k_1 insgesamt
In der j-ten Runde habe ich schon j verschiedene Sticker und ziehe k_j Sticker, die Chance einen neuen zu kriegen ist (650-j)/650 pro Sticker und somit 1-(j/650)^k_j insgesamt.

Es gibt n-1, hier 649 solcher Runden.

Wie groß ist jetzt meine Erfolgswahrscheinlichkeit, dass ich Alle Sticker habe?
Um alle Sticker zu haben muss ich in jeder Runde Erfolg gehabt haben.
Also ist p gerade das Produkt aller Wahrscheinlichkeiten 1-j/650^k_j.
Die gesuchte Anzahl ist die Summe aller k_j plus die eine Karte aus der nullten Runde.

Um die einzelnen k_j zu bestimmen, habe ich eine Annahme gemacht.
Ich wähle k_j so, dass jede Runde als Wahrscheinlichkeit genau p^(1/(n-1)), also hier 0.95^(1/649) hat. So ist das Produkt der Wahrscheinlichkeiten genau p.
Es gilt also, dass p^(1/(n-1) = 1-(j/n)^k_j. Nach k_j umgestellt ist das
log[j/n,1-p^(1/n-1)]

Probleme an dieser Überlegung:

Für sehr kleine p (z.B. 10^-650, bei n=650) spuckt WA Ergebnisse kleiner als 650 aus. Das erscheint als Widerspruch, da man ja mindestens 650 Karten gezogen haben muss, um überhaupt eine Chance zu haben.
Das kommt jedoch einfach daher, dass k_j wohl nie natürlich sein wird. Das macht die Berechnung auch etwas ungenau, in welchem Maße das für nicht-kleine p das relevant ist, kann ich jedoch nicht sagen.

Das meiner Meinung nach größere Problem:
Es gibt unzählige Möglichkeiten p zu zerlegen, so dass n-1 Faktoren genau p ergeben. Wenn verschiedene Runden unterschiedliche Erfolgschancen haben muss k_j neu berechnet werden. Ob das für das Ergebnis einen Unterschied macht weiß ich nicht und habe ich auch keine Lust/Zeit mehr das nachzuprüfen.

An Alle:

Wer kann mir mit meinen zwei "Problemen" weiterhelfen?
Die Formel modifizieren, dass nur natürliche Stickeranzahlen berücksichtigt werden?

Man könnte das ganze jetzt durch praktische Experimente unterstützen, beispielsweise mit n=3 und p=0.6, dann spuckt meine Formel in etwa 6 aus.
Am besten wäre ein Programm, dass 6 mal zufällige Elemente einer Menge mit drei verschiedenen Elementen greift und schaut, ob diese jedes Element treffen oder nicht und darüber eine Statistik führt.
Ich fänds klasse, wenn sich jemand findet, der mir das abnimmt, habe erstmal keine Zeit mehr dafür.

leoll

Fragesteller

18.04.2016, 15:54

Wow, also doch recht kompliziert. Danke für die Nachvollziehbare Antwort!

YStoll

18.04.2016, 16:26

@leoll

Ist aber falsch.
Der Rechenweg, den ich mir überlegt habe kann so nicht funktionieren.
Für "große" p könnte es evtl. näherungsweise trotzdem stimmen.
Die tatsächliche Anzahl sollte aber geringer sein.

Ich denke nochmal etwas darüber nach.