Wahrscheinlichkeitsfrage , Erklärung gesucht!?

... komplette Frage anzeigen

3 Antworten

Genauer genommen ist es nicht 25, sondern 9900/398 ≈ 24,87 (siehe unten). Hier die Herleitung dieser Berechnung:

Sei zunächst X die Zufallsvariable

X = #der Lieder, die unter 100 Liedern doppelt vorkommen.

Dann sind 2X der 100 Lieder Duplikate und 100–2X einmalig gespielt. Als Werte kann X insbesondere nur 0; 1; …; 50 annehmen. Man stelle nun die Lieder wie folgt dar:

 ORIGINAL:  L1 L2 L3 ... L100
KOPIE: L1 L2 L3 ... L100

(Annahme der gleichmäßigen Mischung.) Jede Auswahl von 100 dieser Lieder kommt gleichwahrscheinlich vor.

  • Sei ∈ {0; 1; …; 50}. Wie viel Mal können k Lieder doppelt vorkommen (und m:=100–2k einmalig)? Wir teilen erstens die Titeln auf: Es sollen k davon doppelt, m einmalig und 100–(m+k) = k gar nicht gespielt werden. Für diese Aufteilung der Titeln gibts also 100! / (k!·(100–2k)!·k!) Möglichkeiten.
  • Es bleibt nur eine Sache zu wählen: für eines jeden der m einmalig gespielten Titeln, ob es aus der Liedermenge ORIGINAL oder KOPIE kommen soll. Das macht exakt 2x2x…x2 = 2ᵐ = 2¹⁰⁰¯²ᵏ Möglichkeiten aus.

Die Anzahl der Möglichkeiten, 100 Lieder zu wählen, darunter exakt k davon doppelt, ist gegeben durch

N[100,k] = 100! / (k!·(100–2k)!·k!) · 2¹⁰⁰¯²˙ᵏ
= (2k! / k!k!)
·(100!/2k!(100-2k)!)
·2¹⁰⁰¯²ᵏ
= (2k über k)·(100 über 2k)·2¹⁰⁰¯²˙ᵏ

Man kann in die Form rechts Werte für k aus {51; …; 100} einsetzen und erhält formal den Wert 0, was mit N[100,k] übereinstimmt. Daher gilt dies für alle k∈{0;1;…; 100}. Wie viele Möglichkeiten gibt es insgesamt, 100 Lieder zu wählen? Na N[100] := (2·100 über 100) natürlich. Insbesondere gilt automatisch

(1) …         ∑ N[100,k] = N[100].

Dasselbe gilt mit 100 durch jede beliebige natürliche Zahl ersetzt. Die Verteilung von X ist also gegeben durch

(2) …         ℙ[X=k] = N[100,k]/N[100]

und entsprechend der Schnitt durch

(3) …         𝔼[X] = ∑k·ℙ[X=k]
= ∑ k·N[100,k]/N[100].

Ich behaupte, dass dies ist gleich

(4) …         𝔼[X] = n·(n–1) / 2·(2n–1)

wobei n=#Lieder und dass die Formel auch funktioniert, für andere Anzahlen n von Liedern als bloß n=100. Ein Beweis kommt später, wenn ich wieder Zeit finde. Inzwischen aber gilt für 100 Lieder

𝔼[X] = 100·(100–1) / 2·(2·100–1) = 9900/398 ≈ 24,87

Darum hört man im Schnitt ca. 24,87 (also ca. 25) Titel 2 Mal.

Antwort bewerten Vielen Dank für Deine Bewertung
Kommentar von kreisfoermig
18.10.2016, 14:15

Für einen Beweis, klicke auf mein Profil

https://www.gutefrage.net/nutzer/kreisfoermig

und meine dort verlinkte Webseite (overleaf.com: dauernd neuladen, bis Dokument erscheint). Auf Seiten 7--9 wird ein allgemeiner Beweis ausgearbeitet, der in das Ergebnis

E-Wert = ℓ·(ℓ-1)/(2·(2n–1))

resultiert, wobei n = #der Originallieder und ℓ = Größe der Auswahl (in unserem Falle gilt ℓ=n=100).

0
Kommentar von Pretan5
18.10.2016, 17:50

Wow ..... was für eine Antwort ,Danke !

Ich bin nicht in der Lage das alles zu verstehen, werde es aber weiterhin versuchen.


Dennoch sehe ich noch zwei Widersprüche , die deine Antwort von 24,87 % zu wiederlegen scheinen.

1. Die Antwort auf meine Frage von  "PWolff" .

Sie erschließt sich mir sofort, und ihre Antwort läge dort bei genau 25 %

2. Ich habe diese Aufgabe am Computer simulliert (mehrmals und mit größeren Werten)  und komme nicht auf die 24,87 % von dir, sonder eher auf die 25 %   .

https://repl.it/Dr6d/1  

(einfach auf "run" klicken)

Das ist mein verwendetes Script, für den Fall, dass jemand mit "Python" nicht vertraut ist, habe ich ein paar Kommentare dazu geschrieben. (im Code)  


-Ich habe die Liste mit 20.000 Titeln erstellt (zwei mal 10.000 gleiche zahlen)

-ich nehme zufällige 10.000  Elemente aus der Liste

-und zähle die Dopplungen


Das ganze mache ich 100 mal und bilde dann den Mittelwert.

Dieser wert liegt fast immer zwischen 2497 und 1503   

Nach deinem Prozentsatz müsste er um die 2487  liegen, ich habe es aber bei ~50 Versuchen nicht einmal erlebt, dass der Mittelwert  (von 100 einzelnen Werten)  um mehr als 4 vom wert 2500  abwich.

Desweiteren habe ich es am PC selbst mit höheren werten ebenfalls versucht, wodurch es aber bei den 25 % blieb.



0

Ersetzen wir die Dateien durch nummerierte Perlen. 100 rote, von AA über AB, AC, ..., AJ, BA, ... bis JJ "durchnummeriert", und 100 blaue, ebenfalls von AA bis JJ durchnummeriert.

Nehmen wir mal die 200 Perlen, rühren sie gut um und fädeln sie auf.

Dann machen wir in die Mitte des Fadens einen Knoten, so dass auf jeder Seite des Knotens 100 Perlen sind. Die Perlen auf der erste Hälfte des Fadens sollen dann die Dateien repräsentieren, die wir anhören.

Im Mittel (!) sind dann auf der ersten Seite des Fadens 50 rote und 50 blaue Perlen.

Die 50 roten Perlen auf der ersten Fadenhälfte versehen wir jetzt zusätzlich mit Nummern von 1 bis 50. Die blauen Perlen mit denselben Buchstabenkombinationen markieren wir mit denselben Nummern. (Die restlichen Perlen nummerieren wir ebenfalls, das vereinfacht nachher die Formulierung ein wenig.)

Die Wahrscheinlichkeit, dass wir die blaue Perle mit der Nummer 1 auf der ersten Hälfte des Fadens finden, ist 1/2.

Ebenso für die blaue Perle mit der Nummer 2, die mit der Nummer 3 usw.

Von den 50 blauen Perlen mit den Nummern 1 bis 50 sind im Mittel also 25 auf der ersten Hälfte des Fadens.

D. h. von den im Mittel 50 Nummern auf roten Perlen auf der ersten Fadenhälfte sind im Mittel 25 auch auf blauen Perlen auf der ersten Fadenhälfte.

Rückübersetzung:

rote und blaue Perle mit derselben Buchstabenkombination / Zahl -> Original und Kopie derselben Sounddatei

erste Fadenhälfte -> Playlist

Von den im Mittel 50 Originalen auf unserer Playlist sind im Mittel 25 auch als Kopie auf unserer Playlist. Das sind genau die, die wir doppelt hören.

Antwort bewerten Vielen Dank für Deine Bewertung

Ganz genau, deshalb ist es ja 'nur' eine Wahrscheinlichkeit. Natürlich kann es auch ganz anders sein, du berechnest ja lediglich die mathematische Wahrscheinlichkeit.

Beispiel:

Ein Würfel hat sechs Seiten mit Augen von 1-6. Immer wenn Du würfelst, ist die Wahrscheinlich daß du eine 1 würfelst 1:6. Logisch!

Wenn Du aber jetzt 5 mal hintereinander eine 1 gewürfelt hast, wie hoch ist die Wahrscheinlichkeit, daß du auch beim 6. Mal eine 1 würfelst???

Richtig: wieder 1:6! Die Wahrscheinlichkeit ist immer 1:6 weil der Würfel ja 6 Seiten hat und nur auf eine davon fallen kann, egal warauf er die letzten Male gefallen ist, die Wahrscheinlichkeit ist immer 1:6! Der Würfel hat ja kein 'Gedächtnis' und sagt sich, jetzt muß ich mal was anderes anzeigen.

Gefühlsmäßig betrachtet würden die meisten sagen, daß nach 5 mal einer gewürfelten 1 die Wahrscheinlichkeit sehr klein ist, daß nochmal eine 1 kommt, weil das eben sehr selten vorkommt. Aber wie gesagt, dennnoch ist die mathematische Wahrscheinlichkeit, daß wieder eine 1 kommt genauso wahrscheinlich oder unwahrscheinlich wie beim 1. Mal würfeln.


Hab ich damit Deine Frage beantwortet?





Antwort bewerten Vielen Dank für Deine Bewertung
Kommentar von Pretan5
19.10.2016, 10:00

Nein, nicht ansatzweise. Das wesen des absoluten Zufalls war mir zuvor beireits bekannt.

Die anderen beiden Antworten hingegen haben sehr geholfen.

0