Statistische Berechnung eines Datenbestandes?

... komplette Frage anzeigen

1 Antwort

Die Idee auszurechnen wie viele Links jede bereits bearbeitete Seite im Durchschnitt hatte ist sicher nicht schlecht.

Die Gesamtzahl aller Links in den unbearbeiteten Seiten kannst Du sicherlich grob so abschätzen.

Allerdings müßtest Du Dir überlegen ob alle Links einzigartig sind, d.h. es gibt keine zwei Seiten, die den gleichen Link enthalten.

Ansonsten wären Konfidenzintervalle für Deine Durchschnittsanalyse auch noch ganz gut -wenn Du weißt welche Links auf welchen bearbeiteten Seiten waren bietet sich Bootstrap an.

Antwort bewerten Vielen Dank für Deine Bewertung
Kommentar von irgendetwas1234
29.06.2016, 13:45

Ich würde eine Redundanz von ca 5% schätzen und eine Art Kulanzwert für X von 90% nehmen.
Aber die 200 Mio wären schon realistisch, oder?

Dein letzter Punkt ist gut, leider lässt sich das nicht mehr im System nachvollziehen

0

Was möchtest Du wissen?