hallo, weiß Einer, wie groß, Wortschatz eines durchschnittlichen Romans mit etwa 300-400 Seiten, ist?

3 Antworten

Vom Fragesteller als hilfreich ausgezeichnet

Ich hab mir grad mal die Textdatei von George Orwells "1984" genommen (https://archive.org/stream/GeorgeOrwell-1984romanDeutsch/GOrwell1984_djvu.txt) und sie in einer Datenbank durchgezählt. (Nur der Teil ab "Vorwort" bis "Ende" auf Seite 339)

Der Roman hat insgesamt 98268  Wörter. Davon sind 14252 unterschiedliche Wörter vorhanden.

Die häufigsten Wörter sind:

die - 2717
und - 2338
der - 2274
er - 2012
sie - 1871
in - 1541
zu - 1476
war - 1462
es - 1430
das - 1272


Was ich vielleicht zu der Zählung noch dazu sagen sollte: Die Seitenzahlen sind auch als Wörter mitgezählt. Dadurch verringert sich die Anzahl der Wörter natürlich um ca. 330. Allerdings ist die Zählung ohne unterschied zwischen Groß- und Kleinschreibung. Also Wörter, die Groß-/Kleingeschrieben eine unterschiedliche Bedeutung haben (z.B. "paar"/"Paar", "ehe"/"Ehe", "rechte"/"Rechte" etc.) werden nicht getrennt gezählt. Musst also wieder ein paar Wörter dazuzählen.

1

Danke, das gibt schon Ansatz von Überblick und Maßstab. 14k verschiedene von 100k sämtlichen. Nebenbei gesagt 1984 von Georg Orwell ist eins meiner Lieblingsbücher :)

2

daCypher, bist Du vielleicht im Stande noch ein anderes Buch durschzuzähen?

0
@Poziom

Wenn du mir das Buch als Text geben kannst, dann ja. Normale eBook-Dateien oder PDFs kann ich leider nicht die Datenbank einlesen. (Also ich muss den Text in eine Textdatei kopieren können)

0

Von den 70000 bis 120000 Wörtern sollten  sich so wenige Worte wie möglich wiederholen. Da man das bei Namen zB nicht machen kann, kannst  du ca 3000  bis 10000 Worte davon abrechnen, um die Anzahl der verschiedenen Wörter zu errechnen. LG 

Ein durchschnittlicher Roman hat zwischen 70.000 und 120.000 Wörter.

Danke für deine Antwort. Leider nicht das wollte ich wissen. Du hast das Wort "verschiedene" übersehen.

0

Was möchtest Du wissen?