Programm um die häufigst genutzen wörter zu bestimmen?

4 Antworten

Word vermutlich nicht, aber Excel kann so was, wenn die Tabelle auch ziemlich umfangreich wird und die Berechnung vermutlich ziemlich lange dauern wird.

Es geht auch mit JavaScript (Browser-Konsole; üblicherweise mit F12 aufrufbar).

PWolff  18.05.2023, 17:07

"Quick'n'Dirty" JavaScript-Lösung (beachte insbesondere die \ vor den Zeilenumbrüchen im Fließtext)

s = "Programm um die häufigst genutzen wörter zu bestimmen?\
\
Würde gerne für meine anstehende Spanischschularbeit die häufigsten Wörter aus den Übungstexten hinausfiltern. Gibt es ein Programm oder eine Funktion in Word, Excel etc. die automatisch die häufigsten Wörter auflistet?\
\
Danke im Vorraus für alle Antworten"

wa = [...s.matchAll(r)].map(arr => arr[0])

st = new Set(wa)

stw = Array.from(st)

stws = stw.map(w => [w, wa.filter(w2 => w2==w).length]).sort((w1,w2) => w2[1]-w1[1])

for (a of stws) console.log('Wort "', a[0], '" kommt', a[1], 'mal vor.')

Um Groß-/Kleinschreibung nicht zu berücksichtigen, müsste noch etwas wie

s = s.toLocaleLowerCase()

oder

s = s.toLowerCase()

angewendet werden.

1

Hallo.

ChatGPT hat mir in 5 Sekunden ein funktionierends Python Programm ausgespuckt, welches diese Aufgabe erledigen könnte. Auf Nachfrage hat Microsoft Word wohl keine solche Funktion, aber es nannte mir noch das Program AntConc, was speziell für Textanalysen zur Verfügung steht.

Ansonsten ist hier ein Pythonprogramm:

def find_most_common_words(text):
    word_counts = {}
    max_count = 0

    # Text in Wörter aufteilen und zählen
    words = text.split()
    for word in words:
        # Kleinschreibung für Wörter ignorieren
        word = word.lower()
        if word in word_counts:
            word_counts[word] += 1
        else:
            word_counts[word] = 1
        # Maximale Häufigkeit aktualisieren
        if word_counts[word] > max_count:
            max_count = word_counts[word]

    most_common_words = []
    # Wörter mit maximaler Häufigkeit finden
    for word, count in word_counts.items():
        if count == max_count:
            most_common_words.append(word)

    return most_common_words


# Eingabeaufforderung für den Text
text = input("Gib den Text ein: ")

# Häufigste Wörter finden
common_words = find_most_common_words(text)

# Ergebnis ausgeben
if len(common_words) == 1:
    print("Das häufigste Wort ist:", common_words[0])
else:
    print("Die häufigsten Wörter sind:")
    for word in common_words:
        print(word)

Welches du zum Beispiel hier

https://www.programiz.com/python-programming/online-compiler/

ausführen kannst. Aber Achtung, bei der Eingabe darfst du keinen Absatz mitliefern sonst kommt es zu Fehlern. Als Beispieltext hatte mir ChatGPT folgendes gegegeben

Gato perro gato perro gato perro elefante león elefante león elefante gato perro elefante león gato perro elefante león gato perro gato perro

Was auch funktioniert hat. Als Ausgabe bekam ich

Die häufigsten Wörter sind
gato
perro
Woher ich das weiß:Studium / Ausbildung – Diplom Wirtschaftsinformatiker

Ich habe auf meinem iPad eine App, in die man getippte Texte eingeben kann und dann werden die Wörter gezählt und die Häufigkeit der Zeichen/ Wörter aufgelistet (also zum Beispiel Hallo 7/ hier 5/ dort 3/ da 1). Dafür müssten die Texte aber eben eingetippt sein, ob du dir die Mühe machen willst musst du selber entscheiden.

Das hier wäre eine Lösung in Excel, die
- erst die Wörter aus dem Text aus Zelle A1 in Spalte B extrahiert
- dann jedes vorkommende Wort in D nur jeweils 1x schreibt
- dann in E zählt wie oft das Wort in Spalte B vorkommt ($B$253, da 253 Worte im Text sind) Diese Formel muss runter kopiert werden
- dann das Ergebnis in G nach Größe absteigend sortiert.

Bild zum Beitrag

Woher ich das weiß:Studium / Ausbildung – Tätigkeit als IT Trainer
 - (Computer, Schule, Deutsch)