Wie kann man (von einem Text) alle kleingeschriebenen Wörter entfernen?

9 Antworten

  1. öffne die Eingabequelle (File, Webseite, ...). Dazu gibt es Kommandos im Kernel Mode wie "fopen(), new FileReader(), ...".
  2. öffne die Ausgabesenke (File, Webseite, Feld (Array), ...)
  3. identifiziere die Wörter (entweder lesen bis Satzzeichen, Leerschlag, Ziffer, ....). Dies hängt davon ab, was Du unter Wörter verstehst (Ist "Vorreiter-Handschuh" ein Wort, oder sind es zwei? Gilt "Haus42" als Wort oder nicht?). Hier gibt es in vielen modernen Sprachen Trennhilfen wie "split()" oder "regEx".
  4. Entscheide, ob das Wort groß oder Klein ist. Dies geht am besten, indem Du den ersten Buchstaben nimmst. Du kannst natürlich auch das ganze Wort in Kleinbuchstaben verwandeln (viele Sprachen bieten sowas an z. B. toLower() oder toLowercase()) und danach das neue Wort vergleichen. Ist es identisch, waren im Originalwort auch alle Buchstaben klein geschrieben (Dann gilt aber "hAUS" nicht als kleingeschrieben!).
  5. War das Wort klein, so schreibe dies in die Ausgabe.
  6. Wiederhole Schritt 3 - 5, solange noch Wörter zu behandeln sind. Dies ist mit einer Kopf- (bzw. Fuß-) gesteuerten Schleife (while, repeat, ...) möglich.
  7. Schließe die Ein- und Ausgabeströme wieder, damit nichts im RAM-Puffer hängenbleibt.

Mit regex, oder auch so:

String x = "text groß Auto Banane, autobus";

String[] words = x.Split(' ');

Dann in einer for schleife durch gehen und alle kleinen Wörter aus den Array entfernen und stattdessen ein "" Speicher.

Dann wieder alles zusammen joinen.

Die einfachste Lösung wäre wohl die Ersetzen-Funktion von Notepad++ (Strg + H), die reguläre Ausdrücke unterstützt. Microsoft Word kann dies evt. auch.

Dieser reguläre Ausdruck sollte alle Kleinbuchstaben finden:

[a-z]

Zum Ersetzen wird eine leere Zeichenkette angegeben.

Microsoft Word kann dies evt. auch.

Ja. Kann es.

Seit Version 2010 glaub ich.

0

Korrektur / Ergänzung des regulären Ausdrucks:

[a-z\u00e4\u00f6\u00fc\u00df]

Die Unicodes stehen für die einzelnen deutschen Umlaute und das ß.

0

Korrektur 2: Mit diesen regulären Ausdrücken würden Kleinbuchstaben entfernt werden, egal ob sie einem großgeschriebenen Wort zugehörig sind oder nicht.

Ein regulärer Ausdruck dazu könnte so aussehen:

/\s+[a-z\u00e4\u00f6\u00fc\u00df]*/
0

Welche Programmiersprache für Programm programmieren Lernen?

Hi ich möchte gerne ein Programm Programmierern und weiß nicht ob ich mit WPF oder Windows Forms auf dem richtigen Weg bin.

Sollte ich Lieber Java lernen ?

...zur Frage

Muttermal/Leberfleck entfernen lassen!

Hallo, ich bin schon seit längerer Zeit mit kleinen Muttermalen/Leberflecken in meinem Gesicht unzufrieden und habe daher beschlossen, es jetzt entfernen zu lassen (nicht aus gesundheitlichen Gründen). Sie sind sehr klein und flach, ganz normale Leberflecke halt die so gut wie jeder hat (Es stört mich dennoch trotzdem), und denke dass sich Lasern oder Kältechirugie gut dafür eignen lassen. Meine Frage: Welche Methode ist gut geeignet? Wie sieht es mit den Schmerzen aus? Wie alt muss ich sein und wie viel kostet das? Fragen über Fragen! :) Ich hoffe ihr könnt mir dennoch noch paar Antworten geben bevor ich zum Arzt gehe! :)

...zur Frage

Wörter zählen bei Word - Werden auch Fußnoten mitgezählt?

Hi, ich habe eine frage zu Wörter zählen bei WORD. Wenn ich da die option wörter zählen einschalte, werden auch die fußnoten mitgezählt oder nur der text auf den seiten?

...zur Frage

Schlafen im Bh?

Was passiert wenn man Nachts auch Bh trägt ? Hat das irgendwelche Nachteile oder so für später ? Ist das ungesund oder völlig egal ?

...zur Frage

Leichtes Programm zur Spieleentwicklung?

Hallo,

gibt es ein Programm mit dem man "leicht" Spiele entwickeln kann? (z.B. Tic Tac Toe)

Am besten mit der Java Programmiersprache. Es sollte für Anfänger mit Java Grundkenntnissen geeignet sein.

Ich hoffe ihr könnt mir helfen

LG

...zur Frage

Worthäufigkeit aller Wörter in einem Text ermitteln

Hallo,

ich bin auf der Suche nach einem kostenlosen Programm bzw. Möglichkeit, um die Worthäufigkeit aller Wörter in einem Text zu ermitteln. Also nicht nur die Häufigkeit eines bestimmten vorgegeben Wortes (wie bei word über die suchen/ersetzen-Funktion), sondern eine Art Rangliste/Charts, welche mir auflistet, welche Wörter besonders häufig in einem bestimmten Text vorkommen.

Also z.B. in einem Text über Hundeerziehung würde das Programm automatisch ermitteln, dass die Wörter Welpe, Hund, Leine usw. überdurchschnittlich häufig auftauchen.

Vielleicht ist sowas ja auch mit excel möglich?

Vielen Dank für eure Antworten :-)

Katja

...zur Frage

Was möchtest Du wissen?