Regulärer Ausdruck für Leerzeichen?

Hm, ich hab festgestellt, dass ich mit dem Suchbefehl nicht alle doppelten Leerzeichen erwische. Da das \b den Wortanfang/das Wortende markiert, sind davon keine Satzzeichen betroffen. Steht vor oder nach dem doppelten Leerzeichen also z.B. , . ! ? : oder " dann findet er die Stellen nicht, sondern nur die doppelten Leerzeichen zwischen Wörtern. Ich habe daher den Befehl wie folgt ergänzt:

(\b|[.]|,|:|!|[?]|"|^) {2}(\b|[.]|,|:|!|[?]|"|$).

Das Problem hierbei ist jedoch, dass anders als bei \b die Satzzeichen bei der Suche mit markiert werden, was das Ersetzen schwierig macht, weil ich nicht mehr alle Stellen einfach mit " " ersetzen kann.. gibts dafür ne Lösung?

MarkusGenervt

05.11.2018, 12:04

Es gibt hier noch eine Möglichkeit, aber die funktioniert nicht auf allen Engines:

(?<! )  (?! )

Die erste Klammer ist ein negativer Look-Behind und die zweite ein negativer Look-Ahead. Die Mengenangabe der Leerzeichen hab ich hier einfach mal durch 2 Leerzeichen verkürzt.

Ansonsten wäre es an dieser Stelle nun doch mal wichtig zu wissen, was genau Dein Vorhaben ist, bzw. was Du mit den doppelten Leerzeichen machen willst, um bessere Alternativen zu finden.

Wenn Du alle doppelten Leerzeichen in einfache Leerzeichen ersetzen willst, dann gibt es hier auch wesentlich einfachere Wege, sogar ohne RegExp.

desperateuser91

Beitragsersteller

05.11.2018, 12:28

Wie Du schon sagst, ich will alle doppelten Leerzeichen finden und durch einfache Leerzeichen ersetzen. Der Grund dafür, dass es nicht mehr als 2 Leerzeichen sein dürfen ist der, dass in den Textdateien auch eine unbestimmte Anzahl von Leerzeichen zur Zentrierung genutzt wurde. Das Programm, das die Textdateien auslesen soll, kann keine Zentrierung, daher der Weg über die Leerzeichen. Und wenn ich jetzt nur nach " " suchen würde, würde er halt auch all die Zentrierungen finden, was er nicht soll

MarkusGenervt

05.11.2018, 12:37

Dann versuch einfach mal das hier:

Suchen:

(^|[^ ])  ([^ ]|$)

Ersetzten:

\1 \2

oder für die andere Syntax:

$1 $2

desperateuser91

Beitragsersteller

05.11.2018, 12:58

Also bei:

(^|[^ ])  ([^ ]|$)

hab ich wieder das Problem, dass vor und nach den Leerzeichen jeweils ein Zeichen mit markiert ist, wodurch man nicht mehr einfach ersetzen kann.

Aber der Befehl funktioniert:

(?<! )  (?! )

Kann ich da denn nicht einfach ein Leerzeichen zum Ersetzen angeben?

MarkusGenervt

05.11.2018, 13:07

Beim obigen Suchmuster musst Du das Ersetzungsmuster mit berücksichtigen! Da werden zwar die umgebenden Zeichen mit gefunden und markiert, aber in der Ersetzung beibehalten durch die Rückwärtsreferenzen "$1" und "$2", bzw. "\1" und "\2" inkl. dem nun einfachen Leerzeichen dazwischen.

Wenn der untere Befehl (Look-Ahead/Behind) allerdings funktioniert, dann reicht das Ersetzungsmuster " " (ein Leerzeichen), weil dann nur die beiden Leerzeichen zwischen diesen Ausdrücken als Treffer zurück gegeben werden.

desperateuser91

Beitragsersteller

05.11.2018, 13:17

Klasse, vielen Dank mal wieder!

desperateuser91

Beitragsersteller

05.11.2018, 13:42

Ich muss nochmal stören. Wenn ich Stellen finden möchte, an denen zwischen Komma und Buchstabe ein Leerzeichen fehlt, was geb ich da sein?

Das war mein Versuch: ,[A-Z|a-z]

Aber da wird auch wieder der Buchstabe nach dem Komma mit markiert.

Ich versteh den Befehl von eben nicht, deshalb weiß ich nicht, wie ich ihn an den Neuen anpassen muss.

MarkusGenervt

05.11.2018, 14:06

Also zunächst mal ist das Pipe innerhalb der Buchstaben-Gruppe überflüssig und diese Gruppe beinhaltet auch keine Umlaute, Ligaturen, Akzente, etc.

"A-Z" ohne Groß/Kleinschreibung wäre einfach "[A-Za-z]" ohne ODER-Verknüpfung. Dein Beispiel würde das Pipe-Symbol mit implizieren. Die ODER-Verknüpfung findet nur in runden Klammern ihre Angewendung.

Aber so geht das, was du meinst:

Ich habe hier mal das Leerzeichen durch das Steuerzeichen "␢" ersetzt, damit man es besser lesen kann.

"(,)(\w)" → "$1␢$2"

oder

"(?<=,)(?=(\w))" → "␢"

oder einfach

",\b" → ",␢"

Im ersten Beispiel werden einfach die beiden Zeichen zusätzlich mit dem Leerzeichen ersetzt.

Im zweiten Beispiel wird das Look-Around-Verfahren angewandt, was aber nicht bei allen Engines so funktioniert. Daher ist davon im Allgemeinen abzuraten. Hier ist auch die Klammer um "\w" wichtig, weil Look-Around-Ausdrücke sonst nur Literale erlauben. Einzige Ausnahmen ist der Look-Ahead und dann mit den runden Klammern zur Vorauswertung.

Im letzten Beispiel wird einfach das Komma literal wiederholt und das Word-Boundary (\b) muss nicht wiederholt werden, da es immer eine leere Zeichenfolge ist. Das ist auch die simpelste Ersetzung und die ist immer zu bevorzugen.

desperateuser91

Beitragsersteller

05.11.2018, 14:24

mit \w und \b hab ich es auch schon versucht, aber das funktioniert nicht, da im Text auch so Sachen stehen wie:

**********Event68********** (38,5) - EV0068

Und da werden halt auch diese Zahlen in den Klammern mit getroffen.

Da ich keinen Befehl gefunden hab, der nur Buchstaben trifft und keine Zahlen (bzw. ich dachte eigentlich, dass das \w sei, aber da hab ich mich scheinbar geirrt), hab ich es mit A-Za-z versucht

MarkusGenervt

05.11.2018, 14:30

Das geht auch, wenn Du keine Sonderbuchstaben im Text hast. Für das deutsche Alphabet kannst Du das aber auch erweitern:

[A-ZÄÖÜa-zäöüß]

oder wenn der Engine das hergibt auch

[:alpha:]

desperateuser91

Beitragsersteller

05.11.2018, 15:03

Gibt es auch einen Befehl um einen Begriff auszuschließen? Wenn ich z.B. nach Stellen suchen möchte, an denen das Leerzeichen zwischen Punkt und Buchstabe fehlt. Jedoch vor dem Punkt kein \ stehen darf.

desperateuser91

Beitragsersteller

05.11.2018, 15:07

Ach, schon gut, ich kann ja einfach ein \b vor den Punkt setzen

MarkusGenervt

05.11.2018, 15:15

https://de.wikipedia.org/wiki/Regulärer_Ausdruck

Meine Güte, Du hast aber echt schräge Extra-Würste in petto. 😁

Klar geht das:

"(?<!\\)\.(?=(\w))" → ".␢"

Und wenn es keine Ziffer sein darf dann:

"(?<!\\)\.(?=([:alpha:]))" → ".␢"

Aber hier mal ein Überblick:

und hier die ausführliche Hilfe:

https://www.regular-expressions.info

Das ist schon ein bisschen vertrackt, aber mit RegExp kannst Du praktisch alles suchen und ersetzen. Zumindest hatte ich bisher noch nichts, was nicht ging. Aber wenn Du auch nur ein Zeichen vergisst oder falsch setzt, dann wirst Du rammdösig beim Suchen des Fehlers! 😆

desperateuser91

Beitragsersteller

05.11.2018, 18:21

:D ja, aber wenn ich diese Ausnahmen nicht mache, mache ich mehr kaputt als ich korrigiere. Da muss man schon genau hingucken, was man verändert. Mir reicht meistens schon der normale Suchlauf, aber da hat mir Notepad++ auch schon große Dienste erwiesen. Mit einem Klick 100e von Dateien aufeinmal zu korrigieren ist toll xD

MarkusGenervt

05.11.2018, 19:33

Also wenn alles wirklich einheitlich formatiert ist und man das Muster genau identifizieren kann, dann ist es super-bequem mehrere Dateien auf einmal durchzurödeln.

Ich muss allerdings aus meiner Erfahrung heraus sagen, dass es besser ist, sich die Mühe zu machen Anzeige-seitenweise zu verarbeiten, weil man hier erstens auf einen Blick Ersetzungsfehler sofort erkennen kann und diese dann zweitens auch rückgängig machen kann. Bei einer Stapelverarbeitung kannst Du nichts wieder rückgängig machen!

desperateuser91

Beitragsersteller

06.11.2018, 17:06

Was meinst Du mit "Anzeige-seitenweise"? Naja, ich lass mir auch immer erst die Suchergebnisse anzeigen, bevor ich sie ersetze. Zu oft denke ich, dass ich damit genau die Ergebnisse ersetze, die ich möchte und hinterher betrifft das doch noch andere Textstellen. Aber wenn man die Suchtreffer erst kontrolliert, kann ja eigentlich nichts schief gehen.

MarkusGenervt

06.11.2018, 17:10

Ich meine, nur das markieren und verarbeiten, was auf den Monitor passt, ohne blättern zu müssen, so dass man alles im Blick hat. Das ist übersichtlicher, als den ganzen Text zu verarbeiten und geht schneller als alles einzeln zu bestätigen. Doch das braucht schon Übung.

desperateuser91

Beitragsersteller

07.11.2018, 13:13

http://docs.notepad-plus-plus.org/index.php/Regular_Expressions

Kann man auch nach Begriffen suchen, die sich auf zwei Zeilen erstrecken? Speziell nach zwei Wörtern, wovon sich eins am Ende einer Zeile und das andere am Anfang der nächsten befindet. Und kann man die auch ersetzen? Das erste soll so bleiben und das zweite soll verändert werden

MartinusDerNerd

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Computer

04.11.2018, 06:31

Hallo!

Ich habe es eben mal ausprobiert:

Doppelte Leerzeichen werden im "normalen Suchmodus" gefunden, wenn man in der Suchzeile einfach zwei Leerzeichen hintereinander eingibt.

Details zu den "Regulären Ausdrücken" findest Du hier:

Ansonsten kann man auch auf Youtube zu dem Thema fündig werden:

https://www.youtube.com/results?search_query=notepad%2B%2B+reguläre+ausdrücke+suchen+ersetzen

Gruss,

Martin

desperateuser91

Beitragsersteller

04.11.2018, 13:37

Hi, das Problem wenn man einfach nur zwei Leerzeichen eingibt ist, dass auch Ergebnisse mit mehr als 2 Leerzeichen gefunden werden. Und das wollte ich in meinem Fall vermeiden. Trotzdem danke, ein anderer User hat schon den richtigen Befehl geliefert.

KarlRanseierIII

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Computer, Informatik

04.11.2018, 03:42

Ich kenen die RegExps von Notepad++ nicht, aber entweder Du setzt 2 Leerzeichen in Deinen Suchstring, oder Du nutzt sowas wie {n} für die Zahl der Wiederholungen.

desperateuser91

Beitragsersteller

04.11.2018, 03:45

das Problem ist, dass mir dann auch Ergebnisse mit mehr als 2 Leerzeichen angezeigt werden. Also wenn ich nur " " eingebe ohne Anfüuhrungsstriche. Wie ich das mit dem n eingeben muss, weiß ich nicht

KarlRanseierIII

04.11.2018, 03:47

Bindestrich+Zeilenumbruch als Regulären Ausdruck?

Na, dann muß Du eben sagen, daß vorher udn nachher eben keine Leerzeichen sein dürfen. \S\s\s\S sollte ebenso funktionieren wie \S \S, oder \S {2}\S, oder falls notepad ++ auch word boundaries kennt, dann damit arbeiten.

Nachtrag: \w\s\s\w müßte auch klappen

desperateuser91

Beitragsersteller

04.11.2018, 13:38

@KarlRanseierIII

Da hatte er mir irgendwie andere Ergebnisse geliefert, trotzdem danke, ich habs jetzt

Lexicus

04.11.2018, 03:37

versuch "spacespace" oder " " eins von beiden funzt

desperateuser91

Beitragsersteller

04.11.2018, 03:47

wenn ich " " eingebe bekmme ich auch Ergebnisse mit mehr als 2 Leerzeichen. Es dürfen aber nur 2 sein

Lexicus

04.11.2018, 03:48

klingt nach tab nicht nach leerzeichen.

Ähnliche Beiträge

Es bringt mich zum Verzweifeln.

Ich möchte mit Notepad++ lediglich alle Wörter suchen, die am Zeilenende durch einen Bindestrich getrennt werden.

Um nach dem Zeilenumbruch suchen zu können benötige ich Reguläre Ausdrücke. Google hat ergeben, dass Zeilenumbruch "\n" und Bindestrich "-" ist, aber wenn ich in das Suchfeld "-\n" eingebe erhalte ich keine Ergebnisse.

Was mache ich falsch?

Reguläre Grammatik vs regulärer Ausdruck?

Hallo,

ich arbeite gerade das Buch Compiler Engineering von Cooper durch und habe schon mehrere Fragen dazu. Vllt gibt es ja einen ITler, der mir helfen kann.

Im zweiten Kapitel habe ich reguläre Ausdrücke kennengelernt, mit welcher man eine reguläre Sprache beschreiben kann.

Der Scanner erzeugt also Wörter, die an den Parser weitergegeben werden.

Frage 1: Jetzt arbeitet der Parser mit einer regulären Grammatik, um eine Syntaxanalyse durchzuführen. Zu Beginn dachte ich, bei den Terminalen handelt es sich um Wörter aus der Sprache, aber wenn ich es jetzt richig verstehe, sind Terminale Zeichen aus dem Alphabet, über welchem die Sprache gebildet wird.

Wie erzeugt der Parser daraus eine Syntaxprüfung, wenn nicht die Reihenfolge der Wörter, sondern die, der Buchstaben analysiert wird. Sind die Grammatiken denn so komplex, dass die Wortreihenfolge kontrolliert werden kann? Bzw. wieso werden für beide Phasen dann nicht einfach eine Grammatik oder RegExes genutzt, anstatt beides zu definieren?

Frage 2: Ich dachte immer, eine Reg Gram und eine RegEx wären unterschiedliche Dinge. Hier https://de.wikipedia.org/wiki/Regul%C3%A4re_Grammatik#Regul%C3%A4re_Sprachen und im Beitrag unter Regulären Sprachen, wird aber gesagt, dass dies beide äquivalente Konzepte sind.

Was mich daran stört.

Als nicht reguläre Sprache wird häufig die Sprache L = a^n b^n genannt. Mir ist zwar bewusst, dass ich die Sprache nicht durch eine RegEx oder einen Automaten abbilden kann (von denen mir bewusst ist, dass sie äquivalent sind), aber ich könnte doch mit einer Regulären Grammatik bspw. die Ableitungsregel S -> aSb | € (epislon soll das sein :P) erzeugen und hätte damit doch eine Beschreibung für die Sprache.

Wenn RegExes und RegGrams aber äquivalent sind, dann scheine ich ja einen Fehler in der Ableitung zu machen.

Frage 3: Definition Reguläre Sprachen https://de.wikipedia.org/wiki/Regul%C3%A4re_Sprache#Definition

Hier wird beschrieben, dass eine der Bedingungen erfüllt sein muss, damit es sich um eine Reg Sprache handelt. Aber wenn eine Bedingung erfüllt ist, sind nicht gleichzeitig alle Bedingungen erfüllt?

Verwirrt mich alles ziemlich

Wie ergänze ich mit Notepad++ und Regex um ein Semikolon?

In einer Liste stehen PLZ und Städtename nur mit einem Leerzeichen getrennt. Dieses Leerzeichen hätte ich gerne durch ein Semikolon ersetzt. Allerdings sind in der gleichen Zeile jeweils vor und hinter PLZ und Stadt auch noch ein paar Leerzeichen. Außerdem kommt der Stadtname auch gelegentlich noch davor oder dahinter in einer Zeile vor.

Mein Ansatz wäre, nach fünfstelligen Zahlen, gefolgt von einem Leerzeichen zu suchen und dann nur das Leerzeichen zu ersetzen.

Wenn ich bei Notepad++ mit Regex den Suchbegriff\d\d\d\d\d\s[A-Z] eingebe, werden die PLZ mit Leerzeichen auch gefunden. Aber ich weiß nicht, mit was ich das ersetzen muß.

Wenn ich es mit \d\d\d\d\d\;[A-Z] versuche, bekomme ich ddddd [A-Z] statt der bisherigen PLZ, Semikolon und dem Ersten Großbuchstaben des Städtenamens.

Hi, wie prüfe ich mit einem regulären Ausdruck ob mein text aus beliebigen Leerzeichen besteht, geht das einfach so (" *") (JAVA)?

Reicht es wenn ich einfach ("hierEinLeerZeichenRein*") mache?

Also ein lerzeichen, dann direkt danach ein Stern?

Regulärer Ausdruck zu NFA/NEA?

Kann mir bitte Jemand weiterhelfen, diesen NFA/NEA zu konstruieren?

Mit "alle drei" Automaten sind jeweils der Automat von [0-9], [0-9]* und [0-9][0-9]* gemeint.

Für [0-9] habe ich den Automaten:

-->(q0)----[0-9]---->((q2))

Für die restlichen beiden habe ich auch eine Lösung, jedoch wurde mir gesagt, dass wir Epsilon bzw. Lambda nicht benutzen dürfen.

Ich verstehe jedoch nicht wie ich dann 5 Zustände und 6 Kanten erreichen soll beim finalen Automat.

Motioneye startet nicht?

Hallo,

Ich habe (probiert) Motioneye auf einem Raspberry Zero W installiert (über Rasbian). Ich habe auch alles nach Anleitung (https://github.com/motioneye-project/motioneye/wiki/Install-On-Raspbian) gemacht, und es kamen keine Fehler. Wenn ich aber Motioneye starten will (systemctl start motioneye) muss ich mein Passwort eingeben, und dann passiert nichts. Bei ps steht auch kein laufender Prozess und http://raspberryip:8765 hat die Verbindung abgelehnt...

Hat irgendjemand Ideen oder Lösungen für das Problem?

Vielen Dank

Genshin impact UID Eingeben geht nicht?

Hallo! Letztens wollte ich eine neue friend request schicken und habe mir die UID rausgesucht. Dann habe ich sie ganz normal eingegeben und dann stand “Player Not found” es war schon ein paar mal so und es nervt mich. Wiederum eine Freundin von mir hat probiert meine UID einzugeben bei ihr stand dann auch wie bei mir “Player Not found” kann mir jmd sagen wie ich das Problem fixen kann? (Ich spiele auf ps5 btw)

Prepaid Aufladung geht nicht! Bitte helfen!

ich habe mir heute für 15 euro so eine karte gekauft für die man einen kassenbon kriegt, wo eine nummer drauf steht, die man ins handy eingeben muss. das habe ich gemacht und als ich auf grün gedrückt habe stand da "XtraCash fehlgeschlagen" oder so. ich habs schön öfters probiert, es geht nicht. kann mir jemand helfen???

PHP kann für Putty nicht installiert werden?

Immer wenn ich den installations Befehl für PHP eingebe, kommt eine Fehlermeldung! Somit kann ich kein phpmyadmin installieren. Das brauche ich für die mysql Datenbank auf meinem Root- / V-Server.

Code:

apt install php7.4 php7.4-cli php7.4-curl php7.4-gd php7.4-intl php7.4-json php7.4-mbstring php7.4-mysql php7.4-opcache php7.4-readline php7.4-xml php7.4-xsl php7.4-zip php7.4-bz2 libapache2-mod-php7.4 -y

Regular Expressions nur in einer bestimmten Zeile?

Hallo zusammen,

wie bewerkstellige ich mit ReGex, dass ein bestimmter Suchbegriff nur in einer bestimmten Zeile ersetzt wird? Ich habe mehrere Dateien, in denen in Zeile 5

==HalloTest==

oder ähnliches auftaucht.

Begriffe wie ==HalloTest== tauchen jedoch auch an weiteren Stellen bzw. Zeilen auf, ich möchte jedoch nur die eingangs erwähnte Zeile ändern, an anderer Stelle nichts.

Wie kann ich das bewerkstelligen?

Vielen Dank im Voraus!

Suchen und ersetzen mit regex via Notepad++. Aber nur ein mal pro Seite?

Hallo,

ich muss ein paar tausend Dateien bereinigen, die einen Schadcode enthalten (joomla-Installation).

Alle Seiten sind folgendermaßen aufgebaut:

<?php SCHADCODE ?><?php Originalcode

Manchmal sind die php-Seiten aber auch Teil eines Programmcodes. Dann sehen sie so aus:

<?php SCHADCODE ?> Originalcode

Meine Herangehensweise bisher war, mit

.<\?php(.?)?>*. den Schadcode zu finden und zu ersetzen. Leider findet dieser Suchstring aber auch das zweite, öffnende php-Tag, das ja - wenn vorhanden - bleiben soll. Daher habe ich den Versuch unternommen, mit obigen Suchstring zu suchen, aber nicht durch nichts, sondern durch ein öffnendes php-tag zu ersetzen.

Nur geschieht dies dann auch in jenen Dateien, die kein öffnendes php-Tag haben sollen.

Kurzum: Wie sage ich dem Suchstring, dass er nur bis zum ersten schließenden php-Tag suchen soll und dann stoppen? Mit anbderen Worten: Er soll das erste öffnende (<?php) und erste schließende php-Tag (?>) und diese beiden Tags nebst allem dazwischen löschen.

(LINUX) wenn ich sudo apt-get --purge remove PROGRAMM eingebe funktioniert es nicht lösung?

Ich wollte meine Programme Löschen aber das einzige was kommt ist ungefähr immer das:

hp-gamer@hp-Gamer:~$ sudo apt-get --purge remove Download.jpeg

Paketlisten werden gelesen... Fertig

Abhängigkeitsbaum wird aufgebaut.

Statusinformationen werden eingelesen.... Fertig

E: Paket Download.jpeg kann nicht gefunden werden.

E: Mittels des Musters »Download.jpeg« konnte kein Paket gefunden werden.

E: Mittels regulärem Ausdruck »Download.jpeg« konnte kein Paket gefunden werden.

Könnt ihr mir sagen was ich falsch mache? Wenn man in der Google Suche eingibt Linux ubuntu programme löschen kommt genau der Command aber IMMER wird mein Paket/Programm/Datei nicht gefunden wieso?

Nachverfolgung post?

Hallo ich möchte gerne meinen Brief nachverfolgen. allerdings verstehe ich nicht wie ich die Sendungsnummer bei der Post eingeben soll. sind das zwei Nummern? Sind das Nullen oder Os? muss ich Leerzeichen eingeben oder nicht? und so weiter. hat jemand Erfahrungen und kann mir helfen? Hab schon viele Varianten probiert. Keine funktioniert.

In welcher Reihenfolge muss ich den Code der Thaliageschenkkarte eingeben?

Ich habe eine Geschenkkarte von Thalia und würde diese gerne im Onlineshop für ein Hörbuch einlösen. Jedoch stand dort immer, dass der Code fehlerhaft wäre, obwohl ich die Karte gerade zum ersten Mal benutzen wollte und sie noch nicht 3 Jahre alt ist. Erst den Code, dann die Pin, andersrum oder ein Leerzeichen zwischen den beiden? Und kann man das überhaupt bereits für Hörbücher machen, denn dort stand nur Gutschein einlösen. Aber Geschenkkarten und Gutscheine sind doch das gleiche, oder?

Danke im Voraus