Reguläre Grammatik vs regulärer Ausdruck?

1 Antwort

Vom Fragesteller als hilfreich ausgezeichnet
Zu Beginn dachte ich, bei den Terminalen handelt es sich um Wörter aus der Sprache, aber wenn ich es jetzt richig verstehe, sind Terminale Zeichen aus dem Alphabet, über welchem die Sprache gebildet wird. Wie erzeugt der Parser daraus eine Syntaxprüfung, wenn nicht die Reihenfolge der Wörter, sondern die, der Buchstaben analysiert wird.

Ein Missverständnis. Die Terminale sind die Token, die der Scanner dir liefert. Die Wörter werden dann aus den Terminalen gebildet.

Du hast einmal diverse reguläre Ausdrücke für den Scanner, um jeweils die Token zu identifizieren. Und dann hast du eine Sprache für die Syntaxprüfung, die dir sagt, wie die Token aneinandergereiht werden dürfen.

Die Sprache für Syntaxprüfung und weiteres parsen wird schlußendlich aber womöglich nicht mehr regulär sein.

Bzw. wieso werden für beide Phasen dann nicht einfach eine Grammatik oder RegExes genutzt, anstatt beides zu definieren?

Du kannst beides als eine Sprache definieren. Macnt man in teilen auch so. Aber man kann es halt auch sinnvoll trennen, für die Token jeweils eigene reguläre Ausdrücke definieren, um diese zu identifizieren und dann damit weiterzumachen.

Frage 2

Nun, es sind unterschiedliche Dinge, aber äquivalente Konzepte. Ein Regulärer Ausdruck kann exakt einer regulären Grammatik zugeordnet werden bzw. eine solche auch definieren.

aber ich könnte doch mit einer Regulären Grammatik bspw. die Ableitungsregel S -> aSb | € (epislon soll das sein :P) erzeugen und hätte damit doch eine Beschreibung für die Sprache.

Die Sprache ist wahrscheinlich nicht regulär. Das kannst du mittels Pummping-Lemma prüfen.
Das Problem erkennst du dann, wenn du ein Wort der Sprache vor dir hast und versuchst zu prüfen, ob das in der Sprache liegt. Du kommt nicht drum herum zu zählen.

Aber wenn eine Bedingung erfüllt ist, sind nicht gleichzeitig alle Bedingungen erfüllt?

Wahrscheinlich. Steht ja da, dass die Bedingungen äquivalent seien.