Ein regulärer Ausdruck ist eine codierte Zeichenfolge. Er definiert eine Gruppe von Zeichenfolgen, die mit dem Ausdruck übereinstimmen. Ein regulärer Ausdruck kann aus einer oder mehreren Verzweigungen (Auswahlmöglichkeiten) bestehen, von denen jede eine Zeichenfolge bestehend aus Zeichen, Zeichenklassen oder Klammerausdrücken mit Änderungswerten zur Angabe von Wiederholungsregeln sein kann.
Die unterstützte Syntax für reguläre Ausdrücke ist eine Untermenge der regulären Ausdrücke des XML-Schemas. Die vollständige Syntax finden Sie unter Appendix F in XML Schema Part 2: Datatypes auf der Website von World Wide Web Consortium (W3C).
In der folgenden Tabelle werden die Elemente der unterstützten Syntax für reguläre Ausdrücke aufgelistet:
Metazeichen | Bedeutung |
\ | Escape |
. | beliebiges einzelnes Zeichen |
* | Vorhergehendes Zeichen kommt nicht oder mehrfach vor |
+ | Vorhergehendes Zeichen kommt einmal oder mehrfach vor |
? | Vorhergehendes Zeichen kommt nicht oder einmal vor |
{...} | Vorkommen des vorhergehenden Zeichens 1 |
[...] | Abgleich mit einer der enthaltenen Klassen |
[^...] | Abgleich mit einer der nicht enthaltenen Klassen 1 |
(...) | Gruppieren der Ausdrücke 1 |
| | Abgleich mit vorhergehendem oder folgendem Zeichen |
Escapezeichenfolge | Bedeutung |
\n | neue Zeile |
\r | Wagenrücklauf |
\t | Tabulator |
\e | Escape |
Klassencode | Bedeutung |
\d | Ziffer [0-9] |
\D | ungleich Ziffer [^0-9] 2 |
\s | Leerzeichen [ \t\n\r] |
\S | ungleich Leerzeichen [^ \t\n\r] 2 |
\p{L} | alle Buchstaben 3 |
\p{N} | alle Zahlen, vergleichbar mit \d 4 |
[\p{N}\p{L}] | alle Zahlen und alle Buchstaben, vergleichbar mit \w 4 |
\P{L} | ungleich Buchstaben, äquivalent zu [^\p{L}] |
\P{N} | ungleich Zahlen, äquivalent zu [^\p{N}] |
Bereich | Bedeutung |
{n} | genau n Mal |
{n,} | mindestens n Mal |
{n,m} | mindestens n, aber nicht mehr als m Mal |
{0,m) | kein oder m Mal |
Die folgende Tabelle enthält Beispiele der Syntaxregeln für reguläre Ausdrücke. Unter Datenelemente mit Hilfe regulärer Ausdrücke analysieren finden Sie Beispiele für deren Anwendung.
Datenmuster für regulären Ausdruck | Bedeutung |
---|---|
a | Ableich mit Zeichen "a" |
. | Abgleich mit beliebigem Zeichen |
a+ | Abgleich mit einer Zeichenfolge aus einem oder mehreren "a" |
a* | Abgleich mit einer Zeichenfolge, die kein oder mehr als ein "a" enthält |
a? | Abgleich mit keinem oder einem "a" |
a{3} | Abgleich mit einer Zeichenfolge aus genau drei "a", d. h. "aaa" |
a{3,} | Abgleich mit einer Zeichenfolge aus drei oder mehr "a" |
a{2,4} | Abgleich mit einer Zeichenfolge aus mindestens zwei und maximal vier "a" |
[abc] | Abgleich mit einem der Zeichen "a", "b" oder "c" |
[a-zA-Z] | Abgleich mit einem beliebigen Zeichen im Bereich "a" bis "z" bzw. "A" bis "Z". Der Bereich der abgeglichenen Zeichen basiert auf den Unicodes der angegebenen Zeichen. |
[^abc] | Abgleich mit jedem beliebigen Zeichen ungleich "a", "b" oder "c" |
(ab)+ | Abgleich mit einer oder mehreren Wiederholungen der Zeichenfolge "ab" |
(ab)|(cd) | Abgleich mit der Zeichenfolge "ab" oder der Zeichenfolge "cd" |