Reguläre Ausdruck ist die Bezeichnung für a) eine Sprache zur Beschreibung von Mustern b) ein konkretes Muster in dieser Sprache.
Ein regulärer Ausdruck ist eine Zeichenkette, die mit Platzhaltern ein Muster beschreibt. Man nach dieser Musterdefinition andere Zeichenkette mit dem Muster vergleichen und erhält als Ergebnis, ob die Zeichenkette auf das Muster passt. Dabei kann das Muster auch auf einen Teil der Zeichenkette zutreffen. Mit regulären Ausdrücken kann man auch Teile von Zeichenketten ersetzen durch andere Zeichenketten (Austauschfunktion).
Das Microsoft
.NET Framework und die
PowerShell enthalten eine gute Unterstützung für Mustererkennung in Texten durch reguläre Ausdrücke. Reguläre Ausdrücke sind eine komplexe Sprache, die hier nicht vollständig beschrieben werden kann. Dazu gibt es komplette Bücher. Sie finden eine gute Dokumentation dazu auch im
WWW unter [
MSDN08].
Reguläre Ausdrücke in .NET
Der Unternamensraum
System.Text.RegularExpressions bietet Unterstützung für reguläre Ausdrücke zum Mustervergleich und Ersetzen in Zeichenketten. Die Klasse RegEx stellt mit IsMatch() und Replace() zwei einfache
Methoden bereit. Wenn ein regulärer Ausdruck mehrfach verwendet werden soll, ist es aus Leistungsgründen sinnvoll, ein RegEx-
Objekt mit dem regulären Ausdruck zu instanziieren und dann die verschiedenen Eingaben mit den
Methoden Match() und Replace() anzuwenden.
Beispiel 1: Mustervergleich
In dem folgenden Beispiel prüft ein regulärer Ausdruck, ob die Eingabezeichenkette ein
Global Unique Identifier (
GUID) oder eine E-Mail-Adresse ist.
Public void Mustervergleich()
{
const string RA_
GUID = @"\{[0-9a-fA-F]{8}-[0-9a-fA-F]{4}-[0-9a-fA-F]{4}-[0-9a-fA-F]{4}-[0-9|a-f|
A-F]{12}\}";
const string RA_
IPAdresse = @"\b(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|
[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\b";
const string RA_Email = @"^(?<user>[^@]+)@(?<host>.+)$";
const string EINGABE1 = @"{00000615-0000-0010-8000-00AA006D2EA4}";
const string EINGABE2 = @"192.168.123.355"; // Fehler!
Const string EINGABE3 = @"hs@IT-Visions.de";
Demo.Print("
GUID korrekt? " + Regex.IsMatch(EINGABE1, RA_
GUID));
Demo.Print("IP-Adresse korrekt? " + Regex.IsMatch(EINGABE2, RA_
IPAdresse));
Demo.Print("E-Mail-Adresse korrekt? " + Regex.IsMatch(EINGABE3, RA_Email));
}
Listing: Mustervergleich
Beispiel 2: Musterersatz
Im zweiten Beispiel wird eine Datumszeichenkette der Form 08/01/1972 umgewandelt in 01-08-1972.
public void Musterersatz()
{
const String EINGABE = @"08/01/1972";
const string MUSTER = @"\b(?<month>\d{1,2})/(?<day>\d{1,2})/(?<year>\d{2,4})\b";
const string ERSATZ = @"${day}-${month}-${year}";
Demo.Print("Alt: " + EINGABE);
Demo.Print("Neu: " + Regex.Replace(EINGABE, MUSTER, ERSATZ));
}
Listing: Musterersatz