Reguläre Ausdruck ist die Bezeichnung für a) eine Sprache zur Beschreibung von Mustern b) ein konkretes Muster in dieser Sprache.

Ein regulärer Ausdruck ist eine Zeichenkette, die mit Platzhaltern ein Muster beschreibt. Man nach dieser Musterdefinition andere Zeichenkette mit dem Muster vergleichen und erhält als Ergebnis, ob die Zeichenkette auf das Muster passt. Dabei kann das Muster auch auf einen Teil der Zeichenkette zutreffen. Mit regulären Ausdrücken kann man auch Teile von Zeichenketten ersetzen durch andere Zeichenketten (Austauschfunktion).

Das Microsoft .NET Framework und die PowerShell enthalten eine gute Unterstützung für Mustererkennung in Texten durch reguläre Ausdrücke. Reguläre Ausdrücke sind eine komplexe Sprache, die hier nicht vollständig beschrieben werden kann. Dazu gibt es komplette Bücher. Sie finden eine gute Dokumentation dazu auch im WWW unter [MSDN08].

Reguläre Ausdrücke in .NET

Der Unternamensraum System.Text.RegularExpressions bietet Unterstützung für reguläre Ausdrücke zum Mustervergleich und Ersetzen in Zeichenketten. Die Klasse RegEx stellt mit IsMatch() und Replace() zwei einfache Methoden bereit. Wenn ein regulärer Ausdruck mehrfach verwendet werden soll, ist es aus Leistungsgründen sinnvoll, ein RegEx-Objekt mit dem regulären Ausdruck zu instanziieren und dann die verschiedenen Eingaben mit den Methoden Match() und Replace() anzuwenden.

Beispiel 1: Mustervergleich

In dem folgenden Beispiel prüft ein regulärer Ausdruck, ob die Eingabezeichenkette ein Global Unique Identifier (GUID) oder eine E-Mail-Adresse ist.
Public void Mustervergleich()
{
const string RA_GUID = @"\{[0-9a-fA-F]{8}-[0-9a-fA-F]{4}-[0-9a-fA-F]{4}-[0-9a-fA-F]{4}-[0-9|a-f|
A-F]{12}\}";
const string RA_IPAdresse = @"\b(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|
[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\b";
const string RA_Email = @"^(?<user>[^@]+)@(?<host>.+)$";
const string EINGABE1 = @"{00000615-0000-0010-8000-00AA006D2EA4}";
const string EINGABE2 = @"192.168.123.355"; // Fehler!
Const string EINGABE3 = @"hs@IT-Visions.de";
Demo.Print("GUID korrekt? " + Regex.IsMatch(EINGABE1, RA_GUID));
Demo.Print("IP-Adresse korrekt? " + Regex.IsMatch(EINGABE2, RA_IPAdresse));
Demo.Print("E-Mail-Adresse korrekt? " + Regex.IsMatch(EINGABE3, RA_Email));
}
Listing: Mustervergleich

Beispiel 2: Musterersatz

Im zweiten Beispiel wird eine Datumszeichenkette der Form 08/01/1972 umgewandelt in 01-08-1972.
public void Musterersatz()
{
const String EINGABE = @"08/01/1972";
const string MUSTER = @"\b(?<month>\d{1,2})/(?<day>\d{1,2})/(?<year>\d{2,4})\b";
const string ERSATZ = @"${day}-${month}-${year}";
Demo.Print("Alt: " + EINGABE);
Demo.Print("Neu: " + Regex.Replace(EINGABE, MUSTER, ERSATZ));
}
Listing: Musterersatz