Regular Expressions (RegEx, deutsch “Reguläre Ausdrücke”) dienen dazu, Zeichenketten zu definieren. Im Online Marketing praktisch verwendet werden sie zum Beispiel, um URLs mit bestimmten Merkmalen wie einem gleichen Verzeichnis oder einer bestimmten TLD zu beschreiben. In diesem Beitrag zeigen wir die wichtigsten Anwendungsfälle und Ausdrücke für den Online Marketing Alltag.
Regular Expressions sparen Zeit und helfen bei Definitionen, zum Beispiel:
Ausdruck | Beispiel(e) | Erklärung |
[] | [0-9][A-Za-z0-9] | Genau eine Ziffer soll vorkommen. (Bindestriche definieren einen Bereich) Ein beliebiger Großbuchstabe oder ein beliebiger Kleinbuchstabe oder eine beliebige Ziffer |
. | Ein beliebiges Zeichen | |
\ | www\.domain\.de | Metafunktion aufgehoben (der Punkt ist im Beispiel als ein Punkt und kein Platzhalter zu interpretieren) |
\s | Ein Whitespace (Steuerzeichen) = Leerzeichen, Zeilenumbruch, Tabulator, etc. | |
\d | Eine beliebige Ziffer | |
^ | 1. [^0]2. ^www | Falls in Klammer [] : Negiert nachfolgende Zeichenauswahl (Beispiel: Alles außer der Zahl 0 darf vorkommen) Sonst: Zeile beginnt mit der Zeichenkette „www“ |
! | !html | Negierung: Alles außer die nachfolgenden Zeichen soll berücksichtigt werden |
? | Domain.de\/? | Das direkt davor stehende Zeichen kann vorkommen, muss es aber nicht. (Beispiel: Trailing Slash kann vorhanden sein) |
* | [a-z]* | Der voranstehende Ausdruck darf beliebig oft (auch 0 mal) vorkommen |
+ | [a-z]+ | Der voranstehende Ausdruck muss mindestens einmal vorkommen |
$ | \?$ | Zeile oder String endet mit vorangehendem Zeichen (Beispiel: Eine URL endet mit einem Fragezeichen) |
() | (\.pdf)$ | Gruppiert mehre Zeichen zu einer zusammenhängenden Zeichengruppe, um Teilmuster zu erfassen (Beispiel: PDF-URLs sollen gefunden werden.) |
$1 | Rückwärtsreferenz auf eine Gruppe bzw. ein Teilmuster. Vor allem für das Suchen und Ersetzen wichtig. $1 bezieht sich auf die erste Klammer / Gruppe. | |
| | (a|A) | Agiert als ODER. Nur einer der beiden Zeichen(-ketten) darf vorkommen |
Im Online Marketing lassen sich Regular Expressions häufig einsetzen, um mit vergleichsweise wenig Aufwand umfangreiche Auswertungen und Einstellungen vorzunehmen. Nachfolgend sind Anwendungsbeispiele aufgeführt, um eine Hilfestellung für Einsatzgebiete zu geben.
Ein häufiges Einsatzgebiet von Regular Expressions bei Google Analytics ist der Seitenreport (Alle Seiten). Hier lassen sich beispielsweise mehrere Seiten gleichzeitig anzeigen, die durch die einfachen Filter nicht zu erreichen wären. Wenn Seiten keine gleichen Merkmale haben (Seitenpfad o.ä.), ist es nicht Möglich, diese mit dem "Enthält"-Filter zu erreichen. Durch die Pipe | lassen sich einzelne URLs hintereinander in das Suchfeld eintragen, sodass diese gefiltert ausgegeben werden:
/kompetenzen/lösungen.html|/ueberuns/firmenportrait.html
Der Report wird mit diesem Filter beide URLs anzeigen.
Auch bei Filtern von Datenansichten sind Regular Expressions häufig hilfreich. Bei einer Website, auf die mehrere Domains (.com, .de, Subdomains, ...) geschaltet sind, können Regular Expressions bei der Erstellung eines Hostname-Filters zur Vermeidung von Spam helfen:
.*domain\..*
Durch diesen Filter werden alle Hostnames zugelassen, die den Domainnamen beinhalten. Durch .* sind alle Zeichenketten vor und nach dem Namen eingeschlossen.
Möchte man nach beispielsweise einem Relaunch eine nicht sehr einfache URL auf eine neue weiterleiten, so lässt sich dies einfach mit Regular Expressions durchführen:
Redirect 301 ^/jobs/?$ www.domain.de/karriere/