Früher oder später wird jeder der sich mit ecoDMS beschäftigt, Regex in Vorlagen von ecoDMS verwenden wollen. So ist zumindest mein Standpunkt, denn Regex bietet gegenüber der Klassischen Schlagwort-Erkennung einige Vorteile:

  • Arbeiten mit Platzhaltern
  • Ausschluss von bestimmten Kriterien
  • Höhere Anpassbarkeit auf die eigenen Bedürfnisse

Viele haben aber leider immer noch Angst vor Regex, da es anfangs furchtbar kompliziert und komplex aussieht. Man muss aber Regex nicht vollständig beherrschen, um damit in seinen Vorlagen von ecoDMS zu arbeiten. Es reicht völlig aus, wenn man nur einen ganz kleinen Teil kann und das Prinzip verstanden hat. Ich werde in diesem Artikel versuchen, alles was man wirklich für ecoDMS braucht zu erklären, bildhaft darzustellen und noch ein, zwei Tipps zu geben.

Was ist Regex?

Laut Wikipedia: Ein regulärer Ausdruck (englischregular expression, Abkürzung RegExp oder Regex) ist in der theoretischen Informatik eine Zeichenkette, die der Beschreibung von Mengen von Zeichenketten mit Hilfe bestimmter syntaktischer Regeln dient.

In ganz einfachen Worten ist Regex also eine Filter-Sprache. Nichts anderes macht Regex nämlich, es filtert beispielsweise aus vorhandenen Texten, Wörter nach von uns vorgegebenen Kriterien heraus.

Was macht Regex in ecoDMS?

Nochmal ganz einfach geschildert, wozu wir Regex in ecoDMS benutzen wollen: Wir sagen ecoDMS mit Hilfe von Regex, dass es im Dokument nach bestimmten Wörtern, Zahlen, oder Zeichenketten suchen soll.

Klar, das geht auch mit der Schlagwort-Erkennung. Aber die Schlagwort-Erkennung bietet nicht die am Anfang genannten Vorteile von Regex!

Eine Sache wollte ich noch loswerden, von ecoDMS gibt es auch Tipps & Tricks zur Verwendung von Regex. Anschauen lohnt sich.

Regex-Kriterien im Vorlagen-Designer als Kriterium angeben

Grundlegendes Schema

Regex wird im Vorlagen-Designer immer nach dem gleichen Schema angegeben, nämlich:

REGEX:\b(HierKommenUnsereKriterienHin)\b

In die beiden klammern können wir jetzt Regex-Platzhalter, aber auch normalen Text schreiben.

Schlagwörter

Wenn ihr also in einer Vorlage das Postfach 11 als Schlagwort angegeben habt, könnt ihr das in Regex einfach mit:  REGEX:\b(Postfach 11)\b  bewerkstelligen.

Der Effekt ist fast der selbe. Der einzige Unterschied ist der, dass jetzt Tatsächlich PostfachLEERZEILE11 im Dokument vorkommen muss. Wenn also im Dokument Postfach – 11 steht, würde die Vorlage nicht mehr erkannt werden.

Ausnahmen (Darf nicht im Dokument vorkommen)

Sollten wir aber !REGEX:\b(Postfach 11)\b  schreiben, würde die Vorlage nicht erkannt werden, sobald Postfach 11 im Dokument vorkommt. Ist unter anderem sehr Praktisch für eine Klassifizierungsvorlage der Dokumentenart Information, da man so sicherstellen kann, das z.B. das Wort Rechnung nicht im Dokument vorkommt.

!REGEX:\b(Rechnung)\b

Oder

Mit dem | Operator könnten wir jetzt außerdem sicherstellen, dass noch ein paar andere Wörter nicht vorkommen dürfen.

!REGEX:\b(Rechnung|Kontoauszug|Bescheid|Urkunde)\b

Gesprochen würde das ganze jetzt so lauten: Es darf im Dokument nicht(!) Rechnung oder(|) Kontoauszug oder(|) Bescheid oder(|) Urkunde vorkommen.

Und

Wer sich jetzt fragt, wo ist der Und-Operator. Naja, den gibt es schon, brauchen wir aber nicht. Wir geben die beiden Regex Zeilen einfach nacheinander an (jede in eine neue Zeile)

REGEX:\b(Postfach 11)\b
!REGEX:\b(Rechnung|Kontoauszug|Bescheid|Urkunde)\b

Case Insensitiv

Regex ist normalerweise Case Sensitiv, also die Groß und Kleinschreibung wird beachtet. Wenn im Dokument beispielsweise RECHNUNG statt Rechnung steht, würden die Regex Kriterien von oben schon nicht mehr greifen. Das können wir mit (?i) ändern. Wenn wir diesen Operator direkt nach den Doppelpunkten einfügen, wird die Groß- und Kleinschreibung nicht mehr beachtet. Könnte man natürlich auch für die Regex Zeile mit Postfach 11 machen, brauchen wir aber nicht unbedingt.

REGEX:\b(Postfach 11)\b
!REGEX:(?i)\b(Rechnung|Kontoauszug|Bescheid|Urkunde)\b

Vorsicht bei Umlauten

Regex hat mit allen Umlauten, also mit ä Ä ö Ö ü Ü Probleme. Diese können leider nicht direkt angegeben werden. Ich bin dazu übergegangen, statt des Umlautes immer .* zu schreiben. (Dazu mehr im nächsten Abschnitt)

Wildcards

Es gibt noch sogenannte Wildcards, also Platzhalter für bestimmte Zeichen. Ich erkläre erst kurz meine lieblings-wildcars für ecoDMS. Im Anschluss erkläre ich das gaze anhand eines Beispiels.

Die Besten Wildcards für ecodms

  • .?  steht für ein oder kein beliebiges Zeichen, außer einem Absatz. Sehr Praktisch für OCR-Fehler, da man so immer wieder falsch erkannte Buchstaben oder Zahlen in Wörtern oder Nummern trotzdem als Kriterium angeben kann.
  • .*  ist mit äußerster Vorsicht zu genießen. Es steht für beliebig viele oder ein Zeichen. Also auch wenn ein teil am Anfang und ein Teil am Ende des Dokumentes steht, wird es erkannt!
  • [0?O?o]  Null, großes oder kleines o Unglaublich praktisch für OCR-Fehler in Nummern!

Beispiele für die Anwendung der Wildcards

Ein neues Beispiel, vergesst also erstmal das obere Postfach 11 beispiel. Oder nein, vergesst es doch nicht 😉

Im Dokument steht also Postfach 11

Erkannt wird aber immer wieder etwas andres, beispielsweise:

Postfach11

Postfach 11

Postfach-11

Postfachi11

Dann geben wir einfach, statt REGEX:\b(Postfach 11)\b, folgende Regex Zeile an:

REGEX:\b(Postfach.?11)\b

Jetzt ist egal was erkannt wird, solange das Wort Postfach und die Zahl 11 nicht mehr als ein Zeichen weit voneinander getrennt sind, wirds erkannt!

Eigenen Regex-Kriterien testen und anwenden

Das war jetzt alles ziemlich viel Gelaber, also sage ich probiert es einfach selbst aus. Praxis ist immer besser als Theorie. Aber wie sollt ihr das jetzt ausprobieren, fragt ihr euch bestimmt. Ich gebe euch jetzt mal ein Praxisnahes beispiel, wie ich meine Regex-Kriterien in ecoDMS schreibe.

Vorlagen Designer sollte übrigens schon geöffnet sein 😎

Grundgerüst einfügen

Dann füge ich erstmal ein leeres “Regex-Grundgerüst” in den Vorlagen-Designer ein.

ecodms regex im Vorlagen Designer Fenster des Programms

Text mittels OCR-Erkennung in die Zwischenablage kopieren

ecoDMS Vorlagendesigner mit OCR-Erkennungs-Fenster
Zuerst kopiere ich mir den Text, für den ich Regex Kriterein schreiben möchte, via STRG+Rechte Maustaste in die Zwischenablage

OCR-Text auf Regexstorm einfügen und testen

Regex Tester auf regexstorm.net/tester
Den eben aus ecoDMS heraus-kopierten Text, füge ich nun auf http://regexstorm.net/tester unter Input ein
Regex Tester auf regexstorm.net/tester mit Pattern und Input
Jetzt füge ich mir auch hier mein Grundgerüst, also die Zeichen \b()\b in das Feld Pattern hinzu. Achtung: Das Grundgerüst muss hier OHNE REGEX: angegeben werden!
Regex Tester auf regexstorm.net/tester mit erweitertem Pattern und Input
Dann gebe ich die eigentlichen Kriterien ein. Und sehe in diesem Fall, irgend etwas passt nicht. Der Text müsste eigentlich gelb hervorgehoben werden, sobald etwas erkannt wurde.

Das Problem ist hier der Abschnitt O29. Es handelt sich nämlich nicht um eine Null, sonder um ein großes o. Da ich die Regex-Kriterien oben manuell eingetippt habe, kann es eigentlich nur daran liegen. Außerdem wurde der Text im Kästchen Input ja bis zum M gelb hervorgehoben, und dann plötzlich nicht mehr.

Wir erinnern uns: REGEX:\b()\b gibt an, das alles in den Klammern und nicht nur teile dessen erkannt werden müssen!

Regex Tester auf regexstorm.net/tester mit erweitertem ecoDMS Regex Pattern und markiertem Input (Input stimmt mit Regex-Kriterien teilweise überein)
Mit dem praktischem Platzhalter für o, O oder null wird die Versicherungsnummer nun wieder hervorgehoben.

Mit Regexstorm experimentieren

Regex Tester auf regexstorm.net/tester mit erweitertem Pattern und markierten Input (Input stimmt mit Regex-Kriterien teilweise überein)
Damit kann man natürlich auch unglaublich gut experimentieren, sollte man sich z.B. fragen, wann die Vorlage jetzt noch erkannt werden würde
Regex Tester auf regexstorm.net/tester mit erweitertem Pattern und markierten Input (Input stimmt mit Regex-Kriterien teilweise überein)
Oder um mit anderen Wildcards zu experimentieren (hier wurde [0?O?o] durch .* ausgetauscht.

Erstelltes Regex Pattern in ecoDMS einfügen.

Nun das ganze noch kopieren und einfügen, fertig ist die Vorlage. (Genauer gesagt das erste Regex Kriterium der Vorlage, hier sollte man mindestens noch ein 2tes hinzufügen)

Kopieren

Regex Tester auf regexstorm.net/tester mit getestetem Regex für ecoDMS

Einfügen

Vorlagen Designer von ecoDMS mit getestetem Regex von Regexstorm

Und fertig ist die Vorlage. Sieht viel aus, aber wie bei allem anderen bleibt nur zu sagen, Übung macht den Meister. Ich brauche circa 5 Minuten um eine Dokumenten-Vorlage mit Regex Schlagwörtern / Kriterien zu erstellen. Nur den ganzen Weg darzustellen wie ich das machen, braucht leider etwas platz.

Regex-Snippets

Hier möchte ich euch die coolsten ecoDMS Regex Snippets von mir bereitstellen. (Fortsetzung folgt)

Schweizer Franken Betrag auslesen

Für schweizer Franken mit dem Tausender-Trennzeichen habe ich das Snippet aus der ecoDMS Doku mal leicht angepasst. Hier suche ich nach CHF im Text und die folgenden Zahlen werden ausgegeben mit maximal 2 Nachkommastellen (Punkt als Trennzeichen).

REGEX:(?<=CHF:)([\s]*)((((\d+)['.]{1,10})+\d{0,2})|(\d+(?!.)))
ecoDMS Regex für Schweizer Franken auf Regexstorm.net

Habt ihr noch Fragen oder Ideen zu diesem Artikel? Schreibt es gerne in die Kommentare 😮

Regex in Vorlagen von ecoDMS verwenden e1511036717844 - Regex in Vorlagen von ecoDMS verwenden

2 Kommentare zu „Regex in Vorlagen von ecoDMS verwenden“

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

15585

Du willst schon gehen?

Meld dich noch schnell zum Newsletter an und komm später wieder!

Jederzeit kündbar und kostenlos.

Sad Smiley
15585

Deine Daten sind sicher!

Wir speichern deine E-Mail nur, um Newsletter zu versenden. 

Klicke auf den Haken, wenn du der Speicherung deiner Daten zustimmst.

15585

Du willst schon gehen?

Meld dich noch schnell zum Newsletter an und komm später wieder!

Jederzeit kündbar und kostenlos.

Wow Smiley
15585

Deine Daten sind sicher!

Wir speichern deine E-Mail nur, um Newsletter zu versenden. 

Klicke auf den Haken, wenn du der Speicherung deiner Daten zustimmst.

Scroll to Top
Share via
Copy link
Lesen Sie den vorherigen Eintrag:
cropped-QNAP-TS-453A-Review.jpg
QNAP TS 453A Test – Ergebnis nach 1,5 Jahren

Die Entscheidung, welche Qnap ich mir jetzt als Nachfolger für meine TS-412 kaufen sollte, war für mich eine der schwierigsten...

Bild des Netgear ProSafe mit eingesteckten Kabeln
Gigabit Switch Test – Fazit nach 1 Jahr Netgear ProSafe

Ja, das geliebt Heimnetzwerk. Irgendwann ist es wie mit allem, es kommt doch auf die Größe an. Wenn man mal...

Schließen