Reguläre Ausdrücke. Reguläre Ausdrücke = Regular Expressions = reg.exp./regexp/regexp = RE

Größe: px
Ab Seite anzeigen:

Download "Reguläre Ausdrücke. Reguläre Ausdrücke = Regular Expressions = reg.exp./regexp/regexp = RE"

Transkript

1 Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. REGULAR EXPRESSIONS RegExp Was ist ein regulärer Ausdruck? = Regular Expressions = reg.exp./regexp/regexp = RE Ein regulärer Ausdruck beschreibt ein bestimmtes Textmuster in einer abgekürzten oder unterspezifizierten Weise. Dazu sind eine Reihe von Metazeichen definiert. (Lemnitzer/Zinsmeister 2010: 89) Mit regulären Ausdrücken lassen sich Variationen erfassen und komplexe Suchanfragen formulieren. 1

2 Metazeichen Zeichenklassen [abc] [a-z] [a-za-z] [a-zöüäß0-9] Findet eines der Zeichen a,b,c Findet einen beliebigen Kleinbuchstaben Findet einen Klein- oder Großbuchstaben von a/a bis z/z Findet einen beliebigen Kleinbuchstaben (inklusive Umlaute) oder eine Ziffer Metazeichen Platzhalter/Wildcard. Steht für ein beliebiges Zeichen Alternation Gruppierung () Negation ^ Steht für alternative Muster Fasst Inhalte zusammen, markiert den Einzugsbereich Schließt Zeichen aus 2

3 Metazeichen Quantoren/Operatoren? + * {n,m} Voranstehendes Zeichen kommt 0- oder 1-mal vor Voranstehendes Zeichen kommt mindestens 1-mal bis -mal vor Voranstehendes Zeichen kommt 0-mal bis -mal vor Voranstehendes Zeichen kommt n- bis m-mal vor Metazeichen Spezielle Zeichen \r \n \t \s bzw. \S \w bzw. \W \d bzw. \D Zeilenschaltung (r: Mac; n: Unix) Ist man nicht sicher, welche Art der Zeilenschaltung im Dokument vorhanden ist, macht man einfach eine Klasse daraus: [\r\n] Tabulator Jede Art von Leerzeichen bzw. jede Art von Nicht-Leerzeichen (Tabulator, Zeilenschaltung ) Jeder Wort -Buchstabe bzw. Nicht- Wort -Buchstabe (also a-z, A-Z, 0-9, _ und wenige mehr) Zahlen bzw. Nicht-Zahlen 3

4 Escape/Maskieren Will man innerhalb eines regulären Ausdrucks nach Zeichen suchen, die auch als Metazeichen definiert sind, so maskiert man das entsprechende Zeichen mit einem Backslash. Beispiele:. Findet eine beliebiges Zeichen \. Findet das Zeichen. ( Gruppiert die nachfolgenden Zeichen \( Findet öffnende Klammern Beispielabfragen Tokio oder Tokyo? Alternation: (Tokio Tokyo) oder Tok(i y)o Zeichenklasse: Tok[iy]o Fiktive Variante Tokiio Tok[ii]o oder Tok[iii]o oder Tok[i ii]o? Gibt es ein Wort, das mit X, Y oder Z beginnt und nur 2 a) (X Y Z). b) [XYZ]. oder 3 Buchstaben hat? a) (X Y Z).. b) [XYZ].. c) (X Y Z).? d)[xyz].? 4

5 Beispielabfragen Welche Wörter enden auf das Suffix lich?.+(lich) Wie finde ich zusätzlich emphatische Varianten? z.b. Tor und Toooor und TOOOORRRR (T t)(o O)+(r R)+ Beispielabfragen Dieses Suchmuster findet Internetadressen der Art \d\d\d\d-\d+-\d+ Dieses Suchmuster findet Datumsangaben der Art

6 Bis wohin wird gesucht? Bei TIGERSearch und CQP bezieht sich das Suchmuster auf ein Wort. Syntax und Mächtigkeit können variieren finden auch in Programmiersprachen, diversen Werkzeugen oder beim Suchen & Ersetzen ggf. mit unterschiedlicher Syntax und Mächtigkeit Anwendung. Pattern matching Den Abgleich des Musters mit dem vorliegenden Material nennt man pattern matching. Wichtig ist beim Formulieren von regulären Ausdrücken, dass man sich nicht nur fragt, mit welchem Muster finde ich, was ich suche, sondern vor allem auch: Was findet dieses Muster außerdem alles und wie muss es ggf. eingeschränkt werden? (Perkuhn/Keibel/Kupietz 2012: 36) Intendierte Tatsächliche Treffermenge Precision und Recall RegExp in der CWB Über Query Mode = Simple Query:. ist kein Metazeichen, stattdessen steht? für ein beliebiges Zeichen Suche nach speziellen Zeichen (z.b. /d) ist möglich Alternation und Zeichenklassen werden folgendermaßen ausgedrückt: [s,z] = s oder z [u,] = mit oder ohne u [this,that] = this oder that z.b. color/colour: colo[u,]r Siehe: CQPweb tutorial # 03: wildcards in queries 6

7 RegExp in der CWB Über Query Mode = CQP syntax: Die Metazeichen entsprechen (größtenteils) den eingangs erwähnten. Suchabfragen werden wie folgt strukturiert: [word= ] [lemma= ] [pos= ] Innerhalb der wird die Suchanfrage ggf. mit regulären Ausdrücken spezifiziert. Weiterführende Literatur Wikipedia: Regulärer Ausdruck RegExp 7

8 Aufgaben/Übungen der Socken oder die Socke? der oder das Virus? Parfüm oder Parfum? das Joghurt bzw. Yoghurt oder der Joghurt bzw. Yoghurt? Lösungen z.b.: [word="(der die)"] [word="sock(e en)"] z.b.: [word="(der das)"] [word="virus"] z.b.: [word="parf(u ü)m"] z.b.: [word="(der das)"] [word="[yj]o(g gh)urt"] 8

9 Aufgaben/Übungen Finden Sie die 5 häufigsten attributiven Adjektive und die 5 häufigsten adverbialen bzw. prädikativen Adjektive die auf bar enden. Welche Arten von Zahlenangaben finden sich in Zeitungstexten? Welche Zahl ist die häufigste und welche Art von Zahlenangabe ist die häufigste? Finden Sie Wörter mit Vokalen, die sich mindestens doppeln. Lösungen z.b.: [lemma=".+(bar)" & pos="adja"] [lemma=".+(bar)" & pos="adjd"] z.b.: \d+ z.b.: [word=".+(a{2,5}) (o{2,5}) (e{2,5}) (i{2,5}) (u{2,5}).+"] 9

Einführung in die Computerlinguistik Suche mit regulären Ausdrücken

Einführung in die Computerlinguistik Suche mit regulären Ausdrücken Einführung in die Computerlinguistik Suche mit regulären Ausdrücken Dozentin: Wiebke Petersen 9. Foliensatz Wiebke Petersen Einführung CL 1 Suche mit regulären Ausdrücken Suche nach allen Wortformen des

Mehr

Formale Sprachen und Automaten

Formale Sprachen und Automaten Formale Sprachen und Automaten Kapitel 3: Regular Expressions Vorlesung an der DHBW Karlsruhe Thomas Worsch Karlsruher Institut für Technologie, Fakultät für Informatik Wintersemester 2012 Kapitel 3 Regular

Mehr

1.103 Regular Expressions - Reguläre Ausdrücke

1.103 Regular Expressions - Reguläre Ausdrücke Copyright ( ) 2009 by M.Peichl. This work is licensed under the Creative Commons Attribution-Noncommercial-Share Alike 2.0 Germany License. To view a copy of this license, visit http://creativecommons.org/licenses/by-nc-sa/2.0/de/

Mehr

b{2} [^b]{2} Reguläre Ausdrücke als Hilfsmittel der Textanalyse Manuel Raaf Bayerische Akademie der Wissenschaften, IT-Referat

b{2} [^b]{2} Reguläre Ausdrücke als Hilfsmittel der Textanalyse Manuel Raaf Bayerische Akademie der Wissenschaften, IT-Referat b{2} [^b]{2} Reguläre Ausdrücke als Hilfsmittel der Textanalyse Manuel Raaf raaf@badw.de Bayerische Akademie der Wissenschaften, IT-Referat Reguläre Ausdrücke engl. regular expressions, kurz: regex, regexp

Mehr

/ Vortrag Unix-AG

/ Vortrag Unix-AG 16.6.2010 / Vortrag Unix-AG xkcd Fortsetzung... Grundlegendes 1 Begriff: = regular expressions kurz: regex Funktion: definieren flexible Muster, mit denen in Texten gesucht (und ersetzt) werden kann. Diese

Mehr

Regular Expressions. Daniel Lutz Was ist eine Regular Expression?

Regular Expressions. Daniel Lutz Was ist eine Regular Expression? Regular Expressions Daniel Lutz 12.11.2003 1 Was ist eine Regular Expression? Ausdruck, der ein Textfragment beschreibt Eine Regular Expression passt zu einem Textfragment, wenn das Textfragment

Mehr

Webengineering. Reguläre Ausdrücke. Dienstag, 2. Juli 13

Webengineering. Reguläre Ausdrücke. Dienstag, 2. Juli 13 Webengineering Reguläre Ausdrücke Marcel Vilas 1 DHBW - Stuttgart 1 RegExp - Allgemein Muster, die eine Menge von Zeichenketten mit Hilfe bestimmter syntaktischer Regeln beschreiben Werden oft als Suchmuster

Mehr

Einführung in PERL 2 Reguläre Ausdrücke

Einführung in PERL 2 Reguläre Ausdrücke Einführung in PERL 2 Reguläre Ausdrücke BASIEREND AUF FOLIEN VON DR. H. ZINSMEISTER und dem Buch `Einführung in Perl (Lama Buch) von RL Schwartz&T Phoenix sowie hwp://de.sel[tml.org/perl/sprache/regexpr.htm

Mehr

18.09.2010 / Software Freedom Day

18.09.2010 / Software Freedom Day 18.09.2010 / Software Freedom Day xkcd Fortsetzung... Grundlegendes Begriff: = regular expressions kurz: regex Funktion: definieren flexible Muster, mit denen in Texten gesucht (und ersetzt) werden kann.

Mehr

Programmierkurs Kapitel 4

Programmierkurs Kapitel 4 Kapitel 4 Dipl.-Wirt.-Inf. Stefan Fleischer Dipl.-Wirt.-Inf. Ulrich Wolffgang Komponente: Parser Interface für Parser entwickeln public interface IParser { public ArrayList parseemailaddresses(string

Mehr

Reguläre Ausdrücke in Oracle 10g Waren Queries bis jetzt irregulär?

Reguläre Ausdrücke in Oracle 10g Waren Queries bis jetzt irregulär? Donnerstag, 11. November 2004 13h00, Mozartsaal Reguläre Ausdrücke in Oracle 10g Waren Queries bis jetzt irregulär? Dr. Martin Wunderli Trivadis AG, Zürich-Glattbrugg Schlüsselworte Reguläre Ausdrücke,

Mehr

Reguläre Ausdrücke Suchmuster, Pattern Matching

Reguläre Ausdrücke Suchmuster, Pattern Matching Suchmuster, Pattern Matching Ein oder mehrere Einzelzeichen in interner Variablen $_suchen: /e/ #liefert wahr, wenn $_ ein 'e' enthält. /aus/ #liefert wahr, wenn $_ 'aus' enthält. while { if (/e/)

Mehr

Formale Sprachen. Anwendungen formaler Sprachen Adressen, Kaffeeautomaten, Programmiersprachen. Rudolf Freund, Marian Kogler

Formale Sprachen. Anwendungen formaler Sprachen Adressen, Kaffeeautomaten, Programmiersprachen. Rudolf Freund, Marian Kogler Formale Sprachen Anwendungen formaler Sprachen Adressen, Kaffeeautomaten, Programmiersprachen Rudolf Freund, Marian Kogler (http://xkcd.com/208) Gültige Adressen: Favoritenstraße 9, 1040 Wien Reumannplatz

Mehr

Einführung in Perl Übersicht Operatoren Mustersuche I Autoinkrement und Autodekrement Autoinkrement und Autodekrement Bsp

Einführung in Perl Übersicht Operatoren Mustersuche I Autoinkrement und Autodekrement Autoinkrement und Autodekrement Bsp Übersicht Ergänzendes zu Operatoren Autoinkrement ++ und Autodekrement - logisches und && und oder Ordnung von Operatoren Reguläre Ausdrücke Diamantoperator Perl, 31.10.03 Mustersuche I 1 Autoinkrement

Mehr

Reguläre Ausdrücke. Felix Döring, Felix Wittwer 14. November Python-Kurs

Reguläre Ausdrücke. Felix Döring, Felix Wittwer 14. November Python-Kurs Reguläre Ausdrücke Felix Döring, Felix Wittwer 14. November 2016 Python-Kurs Gliederung 1. Grundlagen 2. Matching Regeln Sonderzeichen Zusammengesetzte Regex Spezielle Sequenzen 3. Methoden 4. reqular

Mehr

Suchen und Ersetzen mit Platzhaltern

Suchen und Ersetzen mit Platzhaltern Suchen und Ersetzen mit Platzhaltern Version Word 2010, 2007, 2003 und 2002/XP Normalerweise suchen Sie in Word nach einem bestimmten Begriff und mit der Suchfunktion gelangen Sie schnell von einer Fundstelle

Mehr

Anwendung von (Perl) Regular Expressions für die Mustersuche in Strings

Anwendung von (Perl) Regular Expressions für die Mustersuche in Strings Anwendung von (Perl) Regular Expressions für die Mustersuche in Strings Tipps und Tricks Andreas Deckert Heiko Zimmermann Institute of Public Health Institute of Public Health INF 324 INF 324 69120 Heidelberg

Mehr

Arbeiten mit Regulären Ausdrücken. Annette Gerstenberg Würzburg, 16. März 2016 Workshop "Digitale Methoden" beim Forum Junge Romanistik

Arbeiten mit Regulären Ausdrücken. Annette Gerstenberg Würzburg, 16. März 2016 Workshop Digitale Methoden beim Forum Junge Romanistik Arbeiten mit Regulären Ausdrücken Annette Gerstenberg Würzburg, 16. März 2016 Workshop "Digitale Methoden" beim Forum Junge Romanistik Warum RegEx? Ziele! Beispiel 1: Bereinigen eines Transkripts, Entfernen

Mehr

Ferdinand Beyer. 1 Allgemeines Beschreibung Bezeichnungen Einsatzgebiete in UNIX-Tools Notationsarten...

Ferdinand Beyer. 1 Allgemeines Beschreibung Bezeichnungen Einsatzgebiete in UNIX-Tools Notationsarten... Reguläre Ausdrücke Ferdinand Beyer Inhaltsverzeichnis 1 Allgemeines 2 1.1 Beschreibung............................. 2 1.2 Bezeichnungen............................ 2 1.3 Einsatzgebiete in UNIX-Tools....................

Mehr

Wiederholung. Ein deterministischer endlicher Automat (DEA) über einem Alphabet A besteht aus: einer endlichen Menge von Zuständen Q,

Wiederholung. Ein deterministischer endlicher Automat (DEA) über einem Alphabet A besteht aus: einer endlichen Menge von Zuständen Q, Wiederholung Ein deterministischer endlicher Automat (DEA) über einem Alphabet A besteht aus: einer endlichen Menge von Zuständen Q, einem Anfangszustand q 0 Q, einer Menge von Endzuständen Q E Q, einer

Mehr

Theoretische Informatik. Reguläre Sprachen und Automaten

Theoretische Informatik. Reguläre Sprachen und Automaten Theoretische Informatik Reguläre Sprachen und Automaten Reguläre Sprachen Reguläre Ausdrücke und Sprachen Gleichungen Syntaxdiagramme Erweiterungen Anwendungen Reguläre Ausdrücke über Σ Syntax: Konstante

Mehr

Sebastian Harl. 03. Oktober 2008

Sebastian Harl. 03. Oktober 2008 Reguläre Ausdrücke Sebastian Harl LUSC Workshop Weekend 2008 03. Oktober 2008 (?:[a-z0-9!#$%& *+/=?^_ { }~-]+(?:\.[a-z0-9!#$%& *+/=?^_ { }~-]+ )* "(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21\x23-\x5b\x5d-\x7f]

Mehr

GREP. Reguläre Ausdrücke. GREP Hardcore. Syntax. Ersetzen Suchen. Look Around. 20. April 2012 Pubkon 2013

GREP. Reguläre Ausdrücke. GREP Hardcore. Syntax. Ersetzen Suchen. Look Around. 20. April 2012 Pubkon 2013 GREP Syntax Reguläre Ausdrücke Look Around Ersetzen Suchen GREP Hardcore 20. April 2012 Pubkon 2013 Kontakt: Folien: gregor.fellenz@publishingx.de http://www.publishingx.de/dokumente Lizenz: c b n Quelle:

Mehr

Effizientes Arbeiten mit dem Emacs. Suchen und Ersetzen.

Effizientes Arbeiten mit dem Emacs. Suchen und Ersetzen. Effizientes Arbeiten mit dem Emacs Suchen und Ersetzen Rainer Orth Alexander Sczyrba {ro,asczyrba}@techfak.uni-bielefeld.de Suchmethoden Simple Search Emacs springt an das nächste Vorkommen des angegebenen

Mehr

Version 2.00 ( )

Version 2.00 ( ) Tutorial: Regex Version 2.00 (13. 08. 2008) Seite 1 von 15 Inhaltsverzeichnis 1. Was ist Regex?... 3 2. Verwendung von Regex in C#... 3 2.1 Validieren von numerischen Benutzereingaben... 3 3. Funktionen

Mehr

Version 1.00h (13. 04. 2008)

Version 1.00h (13. 04. 2008) Tutorial: Regex Version 1.00h (13. 04. 2008) Seite 1 von 15 Inhaltsverzeichnis 1. Was ist Regex?... 3 2. Verwendung von Regex in C#... 3 3. Funktionen von Regex... 3 4. Syntax von Regex... 4 4.1 Einfachstes

Mehr

Informationsextraktion Materialien zur Vorlesung

Informationsextraktion Materialien zur Vorlesung Vordefinierte Informationsextraktion Materialien zur Vorlesung Reguläre Ausdrücke D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg

Mehr

C. Ortseifen: Reguläre Ausdrücke

C. Ortseifen: Reguläre Ausdrücke Inhalt Reguläre Ausdrücke mit SAS Einsatz der RX- und PRX-Funktionen Dr. Carina Ortseifen SAS-Treff am URZ 2. Dezember 2005 1. Einleitung 2. Aufbau der regulären Ausdrücke 3. Beispiele 4. Reguläre Ausdrücke

Mehr

SelfLinux-0.12.3. Reguläre Ausdrücke

SelfLinux-0.12.3. Reguläre Ausdrücke Reguläre Ausdrücke Autor: Dennis Roch (ysae@users.sourceforge.net) Formatierung: Matthias Hagedorn (matthias.hagedorn@selflinux.org) Lizenz: GFDL Reguläre Ausdrücke Seite 2 Inhaltsverzeichnis 1 Einleitung

Mehr

Regexp Reguläre Ausdrücke

Regexp Reguläre Ausdrücke Vincent Tscherter, Raimond Reichert Regexp Reguläre Ausdrücke Suchen und Ersetzen von en, das können sehr viele Programme. Aber was, wenn man nach allen Telefonnummern oder E-Mail-Adressen in einem suchen

Mehr

Reguläre Ausdrücke mit Java

Reguläre Ausdrücke mit Java Reguläre Ausdrücke mit Java Johannes Dyck, Thomas Schulz Projektseminar www.prominentpeople.info Gliederung 2 1. Grundlagen von regulären Ausdrücken 1. Aufbau 2. Zeichenklassen 3. Metazeichen 4. Quantoren

Mehr

Einleitung. liefert Ihnen alle Dateien, die mit.txt enden. Oder dir bericht??.txt

Einleitung. liefert Ihnen alle Dateien, die mit.txt enden. Oder dir bericht??.txt Betrifft Regular Expressions Autor Martin Bracher (martin.bracher@trivadis.com) Art der Info Technische Background Info (November 2003) Quelle Aus unserer Schulungs- und Beratungstätigkeit Einleitung Sie

Mehr

Einstieg in die Informatik mit Java

Einstieg in die Informatik mit Java 1 / 17 Einstieg in die Informatik mit Java String Tokenizer Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 17 1 Überblick Tokenizer 2 StringTokenizer 3 Verwendung von String.split

Mehr

Linux II. Reguläre Ausdrücke Editoren Scripting. 2 Linux II. Linux I II III Res WN/TT NLTK XML Weka E Reguläre Ausdrücke Editoren Scripting

Linux II. Reguläre Ausdrücke Editoren Scripting. 2 Linux II. Linux I II III Res WN/TT NLTK XML Weka E Reguläre Ausdrücke Editoren Scripting Linux II 2 Linux II Reguläre Ausdrücke Editoren Scripting Reguläre Ausdrücke Reguläre Ausdrücke beschreiben eine Menge von Zeichenfolgen und werden benutzt um m festzustellen, ob eine Zeichenkette Teil

Mehr

Stream EDitor SED und Reguläre Ausdrücke

Stream EDitor SED und Reguläre Ausdrücke Stream EDitor SED und Reguläre Ausdrücke ExactCODE New Thinking Store 11. Mai 2006 Was ist SED? sed steht für Stream EDitor eine Variante des Unix Editors ed und arbeitet auf Streams keine interaktiven

Mehr

Dateisystem 1, Suchen & Finden

Dateisystem 1, Suchen & Finden Dateisystem 1, Suchen & Finden Linux-Kurs der Unix-AG Benjamin Eberle 15. Juni 2016 ln ln ( link ) legt Verknüpfungen an, Verwendung wie cp ohne Optionen wird ein zweiter Name für die gleiche Datei erzeugt

Mehr

Reguläre Ausdrücke. Einstieg in PHP 5.4 und MySQL 5.5. Zusatzkapitel zum Buch: Thomas Theis ISBN

Reguläre Ausdrücke. Einstieg in PHP 5.4 und MySQL 5.5. Zusatzkapitel zum Buch: Thomas Theis ISBN Zusatzkapitel zum Buch: Thomas Theis Einstieg in PHP 5.4 und MySQL 5.5 ISBN 978-3-8362-1877-1 Galileo Press 2012 1 Suchmuster Reguläre Ausdrücke dienen zur Beschreibung von Suchmustern. Mit Hilfe dieser

Mehr

Reguläre Ausdrücke - eine Einführung -

Reguläre Ausdrücke - eine Einführung - Ziel Reguläre Ausdrücke - eine Einführung - Andreas Romeyke Leipzig, Oktober/November 2002 Diese Präsentation ist eine kurze Einführung in die Welt der regulären Ausdrücke mit Schwerpunkt Perl. Die Präsentation

Mehr

Empfehlenswerte Referenzen

Empfehlenswerte Referenzen Wenn Google etwas nicht finden kann, fragen sie Jack Bauer. ("Fakten über Jack Bauer") Inhalt Empfehlenswerte Referenzen...1 0 Wozu reguläre Ausdrücke?...1 1 Die Elemente regulärer Ausdrücke...2 2 Ein

Mehr

1 Schöner suchen und ersetzen mit GREP

1 Schöner suchen und ersetzen mit GREP 18 1 Schöner suchen und ersetzen mit GREP Reguläre Ausdrücke Bei der Arbeit in InDesign kommt man oft mit der Suchen/Ersetzen- Funktion in Berührung. Viele Anwender beschränken sich auf die Suche nach

Mehr

Theorie der Informatik. Theorie der Informatik. 6.1 Einführung. 6.2 Alphabete und formale Sprachen. 6.3 Grammatiken. 6.4 Chomsky-Hierarchie

Theorie der Informatik. Theorie der Informatik. 6.1 Einführung. 6.2 Alphabete und formale Sprachen. 6.3 Grammatiken. 6.4 Chomsky-Hierarchie Theorie der Informatik 17. März 2014 6. Formale Sprachen und Grammatiken Theorie der Informatik 6. Formale Sprachen und Grammatiken Malte Helmert Gabriele Röger Universität Basel 17. März 2014 6.1 Einführung

Mehr

WS 2009/10 18.11.2009

WS 2009/10 18.11.2009 Übung 5 Vorbereitung Öffnen Sie einen Texteditor, z.b. Word, Emacs, Textedit etc. und legen Sie Ihre Antwortdatei an. Der Name der Antwortdatei sollte nach folgendem Schema aufgebaut sein: KL_ueb5_

Mehr

Reguläre Ausdrücke in C#

Reguläre Ausdrücke in C# Jürgen Bayer Reguläre Ausdrücke in C# Strings flexibel durchsuchen und bearbeiten Inhalt 1 Einführung 1 1.1 Das Prinzip 1 1.2 Die Musterzeichen 2 1.2.1 Escape-Sequenzen 3 1.2.2 Zeichenklassen 3 1.2.3 Gruppierungen

Mehr

Ein- und Ausgabeumlenkung

Ein- und Ausgabeumlenkung Ein- und Ausgabeumlenkung Viele Prozesse lesen und/oder schreiben Daten (z.b. who, date, cat, rm -i,...) Zu jedem Kommando gibt es voreingestellte Dateien, von denen Daten gelesen und/oder in die Daten

Mehr

Dateisystem 2, Suchen & Finden

Dateisystem 2, Suchen & Finden Dateisystem 2, Suchen & Finden Linux-Kurs der Unix-AG Benjamin Eberle 15. Januar 2015 ln ln ( link ) legt Verknüpfungen an, Verwendung wie cp ohne Optionen wird ein zweiter Name für die gleiche Datei erzeugt

Mehr

Korpuslinguistik IDS-Korpora und COSMAS II

Korpuslinguistik IDS-Korpora und COSMAS II Korpuslinguistik IDS-Korpora und COSMAS II Heike Zinsmeister Korpuslinguistik 11. 11. 2011 Gliederung 1 Einleitung 2 Korpusbestand am IDS 3 Korpusrecherche mit COSMAS II 4 Referenzen Das Institut für Deutsche

Mehr

Reguläre Ausdrücke in Oracle 10g Waren Queries bis jetzt irregulär? Dr. Martin Wunderli Trivadis AG

Reguläre Ausdrücke in Oracle 10g Waren Queries bis jetzt irregulär? Dr. Martin Wunderli Trivadis AG Reguläre Ausdrücke in Oracle 10g Waren Queries bis jetzt irregulär? Dr. Martin Wunderli Trivadis AG www.trivadis.com Reguläre Ausdrücke in Oracle 10g > Grundlagen > Vor Oracle 10g > Ab Oracle 10g > Check/Suchen/Ersetzen

Mehr

Perlkurs WS 14/15 Reguläre Ausdrücke I

Perlkurs WS 14/15 Reguläre Ausdrücke I Perlkurs WS 14/15 Reguläre Ausdrücke I 1 Reguläre Ausdrücke Reguläre Ausdrücke mächtigtes Werkzeug von Perl, um nach Mustern (Gruppen von Zeichen) innerhalb von Text zu suchen z.b. in Protein- und DNA-Sequenzen

Mehr

grep in Adobe InDesign

grep in Adobe InDesign grep in Adobe InDesign Kurs 2, Version CS5 Kursleiter: Serge Paulus Unterlagen Version 2 vom Juni 2011 grep in Adobe InDesign Kurs 2, Version CS5 2 grep in InDesign grep in InDesign Es gibt mehrere Implementierungen

Mehr

3. Nur die mit diesen Regeln erzeugten Ausdrücke sind reguläre Ausdrücke über Σ.

3. Nur die mit diesen Regeln erzeugten Ausdrücke sind reguläre Ausdrücke über Σ. H O C H S C H U L E University of Applied Sciences ZITTAU/GÖRLITZ Fachbereich Informatik Prof. Dr. Christian Wagenknecht Formale Sprachen und Automaten Übung: Reguläre Ausdrücke Zur Erinnerung: Reguläre

Mehr

Es gibt viele Programme, die mit regulären Ausdrücken arbeiten:

Es gibt viele Programme, die mit regulären Ausdrücken arbeiten: Reinald Cronauer 7. Februar 2001 Reguläre Ausdrücke 1 Einführung Reguläre Ausdrücke, kurz Regex genannt, erlauben das Suchen von Zeichenfolgen in große Texte. Ein regulärer Ausdruck ist aber flexibler

Mehr

Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung

Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus und seine Aufbereitung Bestandteile eines Korpus sind i.d.r.: Primärdaten Metadaten Annotationen Annotationen

Mehr

Grundlagen der Theoretischen Informatik

Grundlagen der Theoretischen Informatik Grundlagen der Theoretischen Informatik Sommersemester 2015 22.04.2015 Viorica Sofronie-Stokkermans e-mail: sofronie@uni-koblenz.de 1 Bis jetzt 1. Terminologie 2. Endliche Automaten und reguläre Sprachen

Mehr

SQL. SQL SELECT Anweisung SQL-SELECT SQL-SELECT

SQL. SQL SELECT Anweisung SQL-SELECT SQL-SELECT SQL SQL SELECT Anweisung Mit der SQL SELECT-Anweisung werden Datenwerte aus einer oder mehreren Tabellen einer Datenbank ausgewählt. Das Ergebnis der Auswahl ist erneut eine Tabelle, die sich dynamisch

Mehr

Heiko Baur 10. November 2006

Heiko Baur  10. November 2006 Reguläre Ausdrücke Heiko Baur http://www.belbardonisakel.de 10. November 2006 1 / 60 Begriffsdefinition Wildcards und reguläre Ausdrücke Zusammenfassung Teil I Einleitung 2 / 60 Begriffsdefinition Wildcards

Mehr

AUFGABE 1: REGULÄRE AUSDRÜCKE (5 PUNKTE)

AUFGABE 1: REGULÄRE AUSDRÜCKE (5 PUNKTE) AUFGABE 1: REGULÄRE AUSDRÜCKE (5 PUNKTE) a Das Zeichen a. Ein beliebiges Zeichen [abc] Ein beliebiges Zeichen aus der Menge {a, b, c [a-f] Ein beliebiges Zeichen aus der Menge {a, b, c, d, e, f \d eine

Mehr

1.7 Anwendung/Expansion und Substition

1.7 Anwendung/Expansion und Substition 1.7 Anwendung/Expansion und Substition 1.7.1 Tilden-Substitution BeiderTilden-SubstitutionwirdaufderKommandozeiledasWort durchdashome-verzeichnis des aktuellen Benutzers ersetzt: nutzer@r155pc13: $ echo

Mehr

Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora

Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann... und anderen Mitarbeitern der HU-Korpuslinguistik Ziele Wie/Was

Mehr

Erste Schritte in TUSTEP

Erste Schritte in TUSTEP Erste Schritte in TUSTEP Tobias Ott, pagina GmbH Tübingen Aufruf des Programms Einrichten von TUSTEP-Sitzungen Generelles zum Aufbau der TUSTEP-Programme Die wichtigsten Kommandos für den Anfang mit TUSTEP

Mehr

Michael Fitzgerald, Einstieg in Reguläre Ausdrücke, O Reilly, ISBN D3kjd3Di38lk323nnm

Michael Fitzgerald, Einstieg in Reguläre Ausdrücke, O Reilly, ISBN D3kjd3Di38lk323nnm D3kjd3Di38lk323nnm Michael Fitzgerald, Einstieg in Reguläre Ausdrücke, O Reilly, ISBN 97838689994029783868999402 Inhalt Vorwort.... 1 Was ist ein regulärer Ausdruck?... 1 Ein Anfang mit Regexpal... 2 Eine

Mehr

Eine Beschreibung des Programms und der dahinter stehenden Philosophie.

Eine Beschreibung des Programms und der dahinter stehenden Philosophie. 1 Geschichte Larry Wall schrieb ein Konfigurationsmanagementsystem und benötigte dazu ein Berichtwerkzeug, das mehrere Dateien gleichzeitig öffnen konnte. Awk konnte es damals nicht, daher schrieb er eine

Mehr

Linux I II III Res/Pro WN/TT Reguläre Ausdrücke Editoren Scripting. Linux II. 2 Linux II. Reguläre Ausdrücke Editoren Scripting. Ressourcen-Vorkurs

Linux I II III Res/Pro WN/TT Reguläre Ausdrücke Editoren Scripting. Linux II. 2 Linux II. Reguläre Ausdrücke Editoren Scripting. Ressourcen-Vorkurs Linux II 2 Linux II Reguläre Ausdrücke Editoren Scripting POSIX POSIX POSIX ist ein UNIX-Standard, der bestimmte grundlegende Funktionen und Eigenschaften von UNIX-Systemen definiert. Dazu gehören auch

Mehr

Lexikalische Programmanalyse der Scanner

Lexikalische Programmanalyse der Scanner Der Scanner führt die lexikalische Analyse des Programms durch Er sammelt (scanned) Zeichen für Zeichen und baut logisch zusammengehörige Zeichenketten (Tokens) aus diesen Zeichen Zur formalen Beschreibung

Mehr

Reguläre Ausdrücke: Beschreibung und Anwendung

Reguläre Ausdrücke: Beschreibung und Anwendung Reguläre Ausdrücke: und Anwendung Version 1.41 17.12.2014 Die Informationen in diesem Skript wurden mit größter Sorgfalt erarbeitet. Dennoch können Fehler nicht vollständig ausgeschlossen werden. Der Autor

Mehr

Fischerprüfung Online Registrierungsanleitung für Anwender. LfL-Information

Fischerprüfung Online Registrierungsanleitung für Anwender. LfL-Information Fischerprüfung Online Registrierungsanleitung für Anwender LfL-Information Impressum Herausgeber: Bayerische Landesanstalt für Landwirtschaft (LfL) Vöttinger Straße 38, 85354 Freising-Weihenstephan Internet:

Mehr

Theorie der Informatik

Theorie der Informatik Theorie der Informatik 6. Formale Sprachen und Grammatiken Malte Helmert Gabriele Röger Universität Basel 17. März 2014 Einführung Beispiel: Aussagenlogische Formeln Aus dem Logikteil: Definition (Syntax

Mehr

9303: gibt es nichts zu <lachen>, meine Damen und

9303: gibt es nichts zu <lachen>, meine Damen und Korpusabfragen mit CQP CQP Dies ist nur eine Kurzanleitung. Bitte verwenden Sie auch das CQP Handbuch http://www.ims.uni-stuttgart.de/projekte/corpusworkbench/cqpusermanual/html/cqpman.html Einige CQP

Mehr

Oracle 10g Einführung

Oracle 10g Einführung Kurs Oracle 10g Einführung Teil 7 Einige interessante SQL und PL/SQL Erweiterungen für Administratoren Timo Meyer Administration von Oracle-Datenbanken Timo Meyer Sommersemester 2006 Seite 1 von 19 Seite

Mehr

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz

Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz 02_Grundlagen Lucene Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz Was ist Lucene? (1) Apache Lucene is a high-performance, full-featured text search engine library written

Mehr

Prinzipien der Softwareentwicklung S. Strahringer

Prinzipien der Softwareentwicklung S. Strahringer Gliederung 1 Einführung Was ist ein Programm? Vorteile (und Nachteile) von PHP Erste PHP-Programme Ausführung von PHP-Programmen 2 Grundbegriffe der Programmierung Anweisungen, Variablen, Datentypen und

Mehr

Grundkurs Teil 2. Senioren-Computerclub-Dulach Bienleinstorstr. 22 Dienstags von 10:00 bis 12:00 Uhr G.B.

Grundkurs Teil 2. Senioren-Computerclub-Dulach Bienleinstorstr. 22 Dienstags von 10:00 bis 12:00 Uhr G.B. Grundkurs 9.10.2006 Teil 2 Senioren-Computerclub-Dulach Bienleinstorstr. 22 Dienstags von 10:00 bis 12:00 Uhr DAS SCHREIBMASCHINENFELD Das Schreibmaschinenfeld besteht aus Tasten mit numerischen, alphanumerischen

Mehr

Fachmagazinartikel. Module Leader: Tobias Schmidt Staffing: Word Count: Michaela Duhr, Benedikt Vogeler, Paul Stüssel. 1.443 (9.

Fachmagazinartikel. Module Leader: Tobias Schmidt Staffing: Word Count: Michaela Duhr, Benedikt Vogeler, Paul Stüssel. 1.443 (9. Fachmagazinartikel Module Name: Creative Media Practice Module Number: SAE 502 Course Number: WDBP 412 Date Submitted: 05.03.2013 Award Name: Bachelor of Arts/Science (Hons.) Web Development Year: 2013

Mehr

Eine kurze Einführung in Vim

Eine kurze Einführung in Vim Eine kurze Einführung in Vim Johannes Englisch Universität Leipzig Institut für Linguistik Seminar Sprachwissenschaftliche Elementarkompetenz Johannes Englisch (Uni Leipzig) Vim Sem. wissenschaftl. Arbeiten

Mehr

Tutorium Reguläre Ausdrücke/Code Munger

Tutorium Reguläre Ausdrücke/Code Munger Tutorium Reguläre Ausdrücke/Code Munger (Version 1.2 vom 14.3.2014) Einleitung Mit reguläre Ausdrücken lassen sich Mengen von Zeichenketten beschreiben. Diese Beschreibungen werden dann zum Beispiel zur

Mehr

Ein deterministischer endlicher Automat (DFA) kann als 5-Touple dargestellt werden:

Ein deterministischer endlicher Automat (DFA) kann als 5-Touple dargestellt werden: Sprachen und Automaten 1 Deterministische endliche Automaten (DFA) Ein deterministischer endlicher Automat (DFA) kann als 5-Touple dargestellt werden: M = (Z,3,*,qo,E) Z = Die Menge der Zustände 3 = Eingabealphabet

Mehr

Formale Sprachen, reguläre und kontextfreie Grammatiken

Formale Sprachen, reguläre und kontextfreie Grammatiken Formale Sprachen, reguläre und kontextfreie Grammatiken Alphabet A: endliche Menge von Zeichen Wort über A: endliche Folge von Zeichen aus A A : volle Sprache über A: Menge der A-Worte formale Sprache

Mehr

Arbeitshilfe für fortlaufende Ressourcen RDA Erscheinungsdatum

Arbeitshilfe für fortlaufende Ressourcen RDA Erscheinungsdatum Arbeitsstelle für Standardisierung (AfS) Projekt RDA Stand: 24. August 2015 Arbeitshilfe für fortlaufende Ressourcen RDA 2.8.6 Erscheinungsdatum Das Erscheinungsdatum ist ein Standardelement und wird immer

Mehr

Benutzung der Manpage, Shell Teil 3

Benutzung der Manpage, Shell Teil 3 Benutzung der Manpage, Shell Teil 3 Linux-Kurs der Unix-AG Andreas Teuchert 3./9. Mai 2012 Manpages Dokumentation zu Programmen, speziellen Dateien, etc. steht in Manpages Aufruf mit man Manpage

Mehr

Eine Abfrage (Query) ist in Begriffe und Operatoren unterteilt. Es gibt zwei verschiedene Arten von Begriffen: einzelne Begriffe und Phrasen.

Eine Abfrage (Query) ist in Begriffe und Operatoren unterteilt. Es gibt zwei verschiedene Arten von Begriffen: einzelne Begriffe und Phrasen. Lucene Hilfe Begriffe Eine Abfrage (Query) ist in Begriffe und Operatoren unterteilt. Es gibt zwei verschiedene Arten von Begriffen: einzelne Begriffe und Phrasen. Ein einzelner Begriff ist ein einzelnes

Mehr

LWDKIP LWDKIP Zugang Okt https://portal.tirol.gv.at/

LWDKIP LWDKIP Zugang Okt https://portal.tirol.gv.at/ Zugang LWDKIP LWDKIP Der Zugang zu LWDKIP erfolgt über das Portal Tirol: https://portal.tirol.gv.at/ Alle sechs Monate muss aus Sicherheitsgründen das Passwort für den Zugang zum Portal Tirol und somit

Mehr

Programmieren in Java

Programmieren in Java Programmieren in Java Vorlesung 07: Parsen Prof. Dr. Peter Thiemann Albert-Ludwigs-Universität Freiburg, Germany SS 2015 Peter Thiemann (Univ. Freiburg) Programmieren in Java JAVA 1 / 32 Inhalt Vorlesungsüberblick

Mehr

Datenaustausch@IC RL

Datenaustausch@IC RL Datenaustausch@IC RL SAP cfolders Erste Schritte Erstes Login: Ihre Initial-Zugangsdaten zu SAP cfolders finden Sie im ProjektPortal nach Klick auf den Reiter Projekt SAP cfolders, im Channel SAP cfolders

Mehr

Syntax von Programmiersprachen

Syntax von Programmiersprachen "Grammatik, die sogar Könige zu kontrollieren weiß... aus Molière, Les Femmes Savantes (1672), 2. Akt Syntax von Programmiersprachen Prof. Dr. Christian Böhm in Zusammenarbeit mit Gefei Zhang WS 07/08

Mehr

Wie finde ich schnell relevante Literatur?

Wie finde ich schnell relevante Literatur? Platzhalter für Bild, Bild auf Titelfolie hinter das Logo einsetzen Wie finde ich schnell relevante Literatur? Suchtechniken im Katalog der UB In diesem Tutorial geht es um verschiedene Suchtechniken,

Mehr

Reguläre Ausdrücke 1 / 10. Doing Web Apps. Reguläre Ausdrücke. Letzte Änderung: 2009-04-17 Version: 0.6 Copyright: 2005. Alle Rechte vorbehalten

Reguläre Ausdrücke 1 / 10. Doing Web Apps. Reguläre Ausdrücke. Letzte Änderung: 2009-04-17 Version: 0.6 Copyright: 2005. Alle Rechte vorbehalten 1 / 10 Doing Web Apps Reguläre Ausdrücke Autor: Rüdiger Marwein Letzte Änderung: 2009-04-17 Version: 0.6 Copyright: 2005. Alle Rechte vorbehalten Dieses Dokument darf mit Nennung des Autoren - frei vervielfältigt,

Mehr

Kapitel 2. Methoden zur Beschreibung von Syntax

Kapitel 2. Methoden zur Beschreibung von Syntax 1 Kapitel 2 Methoden zur Beschreibung von Syntax Grammatik, die sogar Könige zu kontrollieren weiß... aus Molière, Les Femmes Savantes (1672), 2. Akt 2 Ziele Zwei Standards zur Definition der Syntax von

Mehr

Interrupt: Passwort-Checker Arbeitsblatt

Interrupt: Passwort-Checker Arbeitsblatt Lehrerinformation 1/5 Arbeitsauftrag Passwort-Checker: Mit Hilfe einer Plattform im Internet kann man die verschiedenen Passwörter auf ihre Sicherheit überprüfen. Die Sch kreieren Passwörter, welche einen

Mehr

Zusammenfassung Informatik

Zusammenfassung Informatik 1. Information und ihre Darstellung Information + Automatik = Informatik Zusammenfassung Informatik Informationen kann man mit Hilfe von Bildern, Diagrammen, Graphiken, Tönen, Texten, Tabellen, Strichlisten,

Mehr

10 Reguläre Ausdrücke

10 Reguläre Ausdrücke 10 Reguläre Ausdrücke Muster, nach denen zum Beispiel Dateien durchsucht werden sollen, können mit Hilfe von regulären Ausdrücken gebildet werden. engl.: Muster = pattern; regulärer Ausdruck = regular

Mehr

Betriebssysteme I WS 2016/17. Prof. Dr. Dirk Müller. 3 Shell-Grundlagen

Betriebssysteme I WS 2016/17. Prof. Dr. Dirk Müller. 3 Shell-Grundlagen Betriebssysteme I 3 Shell-Grundlagen WS 2016/17 Prof. Dr. Dirk Müller Dirk Müller: Betriebssysteme I WS 2016/17 2/18 Praktische Tipps Überblick Kommandoaufruf Bereitschaftszeichen (Prompt) Name, Option(-en),

Mehr

Elementare Konzepte von

Elementare Konzepte von Elementare Konzepte von Programmiersprachen Teil 1: Bezeichner, Elementare Datentypen, Variablen, Referenzen, Zuweisungen, Ausdrücke Kapitel 6.3 bis 6.7 in Küchlin/Weber: Einführung in die Informatik Bezeichner

Mehr

Reguläre Ausdrücke. Prof.Dr.Christian Wagenknecht mit Beiträgen von Herrn Dr.Michael Hielscher

Reguläre Ausdrücke. Prof.Dr.Christian Wagenknecht mit Beiträgen von Herrn Dr.Michael Hielscher Reguläre Ausdrücke Prof.Dr.Christian Wagenknecht mit Beiträgen von Herrn Dr.Michael Hielscher Prof.Dr.Chr. Wagenknecht Formale Sprachen und Automaten 1/44 Definition reguläre Ausdrücke für reguläre Sprachen

Mehr

Inhalte der Vorlesung. 3. Der Textstrom-Editor sed. 3. Der Textstrom-Editor sed. Grundprinzip eines Textstrom-Editors

Inhalte der Vorlesung. 3. Der Textstrom-Editor sed. 3. Der Textstrom-Editor sed. Grundprinzip eines Textstrom-Editors Inhalte der Vorlesung 3. Der Textstrom-Editor sed 1.Einführung 2.Lexikalische Analyse 3.Der Textstrom-Editor sed 4.Der Scanner-Generator lex (2 Termine) 5.Syntaxanalyse und der Parser-Generator yacc (3

Mehr

Einführung in die Informatik Turing Machines

Einführung in die Informatik Turing Machines Einführung in die Informatik Turing Machines Eine abstrakte Maschine zur Präzisierung des Algorithmenbegriffs Wolfram Burgard Cyrill Stachniss 1/14 Motivation und Einleitung Bisher haben wir verschiedene

Mehr

Teil 3: Syntax-Diagramme

Teil 3: Syntax-Diagramme 3. Syntax-Diagramme 3-1 Teil 3: Syntax-Diagramme Literatur: Kathleen Jensen/Niklaus Wirth: PASCAL User Manual and Report, 4th Edition. Springer, 1991. Niklaus Wirth: Compilerbau (in German). Teubner, 1986.

Mehr

Reguläre Ausdrücke in Python

Reguläre Ausdrücke in Python Wintersemester 2009/2010 1 Metazeichen, Quantoren, Gruppierung 2 findall, finditer 3 sub, subn 4 split 5 Match Objects 6 greedy 7 Gruppen-Namen 8 Assertions Reguläre Ausdrücke Reguläre Ausdrücke Reguläre

Mehr

Programmierstile in C

Programmierstile in C Von Sebastian Rothe 05.05.011 Inhaltsverzeichnis 1. Motivation wozu Code-Formatierung?. Definition: Programmierstil Gebräuchliche Konventionen Einrückungsstil Vertikale Anordnung Leerzeichen & Tabulatoren

Mehr

9 Theoretische Informatik und Compilerbau

9 Theoretische Informatik und Compilerbau 9 Theoretische Informatik und Compilerbau Theoretische Informatik und Mathematik schaffen die Basis für viele der technischen Entwicklungen, die wir in diesem Buch besprechen. Die boolesche Algebra (S.

Mehr

Benutzerhandbuch E-Mail Archivierung

Benutzerhandbuch E-Mail Archivierung Benutzerhandbuch E-Mail Archivierung Kurzbeschrieb Das vorliegende Dokument beschreibt den Umgang mit der E-Mail Archivierung bei. Änderungskontrolle Version Datum Überarbeitungsgrund Ersteller 1.0 27.01.2014

Mehr