b{2} [^b]{2} Reguläre Ausdrücke als Hilfsmittel der Textanalyse Manuel Raaf Bayerische Akademie der Wissenschaften, IT-Referat
|
|
- Andreas Kruse
- vor 7 Jahren
- Abrufe
Transkript
1 b{2} [^b]{2} Reguläre Ausdrücke als Hilfsmittel der Textanalyse Manuel Raaf Bayerische Akademie der Wissenschaften, IT-Referat
2 Reguläre Ausdrücke engl. regular expressions, kurz: regex, regexp sind formale Ausdrücke, beschreiben Mengen bzw. Untermengen von Zeichenketten anhand syntaktischer Regeln, dienen damit der Auffindung von Zeichenketten variabler Art, Reguläre Ausdrücke als Hilfsmittel der Textanalyse
3 Reguläre Ausdrücke verfügbar in nahezu allen Programmiersprachen und vielen Textverarbeitungsprogrammen, jedoch nicht überall in gleicher Komplexität, volle Unicode-Unterstützung, (abhängig von gewählter Programmiersprache bzw. Programm) vereinfachen die Suche nach und das Ersetzen von komplexen Textmustern, ersetzen zeilen-/seitenweise Programmcode. Reguläre Ausdrücke als Hilfsmittel der Textanalyse
4 Reguläre Ausdrücke Textmuster bzw. Zeichenkette: Tags, Annotations-Marker, Trennzeichen, Metadaten, Annotationen, Wörter, Wortteile, einzelne Grapheme, Phrasen, Sätze, Interpunktionen, Ziffern, etc. Noten, Symbole suchbar in: jeglicher Textdatei, Datenbanken, eingebettete Metadaten in Medien (Ton, Video, Bild) Reguläre Ausdrücke als Hilfsmittel der Textanalyse
5 Reguläre Ausdrücke Logik bzw. Formulierung auf Kleinkindniveau : alles sehr genau Schritt für Schritt formulieren denn: der Computer ist nur so schlau wie die Person, die vor ihm sitzt Reguläre Ausdrücke als Hilfsmittel der Textanalyse
6 Metazeichen Metazeichen stehen für eine Gruppe von Zeichen oder für eine Funktion: \d Ziffern von 0 bis 9 (digit) \w Buchstaben, Ziffern und _ (word) \b Wortgrenze (boundary); mit Vorsicht zu genießen! \D alles, was nicht \d ist \W Alles, was nicht \w ist \s Leerzeichen, Tabulatoren, Zeilenumbrüche (space) \S Alles, was nicht \s ist Reguläre Ausdrücke als Hilfsmittel der Textanalyse
7 Metazeichen Metazeichen stehen für eine Gruppe von Zeichen oder für eine Funktion: * Quantor: beliebig viele Treffer (auch 0) + Quantor: mindestens 1 Treffer? Quantor: 0 oder 1 Treffer {x,y} oder {x} frei wählbarer Quantor; x und y sind Zahlen. alles, d.h. alle Zeichen \n Zeilenumbruch (new line) \r Wagenrücklauf (carriage return) \t Tabulator Reguläre Ausdrücke als Hilfsmittel der Textanalyse
8 Metazeichen - Beispiele H.nd oder H\wnd (ohne Groß-/Kleinschreibung) Hund, Hunde, Hand, Handel, Honda, Hindu, Hindi, bestehend, anhand, entsprechend, handlich H.nd\b oder H\wnd\b (mit Groß-/Kleinschreibung) Hund, Hand \d{1,2}.\d{1,2}.\d{2,4} , 10/12/2014, findet aber auch z. B sicherer: \d{1,2}\d\d{1,2}\d\d{2,4} Reguläre Ausdrücke als Hilfsmittel der Textanalyse
9 Beispiel ohne Regex H.nd oder H\wnd (ohne Groß-/Kleinschreibung) müsste in einer Programmiersprache z. B. so formuliert werden: IF POSITION('h' IN LOWERCASE(str)) THEN PRINT str AND LOWERCASE(SUBSTRING(str,POSITION('h' IN LOWERCASE(str))+2,2)='nd') str enthält die zu durchsuchende Zeichenkette; POSITION, SUBSTRING, LOWERCASE und PRINT sind Funktionen der Programmiersprache. Existieren erstere 3 nicht, müssten sie selbst implementiert werden. Das Beispiel würde dann mehrere Seiten umfassen. Reguläre Ausdrücke als Hilfsmittel der Textanalyse
10 Metazeichen Metazeichen stehen für eine Gruppe von Zeichen oder für eine Funktion: ( ) Gruppierung; Speicherung des Inhalts, um darauf zurückgreifen zu können Oder-Verknüpfung einzelner Teil-Patterns [ ] [^ ] Oder-Verknüpfung einzelner Zeichen bzw. Angabe einer Klasse von Zeichen Negation von [ ] (?: ) Gruppierung, ohne Speicherung steht hier jeweils stellvertretend für ein beliebiges Suchmuster Reguläre Ausdrücke als Hilfsmittel der Textanalyse
11 Metazeichen - Beispiele [a-z0-9] [Д-Р] alle lateinischen Buchstaben von a bis z sowie alle Ziffern von 0-9. enthält für gewöhnlich nur das englische Alphabet! kyrillisches Alphabet von Д (D) bis Р (R) M[aä]nn\w* oder M(a ä)nn\w* Mann, Männer, Mannes, Mannschaft, Mannheim Vorsicht: Ma änn\w* würde Ma oder änn\w* suchen! Die Klammerung ist daher unbedingt nötig! Reguläre Ausdrücke als Hilfsmittel der Textanalyse
12 Metazeichen - Beispiele \b(\w+)\w+\1+ identische Wörter mehrfach hintereinander, z. B.: Dt.: die die, der der, Haus Haus (wohl als Tippfehler) Tr.: güle güle kullan (trage es wohl), yavaş yavaş söyle lütfen (bitte sprich langsam) \b(\w)\w+\s+(\1\w+\s+){2,} <[^>]+> Alliterationen wie z. B. veni vidi vici alle Tags, wie z. B. <font size=''+2''> \b[^aiouöäü\s\d-]+\b alles, was nicht a, i, o, u, ö, ä, ü, Leerzeichen, Ziffern und den Bindestrich enthält sowie von Wortgrenzen umgeben ist. Wörter, die keinen anderen Vokal als e enthalten. Reguläre Ausdrücke als Hilfsmittel der Textanalyse
13 Metazeichen Metazeichen stehen für eine Gruppe von Zeichen oder für eine Funktion: \p{german} \p{arabic} \p{l} Unicode-Block für Deutsch Unicode-Block für Arabisch jeglicher Buchstabe im Unicode Unicode-Metazeichen beheben Probleme, die z. B. durch \w in Benutzung bei Texten, die nicht nur ASCII enthalten, auftreten können! Reguläre Ausdrücke als Hilfsmittel der Textanalyse
14 Metazeichen - Beispiele \p{georgian}+ \p{lu}{2,} findet alle in georgischer Schrift geschriebenen Wörter. findet alle Zeichenketten, die ausschließlich und mindestens 2 Großbuchstaben (in beliebigem Alphabet!) enthalten. damit können Akronyme in mehrsprachigen Texten gefunden werden. Reguläre Ausdrücke als Hilfsmittel der Textanalyse
15 Metazeichen soll nach Zeichen, die als Metazeichen fungieren, gesucht werden, muss diesen zur Demaskierung ein Backslash \ vorangestellt werden: \. findet. anstatt beliebigem Zeichen \+ findet + anstatt Interpretation als Quantor \\ demaskiert und findet somit \ selbst Reguläre Ausdrücke als Hilfsmittel der Textanalyse
16 Reichweite der Quantoren Sofern nicht anders angegeben, endet die Reichweite der Quantoren am Zeilenende, da auch die Suche (m. E.) nur bis zum Zeilenende geht. Die Option m ändert dies. Reguläre Ausdrücke als Hilfsmittel der Textanalyse
17 Gierige Quantoren Die Quantoren *, + und {x,y} sind gierig, d.h. sie erfassen so viele Treffer wie möglich, sofern sie nicht reguliert werden. Lösung: zusätzliches Anfügen von? Direkt nach dem Quantor hebt Gierigkeit auf: *? stoppt nach dem ersten Treffer innerhalb einer Zeile bzw. des gesamten Textes (falls m als Option angegeben ist). Reguläre Ausdrücke als Hilfsmittel der Textanalyse
18 lookahead, lookbehind lookbehind: finde Muster nur, wenn davor ein bestimmtes Muster steht positiv: (?<= ) negativ: (?<!...) lookahead: finde Muster nur, wenn vornweg ein bestimmtes Muster steht positiv: (?= ) negativ: (?!...) steht jeweils für ein Suchmuster Die gefundenen Muster der lookarounds sind nicht im Suchergebnis enthalten! Sie werden somit auch nicht ersetzt. Reguläre Ausdrücke als Hilfsmittel der Textanalyse
19 Programme AntConc Reguläre Ausdrücke als Hilfsmittel der Textanalyse
20 Programme Notepad++ Reguläre Ausdrücke als Hilfsmittel der Textanalyse
21 Literatur / Links AntConc ( Notepad++ ( regex online testen GOYVAERTS, Jan; LEVITHAN, Steven / DEMMIG Thomas (trans.): Reguläre Ausdrücke Kochbuch, O Reilly, Köln, 2009 Reguläre Ausdrücke als Hilfsmittel der Textanalyse
22 Vielen Dank für die Aufmerksamkeit! Reguläre Ausdrücke als Hilfsmittel der Textanalyse
/ Vortrag Unix-AG
16.6.2010 / Vortrag Unix-AG xkcd Fortsetzung... Grundlegendes 1 Begriff: = regular expressions kurz: regex Funktion: definieren flexible Muster, mit denen in Texten gesucht (und ersetzt) werden kann. Diese
MehrReguläre Ausdrücke. Reguläre Ausdrücke = Regular Expressions = reg.exp./regexp/regexp = RE
Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. REGULAR EXPRESSIONS RegExp Was ist ein regulärer Ausdruck? = Regular Expressions = reg.exp./regexp/regexp = RE Ein regulärer
MehrReguläre Ausdrücke IDE AUTUMN SCHOOL
Reguläre Ausdrücke 1 Reguläre Ausdrücke Übersicht Einführung Grundlagen Währenddessen: Übungen 2 Was sind Reguläre Ausdrücke? Reguläre Ausdrücke sind Zeichenketten, die Mengen von Zeichenketten beschreiben.
MehrWebengineering. Reguläre Ausdrücke. Dienstag, 2. Juli 13
Webengineering Reguläre Ausdrücke Marcel Vilas 1 DHBW - Stuttgart 1 RegExp - Allgemein Muster, die eine Menge von Zeichenketten mit Hilfe bestimmter syntaktischer Regeln beschreiben Werden oft als Suchmuster
MehrReguläre Ausdrücke mit Java
Reguläre Ausdrücke mit Java Johannes Dyck, Thomas Schulz Projektseminar www.prominentpeople.info Gliederung 2 1. Grundlagen von regulären Ausdrücken 1. Aufbau 2. Zeichenklassen 3. Metazeichen 4. Quantoren
MehrRegular expressions for pros Reguläre Ausdrücke für Fortgeschrittene (Perl) Elena Neuburg
Regular expressions for pros Reguläre Ausdrücke für Fortgeschrittene (Perl) Elena Neuburg Inhaltsverzeichnis Definition Pattern Matching Greediness Eagerness Backtracking Nützliche Optionen Backreferences
MehrSchritt für Schritt Reguläre Ausdrücke verstehen. Einstieg in. Reguläre Ausdrücke. Michael Fitzgerald O REILLY. Übersetzung von Thomas Demmig
Schritt für Schritt Reguläre Ausdrücke verstehen Einstieg in Reguläre Ausdrücke O REILLY Michael Fitzgerald Übersetzung von Thomas Demmig Inhalt Vorwort.... 1 Was ist ein regulärer Ausdruck?... 1 Ein Anfang
MehrDigital Humanities: Übung 1
Digital Humanities: Übung 1 Suche mit Boolschen Operatoren und Regulären Ausdrücken Sven Büchel Jena Language & Information Engineering (JULIE) Lab Friedrich-Schiller-Universität Jena, Germany http://www.julielab.de
MehrReguläre Ausdrücke Suchmuster, Pattern Matching
Suchmuster, Pattern Matching Ein oder mehrere Einzelzeichen in interner Variablen $_suchen: /e/ #liefert wahr, wenn $_ ein 'e' enthält. /aus/ #liefert wahr, wenn $_ 'aus' enthält. while { if (/e/)
MehrProseminar UNIX Tools. Ferdinand Beyer
Reguläre Ausdrücke Proseminar UNIX Tools Ferdinand Beyer Technische Universität München 08.11.2005 Ferdinand Beyer (TUM) Reguläre Ausdrücke 08.11.2005 1 / 39 Gliederung Allgemeines 1 Allgemeines 2 Notation
MehrEinführung in PERL 2 Reguläre Ausdrücke
Einführung in PERL 2 Reguläre Ausdrücke BASIEREND AUF FOLIEN VON DR. H. ZINSMEISTER und dem Buch `Einführung in Perl (Lama Buch) von RL Schwartz&T Phoenix sowie hwp://de.sel[tml.org/perl/sprache/regexpr.htm
MehrEinführung in die Programmiertechnik
Einführung in die Programmiertechnik Formale Beschreibung von Programmiersprachen Lexikalische Regeln Definition von Wörtern (Lexem, Token) Gruppierung von Zeichen Lexikalische Kategorien: Klassen ähnlicher
MehrElementare Unix-Befehle 11
Elementare Unix-Befehle 11 beliebige Dateien vergleichen mit diff - diff datei1 datei2 listet die Unterschiede zwischen den beiden Dateien: d.h., welche Änderungen an den beiden Dateien ausgeführt werden
MehrFormale Sprachen und Automaten
Formale Sprachen und Automaten Kapitel 3: Regular Expressions Vorlesung an der DHBW Karlsruhe Thomas Worsch Karlsruher Institut für Technologie, Fakultät für Informatik Wintersemester 2012 Kapitel 3 Regular
MehrSebastian Harl. 03. Oktober 2008
Reguläre Ausdrücke Sebastian Harl LUSC Workshop Weekend 2008 03. Oktober 2008 (?:[a-z0-9!#$%& *+/=?^_ { }~-]+(?:\.[a-z0-9!#$%& *+/=?^_ { }~-]+ )* "(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21\x23-\x5b\x5d-\x7f]
MehrLinux II. Reguläre Ausdrücke Editoren Scripting. 2 Linux II. Linux I II III Res WN/TT NLTK XML Weka E Reguläre Ausdrücke Editoren Scripting
Linux II 2 Linux II Reguläre Ausdrücke Editoren Scripting Reguläre Ausdrücke Reguläre Ausdrücke beschreiben eine Menge von Zeichenfolgen und werden benutzt um m festzustellen, ob eine Zeichenkette Teil
Mehr18.09.2010 / Software Freedom Day
18.09.2010 / Software Freedom Day xkcd Fortsetzung... Grundlegendes Begriff: = regular expressions kurz: regex Funktion: definieren flexible Muster, mit denen in Texten gesucht (und ersetzt) werden kann.
MehrSuchen & Ersetzen in umfangreichen Dokumentenbeständen
Suchen & Ersetzen in umfangreichen Dokumentenbeständen Dipl.-Math. Klaus Stolte Klaus.Stolte@tfk.de tekom-regionalgruppentreffen, München, 18.05.2010 Thematische Eingrenzung» Dokumentübergreifendes Suchen
MehrEinführung in die Computerlinguistik Suche mit regulären Ausdrücken
Einführung in die Computerlinguistik Suche mit regulären Ausdrücken Dozentin: Wiebke Petersen 9. Foliensatz Wiebke Petersen Einführung CL 1 Suche mit regulären Ausdrücken Suche nach allen Wortformen des
MehrEinführung in die Computerlinguistik Suche mit regulären Ausdrücken
Einführung in die Computerlinguistik Suche mit regulären Ausdrücken Dozentin: Wiebke Petersen 9. Foliensatz Wiebke Petersen Einführung CL 1 Suche mit regulären Ausdrücken Suche nach allen Wortformen des
MehrC. Ortseifen: Reguläre Ausdrücke
Inhalt Reguläre Ausdrücke mit SAS Einsatz der RX- und PRX-Funktionen Dr. Carina Ortseifen SAS-Treff am URZ 2. Dezember 2005 1. Einleitung 2. Aufbau der regulären Ausdrücke 3. Beispiele 4. Reguläre Ausdrücke
MehrFerdinand Beyer. 1 Allgemeines Beschreibung Bezeichnungen Einsatzgebiete in UNIX-Tools Notationsarten...
Reguläre Ausdrücke Ferdinand Beyer Inhaltsverzeichnis 1 Allgemeines 2 1.1 Beschreibung............................. 2 1.2 Bezeichnungen............................ 2 1.3 Einsatzgebiete in UNIX-Tools....................
MehrÜbersicht. Einführung in Perl Operatoren - Richtigstellung Mustersuche II. Richtigstellung Operatoren (2) Richtigstellung Operatoren (1)
IMS Einführung in Perl Operatoren - Richtigstellung Mustersuche II Universität Stuttgart Institut für maschinelle Sprachverarbeitung http://www.ims.uni-stuttgart.de/lehre/teaching/2003-ws/perl/home.html
MehrPropädeutikum Programmierung in der Bioinformatik
Propädeutikum Programmierung in der Bioinformatik Java Reguläre Ausdrücke und PROSITE-Patterns Thomas Mauermeier 04.12.2018 Ludwig-Maximilians-Universität München Warum Reguläre Ausdrücke? Regulärer Ausdruck
MehrReguläre Ausdrücke - eine Einführung -
Ziel Reguläre Ausdrücke - eine Einführung - Andreas Romeyke Leipzig, Oktober/November 2002 Diese Präsentation ist eine kurze Einführung in die Welt der regulären Ausdrücke mit Schwerpunkt Perl. Die Präsentation
MehrDateisystem 1, Suchen & Finden
Dateisystem 1, Suchen & Finden Linux-Kurs der Unix-AG Benjamin Eberle 15. Juni 2016 ln ln ( link ) legt Verknüpfungen an, Verwendung wie cp ohne Optionen wird ein zweiter Name für die gleiche Datei erzeugt
MehrRegular Expressions. Daniel Lutz Was ist eine Regular Expression?
Regular Expressions Daniel Lutz 12.11.2003 1 Was ist eine Regular Expression? Ausdruck, der ein Textfragment beschreibt Eine Regular Expression passt zu einem Textfragment, wenn das Textfragment
Mehr3 Regular expressions
3 Regular expressions Es gibt eine ganze Reihe von Unix-Werkzeugen, für deren Benutzung es sinnvoll oder gar wesentlich ist, dass man mit etwas umgehen kann, was als regular expression oder kurz Regex
MehrÜbungs- und Praktikumsaufgaben zur Systemprogrammierung Dipl.-Ing. H. Büchter (Lehrbeauftragter) FH-Dortmund WS 2001/2002 / SS 2002
1. Stellen Sie die schrittweise Verbesserung eines Compilers durch das Bootstrap- Verfahren mit Hilfe von T-Diagrammen dar. Gegeben ist ein auf der Maschine M lauffähiger Compiler C 1, der in S geschrieben
MehrShell-Scripting Teil 2 - Reguläre Ausdrücke
Shell-Scripting Teil 2 - Reguläre Ausdrücke Alexander Gordon Freie Universität Berlin 5. Vorlesung WS17/18 Outline Reguläre Ausdrücke Was sind reguläre Ausdrücke? Syntax Suchen mit grep/egrep Ersetzen
MehrPerl Regular Expressions in Base SAS
Webinar@Lunchtime Perl Regular Expressions in Base SAS Perl Reguläre Ausdrücke (Perl Regular Expressions) Einleitung Perl Regulare Ausdrücke beschreiben einen Text, der als Muster dient. In einem solchen
MehrUNIX Power Tools. Helferlein für den Alltag. Maximilian Haupt
UNIX Power Tools Helferlein für den Alltag Maximilian Haupt mhaupt@cs.uni-magdeburg.de Fakultät für Informatik, Otto-von-Guericke-Universität Magdeburg Magdeburg, 28. Oktober 2008 1 Reguläre Ausdrücke
MehrVorbemerkung. Allgemeines zu Shell Scripts. Aufruf. Einfaches Beispiel
Inhalt: Vorbemerkung...1 Allgemeines zu Shell Scripts...1 Aufruf...1 Einfaches Beispiel...1 Testen eines Shell-Scripts...2 Kommandozeilen-Parameter...2 Prozeßsteuerung...3 Bedingte Ausführung: if...3 Mehrfachentscheidung:
MehrRegexp Reguläre Ausdrücke
Vincent Tscherter Regexp Reguläre Ausdrücke Suchen und Ersetzen von en, das können sehr viele Programme. Aber was, wenn man nach allen Telefonnummern oder E-Mail-Adressen in einem suchen möchte? Oder nach
MehrMySQL Informationsgewinnung Teil 3. Stefan Maihack Dipl. Ing. (FH) Datum:
MySQL Informationsgewinnung Teil 3 Stefan Maihack Dipl. Ing. (FH) Datum: 18.6.2013 Mustervergleich Problem: Der gesuchte Datensatz ist nur teilweise bekannt Beispiel: alle Bücher zum Thema MySQL exakter
MehrLexikalische Struktur von Fortran 95. Normierte Zeichensätze
Lexikalische Struktur von Fortran 95. Normierte Zeichensätze Im Folgenden steht für ein Leerzeichen! ASCII (American Standard Code for Information Interchange. Es gibt eine DIN-Norm die dem entspricht),
Mehrgrep in Adobe InDesign
grep in Adobe InDesign Kurs 2, Version CS5 Kursleiter: Serge Paulus Unterlagen Version 2 vom Juni 2011 grep in Adobe InDesign Kurs 2, Version CS5 2 grep in InDesign grep in InDesign Es gibt mehrere Implementierungen
MehrArbeiten mit Regulären Ausdrücken. Annette Gerstenberg Würzburg, 16. März 2016 Workshop "Digitale Methoden" beim Forum Junge Romanistik
Arbeiten mit Regulären Ausdrücken Annette Gerstenberg Würzburg, 16. März 2016 Workshop "Digitale Methoden" beim Forum Junge Romanistik Warum RegEx? Ziele! Beispiel 1: Bereinigen eines Transkripts, Entfernen
MehrDateisystem 2, Suchen & Finden
Dateisystem 2, Suchen & Finden Linux-Kurs der Unix-AG Benjamin Eberle 15. Januar 2015 ln ln ( link ) legt Verknüpfungen an, Verwendung wie cp ohne Optionen wird ein zweiter Name für die gleiche Datei erzeugt
MehrFormale Sprachen. Anwendungen formaler Sprachen Adressen, Kaffeeautomaten, Programmiersprachen. Rudolf Freund, Marian Kogler
Formale Sprachen Anwendungen formaler Sprachen Adressen, Kaffeeautomaten, Programmiersprachen Rudolf Freund, Marian Kogler (http://xkcd.com/208) Gültige Adressen: Favoritenstraße 9, 1040 Wien Reumannplatz
MehrInformationsextraktion Materialien zur Vorlesung
Vordefinierte Informationsextraktion Materialien zur Vorlesung Reguläre Ausdrücke D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg
MehrTokenisierer Überblick
1 1. Überblick (engl. Tokenizers) sind Programme, die Texte für die Weiterverarbeitung durch anderer Programme (z.b. Tagger, Stemmer, Lemmatisierer oder Parser) in Teilketten, sog. Token zerlegen. Was
MehrVariablen, Konstanten und Datentypen
Informatik für Elektrotechnik und Informationstechnik Benedict Reuschling benedict.reuschling@h-da.de Hochschule Darmstadt Fachbereich Informatik WS 2013/14 Variablen, Konstanten und Datentypen Überblick
MehrReguläre Ausdrücke. Einstieg in PHP 5.4 und MySQL 5.5. Zusatzkapitel zum Buch: Thomas Theis ISBN
Zusatzkapitel zum Buch: Thomas Theis Einstieg in PHP 5.4 und MySQL 5.5 ISBN 978-3-8362-1877-1 Galileo Press 2012 1 Suchmuster Reguläre Ausdrücke dienen zur Beschreibung von Suchmustern. Mit Hilfe dieser
MehrJava-Applikationen (Java-Programme)
Java-Applikationen (Java-Programme) Eine erste Applikation: 1 2 3 4 5 6 7 8 9 10 // Quelltext HalloWelt.java // Programm gibt den Text Hallo Welt aus public class HalloWelt public static void main(string[]
MehrEinführung in die Computerlinguistik Pumpinglemma für reguläre Sprachen. Suche mit regulären Ausdrücken. Dozentin: Wiebke Petersen
Einführung in die Computerlinguistik Pumpinglemma für reguläre Sprachen Dozentin: Wiebke Petersen 24.11.2009 Wiebke Petersen Einführung CL (WiSe 09/10) 1 Pumping-lemma für reguläre Sprachen Lemma (Pumping-Lemma)
MehrEinführung in die Programmiertechnik
Einführung in die Programmiertechnik Darstellung von Text Plain Text Abstraktion: Text wird durch eine Folge von Symbolen (Buchstaben, Zahlen, Interpunktion) dargestellt Verzicht auf Informationen über
MehrEinführung in die Computerlinguistik Pumpinglemma für reguläre Sprachen. Suche mit regulären Ausdrücken. Dozentin: Wiebke Petersen 17.5.
Einführung in die Computerlinguistik Pumpinglemma für reguläre Sprachen Dozentin: Wiebke Petersen 17.5.2010 Wiebke Petersen Einführung CL (SoSe 2010) 1 Pumping-lemma für reguläre Sprachen Lemma (Pumping-Lemma)
MehrPython für Linguisten
Python für Linguisten Dozentin: Wiebke Petersen & Co-Dozentin: Esther Seyarth Fortgeschrittene Zeichenkettenverarbeitung mit regulären Ausdrücken Esther Seyarth Python 1 Motivation Wir haben bereits einige
MehrSyntax von Programmiersprachen
"Grammatik, die sogar Könige zu kontrollieren weiß... aus Molière, Les Femmes Savantes (1672), 2. Akt Syntax von Programmiersprachen Prof. Dr. Christian Böhm in Zusammenarbeit mit Gefei Zhang WS 07/08
MehrSyntax von Programmiersprachen
"Grammatik, die sogar Könige zu kontrollieren weiß... aus Molière, Les Femmes Savantes (1672), 2. Akt Syntax von Programmiersprachen Prof. Dr. Martin Wirsing in Zusammenarbeit mit Michael Barth, Philipp
MehrEinstieg in die Informatik mit Java
1 / 30 Einstieg in die Informatik mit Java Datentypen Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 30 1 Überblick 2 Ganzzahlige Typen 3 Gleitkommatypen 4 Zeichen, char
MehrLinux I II III Res/Pro WN/TT Reguläre Ausdrücke Editoren Scripting. Linux II. 2 Linux II. Reguläre Ausdrücke Editoren Scripting. Ressourcen-Vorkurs
Linux II 2 Linux II Reguläre Ausdrücke Editoren Scripting POSIX POSIX POSIX ist ein UNIX-Standard, der bestimmte grundlegende Funktionen und Eigenschaften von UNIX-Systemen definiert. Dazu gehören auch
MehrProgrammierkurs Kapitel 4
Kapitel 4 Dipl.-Wirt.-Inf. Stefan Fleischer Dipl.-Wirt.-Inf. Ulrich Wolffgang Komponente: Parser Interface für Parser entwickeln public interface IParser { public ArrayList parseemailaddresses(string
MehrWo sind wir? Übersicht lexikale Struktur von Java
Wo sind wir? Java-Umgebung Lexikale Konventionen Datentypen Kontrollstrukturen Ausdrücke Klassen, Pakete, Schnittstellen JVM Exceptions Java Klassenbibliotheken Ein-/Ausgabe Collections Threads Applets,
MehrLexikalische Programmanalyse der Scanner
Der Scanner führt die lexikalische Analyse des Programms durch Er sammelt (scanned) Zeichen für Zeichen und baut logisch zusammengehörige Zeichenketten (Tokens) aus diesen Zeichen Zur formalen Beschreibung
MehrGrundlagen der theoretischen Informatik
Grundlagen der theoretischen Informatik Kurt Sieber Fakultät IV, Department ETI Universität Siegen SS 2013 Vorlesung vom 09.04.2013 Inhalt der Vorlesung Teil I: Automaten und formale Sprachen (Kurt Sieber)
Mehr1 EINFÜHRUNG PROGRAMMAUFBAU IN C++
1 EINFÜHRUNG PROGRAMMAUFBAU IN C++ Leitidee: Genaueres Verständnis der C++-Syntax an Hand von Syntaxdiagrammen Lexikalische Struktur von C++ Vereinbarungen: Definition / Deklaration Beispiele für Variablen-
MehrKapitel 2. Methoden zur Beschreibung von Syntax
1 Kapitel 2 Methoden zur Beschreibung von Syntax Grammatik, die sogar Könige zu kontrollieren weiß... aus Molière, Les Femmes Savantes (1672), 2. Akt 2 Ziele Zwei Standards zur Definition der Syntax von
MehrLogik I. Symbole, Terme, Formeln
Logik I Symbole, Terme, Formeln Wie jede geschriebene Sprache basiert die Prädikatenlogik erster Stufe auf einem Alphabet, welches aus den folgenden Symbolen besteht: (a) Variabeln wie zum Beispiel v 0,v
MehrExcel + VBA. Ergänzungen. Kapitel 1 Einführung in VBA Sequentielle Textdateien HARALD NAHRSTEDT. Erstellt am
HARALD NAHRSTEDT Excel + VBA Ergänzungen Kapitel 1 Einführung in VBA 1.5.23 Sequentielle Textdateien Erstellt am 12.02.2012 Beschreibung In Textdateien lassen sich schnell Informationen speichern und auch
MehrBenutzung der Manpage, Shell Teil 3
Benutzung der Manpage, Shell Teil 3 Linux-Kurs der Unix-AG Andreas Teuchert 3./9. Mai 2012 Manpages Dokumentation zu Programmen, speziellen Dateien, etc. steht in Manpages Aufruf mit man Manpage
MehrEinstieg in die Informatik mit Java
1 / 17 Einstieg in die Informatik mit Java String Tokenizer Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 17 1 Überblick Tokenizer 2 StringTokenizer 3 Verwendung von String.split
MehrReguläre Ausdrücke. Felix Döring, Felix Wittwer 14. November Python-Kurs
Reguläre Ausdrücke Felix Döring, Felix Wittwer 14. November 2016 Python-Kurs Gliederung 1. Grundlagen 2. Matching Regeln Sonderzeichen Zusammengesetzte Regex Spezielle Sequenzen 3. Methoden 4. reqular
MehrTheoretische Informatik. Reguläre Sprachen und Automaten
Theoretische Informatik Reguläre Sprachen und Automaten Reguläre Sprachen Reguläre Ausdrücke und Sprachen Gleichungen Syntaxdiagramme Erweiterungen Anwendungen Reguläre Ausdrücke über Σ Syntax: Konstante
MehrPerlkurs WS 14/15 Reguläre Ausdrücke I
Perlkurs WS 14/15 Reguläre Ausdrücke I 1 Reguläre Ausdrücke Reguläre Ausdrücke mächtigtes Werkzeug von Perl, um nach Mustern (Gruppen von Zeichen) innerhalb von Text zu suchen z.b. in Protein- und DNA-Sequenzen
Mehr1 Schöner suchen und ersetzen mit GREP
18 1 Schöner suchen und ersetzen mit GREP Bei der Arbeit in InDesign kommt man oft mit der Suchen/Ersetzen- Funktion in Berührung. Viele Anwender beschränken sich auf die Suche nach bestimmten Texten,
MehrSyntax von Programmiersprachen
Information: ist Rohstoff der Informatik, hat eigenständige Dimension (vgl. Länge, Zeit, elektrische Ladung ist jedoch nicht im SI-System enthalten) läßt sich nicht messen, sie wird berechnet wird durch
MehrVersion 1.00h (13. 04. 2008)
Tutorial: Regex Version 1.00h (13. 04. 2008) Seite 1 von 15 Inhaltsverzeichnis 1. Was ist Regex?... 3 2. Verwendung von Regex in C#... 3 3. Funktionen von Regex... 3 4. Syntax von Regex... 4 4.1 Einfachstes
Mehr1.103 Regular Expressions - Reguläre Ausdrücke
Copyright ( ) 2009 by M.Peichl. This work is licensed under the Creative Commons Attribution-Noncommercial-Share Alike 2.0 Germany License. To view a copy of this license, visit http://creativecommons.org/licenses/by-nc-sa/2.0/de/
MehrSyntax von Programmiersprachen
"Grammatik, die sogar Könige zu kontrollieren weiß aus Molière, Les Femmes Savantes (1672), 2. kt Syntax von Programmiersprachen Prof. Dr. Martin Wirsing Ziele Zwei Standards zur Definition der Syntax
MehrReguläre Ausdrücke 1 / 10. Doing Web Apps. Reguläre Ausdrücke. Letzte Änderung: 2009-04-17 Version: 0.6 Copyright: 2005. Alle Rechte vorbehalten
1 / 10 Doing Web Apps Reguläre Ausdrücke Autor: Rüdiger Marwein Letzte Änderung: 2009-04-17 Version: 0.6 Copyright: 2005. Alle Rechte vorbehalten Dieses Dokument darf mit Nennung des Autoren - frei vervielfältigt,
MehrKommunikationsmuster (T) Interprozesskommunikation (T) Kommunikation über Pipes (P) Parserspezifikation und -generierung (P)
Systempraktikum im Wintersemester 2009/2010 (LMU): Vorlesung vom 19.11. Foliensatz 4 Kommunikationsmuster (T) Interprozesskommunikation (T) Kommunikation über Pipes (P) Parserspezifikation und -generierung
MehrEmpfehlenswerte Referenzen
Wenn Google etwas nicht finden kann, fragen sie Jack Bauer. ("Fakten über Jack Bauer") Inhalt Empfehlenswerte Referenzen...1 0 Wozu reguläre Ausdrücke?...1 1 Die Elemente regulärer Ausdrücke...2 2 Ein
MehrTheorie der Informatik. Theorie der Informatik. 6.1 Einführung. 6.2 Alphabete und formale Sprachen. 6.3 Grammatiken. 6.4 Chomsky-Hierarchie
Theorie der Informatik 17. März 2014 6. Formale Sprachen und Grammatiken Theorie der Informatik 6. Formale Sprachen und Grammatiken Malte Helmert Gabriele Röger Universität Basel 17. März 2014 6.1 Einführung
MehrÜbung Praktische Informatik I
Übung Praktische Informatik I HWS 2008/2009 Benjamin Guthier Lehrstuhl für Praktische Informatik IV Universität Mannheim guthier@pi4.informatik.uni-mannheim.de 24.10.08 6-1 Heutige große Übung Hinweise
MehrVorsemesterkurs Informatik Sommersemester Aufgabenblatt Nr. 1B
Fachbereich Informatik und Mathematik Institut für Informatik Vorsemesterkurs Informatik Sommersemester 209 Aufgabenblatt Nr. B Aufgabe (Verzeichnisse) a) Finden Sie heraus, wie Ihr Homeverzeichnis auf
MehrSprachen sind durch folgenden Aufbau gekennzeichnet:
BNF UND SYNTAXDIAGRAMME 1. Allgemeines 1.1 Aufbau von Sprachen BNF und Syntaxdiagramme werden verwendet, um die Syntax einer Sprache darzustellen und graphisch zu veranschaulichen. Mit ihnen können entweder
MehrTag 2 Repetitorium Informatik (Java)
Tag 2 Repetitorium Informatik (Java) Dozent: Daniela Novac Lehrstuhl für Informatik 2 (Programmiersysteme) Friedrich-Alexander-Universität Erlangen-Nürnberg Wintersemester 2017/2018 Übersicht Zeichen und
MehrWozu braucht man das? (1) Wozu braucht man das? (2)
Programmierkurs für absolute Anfänger Reguläre Ausdrücke / regular expressions Wozu braucht man das? (1) Caren Brinckmann Sommersemester 2005 http://www.coli.uni-saarland.de/~cabr/teaching.php Programmierkurs
MehrGepufferte Eingabe und reguläre Ausdrücke 397
Gepufferte Eingabe und reguläre Ausdrücke 397 Gepufferte Ein- und Ausgabe ist sinnvoll, um die Zahl der Systemaufrufe zu reduzieren. Standardmäßig wird in C als Lösung hierfür die stdio verwendet. Frage:
MehrStream EDitor SED und Reguläre Ausdrücke
Stream EDitor SED und Reguläre Ausdrücke ExactCODE New Thinking Store 11. Mai 2006 Was ist SED? sed steht für Stream EDitor eine Variante des Unix Editors ed und arbeitet auf Streams keine interaktiven
MehrÜbersicht. Einführung in Perl Mustersuche III/ Datentypen II. Mehrzeiliges Matching (1) Mehrzeiliges Matching (2) chomp
Einführung in Perl Mustersuche III/ Datentypen II Universität Stuttgart Institut für maschinelle Sprachverarbeitung http://www.ims.uni-stuttgart.de/lehre/teaching/2003-ws/perl/home.html Heike.Zinsmeister@ims.uni-stuttgart.de
Mehrgrep Tutorial update
grep Tutorial update 06.11.2002 Gesamtindex: Startseite Forum Musik und Recht Juristische Links Sonstige Links Mail Privat Die Volltext-Suche mit regulären Ausdrücken - eine Anleitung zur Nachbildung der
MehrObjektorientierte Programmierung. Kapitel 3: Syntaxdiagramme
Stefan Brass: OOP (Java), 3. 1/31 Objektorientierte Programmierung Kapitel 3: Stefan Brass Martin-Luther-Universität Halle-Wittenberg Wintersemester 2014/15 http://www.informatik.uni-halle.de/ brass/oop14/
MehrEinstieg in die Informatik mit Java
1 / 22 Einstieg in die Informatik mit Java Grundlagen Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 22 1 Kommentare 2 Bezeichner für Klassen, Methoden, Variablen 3 White
MehrKleine lateinische Buchstaben wie z. B. p, q, r, s t, usw.
1.1 Aussagenlogik Grundlagen der Mathematik 1 1.1 Aussagenlogik Definition: Aussage Eine Aussage im Sinne der Logik ist ein formulierter Tatbestand, der sich bei objektiver Prüfung immer eindeutig als
MehrInhalt. Zeichen und Zeichenketten (engl. Strings)
Inhalt Inhalt: 4. Programmiersprache C 4.1 Programmaufbau in C 4.2 Basisdatentypen und einfache Anweisungen 4.3 Steuerfluss-Konstrukte 4.4 Arbeit mit indizierten Größen (Felder) 4.5 Arbeit mit Pointern
MehrVersion 2.00 ( )
Tutorial: Regex Version 2.00 (13. 08. 2008) Seite 1 von 15 Inhaltsverzeichnis 1. Was ist Regex?... 3 2. Verwendung von Regex in C#... 3 2.1 Validieren von numerischen Benutzereingaben... 3 3. Funktionen
MehrGepufferte Eingabe und reguläre Ausdrücke 398
Gepufferte Eingabe und reguläre Ausdrücke 398 Gepufferte Ein- und Ausgabe ist sinnvoll, um die Zahl der Systemaufrufe zu reduzieren. Standardmäßig wird in C als Lösung hierfür die stdio verwendet. Frage:
MehrÜbersicht. Einführung in Perl Datenstrukturen I. Datentypen Übersicht (1) Kernbegriffe. Kernbegriffe. Einführung der Datentypen.
Übersicht Kernbegriffe Einführung der Datentypen Skalare im Detail Vergleichsoperatoren Standardeingabe chomp-operator while-schleife Perl, 24.10.03 Datentypen I 1 Datentypen Übersicht (1) Datentyp Erklärung
MehrEinstieg in die Informatik mit Java
Vorlesung vom 18.4.07, Grundlagen Übersicht 1 Kommentare 2 Bezeichner für Klassen, Methoden, Variablen 3 White Space Zeichen 4 Wortsymbole 5 Interpunktionszeichen 6 Operatoren 7 import Anweisungen 8 Form
Mehr