Informationsextraktion mit endlichen Automaten

Größe: px
Ab Seite anzeigen:

Download "Informationsextraktion mit endlichen Automaten"

Transkript

1 Informationsextraktion mit endlichen Automaten HS: Information Retrieval Dozentin: Dr. Karin Haenelt Anna Abykova, Vladlena Belinschi, Wei Wang Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Wintersemester 2006 / 2007 ( ) 1

2 Inhalt Kurze Einführung in das Themengebiet Suche nach einem Thema mögliche Themen Unser Thema Entwicklung einer Lösung Evaluation und Erweiterungen Stabilität der Ergebnisse Anwendungsbeispiel Zusammenfassung Quellenangaben 2

3 Einführung Was ist Informationsextraktion? Reguläre Ausdrücke Endliche Automaten 3

4 Was ist Informationsextraktion? Domänenspezifische Informationen aus Texten gezielt aussuchen und strukturieren: Relevante Informationen extrahieren. Irrelevante Informationen überlesen. 4

5 Reguläre Ausdrücke Eine Formel in einer speziellen Sprache mit bestimmten syntaktischen Regeln elementare Symbole leere Menge ε a leere Zeichenreihe elementares Symbol Verknüpfungen der elementaren Symbole und der durch Verknüpfung gebildeten Ausdrücke durch Konkatenation (ab) Disjunktion (a b) Kleene-Stern (a*) Filterkriterium für Texte den Ausdruck in Form eines Musters mit dem Text abgleichen Schablone alle denkbaren Zeichenkombinationen (Wörter) erzeugen 5

6 Reguläre Ausdrücke Notationskonventionen für reguläre Ausdrücke * +? a b ^ $ null oder mehr Vorkommen ein oder mehr Vorkommen null oder ein Vorkommen a oder b der Anfang des Strings das Ende des Strings Spezialität in Python: *? (non-greedy-quantor: shortest match) 6

7 Endliche Automaten erlauben das Erkennen von regulären Mustern in einer Eingabesequenz. jeder reguläre Ausdruck kann als ein endlicher Automat implementiert werden und umgekehrt. werden in IE-Systemen benutzt, weil sie den Text nur partiell, aber schnell und robust analysieren. 7

8 Mögliche Themen Lebensläufe analysieren Büroakten analysieren Bestimmte Informationen suchen über Staaten Wetter Wohnungsanzeigen Jobs Schriftsteller, Artisten, CDs... 8

9 Mögliche Themen Benutzernamen, Passwörter, -Adressen und allerlei Geheimnisse - spannend! :-) z.b. RA, der verschiedene Arten von Adressen findet [a-za-z0-9._-]+@(([a-za-z0-9_-]{2,99}\.)+[a-za- Z]{2,4}) ((25[0-5] 2[0-4] \d 1 \d \d [1-9]) \.(25[0-5] 2[0-4] \d 1 \d \d [1-9] \d) \.(25[0-5] 2[0-4] \d 1 \d \d [1-9] \d [1-9]) \.(25 [0-5] 2[0-4] \d 1 \d \d [1-9] \d [1-9]))... Google Hacking / Johnny Long (2005) 9

10 Unser Thema Ziel: Alben, Artisten und Preise mit RA aus Online-Music Charts zu finden (z.b. Album: Temptation, Artist: Monrose, Preis: 12,99) 10

11 Beispiel: Online - Music Charts Entsprechendes Korpus aussuchen Google: Music Shops Charts Top 11

12 Systemarchitektur, 1. Entwurf MusicCharts O 2 - Korpus Analysefunktion 1. Aufruf des RE 2. Aufruf des RE 3. Aufruf des RE Ausgabe Artist Album Preis AOL- Korpus Analysefunktion 1. Aufruf des RE 2. Aufruf des RE 3. Aufruf des RE Artist Album Preis 12

13 1. Ansatz: korpusspezifische Extraktionsverfahren O2-Korpus Dokumentstruktur regulärer Ausdruck Ergebnisstruktur AOL-Korpus Dokumentstruktur regulärer Ausdruck Ergebnisstruktur 13

14 O2-Korpus: Dokumentstruktur <body>... <a href="/artist.do?artistid= " title="shakira">shakira</a> </td><td valign="top" class="dividercolumn text rowdark"> <a href="/album.do?albumid= "title="illegal (featuring Carlos Santana)">Illegal (fea...</a> </td> <td valign="top" class="dividercolumn rowdark"> <table cellpadding="0" cellspacing="0"> <tr> <td class="text" id="price-18" valign="top"> 1,49 </td>... </body> Inhalte, die extrahiert werden sollen, sind rot markiert. Schlüsselwörter sind blau markiert: Schlüsselwörter: a href="/artist a href="/album title= 14

15 O2-Korpus: Regulärer Ausdruck RA (('a href= /')('artist' 'album')([. \n]*?)('title= ') (.*?)(' ')) ((' ')(\d+)(, ')(\d+)) Automat O2 Shop. \n. S 'a href= /' /' A1 artist album P1 \d \d A2 P2, 'title= ' P3 A3 \d \d ' E 15

16 O2-Ergebnis Analysefunktion: Ausgabe: topnumber = 1 for i in Data_url1: print "Number ", topnumber for k in i: kdd = re.sub('\t*',"", k) if re.search('a href="/artist',kdd): kdd = re.search('title=".*?"',kdd).group(0) print "Artist:",re.search('".*?"',kdd).group(0) elif re.search('a href="/album',kdd): kdd = re.search('title=".*?"',kdd).group(0) print "Album:",re.search('".*?"',kdd).group(0) else: kdd = re.sub(' ',"",kdd) print "Price:", kdd topnumber = topnumber

17 AOL-Korpus: Dokumentstruktur <!-- album item begin --> <div class="classalbumshortblock"> <div class="classalbumshortn">1</div> <div class="classalbumshortimg"> <a href="album/view.do?id= "> <img src=" alt="temptation" title="temptation" hspace="0" vspace="0" border="0"> </a> </div> <div class="classalbumshorttxt"> <a href="album/view.do?id= " class="blue">temptation</a> <br><a href="artist/view.do?id=65523" class="blackundernoblink">monrose</a> <div class="classalbumshorteinzelsong">einzelsong: 1,39</div> </div> <!-- icons block --> <div class="classalbumshorticons"> <div class="classalbumshorticonimg1"> <a href="shoppingcart/add.do?productid= &referral=%2f.%2f"><img src="images/list/actions/order.gif" hspace="0" vspace="0" border="0" alt="warenkorb" title="warenkorb"></a> </div> <div class="classalbumshorticonimg2"> <a href="shoppingcart/order/add.do?productid= "><img src="images/list/actions/save.gif" hspace="0" vspace="0" border="0" alt="sofort bestellen" title="sofort bestellen"></a> </div> <div class="classalbumshorticonimg3"> <a href="wishlist/add.do?productid= &referral=%2f.%2f"><img src="images/list/actions/playlist.gif" hspace="0" vspace="0" border="0" alt="merkzettel" title="merkzettel"></a> </div> </div> <!-- end icons block --> <div class="classalbumshortprice"> 12,99 </div> </div> <!-- album item end --> 17

18 AOL-Korpus Analysefunktion... dataindexbegin = re.finditer('<!-- album item begin -->', Data2) dataindexend = re.finditer('<!-- album item end -->', Data2)... listartist = re.finditer('artist/view.do\?id=[0-9]{1,10}\"\sclass=\"blackundernoblink\">', primarylist) for matchartist in listartist: artistpositionbegin = matchartist.end() matchpositionend = re.search('<', primarylist[artistpositionbegin:]) artistpositionend = artistpositionbegin + matchpositionend.start() artist = primarylist[artistpositionbegin:artistpositionend]... listalbum = re.finditer('album/view.do\?id=[0-9]{1,10}\"\sclass=\"blue\">', primarylist) for matchalbum in listalbum: albumpositionbegin = matchalbum.end() matchpositionend = re.search('<', primarylist[albumpositionbegin:]) albumpositionend = albumpositionbegin + matchpositionend.start() album = primarylist[albumpositionbegin:albumpositionend]... listprice = re.finditer('classalbumshortprice"> ', primarylist) for matchlist in listprice: pricepositionbegin = matchlist.end() matchpriceend = re.search('<', primarylist[pricepositionbegin:]) pricepositionend = pricepositionbegin + matchpriceend.start() price = primarylist[pricepositionbegin:pricepositionend]... Schlüsselwörter: (<!-- album item begin -->) (<!-- album item end -->) artist/view.do album/view.do classalbumshortprice > 18

19 AOL-Korpus: Regulärer Ausdruck S RA ('<!--album item begin')([. \n]*?)(('artist' 'album')('/view.do' )([. \n]*?)('>')(.*?)('<')) ('classalbumshortprice')([. \n]*?)('>')(.*?)(' ')(\d*)(', ')(\d+)('< ))('<!--album item end') Automat '<!--album item begin' 'artist album' S1 'classalbum ShortPrice'. \n A1 P1 >'. \n AOL Shop '/view.do' P2. ' A2 P3 \d. \n, > P4 \d \d A3. P5 < < S2 '<!--album item end' E 19

20 AOL-Ergebnis 20

21 Evaluation und Erweiterungen Ergebnisse liegen bei 100 Prozent - warum? Eingeschränktes Fachgebiet (Domäne) Anfragen vorher bekannt Das Korpus ist sehr klein Für jedes Korpus angepasste RA => Allgemeiner Ausdruck? 21

22 2. Ansatz (Erweiterungen des 1. Ansatzes) Frage: Kann man allgemein anwendbare RA schreiben: für unsere Korpora? für andere Korpora? Antwort: Wir schreiben einen gemeinsamen RA für beide Korpora. 22

23 2. Ansatz: Entwicklung eines verallgemeinerten Extraktionsverfahrens Analyse der Korpora Informationseinheiten und ihre Strukturen Kodierung der Information Entwicklung regulärer Ausdrücke zur Extraktion der Information aus den beiden Korpora Evaluierung Flash-Präsentation der Ergebnisse 23

24 Systemarchitektur, 2. Ansatz MusicCharts O 2 - Korpus Analysefunktion 1. Aufruf des RE Ausgabe Artist Ranking der Titel in den Charts AOL- Korpus 2. Aufruf des RE 3. Aufruf des RE Album Preis Flash XML Adobe Flex Builder 24

25 2. Ansatz (Erweiterungen des 1. Ansatzes) Schreiben einer allgemeinen Analysefunktion: def printchart(start, End, Artist, Album, Price):... Die gesuchten Angaben werden in den beiden Korpora O2 und AOL mit den folgenden Varianten von Schlüsselwörtern ausgezeichnet: Start = [ <body ] End = [ /body ] Artist = [ artist ] Album = [ album ] Price = [, ] 25

26 Allgemeiner regulärer Ausdruck RA ('<body')([. \n]*?)(((artist Album)([. \n]*?)('>')) (Price)(\d+)(', ')(\d+)))(.*?)('<')('\body') Automat. \n S Start Artist Album. \n A > S1 S2 S3 E Price \d P1 \d P2, \d P3. < End \d 26

27 Evaluation und Erweiterungen Gründe für die Evaluation: Die Ergebnisse unseres allgemeinen RE evaluieren, um ihn eventuell an neue Korpora anzupassen, wenn nötig. Evaluation wird als ein Werkzeug benutzt, um die Information aus anderen Korpora extrahieren zu können. Bewertung der Ergebnisse: Precision Recall Fallout F- Maß F = (β² + 1) * P * R / (β² * P + R) 27

28 Evaluation und Erweiterungen Ergebnisse Relevant Ausg. Relevant Nicht Ausg. Nicht Relevant Ausg. Nicht Relevant Nicht Ausg. Relevant Ausg. Relevant Nicht Ausg. Nicht Relevant Ausg. Nicht Relevant Nicht Ausg. 28

29 Evaluation und Erweiterungen Programm Ergebnisse Precision (Genauigkeit) = Relevant Ausg. / Gesamt Ausg. Recall (Vollständigkeit) = Relevant Ausg. / Relevant Gesamt Fallout (Effektivität) = Irrelevant Ausg. / Irrelevant Gesamt O2 Shop AOL Shop Precision: 75/ % Relevant Ausg. Gesamt Ausg. Precision: 20/ % Relevant Ausg. Gesamt Ausg. Recall: 75/ % Relev. Ausgegeb. Relevant Gesamt Recall: 20/ % Relev. Ausgegeb. Relevant Gesamt Fallout: 51/ % Irrelevant Ausg. Irrelevant Gesamt Fallout: 75/ % Irrelevant Ausg. Irrelevant Gesamt 29

30 Evaluation und Erweiterungen Ergebnisse nach F- Maß (β=1) Vereinfachte Formel: F = 2 * P * R / (P + R) O2 Shop: F = 74% AOL Shop: F = 36% 30

31 Evaluation und Erweiterungen Analyse der schlechten Treffer (nonrelevante Ausg.) Beispiele: Artist: "Alle Interpreten" (kein Name eines Artisten) Artist: "Interpret" Album: "Album" (kein Albumtitel) Album: "2" (kein Albumtitel) Album: " " (leeres Ergebnis) Price: 0,00 (kein Preis) Lösung: Eine Liste mit Ignore Wörtern für die Ergebnisse: Ignore = [(.*Interpret.*),((.*Alb)(((e)(n)) ((u)(m)).*] Leere Ergebnisse ignorieren 1-Zeichen-Ergebnisse ignorieren 0,00 Preise ignorieren (Warenkorb) Anmerkung: AOL - wir haben mehr Ergebnisse, die nicht relevant sind, weil zum Top Album noch Top Song / Video... hinzukommt ( Top Problem mehr Information, als wir brauchen) 31

32 Evaluation und Erweiterungen Analyse der schlechten Treffer (nonrelevante Ausg.) Beispiele: Artist: "Nelly Furtado" Artist: Nelly Furtado" Artist: "Monrose" Artist: "Monrose"... Album: "All Good Thi..." Album: "All Good Thi..." Album: "Shame" Album: "Shame"... Lösung: Doppelte Ergebnisse entstehen, weil das Wort Artist Album 2x vorkommt (innerhalb der Tags für den Namen, außerhalb der Tags für das Bild) Überprüfen, ob Ergebnis mit (Ergebnis - 1) übereinstimmt, wenn ja - nicht ausgeben 32

33 Evaluation und Erweiterungen Ergebnisse Relevant Ausg. Relevant Nicht Ausg. Nicht Relevant Ausg. Nicht Relevant Nicht Ausg. Relevant Ausg. Relevant Nicht Ausg. Nicht Relevant Ausg. Nicht Relevant Nicht Ausg. 33

34 Evaluation und Erweiterungen Programm Ergebnisse Precision (Genauigkeit) = Relevant Ausg. / Gesamt Ausg. Recall (Vollständigkeit) = Relevant Ausg. / Relevant Gesamt Fallout (Effektivität) = Irrelevant Ausg. / Irrelevant Gesamt O2 Shop AOL Shop Precision: 75/ % Relevant Ausg. Gesamt Ausg. Precision: 20/ % Relevant Ausg. Gesamt Ausg. Recall: 75/ % Relev. Ausgegeb. Relevant Gesamt Recall: 20/ % Relev. Ausgegeb. Relevant Gesamt Fallout: 0/ % Irrelevant Ausg. Irrelevant Gesamt Fallout: 30/ % Irrelevant Ausg. Irrelevant Gesamt 34

35 Evaluation und Erweiterungen Ergebnisse nach F- Maß O2 Shop: F = 100% AOL Shop: F = 57% => Perfektes Ergebnis für O2 Shop! AOL Shop: Top Problem nicht lösbar! 35

36 Stabilität der Ergebnisse Wir überprüfen nochmals, ob unser RA auch für weitere Korpora anwendbar ist? Es werden Korpora gesucht, die mit den bereits gebildeten Ausdrücken analysierbar sind. Sind die Ergebnisse genauso gut? 36

37 Stabilität der Ergebnisse <html> <head> <title>mediaonl ine Musikdo wnload</title> <meta htt p - equiv="conten t- Typ e " content="tex t/html; charset=iso "> </head> <fr ameset rows="0, *,0,0 " frame b ord e r="no" BORDER="0" FRAMESPACING="0"> <frame name = "ONTopMenu" src="/servlets/ Dispatch/14/Call?htmltemplate=./ m en u/topmenu/shopmenu.html" MARGI NHEIGHT="0" MARGINWIDTH="0" leftmargin="0" scrolling="no" noresi ze> <frame name = "ONMainFrame" src="/servlets/ Dispatch/14/Call?htmltemplate=./ m en u/topmenu/start.h tm" MARGINHEIGHT="0" MARGINWIDTH="0" leftmargin="0" scrolling="yes" NORESIZE> <frame name = "serverc o mm " src="/servlets/ Dispatch/14/Call?htmltemplate=./misc /serverco m m.ht m "> <frame name = "sslservercomm" src="/servlets/ Dispatch/14/Call?htmltemplate=./misc /serverco m m.ht m "> </frameset> <noframes> <body bgcolor="#fffff F"> </body> </noframes> </html> Media-Online.de RA ist nicht anwendbar, da die Korpora anders strukturiert sind. Alles ist gewissermaßen versteckt 37

38 Stabilität der Ergebnisse Output: Artist: "Evanescence" Artist: "Christina Stürmer"... Price: 7,95 Price: 7,95 Price: 7,95... Lösung: Album = [ album, 'title ] Kein Album? musicload.de RA ist erweitert und anwendbar... Album: "Es Ist Wie Es Ist" Album: "Sa m 's Town"... 38

39 Stabilität der Ergebnisse Output:... Album: "Die Hits des Jahres 2006 Album: "Bravo - The Hits " Album: "T e mptation"... Lösung: Artist = [ artist, 'author'] - national" Kein Artist? Kein Preis? Price = [,, 'value'] Club Music Shop RA ist erweitert und anwendbar Artist: "Monrose" Artist: "Sasha"... Album: "Die Hits des Jahres national" Album: "Bravo - The Hits "... Price: "14,9 9 Price: 19,

40 Stabilität der Ergebnisse Stabilität der Ergebnisse? Ja - für gleich strukturierte Korpora Nein - Jedes Korpus hat eine eigene HTML- Struktur. Weitere Verbesserungen? Anwenden für andere Korpora, und RA erweitern. Gefahr, je mehr wir die RA erweitern, desto mehr Fehltreffer werden wir in Zukunft haben, da Schlüsselwörter wie value, oder title in HTML- Tags frei als Attribute verwendet werden. 40

41 Anwendung Beispiel Als Music Fans wollen wir Chart- Shops von verschiedenen Anbietern anschauen und analysieren: Wir speichern die Ergebnisse strukturiert in einer XML Datei. Wir bauen ein Flash File, wo wir die Ergebnisse aus der XML Datei lesen. 41

42 Anwendung Beispiel 42

43 Zusammenfassung Gut für eingeschränktes Fachgebiet Gut, wenn die Anfragen vorher bekannt sind Gut für Korpora mit einer fixen Struktur RA sind schnell und einfach, aber mit allgemeinem RA erreichen wir nie 100%: mit korpusspezifischen regulären Ausdrücken sind korrekte und vollständige Ergebnisse erreichbar der allgemeine Ausdruck, der für alle Korpora korrekte und vollständige Ergebnisse liefert, ließ sich nicht finden 43

44 Quellenangaben Baeza-Yates, Ricardo; Ribeiro-Neto, Berthier (Eds.) (1999): Modern Information Retrieval. Essex: Addison Wesley Longman Limited. Ferber, Reginald (2003): Information Retrieval. Suchmodelle und Data-Mining Verfahren für Textsammlungen und das Web. Heidelberg: dpunkt-verlag. Jekat, Susanne; Schultz, Tanja: Evaluation sprachverarbeitender Systeme. In: Carstensen, Kai-Uwe (Hrsg.) (2004): Computerlinguistik und Sprachtechnologie. Eine Einführung. Müchen: Elsevier. S Johnny, Long (2005): Google Hacking. Mitp-Verlag. Jurafsky, Daniel; Martin James H. (2000): Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Upper Saddle River, N.J.: Prentice Hall. Klabunde, Ralf (1998): Formale Grundlagen der Linguistik. Tübingen: Narr. Kuchling, A.M. (1998): Regular Expression HOWTO. Neumann, Günter (2000): Informationsextraktion. Riloff, Ellen; Lorenzen, Jeffrey: Extraction-based text categorization: Generating domainspecific role relationships automatically. In: Strzalkowski, Tomek (1999): Natural Language Information Retrieval. Dordrecht, Boston, London: Kluwer Academic Publishers. S Weigend, Michael (2006): Python Ge-Packt. Heidelberg: Redline Gmbh. 44

Reguläre Ausdrücke. Karin Haenelt

Reguläre Ausdrücke. Karin Haenelt Reguläre Ausdrücke Karin Haenelt 25.04.2010 1 Inhalt Einführung Definitionen Kleene-Theorem Schreibweisen regulärer Ausdrücke Eigenschaften regulärer Sprachen 2 Was sind reguläre Ausdrücke? Reguläre Ausdrücke

Mehr

Operationen auf endlichen Automaten und Transduktoren

Operationen auf endlichen Automaten und Transduktoren Operationen auf endlichen Automaten und Transduktoren Kursfolien Karin Haenelt 1 Notationskonventionen L reguläre Sprache A endlicher Automat DEA deterministischer endlicher Automat NEA nichtdeterministischer

Mehr

Überführung regulärer Ausdrücke in endliche Automaten

Überführung regulärer Ausdrücke in endliche Automaten Der Algorithmus von Thompson Karin Haenelt 9.5.2010 1 Inhalt Quelle Prinzip des Algorithmus Algorithmus Konstruktion des Automaten Basisausdrücke Vereinigung, Konkatenation, Hülle Beispiel Implementierung

Mehr

Einführung in PERL 2 Reguläre Ausdrücke

Einführung in PERL 2 Reguläre Ausdrücke Einführung in PERL 2 Reguläre Ausdrücke BASIEREND AUF FOLIEN VON DR. H. ZINSMEISTER und dem Buch `Einführung in Perl (Lama Buch) von RL Schwartz&T Phoenix sowie hwp://de.sel[tml.org/perl/sprache/regexpr.htm

Mehr

Computerlinguistik und Sprachtechnologie

Computerlinguistik und Sprachtechnologie Computerlinguistik und Sprachtechnologie Eine Einführung Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde und Hagen Langer Spektrum Akademischer Verlag

Mehr

!"#$%&'()$"*+,(%'-()$"

!#$%&'()$*+,(%'-()$ "#$%&'()$"*+,(%'-()$" A$,()'*B'3)#01*C*.,D$*43(%(, "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5 7,(2)#1(080*94*:;', ?>@=>?? "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*?>@=>??

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

Informationsextraktion Materialien zur Vorlesung

Informationsextraktion Materialien zur Vorlesung Informationsextraktion Materialien zur Vorlesung Beispiel: reguläre Ausdrücke für Firmennamen D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität

Mehr

Grundlagen zu HTML. Vortrag im Rahmen der BTK-Vorlesung von Herrn Professor Kärger

Grundlagen zu HTML. Vortrag im Rahmen der BTK-Vorlesung von Herrn Professor Kärger Grundlagen zu HTML Vortrag im Rahmen der BTK-Vorlesung von Herrn Professor Kärger Folie: 1 Gliederung Folie: 2 Was ist HTML Die Sprache HTML Aufbau von HTML-Tags Das HTML-Grundgerüst Hintergrundformatierungen

Mehr

INFORMATIONSEXTRAKTION

INFORMATIONSEXTRAKTION INFORMATIONSEXTRAKTION Referentin: Syriane Kemayou Yamga Universität Heidelberg, Computerlinguistik, Hauptseminar: Information Retrieval PD. Dr. Karin Haenelt 16.01.2006 Informationsextraktion (IE) 1.

Mehr

7 Tabellen. 7.1 Erstellen einer Tabelle. - übersichtliches Gestalten von Websites - enorme Steigerung der Layoutmöglichkeiten durch Tabellen

7 Tabellen. 7.1 Erstellen einer Tabelle. - übersichtliches Gestalten von Websites - enorme Steigerung der Layoutmöglichkeiten durch Tabellen 1 7 Tabellen - übersichtliches Gestalten von Websites - enorme Steigerung der Layoutmöglichkeiten durch Tabellen 7.1 Erstellen einer Tabelle Syntax: Inhalt1 Inhalt2 Kommentar

Mehr

Einführung in die Computerlinguistik Einführung in Python (2)

Einführung in die Computerlinguistik Einführung in Python (2) Einführung in die Computerlinguistik Einführung in Python (2) Dozentin: Wiebke Petersen 11. Foliensatz Wiebke Petersen Einführung CL 1 Kurzwiederholung der letzten Sitzung Textausgabe mit print("text")

Mehr

Web Scraping. Seminar Aktuelle Software-Engineering Praktiken für das World Wide Web JK 19.05.2010

Web Scraping. Seminar Aktuelle Software-Engineering Praktiken für das World Wide Web JK 19.05.2010 Web Scraping Seminar Aktuelle Software-Engineering Praktiken für das World Wide Web JK 19.05.2010 Inhalt Einführung Motivation Dokumente herunterladen Scraping Document Object Model Regular Expressions

Mehr

Informationsextraktion. Karin Haenelt 1.12.2012

Informationsextraktion. Karin Haenelt 1.12.2012 Informationsextraktion Karin Haenelt 1.12.2012 Informationsextraktion Ziel Identifikation bestimmter Information (Daten) in einem unstrukturierten oder teilstrukturierten textuellen Dokument Transformation

Mehr

Programmierkurs Python II

Programmierkurs Python II Programmierkurs Python II Michaela Regneri & tefan Thater FR 4.7 Allgemeine Linguistik (Computerlinguistik) Universität des aarlandes ommersemester 2010 (Charniak, 1997) the dog biscuits N V N V the dog

Mehr

Formale Sprachen und Automaten

Formale Sprachen und Automaten Formale Sprachen und Automaten Kapitel 1: Grundlagen Vorlesung an der DHBW Karlsruhe Thomas Worsch Karlsruher Institut für Technologie, Fakultät für Informatik Wintersemester 2012 Ziel Einführung der wichtigsten

Mehr

Einführung in die Computerlinguistik Suche mit regulären Ausdrücken

Einführung in die Computerlinguistik Suche mit regulären Ausdrücken Einführung in die Computerlinguistik Suche mit regulären Ausdrücken Dozentin: Wiebke Petersen 9. Foliensatz Wiebke Petersen Einführung CL 1 Suche mit regulären Ausdrücken Suche nach allen Wortformen des

Mehr

Einführung in die Computerlinguistik Statistische Grundlagen

Einführung in die Computerlinguistik Statistische Grundlagen Statistik 1 Sommer 2015 Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Sommersemester 2015 Statistik 2 Sommer 2015 Überblick 1. Diskrete Wahrscheinlichkeitsräume

Mehr

Einführung in die Informatik Grammars & Parsers

Einführung in die Informatik Grammars & Parsers Einführung in die Informatik Grammars & Parsers Grammatiken, Parsen von Texten Wolfram Burgard Cyrill Stachniss 12.1 Einleitung Wir haben in den vorangehenden Kapiteln meistens vollständige Java- Programme

Mehr

Publizieren im Internet

Publizieren im Internet Publizieren im Internet Eine eigene Homepage erstellen Teil 2 Margarita Esponda esponda@inf.fu-berlin.de Ein Bild als Hintergrund Webseite mit einen Bild als Hintergrund

Mehr

Webseiten-Bericht für sitekur.bbs.tr

Webseiten-Bericht für sitekur.bbs.tr Webseiten-Bericht für sitekur.bbs.tr Generiert am 19 Januar 2017 07:20 AM Der Wert ist 40/100 SEO Inhalte Seitentitel Site Kur / Bedava Web Sitesi Kur ve Aç Länge : 38 Perfekt, denn Ihr Seitentitel enthält

Mehr

Erstellen eines HTML-Templates mit externer CSS-Datei

Erstellen eines HTML-Templates mit externer CSS-Datei Erstellen eines HTML-Templates mit externer CSS-Datei Eigenschaften der Lösung Menü mit 2 Ebenen ohne Bilder, Menü besteht aus Text (Links) Durch CSS kann das Menü aber auch die Seite angepasst werden

Mehr

ArenaSchweiz AG. CMS Concrete5.7 Erste Schritte

ArenaSchweiz AG. CMS Concrete5.7 Erste Schritte CMS Concrete5.7 Erste Schritte Anmelden Öffnen Sie Ihren Browser und geben Sie Ihre Website-Adresse ein, dazu «/login» Beispiel: http://www.domainname.ch/login Geben Sie Benutzername und Passwort ein und

Mehr

Satz von Kleene. (Stephen C. Kleene, ) Wiebke Petersen Einführung CL 2

Satz von Kleene. (Stephen C. Kleene, ) Wiebke Petersen Einführung CL 2 Satz von Kleene (Stephen C. Kleene, 1909-1994) Jede Sprache, die von einem deterministischen endlichen Automaten akzeptiert wird ist regulär und jede reguläre Sprache wird von einem deterministischen endlichen

Mehr

Webseiten-Bericht für fantomw.ru

Webseiten-Bericht für fantomw.ru Webseiten-Bericht für fantomw.ru Generiert am 20 Januar 2017 21:16 PM Der Wert ist 47/100 SEO Inhalte Seitentitel 403 Forbidden Länge : 13 Perfekt, denn Ihr Seitentitel enthält zwischen 10 und 70 Anzahl

Mehr

TemplaVoila T3AK07 - TYPO3 Akademie 2.0

TemplaVoila T3AK07 - TYPO3 Akademie 2.0 TemplaVoila T3AK07 - TYPO3 Akademie 2.0 23.02.2007 2 TemplaVoila - Geschichtliches Ursprünglich entwickelt von Kasper Skårhøj für Dassault Systèmes Weiterentwicklung durch Robert Lemke Wurde auf der T3BOARD04

Mehr

Programmierkurs Python I

Programmierkurs Python I Programmierkurs Python I Michaela Regneri & Stefan Thater Universität des Saarlandes FR 4.7 Allgemeine Linguistik (Computerlinguistik) Winter 2010/11 Übersicht Kurze Wiederholung: while Sammeltypen (kurz

Mehr

Webseiten-Bericht für ebay.de

Webseiten-Bericht für ebay.de Webseiten-Bericht für ebay.de Generiert am 07 Januar 2017 16:59 PM Der Wert ist 57/100 SEO Inhalte Seitentitel Access Denied Länge : 13 Perfekt, denn Ihr Seitentitel enthält zwischen 10 und 80 Anzahl Zeichen.

Mehr

XML Kurs 2005-8 LRZ 1

XML Kurs 2005-8 LRZ 1 XML Kurs 2005-8 LRZ 1 Inhalt 2005-8 LRZ 2 Werbung 1: XML steht für strukturierte Daten March 2008 2005-8 LRZ 3 Werbung 2: XML ist lizenzfrei, plattformunabhängig und gut unterstützt March 2008 2005-8 LRZ

Mehr

Einführung in HTML. Tutorium. Präsentation der Sitzung vom 2./9. Juni 2004 Martin Stricker

Einführung in HTML. Tutorium. Präsentation der Sitzung vom 2./9. Juni 2004 Martin Stricker Tutorium Einführung in HTML Präsentation der Sitzung vom 2./9. Juni 2004 Martin Stricker martin.stricker@rz.hu-berlin.de Programm Grundlagen von HTML Objekte, Elemente, Tags Grundaufbau eines HTML-Dokuments

Mehr

So sieht html-befehl aus <head> </head>

So sieht html-befehl aus <head> </head> Notizen oder Protokoll kwm von Jürg Seiberth, 20.9.2001 und 27.9.2001 Html/Textverarbeitung Browser titel Titel So sieht html-befehl aus Obligatorisch für html-dokument

Mehr

«Integration in WebSite» HTML-/Javascript-Code-Beispiele

«Integration in WebSite» HTML-/Javascript-Code-Beispiele QuickInfo «Integration in WebSite» HTML-/Javascript-Code-Beispiele Fragen? Ihre Umfrage soll direkt in resp. auf Ihrer WebSite erscheinen? Die Möglichkeiten für eine technische Integration an exakten Stellen

Mehr

Internetseiten selbst erstellt

Internetseiten selbst erstellt Internetseiten selbst erstellt Vorüberlegungen: Übersichtsplan aller geplanten Seiten zeichnen und bereits logische Dateinamen überlegen. Inhalt der Seite Willkommen/Was gibt es zu sehen und was will ich

Mehr

Meine erste Homepage - Beispiele

Meine erste Homepage - Beispiele Meine erste - Beispiele 1. Beispiel meine Willkommen auf meiner Befehle nicht über Hier ist ein Senior, der noch fit für's Internet ist. Probieren wir

Mehr

Textdokument-Suche auf dem Rechner Implementierungsprojekt

Textdokument-Suche auf dem Rechner Implementierungsprojekt Textdokument-Suche auf dem Rechner Implementierungsprojekt Referent: Oliver Petra Seminar: Information Retrieval Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 19.01.2015 Überblick

Mehr

HTML-Grundlagen (X)HTML:

HTML-Grundlagen (X)HTML: HTML-Grundlagen (X)HTML: < > beginnender HTML Tag schließender HTML Tag < /> leere HTML Elemente Attribute und Werte &.; Sonderzeichen, HTML Entities Aufbau einer Datei Ein

Mehr

Konzeption und Entwicklung eines intelligenten Software-Agenten zum Web-Content-Mining

Konzeption und Entwicklung eines intelligenten Software-Agenten zum Web-Content-Mining und Entwicklung eines intelligenten Software- zum Web-Content-Mining Was sind Software-? Programme, die Arbeiten im Auftrag von Benutzern selbstständig ausführen. Eigenschaften Autonomie Soziale Fähigkeiten

Mehr

WEBPROGRAMMIERUNG DATEN AUS DEM WEB AUTOMATISIERT VERARBEITEN

WEBPROGRAMMIERUNG DATEN AUS DEM WEB AUTOMATISIERT VERARBEITEN WEBPROGRAMMIERUNG DATEN AUS DEM WEB AUTOMATISIERT VERARBEITEN Martin Guggisberg 5.9.2015 Weiterbildung: Programmieren im Unterricht mit Python AGENDA Fakten und Grundlagen zum Web Strukturierte Daten (JSON)

Mehr

Frames oder Rahmen im Browserfenster

Frames oder Rahmen im Browserfenster In dieser Ausbildungseinheit zeigen wir Ihnen, wie Frames oder auch Rahmen im Browserfenster erstellt werden. Dabei möchten wir anmerken, dass zu Frames bereits sehr viel Gegensätzliches geschrieben wurde.

Mehr

Projektseminar "Texttechnologische Informationsmodellierung"

Projektseminar Texttechnologische Informationsmodellierung Projektseminar "Texttechnologische Informationsmodellierung" Analyse mit XSLT Ziel diese Sitzung Nach dieser Sitzung sollten Sie: Einen ersten Überblick über Funktionen in XPath haben Stylesheets und Templates

Mehr

Fachhochschule Brandenburg University of Applied Sciences

Fachhochschule Brandenburg University of Applied Sciences Fachhochschule Brandenburg University of Applied Sciences Fachbereich: Wirtschaft Studiengang: Wirtschaftsinformatik Fach: Datenbank II Dozent: Dr. Michael Höding Projektdokumentation Lehrveranstaltung

Mehr

Es gibt drei unterschiedliche Automaten:

Es gibt drei unterschiedliche Automaten: Automatentheorie Es gibt drei unterschiedliche Automaten: 1. Deterministische Endliche Automaten (DEA) 2. Nichtdeterministische Endliche Automaten (NEA) 3. Endliche Automaten mit Epsilon-Übergängen (ε-

Mehr

6 Modellierung von Strukturen 6.1 Kontextfreie Grammatiken

6 Modellierung von Strukturen 6.1 Kontextfreie Grammatiken 6 Modellierung von Strukturen 6.1 Kontextfreie Grammatiken Mod-6.1 Kontextfreie Grammatik (KFG): formaler Kalkül, Ersetzungssystem; definiert Sprache als Menge von Sätzen; jeder Satz ist eine Folge von

Mehr

Counter als PHP-Skript (Zugriff auf Textdatei):

Counter als PHP-Skript (Zugriff auf Textdatei): Counter als PHP-Skript (Zugriff auf Textdatei): php Counter Herzlich willkommen Sie

Mehr

FAQ - Script gaesteform

FAQ - Script gaesteform FAQ - Script gaesteform www.kundencenter.ws 9. April 2009 Salvatore Spadaro 1 2 Inhaltsverzeichnis 1 Script - gaesteform 3 1.1 Welchen Funktionumfang bietet das Script gaesteform und welche Technik steckt

Mehr

Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14

Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14 Universität Augsburg, Institut für Informatik Wintersemester 2013/14 Prof. Dr. W. Kießling 10. Oktober 2013 F. Wenzel, D. Köppl Suchmaschinen Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14

Mehr

Informatik für Schüler, Foliensatz 21 Objektorientierte Programmierung

Informatik für Schüler, Foliensatz 21 Objektorientierte Programmierung rof. G. Kemnitz Institut für Informatik, Technische Universität Clausthal 23. April 2009 1/14 Informatik für Schüler, Foliensatz 21 Objektorientierte Programmierung Prof. G. Kemnitz Institut für Informatik,

Mehr

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten

Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Einführung in die Computerlinguistik reguläre Sprachen und endliche Automaten Dozentin: Wiebke Petersen May 3, 2010 Wiebke Petersen Einführung CL (SoSe2010) 1 Operationen auf Sprachen Seien L Σ und K Σ

Mehr

Checkliste SEO-freundliches Shopsystem. Inhaltsverzeichnis

Checkliste SEO-freundliches Shopsystem. Inhaltsverzeichnis Checkliste SEO-freundliches Shopsystem Für Betreiber eines Onlineshops gibt es viele Dinge zu beachten. Ein wichtiger Besucherkanal sind Suchmaschinen. Auf die folgenden Dinge sollten Sie achten, wenn

Mehr

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung

Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Elementare Begriffe der Wahrscheinlichkeitstheorie für die Sprachverarbeitung Kursfolien Karin Haenelt 1 Übersicht Wahrscheinlichkeitsfunktion P Wahrscheinlichkeit und bedingte Wahrscheinlichkeit Bayes-Formeln

Mehr

Automatentheorie und formale Sprachen rechtslineare Grammatiken

Automatentheorie und formale Sprachen rechtslineare Grammatiken Automatentheorie und formale Sprachen rechtslineare Grammatiken Dozentin: Wiebke Petersen 17.6.2009 Wiebke Petersen Automatentheorie und formale Sprachen - SoSe09 1 Pumping lemma for regular languages

Mehr

Vorlesung Information Retrieval Wintersemester 04/05

Vorlesung Information Retrieval Wintersemester 04/05 Vorlesung Information Retrieval Wintersemester 04/05 14. Oktober 2004 Institut für Informatik III Universität Bonn Tel. 02 28 / 73-45 31 Fax 02 28 / 73-43 82 jw@informatik.uni-bonn.de 1 Themenübersicht

Mehr

Automaten und formale Sprachen. Lösungen zu den Übungsblättern

Automaten und formale Sprachen. Lösungen zu den Übungsblättern Automaten und formale Sprachen zu den Übungsblättern Übungsblatt Aufgabe. (Sipser, exercise.3) M = ({q, q2, q3, q4, q5}, {u, d}, δ, q3, {q3}) δ: u d q q q 2 q 2 q q 3 q 3 q 2 q 4 q 4 q 3 q 5 q 5 q 4 q

Mehr

for ($i=1 ;$i<=25 ;$i++) { echo "$i "; }?> <br> <a href="http://localhost/php.php">zurück zur Index-Seite</a> </body> </html>

for ($i=1 ;$i<=25 ;$i++) { echo $i ; }?> <br> <a href=http://localhost/php.php>zurück zur Index-Seite</a> </body> </html> 8 Schleifen Schleifen werden in der Programmierung viel verwendet. Sie sind deshalb sehr wichtig, weil man mit Ihrer Hilfe erreichen kann, dass etwas unter bestimmten Bedingungen immer wieder ausgeführt

Mehr

Eignungsverfahren zum Master of Science Human-Computer Interaction

Eignungsverfahren zum Master of Science Human-Computer Interaction Eignungsverfahren zum Master of Science Human-Computer Interaction Literaturhinweise Prüfungsausschuss HCI Human-Computer Interaction & Psychologische Ergonomie Julius-Maximilians-Universität Würzburg

Mehr

Anleitung So klappt der Downloadschnitt

Anleitung So klappt der Downloadschnitt Anleitung So klappt der Downloadschnitt Liebe Kundin, lieber Kunde, bitte nehmen Sie sich einen Augenblick Zeit um diese Anleitung zu lesen. Sie enthält nützliche Tipps und Tricks zum Thema Downloadschnitte

Mehr

DataTables LDAP Service usage Guide

DataTables LDAP Service usage Guide DataTables LDAP Service usage Guide DTLDAP Usage Guide thomasktn@me.com / www.ktn.ch Benutzung des DTLDAP Service DataTables Der Service stellt einen JSON Feed für DataTables (http://www.datatables.net)

Mehr

Web Data Management Systeme

Web Data Management Systeme Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS

Mehr

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong Part-of-Speech Tagging Friedrich-Alexander-Universität Professur für Computerlinguistik Nguyen Ai Huong 15.12.2011 Part-of-speech tagging Bestimmung von Wortform (part of speech) für jedes Wort in einem

Mehr

AdOps Technische Spezifikationen

AdOps Technische Spezifikationen AdOps Technische Spezifikationen HTML5-Werbemittel (Desktop) Bei der Verwendung von Redirects müssen diese Spezifikationen nicht beachtet werden. Physische Anlieferung von HTML5-Werbemitteln + Trackings.

Mehr

Steuerung des Distriktskalender

Steuerung des Distriktskalender Steuerung des Distriktskalender Wolfgang Hallmann, DF7PN Referat für Öffentlichkeitsarbeit und Internet im DARC Distrikt K Stand: April 2008 DF7PN@DARC.DE Inhaltsverzeichnis Vorwort... 3 Die Schnittstelle...

Mehr

Vorlesung Information Retrieval Wintersemester 04/05

Vorlesung Information Retrieval Wintersemester 04/05 Vorlesung Information Retrieval Wintersemester 04/05 20. Januar 2005 Institut für Informatik III Universität Bonn Tel. 02 28 / 73-45 31 Fax 02 28 / 73-43 82 jw@informatik.uni-bonn.de 0 Themenübersicht

Mehr

Web-Programmierung (WPR)

Web-Programmierung (WPR) Web-Programmierung (WPR) TFH-Berlin Sommer Semester 2008 Manfred Gruner mailto:wpr@gruner.org Web-Programmierung (WPR) Literatur: Web-Technologien (Heiko Wöhr) Konzepte Programmiermodelle - Architekturen

Mehr

Erste Schritte mit XHTML

Erste Schritte mit XHTML Sascha Frank SS 2005 www.saschafrank.de 3.3.05 Eigene Homepage Rechte am $HOME ändern Eigene Homepage Rechte am $HOME ändern chmod 701 /home/login Eigene Homepage Rechte am $HOME ändern chmod 701

Mehr

Text-Mining: Einführung

Text-Mining: Einführung Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:

Mehr

Webseiten-Bericht für duhard.fr

Webseiten-Bericht für duhard.fr Webseiten-Bericht für duhard.fr Generiert am 30 Dezember 2015 05:28 AM Der Wert ist 47/100 SEO Inhalte Seitentitel Website unavailable Länge : 19 Perfekt, denn Ihr Seitentitel enthält zwischen 10 und 70

Mehr

33 CSS in HTML einbinden

33 CSS in HTML einbinden D3kjd3Di38lk323nnm 256 33 CSS in HTML einbinden Damit CSS auf HTML wirken kann, muss eine Verknüpfung hergestellt werden. Dafür stehen verschiedene Möglichkeiten zur Verfügung, die in diesem Kapitel beschrieben

Mehr

PHP objektorientiert

PHP objektorientiert PHP objektorientiert Konzepte, Techniken, Code von Jörg Krause, Christian Alkemper, Peter Lavin 1. Auflage Hanser München 2006 Verlag C.H. Beck im Internet: www.beck.de ISBN 978 3 446 40762 6 Zu Inhaltsverzeichnis

Mehr

4.Grundsätzliche Programmentwicklungsmethoden

4.Grundsätzliche Programmentwicklungsmethoden 4.Grundsätzliche Programmentwicklungsmethoden 1.1 Grundlage strukturierter und objektorientierter Programmierung Begriff Software Engineering - umfaßt den gezielten Einsatz von Beschreibungsmitteln, Methoden

Mehr

INFORMATIONSEXTRAKTION IN SUCHMASCHINEN

INFORMATIONSEXTRAKTION IN SUCHMASCHINEN INFORMATIONSEXTRAKTION IN SUCHMASCHINEN S E M I N A R S U C H M A S C H I N E N S O M M E R S E M ESTER 2014 S T E FA N L A N G E R, C I S, U N I V E R S I TÄT M Ü N C H E N Schematische Architektur einer

Mehr

Algorithmen mit konstantem Platzbedarf: Die Klasse REG

Algorithmen mit konstantem Platzbedarf: Die Klasse REG Algorithmen mit konstantem Platzbedarf: Die Klasse REG Sommerakademie Rot an der Rot AG 1 Wieviel Platz brauchen Algorithmen wirklich? Daniel Alm Institut für Numerische Simulation Universität Bonn August

Mehr

Webseiten-Bericht für ggig.ir

Webseiten-Bericht für ggig.ir Webseiten-Bericht für ggig.ir Generiert am 25 Juni 2016 12:45 PM Der Wert ist 43/100 SEO Inhalte Seitentitel Suspended Domain Länge : 16 Perfekt, denn Ihr Seitentitel enthält zwischen 10 und 70 Anzahl

Mehr

6 F O R M A L E S P R A C H E N. 6.1 formale sprachen

6 F O R M A L E S P R A C H E N. 6.1 formale sprachen 6.1 formale sprachen 6 F O R M A L E S P R A C H E N Eine natürliche Sprache umfasst mehrere Aspekte, z. B. Aussprache und Stil, also z. B. Wortwahl und Satzbau. Dafür ist es auch notwendig zu wissen,

Mehr

Deterministische endliche Automaten - Wiederholung

Deterministische endliche Automaten - Wiederholung Deterministische endliche Automaten - Wiederholung Die folgende Klasse Zahl stellt einen endlichen Automaten dar. Ermittle die Größen des Automaten und zeichne den Zustandsgraphen. Gib Zeichenfolgen an,

Mehr

Matrix Reports mit Apex

Matrix Reports mit Apex Matrix Reports mit Apex Thomas Hernando Gotthardt syntegris information solutions GmbH Neu-Isenburg Schlüsselworte: Matrix, Kreuztabellen, Reports, Apex, SQL, PL/SQL, Packages, JavaScript, HTML, Pivot-Klausel,

Mehr

Lexikalische Substitutionen. Seminar: Sprachproduktion Dozentin: Prof. Dr. Helen Leuninger WS 09/10 Referenten: Anna Schmidt und Tim Krones

Lexikalische Substitutionen. Seminar: Sprachproduktion Dozentin: Prof. Dr. Helen Leuninger WS 09/10 Referenten: Anna Schmidt und Tim Krones Lexikalische Substitutionen Seminar: Sprachproduktion Dozentin: Prof. Dr. Helen Leuninger WS 09/10 Referenten: Anna Schmidt und Tim Krones Gliederung 1 Substitutionen: Arten und Eigenschaften 2 Entstehung

Mehr

Responsive Web Design

Responsive Web Design Responsive Web Design mit APEX Theme 25 Christian Rokitta APEX UserGroup NRW Treffen 20.01.2014 Oracle DB & APEX Entwickler (selbstständig) Deutschland ( 1996) Niederlanden ( 1996) themes4apex: APEX UI

Mehr

CAS WEBDESIGN UND WEBPUBLISHING KURS 1 / TAG 1: GRUNDLAGEN DER WEBENTWICKLUNG

CAS WEBDESIGN UND WEBPUBLISHING KURS 1 / TAG 1: GRUNDLAGEN DER WEBENTWICKLUNG CAS WEBDESIGN UND WEBPUBLISHING KURS 1 / TAG 1: GRUNDLAGEN DER WEBENTWICKLUNG Von Markus Stauffiger / 4eyes GmbH DOZENTENTEAM FÜR JEDES THEMA EIN SPEZIALIST ANDI KELLER andi@4eyes.ch Mitgründer von 4eyes

Mehr

Hackerpraktikum Versuch 4

Hackerpraktikum Versuch 4 Hackerpraktikum Versuch 4 Praktikum zur Vorlesung Reaktive Sicherheit WS 09/10 Johannes Hoffmann (hoffmann[-@-]ls6.cs.tu-dortmund.de) Dieser Versuch beschäftigt sich mit serverseitigen Schwachstellen im

Mehr

Einführung in die Theoretische Informatik

Einführung in die Theoretische Informatik Einführung in die Theoretische Informatik Woche 10 Harald Zankl Institut für Informatik @ UIBK Wintersemester 2014/2015 Zusammenfassung Zusammenfassung der letzten LV Satz Sei G = (V, Σ, R, S) eine kontextfreie

Mehr

Objects First With Java A Practical Introduction Using BlueJ. Mehr über Vererbung. Exploring polymorphism 1.0

Objects First With Java A Practical Introduction Using BlueJ. Mehr über Vererbung. Exploring polymorphism 1.0 Objects First With Java A Practical Introduction Using BlueJ Mehr über Vererbung Exploring polymorphism 1.0 Zentrale Konzepte dieses Kapitels Methoden-Polymorphie statischer und dynamischer Typ Überschreiben

Mehr

Überführung regulärer Ausdrücke in endliche Automaten

Überführung regulärer Ausdrücke in endliche Automaten Endliche Automaten Überführung regulärer Ausdrücke in endliche Automaten Karin Haenelt 1 Inhalt Anwendung: Spezifikation linguistischer Regeln Theoretische Basis: Äquivalenz regulärer Ausdrücke und endlicher

Mehr

Webseiten-Bericht für shagor5.net

Webseiten-Bericht für shagor5.net Webseiten-Bericht für shagor5.net Generiert am 11 Januar 2016 08:43 AM Der Wert ist 46/100 SEO Inhalte Seitentitel Free web hosting service with cpanel WordPress Joomla ecommerce hosting Länge : 79 Ideal,

Mehr

Informatik I. Informatik I. 6.1 Programme. 6.2 Programme schreiben. 6.3 Programme starten. 6.4 Programme entwickeln. 6.1 Programme.

Informatik I. Informatik I. 6.1 Programme. 6.2 Programme schreiben. 6.3 Programme starten. 6.4 Programme entwickeln. 6.1 Programme. Informatik I 05. November 2013 6. Python-, kommentieren, starten und entwickeln Informatik I 6. Python-, kommentieren, starten und entwickeln Bernhard Nebel Albert-Ludwigs-Universität Freiburg 05. November

Mehr

VWA Rhein-Neckar Dipl.-Ing. Thomas Kloepfer. Kommunikation I (Internet) Übung 4 PHP

VWA Rhein-Neckar Dipl.-Ing. Thomas Kloepfer. Kommunikation I (Internet) Übung 4 PHP VWA Rhein-Neckar Dipl.-Ing. Thomas Kloepfer Kommunikation I (Internet) Übung 4 PHP SS 2004 Inhaltsverzeichnis 1. PHP die serverseitige Programmiersprache...1 1.1. PHP - Bereiche in HTML definieren...1

Mehr

ht://dig WWW Search Engine Software

ht://dig WWW Search Engine Software ht://dig WWW Search Engine Software Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Kurs: Information Retrieval Leitung: PD Dr. Karin Haenelt 22.01.2007 Erwin Glockner Übersicht Einführung

Mehr

Kapitel: Die Chomsky Hierarchie. Die Chomsky Hierarchie 1 / 14

Kapitel: Die Chomsky Hierarchie. Die Chomsky Hierarchie 1 / 14 Kapitel: Die Chomsky Hierarchie Die Chomsky Hierarchie 1 / 14 Allgemeine Grammatiken Definition Eine Grammatik G = (Σ, V, S, P) besteht aus: einem endlichen Alphabet Σ, einer endlichen Menge V von Variablen

Mehr

Hypertext Markup Language HTML. Stefan Szalowski Internet-Technologien HTML

Hypertext Markup Language HTML. Stefan Szalowski Internet-Technologien HTML Hypertext Markup Language HTML Hypertext Markup Language HTML Cascading Style Sheets CSS Zwei Sprachen, mit denen Webseiten erstellt werden HTML: Strukturieren von Inhalten durch Elemente Überschriften,

Mehr

6.9 Java Server Pages

6.9 Java Server Pages DocumentCollection dc = db.ftsearch(abfrage); Document d = dc.getfirstdocument(); while (d!= 0) { String Name = db.gettitle(); out.println(name + ""); d = dc.getnextdocument(); catch (NotesException

Mehr

Regionale Fortbildung Kurs zum Erstellen von Internetpräsentationen Z-01-2-205 vom 16.-19.10.2000

Regionale Fortbildung Kurs zum Erstellen von Internetpräsentationen Z-01-2-205 vom 16.-19.10.2000 Rahmen (Frames) Der Übersichtlichkeit halber und um die Navigation auf den Seiten zu vereinfachen, arbeitet man mit Rahmen, deren Inhalt fest bzw. veränderlich ist. Im angegebenen Beispiel wäre der Rahmen

Mehr

Gliederung. Tutorium zur Vorlesung. Gliederung. Gliederung. 1. Gliederung der Informatik. 1. Gliederung der Informatik. 1. Gliederung der Informatik

Gliederung. Tutorium zur Vorlesung. Gliederung. Gliederung. 1. Gliederung der Informatik. 1. Gliederung der Informatik. 1. Gliederung der Informatik Informatik I WS 2012/13 Tutorium zur Vorlesung 1. Alexander Zietlow zietlow@informatik.uni-tuebingen.de Wilhelm-Schickard-Institut für Informatik Eberhard Karls Universität Tübingen 11.02.2013 1. 2. 1.

Mehr

Digitale Medien. Übung

Digitale Medien. Übung Digitale Medien Übung HTML Heute Hyper Text Markup Language Beschreibungssprache von WWW-Seiten: Enthält die Struktur eines Dokuments und teilweise die Darstellung. ich bin eine Überschrift

Mehr

http://www.therealgang.de/

http://www.therealgang.de/ http://www.therealgang.de/ Titel : Author : Kategorie : Vorlesung HTML und XML (Einführung) Dr. Pascal Rheinert Sonstige-Programmierung Vorlesung HTML / XML: Grundlegende Informationen zu HTML a.) Allgemeines:

Mehr

Alphabet, formale Sprache

Alphabet, formale Sprache n Alphabet Alphabet, formale Sprache l nichtleere endliche Menge von Zeichen ( Buchstaben, Symbole) n Wort über einem Alphabet l endliche Folge von Buchstaben, die auch leer sein kann ( ε leere Wort) l

Mehr

Perl-Praxis. Jörn Clausen

Perl-Praxis. Jörn Clausen Perl-Praxis Reguläre Ausdrücke Jörn Clausen joern@techfak.uni-bielefeld.de Übersicht Reguläre Ausdrücke Muster suchen Muster finden Perl-Praxis Reguläre Ausdrücke 2/19 zur Erinnerung Perl := Practical

Mehr

TYPO3 Redaktoren-Handbuch

TYPO3 Redaktoren-Handbuch TYPO3 Redaktoren-Handbuch Kontakt & Support: rdv interactive ag Arbonerstrasse 6 9300 Wittenbach Tel. 071 / 577 55 55 www.rdvi.ch Seite 1 von 38 Login http://213.196.148.40/typo3 Username: siehe Liste

Mehr

Webseiten-Bericht für cdn.optimizely.com

Webseiten-Bericht für cdn.optimizely.com Webseiten-Bericht für cdn.optimizely.com Generiert am 07 Oktober 2015 15:07 PM Der Wert ist 37/100 SEO Inhalte Seitentitel Länge : 0 Schlecht. Wir haben keinen Seitentitel auf Ihrer Webseite gefunden.

Mehr

Web Publishing mit mas2tex

Web Publishing mit mas2tex Web Publishing mit mas2tex Oliver Vornberger Fachbereich Mathematik/Informatik Universität Osnabrück 49069 Osnabrück oliver@uos.de http://www-lehre.inf.uos.de/mas2tex/papier #DOCBEGIN{ #INTRO{ title ="Web

Mehr

ARBEITSBLATT ZU FORMALEN SPRACHEN

ARBEITSBLATT ZU FORMALEN SPRACHEN ARBEITSBLATT ZU FORMALEN SPRACHEN Aufgabe 1: Gegeben ist die folgende Formale Sprache L(G) mit G = (T, N, P, S). Die Produktionen lauten ZUWEISUNG ::= name zuweisungsoperator AUSDRUCK semikolon AUSDRUCK

Mehr