Kapitel 18 Fehlertolerantes Retrieval
|
|
- Martin Dressler
- vor 6 Jahren
- Abrufe
Transkript
1 Kapitel 18 Fehlertolerantes Retrieval HHU Düsseldorf, WS 2008/09 Information Retrieval 272
2 Eingabefehler in den Dokumenten in den Suchanfragen Formen Leerzeichenfehler ("...ofthe..."; "th_ebook") Fehler an Worten, die isoliert erkannt werden typographische Fehler ("teh" statt "the") orthographische Fehler ("recieve" statt "receive") phonetische Fehler ("4u" statt "for you") Fehler an Worten, die erst im Kontext erkannt werden syntaktische Fehler ("the study was conducted be XY") semantische Fehler ("they are leaving in about 15 minuets to go...") Kukich K. (1992): Techniques for automatically correcting words in texts. In: ACM Computing Surveys 24, S HHU Düsseldorf, WS 2008/09 Information Retrieval 273
3 Fehler an Worten, die isoliert erkannt werden Zusätzlicher Buchstabe 10% Multiple Error 13% Buchstabendreher 2% Falscher Buchstabe 59% Ausgelassener Buchstabe 16% Damerau, F.J. (1964): A technique for computer detection and correction of spelling errors. In: Communications of the ACM 7, S HHU Düsseldorf, WS 2008/09 Information Retrieval 274
4 Fehlertolerantes Retrieval. Ansatz 1: Phonetik (1a) Der Soundex-Algorithmus Verschmelzung von Wortformen anhand ihres Klanges Vorgehen: erster Buchstabe bleibt erhalten Vokale a, e, i, o, u, y 1 labiale und labiodentale Laute b, f, p, v 2 Kehl- und Zischlaute c, g (übergehen: gh), k,q, x, s, z (ohne Schluss-s und -z) 3 Dentallaute d, t 4 palataler Reibelaut l 5 labionasaler Laut: m 6 dento- oder linguanasaler Laut n 7 dentaler Reibelaut r 8 Russell, R.C. (1917): Index. Patent-Nr. US Erteilt am: (Eingereicht am ). HHU Düsseldorf, WS 2008/09 Information Retrieval 275
5 Fehlertolerantes Retrieval. Ansatz 1: Phonetik Der Soundex-Algorithmus Regeln: aufeinander folgende Buchstaben derselben Lautklasse: nur den ersten berücksichtigen ("Ball" wird zu "Bal") mehrere Vokale im Wort: nur den ersten berücksichtigen ("Carter" wird zu "Catr") Heutiger Stand: H ist Vokal m und n: nur eine Klasse Jacobs, J.R. (1982): Finding words that sound alike. The SOUNDEX algorithm. In: Byte 7, S HHU Düsseldorf, WS 2008/09 Information Retrieval 276
6 Fehlertolerantes Retrieval. Ansatz 1: Phonetik Der Soundex-Algorithmus Hoppa H oppa H opa (doppelte Belegung) H op (nur 1 Vokal) H 12 Highfield H ighfield H ifield (gh wird übergangen) H ifld(nur 1 Vokal) H 1254 HHU Düsseldorf, WS 2008/09 Information Retrieval 277
7 Fehlertolerantes Retrieval. Ansatz 1: Phonetik (1b): Phonix Verfeinerungen von Soundex phonetische Regeln werden auch auf den 1. Buchstaben angewandt (night - knight) "phonetische Ersetzung": gleiche Buchstabenfolgen (z.b. "ough") klingen in unterschiedlichen Worten unterschiedlich ("plough" - "cough") Regeln beziehen sich auf die Stellung der Zeichenfolge im Wort: am Anfang (z.b. "kn" zu "n"), in der Mitte und am Ende (dort "kn" nicht ändern) Gadd, T.N. (1988): 'Fisching fore werds': Phonetic retrieval of written text in information systems. In: Program 22, S Gadd, T.N. (1990): PHONIX: The algorithm. In: Program 24, S HHU Düsseldorf, WS 2008/09 Information Retrieval 278
8 18. Fehlertoleranz phonetische Ersetzung HHU Düsseldorf, WS 2008/09 Information Retrieval 279
9 Fehlertolerantes Retrieval. Ansatz 2: Damerau-Methode benötigt Wörterbuch Schritt 1: Fehleridentifikation (Vergleich: Wort - Wörterbuch) Schritt 2: Identifikation des Fehlertyps (die Damerau- Methode bearbeitet nur Einzelfehler, keine multiple errors) Schritt 3: Fehlerkorrektur Damerau, F.J. (1964): A technique for computer detection and correction of spelling errors. In: Communications of the ACM 7, S HHU Düsseldorf, WS 2008/09 Information Retrieval 280
10 Fehlerkorrektur nach Damerau-Methode FALSCHER BUCHSTABE: Eingabe: Lexikon: Ergebnis ALPHIBET ALPHABET einzige Differenz bei Stelle 5 Korrigiere Alphibet zu Alphabet! HHU Düsseldorf, WS 2008/09 Information Retrieval 281
11 Fehlerkorrektur nach Damerau-Methode BUCHSTABENDREHER: Eingabe: Lexikon: Ergebnis ALHPABET ALPHABET Differenzen bei Stellen 3 und 4. HP in der Eingabe entspricht umgekehrter Reihenfolge PH im Lexikon Korrigiere Alhpabet zu Alphabet! HHU Düsseldorf, WS 2008/09 Information Retrieval 282
12 Fehlerkorrektur nach Damerau-Methode ZUSÄTZLICHER BUCHSTABE Eingabe: Lexikon: Ergebnis ALLPHABET ALPHABET Erste Differenz bei Stelle 3 Löschen des L bei Eingabe ALPHABET Übereinstimmung mit Lexikon: Korrigiere Allphabet zu Alphabet! HHU Düsseldorf, WS 2008/09 Information Retrieval 283
13 Fehlerkorrektur nach Damerau-Methode AUSGELASSENER BUCHSTABE Eingabe: Lexikon: Ergebnis ALPABET ALPHABET Erste Differenz bei Stelle 4 Löschen des H bei Lexikon ALPABET Übereinstimmung mit Eingabe: Korrigiere Alpabet zu Alphabet! HHU Düsseldorf, WS 2008/09 Information Retrieval 284
14 Fehlertolerantes Retrieval. Ansatz 3: n-gramme benötigt Wörterbuch; Zerlegung der Lexeme in n-gramme Schritt 1: Fehleridentifikation (wenn Wort ein n-gramm enthält, das nicht im Wörterbuch vorkommt) Schritt 2: Fehlerkorrektur (Ähnlichkeit nach Dice) (m, m': Anzahl der Buchstaben): # n-gramme des Wortes: m' + n - 1 # n-gramme des Lexems: m + n - 1 # gemeinsamer n-gramme: g Ähnlichkeit(Wort-Lexem) = 2g / (m + n -1 + m' + n - 1) Angell, R.C.; Freund, G.E.; Willett, P. (1983): Automatic spelling correction using a trigram similarity measure. In: Information Processing & Management 19, S HHU Düsseldorf, WS 2008/09 Information Retrieval 285
15 Eingabewort: CONSUMMING; Lexem: CONSUMING; N=3 CONSUMMING hat zehn Buchstaben und wird demnach durch zwölf Trigramme (m'+n-1 = 12) ausgedrückt: **C, *CO, CON, ONS, NSU, SUM, UMM, MMI, MIN, ING, NG*, G**. Die Zerlegung von CONSUMING ergibt elf Trigramme (m+n-1 = 11): **C, *CO, CON, ONS, NSU, SUM, UMI, MIN, ING, NG*, G**. Gemeinsam haben die beiden Zeichenketten zehn Trigramme (g = 10): **C, *CO, CON, ONS, NSU, SUM, MIN, ING, NG*, G**. Die Ähnlichkeit von CONSUMMING und CONSUMING beträgt also: 2 * 10 / ( ) = 20 / 23 = 0,87. HHU Düsseldorf, WS 2008/09 Information Retrieval 286
Meinten Sie...? Wie Suchmaschinen mit Hilfe des Levenshtein-Algorithmus und Soundex ähnliche Wörter finden.
Meinten Sie...? Wie Suchmaschinen mit Hilfe des Levenshtein-Algorithmus und Soundex ähnliche Wörter finden. 24.11.2010, Christiane Olschewski Kontakt: Olschewski@LaminARt.de, Olschewski@Olschewski.org
MehrÜbung: Phonetische Transkription
Institut für Phonetik, Universität des Saarlandes Übung: Phonetische Transkription 29.10.2014 IPA-Tabelle, Transkription; Einführung in die Konsonanten Institut für Phonetik, Universität des Saarlandes
MehrUE Algorithmen und Datenstrukturen 1 UE Praktische Informatik 1. Übung 2. Spezifikation Schrittweise Verfeinerung
UE Algorithmen und Datenstrukturen 1 UE Praktische Informatik 1 Übung 2 Spezifikation Schrittweise Verfeinerung Institut für Pervasive Computing Johannes Kepler Universität Linz Altenberger Straße 69,
MehrInterdisziplinäre fachdidaktische Übung: Formale Sprache Definitionen, Funktionen
Interdisziplinäre fachdidaktische Übung: Formale Sprache Definitionen, en SS 2013: Grossmann, Jenko 1 Definitionen Folgenden Begriffe werden oft synonym verwendet: Formale Sprache Programmiersprache Computersprache
Mehr= Wortanfang/Wortende: Die ersten oder letzten Buchstaben ersetzen oder die Buchstaben stehen lassen.
ZARB Programmfunktionen Im Folgenden finden Sie eine Auswahl hilfreicher Zarb Programmfunktionen, mit denen Sie leicht Aufgaben für den Englischunterricht erstellen können. Weitere Hinweise finden Sie
MehrArtikulationsstelle Lautbezeichnung Beispiel Nasenraum Nasale - n, m, ng Nase Mund - Gang Lippen Labiale (lat. labrum: die Lippe) b, Bär pusten -
Laut und Buchstabe Ein Wort weckt (ausgesprochen oder im Schriftbild) im Hörer die Vorstellung eines Gegenstandes. Beispiel: WALD (Schriftbild) [valt] (Lautschrift) So besitzt jedes Wort eine Ausdrucks-
MehrSeminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK
Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 08.05.2014 Gliederung 1 Vorverarbeitung
MehrOrtsuche. mit PostgreSQL und PostGIS. Stephan Wagner. FOSSGIS 13. Juni ITos GmbH, CH-9642 Ebnat-Kappel. Ortsuche. Stephan Wagner.
mit und PostGIS ITos GmbH, CH-9642 Ebnat-Kappel FOSSGIS 13. Juni 2013 Ziel Konzept Hinweise an den Mahaut Abhängigkeit Ortsbezeichner Ortskoordinaten Koordinatensystem Einheiten Ortsname Sprache Schreibweise
MehrFormale Grundlagen der Fehlertoleranz in verteilten Systemen
1/27 Formale Grundlagen der Fehlertoleranz in verteilten Systemen Felix Gärtner TU Darmstadt felix@informatik.tu-darmstadt.de 2/27 Bezug zur formalen Softwareentwicklung formale SE Definitionsphase Aufsplittung
MehrArbeitsblatt 1: Transkription Konsonanten
Übungen zu Modul A: Grundlagen der Phonetik, IPDS, WS 2005/06, T. Wesener 1 Arbeitsblatt 1: Transkription Konsonanten Aufgabe 1: Benennen Sie die in der Abbildung durchnummerierten Artikulationsorte bzw.
MehrText Mining. Joachim Schole. Fakultät Technik und Informatik Hochschule für angewandte Wissenschaften Hamburg. Grundseminar, WS 2014
Text Mining Joachim Schole Fakultät Technik und Informatik Hochschule für angewandte Wissenschaften Hamburg Grundseminar, WS 2014 Joachim Schole (HAW Hamburg) Text Mining Grundseminar, WS 2014 1 / 26 Agenda
MehrKapitel 11 Informetrische Analysen. HHU Düsseldorf, WS 2008/09 Information Retrieval 180
Kapitel 11 Informetrische Analysen HHU Düsseldorf, WS 2008/09 Information Retrieval 180 Gewinnung neuer Informationen aus Datenbanken Unterstützung der normalen Recherche Information-Retrieval-Forschung
MehrSyntax. Annabelle Klarl. Einführung in die Informatik Programmierung und Softwareentwicklung
Annabelle Klarl Zentralübung zur Vorlesung Einführung in die Informatik: http://www.pst.ifi.lmu.de/lehre/wise-16-17/infoeinf WS16/17 Organisatorisches Wir werden socrative nutzen, um während der Zentralübung
MehrGrundlagen der Technischen Informatik. 2. Übung
Grundlagen der Technischen Informatik 2. Übung Christian Knell Keine Garantie für Korrekt-/Vollständigkeit Organisatorisches Übungsblätter zuhause vorbereiten! In der Übung an der Tafel vorrechnen! Bei
MehrSeminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK
Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 16.05.2013 Gliederung 1 Vorverarbeitung
MehrAlgorithmen mit konstantem Platzbedarf: Die Klasse REG
Algorithmen mit konstantem Platzbedarf: Die Klasse REG Sommerakademie Rot an der Rot AG 1 Wieviel Platz brauchen Algorithmen wirklich? Daniel Alm Institut für Numerische Simulation Universität Bonn August
Mehrund noch allerlei mehr bei nicht-nativen Wörtern, z.b. cact-i, cherub-im,...
Plank, WS 03/04, EinfLing, M&S 4a 1 Morphologische Analyse: ALLOMORPHIE Englisch: Plural ( mehr als 1 davon ; Singular = 1 davon ) The cat-s sit on the mat /s/ The dog-s /z/ The kangaroo-s /z/ The small
MehrInformatik I. Grundlagen der systematischen Programmierung. Peter Thiemann WS 2008/09. Universität Freiburg, Germany
Informatik I Grundlagen der systematischen Programmierung Peter Thiemann Universität Freiburg, Germany WS 2008/09 Organisatorisches Vorlesung Di und Do, 11-13 Uhr, HS 101-00-036 Dozent Prof. Dr. Peter
MehrDie Mathematik in der CD
Lehrstuhl D für Mathematik RWTH Aachen Lehrstuhl D für Mathematik RWTH Aachen St.-Michael-Gymnasium Monschau 14. 09. 2006 Codes: Definition und Aufgaben Ein Code ist eine künstliche Sprache zum Speichern
Mehr15ab 21bc 9b = 3b 5a 7c 3
4 4.1 Einführung Haben alle Summanden einer algebraischen Summe einen gemeinsamen Faktor, so kann man diesen gemeinsamen Faktor ausklammern. Die Summe wird dadurch in ein Produkt umgewandelt. Tipp: Kontrolle
MehrLexikalische Programmanalyse der Scanner
Der Scanner führt die lexikalische Analyse des Programms durch Er sammelt (scanned) Zeichen für Zeichen und baut logisch zusammengehörige Zeichenketten (Tokens) aus diesen Zeichen Zur formalen Beschreibung
MehrVGM. VGM information. HAMBURG SÜD VGM WEB PORTAL USER GUIDE June 2016
Overview The Hamburg Süd VGM Web portal is an application that enables you to submit VGM information directly to Hamburg Süd via our e-portal Web page. You can choose to enter VGM information directly,
MehrPrüfungsbestimmungen für die Prüfung in Textverarbeitung an den bayerischen Realschulen
Prüfungsbestimmungen für die Prüfung in Textverarbeitung an den bayerischen Realschulen Für die freiwillige Prüfung in Textverarbeitung an den bayerischen Realschulen wird Folgendes bestimmt: Allgemeine
MehrNP-Vollständigkeit. Krautgartner Martin (9920077) Markgraf Waldomir (9921041) Rattensberger Martin (9921846) Rieder Caroline (0020984)
NP-Vollständigkeit Krautgartner Martin (9920077) Markgraf Waldomir (9921041) Rattensberger Martin (9921846) Rieder Caroline (0020984) 0 Übersicht: Einleitung Einteilung in Klassen Die Klassen P und NP
MehrStudienprojekt TaxoSearch Spezifikation
Studienprojekt TaxoSearch Spezifikation Semantisch gestützte Suche im Internet Lehrstuhl für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 2002-2003 vorgestellt von Thorsten Beinhorn, Vesna
MehrACDEFG. Hotmetal Borders
1 1 a123b c456d g44h i11j i 11 j k44l o44p q11r q11r s44t u11v u11v w44x A$$B A$$B * + + C//D E%"%F E%"%F * + G?&?H I%"%J I%"%J K?&?L M$$N M$$N * + + O//P Q11R Q 11 R S44T U123V U 123 V 8 W456X y11z y
MehrVGM. VGM information. HAMBURG SÜD VGM WEB PORTAL - USER GUIDE June 2016
Overview The Hamburg Süd VGM-Portal is an application which enables to submit VGM information directly to Hamburg Süd via our e-portal web page. You can choose to insert VGM information directly, or download
MehrLexikalische Semantik. Was ist ein Wort? Was ist in einem Wort?
Lexikalische Semantik Was ist ein Wort? Was ist in einem Wort? Was ist ein Wort? Er machte nicht viele Wörter. Deine Wörter in Gottes Ohr! Ich stehe zu meinen Wörtern Ein Essay von 4000 Worten Im Deutschen
MehrNachteile Boolesches Retrieval
Nachteile Boolesches Retrieval Komplizierte Anfragen Häufigkeit bzw. Relevanz der Terme in den Dokumenten nicht berücksichtigt 2 von 3 UND-verknüpften Termen im Dokument so schlecht wie 0 Terme Keine Rangfolge
MehrDaten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1
Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 2.800.000.000.000.000.000.000 Bytes Daten im Jahr 2012* * Wenn jedes Byte einem Buchstaben entspricht und wir 1000 Buchstaben auf
Mehrdas Haus - Vokabeln der Schornstein die Toilette Verben wohnen Andere Wörter die Einfahrt
das Haus - Vokabeln das Haus die Wohnung der Garten der Schornstein der Keller die Garage die Tür die Toilette die Küche das Dach das Badezimmer das Schlafzimmer das Fenster das Eßzimmer das Wohnzimmer
MehrIndexieren und Suchen
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Indexieren und Suchen Tobias Scheffer Index-Datenstrukturen, Suchalgorithmen Invertierte Indizes Suffix-Bäume und -Arrays Signaturdateien
MehrDeterministischer Kellerautomat (DPDA)
Deterministische Kellerautomaten Deterministischer Kellerautomat (DPDA) Definition Ein Septupel M = (Σ,Γ, Z,δ, z 0,#, F) heißt deterministischer Kellerautomat (kurz DPDA), falls gilt: 1 M = (Σ,Γ, Z,δ,
MehrÜbungsblatt 7. Vorlesung Theoretische Grundlagen der Informatik im WS 16/17
Institut für Theoretische Informatik Lehrstuhl Prof. Dr. D. Wagner Übungsblatt 7 Vorlesung Theoretische Grundlagen der Informatik im W 16/17 Ausgabe 17. Januar 2017 Abgabe 31. Januar 2017, 11:00 Uhr (im
MehrArbeitsblatt I. 5. Welche Arten von Fehlern könnten bei der Eingabe noch auftreten?
Arbeitsblatt I 1. Sind folgende EAN gültig? a. 3956966784248 b. 3900271934004 2. Berechne händisch die Prüfziffer zu folgender Nummer: 100311409310 Tipp: Du kannst dir die Sache einfacher machen, wenn
MehrSpracherkennung und Sprachsynthese
Spracherkennung und Sprachsynthese Einführung in die Computerlinguistik Sommersemester 2012 Peter Kolb Spracherkennung / -synthese Spracherkennung (automatic speech recognition, ASR) Sprachsynthese (text-to-speech,
Mehration Retrieval Informationen suchen und finden R. Oldenbourg Verlag München Wien von Prof. Dr. Wolfgang G. Stock Fachhochschule Köln
;,~"., ""'1"" -
MehrMorphologie. Ending Khoerudin Deutschabteilung FPBS UPI
Morphologie Ending Khoerudin Deutschabteilung FPBS UPI Morphologie Was ist ein Wort? Morphologie ist linguistische Teildisziplin, die sich mit dem Gestalt, Flexion (Beugung) und Bildung von Wörtern beschäftigt.
MehrAllgemeines Artikulatorische Phonetik Transkription Konsonanten Vokale. Phonetik I. Gerrit Kentner
Phonetik I Gerrit Kentner 8. Juni 2010 1 / 27 Was bisher geschah Einführendes Was ist/ was macht die Sprachwissenschaft Zeichentheoretische Grundlagen Morphologie Allgemeines zur Morphologie, Morphembegriff,
MehrKapiteltests zum Leitprogramm Binäre Suchbäume
Kapiteltests zum Leitprogramm Binäre Suchbäume Björn Steffen Timur Erdag überarbeitet von Christina Class Binäre Suchbäume Kapiteltests für das ETH-Leitprogramm Adressaten und Institutionen Das Leitprogramm
MehrLiLi. physik multimedial. Links to e-learning content for physics, a database of distributed sources
physik multimedial Lehr- und Lernmodule für das Studium der Physik als Nebenfach Links to e-learning content for physics, a database of distributed sources Julika Mimkes: mimkes@uni-oldenburg.de Overview
MehrDublettenbereinigung nach dem Record Linkage Algorithmus
Dublettenbereinigung nach dem Record Linkage Algorithmus Dipl.-Wirtschaftsinformatiker (FH) Sönke Cordts, Prof. Dr. Burkhard Müller Wirtschaftsinformatik Fachhochschule Westküste, BWL Fritz-Thiedemann-Ring
MehrVuFind Ein Baustein beim Finden, Entdecken & Bekommen. Gerald Steilen, 6. Mai 2015
VuFind Ein Baustein beim Finden, Entdecken & Bekommen Gerald Steilen, 6. Mai 2015 Perceptions of Libraries and Information Resources. 1 Wo beginnt die Suche? Perceptions of Libraries and Information Resources.
MehrPart-of-Speech- Tagging
Part-of-Speech- Tagging In: Einführung in die Computerlinguistik Institut für Computerlinguistik Heinrich-Heine-Universität Düsseldorf WS 2004/05 Dozentin: Wiebke Petersen Tagging Was ist das? Tag (engl.):
MehrFormale Sprachen und Automaten
Formale Sprachen und Automaten Kapitel 1: Grundlagen Vorlesung an der DHBW Karlsruhe Thomas Worsch Karlsruher Institut für Technologie, Fakultät für Informatik Wintersemester 2012 Ziel Einführung der wichtigsten
MehrInterdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko
Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der SS 2016: Grossmann, Jenko Die Beschreibung orientiert sich am Begriffssystem der Beschreibung natürlicher Sprachen Sprache in der steht
Mehr15ab 21bc 9b = 3b 5a 7c 3
4 4.1 Einführung Haben alle Summanden einer algebraischen Summe einen gemeinsamen Faktor, so kann man diesen gemeinsamen Faktor ausklammern. Die Summe wird dadurch in ein Produkt umgewandelt. Tipp: Kontrolle
MehrEarley Parsing. Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann
Earley Parsing Parsing - WS 2012 / 2013 Lisa Orszullok & Anika Stallmann 12.12.2012 Agenda Basics Komponenten Earley Parsing - Recognizer Earley Parsing - Parser Vor- und Nachteile Parsing WS 2012/2013
MehrLemmatisierung und Stemming in Suchmaschinen
Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2016 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)
MehrGrundlagen der Technischen Informatik. Hamming-Codes. Kapitel 4.3
Hamming-Codes Kapitel 4.3 Prof. Dr.-Ing. Jürgen Teich Lehrstuhl für Hardware-Software-Co-Design Inhalt Welche Eigenschaften müssen Codes haben, um Mehrfachfehler erkennen und sogar korrigieren zu können?
MehrFormale Methoden 2. Gaetano Geck Lehrstuhl I Logik in der Informatik WS 2015/2016
Formale Methoden 2 Gaetano Geck Lehrstuhl I Logik in der Informatik WS 2015/2016 Teil 3: Kodierung 1 Motivation 2 Exkurs Grundlagen formaler Sprachen 3 Grundlagen 4 Beispielkodierungen FM2 (WS 2014/15,
MehrKapitel 1. Exakte Suche nach einem Wort. R. Stiebe: Textalgorithmen, WS 2003/04 11
Kapitel 1 Exakte Suche nach einem Wort R. Stiebe: Textalgorithmen, WS 2003/04 11 Überblick Aufgabenstellung Gegeben: Text T Σ, Suchwort Σ mit T = n, = m, Σ = σ Gesucht: alle Vorkommen von in T Es gibt
MehrWS 2008/09. Diskrete Strukturen
WS 2008/09 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws0809
MehrKurzeinführung Moodle
Kurzeinführung Moodle 1. Einstieg, Kursinhalte, Datei-Download Nachdem Sie sich erfolgreich registriert und eingeloggt haben, gelangen Sie zu Ihrer Hauptseite. Aktivieren Sie Meine Startsteite um Ihren/Ihre
MehrKapitel 23 Strukturinformationen in Dokumenten. HHU Düsseldorf, WS 2008/09 Information Retrieval 368
Kapitel 23 Strukturinformationen in Dokumenten HHU Düsseldorf, WS 2008/09 Information Retrieval 368 Erkennung von Strukturinformationen in Web- Dokumenten Aufgaben: Kreation von Metadaten optimal: Eintragen
MehrC++ Notnagel. Ziel, Inhalt. Programmieren in C++
C++ Notnagel Ziel, Inhalt Ich versuche in diesem Dokument noch einmal die Dinge zu erwähnen, die mir als absolut notwendig für den C++ Unterricht und die Prüfungen erscheinen. C++ Notnagel 1 Ziel, Inhalt
MehrMultilinguales Information Retrieval, AG Datenbanken und Informationssysteme. Multilinguales Information Retrieval
Multilinguales Information Retrieval 1 Definition IR in einer anderen Sprache als Englisch IR auf einer einsprachigen Dokumentensammlung, die in mehreren Sprachen befragt werden kann. Information Retrieval
MehrLexikalische Substitutionen. Seminar: Sprachproduktion Dozentin: Prof. Dr. Helen Leuninger WS 09/10 Referenten: Anna Schmidt und Tim Krones
Lexikalische Substitutionen Seminar: Sprachproduktion Dozentin: Prof. Dr. Helen Leuninger WS 09/10 Referenten: Anna Schmidt und Tim Krones Gliederung 1 Substitutionen: Arten und Eigenschaften 2 Entstehung
Mehr2 Sprachliche Einheiten
2 Sprachliche Einheiten Inhalt Semiotische Begriffe Wörter Wortbestandteile Wortzusammensetzungen Wortgruppen Text und Dialog Wort- und Satzbedeutung 2.1 Semiotische Begriffe Semiotische Begriffe Semiotik
MehrGrammatiken und ANTLR
Grammatiken und ANTLR Zusatzfolien zu Algo Blatt 6 Author: Henry Schaefer http://www.majeeks.de/folien_blatt6.pdf Grammatik Definition: syntaktische Beschreibung einer Sprache (H.S.) Definiton Grammatik
MehrAm Anfang war das Wort!
Am Anfang war das Wort! Was ist Morphologie? Der Begriff Morphologie wurde 1796 von Johann Wolfgang von Goethe in einer Tagebuchaufzeichnung für eine neue Wissenschaft geprägt,, die sich mit den Gestaltungsgesetzen
MehrWas bisher geschah. Darstellung von Sprachen Ausführen von Berechnungen
Was bisher geschah Alphabet, Wort, Sprache Operationen auf Wörtern: Spiegelung R, Verkettung Palindrome Relationen zwischen Wörtern: Präfix, Infix, Postfix Wortersetzungssystem S: Regeln (l r), Ersetzungsschritt
MehrGrundlagen der Textlinguistik
Grundlagen der Textlinguistik * WS 2003/04 1 Grundlagen der Textlinguistik Teil 11: Textproduktion Aufgabe: Schreiben Sie in fünf Minuten ein kurzes Essay über das Thema Ökologie. Nehmen Sie die Aussage:
MehrSentiStrength. Irina Schmidt Universität Koblenz-Landau Campus Koblenz Institute for Web Science and Technologies 31.05.2012
SentiStrength Irina Schmidt Universität Koblenz-Landau Campus Koblenz Institute for Web Science and Technologies 31.05.2012 Gliederung Motivation Sentimentanalyse Menschliche Einschätzung des Sentiment
MehrDas Studium im Fach Informatik
[Projekttage Studien- und Berufsorientierung der Jgst. 12] Fachbereich Informatik Fakultät für Mathematik und Informatik FernUniversität Hagen 22. Februar 2007 Was Informatik nicht ist Was ist Informatik?
MehrFachseminar WS 2008/09
Fachseminar WS 2008/09 Fachgebiet: Compilerbau Thema: Lexikalische Analyse (Scanner) Referent: Ali Sediq Betreuer: Prof. Dr. Helmut Weber 1 Inhaltsverzeichnis Lexikalische Analyse 1.0 Grundprobleme der
MehrAusdrücke und primitive Typen
Lehrstuhl für Bioinformatik Einführung in die Programmierung für Bioinformatiker Prof. B. Rost, Dr. L. Richter Blatt 04 14.11.2016 Ausdrücke und primitive Typen Aufgabe 4.1 Java-Quiz Wahr Falsch Der Ausdruck
MehrAlgorithmen zur Bestimmung von Ähnlichkeit auf Zeichenketten. Ähnlichkeit in der Linguistik
Algorithmen zur Bestimmung von Ähnlichkeit auf Zeichenketten Ähnlichkeit in der Linguistik Inhalt Einführung Lautsymbolik Vergleich von Lauten Ähnlichkeits- & Distanzmaße Identitätsabgleich subjektive
MehrAnwenundg regulärer Sprachen und endlicher Automaten
Proseminar Theoretische Informatik Dozent: Prof. Helmut Alt Anwenundg regulärer Sprachen und endlicher Automaten Madlen Thaleiser 30. Oktober 2012 Reguläre Sprachen Regulärer Ausdruck definiert über einem
MehrInduktive Beweise und rekursive Definitionen
Induktive Beweise und rekursive Definitionen Vorlesung Logik in der Informatik, HU Berlin 1. Übungsstunde Beweis durch vollständige Induktion über N Aufgabe 1 Zeige, dass für alle n N gilt: n 2 i = 2 n+1
MehrName: Klasse: Standardisierte kompetenzorientierte schriftliche Reifeprüfung AHS. 18. September Englisch. Schreiben
Name: Klasse: Standardisierte kompetenzorientierte schriftliche Reifeprüfung AHS 18. September 2015 Englisch (B2) Schreiben Hinweise zum Beantworten der Fragen Sehr geehrte Kandidatin, sehr geehrter Kandidat!
MehrSemantische Suche auf einem Web-Korpus
Semantische Suche auf einem Web-Korpus Philipp Bausch April 25, 2014 Philipp Bausch () Semantische Suche auf einem Web-Korpus April 25, 2014 1 / 18 Übersicht 1 Einleitung 2 Die Daten 3 Verarbeitung 4 Fazit
Mehr28 4. DIE MATHEMATIK HINTER DER COMPACT DISC. Abbildung 4.1: Selbstkorrigierende Codes
8 4. DIE MATHEMATIK HINTER DER COMPACT DISC y1 1 4 3 y3 y Abbildung 4.1: Selbstkorrigierende Codes 4. Die Mathematik hinter der Compact Disc 4.1. Selbstkorrigierende Codes Wenn wir eine Reihe von 0 und
Mehr51.28 Protokoll und Skript vom
51.28 Protokoll und Skript vom 04.02.2009 Qualifizierungsmaßnahme Das Würzburger Trainingsprogramm und seine Einsatzmöglichkeiten beim Übergang von der Kindertageseinrichtung in die Grundschule Referentin:
MehrMaschinelle Übersetzung
Hauptstudiumsprojekt SoSe 07 Maschinelle Übersetzung Walther v. Hahn, Cristina Vertan {vhahn,vertan}@informatik.uni-hamburg.de Wozu dient ein Projekt? Projekte im Umfang von 6 SWS dienen der Bearbeitung
MehrEinsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation
Einsatz einer Dokumentenverwaltungslösung zur Optimierung der unternehmensübergreifenden Kommunikation Eine Betrachtung im Kontext der Ausgliederung von Chrysler Daniel Rheinbay Abstract Betriebliche Informationssysteme
MehrAlgorithmen und Komplexität Teil 1: Grundlegende Algorithmen
Algorithmen und Komplexität Teil 1: Grundlegende Algorithmen WS 08/09 Friedhelm Meyer auf der Heide Vorlesung 8, 4.11.08 Friedhelm Meyer auf der Heide 1 Organisatorisches Am Dienstag, 11.11., fällt die
MehrDic*onary Zugriff, Datenstrukturen Wildcard Queries Fehlertolerante Suche/Fehlerkorrektur Soundex
Ch. 2 Woche 3 Dic*onary Zugriff, Datenstrukturen Wildcard Queries Fehlertolerante Suche/Fehlerkorrektur Soundex Folien Übersetzt + z.t. Ergänzt von Manning et al. 1 Ch. 2 Letzte Woche Unterschied Type/Token
MehrAastra Communications Systems
Aastra Communications Systems Aastra 6700i family Designation Labels Thank you for your purchase of an Aastra 6700i phone. This file will allow you to print the designation labels for the programmable
MehrInduktive Beweise und rekursive Definitionen
Induktive Beweise und rekursive Definitionen Vorlesung Logik in der Informatik, HU Berlin 1. Übungsstunde Beweis durch vollständige Induktion über N Aufgabe 1 Zeige, dass für alle n N gilt: n 2 i = 2 n+1
MehrPräfx Trie zur Stringverarbeitung. Cheng Ying Sabine Laubichler Vasker Pokhrel
Präfx Trie zur Stringverarbeitung Cheng Ying Sabine Laubichler Vasker Pokhrel Übersicht: Einführung Eigenschaften von Tries Verwendung von Tries Allgemeine Defnition von Patricia Tries Eigenschaften von
MehrSentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser
Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Gliederung Einleitung Problemstellungen Ansätze & Herangehensweisen Anwendungsbeispiele Zusammenfassung 2 Gliederung
MehrEinführung in die Informatik 2
Einführung in die Informatik 2 Suchen in Texten Sven Kosub AG Algorithmik/Theorie komplexer Systeme Universität Konstanz E 202 Sven.Kosub@uni-konstanz.de Sprechstunde: Freitag, 12:30-14:00 Uhr, o.n.v.
MehrGrundkurs Was ist Phonologie? Kontraste, Phonotaktik und Alternationen einer Sprache
Grundkurs Was ist Phonologie? Kontraste, Phonotaktik und Alternationen einer Sprache Dinah Baer-Henney October 22, 2014 Praktische Information Praktische Information Kurs Grundkurs: Was ist Phonologie?
MehrGrundlagen der Informatik II
Grundlagen der Informatik II Tutorium 2 Professor Dr. Hartmut Schmeck Miniaufgabe * bevor es losgeht * Finden Sie die drei Fehler in der Automaten- Definition. δ: A = E, S, δ, γ, s 0, F, E = 0,1, S = s
MehrBerechenbarkeit und Komplexität: Rekursive Aufzählbarkeit und die Technik der Reduktion
Berechenbarkeit und Komplexität: Rekursive Aufzählbarkeit und die Technik der Reduktion Prof. Dr. Berthold Vöcking Lehrstuhl Informatik 1 Algorithmen und Komplexität 26. November 2007 Semi-Entscheidbarkeit
MehrA1: Wandle durch Zerlegung in Zweierpotenzen in das Binärsystem um: 12; 22; 38; 57; 111; 31; 63; 96; 127; 65; 129; 145, 173 32; 64; 128; 255; 256
Aufgaben A1: Wandle durch Zerlegung in Zweierpotenzen in das Binärsystem um: 12; 22; 38; 57; 111; 31; 63; 96; 127; 65; 129; 145, 173 32; 64; 128; 255; 256 Wandle per Resteverfahren ins Binärsystem um:
Mehr1. Vorlesung,
1. Vorlesung, 16.10.2006 Einführung und Motivation, Beispiel Information versus Daten Grundlegende Konzepte Aufgaben des Anwenders Logische Sicht auf Dokumente Dokumentvorverarbeitung Dokumentsuche mit
MehrArtikulatorische distinktive Merkmale der Konsonanten im Deutschen
Referentinnen Ania Lamkiewicz Eva Mujdricza Computerlinguistik 1. FS Computerlinguistik 1. FS Romanistik 2. FS DaF Sprachwissenschaft 1. FS e-mail: al_smile@web.de e-mail: mujdricza@web.de Artikulatorische
MehrEnglische Phonetik und Phonologie
Englische Phonetik und Phonologie Günther Scherer und Alfred Wollmann 3., überarbeitete und ergänzte Auflage E R I C H S C H M I D T V E R L A G Vorwort i 5 Vorwort zur 3. Auflage 7 Abkürzungen und Zeichen
MehrVergleiche und Transformationen für XML-Dokumente - Teil 2. Ein Ansatz zur hierarchischen, adaptiven Kollationierung
Vergleiche und Transformationen für XML-Dokumente - Teil 2 Ein Ansatz zur hierarchischen, adaptiven Kollationierung Varianz in der Gleichheit nicht nur der Manuskripte, sondern auch ihrer Teile die Elemente
Mehr1. Woche Einführung in die Codierungstheorie, Definition Codes, Präfixcode, kompakte Codes
1 Woche Einführung in die Codierungstheorie, Definition Codes, Präfixcode, kompakte Codes 1 Woche: Einführung in die Codierungstheorie, Definition Codes, Präfixcode, kompakte Codes 5/ 44 Unser Modell Shannon
MehrVom Suchen und Finden - Google und andere Ansätze
Vom Suchen und Finden - Google und andere Ansätze Norbert Fuhr Universität Duisburg Essen FB Ingenieurwissenschaften Abteilung Informatik 12. Mai 2005 Gliederung 1 Einführung 2 Grundlagen 3 Erweiterte
Mehr5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften
5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer Clusterstruktur kennen, verschiedene
MehrEntstehung. Überblick. Arabisch und Varietäten. Entstehung. Entstehung und Verbreitung der arabischen Sprache und Schrift
Cross-Linguales Retrieval Arabisch-Deutsch 3. Hildesheimer Evaluierungs- und Retrieval Workshop Dr. René Schneider Überblick Entstehung und Verbreitung der arabischen Sprache und Schrift Koiné Expansion
MehrÜbungsaufgaben zu Formalen Sprachen und Automaten
Universität Freiburg PD Dr. A. Jakoby Sommer 27 Übungen zum Repetitorium Informatik III Übungsaufgaben zu Formalen Sprachen und Automaten. Untersuchen Sie das folgende Spiel: A B x x 2 x 3 C D Eine Murmel
MehrAlgorithmus zur komprimierten Übertragung von Textdaten an mobile Endgeräte
Fachhochschule Wedel Seminararbeit Algorithmus zur komprimierten Übertragung von Textdaten an mobile Endgeräte Sven Reinck 7. Januar 2007 Inhaltsverzeichnis Inhaltsverzeichnis Motivation 2 Wörterbuch 2.
Mehr5. Clusteranalyse Vorbemerkungen. 5. Clusteranalyse. Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften
5. Clusteranalyse Vorbemerkungen 5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer
Mehr13. Algorithmus der Woche Fehlererkennende Codes Was ist eigentlich ISBN?
13. Algorithmus der Woche Fehlererkennende Codes Was ist eigentlich ISBN? Autor Alexander Souza, Universität Freiburg Schon faszinierend, was man so alles mit Algorithmen machen kann: CDs schnell in Regalen
Mehr