Phonetische Lexika Morphologische Analysen. Uwe D. Reichel IPSK, LMU München 9. Januar 2008
|
|
- Luisa Dunkle
- vor 6 Jahren
- Abrufe
Transkript
1 Phonetische Lexika Morphologische Analysen Uwe D. Reichel IPSK, LMU München 9. Januar 2008
2 Inhalt Terminologie Finite-State-Methoden Schwierigkeiten der deutschen Morphologie Analyse ohne lexikalisches Wissen Wissenfreie Segmentierung 1
3 Terminologie Morphem: kleinste Bedeutungstragende Einheit einer Sprache Morph: Morphem-Realisierung Allomorphe: kontextabhängige verschiedene Realisierungen desselben Morphems; M. hart: hart, härt; M. <Plural>: e, en, es, s, ɛ Lexikalisches Morphem: Bezeichnung von Objekten, Sachverhalten der außersprachlichen Welt (hund, les) Grammatikalisches Morphem: Bestimmung von gramm. Beziehungen im Satz (e, en, heit, und, wenn) Freies Morphem: kann eigenständig auftreten; sowohl lex. (haus) als auch gramm. (und) Morpheme Gebundenes Morphem: kann nicht ohne freies Morphem auftreten: entwarnung) Stamm: Basismorphem, das gemeinsame Element einer Wortfamilie; les in lesen, ablesbar 2
4 Affixe: gebundene Morpheme zur Wortbildung (u.a. zu Wortartwechsel = Konversion führend); dem Stamm vorausgehend: Präfixe (entschuldigen); stammintern: Infixe; dem Stamm folgend: Suffixe (schuldig); den Stamm einschließend: Circumfixe (geglaubt); Reihenbildung möglich (ab+geordnet, Arbeitslos+ig+keit) Diskontinuierliches Morphem: durch mehrere getrennte Morphe realisert; M. <Part. Perf.>: geliebt Portemanteau-Morphem: Bedeutungseinheit, die durch Verschmelzung von Morphen entsteht; zum Unikales Morphem (Hapax Legomenon): nicht produktives Morphem mit rein distinktiver Funktion; Himbeere, Brombeere Nullmorphem: durch leeres Morph realisiertes Morphem; M. <Plural> in Wasser Derivation: Wortbildung (i.d.r. Wortartwechsel) durch Affigierung (s.o.), Ablaute (härter), Rückbildung (Schau[en]) Komposition: Verbindung von zwei oder mehr freien Morphemen (mit beliebig vielen gebundenen M.) Simplex: Nicht-Kompositum 3
5 Flexion: Codierung der Parameter Kasus, Numerus, Genus, Finitheit, Tempus, Modus, Komparation mit Hilfe von Flexionsmorphemen und Allomorphie (u.a. Ablautbildung); denken, Häuser, dachte Fugenmorphem: Bindeglied zwischen Morphemen; Bahnhofskneipe, Toilettentür, hoffnungslos Morphotaktik: Festlegung erlaubter Sequenzen von Morphemklassen String-Präfix: Stringsegment, beginnend am linken Rand, kein morph. Bezug: Altertum String-Suffix: Stringsegment, beginnend am rechten Rand, kein morph. Bezug: Altertum Stemming: Entfernung der Flektionsendungen und Suffixe 4
6 Deutsche Morphologie flektierende Sprache: gebundene Morpheme und Stammmodifizierungen zur Derivation, Flektion Kompositabildung hochproduktiv 5
7 Finite-State-Methoden Verfahren zum Analysieren (Parsen) und Erzeugen sprachlicher Einheiten Definitionen Alphabet : endliche Menge von Zeichen Wort w: Verkettung von Zeichen aus : Menge aller Wörter über Alphabet Sprache L über : Teilmenge von 6
8 Endliche Automaten Entscheidungsproblem: entscheide, ob w L Erkennungsproblem: ermittle Struktur von w endlicher Automat: A = (Q,, q 0, F, ) Q: endliche Zustandsmenge : endliches Eingabe-Alphabet q 0 Q: Startzustand F Q: Menge von Finalzuständen Q x x Q: Übergangsrelation; Q x Q; (q x, s) = q y ( vom Zustand q x gelangt man durch Einlesen des Zeichens s in Zustand q y ) Sprache L(A): Menge aller von A akzeptierten Wörter Eingabewort w ist Element von L(A), wenn in A nach Einlesen des letzten Zeichens von w ein Finalzustand erreicht werden kann deterministischer endlicher Automat: ist für jedes Zustand-Eingabesymbol-Paar eindeutig, also eine Funktion; man kann von einem Zustand nach Einlesen eines bestimmten Eingabesymbols nur in höchstens einen anderen Zustand gelangen nicht-deterministischer endlicher Automat: ist für mindestens ein Zustand-Eingabesymbol-Paar nicht eindeutig 7
9 Anwendung in der morphologischen Analyse Lexikon ordnet Morpheme ihren Klassen zu Automat repräsentiert Morphotaktik (Eingabe-Alphabet: Morphemklassen) Analyse: 1. Zerlegung des Eingabeworts (s.u.) 2. dabei Lookup der Morphemklassen der erhaltenen Segmente 3. Prüfung, ob der Morphotaktik-Automat die Morphemklassensequenz akzeptiert: ja Analyse geglückt; nein sofern andere Zerlegung möglich Neustart bei 1 mit anderer Zerlegung 8
10 Beispiel: finite Verben Lexikon VP PRFX PRP V N SFX FL aus be gegen halt ding ier en fort ent in komm form et setz te VP Verbalpartikel, PRFX V.-Präfix, PRP Präposition, V Verbstamm, N Substantivstamm, SFX V.-Suffix, FL V.-Flexionsendung Automat s P RF X V P ɛ 1 3 ɛ P RP ɛ 2 N P RF X V 4 5 SF X ɛ SF X 6 F L F L ɛ: leerer Übergang (kein Zeichen eingelesen), Startzustand s, Finalzustände doppelt umkreist 7 9
11 Analysierbare Wörter be/prfx+in/prp+halt/v+et/fl ent/prfx+gegen/prp+komm/v+en/fl fort/vp+setz/v+en/fl aus/vp+be/prfx+ding/n+te/fl form/n+ier/sfx+te/fl komm/v form/n+ier/sfx 10
12 Morphologisches Parsing Ausgabe von Grundform und gramm. Angaben zu Person, Kasus, Tempus, usw. Zwei-Ebenen-Morphologie (Koskenniemi, 1983) lexikalische Form: haus +N +PL Oberflächenform: Häuser Finite State Transducer zur Vermittlung zwischen diesen beiden Ebenen Beim Übergang von einem Zustand in einen anderen wird Zeichen aus Eingabealphabet durch Zeichen aus Ausgabealphabet ersetzt 11
13 Finite State Transducer T = ( 1, 2, Q, q 0, F, ) 1 : Eingabealphabet 2 : Ausgabealphabet Q: endliche Zustandsmenge q 0 Q: Startzustand F Q: Finalzustände Q x 1 x 2 x Q: Übergangsrelation mit Ersetzung; (q x, i : o) = q y ( Vom Zustand q x gelangt man durch Einlesen des Eingabzeichens i in Zustand q y. Dabei wird i durch das Ausgabezeichen o ersetzt. ) 12
14 Beispiel: Nomen Lexikon: enthält für lexikalische Morpheme auch 2 Ebenen N-er N-en FL häus:haus bett:bett en büch:buch er en-plural, FL: Nom. Flexionsendung Transducer N-er: Nomenstamm mit er-plural, N-en: Nomenstamm mit N er 1 ɛ:+n 2 er:+p L s 5 N en 3 ɛ:+n 4 en:+p L 13
15 Analysierbare Wörter buch+n+pl haus+n+pl gart+n+pl Durch Vertauschen von Eingabe- und Ausgabealphabet läßt sich ein analysierender Transducer in einen generierenden umwandeln. Im Lexikon stünde dann beispielsweise haus:häus und am er-plural-übergang im Transducer +PL:er. 14
16 Analyse ohne lexikalisches Wissen Reichel et al. (2004) nötiges Wissen: gebundene Morpheme, Allomorphie, Morphotaktik, POS, POS/Last-Morph-Kompatibilität nur zur Analyse, nicht zur Generierung geeignet (Übergeneralisierung) 2 Schritte: Lexikonaufbau, Segmentierung 15
17 Lexikon Aufbau: Morph + Morphemklasse initialisiert mit gebundenen Morphemen (Affixe, Fugen, Flektionsendungen) wird anhand von Input-Text mittels Stemming und Allomorph-Generierung aufgefüllt Stemming: Verben, Adjektive: greedy pattern matching und Entfernung gebundener Morpheme; Constraints: z.b. verbleibender String muß mind. 1 Vokal enthalten und best. Mindestlänge aufweisen Distributionsanalyse (betet & beten bet/v; Bilds & Bilder bild/n) Allomorph-Generierung Ersetzung von Umlauten in Adjektivstämmen (stärk/adj stark/adj) Vokalersetzung bei starken Verben mit informativen Ablautreihen (e.g. ge+lauf+en lief/v ) 16
18 Segmentierung gemäß simpler konkatenativer Morphologie, Kontextsensitivität der Allomorphie muß nicht beachtet werden. Algorithmus 1. Teile jedes Wort w rekursiv 1 von links nach rechts in String-Präfixe und -Suffixe bis eine erlaubte Segmentierung möglich ist oder das Wortende erreicht wird. 2. Im Laufe der Rekursion wird eine Grenze, die den aktuellen String in Präfix und Suffix unterteilt dann akzeptiert wenn (i) das Präfix im Lexikon zu finden ist, (ii) eine eine erlaubte Segmentierung des Suffixes möglich ist, oder /falls nicht) das Suffix im Lexikon steht, (iii) die Sequenz Präfix-Klasse + Klasse des ersten Suffixes nicht der Morphotaktik widerspricht 2 und (iv) die Klasse des letzten Suffixes kompatibel ist mit dem POS von w. 1 Rekursion: Aufruf einer Funktion durch sich selbst. 2 Morphotaktik hier also nur lokal zwischen Morphem-Paaren festgelegt, nicht über das ganze Wort hinweg. 17
19 Nominalsuffix Verb finit Fuge, Nominalsuffix, Nominalflexionsendung Verbalflexionsendung, Verbstamm Beispieleinträge für Morphotaktik (oben: Morphemklassen rechts können den Klassen links folgen) und POS letztes Suffix Kompatibilität (unten: Wörter mit POS links müssen mit einem Morphem einer der Klassen rechts enden) Entdeckung neuer Morpheme: über Distributionsanalyse. Wenn vollständige Segmentierung von w scheitert, wird eine partielle Segmentierung versucht (also eine Segmentierung von w-substrings). Falls nur ein Substring s nicht zu segmentieren ist und s in verschiedenen segmentierbaren lexikalischen Umgebungen auftritt, wird es als (nicht klassifiziertes) Morphem behandelt, und die betroffenen Wörter dementsprechend segmentiert (Chefpilot & Regierungschef chef/nc chef/nc+pilot/n & reg/v+ier/vsfx+ung/nsfx+s/fg+chef/nc) 18
20 Wissensfreie morph. Segmentierung Stemming: Peak and Plateau-Algorithmus (Nascimento et al., 1998) Stamm endet an lokalem Maximum der successor variety. (vgl. POS Tagging-Skript) Morphology Induction unüberwachtes Lernen (keine morphologischen Segmentierungen vorgegeben) Minimum Description Length (MDL) Prinzip: wähle dasjenige morph. Modell für die Trainingsdaten DATA, das den Ausdruck: Größe des Lexikons + Größe des Modells= DL(L) + DL(DATA L) minimiert Lexikon L beinhaltet die morph. Segmente Modell segmentiert Trainingsdaten DATA anhand des Lexikons L. Je weniger Bits im Durchschnitt benötigt werden, um ein Segment aus DATA vorherzusagen, desto kleiner die description length DL des Modells. alternative Modellgrößen: Anzahl der Zustände in einem Reduzierten Endlichen Automaten zur Segmentierung von DATA (Reichel et al., 2004) zu Details der Lernverfahren vgl. Brent et al. (1995), Goldsmith (2001) u.a. 19
4.9 Deterministische Kellerautomaten Wir haben bereits definiert: Ein PDA heißt deterministisch (DPDA), falls
4.9 Deterministische Kellerautomaten Wir haben bereits definiert: Ein PDA heißt deterministisch (DPDA), falls δ(q, a, Z) + δ(q, ɛ, Z) 1 (q, a, Z) Q Σ. Die von einem DPDA, der mit leerem Keller akzeptiert,
MehrAutomatische Morphemanalyse
Automatische Morphemanalyse Johannes Stiehler Wozu? noch immer viele europäische Sprachen ohne befriedigende Morphologie ermöglicht es, verschiedene Sprachstadien morphologisch zu vergleichen ohne Wochen
MehrVI Morphologische Exponens
Fortmann, Proseminar Morphologie / Universität Konstanz Wintersemester 2006/07 VI Morphologische Exponens Die Bedeutung, welche durch ein Morphem einer Lautform assoziiert wird, ist nach Gehalt und Umfang
MehrMorphologie Einleitung. System der deutschen Sprache Morphologie nominale Kategorie: Genus
System der deutschen Sprache nominale Kategorie: Genus Beat Siebenhaar Frank Liedtke Einleitung! Morphem als kleinste bedeutungstragende Einheit! als Lehre von den Morphemen! Agglutination! Flexion! Genus,
MehrTHEORETISCHE INFORMATIK
THEORETISCHE INFORMATIK Vorlesungsskript Jiří Adámek Institut für Theoretische Informatik Technische Universität Braunschweig Januar 2014 Inhaltsverzeichnis 1 Endliche Automaten 1 1.1 Mathematische Grundbegriffe.......................
MehrSEMANTISCHE INFORMATION [NPnominativ1, NPakkusativ2]
Lexikon und Morphologie Lexikon Vokabular, bzw. Zeichenvorrat...enthält die bedeutungstragenden Bausteine der Sprache, aus denen komplexe Strukturen mit komplexen Bedeutungen zusammengesetzt werden: Lexeme
MehrMorphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming
Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 24.11.2014, 9 c.t. Zangenfeind: Morphologie 1 / 18 Wdh.: Klassifizierung
MehrLösung für Lehrerinnen und Lehrer Grammatik-Lapbook Teil 1: Wortarten
Lösung für Lehrerinnen und Lehrer Grammatik-Lapbook Teil 1: Wortarten Es wird zunächst eine Grundform für das Lapbook erstellt. Dabei bietet es sich an, aus Tonkarton ein Buch zu falten (siehe auch Arbeitsblatt
MehrGrundlagen Theoretischer Informatik I SoSe 2011 in Trier. Henning Fernau Universität Trier fernau@uni-trier.de
Grundlagen Theoretischer Informatik I SoSe 2011 in Trier Henning Fernau Universität Trier fernau@uni-trier.de 1 Grundlagen Theoretischer Informatik I Gesamtübersicht Organisatorisches; Einführung Logik
Mehr3. Stilkontrolle. 4. Terminologiekontrolle
Heinz Dieter Maas Multilingualität in Mpro Im folgenden soll das System Mpro vorgestellt werden, an dem seit genau dem 20. Dezember 1992 im Institut für Angewandte Informationsforschung in Saarbrücken
MehrFachseminar WS 2008/09
Fachseminar WS 2008/09 Fachgebiet: Compilerbau Thema: Lexikalische Analyse (Scanner) Referent: Ali Sediq Betreuer: Prof. Dr. Helmut Weber 1 Inhaltsverzeichnis Lexikalische Analyse 1.0 Grundprobleme der
Mehr1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen. I.2. I.2. Grundlagen von von Programmiersprachen.
1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen I.2. I.2. Grundlagen von von Programmiersprachen. - 1 - 1. Der Begriff Informatik "Informatik" = Kunstwort aus Information und Mathematik
MehrMorphologie & Syntax
Morphologie & Syntax SS 2010 Wiederholungsklausur ame, Vorname Matrikelnummer 1. Morphologische Struktur (3 P.) Geben Sie die morphologische Struktur des Stamms Bundesausbildungsförderungsgesetz durch
MehrDeterministische Turing-Maschinen (DTM) F3 03/04 p.46/395
Deterministische Turing-Maschinen (DTM) F3 03/04 p.46/395 Turing-Machine Wir suchen ein Modell zur formalen Definition der Berechenbarkeit von Funktionen und deren Zeit- und Platzbedarf. Verschiedene Modelle
MehrBestellformular Messeaktion Rehab 2009
An Per Fax: 0228/97199-99 Bestellformular Messeaktion Rehab 2009 Phoenix Software GmbH, Adolf-Hombitzer-Straße 12, 53227 Bonn Tel.: 0228/97199-0; E-Mail: reha@phoenixsoftware.de Programme / Update Preis
MehrSprachen/Grammatiken eine Wiederholung
Sprachen/Grammatiken eine Wiederholung Was sind reguläre Sprachen? Eigenschaften regulärer Sprachen Sprachen Begriffe Symbol: unzerlegbare Grundzeichen Alphabet: endliche Menge von Symbolen Zeichenreihe:
MehrSegmentierung (Beispielanalyse)
Einführung in die Linguistik Butt / Eulitz / Wiemer Di. 12:15-13:45 Do.! 12:15-13:45 Fr.! 12:15-13:45 Infos etc. http://ling.uni-konstanz.de => Lehre Einführung in die Linguistik Segmentierung (Beispielanalyse)
MehrZ 50. Z O Z Int Z Komma Z Real Ziffer Komma Ziffer
10 Endliche Automaten 10.1 Einführungsbeispiele Beispiel 1: Warenautomat Ein Flasche Cola kostet 1,50. Münzen zu 1 und 50 ct werden angenommen. Cola und evtl. Restgeld werden ausgegeben. Auch der Rückgabeknopf
MehrEinführung Computerlinguistik. Konstituentensyntax II
Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 Schütze & Zangenfeind: Konstituentensyntax
MehrVorlesung Theoretische Informatik
Vorlesung Theoretische Informatik Automaten und Formale Sprachen Hochschule Reutlingen Fakultät für Informatik Masterstudiengang Wirtschaftsinformatik überarbeitet von F. Laux (Stand: 09.06.2010) Sommersemester
MehrGTI. Hannes Diener. 6. Juni - 13. Juni. ENC B-0123, diener@math.uni-siegen.de
GTI Hannes Diener ENC B-0123, diener@math.uni-siegen.de 6. Juni - 13. Juni 1 / 49 Die Turingmaschine war das erste (bzw. zweite) formale Modell der Berechenbarkeit. Sie wurden bereits 1936 (also lange
Mehr2. Lernen von Entscheidungsbäumen
2. Lernen von Entscheidungsbäumen Entscheidungsbäume 2. Lernen von Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch Attribut/Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse
MehrEndlicher Automat (EA)
Endlicher Automat (EA) siehe auch Formale Grundlagen 3 1 Motivation: Automaten für die Modellierung, Spezifikation und Verifikation verwenden! Definition Ein Endlicher Automat A = (S,I,Σ,T,F) besteht aus
Mehr4. Lernen von Entscheidungsbäumen. Klassifikation mit Entscheidungsbäumen. Entscheidungsbaum
4. Lernen von Entscheidungsbäumen Klassifikation mit Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch /Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse zugeordnet werden.
MehrSpezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen
Spezielle Themen der KI NLP Natural Language Processing Sprachverstehen NLP - Verarbeitungsstufen des Sprachverstehen 47 Phonologie und Phonetik Phonologie Lautlehre oder Sprachgebilde-Lautlehre untersucht
MehrGrafische Interaktionssysteme/ dynamische Visualisierung des endlichen Automaten
Sprachliche Informationsverarbeitung 29.01.2007 HS Intelligente Systeme Prof. Dr. J. Rolshoven (WS 06/07) Grafische Interaktionssysteme/ dynamische Visualisierung des endlichen Automaten Referentin: Melinda
MehrKonfiguration einer TM als String schreiben: Bandinschrift zwischen den Blank-Zeichen Links von der Kopfposition Zustand einfügen.
H MPKP Konfiguration einer TM als String schreiben: Bandinschrift zwischen den Blank-Zeichen Links von der Kopfposition Zustand einfügen. Beispiel: 1234q567 bedeutet: Kopf steht auf 5, Zustand ist q. Rechnung:
MehrZusammenfassung Grundzüge der Informatik 4
Zusammenfassung Grundzüge der Informatik 4 Sommersemester 04 Thorsten Wink 21. September 2004 Version 1.2 Dieses Dokument wurde in L A TEX 2εgeschrieben. Stand: 21. September 2004 Inhaltsverzeichnis 1
MehrWortartenbestimmung nach Peter Eisenberg
Seminar: Wortarten Dozent: Prof. Dr. Öhlschläger Referent: Erik Heinig Literatur: Wortartenbestimmung nach Peter Eisenberg Eisenberg, Peter: Das Wort, Grundriß der deutschen Grammatik. Metzler.2004 Eisenberg,
MehrMorphemunterstütztes Grundwortschatz- Segmentierungstraining (MORPHEUS)
Morphemunterstütztes Grundwortschatz- Segmentierungstraining (MORPHEUS) von R. Kargl & C. Purgstaller MORPHEUS Rechtschreibtraining 4. bis 8. Klassenstufe Einsatz im Förder- und Regelunterricht, Förderung
MehrAufgabentypen die in der Klausur vorkommen
Aufgabentypen die in der Klausur vorkommen können 1. Nennen Sie fünf wichtige Anwendungsgebiete der Computerlinguistik. 2. Für welches der drei Anwendungsgebiete Maschinelle Übersetzung, Rechtschreibkorrektur
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Syntax WS 2006/2007 Manfred Pinkal Einführung in die Computerlinguistik 2006/2007 M. Pinkal UdS 1 Morphologie und Syntax Gegenstand der Morphologie ist die Struktur
MehrRegeln zur Pluralbildung
Es gibt 8 verschiedene Pluralendungen im Deutschen: Pluralendung Beispiele (Singular -> Plural) -e r Tisch -> e Tische -"e (mit Umlaut) e Hand -> e Hände -(e)n e Tante -> e Tanten -er s Kind -> e Kinder
MehrEntscheidungsprobleme. Berechenbarkeit und Komplexität Entscheidbarkeit und Unentscheidbarkeit. Die Entscheidbarkeit von Problemen
Berechenbarkeit und Komlexität Entscheidbarkeit und Unentscheidbarkeit Wolfgang Schreiner Wolfgang.Schreiner@risc.uni-linz.ac.at Research Institute for Symbolic Comutation (RISC) Johannes Keler University,
MehrInformatik II Greedy-Algorithmen
7/7/06 lausthal Erinnerung: Dynamische Programmierung Informatik II reedy-algorithmen. Zachmann lausthal University, ermany zach@in.tu-clausthal.de Zusammenfassung der grundlegenden Idee: Optimale Sub-Struktur:
MehrFormale Sprachen und Grammatiken
Formale Sprachen und Grammatiken Jede Sprache besitzt die Aspekte Semantik (Bedeutung) und Syntax (formaler Aufbau). Die zulässige und korrekte Form der Wörter und Sätze einer Sprache wird durch die Syntax
MehrProblem: Finde für Alphabet mit n Zeichen einen Binärcode, der die Gesamtlänge eines Textes (über diesem Alphabet) minimiert.
Anwendungen von Bäumen 4.3.2 Huffman Code Problem: Finde für Alphabet mit n Zeichen einen Binärcode, der die Gesamtlänge eines Textes (über diesem Alphabet) minimiert. => nutzbar für Kompression Code fester
MehrÜbung 9. Quellcode Strukturieren Rekursive Datenstrukturen Uebung 9
Informatik I 2 Übung 9 Quellcode Strukturieren Rekursive Datenstrukturen Uebung 9 Quellcode Strukturieren Wenn alle Funktionen in einer Datei zusammengefasst sind wird es schnell unübersichtlich Mehrere
MehrMaschinelles Lernen Entscheidungsbäume
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Maschinelles Lernen Entscheidungsbäume Paul Prasse Entscheidungsbäume Eine von vielen Anwendungen: Kreditrisiken Kredit - Sicherheiten
Mehr6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)
6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden
MehrLösungen zum Aufgabenblatt 9 Symbolisches Programmieren
Lösungen zum Aufgabenblatt 9 Symbolisches Programmieren WS 2012/13 H.Leiß, CIS, Universität München Aufgabe 9.1 Wir beginnen mit der einfachen DCG-Grammatik: % --------------- Grammatik-1 ---------------------
MehrEinführung in die Java- Programmierung
Einführung in die Java- Programmierung Dr. Volker Riediger Tassilo Horn riediger horn@uni-koblenz.de WiSe 2012/13 1 Rückblick Schleifen while do-while for Methoden Verfahren: Intervallschachtelung 2 Wo
MehrSeminar Textmining SS 2015 Grundlagen des Maschinellen Lernens
Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 17.04.2015 Entscheidungsprobleme beim Textmining
MehrCodierung. Auszug aus dem Skript von Maciej Liśkiewicz und Henning Fernau
Codierung Auszug aus dem Skript von Maciej Liśkiewicz und Henning Fernau Ein bisschen Informationstheorie Betrachten wir das folgende Problem: Wie lautet eine sinnvolle Definition für das quantitative
MehrEinführung in die Sprachwissenschaft Jan Bruners
Einführung in die Sprachwissenschaft Jan Bruners Morphologie 2: Wortbildung Allgemein Im Gegensatz zur Flexion ([der] Wald, [des] Waldes, [die] Wälder) ist die Wortbildung ein prinzipiell unbeschränkter
MehrEinführung in die Morphologie
Avant Propos Einführung in die Morphologie Es war ihm unmöglich, die Wörter nicht in dem Besitz ihrer Bedeutungen zu stören. (Georg Christoph Lichtenberg, 1742-1799) Wörter und Lexeme Typeset by FoilTEX
MehrEinführung in die Theoretische Informatik
Einführung in die Theoretische Informatik Woche 10 Harald Zankl Institut für Informatik @ UIBK Wintersemester 2014/2015 Zusammenfassung Zusammenfassung der letzten LV Satz Sei G = (V, Σ, R, S) eine kontextfreie
MehrWMS Block: Management von Wissen in Dokumentenform PART: Text Mining. Myra Spiliopoulou
WMS Block: Management von Wissen in nform PART: Text Mining Myra Spiliopoulou WIE ERFASSEN UND VERWALTEN WIR EXPLIZITES WISSEN? 1. Wie strukturieren wir Wissen in nform? 2. Wie verwalten wir nsammlungen?
MehrGenerierung & Übersetzung mit XLE
Generierung & Übersetzung mit XLE Grammatikentwicklung, SS 2010 1 /25 Worum es heute geht: Generierung mit XLE Übersetzung mit XLE 2 /25 Allgemein: Generierung Generierung ist: der Gegenbegriff zum Parsing
MehrARBEITSBLATT ZU FORMALEN SPRACHEN
ARBEITSBLATT ZU FORMALEN SPRACHEN Aufgabe 1: Gegeben ist die folgende Formale Sprache L(G) mit G = (T, N, P, S). Die Produktionen lauten ZUWEISUNG ::= name zuweisungsoperator AUSDRUCK semikolon AUSDRUCK
MehrKompositionen von Baumreihen-Transformationen
Kompositionen von Baumreihen-Transformationen Andreas Maletti 1 Lehrstuhl: Grundlagen der Programmierung Institut für Theoretische Informatik Technische Universität Dresden 4. November 2005 1 Finanziell
MehrInformatik I WS 07/08 Tutorium 24
Info I Tutorium 24 Informatik I WS 07/08 Tutorium 24 20.12.07 Bastian Molkenthin E-Mail: infotut@sunshine2k.de Web: http://infotut.sunshine2k.de Rückblick Semi-Thue-Systeme Ein Semi-Thue-System besteht
MehrMusterlösung zur Vorlesung Modellbasierte Softwareentwicklung Wintersemester 2014/2015 Übungsblatt 9
Prof. Dr. Wilhelm Schäfer Paderborn, 15. Dezember 2014 Christian Brenner Tristan Wittgen Musterlösung zur Vorlesung Modellbasierte Softwareentwicklung Wintersemester 2014/2015 Übungsblatt 9 Aufgabe 1 Codegenerierung
MehrMorphologie. Grundlagen. Begriffsklärung. Morphologie ist die Lehre von den Formen. Sie ist Teilgebiet verschiedener Wissenschaftszweige, z.b.
Begriffsklärung Morphologie ist die Lehre von den Formen. Sie ist Teilgebiet verschiedener Wissenschaftszweige, z.b.: Morphologie 1. Biologie 2. Geologie 3. Sprachwissenschaft Der Begriff wurde von Johann
MehrVerbesserung der Modellprüfung mittels Blackbox-Testen
Martin Luther Universität Halle Wittenberg Institut für Informatik Lehrstuhl für Softwaretechnik und Programmiersprachen Verbesserung der Modellprüfung mittels Blackbox-Testen Verifikation von Komponentensystemen
MehrCGI Programmierung mit Ha. Markus Schwarz
CGI Programmierung mit Ha Markus Schwarz Überblick Was ist funktionale Programmierung Einführung in Haskell CGI-Programmierung mit Haskell Ein etwas größeres Beispiel Was ist funktionale Programm Ein Programm
MehrDatenbankanwendung. Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern. Wintersemester 2014/15. smichel@cs.uni-kl.de
Datenbankanwendung Wintersemester 2014/15 Prof. Dr.-Ing. Sebastian Michel TU Kaiserslautern smichel@cs.uni-kl.de Wiederholung: Anfragegraph Anfragen dieses Typs können als Graph dargestellt werden: Der
MehrDie Betonung der Wörter
Die Betonung der Wörter I. Anmerkungen zur Notation Der Vokal der betonten Silbe wird markiert. EH]HLFKQHWHLQHQkurzen Vokal, einen langen Vokal. Bei Diphtongen (au, äu, eu, ei) spielt die Unterscheidung
MehrAlgorithmische Bioinformatik
Algorithmische Bioinformatik Hidden-Markov-Modelle Viterbi - Algorithmus Ulf Leser Wissensmanagement in der Bioinformatik Inhalt der Vorlesung Hidden Markov Modelle Baum, L. E. and Petrie, T. (1966). "Statistical
MehrAlignment-Verfahren zum Vergleich biologischer Sequenzen
zum Vergleich biologischer Sequenzen Hans-Joachim Böckenhauer Dennis Komm Volkshochschule Zürich. April Ein biologisches Problem Fragestellung Finde eine Methode zum Vergleich von DNA-Molekülen oder Proteinen
MehrKapitel 4: Dynamische Datenstrukturen. Algorithmen und Datenstrukturen WS 2012/13. Prof. Dr. Sándor Fekete
Kapitel 4: Dynamische Datenstrukturen Algorithmen und Datenstrukturen WS 2012/13 Prof. Dr. Sándor Fekete 4.4 Binäre Suche Aufgabenstellung: Rate eine Zahl zwischen 100 und 114! Algorithmus 4.1 INPUT: OUTPUT:
MehrDas erste Programm soll einen Text zum Bildschirm schicken. Es kann mit jedem beliebigen Texteditor erstellt werden.
Einfache Ein- und Ausgabe mit Java 1. Hallo-Welt! Das erste Programm soll einen Text zum Bildschirm schicken. Es kann mit jedem beliebigen Texteditor erstellt werden. /** Die Klasse hello sendet einen
MehrApproximationsalgorithmen
Ausarbeitung zum Thema Approximationsalgorithmen im Rahmen des Fachseminars 24. Juli 2009 Robert Bahmann robert.bahmann@gmail.com FH Wiesbaden Erstellt von: Robert Bahmann Zuletzt berarbeitet von: Robert
MehrEinführung in die englische Sprachgeschichte
MANFRED GORLACH Einführung in die englische Sprachgeschichte 5., völlig überarbeitete Auflage Universitätsverlag C.WINTER Heidelberg Inhaltsverzeichnis Abbildungsverzeichnis Vorwort Abkürzungen xi xiii
MehrEnglisch-deutsch-polnisches Wörterbuch. Benutzeranleitung
Der EGP230D wird mit zwei CR2032 Batterien und einer CR1220 Reservebatterie betrieben. Um einen Datenverlust zu vermeiden, tauschen Sie die Batterien so schnell wie möglich aus. Dabei dürfen die alten
MehrTextanalyse 10b. (Vorlagen von Pierre Nugues und von verschiedenen Websites). G. Görz, J. Schneeberger Lehrstuhl Informatik 8 (KI)
Textanalyse 10b (Vorlagen von Pierre Nugues und von verschiedenen Websites). G. Görz, J. Schneeberger Lehrstuhl Informatik 8 (KI) goerz@informatik.uni-erlangen.de! G. Görz, FAU, Informatik 8 1 Literaturhinweis
MehrAutomatentheorie Berechnungsmodell für logische Sprachen
Automatentheorie Berechnungsmodell für logische Sprachen Thorsten Haupt Betreuer: Tim Priesnitz -Proseminar Theorie kommunizierender Systeme SS 24- Prof. Gert Smolka, PS-Lab, Universität des Saarlandes
MehrMorphologie. Was ist Morphologie? Was ist Morphologie?
Was ist Morphologie? Morphologie ist die Lehre von den Formen. Sie ist in vielen Wissenschaftszweigen ein Teilgebiet, z.b.: Morphologie Was ist Morphologie? Man soll öfter das untersuchen, was von den
Mehr3. Turingmaschinen FORMALISIERUNG VON ALGORITHMEN. Turingmaschinen Registermaschinen Rekursive Funktionen UNTERSCHEIDUNGSMERKMALE DER ANSÄTZE:
FORMALISIERUNG VON ALGORITHMEN Wegen der beobachteten Zusammenhänge zwischen Berechnungs-, Entscheidungs- und Aufzählungsverfahren genügt es Berechnungsverfahren zu formalisieren. Weiter genügt es Verfahren
MehrPart-Of-Speech-Tagging mit Viterbi Algorithmus
Part-Of-Speech-Tagging mit Viterbi Algorithmus HS Endliche Automaten Inna Nickel, Julia Konstantinova 19.07.2010 1 / 21 Gliederung 1 Motivation 2 Theoretische Grundlagen Hidden Markov Model Viterbi Algorithmus
MehrAutomaten und Formale Sprachen alias Theoretische Informatik. Sommersemester 2013
Automaten und Formale Sprachen alias Theoretische Informatik Sommersemester 2013 Dr. Sander Bruggink Übungsleitung: Jan Stückrath Sander Bruggink Automaten und Formale Sprachen 1 Deterministische Kellerautomaten
MehrAdjektiv und Adjektivgruppe
Sprachbeschreibung 1 11 Adjektiv & Adjektivgruppe Uwe Helm Petersen Adjektiv und Adjektivgruppe 1 Eigenschaften des prototypischen Adjektivs Prototypische Adjektive haben folgende Eigenschaften: (i) Semantisch
MehrFormale Sprachen, reguläre und kontextfreie Grammatiken
Formale Sprachen, reguläre und kontextfreie Grammatiken Alphabet A: endliche Menge von Zeichen Wort über A: endliche Folge von Zeichen aus A A : volle Sprache über A: Menge der A-Worte formale Sprache
Mehr2. Vorlesung. Slide 40
2. Vorlesung Slide 40 Knobelaufgabe Was tut dieses Programm? Informell Formal Wie stellt man dies sicher? knobel(a,b) { Wenn a = 0 dann return b sonst { solange b 0 wenn a > b dann { a := a - b sonst b
MehrLiteratur. Dominating Set (DS) Dominating Sets in Sensornetzen. Problem Minimum Dominating Set (MDS)
Dominating Set 59 Literatur Dominating Set Grundlagen 60 Dominating Set (DS) M. V. Marathe, H. Breu, H.B. Hunt III, S. S. Ravi, and D. J. Rosenkrantz: Simple Heuristics for Unit Disk Graphs. Networks 25,
MehrÜbersetzen Spanisch Deutsch
Holger Siever Übersetzen Spanisch Deutsch Ein Arbeitsbuch 3. Auflage Grammatikalische Bezeichnungen 19 1.4 Grammatikalische Bezeichnungen Die meisten, die Übersetzen studieren, werden Fachübersetzer. Von
MehrTheoretische Informatik 2 (WS 2006/07) Automatentheorie und Formale Sprachen / Kontextfreie Sprachen und Kellerautomaten
Inhalt 1 Einführung 2 Automatentheorie und Formale Sprachen Grammatiken Reguläre Sprachen und endliche Automaten Kontextfreie Sprachen und Kellerautomaten Kontextsensitive und Typ 0-Sprachen 3 Berechenbarkeitstheorie
MehrII. Grundlagen der Programmierung. 9. Datenstrukturen. Daten zusammenfassen. In Java (Forts.): In Java:
Technische Informatik für Ingenieure (TIfI) WS 2005/2006, Vorlesung 9 II. Grundlagen der Programmierung Ekkart Kindler Funktionen und Prozeduren Datenstrukturen 9. Datenstrukturen Daten zusammenfassen
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Syntax II WS 2008/2009 Manfred Pinkal Morphologie und Syntax Gegenstand der Morphologie ist die Struktur des Wortes: der Aufbau von Wörtern aus Morphemen, den kleinsten
MehrDuden Schülerhilfen. Englisch 5. Klasse Übungen zu Wortschatz und Wortlehre. Dudenverlag Mannheim Leipzig Wien Zürich
Duden Schülerhilfen Englisch 5. Klasse Übungen zu Wortschatz und Wortlehre von Alois Mayer mit Illustrationen von Detlef Surrey 2., aktualisierte Auflage Dudenverlag Mannheim Leipzig Wien Zürich Inhalt
MehrInformatik 11 Kapitel 2 - Rekursive Datenstrukturen
Fachschaft Informatik Informatik 11 Kapitel 2 - Rekursive Datenstrukturen Michael Steinhuber König-Karlmann-Gymnasium Altötting 15. Januar 2016 Folie 1/77 Inhaltsverzeichnis I 1 Datenstruktur Schlange
MehrKapitel 2. Lexikalische Analyse. Lexikalische Analyse Wintersemester 2008/09 1 / 39
Kapitel 2 Lexikalische Analyse Lexikalische Analyse Wintersemester 2008/09 1 / 39 1 Eingliederung in den Übersetzer / Zielvorgaben 2 Theoretische Grundlage: Endliche Automaten 3 Implementierung Implementierung
MehrNeuronale Netze mit mehreren Schichten
Neuronale Netze mit mehreren Schichten Lehrstuhl für Künstliche Intelligenz Institut für Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg (Lehrstuhl Informatik 8) Neuronale Netze mit mehreren
MehrDynamische Optimierung. Kapitel 4. Dynamische Optimierung. Peter Becker (H-BRS) Operations Research II Wintersemester 2014/15 160 / 206
Kapitel 4 Dynamische Optimierung Peter Becker (H-BRS) Operations Research II Wintersemester 2014/15 160 / 206 Inhalt Inhalt 4 Dynamische Optimierung Allgemeiner Ansatz und Beispiele Stochastische dynamische
MehrPraktikum zu Einführung in die Informatik für LogWiIngs und WiMas Wintersemester 2015/16. Vorbereitende Aufgaben
Praktikum zu Einführung in die Informatik für LogWiIngs und WiMas Wintersemester 2015/16 Fakultät für Informatik Lehrstuhl 14 Lars Hildebrand, Marcel Preuß, Iman Kamehkhosh, Marc Bury, Diana Howey Übungsblatt
MehrErstspracherwerb. Sprachentwicklung: Wortschatz
Erstspracherwerb Sprachentwicklung: Wortschatz Gliederung: 1. Welche 3 Phasen der lexikalischen Entwicklung werden bei Kindern unterschieden? 2. Welche sprachlichen Inhalte lernt das Kind 3. Wie verläuft
MehrEinführung. Heute. Parsing. Parser - Arten Parsing - Arten grob klassifiziert Interessante Parser Arten detailierter.
Heute Parsing Methoden der Sprachverarbeitung Hauke Traulsen Parser - Arten Parsing - Arten grob klassifiziert Interessante Parser Arten detailierter Einführung Grammatik Parser I Bedeutung Parsing Zuweisung
MehrMorphologische Komplexität in germanischen Sprachen am Beispiel der Pluralbildung
Morphologische Komplexität in germanischen Sprachen am Beispiel der Pluralbildung Gastvortrag Universität Wuppertal 28. November 2012 Sebastian Kürschner sebastian.kuerschner@fau.de Komplexität - ein Jokerbegriff?
Mehr22. Algorithmus der Woche Partnerschaftsvermittlung Drum prüfe, wer sich ewig bindet
22. Algorithmus der Woche Partnerschaftsvermittlung Drum prüfe, wer sich ewig bindet Autor Volker Claus, Universität Stuttgart Volker Diekert, Universität Stuttgart Holger Petersen, Universität Stuttgart
MehrEs sollen 2 verschiedene Reparaturmechanismen angewendet werden: *XB soll durch Änderung von X repariert werden
Modul 046-2012 (Morphologie: Wortbildung) Kolloquium: Opazität 10. Juli 2012 Gereon Müller & Jochen Trommer Die partiell vorangestellte Ordnung in 3-Verbclustern: Eine Instanz von Counter-Bleeding in der
MehrSprachenvielfalt im Klassenzimmer: Deutsch und andere Sprachen im Vergleich. Dr.(Rus) Hahn
Sprachenvielfalt im Klassenzimmer: Deutsch und andere Sprachen im Vergleich Dr.(Rus) Hahn Kontrastive Linguistik Vergleich eines oder mehrerer bestimmter Aspekte in zwei Sprachen bzw. innerhalb einer reduzierten
MehrBäume. Informatik B - Objektorientierte Programmierung in Java. Vorlesung 10: Collections 4. Inhalt. Bäume. Einführung. Bäume.
Universität Osnabrück 1 Bäume 3 - Objektorientierte Programmierung in Java Vorlesung 10: Collections 4 Einführung Bäume sind verallgemeinerte Listenstrukturen Lineare Liste Jedes Element hat höchstens
MehrProgrammierkurs Java
Programmierkurs Java Dr. Dietrich Boles Aufgaben zu UE16-Rekursion (Stand 09.12.2011) Aufgabe 1: Implementieren Sie in Java ein Programm, das solange einzelne Zeichen vom Terminal einliest, bis ein #-Zeichen
MehrVolltextsuche und Text Mining
1 Volltextsuche und Text Mining Datum: 22.12.2009 Seminar: Einführung in die Computerlinguistik Referenten: Cornelia Baldauf, Valentin Heinz, Adriana Kosior 2 Agenda 1. Einführung a) Volltextsuche b) Text
MehrZug Bart Borg Bart Borg Bart Borg Bart. Bart 2 1 1 1 Borg 1 1 2 verloren. Stand 8 7 6 5 4 2 1. Zug Bart Borg Bart Borg Bart Borg
. Das. Einführung Deep Blue Kasparow, Philadelphia 996 Deep Blue, der Supercomputer schlägt Garry Kasparow. So oder ähnlich lauteten die Schlagzeilen 996. Die 6 Partien waren insgesamt ausgeglichen, zum
MehrParsing-EinfŸhrung Ð 1
Parsing-EinfŸhrung bersicht Falsifizierbarkeit, oder: Sind Grammatiken wissenschaftlich? Grammatik, Formalismus Kontextfreie Grammatiken Ableitungen Ziel Verstehen der linguistischen Motivation Intuitives
MehrMaschinelles Lernen: Neuronale Netze. Ideen der Informatik Kurt Mehlhorn
Maschinelles Lernen: Neuronale Netze Ideen der Informatik Kurt Mehlhorn 16. Januar 2014 Übersicht Stand der Kunst im Bilderverstehen: Klassifizieren und Suchen Was ist ein Bild in Rohform? Biologische
Mehr1 Vom Problem zum Programm
1 Vom Problem zum Programm Ein Problem besteht darin, aus einer gegebenen Menge von Informationen eine weitere (bisher unbekannte) Information zu bestimmen. 1 Vom Problem zum Programm Ein Algorithmus ist
Mehr2: Zahlentheorie / Restklassen 2.1: Modulare Arithmetik
Stefan Lucks Diskrete Strukturen (WS 2009/10) 57 2: Zahlentheorie / Restklassen 2.1: Modulare Arithmetik Uhr: Stunden mod 24, Minuten mod 60, Sekunden mod 60,... Rechnerarithmetik: mod 2 w, w {8, 16, 32,
MehrWissensbasierte Systeme
WBS4 Slide 1 Wissensbasierte Systeme Vorlesung 4 vom 03.11.2004 Sebastian Iwanowski FH Wedel WBS4 Slide 2 Wissensbasierte Systeme 1. Motivation 2. Prinzipien und Anwendungen 3. Logische Grundlagen 4. Suchstrategien
Mehr