Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW Subject: MTZH
|
|
- Jasmin Edith Baumgartner
- vor 6 Jahren
- Abrufe
Transkript
1 Ausgewählte Techniken der Maschinellen Übersetzung Susanne J. Jekat ZHW Subject: MTZH
2 Übersicht Themenbereiche: 1. Erstellung und Standardisierung von Ressourcen für die Maschinelle Übersetzung 2. Grammatikformalismen für die Maschinelle Übersetzung 3. Maschinelles Dolmetschen 4. Computergestützte Übersetzung 5. Evaluation von Systemen zur Maschinellen Übersetzung 2
3 Thema 2: Grammatikformalismen für die Maschinelle Übersetzung Übersicht Thema 2: 1. Einführung 2. Head Driven Phrase Structure Grammar 3. Lexical Functional Grammar 3
4 Thema 2: Grammatikformalismen für die Maschinelle Übersetzung Wissensgebiete zu Thema 2: a) Syntax und Morphologie b) Merkmalsstrukturen c) Kontrastive Linguistik d) MT (Grundlagen) e) Translationswissenschaft? (eher Probleme der Translation) 4
5 Offene Fragen Ist die traditionelle Grammatik präskriptiv? vgl. Bussmann (2002:708)..woraus ihr auf normative Tradierung ausgerichtetes Bestreben resultiert, vgl. entsprechende Sprachurteile wie richtig, falsch [...]. 5
6 Unifikationsgrammatiken um 1980 entstandene Grammatiktypen, in denen Merkmalsstrukturen eine zentrale Rolle spielen Wichtigste Vertreter: GPSG, Generalized Phrase Structure Grammar, Gazdar et al HPSG, Head Driven Phrase Structure Grammar (zu grossen Teilen auf Elementen der GPSG basierend), Pollard & Sag 1994 LFG, Lexical Functional Grammar, Bresnan 1982 PATRII, Parsing and Translation, Shieber 1986, (hier nicht behandelt, in Bezug auf die Anzahl und Komplexität der zugrundeliegenden linguistischen Annahmen einfacher, tool formalisms vs. theory formalisms) 6
7 Merkmalsstrukturen Modellierung komplexer Kategorien durch eine Menge von Merkmalsspezifikationen (Paare grammatischer Merkmale und zugehöriger Werte) MERKMAL 1 WERT 1 S = MERKMAL 2 WERT 2 7
8 Merkmalsstrukturen bellt Beschreibung: Verb (atomare Kategorie) oder Aufspaltung in komplexe Kategorien S 3sg = KAT NUM PERS 3 VERB SG 8
9 Merkmale können einen atomaren (nicht weiter aufteilbaren) Wert, z.b. VERB, oder einen komplexen Wert, z.b. KGR (Kongruenz; das Merkmal enthält als Wert wieder eine vollständige Merkmalsstruktur) haben 9
10 Unterspezifikation In einer Merkmalsstruktur können Merkmale, deren Werte noch nicht bekannt sind, unspezifiziert belassen werden z.b. das Wort Kollegen isoliert betrachtet: keine Information über Kasus und Numerus Spezifikation nach Auswertung weiterer Information (Kontext) 10
11 Unterspezifikation Möglichkeit zur Beschreibung von Mengen von Objekten (Verallgemeinerung oder Spezifikation) z.b. Menge der Verben im Singular ist eine Teilmenge aller Verben 11
12 Koreferenz Hund, der, bellt zwei Merkmale besitzen denselben Wert, dargestellt durch nummerierte Kästchen der Wert wird nicht von einem Merkmal zum anderen kopiert, sondern die Merkmale teilen sich denselben Wert 12
13 Koreferenz Durch die Koreferenz wird erzwungen, dass Werte der KGR bei Subjekt und Prädikat identisch sind. 13
14 Koreferenz im Graphen Merkmalsstrukturen können als gerichtete Graphen dargestellt werden.! Koreferenz: Zwischen Merkmalsstrukturen mit korefenten Werten und solchen mit zufällig gleichen Werten muss unterschieden werden. 14
15 Subsumption Eine Merkmalsstruktur S 1 subsumiert eine Merkmalsstruktur S 2, wenn in S 2 mindestens die Information aus S 1 enthalten ist (die allgemeinere Merkmalsstruktur subsumiert die spezifischere)! Greift nicht für unterschiedliche aber kombinierbare Informationen 15
16 Unifikation Vereinigung der Information aus zwei Merkmalstrukturen in einer 16
17 Unifikation kann nur in eine Richtung verlaufen (monotone Operation): durch Unifikation kann Information nur hinzugefügt werden Reihenfolge der Merkmalsstrukturen, die unifiziert werden, spielt keine Rolle Lücken in partiellen Beschreibungen werden im Verlauf der Unifikation gefüllt 17
18 Generalized Phrase Structure Grammar Generative Grammatiktheorie aus der Familie der Unifikationsgrammatiken Grammatikmodell ohne Transformationen und mit einer einzigen Repräsentationsebene Die syntaktische Repräsentation erfolgt in Form eines Phrasenstrukturbaumes, syntaktische Kategorien in Form partiell spezifizierter Merkmalsstrukturen die Merkmalsstruktur einer syntaktischen Kategorie muss bestimmten Regeln folgen: Feature Coocurrence Restrictions (Kombinationsbeschränkungen) Feature Specification Defaults (Standardspezifikationen) 18
19 Phrasenstrukturregeln (vgl. Folie 29 in Grammatikform1.pdf, Ersetzungsregeln der Form S NP + VP) beschreiben zwei Relationen: a) Unmittelbare Dominanz (immediate dominance): die Mutterkategorie S dominiert unmittelbar die Tochterkategorien NP, VP b) Lineare Präzedenz (linear precedence): besteht zwischen den Tochter-Kategorien NP und VP, Permutation ist ausgeschlossen, d.h.! NP + VP VP + NP ist verboten (jeder Phrasenstrukturregel muss eine Abzweigung im Strukturbaum entsprechen) 19
20 Immediate Dominance (ID) ID-Regeln in GPSG-Grammatiken sind ähnlich den traditionellen kontextfreien Phrasenstrukturregeln, aber die Elemente der rechten Seite sind nicht geordnet (Notation durch Komma): NP DET, N NP N, DET ist identisch mit 20
21 Linear Precedence (LP)-Statements Ein LP-Statement, das festlegt, dass im Deutschen Nomina den Determinierern nachfolgen, hätte die Form: 21
22 ID & LP Im Gegensatz zur herkömmlichen Phrasenstrukturgrammatik werden Unmittelbare Dominanz und Lineare Präzedenz in GPSG- Grammatiken durch verschiedene Regeltypen beschrieben dieses sogenannte ID/LP-Format bildet die Basis der GPSG-Grammatiken der Geltungsbereich der LP-Statements umfasst die gesamte ID-Regelmenge, hier also alle weiteren ID-Regeln, in denen DET und N vorkommen 22
23 Head-Driven Phrase Structure Grammar (HPSG) typisierte Merkmalsstrukturen stark lexikalisiert, d.h. Lexikon enthält einen grossen Teil der syntaktischen Information head feature principle 23
24 Typisierte Merkmalsstrukturen Aufgrund gemeinsamer Merkmale können linguistische Objekte in Kategorien eingeteilt werden, diese Einteilung wird durch Typen abgebildet. Die Angemessenheitsfunktion app (appropriateness) legt fest, welche Merkmale einem Typen zukommen und welche Werte diese Merkmale annehmen dürfen 24
25 Typisierte Merkmalsstrukturen Beispiel: Typ kongruenz Strukturen dieses Typs sollen die Merkmale NUM, GEN und KAS besitzen, die die angegebenen Werte und sonst keine annehmen können app(kongruenz, NUM) = {SG, PL} app(kongruenz, GEN) = {MASK, FEM, NEUT} app(kongruenz, KAS) = {NOM; GEN, DAT; AKK} 25
26 Typisierte Merkmalstrukturen Jeder innere Knoten entspricht einem komplexen Typen, jeder Endknoten einem atomaren Typen. 26
27 Typisierte Merkmalstrukturen eine Merkmalsstruktur darf weniger Merkmale haben, als ihr Typ verlangt (Unterspezifikation) durch die Festlegung des Typen ist erkennbar, ob Unterspezifikation vorliegt (d.h. durch Unifikation können noch fehlende Merkmale hinzukommen) 27
28 Lexikalisierte Grammatik hohe Komplexität und Redundanz daher: Anordung der Typen in einer Vererbungshierarchie (Subsumtionshierarchie aus Typen) Subtypen erben die Merkmale ihrer Supertypen z.b. bei dekliniert (s. Folie 29) besitzt KGR als Werte die Merkmale KAS, GEN und NUM, der Typ Pronomen erbt diese drei Merkmale (und fügt noch ein Merkmal PERS hinzu) 28
29 Typhierarchie 29
30 Head Feature Principle Hauptkategorien: Verb (V), Nomen (N), Adjektiv (A) und Präposition (P), alle anderen sind Nebenkategorien. Die Hauptkategorien bilden den lexikalischen Kopf einer Phrase. [+ V] [- V] [+ N] [-N] A V N P 30
31 Head Feature Principle Köpfe sind obligatorischer Bestandteil einer Phrase die relevanten Merkmale einer Phrase werden vom Kopf determiniert z.b. ist der Kopf einer Verbalphrase das Verb, Merkmale wie Numerus und Person werden vom Verb definiert. 31
32 Head Feature Principle Der Hund bellt. Der Lexikoneintrag des Wortes bellt stellt die Kopfinformation bereit, dass es sich um ein Verb im Präsens handelt. der Wert des HEAD-Attributs ist damit vom Typ verb und könnte z.b. das Attribut TEMP mit Wert pres enthalten. 32
33 Head Feature Principle 33
34 Legende PHON: Informationen über die phonologische Struktur des durch die Merkmalsstruktur beschriebenen sprachlichen Ausdrucks SYNSEM: syntaktische und semantische Eigenschaften LOCAL: Kontext CAT: Kategorie, syntaktische Information HEAD: Kopf DTRS: Daughters, Struktur der Teilkonstituenten HEAD-DTRS: Struktur der Kopfkonstituente COMP-DTRS: Struktur der Komplemente 34
35 Quellen Bresnan, J., ed, (1982) The Mental Representation of Grammatical Relations, Cambridge, MA:MIT Press. Bussmann, Hadumod (2002) Lexikon der Spradchwissenschaft. Stuttgart:Kröner. Gazdar, G., Klein, E., Pullum, G. & Sag, I. (1985) Generalized Phrase Structure Grammar, Oxford:Blackwell.. Klabunde, Ralf et al., ed, (2004) Computerlinguistik und Sprachtechnologie. Eine Eine Einführung. Heidelberg:Spektrum, hier insbesondere Kolb, Peter, Graphentheorie und Merkmalsstrukturen, pp Pollard, Carl & Sag, Ivan (1994) Head-Driven Phrase Structure Grammar, Chicago: University of Chicago Press. Shieber, Stuart (1986) An Introduction to Unification-Based Approaches to Grammar, Standford, CA:CSLI Lecture Notes. 35
Formale Methoden III - Tutorium
Formale Methoden III - Tutorium Daniel Jettka 19.06.06 Inhaltsverzeichnis 1. Logische Eigenschaften von Merkmalsstrukturen 1. Logische Eigenschaften von MS Ausgangspunkt: Unterscheidung von: Linguistische
MehrDie Idee... Analyse geschriebener Texte. Gliederung. Analyse-Ebenen von Sprache. Lexikalische Ebene. Morphologische Ebene
Die Idee... Analyse geschriebener Texte Joachim Pfister Hans Kenn! Eine Sprache hat unendliche viele Möglichkeiten, Sätze zu bilden und Wörter anzuordnen.! Nur: Welche davon werden als grammatikalisch
MehrEinführung Computerlinguistik. Konstituentensyntax II
Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 Schütze & Zangenfeind: Konstituentensyntax
MehrLösungen zum Aufgabenblatt 9 Symbolisches Programmieren
Lösungen zum Aufgabenblatt 9 Symbolisches Programmieren WS 2012/13 H.Leiß, CIS, Universität München Aufgabe 9.1 Wir beginnen mit der einfachen DCG-Grammatik: % --------------- Grammatik-1 ---------------------
MehrGliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute
Das TIGER-Korpus: Annotation und Exploration Stefanie Dipper Forschungskolloquium Korpuslinguistik, 11.11.03 Gliederung 1. TIGER-Korpus 2. Annotation 3. Visualisierung 4. Suche, Retrieval 5. Demo 6. Repräsentation
MehrDeutsche Syntax deklarativ
Deutsche Syntax deklarativ Head-Driven Phrase Structure Grammar für das Deutsche Stefan Müller 1999 c Stefan Müller überarbeitete Ausgabe vom 2. Februar 1999 DFKI GmbH Fachbereich Sprachtechnologie Stuhlsatzenhausweg
MehrJan Strunk 15.04.2008
Grundkurs Syntax Einführung Jan Strunk 15.04.2008 Formalia Für den Kurs besteht Anwesenheitspflicht Die Abwesenheit ist schriftlich (per Email) zu begründen. Als entschuldigte Abwesenheiten gelten nur
MehrPractical Grammar Engineering Using HPSG. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel
Practical Grammar Engineering Using HPSG Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Inhalt Organisatorisches HPSG Grammatiken Werkzeuge Kodierungen TDL Syntax Über dieses Seminar
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Syntax II WS 2012/2013 Manfred Pinkal Eigenschaften der syntaktischen Struktur [1] Er hat die Übungen gemacht. Der Student hat die Übungen gemacht. Der interessierte
MehrZiele und Herausforderungen
Ziele und Herausforderungen Text soll automatisch aus einer Quellsprache in eine Zielsprache übertragen werden Dabei soll die Funktion des Textes erhalten bleiben Es werden sowohl computerlinguistische
MehrSpezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen
Spezielle Themen der KI NLP Natural Language Processing Sprachverstehen NLP - Verarbeitungsstufen des Sprachverstehen 47 Phonologie und Phonetik Phonologie Lautlehre oder Sprachgebilde-Lautlehre untersucht
MehrI. LINGUISTISCHE GRUNDBEZIEHUNGEN
I. LINGUISTISCHE GRUNDBEZIEHUNGEN 1. die zwei Seiten eines sprachlichen Zeichens - Inhalt vs. Ausdruck 2. paradigmatische vs. syntagmatische Beziehungen zwischen sprachlichen Zeichen 3. Konstituenzbeziehungen
MehrLinguistik für Kognitionswissenschaften
Linguistik für Kognitionswissenschaften Computerlinguistik: Maschinelle Übersetzung Computerlinguistik Fehlübersetzung von engl. computational linguistics - computationelle Linguistik beinhaltet im weiteren
MehrAttribute und Werte im Düsseldorfer Frame-Modell
Attribute und Werte im Düsseldorfer Frame-Modell Wiebke Petersen Heinrich-Heine-Universität Düsseldorf SFB 991: The Structure of Representations in Language, Cognition, and Science www.phil-fak.uni-duesseldorf.de/~petersen/
MehrParsing-EinfŸhrung Ð 1
Parsing-EinfŸhrung bersicht Falsifizierbarkeit, oder: Sind Grammatiken wissenschaftlich? Grammatik, Formalismus Kontextfreie Grammatiken Ableitungen Ziel Verstehen der linguistischen Motivation Intuitives
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Syntax II WS 2008/2009 Manfred Pinkal Morphologie und Syntax Gegenstand der Morphologie ist die Struktur des Wortes: der Aufbau von Wörtern aus Morphemen, den kleinsten
MehrVorlesung Theoretische Informatik
Vorlesung Theoretische Informatik Automaten und Formale Sprachen Hochschule Reutlingen Fakultät für Informatik Masterstudiengang Wirtschaftsinformatik überarbeitet von F. Laux (Stand: 09.06.2010) Sommersemester
MehrEin PATR-II - basierter Chartparser zur Analyse von Idiomen
Ein PATR-II - basierter Chartparser zur Analyse von Idiomen Diplomarbeit im Fach Informatik vorgelegt von Ulrike Ranger geb. 11.04.1979 in Erlangen angefertigt am Institut für Informatik Lehrstuhl für
Mehr7. Formale Sprachen und Grammatiken
7. Formale Sprachen und Grammatiken Computer verwenden zur Verarbeitung von Daten und Informationen künstliche, formale Sprachen (Maschinenspr., Assemblerspachen, Programmierspr., Datenbankspr., Wissensrepräsentationsspr.,...)
MehrEinführung in die Computerlinguistik Statistische Grundlagen
Statistik 1 Sommer 2015 Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Sommersemester 2015 Statistik 2 Sommer 2015 Überblick 1. Diskrete Wahrscheinlichkeitsräume
Mehr5. Maschinelle Verarbeitung natürlicher Sprache (Computerlinguistik) (1)
5. Maschinelle Verarbeitung natürlicher Sprache (Computerlinguistik) (1) 5.1 Vorbemerkungen Wissen, das als Ergebnis menschlichen Denkens vorliegt, wird durch Sprache mitgeteilt. Unterscheidung von Sprachen:
MehrAdjektiv und Adjektivgruppe
Sprachbeschreibung 1 11 Adjektiv & Adjektivgruppe Uwe Helm Petersen Adjektiv und Adjektivgruppe 1 Eigenschaften des prototypischen Adjektivs Prototypische Adjektive haben folgende Eigenschaften: (i) Semantisch
Mehr1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen. I.2. I.2. Grundlagen von von Programmiersprachen.
1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen I.2. I.2. Grundlagen von von Programmiersprachen. - 1 - 1. Der Begriff Informatik "Informatik" = Kunstwort aus Information und Mathematik
MehrWS 2009/10 18.11.2009
Übung 5 Vorbereitung Öffnen Sie einen Texteditor, z.b. Word, Emacs, Textedit etc. und legen Sie Ihre Antwortdatei an. Der Name der Antwortdatei sollte nach folgendem Schema aufgebaut sein: KL_ueb5_
MehrVI Morphologische Exponens
Fortmann, Proseminar Morphologie / Universität Konstanz Wintersemester 2006/07 VI Morphologische Exponens Die Bedeutung, welche durch ein Morphem einer Lautform assoziiert wird, ist nach Gehalt und Umfang
MehrCompiler. Kapitel. Syntaktische Analyse. Kapitel 4. Folie: 1. Syntaktische Analyse. Autor: Aho et al.
Folie: 1 Kapitel 4 Übersicht Übersicht Syntax: Definition 4 syn-tax: the way in which words are put together to form phrases, clauses, or sentences. Webster's Dictionary Die Syntax (griechisch σύνταξις
MehrLOKALE UND DIREKTIONALE PPS
DGA Themen der Deutschen Syntax Universität Athen, WS 2014-15 Winfried Lechner Handout #4 LOKALE UND DIREKTIONALE PPS Elena Vlachou (Cand. phil, Universität Athen) 1. DIE KATEGORIE P Präpositionen bilden
MehrVorlaugeGuidelinesfurdasTaggingdeutscherTextcorpora AnneSchiller,SimoneTeufel,ChristineStockert mitstts InstitutfurmaschinelleSprachverarbeitung UniversitatStuttgart SeminarfurSprachwissenschaft UniversitatTubingen
MehrTheorien und Modelle I WS 2006/07 Prinzipien- und Parametermodell 1
Theorien und Modelle I WS 2006/07 Prinzipien- und Parametermodell 1 Prinzipien- und Parametermodell Für die Generative Grammatik findet sich oft die Bezeichnung Prinzipien- und Parametermodell. Die Bezeichnung
MehrImplementierung einer Lateingrammatik im Grammatical Framework
Implementierung einer Lateingrammatik im Grammatical Framework Kolloquium Computerlinguistisches Arbeiten SS 2013 Herbert Lange 10. Juni 2013 1 / 16 Überblick Inhalt Inhalt 1 Einführung Das Grammatical
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Syntax WS 2006/2007 Manfred Pinkal Einführung in die Computerlinguistik 2006/2007 M. Pinkal UdS 1 Morphologie und Syntax Gegenstand der Morphologie ist die Struktur
MehrFersentalerisch: SVO SOV?
Linguistica tedesca- LS 44S - A.A. 07/08 - Das Fersentalerische, eine deutsche Sprachinsel in Norditalien 1 Birgit Alber, 7.4. 2008 Fersentalerisch: SVO SOV? SVO - Sprachen: Subjekt Verb Objekt SOV Sprachen:
MehrEinführung in die Linguistik Butt & Co. Do. 12:15-13:45 Fr. 12:15-13:45
Einführung in die Linguistik Butt & Co. Do. 12:15-13:45 Fr. 12:15-13:45 Infos etc. http://ling.uni-konstanz.de => Studium => Lehrveranstaltungen Einführung in die Linguistik Frage/Antwort: Klausur Wird
MehrAusgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH
Ausgewählte Techniken der Maschinellen Übersetzung Susanne J. Jekat ZHW E-mail: jes@zhwin.ch, Subject: MTZH Übersicht Themenbereiche: 1. Erstellung und Standardisierung von Ressourcen für die Maschinelle
MehrAufgabe 1: % Schreiben Sie eine DATR-Theorie, die die Flexionsendungen deutscher % Adjektive erfasst. Benutzen Sie die gegebenen Show-Deklarationen.
Hausaufgabe (Abgabe: 22.12.2009): Lösen Sie bitte eine der drei folgenden Aufgaben. Hinweis: die Aufgabe 3 ist vermutlich die einfachste dieser Aufgaben. BN: Für einen BN müssen diese Woche keine Hausaufgaben
MehrEin bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort?
Ein bisschen Werbung Einführung in die Morphologie Einleitung, Grundbegriffe I Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 "Morphology is the conceptual centre of linguistics. This
MehrBestellformular Messeaktion Rehab 2009
An Per Fax: 0228/97199-99 Bestellformular Messeaktion Rehab 2009 Phoenix Software GmbH, Adolf-Hombitzer-Straße 12, 53227 Bonn Tel.: 0228/97199-0; E-Mail: reha@phoenixsoftware.de Programme / Update Preis
MehrZusammenfassung. 1 Wir betrachten die folgende Signatur F = {+,,, 0, 1} sodass. 3 Wir betrachten die Gleichungen E. 4 Dann gilt E 1 + x 1
Zusammenfassung Zusammenfassung der letzten LV Einführung in die Theoretische Informatik Woche 7 Harald Zankl Institut für Informatik @ UIBK Wintersemester 2014/2015 1 Wir betrachten die folgende Signatur
MehrComputerlinguistische Verfahren und Theorien für die Textproduktion in der Technischen Redaktion. Melanie Siegel
Computerlinguistische Verfahren und Theorien für die Textproduktion in der Technischen Redaktion Melanie Siegel Produktion technischer Dokumente Verständlichkeit Lesbarkeit Übersetzbarkeit Konsistenz Rechtschreibung
MehrTag 4 Inhaltsverzeichnis
Tag 4 Inhaltsverzeichnis Normalformen Problem Formen (1-4) Weitere Formen Transaktionen Synchronisationsprobleme Überblick Autocommit Locking Savepoints Isolation levels Übungen RDB 4-1 Normalformen Problematik
MehrKünstliche Intelligenz Maschinelles Lernen
Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen
MehrFunktionale Programmierung (in Clojure)
Funktionale Programmierung (in Clojure) Einführung Burkhardt Renz Fachbereich MNI Technische Hochschule Mittelhessen Wintersemester 2014/15 Übersicht Paradigmen von Programmiersprachen Paradigmen von Programmiersprachen
MehrEinführung in die Linguistik, Teil 4
Einführung in die Linguistik, Teil 4 Syntax - Das Berechnen syntaktischer Strukturen beim menschlichen Sprachverstehen Markus Bader, Frans Plank, Henning Reetz, Björn Wiemer Einführung in die Linguistik,
Mehrfachhochschule hamburg FACHBEREICH ELEKTROTECHNIK UND INFORMATIK
fachhochschule hamburg FACHBEREICH ELEKTROTECHNIK UND INFORMATIK Diplomarbeit Chi Cuong Tat Entwicklung und Aufbau einer Sprachsteuerungsschnittstelle für den Pioneer Roboter Studiengang Softwaretechnik
MehrFormale Sprachen und Grammatiken
Formale Sprachen und Grammatiken Jede Sprache besitzt die Aspekte Semantik (Bedeutung) und Syntax (formaler Aufbau). Die zulässige und korrekte Form der Wörter und Sätze einer Sprache wird durch die Syntax
MehrVO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft
, Informations- und Wissensmanagement Zentrum für Translationswissenschaft Grundlagen und Definitionen Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache.
MehrKlassifikation von Modelltransformationen
Klassifikation von Modelltransformationen feat. feature diagrams Andreas Blunk blunk@informatik.hu-berlin.de 1 Agenda 1. Einführung in Modelltransformationen 2. Vorstellung von Merkmalsdiagrammen 3. Beschreibung
MehrInformationsextraktion. Karin Haenelt 1.12.2012
Informationsextraktion Karin Haenelt 1.12.2012 Informationsextraktion Ziel Identifikation bestimmter Information (Daten) in einem unstrukturierten oder teilstrukturierten textuellen Dokument Transformation
MehrDatenstrukturen DCG Grammatiken. Tutorial I Operationen auf Datenstrukturen II Bäume DCGs und Semantik II
Datenstrukturen DCG Grammatiken Tutorial I Operationen auf Datenstrukturen II Bäume DCGs und Semantik II Bäume Repräsentation von Mengen durch binäre Bäume: Eine häufige Anwendung von Listen ist es Mengen
MehrWissen aus unstrukturierten natürlichsprachlichen
ZKI Tagung AK Supercomputing, 19.-20. Okt. 2015 Wissen aus unstrukturierten natürlichsprachlichen Daten Sprachtechnologie und Textanalytik in the large Udo Hahn Jena University Language & Information Engineering
MehrModerne Methoden der KI: Maschinelles Lernen
Moderne Methoden der KI: Maschinelles Lernen Prof. Dr.Hans-Dieter Burkhard Vorlesung Entscheidungsbäume Darstellung durch Regeln ID3 / C4.5 Bevorzugung kleiner Hypothesen Overfitting Entscheidungsbäume
Mehr3. Ontologien und Wissensbasen
Ontologien Ontologien stellen mittlerweile die Basis für viele innovative wissensbasierte Systeme dar: 3. Ontologien und Wissensbasen ecommerce/elearning Knowledge Management Informationsextraktion/Data-mining
MehrTypisierung von semistrukturierten Daten. Steffen Staab ISWeb Informationssysteme & Semantic Web
Typisierung von semistrukturierten Daten Typisierung von semistrukturierten Daten Idee: Strukturieren und Typisieren von semistrukturierte Daten. Zwei einfache Formalismen basierend auf: Logik Graphensimulation
MehrTag 4 Inhaltsverzeichnis
Tag 4 Inhaltsverzeichnis Normalformen Problem Formen (1-4) Weitere Formen Transaktionen Synchronisationsprobleme Überblick Autocommit Locking Savepoints Isolation levels Übungen RDB 4-1 Normalformen Problematik
MehrVorlesung "Software-Engineering"
Vorlesung "Software-Engineering" Rainer Marrone, TUHH, Arbeitsbereich STS Vorige Vorlesung Pflichtenheft (requirements specification document) Charakterisierung von Software-Qualität Detaillierte Anforderungsanalyse
MehrBeschreibungslogiken. Daniel Schradick 1schradi@informatik.uni-hamburg.de
Beschreibungslogiken Daniel Schradick 1schradi@informatik.uni-hamburg.de Was sind Beschreibungslogiken? Definition: Formalisms that represent knowledge of some problem domain (the world ) by first defining
MehrAutomaten und Formale Sprachen alias Theoretische Informatik. Sommersemester 2013
Automaten und Formale Sprachen alias Theoretische Informatik Sommersemester 2013 Dr. Sander Bruggink Übungsleitung: Jan Stückrath Sander Bruggink Automaten und Formale Sprachen 1 Deterministische Kellerautomaten
MehrMorphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming
Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 24.11.2014, 9 c.t. Zangenfeind: Morphologie 1 / 18 Wdh.: Klassifizierung
MehrM. Sc. Mirjana Jakšić Dipl.-Inf. Christian Schönberg Dipl.-Inf. Franz Weitl
Spezifikationsmuster für Web Dokumente M. Sc. Mirjana Jakšić Dipl.-Inf. Christian Schönberg Dipl.-Inf. Franz Weitl Verdikt Übersicht Formale Wissensrepräsentation Model Checking Formale Spezifikation Introduction
MehrAbschnitt 9: Schnittstellen: Interfaces
Abschnitt 9: Schnittstellen: Interfaces 9. Schnittstellen: Interfaces 9.1 Die Idee der Schnittstellen 9.2 Schnittstellen in Java 9.3 Marker-Interfaces 9.4 Interfaces und Hilfsklassen 9.5 Zusammenfassung
MehrAus: Hubert Truckenbrodt und Kathrin Eichler: Einführung in die moderne Sprachwissenschaft. Ms., ZAS Berlin und DFKI Saarbrücken, 2010.
Aus: Hubert Truckenbrodt und Kathrin Eichler: Einführung in die moderne Sprachwissenschaft. Ms., ZAS Berlin und DFKI Saarbrücken, 2010. Syntax 5: Die Syntax der Verben 1 Verben im Englischen 1.1 Auxiliare,
Mehr4. Relationen. Beschreibung einer binären Relation
4. Relationen Relationen spielen bei Datenbanken eine wichtige Rolle. Die meisten Datenbanksysteme sind relational. 4.1 Binäre Relationen Eine binäre Relation (Beziehung) R zwischen zwei Mengen A und B
MehrErstspracherwerb. Sprachentwicklung: Wortschatz
Erstspracherwerb Sprachentwicklung: Wortschatz Gliederung: 1. Welche 3 Phasen der lexikalischen Entwicklung werden bei Kindern unterschieden? 2. Welche sprachlichen Inhalte lernt das Kind 3. Wie verläuft
MehrGrundlagen der Informatik II. Teil I: Formale Modelle der Informatik
Grundlagen der Informatik II Teil I: Formale Modelle der Informatik 1 Einführung GdInfoII 1-2 Ziele/Fragestellungen der Theoretischen Informatik 1. Einführung abstrakter Modelle für informationsverarbeitende
MehrGrammatiken in Prolog
12. Grammatiken in Prolog 12-1 Grammatiken in Prolog Allgemeines: Gedacht zur Verarbeitung natürlicher Sprache. Dort braucht man kompliziertere Grammatiken als etwa im Compilerbau, andererseits sind die
MehrSyntax Verb-Zweit. Modul 04-006-1003 Syntax und Semantik. Universität Leipzig www.uni-leipzig.de/ heck. Institut für Linguistik
Syntax Verb-Zweit Modul 04-006-1003 Syntax und Semantik Institut für Linguistik Universität Leipzig www.uni-leipzig.de/ heck Modell der topologischen Felder Plan: Im folgenden soll die Verb-Zweit-Eigenschaft
MehrEinführung in die englische Sprachgeschichte
MANFRED GORLACH Einführung in die englische Sprachgeschichte 5., völlig überarbeitete Auflage Universitätsverlag C.WINTER Heidelberg Inhaltsverzeichnis Abbildungsverzeichnis Vorwort Abkürzungen xi xiii
MehrXML Schema vs. Relax NG
XML Schema vs. Relax NG p. 1/2 XML Schema vs. Relax NG Semistrukturierten Daten 1 Präsentation der Gruppe 2 XML Schema vs. Relax NG p. 2/2 Wozu XML Schema? W3C Empfehlung zur Definition von XML-Dokumentstrukturen
Mehr4. 4. Algorithmen und Datenstrukturen in deskriptiven Programmiersprachen
Kapitel Kapitel 4 Deskriptive Programmierung SS 2008 4. 4. Algorithmen und Datenstrukturen in in deskriptiven Programmiersprachen Deskriptive Programmierung 1 Sprachverarbeitung in in Prolog Prolog Prolog
MehrAusgangsposition. Aspekte der Texttechnologie. Aspekte der Texttechnologie. Susanne J. Jekat Zürcher Hochschule Winterthur E-mail: jes@zhwin.
Aspekte der Texttechnologie Susanne J. Jekat Zürcher Hochschule Winterthur E-mail: jes@zhwin.ch Aspekte der Texttechnologie Thema 5 Semantic Web Termine: 24. Mai 2007 Lernfrage: Was ist das Semantic Web
MehrLösung für Lehrerinnen und Lehrer Grammatik-Lapbook Teil 1: Wortarten
Lösung für Lehrerinnen und Lehrer Grammatik-Lapbook Teil 1: Wortarten Es wird zunächst eine Grundform für das Lapbook erstellt. Dabei bietet es sich an, aus Tonkarton ein Buch zu falten (siehe auch Arbeitsblatt
MehrInformatik I WS 07/08 Tutorium 24
Info I Tutorium 24 Informatik I WS 07/08 Tutorium 24 3.2.07 astian Molkenthin E-Mail: infotut@sunshine2k.de Web: http://infotut.sunshine2k.de Organisatorisches / Review is zum 2.2 müssen alle Praxisaufgaben
MehrGI-Technologien zur Umsetzung der EU-Wasserrahmenrichtlinie (WRRL): Wissensbasen. Teil 1: Einführung: Wissensbasis und Ontologie.
GI-Technologien zur Umsetzung der EU-Wasserrahmenrichtlinie (WRRL): Wissensbasen Teil 1: Einführung: Wissensbasis und Ontologie Was ist eine Wissensbasis? Unterschied zur Datenbank: Datenbank: strukturiert
MehrÜbungsaufgaben zur Vorlesung Modellbasierte Softwareentwicklung Wintersemester 2014/2015 Übungsblatt 6
Prof. Dr. Wilhelm Schäfer Paderborn, 24. November 204 Christian Brenner Tristan Wittgen Besprechung der Aufgaben:. - 4. Dezember 204 Übungsaufgaben zur Vorlesung Modellbasierte Softwareentwicklung Wintersemester
MehrAnfrage Erweiterung 03.11.2011 Jan Schrader
Anfrage Erweiterung 03.11.2011 Jan Schrader Vocabulary Mismatch Problem Anfrage und Dokument passen nicht zusammen obwohl Dokument zur Anfrage relevant Grund: Synonymproblem verschiedene Menschen benennen
MehrZur Analyse der deutschen Satzstruktur
Zur Analyse der deutschen Satzstruktur Stefan Müller Theoretische Linguistik/Computerlinguistik Universität Bremen/Fachbereich 10 Postfach 33 04 40 D-28334 Bremen Stefan.Mueller@cl.uni-bremen.de 1 Abstract
MehrGrammatical Framework
Grammatical Framework Hauptseminar SS 2007 CIS, Universität München Hans Leiß, Martin Hofmann 18. Juli 2007 Aufgabe 1 Schreibe eine GF-Grammatik Ap0, die folgende Ausdrücke erkennt: E1 D1 E2 D2 E3 D3 the
MehrEine XML-Kodierung für AVM-Beschreibungen
Eine XML-Kodierung für AVM-Beschreibungen Manfred Sailer und Frank Richter Zusammenfassung Ausgehend von der Beobachtung, dass existierende Plattformen für HPSG-Grammatiken untereinander inkompatible interne
MehrHerausforderungen bei der Übersetzung und Adaption eines englischen SLI-Screenings ins Deutsche
Herausforderungen bei der Übersetzung und Adaption eines englischen SLI-Screenings ins Deutsche Bettina Fürst ULG Klinische Linguistik, MSc Präsentation der Abschluss- Arbeit 20. März 2010, Salzburg Forschungsfragen
Mehrw a is die Anzahl der Vorkommen von a in w Beispiel: abba a = 2
1 2 Notation für Wörter Grundlagen der Theoretischen Informatik Till Mossakowski Fakultät für Informatik Otto-von-Guericke Universität Magdeburg w a is die Anzahl der Vorkommen von a in w Beispiel: abba
MehrEinfÅhrung in die objektorientiere Programmierung (OOP) unter Delphi 6.0. EDV Kurs 13/2
EinfÅhrung in die objektorientiere Programmierung (OOP) unter Delphi 6.0 EDV Kurs 13/2 Inhaltsverzeichnis 1 Objekte... 1 2 Klassen... 3 2.1 Beziehungen zwischen Klassen... 4 2.1.1 Vererbung... 4 2.1.2
MehrGrundbegriffe der Objektorientierung
Grundbegriffe der Objektorientierung Objekt Merkmale Zustand Verhalten Lebenszyklus Beziehungen zwischen Objekten Kategorisierung von Objekten Grundbegriffe der Objektorientierung Objekt Merkmale Zustand
MehrRequirements Engineering Übung 10 - Formale Systemmodellierung im RE -
Requirements Engineering Übung 10 - Formale Systemmodellierung im RE - Dr. Birgit Penzenstadler, Dr. Daniel Méndez, Jonas Eckhardt 08.01.2012 Aufgabe 1: Empirisch formulierte vs. Formal fundierte Anforderungen:
MehrAutomatisches Lernen von Regeln zur quellseitigen Umordnung
Automatisches Lernen von Regeln zur quellseitigen Umordnung E I N A N S AT Z V O N D M I T R I Y G E N Z E L Duwaraka Murugadas Fortgeschrittene Methoden der statistischen maschinellen Übersetzung (Miriam
MehrModellierungstechniken im Softwaredesign. Praxisprojekt [ai] Control WS 2011/2012 Lara Baschour und Anne Heiting
Modellierungstechniken im Softwaredesign Praxisprojekt [ai] Control WS 2011/2012 Lara Baschour und Anne Heiting Was ist Modellierung? Modell = Ein Modell ist eine Repräsentation eines Systems von Objekten,
MehrDiskrete Mathematik für Informatiker
Diskrete Mathematik für Informatiker Markus Lohrey Universität Siegen Wintersemester 2014/2015 Lohrey (Universität Siegen) Diskrete Mathematik Wintersem. 2014/2015 1 / 344 Organisatorisches zur Vorlesung
MehrInformatik IV Theoretische Informatik: Formale Sprachen und Automaten, Berechenbarkeit und NP-Vollständigkeit
Informatik IV Theoretische Informatik: Formale Sprachen und Automaten, Berechenbarkeit und NP-Vollständigkeit Sommersemester 2011 Dozent: Prof. Dr. J. Rothe, Prof. Dr. M. Leuschel J. Rothe (HHU Düsseldorf)
MehrSyntaktische Typologie
Morphologie und Syntax (BA) PD Dr. Ralf Vogel Fakultät für Linguistik und Literaturwissenschaft Universität Bielefeld, SoSe 2007 Ralf.Vogel@Uni-Bielefeld.de 26. Mai 2008 1 / 39 Gliederung 1 Übungsaufgabe
MehrAktuelle Architekturfragen in der Maschinellen Übersetzung semantischer Transfer und Integration statistischer Information in translate
Aktuelle Architekturfragen in der Maschinellen Übersetzung semantischer Transfer und Integration statistischer Information in translate Kurt Eberle Lingenio GmbH, Heidelberg 28.Mai 2009 Überblick Unternehmen/Hintergrund
MehrSEMINAR AUTOMATISCHE GESICHTSERKENNUNG
SEMINAR AUTOMATISCHE GESICHTSERKENNUNG OBERSEMINAR AUTOMATISCHE ANALYSE VON GESICHTSAUSDRÜCKEN Organisation, Überblick, Themen Überblick heutige Veranstaltung 1. Organisatorisches 2. Überblick über beide
MehrKiwi. Modellkonsistenz. Themenbereich Modellmanagement und Qualität
Kiwi. Kiwi. Modellkonsistenz Themenbereich Modellmanagement und Qualität Vortrag im Seminar Software-Qualität bei der modellbasierten Softwareentwicklung (SS2007) Stefan Marr Agenda 3 Softwareentwicklung
Mehr1. Java ist... 2. Stammbaum der Programmiersprachen 3. Die "Softwarekrise"
im Überblick im Überblick Inhalt 1. Java ist... 2. Stammbaum der Programmiersprachen 3. Die Softwarekrise 1. Merkmale von Software 2. Fortlaufende Veränderungen 3. Erschwerte Rahmenbedingungen bei der
MehrVorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke
Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,
MehrWortartenbestimmung nach Peter Eisenberg
Seminar: Wortarten Dozent: Prof. Dr. Öhlschläger Referent: Erik Heinig Literatur: Wortartenbestimmung nach Peter Eisenberg Eisenberg, Peter: Das Wort, Grundriß der deutschen Grammatik. Metzler.2004 Eisenberg,
MehrProgrammbeschreibungen. PIH-Software. Alexander M. Hüther. für WINDOWS & MAC-OS
Programmbeschreibungen PIH-Software für WINDOWS & MAC-OS Alexander M. Hüther Stand: November 2002 PIH-CD Teil 1 Rechnen Zahlenstrahl bis 100 Übung 1: Durch das Eingeben einer beliebigen Zahl wandert der
MehrRDF und RDF Schema. Einführung in die Problematik Von HTML über XML zu RDF
RDF und RDF Schema Einführung in die Problematik Von HTML über XML zu RDF Kirsten Albrecht Roland Illig Probleme des HTML-basierten
MehrA Medial Topic Position for German W. Frey 2004
A Medial Topic Position for German W. Frey 2004 Ausgewählte Momente der deutschen Syntax 10.01.11 Dr. Fabian Heck Referentin: Nathalie Scherf, MA Linguistik 2 Gliederung 1. Definition des Begriffs Topik
Mehrdessen deren Probleme er verstehen kann. deren Bankkonto groß ist.
05-18a Aufbaustufe II / GD (nach bat) A. dessen & deren Er träumt von einer Frau, die sehr aufgeschlossen und interessiert ist. die er auf Händen tragen kann über die er sich jeden Tag freuen kann. mit
MehrSoftwaretechnik SS 2006
Softwaretechnik SS 2006 Basisveranstaltung im Studiengebiet SSG (Softwaretechnik und Systemgestaltung) Siehst Du ein Gesicht, oder einen Eskimo von hinten? Softwaretechnik SS 2006 1 Stefan Jähnichen Steffen
MehrInteraktive Wörterbücher. Kurt Eberle Lingenio GmbH Hebelstr. 14 D-69115 Heidelberg k.eberle@lingenio.de 11.Juli 2007
Interaktive Wörterbücher Lingenio GmbH Hebelstr. 14 D-69115 Heidelberg k.eberle@lingenio.de 11.Juli 2007 Es geht...... nicht um das Habilitationsthema nicht um (computer-)linguistische Theorie um ein praktisches
Mehr