Erkennung von Teilsatzgrenzen
|
|
- Hanna Bretz
- vor 7 Jahren
- Abrufe
Transkript
1 Erkennung von Teilsatzgrenzen Maryia Fedzechkina Universität zu Köln Institut für Linguistik Sprachliche Informationsverarbeitung SoSe 2007 Hauptseminar Maschinelle Sprachverarbeitung
2 Agenda Definitionen von Teilsätzen Teilsatz: NLP Anwendungen Erkennung von Teilsatzgrenzen: Existierende Verfahren Erkennung von Teilsatzgrenzen durch Pattern Matching
3 Teilsatz Teilsatz (eng. Clause ) - a grammatical unit that includes, at minimum, a predicate and an explicit or implied subject, and expresses a proposition (Loos et al. 2004) Das ist offensichtlich ein Irrtum. (1 Satz, 1 Teilsatz) Das Buch ist sehr begehrt, <CB> was der Verlag zufrieden feststellt. (1 Satz, 2 Teilsätze)
4 Teilsatz Teilsatz a group of words containing one verb phrase (Collins 1990) Problem: semantische Ambiguitäten: The professor is teaching. (1 VP) The problem is teaching. (2 VPs) (Leffa 1998)
5 Finite vs. Infinite Teilsätze Finite Teilsätze enthalten ein finites Verb: Zehn Soldaten starben, als eine Rakete das Hauptquartier der Armee traf. Infinite Teilsätze enthalten ein infinites Verb: Am ganzen Körper zitternd, wandte er sich um. Sie ging ins Zimmer, um über das Gehörte nachzudenken. Er hörte den Hund bellen.
6 Verblose Teilsätze Quirk et al. (1985) definieren verblose Teilsätze: If wet, the pipe won t give you a good smoke. (If it is wet, the pipe won t give you a good smoke.) It has little taste, unless hot. (It has little taste, unless it is hot.) (Quirk et al. 1985)
7 Teilsatz: NLP Anwendungen Text-to-Speech Systeme, Question- Answering Systeme Parallel Text Alignment Maschinelle Übersetzung Shallow Parsing
8 Text-to-Speech Systeme Durch Informationen über Teilsatzgrenzen kann die Natürlichkeit der syntetischen Sprache verbessert werden (Ejehed 1988) Idee: Teilsatzgrenzen sind die Voraussetzung für die Setzung der Grenztönen, Pausen und finalen Dehnung
9 Parallel Text Alingment Parallel Text Alingment das Verfahren zu paralleler Repräsentation vom Text und seiner Übersetzungen Has the cat got your tongue? Вы что, язык проглотили? Problem: keine eins-zu-eins Übereinstimmung der Teilsätze; eingebettete Strukturen, Alignment von Phrasen
10 Maschinelle Übersetzung Idee: Verbesserung syntaktischer Struktur generierter Sätze durch Reduktion der Telsätze zu den Part-of-Speech Kategorien (Leffa 1998) That they refused the flowers surprises me. N V
11 Shallow Parsing Shallow Parsing (partielles Parsing) Parsingverfahren, das umfasst regelbasierte und statistische Verfahren zur partiellen Analyse des Satzes (Abney 1996) Idee: Im ersten Schritt die oberflächliche Satzstruktur zu ermitteln (minimal: Part-of-Speech Tagging, Chunking, Teilsatz- Segmentierung) Im zweiten Schritt schon ermittelte Teilsätze an den traditionellen Parser zu übergeben
12 Shallow Parsing Vorteile: Robustness (Attachment Ambiguitäten) Modulare Architektur (Wiederverwendbarkeit, einfachere Wartung) Geringerer Aufwand
13 Erkennung von Teilsatzgrenzen vs. Teilsatzerkennung Erkennung von Teilsatzgrenzen sagt nur aus, dass es eine Grenze der satzartigen Struktur gibt: Nur ein Projekt der Volkswagen AG, <CB> die ihre europäischen Vertragswerkstätten per Satellit vernetzen will, <CB> stößt in ähnliche Dimensionen vor. Teilsatzerkennung liefert weitere Informationen: segmentiert diskontinuierliche Elemente eines Teilsatzes: <C> Nur ein Projekt der Volkswagen AG, <C> die ihre europäschen Vertragswerkstätten per Satellit vernetzen will, <\C> stößt in ähnliche Dimensionen vor <\C>.
14 Erkennung von Teilsatzgrenzen: Existierende Verfahren Ejerhed (1988) entwirft eine Clause Grammar, die verschiedene Teilsätze des Englischen beschreiben soll. Die Grammatik besteht aus einer Menge von regulären Ausdrücken über Part-of-Speech Tags und Interpunktion.
15 Erkennung von Teilsatzgrenzen: Existierende Verfahren Clause Grammar Beispiele: XX SN -> XX <CB> SN Silvia hörte, <CB> wie sie schrieen. FIN DLMID FIN -> FIN DL MID <CB> FIN Der Mann, der Birnen verkauft, <CB> war gestern da. (Ejerhed 1996) Ein finite-state Parser wird eingesetzt, um die regulären Ausdrücke gegen die Eingabe zu matchen Fehlerrate 13%
16 Erkennung von Teilsatzgrenzen: Existierende Verfahren Papageorgiou (1997) verfeinert Ejerheds (1988) Verfahren durch Einsetzung des Clause Marker TAGging (CMTAG) Modules Aufgaben von CMTAG: Fehlerkorrektur von POS Tagging (Adjektive in satzinitialer Position werden als NN getaggt, Verb vor worden muss VVPP sein, etc.) Extension von POS Tags für komplexe Konjuktionen (wie so as, as thought, etc.) und Präpositionen (wie in order to, etc.) Fehlerrate: 7%
17 Erkennung von Teilsatzgrenzen: Existierende Verfahren Volk (2002) modifiziert Brills POS Tagger (Brill 1994) zum Clause Boundary Recognizer Erkennung von Teilsätzen wird durch Pattern Matching realisiert Patterns: 34 Patterns, meistens eine Bedingung in Zusammenhang mit Verb und Komma Fehlerate: 8% (kleines Test Korpus!)
18 Erkennung von Teilsatzgrenzen Was erkennen? Anwendungsorientiert (Text-to-Speech vs. Maschinelle Übersetzung, Sprache, etc.) Ressourcen orientiert (Baumbanken)
19 Baumbanken Baumbank Kopus, der mit syntaktischer Struktur annotiert ist (meistens in Form von Bäumen, evt. auch Graphen) Beispiele: Penn Treebank fürs Englische NeGra, TIGER fürs Deutsche
20 TIGER Korpus Wird an der Universität des Saarlandes, Universität Stuttgart, Universität Potsdam entwickelt Enthält ca syntaktisch annotierte Sätze aus Frankfurter Rundschau Annotatiosmethode: semi-automatisch (LFG Parsing + manuelle Nachbearbeitung)
21 TIGER: Ebenen der Annotation Part-of-Speech: Information über Wortklassen Morphologische Informationen: nur die Kategorien, die für Flexion relevant sind (z.b. Genus, Numerus, Kasus, etc.) Phrasenstruktur (z.b. NP, VP, etc.) Syntaktische Funktionen (z.b., Subjekt, Objekt, etc.)
22 TIGER: Beispiel
23 TIGER Teilsatzannotation: Besonderheiten Als Teilsätze (S) werden ausschließlich finite Teilsätze annotiert Koordinierte Verben werden als separate Teilsätze annotiert: Sie entwickelt <CB> und <CB> druckt Verpackungen und Etiketten.
24 Mithilfe von TigerAPI wurden aus dem TIGER Korpus extrahiert: Finite Teilsätze Infinite (Infinitiv und Partizip) Teilsätze Part-of-Speech Informationen für jeden Token Der ART X Deutschen ADJA X Presse-Agentur NN X sagte VVFIN X er PPER X, $, <CB> Bonn NE X ignoriere VVFIN X Absprachen NN X von APPR X Bund NN X und KON X Ländern NN X. $. X
25 Aufbau des Systems Satzerkenner Teilt den Text in Sätze auf Tokenizer Teilt den Text in Tokens auf Part-of-Speech Tagger Taggt Tokens mit POS Informationen Clause Boundary Recognizer Führt Pattern Matching durch
26 Patterns: Beispiele subs: {PWS PWAT PWAV KOUS KOKOM} nebensatzeinleitende Konjunktionen [^^] subs -> <CB> subs Es ist wichtig, dass sie einmal kommt. Aber nicht: Dass sie einmal kommt, ist wichtig.
27 Quellen Loos, E. E., Anderson, S., Day, D. H. Jr., Jordan, P. C., Wingate, J. D. (2004). Glossary of Linguistic Terms. Online at: < Quirk, R., Greenbaum, S., Leech, G., Svartvik, J. (1985). A Comprehensive Grammar of the English Language. Longman: London and New York. Collins. (1990). Collins Cobuild English Grammar. Collins: London and Glasgow. TIGER Project. (2000). TIGER Project: Online Documentation. Online at: <
28 Quellen Abney, S. (1996). Parsing by Chunks. Online at: <citeseer.ist.psu.edu/58210.html> Ejerhed, E. I. (1988). Finding Clauses in Unrestricted Text by Finitary and Stochastic Methods. Online at <citeseer.ist.psu.edu/eva88finding.html>. Leffa, V. J. (1998). Clause Processing in Complex Sentences. Online at <citeseer.comp.nus.edu.sg/context/ /0>.
29 Quellen Ejerhed, E. I. (1996). Finite state segmentation of discourse into Clauses. In A. Kornai (Ed.). ECAI Workshop: Extended Finite State Models of Language. Volk, M. (2001). The Automatic Resolution of Prepositional Phrase - Attachment Ambiguities in German. Habilitation thesis, University of Zurich, Faculty of Arts. Zurich. Brill, E. (1994). Some advances in rule-based part of speech tagging In Proceedings of the 12th National Conference on Artificial Intelligence (AAAI-94). Seattle, Washington, USA, pp Online at < citeseer.ist.psu.edu/ html>.
30 Quellen Papageorgiou, H. (1997), Clause Recognition in the Framework of Alignment. In Mitkov, R., Nicolov, R. (Eds.) Proceedings of the 2nd Conference on Recent Advances in Natural Language Processing (RANLP-97). Amsterdam/Philadelphia: John Benjamins, pp
Lösungsvorschlag für das Übungsblatt 8. Aufgabe1.
Lösungsvorschlag für das Übungsblatt 8. Aufgabe1. 3 Det A N VP R6 4 Any A N VP L3 5 Any intelligent N VP L4 6 Any intelligent cat VP L2 Nach den Regeln kann der Satz weiter nicht erzeugt warden, deswegen
MehrKontextfreie Grammatiken
Kontextfreie Grammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 16. Oktober 2015 Übersicht Worum geht es in dieser Vorlesung? Übungen und Abschlussprojekt Kontextfreie Grammatiken Computerlinguistische
Mehr"What's in the news? - or: why Angela Merkel is not significant
"What's in the news? - or: why Angela Merkel is not significant Andrej Rosenheinrich, Dr. Bernd Eickmann Forschung und Entwicklung, Unister GmbH, Leipzig UNISTER Seite 1 Unister Holding UNISTER Seite 2
MehrSatz Umstrukturierung für statistisch. Anna Schiffarth Dozentin: Miriam Kaeshammer Fortgeschrittene Methoden der statistisch maschinellen Übersetzung
Satz Umstrukturierung für statistisch maschinelle Übersetzung Anna Schiffarth Dozentin: Miriam Kaeshammer Fortgeschrittene Methoden der statistisch maschinellen Übersetzung Einführung Beschreibung einer
MehrSemantic Role Labeling
Semantic Role Labeling Am Beispiel von EasySRL und SEMAFOR Max Depenbrock Proseminar "Tools für Computerlinguisten" 5.1.2018 Max Depenbrock SRL 5.1.2018 1 / 36 Was ist Semantic Role Labeling? Was ist Semantic
MehrPart-of-Speech Tagging. Stephanie Schuldes
Part-of-Speech Tagging Stephanie Schuldes 05.06.2003 PS Erschließen von großen Textmengen Geißler/Holler SoSe 2003 Motivation Ziel: vollständiges Parsing und Verstehen natürlicher Sprache Herantasten durch
MehrLinguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets
Linguistische Grundlagen Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets Warum Tagging? Abfragbarkeit linguistischer Information Generalisierbarkeit von Abfragen
MehrAnalyse von Beurteilungen räumlicher Objekte in natürlich sprachlichen Texten Sarah Tauscher, Karl Neumann
Analyse von Beurteilungen räumlicher Objekte in natürlich sprachlichen Texten Sarah Tauscher, Karl Neumann Institut für Informationssysteme Technische Universität Braunschweig Example: Main Tower Main
MehrProseminar Linguistische Annotation
Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation
MehrTagger for German. Online BRILL-Tagger für das Deutsche
Tagger for German Online BRILL-Tagger für das Deutsche Morphologie V/Ü, Anke Holler Uni Heidelberg, SS2007 Nataliya Mytyay Éva Mújdricza 19.07.2007 Designed by: Dóra Dobos Tagger for German Eric Brill
MehrErweiterung des STTS für gesprochene Sprache
Erweiterung des STTS für gesprochene Sprache Ines Rehbein, Sören Schalowski und Heike Wiese Institut für Deutsche Sprache SFB 632 Informationsstruktur Universität Potsdam STTS Workshop am IMS Stuttgart
MehrPart of Speech Tagging. Linguistische Sicht. Carolin Deck
Part of Speech Tagging Linguistische Sicht Carolin Deck Gliederung 1. Begriffsklärung 2. Vorstellung zwei wichtiger Tagsets (STTS & PTTS) 3. Bedeutung des POS-Tagging für die Sprachwissenschaft 4. Tagzuweisung
MehrPart-of-Speech-Tagging mit Transduktoren
Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr. Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria
MehrTagging mit Hidden Markov Models und Viterbi-Algorithmus
Tagging mit Hidden Markov Models und Viterbi-Algorithmus Annelen Brunner, Stephanie Schuldes, Nicola Kaiser, Olga Mordvinova HS Parsing SoSe 2003 PD Dr. Karin Haenelt Inhalt Ziel des Seminarprojekts Theorie:
MehrPart-of-Speech-Tagging mit Transduktoren
Ruprecht-Karls Universität Heidelberg Hauptseminar Computerlinguistik Endliche Automaten für die Sprachverarbeitung PD Dr Karin Haenelt Sommersemester 2005 Part-of-Speech-Tagging mit Transduktoren Maria
MehrStefan Engelberg (IDS Mannheim), Workshop Corpora in Lexical Research, Bucharest, Nov. 2008 [Folie 1] DWDS-Kernkorpus / DWDS corpus analysis
Content 1. Empirical linguistics 2. Text corpora and corpus linguistics 3. Concordances 4. Application I: The German progressive 5. Part-of-speech tagging 6. Fequency analysis 7. Application II: Compounds
MehrMaschinelle Sprachverarbeitung: Part-of-Speech-Tagging
HUMBOLDT-UNIVERSITÄT ZU BERLIN Institut für Informatik Lehrstuhl Wissensmanagement Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging Tobias Scheffer Ulf Brefeld POS-Tagging Zuordnung der Wortart von
MehrSpeech Recognition Grammar Compilation in Grammatikal Framework. von Michael Heber
Speech Recognition Grammar Compilation in Grammatikal Framework von Michael Heber Agenda 1. Einführung 2. Grammatical Framework (GF) 3. Kontextfreie Grammatiken und Finite-State Modelle 4. Quellen 2 1.
MehrPROBABILISTIC PARSING FOR GERMAN USING SISTER-HEAD DEPENDENCIES
Ausgangsfrage PROBABILISTIC PARSING FOR GERMAN USING SISTER-HEAD DEPENDENCIES Irina Gossmann Carine Dombou 9. Juli 2007 INHALT Ausgangsfrage 1 AUSGANGSFRAGE 2 SYNTAX DES DEUTSCHEN + NEGRA 3 PROBABILISTISCHE
MehrKorpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora
Korpuslinguistik Annis 3 -Korpussuchtool Suchen in tief annotierten Korpora Anke Lüdeling, Marc Reznicek, Amir Zeldes, Hagen Hirschmann... und anderen Mitarbeitern der HU-Korpuslinguistik Ziele Wie/Was
MehrBlockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung
Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus und seine Aufbereitung Bestandteile eines Korpus sind i.d.r.: Primärdaten Metadaten Annotationen Annotationen
MehrAux Flip in German: A Walk in the Woods
Aux Flip in German: A Walk in the Woods Erhard Hinrichs 1, Kathrin Beck 1, and Tsuneko Nakazawa 2 1 Seminar für Sprachwissenschaft Eberhard Karls Universität Tübingen 2 University of Tokyo Aux Flip in
MehrNamed Entity Recognition (NER)
Named Entity Recognition (NER) Katharina Stein 01/12/2017 Named Entity Recognition 1 Inhalt Named Entity Recognition Was ist Named Entity Recognition? Bedeutung für Natural Language Processing Herausforderungen
MehrMaschinelle Sprachverarbeitung: Probabilistische, kontextfreie Grammatiken
HUMBOLDT-UNIVERSITÄT ZU BERLIN Institut für Informatik Lehrstuhl Wissensmanagement Maschinelle Sprachverarbeitung: Probabilistische, kontextfreie Grammatiken Tobias Scheffer Ulf Brefeld Sprachmodelle N-Gramm-Modell:
MehrVortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09)
Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012 Referent: Florian Kalisch (GR09) Rückblick Aktueller Status Einführung in Text-Mining Der Text-Mining Prozess
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Einführung Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2018 1 / 14 Anwendungen der Computerlinguistik Carstensen et al. (2010); Jurafsky and Martin
MehrSemantic Role Labeling im modernen Text-Analyse-Prozess
Semantic Role Labeling im modernen Text-Analyse-Prozess Bastian Haarmann info@bastianhaarmann.de http://www.bastianhaarmann.de Agenda I Text-Analyse-Prozesse 1. Motivation 2. Informationsextraktion 3.
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Paul Prasse Michael Großhans
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-Pipeline Tobias Scheffer Paul Prasse Michael Großhans NLP- (Natural Language Processing-) Pipeline Folge von Verarbeitungsschritten
MehrModul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen
Institut für Computerlinguistik Sprachtechnologie in den Digital Humanities Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen Simon
MehrChunk Linking und Chunk Attachment
Ruprecht Karls Universität Heidelberg Lehrstuhl für Computerlinguistik HS Parsing SS 2003 Dozentin: Dr. Karin Haenelt Referent/Innen: Klaus Rothenhäusler, Wiebke Wagner Chunk Linking Chunk Attachment Klaus
MehrOverview. Motivation Learner text and target hypoteses correction of POS-tags parsing the target hypothesis TH1
Overview Motivation Learner text and target hypoteses correction of POS-tags parsing the target hypothesis TH1 Motivation up -to -date learner corpora allow us to investigate surface structure features
MehrChunk Linking und Chunk Attachment
21.7.2003 Klaus Rothenhäusler, Wiebke Wagner 1 Ruprecht Karls Universität Heidelberg Lehrstuhl für Computerlinguistik HS Parsing SS 2003 Dozentin: Dr. Karin Haenelt Referent/Innen: Klaus Rothenhäusler,
MehrTutorium Prolog für Linguisten 12
Tutorium Prolog für Linguisten 12 Sebastian Golly 29. Januar 2013 Sebastian Golly Tutorium Prolog für Linguisten 12 1 / 13 Plan für heute Fürs Langzeitgedächtnis Zusammenfassung des letzten Seminars Übungsblatt
MehrAnnotation des Wittgenstein-Korpus mit Wortart-Information
Annotation des Wittgenstein-Korpus mit Wortart-Information Institut für Informations- und Sprachverarbeitung Ludwig-Maximilian-Universität München schmid@cis.uni-muenchen.de Überblick Was ist Wortart-Tagging?
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Peter Haider Uwe Dick Paul Prasse
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-Pipeline Tobias Scheffer Peter Haider Uwe Dick Paul Prasse NLP-Pipeline Folge von Verarbeitungsschritten für Informationsextraktion,
MehrVorlaugeGuidelinesfurdasTaggingdeutscherTextcorpora AnneSchiller,SimoneTeufel,ChristineStockert mitstts InstitutfurmaschinelleSprachverarbeitung UniversitatStuttgart SeminarfurSprachwissenschaft UniversitatTubingen
MehrSharon Goldwater & David McClosky. Sarah Hartmann Advanced Topics in Statistical Machine Translation
Sharon Goldwater & David McClosky Sarah Hartmann 13.01.2015 Advanced Topics in Statistical Machine Translation Einführung Modelle Experimente Diskussion 2 Einführung Das Problem Der Lösungsvorschlag Modelle
MehrElektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen 2 und / 27der. und der Computerlinguistik
Elektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen und der Linguistics Department Ruhr-University Bochum 18.1.2011 DSPIN-Workshop Sprachressourcen in der Lehre Erfahrungen, Einsatzszenarien,
MehrEnglisch Klasse 8 - Name:
Englisch Klasse 8 Name: Kompetenzen: Unit 1 talk about New York City Englisch G 21 A4 p. 1421 Fit für Tests und Klassenarbeiten 4, p. 89, p. 14 ex. 2, p. 15 ex. 3 use the present perfect progressive and
MehrKünstliche Intelligenz
Künstliche Intelligenz Prolog - Definite Clause Grammar Claes Neuefeind Sprachliche Informationsverarbeitung Universität zu Köln 25. Januar 2012 Wiederholung: DCGs Parser, Kongruenz, Semantik Praxis Hausaufgaben
MehrHidden Markov Models in Anwendungen
Hidden Markov Models in Anwendungen Prof Dr. Matthew Crocker Universität des Saarlandes 18. Juni 2015 Matthew Crocker (UdS) HMM Anwendungen 18. Juni 2015 1 / 26 Hidden Markov Modelle in der Computerlinguistik
MehrComputerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus
MehrInformationsextraktion
Informationsextraktion Bestimmte Anwendungen bei der semantischen Verarbeitung erfordern keine tiefe linguistische Analyse mit exakter Disambiguierung (= eine einzige und korrekte Lesart). Hierzu gehört
MehrDeutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können
Deutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können Marc Reznicek Humboldt-Universität zu Berlin STTS- Workshop 24.9.2012 Überblick STTS in Lernerkorpora Lernerfehler
MehrNLP Eigenschaften von Text
NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Peter Haider Paul Prasse
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-Pipeline Tobias Scheffer Peter Haider Paul Prasse NLP-Pipeline Folge von Verarbeitungsschritten für Informationsextraktion,
MehrGerman translation: technology
A. Starter Write the gender and the English translation for each word, using a dictionary if needed. Gender (der/die/das) German English Handy Computer Internet WLAN-Verbindung Nachricht Drucker Medien
MehrSprachtechnologien und maschinelle Übersetzung heute und morgen eine Einführung Martin Kappus (ZHAW)
Martin Kappus (ZHAW) Ablauf: Warum sprechen wir heute über maschinelle Übersetzung? Geschichte und Ansätze Eingabe-/Ausgabemodi und Anwendungen 2 WARUM SPRECHEN WIR HEUTE ÜBER MASCHINELLE ÜBERSETZUNG?
MehrFASTUS: Ein System zur Informationsextraktion mit Transduktoren
FASTUS: Ein System zur Informationsextraktion mit Transduktoren (Systembeschreibung) Branimira Nikolova HS Endliche Automaten für die Sprachverarbeitung SS 2004 Dr. Karin Haenelt Information Extraction
MehrSeminar Sicherheit und Softwareengineering WS 2013 / Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS
Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS Requirements Documents Was sind Requirements Documents? Anforderungsdokumente in industriellen Software-Projekten Häufig in natürlicher Sprache
MehrSprachsynthese: Part-of-Speech-Tagging
Sprachsynthese: Part-of-Speech-Tagging (Änderungen von F. Schiel 2016) Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München reichelu schiel@phonetik.uni-muenchen.de 2. November
MehrAutomatentheorie und formale Sprachen reguläre Ausdrücke
Automatentheorie und formale Sprachen reguläre Ausdrücke Dozentin: Wiebke Petersen 6.5.2009 Wiebke Petersen Automatentheorie und formale Sprachen - SoSe09 1 Formal language Denition A formal language L
MehrFACULTY OF LANGUAGES
FACULTY OF LANGUAGES Syllabus For CERTIFICATE COURSE IN GERMAN (PART TIME) (Semester: I II) Examinations: 2015 16 GURU NANAK DEV UNIVERSITY AMRITSAR Note: (i) Copy rights are reserved. Nobody is allowed
MehrParsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Beispiel: eine kleine kontextfreie Grammatik (cf. [BKL09], Ch. 8.
Gliederung Natürlichsprachliche Systeme I D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg 1 WS 2011/12, 26. Oktober 2011, c 2010-2012
MehrChunk linking und Chunk attachment
Titus von der Malsburg, Heike Stadler Chunk linking und Chunk attachment HS Parsing, Karin Haenelt Heidelberg, 8.7.2002 Chunk linking und Chunk attachment Inhalt Was ist Chunk linking und Chunk attachment?
MehrFriedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong
Part-of-Speech Tagging Friedrich-Alexander-Universität Professur für Computerlinguistik Nguyen Ai Huong 15.12.2011 Part-of-speech tagging Bestimmung von Wortform (part of speech) für jedes Wort in einem
MehrInhalt. Topics and Worksheets Vorwort Hinweise zum ActiveBook
Inhalt Vorwort Hinweise zum ActiveBook Topics and Worksheets... 1 Topic 1: Reading: Chasing the cheese... 2 Grammar: Simple past and present perfect revision... 4 Vocabulary: Naming parts of a picture...
MehrFormale Methoden III - Tutorium
Formale Methoden III - Tutorium Daniel Jettka 08.05.06 Anmeldung im ekvv Inhaltsverzeichnis 1. Aufgaben vom 27.04.06 1.1 Aufgabe 1 1.2 Aufgabe 2 1.3 Aufgabe 3 1.4 Aufgabe 4 1.5 Aufgabe 5 1.6 Aufgabe 6
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Statistische Grundlagen Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2016 1 / 21 Diskrete Wahrscheinlichkeitsräume (1) Carstensen et al. (2010), Abschnitt
MehrInterdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko
Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der SS 2016: Grossmann, Jenko Die Beschreibung orientiert sich am Begriffssystem der Beschreibung natürlicher Sprachen Sprache in der steht
MehrMultilinguales Information Retrieval, AG Datenbanken und Informationssysteme. Multilinguales Information Retrieval
Multilinguales Information Retrieval 1 Definition IR in einer anderen Sprache als Englisch IR auf einer einsprachigen Dokumentensammlung, die in mehreren Sprachen befragt werden kann. Information Retrieval
MehrFACULTY OF LANGUAGES
FACULTY OF LANGUAGES SYLLABUS FOR CERTIFICATE COURSE IN GERMAN (PART TIME) (SEMESTER: I II) EXAMINATIONS: 2016 17 GURU NANAK DEV UNIVERSITY AMRITSAR Note: (i) (ii) Copy rights are reserved. Nobody is allowed
MehrVorbesprechung Mathe III
Vorbesprechung Mathe III Dr. Vera Demberg, Prof. Dr. Enrico Lieblang (HTW) Universität des Saarlandes April 19th, 2012 Vera Demberg (UdS) Vorbesprechung Mathe III April 19th, 2012 1 / 20 Formalien Pflichtveranstaltung
Mehr8. Mai Humboldt-Universität zu Berlin. LingPipe. Mark Kibanov und Maik Lange. Index. Allgemeine Infos. Features
Humboldt-Universität zu Berlin 8. Mai 2008 1 2 logistic regression 3 Benutzer 4 Fazit 5 Quellen Was ist? is a suite of Java libraries for the linguistic analysis of human. Was ist? is a suite of Java libraries
MehrImproving Part-Of-Speech Tagging for Social Media via Automatic Spelling Error Correction
Improving Part-Of-Speech Tagging for Social Media via Automatic Spelling Error Correction Vorstellung AI-Studienprojekt für das SoSe 2019 Benedikt Tobias Bönninghoff 17.01.2019 Cognitive Signal Processing
MehrKombiniertes transformations-basiertes Lernen erweiterter Chunks
Kombiniertes transformations-basiertes Lernen erweiterter Chunks Markus Dreyer Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg dreyer@cl.uni-heidelberg.de Abstract Chunking beschränkt
MehrFaktivität und Theory of Mind / Komplexe Syntax und Theory of mind
Faktivität und Theory of Mind / Komplexe Syntax und Theory of mind Semantik im normalen und gestörten Spracherwerb Prof. Dr. Petra Schulz Referentin: Carolin Ickstadt Gliederung Definition: False belief
MehrHEALTH Institut für Biomedizin und Gesundheitswissenschaften
HEALTH Institut für Biomedizin und Gesundheitswissenschaften Konzept zur Verbesserung eines klinischen Information Retrieval Systems unter Verwendung von Apache UIMA und medizinischen Ontologien Georg
MehrErkennung und Visualisierung attribuierter Phrasen in Poetiken
Erkennung und Visualisierung attribuierter Phrasen in Poetiken Andreas Müller (1) Markus John (2) Steffen Koch (2) Thomas Ertl (2) Jonas Kuhn (1) (1), Universität Stuttgart (2) Institut für Visualisierung
MehrKorpuslinguistik. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, Korpuslinguistik. Jürgen Spitzmüller.
Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, 7.12.2004 1. Teil: Theorie Grundlegende theoretische Fragestellungen: Was sind überhaupt Korpora? Wozu Korpora? Was sollen Korpora
MehrGrundkurs Linguistik Wintersemester 2014/15. Syntax. Anja Latrouite
Grundkurs Linguistik Wintersemester 2014/15 Syntax Anja Latrouite Von der Morphologie zur Syntax Morpheme sind das Baumaterial für Wörter sind das Baumaterial für Phrasen sind das Baumaterial für Teilsätze
MehrSatzklammer annotieren und Tags korrigieren Ein mehrstufiges Top-Down-Bottom-Up - System zur flachen, robusten Annotierung von Sätzen im Deutschen
Satzklammer annotieren und Tags korrigieren Ein mehrstufiges Top-Down-Bottom-Up - System zur flachen, robusten Annotierung von Sätzen im Deutschen Frank Henrik Müller und Tylman Ule Zusammenfassung Der
MehrSemantik und Pragmatik
Semantik und Pragmatik SS 2005 Universität Bielefeld Teil 4, 6. Mai 2005 Gerhard Jäger Semantik und Pragmatik p.1/35 Prädikatenlogik: atomare Formeln Syntax JO, BERTIE, ETHEL, THE-CAKE... sind Individuenkonstanten
MehrKünstliche Intelligenz Sprachverarbeitung mit Prolog
Künstliche Intelligenz Sprachverarbeitung mit Prolog Stephan Schwiebert WS 2009/2010 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Parsing mit Prolog Grammatik Wortartenklassifikation,
MehrGrade 12: Qualifikationsphase. My Abitur
Grade 12: Qualifikationsphase My Abitur Qualifikationsphase Note 1 Punkte Prozente Note 1 15 14 13 85 % 100 % Note 2 12 11 10 70 % 84 % Note 3 9 8 7 55 % 69 % Note 4 6 5 4 40 % 54 % Note 5 3 2 1 20 % 39
MehrHidden Markov Models in Anwendungen
Hidden Markov Models in Anwendungen Dr. Vera Demberg Universität des Saarlandes 31. Mai 2012 Vera Demberg (UdS) HMM Anwendungen 31. Mai 2012 1 / 26 Hidden Markov Modelle in der Computerlinguistik Table
MehrEinführung in die Computerlinguistik. Morphologie III
Einführung in die Computerlinguistik Morphologie III Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 7.12.2015 Schütze & Zangenfeind: Morphologie III
MehrWortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank
Wortdekodierung Vorlesungsunterlagen Speech Communication 2, SS 2004 Franz Pernkopf/Erhard Rank Institute of Signal Processing and Speech Communication University of Technology Graz Inffeldgasse 16c, 8010
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Thomas Vanck
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-Pipeline Tobias Scheffer Thomas Vanck NLP-Pipeline Folge von Verarbeitungsschritten für Informationsextraktion, Übersetzung,
MehrInstitut für Informatik Lehrstuhl Maschinelles Lernen
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-PipelinePipeline Tobias Scheffer Peter Haider Uwe Dick Paul Prasse NLP-Pipeline Folge von Verarbeitungsschritten für Informationsextraktion,
Mehr"Niels Meyer" Definition:
Definition: Quirk, Greenbaum, Leech und Svartvik definieren in A Grammar of contemporary English ein Kompositum als eine aus zwei oder mehreren Basen bestehende Einheit, die grammatisch und semantisch
MehrEinführung in unifikationsbasierte Grammatikformalismen
Universität Potsdam Institut für Linguistik Computerlinguistik Einführung in unifikationsbasierte Grammatikformalismen Thomas Hanneforth head: VP form: finite subj: pers: 3 num: pl Merkmalsstrukturen:
Mehrxii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis
Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....
MehrDiskriminatives syntaktisches Reranking für SMT
Diskriminatives syntaktisches Reranking für SMT Fortgeschrittene Themen der statistischen maschinellen Übersetzung Janina Nikolic 2 Agenda Problem: Ranking des SMT Systems Lösung: Reranking-Modell Nutzung
MehrA Topical/Local Classifier for Word Sense Idendification (TLC) Anne Schwartz
A Topical/Local Classifier for Word Sense Idendification (TLC) Anne Schwartz anne@coli.uni-sb.de A Topical/Local Classifier for Word Sense Idendification (TLC) entwickelt von: - Martin Chodorow (Dep. of
MehrInhaltsverzeichnis. Bibliografische Informationen digitalisiert durch
Inhaltsverzeichnis 1 Computerlinguistik - Was ist das? 1 1.1 Aspekte der Computerlinguistik 1 1.1.1 Computer linguistik: Die Wissenschaft 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen 3 1.1.3
MehrTransformation-Based Error-Driven Learning: Eine Fallstudie in Part of Speech Tagging
Transformation-Based Error-Driven Learning: Eine Fallstudie in Part of Speech Tagging Malte Helmert 23. Februar 2000 Seminar Autonome Mobile Systeme/Machine Learning Übersicht 1. Part of Speech Tagging
MehrTextmining Wissensrohstoff Text
Textmining Wissensrohstoff Text Wintersemester 2008/09 Teil 5 Chunking und Parsing Uwe Quasthoff Universität Leipzig Institut für Informatik quasthoff@informatik.uni-leipzig.de Zerlegung von Sätzen 1.
MehrTerminologie-Extraktion: Beispiel
Terminologie-Extraktion: Beispiel The major risks of long-term cardiotoxicity relate to treatment prior to the BMT, in particular, anthracyclines, ablative-dose Cytoxan (ie, dose > 150 mg/ kg), chest [radiation
MehrDIBELS TM. German Translations of Administration Directions
DIBELS TM German Translations of Administration Directions Note: These translations can be used with students having limited English proficiency and who would be able to understand the DIBELS tasks better
MehrHarry gefangen in der Zeit Begleitmaterialien
Episode 011 Grammar 1. Plural forms of nouns Most nouns can be either singular or plural. The plural indicates that you're talking about several units of the same thing. Ist das Bett zu hart? Sind die
MehrDer VITERBI-Algorithmus
Der VITERBI-Algorithmus Hauptseminar Parsing Sommersemester 2002 Lehrstuhl für Computerlinguistik Universität Heidelberg Thorsten Beinhorn http://janus.cl.uni-heidelberg.de/~beinhorn 2 Inhalt Ziel des
MehrTagging von Online-Blogs
Tagging von Online-Blogs Gertrud Faaß (vertreten durch Josef Ruppenhofer) STTS tagset and tagging: special corpora 24. September 2012 Faaß MODEBLOGS 1 Korpuslinguistische studentische Projekte am IwiSt
MehrGrammatikformalismen SS 2007 Ausgewählte Musterlösungen Schreiben Sie eine LFG-Grammatik, die Sätze der folgenden Form erkennt:
Grammatikformalismen SS 2007 Ausgewählte usterlösungen 1 LFG Übungsblatt LFG 1 1. Schreiben Sie eine LFG-Grammatik, die Sätze der folgenden Form erkennt: (1) Der Lehrer schläft. (2) Sie schenkt dem Lehrer
MehrProbabilistische kontextfreie Grammatiken und Parsing. Sebastian Pado
Probabilistische kontextfreie Grammatiken und Parsing Sebastian Pado 18.01.2005 1 Robustes Parsing Ziel: Syntaktische Analyse von freiem Text Anwendungen: Freier Dialog Große Textmengen (Internet) Herausforderungen
MehrFACULTY OF LANGUAGES
FACULTY OF LANGUAGES SYLLABUS FOR DIPLOMA COURSE IN GERMAN (PART TIME) (SEMESTER: I II) EXAMINATIONS: 2016 17 GURU NANAK DEV UNIVERSITY AMRITSAR Note: (i) (ii) Copy rights are reserved. Nobody is allowed
MehrIm Original veränderbare Word-Dateien
Schulaufgabe aus dem Englischen Klasse:... Name:... gehalten am:... 1. Dictation 2. Compare these things! Take the given adjectives in brackets and use the comparative once and the superlative once. (1)
Mehr