PHRASENERKENNUNG IM ENGLISCHEN
|
|
- Babette Hoch
- vor 5 Jahren
- Abrufe
Transkript
1 Centrum für Informations- und Sprachverarbeitung (CIS) Michaela Geierhos PHRASENERKENNUNG IM ENGLISCHEN mit kaskadierten lokalen Grammatiken, linguistischen Filtern und diversen statistischen Methoden 24. Januar 2007
2 Begriff der Phrase Was versteht man unter einer Phrase? Die Phrase (griechisch φράση, phrássi - der Satz, Ausdruck, die Wendung) bezeichnet in der Linguistik gemeinhin Satzteile, die nur geschlossen im Satz verschoben werden können. Während der Begriff Satzglied auf der syntaktischen Ebene angesiedelt ist, sagt der Begriff Phrase etwas über die kategoriale Füllung dieser Satzglieder. So werden im Allgemeinen Nominalphrase (NP), Verbalphrase (VP), Präpositionalphrase (PP), Adjektivphrase (AP) und Adverbialphrase (AdvP) voneinander unterschieden. Ohne den Begriff der Phrase wären viele computerlinguistische Modelle nicht vorstellbar. So sind sie grundlegender Baustein von Grammatiken, insbesondere von Phrasenstrukturgrammatiken. Michaela Geierhos, # 2
3 Beispiele für englische Phrasen Realisierungen englischer Phrasen absence of mind = Zerstreutheit auto liability insurance = Kfz-Haftpflichtversicherung axis of ordinates = y-achse free practice of religion = freie Religionsausübung against doctor s orders = entgegen ärztl. Anweisung of unknown paternity = Vater unbekannt Uncle Sam = Vater Staat to live the life of Riley = Leben wie Gott in Frankreich Quelle: Michaela Geierhos, # 3
4 Phrasenerkennung nach Petra Maier-Meyer Phrasenerkennung als vermeintliche Blackbox Michaela Geierhos, # 4
5 Phrasenerkennung nach Petra Maier-Meyer Mögliche Vorgehensweise bei der Phrasenerkennung (Teil I) Normalisierung des Eingabetextes (Korpus) Großschreibung wird auf Kleinschreibung abgebildet Part-of-Speech-Tagging (POS-Tagger = CISTAGGER) Mustererkennung und -extraktion => Liste von Phrasen-Kandidaten bestehend aus Vektoren der Form <Phrase, Grundform, POS-Sequenz> Anwendung linguistischer Filter Korrektur von möglichen Tagging-Fehlern Bereinigung von unsauberem Input Stoppphrasen (Stoppwörter auf Phrasenebene) Disambiguierung von Wortarten Will <=> will, Eigenname/Vorname/Nomen vs. Hilfsverb Michaela Geierhos, # 5
6 Phrasenerkennung nach Petra Maier-Meyer Part-of-Speech Tagging (Beispiel eines POS-Tagger Outputs) <tok><sur> </sur><lem cat="bos" mor=""></lem></tok> <tok><sur>36</sur><lem cat="adj" mor=":4">36</lem></tok> <tok><sur>strategies</sur><lem cat="n" mor=":m">strategy</lem></tok> <tok><sur>of</sur><lem cat="prep" mor="">of</lem></tok> <tok><sur>ancient</sur><lem cat="adj" mor=":b">ancient</lem></tok> <tok><sur>china</sur><lem cat="n" mor=":e">china</lem></tok> <tok><sur>:</sur><lem cat="pun" mor="">:</lem></tok> <tok><sur>.</sur><lem cat="eos" mor=""></lem></tok> Michaela Geierhos, # 6
7 Phrasenerkennung nach Petra Maier-Meyer Part-of-Speech Tagging (Struktur der Tagging-Information) <tok><sur> </sur><lem cat="bos" mor=""></lem></tok> TOKEN SURFACE FORM BEGIN OF SPEECH LEMMA FORM <tok><sur>china</sur><lem cat="n" mor=":e">china</lem></tok> LEXIKALISCHE KATEGORIE MORPHOLOGISCHES MERKMAL Michaela Geierhos, # 7
8 Phrasenerkennung nach Petra Maier-Meyer Mustererkennung und -extraktion innerhalb von Kontexten mögliche Kontexte sind Interpunktion Konjunktionen Artikel, weitere Determinatoren Verben etc. mögliche kontextuelle Phrasenmuster sind cnj n n pun det n prep n pun det adj n v etc. Michaela Geierhos, # 8
9 Phrasenerkennung nach Petra Maier-Meyer Vektoren von möglichen Phrasenkandidaten <The Art of War focus on, the art of war focus on, det n prep n n prep> <on military organization, on military organization, prep adj n pun> <and battlefield tactics, and battlefield tactics, cnj n n pun> <the Thirty-Six Strategies are, the thirty-six strategy be, det adj n v> <the fields of politics, the field of politics, det n prep n pun> <not only battlefield strategies, not only battlefield strategy, adv adj n n pun> Michaela Geierhos, # 9
10 Phrasenerkennung nach Petra Maier-Meyer Linguistische Filter: Was soll nicht als Nomen erkannt werden? according a day's days day eight five four friday half on i minute' s minutes minute monday month's months month nine of one percent quarter saturday second's seconds second seven six sunday ten three thursday time to tuesday two wednesday week's weeks week year's years Michaela Geierhos, # 10
11 Phrasenerkennung nach Petra Maier-Meyer Linguistische Filter: Was sind nicht-aussagekräftige Adjektive? able actual alone appropriate available a best better billion certain common concerned current different dozenth dozen earlier early eight-hundred possible present previous recent real second only specific special sure two-and-a-half two-hundred two-thousand twohundred twothousand useful usual various very whole working zero Michaela Geierhos, # 11
12 Phrasenerkennung nach Petra Maier-Meyer Linguistische Filter: Was sind zu allgemeine Phrasen? first round first time further details large numbers large portion last night last time least in principle little bit long term million people million pounds most part new year next door number of people original page other hand other side other things percentage points period of time point of view second half second place second time short term small group table of contents table of content take place the following time to time to order Michaela Geierhos, # 12
13 Phrasenerkennung nach Petra Maier-Meyer Welche Muster kommen für Nominalphrasen (NPs) in Frage? adj adj n.np adj adj en.np adj n n.np adj en n.np adj n en.np adj en en.np adj n prep n.np adje n prep n.np adj n prep en.np adj en prep en.np adj n.np adj en.np n n.np en n.np n en.np en en.np n n n.np en n n.np n en n.np n n en.np en en n.np en n en.np n en en.np en en en.np n prep adj n.np en prep adj n.np n prep adj en.np en prep adj en.np n prep n.np en prep n.np n prep en.np en prep en.np n prep n n.np en prep n n.np n prep en n.np n prep ne n.np en prep en n.np n prep en en.np en prep en en.np en prep n en.np Michaela Geierhos, # 13
14 Phrasenerkennung nach Petra Maier-Meyer Mögliche Vorgehensweise bei der Phrasenerkennung (Teil II) Statistische Verfahren zur Ermittlung der besten Phrasen Frequenzberechnung der Zitatform einer Phrase => <Phrase (Zitatform), Grundform, Frequenz> Bestimmung der kanonischen Form einer Phrase und deren Frequenz => <Phrase (Kanonische Form), Grundform, Frequenz> Sortieren nach Frequenz (optional) Filtern nach Frequenz Michaela Geierhos, # 14
15 Phrasenerkennung nach Petra Maier-Meyer Einige erkannte Phrasen im Beispieltext ¹ Art of War focus Balance Hide Beams With Rotten Timbers Borrowed Sword Burning House Chinese history Confucian notion of honor Corpse to Raise Dead Tree Distant Enemy Door to Catch Emperor to Cross Exhausted Enemy ¹ muenchen.de/~micha/kurse/korpuslinguistik- WS0607/phrasen/phrasenerkennung_bsptext.txt Locust Tree Master Tan Mountain Link Opportunity To Lead Opposite Shore Delay Plum Tree Role of Guest Secret Art of War Smile Charm Strategy of Beautiful Women Strategy of Sowing Discord Sun Tzu Tactic of Combining Tactics Thirty-Six Strategies Michaela Geierhos, # 15
16 Phrasenerkennung nach Petra Maier-Meyer Fehler bei der Phrasenerkennung: Welche Fehlertypen gibt es? Unvollständige Erkennung des linken Kontextes and -koordinierte Adjektivphrase oder Nominalphrase { most cunning and [subtle strategies] } { time and [place for battle] } Unvollständige Erkennung des rechten Kontextes Komma-separierte Aufzählung { [fields of politics], diplomacy, and espionage } Irrelevantes Adjektiv als Teil einer guten Phrase [only { battlefield strategies] } Michaela Geierhos, # 16
17 Phrasenerkennung nach Petra Maier-Meyer Fehler bei der Phrasenerkennung: Welche Fehlertypen gibt es? Vollständige unerkannte Phrasen im Text { Chinese military texts } { Chinese military works of strategy } Zu weite Erkennung im rechten Kontext in muss bei der lexikalischen Filterung als Nomen verboten werden { [short-term objectives } in order] Weitere Fehlertypen lassen sich mit dem Beispieltext der Demo unter ermitteln. Michaela Geierhos, # 17
18 Naive Phrasenerkennung mit Lokalen Grammatiken Können Lokale Grammatiken allein die Qualität der beschriebenen Phrasenerkennung nachempfinden? Die eben vorgestellten lexikalischen Muster lassen sich mühelos in Lokale Grammatiken umwandeln, welche vom System Unitex interpretiert werden können. Werden dieselben Phrasen wie zuvor erkannt? Die entsprechende Konkordanz gibt darüber Aufschluss WS0607/phrasen/naive_knk.html Michaela Geierhos, # 18
19 Naive Phrasenerkennung mit Lokalen Grammatiken Können Lokale Grammatiken allein die Qualität der beschriebenen Phrasenerkennung nachempfinden? Michaela Geierhos, # 19
20 Naive Phrasenerkennung mit Lokalen Grammatiken Denkfehler und Verbesserungen dieses naiven Ansatzes: Gleiche syntaktische Muster würden ähnliche Ergebnisse erzielen Ressourcenungleichheit auf Wörterbuchebene: => Unitex-System-Lexika vs. CISLEX-EN Lexika zur Filterung von unerwünschten Ambiguitäten auf lexikalischer Ebene fehlen noch diesem Ansatz Linguistische Filter in Form von Negativkontexten, Antigrammatiken oder Filterlexika müssen implementiert werden Verwendung von Phrasenlexika zur Verbesserung der Präzision Heuristiken als Ausschlussverfahren für zu allgemeine Kontexte oder für nicht-aussagekräftige Phrasen. Michaela Geierhos, # 20
21 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Verbesserungen: Umfassende Erweiterung der lexikalischen Datenbasis mit Fokus auf Mehrwortterme Eigennamen Personennamen, Vornamen, Nachnamen Organisationsnamen/Firmennamen typische adjektivische Kontexte von Firmen Ortsangaben/Lokativa/Geographische Entitäten geographische Adjektive und Nomina geographische Zugehörigkeiten (Nationaltiät, etc.) Berufsbezeichnungen (z.b. baby doctor) Menschenbezeichner (z.b. mother-in-law) Redewendungen (Idiome) Phrasenlexikon ( Michaela Geierhos, # 21
22 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Verbesserungen: Linguistische Filterlexika und -grammatiken Ausschluss nominaler Lesarten von lexikalisch ambigen Wörtern, wie z.b. a, as, in, etc. Ausschluss irrelevanter phraseneinleitender Adjektive Zahlen unbestimmte Zahlwörter, wie several, many, etc. Ausschluss unbedeutender Adverben another, other, only, etc. Grammatiken für Phrasengrenzen Was leitet eine Phrase ein? Wie sieht der rechte Kontext einer Phrase aus, der sicher eine Nominalphrase begrenzt? Satzende Verbalphrase Interpunktion (außer Komma) Antigrammatiken zur Abdeckung ungewollt erkannter Phrasen Michaela Geierhos, # 22
23 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Verbesserungen: Lemmatisierung komplexer englischer Zeitformen Systematische Ergänzungen und Erweiterungen des Graphenpakets zur Lemmatisierung komplexer Zeitformen von Maurice Gross fehlende Graphen erstellen Passivgraphen schematisieren Futurgraphen erweitern etc. Tagging des zu untersuchenden Korpus mit den Lemmatisierungsgraphen Interpretation der komplexen Verbalphrasen als Einheit (Token) Verbalphrasen als Indikatoren für Grenzen von Nominalphrasen Grammatiken für die Lemmatisierung einfacher englischer Zeitformen und Annotation dieser im Korpus leichtere Disambiguierung, z.b. to make up (Verb) vs. make up / make-up (Nomen) Markierung von Verbalphrasen als möglicher begrenzender Kontext für die gesuchten Nominalphrasen Michaela Geierhos, # 23
24 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Verbesserungen: Kaskadierung von Lokalen Grammatiken mit Lemmatisierungsgraphen getaggter Korpus wird zum Eingabetext für die Anwendung von Lokalen Grammatiken, welche Personennamen Organisationsnamen Ortsnamen Datumsangaben, etc. erkennen und annotieren. Die eben genannten Einheiten können wiederum Bestandteil von komplexeren Nominalphrasen sein. Die jeweilige semantische Information dieser Phrasen lässt sich in weiteren Graphen zur Abgrenzung von Phrasen oder zur Erweiterung dieser nutzen. Datumsangaben sind beispielsweise mögliche Grenzen Namen sind selbst komplex und meist Teil komplexerer Nominalphrasen, so dass sie sich als Einheit (XN+PR) taggen lassen. Michaela Geierhos, # 24
25 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg. Verbesserungen: Named-Entity-Recognition (NER) mit Lokalen Grammatiken (z.b. Personennamen) Michaela Geierhos, # 25
26 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Verbesserungen: Analyse und Beschreibung von phrasenspezifischen Elementen (z.b. geographische Adjektive). Michaela Geierhos, # 26
27 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Vorteile von kaskadierten Transduktoren. Erkennung von eigentlichen Verbalphrasen als potentielle Nominalphrasen wird vermieden (leichtere Disambiguierung) Getaggte Verbalphrasen dienen als Grenzmarkierung von Nominalphrasen Annotierte Namensphrasen können schematisiert als Teil neuer Phrasenmuster fungieren Vorteile detaillierter Beschreibung phraseninterner Kontexte Kombination von semantischer und syntaktischer Information grenzt potentielle Phrasen genauer ein gezielter Einsatz lexikalischer Ressourcen in engen Kontexten Michaela Geierhos, # 27
28 Phrasenerkennung mit Lokalen Grammatiken: BITE (Bilingual Term Extraction). Phrasenerkennung als Komponente in BITE Konkordanz auf dem Beispieltext mit den BITE-Graphen WS0607/phrasen/phrasen_bite.html Was ist auch an dieser Konkordanz offensichtlich? Es fehlen linguistische Filter. Es werden detaillierte und umfassendere Lexika benötigt. Vorverarbeitung (z.b. Bestimmung von Verbalphrasen) kann helfen die Nominalphrasengrenzen auszuloten. Gewisse statistische Nachbearbeitungsmethoden sind wichtig, um irrelevante Phrasenadjektive auszuschließen. Michaela Geierhos, # 28
Englisch-Grundwortschatz
Englisch-Grundwortschatz Die 100 am häufigsten verwendeten Wörter also auch so so in in even sogar on an / bei / in like wie / mögen their with but first only and time find you get more its those because
MehrMaschinelle Sprachverarbeitung: Part-of-Speech-Tagging
HUMBOLDT-UNIVERSITÄT ZU BERLIN Institut für Informatik Lehrstuhl Wissensmanagement Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging Tobias Scheffer Ulf Brefeld POS-Tagging Zuordnung der Wortart von
MehrLösungsvorschlag für das Übungsblatt 8. Aufgabe1.
Lösungsvorschlag für das Übungsblatt 8. Aufgabe1. 3 Det A N VP R6 4 Any A N VP L3 5 Any intelligent N VP L4 6 Any intelligent cat VP L2 Nach den Regeln kann der Satz weiter nicht erzeugt warden, deswegen
MehrPrepositions are words that give information to the reader. Vorwörter geben dem Leser Informationen.
What is the role of prepositions? Prepositions are words that give information to the reader. They can tell us where something takes place when something takes place why something takes place or give a
Mehr<APPOINT> BiographIE - Informationsextraktion aus biographischen Kontexten. Hauptseminar im Wintersemester 2009/2010
BiographIE - Informationsextraktion aus biographischen Kontexten Hauptseminar im Wintersemester 2009/2010 Dozenten: Prof. Franz Günthner, Michaela Geierhos Vortrag am 14.01.2010, Referentin:
MehrTextmining Information Extraction (symbolisch)
Textmining Information Extraction (symbolisch) Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Information Extraction (symbolisch) 1 / 22 Information
MehrProseminar Linguistische Annotation
Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation
MehrModerne deutsche Wortbildung
Birgit Lawrenz Moderne deutsche Wortbildung Phrasale Wortbildung im Deutschen: Linguistische Untersuchung und sprachdidaktische Behandlung Verlag Dr. Kovac Hamburg 2006 Inhaltsverzeichnis I. 1. Gegenstand
MehrSyntax. Ending Khoerudin Deutschabteilung FPBS UPI
Syntax Ending Khoerudin Deutschabteilung FPBS UPI Traditionale Syntaxanalyse Was ist ein Satz? Syntax: ein System von Regeln, nach denen aus einem Grundinventar kleinerer Einheiten (Wörter und Wortgruppen)
MehrSandy the Snail. 30 Finken Verlag
Story: Sandy the Snail Topics: animals friends days of the week Sandy the Snail Sandy is a little snail. She lives in a beautiful park with her mum and her dad. Sandy loves to crawl among big trees, green
Mehr[GEBEN SIE DEN TITEL DES DOKUMENTS EIN]
Präpositionen der Zeit ago after at before by during for from to/till/until in on past since to till / until within Zeitdauer vor dem jetzigen Zeitpunkt: five years ago vor fünf Jahren nach einem Ereignis:
MehrEigennamenerkennung mit großen lexikalischen Ressourcen. Jörg Didakowski BBAW
Eigennamenerkennung mit großen lexikalischen Ressourcen Jörg Didakowski BBAW Was sind Eigennamen? Sprachliche Zeichen (Eigennamen) das Bezeichnete (Named Entity) Was sind Eigennamen? Eigennamen bezeichnen
MehrTreeTagger. Deborah Watty
TreeTagger Deborah Watty POS-Tagging store Das ist ein Haus. Artikel Verb Artikel Nomen Nom The 1977 PCs could only store two pages Modalverb Adverb of data. Wir wissen: store kann Nomen oder Verb sein.
MehrPartielle Analyse von Personen-, Orts- und Zeitangaben in Texten aus der Museumsdokumentation
Partielle Analyse von Personen-, Orts- und Zeitangaben in Texten aus der Museumsdokumentation Martin Scholz martin.scholz@i8.informatik.uni-erlangen.de 05.02.2009 Inhalt Anwendungsfall: Goldschmiede-Texte
MehrSyntax natürlicher Sprachen
Syntax natürlicher Sprachen 03: Phrasen und Konstituenten Martin Schmitt Ludwig-Maximilians-Universität München 08.11.2017 Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 1 Themen der heutigen
MehrRegistration of residence at Citizens Office (Bürgerbüro)
Registration of residence at Citizens Office (Bürgerbüro) Opening times in the Citizens Office (Bürgerbüro): Monday to Friday 08.30 am 12.30 pm Thursday 14.00 pm 17.00 pm or by appointment via the Citizens
MehrGrammatik und Lexikon für Branchen/Sektoren Loreta Bakiu. Hauptseminar: Informationsextraktion aus biographische Kontexten
Grammatik und Lexikon für Branchen/Sektoren Loreta Bakiu Hauptseminar: Informationsextraktion aus biographische Kontexten Dozenten: Prof. Dr. Franz Guenthner Michaela Geierhos Centrum für Informations-
MehrGerlang 2 Winter 2013 Tentative schedule. Date Class Activity Preparation for next day
Gerlang 2 Winter 2013 Tentative schedule (NK = text: Deutsch: Na klar) WEEK ONE THEME: Wir gehen aus Objectives for Week One describe location of things talk about food understand service questions in
MehrContents / Inhalt. Lilijana Stepic, ERLERNEN WIR DIE ENGLISCHEN ZEITEN 205. Vorwort... und noch einige Tipps zum erfolgreichen Lernen
Contents / Inhalt Vorwort... und noch einige Tipps zum erfolgreichen Lernen Simple Present and Present Progressive / Präsens (Gegenwart und Verlaufsform der Gegenwart) 7_ Simple Present / Präsens 7 Use
MehrGerlang 5B Summer 2013
(NK = text: Deutsch: Na klar) DAY ONE: Do. 11/7 THEME: Wir gehen aus Gerlang 5B Summer 2013 Objectives for Day One describe location of things talk about food understand service questions in restaurant
MehrFuture plans. Exercise 1: Read the text below.
Exercise 1: Read the text below. Future plans Nächstes Jahr werde ich die Schule verlassen, weil ich die Schule hasse. Mit 18 werde ich einen Job finden. Ich möchte in einem Büro arbeiten, weil ich als
MehrDELA Wörterbücher ===========================================================
DELA Wörterbücher =========================================================== Der Umgang mit externen Ressourcen in Unitex Was man beim Erstellen eigener Lexika beachten sollte? Ein Vortrag von Michaela
MehrModern Foreign Languages
MFL1: To understand the verb werden and to be able to talk about future plans A) Match the English answers to the German. German Correct Answer English Ich werde spielen Du wirst spielen You will play
MehrOn a Sunday Morning summary
On a Sunday Morning summary Connect the English sentences and their German translation Verbinde die englischen Sätze mit ihrer deutschen Übersetzung The hedgehog was standing at the door of his house He
MehrGemeinde Gilching. Registration kindergarten for the school year 2018/2019
Gemeinde Gilching Registration kindergarten for the school year 2018/2019 ( ) My/our child did not attend a child-care center in Gilching in the school year 2017/2018 ( ) My/our child is currently attending
MehrErkennung und Visualisierung attribuierter Phrasen in Poetiken
Erkennung und Visualisierung attribuierter Phrasen in Poetiken Andreas Müller (1) Markus John (2) Steffen Koch (2) Thomas Ertl (2) Jonas Kuhn (1) (1), Universität Stuttgart (2) Institut für Visualisierung
MehrNamed Entity Recognition auf Basis von Wortlisten
Named Entity Recognition auf Basis von Wortlisten EDM SS 2017 Lukas Abegg & Tom Schilling Named Entity Recognition auf Basis von Wortlisten Lukas Abegg - Humboldt Universität zu Berlin Tom Schilling -
MehrGemeinde Gilching. Registration kindergarten for the school year 2016/2017
Gemeinde Gilching Registration kindergarten for the school year 2016/2017 ( ) My/our child did not attend a child-care center in Gilching in the school year 2015/2016 ( ) My/our child is currently attending
Mehr25 teams will compete in the ECSG Ghent 2017 Senior Class Badminton.
ECSG 2017 Badminton Briefing : Senior Class 25 teams will compete in the ECSG Ghent 2017 Senior Class Badminton. Including 8 Belgian, 1 Danish, 1 French, 21 German, and 1 Maltese Teams. Teams have been
MehrLevel 1 German, 2012
90886 908860 1SUPERVISOR S Level 1 German, 2012 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am Tuesday 13 November 2012 Credits: Five Achievement
MehrNamed Entity Recognition (NER)
Named Entity Recognition (NER) Katharina Stein 01/12/2017 Named Entity Recognition 1 Inhalt Named Entity Recognition Was ist Named Entity Recognition? Bedeutung für Natural Language Processing Herausforderungen
MehrTeil 111. Chart-Parsing
Teil 111 Chart-Parsing 102 Die im ersten Teil des Buches behandelten einfachen Parsingalgorithmen sind, anders als die meisten vor allem im Compilerbau verwendeten Algorithmen (z.b. die LLoder LR-Parsingalgorithmen),
MehrSchule mit Erfolg. Englisch Simple present adverbs time Unit Blatt What time is it? 7.50 Uhr Uhr Uhr Uhr 20.
Englisch Simple present adverbs time Unit 3 2.1 Blatt 1 1. Vocabulary. a) Write down the opposites! big always after first late rude b) Put in the right prepositions. Luke gets up at 7 am the morning.
MehrINFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka
INFORMATIONSEXTRAKTION 1 22.12.09 Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION(IE) 1. Einleitung 2. Ziel der IE 3. Funktionalität eines IE-Systems 4. Beispiel 5. Übung
MehrNLP Eigenschaften von Text
NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen
MehrLevel 1 German, 2014
90886 908860 1SUPERVISOR S Level 1 German, 2014 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am Wednesday 26 November 2014 Credits: Five Achievement
MehrJOBS OF TEENAGERS CODE 250
JOBS OF TEENAGERS Fertigkeit Hören Relevante(r) Deskriptor(en) Deskriptor 1: Kann Gesprächen über vertraute Themen die Hauptpunkte entnehmen, wenn Standardsprache verwendet und auch deutlich gesprochen
MehrInformationsextraktion
Informationsextraktion Bestimmte Anwendungen bei der semantischen Verarbeitung erfordern keine tiefe linguistische Analyse mit exakter Disambiguierung (= eine einzige und korrekte Lesart). Hierzu gehört
MehrFranke & Bornberg award AachenMünchener private annuity insurance schemes top grades
Franke & Bornberg award private annuity insurance schemes top grades Press Release, December 22, 2009 WUNSCHPOLICE STRATEGIE No. 1 gets best possible grade FFF ( Excellent ) WUNSCHPOLICE conventional annuity
MehrABLAUF USI BÜRO INSKRIPTION im WS 18-19
ABLAUF USI BÜRO INSKRIPTION im WS 18-19 Der erste Teil der Kursplätze wurde online über MY USI DATA (ab Di, 18.09.2018) vergeben. Der zweite Teil der Kursplätze (ca. 5000) wird bei der Büro-Inskription
MehrSyntaktische Kategorien: Phrasenkategorien
Syntaktische Kategorien: Phrasenkategorien FLM0410 - Introdução à Linguística Alemã I Profa. Dra. Ma. Helena Voorsluys Battaglia Eugenio Braga 8974165 Márcio Ap. de Deus 7000382 Wörter Phrasen Satz Satz
MehrIvana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Morphologie. Sarah Bosch,
Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Morphologie Wiederholung Aufgabe 1 Was ist Morphologie, Morphem? 3 Aufgabe 1 Was ist Morphologie, Morphem? Teildisziplin der
MehrThe English Tenses Die englischen Zeitformen
The English Tenses Die englischen Zeitformen Simple Present (Präsens einfache Gegenwart) Handlungen in der Gegenwart die sich regelmäßig wiederholen oder einmalig geschehen I go you go he goes she goes
MehrSemantic Role Labeling im modernen Text-Analyse-Prozess
Semantic Role Labeling im modernen Text-Analyse-Prozess Bastian Haarmann info@bastianhaarmann.de http://www.bastianhaarmann.de Agenda I Text-Analyse-Prozesse 1. Motivation 2. Informationsextraktion 3.
MehrKünstliche Intelligenz Sprachverarbeitung mit Prolog
Künstliche Intelligenz Sprachverarbeitung mit Prolog Stephan Schwiebert WS 2009/2010 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Parsing mit Prolog Grammatik Wortartenklassifikation,
MehrKriminell gut Englisch 3 4: At the museum
Stefanie Pohlmann Kriminell gut Englisch 3 4: At the museum Spannende Detektivaufgaben zur Förderung der Basiskompetenzen im Englischunterricht der Grundschule Grundschule ul Stefanie Pohlmann Downloadauszug
MehrMagic Figures. We note that in the example magic square the numbers 1 9 are used. All three rows (columns) have equal sum, called the magic number.
Magic Figures Introduction: This lesson builds on ideas from Magic Squares. Students are introduced to a wider collection of Magic Figures and consider constraints on the Magic Number associated with such
MehrDIBELS TM. German Translations of Administration Directions
DIBELS TM German Translations of Administration Directions Note: These translations can be used with students having limited English proficiency and who would be able to understand the DIBELS tasks better
MehrCall Centers and Low Wage Employment in International Comparison
Wissenschaftszentrum Nordrhein-Westfalen Kulturwissenschaftliches Institut Wuppertal Institut für Klima, Umwelt, Energie Institut Arbeit und Technik Call Centers and Low Wage Employment in International
MehrDiskriminatives syntaktisches Reranking für SMT
Diskriminatives syntaktisches Reranking für SMT Fortgeschrittene Themen der statistischen maschinellen Übersetzung Janina Nikolic 2 Agenda Problem: Ranking des SMT Systems Lösung: Reranking-Modell Nutzung
MehrLokale Grammatik für resign und quit
Lokale Grammatik für resign und quit Hauptseminar Informationsextraktion aus biografischen Kontexten 28.01.2010 Katharina Groth Prof.Dr.F.Guenthner M.Geierhos Übersicht Struktur von resign Sätzen 1.Graph
MehrEin Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten. Click here if your download doesn"t start automatically
Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten Click here if your download doesn"t start automatically Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten Ein Stern in dunkler
MehrEinführung in die Computerlinguistik. Morphologie III
Einführung in die Computerlinguistik Morphologie III Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 7.12.2015 Schütze & Zangenfeind: Morphologie III
MehrEinführung Computerlinguistik. Konstituentensyntax II
Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 1 / 31 Take-away Phrasenstrukturgrammatik:
MehrGrade 12: Qualifikationsphase. My Abitur
Grade 12: Qualifikationsphase My Abitur Qualifikationsphase Note 1 Punkte Prozente Note 1 15 14 13 85 % 100 % Note 2 12 11 10 70 % 84 % Note 3 9 8 7 55 % 69 % Note 4 6 5 4 40 % 54 % Note 5 3 2 1 20 % 39
MehrAnalyse biographischer Ereignisse: 3. Beruflicher Werdegang
Analyse biographischer Ereignisse: 3. Beruflicher Werdegang Grammatik und Lexikon der Berufsbezeichnungen Referentin: Beate Vogg 10.12.09 Seminar: BiographIE Informationsextraktion aus biographischen Kontexten,
MehrGerman Section 29 - Online activitites
No. 01 Die Uhr The clock Es ist zehn Uhr. It's ten o'clock. Es ist fünf nach zehn. It's five past ten. Es ist zehn nach zehn. It's ten past ten. Es ist Viertel nach zehn. It's a quarter past ten. Es ist
Mehr"What's in the news? - or: why Angela Merkel is not significant
"What's in the news? - or: why Angela Merkel is not significant Andrej Rosenheinrich, Dr. Bernd Eickmann Forschung und Entwicklung, Unister GmbH, Leipzig UNISTER Seite 1 Unister Holding UNISTER Seite 2
MehrLevel 2 German, 2015
91126 911260 2SUPERVISOR S Level 2 German, 2015 91126 Demonstrate understanding of a variety of written and / or visual German text(s) on familiar matters 2.00 p.m. Friday 4 December 2015 Credits: Five
MehrLudwig-Maximilians Universität München Centrum für Informations -und Sprachverarbeitung
Ludwig-Maximilians Universität München Centrum für Informations -und Sprachverarbeitung Informationsextraktion aus biographischen Kontexten Dozenten: Professor Dr. F. Guenthner Michaela Geierhos Lokale
MehrABLAUF USI BÜRO INSKRIPTION
ABLAUF USI BÜRO INSKRIPTION Der erste Teil der Kursplätze wurde online über MY USI DATA (ab Di, 16.02.2016) vergeben. Der zweite Teil der Kursplätze (ca. 4000) wird bei der Büro-Inskription vergeben. Am
MehrDeutsche Grammatik WS 14/15. Kerstin Schwabe
Deutsche Grammatik WS 14/15 Kerstin Schwabe Generelle Information Dr. Kerstin Schwabe Zentrum für Allgemeine Sprachwissenschaft Schützenstraße 18, R. 432 10117 Berlin Tel.: 20192410 E-mail: schwabe@zas.gwz-berlin.de
MehrInformationsextraktionssystem ANNIE
Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 10/11 Inhalt 1 Einführung: Informationsextraktion Begriffsklärung eines Informationsextraktionssystems 2 Einführung in Getting Started
MehrSatzglieder und Gliedteile. Duden
Satzglieder und Gliedteile Duden 1.1-1.3 1. Valenz: Ergänzungen und Angaben - Verb (bzw. Prädikat) bestimmt den Satz syntaktisch und semantisch [Anna] stellte [rasch] [eine Kerze] [auf den Tisch]. - Neben
Mehrdie Band Freunde besuchen fernsehen Aufkleber sammeln
das Konzert die Band Freunde besuchen reiten Flugzeuge sammeln fernsehen Aufkleber sammeln im Schulcafé arbeiten Sport machen ins Kino gehen Mein Zimmer aufräumen ins Schwimmbad gehen Was machst du in
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Peter Haider Uwe Dick Paul Prasse
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-Pipeline Tobias Scheffer Peter Haider Uwe Dick Paul Prasse NLP-Pipeline Folge von Verarbeitungsschritten für Informationsextraktion,
MehrAutomatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen
Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen Mark Reinke Bachelorarbeit TU Dresden 17. Februar 2014 Webtabellen Warum sind Webtabellen von Bedeutung? Sie können relationale
MehrExercise (Part XI) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1
Exercise (Part XI) Notes: The exercise is based on Microsoft Dynamics CRM Online. For all screenshots: Copyright Microsoft Corporation. The sign ## is you personal number to be used in all exercises. All
MehrLevel 1 German, 2013
90883 908830 1SUPERVISOR S Level 1 German, 2013 90883 Demonstrate understanding of a variety of spoken German texts on areas of most immediate relevance 9.30 am Tuesday 12 November 2013 Credits: Five Achievement
MehrElectrical tests on Bosch unit injectors
Valid for Bosch unit injectors with order numbers 0 414 700 / 0 414 701 / 0 414 702 Parts Kit Magnet*: - F00H.N37.925 - F00H.N37.933 - F00H.N37.934 * For allocation to the 10-place Bosch order number,
MehrModul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen
Institut für Computerlinguistik Sprachtechnologie in den Digital Humanities Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen Simon
MehrSwantje Westpfahl & Thomas Schmidt POS für(s) FOLK
Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus
MehrWortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank
Wortdekodierung Vorlesungsunterlagen Speech Communication 2, SS 2004 Franz Pernkopf/Erhard Rank Institute of Signal Processing and Speech Communication University of Technology Graz Inffeldgasse 16c, 8010
MehrTube Analyzer LogViewer 2.3
Tube Analyzer LogViewer 2.3 User Manual Stand: 25.9.2015 Seite 1 von 11 Name Company Date Designed by WKS 28.02.2013 1 st Checker 2 nd Checker Version history Version Author Changes Date 1.0 Created 19.06.2015
MehrSeminar Sicherheit und Softwareengineering WS 2013 / Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS
Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS Requirements Documents Was sind Requirements Documents? Anforderungsdokumente in industriellen Software-Projekten Häufig in natürlicher Sprache
Mehr1. A number has 6 in the tenths place, 4 in the ones place, and 5 in the hundredths place. Write the number.
Englische Übungen zu Dezimalzahlen Bemerkung: Im Englischen schreibt man einen Punkt als Komma ( decimal point ). 1. A number has 6 in the tenths place, 4 in the ones place, and 5 in the hundredths place.
MehrSprachproduktion: grammatische Enkodierung nach Levelt 1989 bzw. Kempen & Hoenkamp 1987
Sprachproduktion: grammatische Enkodierung nach Levelt 989 bzw. Kempen & Hoenkamp 987 dargestellt nach Schade & Eikmeyer 2003: Produktion von Syntagmen. In: Rickheit, G., Herrmann, T. & Deutsch, W.: (eds)
MehrVortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09)
Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012 Referent: Florian Kalisch (GR09) Rückblick Aktueller Status Einführung in Text-Mining Der Text-Mining Prozess
Mehr❶ Hier siehst du Beispiele für die Pluralbildung im Englischen. Schreibe unter jedes Beispiel zwei weitere Nomen, die ihren Plural genauso bilden.
4 Singular und Plural ❶ Hier siehst du Beispiele für die Pluralbildung im Englischen. Schreibe unter jedes Beispiel zwei weitere Nomen, die ihren Plural genauso bilden. Tipp: Wenn dir keine Nomen einfallen,
MehrLinguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets
Linguistische Grundlagen Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets Warum Tagging? Abfragbarkeit linguistischer Information Generalisierbarkeit von Abfragen
MehrMeine Lernlandkarte. für UNIT 1. andere sprechen. Ich kann etwas. verneinen. Ich kann über mich, meine Schule und. Stundenpläne sprechen.
Meine Lernlandkarte für UNIT 1 Ich kenne die Zahlen von 1 20. Ich kann über Stundenpläne sprechen. Ich kann mich und meine Familie vorstellen. 1.2 1.3 1.1 Hier stehen die Lernschwerpunkte für Unit 1. Schätze
MehrProjektseminar "Texttechnologische Informationsmodellierung"
Projektseminar "Texttechnologische Informationsmodellierung" Ziel dieser Sitzung Nach dieser Sitzung sollten Sie: Einige standards und projekte vom Namen her kennen Einen Überblick über und einen Eindruck
MehrFASTUS: Ein System zur Informationsextraktion mit Transduktoren
FASTUS: Ein System zur Informationsextraktion mit Transduktoren (Systembeschreibung) Branimira Nikolova HS Endliche Automaten für die Sprachverarbeitung SS 2004 Dr. Karin Haenelt Information Extraction
MehrEinführung in die Sprachwissenschaft des Deutschen Syntax II. PD Dr. Alexandra Zepter
Einführung in die Sprachwissenschaft des Deutschen Syntax II PD Dr. Alexandra Zepter Systemorientierte theoretische Linguistik Pragmatik: Textlinguistik (Semiotik) Semantik Syntax Morphologie Phonetik/Phonologie
MehrWortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin
Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin 27.01.2016 Phänomen In gesprochenem Deutsch wird wortfinales Schwa oft weggelassen ich
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Paul Prasse Michael Großhans
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-Pipeline Tobias Scheffer Paul Prasse Michael Großhans NLP- (Natural Language Processing-) Pipeline Folge von Verarbeitungsschritten
MehrSprachtechnologie. Fraunhofer-Institut für Angewandte Informationstechnik FIT. Katja Niemann Maren Scheffel
Sprachtechnologie Fraunhofer-Institut für Angewandte Informationstechnik FIT Katja Niemann Maren Scheffel Inhalt Was ist Sprachtechnologie? Computerlinguistische Anwendungen Praktische Beispiele MACE Schlüsselaktionen
MehrDienstleistungsmanagement Übung 5
Dienstleistungsmanagement Übung 5 Univ.-Prof. Dr.-Ing. Wolfgang Maass Chair in Economics Information and Service Systems (ISS) Saarland University, Saarbrücken, Germany Besprechung Übungsblatt 4 Slide
MehrFEM Isoparametric Concept
FEM Isoparametric Concept home/lehre/vl-mhs--e/folien/vorlesung/4_fem_isopara/cover_sheet.tex page of 25. p./25 Table of contents. Interpolation Functions for the Finite Elements 2. Finite Element Types
MehrLemmatisierung und Stemming in Suchmaschinen
Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2016 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)
MehrLemmatisierung und Stemming in Suchmaschinen
Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2014 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)
MehrFachbereich 5 Wirtschaftswissenschaften Univ.-Prof. Dr. Jan Franke-Viebach
1 Universität Siegen Fachbereich 5 Wirtschaftswissenschaften Univ.-Prof. Dr. Jan Franke-Viebach Klausur International Financial Markets Sommersemester 2010 (2. Prüfungstermin) Bearbeitungszeit: 60 Minuten
Mehrentschuldigung well / good
Allgemein ja nein vielleicht bitte danke entschuldigung alles klar Ich verstehe (nicht) Sprechen Sie Deutsch? Ich spreche kein Deutsch Hilfe! Ein bisschen langsamer bitte Gesundheit! Prost! wo wann wer
MehrAutomatische Erkennung von Organisationsnamen in Englischsprachigen Wirtschaftsnachrichten. Dissertation von Friederike Mallchok
Automatische Erkennung von Organisationsnamen in Englischsprachigen Wirtschaftsnachrichten Dissertation von Friederike Mallchok Vortragsgliederung: 1. Definition Named Entity Recognition 2. Evaluation
MehrFinite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010
Finite-State-Morphologie in XLE Grammatikentwicklung, SS 2010 1 / 20 Worum es heute geht: Nutzen von Finite-State-Morphologien... und wie man sie in XLE einbaut 2 / 20 Lexikon in XLE Bis jetzt: so genanntes
MehrWhen you use any of these prepositions, you need to put the noun or pronoun following them into the accusative case. For example:
Accusative Prepositions Up to now, we ve been using the accusative case only for direct objects. There is another part of speech that requires the accusative case in German: the accusative prepositions.
MehrAutomatisches Verstehen gesprochener Sprache
Automatisches Verstehen gesprochener Sprache 6. Syntaxanalyse Martin Hacker Bernd Ludwig Günther Görz Professur für Künstliche Intelligenz Department Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg
Mehr