PHRASENERKENNUNG IM ENGLISCHEN

Größe: px
Ab Seite anzeigen:

Download "PHRASENERKENNUNG IM ENGLISCHEN"

Transkript

1 Centrum für Informations- und Sprachverarbeitung (CIS) Michaela Geierhos PHRASENERKENNUNG IM ENGLISCHEN mit kaskadierten lokalen Grammatiken, linguistischen Filtern und diversen statistischen Methoden 24. Januar 2007

2 Begriff der Phrase Was versteht man unter einer Phrase? Die Phrase (griechisch φράση, phrássi - der Satz, Ausdruck, die Wendung) bezeichnet in der Linguistik gemeinhin Satzteile, die nur geschlossen im Satz verschoben werden können. Während der Begriff Satzglied auf der syntaktischen Ebene angesiedelt ist, sagt der Begriff Phrase etwas über die kategoriale Füllung dieser Satzglieder. So werden im Allgemeinen Nominalphrase (NP), Verbalphrase (VP), Präpositionalphrase (PP), Adjektivphrase (AP) und Adverbialphrase (AdvP) voneinander unterschieden. Ohne den Begriff der Phrase wären viele computerlinguistische Modelle nicht vorstellbar. So sind sie grundlegender Baustein von Grammatiken, insbesondere von Phrasenstrukturgrammatiken. Michaela Geierhos, # 2

3 Beispiele für englische Phrasen Realisierungen englischer Phrasen absence of mind = Zerstreutheit auto liability insurance = Kfz-Haftpflichtversicherung axis of ordinates = y-achse free practice of religion = freie Religionsausübung against doctor s orders = entgegen ärztl. Anweisung of unknown paternity = Vater unbekannt Uncle Sam = Vater Staat to live the life of Riley = Leben wie Gott in Frankreich Quelle: Michaela Geierhos, # 3

4 Phrasenerkennung nach Petra Maier-Meyer Phrasenerkennung als vermeintliche Blackbox Michaela Geierhos, # 4

5 Phrasenerkennung nach Petra Maier-Meyer Mögliche Vorgehensweise bei der Phrasenerkennung (Teil I) Normalisierung des Eingabetextes (Korpus) Großschreibung wird auf Kleinschreibung abgebildet Part-of-Speech-Tagging (POS-Tagger = CISTAGGER) Mustererkennung und -extraktion => Liste von Phrasen-Kandidaten bestehend aus Vektoren der Form <Phrase, Grundform, POS-Sequenz> Anwendung linguistischer Filter Korrektur von möglichen Tagging-Fehlern Bereinigung von unsauberem Input Stoppphrasen (Stoppwörter auf Phrasenebene) Disambiguierung von Wortarten Will <=> will, Eigenname/Vorname/Nomen vs. Hilfsverb Michaela Geierhos, # 5

6 Phrasenerkennung nach Petra Maier-Meyer Part-of-Speech Tagging (Beispiel eines POS-Tagger Outputs) <tok><sur> </sur><lem cat="bos" mor=""></lem></tok> <tok><sur>36</sur><lem cat="adj" mor=":4">36</lem></tok> <tok><sur>strategies</sur><lem cat="n" mor=":m">strategy</lem></tok> <tok><sur>of</sur><lem cat="prep" mor="">of</lem></tok> <tok><sur>ancient</sur><lem cat="adj" mor=":b">ancient</lem></tok> <tok><sur>china</sur><lem cat="n" mor=":e">china</lem></tok> <tok><sur>:</sur><lem cat="pun" mor="">:</lem></tok> <tok><sur>.</sur><lem cat="eos" mor=""></lem></tok> Michaela Geierhos, # 6

7 Phrasenerkennung nach Petra Maier-Meyer Part-of-Speech Tagging (Struktur der Tagging-Information) <tok><sur> </sur><lem cat="bos" mor=""></lem></tok> TOKEN SURFACE FORM BEGIN OF SPEECH LEMMA FORM <tok><sur>china</sur><lem cat="n" mor=":e">china</lem></tok> LEXIKALISCHE KATEGORIE MORPHOLOGISCHES MERKMAL Michaela Geierhos, # 7

8 Phrasenerkennung nach Petra Maier-Meyer Mustererkennung und -extraktion innerhalb von Kontexten mögliche Kontexte sind Interpunktion Konjunktionen Artikel, weitere Determinatoren Verben etc. mögliche kontextuelle Phrasenmuster sind cnj n n pun det n prep n pun det adj n v etc. Michaela Geierhos, # 8

9 Phrasenerkennung nach Petra Maier-Meyer Vektoren von möglichen Phrasenkandidaten <The Art of War focus on, the art of war focus on, det n prep n n prep> <on military organization, on military organization, prep adj n pun> <and battlefield tactics, and battlefield tactics, cnj n n pun> <the Thirty-Six Strategies are, the thirty-six strategy be, det adj n v> <the fields of politics, the field of politics, det n prep n pun> <not only battlefield strategies, not only battlefield strategy, adv adj n n pun> Michaela Geierhos, # 9

10 Phrasenerkennung nach Petra Maier-Meyer Linguistische Filter: Was soll nicht als Nomen erkannt werden? according a day's days day eight five four friday half on i minute' s minutes minute monday month's months month nine of one percent quarter saturday second's seconds second seven six sunday ten three thursday time to tuesday two wednesday week's weeks week year's years Michaela Geierhos, # 10

11 Phrasenerkennung nach Petra Maier-Meyer Linguistische Filter: Was sind nicht-aussagekräftige Adjektive? able actual alone appropriate available a best better billion certain common concerned current different dozenth dozen earlier early eight-hundred possible present previous recent real second only specific special sure two-and-a-half two-hundred two-thousand twohundred twothousand useful usual various very whole working zero Michaela Geierhos, # 11

12 Phrasenerkennung nach Petra Maier-Meyer Linguistische Filter: Was sind zu allgemeine Phrasen? first round first time further details large numbers large portion last night last time least in principle little bit long term million people million pounds most part new year next door number of people original page other hand other side other things percentage points period of time point of view second half second place second time short term small group table of contents table of content take place the following time to time to order Michaela Geierhos, # 12

13 Phrasenerkennung nach Petra Maier-Meyer Welche Muster kommen für Nominalphrasen (NPs) in Frage? adj adj n.np adj adj en.np adj n n.np adj en n.np adj n en.np adj en en.np adj n prep n.np adje n prep n.np adj n prep en.np adj en prep en.np adj n.np adj en.np n n.np en n.np n en.np en en.np n n n.np en n n.np n en n.np n n en.np en en n.np en n en.np n en en.np en en en.np n prep adj n.np en prep adj n.np n prep adj en.np en prep adj en.np n prep n.np en prep n.np n prep en.np en prep en.np n prep n n.np en prep n n.np n prep en n.np n prep ne n.np en prep en n.np n prep en en.np en prep en en.np en prep n en.np Michaela Geierhos, # 13

14 Phrasenerkennung nach Petra Maier-Meyer Mögliche Vorgehensweise bei der Phrasenerkennung (Teil II) Statistische Verfahren zur Ermittlung der besten Phrasen Frequenzberechnung der Zitatform einer Phrase => <Phrase (Zitatform), Grundform, Frequenz> Bestimmung der kanonischen Form einer Phrase und deren Frequenz => <Phrase (Kanonische Form), Grundform, Frequenz> Sortieren nach Frequenz (optional) Filtern nach Frequenz Michaela Geierhos, # 14

15 Phrasenerkennung nach Petra Maier-Meyer Einige erkannte Phrasen im Beispieltext ¹ Art of War focus Balance Hide Beams With Rotten Timbers Borrowed Sword Burning House Chinese history Confucian notion of honor Corpse to Raise Dead Tree Distant Enemy Door to Catch Emperor to Cross Exhausted Enemy ¹ muenchen.de/~micha/kurse/korpuslinguistik- WS0607/phrasen/phrasenerkennung_bsptext.txt Locust Tree Master Tan Mountain Link Opportunity To Lead Opposite Shore Delay Plum Tree Role of Guest Secret Art of War Smile Charm Strategy of Beautiful Women Strategy of Sowing Discord Sun Tzu Tactic of Combining Tactics Thirty-Six Strategies Michaela Geierhos, # 15

16 Phrasenerkennung nach Petra Maier-Meyer Fehler bei der Phrasenerkennung: Welche Fehlertypen gibt es? Unvollständige Erkennung des linken Kontextes and -koordinierte Adjektivphrase oder Nominalphrase { most cunning and [subtle strategies] } { time and [place for battle] } Unvollständige Erkennung des rechten Kontextes Komma-separierte Aufzählung { [fields of politics], diplomacy, and espionage } Irrelevantes Adjektiv als Teil einer guten Phrase [only { battlefield strategies] } Michaela Geierhos, # 16

17 Phrasenerkennung nach Petra Maier-Meyer Fehler bei der Phrasenerkennung: Welche Fehlertypen gibt es? Vollständige unerkannte Phrasen im Text { Chinese military texts } { Chinese military works of strategy } Zu weite Erkennung im rechten Kontext in muss bei der lexikalischen Filterung als Nomen verboten werden { [short-term objectives } in order] Weitere Fehlertypen lassen sich mit dem Beispieltext der Demo unter ermitteln. Michaela Geierhos, # 17

18 Naive Phrasenerkennung mit Lokalen Grammatiken Können Lokale Grammatiken allein die Qualität der beschriebenen Phrasenerkennung nachempfinden? Die eben vorgestellten lexikalischen Muster lassen sich mühelos in Lokale Grammatiken umwandeln, welche vom System Unitex interpretiert werden können. Werden dieselben Phrasen wie zuvor erkannt? Die entsprechende Konkordanz gibt darüber Aufschluss WS0607/phrasen/naive_knk.html Michaela Geierhos, # 18

19 Naive Phrasenerkennung mit Lokalen Grammatiken Können Lokale Grammatiken allein die Qualität der beschriebenen Phrasenerkennung nachempfinden? Michaela Geierhos, # 19

20 Naive Phrasenerkennung mit Lokalen Grammatiken Denkfehler und Verbesserungen dieses naiven Ansatzes: Gleiche syntaktische Muster würden ähnliche Ergebnisse erzielen Ressourcenungleichheit auf Wörterbuchebene: => Unitex-System-Lexika vs. CISLEX-EN Lexika zur Filterung von unerwünschten Ambiguitäten auf lexikalischer Ebene fehlen noch diesem Ansatz Linguistische Filter in Form von Negativkontexten, Antigrammatiken oder Filterlexika müssen implementiert werden Verwendung von Phrasenlexika zur Verbesserung der Präzision Heuristiken als Ausschlussverfahren für zu allgemeine Kontexte oder für nicht-aussagekräftige Phrasen. Michaela Geierhos, # 20

21 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Verbesserungen: Umfassende Erweiterung der lexikalischen Datenbasis mit Fokus auf Mehrwortterme Eigennamen Personennamen, Vornamen, Nachnamen Organisationsnamen/Firmennamen typische adjektivische Kontexte von Firmen Ortsangaben/Lokativa/Geographische Entitäten geographische Adjektive und Nomina geographische Zugehörigkeiten (Nationaltiät, etc.) Berufsbezeichnungen (z.b. baby doctor) Menschenbezeichner (z.b. mother-in-law) Redewendungen (Idiome) Phrasenlexikon ( Michaela Geierhos, # 21

22 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Verbesserungen: Linguistische Filterlexika und -grammatiken Ausschluss nominaler Lesarten von lexikalisch ambigen Wörtern, wie z.b. a, as, in, etc. Ausschluss irrelevanter phraseneinleitender Adjektive Zahlen unbestimmte Zahlwörter, wie several, many, etc. Ausschluss unbedeutender Adverben another, other, only, etc. Grammatiken für Phrasengrenzen Was leitet eine Phrase ein? Wie sieht der rechte Kontext einer Phrase aus, der sicher eine Nominalphrase begrenzt? Satzende Verbalphrase Interpunktion (außer Komma) Antigrammatiken zur Abdeckung ungewollt erkannter Phrasen Michaela Geierhos, # 22

23 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Verbesserungen: Lemmatisierung komplexer englischer Zeitformen Systematische Ergänzungen und Erweiterungen des Graphenpakets zur Lemmatisierung komplexer Zeitformen von Maurice Gross fehlende Graphen erstellen Passivgraphen schematisieren Futurgraphen erweitern etc. Tagging des zu untersuchenden Korpus mit den Lemmatisierungsgraphen Interpretation der komplexen Verbalphrasen als Einheit (Token) Verbalphrasen als Indikatoren für Grenzen von Nominalphrasen Grammatiken für die Lemmatisierung einfacher englischer Zeitformen und Annotation dieser im Korpus leichtere Disambiguierung, z.b. to make up (Verb) vs. make up / make-up (Nomen) Markierung von Verbalphrasen als möglicher begrenzender Kontext für die gesuchten Nominalphrasen Michaela Geierhos, # 23

24 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Verbesserungen: Kaskadierung von Lokalen Grammatiken mit Lemmatisierungsgraphen getaggter Korpus wird zum Eingabetext für die Anwendung von Lokalen Grammatiken, welche Personennamen Organisationsnamen Ortsnamen Datumsangaben, etc. erkennen und annotieren. Die eben genannten Einheiten können wiederum Bestandteil von komplexeren Nominalphrasen sein. Die jeweilige semantische Information dieser Phrasen lässt sich in weiteren Graphen zur Abgrenzung von Phrasen oder zur Erweiterung dieser nutzen. Datumsangaben sind beispielsweise mögliche Grenzen Namen sind selbst komplex und meist Teil komplexerer Nominalphrasen, so dass sie sich als Einheit (XN+PR) taggen lassen. Michaela Geierhos, # 24

25 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg. Verbesserungen: Named-Entity-Recognition (NER) mit Lokalen Grammatiken (z.b. Personennamen) Michaela Geierhos, # 25

26 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Verbesserungen: Analyse und Beschreibung von phrasenspezifischen Elementen (z.b. geographische Adjektive). Michaela Geierhos, # 26

27 Phrasenerkennung mit Lokalen Grammatiken: Step-by-Step zum Erfolg Vorteile von kaskadierten Transduktoren. Erkennung von eigentlichen Verbalphrasen als potentielle Nominalphrasen wird vermieden (leichtere Disambiguierung) Getaggte Verbalphrasen dienen als Grenzmarkierung von Nominalphrasen Annotierte Namensphrasen können schematisiert als Teil neuer Phrasenmuster fungieren Vorteile detaillierter Beschreibung phraseninterner Kontexte Kombination von semantischer und syntaktischer Information grenzt potentielle Phrasen genauer ein gezielter Einsatz lexikalischer Ressourcen in engen Kontexten Michaela Geierhos, # 27

28 Phrasenerkennung mit Lokalen Grammatiken: BITE (Bilingual Term Extraction). Phrasenerkennung als Komponente in BITE Konkordanz auf dem Beispieltext mit den BITE-Graphen WS0607/phrasen/phrasen_bite.html Was ist auch an dieser Konkordanz offensichtlich? Es fehlen linguistische Filter. Es werden detaillierte und umfassendere Lexika benötigt. Vorverarbeitung (z.b. Bestimmung von Verbalphrasen) kann helfen die Nominalphrasengrenzen auszuloten. Gewisse statistische Nachbearbeitungsmethoden sind wichtig, um irrelevante Phrasenadjektive auszuschließen. Michaela Geierhos, # 28

Englisch-Grundwortschatz

Englisch-Grundwortschatz Englisch-Grundwortschatz Die 100 am häufigsten verwendeten Wörter also auch so so in in even sogar on an / bei / in like wie / mögen their with but first only and time find you get more its those because

Mehr

Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging

Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging HUMBOLDT-UNIVERSITÄT ZU BERLIN Institut für Informatik Lehrstuhl Wissensmanagement Maschinelle Sprachverarbeitung: Part-of-Speech-Tagging Tobias Scheffer Ulf Brefeld POS-Tagging Zuordnung der Wortart von

Mehr

Lösungsvorschlag für das Übungsblatt 8. Aufgabe1.

Lösungsvorschlag für das Übungsblatt 8. Aufgabe1. Lösungsvorschlag für das Übungsblatt 8. Aufgabe1. 3 Det A N VP R6 4 Any A N VP L3 5 Any intelligent N VP L4 6 Any intelligent cat VP L2 Nach den Regeln kann der Satz weiter nicht erzeugt warden, deswegen

Mehr

Prepositions are words that give information to the reader. Vorwörter geben dem Leser Informationen.

Prepositions are words that give information to the reader. Vorwörter geben dem Leser Informationen. What is the role of prepositions? Prepositions are words that give information to the reader. They can tell us where something takes place when something takes place why something takes place or give a

Mehr

<APPOINT> BiographIE - Informationsextraktion aus biographischen Kontexten. Hauptseminar im Wintersemester 2009/2010

<APPOINT> BiographIE - Informationsextraktion aus biographischen Kontexten. Hauptseminar im Wintersemester 2009/2010 BiographIE - Informationsextraktion aus biographischen Kontexten Hauptseminar im Wintersemester 2009/2010 Dozenten: Prof. Franz Günthner, Michaela Geierhos Vortrag am 14.01.2010, Referentin:

Mehr

Textmining Information Extraction (symbolisch)

Textmining Information Extraction (symbolisch) Textmining Information Extraction (symbolisch) Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Information Extraction (symbolisch) 1 / 22 Information

Mehr

Proseminar Linguistische Annotation

Proseminar Linguistische Annotation Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation

Mehr

Moderne deutsche Wortbildung

Moderne deutsche Wortbildung Birgit Lawrenz Moderne deutsche Wortbildung Phrasale Wortbildung im Deutschen: Linguistische Untersuchung und sprachdidaktische Behandlung Verlag Dr. Kovac Hamburg 2006 Inhaltsverzeichnis I. 1. Gegenstand

Mehr

Syntax. Ending Khoerudin Deutschabteilung FPBS UPI

Syntax. Ending Khoerudin Deutschabteilung FPBS UPI Syntax Ending Khoerudin Deutschabteilung FPBS UPI Traditionale Syntaxanalyse Was ist ein Satz? Syntax: ein System von Regeln, nach denen aus einem Grundinventar kleinerer Einheiten (Wörter und Wortgruppen)

Mehr

Sandy the Snail. 30 Finken Verlag

Sandy the Snail. 30 Finken Verlag Story: Sandy the Snail Topics: animals friends days of the week Sandy the Snail Sandy is a little snail. She lives in a beautiful park with her mum and her dad. Sandy loves to crawl among big trees, green

Mehr

[GEBEN SIE DEN TITEL DES DOKUMENTS EIN]

[GEBEN SIE DEN TITEL DES DOKUMENTS EIN] Präpositionen der Zeit ago after at before by during for from to/till/until in on past since to till / until within Zeitdauer vor dem jetzigen Zeitpunkt: five years ago vor fünf Jahren nach einem Ereignis:

Mehr

Eigennamenerkennung mit großen lexikalischen Ressourcen. Jörg Didakowski BBAW

Eigennamenerkennung mit großen lexikalischen Ressourcen. Jörg Didakowski BBAW Eigennamenerkennung mit großen lexikalischen Ressourcen Jörg Didakowski BBAW Was sind Eigennamen? Sprachliche Zeichen (Eigennamen) das Bezeichnete (Named Entity) Was sind Eigennamen? Eigennamen bezeichnen

Mehr

TreeTagger. Deborah Watty

TreeTagger. Deborah Watty TreeTagger Deborah Watty POS-Tagging store Das ist ein Haus. Artikel Verb Artikel Nomen Nom The 1977 PCs could only store two pages Modalverb Adverb of data. Wir wissen: store kann Nomen oder Verb sein.

Mehr

Partielle Analyse von Personen-, Orts- und Zeitangaben in Texten aus der Museumsdokumentation

Partielle Analyse von Personen-, Orts- und Zeitangaben in Texten aus der Museumsdokumentation Partielle Analyse von Personen-, Orts- und Zeitangaben in Texten aus der Museumsdokumentation Martin Scholz martin.scholz@i8.informatik.uni-erlangen.de 05.02.2009 Inhalt Anwendungsfall: Goldschmiede-Texte

Mehr

Syntax natürlicher Sprachen

Syntax natürlicher Sprachen Syntax natürlicher Sprachen 03: Phrasen und Konstituenten Martin Schmitt Ludwig-Maximilians-Universität München 08.11.2017 Martin Schmitt (LMU) Syntax natürlicher Sprachen 08.11.2017 1 Themen der heutigen

Mehr

Registration of residence at Citizens Office (Bürgerbüro)

Registration of residence at Citizens Office (Bürgerbüro) Registration of residence at Citizens Office (Bürgerbüro) Opening times in the Citizens Office (Bürgerbüro): Monday to Friday 08.30 am 12.30 pm Thursday 14.00 pm 17.00 pm or by appointment via the Citizens

Mehr

Grammatik und Lexikon für Branchen/Sektoren Loreta Bakiu. Hauptseminar: Informationsextraktion aus biographische Kontexten

Grammatik und Lexikon für Branchen/Sektoren Loreta Bakiu. Hauptseminar: Informationsextraktion aus biographische Kontexten Grammatik und Lexikon für Branchen/Sektoren Loreta Bakiu Hauptseminar: Informationsextraktion aus biographische Kontexten Dozenten: Prof. Dr. Franz Guenthner Michaela Geierhos Centrum für Informations-

Mehr

Gerlang 2 Winter 2013 Tentative schedule. Date Class Activity Preparation for next day

Gerlang 2 Winter 2013 Tentative schedule. Date Class Activity Preparation for next day Gerlang 2 Winter 2013 Tentative schedule (NK = text: Deutsch: Na klar) WEEK ONE THEME: Wir gehen aus Objectives for Week One describe location of things talk about food understand service questions in

Mehr

Contents / Inhalt. Lilijana Stepic, ERLERNEN WIR DIE ENGLISCHEN ZEITEN 205. Vorwort... und noch einige Tipps zum erfolgreichen Lernen

Contents / Inhalt. Lilijana Stepic, ERLERNEN WIR DIE ENGLISCHEN ZEITEN 205. Vorwort... und noch einige Tipps zum erfolgreichen Lernen Contents / Inhalt Vorwort... und noch einige Tipps zum erfolgreichen Lernen Simple Present and Present Progressive / Präsens (Gegenwart und Verlaufsform der Gegenwart) 7_ Simple Present / Präsens 7 Use

Mehr

Gerlang 5B Summer 2013

Gerlang 5B Summer 2013 (NK = text: Deutsch: Na klar) DAY ONE: Do. 11/7 THEME: Wir gehen aus Gerlang 5B Summer 2013 Objectives for Day One describe location of things talk about food understand service questions in restaurant

Mehr

Future plans. Exercise 1: Read the text below.

Future plans. Exercise 1: Read the text below. Exercise 1: Read the text below. Future plans Nächstes Jahr werde ich die Schule verlassen, weil ich die Schule hasse. Mit 18 werde ich einen Job finden. Ich möchte in einem Büro arbeiten, weil ich als

Mehr

DELA Wörterbücher ===========================================================

DELA Wörterbücher =========================================================== DELA Wörterbücher =========================================================== Der Umgang mit externen Ressourcen in Unitex Was man beim Erstellen eigener Lexika beachten sollte? Ein Vortrag von Michaela

Mehr

Modern Foreign Languages

Modern Foreign Languages MFL1: To understand the verb werden and to be able to talk about future plans A) Match the English answers to the German. German Correct Answer English Ich werde spielen Du wirst spielen You will play

Mehr

On a Sunday Morning summary

On a Sunday Morning summary On a Sunday Morning summary Connect the English sentences and their German translation Verbinde die englischen Sätze mit ihrer deutschen Übersetzung The hedgehog was standing at the door of his house He

Mehr

Gemeinde Gilching. Registration kindergarten for the school year 2018/2019

Gemeinde Gilching. Registration kindergarten for the school year 2018/2019 Gemeinde Gilching Registration kindergarten for the school year 2018/2019 ( ) My/our child did not attend a child-care center in Gilching in the school year 2017/2018 ( ) My/our child is currently attending

Mehr

Erkennung und Visualisierung attribuierter Phrasen in Poetiken

Erkennung und Visualisierung attribuierter Phrasen in Poetiken Erkennung und Visualisierung attribuierter Phrasen in Poetiken Andreas Müller (1) Markus John (2) Steffen Koch (2) Thomas Ertl (2) Jonas Kuhn (1) (1), Universität Stuttgart (2) Institut für Visualisierung

Mehr

Named Entity Recognition auf Basis von Wortlisten

Named Entity Recognition auf Basis von Wortlisten Named Entity Recognition auf Basis von Wortlisten EDM SS 2017 Lukas Abegg & Tom Schilling Named Entity Recognition auf Basis von Wortlisten Lukas Abegg - Humboldt Universität zu Berlin Tom Schilling -

Mehr

Gemeinde Gilching. Registration kindergarten for the school year 2016/2017

Gemeinde Gilching. Registration kindergarten for the school year 2016/2017 Gemeinde Gilching Registration kindergarten for the school year 2016/2017 ( ) My/our child did not attend a child-care center in Gilching in the school year 2015/2016 ( ) My/our child is currently attending

Mehr

25 teams will compete in the ECSG Ghent 2017 Senior Class Badminton.

25 teams will compete in the ECSG Ghent 2017 Senior Class Badminton. ECSG 2017 Badminton Briefing : Senior Class 25 teams will compete in the ECSG Ghent 2017 Senior Class Badminton. Including 8 Belgian, 1 Danish, 1 French, 21 German, and 1 Maltese Teams. Teams have been

Mehr

Level 1 German, 2012

Level 1 German, 2012 90886 908860 1SUPERVISOR S Level 1 German, 2012 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am Tuesday 13 November 2012 Credits: Five Achievement

Mehr

Named Entity Recognition (NER)

Named Entity Recognition (NER) Named Entity Recognition (NER) Katharina Stein 01/12/2017 Named Entity Recognition 1 Inhalt Named Entity Recognition Was ist Named Entity Recognition? Bedeutung für Natural Language Processing Herausforderungen

Mehr

Teil 111. Chart-Parsing

Teil 111. Chart-Parsing Teil 111 Chart-Parsing 102 Die im ersten Teil des Buches behandelten einfachen Parsingalgorithmen sind, anders als die meisten vor allem im Compilerbau verwendeten Algorithmen (z.b. die LLoder LR-Parsingalgorithmen),

Mehr

Schule mit Erfolg. Englisch Simple present adverbs time Unit Blatt What time is it? 7.50 Uhr Uhr Uhr Uhr 20.

Schule mit Erfolg. Englisch Simple present adverbs time Unit Blatt What time is it? 7.50 Uhr Uhr Uhr Uhr 20. Englisch Simple present adverbs time Unit 3 2.1 Blatt 1 1. Vocabulary. a) Write down the opposites! big always after first late rude b) Put in the right prepositions. Luke gets up at 7 am the morning.

Mehr

INFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka

INFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION 1 22.12.09 Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION(IE) 1. Einleitung 2. Ziel der IE 3. Funktionalität eines IE-Systems 4. Beispiel 5. Übung

Mehr

NLP Eigenschaften von Text

NLP Eigenschaften von Text NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen

Mehr

Level 1 German, 2014

Level 1 German, 2014 90886 908860 1SUPERVISOR S Level 1 German, 2014 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am Wednesday 26 November 2014 Credits: Five Achievement

Mehr

JOBS OF TEENAGERS CODE 250

JOBS OF TEENAGERS CODE 250 JOBS OF TEENAGERS Fertigkeit Hören Relevante(r) Deskriptor(en) Deskriptor 1: Kann Gesprächen über vertraute Themen die Hauptpunkte entnehmen, wenn Standardsprache verwendet und auch deutlich gesprochen

Mehr

Informationsextraktion

Informationsextraktion Informationsextraktion Bestimmte Anwendungen bei der semantischen Verarbeitung erfordern keine tiefe linguistische Analyse mit exakter Disambiguierung (= eine einzige und korrekte Lesart). Hierzu gehört

Mehr

Franke & Bornberg award AachenMünchener private annuity insurance schemes top grades

Franke & Bornberg award AachenMünchener private annuity insurance schemes top grades Franke & Bornberg award private annuity insurance schemes top grades Press Release, December 22, 2009 WUNSCHPOLICE STRATEGIE No. 1 gets best possible grade FFF ( Excellent ) WUNSCHPOLICE conventional annuity

Mehr

ABLAUF USI BÜRO INSKRIPTION im WS 18-19

ABLAUF USI BÜRO INSKRIPTION im WS 18-19 ABLAUF USI BÜRO INSKRIPTION im WS 18-19 Der erste Teil der Kursplätze wurde online über MY USI DATA (ab Di, 18.09.2018) vergeben. Der zweite Teil der Kursplätze (ca. 5000) wird bei der Büro-Inskription

Mehr

Syntaktische Kategorien: Phrasenkategorien

Syntaktische Kategorien: Phrasenkategorien Syntaktische Kategorien: Phrasenkategorien FLM0410 - Introdução à Linguística Alemã I Profa. Dra. Ma. Helena Voorsluys Battaglia Eugenio Braga 8974165 Márcio Ap. de Deus 7000382 Wörter Phrasen Satz Satz

Mehr

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Morphologie. Sarah Bosch,

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Morphologie. Sarah Bosch, Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Morphologie Wiederholung Aufgabe 1 Was ist Morphologie, Morphem? 3 Aufgabe 1 Was ist Morphologie, Morphem? Teildisziplin der

Mehr

The English Tenses Die englischen Zeitformen

The English Tenses Die englischen Zeitformen The English Tenses Die englischen Zeitformen Simple Present (Präsens einfache Gegenwart) Handlungen in der Gegenwart die sich regelmäßig wiederholen oder einmalig geschehen I go you go he goes she goes

Mehr

Semantic Role Labeling im modernen Text-Analyse-Prozess

Semantic Role Labeling im modernen Text-Analyse-Prozess Semantic Role Labeling im modernen Text-Analyse-Prozess Bastian Haarmann info@bastianhaarmann.de http://www.bastianhaarmann.de Agenda I Text-Analyse-Prozesse 1. Motivation 2. Informationsextraktion 3.

Mehr

Künstliche Intelligenz Sprachverarbeitung mit Prolog

Künstliche Intelligenz Sprachverarbeitung mit Prolog Künstliche Intelligenz Sprachverarbeitung mit Prolog Stephan Schwiebert WS 2009/2010 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Parsing mit Prolog Grammatik Wortartenklassifikation,

Mehr

Kriminell gut Englisch 3 4: At the museum

Kriminell gut Englisch 3 4: At the museum Stefanie Pohlmann Kriminell gut Englisch 3 4: At the museum Spannende Detektivaufgaben zur Förderung der Basiskompetenzen im Englischunterricht der Grundschule Grundschule ul Stefanie Pohlmann Downloadauszug

Mehr

Magic Figures. We note that in the example magic square the numbers 1 9 are used. All three rows (columns) have equal sum, called the magic number.

Magic Figures. We note that in the example magic square the numbers 1 9 are used. All three rows (columns) have equal sum, called the magic number. Magic Figures Introduction: This lesson builds on ideas from Magic Squares. Students are introduced to a wider collection of Magic Figures and consider constraints on the Magic Number associated with such

Mehr

DIBELS TM. German Translations of Administration Directions

DIBELS TM. German Translations of Administration Directions DIBELS TM German Translations of Administration Directions Note: These translations can be used with students having limited English proficiency and who would be able to understand the DIBELS tasks better

Mehr

Call Centers and Low Wage Employment in International Comparison

Call Centers and Low Wage Employment in International Comparison Wissenschaftszentrum Nordrhein-Westfalen Kulturwissenschaftliches Institut Wuppertal Institut für Klima, Umwelt, Energie Institut Arbeit und Technik Call Centers and Low Wage Employment in International

Mehr

Diskriminatives syntaktisches Reranking für SMT

Diskriminatives syntaktisches Reranking für SMT Diskriminatives syntaktisches Reranking für SMT Fortgeschrittene Themen der statistischen maschinellen Übersetzung Janina Nikolic 2 Agenda Problem: Ranking des SMT Systems Lösung: Reranking-Modell Nutzung

Mehr

Lokale Grammatik für resign und quit

Lokale Grammatik für resign und quit Lokale Grammatik für resign und quit Hauptseminar Informationsextraktion aus biografischen Kontexten 28.01.2010 Katharina Groth Prof.Dr.F.Guenthner M.Geierhos Übersicht Struktur von resign Sätzen 1.Graph

Mehr

Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten. Click here if your download doesn"t start automatically

Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten. Click here if your download doesnt start automatically Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten Click here if your download doesn"t start automatically Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten Ein Stern in dunkler

Mehr

Einführung in die Computerlinguistik. Morphologie III

Einführung in die Computerlinguistik. Morphologie III Einführung in die Computerlinguistik Morphologie III Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 7.12.2015 Schütze & Zangenfeind: Morphologie III

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 1 / 31 Take-away Phrasenstrukturgrammatik:

Mehr

Grade 12: Qualifikationsphase. My Abitur

Grade 12: Qualifikationsphase. My Abitur Grade 12: Qualifikationsphase My Abitur Qualifikationsphase Note 1 Punkte Prozente Note 1 15 14 13 85 % 100 % Note 2 12 11 10 70 % 84 % Note 3 9 8 7 55 % 69 % Note 4 6 5 4 40 % 54 % Note 5 3 2 1 20 % 39

Mehr

Analyse biographischer Ereignisse: 3. Beruflicher Werdegang

Analyse biographischer Ereignisse: 3. Beruflicher Werdegang Analyse biographischer Ereignisse: 3. Beruflicher Werdegang Grammatik und Lexikon der Berufsbezeichnungen Referentin: Beate Vogg 10.12.09 Seminar: BiographIE Informationsextraktion aus biographischen Kontexten,

Mehr

German Section 29 - Online activitites

German Section 29 - Online activitites No. 01 Die Uhr The clock Es ist zehn Uhr. It's ten o'clock. Es ist fünf nach zehn. It's five past ten. Es ist zehn nach zehn. It's ten past ten. Es ist Viertel nach zehn. It's a quarter past ten. Es ist

Mehr

"What's in the news? - or: why Angela Merkel is not significant

What's in the news? - or: why Angela Merkel is not significant "What's in the news? - or: why Angela Merkel is not significant Andrej Rosenheinrich, Dr. Bernd Eickmann Forschung und Entwicklung, Unister GmbH, Leipzig UNISTER Seite 1 Unister Holding UNISTER Seite 2

Mehr

Level 2 German, 2015

Level 2 German, 2015 91126 911260 2SUPERVISOR S Level 2 German, 2015 91126 Demonstrate understanding of a variety of written and / or visual German text(s) on familiar matters 2.00 p.m. Friday 4 December 2015 Credits: Five

Mehr

Ludwig-Maximilians Universität München Centrum für Informations -und Sprachverarbeitung

Ludwig-Maximilians Universität München Centrum für Informations -und Sprachverarbeitung Ludwig-Maximilians Universität München Centrum für Informations -und Sprachverarbeitung Informationsextraktion aus biographischen Kontexten Dozenten: Professor Dr. F. Guenthner Michaela Geierhos Lokale

Mehr

ABLAUF USI BÜRO INSKRIPTION

ABLAUF USI BÜRO INSKRIPTION ABLAUF USI BÜRO INSKRIPTION Der erste Teil der Kursplätze wurde online über MY USI DATA (ab Di, 16.02.2016) vergeben. Der zweite Teil der Kursplätze (ca. 4000) wird bei der Büro-Inskription vergeben. Am

Mehr

Deutsche Grammatik WS 14/15. Kerstin Schwabe

Deutsche Grammatik WS 14/15. Kerstin Schwabe Deutsche Grammatik WS 14/15 Kerstin Schwabe Generelle Information Dr. Kerstin Schwabe Zentrum für Allgemeine Sprachwissenschaft Schützenstraße 18, R. 432 10117 Berlin Tel.: 20192410 E-mail: schwabe@zas.gwz-berlin.de

Mehr

Informationsextraktionssystem ANNIE

Informationsextraktionssystem ANNIE Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 10/11 Inhalt 1 Einführung: Informationsextraktion Begriffsklärung eines Informationsextraktionssystems 2 Einführung in Getting Started

Mehr

Satzglieder und Gliedteile. Duden

Satzglieder und Gliedteile. Duden Satzglieder und Gliedteile Duden 1.1-1.3 1. Valenz: Ergänzungen und Angaben - Verb (bzw. Prädikat) bestimmt den Satz syntaktisch und semantisch [Anna] stellte [rasch] [eine Kerze] [auf den Tisch]. - Neben

Mehr

die Band Freunde besuchen fernsehen Aufkleber sammeln

die Band Freunde besuchen fernsehen Aufkleber sammeln das Konzert die Band Freunde besuchen reiten Flugzeuge sammeln fernsehen Aufkleber sammeln im Schulcafé arbeiten Sport machen ins Kino gehen Mein Zimmer aufräumen ins Schwimmbad gehen Was machst du in

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Peter Haider Uwe Dick Paul Prasse

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Peter Haider Uwe Dick Paul Prasse Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-Pipeline Tobias Scheffer Peter Haider Uwe Dick Paul Prasse NLP-Pipeline Folge von Verarbeitungsschritten für Informationsextraktion,

Mehr

Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen

Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen Automatische Rekonstruktion und Spezifizierung von Attributnamen in Webtabellen Mark Reinke Bachelorarbeit TU Dresden 17. Februar 2014 Webtabellen Warum sind Webtabellen von Bedeutung? Sie können relationale

Mehr

Exercise (Part XI) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1

Exercise (Part XI) Anastasia Mochalova, Lehrstuhl für ABWL und Wirtschaftsinformatik, Kath. Universität Eichstätt-Ingolstadt 1 Exercise (Part XI) Notes: The exercise is based on Microsoft Dynamics CRM Online. For all screenshots: Copyright Microsoft Corporation. The sign ## is you personal number to be used in all exercises. All

Mehr

Level 1 German, 2013

Level 1 German, 2013 90883 908830 1SUPERVISOR S Level 1 German, 2013 90883 Demonstrate understanding of a variety of spoken German texts on areas of most immediate relevance 9.30 am Tuesday 12 November 2013 Credits: Five Achievement

Mehr

Electrical tests on Bosch unit injectors

Electrical tests on Bosch unit injectors Valid for Bosch unit injectors with order numbers 0 414 700 / 0 414 701 / 0 414 702 Parts Kit Magnet*: - F00H.N37.925 - F00H.N37.933 - F00H.N37.934 * For allocation to the 10-place Bosch order number,

Mehr

Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen

Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen Institut für Computerlinguistik Sprachtechnologie in den Digital Humanities Modul 4: Automatische Korpusannotation mit computerlinguistischen Werkzeugen: Bestimmung von Wortarten und Grundformen Simon

Mehr

Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK

Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Swantje Westpfahl & Thomas Schmidt POS für(s) FOLK Problemanalyse des POS- Taggings für spontansprachliche Daten anhand des Forschungsund Lehrkorpus Gesprochenes Deutsch 2 FOLK Forschungs- und Lehrkorpus

Mehr

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank Wortdekodierung Vorlesungsunterlagen Speech Communication 2, SS 2004 Franz Pernkopf/Erhard Rank Institute of Signal Processing and Speech Communication University of Technology Graz Inffeldgasse 16c, 8010

Mehr

Tube Analyzer LogViewer 2.3

Tube Analyzer LogViewer 2.3 Tube Analyzer LogViewer 2.3 User Manual Stand: 25.9.2015 Seite 1 von 11 Name Company Date Designed by WKS 28.02.2013 1 st Checker 2 nd Checker Version history Version Author Changes Date 1.0 Created 19.06.2015

Mehr

Seminar Sicherheit und Softwareengineering WS 2013 / Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS

Seminar Sicherheit und Softwareengineering WS 2013 / Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS Requirements Documents Was sind Requirements Documents? Anforderungsdokumente in industriellen Software-Projekten Häufig in natürlicher Sprache

Mehr

1. A number has 6 in the tenths place, 4 in the ones place, and 5 in the hundredths place. Write the number.

1. A number has 6 in the tenths place, 4 in the ones place, and 5 in the hundredths place. Write the number. Englische Übungen zu Dezimalzahlen Bemerkung: Im Englischen schreibt man einen Punkt als Komma ( decimal point ). 1. A number has 6 in the tenths place, 4 in the ones place, and 5 in the hundredths place.

Mehr

Sprachproduktion: grammatische Enkodierung nach Levelt 1989 bzw. Kempen & Hoenkamp 1987

Sprachproduktion: grammatische Enkodierung nach Levelt 1989 bzw. Kempen & Hoenkamp 1987 Sprachproduktion: grammatische Enkodierung nach Levelt 989 bzw. Kempen & Hoenkamp 987 dargestellt nach Schade & Eikmeyer 2003: Produktion von Syntagmen. In: Rickheit, G., Herrmann, T. & Deutsch, W.: (eds)

Mehr

Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09)

Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09) Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012 Referent: Florian Kalisch (GR09) Rückblick Aktueller Status Einführung in Text-Mining Der Text-Mining Prozess

Mehr

❶ Hier siehst du Beispiele für die Pluralbildung im Englischen. Schreibe unter jedes Beispiel zwei weitere Nomen, die ihren Plural genauso bilden.

❶ Hier siehst du Beispiele für die Pluralbildung im Englischen. Schreibe unter jedes Beispiel zwei weitere Nomen, die ihren Plural genauso bilden. 4 Singular und Plural ❶ Hier siehst du Beispiele für die Pluralbildung im Englischen. Schreibe unter jedes Beispiel zwei weitere Nomen, die ihren Plural genauso bilden. Tipp: Wenn dir keine Nomen einfallen,

Mehr

Linguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets

Linguistische Grundlagen. Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets Linguistische Grundlagen Warum Tagging? Klassische Wortartenlehre Tagsets Annotation höherer Ebenen Design von Tagsets Warum Tagging? Abfragbarkeit linguistischer Information Generalisierbarkeit von Abfragen

Mehr

Meine Lernlandkarte. für UNIT 1. andere sprechen. Ich kann etwas. verneinen. Ich kann über mich, meine Schule und. Stundenpläne sprechen.

Meine Lernlandkarte. für UNIT 1. andere sprechen. Ich kann etwas. verneinen. Ich kann über mich, meine Schule und. Stundenpläne sprechen. Meine Lernlandkarte für UNIT 1 Ich kenne die Zahlen von 1 20. Ich kann über Stundenpläne sprechen. Ich kann mich und meine Familie vorstellen. 1.2 1.3 1.1 Hier stehen die Lernschwerpunkte für Unit 1. Schätze

Mehr

Projektseminar "Texttechnologische Informationsmodellierung"

Projektseminar Texttechnologische Informationsmodellierung Projektseminar "Texttechnologische Informationsmodellierung" Ziel dieser Sitzung Nach dieser Sitzung sollten Sie: Einige standards und projekte vom Namen her kennen Einen Überblick über und einen Eindruck

Mehr

FASTUS: Ein System zur Informationsextraktion mit Transduktoren

FASTUS: Ein System zur Informationsextraktion mit Transduktoren FASTUS: Ein System zur Informationsextraktion mit Transduktoren (Systembeschreibung) Branimira Nikolova HS Endliche Automaten für die Sprachverarbeitung SS 2004 Dr. Karin Haenelt Information Extraction

Mehr

Einführung in die Sprachwissenschaft des Deutschen Syntax II. PD Dr. Alexandra Zepter

Einführung in die Sprachwissenschaft des Deutschen Syntax II. PD Dr. Alexandra Zepter Einführung in die Sprachwissenschaft des Deutschen Syntax II PD Dr. Alexandra Zepter Systemorientierte theoretische Linguistik Pragmatik: Textlinguistik (Semiotik) Semantik Syntax Morphologie Phonetik/Phonologie

Mehr

Wortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin

Wortfinales Schwa in BeMaTaC: L1 vs. L2. Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin Wortfinales Schwa in BeMaTaC: L1 vs. L2 Simon Sauer Korpuslinguistisches Kolloquium Humboldt-Universität zu Berlin 27.01.2016 Phänomen In gesprochenem Deutsch wird wortfinales Schwa oft weggelassen ich

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Paul Prasse Michael Großhans

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Paul Prasse Michael Großhans Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-Pipeline Tobias Scheffer Paul Prasse Michael Großhans NLP- (Natural Language Processing-) Pipeline Folge von Verarbeitungsschritten

Mehr

Sprachtechnologie. Fraunhofer-Institut für Angewandte Informationstechnik FIT. Katja Niemann Maren Scheffel

Sprachtechnologie. Fraunhofer-Institut für Angewandte Informationstechnik FIT. Katja Niemann Maren Scheffel Sprachtechnologie Fraunhofer-Institut für Angewandte Informationstechnik FIT Katja Niemann Maren Scheffel Inhalt Was ist Sprachtechnologie? Computerlinguistische Anwendungen Praktische Beispiele MACE Schlüsselaktionen

Mehr

Dienstleistungsmanagement Übung 5

Dienstleistungsmanagement Übung 5 Dienstleistungsmanagement Übung 5 Univ.-Prof. Dr.-Ing. Wolfgang Maass Chair in Economics Information and Service Systems (ISS) Saarland University, Saarbrücken, Germany Besprechung Übungsblatt 4 Slide

Mehr

FEM Isoparametric Concept

FEM Isoparametric Concept FEM Isoparametric Concept home/lehre/vl-mhs--e/folien/vorlesung/4_fem_isopara/cover_sheet.tex page of 25. p./25 Table of contents. Interpolation Functions for the Finite Elements 2. Finite Element Types

Mehr

Lemmatisierung und Stemming in Suchmaschinen

Lemmatisierung und Stemming in Suchmaschinen Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2016 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)

Mehr

Lemmatisierung und Stemming in Suchmaschinen

Lemmatisierung und Stemming in Suchmaschinen Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2014 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)

Mehr

Fachbereich 5 Wirtschaftswissenschaften Univ.-Prof. Dr. Jan Franke-Viebach

Fachbereich 5 Wirtschaftswissenschaften Univ.-Prof. Dr. Jan Franke-Viebach 1 Universität Siegen Fachbereich 5 Wirtschaftswissenschaften Univ.-Prof. Dr. Jan Franke-Viebach Klausur International Financial Markets Sommersemester 2010 (2. Prüfungstermin) Bearbeitungszeit: 60 Minuten

Mehr

entschuldigung well / good

entschuldigung well / good Allgemein ja nein vielleicht bitte danke entschuldigung alles klar Ich verstehe (nicht) Sprechen Sie Deutsch? Ich spreche kein Deutsch Hilfe! Ein bisschen langsamer bitte Gesundheit! Prost! wo wann wer

Mehr

Automatische Erkennung von Organisationsnamen in Englischsprachigen Wirtschaftsnachrichten. Dissertation von Friederike Mallchok

Automatische Erkennung von Organisationsnamen in Englischsprachigen Wirtschaftsnachrichten. Dissertation von Friederike Mallchok Automatische Erkennung von Organisationsnamen in Englischsprachigen Wirtschaftsnachrichten Dissertation von Friederike Mallchok Vortragsgliederung: 1. Definition Named Entity Recognition 2. Evaluation

Mehr

Finite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010

Finite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010 Finite-State-Morphologie in XLE Grammatikentwicklung, SS 2010 1 / 20 Worum es heute geht: Nutzen von Finite-State-Morphologien... und wie man sie in XLE einbaut 2 / 20 Lexikon in XLE Bis jetzt: so genanntes

Mehr

When you use any of these prepositions, you need to put the noun or pronoun following them into the accusative case. For example:

When you use any of these prepositions, you need to put the noun or pronoun following them into the accusative case. For example: Accusative Prepositions Up to now, we ve been using the accusative case only for direct objects. There is another part of speech that requires the accusative case in German: the accusative prepositions.

Mehr

Automatisches Verstehen gesprochener Sprache

Automatisches Verstehen gesprochener Sprache Automatisches Verstehen gesprochener Sprache 6. Syntaxanalyse Martin Hacker Bernd Ludwig Günther Görz Professur für Künstliche Intelligenz Department Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg

Mehr