Castensen KU, Ebert Ch, Ebert C, Jekat S, Klabunde R, Langer H (Hrsg.). Computerlinguistik und Sprachtechnologie. 3. Auflage. Heidelberg: Spektrum

Größe: px
Ab Seite anzeigen:

Download "Castensen KU, Ebert Ch, Ebert C, Jekat S, Klabunde R, Langer H (Hrsg.). Computerlinguistik und Sprachtechnologie. 3. Auflage. Heidelberg: Spektrum"

Transkript

1 Präsentation Natural Language and Text Processing in Biomedicine Matthias Baldauf WS 2010/11 Seminar Biomedizinische Informatik

2 Einleitung Natural Language Processing (NLP) Computerlinguistik maschinelle Verarbeitung von natürlicher Sprache auf dem Computer geschriebene Sprache (Text) & gesprochene Sprache Informatik <-> Linguistik Anfänge: 50er Jahre maschinelle Übersetzung Russisch-Englisch NLP im alltäglichen Einsatz: Textverarbeitungsprogramme Rechtschreibprüfung, Grammatiküberprüfung, Thesaurus Internet vollautomatische maschinelle Übersetzung (Google, MS-Hilfen, ) Quelle: Castensen KU, Ebert Ch, Ebert C, Jekat S, Klabunde R, Langer H (Hrsg.). Computerlinguistik und Sprachtechnologie. 3. Auflage. Heidelberg: Spektrum Akademischer Verlag; ISBN:

3 Motivation für NLP Kommunikation zwischen Menschen: natürliche Sprache Verbreitung von Wissen und Daten in der Biomedizin: 1) schriftlicher Form Artikeln Berichte (technische & administrative) Krankenakten, 2) verbaler Form Konferenzen Vorträge, Computer: sammeln, speichern & verteilen biomedizinischer Informationen

4 Motivation für NLP Texte fast immer elektronisch verfügbar, aber meist in narrativer (unstrukturierter) Form schlecht für weitere Verarbeitung im Computer schwierig zuverlässig zuzugreifen viele Wörter ein Begriff grammatikalische Strukturen gleiche Information Computer in der Medizin: Verarbeiten von strukturierten Daten Information in einer regulären, vorhersagbaren Form

5 Motivation für NLP NLP Überbrückung der Lücke zwischen unstrukturierten und strukturierten Daten Mensch: Interaktion mit Computer in natürlicher Sprache Computer: effektive Verarbeitung der Daten Quelle: Shortliffe EH, JJ Cimino (Hrsg.). Biomedical informatics: computer applications in health care and biomedicine. 3. Auflage. Berlin: Springer Verlag; ISBN:

6 Verwendetes Wissen phonetisches und phonologisches Wissen morphologisches Wissen lexikographisches Wissen syntaktisches Wissen semantisches Wissen pragmatisches Wissen Quellen: Shortliffe EH, JJ Cimino (Hrsg.). Biomedical informatics: computer applications in health care and biomedicine. 3. Auflage. Berlin: Springer Verlag; ISBN: Castensen KU, Ebert Ch, Ebert C, Jekat S, Klabunde R, Langer H (Hrsg.). Computerlinguistik und Sprachtechnologie. 3. Auflage. Heidelberg: Spektrum Akademischer Verlag; ISBN:

7 Verwendetes Wissen: Phonetisches und phonologisches Wissen Phonetik: Wie entstehen sprachliche Laute? Art, Erzeugung, Verwendung in der Kommunikation Phonologie: Grundobjekte der Lautsprache Untersucht deren Funktion, Struktur, Eigenschaften Wortunterscheidung

8 Verwendetes Wissen: Phonetisches und phonologisches Wissen Grundobjekt der Phonologie: Phonem kleinste bedeutungsunterscheidende Einheit der Sprache Bsp.: Katze Tatze Internationales Phonetisches Alphabet Schreibweise: /r/ Phone Realisierungen von Phonemen Untersuchungsgegenstand der Phonetik Schreibweise: [r] Silbe besteht aus einem oder mehreren Phonemen kleinste Lautgruppe phonologisches Wort besteht aus Silben

9 Verwendetes Wissen: Morphologisches Wissen Morphologie: Regeln Kombination von Morphemen zu Wörtern & Wortformen Morphem kleinste bedeutungstragende sprachliche Einheit besteht aus Phonemen oder Graphemen Beispiel: Ultraschall ultra ul + tra Schall

10 Verwendetes Wissen: Morphologisches Wissen Unterteilung von Morphemen: Nach ihrem Status: Freie Morpheme Bsp.: Schall Gebundene Morpheme Bsp.: -s bei Schalls Nach ihrer Wortfähigkeit: Grundmorpheme Bsp.: Haus, Auto Affixe Nach ihrer Funktion: lexikalisches Morphem Bsp.: Kopf im Wort Köpfe funktionales Morphem

11 Verwendetes Wissen: Morphologisches Wissen Englische Sprache keine besonders komplexe Morphologie Biomedizinische Sprache komplexe Morphologie Bsp 1 (Chemikalien): Hydr-oxy-nitro-di-hydro-thym-ine Bsp 2 (Prozeduren): Hepatikojejunostomie System sollte mit Wörtern flexibel agieren können Separierung ist schwierig

12 Verwendetes Wissen: Lexikographisches Wissen Lexikographie: Kategorisierung von Lexemen Lexem Grundform eines Wortes gehört zu ein oder mehreren Wortarten Nomen (Hüfte) Adjektive (mild) Verben (improvisieren) aus mehreren Wörtern

13 Verwendetes Wissen: Syntaktisches Wissen Syntax: Struktur von Phrasen und Sätzen Phrase Gruppe von zusammengehörenden Wörtern (Lexemen) Nominalphrasen - (der junge Patient) Adjektivphrasen - (ziemlich schmerzhaft) Verbalphrasen - (gefällt mit sehr) Kern und Modifizierer

14 Verwendetes Wissen: Syntaktisches Wissen Sätze Zusammengesetzt aus Phrasen Restriktionen zur Satzformung (deutsche Sprache) Keine Restriktionen zur Satzformung (klinische Sprache) Der Husten hat sich verschlechtert Husten verschlechtert Husten bilden Untersprache

15 Verwendetes Wissen: Semantisches Wissen Semantik: Bedeutung und Interpretation von Wörtern, Phrasen und Sätzen Wort mehrere Bedeutungen/Wortsinne Bsp.: Kopf = Körperteil eines Lebewesens = alte Maßeinheit Semantik in Allgemeinsprachen komplex Semantik in Untersprachen (Biomedizin) einfacher da restriktive semantische Muster kleine Anzahl semantischer Typen (Gen, Medikation, Krankheit ) kleine Anzahl semantischer Muster (Medikament-behandelt-Krankheit)

16 Verwendetes Wissen: Pragmatisches Wissen Pragmatik: erforscht sprachliches Handeln und Verwendung der Sprache Bsp.: englisches Wort mass Mammographiebericht (Brustmass - breast mass) Radiologiebericht des Brustkorbs (Lungenvolumen lung mass) Religiöse Zeitschift (Zeremonie) Bsp.: Eine Verletzung an der Vene konnte festgestellt werden. Diese ist schwerwiegend. diese referenziert die Verletzung, nicht die Vene

17 Techniken und Methoden NLP involviert drei große Aufgaben: 1) Repräsentation des linguistischen Wissens 2) Anwendung des Wissens 3) Wissensakquisition Quelle: Shortliffe EH, JJ Cimino (Hrsg.). Biomedical informatics: computer applications in health care and biomedicine. 3. Auflage. Berlin: Springer Verlag; ISBN:

18 Techniken und Methoden: Morphologie 1) Einlesen des Textes 2) Zerlegung in einzelne Tokens (Morpheme, Wörter, Satzzeichen ) Sehr schwer festzustellen, was ein Wort ist Bsp.: q.i.d. 5 mg. gegeben. Reguläre Ausdrücke / endliche Automaten Bsp.: [a-z]+( s)? [0-9]+ [.] patient s wbc dropped to 12.

19 Techniken und Methoden: Morphologie Besser geeignet: probabilistischer Ansatz Markov-Modelle Abb. 1: Markov-Modell (Übergangsmatrix) Quelle: Shortliffe EH, JJ Cimino (Hrsg.). Biomedical informatics: computer applications in health care and biomedicine. 3. Auflage. Berlin: Springer Verlag; ISBN:

20 Techniken und Methoden: Lexikographie Lexikalische Analyse: Welche Wörter/Begriffe sind dem System bekannt? Welche Wortart liegt vor? Wie schaut die Normalform aus? Ein Wort mehreren Wortarten angehörig Bsp.: stay = Nomen bei her hospital stay = Verb bei refused to stay Wortart-Tagging: Betrachten von umliegenden Wörtern

21 Techniken und Methoden: Lexikographie Erstellen von Regeln: CHANGE NOUN TO VERB IF PREVIOUS TAG IS TO CHANGE NOUN TO ADJECTIVE IF FOLLOWING TAG IS NOUN Bsp.: Satz vor Regelanwendung: total/noun hip/noun replacement/noun Satz nach Regelanwendung: total/adjective hip/noun replacement/noun Einsatz von Markov-Modellen

22 Techniken und Methoden: Syntax Grammatik spezifiziert mittels Regeln wie Wörter für best. Struktur zusammengeführt werden müssen Struktur hat zugrundeliegende Relationen Abbildung von Phrasen mittels regulären Ausdrücken Bsp.: ARTIKEL? ADJEKTIV* NOMEN* (SINGULAR PLURAL) die kongestive Herzinsuffizienz Teilparsing kann zu Informationsverlust führen

23 Techniken und Methoden: Syntax Kontextfreie Grammatiken Abb. 2: einfache kontextfreie Grammatik für die englische Sprache Abb. 3: Syntaxbaum für den Satz The patient had pain in lower extremities Quelle: Shortliffe EH, JJ Cimino (Hrsg.). Biomedical informatics: computer applications in health care and biomedicine. 3. Auflage. Berlin: Springer Verlag; ISBN:

24 Techniken und Methoden: Semantik Einzelne Wörter Semantische Interpretationen zuordnen Zu größeren semantischen Strukturen zusammenfügen Semantische Informationen in Lexikon gehalten Erzeugung z.b. durch UMLS, GeneBank Zu unterscheiden: Semantischer Typ Semantischer Sinn Bsp.: Ibuprofen, Aspirin und ASS

25 Techniken und Methoden: Semantik Wörter haben mehr als einen semantischen Typ Bsp.: Wachstum = anomaler Prozess (Tumor) = normaler Prozess (Kind) Wörter können doppeldeutig sein Bsp.: MS = multiple Sklerose = Mitralstenose Verwendung von Regeln Bsp: Discharge from hospital Discharge from eye

26 Techniken und Methoden: Semantik Reguläre Ausdrücke für größere semantische Strukturen: [GENE PROTEIN].* MFUN.* [GENE PROTEIN] Pax-3 aktivierte Myod Semantische Grammatiken für komplexe Strukturen: Abb. 4: einfache semantische kontextfreie Grammatik für die englische Sprache Grammatik erkennt No increased cholesterol Quelle: Shortliffe EH, JJ Cimino (Hrsg.). Biomedical informatics: computer applications in health care and biomedicine. 3. Auflage. Berlin: Springer Verlag; ISBN:

27 Techniken und Methoden: Pragmatik Syntaktische und semantische Analyse: betrachten Satz nur isoliert Finden von Beziehungen zwischen mehreren Sätzen Referentielle Ausdrücke Pronomen, Eigenworte, Nominalphrasen Referentieller Ausdruck Referent Dr. Cox der Arzt der den Patienten behandelt Der Patient ging in die Radiologie. Dort wurde ein Röntgenbild erstellt. Kohärenz von Texten Centering-Theorie

28 Anwendungen von NLP Informationsextraktion Information Retrieval Textgenerierung Benutzerschnittstellen maschinelle Übersetzung

29 Anwendungen von NLP: Informationsextraktion 1) Lokalisierung von relevanten Informationen im Text 2) Strukturierte Wiedergabe der gefundenen Informationen Ist die häufigste Anwendung in der biomedizinischen Domäne Anwendungen: Informationsextraktion aus klinischen Daten (EHR) Informationsextraktion aus wissenschaftlichen Artikeln Meist limitiert auf gewisse isolierte Terme (Medikation, Gene ) Komplexere Anwendungen: erkennbare Muster im Text Anspruchsvolle Techniken: Beziehungen zwischen den Termen

30 Anwendungen von NLP: Information Retrieval Unterstützende Funktion: Zugriff auf sehr große Sammlungen (z.b. in der Literatur) Benutzer: verfasst Abfrage (Query) NLP-System: Auswahl der ähnlichsten Dokumente Indexierung von Dokumenten: Einfache Form Isolation von Wörtern und Termen Fortgeschrittene Form Anwendung der Informationsextraktion

31 Anwendungen von NLP: Textgenerierung Formulieren von Sätzen in natürlicher Sprache Basis: strukturierte Daten Anwendungen: Erzeugen von Texten aus strukturierten Datenbanken Erzeugen von kurzen Zusammenfassungen umfangreicher Texte

32 Anwendungen von NLP: Benutzerschnittstellen Effektivere Kommunikation zwischen Mensch-Computer Eingabe der Daten: Direkt über die Tastatur (Templates / Makros) Spracherkennungssysteme Weniger verbreitet: Datenbankabfragen mittels natürlicher Sprache

33 Anwendungen von NLP: Maschinelle Übersetzung Maschinelle Übersetzung von Texten einer Sprache in eine andere Sprache Anwendung: mehrsprachige Arbeitsumgebungen Übersetzen per Hand: zeitaufwändig & kostenintensiv Übersetzung von Medikationshilfen für Patienten Übersetzung von wissenschaftlichen Artikeln

34 Anwendungen von NLP in der Praxis 2 2 Anwendungen im klinischen Bereich 1 Anwendung im biologischen Bereich Quellen: Day S, Christensen LM, Dalto J, Haug P.Identification of trauma patients at a level 1 trauma center utilizing natural language processing. J Trauma Nurs Apr-Jun;14(2): Baldwin KB. Evaluating healthcare quality using natural language processing. J Healthc Qual Jul-Aug;30(4):24-9. Rodríguez-Penagos C, Salgado H, Martínez-Flores I, Collado-Vides J. Automatic reconstruction of a bacterial regulatory network using Natural Language Processing. BMC Bioinformatics Aug 7;8:293.

35 Anwendungen von NLP in der Praxis: Identifizierung von Trauma-Patienten Trauma-Zentren: Trauma-Register sammeln, speichern, organisieren Patienteninformationen Auswahl von Patienten zur Aufnahme in das Trauma-Register komplex Identifizierungsprozess: täglicher Lagebericht Lesen der Krankengeschichte Lesen der ärztlichen Dokumentation Wochenende: andere Mitarbeiter Ausdrucken der Berichte fehleranfällig, mühsam, zeitraubend, unvollständig Quelle: Day S, Christensen LM, Dalto J, Haug P.Identification of trauma patients at a level 1 trauma center utilizing natural language processing. J Trauma Nurs Apr-Jun;14(2):79-83.

36 Anwendungen von NLP in der Praxis: Identifizierung von Trauma-Patienten Entwicklung eines NLP-System zu Identifizierung von Trauma- Patienten Bayes'sches Netzwerk Abbildung von Wörtern und Phrasen auf relevante Konzepte (Traumadiagnose) Trainieren des System Relevante Wörter und Phrasen: Kollisionen mit Kraftfahrzeugen, Brüche, Schusswunden, Stichwunden, Erstellen eine Relevanz-Score für Bericht Score > Schwellwert Speichern von relevanten Daten in Datenbank Programm erfasst 100% der Trauma-Patienten Quelle: Day S, Christensen LM, Dalto J, Haug P.Identification of trauma patients at a level 1 trauma center utilizing natural language processing. J Trauma Nurs Apr-Jun;14(2):79-83.

37 Anwendungen von NLP in der Praxis: Evaluierung der Gesundheitsversorgungsqualität Daten für klinische Qualitätsberichte liegen eingebettet in Berichten in der EHR NUD*IST NLP-System Verwendet Informationsextraktion Extrahiert und kategorisiert narrativen Text Quelle: Baldwin KB. Evaluating healthcare quality using natural language processing. J Healthc Qual Jul-Aug;30(4):24-9.

38 Anwendungen von NLP in der Praxis: Evaluierung der Gesundheitsversorgungsqualität Resultate des NLP-Systems Effizienz: Auffinden von Variablen: Abb. 5: Effizienzvergleich (NLP vs. manuell) Abb. 6: Finden von Variablen (NLP vs. manuell) Recall und Präzision: Recall: 29% Präzision: 70% Quelle: Baldwin KB. Evaluating healthcare quality using natural language processing. J Healthc Qual Jul-Aug;30(4):24-9.

39 Anwendungen von NLP in der Praxis: Automatische Rekonstruktion Automatische Rekonstruktion eines bakteriellen Regulationsnetzwerks mittels NLP Entwickeltes NLP-System Informationsextraktion aus wissenschaftlichen Artikeln Finden von Interaktionen Basis: regelbasiertes System Ziel Unterstützung der manuellen Pflege der transkriptionellen Regulation von E. coli Quelle: Rodríguez-Penagos C, Salgado H, Martínez-Flores I, Collado-Vides J. Automatic reconstruction of a bacterial regulatory network using Natural Language Processing. BMC Bioinformatics Aug 7;8:293.

40 Anwendungen von NLP in der Praxis: Automatische Rekonstruktion Beispiel-Output des NLP-Systems Abb. 7: Output einer gefundenen Interaktion im XML-Format Abb. 8: Evaluierung der extrahierten Interaktionen Quelle: Rodríguez-Penagos C, Salgado H, Martínez-Flores I, Collado-Vides J. Automatic reconstruction of a bacterial regulatory network using Natural Language Processing. BMC Bioinformatics Aug 7;8:293.

41 Herausforderungen von NLP Herausforderungen von NLP in der klinischen Domäne: 1) Gute Performance 2) Wiederherstellung von impliziten Wissen 3) Intraoperabilität 4) Interoperabilität 5) Trainingsdaten für NLP-Systeme

42 Herausforderungen von NLP Herausforderungen von NLP in der biologischen Domäne: 1) Dynamik der Domäne 2) Doppeldeutigkeiten von biomolekularen Namen 3) Große Anzahl von Einträgen 4) Namensgebung 5) Heterogenität der Texte

43 -ENDE- Vielen Dank für die Aufmerksamkeit

Ziele und Herausforderungen

Ziele und Herausforderungen Ziele und Herausforderungen Text soll automatisch aus einer Quellsprache in eine Zielsprache übertragen werden Dabei soll die Funktion des Textes erhalten bleiben Es werden sowohl computerlinguistische

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen Spezielle Themen der KI NLP Natural Language Processing Sprachverstehen NLP - Verarbeitungsstufen des Sprachverstehen 47 Phonologie und Phonetik Phonologie Lautlehre oder Sprachgebilde-Lautlehre untersucht

Mehr

Einführung in die Computerlinguistik Überblick

Einführung in die Computerlinguistik Überblick Einführung in die Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2015-10-12 1 / 19 Was ist Computerlinguistik? Definition

Mehr

Linguistik für Kognitionswissenschaften

Linguistik für Kognitionswissenschaften Linguistik für Kognitionswissenschaften Computerlinguistik: Maschinelle Übersetzung Computerlinguistik Fehlübersetzung von engl. computational linguistics - computationelle Linguistik beinhaltet im weiteren

Mehr

Grundlagen der natürlichsprachlichen Mensch-Computer Interaktion

Grundlagen der natürlichsprachlichen Mensch-Computer Interaktion Grundlagen der natürlichsprachlichen Mensch-Computer Interaktion Donnerstag 29. 04. 2004 2-1 Richtziel: Erlernen möglicher Verwendung von Markup-Programmiersprachen für Modellierung der natürlichsprachlichen

Mehr

Maturandentag 2005 Computerlinguistik

Maturandentag 2005 Computerlinguistik Maturandentag 2005 Computerlinguistik http://www.ifi.unizh.ch/cl/ 13./14. September 2005 Maturandentag 2005 Computerlinguistik 13./14. September 2005 http://www.ifi.unizh.ch/cl/ 1 / 11 Computerlinguistik

Mehr

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft

VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft , Informations- und Wissensmanagement Zentrum für Translationswissenschaft Grundlagen und Definitionen Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache.

Mehr

2 Sprachliche Einheiten

2 Sprachliche Einheiten 2 Sprachliche Einheiten Inhalt Semiotische Begriffe Wörter Wortbestandteile Wortzusammensetzungen Wortgruppen Text und Dialog Wort- und Satzbedeutung 2.1 Semiotische Begriffe Semiotische Begriffe Semiotik

Mehr

Informationsextraktion. Karin Haenelt 1.12.2012

Informationsextraktion. Karin Haenelt 1.12.2012 Informationsextraktion Karin Haenelt 1.12.2012 Informationsextraktion Ziel Identifikation bestimmter Information (Daten) in einem unstrukturierten oder teilstrukturierten textuellen Dokument Transformation

Mehr

Formale Sprachen und Grammatiken

Formale Sprachen und Grammatiken Formale Sprachen und Grammatiken Jede Sprache besitzt die Aspekte Semantik (Bedeutung) und Syntax (formaler Aufbau). Die zulässige und korrekte Form der Wörter und Sätze einer Sprache wird durch die Syntax

Mehr

Wissen aus unstrukturierten natürlichsprachlichen

Wissen aus unstrukturierten natürlichsprachlichen ZKI Tagung AK Supercomputing, 19.-20. Okt. 2015 Wissen aus unstrukturierten natürlichsprachlichen Daten Sprachtechnologie und Textanalytik in the large Udo Hahn Jena University Language & Information Engineering

Mehr

Informationsextraktion

Informationsextraktion Informationsextraktion Bestimmte Anwendungen bei der semantischen Verarbeitung erfordern keine tiefe linguistische Analyse mit exakter Disambiguierung (= eine einzige und korrekte Lesart). Hierzu gehört

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 Schütze & Zangenfeind: Konstituentensyntax

Mehr

Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1.

Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1. Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1. Zusammengefasst aus Ihren Beiträgen Wie bewerten sie das System ingesamt? Das Watson System verdeutlicht den Fortschritt der Künstlichen Intelligenz Forschung/Computerlinguistik/Informatik

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax WS 2006/2007 Manfred Pinkal Einführung in die Computerlinguistik 2006/2007 M. Pinkal UdS 1 Morphologie und Syntax Gegenstand der Morphologie ist die Struktur

Mehr

Chancen und Grenzen (semi-) automatischer, semantischer Analyse medizinischer Dokumente

Chancen und Grenzen (semi-) automatischer, semantischer Analyse medizinischer Dokumente Chancen und Grenzen (semi-) automatischer, semantischer Analyse medizinischer Dokumente conhit-session: medizinische Dokumentation aktuelle Herausforderungen und Perspektiven Berlin 15.04.2015 ID Information

Mehr

Parsing-EinfŸhrung Ð 1

Parsing-EinfŸhrung Ð 1 Parsing-EinfŸhrung bersicht Falsifizierbarkeit, oder: Sind Grammatiken wissenschaftlich? Grammatik, Formalismus Kontextfreie Grammatiken Ableitungen Ziel Verstehen der linguistischen Motivation Intuitives

Mehr

Volltextsuche und Text Mining

Volltextsuche und Text Mining 1 Volltextsuche und Text Mining Datum: 22.12.2009 Seminar: Einführung in die Computerlinguistik Referenten: Cornelia Baldauf, Valentin Heinz, Adriana Kosior 2 Agenda 1. Einführung a) Volltextsuche b) Text

Mehr

Einführung in die Computerlinguistik Statistische Grundlagen

Einführung in die Computerlinguistik Statistische Grundlagen Statistik 1 Sommer 2015 Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Sommersemester 2015 Statistik 2 Sommer 2015 Überblick 1. Diskrete Wahrscheinlichkeitsräume

Mehr

Part of Speech Tagging. Linguistische Sicht. Carolin Deck

Part of Speech Tagging. Linguistische Sicht. Carolin Deck Part of Speech Tagging Linguistische Sicht Carolin Deck Gliederung 1. Begriffsklärung 2. Vorstellung zwei wichtiger Tagsets (STTS & PTTS) 3. Bedeutung des POS-Tagging für die Sprachwissenschaft 4. Tagzuweisung

Mehr

Fachseminar WS 2008/09

Fachseminar WS 2008/09 Fachseminar WS 2008/09 Fachgebiet: Compilerbau Thema: Lexikalische Analyse (Scanner) Referent: Ali Sediq Betreuer: Prof. Dr. Helmut Weber 1 Inhaltsverzeichnis Lexikalische Analyse 1.0 Grundprobleme der

Mehr

HEALTH Institut für Biomedizin und Gesundheitswissenschaften

HEALTH Institut für Biomedizin und Gesundheitswissenschaften HEALTH Institut für Biomedizin und Gesundheitswissenschaften Konzept zur Verbesserung eines klinischen Information Retrieval Systems unter Verwendung von Apache UIMA und medizinischen Ontologien Georg

Mehr

Einführung Computerlinguistik. Überblick

Einführung Computerlinguistik. Überblick Einführung Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-14 Schütze & Zangenfeind: Überblick 1 / 30 Take-away Schütze

Mehr

Multimedia-Metadaten und ihre Anwendung

Multimedia-Metadaten und ihre Anwendung Multimedia-Metadaten und ihre Anwendung 14.02.2006 Video Retrieval und Video Summarization Maria Wagner Aspekte des Video Retrieval 2/14 Videoanalyse Analyse nötig, um Struktur und Metadaten zu erkennen

Mehr

Zusammenfassung. 1 Wir betrachten die folgende Signatur F = {+,,, 0, 1} sodass. 3 Wir betrachten die Gleichungen E. 4 Dann gilt E 1 + x 1

Zusammenfassung. 1 Wir betrachten die folgende Signatur F = {+,,, 0, 1} sodass. 3 Wir betrachten die Gleichungen E. 4 Dann gilt E 1 + x 1 Zusammenfassung Zusammenfassung der letzten LV Einführung in die Theoretische Informatik Woche 7 Harald Zankl Institut für Informatik @ UIBK Wintersemester 2014/2015 1 Wir betrachten die folgende Signatur

Mehr

Morphologie Einleitung. System der deutschen Sprache Morphologie nominale Kategorie: Genus

Morphologie Einleitung. System der deutschen Sprache Morphologie nominale Kategorie: Genus System der deutschen Sprache nominale Kategorie: Genus Beat Siebenhaar Frank Liedtke Einleitung! Morphem als kleinste bedeutungstragende Einheit! als Lehre von den Morphemen! Agglutination! Flexion! Genus,

Mehr

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute

Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute Das TIGER-Korpus: Annotation und Exploration Stefanie Dipper Forschungskolloquium Korpuslinguistik, 11.11.03 Gliederung 1. TIGER-Korpus 2. Annotation 3. Visualisierung 4. Suche, Retrieval 5. Demo 6. Repräsentation

Mehr

Practical Grammar Engineering Using HPSG. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel

Practical Grammar Engineering Using HPSG. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Practical Grammar Engineering Using HPSG Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Inhalt Organisatorisches HPSG Grammatiken Werkzeuge Kodierungen TDL Syntax Über dieses Seminar

Mehr

Quellen: Towards a Human Computer InteractionPerspective. Übersicht. Warum visuelle Sprachen? Begriffsdefinitionen: Hinderungsgründe bisher:

Quellen: Towards a Human Computer InteractionPerspective. Übersicht. Warum visuelle Sprachen? Begriffsdefinitionen: Hinderungsgründe bisher: Quellen: Towards a Human Computer InteractionPerspective von B.K. & B.K. LV: Visuelle Sprachen (03-763) Universität Bremen WS 2001/02 Visual Language Theory: Towards a Human- Computer Perspective; N. Hari

Mehr

Grammatik Prüfung möglich, ob eine Zeichenfolge zur Sprache gehört oder nicht

Grammatik Prüfung möglich, ob eine Zeichenfolge zur Sprache gehört oder nicht Zusammenhang: Formale Sprache Grammatik Formale Sprache kann durch Grammatik beschrieben werden. Zur Sprache L = L(G) gehören nur diejenigen Kombinationen der Zeichen des Eingabealphabets, die durch die

Mehr

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 17.04.2015 Entscheidungsprobleme beim Textmining

Mehr

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 24.11.2014, 9 c.t. Zangenfeind: Morphologie 1 / 18 Wdh.: Klassifizierung

Mehr

Strukturierte Analyse von Entwicklungs-Frameworks für elektronische Akten im Gesundheitswesen

Strukturierte Analyse von Entwicklungs-Frameworks für elektronische Akten im Gesundheitswesen Strukturierte Analyse von Entwicklungs-Frameworks für elektronische Akten im Gesundheitswesen Christian Schäfer Martin Staemmler 06. September 2010 GMDS Jahrestagung 2010, Mannheim understanding reality

Mehr

Plank, WS 03/04, EinfLing, M&S 4b 1 Morphologische Analyse:

Plank, WS 03/04, EinfLing, M&S 4b 1 Morphologische Analyse: Plank, WS 03/04, EinfLing, M&S 4b 1 Morphologische Analyse: Segmentieren in Morphe (gegebenenfalls) Zusammenfassen von Morphen als Realisierungen eines Morphems Erfassen von Allomorphie-Beziehungen (Art

Mehr

Erstspracherwerb. Sprachentwicklung: Wortschatz

Erstspracherwerb. Sprachentwicklung: Wortschatz Erstspracherwerb Sprachentwicklung: Wortschatz Gliederung: 1. Welche 3 Phasen der lexikalischen Entwicklung werden bei Kindern unterschieden? 2. Welche sprachlichen Inhalte lernt das Kind 3. Wie verläuft

Mehr

XDOC Extraktion, Repräsentation und Auswertung von Informationen

XDOC Extraktion, Repräsentation und Auswertung von Informationen XDOC Extraktion, Repräsentation und Auswertung von Informationen Manuela Kunze Otto-von-Guericke Universität Magdeburg Fakultät für Informatik Institut für Wissens- und Sprachverarbeitung Gliederung Ausgangspunkt

Mehr

Terminologie-Extraktion: Beispiel

Terminologie-Extraktion: Beispiel Terminologie-Extraktion: Beispiel The major risks of long-term cardiotoxicity relate to treatment prior to the BMT, in particular, anthracyclines, ablative-dose Cytoxan (ie, dose > 150 mg/ kg), chest [radiation

Mehr

Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz)

Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz) Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz) 1 Maschinelle Übersetzung (MÜ) Überblick: Warum MÜ: Datenmenge, Qualität und

Mehr

Ein bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort?

Ein bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort? Ein bisschen Werbung Einführung in die Morphologie Einleitung, Grundbegriffe I Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 "Morphology is the conceptual centre of linguistics. This

Mehr

SMART DATA IN DER MEDIZIN WIE COMPUTER HELFEN, DIE RICHTIGE DIAGNOSE ZU FINDEN. Referentenbeitrag bei der Special Interest Group (SIG) Big Data 2015

SMART DATA IN DER MEDIZIN WIE COMPUTER HELFEN, DIE RICHTIGE DIAGNOSE ZU FINDEN. Referentenbeitrag bei der Special Interest Group (SIG) Big Data 2015 SMART DATA IN DER MEDIZIN WIE COMPUTER HELFEN, DIE RICHTIGE DIAGNOSE ZU FINDEN Referentenbeitrag bei der Special Interest Group (SIG) Big Data 2015 Dr. med. Dipl.-Phys. Thomas Faßbender INHALT 1. Vorstellung

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax II WS 2008/2009 Manfred Pinkal Morphologie und Syntax Gegenstand der Morphologie ist die Struktur des Wortes: der Aufbau von Wörtern aus Morphemen, den kleinsten

Mehr

Eine semantische Suchmaschine in der Biomedizin

Eine semantische Suchmaschine in der Biomedizin Eine semantische Suchmaschine in der Biomedizin Jena University Language and Information Engineering Lab Anne Schneider Friedrich-Schiller-Universität Jena Einstieg Großes Wachstum von Daten im Bereich

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

5. Maschinelle Verarbeitung natürlicher Sprache (Computerlinguistik) (1)

5. Maschinelle Verarbeitung natürlicher Sprache (Computerlinguistik) (1) 5. Maschinelle Verarbeitung natürlicher Sprache (Computerlinguistik) (1) 5.1 Vorbemerkungen Wissen, das als Ergebnis menschlichen Denkens vorliegt, wird durch Sprache mitgeteilt. Unterscheidung von Sprachen:

Mehr

Was ist ein Compiler?

Was ist ein Compiler? Was ist ein Compiler? Was ist ein Compiler und worum geht es? Wie ist ein Compiler aufgebaut? Warum beschäftigen wir uns mit Compilerbau? Wie ist die Veranstaltung organisiert? Was interessiert Sie besonders?

Mehr

Zusatzdienste für die Kontinuität der Behandlung Daniel Diekmann, ID GmbH & Co. KGaA

Zusatzdienste für die Kontinuität der Behandlung Daniel Diekmann, ID GmbH & Co. KGaA Zusatzdienste für die Kontinuität der Behandlung Daniel Diekmann, ID GmbH & Co. KGaA Systems München 22.10.2008 ID - Information und Dokumentation im Gesundheitswesen - Kernkompetenz: Codierung, Terminologie,

Mehr

Herausforderungen bei der Übersetzung und Adaption eines englischen SLI-Screenings ins Deutsche

Herausforderungen bei der Übersetzung und Adaption eines englischen SLI-Screenings ins Deutsche Herausforderungen bei der Übersetzung und Adaption eines englischen SLI-Screenings ins Deutsche Bettina Fürst ULG Klinische Linguistik, MSc Präsentation der Abschluss- Arbeit 20. März 2010, Salzburg Forschungsfragen

Mehr

B.A. LINGUISTIK. Bachelorstudiengang Linguistik an der Universität Leipzig

B.A. LINGUISTIK. Bachelorstudiengang Linguistik an der Universität Leipzig B.A. LINGUISTIK Bachelorstudiengang Linguistik an der Universität Leipzig WOMIT BESCHÄFTIGT SICH DIE LINGUISTIK? Gegenstand der Linguistik sind anders als bei den Einzel-Philologien nicht die konkreten

Mehr

Von Tags zu Semantischen Netzen

Von Tags zu Semantischen Netzen Von Tags zu Semantischen Netzen Einsatz im Resourcen-basierten Lernen httc Hessian Telemedia Technology Competence-Center e.v - www.httc.de Dipl.-Inf. Renato Domínguez García Doreen Böhnstedt, M. Sc. Dipl.-Inf.

Mehr

WMS Block: Management von Wissen in Dokumentenform PART: Text Mining. Myra Spiliopoulou

WMS Block: Management von Wissen in Dokumentenform PART: Text Mining. Myra Spiliopoulou WMS Block: Management von Wissen in nform PART: Text Mining Myra Spiliopoulou WIE ERFASSEN UND VERWALTEN WIR EXPLIZITES WISSEN? 1. Wie strukturieren wir Wissen in nform? 2. Wie verwalten wir nsammlungen?

Mehr

1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen. I.2. I.2. Grundlagen von von Programmiersprachen.

1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen. I.2. I.2. Grundlagen von von Programmiersprachen. 1. Der Begriff Informatik 2. Syntax und Semantik von Programmiersprachen I.2. I.2. Grundlagen von von Programmiersprachen. - 1 - 1. Der Begriff Informatik "Informatik" = Kunstwort aus Information und Mathematik

Mehr

Eine Schnittstelle für Arztpraxisdaten mittels einer Ontologie auf Basis von HL7 Version 3

Eine Schnittstelle für Arztpraxisdaten mittels einer Ontologie auf Basis von HL7 Version 3 Eine Schnittstelle für Arztpraxisdaten mittels einer Ontologie auf Basis von HL7 Version 3 Jan Kunze, Thomas Riechert, Sören Auer Universität Leipzig Augustusplatz 10-11 04109 Leipzig jan-kunze@gmx.de,

Mehr

HPSG. Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer

HPSG. Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer HPSG Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer Gliederung Einleitung Kongruenz Allgemein Zwei Theorien der Kongruenz Probleme bei ableitungsbasierenden Kongruenztheorien Wie syntaktisch

Mehr

Opinion Mining in der Marktforschung

Opinion Mining in der Marktforschung Opinion Mining in der Marktforschung von andreas.boehnke@stud.uni-bamberg.de S. 1 Überblick I. Motivation Opinion Mining II. Grundlagen des Text Mining III. Grundlagen des Opinion Mining IV. Opinion Mining

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Schriftsysteme. Schriftsysteme. Seminar: Suchmaschinen Dozent: Stefan Langer CIS, Universität München Wintersemester 2010

Schriftsysteme. Schriftsysteme. Seminar: Suchmaschinen Dozent: Stefan Langer CIS, Universität München Wintersemester 2010 Seminar: Suchmaschinen Dozent: Stefan Langer CIS, Universität München Wintersemester 2010 Übung (5 min) Welche kennen Sie? Finden Sie jeweils ein Beispiel für jeden der unten angegebenen Typen Alphabete

Mehr

Grundlagen der Informatik II. Teil I: Formale Modelle der Informatik

Grundlagen der Informatik II. Teil I: Formale Modelle der Informatik Grundlagen der Informatik II Teil I: Formale Modelle der Informatik 1 Einführung GdInfoII 1-2 Ziele/Fragestellungen der Theoretischen Informatik 1. Einführung abstrakter Modelle für informationsverarbeitende

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Thomas Vanck

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Thomas Vanck Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-Pipeline Tobias Scheffer Thomas Vanck NLP-Pipeline Folge von Verarbeitungsschritten für Informationsextraktion, Übersetzung,

Mehr

4. 4. Algorithmen und Datenstrukturen in deskriptiven Programmiersprachen

4. 4. Algorithmen und Datenstrukturen in deskriptiven Programmiersprachen Kapitel Kapitel 4 Deskriptive Programmierung SS 2008 4. 4. Algorithmen und Datenstrukturen in in deskriptiven Programmiersprachen Deskriptive Programmierung 1 Sprachverarbeitung in in Prolog Prolog Prolog

Mehr

Berichte aus der Medizinischen Informatik und Bioinformatik. Günther Schadow. Krankenhauskommunikation mit HL7

Berichte aus der Medizinischen Informatik und Bioinformatik. Günther Schadow. Krankenhauskommunikation mit HL7 Berichte aus der Medizinischen Informatik und Bioinformatik Günther Schadow Krankenhauskommunikation mit HL7 Analyse, Implementation und Anwendungeines Protokollstandards für medizinische Datenkommunikation

Mehr

Anlage 1: Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Computerlinguistik

Anlage 1: Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Computerlinguistik Anlage : Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Legende: PM = Pflichtmodul; WPM = Wahlpflichtmodul; WM = Wahlmodul VL = Vorlesung; PS = Proseminar; HS = Hauptseminar; Ü =

Mehr

Christian Zietzsch / Norman Zänker. Text Mining. und dessen Implementierung. Diplomica Verlag

Christian Zietzsch / Norman Zänker. Text Mining. und dessen Implementierung. Diplomica Verlag Christian Zietzsch / Norman Zänker Text Mining und dessen Implementierung Diplomica Verlag Christian Zietzsch, Norman Zänker Text Mining und dessen Implementierung ISBN: 978-3-8428-0970-3 Herstellung:

Mehr

Regelbasiertes Routing unstrukturierter Daten

Regelbasiertes Routing unstrukturierter Daten Regelbasiertes Routing unstrukturierter Daten Mittwoch, 16. September 2015, Developer Academy Thomas Nitzsche, Sales Engineer Regelbasiertes Routing unstrukturierter Daten Überblick Ziel: Regelbasiertes

Mehr

Einführung. Information Retrieval. IR-Aufgaben. IR in Beispielen. Adhoc-Suche: Web. IR in Beispielen. Was ist IR? Norbert Fuhr

Einführung. Information Retrieval. IR-Aufgaben. IR in Beispielen. Adhoc-Suche: Web. IR in Beispielen. Was ist IR? Norbert Fuhr Einführung Information Retrieval Norbert Fuhr 13. Oktober 2011 IR in Beispielen Was ist IR? Daten Information Wissen Dimensionen des IR Rahmenarchitektur für IR-Systeme Adhoc-Suche: Web IR in Beispielen

Mehr

Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren)

Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren) Einführung in die Computerlinguistik Morphologie (morphembasiert mit Transduktoren) Dozentin: Wiebke Petersen 7. Foliensatz Wiebke Petersen Einführung CL 1 Morphologische Grundbegrie Wort / Lexem: abstrakte

Mehr

Grammatik des Standarddeutschen. Michael Schecker

Grammatik des Standarddeutschen. Michael Schecker Grammatik des Standarddeutschen Michael Schecker Einführung und Grundlagen Nominalgruppen Nomina Artikel Attribute Pronomina Kasus (Subjekte und Objekte, Diathese) Verbalgruppen Valenz und Argumente Tempora

Mehr

Multilinguales Information Retrieval, AG Datenbanken und Informationssysteme. Multilinguales Information Retrieval

Multilinguales Information Retrieval, AG Datenbanken und Informationssysteme. Multilinguales Information Retrieval Multilinguales Information Retrieval 1 Definition IR in einer anderen Sprache als Englisch IR auf einer einsprachigen Dokumentensammlung, die in mehreren Sprachen befragt werden kann. Information Retrieval

Mehr

Klausur: Lösungen und Bewertungen

Klausur: Lösungen und Bewertungen Sommersemester 2004 Norbert Rüffer 1) Beschreiben Sie anhand des Logogenmodells die Verarbeitungsschritte beim 1. lauten Lesen von Wörtern und Pseudowörtern 2. Verstehen gelesener Wörter/Erkennen gelesener

Mehr

Einführung in die Theoretische Informatik

Einführung in die Theoretische Informatik Einführung in die Theoretische Informatik Woche 10 Harald Zankl Institut für Informatik @ UIBK Wintersemester 2014/2015 Zusammenfassung Zusammenfassung der letzten LV Satz Sei G = (V, Σ, R, S) eine kontextfreie

Mehr

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 16.05.2013 Gliederung 1 Vorverarbeitung

Mehr

Computerlinguistische Verfahren und Theorien für die Textproduktion in der Technischen Redaktion. Melanie Siegel

Computerlinguistische Verfahren und Theorien für die Textproduktion in der Technischen Redaktion. Melanie Siegel Computerlinguistische Verfahren und Theorien für die Textproduktion in der Technischen Redaktion Melanie Siegel Produktion technischer Dokumente Verständlichkeit Lesbarkeit Übersetzbarkeit Konsistenz Rechtschreibung

Mehr

!"#$%&'()$"*+,(%'-()$"

!#$%&'()$*+,(%'-()$ "#$%&'()$"*+,(%'-()$" A$,()'*B'3)#01*C*.,D$*43(%(, "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5 7,(2)#1(080*94*:;', ?>@=>?? "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*?>@=>??

Mehr

Medizinische Nomenklaturen

Medizinische Nomenklaturen Medizinische Nomenklaturen Einführung Nomenklaturen Wissenschaftliches Beziehungssystem Sammlung von Namen, die nach bestimmten Regeln gebildet wurden Systematische Zusammenstellung von Deskriptoren (Bezeichnungen,

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax II WS 2012/2013 Manfred Pinkal Eigenschaften der syntaktischen Struktur [1] Er hat die Übungen gemacht. Der Student hat die Übungen gemacht. Der interessierte

Mehr

Computerlinguistik in Requirements Engineering

Computerlinguistik in Requirements Engineering Computerlinguistik in Requirements Engineering Dr. Leonid Kof kof@in.tum.de TU München, Fakultät für Informatik, Lehrstuhl Software und Systems Engineering 24.11.06 Leonid Kof, TUM: Computerlinguistik

Mehr

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen

Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen Spezielle Themen der KI NLP Natural Language Processing Sprachverstehen NLP - Verarbeitungsstufen des Sprachverstehen 2 Phonologie und Phonetik Phonologie Lautlehre oder Sprachgebilde-Lautlehre untersucht

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2)

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2) Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Grammatik einfach praktisch - Englisch (Niveau: A1 - B2) Das komplette Material finden Sie hier: School-Scout.de Eine moderne und

Mehr

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser

Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Gliederung Einleitung Problemstellungen Ansätze & Herangehensweisen Anwendungsbeispiele Zusammenfassung 2 Gliederung

Mehr

Sprachtypologie 1. Sitzung (14. April) Alena Witzlack-Makarevich SoSe 2015

Sprachtypologie 1. Sitzung (14. April) Alena Witzlack-Makarevich SoSe 2015 Sprachtypologie 1. Sitzung (14. April) Alena Witzlack-Makarevich SoSe 2015 1 Gegenstand der Sprachtypologie Wie erklären Sie einem Erstsemester, was der Gegenstand und die Ziele der Sprachtypologie sind?

Mehr

LANGSOFT, Sprachlernmittel, Schweiz. DOKUMENTATION und Präsentation

LANGSOFT, Sprachlernmittel, Schweiz. DOKUMENTATION und Präsentation LANGSOFT, Sprachlernmittel, Schweiz DOKUMENTATION und Präsentation 1. Eintragung. Zuerst registriert am 27.05.1994 in Graubünden, Schweiz, Reg. No 1.350.000.133. Erneut registriert am 09.12.1996 in Graubünden,

Mehr

Medizinische Informatik 1. Einführung. Wintersemester 2010/11 Dozent: Univ. Prof. Dr. med. Stefan Schulz

Medizinische Informatik 1. Einführung. Wintersemester 2010/11 Dozent: Univ. Prof. Dr. med. Stefan Schulz Medizinische Informatik 1. Einführung Wintersemester 2010/11 Dozent: Univ. Prof. Dr. med. Stefan Schulz zur Person (I) geboren in Karlsruhe (D) Studium der Humanmedizin in Heidelberg, Mannheim und Porto

Mehr

Endliche Automaten zur Erkennung von Stoppwörtern

Endliche Automaten zur Erkennung von Stoppwörtern Endliche Automaten zur Erkennung von Stoppwörtern Vortrag von Christian Schwarz & Andreas Beyer im Seminar FSM zur Spracherkennung 06.07.2009 DFA zur Spracherkennung 2009 - Uni Heidelberg - Vortrag Stoppwörter

Mehr

Grundbegriffe der Informatik

Grundbegriffe der Informatik Grundbegriffe der Informatik Einheit 15: Reguläre Ausdrücke und rechtslineare Grammatiken Thomas Worsch Universität Karlsruhe, Fakultät für Informatik Wintersemester 2008/2009 1/25 Was kann man mit endlichen

Mehr

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische

Mehr

healthcare within reach Mindray VS-900 Vitalzeichen intelligent gemacht

healthcare within reach Mindray VS-900 Vitalzeichen intelligent gemacht healthcare within reach Mindray VS-900 Vitalzeichen intelligent gemacht Elektronische Patientenakte: Immer aktuell, überall verfügbar Sichere Daten und kurze Entscheidungswege sind elementare Grundlagen

Mehr

Inhaltliche Erschließung von Arztbriefen in der Praxis

Inhaltliche Erschließung von Arztbriefen in der Praxis M:\Aussendarstellung\Foliensaetze\MN\xml.ppt Inhaltliche Erschließung von Arztbriefen in der Praxis Mark Neumann ID Berlin Übersicht ID LOGIK -Services verwendet in: 1. ID Arztbrief Online 2. ID Pharma

Mehr

Rhetorik und Audiovisuelle Rhetorik. A. Echterhoff FH Aachen FB Design 24.04.01

Rhetorik und Audiovisuelle Rhetorik. A. Echterhoff FH Aachen FB Design 24.04.01 Rhetorik und Audiovisuelle Rhetorik A. Echterhoff FH Aachen FB Design 24.04.01 Inhalt 1 2 3 4 5 6 Definitionen und Geschichte Vorbereitung der Kommunikation Rhetorische Figuren Visuelle Elemente in der

Mehr

Inaugural-Dissertation. Philosophie

Inaugural-Dissertation. Philosophie Ontology On Demand Vollautomatische Ontologieerstellung aus deutschen Texten mithilfe moderner Textmining-Prozesse Inaugural-Dissertation zur Erlangung des Grades eines Doktors der Philosophie in der Fakultät

Mehr

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz

Suchmaschinen und ihre Architektur. Seminar: Angewandtes Information Retrieval Referat von Michael Wirz Suchmaschinen und ihre Architektur Seminar: Angewandtes Information Retrieval Referat von Michael Wirz Ziel Rudimentäre Grundkenntnisse über die Funktionsweise von Suchmaschinen und Trends Einführung in

Mehr

Was ist ein Wort? Morphologie I Einf. in die Linguistik

Was ist ein Wort? Morphologie I Einf. in die Linguistik Morphologie I Einf. in die Linguistik Was ist ein Wort? Ich will Rad fahren Ich will radfahren Ich will Räder fahren *Ich will räderfahren 1 Wenn es flektiert ist, ist es ein Wort. (und wenn es keine sichtbare

Mehr

INEX. INitiative for the Evaluation of XML Retrieval. Sebastian Rassmann, Christian Michele

INEX. INitiative for the Evaluation of XML Retrieval. Sebastian Rassmann, Christian Michele INEX INitiative for the Evaluation of XML Retrieval Was ist INEX? 2002 gestartete Evaluierungsinitiative Evaluierung von Retrievalmethoden für XML Dokumente Berücksichtigt die hierarchische Dokumentstruktur

Mehr

Modulhandbuch für den integrierten Studiengang Informationswissenschaft und Sprachtechnologie

Modulhandbuch für den integrierten Studiengang Informationswissenschaft und Sprachtechnologie Modulhandbuch für den integrierten Studiengang Informationswissenschaft und Sprachtechnologie im Bachelorstudium der Philosophischen Fakultät der Heinrich-Heine-Universität Düsseldorf Stand: 10/2011 Inhaltsübersicht

Mehr

EAI - Enterprise Application Integration

EAI - Enterprise Application Integration EAI - Enterprise Application Integration Jutta Mülle WS 2005/2006 EAI - Folie 1 Überblick und Begriffsbildung Zusammenfassung und Ausblick hinweise EAI - Folie 2 Conclusion EAI Enterprise Application Integration

Mehr

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....

Mehr

Physiotherapeutisches Expertentool im cloudbasierten. AW1 Nicolas With Betreuer: Olaf Zukunft

Physiotherapeutisches Expertentool im cloudbasierten. AW1 Nicolas With Betreuer: Olaf Zukunft Physiotherapeutisches Expertentool im cloudbasierten Netzwerk AW1 Nicolas With Betreuer: Olaf Zukunft Gliederung Idee Grundlagen Motivation Umsetzung Cloud Applikation Risiken Entwicklung Thema Ausblick

Mehr

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006 Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet

Mehr

Programmbeschreibungen. PIH-Software. Alexander M. Hüther. für WINDOWS & MAC-OS

Programmbeschreibungen. PIH-Software. Alexander M. Hüther. für WINDOWS & MAC-OS Programmbeschreibungen PIH-Software für WINDOWS & MAC-OS Alexander M. Hüther Stand: November 2002 PIH-CD Teil 1 Rechnen Zahlenstrahl bis 100 Übung 1: Durch das Eingeben einer beliebigen Zahl wandert der

Mehr

Ein Portal für Medizinische Formulare. Martin Dugas dugas@uni-muenster.de

Ein Portal für Medizinische Formulare. Martin Dugas dugas@uni-muenster.de Ein Portal für Medizinische Formulare Martin Dugas dugas@uni-muenster.de Agenda Kurzvorstellung IMI Hintergrund und Problemstellung MDM-Portal für Medizinische Formulare Diskussion: Freier Zugang zu medizinischen

Mehr

Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren

Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren Dozentin: Wiebke Petersen 14.6.2010 Wiebke Petersen Einführung CL SoSe 2010 1 Morphologische Grundbegrie

Mehr