Einführung in die Computerlinguistik

Größe: px
Ab Seite anzeigen:

Download "Einführung in die Computerlinguistik"

Transkript

1 Einführung in die Computerlinguistik Hinrich Schütze Center for Information and Language Processing Schütze: Einführung in die Computerlinguistik 1 / 75

2 Die Grundfassung dieses Foliensatzes wurde von Dr. Benjamin Roth erstellt. Fehler und Mängel sind ausschließlich meine Verantwortung. Schütze: Einführung in die Computerlinguistik 2 / 75

3 Outline 1 Was ist Computerlinguistik? 2 Organisation 3 Linguistik 4 CL-Methoden 5 Sprachtechnologie 6 Allgemeines Schütze: Einführung in die Computerlinguistik 3 / 75

4 Outline 1 Was ist Computerlinguistik? 2 Organisation 3 Linguistik 4 CL-Methoden 5 Sprachtechnologie 6 Allgemeines Schütze: Einführung in die Computerlinguistik 4 / 75

5 Was ist Computerlinguistik? Definition Computational linguistics is the scientific study of models and methods for automatic processing of natural language. Computational linguistics is an interdisciplinary field that shares a large part of its subject matter with computer science and linguistics. However, computational linguists also work on theories, models and methods that are not part of core linguistics or core computer science. Schütze: Einführung in die Computerlinguistik 5 / 75

6 Was ist Computerlinguistik? Definition Computational linguistics is the scientific study of models and methods for automatic processing of natural language. Computational linguistics is an interdisciplinary field that shares a large part of its subject matter with computer science and linguistics. However, computational linguists also work on theories, models and methods that are not part of core linguistics or core computer science. Schütze: Einführung in die Computerlinguistik 5 / 75

7 Was ist Computerlinguistik? Definition Computational linguistics is the scientific study of models and methods for automatic processing of natural language. Computational linguistics is an interdisciplinary field that shares a large part of its subject matter with computer science and linguistics. However, computational linguists also work on theories, models and methods that are not part of core linguistics or core computer science. Schütze: Einführung in die Computerlinguistik 5 / 75

8 Was ist Computerlinguistik? Definition Computational linguistics is the scientific study of models and methods for automatic processing of natural language. Computational linguistics is an interdisciplinary field that shares a large part of its subject matter with computer science and linguistics. However, computational linguists also work on theories, models and methods that are not part of core linguistics or core computer science. Schütze: Einführung in die Computerlinguistik 5 / 75

9 Teilbereiche der Computerlinguistik Traditionell zwei Teilbereiche: Schütze: Einführung in die Computerlinguistik 6 / 75

10 Teilbereiche der Computerlinguistik Traditionell zwei Teilbereiche: 1 Theoretische Computerlinguistik: Sieht sich als Teildisziplin der Linguistik, die formale berechenbare Modelle natürlicher Sprache entwickelt, implementiert und untersucht. Schütze: Einführung in die Computerlinguistik 6 / 75

11 Teilbereiche der Computerlinguistik Traditionell zwei Teilbereiche: 1 Theoretische Computerlinguistik: Sieht sich als Teildisziplin der Linguistik, die formale berechenbare Modelle natürlicher Sprache entwickelt, implementiert und untersucht. 2 Angewandte Computerlinguistik: interdisziplinäres Forschungsgebiet (Linguistik, Informatik), das konkrete Algorithmen für die maschinelle Sprachverarbeitung entwickelt (maschinelle Übersetzung, Spracherkennung...) Schütze: Einführung in die Computerlinguistik 6 / 75

12 Disziplinen: Eine leicht andere Sicht Schütze: Einführung in die Computerlinguistik 7 / 75

13 Disziplinen: Eine leicht andere Sicht Schütze: Einführung in die Computerlinguistik 8 / 75

14 Flying systems in nature Was ist Computerlinguistik? Organisation Schu tze: Einfu hrung in die Computerlinguistik Linguistik CL-Methoden Sprachtechnologie Allgemeines 9 / 75

15 Noch eine andere Sicht Schütze: Einführung in die Computerlinguistik 10 / 75

16 Anwendungen der Computerlinguistik Schütze: Einführung in die Computerlinguistik 11 / 75

17 Anwendungen der Computerlinguistik Häufigkeitsanalysen von Vorkommen von Wörtern und linguistischen Phänomenen Schütze: Einführung in die Computerlinguistik 11 / 75

18 Anwendungen der Computerlinguistik Häufigkeitsanalysen von Vorkommen von Wörtern und linguistischen Phänomenen Lexikographie (Thesauri, Wörterbücher) Schütze: Einführung in die Computerlinguistik 11 / 75

19 Anwendungen der Computerlinguistik Häufigkeitsanalysen von Vorkommen von Wörtern und linguistischen Phänomenen Lexikographie (Thesauri, Wörterbücher) Suche: Google, Facebook etc. Sehr große Menge an Information, aber hochgradig unstrukturiert direkter Zugang zu relevanten Daten ist schwierig. Schütze: Einführung in die Computerlinguistik 11 / 75

20 Anwendungen der Computerlinguistik Häufigkeitsanalysen von Vorkommen von Wörtern und linguistischen Phänomenen Lexikographie (Thesauri, Wörterbücher) Suche: Google, Facebook etc. Sehr große Menge an Information, aber hochgradig unstrukturiert direkter Zugang zu relevanten Daten ist schwierig. Dialoganwendungen: Zugang zu komplexen Systemen, z.b. Bestellung eines Bahn- oder Flugtickets, Interaktion mit Bank, auch mit natürlichsprachlichen Anwendungen Schütze: Einführung in die Computerlinguistik 11 / 75

21 Anwendungen der Computerlinguistik Häufigkeitsanalysen von Vorkommen von Wörtern und linguistischen Phänomenen Lexikographie (Thesauri, Wörterbücher) Suche: Google, Facebook etc. Sehr große Menge an Information, aber hochgradig unstrukturiert direkter Zugang zu relevanten Daten ist schwierig. Dialoganwendungen: Zugang zu komplexen Systemen, z.b. Bestellung eines Bahn- oder Flugtickets, Interaktion mit Bank, auch mit natürlichsprachlichen Anwendungen Übersetzungssysteme: fremdsprachige Web-Seiten, Gebrauchsanweisungen, Social Media etc. Schütze: Einführung in die Computerlinguistik 11 / 75

22 Anwendungen der Computerlinguistik Häufigkeitsanalysen von Vorkommen von Wörtern und linguistischen Phänomenen Lexikographie (Thesauri, Wörterbücher) Suche: Google, Facebook etc. Sehr große Menge an Information, aber hochgradig unstrukturiert direkter Zugang zu relevanten Daten ist schwierig. Dialoganwendungen: Zugang zu komplexen Systemen, z.b. Bestellung eines Bahn- oder Flugtickets, Interaktion mit Bank, auch mit natürlichsprachlichen Anwendungen Übersetzungssysteme: fremdsprachige Web-Seiten, Gebrauchsanweisungen, Social Media etc. automatische Silbentrennung, Rechtschreibprüfung und -korrektur Schütze: Einführung in die Computerlinguistik 11 / 75

23 Anwendungen der Computerlinguistik Häufigkeitsanalysen von Vorkommen von Wörtern und linguistischen Phänomenen Lexikographie (Thesauri, Wörterbücher) Suche: Google, Facebook etc. Sehr große Menge an Information, aber hochgradig unstrukturiert direkter Zugang zu relevanten Daten ist schwierig. Dialoganwendungen: Zugang zu komplexen Systemen, z.b. Bestellung eines Bahn- oder Flugtickets, Interaktion mit Bank, auch mit natürlichsprachlichen Anwendungen Übersetzungssysteme: fremdsprachige Web-Seiten, Gebrauchsanweisungen, Social Media etc. automatische Silbentrennung, Rechtschreibprüfung und -korrektur automatische Spracherkennung Schütze: Einführung in die Computerlinguistik 11 / 75

24 Anwendungen der Computerlinguistik Häufigkeitsanalysen von Vorkommen von Wörtern und linguistischen Phänomenen Lexikographie (Thesauri, Wörterbücher) Suche: Google, Facebook etc. Sehr große Menge an Information, aber hochgradig unstrukturiert direkter Zugang zu relevanten Daten ist schwierig. Dialoganwendungen: Zugang zu komplexen Systemen, z.b. Bestellung eines Bahn- oder Flugtickets, Interaktion mit Bank, auch mit natürlichsprachlichen Anwendungen Übersetzungssysteme: fremdsprachige Web-Seiten, Gebrauchsanweisungen, Social Media etc. automatische Silbentrennung, Rechtschreibprüfung und -korrektur automatische Spracherkennung Informationsextraktion, z.b. relevante Qualifikationen aus Bewerbungsschreiben und Lebensläufen maschinell extrahieren Schütze: Einführung in die Computerlinguistik 11 / 75

25 Berufsfelder für Computerlinguistik Schütze: Einführung in die Computerlinguistik 12 / 75

26 Berufsfelder für Computerlinguistik Verarbeitung gesprochener Sprache für die Interaktion mit Computern Schütze: Einführung in die Computerlinguistik 12 / 75

27 Berufsfelder für Computerlinguistik Verarbeitung gesprochener Sprache für die Interaktion mit Computern Verarbeitung von Texten (suchen, bearbeiten und verwalten) Schütze: Einführung in die Computerlinguistik 12 / 75

28 Berufsfelder für Computerlinguistik Verarbeitung gesprochener Sprache für die Interaktion mit Computern Verarbeitung von Texten (suchen, bearbeiten und verwalten) Einsatz sprachtechnologischer Software und Ressourcen (in Verlagen, Übersetzungsbüros, Verwaltungen etc.): Maschinelle Übersetzung, elektronische Wörterbücher, Spracherkennung, Sprachgenerierung, Optical-Character-Recognition-Verfahren (OCR) Schütze: Einführung in die Computerlinguistik 12 / 75

29 Berufsfelder für Computerlinguistik Verarbeitung gesprochener Sprache für die Interaktion mit Computern Verarbeitung von Texten (suchen, bearbeiten und verwalten) Einsatz sprachtechnologischer Software und Ressourcen (in Verlagen, Übersetzungsbüros, Verwaltungen etc.): Maschinelle Übersetzung, elektronische Wörterbücher, Spracherkennung, Sprachgenerierung, Optical-Character-Recognition-Verfahren (OCR) akademischer Bereich Schütze: Einführung in die Computerlinguistik 12 / 75

30 Berufsfelder für Computerlinguistik Verarbeitung gesprochener Sprache für die Interaktion mit Computern Verarbeitung von Texten (suchen, bearbeiten und verwalten) Einsatz sprachtechnologischer Software und Ressourcen (in Verlagen, Übersetzungsbüros, Verwaltungen etc.): Maschinelle Übersetzung, elektronische Wörterbücher, Spracherkennung, Sprachgenerierung, Optical-Character-Recognition-Verfahren (OCR) akademischer Bereich Bedarf an Experten steigt tendenziell Schütze: Einführung in die Computerlinguistik 12 / 75

31 Typische Forschungsgegenstände Schütze: Einführung in die Computerlinguistik 13 / 75

32 Typische Forschungsgegenstände Entwicklung von Methoden (Theorie) Schütze: Einführung in die Computerlinguistik 13 / 75

33 Typische Forschungsgegenstände Entwicklung von Methoden (Theorie) Entwicklung realistischer Anwendungen (Praxis) Schütze: Einführung in die Computerlinguistik 13 / 75

34 Typische Forschungsgegenstände Entwicklung von Methoden (Theorie) Entwicklung realistischer Anwendungen (Praxis) Aufbau und Verwaltung großer wiederverwendbarer Korpora (Daten) Schütze: Einführung in die Computerlinguistik 13 / 75

35 Typische Forschungsgegenstände Entwicklung von Methoden (Theorie) Entwicklung realistischer Anwendungen (Praxis) Aufbau und Verwaltung großer wiederverwendbarer Korpora (Daten) Konzeption effektiver Evaluierungsmechanismen (Experimente) Schütze: Einführung in die Computerlinguistik 13 / 75

36 Nachbardisziplinen (1) Schütze: Einführung in die Computerlinguistik 14 / 75

37 Nachbardisziplinen (1) Linguistik Schütze: Einführung in die Computerlinguistik 14 / 75

38 Nachbardisziplinen (1) Linguistik Die Wissenschaft, die sich mit menschlicher Sprache beschäftigt Schütze: Einführung in die Computerlinguistik 14 / 75

39 Nachbardisziplinen (1) Linguistik Die Wissenschaft, die sich mit menschlicher Sprache beschäftigt Grundinventar linguistischer Termini Schütze: Einführung in die Computerlinguistik 14 / 75

40 Nachbardisziplinen (1) Linguistik Die Wissenschaft, die sich mit menschlicher Sprache beschäftigt Grundinventar linguistischer Termini Teilgebiete: Phonetik/Phonologie, Morphologie, Syntax, Semantik, Pragmatik; Korpuslinguistik Schütze: Einführung in die Computerlinguistik 14 / 75

41 Nachbardisziplinen (1) Linguistik Die Wissenschaft, die sich mit menschlicher Sprache beschäftigt Grundinventar linguistischer Termini Teilgebiete: Phonetik/Phonologie, Morphologie, Syntax, Semantik, Pragmatik; Korpuslinguistik Informatik (Algorithmen, Datenstrukturen, Software Engineering) Schütze: Einführung in die Computerlinguistik 14 / 75

42 Nachbardisziplinen (1) Linguistik Die Wissenschaft, die sich mit menschlicher Sprache beschäftigt Grundinventar linguistischer Termini Teilgebiete: Phonetik/Phonologie, Morphologie, Syntax, Semantik, Pragmatik; Korpuslinguistik Informatik (Algorithmen, Datenstrukturen, Software Engineering) Kognitionswissenschaft (Sprachbeherrschung ist spezieller Teilbereich der kognitiven Fähigkeiten des Menschen) Schütze: Einführung in die Computerlinguistik 14 / 75

43 Nachbardisziplinen (1) Linguistik Die Wissenschaft, die sich mit menschlicher Sprache beschäftigt Grundinventar linguistischer Termini Teilgebiete: Phonetik/Phonologie, Morphologie, Syntax, Semantik, Pragmatik; Korpuslinguistik Informatik (Algorithmen, Datenstrukturen, Software Engineering) Kognitionswissenschaft (Sprachbeherrschung ist spezieller Teilbereich der kognitiven Fähigkeiten des Menschen) Künstliche Intelligenz (knowledge representation, reasoning, learning) Schütze: Einführung in die Computerlinguistik 14 / 75

44 Nachbardisziplinen (2) Schütze: Einführung in die Computerlinguistik 15 / 75

45 Nachbardisziplinen (2) Philosophie (Verbindung von Sprache, Denken und Handeln; Relation zu außersprachlichen Gegebenheiten) Schütze: Einführung in die Computerlinguistik 15 / 75

46 Nachbardisziplinen (2) Philosophie (Verbindung von Sprache, Denken und Handeln; Relation zu außersprachlichen Gegebenheiten) Mathematik Schütze: Einführung in die Computerlinguistik 15 / 75

47 Nachbardisziplinen (2) Philosophie (Verbindung von Sprache, Denken und Handeln; Relation zu außersprachlichen Gegebenheiten) Mathematik Insbesondere: Logik, Wahrscheinlichkeitstheorie, Statistik, Graphentheorie Schütze: Einführung in die Computerlinguistik 15 / 75

48 Nachbardisziplinen (2) Philosophie (Verbindung von Sprache, Denken und Handeln; Relation zu außersprachlichen Gegebenheiten) Mathematik Insbesondere: Logik, Wahrscheinlichkeitstheorie, Statistik, Graphentheorie Sprache ist oft nicht logisch: Schütze: Einführung in die Computerlinguistik 15 / 75

49 Nachbardisziplinen (2) Philosophie (Verbindung von Sprache, Denken und Handeln; Relation zu außersprachlichen Gegebenheiten) Mathematik Insbesondere: Logik, Wahrscheinlichkeitstheorie, Statistik, Graphentheorie Sprache ist oft nicht logisch: Schütze: Einführung in die Computerlinguistik 15 / 75

50 Nachbardisziplinen (2) Philosophie (Verbindung von Sprache, Denken und Handeln; Relation zu außersprachlichen Gegebenheiten) Mathematik Insbesondere: Logik, Wahrscheinlichkeitstheorie, Statistik, Graphentheorie Sprache ist oft nicht logisch: (1) Ein großer Berg vs. Eine große Ameise Schütze: Einführung in die Computerlinguistik 15 / 75

51 Nachbardisziplinen (2) Philosophie (Verbindung von Sprache, Denken und Handeln; Relation zu außersprachlichen Gegebenheiten) Mathematik Insbesondere: Logik, Wahrscheinlichkeitstheorie, Statistik, Graphentheorie Sprache ist oft nicht logisch: (1) Ein großer Berg vs. Eine große Ameise Vagheit des Adjektivs (kein Problem für Menschen) Logik ist nicht der geeignete Formalismus? Schütze: Einführung in die Computerlinguistik 15 / 75

52 Nachbardisziplinen (2) Philosophie (Verbindung von Sprache, Denken und Handeln; Relation zu außersprachlichen Gegebenheiten) Mathematik Insbesondere: Logik, Wahrscheinlichkeitstheorie, Statistik, Graphentheorie Sprache ist oft nicht logisch: (1) Ein großer Berg vs. Eine große Ameise Vagheit des Adjektivs (kein Problem für Menschen) Logik ist nicht der geeignete Formalismus? (2) Vögel fliegen. / Pinguine sind Vögel. / Pinguine fliegen. Schütze: Einführung in die Computerlinguistik 15 / 75

53 Nachbardisziplinen (2) Philosophie (Verbindung von Sprache, Denken und Handeln; Relation zu außersprachlichen Gegebenheiten) Mathematik Insbesondere: Logik, Wahrscheinlichkeitstheorie, Statistik, Graphentheorie Sprache ist oft nicht logisch: (1) Ein großer Berg vs. Eine große Ameise Vagheit des Adjektivs (kein Problem für Menschen) Logik ist nicht der geeignete Formalismus? (2) Vögel fliegen. / Pinguine sind Vögel. / Pinguine fliegen. scheinbar widersprüchliche Aussagen (Mensch hat wenig Probleme damit) Schütze: Einführung in die Computerlinguistik 15 / 75

54 Outline 1 Was ist Computerlinguistik? 2 Organisation 3 Linguistik 4 CL-Methoden 5 Sprachtechnologie 6 Allgemeines Schütze: Einführung in die Computerlinguistik 16 / 75

55 Personal Schütze: Einführung in die Computerlinguistik 17 / 75

56 Personal Vorlesung / Übung Schütze: Einführung in die Computerlinguistik 17 / 75

57 Personal Vorlesung / Übung Prof. Dr. Hinrich Schütze Schütze: Einführung in die Computerlinguistik 17 / 75

58 Personal Vorlesung / Übung Prof. Dr. Hinrich Schütze MSc Alena Moiseeva Schütze: Einführung in die Computerlinguistik 17 / 75

59 Personal Vorlesung / Übung Prof. Dr. Hinrich Schütze MSc Alena Moiseeva Tutorien / Aufgaben Schütze: Einführung in die Computerlinguistik 17 / 75

60 Personal Vorlesung / Übung Prof. Dr. Hinrich Schütze MSc Alena Moiseeva Tutorien / Aufgaben Ivana Daskalovska (Tutorium ab ) Schütze: Einführung in die Computerlinguistik 17 / 75

61 Personal Vorlesung / Übung Prof. Dr. Hinrich Schütze MSc Alena Moiseeva Tutorien / Aufgaben Ivana Daskalovska (Tutorium ab ) Falk Spellerberg Schütze: Einführung in die Computerlinguistik 17 / 75

62 Personal Vorlesung / Übung Prof. Dr. Hinrich Schütze MSc Alena Moiseeva Tutorien / Aufgaben Ivana Daskalovska (Tutorium ab ) Falk Spellerberg Johanna Strebl Schütze: Einführung in die Computerlinguistik 17 / 75

63 Personal Vorlesung / Übung Prof. Dr. Hinrich Schütze MSc Alena Moiseeva Tutorien / Aufgaben Ivana Daskalovska (Tutorium ab ) Falk Spellerberg Johanna Strebl Jannis Vamvas Schütze: Einführung in die Computerlinguistik 17 / 75

64 Personal Vorlesung / Übung Prof. Dr. Hinrich Schütze MSc Alena Moiseeva Tutorien / Aufgaben Ivana Daskalovska (Tutorium ab ) Falk Spellerberg Johanna Strebl Jannis Vamvas Sie erreichen uns unter: eicl1819 (at) cis.lmu.de Schütze: Einführung in die Computerlinguistik 17 / 75

65 Vorstellung Schütze: Einführung in die Computerlinguistik 18 / 75

66 Übungstermine Schütze: Einführung in die Computerlinguistik 19 / 75

67 Übungstermine Zur Klärung von Fragen zu Übungsblättern und Vorlesung. Schütze: Einführung in die Computerlinguistik 19 / 75

68 Übungstermine Zur Klärung von Fragen zu Übungsblättern und Vorlesung. Vorlesung/Übung am Freitag: Schütze: Einführung in die Computerlinguistik 19 / 75

69 Übungstermine Zur Klärung von Fragen zu Übungsblättern und Vorlesung. Vorlesung/Übung am Freitag: Freitags 10:15-11:45 Schütze: Einführung in die Computerlinguistik 19 / 75

70 Übungstermine Zur Klärung von Fragen zu Übungsblättern und Vorlesung. Vorlesung/Übung am Freitag: Freitags 10:15-11:45 Extra-Tutorat (Ivana Daskalovska): Schütze: Einführung in die Computerlinguistik 19 / 75

71 Übungstermine Zur Klärung von Fragen zu Übungsblättern und Vorlesung. Vorlesung/Übung am Freitag: Freitags 10:15-11:45 Extra-Tutorat (Ivana Daskalovska): Dienstags 12:15-13:45, U127 Schütze: Einführung in die Computerlinguistik 19 / 75

72 Übungsaufgaben Schütze: Einführung in die Computerlinguistik 20 / 75

73 Übungsaufgaben Bearbeitung in Moodle Schütze: Einführung in die Computerlinguistik 20 / 75

74 Übungsaufgaben Bearbeitung in Moodle Freischaltung: Jeweils Freitags nach der Vorlesung. Schütze: Einführung in die Computerlinguistik 20 / 75

75 Übungsaufgaben Bearbeitung in Moodle Freischaltung: Jeweils Freitags nach der Vorlesung. Diese Woche: Ausnahme Schütze: Einführung in die Computerlinguistik 20 / 75

76 Übungsaufgaben Bearbeitung in Moodle Freischaltung: Jeweils Freitags nach der Vorlesung. Diese Woche: Ausnahme Bearbeitungsfrist: Freitags (eine Woche später) vor der Vorlesung. Schütze: Einführung in die Computerlinguistik 20 / 75

77 Übungsaufgaben Bearbeitung in Moodle Freischaltung: Jeweils Freitags nach der Vorlesung. Diese Woche: Ausnahme Bearbeitungsfrist: Freitags (eine Woche später) vor der Vorlesung. Übungsblätter müssen von den Teilnehmern eigenständig bearbeitet werden. Schütze: Einführung in die Computerlinguistik 20 / 75

78 Übungsaufgaben Bearbeitung in Moodle Freischaltung: Jeweils Freitags nach der Vorlesung. Diese Woche: Ausnahme Bearbeitungsfrist: Freitags (eine Woche später) vor der Vorlesung. Übungsblätter müssen von den Teilnehmern eigenständig bearbeitet werden. Klausurbonus: In Abhängigkeit der erreichten Übungspunkte wird ein Klausurbonus von bis zu 10% der maximal erreichbaren Klausurpunkte gewährt, wenn die Klausur auch ohne die Bonuspunkte als bestanden gewertet würde. Schütze: Einführung in die Computerlinguistik 20 / 75

79 Sonstiges Schütze: Einführung in die Computerlinguistik 21 / 75

80 Sonstiges Für die meisten Vorlesungen wird es einen zu lesenden kurzen (je ca. 10 Seiten) Abschnitt aus einem Lehrbuch geben. Schütze: Einführung in die Computerlinguistik 21 / 75

81 Vorlesungsgliederung Schütze: Einführung in die Computerlinguistik 22 / 75

82 Vorlesungsgliederung Teil 1: Sprachwissenschaft Klassische Aufteilung von sprachlicher Form zu kommunikativer Funktion Schütze: Einführung in die Computerlinguistik 22 / 75

83 Vorlesungsgliederung Teil 1: Sprachwissenschaft Klassische Aufteilung von sprachlicher Form zu kommunikativer Funktion Teil 2: Computerlinguistische Methoden Computerlinguistische Techniken, die in verschiedenen Kontexten genutzt werden Schütze: Einführung in die Computerlinguistik 22 / 75

84 Vorlesungsgliederung Teil 1: Sprachwissenschaft Klassische Aufteilung von sprachlicher Form zu kommunikativer Funktion Teil 2: Computerlinguistische Methoden Computerlinguistische Techniken, die in verschiedenen Kontexten genutzt werden Teil 3: Computerlinguistische Anwendungen Praktische Anwendungen, wie z.b. automatische Übersetzungssysteme. Schütze: Einführung in die Computerlinguistik 22 / 75

85 Vorlesungsgliederung Schütze: Einführung in die Computerlinguistik 23 / 75

86 Vorlesungsgliederung Teil 1: Sprachwissenschaft Schütze: Einführung in die Computerlinguistik 23 / 75

87 Vorlesungsgliederung Teil 1: Sprachwissenschaft 1 Phonetik / Phonologie Merkmale sprachlicher Laute Lautsystem, Lautstrukturen Schütze: Einführung in die Computerlinguistik 23 / 75

88 Vorlesungsgliederung Teil 1: Sprachwissenschaft 1 Phonetik / Phonologie Merkmale sprachlicher Laute Lautsystem, Lautstrukturen 2 Morphologie Wortbildung, Flexion, Wortarten Wortstrukturen Schütze: Einführung in die Computerlinguistik 23 / 75

89 Vorlesungsgliederung Teil 1: Sprachwissenschaft 1 Phonetik / Phonologie Merkmale sprachlicher Laute Lautsystem, Lautstrukturen 2 Morphologie Wortbildung, Flexion, Wortarten Wortstrukturen 3 Syntax Größere sprachliche Einheiten und deren Zusammenhang Satzstrukturen Schütze: Einführung in die Computerlinguistik 23 / 75

90 Vorlesungsgliederung Teil 1: Sprachwissenschaft 1 Phonetik / Phonologie Merkmale sprachlicher Laute Lautsystem, Lautstrukturen 2 Morphologie Wortbildung, Flexion, Wortarten Wortstrukturen 3 Syntax Größere sprachliche Einheiten und deren Zusammenhang Satzstrukturen 4 Semantik Bedeutung sprachlicher Einheiten Bedeutungsstrukturen Schütze: Einführung in die Computerlinguistik 23 / 75

91 Vorlesungsgliederung Teil 1: Sprachwissenschaft 1 Phonetik / Phonologie Merkmale sprachlicher Laute Lautsystem, Lautstrukturen 2 Morphologie Wortbildung, Flexion, Wortarten Wortstrukturen 3 Syntax Größere sprachliche Einheiten und deren Zusammenhang Satzstrukturen 4 Semantik Bedeutung sprachlicher Einheiten Bedeutungsstrukturen 5 Pragmatik Sprache im kommunikativen Kontext Kommunikative Bedeutung Schütze: Einführung in die Computerlinguistik 23 / 75

92 Vorlesungsgliederung Schütze: Einführung in die Computerlinguistik 24 / 75

93 Vorlesungsgliederung Teil 2: Computerlinguistische Methoden Schütze: Einführung in die Computerlinguistik 24 / 75

94 Vorlesungsgliederung Teil 2: Computerlinguistische Methoden 1 Reguläre Sprachen, Endliche Automaten Beschreibungsmittel für einfache Zeichenketten. Schütze: Einführung in die Computerlinguistik 24 / 75

95 Vorlesungsgliederung Teil 2: Computerlinguistische Methoden 1 Reguläre Sprachen, Endliche Automaten Beschreibungsmittel für einfache Zeichenketten. 2 Hidden Markov Models, Wortartenzuweisung Statistische Verfahren, Wortarten zu bestimmen. Schütze: Einführung in die Computerlinguistik 24 / 75

96 Vorlesungsgliederung Teil 2: Computerlinguistische Methoden 1 Reguläre Sprachen, Endliche Automaten Beschreibungsmittel für einfache Zeichenketten. 2 Hidden Markov Models, Wortartenzuweisung Statistische Verfahren, Wortarten zu bestimmen. 3 Kontextfreie Grammatiken, Parsing Automatische syntaktische Analyse. Schütze: Einführung in die Computerlinguistik 24 / 75

97 Vorlesungsgliederung Teil 2: Computerlinguistische Methoden 1 Reguläre Sprachen, Endliche Automaten Beschreibungsmittel für einfache Zeichenketten. 2 Hidden Markov Models, Wortartenzuweisung Statistische Verfahren, Wortarten zu bestimmen. 3 Kontextfreie Grammatiken, Parsing Automatische syntaktische Analyse. Teil 3: Computerlinguistische Anwendungen Schütze: Einführung in die Computerlinguistik 24 / 75

98 Vorlesungsgliederung Teil 2: Computerlinguistische Methoden 1 Reguläre Sprachen, Endliche Automaten Beschreibungsmittel für einfache Zeichenketten. 2 Hidden Markov Models, Wortartenzuweisung Statistische Verfahren, Wortarten zu bestimmen. 3 Kontextfreie Grammatiken, Parsing Automatische syntaktische Analyse. Teil 3: Computerlinguistische Anwendungen 1 Maschinelle Übersetzung. Schütze: Einführung in die Computerlinguistik 24 / 75

99 Vorlesungsgliederung Teil 2: Computerlinguistische Methoden 1 Reguläre Sprachen, Endliche Automaten Beschreibungsmittel für einfache Zeichenketten. 2 Hidden Markov Models, Wortartenzuweisung Statistische Verfahren, Wortarten zu bestimmen. 3 Kontextfreie Grammatiken, Parsing Automatische syntaktische Analyse. Teil 3: Computerlinguistische Anwendungen 1 Maschinelle Übersetzung. 2 Suchmaschinen. Schütze: Einführung in die Computerlinguistik 24 / 75

100 Moodle Schütze: Einführung in die Computerlinguistik 25 / 75

101 Startseite Schütze: Einführung in die Computerlinguistik 26 / 75

102 Vertiefung Schütze: Einführung in die Computerlinguistik 27 / 75

103 Fachschaftsführung? Schütze: Einführung in die Computerlinguistik 28 / 75

104 Fragen? Schütze: Einführung in die Computerlinguistik 29 / 75

105 Outline 1 Was ist Computerlinguistik? 2 Organisation 3 Linguistik 4 CL-Methoden 5 Sprachtechnologie 6 Allgemeines Schütze: Einführung in die Computerlinguistik 30 / 75

106 Sprachliche Einheiten geschrieben Buchstabe Silbe Wort Phrase Satz Paragraph gesprochen Laut Silbe Wort Phrase Äußerung Discourse Schütze: Einführung in die Computerlinguistik 31 / 75

107 Sprachwissenschaft = Linguistik beschreibt Strukturen der Sprache(n) auf den Ebenen Schütze: Einführung in die Computerlinguistik 32 / 75

108 Sprachwissenschaft = Linguistik beschreibt Strukturen der Sprache(n) auf den Ebenen des Lautsystems Schütze: Einführung in die Computerlinguistik 32 / 75

109 Sprachwissenschaft = Linguistik beschreibt Strukturen der Sprache(n) auf den Ebenen des Lautsystems des Aufbaus von Wörtern Schütze: Einführung in die Computerlinguistik 32 / 75

110 Sprachwissenschaft = Linguistik beschreibt Strukturen der Sprache(n) auf den Ebenen des Lautsystems des Aufbaus von Wörtern der Kombination von Wörtern zu Phrasen und Äußerungen Schütze: Einführung in die Computerlinguistik 32 / 75

111 Sprachwissenschaft = Linguistik beschreibt Strukturen der Sprache(n) auf den Ebenen des Lautsystems des Aufbaus von Wörtern der Kombination von Wörtern zu Phrasen und Äußerungen der Bedeutung dieser Äußerungen, insbesondere im (außersprachlichen) Kontext ( Pragmatik) Schütze: Einführung in die Computerlinguistik 32 / 75

112 Sprachwissenschaft = Linguistik beschreibt Strukturen der Sprache(n) auf den Ebenen des Lautsystems des Aufbaus von Wörtern der Kombination von Wörtern zu Phrasen und Äußerungen der Bedeutung dieser Äußerungen, insbesondere im (außersprachlichen) Kontext ( Pragmatik) erklärt das Funktionieren dieser Strukturen als Kommunikationsmittel Schütze: Einführung in die Computerlinguistik 32 / 75

113 Sprachwissenschaft = Linguistik beschreibt Strukturen der Sprache(n) auf den Ebenen des Lautsystems des Aufbaus von Wörtern der Kombination von Wörtern zu Phrasen und Äußerungen der Bedeutung dieser Äußerungen, insbesondere im (außersprachlichen) Kontext ( Pragmatik) erklärt das Funktionieren dieser Strukturen als Kommunikationsmittel zunächst einzelsprachlich, aber durch Vergleich und Generalisierungen auch sprachübergreifend (universell) Schütze: Einführung in die Computerlinguistik 32 / 75

114 Sprachliche Einheiten Einheit Laut Silbe Wort Phrase Satz, Äußerung Discourse Teildisziplin Phonetik, Phonologie Phonetik, Phonologie Morphologie Syntax Syntax, Semantik Pragmatik Schütze: Einführung in die Computerlinguistik 33 / 75

115 Verstehen von Sprache (gesprochen) Schütze: Einführung in die Computerlinguistik 34 / 75

116 Erzeugen von Sprache (gesprochen) Schütze: Einführung in die Computerlinguistik 35 / 75

117 Teilgebiete der Linguistik Schütze: Einführung in die Computerlinguistik 36 / 75

118 Teilgebiete der Linguistik Phonetik und Phonologie Schütze: Einführung in die Computerlinguistik 36 / 75

119 Teilgebiete der Linguistik Phonetik und Phonologie Morphologie Schütze: Einführung in die Computerlinguistik 36 / 75

120 Teilgebiete der Linguistik Phonetik und Phonologie Morphologie Syntax Schütze: Einführung in die Computerlinguistik 36 / 75

121 Teilgebiete der Linguistik Phonetik und Phonologie Morphologie Syntax Semantik Schütze: Einführung in die Computerlinguistik 36 / 75

122 Teilgebiete der Linguistik Phonetik und Phonologie Morphologie Syntax Semantik Pragmatik Schütze: Einführung in die Computerlinguistik 36 / 75

123 Teilgebiete der Linguistik Phonetik und Phonologie Morphologie Syntax Semantik Pragmatik Schütze: Einführung in die Computerlinguistik 36 / 75

124 Teilgebiete der Linguistik Phonetik und Phonologie Morphologie Syntax Semantik Pragmatik Jedes dieser Teilgebiete hat auch eine Entsprechung in der Computerlinguistik. Schütze: Einführung in die Computerlinguistik 36 / 75

125 Phonetik und Phonologie Schütze: Einführung in die Computerlinguistik 37 / 75

126 Phonetik und Phonologie artikulatorische Merkmale Schütze: Einführung in die Computerlinguistik 37 / 75

127 Phonetik und Phonologie artikulatorische Merkmale Lautstruktur natürlicher Sprachen Schütze: Einführung in die Computerlinguistik 37 / 75

128 Phonetik und Phonologie artikulatorische Merkmale Lautstruktur natürlicher Sprachen Spracherkennung: Erkennung und Produktion gesprochener Sprache Schütze: Einführung in die Computerlinguistik 37 / 75

129 Phonetik und Phonologie artikulatorische Merkmale Lautstruktur natürlicher Sprachen Spracherkennung: Erkennung und Produktion gesprochener Sprache modellieren, welche Segmente ein Wort enthält und wie sich deren Struktur auf die Aussprache auswirkt Schütze: Einführung in die Computerlinguistik 37 / 75

130 Phonetik und Phonologie artikulatorische Merkmale Lautstruktur natürlicher Sprachen Spracherkennung: Erkennung und Produktion gesprochener Sprache modellieren, welche Segmente ein Wort enthält und wie sich deren Struktur auf die Aussprache auswirkt z.b. wenn ein im Prinzip stimmhafter Konsonant am Wortende stimmlos wird ( Auslautverhärtung ): Schütze: Einführung in die Computerlinguistik 37 / 75

131 Phonetik und Phonologie artikulatorische Merkmale Lautstruktur natürlicher Sprachen Spracherkennung: Erkennung und Produktion gesprochener Sprache modellieren, welche Segmente ein Wort enthält und wie sich deren Struktur auf die Aussprache auswirkt z.b. wenn ein im Prinzip stimmhafter Konsonant am Wortende stimmlos wird ( Auslautverhärtung ): (3) Dieb /Di:p/ vs. Diebe /Di:be/ Schütze: Einführung in die Computerlinguistik 37 / 75

132 Morphologie Schütze: Einführung in die Computerlinguistik 38 / 75

133 Morphologie Bildung und Struktur von Wörtern Schütze: Einführung in die Computerlinguistik 38 / 75

134 Morphologie Bildung und Struktur von Wörtern Was ist die lexikalische Wurzel einzelner Wörter? Schütze: Einführung in die Computerlinguistik 38 / 75

135 Morphologie Bildung und Struktur von Wörtern Was ist die lexikalische Wurzel einzelner Wörter? Welche Prozesse sind verantwortlich für unterschiedliche Erscheinungsformen an der Oberfläche? Schütze: Einführung in die Computerlinguistik 38 / 75

136 Morphologie Bildung und Struktur von Wörtern Was ist die lexikalische Wurzel einzelner Wörter? Welche Prozesse sind verantwortlich für unterschiedliche Erscheinungsformen an der Oberfläche? Veränderung der Verwendung und Bedeutung des Wortes durch Oberflächenmodifikationen Schütze: Einführung in die Computerlinguistik 38 / 75

137 Morphologie Bildung und Struktur von Wörtern Was ist die lexikalische Wurzel einzelner Wörter? Welche Prozesse sind verantwortlich für unterschiedliche Erscheinungsformen an der Oberfläche? Veränderung der Verwendung und Bedeutung des Wortes durch Oberflächenmodifikationen z.b. Suffix -e als Pluralmarkierung: Schütze: Einführung in die Computerlinguistik 38 / 75

138 Morphologie Bildung und Struktur von Wörtern Was ist die lexikalische Wurzel einzelner Wörter? Welche Prozesse sind verantwortlich für unterschiedliche Erscheinungsformen an der Oberfläche? Veränderung der Verwendung und Bedeutung des Wortes durch Oberflächenmodifikationen z.b. Suffix -e als Pluralmarkierung: (4) Dieb-e Dieb-pl Mehr als ein Dieb Schütze: Einführung in die Computerlinguistik 38 / 75

139 Syntax Schütze: Einführung in die Computerlinguistik 39 / 75

140 Syntax Strukturbildung von Sätzen Schütze: Einführung in die Computerlinguistik 39 / 75

141 Syntax Strukturbildung von Sätzen traditionell am stärksten vertretene Teildisziplin der Computerlinguistik Schütze: Einführung in die Computerlinguistik 39 / 75

142 Syntax Strukturbildung von Sätzen traditionell am stärksten vertretene Teildisziplin der Computerlinguistik Erkennung von Grammatikalität und darauf folgende Bedeutungserschließung Schütze: Einführung in die Computerlinguistik 39 / 75

143 Syntax Strukturbildung von Sätzen traditionell am stärksten vertretene Teildisziplin der Computerlinguistik Erkennung von Grammatikalität und darauf folgende Bedeutungserschließung z.b. (5) Der gewitzte Dieb stahl das Geld. Schütze: Einführung in die Computerlinguistik 39 / 75

144 Syntax Strukturbildung von Sätzen traditionell am stärksten vertretene Teildisziplin der Computerlinguistik Erkennung von Grammatikalität und darauf folgende Bedeutungserschließung z.b. (5) Der gewitzte Dieb stahl das Geld. vs. Schütze: Einführung in die Computerlinguistik 39 / 75

145 Syntax Strukturbildung von Sätzen traditionell am stärksten vertretene Teildisziplin der Computerlinguistik Erkennung von Grammatikalität und darauf folgende Bedeutungserschließung z.b. (5) Der gewitzte Dieb stahl das Geld. vs. *Der Dieb gewitzte stahl das Geld. Schütze: Einführung in die Computerlinguistik 39 / 75

146 Semantik Schütze: Einführung in die Computerlinguistik 40 / 75

147 Semantik Bedeutung sprachlicher Einheiten (Wort, Satz etc.) Schütze: Einführung in die Computerlinguistik 40 / 75

148 Semantik Bedeutung sprachlicher Einheiten (Wort, Satz etc.) z.b. (6) Die Polizei beschlagnahmte das Diebesgut. Schütze: Einführung in die Computerlinguistik 40 / 75

149 Semantik Bedeutung sprachlicher Einheiten (Wort, Satz etc.) z.b. (6) Die Polizei beschlagnahmte das Diebesgut. vs. Schütze: Einführung in die Computerlinguistik 40 / 75

150 Semantik Bedeutung sprachlicher Einheiten (Wort, Satz etc.) z.b. (6) Die Polizei beschlagnahmte das Diebesgut. vs. Das Diebesgut beschlagnahmte die Polizei. Schütze: Einführung in die Computerlinguistik 40 / 75

151 Semantik Bedeutung sprachlicher Einheiten (Wort, Satz etc.) z.b. (6) Die Polizei beschlagnahmte das Diebesgut. vs. Das Diebesgut beschlagnahmte die Polizei. gleiche Bedeutung Schütze: Einführung in die Computerlinguistik 40 / 75

152 Pragmatik Schütze: Einführung in die Computerlinguistik 41 / 75

153 Pragmatik Zweck einer Äußerung in der Welt, z.b. Schütze: Einführung in die Computerlinguistik 41 / 75

154 Pragmatik Zweck einer Äußerung in der Welt, z.b. Wissen Sie, wie spät es ist? Schütze: Einführung in die Computerlinguistik 41 / 75

155 Pragmatik Zweck einer Äußerung in der Welt, z.b. Wissen Sie, wie spät es ist? Bestimmung des Bezugs von Wörtern: Antezedens eines Pronomens, z.b.: Schütze: Einführung in die Computerlinguistik 41 / 75

156 Pragmatik Zweck einer Äußerung in der Welt, z.b. Wissen Sie, wie spät es ist? Bestimmung des Bezugs von Wörtern: Antezedens eines Pronomens, z.b.: Die Katze schnurrt. Sie hat Hunger. Schütze: Einführung in die Computerlinguistik 41 / 75

157 Pragmatik Zweck einer Äußerung in der Welt, z.b. Wissen Sie, wie spät es ist? Bestimmung des Bezugs von Wörtern: Antezedens eines Pronomens, z.b.: Die Katze schnurrt. Sie hat Hunger. implizite Annahmen (Präsuppositionen), z.b.: Schütze: Einführung in die Computerlinguistik 41 / 75

158 Pragmatik Zweck einer Äußerung in der Welt, z.b. Wissen Sie, wie spät es ist? Bestimmung des Bezugs von Wörtern: Antezedens eines Pronomens, z.b.: Die Katze schnurrt. Sie hat Hunger. implizite Annahmen (Präsuppositionen), z.b.: Welche Drogen hat Peter genommen? Präsupponiert: Peter hat Drogen genommen. Schütze: Einführung in die Computerlinguistik 41 / 75

159 Korpuslinguistik Schütze: Einführung in die Computerlinguistik 42 / 75

160 Korpuslinguistik Methode, die auf alle Beschreibungsebenen angewandt werden kann Schütze: Einführung in die Computerlinguistik 42 / 75

161 Korpuslinguistik Methode, die auf alle Beschreibungsebenen angewandt werden kann seit Anfang 1980er Schütze: Einführung in die Computerlinguistik 42 / 75

162 Text corpus Schütze: Einführung in die Computerlinguistik 43 / 75

163 Text corpus Definition A corpus (plural corpora) or text corpus is a large and structured set of texts, nowadays usually electronically stored and processed. Schütze: Einführung in die Computerlinguistik 43 / 75

164 Text corpus Definition A corpus (plural corpora) or text corpus is a large and structured set of texts, nowadays usually electronically stored and processed. Schütze: Einführung in die Computerlinguistik 43 / 75

165 Text corpus Definition A corpus (plural corpora) or text corpus is a large and structured set of texts, nowadays usually electronically stored and processed. Corpora are used to do statistical analysis and hypothesis testing, checking occurrences or validating linguistic rules within a specific language territory. Schütze: Einführung in die Computerlinguistik 43 / 75

166 Text corpus Definition A corpus (plural corpora) or text corpus is a large and structured set of texts, nowadays usually electronically stored and processed. Corpora are used to do statistical analysis and hypothesis testing, checking occurrences or validating linguistic rules within a specific language territory. A corpus may contain texts in a single language (monolingual corpus) or text data in multiple languages (multilingual corpus). Schütze: Einführung in die Computerlinguistik 43 / 75

167 Text corpus Definition A corpus (plural corpora) or text corpus is a large and structured set of texts, nowadays usually electronically stored and processed. Corpora are used to do statistical analysis and hypothesis testing, checking occurrences or validating linguistic rules within a specific language territory. A corpus may contain texts in a single language (monolingual corpus) or text data in multiple languages (multilingual corpus). (from Wikipedia) Schütze: Einführung in die Computerlinguistik 43 / 75

168 Verwendung von Korpora Schütze: Einführung in die Computerlinguistik 44 / 75

169 Verwendung von Korpora Erkennung gesprochener Sprache Schütze: Einführung in die Computerlinguistik 44 / 75

170 Verwendung von Korpora Erkennung gesprochener Sprache Wortartendisambiguierung (Tagging) Schütze: Einführung in die Computerlinguistik 44 / 75

171 Verwendung von Korpora Erkennung gesprochener Sprache Wortartendisambiguierung (Tagging) syntaktische Analyse (Parsing) Schütze: Einführung in die Computerlinguistik 44 / 75

172 Verwendung von Korpora Erkennung gesprochener Sprache Wortartendisambiguierung (Tagging) syntaktische Analyse (Parsing) semantische Lesartendisambiguierung (z.b. Bank 1 vs. Bank 2) Schütze: Einführung in die Computerlinguistik 44 / 75

173 Verwendung von Korpora Erkennung gesprochener Sprache Wortartendisambiguierung (Tagging) syntaktische Analyse (Parsing) semantische Lesartendisambiguierung (z.b. Bank 1 vs. Bank 2) maschinelle Übersetzung Schütze: Einführung in die Computerlinguistik 44 / 75

174 Slido Schütze: Einführung in die Computerlinguistik 45 / 75

175 Outline 1 Was ist Computerlinguistik? 2 Organisation 3 Linguistik 4 CL-Methoden 5 Sprachtechnologie 6 Allgemeines Schütze: Einführung in die Computerlinguistik 46 / 75

176 Für jede Sprachliche Beschreibungsebene gibt es passende Computerlinguistische Methoden Schütze: Einführung in die Computerlinguistik 47 / 75

177 Für jede Sprachliche Beschreibungsebene gibt es passende Computerlinguistische Methoden Phonetik - Signalverarbeitung (Spracherkennung - Sprachsynthese) Schütze: Einführung in die Computerlinguistik 47 / 75

178 Für jede Sprachliche Beschreibungsebene gibt es passende Computerlinguistische Methoden Phonetik - Signalverarbeitung (Spracherkennung - Sprachsynthese) Morphologie - Wortzerlegung, Wortartenbestimmung Schütze: Einführung in die Computerlinguistik 47 / 75

179 Für jede Sprachliche Beschreibungsebene gibt es passende Computerlinguistische Methoden Phonetik - Signalverarbeitung (Spracherkennung - Sprachsynthese) Morphologie - Wortzerlegung, Wortartenbestimmung Syntax - computerlesbare Grammatiken, automatische Syntaktische Analyse Schütze: Einführung in die Computerlinguistik 47 / 75

180 Für jede Sprachliche Beschreibungsebene gibt es passende Computerlinguistische Methoden Phonetik - Signalverarbeitung (Spracherkennung - Sprachsynthese) Morphologie - Wortzerlegung, Wortartenbestimmung Syntax - computerlesbare Grammatiken, automatische Syntaktische Analyse Semantik - Wissensdatenbanken, automatische semantische Analyse Schütze: Einführung in die Computerlinguistik 47 / 75

181 Für jede Sprachliche Beschreibungsebene gibt es passende Computerlinguistische Methoden Phonetik - Signalverarbeitung (Spracherkennung - Sprachsynthese) Morphologie - Wortzerlegung, Wortartenbestimmung Syntax - computerlesbare Grammatiken, automatische Syntaktische Analyse Semantik - Wissensdatenbanken, automatische semantische Analyse Pragmatik - Koreferenzresolution, Kontextmodellierung (Dialogsysteme, Sprachliche Schnittstellen z.b. in der Robotik) Schütze: Einführung in die Computerlinguistik 47 / 75

182 Computerlinguistische Methoden zu den Beschreibungsebenen Schütze: Einführung in die Computerlinguistik 48 / 75

183 Computerlinguistische Methoden zu den Beschreibungsebenen Wortzerlegung - Endliche Automaten Schütze: Einführung in die Computerlinguistik 48 / 75

184 Computerlinguistische Methoden zu den Beschreibungsebenen Wortzerlegung - Endliche Automaten Wortartenbestimmung - HMMs Schütze: Einführung in die Computerlinguistik 48 / 75

185 Computerlinguistische Methoden zu den Beschreibungsebenen Wortzerlegung - Endliche Automaten Wortartenbestimmung - HMMs computerlesbare Grammatiken - CFGs Schütze: Einführung in die Computerlinguistik 48 / 75

186 Computerlinguistische Methoden zu den Beschreibungsebenen Wortzerlegung - Endliche Automaten Wortartenbestimmung - HMMs computerlesbare Grammatiken - CFGs automatische Syntaktische Analyse - Parsing Schütze: Einführung in die Computerlinguistik 48 / 75

187 Mehr Terminologie Verarbeitung Modalität Mensch Maschine Produktion Lautsprache Sprechen Synthese Schriftsprache Schreiben Generierung Rezeption Lautsprache Hören Erkennung Schiftsprache Lesen Analyse Schütze: Einführung in die Computerlinguistik 49 / 75

188 Outline 1 Was ist Computerlinguistik? 2 Organisation 3 Linguistik 4 CL-Methoden 5 Sprachtechnologie 6 Allgemeines Schütze: Einführung in die Computerlinguistik 50 / 75

189 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Schütze: Einführung in die Computerlinguistik 51 / 75

190 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Spracherkennung (Diktiersysteme, Transkription z.b. Untertitel) Schütze: Einführung in die Computerlinguistik 51 / 75

191 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Spracherkennung (Diktiersysteme, Transkription z.b. Untertitel) Sprachsynthese Schütze: Einführung in die Computerlinguistik 51 / 75

192 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Spracherkennung (Diktiersysteme, Transkription z.b. Untertitel) Sprachsynthese Rechtschreibkorrektur Schütze: Einführung in die Computerlinguistik 51 / 75

193 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Spracherkennung (Diktiersysteme, Transkription z.b. Untertitel) Sprachsynthese Rechtschreibkorrektur Maschinelle Übersetzung DeepL: Google translate: Schütze: Einführung in die Computerlinguistik 51 / 75

194 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Spracherkennung (Diktiersysteme, Transkription z.b. Untertitel) Sprachsynthese Rechtschreibkorrektur Maschinelle Übersetzung DeepL: Google translate: Automatische Zusammenfassung (Summarisation) Schütze: Einführung in die Computerlinguistik 51 / 75

195 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Spracherkennung (Diktiersysteme, Transkription z.b. Untertitel) Sprachsynthese Rechtschreibkorrektur Maschinelle Übersetzung DeepL: Google translate: Automatische Zusammenfassung (Summarisation) Suchmaschinen / Information Retrieval Schütze: Einführung in die Computerlinguistik 51 / 75

196 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Schütze: Einführung in die Computerlinguistik 52 / 75

197 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Dokumentklassifikation Schütze: Einführung in die Computerlinguistik 52 / 75

198 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Dokumentklassifikation Strukturierte Gliederung von Information / Relations-Extraktion Schütze: Einführung in die Computerlinguistik 52 / 75

199 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Dokumentklassifikation Strukturierte Gliederung von Information / Relations-Extraktion Frage-Beantwortung (Question Answering) Start-System (MIT): Schütze: Einführung in die Computerlinguistik 52 / 75

200 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Dokumentklassifikation Strukturierte Gliederung von Information / Relations-Extraktion Frage-Beantwortung (Question Answering) Start-System (MIT): Sentiment-Analyse Bsp.: Ist dies eine gute oder eine schlechte Bewertung? Der Film hat mich ja nicht so richtig begeistert, auch wenn manche behaupten, er wäre ganz toll. Schütze: Einführung in die Computerlinguistik 52 / 75

201 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Dokumentklassifikation Strukturierte Gliederung von Information / Relations-Extraktion Frage-Beantwortung (Question Answering) Start-System (MIT): Sentiment-Analyse Bsp.: Ist dies eine gute oder eine schlechte Bewertung? Der Film hat mich ja nicht so richtig begeistert, auch wenn manche behaupten, er wäre ganz toll. Dialogsysteme Schütze: Einführung in die Computerlinguistik 52 / 75

202 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Dokumentklassifikation Strukturierte Gliederung von Information / Relations-Extraktion Frage-Beantwortung (Question Answering) Start-System (MIT): Sentiment-Analyse Bsp.: Ist dies eine gute oder eine schlechte Bewertung? Der Film hat mich ja nicht so richtig begeistert, auch wenn manche behaupten, er wäre ganz toll. Dialogsysteme Telefonie-Systeme: Telefonbanking, Fahrplanauskunft Schütze: Einführung in die Computerlinguistik 52 / 75

203 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Dokumentklassifikation Strukturierte Gliederung von Information / Relations-Extraktion Frage-Beantwortung (Question Answering) Start-System (MIT): Sentiment-Analyse Bsp.: Ist dies eine gute oder eine schlechte Bewertung? Der Film hat mich ja nicht so richtig begeistert, auch wenn manche behaupten, er wäre ganz toll. Dialogsysteme Telefonie-Systeme: Telefonbanking, Fahrplanauskunft Gerätebedienung Schütze: Einführung in die Computerlinguistik 52 / 75

204 Anwendungen kombinieren oft viele verschiedene Methoden, um eine bestimmte Aufgabe zu lösen Dokumentklassifikation Strukturierte Gliederung von Information / Relations-Extraktion Frage-Beantwortung (Question Answering) Start-System (MIT): Sentiment-Analyse Bsp.: Ist dies eine gute oder eine schlechte Bewertung? Der Film hat mich ja nicht so richtig begeistert, auch wenn manche behaupten, er wäre ganz toll. Dialogsysteme Telefonie-Systeme: Telefonbanking, Fahrplanauskunft Gerätebedienung Interaktion mit virtuellen Agenten und Robotern Schütze: Einführung in die Computerlinguistik 52 / 75

205 Anwendungen kombinieren oft viele verschiedene Methoden, um eine Bestimmte Aufgabe zu lösen Schütze: Einführung in die Computerlinguistik 53 / 75

206 Geschichte der Methoden der Maschinellen Übersetzung (Machine Translation, MT) Schütze: Einführung in die Computerlinguistik 54 / 75

207 Geschichte der Methoden der Maschinellen Übersetzung (Machine Translation, MT) Wörter nachschlagen, aneinanderreihen Schütze: Einführung in die Computerlinguistik 54 / 75

208 Geschichte der Methoden der Maschinellen Übersetzung (Machine Translation, MT) Wörter nachschlagen, aneinanderreihen Morphologische Anpassungen Schütze: Einführung in die Computerlinguistik 54 / 75

209 Geschichte der Methoden der Maschinellen Übersetzung (Machine Translation, MT) Wörter nachschlagen, aneinanderreihen Morphologische Anpassungen Syntaktische Umstellungsregeln Schütze: Einführung in die Computerlinguistik 54 / 75

210 Geschichte der Methoden der Maschinellen Übersetzung (Machine Translation, MT) Wörter nachschlagen, aneinanderreihen Morphologische Anpassungen Syntaktische Umstellungsregeln Volle syntaktische Analyse ( parsing ) Transfer Schütze: Einführung in die Computerlinguistik 54 / 75

211 Geschichte der Methoden der Maschinellen Übersetzung (Machine Translation, MT) Wörter nachschlagen, aneinanderreihen Morphologische Anpassungen Syntaktische Umstellungsregeln Volle syntaktische Analyse ( parsing ) Transfer Semantische Analyse (Disambiguierung) Interlingua Schütze: Einführung in die Computerlinguistik 54 / 75

212 Geschichte der Methoden der Maschinellen Übersetzung (Machine Translation, MT) Wörter nachschlagen, aneinanderreihen Morphologische Anpassungen Syntaktische Umstellungsregeln Volle syntaktische Analyse ( parsing ) Transfer Semantische Analyse (Disambiguierung) Interlingua Unterstützung durch Welt-Wissen Schütze: Einführung in die Computerlinguistik 54 / 75

213 Geschichte der Methoden der Maschinellen Übersetzung (Machine Translation, MT) Wörter nachschlagen, aneinanderreihen Morphologische Anpassungen Syntaktische Umstellungsregeln Volle syntaktische Analyse ( parsing ) Transfer Semantische Analyse (Disambiguierung) Interlingua Unterstützung durch Welt-Wissen Übersetzen mit Statistik/Wahrscheinlichkeiten Schütze: Einführung in die Computerlinguistik 54 / 75

214 MT Transfer Transfer: Direkte Übersetzung von sprachlichen Elementen, ohne Bedeutungsambiguitäten notwendigerweise aufzulösen. Schütze: Einführung in die Computerlinguistik 55 / 75

215 MT Syntaktischer Transfer Schütze: Einführung in die Computerlinguistik 56 / 75

216 MT Interlingua Interlingua: Sprachunabhängige Repräsentation von Bedeutung, in die Sprache überführt werden kann und umgekehrt. Schütze: Einführung in die Computerlinguistik 57 / 75

217 MT Interlingua (Beispiel) Schütze: Einführung in die Computerlinguistik 58 / 75

218 Outline 1 Was ist Computerlinguistik? 2 Organisation 3 Linguistik 4 CL-Methoden 5 Sprachtechnologie 6 Allgemeines Schütze: Einführung in die Computerlinguistik 59 / 75

219 Kleine Geschichte der Computerlinguistik (1) Schütze: Einführung in die Computerlinguistik 60 / 75

220 Kleine Geschichte der Computerlinguistik (1) frühe Entwicklung der Computertechnologie (1930er-, 40er-Jahre): numerische Problemstellungen ( Berechnungen, z.b. ballistische Kurven), auch symbolische Verarbeitungsaufgaben (Dechiffrierung verschlüsselter Nachrichtentexte maschinelle Übersetzung (MÜ) als Spezialfall einer Dekodierungsaufgabe) Schütze: Einführung in die Computerlinguistik 60 / 75

221 Kleine Geschichte der Computerlinguistik (1) frühe Entwicklung der Computertechnologie (1930er-, 40er-Jahre): numerische Problemstellungen ( Berechnungen, z.b. ballistische Kurven), auch symbolische Verarbeitungsaufgaben (Dechiffrierung verschlüsselter Nachrichtentexte maschinelle Übersetzung (MÜ) als Spezialfall einer Dekodierungsaufgabe) frühe Ansätze der MÜ haben gemeinsame Wurzel: stochastische Informationstheorie (Betrachtung des fremdsprachlichen Textes als Ergebnis der Übertragung einer Nachricht über gestörten Kanal Aufgabe: Rekonstruktion des ursprünglichen Nachrichtentextes) Schütze: Einführung in die Computerlinguistik 60 / 75

222 Kleine Geschichte der Computerlinguistik (1) frühe Entwicklung der Computertechnologie (1930er-, 40er-Jahre): numerische Problemstellungen ( Berechnungen, z.b. ballistische Kurven), auch symbolische Verarbeitungsaufgaben (Dechiffrierung verschlüsselter Nachrichtentexte maschinelle Übersetzung (MÜ) als Spezialfall einer Dekodierungsaufgabe) frühe Ansätze der MÜ haben gemeinsame Wurzel: stochastische Informationstheorie (Betrachtung des fremdsprachlichen Textes als Ergebnis der Übertragung einer Nachricht über gestörten Kanal Aufgabe: Rekonstruktion des ursprünglichen Nachrichtentextes) Statistische Verfahren wurden dann für Jahrzehnte aufgegeben. Schütze: Einführung in die Computerlinguistik 60 / 75

223 Kleine Geschichte der Computerlinguistik (2) Schütze: Einführung in die Computerlinguistik 61 / 75

224 Kleine Geschichte der Computerlinguistik (2) Abkehr von statistischen Verfahren weil Schütze: Einführung in die Computerlinguistik 61 / 75

225 Kleine Geschichte der Computerlinguistik (2) Abkehr von statistischen Verfahren weil Chomsky die Unzulänglichkeit der statistischen Verfahren der 50er und 60er für Sprachmodellierung nachweist. Schütze: Einführung in die Computerlinguistik 61 / 75

226 Kleine Geschichte der Computerlinguistik (2) Abkehr von statistischen Verfahren weil Chomsky die Unzulänglichkeit der statistischen Verfahren der 50er und 60er für Sprachmodellierung nachweist. die Leistungsfähigkeit der damaligen Hardware nicht ausreichte (Beschränkungen bevorzugen symbolische Ansätze) Schütze: Einführung in die Computerlinguistik 61 / 75

227 Kleine Geschichte der Computerlinguistik (2) Abkehr von statistischen Verfahren weil Chomsky die Unzulänglichkeit der statistischen Verfahren der 50er und 60er für Sprachmodellierung nachweist. die Leistungsfähigkeit der damaligen Hardware nicht ausreichte (Beschränkungen bevorzugen symbolische Ansätze) nicht genügend digitalisierte mehrsprachige Textdaten zur Verfügung standen Schütze: Einführung in die Computerlinguistik 61 / 75

228 Herausforderungen der Computerlinguistik: Variabilität und Ambiguität (Mehrdeutigkeit) Schwierigkeiten für Sprachverarbeitungsysteme: Schütze: Einführung in die Computerlinguistik 62 / 75

229 Herausforderungen der Computerlinguistik: Variabilität und Ambiguität (Mehrdeutigkeit) Schwierigkeiten für Sprachverarbeitungsysteme: Variabilität: Die selbe Bedeutung kann durch viele sprachliche Formen ausgedrückt werden. Schütze: Einführung in die Computerlinguistik 62 / 75

230 Herausforderungen der Computerlinguistik: Variabilität und Ambiguität (Mehrdeutigkeit) Schwierigkeiten für Sprachverarbeitungsysteme: Variabilität: Die selbe Bedeutung kann durch viele sprachliche Formen ausgedrückt werden. Ambiguität: Dieselbe sprachliche Form kann verschiedene Informationen ausdrücken (erst duch den Kontext kann erschlossen werden, was gemeint ist). Schütze: Einführung in die Computerlinguistik 62 / 75

231 Typen von Ambiguität Schütze: Einführung in die Computerlinguistik 63 / 75

232 Typen von Ambiguität Phonetische Ambigität (Homophone): Miene - Mine, Meer - mehr, viel - fiel Unterschiedliche Wörter haben dieselbe lautliche Form. Schütze: Einführung in die Computerlinguistik 63 / 75

233 Typen von Ambiguität Phonetische Ambigität (Homophone): Miene - Mine, Meer - mehr, viel - fiel Unterschiedliche Wörter haben dieselbe lautliche Form. Orthographische Ambiguität (Homographen): übersetzen - über-setzen, umfahren - um-fahren Unterschiedliche Wörter werden gleich geschrieben. Schütze: Einführung in die Computerlinguistik 63 / 75

234 Typen von Ambiguität Phonetische Ambigität (Homophone): Miene - Mine, Meer - mehr, viel - fiel Unterschiedliche Wörter haben dieselbe lautliche Form. Orthographische Ambiguität (Homographen): übersetzen - über-setzen, umfahren - um-fahren Unterschiedliche Wörter werden gleich geschrieben. Lexikalische Ambiguität (Homonyme): Maria geht zum Ball. Ein Wort hat mehrere verschiedene Bedeutungen. Schütze: Einführung in die Computerlinguistik 63 / 75

235 Typen von Ambiguität Phonetische Ambigität (Homophone): Miene - Mine, Meer - mehr, viel - fiel Unterschiedliche Wörter haben dieselbe lautliche Form. Orthographische Ambiguität (Homographen): übersetzen - über-setzen, umfahren - um-fahren Unterschiedliche Wörter werden gleich geschrieben. Lexikalische Ambiguität (Homonyme): Maria geht zum Ball. Ein Wort hat mehrere verschiedene Bedeutungen. Morphologische Ambiguität: Staub-ecken - Stau-becken Eine Wortform kann auf unterschiedliche Arten analysiert werden. Schütze: Einführung in die Computerlinguistik 63 / 75

236 Typen von Ambiguität Schütze: Einführung in die Computerlinguistik 64 / 75

237 Typen von Ambiguität Strukturelle/syntaktische Ambiguität: Schütze: Einführung in die Computerlinguistik 64 / 75

238 Typen von Ambiguität Strukturelle/syntaktische Ambiguität: 1 Visiting relatives can be boring. Schütze: Einführung in die Computerlinguistik 64 / 75

239 Typen von Ambiguität Strukturelle/syntaktische Ambiguität: 1 Visiting relatives can be boring. 2 Peter fuhr seinen Freund sturzbetrunken nach Hause. Schütze: Einführung in die Computerlinguistik 64 / 75

240 Typen von Ambiguität Strukturelle/syntaktische Ambiguität: 1 Visiting relatives can be boring. 2 Peter fuhr seinen Freund sturzbetrunken nach Hause. 3 Ich traf den Sohn des Nachbarn mit dem Gewehr. Die Grammatikregeln lassen verschiedene Analysen zur Kombination der Satzelemente zu. Schütze: Einführung in die Computerlinguistik 64 / 75

241 Typen von Ambiguität Strukturelle/syntaktische Ambiguität: 1 Visiting relatives can be boring. 2 Peter fuhr seinen Freund sturzbetrunken nach Hause. 3 Ich traf den Sohn des Nachbarn mit dem Gewehr. Die Grammatikregeln lassen verschiedene Analysen zur Kombination der Satzelemente zu. Kompositionell-semantische Ambiguität bzw. Skopusambiguität: Schütze: Einführung in die Computerlinguistik 64 / 75

242 Typen von Ambiguität Strukturelle/syntaktische Ambiguität: 1 Visiting relatives can be boring. 2 Peter fuhr seinen Freund sturzbetrunken nach Hause. 3 Ich traf den Sohn des Nachbarn mit dem Gewehr. Die Grammatikregeln lassen verschiedene Analysen zur Kombination der Satzelemente zu. Kompositionell-semantische Ambiguität bzw. Skopusambiguität: 1 Die zwei Mitarbeiter müssen vier Sprachen beherrschen. Schütze: Einführung in die Computerlinguistik 64 / 75

243 Typen von Ambiguität Strukturelle/syntaktische Ambiguität: 1 Visiting relatives can be boring. 2 Peter fuhr seinen Freund sturzbetrunken nach Hause. 3 Ich traf den Sohn des Nachbarn mit dem Gewehr. Die Grammatikregeln lassen verschiedene Analysen zur Kombination der Satzelemente zu. Kompositionell-semantische Ambiguität bzw. Skopusambiguität: 1 Die zwei Mitarbeiter müssen vier Sprachen beherrschen. 2 Some student likes every course. Schütze: Einführung in die Computerlinguistik 64 / 75

244 Typen von Ambiguität Strukturelle/syntaktische Ambiguität: 1 Visiting relatives can be boring. 2 Peter fuhr seinen Freund sturzbetrunken nach Hause. 3 Ich traf den Sohn des Nachbarn mit dem Gewehr. Die Grammatikregeln lassen verschiedene Analysen zur Kombination der Satzelemente zu. Kompositionell-semantische Ambiguität bzw. Skopusambiguität: 1 Die zwei Mitarbeiter müssen vier Sprachen beherrschen. 2 Some student likes every course. 3 Alle Politiker sind nicht korrupt. Quantifikatoren (alle, jeder, zwei) und Negationen können sich auf verschieden große Satzteile beziehen. Schütze: Einführung in die Computerlinguistik 64 / 75

245 Typen von Ambiguität Schütze: Einführung in die Computerlinguistik 65 / 75

246 Typen von Ambiguität Pragmatische Ambiguität: Schütze: Einführung in die Computerlinguistik 65 / 75

247 Typen von Ambiguität Pragmatische Ambiguität: 1 Könnten Sie die Aufgabe lösen? Schütze: Einführung in die Computerlinguistik 65 / 75

248 Typen von Ambiguität Pragmatische Ambiguität: 1 Könnten Sie die Aufgabe lösen? 2 Haben Sie eine Uhr? Der Bezug einer Aussage zum außerlinguistischen Kontext kann auf mehrere Arten hergestellt werden. Schütze: Einführung in die Computerlinguistik 65 / 75

249 Wie mit Ambiguität umgehen? Schütze: Einführung in die Computerlinguistik 66 / 75

250 Wie mit Ambiguität umgehen? Alle Lesarten berechnen / aufzählen. Ist in der Regel nicht praktikabel, manchmal aber von theoretischem Interesse. Schütze: Einführung in die Computerlinguistik 66 / 75

251 Wie mit Ambiguität umgehen? Alle Lesarten berechnen / aufzählen. Ist in der Regel nicht praktikabel, manchmal aber von theoretischem Interesse. Unterspezifizierte Repräsentation verwenden, die alle möglichen Lesarten in einer kompakten Darstellung zusammenfasst. Schütze: Einführung in die Computerlinguistik 66 / 75

252 Wie mit Ambiguität umgehen? Alle Lesarten berechnen / aufzählen. Ist in der Regel nicht praktikabel, manchmal aber von theoretischem Interesse. Unterspezifizierte Repräsentation verwenden, die alle möglichen Lesarten in einer kompakten Darstellung zusammenfasst. Nur die aufgrund des Kontextes präferierte(n) Lesarten berechnen / aufzählen. Erfordert ein geeignetes gewichtetes / probabilistisches Modell, oder zusätzliche Information (Weltwissen). Schütze: Einführung in die Computerlinguistik 66 / 75

253 Wie mit Ambiguität umgehen? Alle Lesarten berechnen / aufzählen. Ist in der Regel nicht praktikabel, manchmal aber von theoretischem Interesse. Unterspezifizierte Repräsentation verwenden, die alle möglichen Lesarten in einer kompakten Darstellung zusammenfasst. Nur die aufgrund des Kontextes präferierte(n) Lesarten berechnen / aufzählen. Erfordert ein geeignetes gewichtetes / probabilistisches Modell, oder zusätzliche Information (Weltwissen). Probabilistisches Modell: Statistisches Modell, das verschiedenen Möglichkeiten Wahrscheinlichkeiten zuweist. Ein System kann sich dann für die wahrscheinlichste Variante entscheiden. Die Wahrscheinlichkeiten können z.b. durch Auswertung von durch Menschen annotierte Trainingsdaten gewonnen werden. Schütze: Einführung in die Computerlinguistik 66 / 75

254 Literatur Schütze: Einführung in die Computerlinguistik 67 / 75

255 Literatur Jurafsky & Martin: Speech and Language Processing. Pearson Prentice Hall (Lehrbuchsammlung) Schütze: Einführung in die Computerlinguistik 67 / 75

256 Literatur Schütze: Einführung in die Computerlinguistik 68 / 75

257 Literatur Carstensen et al.: Computerlinguistik und Sprachtechnologie. Eine Einführung. Heidelberg 2010 (3. Auflage) (Elektronische Version: Schütze: Einführung in die Computerlinguistik 68 / 75

258 Literatur Schütze: Einführung in die Computerlinguistik 69 / 75

259 Literatur Müller: Arbeitsbuch Linguistik. Schöningh / UTB (Elektronische Version: s.o.) Schütze: Einführung in die Computerlinguistik 69 / 75

260 Literatur Schütze: Einführung in die Computerlinguistik 70 / 75

261 Literatur Fromkin, Rodman, Hyams: An Introduction to Language Schütze: Einführung in die Computerlinguistik 70 / 75

262 Literatur Schütze: Einführung in die Computerlinguistik 71 / 75

263 Literatur Bender: Linguistic Fundamentals for Natural Language Processing. Morgan & Claypool Schütze: Einführung in die Computerlinguistik 71 / 75

264 Literatur Schütze: Einführung in die Computerlinguistik 72 / 75

265 Literatur Manning, Raghavan, Schütze: Foundations of Introduction to Information Retrieval. Cambridge University Press Schütze: Einführung in die Computerlinguistik 72 / 75

266 Literatur Schütze: Einführung in die Computerlinguistik 73 / 75

267 Literatur Keith Brown (ed.): Encyclopedia of Language & linguistics. Elsevier (Elektronische Version: s. Homepage) Schütze: Einführung in die Computerlinguistik 73 / 75

Einführung in die Computerlinguistik Überblick

Einführung in die Computerlinguistik Überblick Einführung in die Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2015-10-12 Schütze & Zangenfeind: Überblick 1 / 19 Was

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Hinrich Schütze Center for Information and Language Processing 2018-10-15 Schütze: Einführung in die Computerlinguistik 1 / 75 Die Grundfassung dieses Foliensatzes

Mehr

Einführung in die Computerlinguistik Überblick

Einführung in die Computerlinguistik Überblick Einführung in die Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2015-10-12 1 / 19 Was ist Computerlinguistik? Definition

Mehr

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch,

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch, Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Kontakt: ivana.bt.mk@gmail.com Betreff: EICL Wiederholung Aufgabe 1 Was ist Computerlinguistik? 4 Was ist Computerlinguistik?

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Was ist Computerlinguistik? Dr. Benjamin Roth CIS LMU München Dr. Benjamin Roth (CIS LMU München) Einführung in die Computerlinguistik 1 / 69 Gliederung 1 Organisatorisches

Mehr

Einführung Computerlinguistik. Überblick

Einführung Computerlinguistik. Überblick Einführung Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-14 Schütze & Zangenfeind: Überblick 1 / 30 Take-away Schütze

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Was ist Computerlinguistik? Definition Anwendungen Fragestellung

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Einführung Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2018 1 / 14 Anwendungen der Computerlinguistik Carstensen et al. (2010); Jurafsky and Martin

Mehr

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....

Mehr

Inhaltsverzeichnis. Bibliografische Informationen digitalisiert durch

Inhaltsverzeichnis. Bibliografische Informationen  digitalisiert durch Inhaltsverzeichnis 1 Computerlinguistik - Was ist das? 1 1.1 Aspekte der Computerlinguistik 1 1.1.1 Computer linguistik: Die Wissenschaft 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen 3 1.1.3

Mehr

Computerlinguistik und Sprachtechnologie

Computerlinguistik und Sprachtechnologie Computerlinguistik und Sprachtechnologie Eine Einführung 2., überarbeitete und erweiterte Auflage Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde

Mehr

Computerlinguistik und Sprachtechnologie

Computerlinguistik und Sprachtechnologie Computerlinguistik und Sprachtechnologie Eine Einführung Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde und Hagen Langer Spektrum Akademischer Verlag

Mehr

! Die Idee Kombination von Informatik und einem anderen Fach

! Die Idee Kombination von Informatik und einem anderen Fach Computerlinguistik Integriertes Anwendungsfach im B.Sc.Studiengang Department Informatik / Universität Hamburg! Wie funktioniert das integrierte Anwendungsfach Computerlinguistik (organisatorisch)?! Beziehungen

Mehr

Grundlagen und Definitionen

Grundlagen und Definitionen Grundlagen und Definitionen Wissensmanagement VO 340088 Bartholomäus Wloka https://www.adaptemy.com Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache. Kann

Mehr

Linguistik mit Schwerpunkt Computerlinguistik / Sprachtechnologie

Linguistik mit Schwerpunkt Computerlinguistik / Sprachtechnologie Nebenfach/Anwendungsfach Linguistik mit Schwerpunkt Computerlinguistik / Sprachtechnologie Prof. Dr. Udo Hahn Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller-Universität

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus

Mehr

8 Fakultät für Philologie

8 Fakultät für Philologie 8 Fakultät für Philologie 8.1 Linguistik 8.1.1 Linguistik, PO 2004 Fach Linguistik (101) Abschluss 2-Fach Bachelor (81) PO-Version 2004 Folgendes ist zurzeit in HISPOS eingerichtet: Modul-Typen: o Nachgewiesene

Mehr

NLP - Analyse des Wissensrohstoffs Text

NLP - Analyse des Wissensrohstoffs Text NLP - Analyse des Wissensrohstoffs Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Organisatorisches Vorlesung Beginn: 8. April 2008 Dienstag 10.15 h - 11.45 h, in Raum 1607

Mehr

NLP - Analyse des Wissensrohstoffs Text

NLP - Analyse des Wissensrohstoffs Text NLP - Analyse des Wissensrohstoffs Text Vorlesung Beginn: 8. April 2008 Dienstag 10.15 h - 11.45 h, in Raum 1607 oder 0443 Übungen Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Beginn:

Mehr

Modulhandbuch. für das Bachelor Nebenfach Computerlinguistik gültig ab Wintersemester (Version: )

Modulhandbuch. für das Bachelor Nebenfach Computerlinguistik gültig ab Wintersemester (Version: ) Modulhandbuch für das Bachelor Nebenfach Computerlinguistik gültig ab Wintersemester 2013 (Version: 2013-06-26) 1 Modulübersicht V=Vorlesung, Ü=Übung, S=Seminar, P=Praktikum Semester Modulnr. Titel der

Mehr

Sprachtechnologien und maschinelle Übersetzung heute und morgen eine Einführung Martin Kappus (ZHAW)

Sprachtechnologien und maschinelle Übersetzung heute und morgen eine Einführung Martin Kappus (ZHAW) Martin Kappus (ZHAW) Ablauf: Warum sprechen wir heute über maschinelle Übersetzung? Geschichte und Ansätze Eingabe-/Ausgabemodi und Anwendungen 2 WARUM SPRECHEN WIR HEUTE ÜBER MASCHINELLE ÜBERSETZUNG?

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Paul Prasse Michael Großhans

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Paul Prasse Michael Großhans Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Sprachtechnologie Tobias Scheffer Paul Prasse Michael Großhans Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. 6 Leistungspunkte

Mehr

Sprachverstehen. Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller

Sprachverstehen. Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller Sprachverstehen Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller Johannes Steinmüller 1/B309 Tel.: 531 35198 stj@informatik.tu-chemnitz.de Seite zur Vorlesung: http://www.tu-chemnitz.de/informatik/ki/edu/spraver/

Mehr

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick Einführung in die Phonetik und Phonologie Allgemeiner Überblick Phonetik und Phonologie Die beiden Bezeichnungen Phonetik und Phonologie sind aus dem griechischen Wort ϕωνþ (phōnē) abgeleitet, welches

Mehr

Module-Handbuch English Linguistics

Module-Handbuch English Linguistics Module-Handbuch English Linguistics Modulkennziffer ELI-MA-01 1 Modultitel: Descriptive Linguistics Leistungspunkte* 12 Gesamt: 360 h Kontaktzeit: 60 h Selbststudium: 300 h Seminar/Übung: 25 Vorlesung:

Mehr

Vorlesung: Einführung in die Computerlinguistik. VL: Einführung in die Computerlinguistik

Vorlesung: Einführung in die Computerlinguistik. VL: Einführung in die Computerlinguistik Wintersemester 98/99 Vorlesung: Einführung in die Computerlinguistik Teil 1: Forschungsgegenstand und Nachbarwissenschaften Hans Uszkoreit Übersicht des ersten Teils Aufgaben und Einordnung des Faches

Mehr

Automatentheorie und formale Sprachen

Automatentheorie und formale Sprachen Automatentheorie und formale Sprachen Wiebke Petersen Wiebke Petersen Automatentheorie und formale Sprachen - WiSe12/13 1 Seminarplan Lektüre: Theoretische Grundlagen der Informatik, Rolf Socher, 2008

Mehr

Anlage 1: Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Computerlinguistik

Anlage 1: Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Computerlinguistik Anlage : Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Legende: PM = Pflichtmodul; WPM = Wahlpflichtmodul; WM = Wahlmodul VL = Vorlesung; PS = Proseminar; HS = Hauptseminar; Ü =

Mehr

Vertiefung der Grundlagen der Computerlinguistik

Vertiefung der Grundlagen der Computerlinguistik Vertiefung der Grundlagen der Computerlinguistik Hinrich Schütze Center for Information and Language Processing 2018-10-16 Schütze: Vertiefung der Grundlagen der Computerlinguistik 1 / 24 Gliederung 1

Mehr

Die Geschichte der Sprachverarbeitung ist eine Geschichte voller Mißverständnisse WS 2011/2012

Die Geschichte der Sprachverarbeitung ist eine Geschichte voller Mißverständnisse WS 2011/2012 Die Geschichte der Sprachverarbeitung ist eine Geschichte voller Mißverständnisse WS 2011/2012 Christian Kölbl Universität Augsburg, Lehrprofessur für Informatik 25. Oktober 2011 HAL 9000 - Zukunftsmusik

Mehr

Einführung in die maschinelle Sprachverarbeitung

Einführung in die maschinelle Sprachverarbeitung Einführung in die maschinelle Sprachverarbeitung Michaela Geierhos CIS Centrum für Informations- und Sprachverarbeitung Ludwig-Maximilians-Universität München 17. April 2007 17.04.2007 Statistische Methoden

Mehr

Was ist Statistik? Wozu dienen statistische Methoden?

Was ist Statistik? Wozu dienen statistische Methoden? 25. APRIL 2002: BLATT 1 Übersicht Was ist Statistik? Wozu dienen statistische Methoden? Was ist maschinelle Sprachverarbeitung? Welche Rolle spielen statistische Methoden in verschiedenen Teilbereichen

Mehr

Kontextfreie Grammatiken

Kontextfreie Grammatiken Kontextfreie Grammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 16. Oktober 2015 Übersicht Worum geht es in dieser Vorlesung? Übungen und Abschlussprojekt Kontextfreie Grammatiken Computerlinguistische

Mehr

Auswahlbibliographie zum Studium der anglistischen Sprachwissenschaft

Auswahlbibliographie zum Studium der anglistischen Sprachwissenschaft Helga Höhlein, Peter H. Marsden, Clausdirk Poliner Auswahlbibliographie zum Studium der anglistischen Sprachwissenschaft Mit Kommentaren Max Niemeyer Verlag Tübingen 1987 INHALT Seite Allgemeine Hilfsmittel.

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik WS 2014/15 Vera Demberg (slides based on previous courses by Manfred Pinkal) Vorläufiges Programm 28.10.14 Einführung 04.11.14 Morphologie und Automaten I 11.11.14

Mehr

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko Interdisziplinäre fachdidaktische Übung: Sprache und Modelle SS 2015: Grossmann, Jenko Einleitung Was ist ein Modell? Sprachlich orientierte Modelle Beispiele Wie entstehen Modelle? Zusammenhang Modell

Mehr

Einführung in die maschinelle Sprachverarbeitung

Einführung in die maschinelle Sprachverarbeitung Einführung in die maschinelle Sprachverarbeitung Michaela Geierhos CIS Centrum für Informations- und Sprachverarbeitung Ludwig-Maximilians-Universität München 17. April 2007 17.04.2007 Statistische Methoden

Mehr

Prüfungsangebot. Fachbereich Sprach- und Literaturwissenschaften Bachelor Linguistik/Language Sciences. Wintersemester 2016/2017

Prüfungsangebot. Fachbereich Sprach- und Literaturwissenschaften Bachelor Linguistik/Language Sciences. Wintersemester 2016/2017 Bezeichnung der sleistung Studienabschnitt: Pflichtbereich (nach ) LS1a Einführung in die Linguistik Introduction to Linguistics Dr. Christel Stolz 9 Allgemeine und Vergleichende Sprachwissenschaft General

Mehr

Prüfungsangebot. Fachbereich Sprach- und Literaturwissenschaften Bachelor Linguistik/Language Sciences. Wintersemester 2018/2019

Prüfungsangebot. Fachbereich Sprach- und Literaturwissenschaften Bachelor Linguistik/Language Sciences. Wintersemester 2018/2019 Bezeichnung der sleistung Studienabschnitt: Pflichtbereich (nach ) LS1a Einführung in die Linguistik Introduction to Linguistics of. Dr. Thomas Stolz 9 Allgemeine und Vergleichende Sprachwissenschaft General

Mehr

Terminus Sprache, Phonologie und Grammatik

Terminus Sprache, Phonologie und Grammatik Terminus Sprache, Phonologie und Grammatik Terminus Sprache Beinhaltet 4 verschiedene Bedeutungen Langage: menschliche Fähigkeit Langue: eine bestimmte Sprache, Untersuchungsgebiet der Linguistik Parole:

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Vorläufiges Programm Einführung in die Computerlinguistik WS 2009/2010 Manfred Pinkal 26.10.10 Einführung 2.11.10 Morphologie und Automaten 9.11.10 Morphologie und Automaten 16.11.10 Syntax 23.11.10 Parsing

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Tobias Scheffer, Tom Vanck, Paul Prasse

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Tobias Scheffer, Tom Vanck, Paul Prasse Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Sprachtechnologie Tobias Scheffer, Tom Vanck, Paul Prasse Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. Termin: Montags,

Mehr

NLP Eigenschaften von Text

NLP Eigenschaften von Text NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen

Mehr

Einführung in die Methoden der Künstlichen Intelligenz

Einführung in die Methoden der Künstlichen Intelligenz Einführung in die Methoden der Künstlichen Intelligenz --- Vorlesung vom 17.4.2007 --- Sommersemester 2007 Prof. Dr. Ingo J. Timm, Andreas D. Lattner Professur für Wirtschaftsinformatik und Simulation

Mehr

Computerlinguistik: Ein Überblick

Computerlinguistik: Ein Überblick 11.2.2016 Einleitung: Was ist Computerlinguistik? Was ist Computerlinguistik? Es gibt verschiedene Definitionen davon, was Computerlinguistik ist; folgende ist die für uns maßgebliche: Computerlinguistik

Mehr

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik Informationsveranstaltung Linguistische Informatik & Korpuslinguistik Prof. Dr. Stefan Evert Professur für Korpuslinguistik http://www.linguistik.uni-erlangen.de/ 2 Was ist Linguistische Informatik? Korpuslinguistik

Mehr

Vorbesprechung Mathe III

Vorbesprechung Mathe III Vorbesprechung Mathe III Dr. Vera Demberg, Prof. Dr. Enrico Lieblang (HTW) Universität des Saarlandes April 19th, 2012 Vera Demberg (UdS) Vorbesprechung Mathe III April 19th, 2012 1 / 20 Formalien Pflichtveranstaltung

Mehr

letzte Änderung. Prüfungsordnung der Universität Heidelberg für den Masterstudiengang Besonderer Teil Computerlinguistik

letzte Änderung. Prüfungsordnung der Universität Heidelberg für den Masterstudiengang Besonderer Teil Computerlinguistik 0- Prüfungsordnung der Universität Heidelberg für den Masterstudiengang Besonderer Teil vom 9. Februar 205 Alle Amts-, Status-, Funktions- und Berufsbezeichnungen, die in dieser Ordnung in männlicher Form

Mehr

Sammlung Metzler Band 307

Sammlung Metzler Band 307 Sammlung Metzler Band 307 Achim Stein Einführung in die französische Sprachwissenschaft Verlag J.B. Metzler Stuttgart. Weimar Angaben zum Autor Achim Stein, geh. 1962; Promotion 1993. Seit 1989 wissenschaftlicher

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Grundlagen Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2016 1 / 21 Diskrete Wahrscheinlichkeitsräume (1) Carstensen et al. (2010), Abschnitt

Mehr

letzte Änderung. Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Computerlinguistik

letzte Änderung. Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Computerlinguistik A 07-0- 08.0.09 0- Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Computerlinguistik vom 8. Januar 009 Geltung des Allgemeinen Teils Die Prüfungsordnung der Universität

Mehr

Studienfach Linguistische Informatik. 1 Modulbezeichnung Grundlagen der Computerlinguistik I 7,5 ECTS

Studienfach Linguistische Informatik. 1 Modulbezeichnung Grundlagen der Computerlinguistik I 7,5 ECTS 1 Modulbezeichnung Grundlagen der Computerlinguistik I 7,5 ECTS 2 Lehrveranstaltungen VL Grundlagen der Computerlinguistik 1 (2 SWS) UE Grundlagen der Computerlinguistik 1 (2 SWS) UE Arbeitstechniken der

Mehr

Anhang III: Modulhandbuch

Anhang III: Modulhandbuch Anhang III: Modulhandbuch Das Modulhandbuch wird gemäß 1 Abs. (1) der Satzung der Technischen Universität Darmstadt zur Regelung der Bekanntmachung von Satzungen der Technischen Universität Darmstadt vom

Mehr

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik Informationsveranstaltung Linguistische Informatik & Korpuslinguistik Prof. Dr. Stefan Evert Professur für Korpuslinguistik http://www.linguistik.uni-erlangen.de/ 2 Was ist Linguistische Informatik? Korpuslinguistik

Mehr

Fach: Linguistik und Phonetik 2-Fach-BA (61E38)

Fach: Linguistik und Phonetik 2-Fach-BA (61E38) Farblegende Vollständige Anerkennung des Moduls möglich Gesonderte Prüfung der Anerkennung erforderlich Anerkennung je nach absolvierter Veranstaltung Anerkennung je nach absolvierter Veranstaltung Bsp.

Mehr

Einführung in die portugiesische Sprachwissenschaft

Einführung in die portugiesische Sprachwissenschaft Annette Endruschat Jürgen Schmidt-Radefeldt Einführung in die portugiesische Sprachwissenschaft Gunter Narr Verlag Tübingen Inhalt Vorwort 9 Abkürzungen und Abbildungsverzeichnis 12 1 Weltsprache Portugiesisch

Mehr

Theoretische Informatik: Berechenbarkeit und Formale Sprachen

Theoretische Informatik: Berechenbarkeit und Formale Sprachen Theoretische Informatik: Berechenbarkeit und Formale Sprachen Prof. Dr. F. Otto Fachbereich Elektrotechnik/Informatik, Universität Kassel 34109 Kassel, Germany E-mail: otto@theory.informatik.uni-kassel.de

Mehr

Spracherkennung und Sprachsynthese

Spracherkennung und Sprachsynthese Spracherkennung und Sprachsynthese Einführung in die Computerlinguistik Sommersemester 2012 Peter Kolb Spracherkennung / -synthese Spracherkennung (automatic speech recognition, ASR) Sprachsynthese (text-to-speech,

Mehr

Natural Language Processing

Natural Language Processing Natural Language Processing Kapitel 1: Einführung Prof. Dr. Johannes Maucher HdM MIB Version 1.7 13.10.2017 Prof. Dr. Johannes Maucher (HdM MIB) NLP Kapitel 1: Einführung Version 1.7 13.10.2017 1 / 30

Mehr

AVS-M Name des Moduls: Sprachtypologie und Universalienforschung

AVS-M Name des Moduls: Sprachtypologie und Universalienforschung AVS-M 10 1. Name des Moduls: Sprachtypologie und Universalienforschung 2. Fachgebiet / Verantwortlich: Allgemeine und Vergleichende Sprachwissenschaft/ Prof. Dr. Johannes Helmbrecht 3. Inhalte des Moduls:

Mehr

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik Informationsveranstaltung Linguistische Informatik & Korpuslinguistik Prof. Dr. Stefan Evert Professur für Korpuslinguistik http://www.linguistik.uni-erlangen.de/ 2 Was ist Linguistische Informatik? Korpuslinguistik

Mehr

Vorwort Vorwort zur 3. Auflage

Vorwort Vorwort zur 3. Auflage Vorwort Vorwort zur 2. Auflage Vorwort zur 3. Auflage V VI VI 1 Einleitung (Jörg Meibauer/Markus Steinbach) 1 1.1 Sprache in Literatur und Alltag 1 1.2 Sprache als soziales Phänomen 3 1.3 Sprache als historisches

Mehr

Einführung in die germanistische Linguistik

Einführung in die germanistische Linguistik Jörg Meibauer / Ulrike Demske / Jochen Geilfuß-Wolfgang / Jürgen Pafel/Karl Heinz Ramers/Monika Rothweiler/ Markus Steinbach Einführung in die germanistische Linguistik 2., aktualisierte Auflage Verlag

Mehr

Mit Computerlinguistik und Sprachtechnologie in die Zukunft: Die Technik

Mit Computerlinguistik und Sprachtechnologie in die Zukunft: Die Technik 1 Mit Computerlinguistik und Sprachtechnologie in die Zukunft: Die Technik Ein Fragebogen zur Einschätzung der Aktualität von Methoden und zum Zeithorizont von Entwicklungen. Karin Haenelt, 25.06.2002

Mehr

Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09)

Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012. Referent: Florian Kalisch (GR09) Vortrag im Rahmen der Vorlesung Data Warehouse Dozentin: Prof. Dr. Frey-Luxemburger WS 2011/2012 Referent: Florian Kalisch (GR09) Rückblick Aktueller Status Einführung in Text-Mining Der Text-Mining Prozess

Mehr

Information und Produktion. Rolland Brunec Seminar Wissen

Information und Produktion. Rolland Brunec Seminar Wissen Information und Produktion Rolland Brunec Seminar Wissen Einführung Informationssystem Einfluss des Internets auf Organisation Wissens-Ko-Produktion Informationssystem (IS) Soziotechnisches System Dient

Mehr

Korpora. Referenten Duyen Tao-Pham Nedyalko Georgiev

Korpora. Referenten Duyen Tao-Pham Nedyalko Georgiev Korpora Referenten Duyen Tao-Pham Nedyalko Georgiev Hauptseminar: Angewandte Linguistische Datenverarbeitung (WS 11/12) Dozent: Prof. Dr. Jürgen Rolshoven Sprachliche Informationsverarbeitung Universität

Mehr

le errnarusnsc e 2., aktualisierte Auflage

le errnarusnsc e 2., aktualisierte Auflage - L?...,. Jörg Meibauer I Ulrike Demske I Jochen Geilfuß-Wolfgang I Jürgen Pafell Karl Heinz Ramers I Monika Rothweilerl Markus Steinbach _ln u rung In le errnarusnsc e o...jln uisti 2., aktualisierte

Mehr

Institut für Künstliche Intelligenz

Institut für Künstliche Intelligenz Institut für Künstliche Intelligenz Prof. Sebstaian Rudolph --- Computational Logic Prof. Steffen Hölldobler --- Wissensverarbeitung Prof. Ivo F. Sbalzarini --- Wissenschaftliches Rechnen für Systembiologie

Mehr

Einführung in die Computerlinguistik D IALOGSYSTEME WS 2009/2010. Bojan Georgievski Prashanna Thangeswaran David Höfig

Einführung in die Computerlinguistik D IALOGSYSTEME WS 2009/2010. Bojan Georgievski Prashanna Thangeswaran David Höfig Einführung in die Computerlinguistik D IALOGSYSTEME WS 2009/2010 Bojan Georgievski Prashanna Thangeswaran David Höfig Einführung Was sind Dialogsysteme? Beispiele von Dialogsystemen Wo werden Dialogsysteme

Mehr

Spracherkennung. Gliederung:

Spracherkennung. Gliederung: Spracherkennung Gliederung: - Einführung - Geschichte - Spracherkennung - Einteilungen - Aufbau und Funktion - Hidden Markov Modelle (HMM) - HMM bei der Spracherkennung - Probleme - Einsatzgebiete und

Mehr

Modulhandbuch B.A. Allgemeine Sprachwissenschaft

Modulhandbuch B.A. Allgemeine Sprachwissenschaft Modulhandbuch B.A. Allgemeine Sprachwissenschaft 1. Vorbemerkungen ist Deutsch oder Englisch, nach Absprache zwischen Dozent 1 und Studenten. Lehrveranstaltungen, die sich explizit auch an die Studenten

Mehr

INFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka

INFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION 1 22.12.09 Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION(IE) 1. Einleitung 2. Ziel der IE 3. Funktionalität eines IE-Systems 4. Beispiel 5. Übung

Mehr

Formale Systeme. Prof. P.H. Schmitt. Winter 2007/2008. Fakultät für Informatik Universität Karlsruhe (TH) Voraussetzungen

Formale Systeme. Prof. P.H. Schmitt. Winter 2007/2008. Fakultät für Informatik Universität Karlsruhe (TH) Voraussetzungen Formale Systeme Prof. P.H. Schmitt Fakultät für Informatik Universität Karlsruhe (TH) Winter 2007/2008 Prof. P.H. Schmitt Formale Systeme Winter 2007/2008 1 / 12 Übungen und Tutorien Es gibt wöchentliche

Mehr

AVS - M 01. Nr. Veranstaltungen SWS LP A Pflichtbereich 1 Einführung in die Phonetik & Phonologie Einführung in die Morphologie und Syntax 2 5

AVS - M 01. Nr. Veranstaltungen SWS LP A Pflichtbereich 1 Einführung in die Phonetik & Phonologie Einführung in die Morphologie und Syntax 2 5 AVS - M 01 1. Name des Moduls: Basismodul I: Grundlagen und Methoden der AVS 2. Fachgebiet / Verantwortlich: Allgemeine und Vergleichende Sprachwissenschaft/ 3. Inhalte / Lehrziele Die Studierenden werden

Mehr

Modulhandbuch. für den Bachelor-Studiengang Computational Linguistics gültig ab WS 2014/2015. (Version )

Modulhandbuch. für den Bachelor-Studiengang Computational Linguistics gültig ab WS 2014/2015. (Version ) Modulhandbuch für den Bachelor-Studiengang Computational Linguistics gültig ab WS 2014/2015 (Version 2013-06-26) 1 CLI-BA-01 Einführungs-Modul Allgemeine Sprachwissenschaft jährlich: WiSe (1.1-2 Semester

Mehr

Natürlichsprachliche Systeme I Materialien zur Vorlesung

Natürlichsprachliche Systeme I Materialien zur Vorlesung Natürlichsprachliche Systeme I Materialien zur Vorlesung D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg WS 2010/11, 19. Oktober 2010,

Mehr

Nebenfächer für Bachelor Mathematik

Nebenfächer für Bachelor Mathematik Nebenfächer für Bachelor Mathematik Es sind in höchstens drei nichtmathematischen Fächern studienbegleitende Leistungen über einen Gesamtumfang von 36 Credits zu erbringen. Wird mehr als ein Fach gewählt,

Mehr

Simullda. Structured Interlingua MultiLingual Lexical Database Application. Sonja Weber

Simullda. Structured Interlingua MultiLingual Lexical Database Application. Sonja Weber Simullda Structured Interlingua MultiLingual Lexical Database Application Sonja Weber 1 Gliederung Background Begriffsklärung Multilinguale Datenbanken WordNet Maschinelle Übersetzung Formale Begriffsanalyse

Mehr

Seminar Künstliche Intelligenz Wintersemester 2013/14

Seminar Künstliche Intelligenz Wintersemester 2013/14 Seminar Künstliche Intelligenz Wintersemester 2013/14 Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 31.10.2013 2 / 13 Überblick Teilgebiete der KI Problemlösen,

Mehr

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der SS 2016: Grossmann, Jenko Die Beschreibung orientiert sich am Begriffssystem der Beschreibung natürlicher Sprachen Sprache in der steht

Mehr

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank Wortdekodierung Vorlesungsunterlagen Speech Communication 2, SS 2004 Franz Pernkopf/Erhard Rank Institute of Signal Processing and Speech Communication University of Technology Graz Inffeldgasse 16c, 8010

Mehr

Lexikologie der deutschen Gegenwartssprache. Herbstsemester 2011/2012 Assist. Daumantas Katinas

Lexikologie der deutschen Gegenwartssprache. Herbstsemester 2011/2012 Assist. Daumantas Katinas Lexikologie der deutschen Gegenwartssprache Herbstsemester 2011/2012 Assist. Daumantas Katinas 7.9.2011 Überblick 15 Lehrveranstaltungen Teilnahmepflicht an 10 Veranstaltungen 1 schriftliche Kontrollarbeit

Mehr

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik Informationsveranstaltung Linguistische Informatik & Korpuslinguistik Prof. Dr. Stefan Evert Professur für Korpuslinguistik http://www.linguistik.uni-erlangen.de/ Was ist Linguistische Informatik? Korpuslinguistik

Mehr

Übersicht. 23. Praktische Verarbeitung natürlicher Sprache

Übersicht. 23. Praktische Verarbeitung natürlicher Sprache Übersicht I Künstliche Intelligenz II Problemlösen III Wissen und Schlußfolgern IV Logisch Handeln V Unsicheres Wissen und Schließen VI Lernen VII Kommunizieren, Wahrnehmen und Handeln 22. Kommunizierende

Mehr

Theoretische Informatik: Berechenbarkeit und Formale Sprachen

Theoretische Informatik: Berechenbarkeit und Formale Sprachen Theoretische Informatik: Berechenbarkeit und Formale Sprachen Prof. Dr. F. Otto Fachbereich Elektrotechnik/Informatik, Universität Kassel 34109 Kassel, Germany E-mail: otto@theory.informatik.uni-kassel.de

Mehr

Einführung in die Linguistik

Einführung in die Linguistik Karl-Dieter Bünting Einführung in die Linguistik io. Auflage Athenäum Verlag 1983 Inhaltsverzeichnis V o r w o r t z u r e r s t e n u n d z u r s i e b t e n A u f l a g e... 1 1 Grundbegriffe 13 Allgemeine

Mehr

Lösungsvorschlag für das Übungsblatt 4. Aufgabe 1.

Lösungsvorschlag für das Übungsblatt 4. Aufgabe 1. Lösungsvorschlag für das Übungsblatt 4. Aufgabe 1. Im CISLEX sind für das deutsche Kernlexikon 206.000 Lemmata, 1.300.000 en und 2.350.000 Lesarten kodiert. Wichtiger ist aber die Herangehensweise, um

Mehr

Synchrone Linguistik

Synchrone Linguistik Synchrone Linguistik Phonetik/ Phonologie Morphologie Syntax Semantik Pragmatik Forensische Linguistik Psycholing. Neuroling. Textling. Sozioling. Aphasiologie Angewandte Linguistik 1 Fragen, Ziele und

Mehr

Elementare Wahrscheinlichkeitslehre

Elementare Wahrscheinlichkeitslehre Elementare Wahrscheinlichkeitslehre Vorlesung Computerlinguistische Techniken Alexander Koller 13. November 2015 CL-Techniken: Ziele Ziel 1: Wie kann man die Struktur sprachlicher Ausdrücke berechnen?

Mehr

Projektseminar "Texttechnologische Informationsmodellierung"

Projektseminar Texttechnologische Informationsmodellierung Projektseminar "Texttechnologische Informationsmodellierung" Ziel dieser Sitzung Nach dieser Sitzung sollten Sie: Einige standards und projekte vom Namen her kennen Einen Überblick über und einen Eindruck

Mehr

Theoretische Informatik

Theoretische Informatik Theoretische Informatik Sommersemester 2004 Christoph Kreitz Theoretische Informatik, Raum 1.18, Telephon 3060 kreitz@cs.uni-potsdam.de http://www.cs.uni-potsdam.de/ti/kreitz 1. Themen und Lernziele 2.

Mehr

Modulhandbuch (21. April 2010) Kennzeichnung der genannten Teilbereiche:

Modulhandbuch (21. April 2010) Kennzeichnung der genannten Teilbereiche: Modulhandbuch (21. April 2010) Legende: PM = Pflichtmodul; WPM = Wahlpflichtmodul; WM = Wahlmodul VL = Vorlesung; HS = Hauptseminar; S = Seminar, Ü = Übung; Tut = Tutorium, Koll = Kolloquium; E = Eigenstudium

Mehr

HERZLICH WILLKOMMEN im Studiengang Bachelor of Science Maschinelle Sprachverarbeitung

HERZLICH WILLKOMMEN im Studiengang Bachelor of Science Maschinelle Sprachverarbeitung HERZLICH WILLKOMMEN im Studiengang Bachelor of Science Maschinelle Sprachverarbeitung Institut für Maschinelle Sprachverarbeitung (IMS) Universität Stuttgart Allgemeine Informationen Regelstudienzeit:

Mehr