Sprachverstehen. Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller

Ähnliche Dokumente
Spracherkennung. Gliederung:

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis

Kommunikation mit gesprochener Sprache...

Spracherkennung und Sprachsynthese

Einführung in die Computerlinguistik D IALOGSYSTEME WS 2009/2010. Bojan Georgievski Prashanna Thangeswaran David Höfig

Computerlinguistik und Sprachtechnologie

Proseminar, wozu? Proseminar, wozu? Proseminar, wozu? Verarbeitung gesprochener Sprache

Anwendung Rechnernetze Thema: Spracheingabe. Michael Pöhnert Matrikel: INF04 Kennnummer: 12538

8 Fakultät für Philologie

V1/2.S Sprachwissenschaft

Seminar Künstliche Intelligenz Wintersemester 2013/14

Teil II. Automatische Spracherkennung. SPEZIELLE MUSTERANALYSESYSTEME Schrift- und Spracherkennung mit Hidden-Markov-Modellen

Theoretische Informatik: Berechenbarkeit und Formale Sprachen

Einführung in die Computerlinguistik. Dialogsysteme. Wozu Dialogsysteme? Der sprechende Fahrstuhl (1) Der sprechende Fahrstuhl (5)

Theoretische Informatik: Berechenbarkeit und Formale Sprachen

Praktische Informatik I

EINLEITUNG. Kurs: Der Sprachinstinkt (Gergely Pethő), 1. Sitzung

NLP - Analyse des Wissensrohstoffs Text

Wie ein Rechner aus Schallwellen Wörter erkennt

Logik. Vorlesung im Wintersemester 2010

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick

Mit Computerlinguistik und Sprachtechnologie in die Zukunft: Die Technik

Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen. Wie verstehen Computer natürliche Sprachen?

Grundlagenbereich Kognitionswissenschaften


Sprachverarbeitung I

Sprachbasierte Informationssysteme

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik

Modelle der Sprachrezeption serial bottleneck :

Einführung in die Signalverarbeitung

Magisterarbeit. Multimodale Interaktionsgestaltung bei dem mobilen Serviceroboter Care-O-bot 3 des Fraunhofer IPA

2 Sprachliche Einheiten

Übersicht über 1. Vorlesungsabschnitt Form und Darstellung von Informationen

Seminar Künstliche Intelligenz Wintersemester 2014/15

Praktische Informatik I

Modellbildung und Simulation

Modulhandbuch. für das Bachelor Nebenfach Computerlinguistik gültig ab Wintersemester (Version: )

Spontane Nutzung sozialer Signale bei autistischen Erwachsenen

Berechenbarkeit und Komplexität

Datenorientierte SA. Aufbau und Grundlagen. Aufbau und Grundlagen. Aufbau und Grundlagen. Was sind neuronale Netze?

Einführung in die Signalverarbeitung

Logik für Informatiker

Woher Methoden der KI stammen Gebiete der Künstlichen Intelligenz wissensbasierte Systeme

Modulhandbuch des Bachelor-Ergänzungsfachs. Sprachkompetenz Italienisch

Automatisches Verstehen gesprochener Sprache

Logik für Informatiker

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko

Mathematik für Informatiker I

Endliche Automaten. Im Hauptseminar Neuronale Netze LMU München, WS 2016/17

Fuzzy Logic und Wahrscheinlichkeit

AVWS Diagnostik aus sprachtherapeutischer Sicht

Grundlagen der Analyse von Sprachdatenbanken. Jonathan Harrington

Was ist Statistik? Wozu dienen statistische Methoden?

Voraussetzungen und Bedingungen für einen erfolgreichen Spracherwerb. Voraussetzungen und Bedingungen für einen erfolgreichen Spracherwerb

Theoretische Informatik

Sprachliches Wissen: mentales Lexikon, grammatisches Wissen. Gedächtnis. Psycholinguistik (2/11; HS 2010/2011) Vilnius, den 14.

Was ist Informatik? Alexander Lange

Natürlichsprachliche Mensch-Computer Interaktion mit VoiceXML

Probe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013

Spezielle Themen der KI

Auswahlbibliographie zum Studium der anglistischen Sprachwissenschaft

Supervised Learning Algorithmus für Stellenanzeigenklassifikation und Jobdeskriptoren Gewinnung

Psycholinguistik: Einführung

Einführung in die Künstliche Intelligenz

Die Neurobiologischen Bedingungen Menschlichen Handelns. Peter Walla

Fremdsprachenmodule des Sprachenzentrums der Universität Leipzig

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik

Einführung in die Wirtschaftsinformatik

Institut für Germanistik Katholische Universität Lublin Johannes Paul II., Polen

Artikulatorische distinktive Merkmale der Konsonanten im Deutschen

Erkennung menschlicher Aktionen durch Inferenz stochastischer regulärer Grammatiken

Fachbereich Linguistik Wahlfachmodule

Maschinelle Kundenbetreuung: Sprachsysteme, Avatare und Co.

Ausgewählte Techniken der Maschinellen Übersetzung. Susanne J. Jekat ZHW Subject: MTZH

Geleitwort Danksagung Abbildungsverzeichnis Tabellenverzeichnis Abkürzungsverzeichnis Zusammenfassung...

1. STUDIENGANG: B.A. LINGUISTIK. 2. ABSCHLUSS: Bachelor of Arts. 3. REGELSTUDIENZEIT: 6 Semester STUDIENBEGINN FÜR STUDIENANFÄNGER: Wintersemester

Wochen-Stundenplan (Stand ) Informatik 1. Semester Bachelor (PO 2010) (Studienbeginn WiSe) WiSe 2010/2011

Einführung in die portugiesische Sprachwissenschaft

Automaten und Formale Sprachen

P4.1 Einführung in die Signalverarbeitung

EINFÜHRUNG IN DIE THEORETISCHE INFORMATIK 0. ORGANISATORISCHES UND ÜBERBLICK

Freihand-Editieren von mathematischen Formeln

LG Allgemeine und Pädagogische Psychologie

Warum haben es Schnellsprecher schwerer?

Psycholinguistik. Definition: Psycholinguistik (synonym: Sprachpsychologie) erforscht das kognitive (mentale) System, das den Sprachgebrauch erlaubt.

Automatische Spracherkennung

Betriebswirtschaftliche Evaluation von Spracherkennungssystemen

Theoretische Informatik 2 bzw. Formale Sprachen und Berechenbarkeit. Sommersemester Herzlich willkommen!

20. Mitteilungsblatt Nr. 24

Phonetik. Phonologie

Vorlesung Berechenbarkeit und Komplexität Wintersemester 2016/17. Wer sind wir? Willkommen zu

WAS IST KOMMUNIKATION? Vorstellungen über die Sprache

Gedächtnis. Extern gewonnene Informationen werden in drei Stufen verarbeitet:

Katholische Universität Lublin Johannes Paul II. Institut für Germanistik. Studienpläne. Bachelor-Studium

Elektronische Kommunikationshilfen. Raphael Kubke Einführung in die Computerlinguistik Sommersemester 2010 Heinrich-Heine-Universität

Spezielle Themen der KI NLP Natural Language Processing

Einsatz elektronischer Kommunikationshilfen bei Aphasie

Studienprojekt TaxoSearch Spezifikation

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik

Transkript:

Sprachverstehen Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller

Johannes Steinmüller 1/B309 Tel.: 531 35198 stj@informatik.tu-chemnitz.de Seite zur Vorlesung: http://www.tu-chemnitz.de/informatik/ki/edu/spraver/

Übung Donnerstag, 7.30 9.00 Uhr, 1/208 Beginn: 25.10.12

Inhalt Einführung Überblick Allgemeine Begriffe Sprachliche Einheiten Aufbau von Sprachverarbeitungssystemen Syntax Grammatiken Übergangsnetze Merkmalsstrukturen Unifikationsgrammatiken Semantik Aufgaben Semantische Netze Logikformalismen Diskursrepräsentationstheorie Erkennung gesprochener Sprache Nichtlineare Zeitanpassung Hidden Markov Modelle Statistische Spracherkennung Sprachmodellierung Zeitliches Schließen

Nicht in dieser Vorlesung Sprache bei Menschen Kognition Signalverarbeitung Neuronale Netze Sprachgenerierung

Literatur St. Euler: Grundkurs Spracherkennung Vieweg, 2006 B. Pfister, T. Kaufmann: Sprachverarbeitung Springer, 2008 Kai-Uwe Carstensen u. a.: Computerlinguistik und Sprachtechnologie Spektrum Akademischer Verlag, 2001, 2004, 2010 www.linguatec.net (Spracherkennung, Sprachausgabe, Übersetzung) www.sympalog.de (Dialog) www.lt-world.org/ (Language Technology World)

1 Einführung

Inhalt Einordnung Sprache Was ist Sprachverarbeitung? Anwendungen der Sprachverarbeitung Geschichte

1.1 Einordnung

Interdisziplinärer Charakter Informatik (Künstliche Intelligenz) Linguistik (Computerlinguistik) Mathematik (Logik, Statistik) Kognitive Psychologie (Kognition) Neuroinformatik, Neurobiologie Informationswissenschaft Signalverarbeitung Philosophie

1.2 Sprache

Sprache dient zur Verständigung zwischen Menschen wichtig: Bedeutung einer sprachlichen Äußerung Sprecher und Hörer müssen eine Lautfolge in gleicher Weise verstehen geschriebene Sprache (Text) gesprochene Sprache (Sprachsignal)

Verschiedene Betrachtungsarten der Sprache Sprachanalyse Haus Phonetik [ h a u s ] Syntax Haus - Substantiv Bedeutung

Text und Sprachsignal

Warum Sprache? natürlichste Kommunikationsform effizientes Mensch-Maschine-Interface Tastatur: 100-150 Wörter pro Minute (bei stark geschulter Bedienungsperson) sonst nur 10-25 Wörter pro Minute Sprache: 120-250 Wörter pro Minute kein physikalischer Mensch-Maschine-Kontakt hoher Grad an Bewegungsfreiheit (Hände bleiben frei) funktioniert über eine räumliche Distanz hinweg keine visuellen Einschränkungen (Dunkelheit, schlechtes Licht) zusätzlicher Informationskanal kein wesentlicher Raumbedarf Zugang zum öffentlichen Telefonnetz

1.3 Was ist Sprachverarbeitung?

Sprachverarbeitung Informationsquelle (Mensch) Schallwellen, elektrisches Signal Digitalisierung Signaltransformation (Spektrum, Merkmale) Berechnung von ca. 30-50 Merkmalen alle 10 ms dazu betrachtet man einen kurzen Abschnitt (20 40 ms) des Sprachsignals Spracherkennung

Sprechprozess Sprachsignal

Berechnung von Merkmalen

System zur Sprachverarbeitung Sprachanalyse: Eine sprachliche Eingabe wird verstanden, syntaktisch und semantisch analysiert, eine Bedeutung zugeordnet und ausgewertet. automatische Spracherkennung Sprachverstehen Sprachsynthese (Sprachgenerierung): Eine Antwort wird wieder in Sätze (ev. akustische Form) zur Ausgabe an den Benutzer übersetzt.

Auskunftsystem fur InterCityVerbindungen

Auskunftsystem fur InterCityVerbindungen

Fähigkeiten und Eigenschaften Einzelworterkennung Sprachpause zwischen 2 Wörtern Mustererkennung beruht auf einem Vergleich ganzer Wörter Wortkettenerkennung sind in der Lage, Ausdrücke, die mehrere Wörter enthalten, zu verarbeiten und die einzelnen Wörter zu zerteilen nur innerhalb der Kette fließend z.b.: Ziffern einer Telefonnummer Erkennung fließender Sprache spontane Sprache

Fähigkeiten und Eigenschaften sprecherabhängig auf einen Sprecher zugeschnitten System muss mit Sprachproben trainiert werden sprecheradaptiv während des Erkennungsvorganges passt sich das System an die besonderen Eigenschaften des Sprechers an sprecherunabhängig

Wortschatz

1.4 Anwendungen

Anwendungen der Sprachverarbeitung Sprachsignalcodierung Übertragung, Speicherung und Chiffrierung von Sprache Verbesserung der Sprachqualität Sprechertransformation ein Sprachsignal, das von einem Sprecher X gesprochen worden ist, so zu verändern, dass es als die Stimme eines Sprechers Y wahrgenommen wird Sprechererkennung Identifikation: Erkennen einer Person anhand ihrer Stimme (bekannter Personenkreis) Verifikation: entscheiden, ob ein Sprecher zu einem bekannten Personenkreis gehört (Zugangskontrollen) Sprachidentifikation Keyword-Spotting Wurden bestimmte Schlüsselwörter gesagt? Spracherkennung Sprachsynthese Übersetzung, Dolmetschen Dialoganwendungen Google Geschäftsprozesse Briefe klassifizieren

Übersetzung Beispiel: Der Geist ist willig, aber das Fleisch ist schwach. Dieser Satz wurde ins Russische übersetzt und dann wieder zurück. Es entstand: Der Wodka ist gut, aber das Essen verdorben.

Anwendungsklassen in der Spracherkennung Kommandoworterkenner kleiner Wortschatz Steuerung von Geräten zuverlässig unter extrem schwierigen Bedingungen Diktiersysteme Sprecheradaptiv großer Wortschatz (100000 Wörter) Bedeutung des gesprochenen Textes wird nicht verstanden interaktive Dialogsysteme sprecherunabhängig spontane zielgerichtete Äußerungen, Telefon z.b.: Kinoreservierung, Hotelvermittlung, Zugverbindungen

1.5 Geschichte

Geschichte 1791: Sprechmaschine (KEMPELEN) Buch "Mechanismus der menschlichen Sprache nebst Beschreibung einer sprechenden Maschine baute auch den Schachautomaten Der Türke 1956: Theorie der formalen Sprachen (CHOMSKY) 1966: Verarbeitung natürlicher Sprachen mit einfachen Mustertransformationen (ELIZA) http://www.med-ai.com/models/eliza.html.de 1968: semantische Netze 1970: effektive Grammatikformalismen (ATN-Grammatiken)

Geschichte 1972: LUNAR -- Auskunftssystem über die von den Mondlandungen mitgebrachten Gesteinsproben 1977: GUS -- Beratung und Reservierung bei Flugreisen 1990: SPICOS II -- Dialog mit einer Datenbank (verarbeitet fließend gesprochene Sprache und generiert akustische Antwort 1994: TANGORA -- sprecherabhängiges Diktiersystem (20000 Wortformen, Pausen zwischen den Wörtern 1995: EVAR -- IC Zugauskunft 1991-2001: VERBMOBIL -- Simultanübersetzung von Verhandlungsdialogen

aktueller Stand Kommandoworterkenner Diktiersystem, Spracherkennung www.linguatec.net Dialogsysteme (Kino, Sport, Wetter, Reservierung, Börsenauskunft) SymRec / SymComponents www.sympalog.de Keyword-Spotter SymSpot www.sympalog.de Erkennung von Emotionen aus Sprachsignalen SymEmotion www.sympalog.de