Teil II. Automatische Spracherkennung. SPEZIELLE MUSTERANALYSESYSTEME Schrift- und Spracherkennung mit Hidden-Markov-Modellen

Größe: px
Ab Seite anzeigen:

Download "Teil II. Automatische Spracherkennung. SPEZIELLE MUSTERANALYSESYSTEME Schrift- und Spracherkennung mit Hidden-Markov-Modellen"

Transkript

1 SPEZIELLE MUSTERANALYSESYSTEME Schrift- und Spracherkennung mit Hidden-Markov-Modellen Vorlesung im Wintersemester 2015 Teil II Automatische Spracherkennung Prof. E.G. Schukat-Talamazzini Stand: 24. Juli 2015 Durchschnittliche Übertragungsraten Tastenfeld trainiert W/min untrainiert W/min Tastenzahl & Tastenbelegung 100% Erkennung (Tippfehler!) Handschrift 25 W/min m/o Übung automat. Erkennung von Blockschrift gelöst automat. Erkennung von Kursivschrift ungelöst Lautsprache W/min m/o Übung Diktiermaschine 40 W/min automatische Erkennung??

2 Vorteile gesprochener MM-Kommunikation hohe Datenrate zusätzlicher Kommunikationskanal Hände & Augen sind frei für andere Aktivitäten Nutzung existierender Übertragungskanäle (Telefon) Bewegungsfreiheit keine mitzuführenden Armaturen geringer Raumbedarf des Endgeräts (Mikrofon) funktioniert auch im Dunkeln unterstützt effizient kollektives Problemlösen natürliche Kommunikationsform wenig Übung erforderlich mnemonisch keine Kürzel Anwendungsgebiete maschineller Spracherkennung Haushalt Beleuchtung, Unterhaltungselektronik, Anrufbeantworter Büro Aktenhaltung, Informationsabfrage, Gerätebedienung, akustische Schreibmaschine Industrie Qualitätskontrolle, Inventur, Versand Zahlungsverkehr telefonischer Bankauftragsdienst, Börsenhandel, Kreditkartenwesen Personentransport Fahrzeugbedienung, Fahrplanauskunft, Reservierung Informationsdienste Wetterbericht, Veranstaltungskalender, Gelbe Seiten Ausbildung Fremdsprachenerwerb, rechnergestütztes Lernen Medizin Diagnosesysteme, Mikroskopie, Patientenrufanlage Militär Waffensystemkontrolle, Flugzeugbedienung, nachrichtendienstliche Observation Behindertenhilfe Sprechtraining für Gehörlose, Fahrzeugbedienung, Filmuntertitelung Sprachkommunikation maschinelle Telefonvermittlungen, automatische Dolmetschgeräte Datenerfassung Gerätesteuerung Informationsgewinnung Auskunftsdialogsysteme System: Hier ist die automatische InterCity-Auskunft. Was kann ich für Sie tun? Nutzer: Ich will morgen abend nach Frankfurt. System: Sie können ab Bonn fahren um [... ] Nutzer: Gibt es auch noch einen früheren Zug? System: Bis wann möchten Sie spätestens in Frankfurt ankommen? Nutzer: Bis einundzwanzig Uhr. System: Sie können ab Bonn fahren um [... ] Nutzer: Vielen Dank. Auf Wiedersehen.

3 AD/DA Wandlung Sprachkompression SPRACHERKENNUNG "Ich will morgen abend nach Frankfurt" SPRACHVOLLSYNTHESE "Sie können ab Bonn fahren um..." Spracherkennung Sprachanalyse Analoges Signal Zeitlicher Amplitudenverlauf Physikalischer Schalldruck Parametrische Darstellung Kurzzeitanalyse Akustische bedeutsame Größen Vollsynthese Sprachverstehen DSP Digitales Signal Rechnerinterne Darstellung abgetastet & quantisiert Symbolphonetische Darstellung ein "Strom" von Lauten, Silben, Intonationsformen Sprachsynthese concept to speech Sprecherverifikation Sprecheridentifikation SPRACHVERSTEHEN ANTWORTGENERIERUNG Textuelle Darstellung Linguistische Strukturinformation Verbindungsauskunft Abfahrt Ankunft Datum Uhrzeit Ort Datum Uhrzeit Ort Freitag, 16. Juli :00 20:00 Uhr Bonn Freitag, 16. Juli :30 22:30 Uhr Frankfurt a.m. eine Folge von Wörtern Orthografische Notation Natürlichsprachliche Verarbeitung System (re)aktion Steuerimpuls, DB Anfrage Dialogantwort, Übersetzung Dialog/Übersetzung/Kommando Systeme Phrasenstrukturbäume PL Formeln, Semant. Netze? ASV = ASE + NSV I Darbietungsform isolierte Einzelwörter kontinuierliche Sätze oder Passagen Kommunikationsmodus Kommandos Menü Dialog (wechsel-/gegensprechend) Übersetzung (MeMaMe) Wortschatz Umfang Schwierigkeitsgrad Adaptivität

4 Wieviele Wortformen braucht der Mensch? II Alarmstopschalter Menü Steuerung (J/N) Zahlen/Ziffern Gerätebedienung Auskunftsdialog Alltagssprache Diktiermaschine Deutsch ohne Fremdwörter n ca Sprachumfang Kommando-Set stark formalisierte Kunstsprache schriftsprachlich spontansprachlich Überdeckungsgrad Verzweigungsfaktor, Perplexität Diskursbereich klein überschaubar mittel umfangreich utopisch Versandbestellung, home banking Bahnauskunft, Flugreservierung Terminabsprache, telephone rosé Patentverzeichnis, ärztliche Diagnose Telefonseelsorge III Sprecherabhängigkeit ein Sprecher feste Sprechergruppe Sprechertypus (Geschlecht, Dialekt) beliebige Sprecher adaptiv Sprecherverhalten Diszipliniertheit Kooperativität Vertrautheitsgrad Streß, Disposition Sprachsignalqualität Bandbreite Störgeräusche Raumakustik

5 Guten Morgen, Herr Hauptkomissar Thanner. Gibt es irgendetwas Neues im Fall Verbmobil? Morgen, Thanner. Irgendwas Neues im Fall Verbmobil? morgen thanner irgendwas neues im fall verbmobil morgenthannerirgendwasneuesimfallverbmobil moangtannairgnwasneuesimfalwerpmobiehl der Text in Schönschrift spontan gesprochene Sprache Großschreibung? Satzzeichen? kontinuierliche Sprache Aussprachevarianten artikulatorische Verschleifung Störungen und Verzerrungen Fremdstimmen Cocktailparty Vier Problemfelder KONTINUITÄT Wahrnehmung Folge von Wörtern Folge von Silben Folge von Lauten Sprachsignal keinerlei akustische Grenzmarkierungen KOMPLEXITÄT Datenmengen z.b Abtastwerte/Sekunde Inventare Phoneme, > Silben, k Wörter Kombinatorik exponentielles Wachstum: Anzahl möglicher Sätze Restriktionen Grammatik versus Suchraum VARIABILITÄT Sprecher Anatomie, Dialekt, Idiolekt Sprechweise Tempo, Lautstärke, Kooperation, Anspannung Kontext Lautumgebung, Betonung Aufnahmekanal Mikrofon, Position, Fundamentalformel Nachhall, Wandlung der ASE Umgebung Stimmen, Verkehr, Maschinen AMBIGUITÄT LINGUISTISCHE QUELLE AKUSTISCHER KANAL Homophonie Rad und Rat Text w Wort Merkmal X Statistische Wortgrenzen Stau-becken und Staub-ecken erzeugung artikulation berechnung Dekodierung Satzbau... das Tonband, daß Nixon vernichtete... Der gute Mann denkt an sich [,] selbst zuletzt Bedeutung Bienenhonig und Imkerhonig SPRACHERKENNUNG P(w) P(X w) argmax w P(X, w) BAYES sche Entscheidungsregel: Suche diejenige Wortfolge w mit maximaler a posteriori Wahrscheinlichkeit P(w X ) def = P(w) P(X w) P(X ) w

6 Systemarchitektur eines Spracherkenners Stand der Technik Signalverarbeitung physikalische Akustik Physiologie Phonologie Informationstheorie HMM Wortmodelle Algorithmen der KI es gibt kommerzielle Systeme für die Erkennung isoliert gesprochener Wörter 10 bis wenige 100 Wörter mit kurzer Anpassungsphase oder sprecherunabhängig in ruhiger Umgebung oder robust gegen Fremdschall statistische Dekodierung grammatisches Sprachmodell Sprachsignalkurzzeitanalyse Vektorquantisierung Mustererkennung Linguistik syntaxgesteuerte Suche Statistik es gibt kommerzielle Diktiermaschinen Wörter sprecherabhängig isolierte Wörter es gibt Laborsysteme, die kontinuierlich gesprochene Sprache verstehen und eine sinnvolle Reaktion geben 1000 oder mehr Wörter mit restriktivem Sprachmodell (Perplexität < 100) bei sehr guter Sprachqualität es gelten einschneidende Beschränkungen hinsichtlich Wortschatz Syntax Dialekt Problemkreis

Spracherkennung. Gliederung:

Spracherkennung. Gliederung: Spracherkennung Gliederung: - Einführung - Geschichte - Spracherkennung - Einteilungen - Aufbau und Funktion - Hidden Markov Modelle (HMM) - HMM bei der Spracherkennung - Probleme - Einsatzgebiete und

Mehr

Sprachverstehen. Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller

Sprachverstehen. Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller Sprachverstehen Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller Johannes Steinmüller 1/B309 Tel.: 531 35198 stj@informatik.tu-chemnitz.de Seite zur Vorlesung: http://www.tu-chemnitz.de/informatik/ki/edu/spraver/

Mehr

Sprachsynthese und Spracherkennung

Sprachsynthese und Spracherkennung 90 Sprachsynthese und Spracherkennung von John N. Holmes Mit 51 Bildern und 69 Übungen mit Lösungshinweisen R. Oldenbourg Verlag München Wien 1991 INHALT Vorwort 11 1 Lautsprachliche Kommunikation 15 1.1

Mehr

Automatische Spracherkennung

Automatische Spracherkennung Ernst Günter Schukat-Talamazzini Automatische Spracherkennung Grundlagen, statistische Modelle und effiziente Algorithmen Technische Universität Darmetadt FACHBEREICH INFORMATIK BIBLIOTHEK MH Invsntar-Nr.:

Mehr

Spracherkennung Hauptseminar Interaktion von Mensch und Roboter

Spracherkennung Hauptseminar Interaktion von Mensch und Roboter Spracherkennung Hauptseminar Interaktion von Mensch und Roboter Vladislav Lazarov lazarov@in.tum.de Was ist Spracherkennung? Was ist (automatische) Spracherkennung? Identifikation und Analyse gesprochener

Mehr

bonn.de bonn.de

bonn.de  bonn.de wgh@ikp.uni bonn.de http://www.ikp.uni bonn.de 023 Vorlesungsskripten deutsch bilingual deutsch/englisch Allgemein zur Sprachsignalverarbeitung Speziell zu Kapitel 1 gsv_1.1 t 250 ms/zeile gsv_1.2 t

Mehr

Spracherkennung und Sprachsynthese

Spracherkennung und Sprachsynthese Spracherkennung und Sprachsynthese Einführung in die Computerlinguistik Sommersemester 2012 Peter Kolb Spracherkennung / -synthese Spracherkennung (automatic speech recognition, ASR) Sprachsynthese (text-to-speech,

Mehr

Spracherkennung. 2. Sitzung 16. Oktober 2008

Spracherkennung. 2. Sitzung 16. Oktober 2008 Spracherkennung 2. Sitzung 16. Oktober 2008 Überblick 1. Sitzung Organisatorisches Übungen und Scheinkriterien Termine Sprechstunde und Webseite Inhaltlicher Überblick Allgemeines Übungen Bislang: NN Vorschlag:

Mehr

Kommunikation mit gesprochener Sprache...

Kommunikation mit gesprochener Sprache... Kommunikation mit gesprochener Sprache...... ist mehr als Hören und Sprechen: Mensch-Maschine-Kommunikation mit gesprochener Sprache 1 Kommunikation mit gesprochener Sprache...... ist mehr als Hören und

Mehr

2 Sprachliche Einheiten

2 Sprachliche Einheiten 2 Sprachliche Einheiten Inhalt Semiotische Begriffe Wörter Wortbestandteile Wortzusammensetzungen Wortgruppen Text und Dialog Wort- und Satzbedeutung 2.1 Semiotische Begriffe Semiotische Begriffe Semiotik

Mehr

Spracherkennung TAREQ HASCHEMI HAW-SEMINAR WS16

Spracherkennung TAREQ HASCHEMI HAW-SEMINAR WS16 Spracherkennung TAREQ HASCHEMI HAW-SEMINAR WS16 AGENDA Grundlegendes Sprache Anwendungsbeispiele Schwierigkeit Architektur Spracherkennungssystem Hidden Markov Modell Verbesserung durch Kombination mit

Mehr

Äquivokationen. In der Spracherkennung. Michael Baumann Seminar (mit Bachelorarbeit)

Äquivokationen. In der Spracherkennung. Michael Baumann Seminar (mit Bachelorarbeit) Äquivokationen In der Spracherkennung Michael Baumann 532 0225336 michael.baumann@student.tuwien.ac.at Seminar (mit Bachelorarbeit) Inhalt Einführung Äquivokation, Ambiguität, Prosodie Signale Beispiele:

Mehr

V1/2.S Sprachwissenschaft

V1/2.S Sprachwissenschaft V1/2.S Sprachwissenschaft Die Studierenden verfügen über Kenntnisse, die sie befähigen, sprachliche Strukturen zu durchschauen. Sie sind in der Lage, die Einheiten und Regeln der sprachlichen Kommunikation

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Was ist Computerlinguistik? Definition Anwendungen Fragestellung

Mehr

Digitale Verarbeitung von natürlicher Sprache

Digitale Verarbeitung von natürlicher Sprache PS Einführung in die Computerlinguistik bzw. SE aus Artificial Intelligence Digitale Verarbeitung von natürlicher Sprache MMag. Gudrun Kellner Ein Sprachsignal 2 Beobachtungen am Sprachsignal 1 Sprachsignale

Mehr

Die bedingte Wahrscheinlichkeit in der Spracherkennung. Wie rechnet man mit...?

Die bedingte Wahrscheinlichkeit in der Spracherkennung. Wie rechnet man mit...? Die bedingte Wahrscheinlichkeit in der Spracherkennung Florian Schiel Was ist...? Münchner Winterwetter Beispiele Statistik! Wozu braucht man...? Automatische Spracherkennung Wie rechnet man mit...? Florian

Mehr

Digitale Signalverarbeitung

Digitale Signalverarbeitung Digitale Signalverarbeitung Hans-Günter Hirsch Institut für Mustererkennung email: hans-guenter.hirsch@hs-niederrhein.de http://dnt.kr.hs-niederrhein.de Webserver: http://dnt.kr.hs-niederrhein.de/dsv15/

Mehr

Einführung in die Computerlinguistik: Gesprochene Sprache. Dr. Marc Schröder, DFKI

Einführung in die Computerlinguistik: Gesprochene Sprache. Dr. Marc Schröder, DFKI Einführung in die Computerlinguistik: Gesprochene Sprache Dr. Marc Schröder, DFKI schroed@dfki.de Kurs-Homepage: http://www.coli.uni-saarland.de/~hansu/courses/ec07/index.html Überblick Eigenschaften gesprochener

Mehr

Automatisches Verstehen gesprochener Sprache

Automatisches Verstehen gesprochener Sprache Automatisches Verstehen gesprochener Sprache 3. Sprachmodellierung Martin Hacker Bernd Ludwig Günther Görz Professur für Künstliche Intelligenz Department Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg

Mehr

Proseminar, wozu? Proseminar, wozu? Proseminar, wozu? Verarbeitung gesprochener Sprache

Proseminar, wozu? Proseminar, wozu? Proseminar, wozu? Verarbeitung gesprochener Sprache Proseminar, wozu? Verarbeitung gesprochener Sprache Proseminar Wolfgang Menzel menzel@informatik.uni-hamburg.de Arbeitsbereich Natürlichsprachliche Systeme Fachbereich Informatik Universität Hamburg Proseminare

Mehr

6.5 Statistische Spracherkennung

6.5 Statistische Spracherkennung 6.5 Statistische Spracherkennung 6.5.1 Spracherkennung mit MAP Regel MAP Regel (Maximum-a-posteriori-Regel Wˆ = argmax W V * P( W X) optimale Wortfolge Wˆ = w w K w i V 1 2 w K Wortfolge Merkmalssequenz

Mehr

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank Wortdekodierung Vorlesungsunterlagen Speech Communication 2, SS 2004 Franz Pernkopf/Erhard Rank Institute of Signal Processing and Speech Communication University of Technology Graz Inffeldgasse 16c, 8010

Mehr

Einführung in die automatische Spracherkennung. SS 2007 Klaus Kasper

Einführung in die automatische Spracherkennung. SS 2007 Klaus Kasper Einführung in die automatische Spracherkennung SS 27 Klaus Kasper Praktikum Montag, 16:h 19:15h (Y-Raster) Ort: D15/22 erste Veranstaltung: 2.4.27 Programmiersprache Ihrer Wahl (C/C ++ /C#, Java, ) Zulassungsvoraussetzung

Mehr

Grundlagen der Analyse von Sprachdatenbanken. Jonathan Harrington

Grundlagen der Analyse von Sprachdatenbanken. Jonathan Harrington Grundlagen der nalyse von Sprachdatenbanken Jonathan Harrington Die Laborsprache Fast alle ntersuchungen in der Experimentalphonetik im 20 Jahrhundert befassen sich mit der Laborsprache. Warum? Competence/performance

Mehr

Hidden Markov Modelle

Hidden Markov Modelle Hidden Markov Modelle in der Sprachverarbeitung Paul Gabriel paul@pogo.franken.de Seminar Sprachdialogsysteme: Hidden Markov Modelle p.1/3 Überblick Merkmalsvektoren Stochastischer Prozess Markov-Ketten

Mehr

Prof. Dr. Marcus Spies Institut f. Informatik LMU München

Prof. Dr. Marcus Spies Institut f. Informatik LMU München Planung für die Vorlesung Spracherkennung und integrierte Dialoganwendungen Sommersemester 2005 am Lehrstuhl Medieninformatik des Institut für Informatik der LMU München Prof. Dr. Marcus Spies Institut

Mehr

Digitale Signalverarbeitung

Digitale Signalverarbeitung Digitale Signalverarbeitung Hans-Günter Hirsch Institut für Mustererkennung email: hans-guenter.hirsch@hs-niederrhein.de http://dnt.kr.hs-niederrhein.de Webserver: http://dnt.kr.hs-niederrhein.de/dsv17/

Mehr

Maschinelle Sprachverarbeitung: N-Gramm-Modelle

Maschinelle Sprachverarbeitung: N-Gramm-Modelle HUMBOLD-UNIVERSIÄ ZU BERLIN Institut für Informatik Lehrstuhl Wissensmanagement Maschinelle Sprachverarbeitung: N-Gramm-Modelle obias Scheffer, Ulf Brefeld Statistische Sprachmodelle Welche Sätze sind

Mehr

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick Einführung in die Phonetik und Phonologie Allgemeiner Überblick Phonetik und Phonologie Die beiden Bezeichnungen Phonetik und Phonologie sind aus dem griechischen Wort ϕωνþ (phōnē) abgeleitet, welches

Mehr

Probe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013

Probe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013 Probe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013 Klausurnummer Name: Vorname: Matr.Nummer: Bachelor: Master: Aufgabe 1 2 3 4 5 6 7 8 max. Punkte 10 5 6 7 5 10 9 8 tats. Punkte

Mehr

1 Erkennung von Wortfolgen. 2 Bewertung von Wortfolgen. 3 Sprachmodelle in der Praxis. Erkennung von Wortfolgen

1 Erkennung von Wortfolgen. 2 Bewertung von Wortfolgen. 3 Sprachmodelle in der Praxis. Erkennung von Wortfolgen Automatisches Verstehen gesprochener Sprache. Sprachmodellierung Martin Hacker Bernd Ludwig Günther Görz Professur für Künstliche Intelligenz Department Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg

Mehr

Statistische Sprachmodelle

Statistische Sprachmodelle Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Statistische Sprachmodelle Tobias Scheffer Thomas Vanck Statistische Sprachmodelle Welche Sätze sind Elemente einer Sprache (durch

Mehr

Sprachdialogsystem mit robuster automatischer Spracherkennung

Sprachdialogsystem mit robuster automatischer Spracherkennung Sprachdialogsystem mit robuster automatischer Spracherkennung Hans-Günter Hirsch Hochschule Niederrhein Fachbereich Elektrotechnik und Informatik Digitale Nachrichtentechnik http://dnt.kr.hs-niederrhein.de

Mehr

RelAtive SpecTrAl (RASTA) Processing of Speech

RelAtive SpecTrAl (RASTA) Processing of Speech RelAtive SpecTrAl (RASTA) Processing of Speech Paul Glad Mihai 23.11.06 Gliederung Einleitung Wieso RASTA? RASTA erläutert Probleme Modulationsspektrum von Sprache Methode RASTA erweitert Lin-Log Rasta

Mehr

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch,

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch, Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Kontakt: ivana.bt.mk@gmail.com Betreff: EICL Wiederholung Aufgabe 1 Was ist Computerlinguistik? 4 Was ist Computerlinguistik?

Mehr

Sprachverstehen Summer term 2015 Friedrich-Alexander-Universität Erlangen-Nürnberg

Sprachverstehen Summer term 2015 Friedrich-Alexander-Universität Erlangen-Nürnberg Dies sind die in der Vorlesung Sprachverstehen Summer term 2015 Friedrich-Alexander-Universität Erlangen-Nürnberg verwendeten Folien. Sie sind ausschließlich für den persönlichen Gebrauch zur Prüfungsvorbereitung

Mehr

Schriftlicher Test Teilklausur 2

Schriftlicher Test Teilklausur 2 Technische Universität Berlin Fakultät IV Elektrotechnik und Informatik Künstliche Intelligenz: Grundlagen und Anwendungen Wintersemester 2011 / 2012 Albayrak, Fricke (AOT) Opper, Ruttor (KI) Schriftlicher

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Paul Prasse Michael Großhans

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Sprachtechnologie. Tobias Scheffer Paul Prasse Michael Großhans Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Sprachtechnologie Tobias Scheffer Paul Prasse Michael Großhans Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. 6 Leistungspunkte

Mehr

Erkennung und Erzeugung gesprochener Sprache

Erkennung und Erzeugung gesprochener Sprache Erkennung und Erzeugung gesprochener Sprache Sebastian Pado Einführung in die Computerlinguistik 2004/2005 1 Einführung Viele computerlinguistische Anwendungen gehen von textbasierter Ein/Ausgabe aus (I.a.)

Mehr

Statistische Verfahren in der Computerlinguistik

Statistische Verfahren in der Computerlinguistik Statistische Verfahren in der Computerlinguistik Zweiter Teil Einführung in die Computerlinguistik Sommersemester 2009 Übersicht Statistische vs. symbolische Verfahren in der CL Statistik beschreibende

Mehr

Komplexprüfung Angewandte Medienwissenschaft. Teil 1. Einführung in die Angewandte Informationstechnik. Name, Vorname:... Seminargruppe:...

Komplexprüfung Angewandte Medienwissenschaft. Teil 1. Einführung in die Angewandte Informationstechnik. Name, Vorname:... Seminargruppe:... Komplexprüfung Angewandte Medienwissenschaft Teil 1 Einführung in die Angewandte Informationstechnik Name, Vorname:... Seminargruppe:... Studiennummer:... Zusätzliche Blätter:... AUFGABE 1 2 3 4 5 maximal

Mehr

Maschinelle Kundenbetreuung: Sprachsysteme, Avatare und Co.

Maschinelle Kundenbetreuung: Sprachsysteme, Avatare und Co. Maschinelle Kundenbetreuung: Sprachsysteme, Avatare und Co. Diplomarbeit zur Erlangung des Grades eines Diplom-Ökonomen der Wirtschaftswissenschaftlichen Fakultät der Leibniz Universität Hannover vorgelegt

Mehr

Riedstadt-Goddelau Groß-Gerau-Dornberg Frankfurt

Riedstadt-Goddelau Groß-Gerau-Dornberg Frankfurt 114 Frankfurt = Zug der Linie RE 4.30 4.33 4.35 4.39 4.45 4.48 4.52 5.01 5.06 alle 30 Min 7.00 7.05 7.09 7.15 7.18 7.36 7.23 7.45 7.48 8.01 8.06 15.23 15.34 15.40 16.01 16.06 16.00 16.05 16.15 16.18 16.31

Mehr

Wie ein Rechner aus Schallwellen Wörter erkennt

Wie ein Rechner aus Schallwellen Wörter erkennt Wie ein Rechner aus Schallwellen Wörter erkennt Spracherkennung mit statistischen Verfahren Franz Kummert Christoph Schillo Gernot A. Fink Technische Fakultät Arbeitsgruppe Angewandte Informatik Eine natürliche

Mehr

Automatisches Verstehen gesprochener Sprache

Automatisches Verstehen gesprochener Sprache Automatisches Verstehen gesprochener Sprache 5. Sprachverstehen und Morphologie Martin Hacker Bernd Ludwig Günther Görz Professur für Künstliche Intelligenz Department Informatik Friedrich-Alexander-Universität

Mehr

Semester Dauer Art CP Studentische Arbeitsbelastung

Semester Dauer Art CP Studentische Arbeitsbelastung Wahlpflichtmodulgruppe P9: Spezialprobleme der Phonetik (27 CP) Von den unter P9 erfassten Wahlpflichtmodulen (jeweils 9 CP) müssen im Laufe des -Studiums drei mit unterschiedlicher Thematik belegt werden.

Mehr

Daten zur Person. 1 Welche Fremdsprachen beherrschen Sie? Bitte geben Sie an, wie gut Sie diese Sprachen sprechen (schreiben, lesen).

Daten zur Person. 1 Welche Fremdsprachen beherrschen Sie? Bitte geben Sie an, wie gut Sie diese Sprachen sprechen (schreiben, lesen). Daten zur Person 1 Welche Fremdsprachen beherrschen Sie? Bitte geben Sie an, wie gut Sie diese Sprachen sprechen (schreiben, lesen). 2 Berufsausbildung / Berufserfahrung 3 Haben Sie schon einmal an Deutsch

Mehr

Sprachverarbeitung I

Sprachverarbeitung I Institut für Technische Informatik und Kommunikationsnetze Eidgenössische Technische Hochschule Zürich Swiss Federal Institute of Technology Zurich Ecole polytechnique fédérale de Zurich Politecnico federale

Mehr

Schriftlicher Test Teilklausur 2

Schriftlicher Test Teilklausur 2 Technische Universität Berlin Fakultät IV Elektrotechnik und Informatik Künstliche Intelligenz: Grundlagen und Anwendungen Wintersemester 2009 / 2010 Albayrak, Fricke (AOT) Opper, Ruttor (KI) Schriftlicher

Mehr

Hidden Markov Modelle

Hidden Markov Modelle Hidden Markov Modelle (Vorabversion begleitend zur Vorlesung Spracherkennung und integrierte Dialogsysteme am Lehrstuhl Medieninformatik am Inst. f. Informatik der LMU München, Sommer 2005) Prof. Marcus

Mehr

Musterlösung zum Übungsblatt zur Vorlesung Biosignale und Benutzerschnittstellen

Musterlösung zum Übungsblatt zur Vorlesung Biosignale und Benutzerschnittstellen Musterlösung zum Übungsblatt zur Vorlesung Biosignale und Benutzerschnittstellen Aufgabe 1: Messtechnik a) Welche Aufgabe erfüllt in einer Messkette in der Biosignalverarbeitung ein Wandler? Ein Wandler

Mehr

Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation Wahrnehmung und Messung von Schall... 9

Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation Wahrnehmung und Messung von Schall... 9 Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation...1 1.1 Einführung in das Buch, das Sprecher Hörer Modell...1 1.2 Bemerkungen zu Fachbegriffen...5 2 Wahrnehmung und Messung von Schall...9 2.1

Mehr

Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen. Wie verstehen Computer natürliche Sprachen?

Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen. Wie verstehen Computer natürliche Sprachen? Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen Wie verstehen Computer natürliche Sprachen? LVA Leiter: Elizabeta Jenko Wilfried Grossmann erstellt von Egbert Althammer 9031924

Mehr

Computerlinguistik und Sprachtechnologie

Computerlinguistik und Sprachtechnologie Computerlinguistik und Sprachtechnologie Eine Einführung Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde und Hagen Langer Spektrum Akademischer Verlag

Mehr

Erkennung und Erzeugung gesprochener Sprache

Erkennung und Erzeugung gesprochener Sprache Erkennung und Erzeugung gesprochener Sprache 8.11.2005 Sebastian Pado Einführung in die Computerlinguistik 2005/2006 M. Pinkal / S. Pado UdS 1 Einführung Viele computerlinguistische Anwendungen gehen von

Mehr

Aufgabe 1 Probabilistische Inferenz

Aufgabe 1 Probabilistische Inferenz Seite 1 von 8 Aufgabe 1 Probabilistische Inferenz (28 Punkte) Die BVG will besser auf Ausfälle im S-Bahn-Verkehr eingestellt sein. Sie geht dabei von folgenden Annahmen aus: An 20% der Tage ist es besonders

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Tobias Scheffer, Tom Vanck, Paul Prasse

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Tobias Scheffer, Tom Vanck, Paul Prasse Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Sprachtechnologie Tobias Scheffer, Tom Vanck, Paul Prasse Organisation Vorlesung/Übung, praktische Informatik. 4 SWS. Termin: Montags,

Mehr

Inhaltsverzeichnis 1 Einführung Überblick Einordnung in das Gebiet der Sprachverarbeitung Nu

Inhaltsverzeichnis 1 Einführung Überblick Einordnung in das Gebiet der Sprachverarbeitung Nu Multimodale Eingabe: Verarbeitung gesprochener Sprache Alexander Denecke 24.11.2003 Eine Ausarbeitung zum Seminar Multimodale Mensch-Maschine-Kommunikation der Veranstalter Bernard Jung und Alf Kranstedt.

Mehr

Einführung in die Computerlinguistik D IALOGSYSTEME WS 2009/2010. Bojan Georgievski Prashanna Thangeswaran David Höfig

Einführung in die Computerlinguistik D IALOGSYSTEME WS 2009/2010. Bojan Georgievski Prashanna Thangeswaran David Höfig Einführung in die Computerlinguistik D IALOGSYSTEME WS 2009/2010 Bojan Georgievski Prashanna Thangeswaran David Höfig Einführung Was sind Dialogsysteme? Beispiele von Dialogsystemen Wo werden Dialogsysteme

Mehr

Sprachproduktion- und Sprachperzeption. Jonathan Harrington

Sprachproduktion- und Sprachperzeption. Jonathan Harrington Sprachproduktion- und Sprachperzeption Jonathan Harrington Die Variabilität 1. Die Variabilität: warum entsteht Variabilität in der gesprochenen Sprache? 2. Wie entschlüsseln Hörer die intendierten Laute

Mehr

Seminar Künstliche Intelligenz Wintersemester 2013/14

Seminar Künstliche Intelligenz Wintersemester 2013/14 Seminar Künstliche Intelligenz Wintersemester 2013/14 Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 31.10.2013 2 / 13 Überblick Teilgebiete der KI Problemlösen,

Mehr

8 Fakultät für Philologie

8 Fakultät für Philologie 8 Fakultät für Philologie 8.1 Linguistik 8.1.1 Linguistik, PO 2004 Fach Linguistik (101) Abschluss 2-Fach Bachelor (81) PO-Version 2004 Folgendes ist zurzeit in HISPOS eingerichtet: Modul-Typen: o Nachgewiesene

Mehr

Suche. Sebastian Stüker

Suche. Sebastian Stüker Institut für Anthropomatik Suche Sebastian Stüker 11.01.2010 Interactive Systems Labs X.Huang/Acero/Hon, Spoken Language Processing : Kapitel 12,13 Konferenzartikel: Hagen Soltau, Florian Metze, Christian

Mehr

HMM-Synthese (Grundzüge)

HMM-Synthese (Grundzüge) (Grundzüge) Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München reichelu@phonetik.uni-muenchen.de 6. Dezember 2010 Inhalt HMM-Grundlagen HMM und Phonemerkennung HMM-Grundlagen

Mehr

Bayes sche Klassifikatoren. Uwe Reichel IPS, LMU München 16. Juli 2008

Bayes sche Klassifikatoren. Uwe Reichel IPS, LMU München 16. Juli 2008 Bayes sche Klassifikatoren Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de 16. Juli 2008 Inhalt Einleitung Grundlagen der Wahrscheinlichkeitsrechnung Noisy-Channel-Modell Bayes sche Klassifikation

Mehr

Hidden Markov Models in Anwendungen

Hidden Markov Models in Anwendungen Hidden Markov Models in Anwendungen Dr. Vera Demberg Universität des Saarlandes 31. Mai 2012 Vera Demberg (UdS) HMM Anwendungen 31. Mai 2012 1 / 26 Hidden Markov Modelle in der Computerlinguistik Table

Mehr

Sinneswahrnehmungen des Menschen

Sinneswahrnehmungen des Menschen Sinneswahrnehmungen des Menschen Tastsinn Gleichgewicht Geruch Sehen Gehör Sprache Aktion Multimedia - Kanäle des Menschen Techniken für Medien im Wandel Multimediale Kommunikation Text : Bücher, Zeitschriften

Mehr

Phonetische Beiträge zur maschinellen Spracherkennung. ExInTra. "Extrem wertintervallgestützte Transkription",

Phonetische Beiträge zur maschinellen Spracherkennung. ExInTra. Extrem wertintervallgestützte Transkription, LDV-Forum - Bd. 6, Nr. 2, Jg. 1989, S. 19-27 Phonetische Beiträge zur maschinellen Spracherkennung ExInTra Extremwertintervallgestützte Transkription Klaus Günther Schweisthal, Patrick Schweisthal Thomas

Mehr

Digitale Signalverarbeitung, Vorlesung 10 - Diskrete Fouriertransformation

Digitale Signalverarbeitung, Vorlesung 10 - Diskrete Fouriertransformation Digitale Signalverarbeitung, Vorlesung 10 - Diskrete Fouriertransformation 23. Januar 2017 Siehe Skript Digitale Signalverarbeitung, Abschnitte 10.1 und 11, Kammeyer & Kroschel (7.1-7.3) eues Thema in

Mehr

Dokumentation gesprochener Sprache. Wortsegmentierung. Dr. Tina John

Dokumentation gesprochener Sprache. Wortsegmentierung. Dr. Tina John Dokumentation gesprochener Sprache Wortsegmentierung Inhalt rechnergestützte Transkription Umgang mit dem Programm praat Segmentieren und Etikettieren Erkennen von Lautklassen anhand der Akustik der Laute

Mehr

Aufgabe 1 Probabilistische Inferenz

Aufgabe 1 Probabilistische Inferenz Seite 1 von 8 Aufgabe 1 Probabilistische Inferenz (32 Punkte) In einer medizinischen Studie werden zwei Tests zur Diagnose von Leberschäden verglichen. Dabei wurde folgendes festgestellt: Test 1 erkennt

Mehr

6. Semester 7. Semester Konto Hispos. gemäß 11 Absatz 1 Satz 4 u. 5 PO: M = (PL1 + PL2) / 2 M1209-1I250 2/0/0. PL2 Laborpraktikum Sprachsynthese

6. Semester 7. Semester Konto Hispos. gemäß 11 Absatz 1 Satz 4 u. 5 PO: M = (PL1 + PL2) / 2 M1209-1I250 2/0/0. PL2 Laborpraktikum Sprachsynthese Seite 1/6 detaillierter Studienablaufplan Studiengang Informationssystemtechnik, Fachgebiet Kommunikationstechnik (DPO 2014), Hilfsmittel zur Planung Stand: 31.06.2018 4/0/2 1PL 8500 M = PL1 oder ET-12

Mehr

Kapitel 2: Spracherkennung Automatisches Verstehen gesprochener Sprache

Kapitel 2: Spracherkennung Automatisches Verstehen gesprochener Sprache Automatisches Verstehen gesprochener Sprache. Spracherkennung Martin Hacker Bernd Ludwig Günther Görz Professur für Künstliche Intelligenz Department Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg

Mehr

Vorlesung: Künstliche Intelligenz

Vorlesung: Künstliche Intelligenz Vorlesung: Künstliche Intelligenz - KI heute, KI morgen, KI übermorgen- D P LS G ML ES S ST SA NN ME O EA SV Künstliche Intelligenz Miao Wang 1 Inhaltliche Planung für die Vorlesung 1) Definition und Geschichte

Mehr

Automatische Spracherkennung

Automatische Spracherkennung Automatische Spracherkennung 2 Grundlagen: Mustererkennung Soweit vorhanden ist der jeweils englische Fachbegriff, so wie er in der Fachliteratur verwendet wird, in Klammern angegeben. Beispiele von Computerkommandos

Mehr

Hidden Markov Models in Anwendungen

Hidden Markov Models in Anwendungen Hidden Markov Models in Anwendungen Prof Dr. Matthew Crocker Universität des Saarlandes 18. Juni 2015 Matthew Crocker (UdS) HMM Anwendungen 18. Juni 2015 1 / 26 Hidden Markov Modelle in der Computerlinguistik

Mehr

Was ist Statistik? Wozu dienen statistische Methoden?

Was ist Statistik? Wozu dienen statistische Methoden? 25. APRIL 2002: BLATT 1 Übersicht Was ist Statistik? Wozu dienen statistische Methoden? Was ist maschinelle Sprachverarbeitung? Welche Rolle spielen statistische Methoden in verschiedenen Teilbereichen

Mehr

Maschinelles Lernen I Einführung. Uwe Reichel IPS, LMU München 22. April 2008

Maschinelles Lernen I Einführung. Uwe Reichel IPS, LMU München 22. April 2008 Maschinelles Lernen I Einführung Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de 22. April 2008 Inhalt Einführung Lernen Maschinelle Lernverfahren im Überblick Phonetische Anwendungsbeispiele

Mehr

Sprachverständlichkeit. Dipl.-Ing. Markus Bertram

Sprachverständlichkeit. Dipl.-Ing. Markus Bertram Sprachverständlichkeit Dipl.-Ing. Markus Bertram Fragen: Welche Faktoren beeinflussen die Sprachverständlichkeit? Wer ist verantwortlich für eine hohe Sprachverständlichkeit? Wie können wir die Sprachverständlichkeit

Mehr

Jürgen Leichsenring. Technische Akustik

Jürgen Leichsenring. Technische Akustik Jürgen Leichsenring Technische Akustik 0)N о Е II Wissenschaftsverlag, Aachen Inhaltverzeichnis 1 Mechanische Ersatzschaltungen 1 1.1 Bewegungsgrößen, Kraft, Schnelle, mechanische Impedanz 1 1.2 Der mechanische

Mehr

Sprachsynthese mit Mary. Simon Schmiedel Proseminar Tools für Computerlinguisten

Sprachsynthese mit Mary. Simon Schmiedel Proseminar Tools für Computerlinguisten Sprachsynthese mit Mary Proseminar Tools für Computerlinguisten Was ist Sprachsynthese? künstliche Erzeugung der menschlichen Sprache 2 Sprachsynthese Symbolische Repräsentation Sprachsynthese Akustische

Mehr

Phonetik. Phonologie

Phonetik. Phonologie Universität Bielefeld Fakultät für Linguistik und Literaturwissenschaft Phonetik k Phonologie christian.ebert@uni-bielefeld.de Organisatorisches Vorlesung mittwochs, 18-20 Uhr, Hörsaal 15 christian.ebert@uni-bielefeld.de

Mehr

Sprachbasierte Informationssysteme

Sprachbasierte Informationssysteme Sprachbasierte Informationssysteme Gunar Fiedler Arbeitsgruppe Technologie der Informationssysteme CAU Kiel WWW: http://www.is.informatik.uni-kiel.de/~fiedler E-Mail: fiedler@is.informatik.uni-kiel.de

Mehr

Sprachverständnis, Folie 1. Sprachverständnis

Sprachverständnis, Folie 1. Sprachverständnis Sprachverständnis, Folie 1 Sprachverständnis Indem wir Wörter und Sätze äussern, teilen wir etwas von unserer Welt mit. Indem wir Wörter und Sätze verstehen, nehmen wir ein Stück Aussenwelt zu uns. Susanne

Mehr

! Die Idee Kombination von Informatik und einem anderen Fach

! Die Idee Kombination von Informatik und einem anderen Fach Computerlinguistik Integriertes Anwendungsfach im B.Sc.Studiengang Department Informatik / Universität Hamburg! Wie funktioniert das integrierte Anwendungsfach Computerlinguistik (organisatorisch)?! Beziehungen

Mehr

Artikulatorische distinktive Merkmale der Konsonanten im Deutschen

Artikulatorische distinktive Merkmale der Konsonanten im Deutschen Referentinnen Ania Lamkiewicz Eva Mujdricza Computerlinguistik 1. FS Computerlinguistik 1. FS Romanistik 2. FS DaF Sprachwissenschaft 1. FS e-mail: al_smile@web.de e-mail: mujdricza@web.de Artikulatorische

Mehr

Inhaltsverzeichnis 1 Einleitung Mensch-Maschine-Kommunikation in der Informations- und Kommunikationstechnik Grundbegriffe der Mensch-M

Inhaltsverzeichnis 1 Einleitung Mensch-Maschine-Kommunikation in der Informations- und Kommunikationstechnik Grundbegriffe der Mensch-M 1 Einleitung 1 1.1 Mensch-Maschine-Kommunikation in der Informations- und Kommunikationstechnik... 1 1.2 Grundbegriffe der Mensch-Maschine-Kommunikation... 2 1.3 Disziplinen der Mensch-Maschine-Kommunikation...

Mehr

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko Interdisziplinäre fachdidaktische Übung: Sprache und Modelle SS 2015: Grossmann, Jenko Einleitung Was ist ein Modell? Sprachlich orientierte Modelle Beispiele Wie entstehen Modelle? Zusammenhang Modell

Mehr

Einführung in die automatische Spracherkennung

Einführung in die automatische Spracherkennung Einführung in die automatische Spracherkennung Klausur 30.07.2008 Name:... Vorname:... Matr.-Nr:... Studiengang:... Hinweise: 1. Schreiben Sie bitte auf jedes Zusatz-Blatt Ihren Namen und Ihre Matrikelnummer.

Mehr

>> Die Mathematik hinter den Tönen >>

>> Die Mathematik hinter den Tönen >> Embedded System Technologies >> Die Mathematik hinter den Tönen >> Fuldaer Brückenkurs Mathematik Sebastian Wendt Schallwandlung Schall, Töne, Musik => Luftdruckänderungen Ein Mikrofon wandelt Luftdruckänderungen

Mehr

3/1/2 1PL M = PL

3/1/2 1PL M = PL Seite 1/14 detaillierter Studienablaufplan Wahlpflichtmodule Elektrotechnik, Studienrichtung Informationstechnologie (DPO 2013), Hilfsmittel zur Planung Stand: 22.03.2018 Abkürzung Profile: ST Schaltungstechnik,

Mehr

Schriftlicher Test Teilklausur 2

Schriftlicher Test Teilklausur 2 Technische Universität Berlin Fakultät IV Elektrotechnik und Informatik Künstliche Intelligenz: Grundlagen und Anwendungen Wintersemester 2010 / 2011 Albayrak, Fricke (AOT) Opper, Ruttor (KI) Schriftlicher

Mehr

Masterstudiengang Sprache und Kommunikation: Angewandte Kommunikations- und Sprachwissenschaft

Masterstudiengang Sprache und Kommunikation: Angewandte Kommunikations- und Sprachwissenschaft Masterstudiengang Sprache und Kommunikation: Angewandte Kommunikations- und Sprachwissenschaft Markus Brückl Fachgebiet Kommunikationswissenschaft Master-Einführung Angewandte Kommunikations- und Sprachwissenschaft

Mehr

Potentiale der Digitalisierung Herausforderungen gestalten. Prof. Dr. Christoph Meinel Dekan, Institutsdirektor und CEO Hasso-Plattner-Institut

Potentiale der Digitalisierung Herausforderungen gestalten. Prof. Dr. Christoph Meinel Dekan, Institutsdirektor und CEO Hasso-Plattner-Institut Herausforderungen gestalten Prof. Dr. Christoph Meinel Dekan, Institutsdirektor und CEO Hasso-Plattner-Institut Herzlich Willkommen zur skonferenz Brandenburg 2018! Die Digitale Transformation ist, nach

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus

Mehr