Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen. Wie verstehen Computer natürliche Sprachen?

Ähnliche Dokumente
Spracherkennung. Gliederung:

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch,

Computerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Grundlagen und Definitionen

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko

Sprachverstehen. Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller

Spracherkennung und Sprachsynthese

Sprachproduktion. Psycholinguistik (7/11; HS 2010/2011 Vilnius, den 26. Oktober 2010

Betriebswirtschaftliche Evaluation von Spracherkennungssystemen

Anwendung Rechnernetze Thema: Spracheingabe. Michael Pöhnert Matrikel: INF04 Kennnummer: 12538

Einführung in die Computerlinguistik: Gesprochene Sprache. Dr. Marc Schröder, DFKI

INTELLIGENTE DATENANALYSE IN MATLAB

Einführung und Anwendungen. Sebastian Stüker

Maschinelle Kundenbetreuung: Sprachsysteme, Avatare und Co.

Wie ein Rechner aus Schallwellen Wörter erkennt

Interdisziplinäre fachdidaktische Übung: Formale Sprache Definitionen, Funktionen

Geschichte der Psycholinguistik

Sprachbasierte Informationssysteme

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis

Erkennung und Erzeugung gesprochener Sprache

Administratives. Beat Siebenhaar

2 Sprachliche Einheiten

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation:

Einführung in die Computerlinguistik D IALOGSYSTEME WS 2009/2010. Bojan Georgievski Prashanna Thangeswaran David Höfig

Einführung in die germanistische Linguistik

Übung zur Einführung in die Computerlinguistik. Wiebke Petersen WiSe 04/05

Internetcafé 55plus-Südwerk. Spracherkennung Diktat-App s

Kommunikation mit gesprochener Sprache...

Kontrastive Linguistik und Lexikographie XII

Grundlagen der Textlinguistik

Studienprojekt TaxoSearch Spezifikation

AVWS Diagnostik aus sprachtherapeutischer Sicht

Designing Haptic. Computer Interfaces for blind people

Sprachlehr- & Sprachlernsysteme

V1/2.S Sprachwissenschaft

Situation-Adaptive Multimodal Dialogue Platform. Übersicht

Automatisches Verstehen gesprochener Sprache

Spracherkennung und synthese

Artikulatorische distinktive Merkmale der Konsonanten im Deutschen

Information und Produktion. Rolland Brunec Seminar Wissen

Technische Unterstützungsmöglichkeiten bei Legasthenie. Vortrag am

Sprachsteuerung für einen ROS-basierten Assistenzroboter

Text Mining und Textzusammenfassung. Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer

Sprache beginnt ohne Worte. Vorsprachliche Entwicklung und die Bedeutung der frühen Elternarbeit

Einführung in die Computerlinguistik

Sprachsynthese - ein Überblick

Proseminar, wozu? Proseminar, wozu? Proseminar, wozu? Verarbeitung gesprochener Sprache

Virtuelle Präsenz Ein-/Ausgabegeräte 1 / 37

BARRIEREFREIHEIT INKLUSIVE CHRIS HEILMANN A-TAG, WIEN, SEPTEMBER 2016

Erkennung menschlicher Aktionen durch Inferenz stochastischer regulärer Grammatiken

Sprachtechnologie als Grundlage für die maschinelle Auswertung von Texten

Datum Kurs Beschreibung Mo. 09. Jan. Smartphone Kommunikation und Spielspaß

Mille feuilles Information für Eltern

Überblick. Gebärdenerkennung. Was ist Gebärdenerkennung? Warum ist es so schwierig? Modellierung der Sprache und Simultaneität

Fachübergreifende Projekte Informatik und Deutsch

Was gehört zu einer erfolgreichen Seminarteilnahme?

Einführung in die Problematik der Sprachein- und -ausgabe

Spracherkennung. Frisbee Digitales Diktieren Spracherkennung Workflow. Speech. The Voice of Business

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick


Skillstraining- Reasoning & Rehabilitation 2 (R&R 2)

Web Engineering-Seminar Methoden zur Web Modellierung: Object-oriented Hypermedia Method (OO-H)

Phonetische Beiträge zur maschinellen Spracherkennung. ExInTra. "Extrem wertintervallgestützte Transkription",

Künstliche Neuronale Netze

Februar 06 Uni Basel Seminar Künstliche Intelligenz Stefan Pauwels Emotion Recognition :-)

Syntaktische Ambiguität

Linguistische Informatik Einführung

ABP Wo steckt der Fehler in der SQL-Anfrage? Semantische Prüfung von Lösungen Prof. Dr. Inga Marina Saatz

Vernetzte Smart Labels

Übung Automatische Spracherkennung

Fachtagung. Mobile. CMS. Ausgabekanäle. Trends. Responsive Design. Namics. Johannes Waibel. Senior Consultant.

Was kann ich sagen? Dr. med. Markus Vogel Nuance Communications Healthcare International

Hidden Markov Models in Anwendungen

Was ist Statistik? Wozu dienen statistische Methoden?

Universität Ulm Abteilung Künstliche Intelligenz. ExtrAns. Verarbeitung natürlicher, schriftlicher Sprache. C. Bohnacker

HMI. Die Zukunft hat begonnen

Das Hypertext-Konzept in der Lexikographie

DI Dieter W. Ehrenstorfer. Dieter W. Ehrenstorfer, FI Mag. Günther Schwarz. Computergesteuerte Gegenstände des Alltages und existierende Eingabegeräte

Programmierpraktikum WS 13/14

Companion Technologie

Proseminar Linguistische Annotation

Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität

Migration und Emulation Angewandte Magie?

Erinnern Sie sich, wie Ihr Kind seine erste Sprache gelernt hat?

Speech Recognition Grammar Compilation in Grammatikal Framework. von Michael Heber

IT-Security Sicher im Internet bewegen

Optimierung einer technischen Beschreibung. Martin Witzel und Peter Buck

Fritz: Die Bedeutung von Fachwissen für das Simultandolmetschen

Wortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank

Fragebogen zur Diplomarbeit von Thomas Friedrich

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik

Schallpegel Sporthalle

Name: Matr.-Nr. Bitte beachten Sie: 1. Nennen Sie eine sinnvolle deutsche Übersetzung des englischen Begriffs Usability.

1.1 Was ist KI? 1.1 Was ist KI? Grundlagen der Künstlichen Intelligenz. 1.2 Menschlich handeln. 1.3 Menschlich denken. 1.

Praktische Informatik I

ANHÖRUNG ZUR AUSWAHL DES VORMUNDS IM JUGENDAMT UND ERSTER KONTAKT AG 10 FRIEDHELM GÜTHOFF DKSB LV NRW MEIN FOKUS

Kapitel 2: Spracherkennung Automatisches Verstehen gesprochener Sprache

Kapitel 1: Informationsverarbeitung durch Programme

Ihr Computer gehorcht auf s Wort

Transkript:

Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen Wie verstehen Computer natürliche Sprachen? LVA Leiter: Elizabeta Jenko Wilfried Grossmann erstellt von Egbert Althammer 9031924 Herbert Schindelka 8526917

Intention und Zielgruppe (fachdidaktische Sicht) Überblick über das Thema Neugierig machen auf das Thema Motivation zum Thema zu schaffen Zielgruppe BHS 4. Klasse (Informatik) AHS 7. Klasse (Wahlpflichtfach Informatik) Anregung für VWA bzw. Diplomarbeit

Agenda Grundsätzliche Überlegungen Anatomie, Physik und Informatik Saarbrückener Pipeline Modell Problemstellungen Natürliche Sprache vs. künstliche Sprache Spracherkennung vs. Stimmerkennung Anwendungen

Grundüberlegungen zu verstehen und natürliche Sprache Schulz von Thun Kommunikation ist nicht das, was A sagt sondern B versteht (n. Watzlawik)

Wie verstehen Computer natürliche Sprache? Was heißt verstehen? Klare Intention des Users Klare Vorstellung von dem was der Computer tun soll Technische Schnittstelle befehlsorientiert und/oder Freier Text

Techn. Schnittstelle Techn. Schnittstelle Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen (UE) Warum möchten wir (eigentlich), dass uns der Computer versteht? Input Computer/ Verarbeitung Output

Techn. Interface Techn. Schnittstelle Video Mikrophon Sprachsynthese Techn. Schnittstelle Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen (UE) Warum möchten wir (eigentlich), dass uns der Computer versteht? Sprachaufzeichnung Spracherkennung Sprachsteuerung Stimmerkennung Videoaufzeichnung Mimik Gestik (Gebärden) Lippenlesen Eye-Tracking Maus, Joystick Tastatur Steuerung über Gedanken

Fokus für heute Gesprochene Sprache - Speech (vs. Language) Andere Referate

Zur Anatomie, Physik und Informatik

Techn. Umsetzung Signal aufbereitung (Filterung) Umweltgeräusche Rauschen Lautstärke (Sprecher-)Training Aussprachewörterbücher Eigentl. Signalanalyse Mustererkennung Sprachsynthese Phonem: kleinste lautliche Einheit auf der Ebene des Sprachsystems, die selbst keine sprachliche Bedeutung trägt, sondern nur bedeutungsunterscheidend ist Wörterbücher Phoneme Silben/Wörter

Wissenschaftlicher Ansatz Disziplin: Computerlinguistik Saarbrücker Pipeline Modell Spracherkennung: Schall in Phoneme Tokenisierung : Die Buchstabenkette wird in Wörter, Sätze etc. segmentiert. Morphologische Analyse: Personalformen oder Fallmarkierungen werden analysiert, um die grammatische Information zu extrahieren und die Wörter im Text auf Grundformen zurückzuführen, wie sie z. B. im Lexikon stehen. Syntaktische Analyse Die Wörter jedes Satzes werden auf ihre strukturelle Funktion im Satz hin analysiert (z. B. Subjekt, Objekt, Modifikator, Artikel, etc.). Semantische Analyse: Den Sätzen bzw. ihren Teilen wird Bedeutung zugeordnet. Dieser Schritt umfasst potentiell eine Vielzahl verschiedener Einzelschritte, da Bedeutung schwer fassbar ist. Dialog- und Diskursanalyse: Die Beziehungen zwischen aufeinander folgenden Sätzen werden erkannt

Warum ist Spracherkennung schwierig? Gewählte Sprache an sich Variabilität o Signalqualität o Phonetisch: Unterschiedliche Aussprache (verschiedene Sprecher, Dialekte, Ansprache, Plauderei, W/M/Kind, ) o Linguistisch: Homonym, Homophon (Ferse vs. Verse) Computer besitzt kein Weltwissen Pragmatisches Wissen was kann jetzt überhaupt gesagt werden Keine multimodale Erfassung (vgl. aber Mensch Experiment McGurk) Segmentierung (Buchstaben, Wörter, Sätze, ) Spontane Wörter Abgebrochene Wörter, Ähhh, Mmmhhh Unbekannte Wörter Erkennen von Emotionen, Erkennen von Witz, Satire

Vor- und Nachteile Vorteile: Hände und Augen frei Natürliche Eingabe Bedienung durch Laien Hohe Bandbreite 1000-4000 Zeichen pro Minute (Tatstatur 200 1000) Nachteile: Akustische Umgebung Mehrere Sprecher gleichzeitig Störgeräusche Technik / Mikrophone Bedienung durch Laien Ungenügende Erkennungsleistung Qualität wird besser Fehlerbehandlung mit einplanen

Taxonomie von Sprachen Einzelne Kommandos Künstliche Sprachen Natürliche Sprachen

Stimmerkennung Interdisziplinäre Fachdidaktik: Natürliche Sprachen und Formale Sprachen (UE) Spracherkennung vs. Stimmerkennung Wortschatz Bessere Verfahren Bessere Datenbasis Höhere Rechnerleistung Spracherkennung schematische Darstellung Anzahl der Sprecher

Anwendungen (1) Hilfsmittel für Behinderte Mensch-Maschine-Schnittstelle Vorlesegeräte für Blinde Spracherkennung Fernsehen für Hörgeschädigte Diktiersysteme Call-Center-Anwendungen (z.b. Verkauf von Kinokarten) Auskunftssysteme (z.b. Fahrplanauskunft) E-Commerce Geschäfte über Mobil-Telefone Sprachsynthese Je nach Komplexität der Interaktion Maschinelle Übersetzung geschriebener und gesprochener Sprache Unterstützung von Human-Übersetzern Domänenspezifische Übersetzungen Stimmerkennung in Kriminologie und Forensik Quelle: https://hpsg.fu-berlin.de/~stefan/ps/cl-slides.pdf

Anwendungen (2) Unterstützung bei der Textverarbeitung (z.b. automatische Korrektur von Tipp- und Rechtschreibfehlern, Prüfung auf grammatische Richtigkeit) Unterstützung von Autoren beim Verfassen von Texten (z.b. Finden des treffenden Ausdrucks oder der richtigen Terminologie, etwa bei der Verwendung eines kontrollierten Vokabulars in der technischen Dokumentation) Sprachsteuerung technischer Geräte oder Computer Automatisierte Messung von persönlichen Stärken anhand natürlicher Gespräche wie offene Interviews, Bewerbungsgespräche, Talkshows, Podiumsdiskussionen oder Gruppendiskussionen Quelle: https://de.wikipedia.org/wiki/computerlinguistik

Software (1) Große Auswahl an kostenpflichtiger sowie gebührenfreier Spracherkennungssoftware (z.b. Dragon Professional, Testsieger 2016 laut www.netzsieger.de) Kaum Unterschiede bei der Qualität der Spracherkennung Lernfähig erfordert intensives Training Wichtig für hohe Erkennungsrate: Akzentfreies Sprechen des Users Leistungsfähiger PC Gutes Headset/Mikrofon Unterschiede in den Zusatzfeatures Quelle: https://www.netzsieger.de/k/spracherkennungssoftware

Software (2) Siri (ios 9): Verwendung nur online möglich Werbung : https://www.apple.com/de/ios/siri Cortana (Windows 10) In deutscher Sprache, aber nicht mit Ländereinstellung Österreich verfügbar http://windows.microsoft.com/de-de/windows-10/getstartedwhat-is-cortana

Links Sprachsignale http://culturmag.de/litmag/siri-ously-neues-aus-dercomputerlinguistik/55432 Wenn Computer Emotionen verstehen lernen http://www.welt.de/wirtschaft/webwelt/article3905112/wen n-computer-emotionen-verstehen-lernen.html McGurk - Effekt https://www.youtube.com/watch?v=jtsfidrq2tw

Danke für die Aufmerksamkeit Fragen?