Diplomarbeit. Diplom-Informatiker (FH)

Größe: px
Ab Seite anzeigen:

Download "Diplomarbeit. Diplom-Informatiker (FH)"

Transkript

1 Diplomarbeit zur Erlangung des akademischen Grades Diplom-Informatiker (FH) an der Fachhochschule Brandenburg Fachbereich Informatik und Medien Thema: Design und Implementierung eines Grammatikprozessors für einen W3C standardkonformen VoiceXML 2.0 Interpreter Diplomand: Christoph Bünte, Leipziger Strasse 65, Berlin Betreuer: Prof. Dr.-Ing. Thomas Preuß Dipl.-Ing. (FH) Barbara Link Eingereicht: 10. Oktober 2005

2 Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt. (Ludwig Josef Johann Wittgenstein)

3 Inhaltsverzeichnis 1. Einleitung 1 2. Vom Text zur Sprache Morpho-syntaktische Analyse Präprozessor Textsegmentierung Satzerkennung Abkürzungen Akronyme Zahlen Idiome Morphologische Analyse Funktionsworte Inhaltsworte Kontext Analyse N-Gramme Künstliche, neuronale Netze Regelbasierte Expertensysteme Zusammenfassung Spracherzeugung Formanterzeugung Natürliche Implementierung Technische Implementierung Regelbasierte Lautbildung Qualität Vorbereitung Wichtige Beispiele Artikulatorisch Konkatenativ Zusammenfassung Von der Sprache zum Text Modelle der Spracherkennung Sprecherabhängig Sprecherunabhängig Diskrete Aussprache Kontinuierliche Aussprache Zusammenfassung Aufbau i

4 Inhaltsverzeichnis Digitalisierung Abtastung Quantisierung Vorverarbeitung Präemphase Spektrale Subtraktion Wiener Filter Spektralanalyse Autokorrelation Kurzzeitspektrum Signalfensterung Merkmalextraktion Wahrnehmung von Frequenzen Wahrnehmung von Lautstärke Spracherkennung Dynamic Time Warping Hidden Markov Model Zusammenfassung Dialogsysteme Aufbau VoiceXML Architektur Ziele Einsatzbereich Kommerzielle Interpreter Freie Interpreter Andere Vertreter Zusammenfassung Grammatiken Chomsky Hierarchie Typ Typ Typ Typ BNF SRGS JSGF Zusammenfassung Konzept Anforderungsdefinition VoiceXML Sprachgrammatiken Integrierte Grammatiken Externe Grammatiken ii

5 Inhaltsverzeichnis DTMF Scope Aktivierung Grammatikgenerierung SRGS Grammatikprozessor Regeldefinition Regelexpansion JVoiceXML JSAPI JSGF Gegenüberstellung Transformation Generierung Geltungsbereich Standardkonformität Zusammenfassung Architektur Verarbeitung Identifizierung Transformation Zusammenfassung Implementierung und Test Entwicklungsumgebung Eingliederung ins Projekt Tests Implementierung Identifizierung Transformation Aktivierung Bibliotheken Checkstyle JUnit Log4J JSAPI FreeTTS Sphinx Herausforderungen Kommunikation Abhängigkeiten Zusammenfassung Zusammenfassung 82 Abbildungsverzeichnis 85 iii

6 Inhaltsverzeichnis Quellcodeverzeichnis 86 Literaturverzeichnis 87 Glossar 90 Stichwortverzeichnis 91 Akronymverzeichnis 92 iv

7 1. Einleitung Seit tausenden Jahren ist die gesprochene Sprache das wichtigste Kommunikationsmittel der gesamten Menschheit. Mit ihrer Hilfe wurden Sitten und Bräuche von einer Generation an die Nächste weiter gegeben. Und obwohl die Menschheit im Laufe ihrer Geschichte andere, effizientere Arten der Informationsübermittlung erfunden hat, bleibt die Sprache dennoch die Natürlichste. Lange Zeit ließen sich die sprachlich übermittelten Informationen nicht speichern. Doch begannen die Menschen wichtige Informationen für die Nachwelt in Form von Wandmalereien oder Kerbungen in Bäumen aufzubewahren. Durch die Erfindung geschriebener Sprache konnte Wissen in komprimierter Form für lange Zeit aufbewahrt werden. Mit der Erfindung des Buchdruckes war es erstmals möglich, geschriebene Sprache in großen Mengen zu verbreiten und das enthaltene Wissen an viele Menschen weiterzugeben. Selbst im digitalen Zeitalter hat die gesprochene Sprache nicht an Bedeutung verloren. Auch wenn in Freizeit und Beruf ein nicht unerheblicher Teil der zwischenmenschlichen Kommunikation mit Hilfe elektronischer Systeme erledigt wird, ist ein persönliches Gespräch nicht zu ersetzen. Die gesprochene Sprache zur Kommunikation mit den immer stärker verbreiteten elektronischen Geräten wie Computer oder Mobiltelefonen ist allerdings noch nahezu bedeutungslos. Viele Menschen, besonders Ältere, beschweren sich über die komplizierte Bedienung ihres Mobiltelefons, Videorekorders oder Computers. Könnte die Steuerung elektronischer Geräte mit Hilfe gesprochener Sprache nicht zuletzt auch der Benutzerfreundlichkeit zu Gute kommen? Die Idee der künstlichen Erzeugung menschlicher Sprache ist unter anderem bei den antiken Griechen entstanden. Sie ließen riesige menschliche Steinköpfe sprechen, indem sie in deren Schlund einen Schlauch anbrachten, durch den ein nicht sichtbarer Priester zu den Gläubigen sprach, um das gemeine Volk unter Kontrolle zu halten. [Fla72, S.166] Die ersten ernsthaften Versuche, menschliche Laute maschinell zu erzeugen, wurden in der zweiten Hälfte des 18. Jahrhunderts unternommen. Ch. G. Kratzen- 1

8 Einleitung stein, Professor der Physiologie in Kopenhagen, gelang es im Jahr 1773 mit an Orgelpfeifen angebrachten Resonanzröhren Vokale hervorzubringen. [Fla72, S.166] Zur gleichen Zeit forschte Wolfgang von Kempelen an einer Maschine, die die menschliche Lauterzeugung simulieren konnte. Diese Maschine war in der Lage, Vokale und Konsonanten aber auch nasale Laute zu produzieren. [Fla72, S.166ff.] Von Kempelen veröffentlichte die Baupläne dieser Maschine in seinem Buch [vk91], um andere zum Nachbau und zur Verbesserung dieser Maschine zu ermutigen. Diese Offenlegung ist zu vergleichen mit den heutigen Open Source [Gra02] Gedanken. Abb. 1.1.: Sprechmaschine nach Wolfgang von Kempelen [Ber05] Der erste elektrische Spracherzeuger, mit dem zusammenhängende Sprache erzeugt werden konnte, war der Voder. Es handelte sich um ein Spektralsynthesegerät, welches mit einer Art Tastatur, ähnlich einer Schreibmaschine, bedient wurde. Dieses Gerät kopierte physiologische Eigenschaften des menschlichen Stimmsystems, genau genommen die stimmhafte oder stimmlose Anregung durch die Stimmbänder. Die Abbildung 1.2 zeigt eine schematische Darstellung des Gerätes. Der von Homer Dudley erfundene Voder wurde 1939 erstmals auf der Weltmesse in New York vorgestellt. (Vergl. [Fla72, S.171ff.]) Die Entwicklung dieses Teilautomatismus hinzu zu vollautomatisierten Technologie hat die Forschung zwischen 1945 bis heute beschäftigt. Weil diese Arbeit nicht historisch zu verstehen ist, werden die einzelnen Teilaspekte dieser Forschung hier nicht eigens erwähnt. Dies hängt auch damit zusammen, dass die Arbeit in Kooperation mit dem JVoiceXML-Projekt entstanden ist. Es handelt sich also im Folgenden um ein Open Source Projekt, dessen Ziel die Implementierung des Voice extensible Markup Language (VoiceXML) 2.1 Standards ist. 2

9 Einleitung Abb. 1.2.: Schematische Darstellung des Voder Open Source Software unterscheidet sich grundlegend vom Konzept der proprietären Software, weshalb daraus in den vergangenen Jahren eine eigene Kultur entstanden ist. Laut Grassmuck [Gra02] ergibt sich das aus den folgenden Eigenschaften von Open Source: Die Software darf uneingeschränkt verwendet werden. Der Quellcode ist frei verfügbar und darf verändert werden. Die Software darf ohne Einschränkungen und Zahlungsverpflichtungen kopiert und verteilt werden. Die Software darf auch als veränderte Version weitergegeben werden. Der Titel dieser Arbeit resultiert aus dem ursprünglichen Projektziel, den Voice- XML 2.0 Standard zu implementieren. Während der Arbeit ist allerdings eine Erweiterung zur Version 2.0 vom World Wide Web Consortium (W3C) verabschiedet worden, die wichtige Neuerungen definiert. Bei der Erstellung des Konzeptes werden daher die Anforderungen der Version 2.1 ebenfalls berücksichtigt. Diese Arbeit wird sich mit der Mensch-Maschine-Kommunikation kritisch auseinander setzen. Dazu werden als erstes die Grundlagen zur Spracherzeugung (Kap. 2) und Spracherkennung (Kap. 3) erläutert. Diese Grundlagen werden für die darauf folgenden Kapitel über sprachgesteuerte Applikationen benötigt. In Kapitel 4 wird auf die Wichtigkeit von Beschreibungssprachen als adäquates Mittel zur schnellen und modularen Applikationserstellung aufmerksam gemacht. Außerdem werden die beiden wichtigsten Standards zur Beschreibung von sprachgesteuerten Anwendungen vorgestellt. Des Weiteren wird ein Ausblick auf die spezifischen Anwendungsgebiete von VoiceXML gegeben. 3

10 Einleitung Im darauf folgenden Kapitel 5 wird auf die zur Spracherkennung notwendige Grammatik eingegangen. Als erstes wird der Begriff der Grammatik formal erläutert. Danach wird anhand der Chomsky Hierarchie auf die für die Spracherkennung notwendigen Grammatiktypen eingegangen. Anschließend wird die für kontextfreie Grammatiken geeignete Notation anhand von zwei Beispielen vorgestellt. Abschließend erfolgt die Konzeption des Grammatikprozessors. Dafür werden im ersten Abschnitt alle notwendigen Voraussetzungen erarbeitet, um anschließend eine konzeptionelle Umsetzung vorzuschlagen. Dabei wird vor allem auf die VoiceXML, Speech Recognition Grammar Specification (SRGS), Java Speech Application Programming Interface (JSAPI) und Java Speech Grammar Format (JSGF) Spezifikationen eingegangen. Aus der Architektur werden sich weiter Unterpunkte ergeben, die dann detailliert dargelegt werden. Das vorletzte Kapitel beleuchtet die praktische Umsetzung der vorangegangenen Konzeption. Der Schwerpunkt wird auf der Darlegung der gemachten Erfahrungen bei der Softwareentwicklung in einem Open Source-Projekt gelegt. Dabei werden die verwendeten Bibliotheken und deren Funktion vorgestellt. Des Weiteren wird gezeigt, wie sich das erstellte Konzept in die vorhandene Struktur des JVoiceXML-Projektes integriert. Die Funktionalität verwendeter Bibliotheken wird ebenfalls kurz dargelegt. Für die Implementierung der notwendigen Klassen wird das test-first Paradigma verwandt werden. Auf diesen Ansatz wird ebenfalls eingegangen. Alle bis hierher vorgestellten Kapitel werden abschließend mit einer kurzen Zusammenfassung versehen. Abschließend werden die gesammelten Ergebnisse der Arbeit im Kapitel 8 komprimiert zusammengefasst. Außerdem wird ein Ausblick auf eine mögliche weitere Entwicklung gewährt. 4

11 2. Vom Text zur Sprache Die Grundlagen der Mensch-Maschine-Kommunikation werden in den folgenden zwei Kapiteln erläutert. Dabei wird vor allem auf die künstliche Erzeugung gesprochener Sprache, die maschinelle Erkennung gesprochener Sprache und deren Besonderheiten eingegangen. Neue Konzepte der Mensch-Maschine- Kommunikation bedürfen der genauen Kenntnis der auf ihr beruhenden Grundlagen. Deshalb werden die notwendigen Grundlagen sehr ausführlich behandelt, um darauf aufbauend das angestrebte Konzept kürzer formulieren zu können. Sprachsynthese ist die automatische Generierung von gesprochener Sprache auf Basis eines gegebenen, maschinenlesbaren Textes. Jedoch ist die Synthese nur der abschließende Schritt in einer komplexen Verarbeitungskette. Für das Kapitel 2 (Sprachsynthese) wird sich vordergründig auf Dutoit [Dut97] gestützt. Die Wahl dieser Quelle wurde bestärkt durch die Co-Editoren des Autors Morpho-syntaktische Analyse Die vielfältigen Text to Speech (TTS)-Systeme am Markt unterscheiden sich heute weniger durch ihren funktionalen Umfang sondern eher durch den natürlichen Klang der erzeugten Stimme. Diese Unterschiede sind auf die Qualität der linguistischen Vorverarbeitung zurückzuführen. Bevor der Text gesprochen werden kann wird, ein maschinenlesbarer Text von einem TTS-System analysiert und verändert. Dazu wird der Text mit einem Natural Language Processor (NLP) bearbeitet. Der bearbeitete Text wird in eine Datenstruktur innerhalb des TTS-Systems überführt. Diese Datenstruktur ist in mehrere Ebenen unterteilt, weshalb sie auch Multi Level Data Structure (MLDS) genannt wird. Doch vom Text zur vollständigen MLDS ist es ein weiter und vor allem rechenintensiver Weg. Der NLP bearbeitet den gegebenen Text in mehreren Schritten. 5

12 Morpho-syntaktische Analyse NLP Text Analyse Text Präprozessor Morphologische Analyse Kontext Analyse Syntaktisch-prosodische Analyse Zeichen zu Geräusch Modul M L D S oder F S s Prosodie Genrator zum DSP Abb. 2.1.: Schematische Darstellung des NLP Präprozessor Der gegebene Text liegt als mit American Standard Code for Information Interchange (ASCII) Format oder Unicode Transformation Format (UTF) codierte, serielle Zeichenkette vor. Doch muss er für eine Weiterverarbeitung in eine Sequenz von Worten umgewandelt werden. Worte sind die kleinste Einheit, auf der eine weiterführende Analyse basieren kann. Da ein Text aber nicht nur aus orthographischen Einheiten besteht, ist es ebenfalls Aufgabe des Präprozessors, Satzenden, Akronyme, Abkürzungen und Zahlen/Nummer zu erkennen und damit umzugehen Textsegmentierung Eine Vorverarbeitung beginnt gewöhnlich mit einer groben Segmentierung des Eingabetextes. Als Trennzeichen werden Freizeichen, Zeilenumbrüche oder Tabulatoren verwendet. Als Ergebnis dieser Segmentierung erhält man sogenannte Broad Segmentation Units (BSUs). Die Zeichensetzung kann vorübergehend in die Segmente aufgenommen werden. Die meisten TTS-Systeme trennen Punktund Zeichensetzung standardmässig ab und ordnen diese Zeichen in einem zwei- 6

13 Morpho-syntaktische Analyse ten Schritt den entsprechenden Segmenten zu. Deshalb ist es für den Präprozessor wichtig, nicht nur Trennzeichen zu erkennen, sondern diese als eigenes Segment anzusehen. Allerdings hat der Präprozessor mit vielen Mehrdeutigkeiten umzugehen, z. B. mit Bindestrichen als Trennzeichen für einen erzwungenen Zeilenumbruch oder als Verbindung zusammengesetzter Worte. Diese Mehrdeutigkeiten können zu schwerwiegenden Segmentierungsfehlern führen, die nur dadurch behoben werden können, dass der Präprozessor die umgebenden Zeichen beachtet. Einem Bindestrich beim Zeilenumbruch folgt zum Beispiel unmittelbar ein New Line Zeichen. Die Abwandlung der BSUs mit Hilfe von regulären Grammatiken hat eine Liste von Final Segmentation Units (FSUs) als Ergebnis Satzerkennung Die meisten offensichtlichen Mehrdeutigkeiten bei der Zeichensetzung entstehen bei Satzschlusszeichen (.,?,!, :), bei denen nur das Fragezeichen fast eindeutig ist. Doppelpunkte erscheinen sowohl bei Uhrzeiten (11:55) als auch bei der Angabe von Mischverhältnissen (1:3). Das Ausrufezeichen wird, wenn auch selten, in mathematischen Formeln verwendet. Um große Zahlen besser lesbar zu machen, werden 1000er Potenzen mit einem Punkt als Trennzeichen versehen (5.239,00). Im Englischen repräsentiert der Punkt das Dezimaltrennzeichen, während das Komma für die bessere Visualisierung der 1000er Potenzen verwendet wird. Bei Angaben des Datums werden die Bestandteile (Tag, Monat, Jahr) ebenfalls mit einem Punkt getrennt. Leider lassen sich solche Mehrdeutigkeiten nicht mit einer einfachen Regel beseitigen, wie z. B.: Prüfe auf eine Ziffer vor und nach einem Punkt. Sogar ein Punkt, ein Freizeichen und ein darauf folgendes, mit einem Großbuchstaben beginnendes Wort deutet nicht zwangsläufig auf einen Satzanfang hin. Außerdem ist die Möglichkeit nicht ausgeschlossen, dass eine Abkürzung das Ende eines Satzes bildet, z. B.: usw. Für die zuverlässige Erkennung von Satzenden ist die Expansion vorhandener Abkürzungen, Akronyme und Nummern zwingende Voraussetzung Abkürzungen Abkürzungen ist die schriftlich verkürzte Form eines Wortes. Diese werden oft voll ausgesprochen (Fr. = Frau). Außerdem enden Abkürzungen meistens mit 7

14 Morpho-syntaktische Analyse einem Punkt. Die Expansion von Abkürzungen in einem Text kann auf sehr einfache Weise mit Hilfe eines Abkürzungslexikons erreicht werden. Physikalische Einheiten, Währungen oder spezielle Buchstaben (kg,, $, +) können in diesem Lexikon ebenfalls enthalten sein. Mehrdeutigkeiten treten auch auf, wenn es sich bei dem abgekürzten Wort um ein flexives Wort wie tgl. handelt, welches entweder täglich, tägliche, täglichem, täglichen, täglicher, tägliches bedeuten kann. Alle Mehrdeutigkeiten sind ohne eine kontextuelle Analyse nicht auszuschließen bzw. zu beseitigen. Aus diesem Grund ist es möglich, zweifelhafte Worte unangetastet zu lassen und in einem späteren Schritt zu transformieren Akronyme Ein Akronym ist ein Kurzwort aus den Anfangsbuchstaben mehrerer Worte. Im Gegensatz zu Abkürzungen brauchen Akronyme nicht in einer Datenbank abgelegt werden, da für ihre Aussprache keinerlei erweitertes Wissen notwendig ist. Oft reduziert sich ein Akronym auf die sequentielle Aussprache der einzelnen Buchstaben. Sollte das Akronym als Wort artikulierbar sein, richtet sich die Aussprache nach den Standardregeln der jeweiligen Sprache. Durch die hohe Generationsrate neuer Akronyme wäre es ohnehin unmöglich, diese vollständig in einer Datenbank zu erfassen. Trotzdem versucht der Präprozessor alle Akronyme zu erkennen und zu markieren, um das versehentliche Erkennen eines Satzendes zu vermeiden Zahlen Zahlen müssen ebenfalls erkannt und expandiert werden. Wurden Zahlen entdeckt, werden sie anhand ihres Kontextes als rationale Zahlen, Uhrzeiten, Daten oder Ordinalzahlen identifiziert und durch die entsprechenden Literale ersetzt Idiome Idiome sind feststehende Redewendungen, die als eine lexikalische Einheit angesehen werden. Aus diesem Grund werden die beteiligten BSUs einer idiomatischen Wendung in einer FSU zusammengefasst. Trotzdem ist eine morphologische Analyse denkbar, da sich idiomatische Wendungen je nach verwendetem Geschlecht verändern können. 8

15 Morpho-syntaktische Analyse Morphologische Analyse Worte können generell in zwei unterschiedlichen Kategorien klassifiziert werden: Funktionsworte (Artikel, Pronomen, Präpositionen und Konjugationen) und Inhaltsworte. Im Gegensatz zu Funktionsworten, die in einem kleinen Lexikon untergebracht werden können, bilden Inhaltsworte eine unendliche Menge, zu der täglich neue hinzukommen; außerdem erscheinen sie in Texten in vielen Variationen (Genus, Tempus, Kasus, Modus usw.). Die morphologische Analyse untersucht Worte auf deren Tempus (Präsens, Präteritum, Futur usw.), Kasus (Nominativ, Genitiv usw.), Numerus (Plural, Singular), Genus (Maskulinum, Femininum, Neutrum) und Modus (Indikativ, Konjunktiv usw.). Diese Abweichungen von der Stammform eines Wortes lassen Rückschlüsse auf die Semantik und Intonation des Textes zu. Diese Metainformationen fließen in die Synthetisierung des Textes ein Funktionsworte Funktionsworte bilden das Skelett eines Satzes. Ihre Erkennung ist von eminenter Wichtigkeit für ein TTS-System. Da es sich bei den Funktionsworten um eine relativ geringe Anzahl handelt, werden diese Worte meistens in einem kleinen Lexikon geführt. Darüber hinaus haben sehr viele der Funktionsworte eine unregelmässige Aussprache. Diese ist nicht allein durch Regeln feststellbar. Deshalb enthält ein typischer Eintrag in einem Lexikon orthographische, syntaktische und phonologische Informationen Inhaltsworte Wie der Name vermuten lässt, bilden Inhaltsworte den Inhalt eines Satzes. Diese Worte bestehen aus einem lexikalischem Morphem, kurz Lexem, der ungebeugten Grundform eines Wortes. Grammatikalische Morpheme verändern Lexeme nach grammatikalischen Regeln. Da das Wissen um die Art eines Wortes sehr großen Einfluss auf die Qualität und Natürlichkeit der erzeugten Sprache haben kann, ist es sehr wichtig, die Inhaltsworte richtig zu erkennen. Das Verbum lachen besteht z. B. im Indikativ der ersten Person, Singular, Präteritum aus dem Lexem (ich) lach und dem syntaktischen Morphem te. Hierbei handelt es sich um ein gebundenes, flexives Morphem. Grundsätzlich kann 9

16 Morpho-syntaktische Analyse zwischen flexiven/derivativen und freien/gebundenen Morphemen unterschieden werden. In Hinblick auf ein multilinguales TTS-System ist die einleitende morphologische Analyse von Sätzen aus einer Vielzahl von Gründen nötig: Wenn nur die Lexeme gespeichert werden, ist die Größe eines Lexikons akzeptabel begrenzbar. Weitere morphologische Ausprägungen eines Wortes werden nicht gespeichert. Das wiederum verlangt nach einer Analyse der Worte in Bezug auf Wortstamm und Affix, um das Lexem zum entsprechendem Wortstamm zu finden. Diese Operation wird Lemmatisierung genannt und bedeutet das Gegenteil zu Konjugation. Um das oben angeführte Beispiel lachen fortzuführen: Es muss eine Möglichkeit geben, aus dem Wortstamm lach und dem Suffix te ein Rückschluss auf das Lexem lachen zu ziehen. Mit Hilfe gefundener Lexeme kann eine Kategorisierung in Geschlecht, Fall, Ordinalität, Zeitform usw. erfolgen. Da einige Worte morphologisch mehrdeutig sein können - ein Wort nimmt bei gleicher flexiver Form unterschiedliche Fälle an (Nominativ und Akkusativ) - ergeben sich für ein Wort mehrere Hypothesen. Die Morphologie hat deshalb einen indirekten aber starken Einfluss auf die Prosodie der erzeugten Sätze. Manchmal kann die phonetische Ausdrucksweise am besten mit der morphologischen Struktur erklärt werden. Bei dem Wort Nebenstrasse wird das str wie /Str/ ausgesprochen, während es in Demonstration wie /str/ klingt. Die Zuordnung der Silbenbetonung steht in betonungsabhängigen Sprachen wie Englisch, Deutsch, Russisch oder Arabisch in engem Zusammenhang mit der Morphologie. In der deutschen Sprache liegt die Betonung meistens auf der ersten Silbe des Hauptwortes wie bei Band und Verband. Obwohl morphologische Regeln hochgradig sprachabhängig sind, ist es laut Dutoit [Dut97, S.80] heute weitgehend anerkannt, dass Flexionen, Derivation und Zusammensetzungen durch reguläre Grammatiken gut erkannt werden können Kontext Analyse Wenn die morphologische Analyse abgeschlossen ist, hat der NLP alle Möglichkeiten der lexikalischen Analyse ausgeschöpft. Trotzdem lassen sich einige 10

17 Morpho-syntaktische Analyse Worte, wahrscheinlich mehr als anfangs vermutet, in mehrere plausible Wortkategorien einordnen. Diese Worte sind vor allem solche, die ihrem Wesen nach mehrdeutig sind und bei denen sich selbst ein menschlicher Leser nicht ohne eine Analyse des Kontexts für eine Bedeutung entscheiden könnte. Im Deutschen treten solche Effekte oft bei zusammengesetzten Worten auf, wie z. B. Versendung, dessen Betonung entweder Vers-endung oder Ver-sendung sein kann. Im Englischen werden Verben vom NLP aufgrund gleicher Syntax fälschlicherweise für Nomen gehalten. Eine Kontextanalyse basiert auf der Annahme, dass für eine Auflösung von Mehrdeutigkeiten nur selten Informationen aus erweiterten grammatikalischen Strukturen benötigt werden. Aus einer Liste möglicher Wortkategorien für das untersuchte Wort werden diejenigen entfernt, die aufgrund der Kategorie benachbarter Worte nicht in eine Wortreihe passen. Dieser Ansatz wird häufig in der Sprachsynthese aber auch in der Spracherkennung angewandt, weil er relativ gute Ergebnisse in kurzer Zeit erbringt. Grundsätzlich kann die Kontextanalyse durch zwei unterschiedliche Ansätzen erfolgen: stochastisch nicht stochastisch Der stochastische Ansatz beruht auf der Beurteilung von Wahrscheinlichkeiten bei der Folge von Wörtern bestimmter Kategorien. Diese können entweder explizit mit Hilfe von N-Grammmen (s ) oder implizit mit Hilfe von künstlichen, neuronalen Netzen (KNN) (s ) errechnet werden. Beim nicht-stochastischen Ansatz werden eine Reihe von Ja/Nein Regeln expandiert, um eine bestimmte Kombination von Wortkategorien als gültig bzw. nicht gültig einzustufen. Die Definition einer Menge gültiger Wortgruppen ist von größter Wichtigkeit für die Kontextanalyse. Ist nur eine kleine Anzahl syntaktischer Klassen berücksichtigt, ist die Auflösung von Mehrdeutigkeiten sehr eingeschränkt. Ist die Anzahl dagegen sehr groß gewählt, wird das System sehr komplex und nur schwer zu überschauen. Außerdem kann eine große Anzahl zusätzlicher Mehrdeutigkeiten durch fehlerhaft unterschiedener Worte ähnlicher syntaktischer Funktionen erzeugt werden. Die Menge wird typischerweise so klein gewählt, dass die Anzahl der beseitigten Mehrdeutigkeiten noch am größten ist. Der Austausch von Worten darf keine syntaktischen Fehler erzeugen. Dies setzt voraus, dass die Kategorien so gewählt sind, dass Worte, die nicht ausgetauscht werden können, unterschiedlichen Kategorien angehören. 11

18 Morpho-syntaktische Analyse N-Gramme N-Gramme wurden als erstes im Kontext der Spracherkennung als spezieller Typ des Markovschen Modells eingesetzt, um die Wahrscheinlichkeiten von Wortsequenzen einer bestimmten Sprache abzuschätzen. Eine Lösung ist die Implementierung einer Finite State Machine (FSM), die sich während der Analyse in jedem Zustand die n vorhergehenden Worte merkt. Dabei können je nach Komplexität mehrere Fälle unterschieden werden. Bi-Gramme analysieren die Abhängigkeiten der ersten Ordnung, Tri-Gramme die der zweiten Ordnung usw. Tri-Gramme machen typischerweise folgende Annahme: P(w 1,w 2,...,w N ) P(w 1 ) P(w 2 w 1 ) P(w 3 w 2, w 1 )P(w 4 w 3, w 2 )... P(w N w N 1, w N 2 ) (2.1) Im Zuge der Kategorisierung aller Worte eines gegebenen Satzes W = (w 1,w 2,w 3,...,w N ) wird die beste Sequenz von Kategorien ˆK aus allen Sequenzen von Kategorien K = (k 1,k 2,k 3,...,k N ), der zulässigen Kategorien Z = (z 1,z 2,z 3,...,z N ) ausgewählt. Es ist sehr einfach, die daraus resultierende FSM abzuleiten. In einem Bi-Gramm Modell z. B. repräsentiert eine Menge von Zuständen M {q 1,q 2,...,q M } die Wortkategorien, die durch die Grammatik der jeweiligen Sprache erlaubt sind, wobei jeder Zustand einer Kategorie zugeordnet ist. Übergänge sind a priori zwischen allen Zuständen erlaubt. Der Automat ist also vollständig verbunden (siehe Abbildung 2.2). Jeder Übergang von einem Zustand zum nächsten ist mit einer Übergangswahrscheinlichkeit a(i, j) belegt. Nimmt man an, dass das zu untersuchende Vokabular L endlich ist, kann man zustandsabhängige Wortemissionswahrscheinlichkeiten b( j, k) definieren. Diese repräsentieren die Wahrscheinlichkeit, dass das k-te Wort im Lexikon gefunden wird, wenn es der Kategorie c j angehört. Die Elemente a(i, j) und b( j,k) der Übergangs- und Emissionsmatrizen der Größe MxM und MxL wurden aus einem großen Textkörper vorberechnet. Als Standardwerk für Linguisten gilt hierfür der Brown Corpus [FK67]. Dieser Text enthält ca. eine Million Worten aus 15 Textkategorien. Er bildet damit eine gute Repräsentation aller in der englischen Sprache verwandten grammatikalischen und orthographischen Wendungen. Durch Schätzung der relativen Frequenzen reduziert sich das Bearbeiten eines Satzes der Länge N in einem vollständig verbundenen FSM mit M Zustän- 12

19 Morpho-syntaktische Analyse K K K K 4 Abb. 2.2.: Vollständig verbundene FSM mit 4 Wortkategorien und gleichen Übergangswahrscheinlichkeiten den, dessen Emisions- und Übergangswahrscheinlichkeiten den Zuständen bzw. den Übergängen zugeordnet sind, auf die Suche nach dem wahrscheinlichsten Pfad der Länge N. Da die Worte eines Satzes bereits durch lexikalische und morphologische Untersuchungen vorkategorisiert wurden, beschränkt sich der vormals noch vollständig verbundene FSM automatisch je Wort k auf m Zustände, wobei m die Anzahl der plausiblen Kategorien des Wortes k sind. Der FSM eines Tri-Gramm Models ist eine einfache Erweiterung, bei der sich eine Menge von M 2 Zuständen {q 11,q 12,...,q 1M,q 21,q 22,...,q 2M,...,q M1,q M2,...,q MM } ergibt. Jedes Paar wurde einer Paarung zweier Wortkategorien zugeordnet, wobei jeweils das aktuelle und das vorhergehende Wort berücksichtigt sind. Übergangswahrscheinlichkeiten ergeben sich daraus, dass eine gegebene Kategorie anhand der Wahrscheinlichkeiten der beiden vorhergehenden Worte gewählt wird. Anzumerken ist hierzu, dass die FSM nun nicht mehr vollständig verbunden ist, da die mit (c i,c j ) indizierten Zustände nur zu Zuständen (c j,c k ) übergehen kön- 13

20 Morpho-syntaktische Analyse Der feige Spitz kann rasen. Artikel, Relativpronomen, Demonstrativpronomen Adjektiv, Nomen Adjektiv, Nomen Verb Verb, Nomen Der feige 0.3 spitz rasen. Der kann Der Feige Spitz Rasen. P(w1) * P(w2 w1) * P(w3 w2,w1) * P(w4 w3,w2) * P(w5 w4,w3) Abb. 2.3.: N-GRAMM nen, wobei k = 1...M. Die Matrizen der Übergangs- und Emissionswahrscheinlichkeiten haben die Größe von M 2 M bzw. M 2 L. Für TTS-Applikationen ist das Vokabular unendlich groß oder zumindest so groß, dass es nicht komplett in einer Datenbank gespeichert werden kann, weshalb die Schätzung aller Wahrscheinlichkeiten für b( j, k) verhindert wird. Eine typische Prozedur zur Minderung dieses Problems ist die Einteilung der Inhaltsworte in eine endliche Menge P von Equivalenzklassen. Equivalenzklassen sind definiert als Menge von Worten, von denen angenommen wird, dass sie ähnliche Werte für b( j,k) für alle j aufweisen. Diese Worte werden durch N-Gramme nicht unterschieden. In der Praxis sind alle Worte mit ähnlichen Mehrdeutigkeiten Teil einer Equivalenzklasse, z. B. alle englischen Worte, die sowohl Verb als auch Nomen sein können. Emissionswahrscheinlichkeiten sind damit auf die Anzahl der Equivalenzklassen beschränkt. Die Fähigkeit von Bi- und Tri-Grammen, Mehrdeutigkeiten aufzulösen, ist generell erstaunlich hoch, wenn eine ausreichend große Trainingsdatenbank zur Verfügung steht, um die Wahrscheinlichkeiten a(i, j) und b( j, k) zu errechnen Künstliche, neuronale Netze Parallel zur Entwicklung von FSM mit stochastischem Ansatz in der Form von N-Grammen, wurden künstliche, neuronale Netze (KNN) als mehrdeutigkeitsbeseitigende Maschinen getestet. Während der Trainingsphase werden Wortse- 14

21 Morpho-syntaktische Analyse quenzen an der Eingangsseite eines Multi Layer Perceptron (MLP) angelegt. Der Ausgang stellt die wahrscheinlichste Wortkategorie eines Wortes bereit. Ein klassischer Back-Propagation Algorithmus wird für die Optimierung der Neuronenwichtung verwendet. Ein potentieller Vorteil dieses Ansatzes gegenüber dem Vorhergehendem ist die mögliche Datenreduktion. Dadurch wird es ermöglicht, einem MLP mehr als drei Worte als Eingabeparameter zu übergeben. Wie Benello, Mackie und Anderson [BMA89] zeigen, ist es sogar möglich, vier eindeutig kategorisierte Worte links vom aktuellen Wort, das aktuelle Wort und ein nicht eindeutig kategorisiertes an das Künstliche Neuronale Netze (KNN) zu übergeben Regelbasierte Expertensysteme Syntaktische Mehrdeutigkeiten wurden schon lange vor dem Boom automatischer Systeme wie in Abs und Abs studiert. In den 60er Jahren wurden regelbasierte Expertensysteme von Linguisten für eine Vielzahl von Sprachen als eine schnelle Möglichkeit der Beseitigung syntaktischer Mehrdeutigkeiten empfohlen. Expertensysteme unterscheiden sich grundlegend vom stochastischen Ansatz. Anstatt Wahrscheinlichkeiten für Wortsequenzen mit Hilfe eines Trainingstextes wie dem Brown corpus zu errechnen, werden mögliche Kategorien eines Wortes durch Tests an dessen Kontext angenommen oder ausgeschlossen. Der Begriff Kontext ist an dieser Stelle etwas verändert, so dass unsinnige oder nutzlose Wortsequenzen im Suchprozess ignoriert werden können. In den Anfängen der regelbasierten Expertensysteme wurden die Regeln durch menschliche Experten erstellt. Für die Englische Sprache wurden laut Greene und Rubin [GR77] ca Regeln definiert, die auf den Brown corpus angewandt, eine Quote von 77% für die Beseitigung syntaktischer Mehrdeutigkeiten aufwiesen. Neben der vergleichbar geringen Trefferquote haben regelbasierte System weitere Nachteile. Es werden für die Erstellung weiterer Regeln menschliche Experten benötigt. Die aufgestellten Regeln sind hochgradig sprachabhängig, so dass für jede Sprache andere Experten benötigt werden. Trotzdem werden diese deterministischen Regeln zur Beseitigung syntaktischer Mehrdeutigkeiten nicht ignoriert, denn sie haben auch Vorteile. Sie können ohne weiteres von menschlichen Experten verstanden werden. Dies ermöglicht die Pflege und Korrektur einer Regelbasis. Außerdem lassen sich Regelbasen von 15

22 Spracherzeugung verschiedenen Experten zu einer größeren zusammenfassen. Dies ist offensichtlich nicht mit N-gram oder neuronalen Netzen möglich. Des Weiteren steigt die Komplexität nicht exponentiell mit der Größe des Rechts- und Linkskontexts, denn es ist recht einfach Kategoriesequenzen mit Hilfe von Regeln zu überspringen, die nicht zur Beseitigung von Mehrdeutigkeiten beitragen. Als letztes sei erwähnt, dass lokale Grammatiken typischerweise eine große Anzahl einfacher, fehlerfreier Regeln enthalten. Dies hat zur Folge, dass die Mehrdeutigkeiten auf Wortbasis korrekt beseitigt werden. Aus diesem Grund werden regelbasierte Expertensystem als Vorverarbeitung für die stochastische Ansätze verwendet Zusammenfassung In diesem Abschnitt wurde auf die Grundlagen für die Verarbeitung von Sätzen auf Zeichen, Wort- und Wortgruppenebene eingegangen. Dabei wurden die miteinander verbundenen Analyse-Module berücksichtigt, deren Ergebnis evtl. noch mit einer weiterführenden syntaktisch-prosodischen Analyse verfeinert werden kann. Für alle Module wurden die Probleme und deren pragmatischer Lösungsansatz beleuchtet Spracherzeugung Informationen speziell zur Spracherzeugung sind zusätzlich [Möb01] entnommen. Die Quelle wurde anhand der Mitgliederliste des Instituts für maschinelle Sprachverarbeitung der Universität Stuttgart (IMS) ausgewählt. Zu erwähnen sind neben Mitarbeitern und Professoren des IMS auch Mitarbeiter externer Unternehmen wie AT&T Research, Bosch Mobile Communications, Daimler Benz Research Center und SONY. Wenn alle Vorverarbeitungsschritte erfolgreich durchgeführt wurden, ist das System in einem Zustand sprechen zu können. Es fehlt jedoch der Mechanismus zur Hörbarmachung dieser Worte. In Abb. 2.1 auf Seite 6 ist zu erkennen, dass eine Schnittstelle zwischen dem NLP und dem Digitalem Signal Processor (DSP) Block besteht. Diese beiden Blöcke sind inhaltlich vollkommen voneinander unabhängig und können deshalb separat betrachtet werden. Es wird angenommen, dass am Eingang des DSPs hochwertige, linguistische Informationen bereitgestellt werden. 16

23 Spracherzeugung Intuitiv betrachtet ist es die Aufgabe des DSPs, die dynamische Kontrolle der artikulatorischen Organe eines Menschen zu simulieren, so dass das erzeugte Signal den Anforderungen des Eingangssignals genügt. Das ist zwar erstrebenswert, doch wird in den späteren Abschnitten gezeigt, dass es nicht unbedingt notwendig ist. Menschliche Sprache kann heute auf folgende Arten erzeugt werden: Explizit, mit einer Reihe von Regeln, die auf formaler Ebene den Einfluss von Phonemen auf einander beschreiben. Explizit, durch die Simulation menschlicher artikulatorischer Organe und deren Einfluss auf die Lautbildung. Implizit, durch Speicherung phonetischer Übergänge als Ersatz für Phoneme in Form von Sprachsegmenten in einer Datenbank Formanterzeugung Die Formantsynthese versucht die akustischen Eigenschaften der Sprache zu modellieren bzw. zu generieren. Dies basiert auf dem Quelle-Filter-Model von Fant [Fan60], welches davon ausgeht, dass die Stimmquelle (Kehlkopf) ein Signal produziert, welches durch einen Filter (Vokaltrakt) verändert wird. Quelle Filter Sprachsignal Anregung Schallformung Abb. 2.4.: Schematische Darstellung des Quelle-Filter-Models nach G.Fant Natürliche Implementierung Das Quellsignal der Stimme kann je nach Phon stimmhaft oder stimmlos sein. Im Falle einer stimmhaften Äußerung produzieren die Stimmbänder mit Hilfe des von den Lungen aufgebauten Luftdruckes eine Grundfrequenz F 0. Diese Frequenz liegt zwischen 80Hz (Mann) und 350Hz (Kind). Bei stimmlosen Lauten sind die Stimmbänder geöffnet. Durch die Brechung des Luftstromes im Rachen entsteht eine Art Rauschen. 17

24 Spracherzeugung Stimmbänder stimmhaft Tongenerator Energie variabler Filter stimmlos Rauschgenerator Rauten, Ritzen Anregung Artikulation Abb. 2.5.: Schematische Darstellung der Lautbildung Der Filter besteht aus dem Vokaltrakt, der aufgrund des beweglichen Rachenraumes, der Zunge und den Lippen hochgradig variabel ist. Durch bestimmte Stellungen und Bewegungen des Vokaltraktes werden auf der Grundfrequenz F 0 mehrere Maxima (Formanten) aufmoduliert. Diese Maxima können vom menschlichen Gehör als Sprachlaute identifiziert werden. Bei stimmlosen Lauten wie /S/ werden auf das Rauschen mit Hilfe des Vokaltraktes ebenfalls Veränderungen aufmoduliert Technische Implementierung Der in einem TTS-System nachgebildete Vokaltrakt (Filter) besteht aus einer Reihe von Resonatoren, die entweder seriell, parallel oder einer Kombination aus beiden verschaltet sein können. Jeder dieser Resonatoren hat als spezifisches Charakteristikum einen speziellen Frequenzbereich und eine Bandbreite, die auf das Eingangssignal aufmoduliert werden. Je nachdem, welche Resonatoren gleichzeitig aktiviert werden, ergibt sich daraus eine Überlagerung der Formanten, die vom Menschen als Sprachlaute wahrgenommen werden können. Durch die dynamische Änderung der Filtereigenschaften kann somit Sprache erzeugt werden Regelbasierte Lautbildung Formantbasierte Synthesizer erzeugen gesprochene Sprache mit Hilfe einer Menge an Filterparametern. Diese werden in kurzen, zeitlichen Abständen aktualisiert. Typische Abstände betragen etwa 5 oder 10 ms. Eine Sequenz von Phon- 18

25 Spracherzeugung Symbolen wird dabei mit Hilfe einer Regelbasis in eine entsprechende Sequenz von Zeitabständen respektive deren Filterparameter transformiert. Deshalb wird diese Art der Sprachsynthese in der Fachliteratur oft als regelbasierte Sprachsynthese bezeichnet. (Vergl. [Dut97, S. 178]) Jedes Phon-Symbol ist in dieser Regelbasis durch eine Menge an Parameterwerten definiert, die wiederum zu bestimmten artikulatorischen Positionen und Bewegungen des Vokaltraktes während der Artikulation dieses Phons zugeordnet sind. Einige Rahmenparameter formen geglättete Übergänge zwischen zwei Phonen Qualität Die Formantsynthese ist teilweise gut geeignet, um Sprache mit wohl definierten Formantstrukturen, wie Vokalen aber auch Halbkonsonanten und Sonoranten zu erzeugen. Die Artikulation von Konsonanten und Stopplauten /d/ oder /t/ bereiten jedoch einige Schwierigkeiten. Eine sehr natürliche Aussprache ist mit einem Formantsynthesizer theoretisch möglich, doch sind die dafür benötigten Regeln bis heute nicht gefunden Vorbereitung Die Formantsynthese bedarf einer langen und intensiven Entwicklungsphase, um Wissen über die akustischen Eigenschaften von Sprache zu erlangen. Dabei werden eine große Anzahl von Konsonant Vokal Konsonant (KVK) Kombinationen digital aufgenommen und gespeichert. Diese sollten von professionellen Sprechen gesprochen werden. Die KVK Kombinationen werden so ausgewählt, dass sie eine repräsentative Menge an KVK Übergängen bilden. In der Analysephase überführt ein Sprachanalysator die digitalen Daten in eine parametrisierte Form. Die Parameter wie z. B. die Formanten können mit Hilfe einer Fouriertransformation oder einer Linear Predictive (LP) Analyse erkannt werden. Typischerweise wird dabei das Quellsignal der Stimmbänder und dessen Veränderung durch den Vokaltrakt voneinander getrennt und letzteres in einer kompakten Form gespeichert, um diese Daten einer weiteren Analyse zu unterziehen. In einer weiteren Stufe werden Regeln durch menschliche Experten aufgestellt. Solche Regeln enthalten die Parameter (z. B.: Dauer der Formantfrequenzen) für 19

26 Spracherzeugung die Synthetisierung eines bestimmten Phons. Bereits bestehende Regelbasen anderer Sprecher können ergänzend in die aktuelle Regelbasis eingefügt werden. Zum Schluss der Entwicklungsphase folgt eine lange Reihe Trial and Error Folgen, um die aufgestellten Regeln und deren Sprachqualität zu optimieren Wichtige Beispiele Die am weitverbreitesten Formantsynthese Systeme sind MITalk (Allen, Hunnicutt, Klatt, 1987), DECtalk (Hertz, Zsiga, 1995), ETI-Eloquence (Hertz, Younes, Zinovieva, 1999) [Möb01, S. 203ff.] Artikulatorische Spracherzeugung Bei dieser Art Spracherzeugung wird mit Hilfe eines Models des menschlichen Spracherzeugungsapparates versucht, Töne möglichst realistisch zu artikulieren. Dabei wird der etwa 17 cm lange Vokaltrakt in gleich lange Abschnitte unterteilt, deren Form und Durchmesser variabel sind. Je nachdem, welches Phonem artikuliert werden soll, ist die Stellung der Abschnitte unterschiedlich. Je nach Stellung reflektieren sich die Schallwellen an den Wänden und erzeugen unterschiedliche Formanten. Die Berechnung der Frequenzen anhand der Form des Vokaltraktes ist dank fundiertem Wissen über die Akustik kein Problem mehr. Es kann festgestellt werden, dass die artikulatorische Spracherzeugung eine Erweiterung der Formanterzeugung ist. Grundsätzlich hat dieser Ansatz das Potential, eine sehr natürliche Sprache zu erzeugen. Leider verhindert fehlendes Wissen über die dreidimensionale Veränderung des Vokaltraktes während des Sprechens einen breiten Einsatz dieser Technik. Auch mit modernster medizinischer Ausrüstung wird es noch eine Weile dauern, bis dieses Wissen zur Verfügung steht Konkatenative Spracherzeugung Da dieser Abschnitt für das Verständnis des zu erstellenden Konzeptes nur eine untergeordnete Rolle spielt, wird auf eine detaillierte Einführung wie in Abschnitt verzichtet. Trotzdem soll dieses vor allem in der täglichen Praxis angewandte und bewährte Konzept nicht verschwiegen werden. Eine gute Zusammenfassung dieser Thematik bietet M. Holzapfel [Hol00] dessen Werk die Informationen zu diesem Abschnitt entnommen sind. 20

27 Zusammenfassung Die Konkatenation menschlicher Sprachaufzeichnungen ist in telefonischen Zeitansagesystemen schon seit Jahrzehnten eine gängige Anwendung der Sprachsynthese. Um die Anwendbarkeit solcher Systeme zu erweitern ist man dazu übergegangen, statt ganzer gesprochener Worte kleinere Sprachsegmente zu verwenden. Bei der Wahl der Sprachsegmente ist in jedem Fall ein Kompromiss zwischen Größe der Sprachdatenbank und Anzahl der Verkettungsstellen zu finden. Wird ein Phon als Sprachsegment gewählt, ist bei moderater Aufnahmequalität mit einer Datenbankgröße von ca. 5MB für die deutsche Sprache zu rechnen. Dagegen ist die Anzahl der Verkettungsstellen sehr hoch. Da der Rechenaufwand für die Glättung und Anpassung der Prosodie- und Rhythmusparameter nicht unerheblich ist, gilt es hier genau abzuwägen. Als Größe der Sprachsegmente werden typischerweise Diphone gewählt. Ein Diphon ist hier definiert als der Übergang zwischen zwei Phonemkernen, im Idealfall von stationärer Phonemmitte zu stationärer Phonemmitte. [Hol00, S.24] Ausgewählte Trägersätze, gesprochen von professionellen Sprechern, werden digital gespeichert und von Phonetikern in die gewählte Sprachsegmentgröße unterteilt. Bei Diphonen ist in der Segmentdatenbank für ein Paar aufeinander folgender Phoneme genau ein Diphon vorhanden. (Vergl. [Hol00, S.24]) Der zu sprechende Text wird wie in Abschnitt beschrieben von einem NLP in eine Sequenz von Phonemsymbolen umgewandelt. Diese werden anschließend vom DSP durch Konkatenation und Glättung der korrespondieren Diphone aus der Datenbank in Sprache artikuliert Zusammenfassung In diesem Kapitel zu den Grundlagen der Sprachsynthese wurden sämtliche Schritte von der Segmentierung des Eingangstextes über die Kontextanalyse bis hin zu unterschiedlichen Ansätzen der Spracherzeugung behandelt. Zusammenfassend kann das Problem der Sprachsynthese mit Mitteln modernster Computer und ausgereifter phonetischer Analysemethoden als gelöst betrachtet werden. Sicherlich gibt es bei der Verbesserung der Natürlichkeit der erzeugten Sprache noch viel Potential. Doch sind die heutigen Ergebnisse der Sprachsynthese hinreichend, um einem zuhörenden Nutzer Informationen zuverlässig zu übermitteln. 21

28 3. Von der Sprache zum Text Spracherkennung ist der Vorgang, gesprochene Worte durch eine Maschine oder einen Computer erkennen zu lassen. Letztendlich bedeutet es, mit dem Computer zu sprechen und ggf. verstanden zu werden Modelle der Spracherkennung Die menschliche Spracherkennung ist ein sehr komplexer Vorgang, der trotz jahrzehntelanger Forschung bis heute nicht vollständig simuliert werden kann. Die deshalb verwendeten stochastischen Ansätze können nur ein unvollständiger Ersatz sein. Zur Vereinfachung der Implementierung werden für manche Systeme gewisse Einschränkungen angenommen. Im Wesentlichen gibt es Unterscheidungen zwischen sprecherabhängigen bzw. sprecherunabhängigen Systemen. Innerhalb dieser beiden Kategorien wird jeweils noch in Systeme unterteilt, die diskret (isoliert) oder kontinuierlich gesprochene Sprache erkennen Sprecherabhängige Spracherkennungssysteme Die Erkennung gesprochener Worte unterschiedlicher Sprecher ist weitaus komplexer, als die Erkennung eines bekannten Sprechers. Denn je nach Sprecher können Äußerungen ein und des selben Phonems differieren. Auch kann es vorkommen, dass zwei disjunkte Phoneme von zwei unterschiedlichen Sprechern identisch ausgesprochen werden. Wird eine Automatic Speech Recognition (ASR)-Software üblicherweise von ein und der selben Person verwendet, z. B. zu Hause als Diktiergerät an einem Personal Computer (PC), ist es legitim, dass das System die sprecherabhängigen Merkmale dieser Person erlernt und berücksichtigt. Dazu ist eine Trainingsphase notwendig, bei der der Sprecher einen vorgegebenen Text in das Mikrofon sprechen muss. Dieser Text enthält Schlüsselworte, 22

29 Modelle der Spracherkennung die es dem System erleichtern, sich an die Aussprache des jeweiligen Sprechers zu gewöhnen. Nach Trainingsabschluss werden neben sprecherunabhängigen Merkmalen auch für diesen Sprecher spezifische Merkmale erkannt. Die Trefferquote für den trainierten Nutzer ist dadurch deutlich höher. Ein Wechsel zu einem anderen Sprecher ist allerdings nicht ohne Weiteres möglich. Das System müsste erst alle sprecherabhängigen Informationen löschen und eine erneute Trainingsphase durchlaufen Sprecherunabhängige Spracherkennungssysteme Bei sprecherunabhängiger Spracherkennung kann sich ein ASR-System nicht auf die Kenntnis sprecherspezifischer Merkmale im Sprachsignal verlassen. Die Anwendungsdomäne dieser Art Spracherkennung ist sehr oft für eine große Anzahl von Nutzern ausgelegt. Als ein Beispiel sei hier das klassische Telefonbanking genannt. Diese Anwendung lässt es nicht zu, dass das ASR-System eine initiale Trainingsphase mit jedem Anrufer durchläuft, bevor die Banking-Funktion genutzt werden kann. Da bei der Erkennung von Sprache nicht auf erweitertes Wissen über die spezifische Aussprache des aktuellen Nutzers zurückgegriffen werden kann, ist es offensichtlich, dass die erreichten Trefferquoten deutlich unter denen eines gut trainierten sprecherabhängigen Systems liegen. Im Allgemeinen wird bei diesen Systemen ein sehr viel kleineres, themengebundenes Vokabular verwendet, um eine akzeptable Trefferquote zu erreichen. Zum Beispiel sind Systeme für die Erkennung diktierter Patientenanamnese denkbar Diskrete Aussprache In den Anfängen der Sprachverarbeitung wurde zur Vereinfachung häufig vorausgesetzt, dass der Sprecher zwischen gesprochenen Worten eine kurze Pause lässt. Damit liessen sich Wortgrenzen viel besser erkennen, was die Fehlerquote deutlich senkte. Diese Art zu sprechen wird von den meisten Benutzern als unnatürlich empfunden und deshalb abgelehnt. Doch hat diese Art der Spracherkennung in Command and Control Systems (CCSs) bis heute ihre Berechtigung. Abbildung 3.1 zeigt die Unterteilung der Systeme nach Wortschatzgröße und Sprecherabhängigkeit. Lange Zeit galt die Wortschatzgrenze von 1000 Worten 23

Verarbeitung der Eingangsmeldungen in einem Callcenter

Verarbeitung der Eingangsmeldungen in einem Callcenter Q-up ist ein Produkt der: Anwendungsbeispiele Verarbeitung der Eingangsmeldungen in einem Callcenter Der Testdatengenerator Der Testdatengenerator Verarbeitung der Eingangsmeldungen in einem Callcenter

Mehr

Grundbegriffe der Informatik

Grundbegriffe der Informatik Grundbegriffe der Informatik Einheit 15: Reguläre Ausdrücke und rechtslineare Grammatiken Thomas Worsch Universität Karlsruhe, Fakultät für Informatik Wintersemester 2008/2009 1/25 Was kann man mit endlichen

Mehr

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als

Mehr

1 Mathematische Grundlagen

1 Mathematische Grundlagen Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.

Mehr

Informationsblatt Induktionsbeweis

Informationsblatt Induktionsbeweis Sommer 015 Informationsblatt Induktionsbeweis 31. März 015 Motivation Die vollständige Induktion ist ein wichtiges Beweisverfahren in der Informatik. Sie wird häufig dazu gebraucht, um mathematische Formeln

Mehr

Zeichen bei Zahlen entschlüsseln

Zeichen bei Zahlen entschlüsseln Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren

Mehr

ecall sms & fax-portal

ecall sms & fax-portal ecall sms & fax-portal Beschreibung des Imports und Exports von Adressen Dateiname Beschreibung_-_eCall_Import_und_Export_von_Adressen_2015.10.20 Version 1.1 Datum 20.10.2015 Dolphin Systems AG Informieren

Mehr

Anleitung über den Umgang mit Schildern

Anleitung über den Umgang mit Schildern Anleitung über den Umgang mit Schildern -Vorwort -Wo bekommt man Schilder? -Wo und wie speichert man die Schilder? -Wie füge ich die Schilder in meinen Track ein? -Welche Bauteile kann man noch für Schilder

Mehr

Barrierefreie Webseiten erstellen mit TYPO3

Barrierefreie Webseiten erstellen mit TYPO3 Barrierefreie Webseiten erstellen mit TYPO3 Alternativtexte Für jedes Nicht-Text-Element ist ein äquivalenter Text bereitzustellen. Dies gilt insbesondere für Bilder. In der Liste der HTML 4-Attribute

Mehr

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung

Mehr

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche etutor Benutzerhandbuch Benutzerhandbuch XQuery Georg Nitsche Version 1.0 Stand März 2006 Versionsverlauf: Version Autor Datum Änderungen 1.0 gn 06.03.2006 Fertigstellung der ersten Version Inhaltsverzeichnis:

Mehr

4. AUSSAGENLOGIK: SYNTAX. Der Unterschied zwischen Objektsprache und Metasprache lässt sich folgendermaßen charakterisieren:

4. AUSSAGENLOGIK: SYNTAX. Der Unterschied zwischen Objektsprache und Metasprache lässt sich folgendermaßen charakterisieren: 4. AUSSAGENLOGIK: SYNTAX 4.1 Objektsprache und Metasprache 4.2 Gebrauch und Erwähnung 4.3 Metavariablen: Verallgemeinerndes Sprechen über Ausdrücke von AL 4.4 Die Sprache der Aussagenlogik 4.5 Terminologie

Mehr

Primzahlen und RSA-Verschlüsselung

Primzahlen und RSA-Verschlüsselung Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also

Mehr

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am 14.08.08

Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am 14.08.08 Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements von Stephanie Wilke am 14.08.08 Überblick Einleitung Was ist ITIL? Gegenüberstellung der Prozesse Neuer

Mehr

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom 21.10.2013b

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom 21.10.2013b AGROPLUS Buchhaltung Daten-Server und Sicherheitskopie Version vom 21.10.2013b 3a) Der Daten-Server Modus und der Tresor Der Daten-Server ist eine Betriebsart welche dem Nutzer eine grosse Flexibilität

Mehr

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt?

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt? Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt? Behandelte Fragestellungen Was besagt eine Fehlerquote? Welche Bezugsgröße ist geeignet? Welche Fehlerquote ist gerade noch zulässig? Wie stellt

Mehr

Grammatiken. Einführung

Grammatiken. Einführung Einführung Beispiel: Die arithmetischen Ausdrücke über der Variablen a und den Operationen + und können wie folgt definiert werden: a, a + a und a a sind arithmetische Ausdrücke Wenn A und B arithmetische

Mehr

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während

Mehr

Eigene Dokumente, Fotos, Bilder etc. sichern

Eigene Dokumente, Fotos, Bilder etc. sichern Eigene Dokumente, Fotos, Bilder etc. sichern Solange alles am PC rund läuft, macht man sich keine Gedanken darüber, dass bei einem Computer auch mal ein technischer Defekt auftreten könnte. Aber Grundsätzliches

Mehr

Diplomarbeit. Konzeption und Implementierung einer automatisierten Testumgebung. Thomas Wehrspann. 10. Dezember 2008

Diplomarbeit. Konzeption und Implementierung einer automatisierten Testumgebung. Thomas Wehrspann. 10. Dezember 2008 Konzeption und Implementierung einer automatisierten Testumgebung, 10. Dezember 2008 1 Gliederung Einleitung Softwaretests Beispiel Konzeption Zusammenfassung 2 Einleitung Komplexität von Softwaresystemen

Mehr

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank

Mehr

Berechnung der Erhöhung der Durchschnittsprämien

Berechnung der Erhöhung der Durchschnittsprämien Wolfram Fischer Berechnung der Erhöhung der Durchschnittsprämien Oktober 2004 1 Zusammenfassung Zur Berechnung der Durchschnittsprämien wird das gesamte gemeldete Prämienvolumen Zusammenfassung durch die

Mehr

SDD System Design Document

SDD System Design Document SDD Software Konstruktion WS01/02 Gruppe 4 1. Einleitung Das vorliegende Dokument richtet sich vor allem an die Entwickler, aber auch an den Kunden, der das enstehende System verwenden wird. Es soll einen

Mehr

A1.7: Entropie natürlicher Texte

A1.7: Entropie natürlicher Texte A1.7: Entropie natürlicher Texte Anfang der 1950er Jahre hat Claude E. Shannon die Entropie H der englischen Sprache mit einem bit pro Zeichen abgeschätzt. Kurz darauf kam Karl Küpfmüller bei einer empirischen

Mehr

DSO. Abtastrate und Speichertiefe

DSO. Abtastrate und Speichertiefe DSO Abtastrate und Speichertiefe Inhalt Inhalt...- 1 - Feine Signaldetails und lange Abtastzeiträume...- 2 - Was ein großer Speicher bewirkt...- 2 - Einfluss der Oszilloskop-Architektur auf die Update-Rate...-

Mehr

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung 1 Einleitung 1.1 Motivation und Zielsetzung der Untersuchung Obgleich Tourenplanungsprobleme zu den am häufigsten untersuchten Problemstellungen des Operations Research zählen, konzentriert sich der Großteil

Mehr

Robot Karol für Delphi

Robot Karol für Delphi Robot Karol für Delphi Reinhard Nitzsche, OSZ Handel I Version 0.1 vom 24. Januar 2003 Zusammenfassung Nach der Einführung in die (variablenfreie) Programmierung mit Robot Karol von Freiberger und Krško

Mehr

Einführung in. Logische Schaltungen

Einführung in. Logische Schaltungen Einführung in Logische Schaltungen 1/7 Inhaltsverzeichnis 1. Einführung 1. Was sind logische Schaltungen 2. Grundlegende Elemente 3. Weitere Elemente 4. Beispiel einer logischen Schaltung 2. Notation von

Mehr

Softwaretests in Visual Studio 2010 Ultimate Vergleich mit Java-Testwerkzeugen. Alexander Schunk Marcel Teuber Henry Trobisch

Softwaretests in Visual Studio 2010 Ultimate Vergleich mit Java-Testwerkzeugen. Alexander Schunk Marcel Teuber Henry Trobisch Softwaretests in Visual Studio 2010 Ultimate Vergleich mit Java-Testwerkzeugen Alexander Schunk Henry Trobisch Inhalt 1. Vergleich der Unit-Tests... 2 2. Vergleich der Codeabdeckungs-Tests... 2 3. Vergleich

Mehr

Bedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof

Bedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof Bedienungsanleitung für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof Matthias Haasler Version 0.4 Webadministrator, email: webadmin@rundkirche.de Inhaltsverzeichnis 1 Einführung

Mehr

Partitionieren in Vista und Windows 7/8

Partitionieren in Vista und Windows 7/8 Partitionieren in Vista und Windows 7/8 Windows Vista und Windows 7 können von Haus aus Festplatten partitionieren. Doch die Funktion ist etwas schwer zu entdecken, denn sie heißt "Volume verkleinern".

Mehr

Web-Kürzel. Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter

Web-Kürzel. Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter Krishna Tateneni Yves Arrouye Deutsche Übersetzung: Stefan Winter 2 Inhaltsverzeichnis 1 Web-Kürzel 4 1.1 Einführung.......................................... 4 1.2 Web-Kürzel.........................................

Mehr

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang sysplus.ch outlook - mail-grundlagen Seite 1/8 Outlook Mail-Grundlagen Posteingang Es gibt verschiedene Möglichkeiten, um zum Posteingang zu gelangen. Man kann links im Outlook-Fenster auf die Schaltfläche

Mehr

Installation von Updates

Installation von Updates Installation von Updates In unregelmässigen Abständen erscheinen Aktualisierungen zu WinCard Pro, entweder weil kleinere Verbesserungen realisiert bzw. Fehler der bestehenden Version behoben wurden (neues

Mehr

Motivation. Formale Grundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen. Informales Beispiel. Informales Beispiel.

Motivation. Formale Grundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen. Informales Beispiel. Informales Beispiel. Kontextfreie Kontextfreie Motivation Formale rundlagen der Informatik 1 Kapitel 5 Kontextfreie Sprachen Bisher hatten wir Automaten, die Wörter akzeptieren Frank Heitmann heitmann@informatik.uni-hamburg.de

Mehr

IT-Governance und Social, Mobile und Cloud Computing: Ein Management Framework... Bachelorarbeit

IT-Governance und Social, Mobile und Cloud Computing: Ein Management Framework... Bachelorarbeit IT-Governance und Social, Mobile und Cloud Computing: Ein Management Framework... Bachelorarbeit zur Erlangung des akademischen Grades Bachelor of Science (B.Sc.) im Studiengang Wirtschaftswissenschaft

Mehr

Formale Sprachen und Grammatiken

Formale Sprachen und Grammatiken Formale Sprachen und Grammatiken Jede Sprache besitzt die Aspekte Semantik (Bedeutung) und Syntax (formaler Aufbau). Die zulässige und korrekte Form der Wörter und Sätze einer Sprache wird durch die Syntax

Mehr

1. Einschränkung für Mac-User ohne Office 365. 2. Dokumente hochladen, teilen und bearbeiten

1. Einschränkung für Mac-User ohne Office 365. 2. Dokumente hochladen, teilen und bearbeiten 1. Einschränkung für Mac-User ohne Office 365 Mac-User ohne Office 365 müssen die Dateien herunterladen; sie können die Dateien nicht direkt öffnen und bearbeiten. Wenn die Datei heruntergeladen wurde,

Mehr

Schulberichtssystem. Inhaltsverzeichnis

Schulberichtssystem. Inhaltsverzeichnis Schulberichtssystem Inhaltsverzeichnis 1. Erfassen der Schüler im SBS...2 2. Erzeugen der Export-Datei im SBS...3 3. Die SBS-Datei ins FuxMedia-Programm einlesen...4 4. Daten von FuxMedia ins SBS übertragen...6

Mehr

In 12 Schritten zum mobilen PC mit Paragon Drive Copy 11 und Microsoft Windows Virtual PC

In 12 Schritten zum mobilen PC mit Paragon Drive Copy 11 und Microsoft Windows Virtual PC PARAGON Technologie GmbH, Systemprogrammierung Heinrich-von-Stephan-Str. 5c 79100 Freiburg, Germany Tel. +49 (0) 761 59018201 Fax +49 (0) 761 59018130 Internet www.paragon-software.com Email sales@paragon-software.com

Mehr

Task: Nmap Skripte ausführen

Task: Nmap Skripte ausführen Task: Nmap Skripte ausführen Inhalt Einfache Netzwerkscans mit NSE Ausführen des Scans Anpassung der Parameter Einleitung Copyright 2009-2015 Greenbone Networks GmbH Herkunft und aktuellste Version dieses

Mehr

Hilfedatei der Oden$-Börse Stand Juni 2014

Hilfedatei der Oden$-Börse Stand Juni 2014 Hilfedatei der Oden$-Börse Stand Juni 2014 Inhalt 1. Einleitung... 2 2. Die Anmeldung... 2 2.1 Die Erstregistrierung... 3 2.2 Die Mitgliedsnummer anfordern... 4 3. Die Funktionen für Nutzer... 5 3.1 Arbeiten

Mehr

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde

Mehr

Grafstat Checkliste Internetbefragung

Grafstat Checkliste Internetbefragung Grafstat Checkliste Internetbefragung ( A ) Datensammelpunkt im Formular eintragen ( B ) Befragung auf dem Datensammelpunkt anmelden ( C ) Formular ins Internet stellen (z.b. Homepage) ( D ) Befragung

Mehr

Programmiersprachen und Übersetzer

Programmiersprachen und Übersetzer Programmiersprachen und Übersetzer Sommersemester 2010 19. April 2010 Theoretische Grundlagen Problem Wie kann man eine unendliche Menge von (syntaktisch) korrekten Programmen definieren? Lösung Wie auch

Mehr

Testplan. Hochschule Luzern Technik & Architektur. Software Komponenten FS13. Gruppe 03 Horw, 16.04.2013

Testplan. Hochschule Luzern Technik & Architektur. Software Komponenten FS13. Gruppe 03 Horw, 16.04.2013 Software Komponenten FS13 Gruppe 03 Horw, 16.04.2013 Bontekoe Christian Estermann Michael Moor Simon Rohrer Felix Autoren Bontekoe Christian Studiengang Informatiker (Berufsbegleitend) Estermann Michael

Mehr

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst.

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst. 40-Tage-Wunder- Kurs Umarme, was Du nicht ändern kannst. Das sagt Wikipedia: Als Wunder (griechisch thauma) gilt umgangssprachlich ein Ereignis, dessen Zustandekommen man sich nicht erklären kann, so dass

Mehr

PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN

PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN Karlsruhe, April 2015 Verwendung dichte-basierter Teilrouten Stellen Sie sich vor, in einem belebten Gebäude,

Mehr

Professionelle Seminare im Bereich MS-Office

Professionelle Seminare im Bereich MS-Office Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion

Mehr

Vermeiden Sie es sich bei einer deutlich erfahreneren Person "dranzuhängen", Sie sind persönlich verantwortlich für Ihren Lernerfolg.

Vermeiden Sie es sich bei einer deutlich erfahreneren Person dranzuhängen, Sie sind persönlich verantwortlich für Ihren Lernerfolg. 1 2 3 4 Vermeiden Sie es sich bei einer deutlich erfahreneren Person "dranzuhängen", Sie sind persönlich verantwortlich für Ihren Lernerfolg. Gerade beim Einstig in der Programmierung muss kontinuierlich

Mehr

Mobile Intranet in Unternehmen

Mobile Intranet in Unternehmen Mobile Intranet in Unternehmen Ergebnisse einer Umfrage unter Intranet Verantwortlichen aexea GmbH - communication. content. consulting Augustenstraße 15 70178 Stuttgart Tel: 0711 87035490 Mobile Intranet

Mehr

schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG mitp/bhv

schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG mitp/bhv Roboter programmieren mit NXC für Lego Mindstorms NXT 1. Auflage Roboter programmieren mit NXC für Lego Mindstorms NXT schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG mitp/bhv Verlag

Mehr

L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016

L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016 L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016 Referentin: Dr. Kelly Neudorfer Universität Hohenheim Was wir jetzt besprechen werden ist eine Frage, mit denen viele

Mehr

Bilder Schärfen und Rauschen entfernen

Bilder Schärfen und Rauschen entfernen Bilder Schärfen und Rauschen entfernen Um alte Bilder, so wie die von der Olympus Camedia 840 L noch dazu zu bewegen, Farben froh und frisch daherzukommen, bedarf es einiger Arbeit und die habe ich hier

Mehr

Nach der Anmeldung im Backend Bereich landen Sie im Kontrollzentrum, welches so aussieht:

Nach der Anmeldung im Backend Bereich landen Sie im Kontrollzentrum, welches so aussieht: Beiträge erstellen in Joomla Nach der Anmeldung im Backend Bereich landen Sie im Kontrollzentrum, welches so aussieht: Abbildung 1 - Kontrollzentrum Von hier aus kann man zu verschiedene Einstellungen

Mehr

Energetische Klassen von Gebäuden

Energetische Klassen von Gebäuden Energetische Klassen von Gebäuden Grundsätzlich gibt es Neubauten und Bestandsgebäude. Diese Definition ist immer aktuell. Aber auch ein heutiger Neubau ist in drei (oder vielleicht erst zehn?) Jahren

Mehr

Kleines Handbuch zur Fotogalerie der Pixel AG

Kleines Handbuch zur Fotogalerie der Pixel AG 1 1. Anmelden an der Galerie Um mit der Galerie arbeiten zu können muss man sich zuerst anmelden. Aufrufen der Galerie entweder über die Homepage (www.pixel-ag-bottwartal.de) oder über den direkten Link

Mehr

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3 Handbuch Fischertechnik-Einzelteiltabelle V3.7.3 von Markus Mack Stand: Samstag, 17. April 2004 Inhaltsverzeichnis 1. Systemvorraussetzungen...3 2. Installation und Start...3 3. Anpassen der Tabelle...3

Mehr

Leichte-Sprache-Bilder

Leichte-Sprache-Bilder Leichte-Sprache-Bilder Reinhild Kassing Information - So geht es 1. Bilder gucken 2. anmelden für Probe-Bilder 3. Bilder bestellen 4. Rechnung bezahlen 5. Bilder runterladen 6. neue Bilder vorschlagen

Mehr

Was ist Sozial-Raum-Orientierung?

Was ist Sozial-Raum-Orientierung? Was ist Sozial-Raum-Orientierung? Dr. Wolfgang Hinte Universität Duisburg-Essen Institut für Stadt-Entwicklung und Sozial-Raum-Orientierte Arbeit Das ist eine Zusammen-Fassung des Vortrages: Sozialräume

Mehr

4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes.

4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes. Binäre Bäume Definition: Ein binärer Baum T besteht aus einer Menge von Knoten, die durch eine Vater-Kind-Beziehung wie folgt strukturiert ist: 1. Es gibt genau einen hervorgehobenen Knoten r T, die Wurzel

Mehr

Anleitung zur Verwendung der VVW-Word-Vorlagen

Anleitung zur Verwendung der VVW-Word-Vorlagen Anleitung zur Verwendung der VVW-Word-Vorlagen v1.0. Feb-15 1 1 Vorwort Sehr geehrte Autorinnen und Autoren, wir haben für Sie eine Dokumentenvorlage für Microsoft Word entwickelt, um Ihnen die strukturierte

Mehr

Hinweise zum Ausfüllen der Zeiterfassung

Hinweise zum Ausfüllen der Zeiterfassung Hinweise zum Ausfüllen der Zeiterfassung Generelle Hinweise zu Excel Ab Version VSA 4.50 wird die dezimale Schreibweise für Zeiteingaben verwendet. Die Zeiterfassung, die Sie erhalten haben wurde für Excel

Mehr

trivum Multiroom System Konfigurations- Anleitung Erstellen eines RS232 Protokolls am Bespiel eines Marantz SR7005

trivum Multiroom System Konfigurations- Anleitung Erstellen eines RS232 Protokolls am Bespiel eines Marantz SR7005 trivum Multiroom System Konfigurations- Anleitung Erstellen eines RS232 Protokolls am Bespiel eines Marantz SR7005 2 Inhalt 1. Anleitung zum Einbinden eines über RS232 zu steuernden Devices...3 1.2 Konfiguration

Mehr

Anti-Botnet-Beratungszentrum. Windows XP in fünf Schritten absichern

Anti-Botnet-Beratungszentrum. Windows XP in fünf Schritten absichern Windows XP in fünf Schritten absichern Inhalt: 1. Firewall Aktivierung 2. Anwendung eines Anti-Virus Scanner 3. Aktivierung der automatischen Updates 4. Erstellen eines Backup 5. Setzen von sicheren Passwörtern

Mehr

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster Es gibt in Excel unter anderem die so genannten Suchfunktionen / Matrixfunktionen Damit können Sie Werte innerhalb eines bestimmten Bereichs suchen. Als Beispiel möchte ich die Funktion Sverweis zeigen.

Mehr

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

OECD Programme for International Student Assessment PISA 2000. Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland OECD Programme for International Student Assessment Deutschland PISA 2000 Lösungen der Beispielaufgaben aus dem Mathematiktest Beispielaufgaben PISA-Hauptstudie 2000 Seite 3 UNIT ÄPFEL Beispielaufgaben

Mehr

Hilfe zur Urlaubsplanung und Zeiterfassung

Hilfe zur Urlaubsplanung und Zeiterfassung Hilfe zur Urlaubsplanung und Zeiterfassung Urlaubs- und Arbeitsplanung: Mit der Urlaubs- und Arbeitsplanung kann jeder Mitarbeiter in Coffee seine Zeiten eintragen. Die Eintragung kann mit dem Status anfragen,

Mehr

1 Part-of-Speech Tagging

1 Part-of-Speech Tagging 2. Übung zur Vorlesung NLP Analyse des Wissensrohstoes Text im Sommersemester 2008 Dr. Andreas Hotho, Dipl.-Inform. Dominik Benz, Wi.-Inf. Beate Krause 28. Mai 2008 1 Part-of-Speech Tagging 1.1 Grundlagen

Mehr

Tutorial. In diesem Tutorial möchte ich die Möglichkeiten einer mehrspracheigen Web-Site erläutern.

Tutorial. In diesem Tutorial möchte ich die Möglichkeiten einer mehrspracheigen Web-Site erläutern. Tutorial In diesem Tutorial möchte ich die Möglichkeiten einer mehrspracheigen Web-Site erläutern. Zu Beginn müssen wir uns über die gewünschten Sprachen Gedanken machen. Zum einem, da eine professionelle

Mehr

3 ORDNER UND DATEIEN. 3.1 Ordner

3 ORDNER UND DATEIEN. 3.1 Ordner Ordner und Dateien PC-EINSTEIGER 3 ORDNER UND DATEIEN Themen in diesem Kapitel: Erstellung von Ordnern bzw Dateien Umbenennen von Datei- und Ordnernamen Speicherung von Daten 3.1 Ordner Ordner sind wie

Mehr

4 Aufzählungen und Listen erstellen

4 Aufzählungen und Listen erstellen 4 4 Aufzählungen und Listen erstellen Beim Strukturieren von Dokumenten und Inhalten stellen Listen und Aufzählungen wichtige Werkzeuge dar. Mit ihnen lässt sich so ziemlich alles sortieren, was auf einer

Mehr

Jederzeit Ordnung halten

Jederzeit Ordnung halten Kapitel Jederzeit Ordnung halten 6 auf Ihrem Mac In diesem Buch war bereits einige Male vom Finder die Rede. Dieses Kapitel wird sich nun ausführlich diesem so wichtigen Programm widmen. Sie werden das

Mehr

Updatehinweise für die Version forma 5.5.5

Updatehinweise für die Version forma 5.5.5 Updatehinweise für die Version forma 5.5.5 Seit der Version forma 5.5.0 aus 2012 gibt es nur noch eine Office-Version und keine StandAlone-Version mehr. Wenn Sie noch mit der alten Version forma 5.0.x

Mehr

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: 24.09.2014)

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: 24.09.2014) Handbuch NAFI Online-Spezial 1. Auflage (Stand: 24.09.2014) Copyright 2016 by NAFI GmbH Unerlaubte Vervielfältigungen sind untersagt! Inhaltsangabe Einleitung... 3 Kundenauswahl... 3 Kunde hinzufügen...

Mehr

2. Word-Dokumente verwalten

2. Word-Dokumente verwalten 2. Word-Dokumente verwalten In dieser Lektion lernen Sie... Word-Dokumente speichern und öffnen Neue Dokumente erstellen Dateiformate Was Sie für diese Lektion wissen sollten: Die Arbeitsumgebung von Word

Mehr

Physik & Musik. Stimmgabeln. 1 Auftrag

Physik & Musik. Stimmgabeln. 1 Auftrag Physik & Musik 5 Stimmgabeln 1 Auftrag Physik & Musik Stimmgabeln Seite 1 Stimmgabeln Bearbeitungszeit: 30 Minuten Sozialform: Einzel- oder Partnerarbeit Voraussetzung: Posten 1: "Wie funktioniert ein

Mehr

Grundlagen der Informatik

Grundlagen der Informatik Mag. Christian Gürtler Programmierung Grundlagen der Informatik 2011 Inhaltsverzeichnis I. Allgemeines 3 1. Zahlensysteme 4 1.1. ganze Zahlen...................................... 4 1.1.1. Umrechnungen.................................

Mehr

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER Inhalt 1 Einleitung... 1 2 Einrichtung der Aufgabe für die automatische Sicherung... 2 2.1 Die Aufgabenplanung... 2 2.2 Der erste Testlauf... 9 3 Problembehebung...

Mehr

Abschluss Version 1.0

Abschluss Version 1.0 Beschreibung Der Abschluss wird normalerweise nur einmal jährlich durchgeführt. Dieses Tech-Note soll helfen, diesen doch seltenen aber periodisch notwendigen Vorgang problemlos durchzuführen. Abschlussvarianten

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 12.01.2012 INSTITUT FÜR THEORETISCHE 0 KIT 12.01.2012 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der Informatik

Mehr

Tevalo Handbuch v 1.1 vom 10.11.2011

Tevalo Handbuch v 1.1 vom 10.11.2011 Tevalo Handbuch v 1.1 vom 10.11.2011 Inhalt Registrierung... 3 Kennwort vergessen... 3 Startseite nach dem Login... 4 Umfrage erstellen... 4 Fragebogen Vorschau... 7 Umfrage fertigstellen... 7 Öffentliche

Mehr

Inhalt. Allgemeine Einführung. Argumentationsvermögen. Räumliches Vorstellungsvermögen. Begabungen und Fähigkeiten messen

Inhalt. Allgemeine Einführung. Argumentationsvermögen. Räumliches Vorstellungsvermögen. Begabungen und Fähigkeiten messen Beispielheft Inhalt Allgemeine Einführung Test Eins: Test Zwei: Test Drei: Test Vier: Test Fünf: Argumentationsvermögen Auffassungsvermögen Zahlenvermögen Sprachverständnis Räumliches Vorstellungsvermögen

Mehr

Pflegende Angehörige Online Ihre Plattform im Internet

Pflegende Angehörige Online Ihre Plattform im Internet Pflegende Angehörige Online Ihre Plattform im Internet Wissen Wichtiges Wissen rund um Pflege Unterstützung Professionelle Beratung Austausch und Kontakt Erfahrungen & Rat mit anderen Angehörigen austauschen

Mehr

Speicher in der Cloud

Speicher in der Cloud Speicher in der Cloud Kostenbremse, Sicherheitsrisiko oder Basis für die unternehmensweite Kollaboration? von Cornelius Höchel-Winter 2013 ComConsult Research GmbH, Aachen 3 SYNCHRONISATION TEUFELSZEUG

Mehr

Wie man Registrationen und Styles von Style/Registration Floppy Disketten auf die TYROS-Festplatte kopieren kann.

Wie man Registrationen und Styles von Style/Registration Floppy Disketten auf die TYROS-Festplatte kopieren kann. Wie man Registrationen und Styles von Style/Registration Floppy Disketten auf die TYROS-Festplatte kopieren kann. Einleitung Es kommt vor, dass im Handel Disketten angeboten werden, die Styles und Registrationen

Mehr

EasyWk DAS Schwimmwettkampfprogramm

EasyWk DAS Schwimmwettkampfprogramm EasyWk DAS Schwimmwettkampfprogramm Arbeiten mit OMEGA ARES 21 EasyWk - DAS Schwimmwettkampfprogramm 1 Einleitung Diese Präsentation dient zur Darstellung der Zusammenarbeit zwischen EasyWk und der Zeitmessanlage

Mehr

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden. In einer Website haben Seiten oft das gleiche Layout. Speziell beim Einsatz von Tabellen, in denen die Navigation auf der linken oder rechten Seite, oben oder unten eingesetzt wird. Diese Anteile der Website

Mehr

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:

Mehr

1. Was ihr in dieser Anleitung

1. Was ihr in dieser Anleitung Leseprobe 1. Was ihr in dieser Anleitung erfahren könnt 2 Liebe Musiker, in diesem PDF erhaltet ihr eine Anleitung, wie ihr eure Musik online kostenlos per Werbevideo bewerben könnt, ohne dabei Geld für

Mehr

Kapitel 4. Einführung in den Scannergenerator Flex. Einführung in den Scannergenerator Flex Wintersemester 2008/09 1 / 9

Kapitel 4. Einführung in den Scannergenerator Flex. Einführung in den Scannergenerator Flex Wintersemester 2008/09 1 / 9 Kapitel 4 Einführung in den Scannergenerator Flex Einführung in den Scannergenerator Flex Wintersemester 2008/09 1 / 9 Generatoren für die lexikalische Analyse Scannergeneratoren werden eingesetzt um die

Mehr

Konfiguration VLAN's. Konfiguration VLAN's IACBOX.COM. Version 2.0.1 Deutsch 01.07.2014

Konfiguration VLAN's. Konfiguration VLAN's IACBOX.COM. Version 2.0.1 Deutsch 01.07.2014 Konfiguration VLAN's Version 2.0.1 Deutsch 01.07.2014 In diesem HOWTO wird die Konfiguration der VLAN's für das Surf-LAN der IAC-BOX beschrieben. Konfiguration VLAN's TITEL Inhaltsverzeichnis Inhaltsverzeichnis...

Mehr

iphone-kontakte zu Exchange übertragen

iphone-kontakte zu Exchange übertragen iphone-kontakte zu Exchange übertragen Übertragen von iphone-kontakten in ein Exchange Postfach Zunächst muss das iphone an den Rechner, an dem es üblicherweise synchronisiert wird, angeschlossen werden.

Mehr

Installation der SAS Foundation Software auf Windows

Installation der SAS Foundation Software auf Windows Installation der SAS Foundation Software auf Windows Der installierende Benutzer unter Windows muss Mitglied der lokalen Gruppe Administratoren / Administrators sein und damit das Recht besitzen, Software

Mehr

3. GLIEDERUNG. Aufgabe:

3. GLIEDERUNG. Aufgabe: 3. GLIEDERUNG Aufgabe: In der Praxis ist es für einen Ausdruck, der nicht alle Detaildaten enthält, häufig notwendig, Zeilen oder Spalten einer Tabelle auszublenden. Auch eine übersichtlichere Darstellung

Mehr

Projektmanagement in der Spieleentwicklung

Projektmanagement in der Spieleentwicklung Projektmanagement in der Spieleentwicklung Inhalt 1. Warum brauche ich ein Projekt-Management? 2. Die Charaktere des Projektmanagement - Mastermind - Producer - Projektleiter 3. Schnittstellen definieren

Mehr

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung

Anleitung zur Daten zur Datensicherung und Datenrücksicherung. Datensicherung Anleitung zur Daten zur Datensicherung und Datenrücksicherung Datensicherung Es gibt drei Möglichkeiten der Datensicherung. Zwei davon sind in Ges eingebaut, die dritte ist eine manuelle Möglichkeit. In

Mehr

Über die Internetseite www.cadwork.de Hier werden unter Download/aktuelle Versionen die verschiedenen Module als zip-dateien bereitgestellt.

Über die Internetseite www.cadwork.de Hier werden unter Download/aktuelle Versionen die verschiedenen Module als zip-dateien bereitgestellt. Internet, Codes und Update ab Version 13 Um Ihnen einen möglichst schnellen Zugang zu den aktuellsten Programmversionen zu ermöglichen liegen Update-Dateien für Sie im Internet bereit. Es gibt drei Möglichkeiten

Mehr

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen 9 3 Web Services 3.1 Überblick Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen mit Hilfe von XML über das Internet ermöglicht (siehe Abb.

Mehr

Guide DynDNS und Portforwarding

Guide DynDNS und Portforwarding Guide DynDNS und Portforwarding Allgemein Um Geräte im lokalen Netzwerk von überall aus über das Internet erreichen zu können, kommt man um die Themen Dynamik DNS (kurz DynDNS) und Portweiterleitung(auch

Mehr