Einführung in die automatische Spracherkennung. SS 2007 Klaus Kasper
|
|
- Dominic Beltz
- vor 6 Jahren
- Abrufe
Transkript
1 Einführung in die automatische Spracherkennung SS 27 Klaus Kasper
2 Praktikum Montag, 16:h 19:15h (Y-Raster) Ort: D15/22 erste Veranstaltung: Programmiersprache Ihrer Wahl (C/C ++ /C#, Java, ) Zulassungsvoraussetzung für Klausur 2
3 Klausur Klausur: , 12:h, D14/44 Anmeldeschluss: Abmeldeschluss:
4 Literatur Schukat-Talamazzini, Ernst Günther; Automatische Spracherkennung, Vieweg, Deller, John R., Proakis, John G., Hansen, John H. L.; Discrete-Time Processing of Speech Signals, Macmillan, Paulus, Dietrich W. R., Hornegger, Joachim; Applied Pattern Recognition; Vieweg, 23. Eppinger, Bernd, Herter, Eberhard; Sprachverarbeitung; Hanser; Bishop, Christopher M.; Neural Networks for Pattern Recognition; Oxford University Press;
5 Themen der Vorlesung Digitalisierung analoger Signale Parametrisierung von Sprachsignalen Fourier-Transformation Psychoakustik Cepstral-Analyse Hidden Markov Modelle (HMM) Effiziente Decodierung (Viterbi-Algorithmus) Künstliche Neuronale Netze (KNN) oder Sprachsynthese 5
6 Themen des Praktikums Umgang mit binären Dateien (.wav) Implementierung einer einfachen DFT Aufnahme von Sprachsignalen Berechnung von MFC mit HTK Aufbau eines Spracherkenners mit HTK 6
7 Historie der Leitbilder Vorleseautomat Phonetische Schreibmaschine Dialogautomatisierung Multimodale Kommunikation Intelligente mobile Begleiter 7
8 Intelligenter mobiler Begleiter 8
9 Digitale Sprachverarbeitung Sprachsynthese Spracherkennung Sprachverstehen Sprachcodierung Sprecherverifikation 9
10 Sprachcodierung Ziel: Effiziente digitale Repräsentation von Sprachsignalen Anwendung: Mobilfunk (GSM) 1
11 Sprachsynthese Ziel: Generierung von Sprachsignalen auf der Basis von Text (Sprechen, Vorlesen) Anwendung: Vorlesen ( , Navigation etc.), Hilfsmittel 11
12 Spracherkennung Ziel: Generierung von Text auf der Basis von Sprachsignalen (Hören) Anwendung: phonetische Schreibmaschine, Dialogautomatisierung 12
13 Sprecherverifikation Ziel: Biometrisches Verfahren zur Authentifikation einer Person an Hand ihrer Stimme. Anwendung: Erteilung eines Zugangs ohne PIN (Password-Reset, Vertragsauskunft, ) 13
14 Sprachverstehen Ziel: Erfassen der Aussage einer sprachlichen oder textlichen Äußerung. Anwendung: Basis für Übersetzung, Disambiguierung (Auflösung von Mehrdeutigkeiten) 14
15 Historie der Kommerzialisierung 8er: IBM, Bell Laboratories 9er: weltweit Forschung und Entwicklung (Philips, TK Unternehmen, IBM) Diktiersysteme: IBM, Philips, Dragon Naturally Speaking Sprachkonzern: Lernout & Hauspie (Belgien, L&H) IPOs: Nuance (Stanford), SpeechWorks (MIT) aktuell: ScanSoft (OmniPage, Zukäufe: Teile L&H, Philips, SpeechWorks, Nuance) Konkurrenten: lokale Anbieter, IBM 15
16 Einsatzgebiete von Spracherkennern Diktiersysteme Interactive Voice Response (IVR) Call Center Voice Portal Embedded Systeme Mobiltelefon PDA Navigationssystem 16
17 Techniken zur Spracherkennung Dynamic Time Warp (DTW) Hidden Markov Modelle (HMM) Künstliche Neuronale Netzwerke (KNN) Linguistik auf höherer Ebene 17
18 Variabilität von Sprachsignalen 18
19 Parametrisierung Sieben 19
20 Beispiel: Fahrplanauskunft Rufnummer: 8/
21 Prinzipieller Aufbau von Spracherkennern Signalanalyse Akustische Bewertung Decodierung Physikalische Modelle HMM/KNN Sprachmodelle Wortmodelle Phonemmodelle Sprache Merkmalsextraktion Merkmale Merkmalsbewertung Scores Phonetisch/ Linguistische Bewertung Wörter 21
22 Digitalisierung 22
23 Wie wird ein Audiosignal digitalisiert? zeitliche Abtastung des analogen Signals Quantisierung der Messwerte 23
24 Abtastung Das analoge Signal wird i.a. in äquidistanten Abständen abgetastet. Die auf diese Weise gefundene Repräsentation soll eine möglichst vollständige Darstellung des analogen Signals liefern. Bei einer evtl. Rekonstruktion des analogen Signals soll dieses als transparent wahrgenommen werden. 24
25 Analoges Signal,6,4,2 -,2 -,4 -,6,4,3,2,1 -,1,2,4,6,8 1 1,2 -,2 -,3 25
26 Abtastung des Signals I,4,3,2,1 -,1,2,4,6,8 1 1,2 -,2 -,3,4,3,2,1,2,4,6,8 1 1,2 -,1 -,2 -,3 26
27 Abtastung des Signals II,4,3,2,1 -,1,2,4,6,8 1 1,2 -,2 -,3,3,2,1 -,1,2,4,6,8 1 1,2 -,2 -,3 27
28 Abtasttheorem Die Abtastfrequenz muss mindestens doppelt so hoch sein wie die maximale Frequenz, die im abgetasteten Signal enthalten ist (Shannon). Zur Gewährleistung dieser Bedingung muss das Eingangssignal entsprechend gefiltert werden (Tiefpass). 28
29 Typische Abtastraten DAT 48 khz CD 44.1 khz Breitbandsprache 16 khz Diktiersysteme khz ISDN 8 khz 29
30 Quantisierung Der Wertebereich des Signals wird in Intervalle oder Zellen eingeteilt, die durch einen Wert oder Vektor repräsentiert werden. Das Eingangsignal wird durch den Wert oder Vektor quantisiert, der das Intervall bzw. die Zelle der das Eingangssignal zugeordnet werden kann, repräsentiert. 3
31 Original,4,3,2,1 -,1,2,4,6,8 1 1,2 -,2 -,3 Quantisiert (1 bit) Intervalle,6 1 1,4,2,5,2,4,6,8 1 1, ,2 -,5 -,4 -, Untere Grenze Obere Grenze Repräsentant 31
32 Original,4,3,2,1 -,1,2,4,6,8 1 1,2 -,2 -,3 Quantisiert (2 bit) Intervalle (2 bit),3 1 1,2,75,5,5,1,25 -,1,2,4,6,8 1 1, ,25 -,5 -,5 -,2 -,75 -, Untere Grenze Obere Grenze Repräsentant 32
33 Original,4,3,2,1 -,1,2,4,6,8 1 1,2 -,2 -,3 Quantisiert (3 bit),5,4,3,2,1,2,4,6,8 1 1,2 -,1 -,2 Intervalle (3 bit) 1 1,875,75,75,625,5,5,375,25,25, , ,25 -,25 -,375 -,5 -,5 -,625 -,75 -,75 -, Untere Grenze Obere Grenze Repräsentant 33
34 Original,4,3,2,1 -,1,2,4,6,8 1 1,2 -,2 -,3 Quantisiert (8 bit) 1,5 Intervalle (8 bit),4 1,3,2,5,1,2,4,6,8 1 1,2 -, ,5 -,2-1 -,3-1,5 34
35 Original,4,3,2,1 -,1,2,4,6,8 1 1,2 -,2 -,3 Quantisiert (8 bit),4,3,2,1,2,4,6,8 1 1,2 -,1 -,2 -,3 35
36 Optimale Quantisierung Die Intervalle bzw. Zellen werden so gewählt, dass bei gegebener Anzahl der Quantisierungsstufen bzgl. einer gegebenen Datenmenge der Quantisierungsfehler minimal wird. In diesen Prozess geht insbesondere die Verteilungsdichte der gegebenen Datenmenge ein. 36
37 Ziel Das Ziel ist die Realisierung einer digitalen Repräsentation eines analogen Signals, die für den Betrachter oder bzgl. des Analysesystems denselben Informationsgehalt hat wie das analoge Signal. Beispiele: CD, MPEG 37
38 Optimierte Quantisierung für Sprache Das menschliche Gehör nimmt Unterschiede bei leisen Signalen stärker wahr als bei lauten. Bei gleichförmiger Quantisierung (konstante Größe der Intervalle) werden Quantisierungsfehler daher bei leisen Signalen deutlicher wahrgenommen als bei lauten. Für eine optimierte Quantisierung werden die Intervallgrößen mit Hilfe von Segmenten unterschiedlicher Steigung gewählt. Mit 8 Bit gelingt eine Quantisierung, die der Qualität einer gleichförmigen Quantisierung mit 12 Bit entspricht. Amerika, Japan: mu-law (15 Segmente); Europa: a- law (13 Segmente) 38
39 Tabelle a-law a-law short int a-law short int
40 a-law Codierung (8 Bit)
41 Beschränkungen Abtastung bedingt eine Beschränkung der maximalen Frequenz des analogen Signals Quantisierung Fehler durch die Quantisierung der Amplitude kann durch den Signal-Rausch-Abstand (SNR) bewertet werden: SNR = 2 xn [ ] 1 * log ( xn % [ ] xn [ ]) 2 41
42 Digitalisierung eines analogen Signals Analog Digital Sprache Vorverstärker und Tiefpaß S&H A/D Signalverarbeitung zeitkontinuierlich zeitdiskret amplitudenquantisiert 42
43 Analog-Digital (AD) - Wandlung analoges Mikrofonsignal Verstärker Tiefpassfilter Abtastung Quantisierung der Amplituden Information in Header Speicherung der Signalwerte in Datei 43
44 Dateiformate pcm, raw: ohne Header wav: Microsoft au: Sun Microsystems vox: Dialogic, ADPCM Codierung mp3: MPEG Layer 3 beachte: byte-order 44
45 Praktikum 1. Bitte nehmen Sie ein Audiofile mit einer Abtastrate von 16 Hz und 16 bit Quantisierung auf. Legen Sie das File bitte im wav-format ab. 2. Bitte modifizieren Sie im Header des Files die Abtastrate auf 8 Hz. Beschreiben Sie den daraus resultierenden Höreindruck. 3. Die Quantisierung der Amplituden soll auf 1 bit durch Modifikation der abgelegten Signalwerte geändert werden. 3.a Bitte arbeiten Sie einen Vorschlag zur Durchführung der Aufgabe aus. 3.b Bitte implementieren Sie die ausgearbeitete Lösung. 3.c Beschreiben Sie bitte den resultierenden Höreindruck. 45
46 Header einer.wav-datei (Struktur) Length description String 4 Byte < Magic Number RIFF > RIFF 4 Byte < size of file > 4 Byte < Magic Number WAVE > WAVE chunks 4 Byte < ID of chunk > f.e. fmt 4 Byte < size of chunk > data 4 Byte < ID of chunk > f.e. fact 4 Byte < size of chunk > data more chunks 46
47 Header einer.wav-datei (Details) Length description name chunk: header information 4 Byte < ID of header > fmt 4 Byte < size of header segment (Byte) > 2 Byte < format tag > 2 Byte < number of channels > 4 Byte < number of samples per second > 4 Byte < number of bytes per second > more informationda chunk: audio data 4 Byte < ID of data > data 4 Byte < size of data segment (Byte) > audio data (f.e. 2 Byte/sample) 47
Multimediale Werkzeuge, Audio: Formate, Tools. -Sound/Audio Objekte. Formate, Beispiele:
Multimediale Werkzeuge, Audio: Formate, Tools -Sound/Audio Objekte Formate, Beispiele: - Mp3 (Kurz für MPEG1/2 Layer 3) - PCM (z.b. Wave Datei), übliche Formate: CD: 44100 HZ Abtastrate, 16 Bits/Abtastwert.
MehrWichtige Eigenschaft: zeitliche Abnahme der Schallintensität. Akustische Ereignisse sind zeitliche Phänomene mit Anfang und Ende
Schallaufzeichnung Wichtige Eigenschaft: zeitliche Abnahme der Schallintensität Akustische Ereignisse sind zeitliche Phänomene mit Anfang und Ende Akustische Ereignisse sind vergänglich Akustische Ereignisse
MehrModulation. Kommunikationstechnik, SS 08, Prof. Dr. Stefan Brunthaler 104
Modulation Kommunikationstechnik, SS 08, Prof. Dr. Stefan Brunthaler 104 Datenfernübertragung I Über kurze Entfernungen können Daten über Kupferkabel übertragen werden, indem jedes Bit mit einer positiven
MehrÜ bung GIT- Teil Nachrichtentechnik, 17.11.2015
Ü bung GIT- Teil Nachrichtentechnik, 17.11.2015 1 OSI Schichtenmodell Systeme der Nachrichtentechnik werden häufig mittels des OSI-Referenzmodells charakterisiert. a) Benennen Sie die Schichten des OSI-Referenzmodells!
MehrDigitale Bildverarbeitung (DBV)
Digitale Bildverarbeitung (DBV) Prof. Dr. Ing. Heinz Jürgen Przybilla Labor für Photogrammetrie Email: heinz juergen.przybilla@hs bochum.de Tel. 0234 32 10517 Sprechstunde: Montags 13 14 Uhr und nach Vereinbarung
MehrSimulink: Einführende Beispiele
Simulink: Einführende Beispiele Simulink ist eine grafische Oberfläche zur Ergänzung von Matlab, mit der Modelle mathematischer, physikalischer bzw. technischer Systeme aus Blöcken mittels plug-and-play
MehrDatenübertragung. Vorlage für den Informatikunterricht. Mag. Otto Dolinsek
Mag. Otto Dolinsek Übertragungsprinzip ISDN ADSL Mobilfunk Klassisches Übertragungsprinzip Beim klassischen Übertragungsprizip im Fernsprechnetz werden Daten analog übertragen. Die Frequenz der menschlichen
Mehr2. Digitale Codierung und Übertragung
2. Digitale Codierung und Übertragung 2.1 Informationstheoretische Grundlagen 2.2 Speicherbedarf und Kompression 2.3 Digitalisierung, Digitale Medien Ludwig-Maximilians-Universität München Prof. Hußmann
MehrEinführung in die automatische Spracherkennung
Einführung in die automatische Spracherkennung Hans-Günter Hirsch http://dnt.kr.hs-niederrhein.de http://dnt.kr.hs-niederrhein.de/asr14/ email: hans-guenter.hirsch@hs-niederrhein.de Folie 1 Persönlicher
MehrMesstechnik. Gedächnisprotokoll Klausur 2012 24. März 2012. Es wurde die Kapazität von 10 Kondensatoren gleicher Bauart gemessen:
Messtechnik Gedächnisprotokoll Klausur 2012 24. März 2012 Dokument erstellt von: mailto:snooozer@gmx.de Aufgaben Es wurde die Kapazität von 10 Kondensatoren gleicher Bauart gemessen: Index k 1 2 3 4 5
MehrDigitale Sprach- und Audiosignalverarbeitung
Digitale Sprach- und Audiosignalverarbeitung Hans-Günter Hirsch Digitale Nachrichtentechnik http://dnt.kr.hs-niederrhein.de email: hans-guenter.hirsch@hs-niederrhein.de Webserver: http:// dnt.kr.hs-niederrhein.de/dsav07/
MehrEDV-Anwendungen im Archivwesen II
EDV-Anwendungen im Archivwesen II 070472 UE WS08/09 Grundlagen der Digitalisierung Überblick Allgemeine Grundlagen der Digitalisierung anhand der Ton-Digitalisierung Abtastrate (Samplerate) Wortlänge (Bitrate)
MehrEntwicklung einer digitalen Übertragungsstrecke mit Einplatinencomputern zur Signalanalyse
Entwicklung einer digitalen mit Einplatinencomputern zur Signalanalyse Philipp Urban Jacobs p.1 Inhalt 1 Motivation 2 Grundlagen 3 Umsetzung 4 Verifizierung 5 Fazit p.2 Motivation Signalgenerator ADC Gertboard
MehrVAD - Voice Activity Detection -
VAD - - erstellt: Robert Schaar s63012 erstellt: Robert Schaar s63012 Mensch-Maschine-Robotik 1. Einleitung 2. Aufbau des Algorithmus 2.1. allgemeiner Aufbau 2.2. Fourier-Transformation 2.3. Short-Time
MehrEinführung in die Robotik Analog-Digital und Digital-Analog Wandler
Einführung in die Robotik Analog-Digital und Digital-Analog Wandler Mohamed Oubbati Institut für Neuroinformatik Tel.: (+49) 73 / 5 2453 mohamed.oubbati@uni-ulm.de 3.. 22 Analog-Digital (A/D) Wandler Digital
MehrSignalübertragung und -verarbeitung
ILehrstuhl für Informationsübertragung Schriftliche Prüfung im Fach Signalübertragung und -verarbeitung 6. Oktober 008 5Aufgaben 90 Punkte Hinweise: Beachten Sie die Hinweise zu den einzelnen Teilaufgaben.
MehrKlausur zur Vorlesung Signale und Systeme
Name: 10. Juli 2008, 11.00-13.00 Uhr Allgemeine Hinweise: Dauer der Klausur: Zugelassene Hilfsmittel: 120 min, 2 Zeitstunden Vorlesungsmitschrift, Mitschrift Übungen, Skript, handgeschriebene 2-seitige
MehrModulationsverfahren
Funktions- und Fehleranalyse Herr Rößger 2011 2012 Modulationsverfahren Definition: Modulation ist die Beeinflussung einer Trägerschwingung durch eine Information. Trägerschwingung: Informationsparameter:
MehrEinführung in die Informatik und Medieninformatik
Name, Vorname Matrikelnummer Klausur zur Vorlesung Einführung in die Informatik und Medieninformatik LVNr. 36 600, WS 2012/13, im Studiengang Medieninformatik Dienstag, 12. Februar 2013 16:00 18:00 Uhr
MehrDigitalisierung als Grundlage des Informationszeitalters
Digitalisierung als Grundlage des Informationszeitalters Prof. Dr.-Ing. Eckehard Steinbach Lehrstuhl für Kommunikationsnetze, Fachgebiet Medientechnik Technische Universität München 80290 München Email:
MehrNANO III - MSR. Signalabtastung Analog Digital Converter (ADC) Digital Analog Converter (DAC) Themen: DAC
NANO III - MSR Themen: Signalabtastung Analog Digital Converter (ADC) A ADC D Digital Analog Converter (DAC) D DAC A Nano III MSR Physics Basel, Michael Steinacher 1 Signalabtastung Praktisch alle heutigen
Mehr2. Eigenschaften digitaler Nachrichtensignale
FH OOW / Fachb. Technik / Studiengang Elektrotechnik u. Automatisierungstechnik Seite 2-2. Eigenschaften digitaler Nachrichtensignale 2. Abgrenzung zu analogen Signalen Bild 2.- Einteilung der Signale
MehrElektrische Messtechnik, Labor Sommersemester 2014
Institut für Elektrische Messtechnik und Messsignalverarbeitung Elektrische Messtechnik, Labor Sommersemester 2014 Rechnerunterstützte Erfassung und Analyse von Messdaten Übungsleiter: Dipl.-Ing. GALLIEN
MehrPraktikum Computational Intelligence 2 Ulrich Lehmann, Johannes Brenig, Michael Schneider
Praktikum Computational Intelligence 2 Ulrich Lehmann, Johannes Brenig, Michael Schneider Versuch: Training des XOR-Problems mit einem Künstlichen Neuronalen Netz (KNN) in JavaNNS 11.04.2011 2_CI2_Deckblatt_XORbinaer_JNNS_2
MehrAgenda MPEG-2 DVB / MHP. Berlin, 19.4.2005 2/ 20. LV: Interaktives Digitales Fernsehen TFH Berlin Dipl.-Ing. Henrik Pantle
Berlin, 19.4.2005 Agenda MPEG-2 DVB / MHP 2/ 20 Übertragungswege für interaktives TV 3/ 20 Übertragungswege für interaktives TV Broadcast Channel Überträgt (i)tv-inhalte in die Haushalte 1 zun Verbindung
MehrVOIP VOICE OVER IP. Vortrag von Michael Mayer an der Rudolf-Diesel-Fachschule. 01.05.07 VOIP - Michael Mayer - Rudolf-Diesel-Fachschule
VOIP VOICE OVER IP Vortrag von Michael Mayer an der Rudolf-Diesel-Fachschule 1 VOIP VOIP steht für Voice-over-IP und hat sich als Standard für eine neuem Art des Telefonierens abgezeichnet. Viele Internetprovider
Mehr2 Darstellung von Zahlen und Zeichen
2.1 Analoge und digitale Darstellung von Werten 79 2 Darstellung von Zahlen und Zeichen Computer- bzw. Prozessorsysteme führen Transformationen durch, die Eingaben X auf Ausgaben Y abbilden, d.h. Y = f
MehrMATLAB Kurs 2010 Teil 2 Eine Einführung in die Frequenzanalyse via MATLAB
MATLAB Kurs 2010 Teil 2 Eine Einführung in die via MATLAB 26.11.2010 & 03.12.2010 nhaltsverzeichnis 1 2 3 Ziele Kurze Einführung in die -Analyse Ziele Kurze Einführung in die -Analyse MATLAB Routinen für
MehrSeminar Digitale Signalverarbeitung
Universität Koblenz-Landau Institut für integrierte aturwissenschaften Abteilung Physik Dr. Merten Joost Seminar Digitale Signalverarbeitung Thema: Fast Fourier Transformation Praktische Durchführung einer
MehrVersuch 3: Anwendungen der schnellen Fourier-Transformation (FFT)
Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT) Ziele In diesem Versuch lernen Sie zwei Anwendungen der Diskreten Fourier-Transformation in der Realisierung als recheneffiziente schnelle
MehrDigitale Signalverarbeitung Juli 2004
Westfälische Wilhelms-Universität Münster Institut für Angewandte Physik xperimentelle Übungen für Fortgeschrittene Digitale Signalverarbeitung Juli 2004 In der Digitaltechnik ist es nicht möglich, physikalische
MehrKapitel 4 Leitungscodierung
Kapitel 4 Leitungscodierung Prof. Dr. Dirk W. Hoffmann Hochschule Karlsruhe w University of Applied Sciences w Fakultät für Informatik Übersicht Quelle Senke Kompression Huffman-, Arithmetische-, Lempel-Ziv
MehrMusterlösung zur Aufgabe A4.1
Musterlösung zur Aufgabe A4.1 a) Mit N = 8 Bit können insgesamt 2 8 Quantisierungsintervalle dargestellt werden M = 256. b) Nummeriert man die Quantisierungsintervalle von 0 bis 255, so steht die Bitfolge
MehrOpen-Source Sprachsteuerung für die Heimautomatisierung
G Exposé zur Bachelorarbeit im Studiengang Informatik (BCS) Open-Source Sprachsteuerung für die Heimautomatisierung von Bojan Krstic Erstgutachter: Zweitgutachter: Prof. Dr. Karl Jonas Prof. Dr. Stefan
MehrZeitdiskrete, digitale Filter und schnelle Fourier-Transformation (FFT)
Zeitdiskrete, digitale Filter und schnelle Fourier-Transformation (FFT) Inhaltsverzeichnis 1 Allgemeines Filter... 2 2 Filter auf dem Signalprozessor... 2 3 Zusammenhang Zeitsignal und Frequenzspektrum...
MehrV 322 Überlagerung und Modulation /AD-Wandler
V 322 Überlagerung und Modulation /AD-Wandler 1. Aufgaben 1.1 Digitalisieren Sie ein analoges Signal und experimentieren mit der Abtastrate und Sampleanzahl. 1.2 Überlagern Sie 2 Frequenzen und beobachten
MehrMusic Information Retrieval - automatische Genre-Klassifikation
Music Information Retrieval - automatische Genre-Klassifikation Julian Hartmann & Christoph Sünderkamp Institut für Informatik, Seminar Mustererkennung im Alltag 8./10.06.2005 Gliederung 1. Einordnung
MehrModul 0: Einführung Basiswissen Multimedia. Modul 1: Information und Kommunikation (IuK)
Inhaltsverzeichnis Modul 0: Einführung Basiswissen Multimedia 1 Was ist Multimedia? 15 2 Wer braucht Wissen" über Multimedia? Warum? 17 3 Wozu Multimedia? 19 4 Wozu Multimedia über das Internet? 21 Modul
MehrTon. Physikalische Grundlagen Digital Audio. Grundlagen MPEG
Ton Physikalische Grundlagen Digital Audio Grundlagen Audiodatenkompression Grundlagen MPEG Audiokompression: mp3 1. Physikalische Grundlagen Schallwellen haben wie jede andere Welle vier Eigenschaften:
MehrAufgabe 3. Signal Processing and Speech Communication Lab. Graz University of Technology
Signal Processing and Speech Communication Lab. Graz University of Technology Aufgabe 3 Senden Sie die Hausübung bis spätestens 15.06.2015 per Email an hw1.spsc@tugraz.at. Verwenden Sie MatrikelNummer1
MehrWichtige Eigenschaft: zeitliche Abnahme der Schallintensität. Akustische Ereignisse müssen Jetzt oder Nie gehört werden
Audiodesign Aufzeichnung akustischer Ereignisse Wichtige Eigenschaft: zeitliche Abnahme der Schallintensität Akustische Ereignisse sind zeitliche Phänomene mit Anfang und Ende Akustische Ereignisse sind
MehrQuelle: www.omekinteractive.com. Ganzkörper- Gestensteuerung. Mit 3-D Sensor (z.b. MS Kinect, ASUS Xtion) Zwischenpräsentation 21.05.
Quelle: www.omekinteractive.com Ganzkörper- 1 Gestensteuerung Mit 3-D Sensor (z.b. MS Kinect, ASUS Xtion) Zwischenpräsentation 2 Gliederung Motivation Wozu braucht man eine Gestensteuerung? Aktuelle Anwendungen
MehrDatenfluss bei Voice-over-IP. Einflüsse auf Sprachqualität. Ende-zu-Ende-Verzögerungszeit (Delay) Schwankungen der Verzögerungszeit (Jitter) Sender
Sender Quelle Datenfluss bei Voice-over-IP Kodieren Paketieren Verzögerungen verlorene Pakete begrenzte Datenrate Sende- Puffer Einflüsse auf Sprachqualität Verzögerungszeit Delay Schwankungen der Verzögerungszeit
MehrFebruar 06 Uni Basel Seminar Künstliche Intelligenz Stefan Pauwels Emotion Recognition :-)
Emotion Recognition :-) Themenüberblick Emotionen Emotion Recognition Speech Facial Expression Mulitmodal Emotion Recognition Integrationsmöglichkeiten der zwei Kanäle Emotionen: Grundlagen Konsens in
MehrModulationsanalyse. Amplitudenmodulation
10/13 Die liefert Spektren der Einhüllenden von Teilbändern des analysierten Signals. Der Anwender kann damit Amplitudenmodulationen mit ihrer Frequenz, ihrer Stärke und ihrem zeitlichen Verlauf erkennen.
MehrÜbung 1 zur Vorlesung SYSTEMORIENTIERTE INFORMATIK HW-,SW-CODESIGN
Fakultät Informatik, Institut für Angewandte Informatik, Professur Technische Informationssysteme Übung 1 zur Vorlesung SYSTEMORIENTIERTE INFORMATIK HW-,SW-CODESIGN Übungsleiter: Dr.-Ing. H.-D. Ribbecke
MehrEmpfindlichkeit und Rauschmaß eines DVB T Sticks
Empfindlichkeit und Rauschmaß eines DVB T Sticks Messung kritischer Spezifikationen eines Salcar Stick DVB T RTL 2832U&R820T SDR Salcar Stick, oder ähnlich Blockschaltbild des R820T Tuners Aufbau für Empfindlichkeitsmessung:
MehrEinführung in die Wirtschaftsinformatik. Daten, Information, Wissen. IT works. Klaus Mairon 2015 1
Einführung in die Daten, Information, Wissen IT works. Klaus Mairon 2015 1 Agenda è è Aufbau und Arbeitsweise Arten von n / Kategorien Beurteilung der Leistungsfähigkeit von n Netzwerke Klaus Mairon 2015
MehrStefan Gössner 21.09.2004 Multimedia: Eine Einführung. Was ist Multimedia? Was ist ein Medium? Was ist Multimedia? Multimedia?
1 of 7 Stefan Gössner 21.09.2004 Multimedia: Eine Einführung Stefan Gössner Was ist Multimedia? vielverwendeter Begriff hat was mit Computern zu tun? Multi + Media? Was ist ein Medium? Mittel zur Verbreitung
MehrDFT / FFT der Titel der Präsentation wiederholt (Ansicht >Folienmaster) Dipl.-Ing. Armin Rohnen, Fakultät 03, rohnen@hm.edu
1 Grundlagen Abtasttheorem Fenster Zeit - Frequenzauflösung Pegelgenauigkeit Overlap Mittelung 2 2 volle Schwingungen 32 Abtastwerte Amplitude = 1 Pascal Signallänge = 1 Sekunde Eine Frequenzline bei 2
MehrSuche und Navigation in Medienarchiven mittels Audio Mining
Suche und Navigation in Medienarchiven mittels Audio Mining Dr. Joachim Köhler Abteilungsleiter NetMedia Fraunhofer-Institut for Intelligent Analysis and Information Systems 1 Fraunhofer-Gesellschaft Fraunhofer
MehrBildverarbeitung Herbstsemester 2012. Fourier-Transformation
Bildverarbeitung Herbstsemester 2012 Fourier-Transformation 1 Inhalt Fourierreihe Fouriertransformation (FT) Diskrete Fouriertransformation (DFT) DFT in 2D Fourierspektrum interpretieren 2 Lernziele Sie
MehrREGA DAC Bedienungsanleitung Version 1.0
REGA DAC Bedienungsanleitung Version 1.0 REGA DAC Bedienungsanleitung Version 1.0 Seite 1 Einleitung Der Rega DAC ist ein D/A-Wandler mit 16/20/24 Bit bei 32 khz bis 192 khz mit integriertem, weiterentwickelten
MehrGrundlagen Anwendungen Quellen. Steganographie. Ingo Blechschmidt, Michael Hartmann LUGA. 4. Oktober 2006
Grundlagen Anwendungen Quellen Ingo Blechschmidt, Michael Hartmann LUGA 4. Oktober 2006 Grundlagen Anwendungen Quellen Inhalt 1 Grundlagen Definition der Beispiele für Historische Anwendungen der Abgrenzung
MehrTypo3 - Schulung: Fortgeschrittene I an der Hochschule Emden/Leer
HTML5 Video Player Der HTML5 Video Player ist eine Typo3 Extension und ermöglicht dem Redakteur das Einbetten von Videos mit Rückfall auf den Flashplayer. Die Extension nennt sich VideoJS - HTML5 Video
MehrNeue Dienste und Anwendungen für private, intelligente Kommunikationsnetzwerke
Labor für VoIP- und ISDN Kommunikationssysteme Neue Dienste und Anwendungen für private, intelligente Kommunikationsnetzwerke (Next Generation Service Capabilities for private intelligent Networks) Übersicht
MehrDazu werden so genannte Modulationstechniken verschiedenster Art angewandt.
5. Modulation Für die Uebertragung eines Nutzsignals über Leitungen oder durch die Luft muss das informationstragende Signal, das Nutzsignal, an die Eigenschaften des Uebertragungswegs angepasst werden.
MehrSDR# Software Defined Radio
SDR# Software Defined Radio Beispiel von DVB T USB Stick und SDR Receiver Frequenz 24 1700MHz Frequenz 0,1 2000MHz, mit Down Converter für KW Treiber und Software http://sdrsharp.com/#download 1 Nach dem
MehrWave-Datei-Analyse via FFT
Wave-Datei-Analyse via FFT Wave-Dateien enthalten gesampelte Daten, die in bestimmten Zeitabständen gespeichert wurden. Eine Fourier-Transformation über diesen Daten verrät das Frequenz-Spektrum der zugrunde
MehrSignale und Systeme. A1 A2 A3 Summe
Signale und Systeme - Prof. Dr.-Ing. Thomas Sikora - Name:............................... Vorname:.......................... Matr.Nr:.............................. Ergebnis im Web mit verkürzter Matr.Nr?
MehrElektrische Mess- und Prüftechnik Laborpraktikum. Signale im Zeit- und Frequenzbereich (FFT) USB-Oszilloskop. Testat:
Fachbereich Elektrotechnik / Informationstechnik Elektrische Mess- und Prüftechnik Laborpraktikum Versuch 2016-E ET(BA) SS 2016 Signale im Zeit- und Frequenzbereich (FFT) USB-Oszilloskop Set:... Studienrichtung:...
MehrVIDEO / AUDIO1. 16. Dezember 2005 Claudia Große, Britta Wartke. Ein Referat von Claudia Große und Britta Wartke
VIDEO / AUDIO1 Ein Referat von Claudia Große und Britta Wartke 1. Codec? Verfahren zur digitalen De-/Codierung von Daten und Signalen (coder und decoder) Verlustfreie Codierung kaum möglich, Einbußen bei
MehrNetzwerke - Bitübertragungsschicht (1)
Netzwerke - Bitübertragungsschicht (1) Theoretische Grundlagen Fourier-Analyse Jedes Signal kann als Funktion über die Zeit f(t) beschrieben werden Signale lassen sich aus einer (möglicherweise unendlichen)
MehrMessdatenerfassung und verarbeitung mit dem PC
Messdatenerfassung und verarbeitung mit dem PC 1. Einführung in das Themengebiet und Versuchsziel Die Erfassung und Bearbeitung von Messdaten findet heutzutage in vielen Bereichen mit Unterstützung leistungsfähiger
MehrBitte benennen Sie Ihre Dateien folgendermaßen:
Videodateien, die an IMD geliefert werden, müssen folgendem technischen Layout entsprechen (am Beispiel eines 30 Spots): Timecode 09:59:50:00 7 technischer Vorspann* 09:59:57:00 3 Schwarzbild + Stille
MehrGrundlagen der Multimedia-Anwendungen, Bildverarbeitung, Computergraphik 12.02.2001 Name (bitte in Blockschrift) Matrikelnummer
Fachbereich Angewandte Informatik Musterlösung Matrikelnummer: Fachprüfung: Grundlagen Multimedia (Teil 1) Grundlagen der Multimedia-Anwendungen, Bildverarbeitung, Computergraphik 12.02.2001 Name (bitte
Mehr2 Informationstheorie
2 Informationstheorie Formale Grundlagen der Informatik I Herbstsemester 2012 Robert Marti Vorlesung teilweise basierend auf Unterlagen von Prof. emer. Helmut Schauer Grundbegriffe Informatik (IT: Information
MehrProduktbeschreibung. MCD Audio Analyzer. Softline. Modline. Funktionen und Merkmale des Produkts. Conline. Boardline. Avidline. Pixline.
Produktbeschreibung Funktionen und Merkmale des Produkts Softline Modline Conline Boardline MCD Audio Analyzer Avidline Pixline Applikation MCD Elektronik GmbH Hoheneichstr. 52 75217 Birkenfeld Telefon
MehrSpeicherung einer. Kurznachricht auf der SIM-Karte. Gliederung. Einführung. Auswertung anhand eines Beispiels. Überlange Kurznachrichten
Speicherung einer Martin Jung, David Kolb, Benno Müller Kurznachricht auf der SIM-Karte Ace Crngarov Gliederung Einführung Dateisystem Chipkarte Speicherort Kurznachrichten Programm zum Auslesen Auswertung
MehrAnalyse spektraler Parameter des Audiosignals zur Identifikation und Abwehr von Telefon-SPAM
Analyse spektraler Parameter des Audiosignals zur Identifikation und Abwehr von Telefon-SPAM Christoph Pörschmann, Heiko Knospe Institut für Nachrichtentechnik Fachhochschule Köln Betzdorfer Str. 2 50679
MehrLeseprobe. Taschenbuch Mikroprozessortechnik. Herausgegeben von Thomas Beierlein, Olaf Hagenbruch ISBN: 978-3-446-42331-2
Leseprobe Taschenbuch Mikroprozessortechnik Herausgegeben von Thomas Beierlein, Olaf Hagenbruch ISBN: 978-3-446-4331- Weitere Informationen oder Bestellungen unter http://www.hanser.de/978-3-446-4331-
MehrBenutzerhandbuch www.lingo-europe.de Zusätzlich zum Benutzerhandbuch Version 201107L.01DE
Benutzerhandbuch www.lingo-europe.de Zusätzlich zum Benutzerhandbuch Version 201107L.01DE Version 201111L.02DE 1 Musik-Wiedergabe (Die Wiedergabe der Musik erfolgt automatisch sobald Sie das Gerät einschalten,
MehrAudiosignalverarbeitung
Digitale Audiosignalverarbeitung Inhalt - Grundlegendes zur Signalverarbeitung - AD-/DA- Wandlung - Digitale Signalprozessoren: Aufbau Funktion Anwendungen - Digital Audio Workstations - Digitale Summierung
MehrPraktikum: Digitale Signalverarbeitung (ET215) Test 1
PROFESSOR DR.-ING. MARTIN WERNER M.W. Fachbereich Elektrotechnik und Informationstechnik Hochschule Fulda Praktikum: Digitale Signalverarbeitung (ET215) Test 1 Erklärung Mit meiner Unterschrift erkläre
MehrSONOR. Implementierungsspezifikation: Filterprüfung Version 2.0. Dipl. Ing. Udo Marx. Version: 1.1.0.0
Zertifiziert nach DIN ISO 9001 (Reg. Nr. 90799443) Dipl. Ing. Udo Marx Softwareentwicklung & Systemanalyse SONOR Implementierungsspezifikation: Filterprüfung Version 2.0 Version: 1.1.0.0 Autor: Dipl. Ing.
MehrMESSWERTERFASSUNG MIT DEM PC
FAKULTÄT FÜR Arbeitsgruppe Didaktik der Physik MESSWERTERFASSUNG MIT DEM PC Messwerterfassungssysteme in Verbindung mit einem PC und entsprechender Software bieten sich vor allem an, bei der Durchführung
MehrProtokollanalyse bei VoIP
Protokollanalyse bei VoIP 1. Einführung 2. Protokoll Stack H.323 3. Protokollanalyse in VoIP-Umgebung Funktionelle Analyse Paketanalyse 4. Dimensionierungsaspekte bei VoIP Jitter-Theorie Bandbreite bei
MehrMethodenseminar. Messtechnik und Biosignalerfassung / Übungen. Assist. Prof. Dipl.-Ing. Dr. Manfred Bijak
Methodenseminar Messtechnik und Biosignalerfassung / Übungen Assist. Prof. Dipl.-Ing. Dr. Manfred Bijak Dieses Skriptum ist ausschließlich als Lernbehelf im Rahmen der Lehrveranstaltung LV 809.045 Messtechnik
MehrDG8DP Christian Dindas. Software Voice Keyer für fast jeden TRX
DG8DP Christian Dindas Software Voice Keyer für fast jeden TRX Wer kennt es nicht, das lange Rufen nach DX Stationen, der CQ-Ruf der nicht auf Anhieb den gewünschten Erfolg bringt oder man möchte seine
MehrEinführung in die Informatik und Medieninformatik
Name, Vorname Matrikelnummer Klausur zur Vorlesung Einführung in die Informatik und Medieninformatik LVNr. 36 600, WS 2013, im Studiengang Medieninformatik Donnerstag, 13. Februar 2014 10:00 12:00 Uhr
MehrMP3 Ein paar Grundlagen. Damit wir wissen von was wir reden. Das Werkzeug Audiograbber. Zum Erstellen von MP3 Dateien. Das Werkzeug Winamp
MP3 Was ist das? MP3 Ein paar Grundlagen Das Werkzeug Audiograbber Zum Erstellen von MP3 Dateien Das Werkzeug Winamp Der neue CD-Spieler Die Technik aktuell ausserhalb des PC s: MP3 Player, Memo-Sticks
MehrJ.5 Die Java Virtual Machine
Java Virtual Machine Die Java Virtual Machine 22 Prof. Dr. Rainer Manthey Informatik II Java-Compiler und Java Virtual Machine Quellcode-Datei class C... javac D.java Java-Compiler - Dateien class class
MehrGrundlagen der Rechnertechnologie Sommersemester 2010 11. Vorlesung Dr.-Ing. Wolfgang Heenes
Grundlagen der Rechnertechnologie Sommersemester 2010 11. Vorlesung Dr.-Ing. Wolfgang Heenes 29. Juni 2010 TechnischeUniversitätDarmstadt Dr.-Ing. WolfgangHeenes 1 Inhalt 1. Einführung in die Signalverarbeitung
MehrThema: DTS (apt-x100) Fachbereich Medieninformatik. Hochschule Harz. DTS (apt-x100) Referat. Olaf Cempel. Abgabe: 15.01.2007
Fachbereich Medieninformatik Hochschule Harz DTS (apt-x00) Referat Olaf Cempel 273 Abgabe: 5.0.2007 Inhaltsverzeichnis Einleitung... 2 Technische Details... 3 Formate...2 3. DTS 5. Discrete (DTS Digital
MehrFM PM FSK BPSK FDM PSK GMSK OFDM ASK 64-QAM AFSK. Analoge und digitale Modulationsarten im Amateurfunk
BPSK FM PM FSK ASK AM FDM PSK GMSK OFDM 64-QAM AFSK 1 von 28 Vortrag zur UKW-Tagung 2010 DL7MAJ - 09/2010 Die Amplitudenmodulation - AM u 0 (t) = A ( 1 + m cos(ϖ Μ t)) cos(ϖ Τ t) m = Modulationsgrad 0...
MehrTelematik bei mm-lab. 5. Tag der Informationslogistik, HFT Stuttgart. mm-lab GmbH Stammheimer Straße 10 70806 Kornwestheim
Telematik bei mm-lab 5. Tag der Informationslogistik, HFT Stuttgart Dr. Andreas Streit Managing Director mm-lab GmbH Stammheimer Straße 10 70806 Kornwestheim Andreas.Streit@mmlab.de www.mmlab.de Die mm-lab
MehrWIEDERGABE KOMPATBILITÄTSLISTE
Allgemeine Informationen USB USB Standards 1.0 1.1 2.0 3.0 File systems FAT 16 (standard) FAT 32 exfat TFS HPFS ext2, ext3, ext4 USB speed classifications Low_Speed, 1,5 Mbit/s (187,5 KB/s) Full_Speed,
MehrWie erstellt man eine Tonaufnahme im MP3 Format?* Tipps und Tricks
Wie erstellt man eine Tonaufnahme im MP3 Format?* Tipps und Tricks Um eure Ideen aufzunehmen, habt ihr mehrere Möglichkeiten: Ihr könnt euer Projekt direkt am Computer aufzeichnen. Dieser Weg ist der schnellste
MehrModulationsverfahren Inhalt
Inhalt 1. Allgemeines... 2 2. Übersicht über... 3 5. Amplitudenmodulation... 3 3.1 Zweiseitenbandmodulation... 5 3.2 Einseitenbandmodulation... 5 4. Winkelmodulation... 6 5. Tastmodulation(Digitale Modulation)...
MehrZusammenfassung Medientyp Audio. 2.1. Physikalische Grundlagen Hörbereich: 20Hz bis 20kHz, 0 bis 130dB Sensitivität: frequenzabhängig, Maskierung
Zusammenfassung Medientyp Audio 2.1. Physikalische Grundlagen Hörbereich: 20Hz bis 20kHz, 0 bis 130dB Sensitivität: frequenzabhängig, Maskierung 2.2. Digitalisierung/ Sampling Zeit-/ Frequenzbereich: Diskretisierung
MehrD/A- und A/D- Wandler. Roland Küng, 2011
D/A- und A/D- Wandler Roland Küng, 2011 1 Konversion Analog Digital 7 6 5 4 3 2 1 0 V REF VREF D2 D3 D4 DN vanalog = (D1 + + + +... ) N 1 2 2 4 8 2 2 D/A-Wandler Grundprinzip S 1 = MSB S N = LSB Grundidee
MehrDokumentation zur Alinierung von schweizerdeutschen Dialektaufnahmen mit vorhandener Transkription Hanna Ruch und Anne Goehring 1.6.2015.
Dokumentation zur Alinierung von schweizerdeutschen Dialektaufnahmen mit vorhandener Transkription Hanna Ruch und Anne Goehring 1.6.2015 Allgemeines Was bedeutet "Alinierung"? Bei der automatischen Alinierung
MehrDSO. Abtastrate und Wiedergabegenauigkeit
DSO Abtastrate und Wiedergabegenauigkeit Inhalt Inhalt...- 0 - Sind eine hohe Abtastrate sowie Bandbreite notwendig?...- 2 - Ein Blick auf die messtechnischen Grundlagen...- 7 - Von Abtastrate und Bandbreite
MehrDigitalisierung von Audio
Digitalisierung von Audio Albert-Ludwigs-Universität Freiburg Praxis-Seminar Telekommunikation WS 05/06 Lehrstuhl für Kommunikationssysteme Prof. Dr. Gerhard Schneider Betreuer: Dirk von Suchodoletz Sanja
MehrAutomatische Mustererkennung
Automatische Mustererkennung Eine Einführung Eine Präsentation von Valentin Kraft Im Modul Digitale Bildverarbeitung Prof. Vogel FH Düsseldorf WS 12/13 Gliederung Anwendungsgebiete / Definition Ziele Zentrales
MehrIVR (Integrated Voice Response)
IVR (Integrated Voice Response) (Auto Attendant) Bedienungsanleitung Version 05.07.2007 Inhaltsverzeichnis 1 Einleitung... 1 2 IVR (Auto Attendant)... 2 2.1. Globale Einstellungen... 3 2.2. Events... 3
MehrZahlensysteme: Oktal- und Hexadezimalsystem
20 Brückenkurs Die gebräuchlichste Bitfolge umfasst 8 Bits, sie deckt also 2 8 =256 Möglichkeiten ab, und wird ein Byte genannt. Zwei Bytes, also 16 Bits, bilden ein Wort, und 4 Bytes, also 32 Bits, formen
Mehr2. Digitale Codierung und Übertragung
2. Digitale Codierung und Übertragung 2.1 Informationstheoretische Grundlagen 2.2 Speicherbedarf und Kompression 2.3 Digitalisierung, Digitale Medien Ludwig-Maximilians-Universität München Prof. Hußmann
Mehr