Unit-Selection-Synthese
|
|
- Kurt Möller
- vor 6 Jahren
- Abrufe
Transkript
1 Institut für Phonetik und Sprachverarbeitung Ludwig-Maximilians-Universität München 6. Dezember 2010
2 Inhalt Klassische Diphon-Synthese Korpuserstellung Synthese Erweiterungen Datenbank Synthese Verständlichkeit Natürlichkeit
3 Datengetrieben: Unit-Selection-Ansatz Speicherung großer Mengen an Sprachsignalen keine oder sehr wenig Manipulation der Signale bei ihrer Verknüpfung Pro: höhere Natürlichkeit der Synthese Kontra: großer Aufwand zur Gewinnung des akustischen Materials
4 Signalmanipulation: klassischer Diphon-Ansatz Speicherung einer geringen Menge an Sprachsignalen Manipulation der Sprachsignale bei ihrer Verknüpfung Pro: höhere Flexibilität, weniger Aufwand bei der Datengewinnung Kontra: geringere Natürlichkeit der Synthese
5 Einheit: Diphon Segment von der Mitte eines Phons bis zur Mitte des folgenden Phons Berücksichtigung lokaler koartikulatorischer Effekte Inventargröße: (Anzahl der Phoneme) 2 (Anzahl phonotaktisch nicht erlaubter Kombinationen)
6 Abbildung: Diphone /fa/ und /sa/: unterschiedliche Formanttransitionen.
7 : Diphondatenbank Erstellung der Diphondatenbank (voice) Ermittlung des nötigen Diphon-Inventars Einbettung der Diphone in einen Trägersatz prosodisch homogene Realisierung der Diphone Rekrutierung eines Sprechers (voice talent) Aufnahme des Sprechers beim Lesen der eingebetteten Diphone Evtl. mit elektroglottographischer Aufnahme Segmentierung, Pitch-Markierung
8 : Diphondatenbank Pitch-Markierung (= Epoch Detection) Epoche: Ereignis im glottalen Schwingungszyklus z.b. Verschluss der Stimmlippen Führungsamplitude nötig für Signalmanipulation bei Konkatenation Mittels Elektroglottographie EGG während der Aufnahme des Sprechers transglottaler Stromfluss Messung der glottalen Impedanz, die vom Abduktionsgrad der Glottis abhängt Problem: Messung der Stimmlippenschwingung bei nicht vollständiger Adduktion
9 : Diphondatenbank Mittels Pitch-Markierungs-Algorithmen Anwendung auf aufgenommenes Sprachsignal Beispiel-Algorithmus: Entferne alle negativen (oder positiven) Werte aus dem Zeitsignal Lege einen Wertebereich für erlaubte Periodenlängen fest Markiere in Fenstern, deren Zentren in erlaubter Periodenlänge voneinander entfernt sind, lokale Maxima als Kandidaten für Epochen Finde mittels dynamischer Programmierung die beste Sequenz Ê von Epochen-Kandidaten [ ] Ê = arg min t(e i ) + a(e i ) E i (1)
10 : Diphondatenbank Periodenkosten t: z.b. Abstand zur letzten Periodenlänge, oder Abstand zu 1/(ermittelte F0) Amplitudenkosten a: 1-(relative Höhe) des lokalen Maximas im betrachteten Fenster Abbildung: Pitch-Marking: Grün: Fensterung, Rauten: Epoch-Kandidaten, Pfeile: Ê
11 : Diphondatenbank Segmentierung Automatische Vorsegmentierung mittels Forced Alignment (z.b. durch MAUS; Schiel, 2004) Forced Alignment: Abbildung des Signals auf eine bereits bekannte Phonemfolge manuelle Nachsegmentierung
12 : Resynthese Ablauf Auswahl der zur G2P-Vorgabe passenden Diphone Resynthese: Manipulation von Segmentdauer, Grundfrequenz, Intensität iggs zur Vollsynthese (z.b. Formantsynthese) sind die zu manipulierenden Signale bereits gegeben
13 Manipulation von F0 und Dauer: TD-PSOLA Signalmanipulation: TD-PSOLA TD: Time-Domain, d.h. keine Überführung in Spektralbereich PS: Pitch-Synchron, d.h. Verfahren operiert auf Einheiten der Größe einer glottalen Schwingungsperiode OLA: Overlap and Add, d.h. Einheiten werden überlagert und addiert
14 Manipulation von F0 und Dauer: TD-PSOLA Fensterung der Einheiten: Multiplikation der Signalauschnitte mit einem Gewichtsfenster zur Abschwächung der Signalränder Dauer-Manipulation: Wiederholung von Kopien einer Periode F0-Manipulation: Verschiebung der Einheiten gegeneinander ( Erhöhung) oder auseinander ( Absenkung). Auffüllen mit/löschen von Perioden zur Aufrechterhaltung der Dauer Intensität: Aufaddieren von Kopien einer Periode
15 Manipulation von F0 und Dauer: TD-PSOLA aus Hess (2004)
16 Manipulation von F0 und Dauer: MBROLA MBROLA MB: Multi-Band, Nutzung einer Filterbank zur Normalisierung der Diphondatenbank R: Resynthesis OLA: Overlap and Add
17 Manipulation von F0 und Dauer: MBROLA Normierung der Diphondatenbank im Frequenzbereich Resynthese der stimmhaften Abschnitte mit konstanter F0 und konstantem Phasenspektrum konstante F0: Erzeugung äquidistanter Harmonischer bei Beibehaltung der spektralen Hüllkurve des Originalsignals konstante Phasen: Gleichsetzung der Phasen tiefer spektraler Komponenten
18 Manipulation von F0 und Dauer: MBROLA Abbildung: Normierung: Erzeugung konstanter F0 im Frequenzbereich. Anwendung im Zeitbereich F0-, Dauer- und Intensitätsmanipulation der normalisierten Diphone wie bei TD-PSOLA Smoothing an Segmentübergängen
19 Manipulation von F0 und Dauer: MBROLA Vorteile gegenüber TD-PSOLA: durch Normalisierung (konstante F0) keine Epochen-Detektion mehr nötig beliebige Platzierung der Epochen im Signal (in äquidistanten Abschnitten) Vermeidung von F0-, Phasen- und spektralen Diskontinuitäten an Segmentübergängen
20 : Erweiterungen Optimal Coupling Speicherung vollständiger Phonpaar-Segmente Herausschneiden der Diphone während Synthese so, dass spektrale Diskontinuitäten minimal Diskontinuitäten z.b. mittels Abständen zwischen zeitlich benachbarten Mel-Cepstral-Koeffizienten-Vektoren ermittelbar (s.u.)
21 Unterschiede zur klassischen Diphon-Synthese große Datenbank, keine oder geringe Signalmanipulation ermöglicht höhere Natürlichkeit der Synthese Units: variable Größe (z.b. Diphone); je größer die Einheiten, desto größer das benötigte Inventar
22 Unit-Selection: Datenbank Für jede Unit Aufnahme von mehreren Exemplaren: +/ akzentuiert, +/ phrasenfinal, unterschiedliches Sprechtempo, unterschiedliche emotionale Markierung,... Extrahierung der akustischen Charakteristika (s.u.)
23 Unit-Selection: Verkettung Statt Signalmanipulation Suche nach der besten Sequenz Û aus gespeicherten Unit-Varianten basierend auf der Minimierung von Target- (T ) und Join-Kosten (J) Û = arg min U [ J(ui 1, u i ) + T (u i, s i ) ] (2) i s i : durch die vorgeschalteten Text- und Prosodie-Module vorgegebenen Zielspezifikationen u i : gespeicherte Unit
24 Unit-Selection: Verkettung Target-Kosten T (u i, s i ) Abstand des Exemplars u i zu den Zielvorgaben s i u i, s i als Merkmalsvektoren repräsentiert mit Angaben zu: Identität der Unit Unit-Kontext prosodische Spezifikationen F0-Kontur Dauer Intensität
25 Unit-Selection: Verkettung Beispiel: s i = [ /u:d/, +akz, phrasenfinal, , 80 ], d.h. Ziel ist ein /u:d/-diphon in akzentuierter und nicht-phrasenfinaler Position mit der F0-Kontur Hz und der Dauer 80 ms T (u i, s i ) als Kombination von Teilkosten eine Teilkostenfunktion für jedes der betrachteten Merkmale j: T j (u ij, s ij ) gewichtete Summe voneinander unabhängiger Teilkosten: T (u i, s i ) = j w j T j (u ij, s ij ) (3)
26 Unit-Selection: Verkettung Teilkosten T j numerischer Features: Korrelation zwischen F0 der Unit u i und der F0-Zielkontur in s i Mittlere absolute Distanz zwischen F0 in u i und Zielkontur Absolute Distanz zwischen u i -Dauer und Zieldauer binäre Teilkosten T j kategorialer Features: gleicher Unit-Kontext von u i und s i : 0, sonst 1 Akzentangaben gleich: 0, sonst 1
27 Unit-Selection: Verkettung Join-Kosten J(u i 1, u i ) Diskontinuitäten zwischen aufeinanderfolgenden Units u i 1 und u i ebenfalls als gewichtete Summe von unabhängigen Teilkosten modellierbar: J(u i 1, u i ) = j v j J j (u i 1j, u ij ) (4) Teilkosten J j (nach Hunt&Black, 1996): Cepstral-Distanz an der Konkatenationsstelle absolute F0-Distanz absolute Log-Energiedistanz
28 Unit-Selection: Exkurs Cepstrum Exkurs Cepstrum Ziel: Ermittlung der MFCC (Mel frequency cepstral coefficients) Weg: Diskrete Fouriertransformation: Spektrum Mel-Transformation des Spektrums (mittels gehörgerechter Filterbank: 10 Filter konstanter Bandbreite bis 1000 Hz, darüber logarithmisch wachsende Bandbreite) Amplituden-Spektrum: Grobstruktur = Hüllkurve (Filtercharakteristik) Feinstruktur (Riffelung) = F0 + Obertöne (Anregungssignal)
29 Unit-Selection: Exkurs Cepstrum Behandlung des logarithmierten Spektrums als Zeitsignal Cepstrum: Spektrum dieses Pseudo-Zeitsignals tieffrequente Anteile ( Grobstruktur): Filtercharakteristik, Cepstral-Koeffizienten 1-12 hochfrequente Anteile ( Feinstruktur): Anregungssignal, Cepstral-Koeffizienten 13 warum Logarithmierung des Spektrums? (x y) (log x + log y) multiplikative additive Verknüpfung von Quelle und Filter im Pseudo-Zeitsignal spektrale Zerlegung ermöglicht
30 Unit-Selection: Exkurs Cepstrum Abbildung: Zeitsignal, Spektrum, Cepstrum eines /a/-segments. Frequenz=1/Queferenz.
31 Unit-Selection: Verkettung Cepstral-Distanz zwischen den Rändern der Units u i 1 und u i : z.b. quadrierte Euklidische Distanz d zwischen den Cepstral-Koeffizienten-Vektoren v und w d(v, w) = 12 n=1 (v n w n ) 2 (5) (n: Index über Cepstral-Koeffizienten)
32 Unit-Selection: Verkettung Ermittlung der Gewichte V = {v j } und W = {w j } numerische Optimierung gegeben: Entwicklungskorpus mit natürlichen Äußerungen als Referenz Distanzmaß zum Vergleich der synthetisierten Sätze mit der Referenz: Mel-Cepstral-Abstand (s.o.) Ziel: Optimierung der Gewichte in V und W zur Minimierung der Distanz zwischen Syntheseausgabe und Referenz
33 Unit-Selection: Verkettung Methode: z.b. Nelder-Mead-Simplex-Verfahren Simplex: einfachstmögliches Polytop in einem n-dimensionalen Raum (Beispiel: Dreieck im 2-dimensionalen Raum) Raum: Merkmalsraum mit n Gewichten aus V und W jede Ecke des Simplex entspricht einer konkreten Belegung der Gewichte iterative Modifizierung des Simplex: Ersetzung der Ecke (der Belegung), die zum höchsten Fehler führt durch eine neue hohe Robustheit, da keine stetige Fehlerfunktion vorausgesetzt wird
34 Unit-Selection: Verkettung Ermittlung der besten Unit-Sequenz Û analog zu statistischen POS-Taggern, Alignment (vgl. POS-, G2P-Folien) HMM-Modellierung Beobachtungen: Targets {s} Zustände: gespeicherte Units {u} Transitionswahrscheinlichkeiten Join-Kosten Emissionswahrscheinlichkeiten Target-Kosten Û mittels Viterbi: Finden des Pfades durch die Trellis, auf dem die minimalen Kosten anfallen
35 Verständlichkeit Verwendung semantisch nicht vorhersagbarer Sätze (SUS) Erzeugung eines SUS: zufälliges Auffüllen eines syntaktisch wohlgeformten POS-Templates mit Wörtern der entsprechenden Wortarten Reimtest: Diskriminierbarkeit von Konsonanten Paare sich reimender Wörter, die sich jeweils in einem distinktiven phonologischen Merkmal unterscheiden ABX-Test: Präsentation eines Worts aus einem Paar (in SUS) + Aufgabe, zu beurteilen, welches
36 Natürlichkeit Mean-Opinion-Score (MOS): Qualitätsurteile auf einer Skala von 1 5
Lesen von Sonagrammen I: Grundlagen. Uwe Reichel IPS, LMU München 16. November 2007
Lesen von Sonagrammen I: Grundlagen Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de 16. November 2007 Inhalt Das Sonagramm: Allgemeines Gewinnung des Sonagramms Zeitsignal Spektrum Spektrogramm
MehrVersuch 3: Anwendungen der schnellen Fourier-Transformation (FFT)
Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT) Ziele In diesem Versuch lernen Sie zwei Anwendungen der Diskreten Fourier-Transformation in der Realisierung als recheneffiziente schnelle
MehrEinführung in die Signalverarbeitung
Einführung in die Signalverarbeitung Phonetik und Sprachverarbeitung, 2. Fachsemester, Block Sprachtechnologie I Florian Schiel Institut für Phonetik und Sprachverarbeitung, LMU München Signalverarbeitung
MehrVom Zeit- zum Spektralbereich: Fourier-Analyse
Vom Zeit- zum Spektralbereich: Fourier-Analyse Ergebnis der Analyse Zerlegung eines beliebigen periodischen Signals in einem festen Zeitfenster in eine Summe von Sinoidalschwingungen Ermittlung der Amplituden
MehrSpracherkennung. 4. Sitzung 23. Oktober 2008
Spracherkennung 4. Sitzung 23. Oktober 2008 Überblick Wiederholung 3 Akustik 3 Artikulation Studie zu Veränderung der Artikulation bei Lärm 4 Sprachwahrnehmung Kategoriale Sprachwahrnehmung beim Menschen
MehrZ-Transformation, Cepstrum, LPC, Autokorrelation Sebastian Stüker
Institut für Anthropomatik Z-Transformation, Cepstrum, LPC, Autokorrelation Sebastian Stüker 04.11.2009 Interactive Systems Labs Verallgemeinerung der Fourier- Transformation: F(s) = L{ f }(s) = 0 e st
MehrSeminar Akustik. Aufgaben zu Teil 1 des Skripts Uwe Reichel, Phil Hoole
Seminar Akustik. Aufgaben zu Teil des Skripts Uwe Reichel, Phil Hoole Welche Kräfte wirken auf ein schwingendes Teilchen?! von außen angelegte Kraft (z.b. Glottisimpulse)! Rückstellkräfte (Elastizität,
MehrProbe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013
Probe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013 Klausurnummer Name: Vorname: Matr.Nummer: Bachelor: Master: Aufgabe 1 2 3 4 5 6 7 8 max. Punkte 10 5 6 7 5 10 9 8 tats. Punkte
MehrTechnische Beschreibung der akustischen Signalkette
Technische Beschreibung der akustischen Signalkette Wichtige Aufgabe: Vielfältige Medien Gestaltung akustischer Kommunikationsketten (Sprache, Geräusche, Musik, CD, Radio, mp3,...) Unterschiedlichste Information
MehrEinführung in die Signalverarbeitung
Einführung in die Signalverarbeitung Phonetik und Sprachverarbeitung, 2. Fachsemester, Block Sprachtechnologie I Florian Schiel Institut für Phonetik und Sprachverarbeitung, LMU München Signalverarbeitung
MehrEinführung in die Signalverarbeitung
Einführung in die Signalverarbeitung Phonetik und Sprachverarbeitung, 2. Fachsemester, Block Sprachtechnologie I Florian Schiel Institut für Phonetik und Sprachverarbeitung, LMU München Signalverarbeitung
MehrSprachverarbeitung I
Institut für Technische Informatik und Kommunikationsnetze Eidgenössische Technische Hochschule Zürich Swiss Federal Institute of Technology Zurich Ecole polytechnique fédérale de Zurich Politecnico federale
MehrDie versteckte Kommunikation
Die versteckte Kommunikation Techniken der Steganographie Marcus Nutzinger Institut für IT-Sicherheitsforschung Fachhochschule St. Pölten IT-Security Community Xchange 2009 6. November 2009 Einführung
MehrEvolutionäre Algorithmen in der Spracherkennung
Informatik Alexander Eslava Evolutionäre Algorithmen in der Spracherkennung Studienarbeit Evolutionäre Algorithmen in der Spracherkennung Hauptseminar Einsatz Evolutionärer Strategien in Eingebetteten
Mehr[ 1 ] Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an.
13 Zeitreihenanalyse 1 Kapitel 13: Zeitreihenanalyse A: Übungsaufgaben: [ 1 ] 1 a a) Nach der Formel x t+i berechnet man einen ein f achen gleitenden Durchschnitt. 2a + 1 i= a b) Die Residuale berechnet
MehrKapitel 2.1: Die stochastische Sicht auf Signale Georg Dorffner 67
Kapitel 2.1: Die stochastische Sicht auf Signale 215 Georg Dorffner 67 Stochastische Prozesse Stochastische Prozesse sind von Zufall geprägte Zeitreihen x n f x, n 1 xn2,... n vorhersagbarer Teil, Signal
MehrMerkmale von Bildregionen, Einführung in Spektraltechniken
Merkmale von Bildregionen, Einführung in Spektraltechniken Industrielle Bildverarbeitung, Vorlesung No. 10 1 M. O. Franz 12.12.2007 1 falls nicht anders vermerkt, sind die Abbildungen entnommen aus Burger
MehrAutomatische Spracherkennung
Automatische Spracherkennung 2 Grundlagen und Begriffe Teil 1 In diesem (längeren) Abschnitt werden grundlegende technische Begriffe aus dem Bereich der automatischen Spracherkennung (ASR) erläutert. In
MehrBayes sche Klassifikatoren. Uwe Reichel IPS, LMU München 16. Juli 2008
Bayes sche Klassifikatoren Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de 16. Juli 2008 Inhalt Einleitung Grundlagen der Wahrscheinlichkeitsrechnung Noisy-Channel-Modell Bayes sche Klassifikation
MehrDFT / FFT der Titel der Präsentation wiederholt (Ansicht >Folienmaster) Dipl.-Ing. Armin Rohnen, Fakultät 03, rohnen@hm.edu
1 Grundlagen Abtasttheorem Fenster Zeit - Frequenzauflösung Pegelgenauigkeit Overlap Mittelung 2 2 volle Schwingungen 32 Abtastwerte Amplitude = 1 Pascal Signallänge = 1 Sekunde Eine Frequenzline bei 2
MehrBildverarbeitung: Fourier-Transformation. D. Schlesinger () BV: Fourier-Transformation 1 / 16
Bildverarbeitung: Fourier-Transformation D. Schlesinger () BV: Fourier-Transformation 1 / 16 Allgemeines Bilder sind keine Vektoren. Bilder sind Funktionen x : D C (Menge der Pixel in die Menge der Farbwerte).
Mehr11. Zeitreihen mit Trend und Saisonalität
In diesem Abschnitt geht es um ZR, die in eine Trend-, eine Saisonund eine Restkomponente zerlegt werden können. (Das Niveau sei in der Trendkomponente enthalten.) Beispiele für solche ZR sind in Abb.
MehrSpracherkennung. Gliederung:
Spracherkennung Gliederung: - Einführung - Geschichte - Spracherkennung - Einteilungen - Aufbau und Funktion - Hidden Markov Modelle (HMM) - HMM bei der Spracherkennung - Probleme - Einsatzgebiete und
MehrSpektra von periodischen Signalen. Resonanz. Jonathan Harrington
Spektra von periodischen Signalen. Resonanz. Jonathan Harrington Spektrum von einem Zeitsignal Zeitsignal 1. Das Zeitsignal wird durch eine Fourier- Analyse in Sinusoiden zerlegt 2. Spektrum: die Abbildung
MehrModul Digitale Bildverarbeitung SS16 Bestandteile der Lehrveranstaltung und Prüfung: Vorlesungen Übungsserien Praktika (ImageJ) bis Mai 2016 Projekt
Modul Digitale Bildverarbeitung SS16 Bestandteile der Lehrveranstaltung und Prüfung: Vorlesungen Übungsserien Praktika (ImageJ) bis Mai 2016 Projekt im Juni 2016 Themen: Digitale Bilder, Eigenschaften
Mehr3. Leistungsdichtespektren
Stochastische Prozesse: 3. Leistungsdichtespektren Wird das gleiche Geräusch mehrmals gemessen, so ergeben sich in der Regel unterschiedliche zeitliche Verläufe des Schalldrucks. Bei Geräuschen handelt
MehrGrundlagen der Analyse von Sprachdatenbanken. Jonathan Harrington
Grundlagen der nalyse von Sprachdatenbanken Jonathan Harrington Die Laborsprache Fast alle ntersuchungen in der Experimentalphonetik im 20 Jahrhundert befassen sich mit der Laborsprache. Warum? Competence/performance
MehrLesen von Sonagrammen III Vokale, Plosive
Lesen von Sonagrammen III Vokale, Plosive Uwe Reichel IPS, LMU München reichelu@phonetik.uni-muenchen.de basierend auf Kirsten Macheletts Online-Script http://www.phonetik.uni-muenchen.de/lehre/skripten/
MehrSignalverarbeitung 2. Volker Stahl - 1 -
- 1 - Überblick Bessere Modelle, die nicht nur den Mittelwert von Referenzvektoren sondern auch deren Varianz berücksichtigen Weniger Fehlklassifikationen Mahalanobis Abstand Besseres Abstandsmaß basierend
MehrBildverarbeitung Herbstsemester 2012. Fourier-Transformation
Bildverarbeitung Herbstsemester 2012 Fourier-Transformation 1 Inhalt Fourierreihe Fouriertransformation (FT) Diskrete Fouriertransformation (DFT) DFT in 2D Fourierspektrum interpretieren 2 Lernziele Sie
MehrAutomatische Spracherkennung --- Frontend
Automatische Spracherkennung --- Frontend Copyright 2005 BAS Services Florian Schiel Florian F Schiel: Automatische Spracherkennung - Frontend 1 AUTOMATISCHE SPRACHERKENNUNG (Automatic Speech Recognition,
MehrFourier - Transformation
Fourier - Transformation Kurzversion 2. Sem. Prof. Dr. Karlheinz Blankenbach Hochschule Pforzheim, Tiefenbronner Str. 65 75175 Pforzheim Überblick / Anwendungen / Motivation: Die Fourier-Transformation
Mehr6. Übung zur Linearen Optimierung SS08
6 Übung zur Linearen Optimierung SS08 1 Sei G = (V, E) ein schlichter ungerichteter Graph mit n Ecken und m Kanten Für eine Ecke v V heißt die Zahl der Kanten (u, v) E Grad der Ecke (a) Ist die Anzahl
MehrAllgemeine diskrete Wahrscheinlichkeitsräume II. Beispiel II. Beispiel I. Definition 6.3 (Diskreter Wahrscheinlichkeitsraum)
Allgemeine diskrete Wahrscheinlichkeitsräume I Allgemeine diskrete Wahrscheinlichkeitsräume II Verallgemeinerung von Laplaceschen Wahrscheinlichkeitsräumen: Diskrete Wahrscheinlichkeitsräume Ω endlich
MehrWS 2010/ Januar Mathematisches Institut der Universität München Prof. Dr. Rudolf Fritsch
Mathematisches Institut der Universität München Prof. Dr. Rudolf Fritsch WS 2010/2011 14. Januar 2011 Geometrie mit Übungen Übungsblatt 9, Musterlösungen Aufgabe 33. Es werden Kreise in der Euklidischen
Mehr5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften
5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer Clusterstruktur kennen, verschiedene
MehrEchtzeit-Analyse/Synthese von Sprachsignalen unter Berücksichtigung des Sprachverständlichkeitsindex (SII)
Allgemeine Nachrichtentechnik Prof. Dr.-Ing. Udo Zölzer Echtzeit-Analyse/Synthese von Sprachsignalen unter Berücksichtigung des Sprachverständlichkeitsindex (SII) Von Sayak Ghosh Choudhury Prof. Dr.-Ing.
MehrT = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente.
Vektorraummodell T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. Der Vektorraum wird
Mehr4 Erzeugung von Tonsignalen
4 Erzeugung von Tonsignalen 4.1 Etwas Theorie: Sample, Samplefrequenz, Abtasten Zeit in ms u1(t) 0 0 1 3,09 2 5,88 3 8,09 4 9,51 5 10 6 9,51 7 8,09 8 5,88 9 3,09 10 0 11-3,09 12-5,88 13-8,09 14-9,51 15-10
MehrTHz Physik: Grundlagen und Anwendungen
THz Physik: Grundlagen und Anwendungen Inhalt: 1. Einleitung 2. Wechselwirkung von THz-Strahlung mit Materie 3. Erzeugung von THz-Strahlung 3.1 Elektronische Erzeugung 3.2 Photonische Erzeugung 3.3 Nachweis
MehrStatistik IV für Studenten mit dem Nebenfach Statistik Lösungen zu Blatt 9 Gerhard Tutz, Jan Ulbricht SS 07
Statistik IV für Studenten mit dem Nebenfach Statistik Lösungen zu Blatt 9 Gerhard Tutz, Jan Ulbricht SS 07 Ziel der Clusteranalyse: Bilde Gruppen (cluster) aus einer Menge multivariater Datenobjekte (stat
MehrModulklausur Multivariate Verfahren
Name, Vorname Matrikelnummer Modulklausur 31821 Multivariate Verfahren Datum Punkte Note Termin: 28. März 2014, 9.00-11.00 Uhr Erstprüfer: Univ.-Prof. Dr. H. Singer Hinweise zur Bearbeitung der Modulklausur
MehrRouting Algorithmen. Begriffe, Definitionen
Begriffe, Definitionen Routing (aus der Informatik) Wegewahl oder Verkehrslenkung bezeichnet in der Telekommunikation das Festlegen von Wegen für Nachrichtenströme bei der Nachrichtenübermittlung über
MehrSignalverarbeitung 2. Volker Stahl - 1 -
- 1 - Hidden Markov Modelle - 2 - Idee Zu klassifizierende Merkmalvektorfolge wurde von einem (unbekannten) System erzeugt. Nutze Referenzmerkmalvektorfolgen um ein Modell Des erzeugenden Systems zu bauen
MehrKapitel 2: Mathematische Grundlagen
[ Computeranimation ] Kapitel 2: Mathematische Grundlagen Prof. Dr. Stefan M. Grünvogel stefan.gruenvogel@fh-koeln.de Institut für Medien- und Phototechnik Fachhochschule Köln 2. Mathematische Grundlagen
MehrDatenstrukturen & Algorithmen
Datenstrukturen & Algorithmen Matthias Zwicker Universität Bern Frühling 2010 Übersicht Dynamische Programmierung Einführung Ablaufkoordination von Montagebändern Längste gemeinsame Teilsequenz Optimale
MehrStatStream : Statistical Monitoring of Thousands of Data Streams in Real Time Yunyue Zhu,Dennis Sasha. Vorgetragen von Matthias Altmann
StatStream : Statistical Monitoring of Thousands of Data Streams in Real Time Yunyue Zhu,Dennis Sasha Vorgetragen von Matthias Altmann Mehrfache Datenströme Beispiel Luft und Raumfahrttechnik: Space Shuttle
MehrPsycholinguistik. Definition: Psycholinguistik (synonym: Sprachpsychologie) erforscht das kognitive (mentale) System, das den Sprachgebrauch erlaubt.
Psycholinguistik Definition: Psycholinguistik (synonym: Sprachpsychologie) erforscht das kognitive (mentale) System, das den Sprachgebrauch erlaubt. Teilgebiete der Psycholinguistik Können danach klassifiziert
MehrGrundlagen der Videotechnik, Farbe 2
Grundlagen der Videotechnik, Farbe 2 1 Beispiel für additive Farbmischung: Aus: O. Limann: Fernsetechnik ohne Ballast, Franzis Verlag 2 Veranschaulichung Farbe, Farbkomponenten Aus: O. Limann: Fernsetechnik
Mehr23. November Betweenness Centrality Closeness Centrality. H. Meyerhenke: Algorithmische Methoden zur Netzwerkanalyse 108
23. November 2011 Betweenness Centrality Closeness Centrality H. Meyerhenke: Algorithmische Methoden zur Netzwerkanalyse 108 Betweenness Centrality Grundlegende Idee: Ein Knoten ist wichtig, wenn er auf
MehrVerteilte Systeme. Verteilte Systeme. 5 Prozeß-Management SS 2016
Verteilte Systeme SS 2016 Universität Siegen rolanda.dwismuellera@duni-siegena.de Tel.: 0271/740-4050, Büro: H-B 8404 Stand: 31. Mai 2016 Betriebssysteme / verteilte Systeme Verteilte Systeme (1/14) i
MehrVerfahren zur robusten automatischen Spracherkennung
Verfahren zur robusten automatischen Spracherkennung Hans-Günter Hirsch Hochschule Niederrhein Fachbereich Elektrotechnik und Informatik Digitale Nachrichtentechnik http://dnt.kr.hs-niederrhein.de Ansätze
MehrNeuronale Netze in der Phonetik: Grundlagen. Pfitzinger, Reichel IPSK, LMU München {hpt 24.
Neuronale Netze in der Phonetik: Grundlagen Pfitzinger, Reichel IPSK, LMU München {hpt reichelu}@phonetik.uni-muenchen.de 24. Mai 2006 Inhalt Einführung Maschinelles Lernen Lernparadigmen Maschinelles
Mehr2. Optimierungsprobleme 6
6 2. Beispiele... 7... 8 2.3 Konvexe Mengen und Funktionen... 9 2.4 Konvexe Optimierungsprobleme... 0 2. Beispiele 7- Ein (NP-)Optimierungsproblem P 0 ist wie folgt definiert Jede Instanz I P 0 hat einen
Mehr*DE B *
*DE102004048707B320051229* ß (19) Bundesrepublik Deutschland Deutsches Patent- und Markenamt (10) DE 10 2004 048 707 B3 2005.12.29 (12) Patentschrift (21) Aktenzeichen: 10 2004 048 707.3 (22) Anmeldetag:
MehrNachrichtentechnik [NAT] Kapitel 4: Fourier-Transformation. Dipl.-Ing. Udo Ahlvers HAW Hamburg, FB Medientechnik
Nachrichtentechnik [NAT] Kapitel 4: Fourier-Transformation Dipl.-Ing. Udo Ahlvers HAW Hamburg, FB Medientechnik Sommersemester 25 Inhaltsverzeichnis Inhalt Inhaltsverzeichnis 4 Fourier-Transformation 3
MehrMessung & Darstellung von Schallwellen
Messung Digitalisierung Darstellung Jochen Trommer jtrommer@uni-leipzig.de Universität Leipzig Institut für Linguistik Phonologie/Morphologie SS 2007 Messung Digitalisierung Darstellung Überblick Messung
MehrII. Grundlagen der Programmierung
II. Grundlagen der Programmierung II.1. Zahlenssteme und elementare Logik 1.1. Zahlenssteme 1.1.1. Ganze Zahlen Ganze Zahlen werden im Dezimalsstem als Folge von Ziffern 0, 1,..., 9 dargestellt, z.b. 123
MehrTHz Physik: Grundlagen und Anwendungen
THz Physik: Grundlagen und Anwendungen Inhalt: 1. Einleitung 2. Wechselwirkung von THz-Strahlung mit Materie 3. Erzeugung von THz-Strahlung 3.1 Elektronische Erzeugung 3.2 Photonische Erzeugung 3.3 Nachweis
MehrMorphem und Allomorph. Jonathan Harrington
Morphem und Allomorph Jonathan Harrington Phonologie und Phonetik Kies kühn Kuh Skandal Lexikon /ki:s/ /ky:n/ /ku:/ /skandal/ Phonetische Regeln [c h i:s] [c h y)n] w [k= h u:] w [skandal] Die Eingaben
MehrDPF Dynamic Partial distance Function
DPF Dynamic Partial distance Function Vorgelegt von Sebastian Loose (MatrikelNR.: 169172), Computervisualistikstudent im 4. Semester. Hausarbeit zum Papier DPF A Perceptual Distance Function for Image
MehrDas wissen Sie: 6. Welche Möglichkeiten zur Darstellung periodischer Funktionen (Signalen) kennen Sie?
Das wissen Sie: 1. Wann ist eine Funktion (Signal) gerade, ungerade, harmonisch, periodisch (Kombinationsbeispiele)? 2. Wie lassen sich harmonische Schwingungen mathematisch beschreiben und welche Beziehungen
MehrDiphone Studio. Teil 3 Analyse resonanter Modelle und Chant-Synthese. Hans Tutschku tutschku@ircam.fr
Diphone Studio Teil 3 Analyse resonanter Modelle und Chant-Synthese Hans Tutschku tutschku@ircam.fr Der Artikel bezieht eine Sammlung von Beispielklängen ein, die auf folgender web-adresse angehört werden
Mehr1. Psycholinguistische Studien zum Erstspracherwerb mit der Head-Turn-Preference Prozedur - Kategorienerwerb - Segmentierungsproblem
1. Psycholinguistische Studien zum Erstspracherwerb mit der Head-Turn-Preference Prozedur - Kategorienerwerb - Segmentierungsproblem 2. Weitere Beispiele für psycholinguistische Studien zur Sprachwahrnehmung
MehrInhaltsverzeichnis. Einführende Bemerkungen 11. Das Fach Informatik 11 Zielsetzung der Vorlesung Grundbegriffe
Inhaltsverzeichnis Einführende Bemerkungen 11 Das Fach Informatik 11 Zielsetzung der Vorlesung 12 1. Grundbegriffe 1 3 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Information und Nachricht 1.1.1 Information 1.1.2 Nachricht
MehrSeminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
MehrEinstieg in die Informatik mit Java
1 / 26 Einstieg in die Informatik mit Java Felder Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 26 1 Was sind Felder? 2 Vereinbarung von Feldern 3 Erzeugen von Feldern
MehrDie Repräsentation des Sprachsignals
45 1.1.3. Die Repräsentation des Sprachsignals Bei der automatischen Erkennung gesprochener Sprache kommt es darauf an, im Sprachsignal bestimmte, für einzelne Laute (oder Lautverbindungen) charakteristische
MehrPhone&sche Analysen (5b) Lautstärke, Lautheit, Tonhöhe, Tonheit. Sven Grawunder SoSe2014, Uni Leipzig
Phone&sche Analysen (5b) Lautstärke, Lautheit, Tonhöhe, Tonheit Sven Grawunder SoSe2014, Uni Leipzig Außen-, MiMel-, Innenohr Incus, Malleus, Stapes li. ; Q: hmp://o.quizlet.com/wolpn4jnnbm6em9w21pxvw_m.png
MehrInhaltliche Planung für die Vorlesung
Vorlesung: Künstliche Intelligenz - Mustererkennung - P LS ES S ST ME Künstliche Intelligenz Miao Wang 1 Inhaltliche Planung für die Vorlesung 1) Definition und Geschichte der KI, PROLOG 2) Expertensysteme
MehrSiSy1, Praktische Übung 3. Fourier-Analyse (periodischer Signale) kann als Fourier-Reihe 1 beschrieben werden:
/5 Fourier-Analyse (periodischer Signale) Grundlagen Ein periodisches, kontinuierliches Signal x(t) der Periodendauer kann als Fourier-Reihe beschrieben werden: wie folgt ( ) = c k x t + e j k 2πf t k=
MehrEuklidische Distanzmatrizen. Andrei Grecu
Euklidische Distanzmatrizen Andrei Grecu Übersicht Motivation Definition und Problemstellung Algo 1: Semidefinite Programmierung Algo 2: Multidimensional Scaling Algo 3: Spring Embedder Algo 4: Genetischer
MehrPhonetische Auswirkungen elektro-neurologischer Therapie-Ansätze bei MS- und Parkinson-Patienten
Phonetische Auswirkungen elektro-neurologischer Therapie-Ansätze bei MS- und Parkinson-Patienten William J. Barry Institut für Phonetik, Universität des Saarlandes IPUS Zusammenarbeit mit der neurologischen
MehrProsodie Variation und Inferenz Phonologische Grundlagen
Prosodie Variation und Inferenz Beat Siebenhaar Frank Liedtke Phonetische Grundlagen Rückblick! Suprasegmentalia und Prosodie! Koartikulation, Assimilation, Schnellsprechformen! Silbe als artikulatorische
Mehr4 Erzeugung von Tonsignalen
4 Erzeugung von Tonsignalen 4.1 Etwas Theorie: Sample, Samplefrequenz, Abtasten Zeit in ms u1(t) 0 0 1 3,09 2 5,88 3 8,09 4 9,51 5 10 6 9,51 7 8,09 8 5,88 9 3,09 10 0 11-3,09 12-5,88 13-8,09 14-9,51 15-10
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
MehrHandy, Börse und Kristalle
Handy, Börse und Kristalle Neues aus der Welt der Analysis Seite 1 Handy, Börse und Kristalle Neues aus der Welt der Analysis Was empfängt ein Handy? Eine mathematische Lupe Ein Blick in die Börse... und
MehrKapitel 12: Schnelles Bestimmen der Frequent Itemsets
Einleitung In welchen Situationen ist Apriori teuer, und warum? Kapitel 12: Schnelles Bestimmen der Frequent Itemsets Data Warehousing und Mining 1 Data Warehousing und Mining 2 Schnelles Identifizieren
MehrMathematik in den Life Siences
Gerhard Keller Mathematik in den Life Siences Grundlagen der Modellbildung und Statistik mit einer Einführung in die Statistik-Software R 49 Abbildungen Verlag Eugen Ulmer Stuttgart Inhaltsverzeichnis
MehrErstellen eines Beamforming-Filters. Allgemeines. Ordnerstruktur erstellen
1: Erstellen eines Beamforming-Filters Allgemeines Entsprechend des Ablaufs ist es zur Beibehaltung der Übersicht sinnvoll die benötigten Workspaces (Arbeitsverzeichnisse) vorher anzulegen, wie im weiteren
MehrLösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK vom 17. Juli 01 (Dauer: 90 Minuten) Übersicht über
MehrGrundlagen der Programmierung
Grundlagen der Programmierung Algorithmen und Datenstrukturen Die Inhalte der Vorlesung wurden primär auf Basis der angegebenen Literatur erstellt. Darüber hinaus sind viele Teile direkt aus der Vorlesung
MehrMathematische Erfrischungen III - Vektoren und Matrizen
Signalverarbeitung und Musikalische Akustik - MuWi UHH WS 06/07 Mathematische Erfrischungen III - Vektoren und Matrizen Universität Hamburg Vektoren entstanden aus dem Wunsch, u.a. Bewegungen, Verschiebungen
MehrAnwendungen der Hauptkomponentenanalyse. Volker Tresp vertreten durch Florian Steinke
Anwendungen der Hauptkomponentenanalyse Volker Tresp vertreten durch Florian Steinke 1 Dimensionsreduktion für Supervised Learning 2 Beispiel: Kaufentscheidung 3 Verbesserte Abstandsmaße durch Hauptkomponentenanalyse
MehrDigitalisierung und ihre Konsequenzen
Digitalisierung und ihre Konsequenzen Bisher haben wir im Zusammenhang mit dem FID und den daraus resultierenden frequenzabhängigen Spektren immer nur von stetigen Funktionen gesprochen. In Wirklichkeit
MehrDigitalelektronik - Inhalt
Digitalelektronik - Inhalt Grundlagen Signale und Werte Rechenregeln, Verknüpfungsregeln Boolesche Algebra, Funktionsdarstellungen Codes Schaltungsentwurf Kombinatorik Sequentielle Schaltungen Entwurfswerkzeuge
Mehr5. Fourier-Transformation
Fragestellungen: 5. Fourier-Transformation Bei Anregung mit einer harmonischen Last kann quasistatitisch gerechnet werden, wenn die Erregerfrequenz kleiner als etwa 30% der Resonanzfrequenz ist. Wann darf
MehrKünstliche neuronale Netze
Künstliche neuronale Netze Eigenschaften neuronaler Netze: hohe Arbeitsgeschwindigkeit durch Parallelität, Funktionsfähigkeit auch nach Ausfall von Teilen des Netzes, Lernfähigkeit, Möglichkeit zur Generalisierung
MehrOutline. 1 Vektoren im Raum. 2 Komponenten und Koordinaten. 3 Skalarprodukt. 4 Vektorprodukt. 5 Analytische Geometrie. 6 Lineare Räume, Gruppentheorie
Outline 1 Vektoren im Raum 2 Komponenten und Koordinaten 3 Skalarprodukt 4 Vektorprodukt 5 Analytische Geometrie 6 Lineare Räume, Gruppentheorie Roman Wienands (Universität zu Köln) Mathematik II für Studierende
MehrBeate Meffert, Olaf Hochmuth: Werkzeuge der Signalverarbeitung, Pearson 2004
4 Signalverarbeitung 4.1! Grundbegriffe! 4.2! Frequenzspektren, Fourier-Transformation! 4.3! Abtasttheorem: Eine zweite Sicht Weiterführende Literatur (z.b.):!! Beate Meffert, Olaf Hochmuth: Werkzeuge
MehrAdaptive Systeme. Sommersemester Prof. Dr. -Ing. Heinz-Georg Fehn. Prof. Dr. rer. nat. Nikolaus Wulff
Adaptive Systeme Sommersemester 2015 Prof. Dr. -Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff Prof. Dr. H.-G. Fehn und Prof. Dr. N. Wulff 1 Adaptive Systeme Adaptives System: ein System, das
Mehr4. Übung für Übungsgruppen Musterlösung
Grundlagenveranstaltung Systemtheorie WS 6/7 (H.S. Stiehl, AB Kognitive Systeme, FB Informatik der Universität Hamburg). Übung für Übungsgruppen Musterlösung (N. Stein, Institut für Angewandte Physik,
MehrDie Fourier-Transformation
1/20 Die Fourier-Transformation 2/20 Die FT ermittelt aus dem Signal von überlagerten Schwingungen welche Frequenzen enthalten sind FT 3/20 Von der folgenden Schwingung soll die Frequenz ermittelt werden
MehrChildren s Production of Word Accents in Swedish Revisited (Mitsuhiko Ota; Edinburgh)
Children s Production of Word Accents in Swedish Revisited (Mitsuhiko Ota; Edinburgh) Intonation der Kindersprache Sommersemester 2008 Bistra Andreeva Referentin: Christina Blaß Ausblick Akzent I und II:
MehrMathematische Melodieanalyse - Ein Streifzug
RMA - MuWi UHH WS 05/06 Mathematische Melodieanalyse - Ein Streifzug Universität Hamburg Mathematische Melodieanalyse - Einleitung Mathematische Melodieanalyse befasst sich mit der algorithmischen Analyse
MehrKorrelationsmatrix. Statistische Bindungen zwischen den N Zufallsgrößen werden durch die Korrelationsmatrix vollständig beschrieben:
Korrelationsmatrix Bisher wurden nur statistische Bindungen zwischen zwei (skalaren) Zufallsgrößen betrachtet. Für den allgemeineren Fall einer Zufallsgröße mit N Dimensionen bietet sich zweckmäßiger Weise
Mehr1 Boolesches Retrieval (2)
2. Übung zur Vorlesung Internet-Suchmaschinen im Sommersemester 2009 mit Lösungsvorschlägen Prof. Dr. Gerd Stumme, M.Sc. Wi-Inf. Beate Krause 06. Mai 2009 1 Boolesches Retrieval (2) Eine Erweiterung des
MehrUltrakurze Lichtimpulse und THz Physik
Ultrakurze Lichtimpulse und THz Physik 1. Einleitung 2. Darstellung ultrakurzer Lichtimpulse 2.1 Prinzip der Modenkopplung 2.2 Komplexe Darstellung ultrakurzer Lichtimpulse 2.2.1 Fourier Transformation
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de
Mehr