Ein hierarchisches Modell zur inhaltsbezogenen Audio-Klassifikation

Größe: px
Ab Seite anzeigen:

Download "Ein hierarchisches Modell zur inhaltsbezogenen Audio-Klassifikation"

Transkript

1 Carl von Ossietzky Universität Oldenburg Studiengang Hörtechnik und Audiologie MASTERARBEIT Ein hierarchisches Modell zur inhaltsbezogenen Audio-Klassifikation vorgelegt von Steffen Kortlang Betreuender Gutachter Prof. Dr. Dr. Birger Kollmeier Zweiter Gutachter Dr. Jörn Anemüller Oldenburg, 24. Januar 211

2 Ein hierarchisches Modell zur inhaltsbezogenen Audio-Klassifikation Masterarbeit vorgelegt von Steffen Kortlang Erstgutachter: Zweitgutachter: Betreuer (Fraunhofer IDMT-HSA): Prof. Dr. Dr. Birger Kollmeier Dr. Jörn Anemüller Jens Schröder Oldenburg, 24. Januar 211

3 III Kurzfassung Üblicherweise wird in der hierarchischen Klassifikation (in Abgrenzung zur flachen oder direkten Klassifikation) das System in kleinere, unabhängige und im Allgemeinen einfacher zu lösende Klassifikationsprobleme zerlegt und für jeden der Hierarchie inneliegenden Knoten ein Klassifikator bestimmt und trainiert. Anwendung findet dies klassischerweise in der automatischen Genreklassifikation oder der Text- bzw. Dokumentenklassifikation. Vorgestellt wird ein System zur inhaltsbezogenen Audioklassifikation mit benutzerdefinierter Taxonomie. Dieses ordnet ein Signal zunächst groben Kategorien (Sprache, Musik oder Geräusch) zu, um anschließend eine spezifische Klassifikation durchzuführen, wie beispielsweise in der Sprechererkennung oder Musikgenreklassifikation üblich. Es wird ein hierarchischer, Gaußscher Klassifizierer als Baum von flachen Gaußschen Klassifikatoren mit eigener Featureauswahl und eigenen Wahrscheinlichkeitsdichten vorgestellt. Zwar multiplizieren sich für die Berechnung der akkumulativen Klassifikationsrate beim hierarchischen Ansatz die Fehlerraten der Ebenen, allerdings ist so unter anderem eine knotenspezifische Wahl der besten Features möglich. Um das Potential eines hierarchischen Ansatzes auszuschöpfen, wird daher ein besonderer Wert auf die Implementation einer umfassenden Datenbank von Features sowie auf den Vergleich verschiedener Algorithmen zur Featureauswahl gelegt. Zunächst wird in Kapitel 1 eine Definition von hierarchischer Klassifikation versucht und Vor- und Nachteile benannt. Nachfolgend erfolgt mit einer Auflistung von Arbeiten zu dem Thema ein Überblick zum Stand der Forschung. Die theoretischen Grundlagen der (hierarchischen) Audioklassifikation werden in Kapitel 2 beschrieben. Auf die Software-Implementierung in Matlab wird in Kapitel 3 eingegangen. Dort folgt mit der Vorstellung der genutzten Audio-Taxonomie, der zur Klassifikation genutzten Features und der Merkmalsauswahl ein genauer Einblick in das verwendete System. In Kapitel 4 wird ein Vergleich zwischen den Klassifikationsraten von hierarchischem und flachem Ansatz geführt und so eine Aussage über Nutzbarkeit und Grenzen eines solchen Systems für unterschiedliche Klassifikationsszenarien getätigt. Es lassen sich verhältnismäßig hohe Klassifikationsraten über 9 % erzielen, wobei der hierarchische Ansatz im Mittel bessere Ergebnisse liefert als der flache. Zusätzlich erfolgt eine systematische Untersuchung zur Verbesserung des hierarchischen Modells anhand von Parametern und des Einflusses der benutzerdefinierten Taxonomie. Das vorgestellt Klassifikationssystem stellt daher eine gute Basis für weitere Entwicklungen dar.

4 IV Abstract Hierarchical classification schemes (in contrast to the flat or direct approach) usually assume a classification problem to be separable into smaller, independent and in general easier-to-solve tasks. Motivated by its success in the field of automatic music genre classification and document classification, a hierarchical approach for content-based classification of music, speech and environmental sounds with a predefined, tree-structured taxonomy is presented in this thesis. For each node in the tree, an individual Gaussian classifier (GMM) is developed and trained with node-specific features. As the accumulative classification rates are multiplied for each node in the tree, the optimal feature sets for each node and tree level are selected in such a way that the overall error-rate is minimized. In order to tap the full potential of a hierarchical approach, a special value is led on the implementation of a huge amount of features as well as on the comparison of different feature selection algorithms. Firstly, in chapter 1, a definition of hierarchical classification is tried and advantages and disadvantages are listed. Consecutively, an overview of the current literature is given. The theoretical principles of the (hierarchical) audio classification are descriped in chapter 2. The implemented Matlab-based classification system is presented in chapter 3. It provides a detailed insight into the audio taxonomy, the extracted features and the feature subset selection. A first comparison between the classification rates of the hierarchical and the direct approach is made in chapter 4. With average classification rates over 9%, better results than in the literature can be achieved, whereat on average the hierarchical aproach provides even better outcomes than the flat. The results allow an assessment of the usability and limitations of such a system also for other classification scenarios. Additionally, a systematic investigation for the enhancement of the hierarchical model is made on the basis of the parameters and the influence of the user-defined taxonomy. The present classification system therefore provides a good basis for further developments.

5 Inhaltsverzeichnis V Inhaltsverzeichnis 1 Einleitung Motivation Stand der Forschung Ziel der Arbeit Theorie Taxonomie Features Temporale Features Energetische Features Beschreibung der spektralen Form Spektrale Flachheit Zeitliche Variation des Spektrums Bandbasierte Beschreibung der spektralen Form Harmonische Features Lautheitsbasierte Features Temporale Modellierung Dimensionsreduktion Dimensionsreduktionsmethoden Motivation und Merkmalsauswahlalgorithmen Charakterisierung von Merkmalsauswahlalgorithmen Evaluationsmaße Übersicht gebräuchlicher Merkmalsauswahlalgorithmen Ausgewählte Algorithmen Gaussian Mixture Models Einführung Likelihood einer (Einzel-)Beobachtung Likelihood eines Satzes von Beobachtungen A-posteriori-Wahrscheinlichkeiten eines Sets von Beobachtungen EM-Algorithmus Testverfahren (Akkumulative) a-posteriori-wahrscheinlichkeiten Klassifikationsraten Das Kreuzvalidierungsverfahren Klassifikationssystem Wahl der Audio-Taxonomie Audiodateien Featureextraktion Features Temporale Modellierung Nachbearbeitung der Merkmale Auswahl der Trainingssamples Wahl der Algorithmen

6 Inhaltsverzeichnis VI 3.5 Testverfahren Framebasiert Dateibasiert Evaluation Voruntersuchung des Systems Ergebnisse der Feature Selection mittels mrmr D-Darstellungen des Feature-Raums Wahl der optimalen Parameter Klassifikationsraten Einfluss anderer Parameter (maximale) Anzahl Trainingssamples pro Klasse Merkmalsauswahlalgorithmus Leave-One-Out Test Zusammenfassung und Diskussion Zusammenfassung Diskussion Ausblick Anhang Grundlagen Korrelation Tiefpassfilterung Fourier-Transformation Filterbänke Die (Gauß sche) Normalverteilung K-means Clustering Tabellen Abkürzungsverzeichnis 84 Symbolverzeichnis 84 Literaturverzeichnis 86 Danksagung 89 Erklärung 9

7 Kapitel 1 Einleitung 1 Kapitel 1 Einleitung Einleitend soll zunächst eine Motivation für diese Masterarbeit gegeben werden. Anschließend erfolgt eine Übersicht zu hierarchischen Lern-Algorithmen in der Literatur und eine Skizzierung der verfolgten Ziele. 1.1 Motivation In der inhaltsbezogenen Audioklassifikation wurden in den letzten Jahren einige Fortschritte erzielt. Einsatzgebiete sind in der Unterhaltungsindustrie, der automatischen Datenarchivierung, der Überwachung aber auch in personenbezogenen Hörsystemen zu finden. Zum Beispiel kann ein Hörgerät mittels einer Analyse der auditiven Umgebung seine Parameter optimal auf die aktuelle Hörsituation (Konzert, Unterhaltung, Natur) einstellen. Mit der stetigen Verbesserung der technischen Möglichkeiten und der Erhöhung des Ausmaßes der Anwendungsszenarien steigt auch der Umfang zu unterscheidender Audioklassen. In der klassischen flachen (auch ebenen oder direkten ) Klassifikation werden diese gleichberechtigt modelliert und die Klassifikationsentscheidung auf Basis einer Entscheidungsstufe gefällt. Typischerweise wird also angenommen, dass die zu separierenden Klassen keine zugrundeliegende Struktur aufweisen. Bei einer solchen Vielzahl von Klassen jedoch ist zu untersuchen, ob eine hierarchisierte Taxonomie bessere Ergebnisse liefert. Beim hierarchischen Ansatz wird das System in kleinere, unabhängige und im Allgemeinen einfacher zu lösende Klassifikationsprobleme zerlegt und für jeden inneliegenden Knoten in der Hierarchie ein Klassifikator bestimmt und trainiert (Keshet, 29). Ein hierarchischer gaußscher Klassifizierer (H-GC) ist daher ein Baum von flachen gaußschen Klassifikatoren (F-GC, vgl. Peeters und Rodet, 23, S. 3), der die Möglichkeit enthält, an jedem Knotenpunkt eigene Verarbeitungsschritte (Merkmalsauswahl, Feature Transformation und Modellierung der Wahrscheinlichkeitsdichten) durchzuführen. Um beispielsweise einen bestimmten Sprecher zu klassifizieren, kann zunächst bestimmt werden, ob es sich bei dem Audiosignal um Sprache handelt. Anschließend wird dann überprüft, ob es sich um einen männlichen oder einen weiblichen Sprecher handelt. Erst zum Schluss wird dann mit Sprechern des entsprechenden Geschlechts verglichen. Diese Art der hierarchischen Klassifikation birgt gegenüber dem flachen Ansatz einige Vorteile: Das Klassifikationsproblem wird in kleinere (einfacher zu trennende) Teilmengen zerlegt. Die naturgemäß zugrundeliegende Systematik wird reflektiert. Eine knotenspezifische Wahl der Merkmale wird ermöglicht. Ähnliche Klassen können auf unterster Ebene der Hierarchie besser getrennt werden. Es besteht die Möglichkeit, später noch differenziertere Unterschiede an den Knotenpunkten zu machen (z.b. andere Erkenner, andere Vorverarbeitung der Features, etc.). Es ergeben sich jedoch auch folgende Nachteile gegenüber dem flachen Ansatz: Es besteht eine höhere Komplexität der Implementation und damit einhergend ein höherer Rechenaufwand.

8 Kapitel 1 Einleitung 2 Die Fehlerraten multiplizieren sich. Ein männlicher Sprecher muss beispielsweise zunächst als Sprecher, dann als männlich und anschließend unter den männlichen Sprechern richtig erkannt werden. 1.2 Stand der Forschung Die Einordnung von Klängen in eine hierarchische Struktur ist ein alltägliches Phänomen, z.b. die Einteilung von Liedern zu bestimmten Musikgenres. Die Kategorisierung von (Umgebungs-)geräuschen ist bisher weniger erforscht worden. Da dies aber einen Großteil der Taxonomie dieser Arbeit darstellt, werden nachfolgend zwei Ansätze aus der Literatur beschrieben. Die von Gaver (1993) vorgeschlagene Taxonomie sieht vor, Geräusche ( interagierende Materialien ) in schwingende Festkörper (Stoß, Kratzen,...), aerodynamische Klänge (Wind, Explosion,...) und liquide Klänge (Spritzer, Wellen,...) zu unterteilen. Gygi u. a. (27) hingegen stellen in ihrem Artikel Similarity and categorization of environmental sounds eine andere Kategorisierung vor. Sie haben in verschiedenen Experimenten untersucht, wie sich Umgebungsgeräusche hinsichtlich ihrer Ähnlichkeit zusammenfassen lassen. Dafür wurden zunächst 5 Geräusch-Klassen festgelegt. In einem Experiment sollten vier Probanden jedes Paar von Klängen (insgesamt 1.) hinsichtlich ihrer Ähnlichkeit auf einer Skala von 1 bis 7 bewerten. Es wurde jedoch keine Einschränkung dafür festgelegt, auf welcher Basis die Entscheidung gefällt werden sollte. Anschließend wurden die Ergebnisse zu einer Ähnlichkeitsmatrix geeignet zusammengefasst. Die Lösung eines Ordinationsverfahrens (drei-dimensionale Multidimensionale Skalierung, MDS) wurde auf Anhäufungen untersucht. In Abbildung 1.1 ist die erste Dimension dieser Lösung in Abhängigkeit der zweiten Dimension grafisch dargestellt. Aus dieser Darstellung heraus definieren sie drei Gruppen von Umgebungsgeräuschen: harmonische, impulsartige und kontinuierliche Klänge. In der Darstellung von Dimension 1 gegen Dimension 3 hingegen lassen sich Häufungen finden, die als vokal und nicht-vokal gekennzeichnet wurden. Sie konnten zudem nachweisen, dass die Dimensionen der MDS durch Linearkombinationen akustischer Merkmale angenähert werden können. Es gibt auch Bestrebungen eine Taxonomie bei gegebenen Audioklassen automatisch erzeugen zu lassen. Um die hierarchie-innere Semantik automatisch anzupassen, wurde einige statistische Ähnlichkeitsgrenzen zwischen den Wahrscheinlichkeitsmodellen angrenzender Klassen (Knoten) definiert. Die Ähnlichkeit mehrerer Klassen kann dann mittels back-off -Schätzung oder Schrumpfungsverfahren erzwungen werden (Keshet, 29). Anwendung findet die hierarchische Klassifikation klassischerweise in der Text- bzw. Dokumentenklassifikation (z.b. automatischer Spam-Filter). Ansonsten findet eine hierarchisch organisierte Klassifikationsstruktur in der Literatur nur in begrenztem Umfang Erwähnung, zum Beispiel in der automatischen Genreklassifikation. Zang und Kuo (1999) sind eine der ersten Autoren, die ein solches hierarchisches System in der Audio-Klassifikation nutzen. Hierfür entwickeln sie eine zwei Ebenen umfassende Hierarchie. Auf der höchsten Ebene unterscheiden sie Klänge in Sprache, Musik, Umgebungsgeräusche und Stille. Auf der niedrigen Ebene werden 1 Geräuschklassen (Applaus, Vögel, Lachen, u.a.) separiert. Auf dieser Ebene erreichen sie eine Klassifikationsrate von über 8%. Lu u. a. (26) stellen ein hierarchisches Klassifikationssystem für vier musikalische Stimmungen ( Zufriedenheit, Depression, Ausgelassenheit und Unruhe ) vor. Erstere und letztere Klassen werden auf höherer Ebene zusammengefasst, sodass sich ebenfalls eine hierarchische Taxonomie mit 2 Ebenen ergibt. Zur Klassifikation werden Intensitätsfeatures, Features zur Klangfarbe (z.b. Spectral Contrast Features ) und rhythmische Features verwendet. Lu u. a. (26) benutzen Mittelwert und Standardabweichung der Features und anschließend eine Lineare Diskriminanzanalyse (LDA, siehe Kapitel 2.3.1) zur Dimensionsreduktion. Zum Training wird ein Gaussian Mixture Model (GMM, siehe Kapitel 2.4) mit 16 Mischungskomponenten gewählt. Sie erzielen eine Klassifikationsrate von bis zu 86,3% beim hierarchischen Ansatz gegenüber 8,6% beim flachen Ansatz. Auch die Standardabweichung nimmt deutlich ab (5.2% gegenüber 1.7%). Roma u. a. (21) beschreiben in Content-based retrieval from unstructured databases using an ecological acoustics taxonomy ein Projekt, dessen Ziel es ist, die Erstellung von

9 Kapitel 1 Einleitung 3 Abbildung 1.1: Dimension 1 gegen Dimension 2 der dreidimensionalen MDS-Lösung für die akustischen Ähnlichkeitsdaten (Gygi u. a., 27, S. 844). Die charakteristischen Cluster sind wie im Text beschrieben markiert. Klangwelten ( Soundscapes ) in virtuellen Umgebungen zu erleichtern. Konkret geht es um die automatische Analyse und Kategorisierung von öffentlichen, benutzergetragenen Sound-Datensammlungen im Internet. Dabei nutzen sie die beschriebene Taxonomie nach Gaver (1993). Insgesamt ergeben sich so 11 verschiedene Klassen von Geräuschen. Es werden zwei Sätze von Merkmalen implementiert: Mel-Frequenz-Cepstrum-Koeffizienten (MFCCs, siehe Kapitel 2.2.6) und Features zur Beschreibung der spektralen Einhüllenden (inklusive Tonhöhe). Zur Klassifikation werden Support Vector Machines (SVMs) benutzt. Das System ordnet die Klänge bezüglich ihrer akustischen Ähnlichkeit zu jeder Klasse der Taxonomie und ermöglicht so eine systematische Kategorisierung der Datenbanken. Sie testen einen hierarchischen Ansatz und erhalten eine Klassifikationsrate von 8.61% gegenüber 84.1% bei der flachen Klassifikation. Den beschriebenen Klassifikationssystem ist gemein, dass die spezifischen Merkmale jeder Verzweigungsstelle der Hierarchie separat mittels a-priori-wissen ausgewählt werden. Die Bestimmung der passendsten Features zu einem gegebenen Klassifikationsproblem aus einem Satz vorhandender Features kann jedoch auch automatisch mittels Merkmalsauswahlalgorithmus (FSA, siehe Kapitel 2.3.2) geschehen. Hier ist zum Beispiel die auf Transinformation basierende Minimum-redundancy-maximumrelevance feature selection (mrmr, siehe Kapitel 2.3.6) nach Peng u. a. (25) zu nennen. Auch in der hierarchischen Audio-Klassifikation finden Merkmalsauswahlalgorithmen Verwendung. Peeters und Rodet (23) beispielsweise stellen den Merkmalsauswahlalgorithmus Inertia Ratio Maximization using Feature Space Projection (IRMFSP, siehe Kapitel 2.3.6) vor. Diesen nutzen sie im Rahmen eines System zur Klassifikation einer großen Datenbank von Musikinstrumenten. Ihre Taxonomie besteht aus 23 verschiedenen Klassen (Instrumenten), die auf der höheren Hierarchiebene nach gestrichenen Instrumenten (z.b. Geige) und ungestrichenen Instrumenten (z.b. Klavier) unterteilt. Sie separieren also kontinuierliche von perkussiven Klängen. Peeters und Rodet erreichen mit dem H-GC eine Klassifikationsrate von 57% (8% für die richtige Instrumentenfamilie) gegenüber nur 53% mit dem F-GC. Unter Benutzung der Featuretransformations-Algorithmen Gaussianity (nichtlineare Transformation für jedes Feature zur Anpassung der Wahrscheinlichkeitsdichte an die einer Gauß-Verteilung)

10 Kapitel 1 Einleitung 4 und der LDA zur weiteren Dimensionsreduktion verbessert sie sich auf 64% (gegenüber 52% beim flachen Ansatz). Der IRMFSP-Algorithmus findet ebenfalls Verwendung im System von Essid u. a. (25) zur hierarchischen Instrumenten-Erkennung in polyphoner Musik, in dem 11 Kombinationen von Musikinstrumenten in Jazz-Ensembles (Solo bis Quartett) klassifizert werden. Aus einem Pool von 164 Merkmalen nutzen sie dabei im Mittel 3.33 Merkmale. Einen korrelationsbasierten Ansatz zur Merkmalsauswahl (CFS, siehe Kapitel 2.3.6) nach Hall (1999) verfolgt Burred. Er entwickelt im Rahmen seiner Diplomarbeit mit dem Thema An Objective Approach to Content-Based Audio Signal Classification (23) an der TU Berlin ein hierarchisch organisiertes Klassifikationssystem. Seine Ergebnisse werden von Burred und Lerch (23) in A Hierarchical Approach to Automatic Musical Genre Classification näher vorgestellt. In seiner hierarchischen Taxonomie werden die Audiodateien dabei zunächst den Kategorien Sprache, Hintergrund und Musik zugeordnet. Sprachsignale werden in männlich, weiblich und Sprache mit Hintergrundgeräusch (z.b. Musik) getrennt. Einen besonderen Wert legt Burred auf die Unterscheidung zwischen insgesamt 13 klassischen und nichtklassischen Musikgenres. Insgesamt unterscheidet er so zwischen 17 (nicht mehr weiter unterteilbaren) Klassen. Pro Klasse sind 5 Audiodateien (entsprechend 5 Samples) gegeben. 45 davon werden zum Training benutzt. Insgesamt werden 9 Features implementiert, darunter 2 instantane ( framebasierte ) Features (MFCCs, Nulldurchgangsrate u.a.) mit jeweils 4 verschiedenen statistischen Modellierungen der Features (Mittelwert, Standardabweichung, sowie Mittelwert und Standardabweichung der Delta-Features), ein globales Feature (Low energy rate) und 9 Features, die auf einem Beat-Histogramm (Pulsstärke in Abhängigkeit eines Tempowertes) beruhen. In einem ersten Schritt testet Burred die Features auf Unabhängigkeit von einer Rauschaddition und der Signal- Bandbreite (mittels Tiefpassfilterung bei 11 khz). 32 Features stellen sich in diesem Test als besonders anfällig heraus und werden nachfolgend aus dem Pool der Features ausgeschlossen, sodass effektiv nur noch 58 Features verwendet werden. In der Feature Selection werden die 2 besten Merkmale ausgewählt und zur Klassifikation genutzt. Es wird ein Vergleich der Klassifikationsfähigkeit zwischen dem GMM- und dem k-nearest-neighbor-erkenner (KNN) unternommen, bei dem festgestellt wird, dass beide etwa ähnliche Klassifikationsgenauigkeiten bieten. In der finalen Version seiner Implementation werden GMMs mit jeweils 3 Komponenten benutzt. Getestet wird das System mittels eines 1-fachen Kreuzvalidierungsverfahrens (siehe Kapitel 2.5.3). Die besten unabhängigen Klassifikationsraten werden auf den höheren Ebenen der Hierarchiestruktur erreicht. Sprache, Hintergrund und Musik können zu 94.59% getrennt werden, klassische und nicht-klassische Musik zu 96.% und Kammer- und Orchestermusik zu 81.52%. Auf den untersten Ebenen der Hierarchie hingegen fällt die unabhängige Klassifikationsrate ab. Insgesamt ergibt sich so eine durchschnittliche (akkumulative) Klassifikationsrate von 58.71%±2.85% und bei der flachen, direkten Klassifikation von 59.76%±5.23%. Die Leistung der beiden Ansätze ist damit insgesamt ähnlich. Burred (25) beschreibt und evaluiert seine Ergebnisse in A Hierarchical Music Genre Classifier Based on User-Defined Taxonomies weiter und vergleicht sie mit früheren Arbeiten. Im Rahmen der Music Information Retrieval Evaluation exchange (MIREX 25) wurde das System in einem Wettbewerb ( Audio Genre Classification ) zur Klassifikation von Audiodateien bezüglich ihres Musikgenres getestet. Die feste Taxonomie war nun definierbar durch den Benutzer. Außerdem wurde der Test der Features auf Robustheit gegenüber Irrelevanzen entfernt, da die Audiodaten der MIREX-Datenbank als rauschfrei angenommen wurden. Getestet wurde zum Einen auf dem Magnatune -Datensatz mit 1 verschiedenen Musikgenres (unterteilt in 5 ungleich große Gruppen). Dabei ergab sich eine hierarchische Klassifikationsrate von 59.22% (flach 54.12%). Der USPOP -Datensatz hingegen implizierte keine hierarchische Taxonomie, sodass lediglich der flache Ansatz getestet wurde. Es ergab sich eine Klassifikationsrate von 66.3%. Im Vergleich zu den anderen Teilnehmer im Wettbewerb konnte Burred (25) damit nur ein mittelmäßiges Ergebnis erzielen. Nicht zu Verwechseln ist dieses Verständnis der hierarchischen Klassifikation im Übrigen mit dem Hierarchical Gaussian Mixture Model (HGMM) von Garcia u. a. (21). Auch Liu u. a. (22) präsentieren in Hierarchical Gaussian mixture model for speaker verification eine neue Art von Gaussian Mixture Models und ihre Relevanz für die Sprechererkennung. In diesen Ansätzen wird aber nicht das eigentliche Klassifikationsproblem hierarchisch behandelt, sondern lediglich ein mit mehreren Hierarchien

11 Kapitel 1 Einleitung 5 System Anzahl Klassen flach hierarchisch Zhang (Geräusche) - >8% Peeters (Musikinstrumente) 53% 57% Peeters 23 (G+LDA) 23 (Musikinstrumente) 52% 64% Essid (Instrumentenkombin.) k.a. k.a Burred (Sprache, Musik) 59.76% 58.71% Burred (MIREX 25, Magnatune) 1 (Musikgenres) 54.12% 59.22% Burred (MIREX 25, USPOP) 6 (Musikgenres) 66.3% - MRA 26 4 (mus. Stimmungen) 8.6% 86.3% MTG Barcelona (Geräusche) 84.1% 8.61% Tabelle 1.1: Chronologisch sortierte Übersicht zu Ergebnissen mit H-GC vs. F-GC angelehnt an die Tabelle von Burred (25, S.3) ausgestatteter Erkenner vorgestellt. 1.3 Ziel der Arbeit Aus der Literaturrecherche ist festzustellen, dass der hierarchischen Audio-Klassifikation (speziell in den letzten Jahren) wenig Aufmerksamkeit gewidmet wurde und die vorgestellten hierarchischen Klassifikationssysteme in der Regel nur einen kleinen Bereich der Audio-Klassifikation abdecken. Eine vergleichende Übersicht mit den angegebenen Klassifikationsraten für den flachen und den hierarchischen Ansatz ist in Tabelle 1.1 dargestellt. Im Vergleich der Klassifikationsraten ist ersichtlich, dass der hierarchische Ansatz bisher nur vereinzelt eine Erhöhung der Erkennerleistung bewirken konnte. Ziel dieser Arbeit ist es daher, ein effizientes System zur Klassifikation von insgesamt 21 Klassen aus den Bereichen Musik, Sprache und Geräusche zu entwickeln, die konkurrierend in einer flachen und einer hierarchischen Taxonomie realisiert werden. Es soll eine systematische Untersuchung der hierarchischen Struktur und deren Vor- und Nachteile gegenüber dem flachen Ansatz erstellt und daraus auf das Potential der hierarchischen Audio-Klassifikation geschlossen werden. Das implementierte Klassifikationssystem wird in Kapitel 3 beschrieben. Die Klassen werden mit Gaussian Mixture Models (GMMs) modelliert. Um die Vorteile des hierarchischen System gemäß Kapitel 1.1 auszunutzen, also einen größtmöglichen Nutzen aus einem hierarchischen Ansatz zu ziehen, wird ein besonderer Wert auf die Extraktion der Merkmale und deren automatischer Auswahl gelegt. Um zu gewährleisten, dass für die verschiedenen Klassifikationsprobleme ein geeignter Satz von Features bereit gestellt wird, wird eine umfassende Feature-Datenbank (194 Merkmale) eingesetzt. Insgesamt werden drei verschiedene Algorithmen zur Merkmalsauswahl, also zur Wahl der spezifisch geeignetsten Merkmale, implementiert. Das Klassifikationssystem wird in Kapitel 4 in drei Stufen evaluiert. Die Ergebnisse der Merkmalsauswahl und die sich daraus ergebende Verteilung der Beobachtungen im Featureraum werden aufgelistet und interpretiert. Ausserdem wird eine Untersuchung zur Abhängigkeit des System von der Anzahl der genutzten Merkmale und der Anzahl der Komponenten des GMMs vollzogen. Im Anschluss werden mit diesen Parametern die Klassifikationsraten für die verschiedenen Verzweigungsstellen der Hierarchie ermittelt und die Ergebnisse mit denen des flachen Ansatzes verglichen. Abschließend erfolgt eine systematische Untersuchung zur Verbesserung des hierarchischen Modells anhand von Parametern und dem Einfluss der benutzerdefinierten Taxonomie.

12 Kapitel 2 Theorie 6 Kapitel 2 Theorie In diesem Kapitel werden einige grundlegende und für diese Arbeit relevante Konzepte der Audio- Klassifikation, im Sinne der automatischen Erkennung von definierten Audio-Klassen, vorgestellt. Gemäß Abbildung 2.1 lassen sich üblicherweise in fast jedem Klassifikationssystem ähnliche größtenteils unabhängige Teilelemente der Klassifikation herausstellen. Zunächst werden die zu unterscheidenden Klassen (z.b. die Sprecher bei der Sprechererkennung) in einer Systematik, der durch eine Gruppe von textuellen Attributen definierten Taxonomie, eingeteilt. Üblicherweise sind die Klassen dabei keiner Hierarchie unterworfen, sondern flach (nebeneinander) angeordnet. Da die hierarchische Strukturierung der Klassen (z.b. in Form der Zusammenfassung in Musikgenres) jedoch einen wichtigen Aspekt dieser Arbeit darstellt, wird darauf in Kapitel 2.1 eingegangen. Modellierung der Klassen Taxonomie Featureextraktion stat./temp. Modellierung Dimensionsreduktion 2/3 1/3 Test Abbildung 2.1: Allgemeines Klassifikations-Schema In der Featureextraktion werden für jede Klasse dieser Taxonomie aus den Audiosignalen Merkmale (engl.: features ) ermittelt. Dabei ist die Anzahl potentieller Features im Grunde nicht beschränkt und die Literatur beschreibt eine Menge möglicher Featursätze, von den klassischen MFCCs bis hin zu anderen spektralen oder temporalen Merkmalen. Eine Auflistung einer großen Menge von potentiellen Merkmalen erfolgt in Kapitel 2.2. Die Wahl der Features hängt von der beabsichtigten Anwendung ab (z.b. Sprach-, Musik-, oder Geräusch-Diskrimination, Sprechererkennung oder Musikinstrumentenklassifikation). Durch a-priori-wissen über die Diskriminationsfähigkeit für die gegebene Aufgabe (z.b. aus der Literatur) können bereits geeignete Features ausgewählt werden. Da Klänge sich im Allgemeinen über die Zeit ändern, werden die Features in der Regel über die Zeit, also framebasiert, berechnet. Diese instantanen Merkmale können direkt im Echtzeit-Kontext zur Klassifikation benutzt werden oder die statistische bzw. temporale Modellierung der Merkmale (üblicherweise über Mittelwert und Standardabweichung) kann gemäß Kapitel (siehe Kapitel 2.2.9) zur Modellierung herangezogen werden. Eine zeitliche Entwicklung der Merkmale kann alternativ auch durch Hidden Markov Modelle (HMMs) beschrieben werden. Anschließend erfolgt in der Regel eine Dimensionsreduktion des Merkmalraums (siehe Kapitel 2.3). Klassischerweise nutzt man hierfür die Lineare Diskriminanzanalyse (LDA). Bei der LDA werden Linearkombinationen der originalen Features als neue Dimensionen im Feature-Raum benutzt, um die Diskrimination der Klassen zu maximieren. Als Alternative zur a-priori Auswahl geeigneter Merkmale kann dies a posteriori über die Benutzung eines Algorithmus zur automatischen Merkmalsauswahl (Feature Subset Selection) geschehen. Traditionell teilt man die extrahierten Beobachtungen im Verhältnis 2:1 in Trainings- und Testmaterial ein, das heißt 2/3 der Beobachtungen werden im Sinne einer Referenz in der Trainingsphase zur Modellierung der Klassen benutzt. Der letzte große Unterschied zwischen den Klassifikations- System bezieht sich daher auf die Wahl des Modells, das die Wahrscheinlichkeitsdichten der Klassen in der Trainingsphase modellieren soll, also die Wahl des Erkenners bzw. Klassifikators. Üblich sind

Music Information Retrieval - automatische Genre-Klassifikation

Music Information Retrieval - automatische Genre-Klassifikation Music Information Retrieval - automatische Genre-Klassifikation Julian Hartmann & Christoph Sünderkamp Institut für Informatik, Seminar Mustererkennung im Alltag 8./10.06.2005 Gliederung 1. Einordnung

Mehr

Fourier - Transformation

Fourier - Transformation Fourier - Transformation Kurzversion 2. Sem. Prof. Dr. Karlheinz Blankenbach Hochschule Pforzheim, Tiefenbronner Str. 65 75175 Pforzheim Überblick / Anwendungen / Motivation: Die Fourier-Transformation

Mehr

Allgemeine Beschreibung von Blockcodes

Allgemeine Beschreibung von Blockcodes Allgemeine Beschreibung von Blockcodes Bei Blockcodierung wird jeweils eine Sequenz von m q binären Quellensymbolen (M q = 2) durch einen Block von m c Codesymbolen mit dem Symbolumfang M c dargestellt.

Mehr

Carl von Ossietzky Universität Oldenburg. Masterarbeit

Carl von Ossietzky Universität Oldenburg. Masterarbeit Carl von Ossietzky Universität Oldenburg Masterstudiengang Hörtechnik + Audiologie Masterarbeit Eine Methode zur Gesangsdetektion basierend auf musikalischen Merkmalen und Merkmalen aus den Frequenzmodulationen

Mehr

Kybernetik Laplace Transformation

Kybernetik Laplace Transformation Kybernetik Laplace Transformation Mohamed Oubbati Institut für Neuroinformatik Tel.: (+49) 73 / 50 2453 mohamed.oubbati@uni-ulm.de 08. 05. 202 Laplace Transformation Was ist eine Transformation? Was ist

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

Von der UML nach C++

Von der UML nach C++ 22 Von der UML nach C++ Dieses Kapitel behandelt die folgenden Themen: Vererbung Interfaces Assoziationen Multiplizität Aggregation Komposition Die Unified Modeling Language (UML) ist eine weit verbreitete

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

Broadband EMI Noise Measurement in Time Domain

Broadband EMI Noise Measurement in Time Domain Broadband EMI Noise Measurement in Time Domain Florian Krug, Peter Russer Institute for High-Frequency Engineering Technische Universität München fkrug@ieee.org 1 Inhalt Einführung Time-Domain Electromagnetic

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Datamining-Cup 2012 - TeamFK i. Datamining-Cup 2012 - TeamFK

Datamining-Cup 2012 - TeamFK i. Datamining-Cup 2012 - TeamFK i Datamining-Cup 2012 - TeamFK ii Inhaltsverzeichnis 1 Programme und Datenvorverarbeitung 1 2 Vorbetrachtung der Daten 2 2.1 Zeitintervalle..................................................... 2 2.2 Mittelwert

Mehr

Digitale Signalbearbeitung und statistische Datenanalyse

Digitale Signalbearbeitung und statistische Datenanalyse Digitale Signalbearbeitung und statistische Datenanalyse Teil 5 8 Aus ontinuierlichem Signal werden in onstanten Zeitintervallen Daten entnommen ontinuierliches Signal x(t) Einheitsimpulsfuntion Gewichtete

Mehr

Künstliche Intelligenz

Künstliche Intelligenz Künstliche Intelligenz Data Mining Approaches for Instrusion Detection Espen Jervidalo WS05/06 KI - WS05/06 - Espen Jervidalo 1 Overview Motivation Ziel IDS (Intrusion Detection System) HIDS NIDS Data

Mehr

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data

Mehr

Lautheitsaussteuerung, Normalisierung und zulässiger Maximalpegel von Audiosignalen

Lautheitsaussteuerung, Normalisierung und zulässiger Maximalpegel von Audiosignalen EBU Empfehlung R 128 Lautheitsaussteuerung, Normalisierung und zulässiger Maximalpegel von Audiosignalen Status: EBU Empfehlung This German version of EBU R 128 has been kindly provided by Messrs G. Spikofski

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Modul G.1 WS 07/08: Statistik 17.01.2008 1. Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen. Modul G.1 WS 07/08: Statistik 17.01.2008 1 Wiederholung Kovarianz und Korrelation Kovarianz = Maß für den linearen Zusammenhang zwischen zwei Variablen x und y Korrelation Die Korrelation ist ein standardisiertes

Mehr

Messsystemanalyse (MSA)

Messsystemanalyse (MSA) Messsystemanalyse (MSA) Inhaltsverzeichnis Ursachen & Auswirkungen von Messabweichungen Qualifikations- und Fähigkeitsnachweise Vorteile einer Fähigkeitsuntersuchung Anforderungen an das Messsystem Genauigkeit

Mehr

Multinomiale logistische Regression

Multinomiale logistische Regression Multinomiale logistische Regression Die multinomiale logistische Regression dient zur Schätzung von Gruppenzugehörigkeiten bzw. einer entsprechenden Wahrscheinlichkeit hierfür, wobei als abhänginge Variable

Mehr

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Auch wenn die Messungsmethoden ähnlich sind, ist das Ziel beider Systeme jedoch ein anderes. Gwenolé NEXER g.nexer@hearin gp

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

1. Vorüberlegungen zu visueller und auditiver Eigenwahrnehmung. 2. Auditive Eigenwahrnehmung/ Eigenwahrnehmung der Stimme

1. Vorüberlegungen zu visueller und auditiver Eigenwahrnehmung. 2. Auditive Eigenwahrnehmung/ Eigenwahrnehmung der Stimme Gliederung: 1. Vorüberlegungen zu visueller und auditiver Eigenwahrnehmung 2. Auditive Eigenwahrnehmung/ Eigenwahrnehmung der Stimme 2.1 Relevanz für Kommunikation 2.2 Eigenschaften der EdS: Kanäle 2.3

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi

Motivation. Themenblock: Data Preprocessing. Einsatzgebiete für Data Mining I. Modell von Gianotti und Pedreschi Motivation Themenblock: Data Preprocessing We are drowning in information, but starving for knowledge! (John Naisbett) Was genau ist Datenanalyse? Praktikum: Data Warehousing und Data Mining Was ist Data

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Folge 19 - Bäume. 19.1 Binärbäume - Allgemeines. Grundlagen: Ulrich Helmich: Informatik 2 mit BlueJ - Ein Kurs für die Stufe 12

Folge 19 - Bäume. 19.1 Binärbäume - Allgemeines. Grundlagen: Ulrich Helmich: Informatik 2 mit BlueJ - Ein Kurs für die Stufe 12 Grundlagen: Folge 19 - Bäume 19.1 Binärbäume - Allgemeines Unter Bäumen versteht man in der Informatik Datenstrukturen, bei denen jedes Element mindestens zwei Nachfolger hat. Bereits in der Folge 17 haben

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Bachelorarbeit (Informatik)

Bachelorarbeit (Informatik) Bachelorarbeit (Informatik) Entwicklung einer Android-App zur Erkennung von Redeanteilen im Unterricht Autor Arash Besadi Hauptbetreuung Dr. Thilo Stadelmann Dr. Mark Cieliebak Datum 05.06.2015 Zusammenfassung

Mehr

Monte Carlo Simulation (Grundlagen)

Monte Carlo Simulation (Grundlagen) Der Titel des vorliegenden Beitrages wird bei den meisten Lesern vermutlich Assoziationen mit Roulette oder Black Jack hervorrufen. Allerdings haben das heutige Thema und die Spieltische nur den Namen

Mehr

The integration of business intelligence and knowledge management

The integration of business intelligence and knowledge management The integration of business intelligence and knowledge management Seminar: Business Intelligence Ketevan Karbelashvili Master IE, 3. Semester Universität Konstanz Inhalt Knowledge Management Business intelligence

Mehr

Abb. 1 Akustikprüfstand, gemessene Geschwindigkeitsprofile hinter der Mehrlochblende (links); Spektrogramm der Mehrlochblende (rechts)

Abb. 1 Akustikprüfstand, gemessene Geschwindigkeitsprofile hinter der Mehrlochblende (links); Spektrogramm der Mehrlochblende (rechts) IGF-Vorhaben Nr. 17261 N/1 Numerische Berechnung des durch Turbulenz erzeugten Innenschalldruckpegels von Industriearmaturen auf der Basis von stationären Strömungsberechnungen (CFD) Die Vorhersage der

Mehr

Befragung und empirische Einschätzung der Praxisrelevanz

Befragung und empirische Einschätzung der Praxisrelevanz Befragung und empirische Einschätzung der Praxisrelevanz eines Vorgehensmodells zur Auswahl von CRM-Systemen D I P L O M A R B E I T zur Erlangung des Grades eines Diplom-Ökonomen der Wirtschaftswissenschaftlichen

Mehr

Autoradios auf Testfahrten. Dr. Michael Koch, BMW AG Dipl. Ing. Gregorio Roper, ServiceForce.Com GmbH

Autoradios auf Testfahrten. Dr. Michael Koch, BMW AG Dipl. Ing. Gregorio Roper, ServiceForce.Com GmbH Audioqualitätsbewertung Bewertung der Audioqualität von Autoradios auf Testfahrten Dr. Michael Koch, BMW AG Dipl. Ing. Gregorio Roper, ServiceForce.Com GmbH Agenda Test von Autoradios state of the art

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

Learning Analytics und Foren

Learning Analytics und Foren Learning Analytics und Foren Agathe Merceron Beuth Hochschule für Technik Berlin Margarita Elkina Hochschule für Wirtschaft und Recht Berlin Albrecht Fortenbacher Hochschule für Technik und Wirtschaft

Mehr

ASSP und Vertiefung Grundfrequenzanalyse

ASSP und Vertiefung Grundfrequenzanalyse ASSP und Vertiefung Grundfrequenzanalyse Florian Schiel/Lasse Bombien Seminar Werkzeuge der Sprachverarbeitung (Sommersemester 2012) ASSP Tools Analyseprogramme Vorlesung acfana Berechnung der Autokorrelationsfunktion

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Extended Ordered Paired Comparison Models An Application to the Data from Bundesliga Season 2013/14

Extended Ordered Paired Comparison Models An Application to the Data from Bundesliga Season 2013/14 Etended Ordered Paired Comparison Models An Application to the Data from Bundesliga Season 2013/14 Gerhard Tutz & Gunther Schauberger Ludwig-Maimilians-Universität München Akademiestraße 1, 80799 München

Mehr

Kapitel 4: Binäre Regression

Kapitel 4: Binäre Regression Kapitel 4: Binäre Regression Steffen Unkel (basierend auf Folien von Nora Fenske) Statistik III für Nebenfachstudierende WS 2013/2014 4.1 Motivation Ausgangssituation Gegeben sind Daten (y i, x i1,...,

Mehr

Mining top-k frequent itemsets from data streams

Mining top-k frequent itemsets from data streams Seminar: Maschinelles Lernen Mining top-k frequent itemsets from data streams R.C.-W. Wong A.W.-C. Fu 1 Gliederung 1. Einleitung 2. Chernoff-basierter Algorithmus 3. top-k lossy counting Algorithmus 4.

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

Wichtige Eigenschaft: zeitliche Abnahme der Schallintensität. Akustische Ereignisse müssen Jetzt oder Nie gehört werden

Wichtige Eigenschaft: zeitliche Abnahme der Schallintensität. Akustische Ereignisse müssen Jetzt oder Nie gehört werden Audiodesign Aufzeichnung akustischer Ereignisse Wichtige Eigenschaft: zeitliche Abnahme der Schallintensität Akustische Ereignisse sind zeitliche Phänomene mit Anfang und Ende Akustische Ereignisse sind

Mehr

Ways and methods to secure customer satisfaction at the example of a building subcontractor

Ways and methods to secure customer satisfaction at the example of a building subcontractor Abstract The thesis on hand deals with customer satisfaction at the example of a building subcontractor. Due to the problems in the building branch, it is nowadays necessary to act customer oriented. Customer

Mehr

Single Parity check Codes (1)

Single Parity check Codes (1) Single Parity check Codes (1) Der Single Parity check Code (SPC) fügt zu dem Informationsblock u = (u 1, u 2,..., u k ) ein Prüfbit (englisch: Parity) p hinzu: Die Grafik zeigt drei Beispiele solcher Codes

Mehr

Analyse kritischer Erfolgsfaktoren für Enterprise Social Networking Anwendungen. Bachelorarbeit

Analyse kritischer Erfolgsfaktoren für Enterprise Social Networking Anwendungen. Bachelorarbeit Analyse kritischer Erfolgsfaktoren für Enterprise Social Networking Anwendungen Bachelorarbeit zur Erlangung des akademischen Grades Bachelor of Science (B.Sc.) im Studiengang Wirtschaftswissenschaften

Mehr

Veräußerung von Emissionsberechtigungen in Deutschland

Veräußerung von Emissionsberechtigungen in Deutschland Veräußerung von Emissionsberechtigungen in Deutschland Monatsbericht September 2008 Berichtsmonat September 2008 Die KfW hat im Zeitraum vom 1. September 2008 bis zum 30. September 2008 3,95 Mio. EU-Emissionsberechtigungen

Mehr

Marktliquidität von Aktien

Marktliquidität von Aktien Marktliquidität von Aktien Inauguraldissertation zur Erlangung der Würde eines Doctor rerum oeconomicarum der Wirtschafts- und Sozialwissenschaftlichen Fakultät der Universität Bern Lukas Roth Die Fakultät

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Teil II. Nichtlineare Optimierung

Teil II. Nichtlineare Optimierung Teil II Nichtlineare Optimierung 60 Kapitel 1 Einleitung In diesem Abschnitt wird die Optimierung von Funktionen min {f(x)} x Ω betrachtet, wobei Ω R n eine abgeschlossene Menge und f : Ω R eine gegebene

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Diphone Studio. Teil 3 Analyse resonanter Modelle und Chant-Synthese. Hans Tutschku tutschku@ircam.fr

Diphone Studio. Teil 3 Analyse resonanter Modelle und Chant-Synthese. Hans Tutschku tutschku@ircam.fr Diphone Studio Teil 3 Analyse resonanter Modelle und Chant-Synthese Hans Tutschku tutschku@ircam.fr Der Artikel bezieht eine Sammlung von Beispielklängen ein, die auf folgender web-adresse angehört werden

Mehr

Kapitel 4 Leitungscodierung

Kapitel 4 Leitungscodierung Kapitel 4 Leitungscodierung Prof. Dr. Dirk W. Hoffmann Hochschule Karlsruhe w University of Applied Sciences w Fakultät für Informatik Übersicht Quelle Senke Kompression Huffman-, Arithmetische-, Lempel-Ziv

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Untersuchung der Auswahl der Hauptfreiheitsgrade zum Import eines Modells von ANSYS nach SIMPACK

Untersuchung der Auswahl der Hauptfreiheitsgrade zum Import eines Modells von ANSYS nach SIMPACK IMW - Institutsmitteilung Nr. 35 (2010) 103 Untersuchung der Auswahl der Hauptfreiheitsgrade zum Import eines Modells von ANSYS nach SIMPACK M. Leng; Z. Liang Die Auswahl der Hauptfreiheitsgrade spielt

Mehr

Perzentile mit Hadoop ermitteln

Perzentile mit Hadoop ermitteln Perzentile mit Hadoop ermitteln Ausgangspunkt Ziel dieses Projektes war, einen Hadoop Job zu entwickeln, der mit Hilfe gegebener Parameter Simulationen durchführt und aus den Ergebnissen die Perzentile

Mehr

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)

6. Bayes-Klassifikation. (Schukat-Talamazzini 2002) 6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Unsupervised Kernel Regression

Unsupervised Kernel Regression 9. Mai 26 Inhalt Nichtlineare Dimensionsreduktion mittels UKR (Unüberwachte KernRegression, 25) Anknüpfungspunkte Datamining I: PCA + Hauptkurven Benötigte Zutaten Klassische Kernregression Kerndichteschätzung

Mehr

Prozeßbezogene Signalverarbeitung in der LDA- und PDA-Meßtechnik

Prozeßbezogene Signalverarbeitung in der LDA- und PDA-Meßtechnik Slide 1 Prozeßbezogene Signalverarbeitung in der LDA- und PDA-Meßtechnik Postdoktorandenprogramm der DFG Zusammenarbeit mit Dantec MT Betreuung durch Universität Rostock Slide Postdoktorandenprogramm Ziel

Mehr

Analyse spektraler Parameter des Audiosignals zur Identifikation und Abwehr von Telefon-SPAM

Analyse spektraler Parameter des Audiosignals zur Identifikation und Abwehr von Telefon-SPAM Analyse spektraler Parameter des Audiosignals zur Identifikation und Abwehr von Telefon-SPAM Christoph Pörschmann, Heiko Knospe Institut für Nachrichtentechnik Fachhochschule Köln Betzdorfer Str. 2 50679

Mehr

Die Interferenz von flexiblen Arbeitszeiten mit der Nutzbarkeit arbeitsfreier Zeit Ein Prädiktor für soziale Beeinträchtigungen

Die Interferenz von flexiblen Arbeitszeiten mit der Nutzbarkeit arbeitsfreier Zeit Ein Prädiktor für soziale Beeinträchtigungen Die Interferenz von flexiblen Arbeitszeiten mit der Nutzbarkeit arbeitsfreier Zeit Ein Prädiktor für soziale Beeinträchtigungen Anna Wirtz*, Ole Giebel**, Carsten Schomann**, Friedhelm Nachreiner** *Bundesanstalt

Mehr

Der Bipolar-Transistor und die Emitterschaltung Gruppe B412

Der Bipolar-Transistor und die Emitterschaltung Gruppe B412 TECHNISCHE UNIVERSITÄT MÜNCHEN Der Bipolar-Transistor und die Emitterschaltung Gruppe B412 Patrick Christ und Daniel Biedermann 16.10.2009 1. INHALTSVERZEICHNIS 1. INHALTSVERZEICHNIS... 2 2. AUFGABE 1...

Mehr

Programmiertechnik II

Programmiertechnik II Bäume Symboltabellen Suche nach Werten (items), die unter einem Schlüssel (key) gefunden werden können Bankkonten: Schlüssel ist Kontonummer Flugreservierung: Schlüssel ist Flugnummer, Reservierungsnummer,...

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II

Kategoriale abhängige Variablen: Logit- und Probit -Modelle. Statistik II Kategoriale abhängige Variablen: Logit- und Probit -Modelle Statistik II Wiederholung Literatur Annahmen und Annahmeverletzungen Funktionen Exponenten, Wurzeln usw. Das Problem Das binäre Logit-Modell

Mehr

Integration geometrischer und fotogrammetrischer Information zum Wiederfinden von Bildern

Integration geometrischer und fotogrammetrischer Information zum Wiederfinden von Bildern Integration geometrischer und fotogrammetrischer Information zum Wiederfinden von Bildern Björn Burow SE Mustererkennung in Bildern und 3D-Daten Lehrstuhl Graphische Systeme BTU Cottbus Inhaltsübersicht

Mehr

1. Einfach verkettete Liste unsortiert 2. Einfach verkettete Liste sortiert 3. Doppelt verkettete Liste sortiert

1. Einfach verkettete Liste unsortiert 2. Einfach verkettete Liste sortiert 3. Doppelt verkettete Liste sortiert Inhalt Einführung 1. Arrays 1. Array unsortiert 2. Array sortiert 3. Heap 2. Listen 1. Einfach verkettete Liste unsortiert 2. Einfach verkettete Liste sortiert 3. Doppelt verkettete Liste sortiert 3. Bäume

Mehr

Unterstützende Technologien in der Physiotherapie

Unterstützende Technologien in der Physiotherapie Unterstützende Technologien in der Physiotherapie Thomas Schrader, Angelina Thiers, Annett l Orteye, Kerstin Schrader, und Katja Orlowski Fachhochschule Brandenburg, Medizinische Schule des Städtischen

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Grundlagen der Elektro-Proportionaltechnik

Grundlagen der Elektro-Proportionaltechnik Grundlagen der Elektro-Proportionaltechnik Totband Ventilverstärkung Hysterese Linearität Wiederholbarkeit Auflösung Sprungantwort Frequenzantwort - Bode Analyse Der Arbeitsbereich, in dem innerhalb von

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00.

Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. 1 Statistik I für Wirtschaftswissenschaftler Klausur am 06.07.2007, 14.00 16.00. Bitte unbedingt beachten: a) Gewertet werden alle 9 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses

Mehr

WCDMA-3GPP-Applikationsfirmware R&S FS-K72/-K73

WCDMA-3GPP-Applikationsfirmware R&S FS-K72/-K73 WCDMA-3GPP-Applikationsfirmware R&S FS-K72/-K73 3GPP-Sendermessungen an Basisstationen und Modulen mit dem Signalanalysator R&S FSQ und den Spektrumanalysatoren R&S FSU und R&S FSP Erweiterung der Analysator-Familien

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1

Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Probeklausur Zeitreihenökonometrie (Sommersemester 2014) 1 Aufgabe 1: Betrachtet wird folgendes Modell zur Erklärung des Managergehalts salary durch den Umsatz sales, die Eigenkapitalrendite roe und die

Mehr

Universität Dortmund Integrating Knowledge Discovery into Knowledge Management

Universität Dortmund Integrating Knowledge Discovery into Knowledge Management Integrating Knowledge Discovery into Knowledge Management Katharina Morik, Christian Hüppe, Klaus Unterstein Univ. Dortmund LS8 www-ai.cs.uni-dortmund.de Overview Integrating given data into a knowledge

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002)

3. Entscheidungsbäume. Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) 3. Entscheidungsbäume Verfahren zum Begriffslernen (Klassifikation) Beispiel: weiteres Beispiel: (aus Böhm 2003) (aus Morik 2002) (aus Wilhelm 2001) Beispiel: (aus Böhm 2003) Wann sind Entscheidungsbäume

Mehr

Power-Efficient Server Utilization in Compute Clouds

Power-Efficient Server Utilization in Compute Clouds Power-Efficient Server Utilization in Compute Clouds 1/14 Overview 1. Motivation 2. SPECpower benchmark 3. Load distribution strategies 4. Cloud configuration 5. Results 6. Conclusion 2/14 1. Motivation

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder

Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder Programmieren in PASCAL Bäume 1 1. Baumstrukturen Eine Baumstruktur sei folgendermaßen definiert. Eine Baumstruktur mit Grundtyp Element ist entweder 1. die leere Struktur oder 2. ein Knoten vom Typ Element

Mehr

Datenanalyse und Statistik

Datenanalyse und Statistik Datenanalyse und Statistik p. 1/44 Datenanalyse und Statistik Vorlesung 2 (Graphik I) K.Gerald van den Boogaart http://www.stat.boogaart.de Datenanalyse und Statistik p. 2/44 Daten Schätzung Test Mathe

Mehr

Künstliche Intelligenz Dirk Krechel SS 2009

Künstliche Intelligenz Dirk Krechel SS 2009 Künstliche Intelligenz Dirk Krechel SS 2009 Überblick über das Modul 1. Einführung 2. Symbolische Verfahren Logik Aussagenlogik Prädikatenlogik Horn Logik Prolog 3. Suchen und Bewerten Problemlösen durch

Mehr

OPERATIONS-RESEARCH (OR)

OPERATIONS-RESEARCH (OR) OPERATIONS-RESEARCH (OR) Man versteht darunter die Anwendung mathematischer Methoden und Modelle zur Vorbereitung optimaler Entscheidungen bei einem Unternehmen. Andere deutsche und englische Bezeichnungen:

Mehr

Der Fröhlich-Faktor. Referent: Stefan Fröhlich

Der Fröhlich-Faktor. Referent: Stefan Fröhlich Der Fröhlich-Faktor Referent: Stefan Fröhlich Entstehung des Fröhlich-Faktor Wenn man sich mit der Entwicklung und dem Backtesting von Handelssystemen beschäftigt wird der Fröhlich-Faktor immer dann wichtig

Mehr

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur.

Einseitig gerichtete Relation: Mit zunehmender Höhe über dem Meeresspiegel sinkt im allgemeinen die Lufttemperatur. Statistik Grundlagen Charakterisierung von Verteilungen Einführung Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsverteilungen Schätzen und Testen Korrelation Regression Einführung Die Analyse und modellhafte

Mehr

Einführung in die automatische Spracherkennung

Einführung in die automatische Spracherkennung Einführung in die automatische Spracherkennung Hans-Günter Hirsch http://dnt.kr.hs-niederrhein.de http://dnt.kr.hs-niederrhein.de/asr14/ email: hans-guenter.hirsch@hs-niederrhein.de Folie 1 Persönlicher

Mehr

Aufgabe 3. Signal Processing and Speech Communication Lab. Graz University of Technology

Aufgabe 3. Signal Processing and Speech Communication Lab. Graz University of Technology Signal Processing and Speech Communication Lab. Graz University of Technology Aufgabe 3 Senden Sie die Hausübung bis spätestens 15.06.2015 per Email an hw1.spsc@tugraz.at. Verwenden Sie MatrikelNummer1

Mehr

Universität Passau. Betriebswirtschaftslehre mit Schwerpunkt Internationales Management Prof. Dr. Carola Jungwirth. Masterarbeit

Universität Passau. Betriebswirtschaftslehre mit Schwerpunkt Internationales Management Prof. Dr. Carola Jungwirth. Masterarbeit Universität Passau Betriebswirtschaftslehre mit Schwerpunkt Internationales Management Prof. Dr. Carola Jungwirth Masterarbeit "Identifikation von Erfolgsfaktoren für eine Facebook- Recruiting-Strategie"

Mehr

Group and Session Management for Collaborative Applications

Group and Session Management for Collaborative Applications Diss. ETH No. 12075 Group and Session Management for Collaborative Applications A dissertation submitted to the SWISS FEDERAL INSTITUTE OF TECHNOLOGY ZÜRICH for the degree of Doctor of Technical Seiences

Mehr

Versuch 5: Spreizbandcodierung

Versuch 5: Spreizbandcodierung Versuch 5: Spreizbandcodierung Einleitung In diesem Versuch sollen Sie ausgehend von dem schematic aus Versuch 3 ein Übertragungssystem mit Spreizbandcodierung realisieren. Sie werden die Spektren und

Mehr

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt.

29. Mai 2006. 5. Bei Unterschleif gilt die Klausur als nicht bestanden und es erfolgt eine Meldung an das Prüfungsamt. L. Fahrmeir, C. Belitz Department für Statistik Bitte für die Korrektur freilassen! Aufgabe 1 2 3 4 Punkte Klausur zur Vorlesung Statistik III für Studenten mit Wahlfach Statistik 29. Mai 2006 Hinweise:

Mehr

WS 2009/10. Diskrete Strukturen

WS 2009/10. Diskrete Strukturen WS 2009/10 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws0910

Mehr

Termin3 Klassifikation multispektraler Daten unüberwachte Verfahren

Termin3 Klassifikation multispektraler Daten unüberwachte Verfahren Ziel Termin3 Klassifikation multispektraler Daten unüberwachte Verfahren Einteilung (=Klassifikation) der Pixel eines multispektralen Datensatzes in eine endliche Anzahl von Klassen. Es sollen dabei versucht

Mehr

MySQL Queries on "Nmap Results"

MySQL Queries on Nmap Results MySQL Queries on "Nmap Results" SQL Abfragen auf Nmap Ergebnisse Ivan Bütler 31. August 2009 Wer den Portscanner "NMAP" häufig benutzt weiss, dass die Auswertung von grossen Scans mit vielen C- oder sogar

Mehr

Mathematische Melodieanalyse - Ein Streifzug

Mathematische Melodieanalyse - Ein Streifzug RMA - MuWi UHH WS 05/06 Mathematische Melodieanalyse - Ein Streifzug Universität Hamburg Mathematische Melodieanalyse - Einleitung Mathematische Melodieanalyse befasst sich mit der algorithmischen Analyse

Mehr

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS?

ε heteroskedastisch BINARY CHOICE MODELS Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? BINARY CHOICE MODELS 1 mit Pr( Y = 1) = P Y = 0 mit Pr( Y = 0) = 1 P Beispiele: Wahlentscheidung Kauf langlebiger Konsumgüter Arbeitslosigkeit Schätzung mit OLS? Y i = X i β + ε i Probleme: Nonsense Predictions

Mehr

Algorithms & Datastructures Midterm Test 1

Algorithms & Datastructures Midterm Test 1 Algorithms & Datastructures Midterm Test 1 Wolfgang Pausch Heiko Studt René Thiemann Tomas Vitvar

Mehr

Die Duration von Standard-Anleihen. - Berechnungsverfahren und Einflussgrößen -

Die Duration von Standard-Anleihen. - Berechnungsverfahren und Einflussgrößen - Die Duration von Standard-Anleihen - Berechnungsverfahren und Einflussgrößen - Gliederung Einleitendes Herleitung einer Berechnungsvorschrift Berechnungsvorschriften für Standardfälle Einflussgrößen und

Mehr