Ein hierarchisches Modell zur inhaltsbezogenen Audio-Klassifikation

Größe: px
Ab Seite anzeigen:

Download "Ein hierarchisches Modell zur inhaltsbezogenen Audio-Klassifikation"

Transkript

1 Carl von Ossietzky Universität Oldenburg Studiengang Hörtechnik und Audiologie MASTERARBEIT Ein hierarchisches Modell zur inhaltsbezogenen Audio-Klassifikation vorgelegt von Steffen Kortlang Betreuender Gutachter Prof. Dr. Dr. Birger Kollmeier Zweiter Gutachter Dr. Jörn Anemüller Oldenburg, 24. Januar 211

2 Ein hierarchisches Modell zur inhaltsbezogenen Audio-Klassifikation Masterarbeit vorgelegt von Steffen Kortlang Erstgutachter: Zweitgutachter: Betreuer (Fraunhofer IDMT-HSA): Prof. Dr. Dr. Birger Kollmeier Dr. Jörn Anemüller Jens Schröder Oldenburg, 24. Januar 211

3 III Kurzfassung Üblicherweise wird in der hierarchischen Klassifikation (in Abgrenzung zur flachen oder direkten Klassifikation) das System in kleinere, unabhängige und im Allgemeinen einfacher zu lösende Klassifikationsprobleme zerlegt und für jeden der Hierarchie inneliegenden Knoten ein Klassifikator bestimmt und trainiert. Anwendung findet dies klassischerweise in der automatischen Genreklassifikation oder der Text- bzw. Dokumentenklassifikation. Vorgestellt wird ein System zur inhaltsbezogenen Audioklassifikation mit benutzerdefinierter Taxonomie. Dieses ordnet ein Signal zunächst groben Kategorien (Sprache, Musik oder Geräusch) zu, um anschließend eine spezifische Klassifikation durchzuführen, wie beispielsweise in der Sprechererkennung oder Musikgenreklassifikation üblich. Es wird ein hierarchischer, Gaußscher Klassifizierer als Baum von flachen Gaußschen Klassifikatoren mit eigener Featureauswahl und eigenen Wahrscheinlichkeitsdichten vorgestellt. Zwar multiplizieren sich für die Berechnung der akkumulativen Klassifikationsrate beim hierarchischen Ansatz die Fehlerraten der Ebenen, allerdings ist so unter anderem eine knotenspezifische Wahl der besten Features möglich. Um das Potential eines hierarchischen Ansatzes auszuschöpfen, wird daher ein besonderer Wert auf die Implementation einer umfassenden Datenbank von Features sowie auf den Vergleich verschiedener Algorithmen zur Featureauswahl gelegt. Zunächst wird in Kapitel 1 eine Definition von hierarchischer Klassifikation versucht und Vor- und Nachteile benannt. Nachfolgend erfolgt mit einer Auflistung von Arbeiten zu dem Thema ein Überblick zum Stand der Forschung. Die theoretischen Grundlagen der (hierarchischen) Audioklassifikation werden in Kapitel 2 beschrieben. Auf die Software-Implementierung in Matlab wird in Kapitel 3 eingegangen. Dort folgt mit der Vorstellung der genutzten Audio-Taxonomie, der zur Klassifikation genutzten Features und der Merkmalsauswahl ein genauer Einblick in das verwendete System. In Kapitel 4 wird ein Vergleich zwischen den Klassifikationsraten von hierarchischem und flachem Ansatz geführt und so eine Aussage über Nutzbarkeit und Grenzen eines solchen Systems für unterschiedliche Klassifikationsszenarien getätigt. Es lassen sich verhältnismäßig hohe Klassifikationsraten über 9 % erzielen, wobei der hierarchische Ansatz im Mittel bessere Ergebnisse liefert als der flache. Zusätzlich erfolgt eine systematische Untersuchung zur Verbesserung des hierarchischen Modells anhand von Parametern und des Einflusses der benutzerdefinierten Taxonomie. Das vorgestellt Klassifikationssystem stellt daher eine gute Basis für weitere Entwicklungen dar.

4 IV Abstract Hierarchical classification schemes (in contrast to the flat or direct approach) usually assume a classification problem to be separable into smaller, independent and in general easier-to-solve tasks. Motivated by its success in the field of automatic music genre classification and document classification, a hierarchical approach for content-based classification of music, speech and environmental sounds with a predefined, tree-structured taxonomy is presented in this thesis. For each node in the tree, an individual Gaussian classifier (GMM) is developed and trained with node-specific features. As the accumulative classification rates are multiplied for each node in the tree, the optimal feature sets for each node and tree level are selected in such a way that the overall error-rate is minimized. In order to tap the full potential of a hierarchical approach, a special value is led on the implementation of a huge amount of features as well as on the comparison of different feature selection algorithms. Firstly, in chapter 1, a definition of hierarchical classification is tried and advantages and disadvantages are listed. Consecutively, an overview of the current literature is given. The theoretical principles of the (hierarchical) audio classification are descriped in chapter 2. The implemented Matlab-based classification system is presented in chapter 3. It provides a detailed insight into the audio taxonomy, the extracted features and the feature subset selection. A first comparison between the classification rates of the hierarchical and the direct approach is made in chapter 4. With average classification rates over 9%, better results than in the literature can be achieved, whereat on average the hierarchical aproach provides even better outcomes than the flat. The results allow an assessment of the usability and limitations of such a system also for other classification scenarios. Additionally, a systematic investigation for the enhancement of the hierarchical model is made on the basis of the parameters and the influence of the user-defined taxonomy. The present classification system therefore provides a good basis for further developments.

5 Inhaltsverzeichnis V Inhaltsverzeichnis 1 Einleitung Motivation Stand der Forschung Ziel der Arbeit Theorie Taxonomie Features Temporale Features Energetische Features Beschreibung der spektralen Form Spektrale Flachheit Zeitliche Variation des Spektrums Bandbasierte Beschreibung der spektralen Form Harmonische Features Lautheitsbasierte Features Temporale Modellierung Dimensionsreduktion Dimensionsreduktionsmethoden Motivation und Merkmalsauswahlalgorithmen Charakterisierung von Merkmalsauswahlalgorithmen Evaluationsmaße Übersicht gebräuchlicher Merkmalsauswahlalgorithmen Ausgewählte Algorithmen Gaussian Mixture Models Einführung Likelihood einer (Einzel-)Beobachtung Likelihood eines Satzes von Beobachtungen A-posteriori-Wahrscheinlichkeiten eines Sets von Beobachtungen EM-Algorithmus Testverfahren (Akkumulative) a-posteriori-wahrscheinlichkeiten Klassifikationsraten Das Kreuzvalidierungsverfahren Klassifikationssystem Wahl der Audio-Taxonomie Audiodateien Featureextraktion Features Temporale Modellierung Nachbearbeitung der Merkmale Auswahl der Trainingssamples Wahl der Algorithmen

6 Inhaltsverzeichnis VI 3.5 Testverfahren Framebasiert Dateibasiert Evaluation Voruntersuchung des Systems Ergebnisse der Feature Selection mittels mrmr D-Darstellungen des Feature-Raums Wahl der optimalen Parameter Klassifikationsraten Einfluss anderer Parameter (maximale) Anzahl Trainingssamples pro Klasse Merkmalsauswahlalgorithmus Leave-One-Out Test Zusammenfassung und Diskussion Zusammenfassung Diskussion Ausblick Anhang Grundlagen Korrelation Tiefpassfilterung Fourier-Transformation Filterbänke Die (Gauß sche) Normalverteilung K-means Clustering Tabellen Abkürzungsverzeichnis 84 Symbolverzeichnis 84 Literaturverzeichnis 86 Danksagung 89 Erklärung 9

7 Kapitel 1 Einleitung 1 Kapitel 1 Einleitung Einleitend soll zunächst eine Motivation für diese Masterarbeit gegeben werden. Anschließend erfolgt eine Übersicht zu hierarchischen Lern-Algorithmen in der Literatur und eine Skizzierung der verfolgten Ziele. 1.1 Motivation In der inhaltsbezogenen Audioklassifikation wurden in den letzten Jahren einige Fortschritte erzielt. Einsatzgebiete sind in der Unterhaltungsindustrie, der automatischen Datenarchivierung, der Überwachung aber auch in personenbezogenen Hörsystemen zu finden. Zum Beispiel kann ein Hörgerät mittels einer Analyse der auditiven Umgebung seine Parameter optimal auf die aktuelle Hörsituation (Konzert, Unterhaltung, Natur) einstellen. Mit der stetigen Verbesserung der technischen Möglichkeiten und der Erhöhung des Ausmaßes der Anwendungsszenarien steigt auch der Umfang zu unterscheidender Audioklassen. In der klassischen flachen (auch ebenen oder direkten ) Klassifikation werden diese gleichberechtigt modelliert und die Klassifikationsentscheidung auf Basis einer Entscheidungsstufe gefällt. Typischerweise wird also angenommen, dass die zu separierenden Klassen keine zugrundeliegende Struktur aufweisen. Bei einer solchen Vielzahl von Klassen jedoch ist zu untersuchen, ob eine hierarchisierte Taxonomie bessere Ergebnisse liefert. Beim hierarchischen Ansatz wird das System in kleinere, unabhängige und im Allgemeinen einfacher zu lösende Klassifikationsprobleme zerlegt und für jeden inneliegenden Knoten in der Hierarchie ein Klassifikator bestimmt und trainiert (Keshet, 29). Ein hierarchischer gaußscher Klassifizierer (H-GC) ist daher ein Baum von flachen gaußschen Klassifikatoren (F-GC, vgl. Peeters und Rodet, 23, S. 3), der die Möglichkeit enthält, an jedem Knotenpunkt eigene Verarbeitungsschritte (Merkmalsauswahl, Feature Transformation und Modellierung der Wahrscheinlichkeitsdichten) durchzuführen. Um beispielsweise einen bestimmten Sprecher zu klassifizieren, kann zunächst bestimmt werden, ob es sich bei dem Audiosignal um Sprache handelt. Anschließend wird dann überprüft, ob es sich um einen männlichen oder einen weiblichen Sprecher handelt. Erst zum Schluss wird dann mit Sprechern des entsprechenden Geschlechts verglichen. Diese Art der hierarchischen Klassifikation birgt gegenüber dem flachen Ansatz einige Vorteile: Das Klassifikationsproblem wird in kleinere (einfacher zu trennende) Teilmengen zerlegt. Die naturgemäß zugrundeliegende Systematik wird reflektiert. Eine knotenspezifische Wahl der Merkmale wird ermöglicht. Ähnliche Klassen können auf unterster Ebene der Hierarchie besser getrennt werden. Es besteht die Möglichkeit, später noch differenziertere Unterschiede an den Knotenpunkten zu machen (z.b. andere Erkenner, andere Vorverarbeitung der Features, etc.). Es ergeben sich jedoch auch folgende Nachteile gegenüber dem flachen Ansatz: Es besteht eine höhere Komplexität der Implementation und damit einhergend ein höherer Rechenaufwand.

8 Kapitel 1 Einleitung 2 Die Fehlerraten multiplizieren sich. Ein männlicher Sprecher muss beispielsweise zunächst als Sprecher, dann als männlich und anschließend unter den männlichen Sprechern richtig erkannt werden. 1.2 Stand der Forschung Die Einordnung von Klängen in eine hierarchische Struktur ist ein alltägliches Phänomen, z.b. die Einteilung von Liedern zu bestimmten Musikgenres. Die Kategorisierung von (Umgebungs-)geräuschen ist bisher weniger erforscht worden. Da dies aber einen Großteil der Taxonomie dieser Arbeit darstellt, werden nachfolgend zwei Ansätze aus der Literatur beschrieben. Die von Gaver (1993) vorgeschlagene Taxonomie sieht vor, Geräusche ( interagierende Materialien ) in schwingende Festkörper (Stoß, Kratzen,...), aerodynamische Klänge (Wind, Explosion,...) und liquide Klänge (Spritzer, Wellen,...) zu unterteilen. Gygi u. a. (27) hingegen stellen in ihrem Artikel Similarity and categorization of environmental sounds eine andere Kategorisierung vor. Sie haben in verschiedenen Experimenten untersucht, wie sich Umgebungsgeräusche hinsichtlich ihrer Ähnlichkeit zusammenfassen lassen. Dafür wurden zunächst 5 Geräusch-Klassen festgelegt. In einem Experiment sollten vier Probanden jedes Paar von Klängen (insgesamt 1.) hinsichtlich ihrer Ähnlichkeit auf einer Skala von 1 bis 7 bewerten. Es wurde jedoch keine Einschränkung dafür festgelegt, auf welcher Basis die Entscheidung gefällt werden sollte. Anschließend wurden die Ergebnisse zu einer Ähnlichkeitsmatrix geeignet zusammengefasst. Die Lösung eines Ordinationsverfahrens (drei-dimensionale Multidimensionale Skalierung, MDS) wurde auf Anhäufungen untersucht. In Abbildung 1.1 ist die erste Dimension dieser Lösung in Abhängigkeit der zweiten Dimension grafisch dargestellt. Aus dieser Darstellung heraus definieren sie drei Gruppen von Umgebungsgeräuschen: harmonische, impulsartige und kontinuierliche Klänge. In der Darstellung von Dimension 1 gegen Dimension 3 hingegen lassen sich Häufungen finden, die als vokal und nicht-vokal gekennzeichnet wurden. Sie konnten zudem nachweisen, dass die Dimensionen der MDS durch Linearkombinationen akustischer Merkmale angenähert werden können. Es gibt auch Bestrebungen eine Taxonomie bei gegebenen Audioklassen automatisch erzeugen zu lassen. Um die hierarchie-innere Semantik automatisch anzupassen, wurde einige statistische Ähnlichkeitsgrenzen zwischen den Wahrscheinlichkeitsmodellen angrenzender Klassen (Knoten) definiert. Die Ähnlichkeit mehrerer Klassen kann dann mittels back-off -Schätzung oder Schrumpfungsverfahren erzwungen werden (Keshet, 29). Anwendung findet die hierarchische Klassifikation klassischerweise in der Text- bzw. Dokumentenklassifikation (z.b. automatischer Spam-Filter). Ansonsten findet eine hierarchisch organisierte Klassifikationsstruktur in der Literatur nur in begrenztem Umfang Erwähnung, zum Beispiel in der automatischen Genreklassifikation. Zang und Kuo (1999) sind eine der ersten Autoren, die ein solches hierarchisches System in der Audio-Klassifikation nutzen. Hierfür entwickeln sie eine zwei Ebenen umfassende Hierarchie. Auf der höchsten Ebene unterscheiden sie Klänge in Sprache, Musik, Umgebungsgeräusche und Stille. Auf der niedrigen Ebene werden 1 Geräuschklassen (Applaus, Vögel, Lachen, u.a.) separiert. Auf dieser Ebene erreichen sie eine Klassifikationsrate von über 8%. Lu u. a. (26) stellen ein hierarchisches Klassifikationssystem für vier musikalische Stimmungen ( Zufriedenheit, Depression, Ausgelassenheit und Unruhe ) vor. Erstere und letztere Klassen werden auf höherer Ebene zusammengefasst, sodass sich ebenfalls eine hierarchische Taxonomie mit 2 Ebenen ergibt. Zur Klassifikation werden Intensitätsfeatures, Features zur Klangfarbe (z.b. Spectral Contrast Features ) und rhythmische Features verwendet. Lu u. a. (26) benutzen Mittelwert und Standardabweichung der Features und anschließend eine Lineare Diskriminanzanalyse (LDA, siehe Kapitel 2.3.1) zur Dimensionsreduktion. Zum Training wird ein Gaussian Mixture Model (GMM, siehe Kapitel 2.4) mit 16 Mischungskomponenten gewählt. Sie erzielen eine Klassifikationsrate von bis zu 86,3% beim hierarchischen Ansatz gegenüber 8,6% beim flachen Ansatz. Auch die Standardabweichung nimmt deutlich ab (5.2% gegenüber 1.7%). Roma u. a. (21) beschreiben in Content-based retrieval from unstructured databases using an ecological acoustics taxonomy ein Projekt, dessen Ziel es ist, die Erstellung von

9 Kapitel 1 Einleitung 3 Abbildung 1.1: Dimension 1 gegen Dimension 2 der dreidimensionalen MDS-Lösung für die akustischen Ähnlichkeitsdaten (Gygi u. a., 27, S. 844). Die charakteristischen Cluster sind wie im Text beschrieben markiert. Klangwelten ( Soundscapes ) in virtuellen Umgebungen zu erleichtern. Konkret geht es um die automatische Analyse und Kategorisierung von öffentlichen, benutzergetragenen Sound-Datensammlungen im Internet. Dabei nutzen sie die beschriebene Taxonomie nach Gaver (1993). Insgesamt ergeben sich so 11 verschiedene Klassen von Geräuschen. Es werden zwei Sätze von Merkmalen implementiert: Mel-Frequenz-Cepstrum-Koeffizienten (MFCCs, siehe Kapitel 2.2.6) und Features zur Beschreibung der spektralen Einhüllenden (inklusive Tonhöhe). Zur Klassifikation werden Support Vector Machines (SVMs) benutzt. Das System ordnet die Klänge bezüglich ihrer akustischen Ähnlichkeit zu jeder Klasse der Taxonomie und ermöglicht so eine systematische Kategorisierung der Datenbanken. Sie testen einen hierarchischen Ansatz und erhalten eine Klassifikationsrate von 8.61% gegenüber 84.1% bei der flachen Klassifikation. Den beschriebenen Klassifikationssystem ist gemein, dass die spezifischen Merkmale jeder Verzweigungsstelle der Hierarchie separat mittels a-priori-wissen ausgewählt werden. Die Bestimmung der passendsten Features zu einem gegebenen Klassifikationsproblem aus einem Satz vorhandender Features kann jedoch auch automatisch mittels Merkmalsauswahlalgorithmus (FSA, siehe Kapitel 2.3.2) geschehen. Hier ist zum Beispiel die auf Transinformation basierende Minimum-redundancy-maximumrelevance feature selection (mrmr, siehe Kapitel 2.3.6) nach Peng u. a. (25) zu nennen. Auch in der hierarchischen Audio-Klassifikation finden Merkmalsauswahlalgorithmen Verwendung. Peeters und Rodet (23) beispielsweise stellen den Merkmalsauswahlalgorithmus Inertia Ratio Maximization using Feature Space Projection (IRMFSP, siehe Kapitel 2.3.6) vor. Diesen nutzen sie im Rahmen eines System zur Klassifikation einer großen Datenbank von Musikinstrumenten. Ihre Taxonomie besteht aus 23 verschiedenen Klassen (Instrumenten), die auf der höheren Hierarchiebene nach gestrichenen Instrumenten (z.b. Geige) und ungestrichenen Instrumenten (z.b. Klavier) unterteilt. Sie separieren also kontinuierliche von perkussiven Klängen. Peeters und Rodet erreichen mit dem H-GC eine Klassifikationsrate von 57% (8% für die richtige Instrumentenfamilie) gegenüber nur 53% mit dem F-GC. Unter Benutzung der Featuretransformations-Algorithmen Gaussianity (nichtlineare Transformation für jedes Feature zur Anpassung der Wahrscheinlichkeitsdichte an die einer Gauß-Verteilung)

10 Kapitel 1 Einleitung 4 und der LDA zur weiteren Dimensionsreduktion verbessert sie sich auf 64% (gegenüber 52% beim flachen Ansatz). Der IRMFSP-Algorithmus findet ebenfalls Verwendung im System von Essid u. a. (25) zur hierarchischen Instrumenten-Erkennung in polyphoner Musik, in dem 11 Kombinationen von Musikinstrumenten in Jazz-Ensembles (Solo bis Quartett) klassifizert werden. Aus einem Pool von 164 Merkmalen nutzen sie dabei im Mittel 3.33 Merkmale. Einen korrelationsbasierten Ansatz zur Merkmalsauswahl (CFS, siehe Kapitel 2.3.6) nach Hall (1999) verfolgt Burred. Er entwickelt im Rahmen seiner Diplomarbeit mit dem Thema An Objective Approach to Content-Based Audio Signal Classification (23) an der TU Berlin ein hierarchisch organisiertes Klassifikationssystem. Seine Ergebnisse werden von Burred und Lerch (23) in A Hierarchical Approach to Automatic Musical Genre Classification näher vorgestellt. In seiner hierarchischen Taxonomie werden die Audiodateien dabei zunächst den Kategorien Sprache, Hintergrund und Musik zugeordnet. Sprachsignale werden in männlich, weiblich und Sprache mit Hintergrundgeräusch (z.b. Musik) getrennt. Einen besonderen Wert legt Burred auf die Unterscheidung zwischen insgesamt 13 klassischen und nichtklassischen Musikgenres. Insgesamt unterscheidet er so zwischen 17 (nicht mehr weiter unterteilbaren) Klassen. Pro Klasse sind 5 Audiodateien (entsprechend 5 Samples) gegeben. 45 davon werden zum Training benutzt. Insgesamt werden 9 Features implementiert, darunter 2 instantane ( framebasierte ) Features (MFCCs, Nulldurchgangsrate u.a.) mit jeweils 4 verschiedenen statistischen Modellierungen der Features (Mittelwert, Standardabweichung, sowie Mittelwert und Standardabweichung der Delta-Features), ein globales Feature (Low energy rate) und 9 Features, die auf einem Beat-Histogramm (Pulsstärke in Abhängigkeit eines Tempowertes) beruhen. In einem ersten Schritt testet Burred die Features auf Unabhängigkeit von einer Rauschaddition und der Signal- Bandbreite (mittels Tiefpassfilterung bei 11 khz). 32 Features stellen sich in diesem Test als besonders anfällig heraus und werden nachfolgend aus dem Pool der Features ausgeschlossen, sodass effektiv nur noch 58 Features verwendet werden. In der Feature Selection werden die 2 besten Merkmale ausgewählt und zur Klassifikation genutzt. Es wird ein Vergleich der Klassifikationsfähigkeit zwischen dem GMM- und dem k-nearest-neighbor-erkenner (KNN) unternommen, bei dem festgestellt wird, dass beide etwa ähnliche Klassifikationsgenauigkeiten bieten. In der finalen Version seiner Implementation werden GMMs mit jeweils 3 Komponenten benutzt. Getestet wird das System mittels eines 1-fachen Kreuzvalidierungsverfahrens (siehe Kapitel 2.5.3). Die besten unabhängigen Klassifikationsraten werden auf den höheren Ebenen der Hierarchiestruktur erreicht. Sprache, Hintergrund und Musik können zu 94.59% getrennt werden, klassische und nicht-klassische Musik zu 96.% und Kammer- und Orchestermusik zu 81.52%. Auf den untersten Ebenen der Hierarchie hingegen fällt die unabhängige Klassifikationsrate ab. Insgesamt ergibt sich so eine durchschnittliche (akkumulative) Klassifikationsrate von 58.71%±2.85% und bei der flachen, direkten Klassifikation von 59.76%±5.23%. Die Leistung der beiden Ansätze ist damit insgesamt ähnlich. Burred (25) beschreibt und evaluiert seine Ergebnisse in A Hierarchical Music Genre Classifier Based on User-Defined Taxonomies weiter und vergleicht sie mit früheren Arbeiten. Im Rahmen der Music Information Retrieval Evaluation exchange (MIREX 25) wurde das System in einem Wettbewerb ( Audio Genre Classification ) zur Klassifikation von Audiodateien bezüglich ihres Musikgenres getestet. Die feste Taxonomie war nun definierbar durch den Benutzer. Außerdem wurde der Test der Features auf Robustheit gegenüber Irrelevanzen entfernt, da die Audiodaten der MIREX-Datenbank als rauschfrei angenommen wurden. Getestet wurde zum Einen auf dem Magnatune -Datensatz mit 1 verschiedenen Musikgenres (unterteilt in 5 ungleich große Gruppen). Dabei ergab sich eine hierarchische Klassifikationsrate von 59.22% (flach 54.12%). Der USPOP -Datensatz hingegen implizierte keine hierarchische Taxonomie, sodass lediglich der flache Ansatz getestet wurde. Es ergab sich eine Klassifikationsrate von 66.3%. Im Vergleich zu den anderen Teilnehmer im Wettbewerb konnte Burred (25) damit nur ein mittelmäßiges Ergebnis erzielen. Nicht zu Verwechseln ist dieses Verständnis der hierarchischen Klassifikation im Übrigen mit dem Hierarchical Gaussian Mixture Model (HGMM) von Garcia u. a. (21). Auch Liu u. a. (22) präsentieren in Hierarchical Gaussian mixture model for speaker verification eine neue Art von Gaussian Mixture Models und ihre Relevanz für die Sprechererkennung. In diesen Ansätzen wird aber nicht das eigentliche Klassifikationsproblem hierarchisch behandelt, sondern lediglich ein mit mehreren Hierarchien

11 Kapitel 1 Einleitung 5 System Anzahl Klassen flach hierarchisch Zhang (Geräusche) - >8% Peeters (Musikinstrumente) 53% 57% Peeters 23 (G+LDA) 23 (Musikinstrumente) 52% 64% Essid (Instrumentenkombin.) k.a. k.a Burred (Sprache, Musik) 59.76% 58.71% Burred (MIREX 25, Magnatune) 1 (Musikgenres) 54.12% 59.22% Burred (MIREX 25, USPOP) 6 (Musikgenres) 66.3% - MRA 26 4 (mus. Stimmungen) 8.6% 86.3% MTG Barcelona (Geräusche) 84.1% 8.61% Tabelle 1.1: Chronologisch sortierte Übersicht zu Ergebnissen mit H-GC vs. F-GC angelehnt an die Tabelle von Burred (25, S.3) ausgestatteter Erkenner vorgestellt. 1.3 Ziel der Arbeit Aus der Literaturrecherche ist festzustellen, dass der hierarchischen Audio-Klassifikation (speziell in den letzten Jahren) wenig Aufmerksamkeit gewidmet wurde und die vorgestellten hierarchischen Klassifikationssysteme in der Regel nur einen kleinen Bereich der Audio-Klassifikation abdecken. Eine vergleichende Übersicht mit den angegebenen Klassifikationsraten für den flachen und den hierarchischen Ansatz ist in Tabelle 1.1 dargestellt. Im Vergleich der Klassifikationsraten ist ersichtlich, dass der hierarchische Ansatz bisher nur vereinzelt eine Erhöhung der Erkennerleistung bewirken konnte. Ziel dieser Arbeit ist es daher, ein effizientes System zur Klassifikation von insgesamt 21 Klassen aus den Bereichen Musik, Sprache und Geräusche zu entwickeln, die konkurrierend in einer flachen und einer hierarchischen Taxonomie realisiert werden. Es soll eine systematische Untersuchung der hierarchischen Struktur und deren Vor- und Nachteile gegenüber dem flachen Ansatz erstellt und daraus auf das Potential der hierarchischen Audio-Klassifikation geschlossen werden. Das implementierte Klassifikationssystem wird in Kapitel 3 beschrieben. Die Klassen werden mit Gaussian Mixture Models (GMMs) modelliert. Um die Vorteile des hierarchischen System gemäß Kapitel 1.1 auszunutzen, also einen größtmöglichen Nutzen aus einem hierarchischen Ansatz zu ziehen, wird ein besonderer Wert auf die Extraktion der Merkmale und deren automatischer Auswahl gelegt. Um zu gewährleisten, dass für die verschiedenen Klassifikationsprobleme ein geeignter Satz von Features bereit gestellt wird, wird eine umfassende Feature-Datenbank (194 Merkmale) eingesetzt. Insgesamt werden drei verschiedene Algorithmen zur Merkmalsauswahl, also zur Wahl der spezifisch geeignetsten Merkmale, implementiert. Das Klassifikationssystem wird in Kapitel 4 in drei Stufen evaluiert. Die Ergebnisse der Merkmalsauswahl und die sich daraus ergebende Verteilung der Beobachtungen im Featureraum werden aufgelistet und interpretiert. Ausserdem wird eine Untersuchung zur Abhängigkeit des System von der Anzahl der genutzten Merkmale und der Anzahl der Komponenten des GMMs vollzogen. Im Anschluss werden mit diesen Parametern die Klassifikationsraten für die verschiedenen Verzweigungsstellen der Hierarchie ermittelt und die Ergebnisse mit denen des flachen Ansatzes verglichen. Abschließend erfolgt eine systematische Untersuchung zur Verbesserung des hierarchischen Modells anhand von Parametern und dem Einfluss der benutzerdefinierten Taxonomie.

12 Kapitel 2 Theorie 6 Kapitel 2 Theorie In diesem Kapitel werden einige grundlegende und für diese Arbeit relevante Konzepte der Audio- Klassifikation, im Sinne der automatischen Erkennung von definierten Audio-Klassen, vorgestellt. Gemäß Abbildung 2.1 lassen sich üblicherweise in fast jedem Klassifikationssystem ähnliche größtenteils unabhängige Teilelemente der Klassifikation herausstellen. Zunächst werden die zu unterscheidenden Klassen (z.b. die Sprecher bei der Sprechererkennung) in einer Systematik, der durch eine Gruppe von textuellen Attributen definierten Taxonomie, eingeteilt. Üblicherweise sind die Klassen dabei keiner Hierarchie unterworfen, sondern flach (nebeneinander) angeordnet. Da die hierarchische Strukturierung der Klassen (z.b. in Form der Zusammenfassung in Musikgenres) jedoch einen wichtigen Aspekt dieser Arbeit darstellt, wird darauf in Kapitel 2.1 eingegangen. Modellierung der Klassen Taxonomie Featureextraktion stat./temp. Modellierung Dimensionsreduktion 2/3 1/3 Test Abbildung 2.1: Allgemeines Klassifikations-Schema In der Featureextraktion werden für jede Klasse dieser Taxonomie aus den Audiosignalen Merkmale (engl.: features ) ermittelt. Dabei ist die Anzahl potentieller Features im Grunde nicht beschränkt und die Literatur beschreibt eine Menge möglicher Featursätze, von den klassischen MFCCs bis hin zu anderen spektralen oder temporalen Merkmalen. Eine Auflistung einer großen Menge von potentiellen Merkmalen erfolgt in Kapitel 2.2. Die Wahl der Features hängt von der beabsichtigten Anwendung ab (z.b. Sprach-, Musik-, oder Geräusch-Diskrimination, Sprechererkennung oder Musikinstrumentenklassifikation). Durch a-priori-wissen über die Diskriminationsfähigkeit für die gegebene Aufgabe (z.b. aus der Literatur) können bereits geeignete Features ausgewählt werden. Da Klänge sich im Allgemeinen über die Zeit ändern, werden die Features in der Regel über die Zeit, also framebasiert, berechnet. Diese instantanen Merkmale können direkt im Echtzeit-Kontext zur Klassifikation benutzt werden oder die statistische bzw. temporale Modellierung der Merkmale (üblicherweise über Mittelwert und Standardabweichung) kann gemäß Kapitel (siehe Kapitel 2.2.9) zur Modellierung herangezogen werden. Eine zeitliche Entwicklung der Merkmale kann alternativ auch durch Hidden Markov Modelle (HMMs) beschrieben werden. Anschließend erfolgt in der Regel eine Dimensionsreduktion des Merkmalraums (siehe Kapitel 2.3). Klassischerweise nutzt man hierfür die Lineare Diskriminanzanalyse (LDA). Bei der LDA werden Linearkombinationen der originalen Features als neue Dimensionen im Feature-Raum benutzt, um die Diskrimination der Klassen zu maximieren. Als Alternative zur a-priori Auswahl geeigneter Merkmale kann dies a posteriori über die Benutzung eines Algorithmus zur automatischen Merkmalsauswahl (Feature Subset Selection) geschehen. Traditionell teilt man die extrahierten Beobachtungen im Verhältnis 2:1 in Trainings- und Testmaterial ein, das heißt 2/3 der Beobachtungen werden im Sinne einer Referenz in der Trainingsphase zur Modellierung der Klassen benutzt. Der letzte große Unterschied zwischen den Klassifikations- System bezieht sich daher auf die Wahl des Modells, das die Wahrscheinlichkeitsdichten der Klassen in der Trainingsphase modellieren soll, also die Wahl des Erkenners bzw. Klassifikators. Üblich sind

Music Information Retrieval - automatische Genre-Klassifikation

Music Information Retrieval - automatische Genre-Klassifikation Music Information Retrieval - automatische Genre-Klassifikation Julian Hartmann & Christoph Sünderkamp Institut für Informatik, Seminar Mustererkennung im Alltag 8./10.06.2005 Gliederung 1. Einordnung

Mehr

Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT)

Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT) Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT) Ziele In diesem Versuch lernen Sie zwei Anwendungen der Diskreten Fourier-Transformation in der Realisierung als recheneffiziente schnelle

Mehr

Modulationsanalyse. Amplitudenmodulation

Modulationsanalyse. Amplitudenmodulation 10/13 Die liefert Spektren der Einhüllenden von Teilbändern des analysierten Signals. Der Anwender kann damit Amplitudenmodulationen mit ihrer Frequenz, ihrer Stärke und ihrem zeitlichen Verlauf erkennen.

Mehr

Allgemeine Beschreibung von Blockcodes

Allgemeine Beschreibung von Blockcodes Allgemeine Beschreibung von Blockcodes Bei Blockcodierung wird jeweils eine Sequenz von m q binären Quellensymbolen (M q = 2) durch einen Block von m c Codesymbolen mit dem Symbolumfang M c dargestellt.

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Untersuchung der Auswahl der Hauptfreiheitsgrade zum Import eines Modells von ANSYS nach SIMPACK

Untersuchung der Auswahl der Hauptfreiheitsgrade zum Import eines Modells von ANSYS nach SIMPACK IMW - Institutsmitteilung Nr. 35 (2010) 103 Untersuchung der Auswahl der Hauptfreiheitsgrade zum Import eines Modells von ANSYS nach SIMPACK M. Leng; Z. Liang Die Auswahl der Hauptfreiheitsgrade spielt

Mehr

, dt. $+ f(x) = , - + < x < +, " > 0. " 2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) =

, dt. $+ f(x) = , - + < x < +,  > 0.  2# Für die zugehörige Verteilungsfunktion F(x) ergibt sich dann: F(x) = 38 6..7.4 Normalverteilung Die Gauß-Verteilung oder Normal-Verteilung ist eine stetige Verteilung, d.h. ihre Zufallsvariablen können beliebige reelle Zahlenwerte annehmen. Wir definieren sie durch die

Mehr

Einfluß von Wind bei Maximalfolgenmessungen

Einfluß von Wind bei Maximalfolgenmessungen 1 von 5 05.02.2010 11:10 Der Einfluß von Wind bei Maximalfolgenmessungen M. KOB, M. VORLÄNDER Physikalisch-Technische Bundesanstalt, Braunschweig 1 Einleitung Die Maximalfolgenmeßtechnik ist eine spezielle

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

MATLAB Kurs 2010 Teil 2 Eine Einführung in die Frequenzanalyse via MATLAB

MATLAB Kurs 2010 Teil 2 Eine Einführung in die Frequenzanalyse via MATLAB MATLAB Kurs 2010 Teil 2 Eine Einführung in die via MATLAB 26.11.2010 & 03.12.2010 nhaltsverzeichnis 1 2 3 Ziele Kurze Einführung in die -Analyse Ziele Kurze Einführung in die -Analyse MATLAB Routinen für

Mehr

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23

Inhaltsverzeichnis. Fragestellungen und Methoden 11. Vorwort 15. Kapitel 1 Einführung 17. Kapitel 2 Statistische Grundbegriffe 23 Fragestellungen und Methoden 11 Vorwort 15 Kapitel 1 Einführung 17 1.1 KonzeptiondesBuchs... 18 1.2 AufbaudesBuchs... 19 1.3 Programmversionen von PASW bzw. SPSS..... 20 1.4 WiekanndiesesBuchverwendetwerden?...

Mehr

Data Mining als Arbeitsprozess

Data Mining als Arbeitsprozess Data Mining als Arbeitsprozess Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 31. Dezember 2015 In Unternehmen werden umfangreichere Aktivitäten oder Projekte im Bereich des Data Mining

Mehr

Physikalisches Praktikum

Physikalisches Praktikum Physikalisches Praktikum Versuchsbericht M13 Schwingende Saite Dozent: Prof. Dr. Hans-Ilja Rückmann email: irueckm@uni-bremen.de http: // www. praktikum. physik. uni-bremen. de Betreuer: Yannik Schädler

Mehr

Clustering von Dokumenten (k-means, HCL)

Clustering von Dokumenten (k-means, HCL) Clustering von Dokumenten (k-means, HCL) Jonas Wolz Universität Ulm Zusammenfassung Ein Überblick über das Clustering von Dokumenten. Außerdem werden zwei dafür verwendete Algorithmen vorgestellt (k-means

Mehr

2. Lernen von Entscheidungsbäumen

2. Lernen von Entscheidungsbäumen 2. Lernen von Entscheidungsbäumen Entscheidungsbäume 2. Lernen von Entscheidungsbäumen Gegeben sei eine Menge von Objekten, die durch Attribut/Wert- Paare beschrieben sind. Jedes Objekt kann einer Klasse

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte

Mehr

VAD - Voice Activity Detection -

VAD - Voice Activity Detection - VAD - - erstellt: Robert Schaar s63012 erstellt: Robert Schaar s63012 Mensch-Maschine-Robotik 1. Einleitung 2. Aufbau des Algorithmus 2.1. allgemeiner Aufbau 2.2. Fourier-Transformation 2.3. Short-Time

Mehr

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke

Vorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,

Mehr

Beteiligung der Beschäftigten an betrieblicher Weiterbildung. und Unternehmensgröße

Beteiligung der Beschäftigten an betrieblicher Weiterbildung. und Unternehmensgröße Beteiligung der Beschäftigten an betrieblicher Weiterbildung und Unternehmensgröße Befunde auf der Grundlage von CVTS3 Friederike Behringer, Gudrun Schönfeld Bonn, Februar 2011 1 Vorbemerkung Im Folgenden

Mehr

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining

Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining Gliederung 1. Einführung 2. Grundlagen Data Mining Begriffsbestimmung CRISP-DM-Modell Betriebswirtschaftliche Einsatzgebiete des Data Mining Web Mining und Text Mining 3. Ausgewählte Methoden des Data

Mehr

Statische Versuchsplanung (DoE - Design of Experiments)

Statische Versuchsplanung (DoE - Design of Experiments) Statische Versuchsplanung (DoE - Design of Experiments) Übersicht Bei der statistischen Versuchsplanung wird die Wirkung von Steuerparametern unter dem Einfluss von Störparametern untersucht. Mit Hilfe

Mehr

Fourier - Transformation

Fourier - Transformation Fourier - Transformation Kurzversion 2. Sem. Prof. Dr. Karlheinz Blankenbach Hochschule Pforzheim, Tiefenbronner Str. 65 75175 Pforzheim Überblick / Anwendungen / Motivation: Die Fourier-Transformation

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

1. Vorüberlegungen zu visueller und auditiver Eigenwahrnehmung. 2. Auditive Eigenwahrnehmung/ Eigenwahrnehmung der Stimme

1. Vorüberlegungen zu visueller und auditiver Eigenwahrnehmung. 2. Auditive Eigenwahrnehmung/ Eigenwahrnehmung der Stimme Gliederung: 1. Vorüberlegungen zu visueller und auditiver Eigenwahrnehmung 2. Auditive Eigenwahrnehmung/ Eigenwahrnehmung der Stimme 2.1 Relevanz für Kommunikation 2.2 Eigenschaften der EdS: Kanäle 2.3

Mehr

x 2 x 1 x 3 5.1 Lernen mit Entscheidungsbäumen

x 2 x 1 x 3 5.1 Lernen mit Entscheidungsbäumen 5.1 Lernen mit Entscheidungsbäumen Falls zum Beispiel A = {gelb, rot, blau} R 2 und B = {0, 1}, so definiert der folgende Entscheidungsbaum eine Hypothese H : A B (wobei der Attributvektor aus A mit x

Mehr

DIE FILES DÜRFEN NUR FÜR DEN EIGENEN GEBRAUCH BENUTZT WERDEN. DAS COPYRIGHT LIEGT BEIM JEWEILIGEN AUTOR.

DIE FILES DÜRFEN NUR FÜR DEN EIGENEN GEBRAUCH BENUTZT WERDEN. DAS COPYRIGHT LIEGT BEIM JEWEILIGEN AUTOR. Weitere Files findest du auf www.semestra.ch/files DIE FILES DÜRFEN NUR FÜR DEN EIGENEN GEBRAUCH BENUTZT WERDEN. DAS COPYRIGHT LIEGT BEIM JEWEILIGEN AUTOR. Physiklabor 4 Michel Kaltenrieder 10. Februar

Mehr

Kontextdiagramm Erstellen von Kontextdiagrammen mit TopEase

Kontextdiagramm Erstellen von Kontextdiagrammen mit TopEase Kontextdiagramm Erstellen von Kontextdiagrammen mit TopEase Version Control: Version Status Datum / Kurzzeichen 1.0 Begründung Copyright: This document is the property of Business-DNA Solutions GmbH, Switzerland.

Mehr

Lokale Frequenzanalyse

Lokale Frequenzanalyse Lokale Frequenzanalyse Fourieranalyse bzw. Powerspektrum liefern globale Maße für einen Datensatz (mittleres Verhalten über die gesamte Länge des Datensatzes) Wiederkehrdiagramme zeigten, dass Periodizitäten

Mehr

Marktliquidität von Aktien

Marktliquidität von Aktien Marktliquidität von Aktien Inauguraldissertation zur Erlangung der Würde eines Doctor rerum oeconomicarum der Wirtschafts- und Sozialwissenschaftlichen Fakultät der Universität Bern Lukas Roth Die Fakultät

Mehr

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen

Kapitel ML: I. I. Einführung. Beispiele für Lernaufgaben Spezifikation von Lernproblemen Kapitel ML: I I. Einführung Beispiele für Lernaufgaben Spezifikation von Lernproblemen ML: I-8 Introduction c STEIN/LETTMANN 2005-2010 Beispiele für Lernaufgaben Autoeinkaufsberater Welche Kriterien liegen

Mehr

Argumente für die diskrete Realisierung der Fourierintegrale

Argumente für die diskrete Realisierung der Fourierintegrale Argumente für die diskrete Realisierung der Fourierintegrale Die Fouriertransformation gemäß der Beschreibung in Kapitel 3.1 weist aufgrund der unbegrenzten Ausdehnung des Integrationsintervalls eine unendlich

Mehr

Folge 19 - Bäume. 19.1 Binärbäume - Allgemeines. Grundlagen: Ulrich Helmich: Informatik 2 mit BlueJ - Ein Kurs für die Stufe 12

Folge 19 - Bäume. 19.1 Binärbäume - Allgemeines. Grundlagen: Ulrich Helmich: Informatik 2 mit BlueJ - Ein Kurs für die Stufe 12 Grundlagen: Folge 19 - Bäume 19.1 Binärbäume - Allgemeines Unter Bäumen versteht man in der Informatik Datenstrukturen, bei denen jedes Element mindestens zwei Nachfolger hat. Bereits in der Folge 17 haben

Mehr

1 Einleitung. 1.1 Motivation

1 Einleitung. 1.1 Motivation 1 Einleitung 1.1 Motivation Eine zunehmende Globalisierung in Verbindung mit der Verbreitung des elektronischen Handels, stets kürzer werdende Produktlebenszyklen und eine hohe Variantenvielfalt konstituieren

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

Bestimmung der Primärstruktur kleiner Moleküle mittels 1D-NMR-Spektroskopie

Bestimmung der Primärstruktur kleiner Moleküle mittels 1D-NMR-Spektroskopie Bestimmung der Primärstruktur kleiner Moleküle mittels 1D-NMR-Spektroskopie Zusammenfassung Mit Hilfe von 1D 1 H- und 13 C-NMR-Spektren und gegebener Summenformel wird die Primärstruktur eines unbekannten

Mehr

WEKA A Machine Learning Interface for Data Mining

WEKA A Machine Learning Interface for Data Mining WEKA A Machine Learning Interface for Data Mining Frank Eibe, Mark Hall, Geoffrey Holmes, Richard Kirkby, Bernhard Pfahringer, Ian H. Witten Reinhard Klaus Losse Künstliche Intelligenz II WS 2009/2010

Mehr

F-Praktikum Physik: Photolumineszenz an Halbleiterheterostruktur

F-Praktikum Physik: Photolumineszenz an Halbleiterheterostruktur F-Praktikum Physik: Photolumineszenz an Halbleiterheterostruktur David Riemenschneider & Felix Spanier 31. Januar 2001 1 Inhaltsverzeichnis 1 Einleitung 3 2 Auswertung 3 2.1 Darstellung sämtlicher PL-Spektren................

Mehr

Befragung und empirische Einschätzung der Praxisrelevanz

Befragung und empirische Einschätzung der Praxisrelevanz Befragung und empirische Einschätzung der Praxisrelevanz eines Vorgehensmodells zur Auswahl von CRM-Systemen D I P L O M A R B E I T zur Erlangung des Grades eines Diplom-Ökonomen der Wirtschaftswissenschaftlichen

Mehr

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse

Schätzung des Lifetime Values von Spendern mit Hilfe der Überlebensanalyse Schätzung Lifetime Values von Spenn mit Hilfe Überlebensanalyse Einführung in das Verfahren am Beispiel Einzugsgenehmigung Überlebensanalysen o Ereignisdatenanalysen behandeln das Problem, mit welcher

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

Einführung in Statistik und Messwertanalyse für Physiker

Einführung in Statistik und Messwertanalyse für Physiker Gerhard Böhm, Günter Zech Einführung in Statistik und Messwertanalyse für Physiker SUB Göttingen 7 219 110 697 2006 A 12486 Verlag Deutsches Elektronen-Synchrotron Inhalt sverzeichnis 1 Einführung 1 1.1

Mehr

Pfinder: Real-Time Tracking of the Human Body

Pfinder: Real-Time Tracking of the Human Body Pfinder: Real-Time Tracking of the Human Body Christopher Wren, Ali Azarbayejani, Trevor Darrell, Alex Pentland aus: IEEE Transactions on Pattern Analysis and Machine Intelligence (pp. 780-785) 12. April

Mehr

3 Quellencodierung. 3.1 Einleitung

3 Quellencodierung. 3.1 Einleitung Source coding is what Alice uses to save money on her telephone bills. It is usually used for data compression, in other words, to make messages shorter. John Gordon 3 Quellencodierung 3. Einleitung Im

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

Ein Geräusch: " Plopp"

Ein Geräusch:  Plopp Ein Geräusch: " Plopp" Zielsetzung: Das Ziel dieses Experiments ist es die Druckveränderungen zu untersuchen, die auftreten, wenn ein Zylinderkolben aus einer kleinen Spritze gezogen wird und die Eigenschaften

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

Lernen von Entscheidungsbäumen. Volker Tresp Summer 2014

Lernen von Entscheidungsbäumen. Volker Tresp Summer 2014 Lernen von Entscheidungsbäumen Volker Tresp Summer 2014 1 Anforderungen an Methoden zum Datamining Schnelle Verarbeitung großer Datenmengen Leichter Umgang mit hochdimensionalen Daten Das Lernergebnis

Mehr

SAP als effiziente IT-Application für den deutschen Mittelstand? mit Schwerpunkt Internationales Management

SAP als effiziente IT-Application für den deutschen Mittelstand? mit Schwerpunkt Internationales Management Wirtschaftswissenschaftliche Fakultät Universität Passau Bachelorarbeit SAP als effiziente IT-Application für den deutschen Mittelstand? Eingereicht bei Prof. Dr. Carola Jungwirth Lehrstuhl für Betriebswirtschaftslehre

Mehr

Clustering Seminar für Statistik

Clustering Seminar für Statistik Clustering Markus Kalisch 03.12.2014 1 Ziel von Clustering Finde Gruppen, sodas Elemente innerhalb der gleichen Gruppe möglichst ähnlich sind und Elemente von verschiedenen Gruppen möglichst verschieden

Mehr

Mining top-k frequent itemsets from data streams

Mining top-k frequent itemsets from data streams Seminar: Maschinelles Lernen Mining top-k frequent itemsets from data streams R.C.-W. Wong A.W.-C. Fu 1 Gliederung 1. Einleitung 2. Chernoff-basierter Algorithmus 3. top-k lossy counting Algorithmus 4.

Mehr

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Auch wenn die Messungsmethoden ähnlich sind, ist das Ziel beider Systeme jedoch ein anderes. Gwenolé NEXER g.nexer@hearin gp

Mehr

Kepler-Daten von V2367 Cygni

Kepler-Daten von V2367 Cygni Kepler-Daten von V2367 Cygni Lienhard Pagel Abstract: The highly successful Kepler Mission NASA provides the observer of variable stars extensive and very precise photometric data. On the basis of a BAV

Mehr

Wie schreibt man eine Ausarbeitung?

Wie schreibt man eine Ausarbeitung? Wie schreibt man eine Ausarbeitung? Holger Karl Holger.karl@upb.de Computer Networks Group Universität Paderborn Übersicht Ziel einer Ausarbeitung Struktur Sprache Korrektes Zitieren Weitere Informationen

Mehr

Künstliche Intelligenz

Künstliche Intelligenz Künstliche Intelligenz Data Mining Approaches for Instrusion Detection Espen Jervidalo WS05/06 KI - WS05/06 - Espen Jervidalo 1 Overview Motivation Ziel IDS (Intrusion Detection System) HIDS NIDS Data

Mehr

Die DOE-Funktionen im Assistenten führen Benutzer durch einen sequenziellen Prozess zum Entwerfen und Analysieren eines oder mehrerer Experimente, in

Die DOE-Funktionen im Assistenten führen Benutzer durch einen sequenziellen Prozess zum Entwerfen und Analysieren eines oder mehrerer Experimente, in Dieses White Paper ist Teil einer Reihe von Veröffentlichungen, welche die Forschungsarbeiten der Minitab-Statistiker erläutern, in deren Rahmen die im Assistenten der Minitab 17 Statistical Software verwendeten

Mehr

Überblick über die Verfahren für Ordinaldaten

Überblick über die Verfahren für Ordinaldaten Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische

Mehr

Risikomanagement für IT-Projekte: Vergleich von Risiken und Methoden

Risikomanagement für IT-Projekte: Vergleich von Risiken und Methoden Sperrvermerk Risikomanagement für IT-Projekte: Vergleich von Risiken und Methoden Bachelorarbeit Zur Erlangung des akademischen Grades Bachelor of Science (B.Sc.) im Studiengang Wirtschaftswissenschaft

Mehr

Technische Fachhochschule Berlin University of Applied Sciences

Technische Fachhochschule Berlin University of Applied Sciences Technische Fachhochschule Berlin University of Applied Sciences Fachbereich II Mathematik - Physik Chemie Masterarbeit von Dipl.-Ing. Ingrid Maus zur Erlangung des Grades Master of Computational Engineering

Mehr

Sortierverfahren für Felder (Listen)

Sortierverfahren für Felder (Listen) Sortierverfahren für Felder (Listen) Generell geht es um die Sortierung von Daten nach einem bestimmten Sortierschlüssel. Es ist auch möglich, daß verschiedene Daten denselben Sortierschlüssel haben. Es

Mehr

Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear":

Das Dialogfeld für die Regressionsanalyse (Lineare Regression) findet sich im Statistik- Menu unter Regression-Linear: Lineare Regression Das Dialogfeld für die Regressionsanalyse ("Lineare Regression") findet sich im Statistik- Menu unter "Regression"-"Linear": Im einfachsten Fall werden mehrere Prädiktoren (oder nur

Mehr

Simulink: Einführende Beispiele

Simulink: Einführende Beispiele Simulink: Einführende Beispiele Simulink ist eine grafische Oberfläche zur Ergänzung von Matlab, mit der Modelle mathematischer, physikalischer bzw. technischer Systeme aus Blöcken mittels plug-and-play

Mehr

Veräußerung von Emissionsberechtigungen in Deutschland

Veräußerung von Emissionsberechtigungen in Deutschland Veräußerung von Emissionsberechtigungen in Deutschland Monatsbericht September 2008 Berichtsmonat September 2008 Die KfW hat im Zeitraum vom 1. September 2008 bis zum 30. September 2008 3,95 Mio. EU-Emissionsberechtigungen

Mehr

Numerische Optionsbepreisung durch Monte-Carlo-Simulation und Vergleich mit dem Black-Scholes-Modell

Numerische Optionsbepreisung durch Monte-Carlo-Simulation und Vergleich mit dem Black-Scholes-Modell Numerische Optionsbepreisung durch Monte-Carlo-Simulation und Vergleich mit dem Black-Scholes-Modell Bachelorarbeit zur Erlangung des akademischen Grades Bachelor of Science (B.Sc.) im Studiengang Wirtschaftswissenschaft

Mehr

Technische Beschreibung der akustischen Signalkette

Technische Beschreibung der akustischen Signalkette Technische Beschreibung der akustischen Signalkette Wichtige Aufgabe: Vielfältige Medien Gestaltung akustischer Kommunikationsketten (Sprache, Geräusche, Musik, CD, Radio, mp3,...) Unterschiedlichste Information

Mehr

Elektrische Messtechnik Protokoll - Bestimmung des Frequenzgangs durch eine Messung im Zeitbereich

Elektrische Messtechnik Protokoll - Bestimmung des Frequenzgangs durch eine Messung im Zeitbereich Elektrische Messtechnik Protokoll - Bestimmung des Frequenzgangs durch eine Messung im Zeitbereich André Grüneberg Janko Lötzsch Mario Apitz Friedemar Blohm Versuch: 19. Dezember 2001 Protokoll: 6. Januar

Mehr

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch 1 2 - Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch Badewannenkurve. -mit der Badewannenkurve lässt

Mehr

Fortgeschrittene Statistik Logistische Regression

Fortgeschrittene Statistik Logistische Regression Fortgeschrittene Statistik Logistische Regression O D D S, O D D S - R A T I O, L O G I T T R A N S F O R M A T I O N, I N T E R P R E T A T I O N V O N K O E F F I Z I E N T E N, L O G I S T I S C H E

Mehr

Praktikumsbericht. Gruppe 6: Daniela Poppinga, Jan Christoph Bernack, Isaac Paha. Betreuerin: Natalia Podlaszewski 28.

Praktikumsbericht. Gruppe 6: Daniela Poppinga, Jan Christoph Bernack, Isaac Paha. Betreuerin: Natalia Podlaszewski 28. Praktikumsbericht Gruppe 6: Daniela Poppinga, Jan Christoph Bernack, Isaac Paha Betreuerin: Natalia Podlaszewski 28. Oktober 2008 1 Inhaltsverzeichnis 1 Versuche mit dem Digital-Speicher-Oszilloskop 3

Mehr

Sarah Ottersbach. Masterarbeit. am Fachbereich Physik der Johann Wolfgang Goethe-Universität Frankfurt am Main. vorgelegt von

Sarah Ottersbach. Masterarbeit. am Fachbereich Physik der Johann Wolfgang Goethe-Universität Frankfurt am Main. vorgelegt von Fluktuationsspektroskopie mittels schneller Datenerfassung und softwaregestützter Datenanalyse - Anwendung auf den Ladungsordnungsübergang in Nickelaten Masterarbeit am Fachbereich Physik der Johann Wolfgang

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Diskriminanzanalyse Beispiel

Diskriminanzanalyse Beispiel Diskriminanzanalyse Ziel bei der Diskriminanzanalyse ist die Analyse von Gruppenunterschieden, d. h. der Untersuchung von zwei oder mehr Gruppen hinsichtlich einer Vielzahl von Variablen. Diese Methode

Mehr

Broadband EMI Noise Measurement in Time Domain

Broadband EMI Noise Measurement in Time Domain Broadband EMI Noise Measurement in Time Domain Florian Krug, Peter Russer Institute for High-Frequency Engineering Technische Universität München fkrug@ieee.org 1 Inhalt Einführung Time-Domain Electromagnetic

Mehr

Nichtlineare Optimierung ohne Nebenbedingungen

Nichtlineare Optimierung ohne Nebenbedingungen Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt

Mehr

Entwicklung eines Distanzmaßes zwischen Bildern über dem Modell der Fields of Visual Words

Entwicklung eines Distanzmaßes zwischen Bildern über dem Modell der Fields of Visual Words Entwicklung eines Distanzmaßes zwischen Bildern über dem Modell der Fields of Visual Words André Viergutz 1 Inhalt Einführung. Einordnung der Arbeit in die zugrunde liegenden Konzepte Das Modell der Fields

Mehr

A2.3: Sinusförmige Kennlinie

A2.3: Sinusförmige Kennlinie A2.3: Sinusförmige Kennlinie Wie betrachten ein System mit Eingang x(t) und Ausgang y(t). Zur einfacheren Darstellung werden die Signale als dimensionslos betrachtet. Der Zusammenhang zwischen dem Eingangssignal

Mehr

Log-lineare Analyse I

Log-lineare Analyse I 1 Log-lineare Analyse I Einleitung Die log-lineare Analysemethode wurde von L.A. Goodman in den 60er und 70er Jahren entwickelt. Sie dient zur Analyse von Zusammenhängen in mehrdimensionalen Kontingenztafeln

Mehr

Clustern. Teile nicht kategorisierte Beispiele in disjunkte Untermengen, so genannte Cluster, ein, so dass:

Clustern. Teile nicht kategorisierte Beispiele in disjunkte Untermengen, so genannte Cluster, ein, so dass: Text-Clustern 1 Clustern Teile nicht kategorisierte Beispiele in disjunkte Untermengen, so genannte Cluster, ein, so dass: Beispiele innerhalb eines Clusters sich sehr ähnlich Beispiele in verschiedenen

Mehr

Art. 8 der Lebensversicherungsrichtlinie: Regelwerk zur Erstellung von Beispielrechnungen

Art. 8 der Lebensversicherungsrichtlinie: Regelwerk zur Erstellung von Beispielrechnungen Art. 8 der Lebensversicherungsrichtlinie: Regelwerk zur Erstellung von Beispielrechnungen zur Wertentwicklung Prüfungsbericht 2014 zu den Performance Annahmen der Assetklassen Zürich/St. Gallen, im Oktober

Mehr

Übung 3: Einfache Graphiken und Näherungen durch Regression

Übung 3: Einfache Graphiken und Näherungen durch Regression Übung 3: Einfache Graphiken und Näherungen durch Regression M. Schlup, 9. August 010 Aufgabe 1 Einfache Graphik Für die abgegebene Leistung P = UI eines linearen, aktiven Zweipols mit Leerlaufspannung

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

Lineare Modelle in R: Einweg-Varianzanalyse

Lineare Modelle in R: Einweg-Varianzanalyse Lineare Modelle in R: Einweg-Varianzanalyse Achim Zeileis 2009-02-20 1 Datenaufbereitung Wie schon in der Vorlesung wollen wir hier zur Illustration der Einweg-Analyse die logarithmierten Ausgaben der

Mehr

Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme

Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Studienprojekt Invisible Web (Dipl.-Inform. Gudrun Fischer - WS 2003/04) Blockseminar

Mehr

Der Bipolar-Transistor und die Emitterschaltung Gruppe B412

Der Bipolar-Transistor und die Emitterschaltung Gruppe B412 TECHNISCHE UNIVERSITÄT MÜNCHEN Der Bipolar-Transistor und die Emitterschaltung Gruppe B412 Patrick Christ und Daniel Biedermann 16.10.2009 1. INHALTSVERZEICHNIS 1. INHALTSVERZEICHNIS... 2 2. AUFGABE 1...

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Messtechnik-Praktikum. Spektrumanalyse. Silvio Fuchs & Simon Stützer. c) Berechnen Sie mit FFT (z.b. ORIGIN) das entsprechende Frequenzspektrum.

Messtechnik-Praktikum. Spektrumanalyse. Silvio Fuchs & Simon Stützer. c) Berechnen Sie mit FFT (z.b. ORIGIN) das entsprechende Frequenzspektrum. Messtechnik-Praktikum 10.06.08 Spektrumanalyse Silvio Fuchs & Simon Stützer 1 Augabenstellung 1. a) Bauen Sie die Schaltung für eine Einweggleichrichtung entsprechend Abbildung 1 auf. Benutzen Sie dazu

Mehr

Weiterbildungskurs Stochastik

Weiterbildungskurs Stochastik Hansruedi Künsch Seminar für Statistik Departement Mathematik, ETH Zürich 24. Juni 2009 Inhalt STATISTIK DER BINOMIALVERTEILUNG 1 STATISTIK DER BINOMIALVERTEILUNG 2 Fragestellungen Typische Fragestellungen

Mehr

Phrasensammlung für wissenschaftliches Arbeiten

Phrasensammlung für wissenschaftliches Arbeiten Phrasensammlung für wissenschaftliches Arbeiten Einleitung In diesem Aufsatz/dieser Abhandlung/dieser Arbeit werde ich... untersuchen/ermitteln/bewerten/analysieren... Um diese Frage zu beantworten, beginnen

Mehr

Interkulturelles Projektmanagement in internationalen Projekten am Beispiel von afghanischen Mitarbeitern. Bachelorarbeit

Interkulturelles Projektmanagement in internationalen Projekten am Beispiel von afghanischen Mitarbeitern. Bachelorarbeit Interkulturelles Projektmanagement in internationalen Projekten am Beispiel von afghanischen Mitarbeitern Bachelorarbeit zur Erlangung des akademischen Grades,,Bachelor of Science (B.Sc.) im Studiengang

Mehr

Grundlagen der Computer-Tomographie

Grundlagen der Computer-Tomographie Grundlagen der Computer-Tomographie Quellenangabe Die folgenden Folien sind zum Teil dem Übersichtsvortrag: imbie.meb.uni-bonn.de/epileptologie/staff/lehnertz/ct1.pdf entnommen. Als Quelle für die mathematischen

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining.

Motivation. Themenblock: Klassifikation. Binäre Entscheidungsbäume. Ansätze. Praktikum: Data Warehousing und Data Mining. Motivation Themenblock: Klassifikation Praktikum: Data Warehousing und Data Mining Ziel Item hat mehrere Attribute Anhand von n Attributen wird (n+)-tes vorhergesagt. Zusätzliches Attribut erst später

Mehr

6.2 Regressionsanalyse

6.2 Regressionsanalyse c-kennzahlensystem (ROCI) 6. Regressionsanalyse Die Regressionsanalyse zählt zu den wichtigsten Analysemethoden des Kommunikationscontrollings und hat ihre tiefen Wurzeln in der Statistik. Im Rahmen des

Mehr

Erstes Nyquistkriterium im Zeitbereich

Erstes Nyquistkriterium im Zeitbereich Erstes Nyquistkriterium im Zeitbereich Für dieses Kapitel wurde vorausgesetzt, dass die Detektion eines Symbols nicht durch Nachbarimpulse beeinträchtigt werden soll. Dies erreicht man durch die Detektion

Mehr

Bildverarbeitung Herbstsemester 2012. Kanten und Ecken

Bildverarbeitung Herbstsemester 2012. Kanten und Ecken Bildverarbeitung Herbstsemester 01 Kanten und Ecken 1 Inhalt Einführung Kantendetektierung Gradientenbasierende Verfahren Verfahren basierend auf der zweiten Ableitung Eckpunkterkennung Harris Corner Detector

Mehr