Ein hierarchisches Modell zur inhaltsbezogenen Audio-Klassifikation
|
|
- Götz Böhmer
- vor 8 Jahren
- Abrufe
Transkript
1 Carl von Ossietzky Universität Oldenburg Studiengang Hörtechnik und Audiologie MASTERARBEIT Ein hierarchisches Modell zur inhaltsbezogenen Audio-Klassifikation vorgelegt von Steffen Kortlang Betreuender Gutachter Prof. Dr. Dr. Birger Kollmeier Zweiter Gutachter Dr. Jörn Anemüller Oldenburg, 24. Januar 211
2 Ein hierarchisches Modell zur inhaltsbezogenen Audio-Klassifikation Masterarbeit vorgelegt von Steffen Kortlang Erstgutachter: Zweitgutachter: Betreuer (Fraunhofer IDMT-HSA): Prof. Dr. Dr. Birger Kollmeier Dr. Jörn Anemüller Jens Schröder Oldenburg, 24. Januar 211
3 III Kurzfassung Üblicherweise wird in der hierarchischen Klassifikation (in Abgrenzung zur flachen oder direkten Klassifikation) das System in kleinere, unabhängige und im Allgemeinen einfacher zu lösende Klassifikationsprobleme zerlegt und für jeden der Hierarchie inneliegenden Knoten ein Klassifikator bestimmt und trainiert. Anwendung findet dies klassischerweise in der automatischen Genreklassifikation oder der Text- bzw. Dokumentenklassifikation. Vorgestellt wird ein System zur inhaltsbezogenen Audioklassifikation mit benutzerdefinierter Taxonomie. Dieses ordnet ein Signal zunächst groben Kategorien (Sprache, Musik oder Geräusch) zu, um anschließend eine spezifische Klassifikation durchzuführen, wie beispielsweise in der Sprechererkennung oder Musikgenreklassifikation üblich. Es wird ein hierarchischer, Gaußscher Klassifizierer als Baum von flachen Gaußschen Klassifikatoren mit eigener Featureauswahl und eigenen Wahrscheinlichkeitsdichten vorgestellt. Zwar multiplizieren sich für die Berechnung der akkumulativen Klassifikationsrate beim hierarchischen Ansatz die Fehlerraten der Ebenen, allerdings ist so unter anderem eine knotenspezifische Wahl der besten Features möglich. Um das Potential eines hierarchischen Ansatzes auszuschöpfen, wird daher ein besonderer Wert auf die Implementation einer umfassenden Datenbank von Features sowie auf den Vergleich verschiedener Algorithmen zur Featureauswahl gelegt. Zunächst wird in Kapitel 1 eine Definition von hierarchischer Klassifikation versucht und Vor- und Nachteile benannt. Nachfolgend erfolgt mit einer Auflistung von Arbeiten zu dem Thema ein Überblick zum Stand der Forschung. Die theoretischen Grundlagen der (hierarchischen) Audioklassifikation werden in Kapitel 2 beschrieben. Auf die Software-Implementierung in Matlab wird in Kapitel 3 eingegangen. Dort folgt mit der Vorstellung der genutzten Audio-Taxonomie, der zur Klassifikation genutzten Features und der Merkmalsauswahl ein genauer Einblick in das verwendete System. In Kapitel 4 wird ein Vergleich zwischen den Klassifikationsraten von hierarchischem und flachem Ansatz geführt und so eine Aussage über Nutzbarkeit und Grenzen eines solchen Systems für unterschiedliche Klassifikationsszenarien getätigt. Es lassen sich verhältnismäßig hohe Klassifikationsraten über 9 % erzielen, wobei der hierarchische Ansatz im Mittel bessere Ergebnisse liefert als der flache. Zusätzlich erfolgt eine systematische Untersuchung zur Verbesserung des hierarchischen Modells anhand von Parametern und des Einflusses der benutzerdefinierten Taxonomie. Das vorgestellt Klassifikationssystem stellt daher eine gute Basis für weitere Entwicklungen dar.
4 IV Abstract Hierarchical classification schemes (in contrast to the flat or direct approach) usually assume a classification problem to be separable into smaller, independent and in general easier-to-solve tasks. Motivated by its success in the field of automatic music genre classification and document classification, a hierarchical approach for content-based classification of music, speech and environmental sounds with a predefined, tree-structured taxonomy is presented in this thesis. For each node in the tree, an individual Gaussian classifier (GMM) is developed and trained with node-specific features. As the accumulative classification rates are multiplied for each node in the tree, the optimal feature sets for each node and tree level are selected in such a way that the overall error-rate is minimized. In order to tap the full potential of a hierarchical approach, a special value is led on the implementation of a huge amount of features as well as on the comparison of different feature selection algorithms. Firstly, in chapter 1, a definition of hierarchical classification is tried and advantages and disadvantages are listed. Consecutively, an overview of the current literature is given. The theoretical principles of the (hierarchical) audio classification are descriped in chapter 2. The implemented Matlab-based classification system is presented in chapter 3. It provides a detailed insight into the audio taxonomy, the extracted features and the feature subset selection. A first comparison between the classification rates of the hierarchical and the direct approach is made in chapter 4. With average classification rates over 9%, better results than in the literature can be achieved, whereat on average the hierarchical aproach provides even better outcomes than the flat. The results allow an assessment of the usability and limitations of such a system also for other classification scenarios. Additionally, a systematic investigation for the enhancement of the hierarchical model is made on the basis of the parameters and the influence of the user-defined taxonomy. The present classification system therefore provides a good basis for further developments.
5 Inhaltsverzeichnis V Inhaltsverzeichnis 1 Einleitung Motivation Stand der Forschung Ziel der Arbeit Theorie Taxonomie Features Temporale Features Energetische Features Beschreibung der spektralen Form Spektrale Flachheit Zeitliche Variation des Spektrums Bandbasierte Beschreibung der spektralen Form Harmonische Features Lautheitsbasierte Features Temporale Modellierung Dimensionsreduktion Dimensionsreduktionsmethoden Motivation und Merkmalsauswahlalgorithmen Charakterisierung von Merkmalsauswahlalgorithmen Evaluationsmaße Übersicht gebräuchlicher Merkmalsauswahlalgorithmen Ausgewählte Algorithmen Gaussian Mixture Models Einführung Likelihood einer (Einzel-)Beobachtung Likelihood eines Satzes von Beobachtungen A-posteriori-Wahrscheinlichkeiten eines Sets von Beobachtungen EM-Algorithmus Testverfahren (Akkumulative) a-posteriori-wahrscheinlichkeiten Klassifikationsraten Das Kreuzvalidierungsverfahren Klassifikationssystem Wahl der Audio-Taxonomie Audiodateien Featureextraktion Features Temporale Modellierung Nachbearbeitung der Merkmale Auswahl der Trainingssamples Wahl der Algorithmen
6 Inhaltsverzeichnis VI 3.5 Testverfahren Framebasiert Dateibasiert Evaluation Voruntersuchung des Systems Ergebnisse der Feature Selection mittels mrmr D-Darstellungen des Feature-Raums Wahl der optimalen Parameter Klassifikationsraten Einfluss anderer Parameter (maximale) Anzahl Trainingssamples pro Klasse Merkmalsauswahlalgorithmus Leave-One-Out Test Zusammenfassung und Diskussion Zusammenfassung Diskussion Ausblick Anhang Grundlagen Korrelation Tiefpassfilterung Fourier-Transformation Filterbänke Die (Gauß sche) Normalverteilung K-means Clustering Tabellen Abkürzungsverzeichnis 84 Symbolverzeichnis 84 Literaturverzeichnis 86 Danksagung 89 Erklärung 9
7 Kapitel 1 Einleitung 1 Kapitel 1 Einleitung Einleitend soll zunächst eine Motivation für diese Masterarbeit gegeben werden. Anschließend erfolgt eine Übersicht zu hierarchischen Lern-Algorithmen in der Literatur und eine Skizzierung der verfolgten Ziele. 1.1 Motivation In der inhaltsbezogenen Audioklassifikation wurden in den letzten Jahren einige Fortschritte erzielt. Einsatzgebiete sind in der Unterhaltungsindustrie, der automatischen Datenarchivierung, der Überwachung aber auch in personenbezogenen Hörsystemen zu finden. Zum Beispiel kann ein Hörgerät mittels einer Analyse der auditiven Umgebung seine Parameter optimal auf die aktuelle Hörsituation (Konzert, Unterhaltung, Natur) einstellen. Mit der stetigen Verbesserung der technischen Möglichkeiten und der Erhöhung des Ausmaßes der Anwendungsszenarien steigt auch der Umfang zu unterscheidender Audioklassen. In der klassischen flachen (auch ebenen oder direkten ) Klassifikation werden diese gleichberechtigt modelliert und die Klassifikationsentscheidung auf Basis einer Entscheidungsstufe gefällt. Typischerweise wird also angenommen, dass die zu separierenden Klassen keine zugrundeliegende Struktur aufweisen. Bei einer solchen Vielzahl von Klassen jedoch ist zu untersuchen, ob eine hierarchisierte Taxonomie bessere Ergebnisse liefert. Beim hierarchischen Ansatz wird das System in kleinere, unabhängige und im Allgemeinen einfacher zu lösende Klassifikationsprobleme zerlegt und für jeden inneliegenden Knoten in der Hierarchie ein Klassifikator bestimmt und trainiert (Keshet, 29). Ein hierarchischer gaußscher Klassifizierer (H-GC) ist daher ein Baum von flachen gaußschen Klassifikatoren (F-GC, vgl. Peeters und Rodet, 23, S. 3), der die Möglichkeit enthält, an jedem Knotenpunkt eigene Verarbeitungsschritte (Merkmalsauswahl, Feature Transformation und Modellierung der Wahrscheinlichkeitsdichten) durchzuführen. Um beispielsweise einen bestimmten Sprecher zu klassifizieren, kann zunächst bestimmt werden, ob es sich bei dem Audiosignal um Sprache handelt. Anschließend wird dann überprüft, ob es sich um einen männlichen oder einen weiblichen Sprecher handelt. Erst zum Schluss wird dann mit Sprechern des entsprechenden Geschlechts verglichen. Diese Art der hierarchischen Klassifikation birgt gegenüber dem flachen Ansatz einige Vorteile: Das Klassifikationsproblem wird in kleinere (einfacher zu trennende) Teilmengen zerlegt. Die naturgemäß zugrundeliegende Systematik wird reflektiert. Eine knotenspezifische Wahl der Merkmale wird ermöglicht. Ähnliche Klassen können auf unterster Ebene der Hierarchie besser getrennt werden. Es besteht die Möglichkeit, später noch differenziertere Unterschiede an den Knotenpunkten zu machen (z.b. andere Erkenner, andere Vorverarbeitung der Features, etc.). Es ergeben sich jedoch auch folgende Nachteile gegenüber dem flachen Ansatz: Es besteht eine höhere Komplexität der Implementation und damit einhergend ein höherer Rechenaufwand.
8 Kapitel 1 Einleitung 2 Die Fehlerraten multiplizieren sich. Ein männlicher Sprecher muss beispielsweise zunächst als Sprecher, dann als männlich und anschließend unter den männlichen Sprechern richtig erkannt werden. 1.2 Stand der Forschung Die Einordnung von Klängen in eine hierarchische Struktur ist ein alltägliches Phänomen, z.b. die Einteilung von Liedern zu bestimmten Musikgenres. Die Kategorisierung von (Umgebungs-)geräuschen ist bisher weniger erforscht worden. Da dies aber einen Großteil der Taxonomie dieser Arbeit darstellt, werden nachfolgend zwei Ansätze aus der Literatur beschrieben. Die von Gaver (1993) vorgeschlagene Taxonomie sieht vor, Geräusche ( interagierende Materialien ) in schwingende Festkörper (Stoß, Kratzen,...), aerodynamische Klänge (Wind, Explosion,...) und liquide Klänge (Spritzer, Wellen,...) zu unterteilen. Gygi u. a. (27) hingegen stellen in ihrem Artikel Similarity and categorization of environmental sounds eine andere Kategorisierung vor. Sie haben in verschiedenen Experimenten untersucht, wie sich Umgebungsgeräusche hinsichtlich ihrer Ähnlichkeit zusammenfassen lassen. Dafür wurden zunächst 5 Geräusch-Klassen festgelegt. In einem Experiment sollten vier Probanden jedes Paar von Klängen (insgesamt 1.) hinsichtlich ihrer Ähnlichkeit auf einer Skala von 1 bis 7 bewerten. Es wurde jedoch keine Einschränkung dafür festgelegt, auf welcher Basis die Entscheidung gefällt werden sollte. Anschließend wurden die Ergebnisse zu einer Ähnlichkeitsmatrix geeignet zusammengefasst. Die Lösung eines Ordinationsverfahrens (drei-dimensionale Multidimensionale Skalierung, MDS) wurde auf Anhäufungen untersucht. In Abbildung 1.1 ist die erste Dimension dieser Lösung in Abhängigkeit der zweiten Dimension grafisch dargestellt. Aus dieser Darstellung heraus definieren sie drei Gruppen von Umgebungsgeräuschen: harmonische, impulsartige und kontinuierliche Klänge. In der Darstellung von Dimension 1 gegen Dimension 3 hingegen lassen sich Häufungen finden, die als vokal und nicht-vokal gekennzeichnet wurden. Sie konnten zudem nachweisen, dass die Dimensionen der MDS durch Linearkombinationen akustischer Merkmale angenähert werden können. Es gibt auch Bestrebungen eine Taxonomie bei gegebenen Audioklassen automatisch erzeugen zu lassen. Um die hierarchie-innere Semantik automatisch anzupassen, wurde einige statistische Ähnlichkeitsgrenzen zwischen den Wahrscheinlichkeitsmodellen angrenzender Klassen (Knoten) definiert. Die Ähnlichkeit mehrerer Klassen kann dann mittels back-off -Schätzung oder Schrumpfungsverfahren erzwungen werden (Keshet, 29). Anwendung findet die hierarchische Klassifikation klassischerweise in der Text- bzw. Dokumentenklassifikation (z.b. automatischer Spam-Filter). Ansonsten findet eine hierarchisch organisierte Klassifikationsstruktur in der Literatur nur in begrenztem Umfang Erwähnung, zum Beispiel in der automatischen Genreklassifikation. Zang und Kuo (1999) sind eine der ersten Autoren, die ein solches hierarchisches System in der Audio-Klassifikation nutzen. Hierfür entwickeln sie eine zwei Ebenen umfassende Hierarchie. Auf der höchsten Ebene unterscheiden sie Klänge in Sprache, Musik, Umgebungsgeräusche und Stille. Auf der niedrigen Ebene werden 1 Geräuschklassen (Applaus, Vögel, Lachen, u.a.) separiert. Auf dieser Ebene erreichen sie eine Klassifikationsrate von über 8%. Lu u. a. (26) stellen ein hierarchisches Klassifikationssystem für vier musikalische Stimmungen ( Zufriedenheit, Depression, Ausgelassenheit und Unruhe ) vor. Erstere und letztere Klassen werden auf höherer Ebene zusammengefasst, sodass sich ebenfalls eine hierarchische Taxonomie mit 2 Ebenen ergibt. Zur Klassifikation werden Intensitätsfeatures, Features zur Klangfarbe (z.b. Spectral Contrast Features ) und rhythmische Features verwendet. Lu u. a. (26) benutzen Mittelwert und Standardabweichung der Features und anschließend eine Lineare Diskriminanzanalyse (LDA, siehe Kapitel 2.3.1) zur Dimensionsreduktion. Zum Training wird ein Gaussian Mixture Model (GMM, siehe Kapitel 2.4) mit 16 Mischungskomponenten gewählt. Sie erzielen eine Klassifikationsrate von bis zu 86,3% beim hierarchischen Ansatz gegenüber 8,6% beim flachen Ansatz. Auch die Standardabweichung nimmt deutlich ab (5.2% gegenüber 1.7%). Roma u. a. (21) beschreiben in Content-based retrieval from unstructured databases using an ecological acoustics taxonomy ein Projekt, dessen Ziel es ist, die Erstellung von
9 Kapitel 1 Einleitung 3 Abbildung 1.1: Dimension 1 gegen Dimension 2 der dreidimensionalen MDS-Lösung für die akustischen Ähnlichkeitsdaten (Gygi u. a., 27, S. 844). Die charakteristischen Cluster sind wie im Text beschrieben markiert. Klangwelten ( Soundscapes ) in virtuellen Umgebungen zu erleichtern. Konkret geht es um die automatische Analyse und Kategorisierung von öffentlichen, benutzergetragenen Sound-Datensammlungen im Internet. Dabei nutzen sie die beschriebene Taxonomie nach Gaver (1993). Insgesamt ergeben sich so 11 verschiedene Klassen von Geräuschen. Es werden zwei Sätze von Merkmalen implementiert: Mel-Frequenz-Cepstrum-Koeffizienten (MFCCs, siehe Kapitel 2.2.6) und Features zur Beschreibung der spektralen Einhüllenden (inklusive Tonhöhe). Zur Klassifikation werden Support Vector Machines (SVMs) benutzt. Das System ordnet die Klänge bezüglich ihrer akustischen Ähnlichkeit zu jeder Klasse der Taxonomie und ermöglicht so eine systematische Kategorisierung der Datenbanken. Sie testen einen hierarchischen Ansatz und erhalten eine Klassifikationsrate von 8.61% gegenüber 84.1% bei der flachen Klassifikation. Den beschriebenen Klassifikationssystem ist gemein, dass die spezifischen Merkmale jeder Verzweigungsstelle der Hierarchie separat mittels a-priori-wissen ausgewählt werden. Die Bestimmung der passendsten Features zu einem gegebenen Klassifikationsproblem aus einem Satz vorhandender Features kann jedoch auch automatisch mittels Merkmalsauswahlalgorithmus (FSA, siehe Kapitel 2.3.2) geschehen. Hier ist zum Beispiel die auf Transinformation basierende Minimum-redundancy-maximumrelevance feature selection (mrmr, siehe Kapitel 2.3.6) nach Peng u. a. (25) zu nennen. Auch in der hierarchischen Audio-Klassifikation finden Merkmalsauswahlalgorithmen Verwendung. Peeters und Rodet (23) beispielsweise stellen den Merkmalsauswahlalgorithmus Inertia Ratio Maximization using Feature Space Projection (IRMFSP, siehe Kapitel 2.3.6) vor. Diesen nutzen sie im Rahmen eines System zur Klassifikation einer großen Datenbank von Musikinstrumenten. Ihre Taxonomie besteht aus 23 verschiedenen Klassen (Instrumenten), die auf der höheren Hierarchiebene nach gestrichenen Instrumenten (z.b. Geige) und ungestrichenen Instrumenten (z.b. Klavier) unterteilt. Sie separieren also kontinuierliche von perkussiven Klängen. Peeters und Rodet erreichen mit dem H-GC eine Klassifikationsrate von 57% (8% für die richtige Instrumentenfamilie) gegenüber nur 53% mit dem F-GC. Unter Benutzung der Featuretransformations-Algorithmen Gaussianity (nichtlineare Transformation für jedes Feature zur Anpassung der Wahrscheinlichkeitsdichte an die einer Gauß-Verteilung)
10 Kapitel 1 Einleitung 4 und der LDA zur weiteren Dimensionsreduktion verbessert sie sich auf 64% (gegenüber 52% beim flachen Ansatz). Der IRMFSP-Algorithmus findet ebenfalls Verwendung im System von Essid u. a. (25) zur hierarchischen Instrumenten-Erkennung in polyphoner Musik, in dem 11 Kombinationen von Musikinstrumenten in Jazz-Ensembles (Solo bis Quartett) klassifizert werden. Aus einem Pool von 164 Merkmalen nutzen sie dabei im Mittel 3.33 Merkmale. Einen korrelationsbasierten Ansatz zur Merkmalsauswahl (CFS, siehe Kapitel 2.3.6) nach Hall (1999) verfolgt Burred. Er entwickelt im Rahmen seiner Diplomarbeit mit dem Thema An Objective Approach to Content-Based Audio Signal Classification (23) an der TU Berlin ein hierarchisch organisiertes Klassifikationssystem. Seine Ergebnisse werden von Burred und Lerch (23) in A Hierarchical Approach to Automatic Musical Genre Classification näher vorgestellt. In seiner hierarchischen Taxonomie werden die Audiodateien dabei zunächst den Kategorien Sprache, Hintergrund und Musik zugeordnet. Sprachsignale werden in männlich, weiblich und Sprache mit Hintergrundgeräusch (z.b. Musik) getrennt. Einen besonderen Wert legt Burred auf die Unterscheidung zwischen insgesamt 13 klassischen und nichtklassischen Musikgenres. Insgesamt unterscheidet er so zwischen 17 (nicht mehr weiter unterteilbaren) Klassen. Pro Klasse sind 5 Audiodateien (entsprechend 5 Samples) gegeben. 45 davon werden zum Training benutzt. Insgesamt werden 9 Features implementiert, darunter 2 instantane ( framebasierte ) Features (MFCCs, Nulldurchgangsrate u.a.) mit jeweils 4 verschiedenen statistischen Modellierungen der Features (Mittelwert, Standardabweichung, sowie Mittelwert und Standardabweichung der Delta-Features), ein globales Feature (Low energy rate) und 9 Features, die auf einem Beat-Histogramm (Pulsstärke in Abhängigkeit eines Tempowertes) beruhen. In einem ersten Schritt testet Burred die Features auf Unabhängigkeit von einer Rauschaddition und der Signal- Bandbreite (mittels Tiefpassfilterung bei 11 khz). 32 Features stellen sich in diesem Test als besonders anfällig heraus und werden nachfolgend aus dem Pool der Features ausgeschlossen, sodass effektiv nur noch 58 Features verwendet werden. In der Feature Selection werden die 2 besten Merkmale ausgewählt und zur Klassifikation genutzt. Es wird ein Vergleich der Klassifikationsfähigkeit zwischen dem GMM- und dem k-nearest-neighbor-erkenner (KNN) unternommen, bei dem festgestellt wird, dass beide etwa ähnliche Klassifikationsgenauigkeiten bieten. In der finalen Version seiner Implementation werden GMMs mit jeweils 3 Komponenten benutzt. Getestet wird das System mittels eines 1-fachen Kreuzvalidierungsverfahrens (siehe Kapitel 2.5.3). Die besten unabhängigen Klassifikationsraten werden auf den höheren Ebenen der Hierarchiestruktur erreicht. Sprache, Hintergrund und Musik können zu 94.59% getrennt werden, klassische und nicht-klassische Musik zu 96.% und Kammer- und Orchestermusik zu 81.52%. Auf den untersten Ebenen der Hierarchie hingegen fällt die unabhängige Klassifikationsrate ab. Insgesamt ergibt sich so eine durchschnittliche (akkumulative) Klassifikationsrate von 58.71%±2.85% und bei der flachen, direkten Klassifikation von 59.76%±5.23%. Die Leistung der beiden Ansätze ist damit insgesamt ähnlich. Burred (25) beschreibt und evaluiert seine Ergebnisse in A Hierarchical Music Genre Classifier Based on User-Defined Taxonomies weiter und vergleicht sie mit früheren Arbeiten. Im Rahmen der Music Information Retrieval Evaluation exchange (MIREX 25) wurde das System in einem Wettbewerb ( Audio Genre Classification ) zur Klassifikation von Audiodateien bezüglich ihres Musikgenres getestet. Die feste Taxonomie war nun definierbar durch den Benutzer. Außerdem wurde der Test der Features auf Robustheit gegenüber Irrelevanzen entfernt, da die Audiodaten der MIREX-Datenbank als rauschfrei angenommen wurden. Getestet wurde zum Einen auf dem Magnatune -Datensatz mit 1 verschiedenen Musikgenres (unterteilt in 5 ungleich große Gruppen). Dabei ergab sich eine hierarchische Klassifikationsrate von 59.22% (flach 54.12%). Der USPOP -Datensatz hingegen implizierte keine hierarchische Taxonomie, sodass lediglich der flache Ansatz getestet wurde. Es ergab sich eine Klassifikationsrate von 66.3%. Im Vergleich zu den anderen Teilnehmer im Wettbewerb konnte Burred (25) damit nur ein mittelmäßiges Ergebnis erzielen. Nicht zu Verwechseln ist dieses Verständnis der hierarchischen Klassifikation im Übrigen mit dem Hierarchical Gaussian Mixture Model (HGMM) von Garcia u. a. (21). Auch Liu u. a. (22) präsentieren in Hierarchical Gaussian mixture model for speaker verification eine neue Art von Gaussian Mixture Models und ihre Relevanz für die Sprechererkennung. In diesen Ansätzen wird aber nicht das eigentliche Klassifikationsproblem hierarchisch behandelt, sondern lediglich ein mit mehreren Hierarchien
11 Kapitel 1 Einleitung 5 System Anzahl Klassen flach hierarchisch Zhang (Geräusche) - >8% Peeters (Musikinstrumente) 53% 57% Peeters 23 (G+LDA) 23 (Musikinstrumente) 52% 64% Essid (Instrumentenkombin.) k.a. k.a Burred (Sprache, Musik) 59.76% 58.71% Burred (MIREX 25, Magnatune) 1 (Musikgenres) 54.12% 59.22% Burred (MIREX 25, USPOP) 6 (Musikgenres) 66.3% - MRA 26 4 (mus. Stimmungen) 8.6% 86.3% MTG Barcelona (Geräusche) 84.1% 8.61% Tabelle 1.1: Chronologisch sortierte Übersicht zu Ergebnissen mit H-GC vs. F-GC angelehnt an die Tabelle von Burred (25, S.3) ausgestatteter Erkenner vorgestellt. 1.3 Ziel der Arbeit Aus der Literaturrecherche ist festzustellen, dass der hierarchischen Audio-Klassifikation (speziell in den letzten Jahren) wenig Aufmerksamkeit gewidmet wurde und die vorgestellten hierarchischen Klassifikationssysteme in der Regel nur einen kleinen Bereich der Audio-Klassifikation abdecken. Eine vergleichende Übersicht mit den angegebenen Klassifikationsraten für den flachen und den hierarchischen Ansatz ist in Tabelle 1.1 dargestellt. Im Vergleich der Klassifikationsraten ist ersichtlich, dass der hierarchische Ansatz bisher nur vereinzelt eine Erhöhung der Erkennerleistung bewirken konnte. Ziel dieser Arbeit ist es daher, ein effizientes System zur Klassifikation von insgesamt 21 Klassen aus den Bereichen Musik, Sprache und Geräusche zu entwickeln, die konkurrierend in einer flachen und einer hierarchischen Taxonomie realisiert werden. Es soll eine systematische Untersuchung der hierarchischen Struktur und deren Vor- und Nachteile gegenüber dem flachen Ansatz erstellt und daraus auf das Potential der hierarchischen Audio-Klassifikation geschlossen werden. Das implementierte Klassifikationssystem wird in Kapitel 3 beschrieben. Die Klassen werden mit Gaussian Mixture Models (GMMs) modelliert. Um die Vorteile des hierarchischen System gemäß Kapitel 1.1 auszunutzen, also einen größtmöglichen Nutzen aus einem hierarchischen Ansatz zu ziehen, wird ein besonderer Wert auf die Extraktion der Merkmale und deren automatischer Auswahl gelegt. Um zu gewährleisten, dass für die verschiedenen Klassifikationsprobleme ein geeignter Satz von Features bereit gestellt wird, wird eine umfassende Feature-Datenbank (194 Merkmale) eingesetzt. Insgesamt werden drei verschiedene Algorithmen zur Merkmalsauswahl, also zur Wahl der spezifisch geeignetsten Merkmale, implementiert. Das Klassifikationssystem wird in Kapitel 4 in drei Stufen evaluiert. Die Ergebnisse der Merkmalsauswahl und die sich daraus ergebende Verteilung der Beobachtungen im Featureraum werden aufgelistet und interpretiert. Ausserdem wird eine Untersuchung zur Abhängigkeit des System von der Anzahl der genutzten Merkmale und der Anzahl der Komponenten des GMMs vollzogen. Im Anschluss werden mit diesen Parametern die Klassifikationsraten für die verschiedenen Verzweigungsstellen der Hierarchie ermittelt und die Ergebnisse mit denen des flachen Ansatzes verglichen. Abschließend erfolgt eine systematische Untersuchung zur Verbesserung des hierarchischen Modells anhand von Parametern und dem Einfluss der benutzerdefinierten Taxonomie.
12 Kapitel 2 Theorie 6 Kapitel 2 Theorie In diesem Kapitel werden einige grundlegende und für diese Arbeit relevante Konzepte der Audio- Klassifikation, im Sinne der automatischen Erkennung von definierten Audio-Klassen, vorgestellt. Gemäß Abbildung 2.1 lassen sich üblicherweise in fast jedem Klassifikationssystem ähnliche größtenteils unabhängige Teilelemente der Klassifikation herausstellen. Zunächst werden die zu unterscheidenden Klassen (z.b. die Sprecher bei der Sprechererkennung) in einer Systematik, der durch eine Gruppe von textuellen Attributen definierten Taxonomie, eingeteilt. Üblicherweise sind die Klassen dabei keiner Hierarchie unterworfen, sondern flach (nebeneinander) angeordnet. Da die hierarchische Strukturierung der Klassen (z.b. in Form der Zusammenfassung in Musikgenres) jedoch einen wichtigen Aspekt dieser Arbeit darstellt, wird darauf in Kapitel 2.1 eingegangen. Modellierung der Klassen Taxonomie Featureextraktion stat./temp. Modellierung Dimensionsreduktion 2/3 1/3 Test Abbildung 2.1: Allgemeines Klassifikations-Schema In der Featureextraktion werden für jede Klasse dieser Taxonomie aus den Audiosignalen Merkmale (engl.: features ) ermittelt. Dabei ist die Anzahl potentieller Features im Grunde nicht beschränkt und die Literatur beschreibt eine Menge möglicher Featursätze, von den klassischen MFCCs bis hin zu anderen spektralen oder temporalen Merkmalen. Eine Auflistung einer großen Menge von potentiellen Merkmalen erfolgt in Kapitel 2.2. Die Wahl der Features hängt von der beabsichtigten Anwendung ab (z.b. Sprach-, Musik-, oder Geräusch-Diskrimination, Sprechererkennung oder Musikinstrumentenklassifikation). Durch a-priori-wissen über die Diskriminationsfähigkeit für die gegebene Aufgabe (z.b. aus der Literatur) können bereits geeignete Features ausgewählt werden. Da Klänge sich im Allgemeinen über die Zeit ändern, werden die Features in der Regel über die Zeit, also framebasiert, berechnet. Diese instantanen Merkmale können direkt im Echtzeit-Kontext zur Klassifikation benutzt werden oder die statistische bzw. temporale Modellierung der Merkmale (üblicherweise über Mittelwert und Standardabweichung) kann gemäß Kapitel (siehe Kapitel 2.2.9) zur Modellierung herangezogen werden. Eine zeitliche Entwicklung der Merkmale kann alternativ auch durch Hidden Markov Modelle (HMMs) beschrieben werden. Anschließend erfolgt in der Regel eine Dimensionsreduktion des Merkmalraums (siehe Kapitel 2.3). Klassischerweise nutzt man hierfür die Lineare Diskriminanzanalyse (LDA). Bei der LDA werden Linearkombinationen der originalen Features als neue Dimensionen im Feature-Raum benutzt, um die Diskrimination der Klassen zu maximieren. Als Alternative zur a-priori Auswahl geeigneter Merkmale kann dies a posteriori über die Benutzung eines Algorithmus zur automatischen Merkmalsauswahl (Feature Subset Selection) geschehen. Traditionell teilt man die extrahierten Beobachtungen im Verhältnis 2:1 in Trainings- und Testmaterial ein, das heißt 2/3 der Beobachtungen werden im Sinne einer Referenz in der Trainingsphase zur Modellierung der Klassen benutzt. Der letzte große Unterschied zwischen den Klassifikations- System bezieht sich daher auf die Wahl des Modells, das die Wahrscheinlichkeitsdichten der Klassen in der Trainingsphase modellieren soll, also die Wahl des Erkenners bzw. Klassifikators. Üblich sind
Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten
Das große x -4 Alles über das Wer kann beantragen? Generell kann jeder beantragen! Eltern (Mütter UND Väter), die schon während ihrer Elternzeit wieder in Teilzeit arbeiten möchten. Eltern, die während
MehrStatistische Auswertung:
Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.
MehrLineargleichungssysteme: Additions-/ Subtraktionsverfahren
Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als
MehrWelche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?
Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test? Auch wenn die Messungsmethoden ähnlich sind, ist das Ziel beider Systeme jedoch ein anderes. Gwenolé NEXER g.nexer@hearin gp
MehrZeichen bei Zahlen entschlüsseln
Zeichen bei Zahlen entschlüsseln In diesem Kapitel... Verwendung des Zahlenstrahls Absolut richtige Bestimmung von absoluten Werten Operationen bei Zahlen mit Vorzeichen: Addieren, Subtrahieren, Multiplizieren
MehrPrimzahlen und RSA-Verschlüsselung
Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also
MehrAnhand des bereits hergeleiteten Models erstellen wir nun mit der Formel
Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung
MehrIT-Governance und Social, Mobile und Cloud Computing: Ein Management Framework... Bachelorarbeit
IT-Governance und Social, Mobile und Cloud Computing: Ein Management Framework... Bachelorarbeit zur Erlangung des akademischen Grades Bachelor of Science (B.Sc.) im Studiengang Wirtschaftswissenschaft
Mehr50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte
50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien
MehrHandbuch Fischertechnik-Einzelteiltabelle V3.7.3
Handbuch Fischertechnik-Einzelteiltabelle V3.7.3 von Markus Mack Stand: Samstag, 17. April 2004 Inhaltsverzeichnis 1. Systemvorraussetzungen...3 2. Installation und Start...3 3. Anpassen der Tabelle...3
MehrVersuch 3: Anwendungen der schnellen Fourier-Transformation (FFT)
Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT) Ziele In diesem Versuch lernen Sie zwei Anwendungen der Diskreten Fourier-Transformation in der Realisierung als recheneffiziente schnelle
MehrPTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN
PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN Karlsruhe, April 2015 Verwendung dichte-basierter Teilrouten Stellen Sie sich vor, in einem belebten Gebäude,
MehrBerechnung der Erhöhung der Durchschnittsprämien
Wolfram Fischer Berechnung der Erhöhung der Durchschnittsprämien Oktober 2004 1 Zusammenfassung Zur Berechnung der Durchschnittsprämien wird das gesamte gemeldete Prämienvolumen Zusammenfassung durch die
MehrQM: Prüfen -1- KN16.08.2010
QM: Prüfen -1- KN16.08.2010 2.4 Prüfen 2.4.1 Begriffe, Definitionen Ein wesentlicher Bestandteil der Qualitätssicherung ist das Prüfen. Sie wird aber nicht wie früher nach der Fertigung durch einen Prüfer,
MehrA2.3: Sinusförmige Kennlinie
A2.3: Sinusförmige Kennlinie Wie betrachten ein System mit Eingang x(t) und Ausgang y(t). Zur einfacheren Darstellung werden die Signale als dimensionslos betrachtet. Der Zusammenhang zwischen dem Eingangssignal
Mehr4. Jeder Knoten hat höchstens zwei Kinder, ein linkes und ein rechtes.
Binäre Bäume Definition: Ein binärer Baum T besteht aus einer Menge von Knoten, die durch eine Vater-Kind-Beziehung wie folgt strukturiert ist: 1. Es gibt genau einen hervorgehobenen Knoten r T, die Wurzel
MehrBedienungsanleitung. Matthias Haasler. Version 0.4. für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof
Bedienungsanleitung für die Arbeit mit der Gemeinde-Homepage der Paulus-Kirchengemeinde Tempelhof Matthias Haasler Version 0.4 Webadministrator, email: webadmin@rundkirche.de Inhaltsverzeichnis 1 Einführung
MehrDieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis
Datenanalyse Auswertung Der Kern unseres Projektes liegt ganz klar bei der Fragestellung, ob es möglich ist, Biere von und geschmacklich auseinander halten zu können. Anhand der folgenden Grafiken, sollte
MehrHandbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken
Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken Dateiname: ecdl5_01_00_documentation_standard.doc Speicherdatum: 14.02.2005 ECDL 2003 Basic Modul 5 Datenbank - Grundlagen
Mehr90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft
Prof. Dr. Helmut Küchenhoff SS08 90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft am 22.7.2008 Anmerkungen Überprüfen Sie bitte sofort, ob Ihre Angabe vollständig ist. Sie sollte
MehrGüte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über
Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion
MehrLineare Gleichungssysteme
Lineare Gleichungssysteme 1 Zwei Gleichungen mit zwei Unbekannten Es kommt häufig vor, dass man nicht mit einer Variablen alleine auskommt, um ein Problem zu lösen. Das folgende Beispiel soll dies verdeutlichen
Mehrgeben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen
geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Vollständigkeit halber aufgeführt. Gehen wir einmal davon aus, dass die von uns angenommenen 70% im Beispiel exakt berechnet sind. Was würde
MehrProfessionelle Seminare im Bereich MS-Office
Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion
MehrEinführung in. Logische Schaltungen
Einführung in Logische Schaltungen 1/7 Inhaltsverzeichnis 1. Einführung 1. Was sind logische Schaltungen 2. Grundlegende Elemente 3. Weitere Elemente 4. Beispiel einer logischen Schaltung 2. Notation von
Mehr1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:
Zählen und Zahlbereiche Übungsblatt 1 1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Für alle m, n N gilt m + n = n + m. in den Satz umschreiben:
MehrProfil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8
1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen
MehrProgramm 4: Arbeiten mit thematischen Karten
: Arbeiten mit thematischen Karten A) Anteil der ausländischen Wohnbevölkerung an der Wohnbevölkerung insgesamt 2001 in Prozent 1. Inhaltliche und kartographische Beschreibung - Originalkarte Bei dieser
MehrBinäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen
Binäre Bäume 1. Allgemeines Binäre Bäume werden grundsätzlich verwendet, um Zahlen der Größe nach, oder Wörter dem Alphabet nach zu sortieren. Dem einfacheren Verständnis zu Liebe werde ich mich hier besonders
MehrErfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.
Abstract zum Thema Handelssysteme Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, eric-hansen@gmx.de am: 07.09.01 Einleitung: Handelssysteme
MehrProzessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements. von Stephanie Wilke am 14.08.08
Prozessbewertung und -verbesserung nach ITIL im Kontext des betrieblichen Informationsmanagements von Stephanie Wilke am 14.08.08 Überblick Einleitung Was ist ITIL? Gegenüberstellung der Prozesse Neuer
MehrKonzepte der Informatik
Konzepte der Informatik Vorkurs Informatik zum WS 2011/2012 26.09. - 30.09.2011 17.10. - 21.10.2011 Dr. Werner Struckmann / Christoph Peltz Stark angelehnt an Kapitel 1 aus "Abenteuer Informatik" von Jens
MehrKorrelation (II) Korrelation und Kausalität
Korrelation (II) Korrelation und Kausalität Situation: Seien X, Y zwei metrisch skalierte Merkmale mit Ausprägungen (x 1, x 2,..., x n ) bzw. (y 1, y 2,..., y n ). D.h. für jede i = 1, 2,..., n bezeichnen
MehrKapiteltests zum Leitprogramm Binäre Suchbäume
Kapiteltests zum Leitprogramm Binäre Suchbäume Björn Steffen Timur Erdag überarbeitet von Christina Class Binäre Suchbäume Kapiteltests für das ETH-Leitprogramm Adressaten und Institutionen Das Leitprogramm
Mehr4. Erstellen von Klassen
Statistik mit Tabellenkalkulation 4. Erstellen von Klassen Mit einem einfachen Befehl lässt sich eine Liste von Zahlen auf die Häufigkeit der einzelnen Werte untersuchen. Verwenden Sie dazu den Befehl
MehrPowerPoint 2010 Mit Folienmastern arbeiten
PP.002, Version 1.1 07.04.2015 Kurzanleitung PowerPoint 2010 Mit Folienmastern arbeiten Der Folienmaster ist die Vorlage für sämtliche Folien einer Präsentation. Er bestimmt das Design, die Farben, die
MehrUmgang mit Schaubildern am Beispiel Deutschland surft
-1- Umgang mit Schaubildern am Beispiel Deutschland surft Im Folgenden wird am Beispiel des Schaubildes Deutschland surft eine Lesestrategie vorgestellt. Die Checkliste zur Vorgehensweise kann im Unterricht
MehrDie reellen Lösungen der kubischen Gleichung
Die reellen Lösungen der kubischen Gleichung Klaus-R. Löffler Inhaltsverzeichnis 1 Einfach zu behandelnde Sonderfälle 1 2 Die ganzrationale Funktion dritten Grades 2 2.1 Reduktion...........................................
MehrObjektorientierte Programmierung für Anfänger am Beispiel PHP
Objektorientierte Programmierung für Anfänger am Beispiel PHP Johannes Mittendorfer http://jmittendorfer.hostingsociety.com 19. August 2012 Abstract Dieses Dokument soll die Vorteile der objektorientierten
MehrDas Mathematik-Abitur im Saarland
Informationen zum Abitur Das Mathematik-Abitur im Saarland Sie können Mathematik im Abitur entweder als grundlegenden Kurs (G-Kurs) oder als erhöhten Kurs (E-Kurs) wählen. Die Bearbeitungszeit für die
MehrRekursionen. Georg Anegg 25. November 2009. Methoden und Techniken an Beispielen erklärt
Methoden und Techniken an Beispielen erklärt Georg Anegg 5. November 009 Beispiel. Die Folge {a n } sei wie folgt definiert (a, d, q R, q ): a 0 a, a n+ a n q + d (n 0) Man bestimme eine explizite Darstellung
MehrSimulink: Einführende Beispiele
Simulink: Einführende Beispiele Simulink ist eine grafische Oberfläche zur Ergänzung von Matlab, mit der Modelle mathematischer, physikalischer bzw. technischer Systeme aus Blöcken mittels plug-and-play
MehrPhysik & Musik. Stimmgabeln. 1 Auftrag
Physik & Musik 5 Stimmgabeln 1 Auftrag Physik & Musik Stimmgabeln Seite 1 Stimmgabeln Bearbeitungszeit: 30 Minuten Sozialform: Einzel- oder Partnerarbeit Voraussetzung: Posten 1: "Wie funktioniert ein
MehrDatensicherung. Beschreibung der Datensicherung
Datensicherung Mit dem Datensicherungsprogramm können Sie Ihre persönlichen Daten problemlos Sichern. Es ist möglich eine komplette Datensicherung durchzuführen, aber auch nur die neuen und geänderten
MehrLichtbrechung an Linsen
Sammellinsen Lichtbrechung an Linsen Fällt ein paralleles Lichtbündel auf eine Sammellinse, so werden die Lichtstrahlen so gebrochen, dass sie durch einen Brennpunkt der Linse verlaufen. Der Abstand zwischen
MehrONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele
ONLINE-AKADEMIE Ziele Wenn man von Menschen hört, die etwas Großartiges in ihrem Leben geleistet haben, erfahren wir oft, dass diese ihr Ziel über Jahre verfolgt haben oder diesen Wunsch schon bereits
MehrF-Praktikum Physik: Photolumineszenz an Halbleiterheterostruktur
F-Praktikum Physik: Photolumineszenz an Halbleiterheterostruktur David Riemenschneider & Felix Spanier 31. Januar 2001 1 Inhaltsverzeichnis 1 Einleitung 3 2 Auswertung 3 2.1 Darstellung sämtlicher PL-Spektren................
Mehr6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)
6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden
MehrFüllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge
2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten
Mehreinfache Rendite 0 145 85 1 160 90 2 135 100 3 165 105 4 190 95 5 210 110
Übungsbeispiele 1/6 1) Vervollständigen Sie folgende Tabelle: Nr. Aktie A Aktie B Schlusskurs in Schlusskurs in 0 145 85 1 160 90 2 135 100 3 165 105 4 190 95 5 210 110 Arithmetisches Mittel Standardabweichung
MehrÜberblick über die Verfahren für Ordinaldaten
Verfahren zur Analyse ordinalskalierten Daten 1 Überblick über die Verfahren für Ordinaldaten Unterschiede bei unabhängigen Stichproben Test U Test nach Mann & Whitney H Test nach Kruskal & Wallis parametrische
Mehr6.2 Scan-Konvertierung (Scan Conversion)
6.2 Scan-Konvertierung (Scan Conversion) Scan-Konvertierung ist die Rasterung von einfachen Objekten (Geraden, Kreisen, Kurven). Als Ausgabemedium dient meist der Bildschirm, der aus einem Pixelraster
MehrVorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke
Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,
MehrHow to do? Projekte - Zeiterfassung
How to do? Projekte - Zeiterfassung Stand: Version 4.0.1, 18.03.2009 1. EINLEITUNG...3 2. PROJEKTE UND STAMMDATEN...4 2.1 Projekte... 4 2.2 Projektmitarbeiter... 5 2.3 Tätigkeiten... 6 2.4 Unterprojekte...
MehrEin Spiel für 2-3 goldhungrige Spieler ab 8 Jahren.
Ein Spiel für 2-3 goldhungrige Spieler ab 8 Jahren. Gold! Gold! Nichts als Gold, soweit das Auge reicht. So ein Goldesel ist schon was Praktisches. Doch Vorsicht: Die störrischen Viecher können einem auch
MehrDie Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.
Lineare Gleichungen mit einer Unbekannten Die Grundform der linearen Gleichung mit einer Unbekannten x lautet A x = a Dabei sind A, a reelle Zahlen. Die Gleichung lösen heißt, alle reellen Zahlen anzugeben,
MehrData Mining: Einige Grundlagen aus der Stochastik
Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener
Mehr1 Mathematische Grundlagen
Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.
MehrSie werden sehen, dass Sie für uns nur noch den direkten PDF-Export benötigen. Warum?
Leitfaden zur Druckdatenerstellung Inhalt: 1. Download und Installation der ECI-Profile 2. Farbeinstellungen der Adobe Creative Suite Bitte beachten! In diesem kleinen Leitfaden möchten wir auf die Druckdatenerstellung
MehrAdditional Cycle Index (ACIX) Thomas Theuerzeit
Additional Cycle Index (ACIX) Thomas Theuerzeit Der nachfolgende Artikel über den ACIX stammt vom Entwickler des Indikators Thomas Theuerzeit. Weitere Informationen über Projekte von Thomas Theuerzeit
Mehr4 Aufzählungen und Listen erstellen
4 4 Aufzählungen und Listen erstellen Beim Strukturieren von Dokumenten und Inhalten stellen Listen und Aufzählungen wichtige Werkzeuge dar. Mit ihnen lässt sich so ziemlich alles sortieren, was auf einer
MehrElektrische Messtechnik Protokoll - Bestimmung des Frequenzgangs durch eine Messung im Zeitbereich
Elektrische Messtechnik Protokoll - Bestimmung des Frequenzgangs durch eine Messung im Zeitbereich André Grüneberg Janko Lötzsch Mario Apitz Friedemar Blohm Versuch: 19. Dezember 2001 Protokoll: 6. Januar
MehrGrundbegriffe der Informatik
Grundbegriffe der Informatik Einheit 15: Reguläre Ausdrücke und rechtslineare Grammatiken Thomas Worsch Universität Karlsruhe, Fakultät für Informatik Wintersemester 2008/2009 1/25 Was kann man mit endlichen
MehrUnterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis Das komplette Material finden Sie hier: Download bei School-Scout.de
MehrDiese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress.
Anmeldung http://www.ihredomain.de/wp-admin Dashboard Diese Ansicht erhalten Sie nach der erfolgreichen Anmeldung bei Wordpress. Das Dashboard gibt Ihnen eine kurze Übersicht, z.b. Anzahl der Beiträge,
MehrZahlen auf einen Blick
Zahlen auf einen Blick Nicht ohne Grund heißt es: Ein Bild sagt mehr als 1000 Worte. Die meisten Menschen nehmen Informationen schneller auf und behalten diese eher, wenn sie als Schaubild dargeboten werden.
MehrTESTEN SIE IHR KÖNNEN UND GEWINNEN SIE!
9 TESTEN SIE IHR KÖNNEN UND GEWINNEN SIE! An den SeniorNETclub 50+ Währinger Str. 57/7 1090 Wien Und zwar gleich in doppelter Hinsicht:!"Beantworten Sie die folgenden Fragen und vertiefen Sie damit Ihr
MehrDer monatliche Tarif für ein Handy wurde als lineare Funktion der Form f(x) = k x + d modelliert (siehe Grafik).
1) Handytarif Der monatliche Tarif für ein Handy wurde als lineare Funktion der Form f(x) = k x + d modelliert (siehe Grafik). Euro Gesprächsminuten Tragen Sie in der folgenden Tabelle ein, welche Bedeutung
MehrDas Vermögen der privaten Haushalte in Nordrhein-Westfalen ein Überblick auf der Basis der Einkommens- und Verbrauchsstichprobe
Sozialberichterstattung NRW. Kurzanalyse 02/2010 09.07.2010 12.07.2010 Das Vermögen der privaten Haushalte in Nordrhein-Westfalen ein Überblick auf der Basis der Einkommens- und Verbrauchsstichprobe 2008
MehrMesstechnik-Praktikum. Spektrumanalyse. Silvio Fuchs & Simon Stützer. c) Berechnen Sie mit FFT (z.b. ORIGIN) das entsprechende Frequenzspektrum.
Messtechnik-Praktikum 10.06.08 Spektrumanalyse Silvio Fuchs & Simon Stützer 1 Augabenstellung 1. a) Bauen Sie die Schaltung für eine Einweggleichrichtung entsprechend Abbildung 1 auf. Benutzen Sie dazu
MehrWie optimiert man die Werbungserkennung von Ad- Detective?
Wie optimiert man die Werbungserkennung von Ad- Detective? Die Ad-Detective-Werbe-Erkennung von VideiReDo basiert auf der Erkennung von Schwarzwerten / scharzen Bildern, die die Werbeblöcke abgrenzen.
MehrInsiderwissen 2013. Hintergrund
Insiderwissen 213 XING EVENTS mit der Eventmanagement-Software für Online Eventregistrierung &Ticketing amiando, hat es sich erneut zur Aufgabe gemacht zu analysieren, wie Eventveranstalter ihre Veranstaltungen
Mehra n + 2 1 auf Konvergenz. Berechnen der ersten paar Folgenglieder liefert:
Beispiel: Wir untersuchen die rekursiv definierte Folge a 0 + auf Konvergenz. Berechnen der ersten paar Folgenglieder liefert: ( ) (,, 7, 5,...) Wir können also vermuten, dass die Folge monoton fallend
MehrRepetitionsaufgaben Wurzelgleichungen
Repetitionsaufgaben Wurzelgleichungen Inhaltsverzeichnis A) Vorbemerkungen B) Lernziele C) Theorie mit Aufgaben D) Aufgaben mit Musterlösungen 4 A) Vorbemerkungen Bitte beachten Sie: Bei Wurzelgleichungen
Mehr1.3 Die Beurteilung von Testleistungen
1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen
MehrStatistische Thermodynamik I Lösungen zur Serie 1
Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen
MehrSuche schlecht beschriftete Bilder mit Eigenen Abfragen
Suche schlecht beschriftete Bilder mit Eigenen Abfragen Ist die Bilderdatenbank über einen längeren Zeitraum in Benutzung, so steigt die Wahrscheinlichkeit für schlecht beschriftete Bilder 1. Insbesondere
MehrAusarbeitung des Seminarvortrags zum Thema
Ausarbeitung des Seminarvortrags zum Thema Anlagepreisbewegung zum Seminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn von Imke Meyer im W9/10 Anlagepreisbewegung
MehrFachbericht zum Thema: Anforderungen an ein Datenbanksystem
Fachbericht zum Thema: Anforderungen an ein Datenbanksystem von André Franken 1 Inhaltsverzeichnis 1 Inhaltsverzeichnis 1 2 Einführung 2 2.1 Gründe für den Einsatz von DB-Systemen 2 2.2 Definition: Datenbank
MehrWinWerk. Prozess 6a Rabatt gemäss Vorjahresverbrauch. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang 16 8307 Effretikon
WinWerk Prozess 6a Rabatt gemäss Vorjahresverbrauch 8307 Effretikon Telefon: 052-740 11 11 Telefax: 052-740 11 71 E-Mail info@kmuratgeber.ch Internet: www.winwerk.ch Inhaltsverzeichnis 1 Ablauf der Rabattverarbeitung...
MehrSEPA Lastschriften. Ergänzung zur Dokumentation vom 27.01.2014. Workshop Software GmbH Siemensstr. 21 47533 Kleve 02821 / 731 20 02821 / 731 299
SEPA Lastschriften Ergänzung zur Dokumentation vom 27.01.2014 Workshop Software GmbH Siemensstr. 21 47533 Kleve 02821 / 731 20 02821 / 731 299 www.workshop-software.de Verfasser: SK info@workshop-software.de
MehrOutlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang
sysplus.ch outlook - mail-grundlagen Seite 1/8 Outlook Mail-Grundlagen Posteingang Es gibt verschiedene Möglichkeiten, um zum Posteingang zu gelangen. Man kann links im Outlook-Fenster auf die Schaltfläche
MehrLineare Gleichungssysteme
Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der
MehrGrundlagen der Theoretischen Informatik, SoSe 2008
1. Aufgabenblatt zur Vorlesung Grundlagen der Theoretischen Informatik, SoSe 2008 (Dr. Frank Hoffmann) Lösung von Manuel Jain und Benjamin Bortfeldt Aufgabe 2 Zustandsdiagramme (6 Punkte, wird korrigiert)
MehrProjekt 2HEA 2005/06 Formelzettel Elektrotechnik
Projekt 2HEA 2005/06 Formelzettel Elektrotechnik Teilübung: Kondensator im Wechselspannunskreis Gruppenteilnehmer: Jakic, Topka Abgabedatum: 24.02.2006 Jakic, Topka Inhaltsverzeichnis 2HEA INHALTSVERZEICHNIS
MehrTheoretische Grundlagen der Informatik WS 09/10
Theoretische Grundlagen der Informatik WS 09/10 - Tutorium 6 - Michael Kirsten und Kai Wallisch Sitzung 13 02.02.2010 Inhaltsverzeichnis 1 Formeln zur Berechnung Aufgabe 1 2 Hamming-Distanz Aufgabe 2 3
MehrApplikations-Performance in Citrix Umgebungen
Applikations-Performance in Citrix Umgebungen Monitoring und Troubleshooting mit OPNET Lösungen Page 1 of 6 CITRIX ist langsam! Mit dieser Frage sehen sich immer wieder IT Administratoren konfrontiert.
MehrMusterlösung zu Serie 14
Dr. Lukas Meier Statistik und Wahrscheinlichkeitsrechnung FS 21 Musterlösung zu Serie 14 1. Der Datensatz von Forbes zeigt Messungen von Siedepunkt (in F) und Luftdruck (in inches of mercury) an verschiedenen
MehrAdobe Photoshop. Lightroom 5 für Einsteiger Bilder verwalten und entwickeln. Sam Jost
Adobe Photoshop Lightroom 5 für Einsteiger Bilder verwalten und entwickeln Sam Jost Kapitel 2 Der erste Start 2.1 Mitmachen beim Lesen....................... 22 2.2 Für Apple-Anwender.........................
MehrGutes Leben was ist das?
Lukas Bayer Jahrgangsstufe 12 Im Hirschgarten 1 67435 Neustadt Kurfürst-Ruprecht-Gymnasium Landwehrstraße22 67433 Neustadt a. d. Weinstraße Gutes Leben was ist das? Gutes Leben für alle was genau ist das
MehrMicrosoft Access 2013 Navigationsformular (Musterlösung)
Hochschulrechenzentrum Justus-Liebig-Universität Gießen Microsoft Access 2013 Navigationsformular (Musterlösung) Musterlösung zum Navigationsformular (Access 2013) Seite 1 von 5 Inhaltsverzeichnis Vorbemerkung...
MehrVerband der TÜV e. V. STUDIE ZUM IMAGE DER MPU
Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU 2 DIE MEDIZINISCH-PSYCHOLOGISCHE UNTERSUCHUNG (MPU) IST HOCH ANGESEHEN Das Image der Medizinisch-Psychologischen Untersuchung (MPU) ist zwiespältig: Das ist
MehrVorlesung Diskrete Strukturen Graphen: Wieviele Bäume?
Vorlesung Diskrete Strukturen Graphen: Wieviele Bäume? Bernhard Ganter Institut für Algebra TU Dresden D-01062 Dresden bernhard.ganter@tu-dresden.de WS 2013/14 Isomorphie Zwei Graphen (V 1, E 1 ) und (V
MehrMeet the Germans. Lerntipp zur Schulung der Fertigkeit des Sprechens. Lerntipp und Redemittel zur Präsentation oder einen Vortrag halten
Meet the Germans Lerntipp zur Schulung der Fertigkeit des Sprechens Lerntipp und Redemittel zur Präsentation oder einen Vortrag halten Handreichungen für die Kursleitung Seite 2, Meet the Germans 2. Lerntipp
MehrAustausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen
Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:
MehrClustering Seminar für Statistik
Clustering Markus Kalisch 03.12.2014 1 Ziel von Clustering Finde Gruppen, sodas Elemente innerhalb der gleichen Gruppe möglichst ähnlich sind und Elemente von verschiedenen Gruppen möglichst verschieden
MehrEinführung in statistische Analysen
Einführung in statistische Analysen Andreas Thams Econ Boot Camp 2008 Wozu braucht man Statistik? Statistik begegnet uns jeden Tag... Weihnachten macht Deutschen Einkaufslaune. Im Advent überkommt die
MehrFolge 19 - Bäume. 19.1 Binärbäume - Allgemeines. Grundlagen: Ulrich Helmich: Informatik 2 mit BlueJ - Ein Kurs für die Stufe 12
Grundlagen: Folge 19 - Bäume 19.1 Binärbäume - Allgemeines Unter Bäumen versteht man in der Informatik Datenstrukturen, bei denen jedes Element mindestens zwei Nachfolger hat. Bereits in der Folge 17 haben
MehrAccess [basics] Gruppierungen in Abfragen. Beispieldatenbank. Abfragen gruppieren. Artikel pro Kategorie zählen
Abfragen lassen sich längst nicht nur dazu benutzen, die gewünschten Felder oder Datensätze einer oder mehrerer Tabellen darzustellen. Sie können Daten auch nach bestimmten Kriterien zu Gruppen zusammenfassen
MehrLinguLab GmbH. Bedienungsanleitung Allgemeine Definition
LinguLab GmbH Bedienungsanleitung Allgemeine Definition LinguLab GmbH T: +49.711.49030.370 Maybachstr. 50 F: +49.711.49030.22.370 70469 Stuttgart E: mba@lingulab.de I: www.lingulab.de Inhaltsverzeichnis
Mehr