Die Kosten mitzählen. Die Kosten mitzählen. Verschiedene Typen von Klassifikationsfehlern haben oft auch verschiedene Kosten Beispiel:
|
|
- Kornelius Gerber
- vor 7 Jahren
- Abrufe
Transkript
1 Glederung Motvaton für Evaluaton chätzen des Klassfkatonsfehlers Traneren, Valderen und Testen Fehler engrenzen, Vertrauensntervalle Auftelung n Tranngs- und Testmenge Wederholtes Auftelen Kreuz-Valderung Leave-One-Out Bootstrap Performanzverglech von DM Methoden Enbezehen der Varanz der Performanz: gnfkanz Tests Gepaarter und ungepaarter t-test Performanz be der Vorhersage von Wahrschenlchketen Quadratsche- und Informatonsverlust-Funkton Performanzverglech be verschedenen Kosten der Fehler Lft Charts ROC Kurve Precson und Recall Evaluerung nummerscher Vorhersagen verschedene Maße Das MDL Prnzp Modellauswahl Bayes Theorem, Log-Lkelyhood und MDL Epkurus Prnzp und Modellmttelung MDL und Clusteranalyse ete 49 De Kosten mtzählen Verschedene Typen von Klassfkatonsfehlern haben oft auch verschedene Kosten Bespel: Entdecken von Terrorsten Ken Terrorst 99.99% der Fälle korrekt En ncht entdeckter Terrorst verursacht sehr vel mehr Kosten, als en als Terrorst beschuldgter Tourst Öl-Teppche fnden Fehlerdagnose Postwurfsendungen ete 50 De Kosten mtzählen Confuson Matrx: Actual class No False postve Es gbt noch vele andere Arten von Kosten! z.b.: Kosten um Tranngsdaten zu sammeln Predcted class True postve No False negatve True negatve ete 51 Lft Charts In der Praxs snd de Kosten oft ncht bekannt Entschedungen werden durch Verglech von zenaren getroffen Bespel: Postwurfsendungen zu 1,000,000 Haushalten sende an alle; 0.1% Antworten (1000) DM dentfzert Telmenge von 100,000, 0.4% von desen antworten (400) 40% der Antworten für 10% der Kosten oder DM dentfzert Telmenge von 400,000, 0.% antworten (800) lft chart gbt enen vsuellen Verglech ete 5
2 Erzeugung des Lft charts Aufgabe Fnde Telmenge der Testnstanzen, mt überproportaler Anzahl an Postven. Idee Klassfkator sagt Antwort-Whr. vorher ortere Instanzen abstegend nach der vorhergesagten Whr. postv zu sen Top- snd beste Wahl, wenn Klasse unbekannt st x Achse st tchprobengröße y Achse st Anzahl der wahren Postven Predcted probablty Actual class No ete 53 En hypothetscher Lft Chart 40% der Antworten für 10% der Kosten 80% der Antworten für 40% der Kosten ete 54 ROC Kurven ROC Kurve snd ähnlch zu Lft Charts ROC recever operatng characterstc Wrd n der gnalverarbetung genutzt, um den Kompromss zwschen Treffer- und Fehlalarmrate zu zegen Unterschede zu Lft Charts: y Achse zegt Prozente der wahren Postven der tchprobe m Verglech zu ener absoluten Anzahl x Achse zegt Prozente der falschen Postven der tchprobe m Verglech zur tchprobengröße Bespel für ROC Kurve Treppenstufen Kurve ene Testdatenmenge Glatte Kurve mt Kreuzvalderung ete 55 ete 56
3 Kreuzvalderung und ROC Kurven Enfache Methode um ene ROC Kurve aus der Kreuzvaldaton zu erhalten: Berechne Whr. für Instanzen n Testmenge ammle Whr.s für alle Testmengen ortere Instanzen aller Testmengen nach Whr. Dese Methode st mplementert n WEKA Andere Möglchket Mttele de ROC Kurven für jede Testmenge ete 57 ROC Kurven für zwe chemata Für ene klene, fokuserte Menge, nutze Methode A Für größere Mengen, nutze Methode B Für mttlere Mengen, nutze Methoden A und B mt passenden Whr. ete 58 Konvexe Hülle Für zwe gegebene Lernschemata kann jeder Punkt auf der konvexen Hülle errecht werden! TP und FP Raten für chema 1: t 1 und f 1 TP und FP Raten für chema : t und f Falls chema 1 de ersten 100 q % Fälle vorhersagen soll und chema den Rest, dann TP Rate für kombnertes chema: q t 1 +(1-q) t FP Rate für kombnertes chema: q f +(1-q) f Kosten-orentertes Lernen Mesten Lernschemata snd ncht Kostenorentert Genereren den glechen Klassfkator unabhängg von den Kosten für verschedene Klassen Bespel: tandard Entschedungsbaum Algorthmus Enfache Methode für kosten-orentertes Lernen: Vervelfältge Instanzen m Verhältns zu den Kosten Gewchte Instanzen m Verhältns zu den Kosten Enge chemata können Kosten über Parameter berückschtgen, z.b. naïve Bayes ete 59 ete 60
4 Maße n Informaton Retreval Zusammenfassung der Maße Prozentsatz der zurückgegebenen Dokumente de relevant snd: precson=tp/(tp+fp), (Präzson ) Prozentsatz der relevanten Dokumente, de zurückgegeben werden: recall =TP/(TP+FN), (Ausbeute) Zusammengefaßte Maße: Durchschnttlche Precson für 0%, 50% und 80% Recall (Dre-Punkt Recall-Durchschntt) F-Maß=( recall precson)/(recall+precson) Lft chart ROC Kurve Recall- Precson Kurve Domäne Marketng Kommunkaton Informaton Retreval, uche Kurve TP Telmengengröße TP rate FP rate Recall Precson Erklärung TP (TP+FP)/(TP+FP+TN+FN) TP/(TP+FN) FP/(FP+TN) TP/(TP+FN) TP/(TP+FP) ete 61 ete 6 Glederung Motvaton für Evaluaton chätzen des Klassfkatonsfehlers Traneren Valderen und Testen Fehler engrenzen, Vertrauensntervalle Auftelung n Tranngs und Testmenge Wederholtes Auftelen Kreuz-Valderung Leave-One-Out Bootstrap Performanzverglech von DM Methoden Enbezehen der Varanz der Performanz: gnfkanz Tests Gepaarter und Ungepaarter t-test Performanz be der Vorhersage von Wahrschenlchketen Quadratsche und Informatonsverlust Funkton Performanzverglech be verschedenen Kosten der Fehler Lft Charts ROC Kurve Precson und Recall Evaluerung nummerscher Vorhersagen verschedene Maße Das MDL Prnzp Modellauswahl Bayes Theorem, Log-Lkelyhood und MDL Epkurus Prnzp und Modellmttelung MDL und Clusteranalyse ete 63 Evaluerung nummerscher Vorhersagen Glechen trategen: unabhängge Testmenge, Kreuz-Valderung, gnfkanz Tests, usw.. Unterschede: Fehlermaße Zelwerte: a 1 a a n Vorhergesagte Werte: p 1 p p n Oft gnutztes Maß: gemttelter, quadrerter Fehler (mean-squared error) ( p1 a1) ( pn an) n ete 64
5 Andere Maße Root Mean-quared Error (RME): 1 n) ( p a1) ( pn a n Der Mean Absolute Error st wenger empfndlch gegenüber Ausreßern als der mean-squared error: p1 a pn an n In manchen tuattonen st der relatve Fehler passender, z.b. 10% als Fehler, wenn 50 statt 500 vorhergesagt wurde Verbesserung gegenüber dem Durchschntt Um wevel st das chema besser als wenn enfach mmer der Durchschntt vorhergesagt werden würde? Der relatve quadrerte Fehler st ( a st Durchschntt): ( p1 a1) ( pn an) ( a a1) ( a an) Der relatve absolute Fehler st: p1 a a a pn an a a n ete 65 ete 66 Korrelatonskoeffzent Mßt de statstsche Korrelaton zwschen den vorhergesagten und tatsächlchen Werten PA = ( p p)( a n 1 a) kalenunabhängg, zwschen 1 und +1 Gute Performanz führen zu großen Werte! P PA P = A ( p p) n 1 A = ( a a) n 1 ete 67 Welches Maß? Am besten alle betrachten Oft ergbt sch ken Untersched Bespel: Root mean-squared error Mean absolute error Root rel squared error Relatve absolute error Correlaton coeffcent A % 43.1% 0.88 B % 40.1% 0.88 D bester C zwet-bester A, B verglechbar % 34.8% 0.89 C D % 30.4% 0.91 ete 68
6 Glederung Motvaton für Evaluaton chätzen des Klassfkatonsfehlers Traneren Valderen und Testen Fehler engrenzen, Vertrauensntervalle Auftelung n Tranngs und Testmenge Wederholtes Auftelen Kreuz-Valderung Leave-One-Out Bootstrap Performanzverglech von DM Methoden Enbezehen der Varanz der Performanz: gnfkanz Tests Gepaarter und Ungepaarter t-test Performanz be der Vorhersage von Wahrschenlchketen Quadratsche und Informatonsverlust Funkton Performanzverglech be verschedenen Kosten der Fehler Lft Charts ROC Kurve Precson und Recall Evaluerung nummerscher Vorhersagen verschedene Maße Das MDL Prnzp Modellauswahl Bayes Theorem, Log-Lkelyhood und MDL Epkurus Prnzp und Modellmttelung MDL und Clusteranalyse ete 69 Das MDL-Prnzp MDL steht für mnmum descrpton length De Beschrebungslänge st defnert als: Platz um de Theore zu beschreben + Platz um de Ausnahmen der Theore zu beschreben In unserem Fall st de Theore der Klassfkator und de Ausnahmen snd de Fehler aus der Tranngsmenge Zel: suche Klassfkator mt mnmaler Beschrebungslänge MDL-Prnzp st en Modellauswahlkrterum ete 70 Modellauswahlkrterum Modellauswahlkrterum sucht enen guten Kompromß zwschen: Der Komplexät des Modells und der Vorhersagegenaugket auf den Tranngsdaten Idee: en gutes Modell st en enfaches Modell, das ene hohe Genaugket auf den gegebenen Daten errecht Auch bekannt als Ockham s Rasermesser : de beste Theore st de Klenste, de alle Fakten beschrebt Wllam of Ockham, born n the vllage of Ockham n urrey (England) about 185, was the most nfluental phlosopher of the 14th century and a controversal theologan. Eleganz vs. Fehler Theore 1: sehr enfache, elegante Theore, welche de Daten fast perfekt erklärt Theore : sgnfkant komplexere Theore, welche de Daten ohne Fehler erklärt Theore 1 wrd whr. bevorzugt Klasssches Bespel: Kepler s dre Gesetze über Planetenbahnen Wenger genau als Coperncus letzte Verbesserung der Ptolemäschen Theore der Epzyklen ete 71 ete 7
7 MDL und Kompresson MDL Prnzp steht n Bezehung zur Datenkompresson De beste Theore st jene, de de Daten am mesten komprmert I. Allg. wrd ene Datenmenge komprmert, ndem en Modell der Daten erstellt wrd und de Ausnahmen zusätzlch gespechert werden Folgendes muß berechnet werden (a) Größe des Modells und (b) Platzbedarf für de Ausnahmen (b) Lecht: nutze Entrope (a) das Modell muß kodert werden ete 73 MDL und Bayes s Theorem L[T]= Länge der Theore L[E T]=Tranngsmenge mttels Theore kodert Beschrebungslänge= L[T] + L[E T] Bayes s Theorem ergbt Posteror-Whr. ener Theore be gegebenen Daten: Pr[ E T ]Pr[ T ] Pr[ T E] = Pr[ E] Äquvalent zu: log Pr[ T E] = log Pr[ E T ] log Pr[ T ] + log Pr[ E] konstant ete 74 MDL und MAP MAP steht für maxmum a posteror probablty Fnden der MAP Theore entsprcht dem Fnden der MDL Theore chwerger chrtt bem Anwenden des MAP Prnzps: Bestmmen der Pror Whr. Pr[T] der Theore Entsprcht dem schwergen Tel bem Anwenden des MDL Prnzps: fnden des passenden Koderungsschemas für de Theore I.Allg. wenn bekannt st, daß ene bestmmte Theore wahrschenlcher st als andere, braucht man wenger Bts um se zu koderen Dskusson des MDL Prnzps Vortel: nutzt de Tranngsdaten voll aus, um das Modell zu bestmmen Nachtel 1: passendes Koderungsschema bzw. Pror-Whr. für de Theoren snd entschedend Nachtel : kene Garante, daß de MDL Theore den erwarteten Klassfkatonsfehler mnmert Bemerkung: Ockham s Rasermesser st en Axom! Epkurus Prnzp der mehrfachen Erklärungen: nutze alle Theoren, de m Enklang mt den Daten snd ete 75 ete 76
8 Bayesche Modellmttelung, BMA ] Reflektert Epkurus Prnzp: alle Theoren werden mttels P[T E] gewchtet und zur Vorhersage genutzt e I ene neue Instanz, deren Klasse vorhergesagt werden soll e C de Zufallsvarable, welche de Klasse angbt Dann ergbt BMA de Whr. für C be gegebenem I Tranngsdaten E Pr[ C I, E] Pr[ C I, T ]Pr[ T E möglchen Theoren T j = j j j ete 77 MDL und Clusteranalyse Beschrebungslänge der Theore: Anzahl der Bts um de Cluster zu koderen z.b. Cluster Repräsentanten Beschrebungslänge der Daten bezüglch der Theore: kodere Clustermtgledschaft und Poston relatve zum Cluster z.b. Dstanz zum Clusterrepräsentanten Funktonert falls das Koderungsschema wenger Platz für klene Zahlen als für große Zahlen verbraucht Be nomnalen Attrbuten muß de Klassenwahrschenlchketsvertelung für jeden Cluster kodert werden MDL kann genutzt werden, um den Parameter k be k-means zu bestmmen ete 78
Übungsklausur zur Vorlesung Wahrscheinlichkeit und Regression Lösungen. Übungsklausur Wahrscheinlichkeit und Regression Die Lösungen
Übungsklausur Wahrschenlchket und Regresson De Lösungen. Welche der folgenden Aussagen treffen auf en Zufallsexperment zu? a) En Zufallsexperment st en emprsches Phänomen, das n stochastschen Modellen
MehrGrundgedanke der Regressionsanalyse
Grundgedanke der Regressonsanalse Bsher wurden durch Koeffzenten de Stärke von Zusammenhängen beschreben Mt der Regressonsrechnung können für ntervallskalerte Varablen darüber hnaus Modelle geschätzt werden
MehrBedingte Entropie. Bedingte Entropie. Bedingte Entropie. Kapitel 4: Bedingte Entropie I(X;Y) H(X Y) H(Y) H(X) H(XY)
Bedngte Entrope Kaptel : Bedngte Entrope Das vorherge Theorem kann durch mehrfache Anwendung drekt verallgemenert werden H (... H ( = Ebenso kann de bedngt Entrope defnert werden Defnton: De bedngte Entrope
MehrDefinition des linearen Korrelationskoeffizienten
Defnton des lnearen Korrelatonskoeffzenten r xy x y y r x xy y 1 x x y y x Der Korrelatonskoeffzent st en Indkator dafür, we gut de Punkte (X,Y) zu ener Geraden passen. Sen Wert legt zwschen -1 und +1.
MehrResultate / "states of nature" / mögliche Zustände / möglicheentwicklungen
Pay-off-Matrzen und Entschedung unter Rsko Es stehen verschedene Alternatven (Strategen) zur Wahl. Jede Stratege führt zu bestmmten Resultaten (outcomes). Man schätzt dese Resultate für jede Stratege und
Mehrnonparametrische Tests werden auch verteilungsfreie Tests genannt, da sie keine spezielle Verteilung der Daten in der Population voraussetzen
arametrsche vs. nonparametrsche Testverfahren Verfahren zur Analyse nomnalskalerten Daten Thomas Schäfer SS 009 1 arametrsche vs. nonparametrsche Testverfahren nonparametrsche Tests werden auch vertelungsfree
MehrArbeitsgruppe Radiochemie Radiochemisches Praktikum P 06. Einführung in die Statistik. 1. Zählung von radioaktiven Zerfällen und Statistik 2
ETH Arbetsgruppe Radocheme Radochemsches Praktkum P 06 Enführung n de Statstk INHALTSVERZEICHNIS Sete 1. Zählung von radoaktven Zerfällen und Statstk 2 2. Mttelwert und Varanz 2 3. Momente ener Vertelung
MehrKapitel 7: Ensemble Methoden. Maschinelles Lernen und Neural Computation
Kaptel 7: Ensemble Methoden 133 Komtees Mehrere Netze haben bessere Performanz als enzelne Enfachstes Bespel: Komtee von Netzen aus der n-fachen Kreuzvalderung (verrngert Varanz) De Computatonal Learnng
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Graphische Modelle. Niels Landwehr
Unverstät Potsdam Insttut für Informatk Lehrstuhl Maschnelles Lernen Graphsche Modelle els Landwehr Zusammenfassung Pfade Zusammenfassung: en Pfad --Y-Z- st B A E Blockert be Y, wenn Dvergerende Verbndung,
MehrStreuungs-, Schiefe und Wölbungsmaße
aptel IV Streuungs-, Schefe und Wölbungsmaße B... Lagemaße von äufgketsvertelungen geben allen weng Auskunft über ene äufgketsvertelung. Se beschreben zwar en Zentrum deser Vertelung, geben aber kenen
MehrBeschreibung des Zusammenhangs zweier metrischer Merkmale. Streudiagramme Korrelationskoeffizienten Regression
Beschrebung des Zusammenhangs zweer metrscher Merkmale Streudagramme Korrelatonskoeffzenten Regresson Alter und Gewcht be Kndern bs 36 Monaten Knd Monate Gewcht 9 9 5 8 3 4 7.5 4 3 6 5 3 6 4 3.5 7 35 5
Mehrwird auch Spannweite bzw. Variationsbreite genannt ist definiert als die Differenz zwischen dem größten und kleinsten Messwert einer Verteilung:
Streuungswerte: 1) Range (R) ab metrschem Messnveau ) Quartlabstand (QA) und mttlere Quartlabstand (MQA) ab metrschem Messnveau 3) Durchschnttlche Abwechung (AD) ab metrschem Messnveau 4) Varanz (s ) ab
MehrItemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte. Itemanalyse und Itemkennwerte: Itemschwierigkeit P i
Itemanalyse und Itemkennwerte De Methoden der Analyse der Itemegenschaften st ncht m engeren Snne Bestandtel der Klassschen Testtheore Im Rahmen ener auf der KTT baserenden Testkonstrukton und -revson
Mehr2.1 Einfache lineare Regression 31
.1 Enfache lneare Regresson 31 Regressonsanalyse De Regressonsanalyse gehört zu den am häufgsten engesetzten multvaraten statstschen Auswertungsverfahren. Besonders de multple Regressonsanalyse hat große
MehrAuswertung univariater Datenmengen - deskriptiv
Auswertung unvarater Datenmengen - desrptv Bblografe Prof. Dr. Küc; Statst, Vorlesungssrpt Abschntt 6.. Bleymüller/Gehlert/Gülcher; Statst für Wrtschaftswssenschaftler Verlag Vahlen Bleymüller/Gehlert;
MehrKapitel 4: Unsicherheit in der Modellierung Modellierung von Unsicherheit. Machine Learning in der Medizin 104
Kaptel 4: Unscherhet n der Modellerung Modellerung von Unscherhet Machne Learnng n der Medzn 104 Regresson Modellerung des Datengenerators: Dchteschätzung der gesamten Vertelung, t pt p p Lkelhood: L n
MehrLineare Regression (1) - Einführung I -
Lneare Regresson (1) - Enführung I - Mttels Regressonsanalysen und kompleeren, auf Regressonsanalysen aserenden Verfahren können schenar verschedene, jedoch nenander üerführare Fragen untersucht werden:
MehrAbbildung 3.1: Besetzungszahlen eines Fermigases im Grundzustand (a)) und für eine angeregte Konfiguration (b)).
44 n n F F a) b) Abbldung 3.: Besetzungszahlen enes Fermgases m Grundzustand (a)) und für ene angeregte Konfguraton (b)). 3.3 Ferm Drac Statstk In desem Abschntt wollen wr de thermodynamschen Egenschaften
MehrDie Annäherung der Binomialverteilung durch die Normalverteilung am Beispiel eines Modells der Schadenversicherung
am Bespel enes Modells der chadenverscherung Für das Modell ener chadenverscherung se gegeben: s w s. n 4 chaden enes Verscherungsnehmers, wenn der chadenfall entrtt Wahrschenlchket dafür, dass der chadenfall
MehrHUMBOLDT-UNIVERSITÄT ZU BERLIN. Institut für Informatik Lehrstuhl Wissensmanagement. Textklassifikation. Tobias Scheffer Ulf Brefeld
HUMBOLDTUNIVERSITÄT ZU BERLIN Insttut für Informatk Lehrstuhl Wssensmanagement Textklassfkaton Tobas Scheffer Ulf Brefeld Textklassfkaton Textklassfkator: Ordnet enen Text ener Menge von nhaltlchen Kategoren
MehrDaten sind in Tabellenform gegeben durch die Eingabe von FORMELN können mit diesen Daten automatisierte Berechnungen durchgeführt werden.
Ene kurze Enführung n EXCEL Daten snd n Tabellenform gegeben durch de Engabe von FORMELN können mt desen Daten automatserte Berechnungen durchgeführt werden. Menüleste Symbolleste Bearbetungszele aktve
MehrStochastische Prozesse
INSTITUT FÜR STOCHASTIK SS 009 UNIVERSITÄT KARLSRUHE Blatt 4 Prv.-Doz. Dr. D. Kadelka Dpl.-Math. W. Lao Übungen zur Vorlesung Stochastsche Prozesse Musterlösungen Aufgabe 16: (Success Run, Fortsetzung)
MehrStatistische Kennzahlen für die Lage
Statstsche Kennzahlen für de Lage Bsher: gernge Informatonsverdchtung durch Vertelungsbeschrebung Jetzt: stärere Zusammenfassung der Daten auf hr Zentrum ls Raabe: Wahrschenlchetsrechnung und Statstsche
MehrInformatik II. Minimalpolynome und Implikanten. Minimalpolynome. Minimalpolynome. Rainer Schrader. 27. Oktober Was bisher geschah: Definition
Informatk II Raner Schrader und Implkanten Zentrum für Angewandte Informatk Köln 27. Oktober 2005 1 / 28 2 / 28 Was bsher geschah: jede Boolesche Funkton kann durch enfache Grundfunktonen dargestellt werden
MehrAnalyse von Querschnittsdaten. Bivariate Regression
Analse von Querschnttsdaten Bvarate Regresson Warum geht es n den folgenden Stzungen? Kontnuerlche Varablen Deskrptve Modelle kategorale Varablen Datum 3.0.2004 20.0.2004 27.0.2004 03..2004 0..2004 7..2004
Mehr-70- Anhang: -Lineare Regression-
-70- Anhang: -Lneare Regressn- Für ene Messgröße y f(x) gelte flgender mathematsche Zusammenhang: y a+ b x () In der Regel läßt sch durch enen Satz vn Messwerten (x, y ) aber kene Gerade zechnen, da de
MehrProf. Dr. P. Kischka WS 2012/13 Lehrstuhl für Wirtschafts- und Sozialstatistik. Klausur Statistische Inferenz
Prof. Dr. P. Kschka WS 2012/13 Lehrstuhl für Wrtschafts- und Sozalstatstk Klausur Statstsche Inferenz 15.02.2013 Name: Matrkelnummer: Studengang: Aufgabe 1 2 3 4 5 6 7 8 Summe Punkte 6 5 5 5 5 4 4 6 40
MehrDer Erweiterungsfaktor k
Der Erweterungsfaktor k Wahl des rchtgen Faktors S. Meke, PTB-Berln, 8.40 Inhalt: 1. Was macht der k-faktor? 2. Welche Parameter legen den Wert des k-faktors fest? 3. Wo trtt der k-faktor auf? 4. Zusammenhang
MehrMultilineare Algebra und ihre Anwendungen. Nr. 6: Normalformen. Verfasser: Yee Song Ko Adrian Jenni Rebecca Huber Damian Hodel
ultlneare Algebra und hre Anwendungen Nr. : Normalformen Verfasser: Yee Song Ko Adran Jenn Rebecca Huber Daman Hodel 9.5.7 - - ultlneare Algebra und hre Anwendungen Jordan sche Normalform Allgemene heore
MehrSpiele und Codes. Rafael Mechtel
Spele und Codes Rafael Mechtel Koderungstheore Worum es geht Über enen Kanal werden Informatonen Übertragen. De Informatonen werden dabe n Worte über enem Alphabet Q übertragen, d.h. als Tupel w = (w,,
MehrInhalt dieses Kapitels. Das Klassifikationsproblem, Bewertung von Klassifikatoren. Grundbegriffe, Parameterwahl, Anwendungen
3. Klassfkaton 3.1 Enletung Inhalt deses Kaptels Das Klassfkatonsproblem, Bewertung von Klassfkatoren 3.2 Bayes-Klassfkatoren Optmaler Bayes-Klassfkator, Naver Bayes-Klassfkator, Anwendungen 3.3 Nächste-Nachbarn-Klassfkatoren
MehrKapitel 2: Klassifikation. Maschinelles Lernen und Neural Computation
Kaptel 2: Klassfkaton Maschnelles Lernen und Neural Computaton 28 En enfacher Fall En Feature, Hstogramme für bede Klassen (z.b. Glukosewert, Dabetes a/nen) Kene perfekte Trennung möglch Entschedung: Schwellwert
Mehr5. ZWEI ODER MEHRERE METRISCHE MERKMALE
5. ZWEI ODER MEHRERE METRISCHE MERKMALE wenn an ener Beobachtungsenhet zwe (oder mehr) metrsche Varablen erhoben wurden wesentlche Problemstellungen: Frage nach Zusammenhang: Bsp.: Duxbury Press (sehe
Mehr2 Zufallsvariable und Verteilungen
Zufallsvarable und Vertelungen 7 Zufallsvarable und Vertelungen Wr wollen uns jetzt mt Zufallsexpermenten beschäftgen, deren Ausgänge durch (reelle) Zahlen beschreben werden können, oder be denen man jedem
Mehr1.1 Beispiele zur linearen Regression
1.1. BEISPIELE ZUR LINEAREN REGRESSION 0 REGRESSION 1: Multple neare Regresson 1 Enführung n de statstsche Regressonsrechnung 1.1 Bespele zur lnearen Regresson b Bespel Sprengungen. Erschütterung Funkton
MehrÜbung zur Vorlesung - Theorien Psychometrischer Tests II
Übung zur Vorlesung - Theoren Psychometrscher Tests II N. Rose 8. Übung (08.01.2008) Agenda Agenda Verglech Rasch-Modell vs. 2-parametrsches logstsches Modell nach Brnbaum 2PL-Modelle n Mplus Verglech
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Bayessches Lernen
Unverstät Potsdam Insttut für Informatk Lehrstuhl Maschnelles Lernen Bayessches Lernen Chrstoph Sawade/Nels Landwehr/Paul Prasse Domnk Lahmann Tobas Scheffer Überblck Wahrschenlchketen, Erwartungswerte,
MehrModul 1: Einführung und Wahrscheinlichkeitsrechnung
Modul : Enführung und Wahrschenlchketsrechnung Informatonstheore Dozent: Prof. Dr. M. Gross E-mal: grossm@nf.ethz.ch Assstenten: Danel Cottng, Rchard Keser, Martn Wcke, Cyrl Flag, Andrea Francke, Jonas
MehrBeim Wiegen von 50 Reispaketen ergaben sich folgende Gewichte X(in Gramm):
Aufgabe 1 (4 + 2 + 3 Punkte) Bem Wegen von 0 Respaketen ergaben sch folgende Gewchte X(n Gramm): 1 2 3 4 K = (x u, x o ] (98,99] (99, 1000] (1000,100] (100,1020] n 1 20 10 a) Erstellen Se das Hstogramm.
MehrExkurs: Entropie in der Wahrscheinlichkeitstheorie
Exkurs: Entrope n der Wahrschenlchketstheore a) Physk/Thermodynamk: S = k B ln(w) mt W=Anzahl glech-wahrschenlcher Möglchketen (Mkrozustände) a) Informatonstheore: Shannon (1948) Entrope wobe p = f /N
MehrKonkave und Konvexe Funktionen
Konkave und Konvexe Funktonen Auch wenn es n der Wrtschaftstheore mest ncht möglch st, de Form enes funktonalen Zusammenhangs explzt anzugeben, so kann man doch n velen Stuatonen de Klasse der n Frage
MehrProf. Dr. Roland Füss Statistik II SS 2008
5. Spezelle Testverfahren Zahlreche parametrsche und nchtparametrsche Testverfahren, de nach Testvertelung (Bnomal, t-test etc.), Analysezel (Anpassungs- und Unabhänggketstest) oder Konstrukton der Prüfgröße
Mehr6. Modelle mit binären abhängigen Variablen
6. Modelle mt bnären abhänggen Varablen 6.1 Lneare Wahrschenlchketsmodelle Qualtatve Varablen: Bnäre Varablen: Dese Varablen haben genau zwe möglche Kategoren und nehmen deshalb genau zwe Werte an, nämlch
MehrAuswertung univariater Datenmengen - deskriptiv
Auswertung unvarater Datenmengen - desrptv Bblografe Prof. Dr. Küc; Statst, Vorlesungssrpt Abschntt 6.. Bleymüller/Gehlert/Gülcher; Statst für Wrtschaftswssenschaftler Verlag Vahlen Bleymüller/Gehlert;
Mehr3 Multiple lineare Regression
3.1 Modell und Statstk 34 3 Multple lneare Regresson 3.1 Modell und Statstk a Zusammenhang zwschen ener Zelgrösse Y und mehreren Engangsgrössen X (1), X (2),..., X (m) Y = β 0 + β 1 x (1) + β 2 x (2) Parameter:
MehrLösungen zum 3. Aufgabenblock
Lösungen zum 3. Aufgabenblock 3. Aufgabenblock ewerber haben n enem Test zur sozalen Kompetenz folgende ntervallskalerte Werte erhalten: 96 131 11 1 85 113 91 73 7 a) Zegen Se für desen Datensatz, dass
Mehr2. Klausur zur Vorlesung Algorithmen II Wintersemester 2012/2013
2. Klausur zur Vorlesung Algorthmen II Wntersemester 202/203 Her Aufkleber mt Name und Matrkelnummer anbrngen Vorname: Nachname: Matrkelnummer: Beachten Se: Brngen Se den Aufkleber mt Ihrem Namen und Matrkelnummer
MehrVorlesung: Multivariate Statistik für Psychologen
Vorlesung: Multvarate Statstk für Psychologen 3. Vorlesung: 14.04.2003 Agenda 1. Organsatorsches 2. Enfache Regresson. Grundlagen.. Grunddee und Zele der enfachen Regresson Bespele Statstsches Modell Modell
Mehr12 LK Ph / Gr Elektrische Leistung im Wechselstromkreis 1/5 31.01.2007. ω Additionstheorem: 2 sin 2 2
1 K Ph / Gr Elektrsche estng m Wechselstromkres 1/5 3101007 estng m Wechselstromkres a) Ohmscher Wderstand = ˆ ( ω ) ( t) = sn ( ω t) t sn t ˆ ˆ P t = t t = sn ω t Momentane estng 1 cos ( t) ˆ ω = Addtonstheorem:
Mehr4. Musterlösung. Problem 1: Kreuzende Schnitte **
Unverstät Karlsruhe Algorthmentechnk Fakultät für Informatk WS 05/06 ITI Wagner 4. Musterlösung Problem 1: Kreuzende Schntte ** Zwe Schntte (S, V \ S) und (T, V \ T ) n enem Graph G = (V, E) kreuzen sch,
Mehr(Theoretische) Konfidenzintervalle für die beobachteten Werte: Die Standardabweichung des Messfehlers wird Standardmessfehler genannt:
(Theoretsche Konfdenzntervalle für de beobachteten Werte: De Standardabwechung des Messfehlers wrd Standardmessfehler genannt: ( ε ( 1- REL( Mt Hlfe der Tschebyscheff schen Unglechung lassen sch be bekanntem
MehrGrundlagen der Mathematik I Lösungsvorschlag zum 12. Tutoriumsblatt
Mathematsches Insttut der Unverstät München Wntersemester 3/4 Danel Rost Lukas-Faban Moser Grundlagen der Mathematk I Lösungsvorschlag zum. Tutorumsblatt Aufgabe. a De Formel besagt, daß de Summe der umrahmten
MehrKapitel V. Parameter der Verteilungen
Kaptel V Parameter der Vertelungen D. 5.. (Erwartungswert) Als Erwartungswert ener Zufallsvarablen X bezechnet man: E( X ) : Dabe se vorausgesetzt: = = + p falls X dskret f d falls X stetg und = + p
MehrMehrfachregression: Einfluss mehrerer Merkmale auf ein metrisches Merkmal. Designmatrix Bestimmtheitsmaß F-Test T-Test für einzelne Regressoren
Mehrfachregresson: Enfluss mehrerer Merkmale auf en metrsches Merkmal Desgnmatrx Bestmmthetsmaß F-Test T-Test für enzelne Regressoren Mehrfachregresson Bvarat: x b b y + = 0 ˆ k k x b x b x b b y + + +
MehrMaße der zentralen Tendenz (10)
Maße der zentralen Tendenz (10) - De Berechnung der zentralen Tendenz be ategorserten Daten mt offenen Endlassen I - Bespel 1: offene Endlasse Alter x f x f p x p p cum bs 20 1? 3? 6? 6 21-25 2 23 20 460
MehrStatistik und Wahrscheinlichkeitsrechnung
Statstk und Wahrschenlchketsrechnung Statstk und Wahrschenlchketsrechnung 5. Vorlesung Dr. Jochen Köhler.03.0 Statstk und Wahrschenlchketsrechnung Wchtg!!! Vorlesung Do 4.03.0 HCI G3 Übung 5 D 9.03.0 Fnk
MehrModelle, Version Spaces, Lernen
Unverstät Potsdam Insttut ür Inormatk Lehrstuhl Maschnelles Lernen Maschnelles Lernen Modelle Verson Spaces Lernen Tobas Scheer Mchael Brückner Klasskaton Engabe: Instanz Objekt X. Können durch Attrbut-Vektoren
MehrBeispiel: Textklassifikation
Bespel: Textklassfkaton To: ruepng@ls8.cs.undortmund.de Subject: Astonshng Guaranteed XXX Pctures FREE! Gao In the next mnutes you are gong to learn how to get access to totally FREE xxx pctures. Let me
MehrAnhang 9. Bias in ökologischen Studien bei nichtlinearen Risikomodellen
Anhang 9 Bas n ökologschen Studen be nchtlnearen Rskomodellen Bas n ökologschen Studen be nchtlnearen Rskomodellen J.C. Kaser GSF - Insttut für Strahlenschutz, Neuherberg, eutschland ezember 4 Anhang 9
MehrNumerische Methoden II
umersche Methoden II Tm Hoffmann 23. Januar 27 umersche Bespele umersche Methoden zur Approxmaton von Dervatpresen: - Trnomsche Gttermethode - Implzte Fnte Dfferenzen - Explzte Fnte Dfferenzen - Crank-colson
MehrÖkonomische und ökonometrische Evaluation. 1.3 Ökonometrische Grundkonzepte
Ökonomsche und ökonometrsche Evaluaton 90 Emprsche Analyse des Arbetsangebots Zele: Bestmmung von Arbetsangebotselastztäten als Test der theoretschen Modelle Smulaton oder Evaluaton der Wrkungen von Insttutonen
MehrBildverarbeitung Herbstsemester 2012. Bildspeicherung
Bldverarbetung Herbstsemester 2012 Bldspecherung 1 Inhalt Bldformate n der Überscht Coderung m Überblck Huffman-Coderung Datenredukton m Überblck Unterabtastung Skalare Quantserung 2 Lernzele De wchtgsten
MehrEinführung in geostatistische Methoden der Datenauswertung
MUC 2.3 und MC 2.1.1 Praktkum Umweltanalytk II Enführung n geostatstsche Methoden der Datenauswertung Enführung n geostatstsche Methoden der Datenauswertung Zel: Anwendung der geostatstschen Methoden Semvarogrammanalyse
MehrANOVA (Analysis of Variance) Varianzanalyse. Statistik Methoden. Ausgangssituation ANOVA. Ao.Prof.DI.Dr Josef Haas
Ao.Prof.DI.Dr Josef Haas josef.haas@medungraz.at ANOVA (Analyss of Varance) Varanzanalyse Statstk Methoden Verglech von Mttelwerten Ao.Unv.Prof.DI.Dr. Josef Haas josef.haas@medungraz.at Ausgangsstuaton
MehrUniversität Karlsruhe (TH)
Unverstät Karlsruhe (TH) Forschungsunverstät gegründet 825 Parallele Algorthmen I Augaben und Lösungen Pro. Dr. Walter F. Tchy Dr. Vctor Pankratus Davd Meder Augabe () Gegeben se en N-elementger Zahlenvektor
Mehr1.11 Beispielaufgaben
. Bespelaufgaben Darstellung komplexer Zahlen Aufgabe. Man stelle de komplexe Zahl z = +e 5f n algebrascher Form, also als x + y dar. Damt man de Formel für de Dvson anwenden kann, muss zunächst der Nenner
MehrKapitel 8: Kernel-Methoden. Maschinelles Lernen und Neural Computation
Kaptel 8: Kernel-Methoden SS 009 Maschnelles Lernen und Neural Computaton 50 Ausgangsbass: Perceptron Learnng Rule Δw y = Kf = 0Ksonst K"target" = Kf Rosenblatt (96) Input wrd dazugezählt (abgezogen),
MehrKapitel 3: Klassifikation
Ludwg-Maxmlans-Unverstät München Insttut für Informatk Lehr- und Forschungsenhet für Datenbanksysteme Skrpt zur Vorlesung Knowledge Dscovery n Databases m Wntersemester 2010/2011 Kaptel 3: Klassfkaton
MehrSind die nachfolgenden Aussagen richtig oder falsch? (1 Punkt pro korrekter Beantwortung)
LÖSUNG KLAUSUR STATISTIK I Berufsbegletender Studengang Betrebswrtschaftslehre Sommersemester 016 Aufgabentel I: Theore (10 Punkte) Snd de nachfolgenden Aussagen rchtg oder falsch? (1 Punkt pro korrekter
MehrGrundlagen der Technischen Informatik. 12. Übung. Christian Knell Keine Garantie für Korrekt-/Vollständigkeit
Grundlagen der Technschen Informatk 12. Übung Chrstan Knell Kene Garante für Korrekt-/Vollständgket 12. Übungsblatt Themen Aufgabe 1: Aufgabe 2: Aufgabe 3: Komparator Adderer/Subtraherer Mehr-Operanden-Adderer
MehrWeitere NP-vollständige Probleme
Wetere NP-vollständge Probleme Prosemnar Theoretsche Informatk Marten Tlgner December 10, 2014 Wr haben letzte Woche gesehen, dass 3SAT NP-vollständg st. Heute werden wr für enge wetere Probleme n NP zegen,
Mehrbinäre Suchbäume Informatik I 6. Kapitel binäre Suchbäume binäre Suchbäume Rainer Schrader 4. Juni 2008 O(n) im worst-case Wir haben bisher behandelt:
Informatk I 6. Kaptel Raner Schrader Zentrum für Angewandte Informatk Köln 4. Jun 008 Wr haben bsher behandelt: Suchen n Lsten (lnear und verkettet) Suchen mttels Hashfunktonen jewels unter der Annahme,
Mehr1 Finanzmathematik. 1.1 Das Modell. Sei Xt
1.1 Das Modell Se Xt der Pres enes Assets zur Zet t und X = X ) 1 d der Rd +-dmensonale Presprozess. Das Geld kann auch zu dem rskolosen Znssatz r be ener Bank angelegt werden. Der Wert deser Anlage wrd
MehrINTELLIGENTE DATENANALYSE IN MATLAB
INTELLIGENTE DATENANALYSE IN MATLAB Collaboratve Flterng Lteratur Benjamn Marln: Collaboratve Flterng A Machne Learnng Perspectve. Thomas Hofmann: Collaboratve Flterng wth P Prvacy va Factor Analyss. Robert
MehrErwartungswert, Varianz, Standardabweichung
RS 24.2.2005 Erwartungswert_Varanz_.mcd 4) Erwartungswert Erwartungswert, Varanz, Standardabwechung Be jedem Glücksspel nteresseren den Speler vor allem de Gewnnchancen. 1. Bespel: Setzen auf 1. Dutzend
MehrAuswertung von Umfragen und Experimenten. Umgang mit Statistiken in Maturaarbeiten Realisierung der Auswertung mit Excel 07
Auswertung von Umfragen und Expermenten Umgang mt Statstken n Maturaarbeten Realserung der Auswertung mt Excel 07 3.Auflage Dese Broschüre hlft bem Verfassen und Betreuen von Maturaarbeten. De 3.Auflage
MehrKlausur zur Vorlesung Lineare Modelle SS 2006 Diplom, Klausur A
Lneare Modelle m SS 2006, Prof. Dr. W. Zucchn 1 Klausur zur Vorlesung Lneare Modelle SS 2006 Dplom, Klausur A Aufgabe 1 (18 Punkte) a) Welcher grundsätzlche Untersched besteht n der Interpretaton von festen
MehrLineare Regression Teil des Weiterbildungskurses in angewandter Statistik
0 Lneare Regresson Tel des Weterbldungskurses n angewandter Statstk der ETH Zürch Folen Werner Stahel, September 2017 1.1 Bespele zur lnearen Regresson 1 1 Enführung n de statstsche Regressonsrechnung
MehrNetzwerkstrukturen. Entfernung in Kilometer:
Netzwerkstrukturen 1) Nehmen wr an, n enem Neubaugebet soll für 10.000 Haushalte en Telefonnetz nstallert werden. Herzu muss von jedem Haushalt en Kabel zur nächstgelegenen Vermttlungsstelle gezogen werden.
Mehr6 Rechnen mit Zahlen beliebig hoher Stellenzahl 7 Intervall-Arithmetik 8 Umsetzung in aktuellen Prozessoren
Inhalt 4 Realserung elementarer Funktonen Rehenentwcklung Konvergenzverfahren 5 Unkonventonelle Zahlenssteme redundante Zahlenssteme Restklassen-Zahlenssteme logarthmsche Zahlenssteme 6 Rechnen mt Zahlen
MehrLösungen der Aufgaben zu Kapitel 2
Lösungen der Aufgaben zu Kaptel Abschntt 1 Aufgabe 1 Wr benutzen de Potenzrechenregeln, um ene Potenz von mt geradem Eponenten n oder mt ungeradem Eponenten n + 1 we folgt darzustellen: n n und n+1 n n
MehrLehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss Statistik II: Schließende Statistik SS 2007
Lehrstuhl für Emprsche Wrtschaftsforschung und Ökonometre Dr Roland Füss Statstk II: Schleßende Statstk SS 007 5 Mehrdmensonale Zufallsvarablen Be velen Problemstellungen st ene solerte Betrachtung enzelnen
MehrBeschreibende Statistik Mittelwert
Beschrebende Statstk Mttelwert Unter dem arthmetschen Mttel (Mttelwert) x von n Zahlen verstehen wr: x = n = x = n (x +x +...+x n ) Desen Mttelwert untersuchen wr etwas genauer.. Zege für n = 3: (x x )
MehrZweck. Radiometrische Kalibrierung. Traditioneller Ansatz. Kalibrierung ohne Kalibrierkörper
Raometrsche Kalbrerung Tratoneller Ansatz Kalbrerung aus mehreren Blern Behanlung von übersteuerten Blern Zweck Das Antwortverhalten es Systems Kamera Framegrabber st ncht mmer lnear Grauwerte sn ncht
Mehr1.Schularbeit 22.Okt A. A) Berechne ohne TI-92: Beachte: Für die Beispiele 1 und 2 sind alle notwendigen Rechenschritte anzugeben.
1.Schularbet.Okt. 1997 7.A A) Berechne ohne TI-9: Beachte: Für de Bespele 1 und snd alle notwendgen Rechenschrtte anzugeben. 1a) De zu z= a + bkonjugert komplexe Zahl st z= a b. Zege für z 1 = -4 + 3 und
Mehr6. Übung zur Linearen Algebra II
Unverstät Würzburg Mathematsches Insttut Prof. Dr. Peter Müller Dr. Peter Fleschmann SS 2006 30.05.2006 6. Übung zur Lnearen Algebra II Abgabe: Bs Mttwoch, 14.06.2006, 11:00 Uhr n de Brefkästen vor der
MehrUniversität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Graphische Modelle. Niels Landwehr
Unverstät Potsdam Insttut für Informatk Lehrstuhl Maschnelles Lernen Graphsche Modelle els Landwehr Überblck Graphsche Modelle: Syntax und Semantk Graphsche Modelle m Maschnellen Lernen Inferenz n Graphschen
MehrAnalysis I. Vorlesung 17. Logarithmen. R R, x exp x,
Prof. Dr. H. Brenner Osnabrück WS 2013/2014 Analyss I Vorlesung 17 Logarthmen Satz 17.1. De reelle Exponentalfunkton R R, x exp x, st stetg und stftet ene Bjekton zwschen R und R +. Bewes. De Stetgket
MehrMathematik für das Ingenieurstudium
Mathematk für das Ingeneurstudum von Martn Stämpfle, Jürgen Koch 2., aktual. Aufl. Hanser München 2012 Verlag C.H. Beck m Internet: www.beck.de ISBN 978 3 446 43232 1 Zu Inhaltsverzechns schnell und portofre
MehrTechnische Universität München Zentrum Mathematik Diskrete Optimierung: Fallstudien aus der Praxis. Das Cutting Stock-Problem
1 Problem Technsche Unverstät München Zentrum Mathematk Dskrete Optmerung: Fallstuden aus der Praxs Barbara Wlhelm Mchael Rtter Das Cuttng Stock-Problem Ene Paperfabrk produzert Paperrollen der Brete B.
MehrÜbung zu Erwartungswert und Standardabweichung
Aufgabe Übung zu Erwartungswert und Standardabwechung In ener Lottere gewnnen 5 % der Lose 5, 0 % der Lose 0 und 5 % der Lose. En Los kostet 2,50. a)berechnen Se den Erwartungswert für den Gewnn! b)der
MehrDynamisches Programmieren
Marco Thomas - IOI 99 -. Treffen n Bonn - Dynamsches Programmeren - Unverstät Potsdam - 8.02.999 Dynamsches Programmeren 957 R. Bellmann: Dynamc Programmng für math. Optmerungsprobleme Methode für Probleme,.
MehrInformation Retrieval: Grundlagen & Modellierung
HUMBOLDT-UNIVERSITÄT ZU BERLIN Insttut für Informatk Lehrstuhl Wssensmanagement Informaton Retreval: Grundlagen & Modellerung Tobas Scheffer Ulf Brefeld Informaton Retreval Repräsentaton, Specherung, Zugrff
MehrKapitel 5: Klassifikation
Ludwg-Maxmlans-Unverstät München Insttut für Informatk Lehr- und Forschungsenhet für Datenbanksysteme Skrpt zur Vorlesung Knowledge Dscovery n Databases m Sommersemester 2015 Kaptel 5: Klassfkaton Vorlesung:
MehrInformationsgehalt und Komplexität von Zeitreihen
Informatonsgehalt und Komplextät von Zetrehen Motvaton: Vele natürlche ysteme verbrauchen Informaton: der Output st wenger komplex als der Input Thermodynamscher Ansatz: Belebte ysteme erhalten trukturen
Mehr9 Komplexe Zahlen ( ) ( ) 9.1 Ziele. 9.2 Warum braucht man komplexe Zahlen? 9.3 Darstellung von komplexen Zahlen. r 2. j 2. j 1.
Mathematk I / Komplexe Zahlen 9 Komplexe Zahlen 9. Zele Am Ende deses Kaptels hast Du ene Grundvorstellung was komplexe Zahlen snd. Du kannst se grafsch darstellen und enfache Berechnungen durchführen.
Mehr1 Mehrdimensionale Analysis
1 Mehrdmensonale Analyss Bespel: De Gesamtmasse der Erde st ene Funton der Erddchte ρ Erde und des Erdradus r Erde De Gesamtmasse der Erde st dann m Erde = V Erde ρ Erde Das Volumen ener Kugel mt Radus
MehrÜbung zur Vorlesung - Theorien Psychometrischer Tests II
Übung zur Vorlesung - Theoren Psychometrscher Tests II N. Rose 2. Übung (05.02.2009) Agenda Agenda Datenbsp. scalefactors.dat Berechnen der Varanzen der Latent Response Varablen Berechnen der modellmplzerten
Mehr