Evaluierung und Retrievalmaße. Seminar experimentelle Evaluierung In Information Retrieval WS05/06

Größe: px
Ab Seite anzeigen:

Download "Evaluierung und Retrievalmaße. Seminar experimentelle Evaluierung In Information Retrieval WS05/06"

Transkript

1 Evaluierung und Retrievalmaße Seminar experimentelle Evaluierung In Information Retrieval WS05/06

2 Einleitung - Evaluierung Wichtig für IR Zusammenhang zwischen einer Suchanfrage und den zurückgegebenen Resultaten sicherstellen Anhand von Dokument- und Anfragesammelungen durchführen Stochastisches Verfahren

3 Evaluierung eines IR Systems Evaluierung eines Systems Effizienz: Nutzung der Systemressourcen für eine bestimmte Aufgabe Effektivität: Die Unterstützung des Benutzers durch das System bei seinem Aufwendungsproblem

4 Evaluierungstypen Evaluierung von batch-artigem Retrieval Annahme: der Benutzer formuliert eine Anfrage und dann wird die Qualität der Ergebnissen bestimmt. sehr beschränkte Aussagekraft Evaluierung von interaktivem Retrieval realistischer aber viel aufwendiger und komplexer. benötigt z.b. eine Reihe von Versuchspersonen

5 Bewertungsmaße Benutzerstandpunkt bezieht sich auf seine Sicht und betrachtet oft nur Bruchteil des Ergebnisses. Systemstandpunkt bewertet dagegen die Distribution global Benutzerorientierte und systemorientierte Maße

6 Relevanz Der Kern der Evaluierung: Relevanz r: D Q R Relevanz: aber nur ein subjektiver Begriff Relevanzurteil ist schlecht ausführbar: umstritten, ob ein Dokument relevant ist oder nicht Abhängig von der Suche, der Dokumentmenge und der Umgebung Lösung: User Profile

7 Standardmaße: Precision & Recall Precision: die Wahrscheinlichkeit, dass zufällig ein ausgewähltes gefundenes Dokument relevant ist. p = #retr. Rel. Dok. / #retr. Dok. = P(doc.relevant doc.retrieved) Recall: die Wahrscheinlichkeit, dass zufällig ein ausgewähltes relevantes Dokument gefunden wird. r = #retr. Rel. Dok. / #rel. Dok = P(doc.retrieved doc.relevant) Optimal wäre Recall = Precision = 1

8 Bsp.: Recall Precision Graph R q = {d3, d5, d9, d25, d39, d44, d56, d71, d89, d123} Precision 120% 100% 80% 60% 40% 20% 0% 0% 10% 20% 30% Recall 40% 50% 60% 70% 80% 90% 100% Ranking for query q: 1. d123* 2. d84 3. d56* 4. d6 5. d8 6. d9* 7. d d d d25* 11. d d d d d3*

9 Retrievalmaße bei mehrfachen Suchen Man könnte einfach den Durchschnitt berechnen, wobei n: die Anzahl der benutzten Anfragen P(r) ist die durchschnittliche Precision beim Recall Level r. P i (r): die Precision beim Recall Level r für die i- te Anfrage. P ( r ) = n i = 1 Pi ( r n )

10 Der Vergleich von Retrievalfunktionen bei mehrfachen Suchen (Bsp.) Der erste Retrievalalgorithmus hat beim niedrigen Recall eine höhere Precision. Der zweite Retrievalalgorithmus hat beim höheren Recall eine höhere Precision Precision Recall

11 Mean Average Precision (MAP) Das am häufigsten verwendete Zusammenfassungsmaß von einem Retrieval Ranking Beinhaltet sowohl Recall- als auch Precisionorientierte Aspekte und ist sehr sensibel zu dem gesamten Ranking Die Interpretation ist aber weniger übersichtlicher als die anderen Maße.

12 MAP (cont.) Wie berechnet man MAP? MAP ist der Mittelwert der durchschnittlichen Precision. Wir berechnen die durchschnittliche Precision für jede Anfrage und dann den Mittelwert von AP über alle Anfragen. Makroaverage Mikroaverage AveP = N r = 1 ( P( r) rel( r)) # rel

13 R-Precision R-Precision berechnet die Precision an der R-ten Position im Ranking. R: die Anzahl der relevanten Dokumenten für die aktuelle Anfrage. R-Precision ist ein sehr guter Parameter für die Betrachtung des Verhaltens eines Algorithmus für jede individuelle Anfrage in einem Experiment. Außerdem kann man auch die durchschnittliche R-Precision über alle Anfragen berechnen.

14 Precision Histogramme Dienen zu sehr schnellem Vergleich zweier Retrievalalgorithmen. Verfahren: Bei mehrfachen Suchen berechnet man die jeweilige R-Precision und dann die Differenz und lässt sie in einem Histogramm darstellen.

15 Precision Histogramme (cont.) Sei RP A (i) und RP B (i) die R-Precision Werte von den Retrievalalgorithmen A und B für die i-te Anfrage Die Differenz definiert man als RP A/B (i) = RP A (i) RP B (i).

16 Bsp.: Precision Histogramme Ein Precision-Histogramm für zehn hypothetische Anfragen: R-Precision A/B Query Number

17 Andere Evaluierungsmaße

18 F-Maß Grund: es ist sehr schwer, Retrievalfunktion zu vergleichen Zusammenführung von Recall und Precision auf eine einzige Zahl F ( β 2 β = 2 β + 1) p + p r r β gibt die relative Wichtung von dem Recall an

19 Mittelwertbildung Um aussagenkräftige Ergebnisse zu bekommen, müssen die Precision- und Recall-Werte über mehrere Anfragen ermittelt werden. Makrobewertung Mikrobewertung p M p = 1 N N N i i= 1 GEFi i= 1 µ = N REL i= 1 REL i GEF GEF GEF Welcher Unterschied? i i i

20 Benutzerorientierte Evaluierungsmaße In den o.g. Evaluierungsmaßen ist die Menge der relevanten Dokumente eine feste Menge und auch unabhängig von den Benutzern. Relevanz ist ein subjektiver Begriff. Benutzerorientierte Evaluierungsmaße

21 Benutzerorientierte Evaluierungsmaße Coverage: (Von den Benutzern bekannte Dok.) /(Retrieved relevante Dok.) Novelty: (Von den Benutzern unbekannte Dok.) /(Retrieved relevante Dok.)

22 novelty = Ru Ru + Rk coverage = Rk U Relevant Docs R Answer Set A Relevant Docs known to the user U Relevant Docs known to the user which were retrieved Rk Relevant Docs previous unknown to the user which were retrieved Ru

23 Referenzen: Ricardo Baeza-Yates, Berthier Ribiero-Neto and Berthier Ribeiro-Neto, 1999, Modern Information Retrieval Addison-Wesley P73 84 Skript von Information Retrieval (SS05) Internet Seiten: IR Evaluation (lecture 9) ation.pdf Wikipedia

24 Vielen Dank für die Aufmerksamkeit!

2 Evaluierung von Retrievalsystemen

2 Evaluierung von Retrievalsystemen 2. Evaluierung von Retrievalsystemen Relevanz 2 Evaluierung von Retrievalsystemen Die Evaluierung von Verfahren und Systemen spielt im IR eine wichtige Rolle. Gemäß der Richtlinien für IR der GI gilt es,...

Mehr

Internet-Suchmaschinen Evaluierung. Vorüberlegungen. Perspektiven auf IR-Systeme. Fragestellungen an die Evaluierung

Internet-Suchmaschinen Evaluierung. Vorüberlegungen. Perspektiven auf IR-Systeme. Fragestellungen an die Evaluierung nternet-suchmaschinen Evaluierung Vorüberlegungen Norbert Fuhr Warum evaluieren? Anforderungen an Evaluierungen Qualitätskriterien 1 / 83 Perspektiven auf R-Systeme Fragestellungen an die Evaluierung Benutzer

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

Vorlesung Information Retrieval Wintersemester 04/05

Vorlesung Information Retrieval Wintersemester 04/05 Vorlesung Information Retrieval Wintersemester 04/05 14. Oktober 2004 Institut für Informatik III Universität Bonn Tel. 02 28 / 73-45 31 Fax 02 28 / 73-43 82 jw@informatik.uni-bonn.de 1 Themenübersicht

Mehr

Prototypische Komponenten eines Information Retrieval Systems: Vektormodell

Prototypische Komponenten eines Information Retrieval Systems: Vektormodell Prototypische Komponenten eines Information Retrieval Systems: Vektormodell Implementierung & Präsentation: Stefan Schmidt (Uni Mannheim) Kontakt: powder@gmx.de Seminar: Information Retrieval WS2002/2003

Mehr

Digitale Bibliotheken. Informationssuche, Zugriff und Verbreitung

Digitale Bibliotheken. Informationssuche, Zugriff und Verbreitung Digitale Bibliotheken Informationssuche, Zugriff und Verbreitung Gliederung Einführung Informationssuche Problemstellung Boolesche Suche Vektorraumsuche Stemming Multilinguale Suche Fuzzy Suche Semantische

Mehr

Darstellung der Methodik in TREC und TREC-basierte Evaluierung

Darstellung der Methodik in TREC und TREC-basierte Evaluierung Darstellung der Methodik in TREC und TREC-basierte Evaluierung Martin Jansson Philip Korte Lukas Wozniak 13. November 2005 Jansson, Korte, Wozniak 1 Inhaltsverzeichnis Was ist TREC? Die Ziele der Konferenz

Mehr

Anfrage Erweiterung 03.11.2011 Jan Schrader

Anfrage Erweiterung 03.11.2011 Jan Schrader Anfrage Erweiterung 03.11.2011 Jan Schrader Vocabulary Mismatch Problem Anfrage und Dokument passen nicht zusammen obwohl Dokument zur Anfrage relevant Grund: Synonymproblem verschiedene Menschen benennen

Mehr

User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten?

User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten? User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten? Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg dirk.lewandowski@haw-hamburg.de

Mehr

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp

Datenanalyse. (PHY231) Herbstsemester Olaf Steinkamp Datenanalyse (PHY31) Herbstsemester 015 Olaf Steinkamp 36-J- olafs@physik.uzh.ch 044 63 55763 Einführung, Messunsicherheiten, Darstellung von Messdaten Grundbegriffe der Wahrscheinlichkeitsrechnung und

Mehr

Anleitung: Standardabweichung

Anleitung: Standardabweichung Anleitung: Standardabweichung So kann man mit dem V200 Erwartungswert und Varianz bzw. Standardabweichung bei Binomialverteilungen für bestimmte Werte von n, aber für allgemeines p nach der allgemeinen

Mehr

Maschinelle Übersetzung

Maschinelle Übersetzung Hauptstudiumsprojekt SoSe 07 Maschinelle Übersetzung Walther v. Hahn, Cristina Vertan {vhahn,vertan}@informatik.uni-hamburg.de Wozu dient ein Projekt? Projekte im Umfang von 6 SWS dienen der Bearbeitung

Mehr

Mathe III. Garance PARIS. Mathematische Grundlagen III. Evaluation. 16. Juli /25

Mathe III. Garance PARIS. Mathematische Grundlagen III. Evaluation. 16. Juli /25 Mathematische Grundlagen III Evaluation 16 Juli 2011 1/25 Training Set und Test Set Ein fairer Test gibt an, wie gut das Modell im Einsatz ist Resubstitution: Evaluation auf den Trainingsdaten Resubstitution

Mehr

Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de

Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de Joachim Griesbaum 1 / Marc Rittberger 2 / Bernard Bekavac 1 1 Universität Konstanz Fach D 87 D-78457 Konstanz 2 Heinrich-Heine-Universität

Mehr

Dokumenten-Clustering. Norbert Fuhr

Dokumenten-Clustering. Norbert Fuhr Dokumenten-Clustering Norbert Fuhr Dokumenten-Clustering (Dokumenten-)Cluster: Menge von ähnlichen Dokumenten Ausgangspunkt Cluster-Hypothese : die Ähnlichkeit der relevanten Dokumente untereinander und

Mehr

Datenbank- Recherche. SS 2015 8. Veranstaltung 18. Juni 2015. Philipp Schaer - philipp.schaer@gesis.org Philipp Mayr - philipp.mayr@gesis.

Datenbank- Recherche. SS 2015 8. Veranstaltung 18. Juni 2015. Philipp Schaer - philipp.schaer@gesis.org Philipp Mayr - philipp.mayr@gesis. Datenbank- Recherche SS 2015 8. Veranstaltung 18. Juni 2015 Philipp Schaer - philipp.schaer@gesis.org Philipp Mayr - philipp.mayr@gesis.org GESIS Leibniz- InsFtut für SozialwissenschaJen 2 Themen der heu2gen

Mehr

8. Konfidenzintervalle und Hypothesentests

8. Konfidenzintervalle und Hypothesentests 8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars

Mehr

Kapitel 5: Einfaktorielle Varianzanalyse

Kapitel 5: Einfaktorielle Varianzanalyse Rasch, Friese, Hofmann & Naumann (006). Quantitative Methoden. Band (. Auflage). Heidelberg: Springer. Kapitel 5: Einfaktorielle Varianzanalyse Berechnen der Teststärke a priori bzw. Stichprobenumfangsplanung

Mehr

S k u l p t u r e n. B i l d e r. T e x t e. H e l g a S i m m e r l e b i s B a n d 2

S k u l p t u r e n. B i l d e r. T e x t e. H e l g a S i m m e r l e b i s B a n d 2 S k u l p t u r e n B i l d e r T e x t e H e l g a S i m m e r l e 1 9 9 3 b i s 1 9 9 5 B a n d 2 S k u l p t u r e n H e l g a S i m m e r l e B i l d e r H e l g a S i m m e r l e Te x t e H e l g

Mehr

INEX. INitiative for the Evaluation of XML Retrieval. Sebastian Rassmann, Christian Michele

INEX. INitiative for the Evaluation of XML Retrieval. Sebastian Rassmann, Christian Michele INEX INitiative for the Evaluation of XML Retrieval Was ist INEX? 2002 gestartete Evaluierungsinitiative Evaluierung von Retrievalmethoden für XML Dokumente Berücksichtigt die hierarchische Dokumentstruktur

Mehr

Auswertung zu "Projektmanagement B, SS08"

Auswertung zu Projektmanagement B, SS08 Auswertung zu "Projektmanagement B, SS08" Liebe Dozentin, lieber Dozent, anbei erhalten Sie die Ergebnisse der Evaluation Ihres Seminars. Zu dieser Veranstaltung wurden 30 Bewertungen (bei 30 TeilnehmerInnen)

Mehr

Mathematische und statistische Methoden II

Mathematische und statistische Methoden II Statistik & Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte

Mehr

Bachelor BEE Statistik Übung: Blatt 1 Ostfalia - Hochschule für angewandte Wissenschaften Fakultät Versorgungstechnik Aufgabe (1.1): Gegeben sei die folgende Messreihe: Nr. ph-werte 1-10 6.4 6.3 6.7 6.5

Mehr

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie!

b) Bestimmen Sie die Varianz der beiden Schätzer. c) Ist ein oder sind beide Schätzer konsistent? Begründen Sie! Aufgabe 1 (3 + 3 + 2 Punkte) Ein Landwirt möchte das durchschnittliche Gewicht von einjährigen Ferkeln bestimmen lassen. Dies möchte er aus seinem diesjährigen Bestand an n Tieren schätzen. Er kann dies

Mehr

2002/2004 2050 2050 Veränderungen gegenüber 2002/2004 Deutschland Ost und West Basisanahme Basisanahme Annahme hoher Anstieg Annahme hoher Anstieg Mittelwert in % pro Jahr Männer 20,0 25,3 27,2 5,3 7,2

Mehr

Prof. Dr. Christoph Karg Hochschule Aalen. Klausur zur Vorlesung Wahrscheinlichkeitstheorie und Statistik. Sommersemester 2016

Prof. Dr. Christoph Karg Hochschule Aalen. Klausur zur Vorlesung Wahrscheinlichkeitstheorie und Statistik. Sommersemester 2016 Prof. Dr. Christoph Karg 5.7.2016 Hochschule Aalen Klausur zur Vorlesung Wahrscheinlichkeitstheorie und Statistik Sommersemester 2016 Name: Unterschrift: Klausurergebnis Aufgabe 1 (15 Punkte) Aufgabe 3

Mehr

Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14

Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14 Universität Augsburg, Institut für Informatik Wintersemester 2013/14 Prof. Dr. W. Kießling 10. Oktober 2013 F. Wenzel, D. Köppl Suchmaschinen Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14

Mehr

Hypothesentests mit SPSS. Beispiel für einen t-test

Hypothesentests mit SPSS. Beispiel für einen t-test Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle

Mehr

Bayes Klassifikatoren M E T H O D E N D E S D A T A M I N I N G F A B I A N G R E U E L

Bayes Klassifikatoren M E T H O D E N D E S D A T A M I N I N G F A B I A N G R E U E L Bayes Klassifikatoren M E T H O D E N D E S D A T A M I N I N G F A B I A N G R E U E L Inhalt Grundlagen aus der Wahrscheinlichkeitsrechnung Hypothesenwahl Optimale Bayes Klassifikator Naiver Bayes Klassifikator

Mehr

AutoSPARQL. Let Users Query Your Knowledge Base

AutoSPARQL. Let Users Query Your Knowledge Base AutoSPARQL Let Users Query Your Knowledge Base Christian Olczak Seminar aus maschinellem Lernen WS 11/12 Fachgebiet Knowledge Engineering Dr. Heiko Paulheim / Frederik Janssen 07.02.2012 Fachbereich Informatik

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übungen für die kompetenzbasierte Abschlussprüfung 1. 60 Äpfel wurden gewogen und die Ergebnisse in einem Boxplot-Diagramm dargestellt. Ergänzen Sie die folgenden

Mehr

Google s PageRank. Eine Anwendung von Matrizen und Markovketten. Vortrag im Rahmen der Lehrerfortbildung an der TU Clausthal 23.

Google s PageRank. Eine Anwendung von Matrizen und Markovketten. Vortrag im Rahmen der Lehrerfortbildung an der TU Clausthal 23. Google s PageRank Eine Anwendung von Matrizen und Markovketten Vortrag im Rahmen der Lehrerfortbildung an der TU Clausthal 23. September 2009 Dr. Werner Sandmann Institut für Mathematik Technische Universität

Mehr

Übungsbuch Statistik für Dummies

Übungsbuch Statistik für Dummies beborah Rumseif Übungsbuch Statistik für Dummies WILEY- VCH WILEY-VCH Verlag GmbH & Co. KGaA Inhaltsverzeichnis Über die Autorin 8 Über den Übersetzer 8 Einführung 15 Über dieses Buch 15 Törichte Annahmen

Mehr

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. DWH Projekte. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing DWH Projekte Ulf Leser Wissensmanagement in der Bioinformatik Inhalt DWH Projekte Spezifika Die kritischen Punkte Warum scheitern DWH Projekte? Ulf Leser: Data Warehousing, Vorlesung,

Mehr

Übungsaufgaben mit Lösungsvorschlägen

Übungsaufgaben mit Lösungsvorschlägen Otto-Friedrich-Universität Bamberg Lehrstuhl für Medieninformatik Prof. Dr. Andreas Henrich Dipl. Wirtsch.Inf. Daniel Blank Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie

Mehr

Software-Metriken. Wolfgang Globke. Seminar Moderne Softwareentwicklung SS 2005. Software-Metriken. Wolfgang Globke. Metriken und Qualitätsmodelle

Software-Metriken. Wolfgang Globke. Seminar Moderne Softwareentwicklung SS 2005. Software-Metriken. Wolfgang Globke. Metriken und Qualitätsmodelle Software- und smodelle Software- Klassische Objektorientierte Seminar Moderne Softwareentwicklung SS 2005 Gliederung Software- und smodelle 1 und smodelle Klassische Objektorientierte 2 Klassische Objektorientierte

Mehr

Erfolgreich suchen im Internet

Erfolgreich suchen im Internet Erfolgreich suchen im Internet Steffen-Peter Ballstaedt 05.10.2015 Statistik Weltweit: etwa 1 Milliarde Websites BRD: 15 Millionen Websites Das Internet verdoppelt sich alle 5,32 Jahre Die häufigste Aktivität

Mehr

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong

Friedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong Part-of-Speech Tagging Friedrich-Alexander-Universität Professur für Computerlinguistik Nguyen Ai Huong 15.12.2011 Part-of-speech tagging Bestimmung von Wortform (part of speech) für jedes Wort in einem

Mehr

Mining top-k frequent itemsets from data streams

Mining top-k frequent itemsets from data streams Seminar: Maschinelles Lernen Mining top-k frequent itemsets from data streams R.C.-W. Wong A.W.-C. Fu 1 Gliederung 1. Einleitung 2. Chernoff-basierter Algorithmus 3. top-k lossy counting Algorithmus 4.

Mehr

Ein möglicher Unterrichtsgang

Ein möglicher Unterrichtsgang Ein möglicher Unterrichtsgang. Wiederholung: Bernoulli Experiment und Binomialverteilung Da der sichere Umgang mit der Binomialverteilung, auch der Umgang mit dem GTR und den Diagrammen, eine notwendige

Mehr

Grenzen für x -s-regelkarten

Grenzen für x -s-regelkarten Normalverteilte Fertigung: Stichproben aus der Fertigung: σ σ Eine normalverteilte Fertigung hat den Mittelwert µ und die Standardabweichung σ. Stichproben aus der Fertigung haben zufällig abweichende

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

Mathematik: LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 12. Erwartungswert, Varianz und Standardabweichung

Mathematik: LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 12. Erwartungswert, Varianz und Standardabweichung Mathematik: LehrerInnenteam Arbeitsblatt 7-7. Semester ARBEITSBLATT Erwartungswert, Varianz und Standardabweichung Die Begriffe Varianz und Standardabweichung sind uns bereits aus der Statistik bekannt

Mehr

P2P - Projekt. 1. Die gleiche Aufgabe zwei Herangehensweisen 2. Voraussetzungen. 3. Automatische Semantische Konvergenz

P2P - Projekt. 1. Die gleiche Aufgabe zwei Herangehensweisen 2. Voraussetzungen. 3. Automatische Semantische Konvergenz P2P - Projekt 1. Die gleiche Aufgabe zwei Herangehensweisen 2. Voraussetzungen 1. Natürlicher Suchalgorithmus 2. Small Worlds 3. Automatische Semantische Konvergenz 1. Netzwerkerstellung 2. Suche 1. Die

Mehr

Übungsaufgaben. Aufgabe 1 Internetsuchmaschinen. Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie Karlsruhe

Übungsaufgaben. Aufgabe 1 Internetsuchmaschinen. Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie Karlsruhe Otto-Friedrich-Universität Bamberg Lehrstuhl für Medieninformatik Prof. Dr. Andreas Henrich Dipl. Wirtsch.Inf. Daniel Blank Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie

Mehr

Bildsegmentierung mit Level Sets

Bildsegmentierung mit Level Sets Bildsegmentierung mit Level Sets Seminar Bildsegmentierung und Computer Vision im Wintersemester 2005 Übersicht 1 Übersicht 2 Definitionen Ausbreitungsgeschwindigkeit Übersicht 3 Inter-Frame-basierte Modellierung

Mehr

1 Einleitung. 1.1 Was ist Ökonometrie und warum sollte man etwas darüber lernen?

1 Einleitung. 1.1 Was ist Ökonometrie und warum sollte man etwas darüber lernen? 1 Einleitung 1.1 Was ist Ökonometrie und warum sollte man etwas darüber lernen? Idee der Ökonometrie: Mithilfe von Daten und statistischen Methoden Zusammenhänge zwischen verschiedenen Größen messen. Lehrstuhl

Mehr

Hintergrund: Web Search & Ranking in Websuchmaschinen

Hintergrund: Web Search & Ranking in Websuchmaschinen Hintergrund: Web Search & Ranking in Websuchmaschinen Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg dirk.lewandowski@haw-hamburg.de @Dirk_Lew LibRank-Abschlussworkshop Hamburg,

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.

Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining. Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen

Mehr

5-8. Capital Asset Pricing Model (CAPM) I

5-8. Capital Asset Pricing Model (CAPM) I 81 5-8. Capital Asset Pricing Model (CAPM) I Wertpapierlinienfunktion: E(R i ) = µ i = R F + [E(R M ) - R F ] β i Risikoadjustierte Renditeerwartung: E(R F ) = µ F = 0,045 + (0,09) 1,8 = 20,7 % Die Empfehlung

Mehr

Die treffende Auswahl anbieten: Im Internet (Referat 3a)

Die treffende Auswahl anbieten: Im Internet (Referat 3a) www.zeix.com Die treffende Auswahl anbieten: Im Internet (Referat 3a) Fachtagung: Suchfunktionen im Web Zürich, 26. Oktober 2006 Jürg Stuker, namics Gregor Urech, Zeix Bern, Frankfurt, Hamburg, München,

Mehr

Prof. Dr. Günter Hellmig. Aufgabenskript Induktive Statistik

Prof. Dr. Günter Hellmig. Aufgabenskript Induktive Statistik rof. Dr. Günter Hellmig Aufgabenskript Induktive Statistik Inhalt:.Kombinatorik: Variation und Kombination, jeweils ohne Wiederholung 2.Rechnen mit Wahrscheinlichkeiten: Additions- und Multiplikationssätze

Mehr

Online-Recherche: Web-Recherche WS 2015/2016 7. Veranstaltung 3. Dezember 2015

Online-Recherche: Web-Recherche WS 2015/2016 7. Veranstaltung 3. Dezember 2015 Online-Recherche: Web-Recherche WS 2015/2016 7. Veranstaltung 3. Dezember 2015 Philipp Schaer - philipp.schaer@gesis.org Philipp Mayr - philipp.mayr@gesis.org GESIS Leibniz-InsJtut für SozialwissenschaNen

Mehr

Jost Reinecke. 7. Juni 2005

Jost Reinecke. 7. Juni 2005 Universität Bielefeld 7. Juni 2005 Testtheorie Test für unabhängige Stichproben Test für abhängige Stichproben Testtheorie Die Testtheorie beinhaltet eine Reihe von Testverfahren, die sich mit der Überprüfung

Mehr

Butz, Krüger: Mensch-Maschine-Interaktion, Kapitel 13 - Evaluation. Mensch-Maschine-Interaktion

Butz, Krüger: Mensch-Maschine-Interaktion, Kapitel 13 - Evaluation. Mensch-Maschine-Interaktion Folie 1 Mensch-Maschine-Interaktion Folie 2 Kapitel 13 - Evaluation Arten der Evaluation Formativ vs. Summativ Quantitativ vs. Qualitativ Analytisch vs. Empirisch Analytische Methoden Cognitive Walkthrough

Mehr

Hypothesentest, ein einfacher Zugang mit Würfeln

Hypothesentest, ein einfacher Zugang mit Würfeln R. Brinkmann http://brinkmann-du.de Seite 4..4 ypothesentest, ein einfacher Zugang mit Würfeln Von einem Laplace- Würfel ist bekannt, dass bei einmaligem Wurf jede einzelne der Zahlen mit der Wahrscheinlichkeit

Mehr

Textbasierte Suche mit Hilfe von Anfrageerweiterungen - technische Realisierung und erste Erfahrungen

Textbasierte Suche mit Hilfe von Anfrageerweiterungen - technische Realisierung und erste Erfahrungen Textbasierte Suche mit Hilfe von Anfrageerweiterungen - technische Realisierung und erste Erfahrungen Dr. Thomas Böhme thomas.boehme@tu-ilmenau.de Dipl.-Inf. Mario Kubek mario.kubek@tu-ilmenau.de Dipl.-Inf.

Mehr

Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme

Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Studienprojekt Invisible Web (Dipl.-Inform. Gudrun Fischer - WS 2003/04) Blockseminar

Mehr

Praktikum Information Retrieval Wochen 12: Suchmaschine

Praktikum Information Retrieval Wochen 12: Suchmaschine Praktikum Information Retrieval Wochen 12: Suchmaschine Melikka Khosh-Niat Matthias Jordan 23. Mai 3. Juni 2011 Lösungen: Upload bis 3. Juni 2011 Aktuelle Informationen, Ansprechpartner, Material und Upload

Mehr

Suchmaschinen und das Web 2.0

Suchmaschinen und das Web 2.0 Suchmaschinen und das Web 2.0 Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Agenda Rechercheverhalten der Suchmaschinennutzer Qualität der Web-Suchmaschinen Web 2.0 Dienste für die Suche Fazit

Mehr

Überschrift. Titel Prognosemethoden

Überschrift. Titel Prognosemethoden Überschrift Prognosemethoden Überschrift Inhalt 1. Einleitung 2. Subjektive Planzahlenbestimmung 3. Extrapolierende Verfahren 3.1 Trendanalyse 3.2 Berücksichtigung von Zyklus und Saison 4. Kausale Prognosen

Mehr

Auswertung zur Veranstaltung Class and Power in Text: A Systematic Functional Analysis

Auswertung zur Veranstaltung Class and Power in Text: A Systematic Functional Analysis Auswertung zur Veranstaltung Class and Power in Text: A Systematic Functional Analysis Liebe Dozentin, lieber Dozent, anbei erhalten Sie die Ergebnisse der Evaluation Ihrer Lehrveranstaltung. Zu dieser

Mehr

Proseminar Einführung in die Mathematik 1 WS 2010/11 2. Dezember 2010 Lösungen

Proseminar Einführung in die Mathematik 1 WS 2010/11 2. Dezember 2010 Lösungen Proseminar Einführung in die Mathematik 1 WS 1/11. Deember 1 Lösungen 46) Wie kann man nach Wahl eines Nullpunktes die Zeichenebene in natürlicher Weise als Vektorraum betrachten? Skriptum Kapitel 4, Par.

Mehr

Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten

Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten Vortrag anlässlich der ODOK 2007 (20. September 2007, Graz) Joachim Pfister Schweizerisches

Mehr

6.6 Vorlesung: Von OLAP zu Mining

6.6 Vorlesung: Von OLAP zu Mining 6.6 Vorlesung: Von OLAP zu Mining Definition des Begriffs Data Mining. Wichtige Data Mining-Problemstellungen, Zusammenhang zu Data Warehousing,. OHO - 1 Definition Data Mining Menge von Techniken zum

Mehr

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 17.04.2015 Entscheidungsprobleme beim Textmining

Mehr

1. Vorlesung,

1. Vorlesung, 1. Vorlesung, 16.10.2006 Einführung und Motivation, Beispiel Information versus Daten Grundlegende Konzepte Aufgaben des Anwenders Logische Sicht auf Dokumente Dokumentvorverarbeitung Dokumentsuche mit

Mehr

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk

Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC. Referenten: Linda Gräfe & Konstantin Falk Schätzverfahren ML vs. REML & Modellbeurteilung mittels Devianz, AIC und BIC Referenten: Linda Gräfe & Konstantin Falk 1 Agenda Schätzverfahren ML REML Beispiel in SPSS Modellbeurteilung Devianz AIC BIC

Mehr

1 Ein Beispiel: Das Berechnen eines Schulzeugnisses

1 Ein Beispiel: Das Berechnen eines Schulzeugnisses Funktionen in Excel 1 Ein Beispiel: Das Berechnen eines Schulzeugnisses Jim hat die folgenden Noten im 1. Trimester: Fach Prüfung 1 Prüfung 2 Prüfung 3 Englisch 35 38 43 Deutsch 44 42 48 Französisch 28

Mehr

Seminar Text- und Datamining Datamining-Grundlagen

Seminar Text- und Datamining Datamining-Grundlagen Seminar Text- und Datamining Datamining-Grundlagen Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 23.05.2013 Gliederung 1 Klassifikationsprobleme 2 Evaluation

Mehr

4. Nicht-Probabilistische Retrievalmodelle

4. Nicht-Probabilistische Retrievalmodelle 4. Nicht-Probabilistische Retrievalmodelle 1 4. Nicht-Probabilistische Retrievalmodelle Norbert Fuhr 4. Nicht-Probabilistische Retrievalmodelle 2 Rahmenarchitektur für IR-Systeme Evaluierung Informations

Mehr

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren. 1. Zweimaliges Ziehen aus einer Urne (ohne Zurücklegen)

Dr. Jürgen Senger INDUKTIVE STATISTIK. Wahrscheinlichkeitstheorie, Schätz- und Testverfahren. 1. Zweimaliges Ziehen aus einer Urne (ohne Zurücklegen) Dr. Jürgen Senger INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren ÜUNG. - LÖSUNGEN. Zweimaliges Ziehen aus einer Urne (ohne Zurücklegen Die Urne enthält 4 weiße und 8 rote Kugeln.

Mehr

Seminar über aktuelle Forschungsthemen in der Algorithmik, Dozent Prof. Dr. Alt;

Seminar über aktuelle Forschungsthemen in der Algorithmik, Dozent Prof. Dr. Alt; Seminar über aktuelle Forschungsthemen in der Algorithmik, Dozent Prof. Dr. Alt Referent Matthias Rost 1 Einleitung Definitionen Maximaler Dynamischer Fluss Algorithmus von Ford-Fulkerson Techniken zur

Mehr

Das lineare Gleichungssystem

Das lineare Gleichungssystem 26/27 Grundwissen Analytische Geometrie I m1 as lineare Gleichungssystem Man startet zuerst mit der Betrachtung eines linearen Gleichungssystem mit zwei Unbekannten.(Genaueres siehe Skript) Einführung

Mehr

Gleichstromnetzwerke

Gleichstromnetzwerke Gleichstromnetzwerke 1. Durchführung In diesem Experiment werden Spannungen und Ströme, eines auf einem Steckbrett aufgebauten Gleichstromnetzwerks, gemessen und mit den Berechnungen laut den Kirchhoff-Regelen

Mehr

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval

Kapitel IR:I. I. Einführung. Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval Kapitel IR:I I. Einführung Retrieval-Szenarien Begriffsbildung Einordnung Information Retrieval IR:I-1 Introduction STEIN 2005-2010 Retrieval-Szenarien Liefere Dokumente, die die Terme «Information» und

Mehr

G+J Werbewirkungspanel und Dialego präsentieren: Semantic Mining

G+J Werbewirkungspanel und Dialego präsentieren: Semantic Mining G+J Werbewirkungspanel und Dialego präsentieren: Semantic Mining Frank Vogel / Media-Forschung- und -Service Hamburg Juli 2009 G+J Werbewirkungspanel Semantic Mining G+J Werbewirkungspanel goes Semantic

Mehr

9. Eine einfache Warteschlangen-Simulation.

9. Eine einfache Warteschlangen-Simulation. SS 2006 Arbeitsblatt 4 / S. 1 von 9 9. Eine einfache Warteschlangen-Simulation. A) Allgemeine Bemerkungen. Die Warteschlange aus 8., wie auch solche mit nur endlich grossem Warteraum, können auf einfache

Mehr

Grundlagen der Programmierung

Grundlagen der Programmierung Grundlagen der Programmierung Dr. Tom Kamphans 1. Vorlesung 12.10.2016 1 Organisatorisches Vorlesung: Mittwochs 14:00 15:30, Raum F 201 Übung: Mittwochs 15:45 19:00, Raum F 225 Übung: alle zwei Wochen

Mehr

Datei Erweiterungen Anzeigen!

Datei Erweiterungen Anzeigen! Datei Erweiterungen Anzeigen! Einleitung Bei einem PC werden die Dateierweiterungen sowie einige Dateien normal nicht angezeigt. Grund: Es gibt sehr viele Dateien die für das System ganz wichtig sind.

Mehr

Statistische Kenngrößen. Histogramm. Grundlagen zur statistischen Signalverarbeitung. Statistische Beschreibung von Audio

Statistische Kenngrößen. Histogramm. Grundlagen zur statistischen Signalverarbeitung. Statistische Beschreibung von Audio 8.3.6 Statistische Kenngrößen Grundlagen zur statistischen Signalverarbeitung Dr. Detlev Marpe Fraunhofer Institut für achrichtentechnik HHI Histogramm Wahrscheinlichkeitsdichteverteilung Mittelwert µ

Mehr

(query by image content)

(query by image content) Proseminar Multimedia Information-Retrieval-Systeme (query by image content) Das QBIC Projekt 1. Einleitung 1.1 Was ist QBIC 1.2 Wo wird es verwendet 2. QBIC im Detail 2.1 technische Grundlagen 2.2 Aufbau

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Duplikatfilterung und Sampling von Webseiten

Duplikatfilterung und Sampling von Webseiten Duplikatfilterung und Sampling von Webseiten Seminar Suchmaschinen, Wintersemester 2007/2008 Martin Sauerhoff Lehrstuhl 2, Universität Dortmund Übersicht 1. Duplikatfilterung: 1.1 Gleichheitstest mit Fingerabdrücken

Mehr

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren)

4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4. Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) 4.1. Einführung Schätzen unbekannter Parameter im Modell, z.b. Wahrscheinlichkeiten p i (Anteile in der Gesamtmenge), Erwartungswerte

Mehr

Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Waldinventur und Fernerkundung

Prof. Dr. Christoph Kleinn Institut für Waldinventur und Waldwachstum Arbeitsbereich Waldinventur und Fernerkundung Systematische Stichprobe Rel. große Gruppe von Stichprobenverfahren. Allgemeines Merkmal: es existiert ein festes, systematisches Muster bei der Auswahl. Wie passt das zur allgemeinen Forderung nach Randomisierung

Mehr

Simulation von Zufallsvariablen und Punktprozessen

Simulation von Zufallsvariablen und Punktprozessen Simulation von Zufallsvariablen und Punktprozessen 09.11.2009 Inhaltsverzeichnis 1 Einleitung 2 Pseudozufallszahlen 3 Punktprozesse Zufallszahlen Definition (Duden): Eine Zufallszahl ist eine Zahl, die

Mehr

Mehrebenenanalyse. Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh

Mehrebenenanalyse. Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh Mehrebenenanalyse Seminar: Multivariate Analysemethoden Referentinnen: Barbara Wulfken, Iris Koch & Laura Früh Inhalt } Einführung } Fragestellung } Das Programm HLM } Mögliche Modelle } Nullmodell } Random

Mehr

Suchmaschinen verstehen Einsatz einer didaktischen Suchmaschine im Unterricht

Suchmaschinen verstehen Einsatz einer didaktischen Suchmaschine im Unterricht Suchmaschinen verstehen Einsatz einer didaktischen Suchmaschine im Unterricht Informationen im Internet zu finden ist ein Kinderspiel! Wer sich für die Entwicklung des Ozonlochs interessiert, gibt auf

Mehr

(27 - Selbstanordnende lineare Listen)

(27 - Selbstanordnende lineare Listen) Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 - Selbstanordnende lineare Listen) Prof. Dr. Susanne Albers Problemstellung Gegeben sei eine Menge von Objekten (Schlüsseln), auf die mit zeitlich

Mehr

Adaptive Systeme. Sommersemester Prof. Dr. -Ing. Heinz-Georg Fehn. Prof. Dr. rer. nat. Nikolaus Wulff

Adaptive Systeme. Sommersemester Prof. Dr. -Ing. Heinz-Georg Fehn. Prof. Dr. rer. nat. Nikolaus Wulff Adaptive Systeme Sommersemester 2015 Prof. Dr. -Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff Prof. Dr. H.-G. Fehn und Prof. Dr. N. Wulff 1 Adaptive Systeme Adaptives System: ein System, das

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Eine Abfrage (Query) ist in Begriffe und Operatoren unterteilt. Es gibt zwei verschiedene Arten von Begriffen: einzelne Begriffe und Phrasen.

Eine Abfrage (Query) ist in Begriffe und Operatoren unterteilt. Es gibt zwei verschiedene Arten von Begriffen: einzelne Begriffe und Phrasen. Lucene Hilfe Begriffe Eine Abfrage (Query) ist in Begriffe und Operatoren unterteilt. Es gibt zwei verschiedene Arten von Begriffen: einzelne Begriffe und Phrasen. Ein einzelner Begriff ist ein einzelnes

Mehr