Dokumenten-Clustering. Norbert Fuhr
|
|
- Lucas Meissner
- vor 7 Jahren
- Abrufe
Transkript
1 Dokumenten-Clustering Norbert Fuhr
2 Dokumenten-Clustering (Dokumenten-)Cluster: Menge von ähnlichen Dokumenten Ausgangspunkt Cluster-Hypothese : die Ähnlichkeit der relevanten Dokumente untereinander und der irrelevanten Dokumente untereinander ist größer als die zwischen anderen (zufälligen) Teilmengen der Dokumentenkollektion (experimentell nachgewiesen von Rijsbergen und Sparck Jones 1972) Ziel des Clustering: Bestimmung dieser Cluster unabhängig von Fragen (schon beim Aufbau der Kollektion)
3 Prinzipielle Vorgehensweise: 1. Festlegung eines Ähnlichkeitsmaßes (z.b. Skalarprodukt oder Cosinus-Maß) 2. Berechnung der Ähnlichkeitmatrix für alle möglichen Dokumentenpaare aus D 3. Berechnung der Cluster 4. Physisch gemeinsame Abspeicherung der Dokumente eines Clusters
4 Agglomeratives Clustering 1. Wahl eines Schwellenwertes α für die Ähnlichkeit 2. für alle Dokumente: füge d k zu Cluster C l hinzu falls a) single link-clustering: b) complete link-clustering: c) average link-clustering: min sim(d k, d i ) α d i C l max sim(d k, d i ) α d i C l 1 C l d i C l sim(d k, d i ) α 3. falls es kein solches Cluster gibt, bildet d k ein neues Cluster. Aufwand für Clustering beträgt O(n 2 )!
5 Partitionierendes Clustering (k-means) 1. wähle Anzahl k zu bildender Cluster 2. bestimme k seed -Dokumente, die hinreichend unterschiedlich sind. Diese bilden jeweils den Kern eines der Cluster C 1,..., C k 3. für alle (übrigen) Dokumente d i : füge d i zu dem ähnlichsten Cluster hinzu 4. Wähle Zentroiden der resulierenden Cluster als neue seeds 5. Wiederhole Schritte 3 und 4, bis die Cluster stabil sind. Aufwand: O(kn)
6 Hierarchisches Clustering Bottom up Start: jede Instanz = 1 Cluster In jedem Schritt: vereinige die beiden Cluster mit der kleinsten Instanz Entwurfsentscheidung: Distanz zwischen Clustern z.b. als kleinster/größter Abstand zwischen zwei Instanzen, oder als Distanz der Zentroiden. Top down Start: alle Instanzen in einem Cluster Aufteilung in zwei Cluster Rekursive Prozessierung jedes erzeugten Clusters sehr effizient
7 Cluster-Suche zu jedem Cluster wird ein Zentroid berechnet (virtuelles Dokument mit minimalem Abstand zu allen Dokumenten des Clusters) gemeinsame Abspeicherung der Zentroiden (getrennt von den Clustern) (.6) 5 A (.8) (.5) 2 (.5) 6 (.1) 7 (.2) 1 (0) (.7) 3 4 (.8) (.3) H 8 K L 9 B C D E F G I J M N (.5) (.3) (.4) (.2) (0) (0) (0) (.6) (.8) (.9) (.4) (.2) (.4)
8 Retrieval 1. Bestimmung der Zentroiden mit den höchsten Retrievalgewichten 2. Ranking der Dokumente in den zugehörigen Clustern
9 Beurteilung des Cluster-Retrieval + Abhängigkeiten zwischen Dokumenten werden berücksichtigt (im Gegensatz zu allen anderen Modellen) + weniger I/O als bei normaler Suche schlechtere Retrievalqualität + es werden andere relevante Dokumente gefunden
10 Ähnlichkeitssuche und Browsing von Dokumenten Ähnlichkeitssuche: nur anwendbar, wenn ein relevantes Dokument bekannt Ziel: Suche nach dazu ähnlichen Dokumenten (erspart die Formulierung einer Anfrage) a) über die vorher berechneten Cluster b) analog zum Vektorraum-Modell (interpretiere Dokumentvektor als Fragevektor)
11 Experimentelle Ergebnisse: Ähnlichkeitssuche sinnvoll als Ergänzung zu den anderen Retrievalmodellen (es werden andere relevante Dokumente gefunden) Clustering ermöglicht Browsing Vorprozessierung der Cluster nur für Retrieval lohnt nicht
12 Probabilistisches Clustering Verallgemeinerung von k-means-clustering auf unscharfe Cluster C 1,..., C k Cluster x = (x 1,..., x n ): Merkmalsvektor eines Dokumentes d mit { 1, falls ti d x i = T 0, sonst Wahrscheinlichkeit, dass Dokument mit Vektor x zu Cluster C j gehört: P(C j x)
13 Anwendung des Bayes schen Theorems P(a b) = P(a, b) P(b) = P(b a) P(a) P(b) P(C j x) = P(x C j )P(C j ) P(x) = P(x C j )P(C j ) k l=1 P(C l )P(x C l )
14 Unabhängigkeitsannahme: P(x C j ) = P(x i C j ) i = P(x i = 1 C j ) P(x i = 0 C j ) x i =1 x i =0 P(C j ) Wahrscheinlichkeit, dass beliebiges Dokument zum Cluster C j gehört q j i = P(x i = 1 C j ) Wahrscheinlichkeit, dass Term t i in einem zufälligen Dokument des Clusters C j vorkommt P(x C j ) = x i =1 q j i (1 q j i ) x i =0
15 Parameterschätzung Cluster sind nicht von vornherein bekannt Anwendung des EM-Algorithmus (expectation maximization) 1. E: Berechne die Cluster-Wahrscheinlichkeit für jede Instanz 2. M: Schätze die Parameter basierend auf den Cluster-Wahrscheinlichkeiten n j = d m D P(C j x m ) P(C j ) p j = nj D q j i 1 n j x mi P(C j x m ) d m D 1 n j + 1 p j + d m D x mi P(C j x m )
16 Anwendung 1. wähle Anzahl k zu bildender Cluster 2. bestimme k seed -Dokumente, die hinreichend unterschiedlich sind. Diese bilden jeweils den Kern eines der Cluster C 1,..., C k 3. Initialisierung der Parameter: Setze n j = 1 und p j = 1/k. Ferner sei { P(C j 1, falls dm seed von C x m ) = j 0, sonst Berechne daraus initiale Werte für die q j i 4. Für alle Dokumente d m D: Berechne P(C j x m ) für j = 1..., k 5. Berechne neue Parameter n j, p j und q j i 6. Wiederhole die letzten beiden Schritte, bis die Cluster stabil sind.
17 Erweiterung auf nummerische Merkmale Annahme einer Normalverteilung: P(x i C j ) = 1 (x i µ j i )2 2(σ e j i )2 1πσi erfordert Schätzung von 2 Parametern pro Merkmal und Cluster: µ j i = 1 n j x mi P(C j x m ) d m D σ j i = 1 n j (x mi µ j i )2 P(C j x m ) d m D
18 Beispiel zu probabilistischem Clustering
19 Evaluierung von Clustering Externe Validierung Vergleich mit vorgegebener Klassifikation Interne Validierung Bewertung struktureller Eigenschaften der Cluster (hier nicht weiter betrachtet)
20 Externe Validierung: F-Maß Vergleich der Cluster C 1,..., C k mit externer Klassifikation E 1,..., E m Recall r ij = C i E j E j Precision p ij = C i E j C i F-Maß F ij = 2p ijr ij p ij + r ij Bilde Mittelwerte für beste Cluster-Klassen-Zuordnung: Mikro-Mittelung F µ = Makro-Mittelung F M = 1 k k i=1 C i D max j=1...m F ij k max F ij j=1...m i=1
21 Externe Validierung: Entropie Entropie einer diskreten Wahrscheinlichkeitsverteilung p 1,..., p k k H = p i log p i i=1 Entropie eines Clusters H(C i ) = C i E j C i E j C i log C i E j C i Gesamt-Entropie des Clusterings H(C) = k i=1 C i D H(C i )
22 Scatter-Gather-Clustering Browsing durch eine dynamisch generierte Hierarchie (basiert auf partitionierendem Clustering) Scatter = Zerstreuen Aufteilen der Ausgangsmenge in Gruppen partitionierendes Clustering Gather = Sammeln Anwender wählt Gruppen aus Gruppen werden zusammengefasst neue Ausgangsmenge
23 New York Times Service, August 1990 Scatter Education Domestic Iraq Arts Sports Oil Germany Legal Gather International Stories Scatter Deployment Politics Germany Pakistan Africa Markets Oil Hostages Gather Smaller International Stories Scatter Trinidad W. Africa S. Africa Security International Lebanon Pakistan Japan
24
25 Studienprojekt Invisible Web (WS 03/04) Scatter/Gather-Clustering für XML-Dokumente aus dem Invisible Web Beispiel... Daten: celebration Werke englischer Autorinnen (Metadaten, aus Open Archives) CaltechOH Interviews mit Lehrenden an einer kalifornischen Universität (Metadaten, aus Open Archives) shakespeare Theaterstücke von Shakespeare in XML (Volltexte)
26
27
28
29 Clustering-Algorithmus: Buckshot basiert auf K-Means Ähnlichkeitsmaß: Cosinus zwischen Termgewichtvektoren Cluster-Repräsentation: Titel von Dokumenten in der Nähe des Zentroiden wichtigste (gemäß der Termgewichtung) Terme im Cluster Datenherkunft
30 Gewicht eines Terms in einem Cluster C tf m f C f n C n k Häufigkeit des Terms im Dokument d m # Dokumente im Cluster C, in denen der Term vorkommt # Dokumente insgesamt, in denen der Term vorkommt # Dokumente im Cluster C # Dokumente insgesamt # Cluster in der Kollektion Termgewichtungen: nach Häufigkeit des Terms im Cluster C: tf m d m C nach relativem Informationsgehalt im Cluster: ( f C log f C + 1 k n C + 1 log f f C + 1 k n n C + 1 )
Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme
Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Studienprojekt Invisible Web (Dipl.-Inform. Gudrun Fischer - WS 2003/04) Blockseminar
MehrVorlesung Text und Data Mining S9 Text Clustering. Hans Hermann Weber Univ. Erlangen, Informatik
Vorlesung Text und Data Mining S9 Text Clustering Hans Hermann Weber Univ. Erlangen, Informatik Document Clustering Überblick 1 Es gibt (sehr viele) verschiedene Verfahren für das Bilden von Gruppen Bei
MehrClustering Seminar für Statistik
Clustering Markus Kalisch 03.12.2014 1 Ziel von Clustering Finde Gruppen, sodas Elemente innerhalb der gleichen Gruppe möglichst ähnlich sind und Elemente von verschiedenen Gruppen möglichst verschieden
Mehr5 Nicht-Probabilistische Retrievalmodelle
Nicht-Probabilistische Retrievalmodelle 1 5 Nicht-Probabilistische Retrievalmodelle Boolesches Retrieval Fuzzy-Retrieval Vektorraummodell Clustering Nicht-Probabilistische Retrievalmodelle 2 5.1 Notationen
MehrClusteranalyse. Multivariate Datenanalyse. Prof. Dr. Dietmar Maringer. Abteilung für Quantitative Methoden, WWZ der Universität Basel
Clusteranalyse Multivariate Datenanalyse Prof. Dr. Dietmar Maringer Abteilung für Quantitative Methoden, WWZ der Universität Basel Herbstsemester 2013 D Maringer: Datenanalyse Clusteranalyse (1) Ausgangssituation
MehrVoraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen
7. Clusteranalyse (= Häufungsanalyse; Clustering-Verfahren) wird der multivariaten Statistik zugeordnet Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut,
MehrKünstliche Intelligenz Maschinelles Lernen
Künstliche Intelligenz Maschinelles Lernen Stephan Schwiebert Sommersemester 2009 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Maschinelles Lernen Überwachtes Lernen
MehrSemestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.
Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....
Mehr2 Evaluierung von Retrievalsystemen
2. Evaluierung von Retrievalsystemen Relevanz 2 Evaluierung von Retrievalsystemen Die Evaluierung von Verfahren und Systemen spielt im IR eine wichtige Rolle. Gemäß der Richtlinien für IR der GI gilt es,...
MehrW-Rechnung und Statistik für Ingenieure Übung 11
W-Rechnung und Statistik für Ingenieure Übung 11 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) Mathematikgebäude Raum 715 Christoph Kustosz (kustosz@statistik.tu-dortmund.de) W-Rechnung und Statistik
MehrWürfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.
040304 Übung 9a Analysis, Abschnitt 4, Folie 8 Die Wahrscheinlichkeit, dass bei n - maliger Durchführung eines Zufallexperiments ein Ereignis A ( mit Wahrscheinlichkeit p p ( A ) ) für eine beliebige Anzahl
MehrGüte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über
Güte von s Grundlegendes zum Konzept der Güte Ableitung der Gütefunktion des Gauss im Einstichprobenproblem Grafische Darstellung der Gütefunktionen des Gauss im Einstichprobenproblem Ableitung der Gütefunktion
MehrÜbungsaufgaben. Aufgabe 1 Internetsuchmaschinen. Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie Karlsruhe
Otto-Friedrich-Universität Bamberg Lehrstuhl für Medieninformatik Prof. Dr. Andreas Henrich Dipl. Wirtsch.Inf. Daniel Blank Einführung in das Information Retrieval, 8. Mai 2008 Veranstaltung für die Berufsakademie
MehrLineargleichungssysteme: Additions-/ Subtraktionsverfahren
Lineargleichungssysteme: Additions-/ Subtraktionsverfahren W. Kippels 22. Februar 2014 Inhaltsverzeichnis 1 Einleitung 2 2 Lineargleichungssysteme zweiten Grades 2 3 Lineargleichungssysteme höheren als
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt. Stock, Nordflügel R. 0-49 (Persike) R. 0- (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de WS 008/009 Fachbereich
MehrDrei Fragen zum Datenschutz im. Nico Reiners
Drei Fragen zum Datenschutz im Geoinformationswesen Nico Reiners 1. Frage Welche Geoinformationen sind personenbezogen? Personenbezug? Personenbezogene Daten sind Einzelangaben über persönliche oder sachliche
MehrDiana Lange. GENERATIVE GESTALTUNG Arten des Zufalls
Diana Lange GENERATIVE GESTALTUNG Arten des Zufalls RANDOM int index = 0; while (index < 200) { float x = random(0, width); float y = random(0, height); float d = random(40, 100); ellipse(x, y, d, d);
MehrMelanie Kaspar, Prof. Dr. B. Grabowski 1
7. Hypothesentests Ausgangssituation: Man muss sich zwischen 2 Möglichkeiten (=Hypothesen) entscheiden. Diese Entscheidung soll mit Hilfe von Beobachtungen ( Stichprobe ) getroffen werden. Die Hypothesen
MehrSchleswig-Holstein 2011. Kernfach Mathematik
Aufgabe 6: Stochastik Vorbemerkung: Führen Sie stets geeignete Zufallsvariablen und Namen für Ereignisse ein. Machen Sie auch Angaben über die Verteilung der jeweiligen Zufallsvariablen. Eine repräsentative
MehrSuchmaschinenalgorithmen. Vortrag von: Thomas Müller
Suchmaschinenalgorithmen Vortrag von: Thomas Müller Kurze Geschichte Erste Suchmaschine für Hypertexte am CERN Erste www-suchmaschine World Wide Web Wanderer 1993 Bis 1996: 2 mal jährlich Durchlauf 1994:
MehrSerienbrieferstellung in Word mit Kunden-Datenimport aus Excel
Sehr vielen Mitarbeitern fällt es schwer, Serienbriefe an Kunden zu verschicken, wenn sie die Serienbrieffunktion von Word nicht beherrschen. Wenn die Kunden mit Excel verwaltet werden, genügen nur ein
MehrProbabilistisches Tracking mit dem Condensation Algorithmus
Probabilistisches Tracking mit dem Condensation Algorithmus Seminar Medizinische Bildverarbeitung Axel Janßen Condensation - Conditional Density Propagation for Visual Tracking Michael Isard, Andrew Blake
Mehr1.1 Auflösungsvermögen von Spektralapparaten
Physikalisches Praktikum für Anfänger - Teil Gruppe Optik. Auflösungsvermögen von Spektralapparaten Einleitung - Motivation Die Untersuchung der Lichtemission bzw. Lichtabsorption von Molekülen und Atomen
MehrProgrammentwicklungen, Webseitenerstellung, Zeiterfassung, Zutrittskontrolle
Version LG-TIME /Office A 8.3 und höher Inhalt 1. Allgemeines S. 1 2. Installation S. 1 3. Erweiterungen bei den Zeitplänen S. 1;2 4. Einrichtung eines Schichtplanes S. 2 5. Einrichtung einer Wechselschicht
MehrAnmerkungen zur Übergangsprüfung
DM11 Slide 1 Anmerkungen zur Übergangsprüfung Aufgabeneingrenzung Aufgaben des folgenden Typs werden wegen ihres Schwierigkeitsgrads oder wegen eines ungeeigneten fachlichen Schwerpunkts in der Übergangsprüfung
MehrGrundlagen des Maschinellen Lernens Kap. 4: Lernmodelle Teil II
1. Motivation 2. Lernmodelle Teil I 2.1. Lernen im Limes 2.2. Fallstudie: Lernen von Patternsprachen 3. Lernverfahren in anderen Domänen 3.1. Automatensynthese 3.2. Entscheidungsbäume 3.3. Entscheidungsbäume
MehrAnleitung zur Erstellung von Serienbriefen (Word 2003) unter Berücksichtigung von Titeln (wie Dr., Dr. med. usw.)
Seite 1/7 Anleitung zur Erstellung von Serienbriefen (Word 2003) unter Berücksichtigung von Titeln (wie Dr., Dr. med. usw.) Hier sehen Sie eine Anleitung wie man einen Serienbrief erstellt. Die Anleitung
MehrB 2. " Zeigen Sie, dass die Wahrscheinlichkeit, dass eine Leiterplatte akzeptiert wird, 0,93 beträgt. (genauerer Wert: 0,933).!:!!
Das folgende System besteht aus 4 Schraubenfedern. Die Federn A ; B funktionieren unabhängig von einander. Die Ausfallzeit T (in Monaten) der Federn sei eine weibullverteilte Zufallsvariable mit den folgenden
MehrUser Manual Data 24. Login und Layout
User Manual Data 24 Login und Layout Auf der Loginseite www.kern.data24.ch geben Sie Ihren Benutzernamen sowie Ihr Kennwort in die beiden Felder ein. Mit Klick auf den Button «Anmeldung» werden Ihre Daten
MehrAufabe 7: Baum-Welch Algorithmus
Effiziente Algorithmen VU Ausarbeitung Aufabe 7: Baum-Welch Algorithmus Florian Fest, Matr. Nr.0125496 baskit@generationfun.at Claudia Hermann, Matr. Nr.0125532 e0125532@stud4.tuwien.ac.at Matteo Savio,
Mehr50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse 11 13. 501322 Lösung 10 Punkte
50. Mathematik-Olympiade. Stufe (Regionalrunde) Klasse 3 Lösungen c 00 Aufgabenausschuss des Mathematik-Olympiaden e.v. www.mathematik-olympiaden.de. Alle Rechte vorbehalten. 503 Lösung 0 Punkte Es seien
MehrWelche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen?
Welche Lagen können zwei Geraden (im Raum) zueinander haben? Welche Lagen können zwei Ebenen (im Raum) zueinander haben? Welche Lagen kann eine Gerade bezüglich einer Ebene im Raum einnehmen? Wie heiÿt
MehrInformationsblatt Induktionsbeweis
Sommer 015 Informationsblatt Induktionsbeweis 31. März 015 Motivation Die vollständige Induktion ist ein wichtiges Beweisverfahren in der Informatik. Sie wird häufig dazu gebraucht, um mathematische Formeln
MehrAnleitung zum GUI Version 2.x
GUI (Graphical User Interface) für PC-DMIS V3.x 4.x Seite 1 von 7 Anleitung zum GUI Version 2.x Einsatzziel des Programms: Über ein grafisches Menü PC-DMIS Messprogramme starten. Empfehlenswert für Anwender
MehrIntegrierter email-versand Konfiguration/Beschreibung
Einstellungen Integrierter email-versand Konfiguration/Beschreibung Der Versand von emails aus Atlantis erfolgt über das Freeware-Programm BLAT (derzeit mit der Version 2.6.1). Dieses Tools verschickt
MehrErfahrungen mit Hartz IV- Empfängern
Erfahrungen mit Hartz IV- Empfängern Ausgewählte Ergebnisse einer Befragung von Unternehmen aus den Branchen Gastronomie, Pflege und Handwerk Pressegespräch der Bundesagentur für Arbeit am 12. November
MehrBeweisbar sichere Verschlüsselung
Beweisbar sichere Verschlüsselung ITS-Wahlpflichtvorlesung Dr. Bodo Möller Ruhr-Universität Bochum Horst-Görtz-Institut für IT-Sicherheit Lehrstuhl für Kommunikationssicherheit bmoeller@crypto.rub.de 6
MehrVorlesungsplan. Von Naïve Bayes zu Bayesischen Netzwerk- Klassifikatoren. Naïve Bayes. Bayesische Netzwerke
Vorlesungsplan 17.10. Einleitung 24.10. Ein- und Ausgabe 31.10. Reformationstag, Einfache Regeln 7.11. Naïve Bayes, Entscheidungsbäume 14.11. Entscheidungsregeln, Assoziationsregeln 21.11. Lineare Modelle,
MehrQM: Prüfen -1- KN16.08.2010
QM: Prüfen -1- KN16.08.2010 2.4 Prüfen 2.4.1 Begriffe, Definitionen Ein wesentlicher Bestandteil der Qualitätssicherung ist das Prüfen. Sie wird aber nicht wie früher nach der Fertigung durch einen Prüfer,
Mehr4. Versicherungsangebot
4. Versicherungsangebot Georg Nöldeke Wirtschaftswissenschaftliche Fakultät, Universität Basel Versicherungsökonomie (FS 11) Versicherungsangebot 1 / 13 1. Einleitung 1.1 Hintergrund In einem grossen Teil
MehrExploration und Klassifikation von BigData
Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)
MehrLineare Gleichungssysteme
Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der
MehrAuswertung Fünfjahresüberprüfung
Auswertung Fünfjahresüberprüfung Insitution Abkürzung Anzahl Rückmeldungen Lehrbetrieb Lehrbetrieb mit -Angebot (befreiter Betrieb) Ausbildungszentrum mit Basisausbildung und -Angebot Überbetriebliches
MehrZID Hotline hotline@boku.ac.at
Plagiatsprüfung Die unüberblickbare Informationsfülle des Internet macht es Lehrenden schwierig, Plagiate in Abschlussarbeiten zu entdecken. Plagiatsprüfungssoftware unterstützt Lehrende bei dieser Aufgabe.
Mehr11. Anhang Häufigkeitsverteilungen Ich bin häufig unsicher, wie ich mich gegenüber Behinderten verhalten soll. (N=1289; I=2,71) 7 19,2 34 39,8 Wenn ich Behinderte auf der Straße sehe, versuche ich, ihnen
MehrVorlesung Information Retrieval Wintersemester 04/05
Vorlesung Information Retrieval Wintersemester 04/05 20. Januar 2005 Institut für Informatik III Universität Bonn Tel. 02 28 / 73-45 31 Fax 02 28 / 73-43 82 jw@informatik.uni-bonn.de 0 Themenübersicht
MehrSCHRITT 1: Öffnen des Bildes und Auswahl der Option»Drucken«im Menü»Datei«...2. SCHRITT 2: Angeben des Papierformat im Dialog»Drucklayout«...
Drucken - Druckformat Frage Wie passt man Bilder beim Drucken an bestimmte Papierformate an? Antwort Das Drucken von Bildern ist mit der Druckfunktion von Capture NX sehr einfach. Hier erklären wir, wie
MehrZusammenfassende Beurteilung der Unterrichtsbeispiele für Wirtschaft und Recht
Zusammenfassende Beurteilung der Unterrichtsbeispiele für Wirtschaft und Recht In die Auswertung der Beurteilungen der Unterrichtsbeispiele gingen von Seiten der SchülerInnen insgesamt acht Items ein,
MehrSimulation LIF5000. Abbildung 1
Simulation LIF5000 Abbildung 1 Zur Simulation von analogen Schaltungen verwende ich Ltspice/SwitcherCAD III. Dieses Programm ist sehr leistungsfähig und wenn man weis wie, dann kann man damit fast alles
MehrEntscheidungsbäume. Definition Entscheidungsbaum. Frage: Gibt es einen Sortieralgorithmus mit o(n log n) Vergleichen?
Entscheidungsbäume Frage: Gibt es einen Sortieralgorithmus mit o(n log n) Vergleichen? Definition Entscheidungsbaum Sei T ein Binärbaum und A = {a 1,..., a n } eine zu sortierenden Menge. T ist ein Entscheidungsbaum
MehrSchulung FRBR Functional Requirements for Bibliographic Records. Modul E: Der FRBRisierte Katalog oder Was bringt uns FRBR?
Arbeitsstelle für Standardisierung (AfS) 1. Oktober 2010 Schulung FRBR Functional Requirements for Bibliographic Records Modul E: Der FRBRisierte Katalog oder Was bringt uns FRBR? Lernziele Nach Bearbeitung
MehrEinführung in. Logische Schaltungen
Einführung in Logische Schaltungen 1/7 Inhaltsverzeichnis 1. Einführung 1. Was sind logische Schaltungen 2. Grundlegende Elemente 3. Weitere Elemente 4. Beispiel einer logischen Schaltung 2. Notation von
MehrDiese Prozesse und noch viele andere Tricks werden in der Digitalfotografie mit Hilfe von Bildbearbeitungsprogrammen, wie z. B. Gimp, bewältigt.
Workflows mit Gimp Workflows sind Arbeitsabläufe, in denen man ein rohes Bildmaterial in ein ansehnliches Foto verwandelt. Denn das, was die Kamera sieht, entspricht selten unseren Vorstellungen eines
MehrBestimmung einer ersten
Kapitel 6 Bestimmung einer ersten zulässigen Basislösung Ein Problem, was man für die Durchführung der Simplexmethode lösen muss, ist die Bestimmung einer ersten zulässigen Basislösung. Wie gut das geht,
MehrTechnical Note 0606 ewon
PCE Deutschland GmbH Im Langel 4 59872 Meschede Telefon: 02903 976 990 E-Mail: info@pce-instruments.com Web: www.pce-instruments.com/deutsch/ Technical Note 0606 ewon M2Web - 1 - Inhaltsverzeichnis 1 Allgemeines...
MehrVorgehensweise bei Lastschriftverfahren
Vorgehensweise bei Lastschriftverfahren Voraussetzung hierfür sind nötige Einstellungen im ControlCenter. Sie finden dort unter Punkt 29 die Möglichkeit bis zu drei Banken für das Lastschriftverfahren
MehrVorlesung Diskrete Strukturen Graphen: Wieviele Bäume?
Vorlesung Diskrete Strukturen Graphen: Wieviele Bäume? Bernhard Ganter Institut für Algebra TU Dresden D-01062 Dresden bernhard.ganter@tu-dresden.de WS 2013/14 Isomorphie Zwei Graphen (V 1, E 1 ) und (V
MehrAnleitung für Lehramtsstudierende. Anmeldung von Abschlussarbeiten
Anleitung für Lehramtsstudierende Anmeldung von Abschlussarbeiten Stand: Februar 2014 1 Liebe Studentinnen und Studenten, ab dem SoSe 2013 gibt es für alle Studiengänge ein Web basiertes Antragsverfahren
MehrClustering (hierarchische Algorithmen)
Clustering (hierarchische Algorithmen) Hauptseminar Kommunikation in drahtlosen Sensornetzen WS 2006/07 Benjamin Mies 1 Übersicht Clustering Allgemein Clustering in Sensornetzen Clusterheads Cluster basiertes
MehrPrimzahlen und RSA-Verschlüsselung
Primzahlen und RSA-Verschlüsselung Michael Fütterer und Jonathan Zachhuber 1 Einiges zu Primzahlen Ein paar Definitionen: Wir bezeichnen mit Z die Menge der positiven und negativen ganzen Zahlen, also
MehrBenutzung der LS-Miniscanner
Benutzung der LS-Miniscanner Seit Januar 2010 ist es möglich für bestimmte Vorgänge (Umlagerungen, Retouren, Inventur) die von LS lieferbaren Miniscanner im Format Autoschlüsselgröße zu benutzen. Diese
MehrMusterlösungen zur Linearen Algebra II Blatt 5
Musterlösungen zur Linearen Algebra II Blatt 5 Aufgabe. Man betrachte die Matrix A := über dem Körper R und über dem Körper F und bestimme jeweils die Jordan- Normalform. Beweis. Das charakteristische
MehrKryptographische Verfahren auf Basis des Diskreten Logarithmus
Kryptographische Verfahren auf Basis des Diskreten Logarithmus -Vorlesung Public-Key-Kryptographie SS2010- Sascha Grau ITI, TU Ilmenau, Germany Seite 1 / 18 Unser Fahrplan heute 1 Der Diskrete Logarithmus
Mehr6.2 Scan-Konvertierung (Scan Conversion)
6.2 Scan-Konvertierung (Scan Conversion) Scan-Konvertierung ist die Rasterung von einfachen Objekten (Geraden, Kreisen, Kurven). Als Ausgabemedium dient meist der Bildschirm, der aus einem Pixelraster
MehrANWENDUNG DES WIENER STADTWERKE-LOGOS
ANWENDUNG DES WIENER STADTWERKE-LOGOS Dem Wiener Stadtwerke-Konzern ist es ein Anliegen, die Logos in optimaler Form darzustellen. Daher sind die Logos vorzugsweise in den Farbvarianten zu verwenden. Reduzierte
MehrZwischenablage (Bilder, Texte,...)
Zwischenablage was ist das? Informationen über. die Bedeutung der Windows-Zwischenablage Kopieren und Einfügen mit der Zwischenablage Vermeiden von Fehlern beim Arbeiten mit der Zwischenablage Bei diesen
MehrLizenzierung von SharePoint Server 2013
Lizenzierung von SharePoint Server 2013 Das Lizenzmodell von SharePoint Server 2013 besteht aus zwei Komponenten: Serverlizenzen zur Lizenzierung der Serversoftware und CALs zur Lizenzierung der Zugriffe
MehrIn konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert.
Konstante Modelle: In konstanten Modellen wird davon ausgegangen, dass die zu prognostizierende Größe sich über die Zeit hinweg nicht verändert. Der prognostizierte Wert für die Periode T+i entspricht
Mehr6. Bayes-Klassifikation. (Schukat-Talamazzini 2002)
6. Bayes-Klassifikation (Schukat-Talamazzini 2002) (Böhm 2003) (Klawonn 2004) Der Satz von Bayes: Beweis: Klassifikation mittels des Satzes von Bayes (Klawonn 2004) Allgemeine Definition: Davon zu unterscheiden
MehrPresse-Information 04.01.2013
04.01.2013 1 Studie des Instituts für Demoskopie Allensbach zur wirtschaftlichen Situation von Unternehmen im Geschäftsgebiet der Volksbank Herrenberg Rottenburg Optimistische Unternehmen in Herrenberg
MehrLizenzierung von SharePoint Server 2013
Lizenzierung von SharePoint Server 2013 Das Lizenzmodell von SharePoint Server 2013 besteht aus zwei Komponenten: Serverlizenzen zur Lizenzierung der Serversoftware und CALs zur Lizenzierung der Zugriffe
MehrEine vorprozessierte Variante von Scatter/Gather
Universität Duisburg-Essen, Standort Duisburg Institut für Informatik und interaktive Systeme Fachgebiet Informationssysteme Ausarbeitung zum Blockseminar Invisible Web Eine vorprozessierte Variante von
MehrProfessionelle Seminare im Bereich MS-Office
Der Name BEREICH.VERSCHIEBEN() ist etwas unglücklich gewählt. Man kann mit der Funktion Bereiche zwar verschieben, man kann Bereiche aber auch verkleinern oder vergrößern. Besser wäre es, die Funktion
Mehr1 Mathematische Grundlagen
Mathematische Grundlagen - 1-1 Mathematische Grundlagen Der Begriff der Menge ist einer der grundlegenden Begriffe in der Mathematik. Mengen dienen dazu, Dinge oder Objekte zu einer Einheit zusammenzufassen.
MehrGEMA Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte Berlin
GEMA Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte Berlin Vergütungssätze VR-AV DT-H 3 für die Vervielfältigung von Werken des GEMA-Repertoires auf audiovisuellen Datenträgern
MehrTYPO3-Suchmaschinenoptimierung für Redakteure
TYPO3-Suchmaschinenoptimierung für Redakteure TYPO3 Version 7.6 LTS Allgemeines Dieses Dokument beschreibt redaktionelle Maßnahmen zur Verbesserung des Suchmaschinen- Rankings. Diese Maßnahmen sind Teil
MehrAGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom 21.10.2013b
AGROPLUS Buchhaltung Daten-Server und Sicherheitskopie Version vom 21.10.2013b 3a) Der Daten-Server Modus und der Tresor Der Daten-Server ist eine Betriebsart welche dem Nutzer eine grosse Flexibilität
Mehr!(0) + o 1("). Es ist damit möglich, dass mehrere Familien geschlossener Orbits gleichzeitig abzweigen.
Bifurkationen an geschlossenen Orbits 5.4 167 der Schnittabbldung konstruiert. Die Periode T (") der zugehörigen periodischen Lösungen ergibt sich aus =! + o 1 (") beziehungsweise Es ist also t 0 = T (")
MehrThema: Kundenzufriedenheit
Ergebnispräsentation: medax-kundenbefragung 3 Thema: Kundenzufriedenheit Studiendesign Zielgruppe 5 aktive medax-kunden (insgesamt wurden 99 Personen kontaktiert) Befragungsmethode/ Feldzeit Durchführung
MehrErstellen einer Collage. Zuerst ein leeres Dokument erzeugen, auf dem alle anderen Bilder zusammengefügt werden sollen (über [Datei] > [Neu])
3.7 Erstellen einer Collage Zuerst ein leeres Dokument erzeugen, auf dem alle anderen Bilder zusammengefügt werden sollen (über [Datei] > [Neu]) Dann Größe des Dokuments festlegen beispielsweise A4 (weitere
MehrScreening for Illustrator. Benutzerhandbuch
Benutzerhandbuch Contents 1. Einführung... 3 2. Screening for Illustrator - Übersicht... 4 3. Screening for Illustrator - Arbeitsverfahren... 5 4. Zusätzliche Leistungsmerkmale der InkManager-Tabelle...7
MehrUnterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Abi-Retter-Strategien: Texterörterung. Das komplette Material finden Sie hier:
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Das komplette Material finden Sie hier: Download bei School-Scout.de Thema: TMD: 47047 Kurzvorstellung des Materials: Teil der Abi-Retter-Strategie-Serie:
MehrSeminar zum Thema Künstliche Intelligenz:
Wolfgang Ginolas Seminar zum Thema Künstliche Intelligenz: Clusteranalyse Wolfgang Ginolas 11.5.2005 Wolfgang Ginolas 1 Beispiel Was ist eine Clusteranalyse Ein einfacher Algorithmus 2 bei verschieden
MehrAbituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR)
Abituraufgabe zur Stochastik, Hessen 2009, Grundkurs (TR) Eine Firma stellt USB-Sticks her. Sie werden in der Fabrik ungeprüft in Packungen zu je 20 Stück verpackt und an Händler ausgeliefert. 1 Ein Händler
Mehregovernment für das Open Source CMS Contao
egovernment für das Open Source CMS Contao egovernment - Leistungsbeschreibung - Seite 1 von 10 Allgemeines Lizenz Die Lizenz gilt für eine Domain. Es steht Ihnen frei das Modul einmalig einem Kunden zur
MehrFehlermonitor. Software zur seriellen Verbindung PC-Airdos Visualdatensignale und Fehlermeldungen-Ausagabe per SMS / Drucker
Fehlermonitor Software zur seriellen Verbindung PC-Airdos Visualdatensignale und Fehlermeldungen-Ausagabe per SMS / Drucker Das Programm ist problemlos zu installieren auf jedem Windows-PC (XP) mit.net
MehrR ist freie Software und kann von der Website. www.r-project.org
R R ist freie Software und kann von der Website heruntergeladen werden. www.r-project.org Nach dem Herunterladen und der Installation von R kann man R durch Doppelklicken auf das R-Symbol starten. R wird
MehrErläuterungen zu Leitlinien zum Untermodul Krankenversicherungskatastrophenrisiko
Erläuterungen zu Leitlinien zum Untermodul Krankenversicherungskatastrophenrisiko Die nachfolgenden Ausführungen in deutscher Sprache sollen die EIOPA- Leitlinien erläutern. Während die Leitlinien auf
MehrAufgabe 1. Zunächst wird die allgemeine Tangentengleichung in Abhängigkeit von a aufgestellt:
Aufgabe 1 1.1. Bestimmung von D max : 1. Bedingung: x >0 ; da ln(x) nur für x > 0 definiert ist. 2. Bedingung: Somit ist die Funktion f a nur für x > 0 definiert und sie besitzt eine Definitionslücke an
MehrHinweise zur Datensicherung für die - Prüfmittelverwaltung - Inhalt
Hinweise zur Datensicherung für die - Prüfmittelverwaltung - Inhalt 1. Vorbetrachtungen... 2 2. Die Installation... 2 3. Einstellungen - Erstellung der Verknüpfung... 3 3.1 Benutzung des Konfigurationsprogramms
MehrAcQuickPrint / AcSetPrinter Publizieren leicht gemacht / Drucker in Layouts tauschen
CAD on demand GmbH Kurt-Schumacher-Str. 28 66130 Saarbrücken Tel: +49(0)681/988 388 93 Fax: +49(0)681/989 28 50 kontakt@cad-od.de AcQuickPrint / AcSetPrinter Publizieren leicht gemacht / Drucker in Layouts
MehrFolie 1: Fehlerbaumanalyse (FTA) Kurzbeschreibung und Ziel Die Fehlerbaumanalyse im Englischen als Fault Tree Analysis bezeichnet und mit FTA
Folie 1: Fehlerbaumanalyse (FTA) Kurzbeschreibung und Ziel Die Fehlerbaumanalyse im Englischen als Fault Tree Analysis bezeichnet und mit FTA abgekürzt dient der systematischen Untersuchung von Komponenten
MehrZufallsgrößen und Wahrscheinlichkeitsverteilungen
RS 24.2.2005 Zufallsgroessen_i.mcd 1) Zufallsgröße Zufallsgrößen und Wahrscheinlichkeitsverteilungen Zu jedem Zufallsexeriment gehört ein Ergebnisraum Ω. Die einzelnen Ergebnisse ω i können Buchstaben,
MehrErstellen von x-y-diagrammen in OpenOffice.calc
Erstellen von x-y-diagrammen in OpenOffice.calc In dieser kleinen Anleitung geht es nur darum, aus einer bestehenden Tabelle ein x-y-diagramm zu erzeugen. D.h. es müssen in der Tabelle mindestens zwei
MehrAlgorithmen II Vorlesung am 15.11.2012
Algorithmen II Vorlesung am 15.11.2012 Kreisbasen, Matroide & Algorithmen INSTITUT FÜR THEORETISCHE INFORMATIK PROF. DR. DOROTHEA WAGNER KIT Universität des Landes Baden-Württemberg und Algorithmen nationales
MehrStatistische Thermodynamik I Lösungen zur Serie 1
Statistische Thermodynamik I Lösungen zur Serie Zufallsvariablen, Wahrscheinlichkeitsverteilungen 4. März 2. Zwei Lektoren lesen ein Buch. Lektor A findet 2 Druckfehler, Lektor B nur 5. Von den gefundenen
Mehr1.3 Die Beurteilung von Testleistungen
1.3 Die Beurteilung von Testleistungen Um das Testergebnis einer Vp zu interpretieren und daraus diagnostische Urteile ableiten zu können, benötigen wir einen Vergleichsmaßstab. Im Falle des klassischen
MehrErstellen und Bearbeiten von Inhalten (Assets)
Wichtig! Beachten Sie die Designrichtlinien im Kapitel Darstellung und Vorgaben zur Erstellung der Inhalte Ein Linkset erstellen Sie, wenn Sie mehrere Links gruppiert ausgeben möchten. Sie sollten diesem
Mehr