Programmierkurs Python II
|
|
|
- Hilko Hase
- vor 8 Jahren
- Abrufe
Transkript
1 Programmierkurs Python II Stefan Thater & Michaela Regneri Universität des Saarlandes FR 4.7 Allgemeine Linguistik (Computerlinguistik) Sommersemester 213 Übersicht Vektoren elementar Information Retrieval Semantische Ähnlichkeit Klassifikation (knn) Cluster-Analyse (k-means) 2
2 Vektoren Vektoren entsprechen Listen reeller Zahlen: v = (v1, v2,, vn) Vektoren können addiert werden: v + u = (v1 + u1,, vn + un) Vektoren können mit reellen Zahlen ( Skalaren ) multipliziert werden: au = (au1,, aun) 3 Vektorräume Ein Vektorraum über R ist eine Menge von Vektoren, über denen Addition und Skalarmultiplikation definiert sind die Additionsoperation muss folgende Bedingungen erfüllen: - (u + v) + w = u + (v + w) - u + v = v + u - v + = v - u v u + v = * Assoziativ * Kommutativ * neutrales Element * Inverses element 4
3 Vektorräume Ein Vektorraum über R ist eine Menge von Vektoren mit Operationen Addition und Skalarmultiplikation. die Skalarmultiplikation muss folgende Bedingungen erfüllen: - a(v + w) = av + aw - (a + b)v = av + bv - a(bv) = (ab)v - 1v = v 5 Geometrische Interpretation Vektoren beschreiben Punkte im Raum Euklidische Distanz: d2(u, v) = (u1 - v1) (un - vn) 2 Distanz d2(u, v) = Länge u - v des Vektors u - v u = d2(u, ) 5 4 u = d(u, ) = 4.72 u = (2,4) d(u, v) = v = (4,3) 2 1 v = d(v, ) =
4 Geometrische Interpretation Vektoren beschreiben Punkte im Raum Skalarprodukt (dot product, inner product): u v = u1v1 + + unvn Winkel φ zwischen Vektoren u und v cos φ = u v / u v φ als Distanzmaß (Länge der Vektoren wird nicht berücksichtigt) u = d(u, ) = 4.72 u = (2,4) v = (4,3) 2 1 v = d(v, ) = Geometrische Interpretation Vektoren beschreiben Punkte im Raum Centroid von Vektoren v1,, vk C = (v1 + + vk) / k 5 4 u = (2,4) 3 v = (4,3) 2 1 w = (3, 1)
5 Vektoren in Python class Vector: def init (self, data): self.data = [] * data if isinstance(data, int) else data def setitem (self, idx, value): self.data[idx] = value def getitem (self, idx): return self.data[idx] def add (self, other): return Vector([x + y for (x, y) in zip(self.data, other.data)]) def mul (self, scalar): return Vector([x * scalar for x in self.data]) def repr (self): return 'Vector({:})'.format(self.data)... 9 Vektoren in Python from math import sqrt, pow class Vector:... def dotproduct(self, other): return sum(x * y for (x, y) in zip(self.data, other.data)) def norm(self): return sqrt(sum(pow(x, 2) for x in def cosine(vec1, vec2): return vec1.dotproduct(vec2) / (vec1.norm() * vec2.norm()) 1
6 Vektoren in Python from math import sqrt, pow class def euclidean(vec1, vec2): return sqrt(sum(pow(x - y, 2) for (x, y) in zip(vec1.data, def centroid(vecs): return sum(vecs[1:], vecs[]) * (1. / len(vecs)) 11 Information Retrieval Typischerweise liefert ein Information Retrieval System viele Dokumente für eine Anfrage beste Treffer zuerst Fasse Dokumente und Anfrage als Vektoren auf - Alle Wörter in Dokumentsammlung: w1,, wn - Vektor für Dokument d: vd = (v1,, vn) = wi kommt vi mal in Dokument d vor (bzw. tf-idf o.ä.) Sortiere die Dokumente nach ihrer Ähnlichkeit bzw. Distanz zur Anfrage - (Ähnlichkeit ~ Winkel zwischen Vektoren) 12
7 (Beispiel aus FSLT 28/9, Pinkal) Term Dokument Matrix D1 D2 D3 dolphin cos(d1, D2) =.62 human cos(d1, D3) =.14 language cos(d2, D3) =. like mammal technology warm-blooded whale (Beispiel aus FSLT 28/9, Pinkal) Term Dokument Matrix Are dolphins mammals? D1 D2 D3 Q dolphin cos(d1, Q) =.78 human cos(d2, Q) =.53 language cos(d3, Q) =. like mammal technology warm-blooded whale
8 Semantische Ähnlichkeit Distributionelle Hypothese: Wörter, die in ähnlichen Kontexten vorkommen, sind semantisch ähnlich eine Wort-Wort Matrix kodiert, wie häufig zwei Wörter im gleichen Kontext zusammen vorkommen. Kontexte können sein: - Dokumente - Abschnitte - Kontext-Fenster und können ggf. die syntaktische Struktur berücksichtigen 15 (Beispiel aus FSLT 28/9, Pinkal) Wort-Wort Matrix dolp. hum. lang. like mam. tech. wb whale dolphin human language like technology warm-blooded whale
9 Vektoren als Wörterbücher In viele Anwendungsfällen hat ein Vektor nur wenige Komponenten Darstellung mit Listen nicht optimal Alternativ können Vektoren als Wörterbücher repräsentiert werden, mit als Defaultwert. 17 Vektoren als Wörterbücher class Vector(dict): def getitem (self, key): return dict.get(self, key, ) def add (self, other): return Vector((k, self[k] + other[k]) for k in set(self.keys() + other.keys())) def mul (self, scalar): return Vector(((k, v * scalar) for (k, v) in self.items()))... 18
10 Vektoren als Wörterbücher class Vector(dict):... def dotproduct(self, other): return sum(self[k] * other[k] for k in self.iterkeys() if k in other) def norm(self): return sqrt(sum(v * v for v in def cos(vec1, vec2): return vec1.dotproduct(vec2)/(vec1.norm()* vec2.norm()) (Beispiel aus Wikipedia) k nearest neighbors (knn) Der knn Algorithmus ist ein Klassifikationsverfahren, das Objekten eine Klasse zuordnet, basierend auf den Klassen seiner k nächsten Nachbarn. Gegeben ist eine Menge von Objekten und deren Klassen ( Trainingsdaten ) 5 Berechne die Distanz zwischen 4 dem zu klassifizierenden Objekt und allen Trainings-Objekten. 3 2 Weise dem neuen Objekt die Klasse seiner k nächsten Nachbarn 1 zu (Mehrheitsentscheidung)
11 WSD mit knn knn kann man auch für Word Sense Disambiguation benutzen Variante 1: Vektoren = (Trainings- u. Test-)Dokumente - wie Bayes von letzter Woche - klassifiziert ein _Dokument_ (nicht eine Wort-Instanz) Variante 2: Vektoren = Auftreten des Wortes im Kontext - Bestimme ein Kontextfenster von n Worten (oder dem Dokument) - pro Auftreten des Wortes in Frage ein Vektor im Modell - klassifiziere das (die) Auftreten des Wortes im Text (ggf. Mehrheitsentscheidung) 21 Clustering mit k-means Clusteranalyse: Ermittlung von Gruppen (Clustern) von Objekten bzw. Vektoren, deren beobachtbare Eigenschaften bestimmte Ähnlichkeiten aufweisen. k-means Algorithmus: Partitioniere eine Menge von Vektoren in k Cluster Zielsetzung: Minimiere den Abstand der Elemente eines Clusters zu seinem Zentrum. Residual sum of squares (RSS) - RSS = 1 k K x ωk x - μ(ωk) 2 - ωk = Cluster k, μ(ωk) = Centroid von ωk 22
12 Der k-means Algorithmus Initialisierung: zufällige Auswahl von k Clusterzentren Iterative (Neu-) Berechnung der Clusterzentren bis Abbruchbedingung zutrifft: - Weise jedes Objekt (Vektor) dem ihm am nächsten liegenden Clusterzentrum zu - Berechne für jeden Cluster die Clusterzentren neu 23 (Beispiel aus Wikipedia) Der k-means Algorithmus (Beispiel) 1. Zufällige Auswahl von drei Clusterzentren (,, ) 2. Zuordnung der Objekte zu Cluster mit dem nächstliegenden Zentrum. 3. Neuberechnung der Cluster- Zentren
13 (Manning, Raghavan, Schütze, 28) Der k-means Algorithmus K-MEANS({ x 1,..., x N }, K) 1 ( s 1, s 2,..., s K ) SELECTRANDOMSEEDS({ x 1,..., x N }, K) 2 for k 1 to K 3 do µ k s k 4 while stopping criterion has not been met 5 do for k 1 to K 6 do ω k {} 7 for n 1 to N 8 do j arg min j µ j x n 9 ω j ω j { x n } (reassignment of vectors) 1 for k 1 to K 11 do µ k 1 ω k x ω k x (recomputation of centroids) 12 return { µ 1,..., µ K } 25 Mögliche Abbruchbedingungen Begrenzte Anzahl von Iterationsschritten Zuweisung von Objekten zu Clustern ändert sich zwischen zwei Iterationsschritten nicht. Die Centroide ändern sich zwischen zwei Iterationsschritten nicht. Abbruch, wenn RSS einen Schwellwert unterschreitet Abbruch, wenn zwischen den Iterationsschritten die Abnahme des RSS einen Schwellwert unterschreitet. 26
14 Eigenschaften k-means liefert für unterschiedliche initiale Clusterzentren ggf. unterschiedliche Ergebnisse ein Cluster kann in einem Schritt leer bleiben k-means findet nicht notwendigerweise die global optimale Lösung optimales Clustering zu finden gehört zur Komplexitätsklasse NP 27
Mathematische Grundlagen III
Mathematische Grundlagen III Maschinelles Lernen III: Clustering Vera Demberg Universität des Saarlandes 7. Juli 202 Vera Demberg (UdS) Mathe III 7. Juli 202 / 35 Clustering vs. Klassifikation In den letzten
Methoden zur Cluster - Analyse
Kapitel 4 Spezialvorlesung Modul 10-202-2206 (Fortgeschrittene Methoden in der Bioinformatik) Jana Hertel Professur für Bioinformatik Institut für Informatik Universität Leipzig Machine learning in bioinformatics
Textmining Clustering von Dokumenten
Textmining Clustering von Dokumenten Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Clustering 1 / 25 Clustering Definition Clustering ist
Programmierkurs Python I
Programmierkurs Python I Michaela Regneri & Stefan Thater Universität des Saarlandes FR 4.7 Allgemeine Linguistik (Computerlinguistik) Winter 2010/11 Übersicht Kurze Wiederholung: while Sammeltypen (kurz
Länge, Skalarprodukt, Vektorprodukt
Länge, Skalarprodukt, Vektorprodukt Jörn Loviscach Versionsstand: 20. April 2009, 19:39 1 Überblick Ein Vektorraum muss nur eine Minimalausstattung an Rechenoperationen besitzen: die Addition zweier Vektoren
2.2 Kollineare und koplanare Vektoren
. Kollineare und koplanare Vektoren Wie wir schon gelernt haben, können wir einen Vektor durch Multiplikation mit einem Skalar verlängern oder verkürzen. In Abbildung 9 haben u und v die gleiche Richtung,
5. Clusteranalyse Vorbemerkungen. 5. Clusteranalyse. Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften
5. Clusteranalyse Vorbemerkungen 5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer
5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften
5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer Clusterstruktur kennen, verschiedene
Vektoren, Vektorräume
Vektoren, Vektorräume Roman Wienands Sommersemester 2010 Mathematisches Institut der Universität zu Köln Roman Wienands (Universität zu Köln) Mathematik II für Studierende der Chemie Sommersemester 2010
Länge, Skalarprodukt, Geradengleichungen
Länge, Skalarprodukt, Geradengleichungen Jörn Loviscach Versionsstand: 9. April 2010, 18:48 Die nummerierten Felder sind absichtlich leer, zum Ausfüllen in der Vorlesung. Videos dazu: http://www.youtube.com/joernloviscach
Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth
Lineare Algebra Mathematik II für Chemiker Daniel Gerth Überblick Lineare Algebra Dieses Kapitel erklärt: Was man unter Vektoren versteht Wie man einfache geometrische Sachverhalte beschreibt Was man unter
Mathematische Erfrischungen III - Vektoren und Matrizen
Signalverarbeitung und Musikalische Akustik - MuWi UHH WS 06/07 Mathematische Erfrischungen III - Vektoren und Matrizen Universität Hamburg Vektoren entstanden aus dem Wunsch, u.a. Bewegungen, Verschiebungen
Nachteile Boolesches Retrieval
Nachteile Boolesches Retrieval Komplizierte Anfragen Häufigkeit bzw. Relevanz der Terme in den Dokumenten nicht berücksichtigt 2 von 3 UND-verknüpften Termen im Dokument so schlecht wie 0 Terme Keine Rangfolge
Outline. 1 Vektoren im Raum. 2 Komponenten und Koordinaten. 3 Skalarprodukt. 4 Vektorprodukt. 5 Analytische Geometrie. 6 Lineare Räume, Gruppentheorie
Outline 1 Vektoren im Raum 2 Komponenten und Koordinaten 3 Skalarprodukt 4 Vektorprodukt 5 Analytische Geometrie 6 Lineare Räume, Gruppentheorie Roman Wienands (Universität zu Köln) Mathematik II für Studierende
Datenstrukturen und Algorithmen. Christian Sohler FG Algorithmen & Komplexität
Datenstrukturen und Algorithmen Christian Sohler FG Algorithmen & Komplexität 1 Clustering: Partitioniere Objektmenge in Gruppen(Cluster), so dass sich Objekte in einer Gruppe ähnlich sind und Objekte
2 Geradengleichungen in Parameterform. Länge und Skalarprodukt
2 Geradengleichungen in Parameterform. Länge und Skalarprodukt Jörn Loviscach Versionsstand: 19. März 2011, 15:33 Die nummerierten Felder sind absichtlich leer, zum Ausfüllen in der Vorlesung. Videos dazu:
Vektorräume. 1. v + w = w + v (Kommutativität der Vektoraddition)
Vektorräume In vielen physikalischen Betrachtungen treten Größen auf, die nicht nur durch ihren Zahlenwert charakterisiert werden, sondern auch durch ihre Richtung Man nennt sie vektorielle Größen im Gegensatz
1. Vektoralgebra 1.0 Einführung Vektoren Ein Vektor ist eine Größe, welche sowohl einen Zahlenwert (Betrag) als auch eine Richtung hat.
1. Vektoralgebra 1.0 Einführung Vektoren Ein Vektor ist eine Größe, welche sowohl einen Zahlenwert (Betrag) als auch eine Richtung hat. übliche Beispiele: Ort r = r( x; y; z; t ) Kraft F Geschwindigkeit
Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell
Textmining Klassifikation von Texten Teil 2: Im Vektorraummodell Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten Teil
Informatik II, SS 2014
Informatik II SS 2014 (Algorithmen & Datenstrukturen) Vorlesung 7 (21.5.2014) Binäre Suche, Hashtabellen I Algorithmen und Komplexität Abstrakte Datentypen : Dictionary Dictionary: (auch: Maps, assoziative
1 Euklidische und unitäre Vektorräume
1 Euklidische und unitäre Vektorräume In diesem Abschnitt betrachten wir reelle und komplexe Vektorräume mit Skalarprodukt. Dieses erlaubt uns die Länge eines Vektors zu definieren und (im Fall eines reellen
The trick in teaching mathematics is that I do the easy part and you do the hard part. Hahn Hiang Shin, Complex Numbers and Geometry
The trick in teaching mathematics is that I do the easy part and you do the hard part. Hahn Hiang Shin, Complex Numbers and Geometry MBT Mathematische Basistechniken Der Vektorraum Lineare Gleichungssysteme
Brückenkurs Mathematik
Brückenkurs Mathematik 6.10. - 17.10. Vorlesung 3 Geometrie Doris Bohnet Universität Hamburg - Department Mathematik Mi 8.10.2008 1 Geometrie des Dreiecks 2 Vektoren Länge eines Vektors Skalarprodukt Kreuzprodukt
Data Mining und Maschinelles Lernen Lösungsvorschlag für das 7. Übungsblatt
Data Mining und Maschinelles Lernen Lösungsvorschlag für das 7. Übungsblatt Knowledge Engineering Group Data Mining und Maschinelles Lernen Lösungsvorschlag 7. Übungsblatt 1 Aufgabe 1a) Auffüllen von Attributen
Programmierkurs Python I
Programmierkurs Python I Michaela Regneri & Stefan Thater Universität des Saarlandes FR 4.7 Allgemeine Linguistik (Computerlinguistik) Winter 2010/11 Übersicht Variablen Datentypen Werte Ausdrücke Operatoren
C++ Teil 2. Sven Groß. 16. Apr IGPM, RWTH Aachen. Sven Groß (IGPM, RWTH Aachen) C++ Teil Apr / 22
C++ Teil 2 Sven Groß IGPM, RWTH Aachen 16. Apr 2015 Sven Groß (IGPM, RWTH Aachen) C++ Teil 2 16. Apr 2015 1 / 22 Themen der letzten Vorlesung Hallo Welt Elementare Datentypen Ein-/Ausgabe Operatoren Sven
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. Clusteranalyse. Tobias Scheffer Thomas Vanck
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Clusteranalyse Tobias Scheffer Thomas Vanck Überblick Problemstellung/Motivation Deterministischer Ansatz: K-Means Probabilistischer
y x x y ( 2x 3y + z x + z
Matrizen Aufgabe Sei f R R 3 definiert durch ( ) x 3y x f = x + y y x Berechnen Sie die Matrix Darstellung von f Aufgabe Eine lineare Funktion f hat die Matrix Darstellung A = 0 4 0 0 0 0 0 Berechnen Sie
Jürgen Roth Didaktik der Linearen Algebra und Analytischen Geometrie
Jürgen Roth Didaktik der Linearen Algebra und Analytischen Geometrie Modul 12a: Fachdidaktische Bereiche juergen-roth.de/lehre/did_linalg_anageo/ Kapitel 5: Skalarprodukt 5.1 Inhalte Didaktik der Linearen
Definition von R n. Parallelverschiebungen in R n. Definition 8.1 Unter dem Raum R n (n N) versteht man das kartesische Produkt R R... R (n-mal), d.h.
8 Elemente der linearen Algebra 81 Der euklidische Raum R n Definition von R n Definition 81 Unter dem Raum R n (n N) versteht man das kartesische Produkt R R R (n-mal), dh R n = {(x 1, x 2,, x n ) : x
Vektoren. Jörn Loviscach. Versionsstand: 11. April 2009, 23:42
Vektoren Jörn Loviscach Versionsstand:. April 29, 23:42 Rechnen mit Pfeilen Bei den komplexen Zahlen haben wir das Rechnen mit Pfeilen schon kennen gelernt. Addition und Subtraktion klappen in drei wie
J.P.E.G. Standard. J.P.E.G. Eigenschaften. J.P.E.G. System. JPEG Verschlüsselungsschritte. Farbmodell
Inhaltsbasierte Bildsuche J.P.E.G = Joint Photographic Expert Group Informatica Feminale Universität Bremen, Aug. 2005 Maja Temerinac Albert-Ludwigs-Universität Freiburg J.P.E.G. Standard Standard zur
Clusteranalyse: Gauß sche Mischmodelle
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Clusteranalyse: Gauß sche Mischmodelle iels Landwehr Überblick Problemstellung/Motivation Deterministischer Ansatz: K-Means Probabilistischer
Maschinelles Lernen: Symbolische Ansätze. Wintersemester 2013/2014 Musterlösung für das 7. Übungsblatt
Maschinelles Lernen: Symbolische Ansätze Wintersemester 2013/2014 Musterlösung für das 7. Übungsblatt 1 Aufgabe 1 Nearest Neighbour Gegeben sei folgende Beispielmenge: Day Outlook Temperature Humidity
1 ALLGEMEINE HINWEISE Das Fach Mathematik für Wirtschaftswissenschaftler Bisheriger Aufbau der Klausur...
Grundlagen Mathe V Inhaltsverzeichnis 1 ALLGEMEINE HINWEISE... 1-1 1.1 Das Fach Mathematik für Wirtschaftswissenschaftler... 1-1 1.2 Bisheriger Aufbau der Klausur... 1-1 1.3 Zugelassene Hilfsmittel und
Algorithmen zur Datenanalyse in C++
Algorithmen zur Datenanalyse in C++ Hartmut Stadie 16.04.2012 Algorithmen zur Datenanalyse in C++ Hartmut Stadie 1/ 39 Einführung Datentypen Operatoren Anweisungssyntax Algorithmen zur Datenanalyse in
Grundlagen der Vektorrechnung
Grundlagen der Vektorrechnung Ein Vektor a ist eine geordnete Liste von n Zahlen Die Anzahl n dieser Zahlen wird als Dimension des Vektors bezeichnet Schreibweise: a a a R n Normale Reelle Zahlen nennt
Lineare Algebra und Numerische Mathematik für D-BAUG
P. Grohs T. Welti F. Weber Herbstsemester 5 Lineare Algebra und Numerische Mathematik für D-BAUG ETH Zürich D-MATH Beispiellösung für Serie Aufgabe. Skalarprodukt und Orthogonalität.a) Bezüglich des euklidischen
3 Matrizenrechnung. 3. November
3. November 008 4 3 Matrizenrechnung 3.1 Transponierter Vektor: Die Notation x R n bezieht sich per Definition 1 immer auf einen stehenden Vektor, x 1 x x =.. x n Der transponierte Vektor x T ist das zugehörige
Multiplikation und Division in Polarform
Multiplikation und Division in Polarform 1-E1 1-E Multiplikation und Division in Polarform: Mathematisches Rüstzeug n m b b = b n+m bn bm = bn m ( b n )m = b n m Additionstheoreme: cos 1 = cos 1 cos sin
Information Retrieval,
Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen Information Retrieval, Vektorraummodell Tobias Scheffer Uwe Dick Peter Haider Paul Prasse Information Retrieval Konstruktion von
Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 2016
Fakultät für Informatik Übung zu Kognitive Systeme Sommersemester 1 M. Sperber ([email protected]) S. Nguyen ([email protected]) Übungsblatt 3 Maschinelles Lernen und Klassifikation Abgabe online
1 Fraktale Eigenschaften der Koch-Kurve
Anhang Inhaltsverzeichnis Fraktale Eigenschaften der Koch-Kurve iii. Einführung.................................. iii.2 Defintion.................................... iii.3 Gesamtlänge der Koch-Kurve........................
Technische Universität München
Technische Universität München Michael Schreier Ferienkurs Lineare Algebra für Physiker Vorlesung Montag WS 2008/09 1 komplexe Zahlen Viele Probleme in der Mathematik oder Physik lassen sich nicht oder
00. Einiges zum Vektorraum R n
00. Einiges zum Vektorraum R n In diesem einleitenden Kapitel werden die in der LV Einführung in die mathematischen Methoden erwähnten Konzepte über Vektoren (im R 2 und R 3 ) im Rahmen des n-dimensionalen
Data Mining und Knowledge Discovery in Databases
Data Mining und Knowledge Discovery in Databases Begriffsabgrenzungen... Phasen der KDD...3 3 Datenvorverarbeitung...4 3. Datenproblematik...4 3. Möglichkeiten der Datenvorverarbeitung...4 4 Data Mining
Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig
Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model
Statistik IV für Studenten mit dem Nebenfach Statistik Lösungen zu Blatt 9 Gerhard Tutz, Jan Ulbricht SS 07
Statistik IV für Studenten mit dem Nebenfach Statistik Lösungen zu Blatt 9 Gerhard Tutz, Jan Ulbricht SS 07 Ziel der Clusteranalyse: Bilde Gruppen (cluster) aus einer Menge multivariater Datenobjekte (stat
z Partitionierende Klassifikationsverfahren
4.4 Partitionierende Klassifikationsverfahren Partitionierenden Verfahren: - gegeben: eine Zerlegung der Objektmenge in G Cluster, die jedoch nicht als "optimal" angesehen wird; - Verbesserung der Ausgangspartition
Programmierkurs Python II
Programmierkurs Python II Michaela Regneri & tefan Thater FR 4.7 Allgemeine Linguistik (Computerlinguistik) Universität des aarlandes ommersemester 2010 (Charniak, 1997) the dog biscuits N V N V the dog
Mathematik für Chemische Technologie 2
Mathematik für Chemische Technologie 2 Themenüberblick: Funktionen mehrerer unabhängigen Veränderlichen Vektoralgebra Lineare Gleichungssysteme und Determinanten Fehlerrechnung Schwerpunkt des Sommersemesters
HDNUM. Peter Bastian (IWR) Numerik November / 158
HDNUM C++ kennt keine Matrizen und Vektoren,... Wir haben C++ erweitert um die Heidelberg Educational Numerics Library, kurz HDNum. Alle in der Vorlesung behandelten Beispiele sind dort enthalten. Peter
mit "Skalarprodukt" aus i-tem "Zeilenvektor" und j-tem "Spaltenvektor"
Zusammenfassung Matrizen Transponierte: Addition: mit Skalare Multiplikation: Matrixmultiplikation: m x p m x n n x p mit ES "Skalarprodukt" aus i-tem "Zeilenvektor" und j-tem "Spaltenvektor" "Determinante"
2.9 Die komplexen Zahlen
LinAlg II Version 1 3. April 2006 c Rudolf Scharlau 121 2.9 Die komplexen Zahlen Die komplexen Zahlen sind unverzichtbar für nahezu jede Art von höherer Mathematik. Systematisch gehören sie zum einen in
Lösungen zur Mathematik für Informatiker I
Lösungen zur Mathematik für Informatiker I Wintersemester 00/03 Prof Dr H Lenzing Blatt 7 Sei M Ihre Matrikelnummer mit den Ziffern m, m, m 3, m 4, m 5, m 6, m 7 Aufgabe 6 ( Bonuspunkt): Wir betrachten
Geometrie und Bedeutung: Kap 5
: Kap 5 21. November 2011 Übersicht Der Begriff des Vektors Ähnlichkeits Distanzfunktionen für Vektoren Skalarprodukt Eukidische Distanz im R n What are vectors I Domininic: Maryl: Dollar Po Euro Yen 6
Boole'sches Modell <is web>
Boole'sches Modell basiert auf Mengentheorie und Boole'scher Algebra sehr einfaches Modell mit klarer Semantik Dokumente als Mengen von Indextermen Termgewichte sind binär: im Dokument enthalten oder nicht
Graphische Datenverarbeitung und Bildverarbeitung
Graphische Datenverarbeitung und Bildverarbeitung Hochschule Niederrhein Merkmale und Klassifikation Graphische DV und BV, Regina Pohle, 16. Merkmale und Klassifikation 1 Einordnung in die Inhalte der
Lineare Algebra: Theorie und Anwendungen
Lineare Algebra: Theorie und Anwendungen Sommersemester 2012 Bernhard Burgeth Universität des Saarlandes c 2010 2012, Bernhard Burgeth 1 VEKTOREN IN DER EBENE UND IM RAUM 2 1 Vektoren in der Ebene und
Ideen der Informatik. Maschinelles Lernen. Kurt Mehlhorn Adrian Neumann Max-Planck-Institut für Informatik
Ideen der Informatik Maschinelles Lernen Kurt Mehlhorn Adrian Neumann Max-Planck-Institut für Informatik Übersicht Lernen: Begriff Beispiele für den Stand der Kunst Spamerkennung Handschriftenerkennung
Ilja Repin Die Wolgatreidler (1873) Das Skalarprodukt. 1-E Ma 1 Lubov Vassilevskaya
Ilja Repin Die Wolgatreidler (1873) Das Skalarprodukt 1-E Ma 1 Lubov Vassilevskaya Treideln http://www.rheinschifffahrtsgeschichte.de/mainzer%20pano%20dateien/tierer%20treideln.jpg Treideln heißt eine
2. Dezember Lineare Algebra II. Christian Ebert & Fritz Hamm. Skalarprodukt, Norm, Metrik. Matrizen. Lineare Abbildungen
Algebra und Algebra 2. Dezember 2011 Übersicht Algebra und Algebra I Gruppen & Körper Vektorräume, Basis & Dimension Algebra Norm & Metrik Abbildung & Algebra I Eigenwerte, Eigenwertzerlegung Singulärwertzerlegung
T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente.
Vektorraummodell T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. Der Vektorraum wird
Einstieg in die Informatik mit Java
1 / 32 Einstieg in die Informatik mit Java Effizienz Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 32 1 Überblick: was ist Effizienz? 2 Landau-Symbole 3 Eier im Korb 4
Matrizen. Jörn Loviscach. Versionsstand: 12. April 2010, 19:00 Die nummerierten Felder sind absichtlich leer, zum Ausfüllen in der Vorlesung.
Matrizen Jörn Loviscach Versionsstand: 12. April 2010, 19:00 Die nummerierten Felder sind absichtlich leer, zum Ausfüllen in der Vorlesung. 1 Matrix Ein rechteckige Anordnung von mathematischen Objekten
Lineare Gleichungssysteme
Christian Serpé Universität Münster 14. September 2011 Christian Serpé (Universität Münster) 14. September 2011 1 / 56 Gliederung 1 Motivation Beispiele Allgemeines Vorgehen 2 Der Vektorraum R n 3 Lineare
Vektorräume und Rang einer Matrix
Universität Basel Wirtschaftswissenschaftliches Zentrum Vektorräume und Rang einer Matrix Dr. Thomas Zehrt Inhalt:. Lineare Unabhängigkeit 2. Vektorräume und Basen 3. Basen von R n 4. Der Rang und Rangbestimmung
Vektorgeometrie - Teil 1
Vektorgeometrie - Teil 1 MNprofil - Mittelstufe KZN Ronald Balestra CH - 8046 Zürich www.ronaldbalestra.ch Name: Vorname: 14. März 2016 Inhaltsverzeichnis 1 Einführung & die analytische Darstellung der
11 Komplexe Zahlen. Themen: Der Körper der komplexen Zahlen Die Mandelbrot-Menge Der Fundamentalsatz der Algebra
11 Komplexe Zahlen Themen: Der Körper der komplexen Zahlen Die Mandelbrot-Menge Der Fundamentalsatz der Algebra Addition ebener Vektoren Sei Ê 2 = {(x, y) : x, y Ê}. Ê 2 können wir als Punkte in der Ebene
Lineare Algebra I. Christian Ebert & Fritz Hamm. Gruppen & Körper. Vektorraum, Basis & Dimension. Lineare Algebra I. 18.
18. November 2011 Wozu das alles? Bedeutung von Termen Vektoren in R n Ähnlichkeiten zwischen Termbedeutungen Skalarprodukt/Norm/Metrik in R n Komposition von Termbedeutungen Operationen auf/abbildungen
Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK
Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 08.05.2014 Gliederung 1 Vorverarbeitung
Programmierkurs Python
Programmierkurs Python Michaela Regneri & Stefan Thater Universität des Saarlandes FR 4.7 Allgemeine Linguistik (Computerlinguistik) Winter 2010/11 Übersicht Das Programmierprojekt Aufgabenstellung Praktische
Vektorräume und Lineare Abbildungen
Vektorräume und Lineare Abbildungen Patricia Doll, Selmar Binder, Lukas Bischoff, Claude Denier ETHZ D-MATL SS 07 11.04.2007 1 Vektorräume 1.1 Definition des Vektorraumes (VR) 1.1.1 Grundoperationen Um
2.4 Schleifen. Schleifen unterscheiden sich hinsichtlich des Zeitpunktes der Prüfung der Abbruchbedingung:
2.4 Schleifen Schleifen beschreiben die Wiederholung einer Anweisung bzw. eines Blocks von Anweisungen (dem Schleifenrumpf) bis eine bestimmte Bedingung (die Abbruchbedingung) eintritt. Schleifen unterscheiden
Programmierkurs Python I
Programmierkurs Python I Stefan Thater & Michaela Regneri Universität des Saarlandes FR 4.7 Allgemeine Linguistik (Computerlinguistik) Übersicht mehr zu OOP: - Hintergründe - Vererbung Methoden zur Operatoren-Überladung
Orthonormalbasis. Orthogonalentwicklung
Orthonormalbasis Eine Orthogonal- oder Orthonormalbasis des R n (oder eines Teilraums) ist eine Basis {v,..., v n } mit v i = und v i, v j = für i j, d. h. alle Basisvektoren haben Norm und stehen senkrecht
Aufgaben zu Kapitel 20
Aufgaben zu Kapitel 20 Aufgaben zu Kapitel 20 Verständnisfragen Aufgabe 20 Sind die folgenden Produkte Skalarprodukte? (( R ) 2 ( R 2 )) R : v w,, v v 2 w w 2 (( R ) 2 ( R 2 )) R : v w, 3 v v 2 w w + v
Brückenkurs Mathematik. Mittwoch Freitag
Brückenkurs Mathematik Mittwoch 5.10. - Freitag 14.10.2016 Vorlesung 4 Dreiecke, Vektoren, Matrizen, lineare Gleichungssysteme Kai Rothe Technische Universität Hamburg-Harburg Montag 10.10.2016 0 Brückenkurs
Vektor-Multiplikation Vektor- Multiplikation
Vektor- Multiplikation a d c b Thema: Schultyp: Vorkenntnisse: Bearbeitungsdauer: Vektor-Multiplikation: Vektorprodukt Mittelschule, Berufsschule, Fachhochschule Elementare Programmierkenntnisse, Geometrie,
Übersicht. Schleifen. Schleifeninvarianten. Referenztypen, Wrapperklassen und API. 9. November 2009 CoMa I WS 08/09 1/15
Übersicht Schleifen Schleifeninvarianten Referenztypen, Wrapperklassen und API CoMa I WS 08/09 1/15 CoMa I Programmierziele Linux bedienen Code umschreiben strukturierte Datentypen Anweisungen und Kontrollstrukturen
Anwendungen der Hauptkomponentenanalyse. Volker Tresp vertreten durch Florian Steinke
Anwendungen der Hauptkomponentenanalyse Volker Tresp vertreten durch Florian Steinke 1 Dimensionsreduktion für Supervised Learning 2 Beispiel: Kaufentscheidung 3 Verbesserte Abstandsmaße durch Hauptkomponentenanalyse
Grundsätzliches Produkte Anwendungen in der Geometrie. Vektorrechnung. Fakultät Grundlagen. Juli 2015
Vektorrechnung Fakultät Grundlagen Juli 205 Fakultät Grundlagen Vektorrechnung Übersicht Grundsätzliches Grundsätzliches Vektorbegriff Algebraisierung der Vektorrechnung Betrag 2 Skalarprodukt Vektorprodukt
Lösung Semesterendprüfung (Nachprüfung)
MLAE Mathematik: Lineare Algebra für Ingenieure Frühlingssemester 6 Dr. Christoph Kirsch ZHAW Winterthur Lösung Semesterendprüfung (Nachprüfung Aufgabe : Aufgabe : a Gemäss Def. der Vorlesung müssen wir
Python-Workshop. Python für C/C++ Programmierer. Carl Friedrich Bolz. [email protected]. Carl Friedrich Bolz
Python-Workshop Python für C/C++ Programmierer [email protected] 1 Übersicht Einführung: Einfache Datentypen Kontrollstrukturen Komplexe Datentypen strings, lists, dicts, tuples slicing list comprehensions
Objektorientierte Programmierung mit Python Polymorphismus und Vererbung. Eltern
Objektorientierte Programmierung mit Python Polymorphismus und Vererbung Eltern Kind Kind Kind Kind Prinzipien der objektorientierten Programmierung Vererbung Strukturierung von Klassen. Oberbegriffe beschreiben
Lineare Algebra und analytische Geometrie II
Prof. Dr. H. Brenner Osnabrück SS 2016 Lineare Algebra und analytische Geometrie II Vorlesung 31 Vektorräume mit Skalarprodukt Im R n kann man nicht nur Vektoren addieren und skalieren, sondern ein Vektor
Übungen zu Einführung in die Lineare Algebra und Geometrie
Übungen zu Einführung in die Lineare Algebra und Geometrie Andreas Cap Sommersemester 2010 Kapitel 1: Einleitung (1) Für a, b Z diskutiere analog zur Vorlesung das Lösungsverhalten der Gleichung ax = b
Mathematik LK 12 M1, 4. Kursarbeit Matrizen und Stochastik Lösung )
Aufgabe 1: Berechne die Determinante und die Transponierte der folgenden Matrizen: 0 1 1.1 M =( 0 4 1 4 det M =0 4 1 4= 4 M T =( 5 3 3 1.2 1 1 3 A=( =( A T 3 0 1 5 1 3 3 1 0 3 3 1 4 4 det M = 5 1 1+3 3
Vorlesung Text und Data Mining S9 Text Clustering. Hans Hermann Weber Univ. Erlangen, Informatik
Vorlesung Text und Data Mining S9 Text Clustering Hans Hermann Weber Univ. Erlangen, Informatik Document Clustering Überblick 1 Es gibt (sehr viele) verschiedene Verfahren für das Bilden von Gruppen Bei
Clusteranalyse von Nachrichtenartikeln
Köln, den 7. Oktober 2011 Studiengang Informationsverarbeitung Sommersemester 2011 Sprachliche Informationsverarbeitung Prose i ar: Co puterli guistik II bei Jürgen Hermes M.A. Clusteranalyse von Nachrichtenartikeln
Einführung in Support Vector Machines (SVMs)
Einführung in (SVM) Januar 31, 2011 Einführung in (SVMs) Table of contents Motivation Einführung in (SVMs) Outline Motivation Vektorrepräsentation Klassifikation Motivation Einführung in (SVMs) Vektorrepräsentation
1 Boolesches Retrieval (2)
2. Übung zur Vorlesung Internet-Suchmaschinen im Sommersemester 2009 mit Lösungsvorschlägen Prof. Dr. Gerd Stumme, M.Sc. Wi-Inf. Beate Krause 06. Mai 2009 1 Boolesches Retrieval (2) Eine Erweiterung des
Didaktik der Analysis und der Analytischen Geometrie/ Linearen Algebra
A. Filler[-3mm] Didaktik der Analysis und der Analytischen Geometrie/ Linearen Algebra, Teil 8 Folie 1 /27 Didaktik der Analysis und der Analytischen Geometrie/ Linearen Algebra 8. Das Skalarprodukt, metrische
Kapitel 2: Mathematische Grundlagen
[ Computeranimation ] Kapitel 2: Mathematische Grundlagen Prof. Dr. Stefan M. Grünvogel [email protected] Institut für Medien- und Phototechnik Fachhochschule Köln 2. Mathematische Grundlagen
Textmining Klassifikation von Texten Teil 1: Naive Bayes
Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive
L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren...
L3 Euklidische Geometrie: Längen, Winkel, senkrechte Vektoren... (benötigt neue Struktur über Vektorraumaxiome hinaus) Sei Länge von nach Pythagoras: Länge quadratisch in Komponenten! - Für : Skalarprodukt
Lineare Algebra I. Prof. Dr. M. Rost. Übungen Blatt 6 (WS 2010/2011) Abgabetermin: Donnerstag, 27. November
Lineare Algebra I Prof. Dr. M. Rost Übungen Blatt 6 (WS 2010/2011) Abgabetermin: Donnerstag, 27. November http://www.math.uni-bielefeld.de/~rost/la1 Erinnerungen und Ergänzugen zur Vorlesung: Der Vollständigkeit
Prototypische Komponenten eines Information Retrieval Systems: Vektormodell
Prototypische Komponenten eines Information Retrieval Systems: Vektormodell Implementierung & Präsentation: Stefan Schmidt (Uni Mannheim) Kontakt: [email protected] Seminar: Information Retrieval WS2002/2003
