Gestenbasierte Steuerung von interaktiven Umgebungen mithilfe der Microsoft Kinect

Größe: px
Ab Seite anzeigen:

Download "Gestenbasierte Steuerung von interaktiven Umgebungen mithilfe der Microsoft Kinect"

Transkript

1 Fakultät Informatik Institut für Software- und Multimediatechnik, Professur für Computergraphik und Visualisierung Gestenbasierte Steuerung von interaktiven Umgebungen mithilfe der Microsoft Kinect Diplomverteidigung Ludwig Schmutzler Dresden,

2 Quelle: Folie 2

3 Motivation Verfolgen und Interpretieren von Nutzerbewegungen Steuerung virtueller Objekte / Auslösen von Aktionen Microsoft Kinect ermöglicht das Nachverfolgen in 3D Bild-Quelle: Folie 3

4 Zielstellung der Arbeit Beschränkung auf Hände und Arme, Ausnutzung d. Potenzials der Kinect Anforderungen: Robustheit gegenüber Lichtverhältnissen Kleidung Körperproportionen Kamera-/Nutzerstandort Folie 4

5 Zielstellung der Arbeit Beschränkung auf Hände und Arme, Ausnutzung d. Potenzials der Kinect Anforderungen: Robustheit gegenüber Lichtverhältnissen Kleidung Körperproportionen Kamera-/Nutzerstandort Kinect geeignete Modellbeschreibung Folie 5

6 Zielstellung der Arbeit Beschränkung auf Hände und Arme, Ausnutzung d. Potenzials der Kinect Anforderungen: Robustheit gegenüber Lichtverhältnissen Kleidung Körperproportionen Kamera-/Nutzerstandort Kinect geeignete Modellbeschreibung Folie 6

7 Zielstellung der Arbeit Beschränkung auf Hände und Arme, Ausnutzung d. Potenzials der Kinect Anforderungen: Robustheit gegenüber Lichtverhältnissen Kleidung Körperproportionen Kamera-/Nutzerstandort Kinect geeignete Modellbeschreibung schnelle Berechnungen, Echtzeitfähigkeit Erkennung von arbiträren Gesten aus dem Bewegungsfluss heraus Folie 7

8 Zielstellung der Arbeit besondere Herausforderungen: Entwickeln eines Gestenkonzeptes komplexes Zusammenspiel der einzelnen System-Komponenten realisieren Ungenauigkeiten des Trackings durch robustes Filtern ausgleichen Folie 8

9 Gliederung 1. Grundlagen Modellkomponenten, Gestenkonzept 2. Gestenerkennungssystem Sensordaten, Posenmodell, Erkennungsverfahren 3. Diskussion Ergebnisse, Bewertung, Ausblick 4. Demonstration Folie 9

10 1. Grundlagen Folie 10

11 Theoretische Grundlagen Gestenkosmos Ein Blick in die reale Welt: Gesten sind Kommunikationsmittel, wichtig für den Menschen Beispiel Folie 11

12 Theoretische Grundlagen Gestenkosmos Bild-Quelle: Folie 12

13 Theoretische Grundlagen Modellierung Geste (Wieder-)Erkennen Interpretieren Folie 13

14 Theoretische Grundlagen Modellierung Geste (Wieder-)Erkennen Interpretieren Bedeutungsmodellierung ist Aufgabe der Anwendung Demonstrationsanwendung im Rahmen der Arbeit Folie 14

15 Theoretische Grundlagen Modellierung Geste (Wieder-)Erkennen einer Struktur über ein Modell Interpretieren Modellierungskonzepte: explizites Vorgeben von Größen Definieren von Zustandsfolgen Bedeutungsmodellierung ist Aufgabe der Anwendung Demonstrationsanwendung im Rahmen der Arbeit mathematische Beschreibung von Bewegungskurven Aufzeichnen von Zeitreihen durch den Nutzer Folie 15

16 Theoretische Grundlagen Modellierung Geste (Wieder-)Erkennen einer Struktur über ein Modell Interpretieren Modellierungskonzepte: explizites Vorgeben von Größen Definieren von Zustandsfolgen Bedeutungsmodellierung ist Aufgabe der Anwendung Demonstrationsanwendung im Rahmen der Arbeit mathematische Beschreibung von Bewegungskurven Aufzeichnen von Zeitreihen durch den Nutzer Im Rahmen der Arbeit verwendet Folie 16

17 Theoretische Grundlagen Modellierung Noch etwas mehr Modellierung modularer Mensch, funktionale Trennung von Hand und restl. Oberkörper Hand Handposition Handform Oberkörper Körperwinkel Folge von Körperhaltungen Folie 17

18 Theoretische Grundlagen Modellierung Noch etwas mehr Modellierung modularer Mensch, funktionale Trennung von Hand und restl. Oberkörper Hand Handposition Handform Oberkörper Körperwinkel Folge von Körperhaltungen Gestenarten [KS05]: deiktische Geste manipulative Geste semaphorische Geste Folie 18

19 Theoretische Grundlagen Modellierung Noch etwas mehr Modellierung modularer Mensch, funktionale Trennung von Hand und restl. Oberkörper Hand Handposition Handform Oberkörper Körperwinkel Folge von Körperhaltungen Gestenarten [KS05]: deiktische Geste manipulative Geste semaphorische Geste Folie 19

20 Theoretische Grundlagen Modellierung Noch etwas mehr Modellierung modularer Mensch, funktionale Trennung von Hand und restl. Oberkörper Hand Handposition Handform Oberkörper Körperwinkel Folge von Körperhaltungen Gestenarten [KS05]: deiktische Geste manipulative Geste semaphorische Geste Folie 20

21 Theoretische Grundlagen Modellierung Noch etwas mehr Modellierung modularer Mensch, funktionale Trennung von Hand und restl. Oberkörper Hand Handposition Handform Oberkörper Körperwinkel Folge von Körperhaltungen Gestenarten [KS05]: deiktische Geste manipulative Geste semaphorische Geste Folie 21

22 Theoretische Grundlagen Modellierung Noch etwas mehr Modellierung modularer Mensch, funktionale Trennung von Hand und restl. Oberkörper Hand Handposition Handform Oberkörper Körperwinkel Folge von Körperhaltungen Gestenarten [KS05]: deiktische Geste manipulative Geste semaphorische Geste Aufgabe des Erkennersystems Folie 22

23 2. Gestenerkennungssystem Folie 23

24 Gestenerkennung Übersicht Gesamtsystem Kinect Gestenerkenner Applikation Nutzeraktion Folie 24

25 Gestenerkennung Übersicht Gesamtsystem Kinect Gestenerkenner Applikation Nutzeraktion Folie 25

26 Gestenerkennung Sensordaten Kinect Sensor liefert mit 30 fps [Mic12]: RGB-Video (bis 1280x960) Tiefendaten (bis 640x480), Objekt - Abstand in Millimetern (13-bit) Folie 26

27 Gestenerkennung Sensordaten Kinect Sensor liefert mit 30 fps [Mic12]: RGB-Video (bis 1280x960) s 3 s 2 s 8 s 4 Tiefendaten (bis 640x480), Objekt - Abstand in Millimetern (13-bit) s 9 s 5 s 1 s 0 s 10 s 6 s 11 s 16 s 12 s 7 Skelettdaten: 20 markante Körperpunkte im sog. Skeleton Space, werden automatisch nachverfolgt s 17 s 13 s 18 s 14 s 19 s 15 Folie 27

28 Gestenerkennung Sensordaten interne Glättungsfunktionen für Skelettdaten dennoch: Trackingprobleme bei Überdeckung von Körperteilen s 3 s 2 s 8 s 4 s 9 s 5 s 1 s 0 s 10 s 6 s 11 s 16 s 12 s 7 s 17 s 13 s 18 s 14 s 19 s 15 Folie 28

29 Gestenerkennung Sensordaten interne Glättungsfunktionen für Skelettdaten Torso dennoch: Trackingprobleme bei Überdeckung von Körperteilen s 3 s 2 s 8 s 4 s 9 s 5 s 1 Steigerung der Robustheit durch Neuberechnung der Torsopunkte s 0 s 10 s 6 s 11 s 16 s 12 s 7 s 17 s 13 s 18 s 14 s 19 s 15 Folie 29

30 Gestenerkennung Übersicht Gesamtsystem Kinect Gestenerkenner Applikation Tiefendaten Skelettdaten Nutzeraktion Folie 30

31 Gestenerkennung Übersicht Gesamtsystem Kinect Gestenerkenner Applikation Tiefendaten Skelettdaten reine Skelettdaten ungeeignet! Nutzeraktion Folie 31

32 Gestenerkennung Modellansatz gesucht ist Beschreibungsform invariant gegenüber: Lage und Orientierung der Kinect Kamera Körpermaßen der Nutzer Folie 32

33 Gestenerkennung Modellansatz gesucht ist Beschreibungsform invariant gegenüber: Lage und Orientierung der Kinect Kamera Körpermaßen der Nutzer Winkelrepräsentationen sind geeignet und werden häufig verwendet (vgl. [YPL07, RKH11, PL06, BP+04, OFH08]) Folie 33

34 Gestenerkennung Modellansatz zusätzlich: Handpositionen in lokalem Koordinatensystem werden robust aus Hauptkomponenten-Analyse der Torsopunkte ermittelt (vgl. [RKH11]) Folie 34

35 Gestenerkennung Modellansatz zusätzlich: Handpositionen in lokalem Koordinatensystem werden robust aus Hauptkomponenten-Analyse der Torsopunkte ermittelt (vgl. [RKH11]) Pose zum Zeitpunkt t P t = φ 1,t, φ 2,t,, φ 8,t, x t L, x t R φ i,t R, i 1,8, x t L, x t R R 3 Redundanzreduktion: Folie 35

36 Gestenerkennung Übersicht Gesamtsystem Kinect Gestenerkenner Applikation Tiefendaten Skelettdaten Nutzeraktion Folie 36

37 Gestenerkennung Übersicht Gesamtsystem Kinect Gestenerkenner Applikation Tiefendaten Skelettdaten Posenmodell Handpositionen Körperwinkel Nutzeraktion Folie 37

38 Gestenerkennung Übersicht Gesamtsystem Kinect Gestenerkenner Applikation Tiefendaten Skelettdaten Posenmodell Handposition Handpositionen Körperwinkel Körperwinkel Handform Folge von Körperhaltungen Nutzeraktion Folie 38

39 Gestenerkennung Übersicht Gesamtsystem Kinect Gestenerkenner Applikation Tiefendaten Skelettdaten Posenmodell Handpositionen Körperwinkel Nutzeraktion Folie 39

40 Gestenerkennung Übersicht Gesamtsystem Kinect Gestenerkenner Applikation Tiefendaten Skelettdaten Posenmodell Handpositionen Körperwinkel Handerkennung Handform? Handposition? Nutzeraktion Oberkörpergestenerkennung Körperwinkel? Folge von Körperhaltungen? Folie 40

41 Gestenerkennung Übersicht Gesamtsystem Kinect Gestenerkenner Applikation Tiefendaten Skelettdaten Posenmodell Handpositionen Körperwinkel Handerkennung Handform? Handposition? Nutzeraktion Oberkörpergestenerkennung Körperwinkel? Folge von Körperhaltungen? Folie 41

42 Erkennung von Handgesten - deiktisch deiktische Handgeste: Handposition virtuelle Zeigerposition 1. Aufgabe: ruhige Zeigerführung temporale Glättung der Handposition 2. Aufgabe: Genaues Positionieren und große Bildschirmbereiche abdecken? nicht-lineare Übersetzung von Hand- in Zeigerposition Folie 42

43 Erkennung von Handgesten - semaphorisch semaphorische Handgesten: Klassifizierung der Handform: Handfläche als Punktmengen [TLB12] Fitten von Spline-Kurven [RVCB03] Nachbar-Pixelsuche [Li12] Radiale Histogramme [Tan11,RYZ11] Folie 43

44 Erkennung von Handgesten - semaphorisch semaphorische Handgesten: Klassifizierung der Handform: Handfläche als Punktmengen [TLB12] Fitten von Spline-Kurven [RVCB03] Nachbar-Pixelsuche [Li12] Radiale Histogramme [Tan11,RYZ11] hier: Auswertung der Konturlinie in Polardarstellung, zwei einfache Handstellungen: "offen" u. "geschlossen" Kinect liefert lediglich 2 Skelettpunkte für Hand bildbasiertes Verfahren über Tiefendaten Folie 44

45 Erkennung von Handgesten - semaphorisch Vorgehen (I) Finden der Handwurzel im Tiefenbild (über Kinect API) Folie 45

46 Erkennung von Handgesten - semaphorisch Vorgehen (I) y Finden der Handwurzel im Tiefenbild (über Kinect API) Definition eines lokalen Koordinatensystems (0,0) x Folie 46

47 Erkennung von Handgesten - semaphorisch Vorgehen (I) y Finden der Handwurzel im Tiefenbild (über Kinect API) Definition eines lokalen Koordinatensystems δ Handpixel definiert über Schwellwert < δ (0,0) x Folie 47

48 Erkennung von Handgesten - semaphorisch Vorgehen (I) Finden der Handwurzel im Tiefenbild (über Kinect API) y Bounding Box Definition eines lokalen Koordinatensystems δ Handpixel definiert über Schwellwert < δ (0,0) x Anforderungen: Lokalität und Kontinuität Bounding-Box-Verfahren (achsenparallele Suchstrahlen, beginnend im Ursprung) Folie 48

49 Erkennung von Handgesten - semaphorisch Vorgehen (II) Handkontur über radiale Suchstrahlen s i = r cos ω i sin ω i Strahlen werden effizient von außen nach innen verfolgt (Kontinuität der Handfläche) Folie 49

50 Erkennung von Handgesten - semaphorisch Vorgehen (II) Handkontur über radiale Suchstrahlen s i = r cos ω i sin ω i Strahlen werden effizient von außen nach innen verfolgt (Kontinuität der Handfläche) Konturlinie k r max,i Glätten und Auszählen der lokalen Maxima (=Fingeranzahl) Folie 50

51 Erkennung von Handgesten - semaphorisch r max,ωi 100 r max,ωi ω Handkontur (offene Hand) Fingerpositionen i ω Handkontur (geschlossene Hand) i praxisgerechte Klassifikation: Anzahl der lokalen Maxima 1 geschlossene Hand Anzahl der lokalen Maxima > 1 offene Hand Folie 51

52 Gestenerkennung Übersicht Gesamtsystem Kinect Gestenerkenner Applikation Tiefendaten Skelettdaten Posenmodell Handpositionen Körperwinkel Handerkennung Handform? Handposition? Nutzeraktion Oberkörpergestenerkennung Körperwinkel? Folge von Körperhaltungen? Folie 52

53 Gestenerkennung Übersicht Gesamtsystem Kinect Tiefendaten Skelettdaten Posenmodell Handpositionen Körperwinkel Gestenerkenner Handerkennung Applikation Klassifizierung der Handform Ergebnis d. Klassifikation Virtuelle Handkoordinaten Nutzeraktion Oberkörpergestenerkennung Körperwinkel? Folge von Körperhaltungen? Folie 53

54 Gestenerkennung Übersicht Gesamtsystem Kinect Tiefendaten Skelettdaten Posenmodell Handpositionen Körperwinkel Gestenerkenner Handerkennung Applikation Klassifizierung der Handform Ergebnis d. Klassifikation Virtuelle Handkoordinaten Nutzeraktion Oberkörpergestenerkennung Körperwinkel? Folge von Körperhaltungen? Folie 54

55 Oberkörpergestenerkennung Vorverarbeitung Vorverarbeitung: Oberkörpergesten (OKG) werden nur über Winkel modelliert, Extraktion aus der Pose φ t = φ P t = φ 1,t, φ 2,t,, φ 8,t Merkmalsvektor (MV), wird temporal geglättet deiktische Oberkörpergeste: Weiterleiten des aktuellen MV an die Applikation Folie 55

56 Oberkörpergestenerkennung semaphorisch semaphorische OKG: Folge von Körperhaltungen zeitreihenbasierter Modellansatz: Geste = Folge von Merkmalsvektoren Merkmalsvektorsequenz (MVS) Φ (i,j) φ i, φ i+1,, φ j 1, φ j Folie 56

57 Oberkörpergestenerkennung semaphorisch semaphorische OKG: Folge von Körperhaltungen zeitreihenbasierter Modellansatz: Geste = Folge von Merkmalsvektoren Merkmalsvektorsequenz (MVS) Φ (i,j) φ i, φ i+1,, φ j 1, φ j 2 Kern-Aufgaben des Erkennens: Auffinden Klassifizieren Folie 57

58 Oberkörpergestenerkennung semaphorisch Auffinden potenzieller OKG: automatisches Segmentieren der Nutzeraktionen aus dem Interaktionsfluss heraus Warum? Nutzer soll nicht manuell anzeigen Folie 58

59 Oberkörpergestenerkennung semaphorisch Auffinden potenzieller OKG: automatisches Segmentieren der Nutzeraktionen aus dem Interaktionsfluss heraus Warum? Nutzer soll nicht manuell anzeigen Absuchen aller möglichen vergangenen MVS, zu rechenintensiv Markieren von Zeitpunkten potenziellen Gesten-Beginns/-Endes, dann Absuchen Folie 59

60 Oberkörpergestenerkennung semaphorisch Auffinden potenzieller OKG: über Gradienten und deren Änderung (vgl. [KLJ04]) hier: Winkelgeschwindigkeiten Beobachtung: Ruhe niedriger Geschwindigkeitsbetrag Bewegung hoher Geschwindigkeitsbetrag Folie 60

61 Oberkörpergestenerkennung semaphorisch Auffinden potenzieller OKG: über Gradienten und deren Änderung (vgl. [KLJ04]) hier: Winkelgeschwindigkeiten Beobachtung: Ruhe niedriger Geschwindigkeitsbetrag Bewegung hoher Geschwindigkeitsbetrag Vorgehen (I) Markieren bei Übergang von einer in die andere Phase Spezialfälle: Verweilen in einer Haltung oder andauerndes Weiterbewegen Warten bis bestimmte Zahl von Frames abgelaufen, dann markieren Folie 61

62 Oberkörpergestenerkennung semaphorisch Auffinden potenzieller OKG: Vorgehen (II) Suchfenster W konstanter Größe über die markierten Zeitindizes Bilden von temporären MVS: (i,j ) Φ temp i, j W, i < j Folie 62

63 Oberkörpergestenerkennung semaphorisch Auffinden potenzieller OKG: Vorgehen (II) Suchfenster W konstanter Größe über die markierten Zeitindizes Bilden von temporären MVS: (i,j ) Φ temp i, j W, i < j alle temporären MVS klassifizieren Weiterrücken von W je nach Klassifikationsergebnis Folie 63

64 Oberkörpergestenerkennung semaphorisch Auffinden potenzieller OKG: Vorgehen (II) Suchfenster W konstanter Größe über die markierten Zeitindizes Bilden von temporären MVS: (i,j ) Φ temp i, j W, i < j alle temporären MVS klassifizieren Weiterrücken von W je nach Klassifikationsergebnis Folie 64

65 Oberkörpergestenerkennung semaphorisch Klassifikation von MVS Grundlage der Erkennung? Trainingsdaten! Aufzeichnen von MVS Bilden von Klassen, d.h. mehrere MVS-Bsp. der gleichen Bewegung werden zusammengefasst Folie 65

66 Oberkörpergestenerkennung semaphorisch Klassifikation von MVS gegeben: eine temporäre MVS viele trainierte MVS Folie 66

67 Oberkörpergestenerkennung semaphorisch Klassifikation von MVS gegeben: eine temporäre MVS viele trainierte MVS Aufgabe: Vergleich Klassenzuordnung Folie 67

68 Oberkörpergestenerkennung semaphorisch Klassifikation von MVS gegeben: eine temporäre MVS viele trainierte MVS Aufgabe: Vergleich Klassenzuordnung Wie? zeitreihenbasierter Modellansatz Berechnen der Distanz zwischen MVS Folie 68

69 Oberkörpergestenerkennung semaphorisch Klassifikation von MVS verwendeter Algorithmus: k-nächste-nachbarn-verfahren hinreichend schnell, einfach zu implementieren Folie 69

70 Oberkörpergestenerkennung semaphorisch Klassifikation von MVS verwendeter Algorithmus: k-nächste-nachbarn-verfahren hinreichend schnell, einfach zu implementieren untersuchte Distanzmaße: Euklidischer Abstand modifizierter euklidischer Abstand (dazu Komplexitätsmaß nach [BWK11]) Pearson-Distanz FM-Distanz [OFH08] Dynamic Time Warping (DTW) Folie 70

71 Oberkörpergestenerkennung semaphorisch Klassifikation von MVS Schwächen der klassischen Maße: MVS müssen gleiche Länge haben (lösbar über Resampling) Φ(t) 7 6 Bsp. 1D Zeitreihen Zuordnung der MV-Korrespondenzen ist festgelegt t φ1 φ2 Folie 71

72 Oberkörpergestenerkennung semaphorisch Klassifikation von MVS Schwächen der klassischen Maße: MVS müssen gleiche Länge haben (lösbar über Resampling) Φ(t) 7 6 Bsp. 1D Zeitreihen Zuordnung der MV-Korrespondenzen ist festgelegt Vorteil DTW: 2 lokale Anpassung der MV-Korrespondenzen t φ1 φ2 Folie 72

73 Gestenerkennung Übersicht Gesamtsystem Kinect Tiefendaten Skelettdaten Posenmodell Handpositionen Körperwinkel Gestenerkenner Handerkennung Applikation Klassifizierung der Handform Ergebnis d. Klassifikation Virtuelle Handkoordinaten Nutzeraktion Oberkörpergestenerkennung Körperwinkel? Folge von Körperhaltungen? Folie 73

74 Gestenerkennung Übersicht Gesamtsystem Kinect Tiefendaten Skelettdaten Posenmodell Handpositionen Gestenerkenner Handerkennung Klassifizierung der Handform Virtuelle Handkoordinaten Applikation Ergebnis d. Klassifikation Nutzeraktion Körperwinkel Merkmalsvektoren Oberkörpergestenerkennung Abbilden von Merkmalsvektoren Auffinden u. Klassifizieren von Merkmalsvektorsequenzen Ergebnis d. Klassifikation Folie 74

75 Gestenerkennung Übersicht Gesamtsystem Kinect Tiefendaten Skelettdaten Posenmodell Handpositionen Gestenerkenner Handerkennung Klassifizierung der Handform Virtuelle Handkoordinaten Applikation Ergebnis d. Klassifikation Nutzeraktion Körperwinkel Merkmalsvektoren Oberkörpergestenerkennung Abbilden von Merkmalsvektoren Auffinden u. Klassifizieren von Merkmalsvektorsequenzen Ergebnis d. Klassifikation Folie 75

76 3. Diskussion Folie 76

77 Evaluation Übersicht Was wurde untersucht? Klassifikationsraten Geschwindigkeit Folie 77

78 Evaluation Handform Klassifikation der Handform Testdaten: 2500 Trainingsbeispiele, unterschiedliche Abstände zur Kamera, verschiedene Ausführgeschwindigkeiten, Hand frontal zur Kamera Ergebnisse: Eingabe der geschlossenen Hand stets zu 100% korrekt klassifiziert korrekte Klassifizierung der geöffneten Hand fällt ab bestimmten Abstand stark ab Ø Rechenzeit pro Klassifikation: 0,37 ms Folie 78

79 Evaluation Handform Klassifikation der Handform Distanzbereich richtig erkannt falsch erkannt Genauigkeit geschlossene Hand mm 100% 0% 100% mm 100% 0% 96,76% >1900mm 100% 0% 52,96% offene Hand mm 100% 0% 100% mm 96,65% 3,35% 100% >1900mm 11,18% 88,82% 100% Distanzbereich Korrektklassifikationsrate Falschklassifikationsrate mm 100% 0% mm 98,33% 1,67% >1900mm 55,59% 44,41% Genauigkeit (precision) = Klasse X richtig erkannt Klasse X erkannt = true positives true positives+false positives Korrektklassifikationsrate (accuracy) = Anz. der korrekt erkannten Gesten Gesamtheit der eingegeben Gesten = true pos. + true neg. true pos. + true neg. + false pos. + false neg. Folie 79

80 Evaluation Handform Klassifikation der Handform Distanzbereich richtig erkannt falsch erkannt Genauigkeit geschlossene Hand mm 100% 0% 100% mm 100% 0% 96,76% >1900mm 100% 0% 52,96% offene Hand mm 100% 0% 100% mm 96,65% 3,35% 100% >1900mm 11,18% 88,82% 100% Distanzbereich Korrektklassifikationsrate Falschklassifikationsrate mm 100% 0% mm 98,33% 1,67% >1900mm 55,59% 44,41% Genauigkeit (precision) = Klasse X richtig erkannt Klasse X erkannt = true positives true positives+false positives Korrektklassifikationsrate (accuracy) = Anz. der korrekt erkannten Gesten Gesamtheit der eingegeben Gesten = true pos. + true neg. true pos. + true neg. + false pos. + false neg. Folie 80

81 Evaluation Klassifikation der MVS Klassifikation der MVS Testdaten: 600 Trainings-Bsp., 10 Klassen 2 Gruppen: 50 Test- u. 10 Referenz-Bsp. pro Klasse Test 1: isolierte Klassifikation Distanzmaß k R F N KK ØRZ Eukl. Abstand ,4% 1,35 ms Mod. Eukl. Abstand ,8% 1,44 ms Pearson- Distanz ,4% 3,33 ms Dynamic Time Warping ,4% 1,22 ms FM-Distanz ,6% 2,52 ms k: Anzahl d. Nachbarn, R: richtig erkannt, F: falsch erkannt, N: nicht erkannt, KK: Korrektklassifikationsrate, ØRZ: durchschnittliche Rechenzeit Folie 81

82 Evaluation Klassifikation der MVS Klassifikation der MVS Testdaten: 600 Trainings-Bsp., 10 Klassen 2 Gruppen: 50 Test- u. 10 Referenz-Bsp. pro Klasse Test 1: isolierte Klassifikation Distanzmaß k R F N KK ØRZ Eukl. Abstand ,4% 1,35 ms Mod. Eukl. Abstand ,8% 1,44 ms Pearson- Distanz ,4% 3,33 ms Dynamic Time Warping ,4% 1,22 ms FM-Distanz ,6% 2,52 ms k: Anzahl d. Nachbarn, R: richtig erkannt, F: falsch erkannt, N: nicht erkannt, KK: Korrektklassifikationsrate, ØRZ: durchschnittliche Rechenzeit gut und schnell Folie 82

83 Evaluation Klassifikation der MVS Klassifikation der MVS gute Ergebnisse für alle Distanzmaße, Eignung im laufenden Betrieb? Test 2: Klassifikation zur Laufzeit Ausführung der 10 Gesten in unterschiedl. Reihenfolge, insgesamt 600 Ausführungen On-The-Fly-Erkennung durch das parallele System von Finden und Klassifizieren nur DTW-Verfahren bringt hier gute Ergebnisse bei den anderen: häufig fälschliche Klassifikationen von Nicht-Gesten (false positives) Folie 83

84 Evaluation Klassifikation der MVS Test 2: Klassifikation zur Laufzeit Gesamtergebnis (DTW): Anzahl der Gesten: 600 richtig erkannt: 574 falsch erkannt: 7 nicht erkannt: 19 Korrektklassifikationsrate: 95,67% Ø Genauigkeit: 98,85% Geschwindigkeitsbetrachtung: Festlegung: Gesten < 3s, Suchfenstergröße 12 Ø RZ = 84 ms (pro Fenster) < 267 ms (Ø Markierungsintervall), Ø Latenz ca. 1-4 Markierungsintervalle (267ms-1067ms), maximal 3,17s Folie 84

85 Bewertung der Ergebnisse Handerkennung Handposition + Ruhige Zeigerführung, Latenz vertretbar, Details bleiben erhalten + nichtlineare Skalierung erlaubt Zielgenauigkeit und gleichzeitig großen Arbeitsbereich kein vollständiges Ausgleichen von Tracking-Ungenauigkeiten Handform + gute Erkennung in bestimmten Distanzbereich + schnell (ca. 1% von Frame-Dauer) kleiner nutzbarer Tiefenbereich durch Mindestabstand d. Nutzers zur Kinect Erkennung von OKG + für überschaubare Anzahl selbstdefinierter Gesten gute Ergebnisse + schnell systembedingte maximale Verzögerung Folie 85

86 Ausblick Erweiterungspotenzial: Verbesserung d. Handformerkennung unter Einbeziehung d. Videobildes Erkennung von Fingerstellungen mehrere Kinects synchronisieren größerer effektiver Nutzerbereich effektiveres Training durch halbautomatisches Labeling... Folie 86

87 4. Demonstration Folie 87

88 Folie 88

89 Details Folie 89

90 Details Glättung der Torsopunkte Beobachtung: stabilster Punkt ist s 1 1. Annahme: Nutzer bleibt an Ort und Stelle Glättung von s 1 : s 1,t 1 β s 1,t + β s 1,t 1 s 3 s 2 s 8 s v 4 i s 9 s 5 s 1 2. Annahme: Torso ist starr s 0 s 10 s 6 s 11 s 16 s 12 s 7 Stützvektoren v i,t s i,t s 1,t für i {0,2,4,8,12,16} werden temporal geglättet: v i,t 1 α v i,t + α v i,t 1 s 17 s 13 Berechnung rekonstruierter Torsopunkte s i,t s i,t s 1,t + v i,t für i {0,2,4,8,12,16} s 18 s 14 s 19 s 15 Folie 90

91 Details nicht-lineare Skalierung Übersetzung von Hand- zu Zeigerposition: SENSITIVITÄT := Änderung der ausgehenden Zeigerposition Änderung der eingehenden Handposition σ t Δp L R t L R Δx t Δp t L R = σt Δx t L R L R L R L R mit Δx t = xt xt 1 L R L R L R und Δpt = pt pt 1 einfacher Ansatz: σ t = σ 0 = const. Problem: genaue Positionierung bei kleinem Wert, großer Bildschirmbereich bei großem Wert wünschenswert: BEIDES! Folie 91

92 Details nicht-lineare Skalierung Nicht-lineare Sensitivitäts-Skalierung (vgl. Mauszeigerbeschleunigung): SENSITIVITÄT = Skalierungskoeffizient x Betrag der Positionsänderung σ t ε ε Δx t L R großes Verhältnis bei schnellen, kleines Verhältnis bei langsamen Hand-Bewegungen Δp t L R = ε Δxt L R Δx t L R p t L R = ε Δxt L R L R L R Δx t + pt 1 Wahl von ε empirisch, resultiert in 1:1 - Übersetzung bei einer mittelschnellen Positionsänderung, entspricht 0,025 m pro Frame (~2,7 km/h): 1 = ε Δx m L R ε = 1 Δx m L R = 1 0,025 = 40 Folie 92

93 Details nicht-lineare Skalierung Nicht-lineare Sensitivitäts-Skalierung (vgl. Mauszeigerbeschleunigung): 5 L R Δp t Δx t L R ε = 5 ε = 10 ε = 20 ε = 40 ε = 80 Folie 93

94 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Nutzerinteraktion zur Laufzeit Strom der MV... Folie 94

95 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Folie 95

96 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Suchfenster konstante Länge Folie 96

97 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Suchfenster temporäre MVS Folie 97

98 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Suchfenster temporäre MVS Folie 98

99 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Suchfenster temporäre MVS Folie 99

100 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Suchfenster temporäre MVS Folie 100

101 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Suchfenster temporäre MVS Trainingsdaten Folie 101

102 Klassifikation Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Suchfenster temporäre MVS Trainingsdaten Folie 102

103 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Suchfenster temporäre MVS Gewinner! Folie 103

104 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Suchfenster neuer Suchbeginn Folie 104

105 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Suchfenster Folie 105

106 Details Suchfenster Vorgehen (II) Suchfensteralgorithmus Strom der MV... Markierungen Suchfenster Folie 106

107 Klassifikation Details Suchfenster Trainingsdaten Folie 107

108 Details knn-algorithmus Klassifikation von MVS k-nearest-neighbour-algorithmus Folie 108

109 Details knn-algorithmus Klassifikation von MVS k-nearest-neighbour-algorithmus Raum der MVS Klasse 1 Klasse 2 Klasse 3 Folie 109

110 Details knn-algorithmus Klassifikation von MVS k-nearest-neighbour-algorithmus Raum der MVS? zu klassifizierende MVS Klasse 1 Klasse 2 Klasse 3 Folie 110

111 Details knn-algorithmus Klassifikation von MVS k-nearest-neighbour-algorithmus Raum der MVS suche die k nächstliegenden Nachbarn? Klasse 1 Klasse 2 Klasse 3 Folie 111

112 Details knn-algorithmus Klassifikation von MVS k-nearest-neighbour-algorithmus Raum der MVS suche die k nächstliegenden Nachbarn? Klasse 1 Klasse 2 Klasse 3 Folie 112

113 Details knn-algorithmus Klassifikation von MVS k-nearest-neighbour-algorithmus Raum der MVS suche die k nächstliegenden Nachbarn naive Klassifikation: Zählen? gewinnt Klasse 1 Klasse 2 Klasse 3 Folie 113

114 Details knn-algorithmus Klassifikation von MVS k-nearest-neighbour-algorithmus Raum der MVS suche die k nächstliegenden Nachbarn naive Klassifikation: Zählen? gewinnt besser: Gewichtete Summen 1 Punkte der Klasse X = Σ Distanz zu MVS MVS Є X Klasse 1 Klasse 2 Klasse 3 Folie 114

115 Details knn-algorithmus Klassifikation von MVS k-nearest-neighbour-algorithmus Raum der MVS suche die k nächstliegenden Nachbarn naive Klassifikation: Zählen gewinnt besser: Gewichtete Summen 1 Punkte der Klasse X = Σ Distanz zu MVS MVS Є X Klasse 1 gewinnt Klasse 2 Klasse 3 Folie 115

116 Details knn-algorithmus Klassifikation von MVS Raum der MVS Wie werden die Distanzen berechnet????? Klasse 1 Klasse 2 Klasse 3 Folie 116

117 Details Distanzmaße Anmerkungen: grundsätzlich keine Normalisierung der MV nötig, da Winkel in der gleichen Größenordnung liegen Studentisierung birgt die Gefahr, dass Rauschanteile deutlicheren Einfluss auf das Klassifikationsergebnis haben aber Skalierung entlang der Anzahl der MV zur Vergleichbarkeit unterschiedlich langer Gesten Def. Merkmalsvektorsequenz von Zeitpunkt i bis Zeitpunkt j: Φ i,j φ i, φ i+1,, φ j 1, φ j mit i < j φ i geglätter Merkmalsvektor Folie 117

118 Details Distanzmaße Metrik: 8 d φ i, φ j = φ n,i φ 2 n,j n=1 Φ k i,j k-ter Eintrag in der MVS Euklidischer Abstand D Euklid Φ (i,j ), Φ (g,h) = 1 N N k=1 d Φ k i,j, Φk g,h 2 N Φ (i,j ) = Φ (g,h) Folie 118

119 Details Distanzmaße modifizierter Euklidischer Abstand Komplexitätsmaß CE nach [BWK11] Φ k i,j k-ter Eintrag in der MVS CE Φ (i,j ) > CE Φ (g,h) T (i,j ) > T (g,h) Bahnlänge der Trajektorie: T (i,j ) i,j i,j = d Φ k, Φk 1 j k=i+1 Korrekturfaktor CF: CF Φ (i,j ), Φ (g,h) max CE Φ(i,j ), CE Φ (g,h) min CE Φ (i,j ), CE Φ (g,h) = max T(i,j ), T (g,h) min T (i,j ), T (g,h) D mod.euklid Φ (i,j ), Φ (g,h) D Euklid Φ (i,j ), Φ (g,h) CF Φ (i,j ), Φ (g,h) Folie 119

120 Details Distanzmaße Pearson-Distanz Korrelationskoeffizienten pro Merkmalsdimension m: (i,j ) Φ m,k k-ter Eintrag in der m-ten Dimension einer MVS ρ m Φ (i,j ), Φ (g,h) N k=1 N k=1 (i,j ) (i,j) Φ m,k Φm,k i,j i,j Φ 2 m,k Φm,k (g,h) (g,h) Φ m,k Φm,k g,h g,h Φ 2 m,k Φm,k N Φ (i,j ) = Φ (g,h) (i,j) 1 Φ m,k N N k=1 (i,j ) Φ m,k D Pearson Φ (i,j ), Φ (g,h) 1 N 8 m =1 1 ρ m Φ (i,j ), Φ (g,h) Folie 120

121 Details Distanzmaße FM-Distanz [OFH08] Kinetische Energie pro Merkmalsdimension m: 2 E m,k m m v m,k mit v m,k = Φ m,k (i,j ) (i,j ) Φm,k 1 Δt (i,j ) Φ m,k k-ter Eintrag in der m-ten Dimension einer MVS lässt sich vereinfachen zu: i,j i,j E m,k Φ m,k Φm,k 1 2 mittlere Energie der m-ten Merkmalszeitreihe: N E m 1 N 1 Energievektoren k=2 e e 1, e 2,, e 8 E m,k logarithmische Skalierung: e m log E m D FM Φ i,j, Φ g,h i,j g,h e 2 k ek k=1 Folie 121

122 03 Gestenerkennung Gesture Recognition DYNAMIC TIME WARPING Voraussetzung: lokales Distanzmaß (auch Kostenfunktion genannt) d: ϕ ϕ R +, d ϕ i, ϕ j = ϕ i ϕ j Input: zwei Merkmalsvektor-Zeitreihen, die aus den Posen einer Geste gewonnen werden φ (ij) = ϕ i, ϕ i+1,, ϕ k,, ϕ j 1, ϕ j mit ϕ k = φ P k für P k G (ij) φ k ij = ϕi+k 1 mit k [1, j i + 1] Ziel des Algorithmus: Verknüpfen von zusammengehörenden Merkmalsvektorpaaren aus beiden Zeitreihen, sodass die akkumulierte Distanz minimal wird TU Dresden, Folie 15 von 22

123 03 Gestenerkennung Gesture Recognition DYNAMIC TIME WARPING Grundlagen 1. lokale Kostenmatrix C aller paarweisen Distanzen: C R M N, C mn d φ m (gh), φn (ij), m 1, M, n 1, N 2. Warping-Pfad Q: ist eine Folge von Indexpaaren (stellvertretend für die Merkmalsvektorpaare): Q = q 1, q 2,, q L mit q l = m l, n l für l [1, L] Distanz zwischen beiden Zeitreihen entspricht den akkumulierten Kosten entlang des Pfades Q: L Distanz Q φ gh, φ (ij) = l=1 gh ij d φ ml, φnl TU Dresden, Folie 16 von 22

124 03 Gestenerkennung Gesture Recognition DYNAMIC TIME WARPING Grundlagen Warping-Pfad muss folgende Bedingungen erfüllen: q 1 = 1,1 und q L = (M, N) Boundary Kriterium: (Start- und Endindexpaar des Pfades muss Start- und Endindizes der beiden Zeitreihen entsprechen) Monotonie Kriterium: (Zeitordnung muss erhalten bleiben) m 0 m 1 m L und n 0 n 1 n L Schrittgrößen Kriterium: (Es dürfen keine Sprünge entlang des Pfades auftreten) q l+1 q l 0,1, 1,0, (1,1) für l [1, L 1] TU Dresden, Folie 17 von 22

125 03 Gestenerkennung Gesture Recognition DYNAMIC TIME WARPING Vorgehen Unter der Menge aller möglichen Pfade ist derjenige mit den minimalen Gesamtkosten gesucht D R M N Definition einer globalen Kostenmatrix : n (gh) (ij) 1. Zeile: D 1,n = d φ 1, φk für n [1, N] k=1 m (gh) (ij) 1. Spalte: D m,1 = d φ k, φ1 für m [1, M] k=1 Sonst: D m,n = d φ m (gh), φn (ij) + min D m 1,n 1, D m 1,n, D m,n 1 für m 2, M und n [2, N] Der Eintrag D M,N enthält die Gesamtkosten des optimalen Pfades (dieser kann explizit durch Backtracking ermittelt werden) liegen sie unter einem definierten Schwellwert, so werden die Gesten als übereinstimmend erkannt TU Dresden, Folie 18 von 22

126 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: TU Dresden, Folie 19 von 22

127 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Zeile und 1. Spalte setzen TU Dresden, Folie 19 von 22

128 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Zeile und 1. Spalte setzen TU Dresden, Folie 19 von 22

129 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Zeile und 1. Spalte setzen TU Dresden, Folie 19 von 22

130 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Zeile und 1. Spalte setzen TU Dresden, Folie 19 von 22

131 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Zeile und 1. Spalte setzen TU Dresden, Folie 19 von 22

132 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Zeile und 1. Spalte setzen TU Dresden, Folie 19 von 22

133 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Zeile und 1. Spalte setzen TU Dresden, Folie 19 von 22

134 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Zeile und 1. Spalte setzen TU Dresden, Folie 19 von 22

135 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Zeile und 1. Spalte setzen TU Dresden, Folie 19 von 22

136 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Restliche Einträge: = + min (,, ) TU Dresden, Folie 19 von 22

137 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Restliche Einträge: = + min (,, ) TU Dresden, Folie 19 von 22

138 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Restliche Einträge: = + min (,, ) TU Dresden, Folie 19 von 22

139 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Restliche Einträge: = + min (,, ) TU Dresden, Folie 19 von 22

140 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Restliche Einträge: = + min (,, ) TU Dresden, Folie 19 von 22

141 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Restliche Einträge: = + min (,, ) TU Dresden, Folie 19 von 22

142 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Restliche Einträge: = + min (,, ) TU Dresden, Folie 19 von 22

143 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Restliche Einträge: = + min (,, ) TU Dresden, Folie 19 von 22

144 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Backtracking: = min (,, ) TU Dresden, Folie 19 von 22

145 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Backtracking: = min (,, ) TU Dresden, Folie 19 von 22

146 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Backtracking: = min (,, ) TU Dresden, Folie 19 von 22

147 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Backtracking: = min (,, ) TU Dresden, Folie 19 von 22

148 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Backtracking: = min (,, ) TU Dresden, Folie 19 von 22

149 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Backtracking: = min (,, ) TU Dresden, Folie 19 von 22

150 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Backtracking: = min (,, ) TU Dresden, Folie 19 von 22

151 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Backtracking: = min (,, ) TU Dresden, Folie 19 von 22

152 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Backtracking: = min (,, ) TU Dresden, Folie 19 von 22

153 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Backtracking: = min (,, ) TU Dresden, Folie 19 von 22

154 Referenz 03 Gestenerkennung Bsp. Lokale Distanzmatrix C: Φ(t) t Referenz Input Distanz herkömmlich berechnet: d=13 Input Globale Distanzmatrix D: Backtracking: = min (,, ) TU Dresden, Folie 19 von 22

Gestenerkennung. Yannick Jonetzko Yannick Jonetzko

Gestenerkennung. Yannick Jonetzko Yannick Jonetzko 30.04.2015 Inhalt Motivation Definition Geste Historie / Anwendungsbereiche Arten der Funktionsweise anhand eines Papers Alternativen Fazit Seite 2 Motivation Human Computer Interaction Gesten sind in

Mehr

Diplomarbeit. Gestenbasierte Steuerung von interaktiven Umgebungen mithilfe der Microsoft Kinect

Diplomarbeit. Gestenbasierte Steuerung von interaktiven Umgebungen mithilfe der Microsoft Kinect TECHNISCHE UNIVERSITÄT DRESDEN FAKULTÄT INFORMATIK INSTITUT FÜR SOFTWARE- UND MULTIMEDIATECHNIK PROFESSUR FÜR COMPUTERGRAPHIK UND VISUALISIERUNG PROF. DR. STEFAN GUMHOLD Diplomarbeit zur Erlangung des

Mehr

Algorithmen für Geographische Informationssysteme

Algorithmen für Geographische Informationssysteme Algorithmen für Geographische Informationssysteme 2. Vorlesung: 16. April 2014 Thomas van Dijk basiert auf Folien von Jan-Henrik Haunert Map Matching? Map Matching! Map Matching...als Teil von Fahrzeugnavigationssystemen

Mehr

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten Albert-Ludwigs-Universität zu Freiburg 13.09.2016 Maximilian Dippel max.dippel@tf.uni-freiburg.de Überblick I Einführung Problemstellung

Mehr

9 SLAM Simultaneous Localization and Mapping

9 SLAM Simultaneous Localization and Mapping 9 SLAM Simultaneous Localization and Mapping Einleitung eines der aktivsten Forschungsgebiete innerhalb der Robotik Roboterlokalisierung bei gegebener Karte (Kap. 8 und Karte aus Sensordaten bei bekannter

Mehr

Echtzeitfähige Algorithmen für markerloses Tracking und Umfelderkennung , Dr.-Ing. Steffen Herbort, A.R.T. GmbH

Echtzeitfähige Algorithmen für markerloses Tracking und Umfelderkennung , Dr.-Ing. Steffen Herbort, A.R.T. GmbH Echtzeitfähige Algorithmen für markerloses Tracking und Umfelderkennung 26.10.2016, TP 2: Arbeiten von A.R.T. TP2: Tracking und Umfelderkennung Markerloses Tracking texturierte Objekte Umfelderkennung

Mehr

Suche nach korrespondierenden Pixeln

Suche nach korrespondierenden Pixeln Suche nach korrespondierenden Pixeln Seminar Algorithmen zur Erzeugung von Panoramabildern Philip Mildner, Gliederung 1. Motivation 2. Anforderungen 3. Moravec Detektor 4. Harris Detektor 5. Scale Invariant

Mehr

1 Einleitung Definitionen, Begriffe Grundsätzliche Vorgehensweise... 3

1 Einleitung Definitionen, Begriffe Grundsätzliche Vorgehensweise... 3 Inhaltsverzeichnis 1 Einleitung 1 1.1 Definitionen, Begriffe........................... 1 1.2 Grundsätzliche Vorgehensweise.................... 3 2 Intuitive Klassifikation 6 2.1 Abstandsmessung zur Klassifikation..................

Mehr

Inhalt. Mathematik für Chemiker II Lineare Algebra. Vorlesung im Sommersemester Kurt Frischmuth. Rostock, April Juli 2015

Inhalt. Mathematik für Chemiker II Lineare Algebra. Vorlesung im Sommersemester Kurt Frischmuth. Rostock, April Juli 2015 Inhalt Mathematik für Chemiker II Lineare Algebra Vorlesung im Sommersemester 5 Rostock, April Juli 5 Vektoren und Matrizen Abbildungen 3 Gleichungssysteme 4 Eigenwerte 5 Funktionen mehrerer Variabler

Mehr

Klassifikation durch direkten Vergleich (Matching)

Klassifikation durch direkten Vergleich (Matching) Klassifikation durch direkten Vergleich (Matching) Eine triviale Lösung für die Klassifikation ergibt sich durch direkten Vergleich des unbekannten Musters in allen Erscheinungsformen der Äquivalenzklasse

Mehr

2. Schnitterkennung Video - Inhaltsanalyse

2. Schnitterkennung Video - Inhaltsanalyse 2. Schnitterkennung Video - Inhaltsanalyse Stephan Kopf Definition: Schnitt Schnitte (cut) liefern Informationen über den Produktionsprozess eines Filmes. trennen kontinuierliche Aufnahmen, die als Kameraeinstellungen

Mehr

Proseminar "Aufgabenstellungen der Bildanalyse und Mustererkennung"

Proseminar Aufgabenstellungen der Bildanalyse und Mustererkennung Fakultät Informatik, Institut für künstliche Intelligenz, Intelligent Systems Proseminar "Aufgabenstellungen der Bildanalyse und Mustererkennung" Lokale Merkmalsdeskriptoren Jens Stormberg - Dresden, 19.06.2009

Mehr

Recommender Systeme mit Collaborative Filtering

Recommender Systeme mit Collaborative Filtering Fakultät für Informatik Technische Universität München Email: rene.romen@tum.de 6. Juni 2017 Recommender Systeme Definition Ziel eines Recommender Systems ist es Benutzern Items vorzuschlagen die diesem

Mehr

1. Grundlagen der ebenen Kinematik

1. Grundlagen der ebenen Kinematik Lage: Die Lage eines starren Körpers in der Ebene ist durch die Angabe von zwei Punkten A und P eindeutig festgelegt. Die Lage eines beliebigen Punktes P wird durch Polarkoordinaten bezüglich des Bezugspunktes

Mehr

Pareto optimale lineare Klassifikation

Pareto optimale lineare Klassifikation Seminar aus Maschinellem Lernen Pareto optimale lineare Klassifikation Vesselina Poulkova Betreuer: Eneldo Loza Mencía Gliederung 1. Einleitung 2. Pareto optimale lineare Klassifizierer 3. Generelle Voraussetzung

Mehr

Algorithmische Bioinformatik 1

Algorithmische Bioinformatik 1 Algorithmische Bioinformatik 1 Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Sommersemester 2009 Übersicht Algorithmen

Mehr

PP Physikalisches Pendel

PP Physikalisches Pendel PP Physikalisches Pendel Blockpraktikum Frühjahr 2007 (Gruppe 2) 25. April 2007 Inhaltsverzeichnis 1 Einführung 2 2 Theoretische Grundlagen 2 2.1 Ungedämpftes physikalisches Pendel.......... 2 2.2 Dämpfung

Mehr

3. Analyse der Kamerabewegung Video - Inhaltsanalyse

3. Analyse der Kamerabewegung Video - Inhaltsanalyse 3. Analyse der Kamerabewegung Video - Inhaltsanalyse Stephan Kopf Bewegungen in Videos Objektbewegungen (object motion) Kameraoperationen bzw. Kamerabewegungen (camera motion) Semantische Informationen

Mehr

Bachelorarbeit Erkennung von Fließtext in PDF-Dokumenten

Bachelorarbeit Erkennung von Fließtext in PDF-Dokumenten Bachelorarbeit Erkennung von Fließtext in PDF-Dokumenten 16.08.2016 David Spisla Albert Ludwigs Universität Freiburg Technische Fakultät Institut für Informatik Gliederung Motivation Schwierigkeiten bei

Mehr

2.3.4 Drehungen in drei Dimensionen

2.3.4 Drehungen in drei Dimensionen 2.3.4 Drehungen in drei Dimensionen Wir verallgemeinern die bisherigen Betrachtungen nun auf den dreidimensionalen Fall. Für Drehungen des Koordinatensystems um die Koordinatenachsen ergibt sich 1 x 1

Mehr

Support Vector Machines (SVM)

Support Vector Machines (SVM) Universität Ulm 12. Juni 2007 Inhalt 1 2 3 Grundlegende Idee Der Kern-Trick 4 5 Multi-Klassen-Einteilung Vor- und Nachteile der SVM 1 2 3 Grundlegende Idee Der Kern-Trick 4 5 Multi-Klassen-Einteilung Vor-

Mehr

Bildverarbeitung Herbstsemester. Mustererkennung

Bildverarbeitung Herbstsemester. Mustererkennung Bildverarbeitung Herbstsemester Herbstsemester 2009 2012 Mustererkennung 1 Inhalt Einführung Mustererkennung in Grauwertbildern Ähnlichkeitsmasse Normalisierte Korrelation Korrelationskoeffizient Mustererkennung

Mehr

Vorstellung des Großen Belegs: Entwurf eines modellbasierten Regelungssystems für einen totzeitbehafteten Prozess

Vorstellung des Großen Belegs: Entwurf eines modellbasierten Regelungssystems für einen totzeitbehafteten Prozess Fakultät Informatik Institut für angewandte Informatik- Professur Technische Informationssysteme Vorstellung des Großen Belegs: Entwurf eines modellbasierten Regelungssystems für einen totzeitbehafteten

Mehr

Distributed Algorithms. Image and Video Processing

Distributed Algorithms. Image and Video Processing Chapter 6 Optical Character Recognition Distributed Algorithms for Übersicht Motivation Texterkennung in Bildern und Videos 1. Erkennung von Textregionen/Textzeilen 2. Segmentierung einzelner Buchstaben

Mehr

Voronoi-Diagramme. Dr. Martin Nöllenburg Vorlesung Algorithmische Geometrie INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK

Voronoi-Diagramme. Dr. Martin Nöllenburg Vorlesung Algorithmische Geometrie INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK Vorlesung Algorithmische Geometrie INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK Martin Nöllenburg 29.05.2011 Das Postamt-Problem b(p, q) = {x R 2 : xp = xq } p q h(p, q) h(q, p) = {x :

Mehr

6. Texterkennung in Videos Videoanalyse

6. Texterkennung in Videos Videoanalyse 6. Texterkennung in Videos Videoanalyse Dr. Stephan Kopf 1 Übersicht Motivation Texterkennung in Videos 1. Erkennung von Textregionen/Textzeilen 2. Segmentierung einzelner Buchstaben 3. Auswahl der Buchstabenpixel

Mehr

Übung Angewandte Biosignalverarbeitung

Übung Angewandte Biosignalverarbeitung Übung Angewandte Biosignalverarbeitung Dr.-Ing. Sebastian Zaunseder e-mail: Sebastian.Zaunseder@tu-dresden.de Telefon: +49 (0)351 463 33786 Raum: Fetscherforum, 1. OG, Raum 32 Die Aufgabe - Schlagdetektion

Mehr

2. Schnitterkennung Videoanalyse

2. Schnitterkennung Videoanalyse 2. Schnitterkennung Videoanalyse Stephan Kopf Inhalt Definition: Schnitt Klassifikation eines Schnittes Vorgehensweise bei der automatischen Schnitterkennung Pixelbasierte Verfahren Histogramme Aggregierte

Mehr

Anhang: Ungarische Methode

Anhang: Ungarische Methode Ungarische Methode 107 Anhang: Ungarische Methode Zum Schluss des Kurses soll noch der Algorithmus der Ungarischen Methode beschrieben werden. Wir lehnen uns hierbei eng an der Darstellung von DOMSCHKE

Mehr

Einführung in Support Vector Machines (SVMs)

Einführung in Support Vector Machines (SVMs) Einführung in (SVM) Januar 31, 2011 Einführung in (SVMs) Table of contents Motivation Einführung in (SVMs) Outline Motivation Vektorrepräsentation Klassifikation Motivation Einführung in (SVMs) Vektorrepräsentation

Mehr

Graphenalgorithmen und lineare Algebra Hand in Hand Prof. Dr. Henning Meyerhenke

Graphenalgorithmen und lineare Algebra Hand in Hand Prof. Dr. Henning Meyerhenke Graphenalgorithmen und lineare Algebra Hand in Hand Prof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 KIT Henning Universität desmeyerhenke, Landes Baden-Württemberg Institutund für Theoretische

Mehr

How To Create A Panorama Image From A Photoelectric Image From An Image From The Camera (I)

How To Create A Panorama Image From A Photoelectric Image From An Image From The Camera (I) Chapter 3 Image Registration Distributed Algorithms for Einführung (I) Definition: Image Registration Gegeben: 2 Bilder der gleichen Szene aber aufgenommen aus unterschiedlichen Perspektiven Gesucht: Transformation,

Mehr

Mustererkennung: Neuronale Netze. D. Schlesinger ()Mustererkennung: Neuronale Netze 1 / 12

Mustererkennung: Neuronale Netze. D. Schlesinger ()Mustererkennung: Neuronale Netze 1 / 12 Mustererkennung: Neuronale Netze D. Schlesinger ()Mustererkennung: Neuronale Netze 1 / 12 Feed-Forward Netze y 1 y 2 y m...... x 1 x 2 x n Output Schicht i max... Zwischenschicht i... Zwischenschicht 1

Mehr

Lineare Algebra und Numerische Mathematik für D-BAUG

Lineare Algebra und Numerische Mathematik für D-BAUG P. Grohs T. Welti F. Weber Herbstsemester 5 Lineare Algebra und Numerische Mathematik für D-BAUG ETH Zürich D-MATH Beispiellösung für Serie Aufgabe. Skalarprodukt und Orthogonalität.a) Bezüglich des euklidischen

Mehr

Maschinelles Lernen: Symbolische Ansätze

Maschinelles Lernen: Symbolische Ansätze Maschinelles Lernen: Symbolische Ansätze Wintersemester 2009/2010 Musterlösung für das 1. Übungsblatt Aufgabe 1: Anwendungsszenario Überlegen Sie sich ein neues Szenario des klassifizierenden Lernens (kein

Mehr

Mustererkennung. Übersicht. Unüberwachtes Lernen. (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren Gaussian-Mixture Modelle

Mustererkennung. Übersicht. Unüberwachtes Lernen. (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren Gaussian-Mixture Modelle Mustererkennung Unüberwachtes Lernen R. Neubecker, WS 01 / 01 Übersicht (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren 1 Lernen Überwachtes Lernen Zum Training des Klassifikators

Mehr

Nichtlineare Klassifikatoren

Nichtlineare Klassifikatoren Nichtlineare Klassifikatoren Mustererkennung und Klassifikation, Vorlesung No. 11 1 M. O. Franz 12.01.2008 1 falls nicht anders vermerkt, sind die Abbildungen entnommen aus Duda et al., 2001. Übersicht

Mehr

3 Matrizenrechnung. 3. November

3 Matrizenrechnung. 3. November 3. November 008 4 3 Matrizenrechnung 3.1 Transponierter Vektor: Die Notation x R n bezieht sich per Definition 1 immer auf einen stehenden Vektor, x 1 x x =.. x n Der transponierte Vektor x T ist das zugehörige

Mehr

1. Musterlösung. Problem 1: Average-case-Laufzeit vs. Worst-case-Laufzeit ** i=1

1. Musterlösung. Problem 1: Average-case-Laufzeit vs. Worst-case-Laufzeit ** i=1 Universität Karlsruhe Algorithmentechnik Fakultät für Informatik WS 05/06 ITI Wagner. Musterlösung Problem : Average-case-Laufzeit vs. Worst-case-Laufzeit ** (a) Im schlimmsten Fall werden für jedes Element

Mehr

2.9 Gedämpfter Harmonischer Oszillator

2.9 Gedämpfter Harmonischer Oszillator 72 KAPITEL 2. DYNAMIK EINES MASSENPUNKTES 2.9 Gedämpfter Harmonischer Oszillator In diesem Abschnitt wollen wir die Bewegung eines Massenpunktes betrachten, der sich in einer Raumrichtung x in einer Harmonischen

Mehr

k-nächste-nachbarn-schätzung

k-nächste-nachbarn-schätzung k-nächste-nachbarn-schätzung Mustererkennung und Klassifikation, Vorlesung No. 7 1 M. O. Franz 29.11.2007 1 falls nicht anders vermerkt, sind die Abbildungen entnommen aus Duda et al., 2001. Übersicht

Mehr

Mustererkennung. Support Vector Machines. R. Neubecker, WS 2018 / Support Vector Machines

Mustererkennung. Support Vector Machines. R. Neubecker, WS 2018 / Support Vector Machines Mustererkennung R. Neubecker, WS 018 / 019 (SVM) kommen aus der statistischen Lerntheorie gehören zu den optimalen Klassifikatoren = SVMs minimieren nicht nur den Trainingsfehler, sondern auch den (voraussichtlichen)

Mehr

Kapitel 10. Maschinelles Lernen Lineare Regression. Welche Gerade? Problemstellung. Th. Jahn. Sommersemester 2017

Kapitel 10. Maschinelles Lernen Lineare Regression. Welche Gerade? Problemstellung. Th. Jahn. Sommersemester 2017 10.1 Sommersemester 2017 Problemstellung Welche Gerade? Gegeben sind folgende Messungen: Masse (kg) 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 Kraft (N) 1.6 2.2 3.2 3.0 4.9 5.7 7.1 7.3 8.1 Annahme: Es gibt eine Funktion

Mehr

Hallo Welt für Fortgeschrittene

Hallo Welt für Fortgeschrittene Hallo Welt für Fortgeschrittene Geometrie II Tiago Joao Informatik 2 Programmiersysteme Martensstraße 3 91058 Erlangen Inhalt Koordinatenkompression Beispiel: SafeJourney Typische compress-funktion Bereichssuche

Mehr

Tutorial Laserscanning: Automatisierung der Modellierung

Tutorial Laserscanning: Automatisierung der Modellierung Tutorial Laserscanning: Automatisierung der Modellierung Dr.-Ing. Fredie Kern Univ.-Prof. Dr.-Ing. habil. Wolfgang Niemeier Dipl.-Ing. Martin Zumstrull 1 Inhaltsverzeichnis 1. Was kann modelliert werden

Mehr

Grundlagen Kondition Demo. Numerisches Rechnen. (für Informatiker) M. Grepl P. Esser & G. Welper & L. Zhang

Grundlagen Kondition Demo. Numerisches Rechnen. (für Informatiker) M. Grepl P. Esser & G. Welper & L. Zhang Numerisches Rechnen (für Informatiker) M. Grepl P. Esser & G. Welper & L. Zhang Institut für Geometrie und Praktische Mathematik RWTH Aachen Wintersemester 2011/12 IGPM, RWTH Aachen Numerisches Rechnen

Mehr

Kapitel 4: Data Mining DATABASE SYSTEMS GROUP. Überblick. 4.1 Einleitung. 4.2 Clustering. 4.3 Klassifikation

Kapitel 4: Data Mining DATABASE SYSTEMS GROUP. Überblick. 4.1 Einleitung. 4.2 Clustering. 4.3 Klassifikation Überblick 4.1 Einleitung 4.2 Clustering 4.3 Klassifikation 1 Klassifikationsproblem Gegeben: eine Menge O D von Objekten o = (o 1,..., o d ) O mit Attributen A i, 1 i d eine Menge von Klassen C = {c 1,...,c

Mehr

Interaktive Lokalisierung durch Objekterkennung

Interaktive Lokalisierung durch Objekterkennung Interaktive Lokalisierung durch Objekterkennung Bachelor Thesis Adrian Batzill Motivation GPS Abweichungen - Guter Tag: ~5m - Wahrscheinlicher: >15m Kompass Abweichungen: - Normal ~3-10 Für Augmented Reality

Mehr

Human Detection Based On Part Models

Human Detection Based On Part Models Human Detection Based On Part Models Seminar: Mobile Human Detection Systems William Basilien Kom MatrNr: 3098186 Institute of Computer Engineering 13. März 2017 1 / 25 Motivation 2 / 25 Inhaltsverzeichnis

Mehr

Theoretische Informatik 1

Theoretische Informatik 1 Theoretische Informatik 1 Approximierbarkeit David Kappel Institut für Grundlagen der Informationsverarbeitung Technische Universität Graz 02.07.2015 Übersicht Das Problem des Handelsreisenden TSP EUCLIDEAN-TSP

Mehr

3. Analyse der Kamerabewegung Video - Inhaltsanalyse

3. Analyse der Kamerabewegung Video - Inhaltsanalyse 3. Analyse der Kamerabewegung Video - Inhaltsanalyse Stephan Kopf Bewegungen in Videos Objektbewegungen (object motion) Kameraoperationen bzw. Kamerabewegungen (camera motion) Semantische Informationen

Mehr

Support Vector Machines, Kernels

Support Vector Machines, Kernels Support Vector Machines, Kernels Katja Kunze 13.01.04 19.03.2004 1 Inhalt: Grundlagen/Allgemeines Lineare Trennung/Separation - Maximum Margin Hyperplane - Soft Margin SVM Kernels Praktische Anwendungen

Mehr

PRIP-Preis. Effizientes Object Tracking durch Programmierung von Mehrkernprozessoren und Grafikkarten

PRIP-Preis. Effizientes Object Tracking durch Programmierung von Mehrkernprozessoren und Grafikkarten Masterarbeit @ PRIP-Preis Effizientes Object Tracking durch Programmierung von Mehrkernprozessoren und Grafikkarten Michael Rauter Pattern Recognition and Image Processing Group Institute of Computer Aided

Mehr

HAW Hamburg Anwendung 1 - Vortrag Andrej Rull

HAW Hamburg Anwendung 1 - Vortrag Andrej Rull HAW Hamburg Anwendung 1 - Vortrag Andrej Rull 02122008 1 Gliederung o Motivation o Der Anwendungsfall o Das SLAM Problem o Lösungsansätze und Algorithmen o Zusammenfassung o Ausblick auf AW2 2 Motivation

Mehr

Neue Ansätze für Mustererkennung und automatisches Lernen

Neue Ansätze für Mustererkennung und automatisches Lernen Z Y X Neue Ansätze für Mustererkennung und automatisches Lernen Vortrag im Rahmen des 2. Technologieforums Bildverarbeitung am 03./04. November 2015 Johannes Zügner STEMMER IMAGING GmbH, Puchheim GLIEDERUNG

Mehr

Vorlesung Maschinelles Lernen

Vorlesung Maschinelles Lernen Vorlesung Maschinelles Lernen Stützvektormethode Katharina Morik LS 8 Informatik 8.11.2011 1 von 38 Gliederung 1 2 Lagrange-Optimierung 2 von 38 Übersicht über die Stützvektormethode (SVM) Eigenschaften

Mehr

Übungen zu Experimentalphysik 1 für MSE

Übungen zu Experimentalphysik 1 für MSE Physik-Department LS für Funktionelle Materialien WS 2017/18 Übungen zu Experimentalphysik 1 für MSE Prof. Dr. Peter Müller-Buschbaum, Dr. Volker Körstgens, Dr. Neelima Paul, Sebastian Grott, Lucas Kreuzer,

Mehr

13. Woche: NP-Vollständigkeit Satz von Cook-Levin Anwendungen in der Kryptographie

13. Woche: NP-Vollständigkeit Satz von Cook-Levin Anwendungen in der Kryptographie 13 Woche: NP-Vollständigkeit Satz von Cook-Levin Anwendungen in der Kryptographie 13 Woche: NP-Vollständigkeit, Satz von Cook-Levin, Anwendungen 276/ 333 N P-Vollständigkeit Ḋefinition NP-vollständig Sei

Mehr

Strukturelle SVM zum Graph-labelling

Strukturelle SVM zum Graph-labelling 23. Juni 2009 1 Was wir gerne hätten...... und der Weg dorthin Erinnerung: strukturelle SVM 2 Junction Tree Algorithmus Loopy Belief Propagation Gibbs Sampling 3 Umfang Qualität der Algorithmen Schlussfolgerungen

Mehr

Algorithmen für Routenplanung 8. Sitzung, Sommersemester 2012 Thomas Pajor 21. Mai 2012

Algorithmen für Routenplanung 8. Sitzung, Sommersemester 2012 Thomas Pajor 21. Mai 2012 Algorithmen für Routenplanung 8. Sitzung, Sommersemester 2012 Thomas Pajor INSTITUT FÜR THEORETISCHE INFORMATIK ALGORITHMIK PROF. DR. DOROTHEA WAGNER KIT Universität des Landes Baden-Württemberg und nationales

Mehr

Bachelorverteidigung Marco Franke

Bachelorverteidigung Marco Franke Bachelorverteidigung Java EE Webservice basiert auf RESTlet, JaxB und JPA/Hibernate zur Bilderkennung mit Hilfe der SURF-Merkmalsextraktion Verantwortlicher Professor: Prof. Dr. rer. nat. Klaus Hering

Mehr

Diskriminatives syntaktisches Reranking für SMT

Diskriminatives syntaktisches Reranking für SMT Diskriminatives syntaktisches Reranking für SMT Fortgeschrittene Themen der statistischen maschinellen Übersetzung Janina Nikolic 2 Agenda Problem: Ranking des SMT Systems Lösung: Reranking-Modell Nutzung

Mehr

Algorithmische Geometrie: Delaunay Triangulierung (Teil 2)

Algorithmische Geometrie: Delaunay Triangulierung (Teil 2) Algorithmische Geometrie: Delaunay Triangulierung (Teil 2) Nico Düvelmeyer WS 2009/2010, 2.2.2010 Überblick 1 Delaunay Triangulierungen 2 Berechnung der Delaunay Triangulierung Randomisiert inkrementeller

Mehr

Principal Component Analysis (PCA)

Principal Component Analysis (PCA) Principal Component Analysis (PCA) Motivation: Klassifikation mit der PCA Berechnung der Hauptkomponenten Theoretische Hintergründe Anwendungsbeispiel: Klassifikation von Gesichtern Weiterführende Bemerkungen

Mehr

Experimentalphysik 1

Experimentalphysik 1 Technische Universität München Fakultät für Physik Ferienkurs Experimentalphysik 1 WS 16/17 Lösung 1 Ronja Berg (ronja.berg@tum.de) Katharina Scheidt (katharina.scheidt@tum.de) Aufgabe 1: Superposition

Mehr

Invariante Merkmale. Seminar Inhaltsbasierte Bildsuche 22. Dezember 2004 Marei Hopert

Invariante Merkmale. Seminar Inhaltsbasierte Bildsuche 22. Dezember 2004 Marei Hopert Invariante Merkmale Seminar Inhaltsbasierte Bildsuche 22. Dezember 2004 Marei Hopert Übersicht Motivation Invariante Merkmale Idee Berechnung Kernfunktionen Ergebnisse Ausblick Motivation Gedrehtes oder

Mehr

Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen

Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen Anwendungen des Fréchet-Abstandes Das Constrained Free Space Diagram zur Analyse von Körperbewegungen David Knötel Freie Universität Berlin, Institut für Informatik Seminar über Algorithmen Leitfaden Wiederholung

Mehr

Algorithmen zur Analyse historischer Landkarten. Benedikt Budig Universität Würzburg

Algorithmen zur Analyse historischer Landkarten. Benedikt Budig Universität Würzburg Algorithmen zur Analyse historischer Landkarten Benedikt Budig Universität Würzburg Einführung Einführung Algorithmen zur Analyse historischer Landkarten Einführung Algorithmen zur Analyse historischer

Mehr

Das Problem des Handlungsreisenden

Das Problem des Handlungsreisenden Seite 1 Das Problem des Handlungsreisenden Abbildung 1: Alle möglichen Rundreisen für 4 Städte Das TSP-Problem tritt in der Praxis in vielen Anwendungen als Teilproblem auf. Hierzu gehören z.b. Optimierungsprobleme

Mehr

Was bisher geschah. Definition digitaler Bilder B : pos col Bildanalyse, statistische Merkmale Signale im Orts- und Frequenzraum Bildbearbeitung durch

Was bisher geschah. Definition digitaler Bilder B : pos col Bildanalyse, statistische Merkmale Signale im Orts- und Frequenzraum Bildbearbeitung durch Was bisher geschah Definition digitaler Bilder B : pos col Bildanalyse, statistische Merkmale Signale im Orts- und Frequenzraum Bildbearbeitung durch Punktoperationen (Farbtransformation) f : col1 col

Mehr

Anwendungen der WSPD & Sichtbarkeitsgraphen

Anwendungen der WSPD & Sichtbarkeitsgraphen Vorlesung Algorithmische Geometrie INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK Martin Nöllenburg 08.07.2014 1 Wdh.: Well-Separated Pair Decomposition Def.: Ein Paar disjunkter Punktmengen

Mehr

Fortgeschrittene Netzwerk- und Graph-Algorithmen

Fortgeschrittene Netzwerk- und Graph-Algorithmen Fortgeschrittene Netzwerk- und Graph-Algorithmen Prof. Dr. Hanjo Täubig Lehrstuhl für Effiziente Algorithmen (Prof. Dr. Ernst W. Mayr) Institut für Informatik Technische Universität München Wintersemester

Mehr

Softwareprojektpraktikum Maschinelle Übersetzung

Softwareprojektpraktikum Maschinelle Übersetzung Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta, Jan Rosendahl max.bleu@i6.informatik.rwth-aachen.de Vorbesprechung 5. Aufgabe 22. Juni 2017 Human Language Technology

Mehr

Data Mining und Maschinelles Lernen Lösungsvorschlag für das 1. Übungsblatt

Data Mining und Maschinelles Lernen Lösungsvorschlag für das 1. Übungsblatt Data Mining und Maschinelles Lernen Lösungsvorschlag für das 1. Übungsblatt Knowledge Engineering Group Data Mining und Maschinelles Lernen Lösungsvorschlag 1. Übungsblatt 1 1. Anwendungsszenario Überlegen

Mehr

Rechnerstrukturen. Michael Engel und Peter Marwedel SS TU Dortmund, Fakultät für Informatik

Rechnerstrukturen. Michael Engel und Peter Marwedel SS TU Dortmund, Fakultät für Informatik Rechnerstrukturen Michael Engel und Peter Marwedel TU Dortmund, Fakultät für Informatik SS 203 Hinweis: Folien a. d. Basis von Materialien von Gernot Fink und Thomas Jansen 2. Mai 203 Boolesche Funktionen

Mehr

14 Ljapunov-Funktionen

14 Ljapunov-Funktionen 14 Ljapunov-Funktionen 67 14 Ljapunov-Funktionen 14.1 Gradientenfelder. a Ein Vektorfeld v C 1 D, R n besitze ein Potential U C 2 D, R, d.h. es sei v = gradu. Dann ist Dvx = HUx symmetrisch, und man hat

Mehr

Lineare Regression. Volker Tresp

Lineare Regression. Volker Tresp Lineare Regression Volker Tresp 1 Die Lernmaschine: Das lineare Modell / ADALINE Wie beim Perzeptron wird zunächst die Aktivierungsfunktion gewichtete Summe der Eingangsgrößen x i berechnet zu h i = M

Mehr

Improving the Accuracy of GPS

Improving the Accuracy of GPS Improving the Accuracy of GPS Stephan Kopf, Thomas King, Wolfgang Effelsberg Lehrstuhl für Praktische Informatik IV Universität Mannheim Gliederung Motivation ierungsfehler von GPS Steigerung der Genauigkeit

Mehr

Algorithmische Methoden für schwere Optimierungsprobleme

Algorithmische Methoden für schwere Optimierungsprobleme Algorithmische Methoden für schwere Optimierungsprobleme Prof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 KIT Henning Universität desmeyerhenke, Landes Baden-Württemberg Institutund

Mehr

Kapitel 4: Komplexitätstheorie Gliederung

Kapitel 4: Komplexitätstheorie Gliederung Gliederung 0. Einleitung und Grundbegriffe 1. Endliche Automaten 2. Formale Sprachen 3. Berechnungstheorie 4. Komplexitätstheorie 4.1. Motivation und Grundbegriffe 4.2. Die Komplexitätsklassen P und NP

Mehr

Darstellung von Kurven und Flächen

Darstellung von Kurven und Flächen Darstellung von Kurven und Flächen Technische Universität Dresden Fakultät Informatik Institut für Software- und Multimediatechnik Dozent: Dr. Mascolous Referent: Gliederung / Einleitung 1 / 25 1. Kurven

Mehr

Klausur Numerische Mathematik (für Elektrotechniker), 24. Februar 2016

Klausur Numerische Mathematik (für Elektrotechniker), 24. Februar 2016 Verständnisfragen-Teil ( Punkte) Jeder der Verständnisfragenblöcke besteht aus Verständnisfragen. Werden alle Fragen in einem Verständnisfragenblock richtig beantwortet, so gibt es für diesen Block Punkte.

Mehr

Algorithmen zur Visualisierung von Graphen

Algorithmen zur Visualisierung von Graphen Algorithmen zur Visualisierung von Graphen Kombinatorische Optimierung mittels Flussmethoden II Vorlesung im Wintersemester 2011/2012 10.11.2011 Orthogonale Zeichnungen II letztes Mal: Satz G Maxgrad-4-Graph

Mehr

Theoretische Informatik 1

Theoretische Informatik 1 Theoretische Informatik 1 Approximierbarkeit David Kappel Institut für Grundlagen der Informationsverarbeitung Technische Universität Graz 10.06.2016 Übersicht Das Problem des Handelsreisenden TSP EUCLIDEAN-TSP

Mehr

Nichtlineare Gleichungssysteme

Nichtlineare Gleichungssysteme Nichtlineare Gleichungssysteme Jetzt: Numerische Behandlung nichtlinearer GS f 1 (x 1,..., x n ) =0. f n (x 1,..., x n ) =0 oder kurz f(x) = 0 mit f : R n R n Bemerkung: Neben dem direkten Entstehen bei

Mehr

Experimentalphysik E1

Experimentalphysik E1 Experimentalphysik E1 Newtonsche Axiome, Kräfte, Arbeit, Skalarprodukt, potentielle und kinetische Energie Alle Informationen zur Vorlesung unter : http://www.physik.lmu.de/lehre/vorlesungen/index.html

Mehr

Vorlesung Maschinelles Lernen

Vorlesung Maschinelles Lernen Vorlesung Maschinelles Lernen Stützvektormethode Katharina Morik LS 8 Informatik Technische Universität Dortmund 12.11.2013 1 von 39 Gliederung 1 Hinführungen zur SVM 2 Maximum Margin Methode Lagrange-Optimierung

Mehr

Vorlesung Digitale Bildverarbeitung Sommersemester 2013

Vorlesung Digitale Bildverarbeitung Sommersemester 2013 Vorlesung Digitale Bildverarbeitung Sommersemester 2013 Sebastian Houben (Marc Schlipsing) Institut für Neuroinformatik Inhalt Crash-Course in Machine Learning Klassifikationsverfahren Grundsätzliches

Mehr

Kryptographische Protokolle

Kryptographische Protokolle Kryptographische Protokolle Lerneinheit 2: Generierung von Primzahlen Prof. Dr. Christoph Karg Studiengang Informatik Hochschule Aalen Wintersemester 2018/2019 15.11.2018 Einleitung Einleitung Diese Lerneinheit

Mehr

Blatt 1. Kinematik- Lösungsvorschlag

Blatt 1. Kinematik- Lösungsvorschlag Fakultät für Physik der LMU München Lehrstuhl für Kosmologie, Prof. Dr. V. Mukhanov Übungen zu Klassischer Mechanik (T1) im SoSe 011 Blatt 1. Kinematik- Lösungsvorschlag Aufgabe 1.1. Schraubenlinie Die

Mehr

Aufgabe 1. Aufgabe 2. Die Formel für den mittleren Fehler einer Streckenmessung mit Meßband lautet:

Aufgabe 1. Aufgabe 2. Die Formel für den mittleren Fehler einer Streckenmessung mit Meßband lautet: Semesterklausur Fehlerlehre und Statistik WS 96/97 11. Februar 1997 Zeit: 2 Stunden Alle Hilfsmittel sind zugelassen Die Formel für den mittleren Fehler einer Streckenmessung mit Meßband lautet: m s :

Mehr

Algorithmen für Routenplanung 7. Sitzung, Sommersemester 2010 Thomas Pajor 28. Mai 2010

Algorithmen für Routenplanung 7. Sitzung, Sommersemester 2010 Thomas Pajor 28. Mai 2010 Algorithmen für Routenplanung 7. Sitzung, Sommersemester 2010 Thomas Pajor 28. Mai 2010 INSTITUT FÜR THEORETISCHE INFORMATIK ALGORITHMIK I PROF. DR. DOROTHEA WAGNER KIT Universität des Landes Baden-Württemberg

Mehr

Indoor Location Tracking and Information System

Indoor Location Tracking and Information System Master Thesis Indoor Location Tracking and Information System Thomas Blocher tblocher@ee.oulu.fi TU Graz Österreich IMST GmbH Deutschland Indoor Location Tracking and Information System p. 1/14 Gliederung

Mehr

Automaten und Formale Sprachen SoSe 2013 in Trier

Automaten und Formale Sprachen SoSe 2013 in Trier Automaten und Formale Sprachen SoSe 2013 in Trier Henning Fernau Universität Trier fernau@uni-trier.de 2. Juni 2013 1 Automaten und Formale Sprachen Gesamtübersicht Organisatorisches Einführung Endliche

Mehr

Voronoi-Diagramme INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK. Dr. Martin Nöllenburg Vorlesung Algorithmische Geometrie

Voronoi-Diagramme INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK. Dr. Martin Nöllenburg Vorlesung Algorithmische Geometrie Vorlesung Algorithmische Geometrie INSTITUT FÜR THEORETISCHE INFORMATIK FAKULTÄT FÜR INFORMATIK Martin Nöllenburg 03.06.2014 1 Das Postamt-Problem b(p, q) = {x 2 R 2 : xp = xq } p q h(p, q) h(q, p) = {x

Mehr

Übungsblatt 9. a) Wie groß ist der Impuls des Autos vor und nach der Kollision und wie groß ist die durchschnittliche Kraft, die auf das Auto wirkt?

Übungsblatt 9. a) Wie groß ist der Impuls des Autos vor und nach der Kollision und wie groß ist die durchschnittliche Kraft, die auf das Auto wirkt? Aufgabe 32: Impuls Bei einem Crash-Test kollidiert ein Auto der Masse 2000Kg mit einer Wand. Die Anfangsund Endgeschwindigkeit des Autos sind jeweils v 0 = (-20m/s) e x und v f = (6m/s) e x. Die Kollision

Mehr

Theoretische Mechanik

Theoretische Mechanik Prof. Dr. R. Ketzmerick/Dr. R. Schumann Technische Universität Dresden Institut für Theoretische Physik Sommersemester 2008 Theoretische Mechanik 9. Übung 9.1 d alembertsches Prinzip: Flaschenzug Wir betrachten

Mehr

Parallele FFT-Algorithmen

Parallele FFT-Algorithmen Parallele FFT-Algorithmen Jörg Haeger 11. Juli 1996 1 Die diskrete Fourier-Transformation (DFT) 2 2 Permutationen und Graphen 2 2.1 Permutationen.............................. 2 2.2 Graphen..................................

Mehr