Warum gefällt uns ein Foto?

Ähnliche Dokumente
Effizientes Fotomanagement auf Basis automatisierter Bildanalyse

Bewertungsmöglichkeiten für die persönliche Relevanz eines Fotos

Caliph & Emir. Retrieval und Annotation von digitalen Photos mit MPEG-7. Mathias Lux

Inhalt und Überblick. Visuelle Kognition Adrian Schwaninger Universität Zürich. Erkennung und Repräsentation Ansichtenbasierte Ansatze Überblick

Navigation anhand natürlicher Landmarken mit Hilfe der Scale Invariant Feature Transform. Thorsten Jost INF-M2 AW1 Sommersemester

Inhalt und Überblick. Visuelle Kognition WS 2001/2002 Adrian Schwaninger

Projektpraktikum MultimediaGrid

Multimedia trifft Mensch-Technik-Interaktion

Stephan Filipczyk. Relevance Feedback. Seminar Bridging the Semantic Gap

Projektgruppe. Clustering und Fingerprinting zur Erkennung von Ähnlichkeiten

Visuelle Bildsuche und Bildnavigation. Prof. Dr. Kai Uwe Barthel

Erfolg durch Wissen. Petershauser Straße 6, D Hohenkammer

Personenerkennung. Harald Hauptseminarpräsentation. Harald Kirschenmann. Department Informatik. Department Informatik.

Vorlesung Maschinelles Lernen

Implizite Modellierung zur Objekterkennung in der Fernerkundung

Inhalt und Überblick. Visuelle Kognition Adrian Schwaninger Universität Zürich

Human Detection Based On Part Models

Inhalt und Überblick. Visuelle Kognition. Visuelle Kognition WS 2001/2002 Adrian Schwaninger

Companion Technologie

VL Wahrnehmung und Aufmerksamkeit. Woher weiß ich, was das ist? Objektwahrnehmung

Multimedia-Metadaten und ihre Anwendung

Semantik-Visualisierung

Inhalt und Überblick

Multimedia-Metadaten und ihre Anwendung

Untersuchung der medialen Darstellung des Amoklaufs in Erfurt und dessen Wirkung auf die Mediennutzung

The accredited Sample Assessment Materials, used in conjunction with the General instructions to the teacher conducting the assessment and the

Software-Defined Secure Networks. Juniper s Innovation für Secure Enterprise Networks

INTELLIGENTE DATENANALYSE IN MATLAB

Structure-from-Motion. Christina Mundhenk Leo Sylvio Rüdian Marcel Kliemannel

Vorlesung Datenbanken II SS 2006

Automatische Analyse und Exploration von Mediendaten. Prof. Dr. Ralph Ewerth Technische Informationsbibliothek (TIB)

Twitter als interaktive Erweiterung des Mediums Fernsehen: Inhaltliche Analyse von Tatort- Tweets

Scene Reconstruction with Multiple View Geometry

Kann SAS Ihre Handschrift lesen? Machine Learning am Beispiel von Stacked Denoising Autoencoders

Allgemeine Psychologie I. Vorlesung 3. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Objektorientierte Bildverarbeitung Methodische Grundlagen

Modellierung von Unsicherheiten in klassifizierten, räumlich hoch aufgelösten Fernerkundungsszenen

Design for Six Sigma - DMADV.

Mathematische Grundlagen III

Modell-Differenzen zur Änderungserkennung in großen Modellen

Semantische Suche im audiovisuellen Kulturerbe Das Projekt mediaglobe

Projektgruppe. FG Engels. Enthält eine zusätzliche Folie. Fabian Christ, Benjamin Nagel, Henning Wachsmuth. Anmeldung bis 28.

Weitere Methoden. Beispiel Risikoindikatoren

2. Schnitterkennung Video - Inhaltsanalyse

(Bamberg)

Ubiquitous RE: Barrieren niederreißen. Karina Villela, Marcus Trapp, Jörg Dörr

Neue Ansätze für Mustererkennung und automatisches Lernen

Data Mining 2-1. Kapitel 2: Finding Similar Items. Johannes Zschache Wintersemester 2018/19

Ahnlichkeitsbestimmung von Bildern

Superpixels for Skin Segmentation

VON NATIVE ÜBER AD SPECIALS ZU INFLUENCERN UND DATA

Neue Trends aus dem maschinellen Lernen in Photogrammetrie und Fernerkundung. Jan Dirk Wegner Photogrammetry and Remote Sensing, ETH Zürich

Corporate Smart Content im Corporate Semantic Web

Extraktion der Tabellen aus XML-Dokumenten und Erkennung deren Semantik. Exposé zur Bachelorarbeit

SAS Text Analytics findet Zusammenhänge in Texten Ergebnisse eines Selbstversuchs

Künstliche Intelligenz

Introduction to the ESPON TIA Quick Check. Erich Dallhammer (ÖIR), Roland Gaugitsch (ÖIR)

Geovisualisierung: Wie aus Daten Informationen werden. Doris Dransch Helmholtz Zentrum Potsdam Deutsches GeoForschungsZentrum (GFZ)

Auswertung der Simulationen von Transportsystemen

SongSlope. Supporting Music Association Through Usage Histories. Abschlussvortrag Projektarbeit

Begriffe zum Risiko. Quelle: ONR 49000:2008. Risikomanagement 2011 Projekt Ragus / Sojarei Mag. Michael Forstik Unternehmensberatung 7210 Mattersburg

Seminar Datenbanksysteme

Tim Krämer. Archimetrix - Improved Software Architecture Recovery in the Presence of Design Deficiencies. 08. Mai 2013

Entwicklung eines Anzeige- und Bedienkonzeptes für die Nutzung mehrerer großvolumiger Musikdatenquellen im Automobil

Monitoring. Vertrauen ist gut, Kontrolle ist... Mathias Brandstetter Trend Micro Deutschland GmbH

Multimedia-Metadaten und ihre Anwendung

Risikomanagement. Schaden

Clustering von Internetdiensten für aktive Ontologien

Algorithmischer Ansatz nach David Marr

Intelligentes Enterprise Information Management (EIM)

In 8 Schritten zur Content-Strategie. Live-Webinar mit Babak Zand

Vertiefte Themen in Mobilen und Verteilten Systemen

Seminar : Information Retrieval Plagiaterkennung. Allgemeines Algorithmische Plagiaterkennung

Social Media Marketing Kleines Budget - Große Wirkung? Hendrik Unger Münster

Bewegungsplanung für den vierbeinigen Roboter AMEE. Björn Bettzüche

Automatic Facial Expression Analysis with

Lisa-Marie Lenk. im Sozial- und. Am Beispiel des Genderaspekts

SAS CONTEXTUAL ANALYSIS IN ACTION ERFAHRUNGEN AUS EINEM EIN SELBSTVERSUCH

INTELLIGENTE DATENANALYSE IN MATLAB. Objekterkennung

Suche nach korrespondierenden Pixeln

Textextraktion aus nichttextuellen Datenquellen

Ontologies are us: A unified model of social networks and sema

Detecting Near Duplicates for Web Crawling

Sprachsteuerung für einen ROS-basierten Assistenzroboter

Inhalt und Überblick. Visuelle Kognition WS 2001/2002 Adrian Schwaninger. Visuelle Kognition. Einleitung

Kompendium semantische Netze

Automatische Erkennung von Fortbewegungsmitteln AW2. Christian Wagner

Die Hurtigruten-Fotofibel,Teil 4 Blende, Verschlusszeit, ISO. Powered by Insidenorway Und Alexandra von Gutthenbach-Lindau

Extraktion von Takt und Rhythmus

Fans. Facebook. Felsen. Online-Marketing und Social Media in der Tourismusregion Sächsischen Schweiz. Tino Richter

SEMINAR AUTOMATISCHE GESICHTSERKENNUNG

Aesthetic Guideline Driven Photography by Robots

Event-Aggregation in Frühwarnsystemen. Till Dörges by PRESENSE Technologies GmbH

H A M B U R G _ DER G+J ADCHECK UND KAMPAGNENCHECK

Suchmaschinenoptimierung. Stephan Winter (MSc) Google Qualified Individual LEONEX Internet GmbH

UNTERSUCHUNGEN ZUR VERARBEITUNG UND WAHRNEHMUNG VON STEREO-3D MIT ERHÖHTER BILDWECHSELFREQUENZ (HIGH FRAME RATES HFR)

Transkript:

Warum gefällt uns ein Foto? Möglichkeiten und Grenzen der automatischen Bewertung von Ästhetik Philipp Sandhaus Seite 1

Warum gefällt uns ein Foto? 2

Semantische Lücke bei der Bildbewertung Bottom Up high level semantics model-driven user-driven Semantic Gap data-driven featuredriven usage-driven low level semantics content 3 context Top Down

Bottom-Up Ansätze Frühe Ansätze: Bivariate Bewertung Wieviel schlechter ist ein Bild im Vergleich zum anderen? in erster Linie für die automatische Bewertung von Kompressionsalgorithmen [Skicioglu1995] Image quality measures and their performance Später: Monovariate Bewertung Wie qualitativ gut ist ein Bild? [DAMERA-VENKATA 2004] Image Quality Assessment Based on a Degradation Model. [Ke2006] The Design of High-Level Features for Photo Quality Assessment Grundsätzliches Vorgehen meist Identifizieren der Merkmale, die für die Qualitätsbewertung relevant sein könnten Entwickeln von Verfahren zur Extraktion dieser Merkmale 4

Beispiel: Vom Merkmal zum Image Feature Merkmal Tiefenschärfe Kantendetektion z.b. Sobel, Wavelets Unterscheidung zwischen Bewegungs- und Fokusunschärfe Modelle für Visuelle Aufmerksamkeit Z.B. Itti/Koch Berechnung, der Schärfentiefe aus Kombination von Brennweiten und Blendeninformationen Exif-Daten 5

Top-Down Ansatz Ausgangspunkt Es gibt bestimmte Eigenschaften und Merkmale, die von Experten als Hinweise auf ein ästhetisches Bild gesehen werden Wie genau und ob diese Merkmale einen geeigneten Hinweis geben, ist dabei größtenteils unklar Ansatz Basis: etwa 3500 community-bewertete Fotos der Platform photo.net Visuelle Analyse dieser Bilder auf bestimmte Eigenschaften, die einen Hinweis auf den Grad der Ästhetik liefern könnten Insgesamt 64 verschiedene Features Automatisches Bestimmen relevanter Eigenschaften durch Abgleich mit Bewertungen Studying Aesthetics in Photographic Images Using a Computational Approach. Datta 2006 6

Bottom-Up Ansatz Untersuchte Merkmale (AUswahl) Exposure of Light & Colorfulness Sättigung Rule of Thirds Textur / Schärfe Seitenverhältnis Schärfentiefe Formen, Konvexität Aussagekräftige Merkmale / Ergebnis (Auswahl) Durchschnittliche Helligkeit Dreierregel auf Basis von Helligkeit Ähnlichkeit zu verwandten Bildern Studying Aesthetics in Photographic Images Using a Computational Approach. Datta 2006 7

Was ist für mich ein gutes Bild? " Was wollen wir wissen? " Ist das Bild qualitativ gut? " Ist es wichtig für mich? " Gibt es bessere? "... " Multimodale Analyse " Nutzung " Ich habe dieses Bild öfter als andere angeschaut " Inhalt " Scharf? Bildkomposition? Farbbalance? Belichtung " Kontext Wie sehen andere Fotos aus? Soziale Netzwerke, Kommentare, Likes, [Luo2006] Pictures are not taken in a vacuum 8

Multimodal Photo Analysis 9 Inhalt Nutzung Kontext Image Salience Usage Importance Social Importance Similarity Score Person Importance Semantic Enrichment Face Detection Edge Detection Saliency Map Texture & Color Histogram Image header Social Network Context Photo history analysis Sharpness Analysis Person Recognition Augmented Saliency Map Similarity Exposure Analysis Light Condition Analysis...

Fotonutzung Ausgangsthese Die Nutzungshistorie eines Mediums reflektiert seine Semantik Informationen, die nicht oder nur sehr schwer aus dem Inhalt oder Kontext extrahiert werden können --> Potentiell wertvolle Quelle für semantische Fotoannotation Vorgehen Untersuchen und Strukturieren verschiedener Nutzungsarten Analyse auf Potential zur Ableitung von Semantiken für Fotos Exemplarische Untersuchung durch Nutzerstudien [Sandhaus2008a] 10

Fotonutzung - Nutzerstudie Fragestellung Gibt es einen Zusammenhang zwischen der Betrachtungszeit eines Fotos und der Auswahl für ein Fotobuch? Studie Erfassen der Betrachtungszeiten am Laptop bei zwei Nutzergruppen Vergleich mit zuvor erstellen Fotoalbenauswahlen Ergebnis Kein direkter Zusammenhang Zusammen auf Eventebene Lang betrachtete Ergeignisse sind auch im Fotoalbum repräsentiert [Sandhaus2008a] 11

Kontext: Soziales Netzwerk " Ziele " Ableiten der sozialen Nähe zweier Fotos " Bestimmen der personenbezogenen Wichtigkeit " Gruppierung von Fotos nach sozialem Netz Ansatz Gesichtsdetektion und -erkennung Ableiten eines Beziehungsgraphen Häufigkeit gemeinsames Vorkommen Räumliche Nähe Anzahl anderer Personen auf Fotos 12

Anwendung: Auswahl für ein Fotobuch Selection Selektierte, gruppierte Fotos Cluster / Event Rating Duplicate Detection Clustering Photo Rating Semantisch angereicherte Fotos 13

Clustering " Ziel " Bestimmen von zusammenhängenden Ereignissen innerhalb eines Fotosets " Grösse eines Ereignisses ist auch abhängig von dem verfügbaren Platz im Fotobuch Selection Ansatz " Gruppieren von Fotos auf Basis von verfügbaren Metadaten " Zeit " Ort " Visuelle Ähnlichkeit Cluster / Event Rating Clustering Duplicate Detection Rating 14

Cluster / Event Rating " Motivation " Einige Ereignisse sind wichtiger als andere " Ein wichtiges Ereignis kann trotzdem eher schlechte Fotos enthalten, die dann trotzdem ausgewählt werden sollten Selection " Kriterien " Größe des Ereignisses " Zeitabstände innerhalb eines Ereignisses " Bildähnlichkeit " Zeitliche und inhaltliche Nähe zu Nachbarereignissen Cluster / Event Rating Clustering Duplicate Detection Photo Rating 15

Photo Rating " Inhalt " Belichtung " Farbreichtum " Schärfe " Visuelle Ausgewogenheit " " Kontext " Zeitliche und inhaltliche Nähe zu Nachbarbildern " (Wichtige) Personen " " Nutzung " Bewertungen, likes, Kommentare,... Cluster / Event Bewertung Clustering Selection Duplicate Detection Photo Rating 16

Duplicate Detection " Bestimmen von Gruppen von Near-Duplicates " Das beste Foto einer Reihe als Repräsentant eines Ereignisses auswählen Selection Cluster / Event Rating Duplicate Detection Clustering Photo Rating 17

Grenzen automatischer Bildbewertung Voraussetzung für ein algorithmisches Bewertungsverfahren ist 1. Es ist bekannt, welche Merkmale ein Bild ansprechend machen 2. Diese Merkmale sind (mehr oder weniger zuverlässig) messbar -> Dies ist vielen Fällen nicht der Fall Subjektivität Ästhetik liegt im Auge des Betrachters Subjektiver Bildkontext Grenzen sind fliessend Nur kleine Veränderungen können den gesamten Bildeindruck verändern Diese Unterschiede sind mit ohnehin unscharfen Verfahren oft nicht messbar Seite 18