Technische Aspekte einer Videosuchmaschine. Björn Wilmsmann, CEO - MetaSieve GmbH



Ähnliche Dokumente
Überblick über aktuelle Services Überblick über aktuelle Cloud Services

Web Services stellen eine Integrationsarchitektur dar, die die Kommunikation zwischen verschiedenen Anwendungen

Erfolgreich suchen im Internet

Studien News. Juni 2015

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013

Webseiten und Web-Apps grafisch gestalten mit HTML5 Canvas ohne Flash und sonstige Tools

YouTube: Video-Untertitel übersetzen

Die Bürgermeister App. Mein Bürgermeister hört mich per App.

Referent Thomas Kaiser Gründer & Geschäftsführer cyberpromote GmbH tel: 089/ thomas.kaiser@cyberpromote.com. Stand C124 SEO 2014

Whitepaper Video-SEO. 10 Schritte für ein besseres Ranking. und mehr Reichweite how2 1

Warum Suche (trotzdem) bedeutend ist

ebay Mode Fokus ebay Partner Network

VIP-Programm. Herzlich Willkommen!

Suchen, um zu finden. Sta,s,k BRD (Quelle: Comscore, 2013) Beziehungsgeflecht der Suchmaschinen. Antworten auf folgende Fragen:

Recherche 2012 Journalismus, PR und mul6mediale Inhalte

1 Was ist das Mediencenter?

SEO. am Beispiel von. Jürgen Schlott

Journalistische Arbeit im Web 2.0 Umfrageresultate Schweiz

Social Media Monitoring Was wird über Sie und Ihre Wettbewerber gesagt?

Google Eine kurze Anleitung Stand: 3. August 2010

Telenet SocialCom. verbindet Sie mit Social Media.

Urbacher-Computer-Forum. Herzlich Willkommen!

Der»Journalist Desktop«

Internet Explorer Version 6

IT-Kosten im Mittelstand höher als bei Großunternehmen

PAUL App. Anleitung für Studierende und Lehrende

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Service CASES. Praxis-Beispiele zur Gestaltung eines echten Kundennutzens. Volume 18

Die neue bunte Google-Suche

Informationen als Leistung

Wie wichtig ist Social Media Marketing für mein Google Ranking?

Ihren Kundendienst effektiver machen

Die App onesto2go Ihr mobiler Zugriff auf OBT

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

fasttime Zeiterfassung leicht gemacht

Social Media in der kommunalen Praxis Ein Blick hinter die Kulissen

Mobile-Szenario in der Integrationskomponente einrichten

On Page SEO für WordPress. Übersichtliche Zusammenfassung der effektiven Optimierungslösungen für WordPress Blogs

Migrationspfad zu BES 10 (1)

Ein buchner Unternehmen: Starke Software Gmbh Lise-Meitner-Str Schwentinental Tel.:

Der Fragebogen besteht aus 17 Fragen, sieben davon im ersten Teil und elf Fragen im zweiten Teil der Umfrage.

Transparente Hausverwaltung Marketingschmäh oder doch: eine neue Dimension der Dienstleistung?

Navigation. Drucken Klicken Sie auf ein Symbol, um nähere Informationen zu erhalten. Papierhandhabung Anzeigen der Online-Informationen

INHALTSVERZEICHNIS Allgemeine Beschreibung... 3 Verwendung der Webseite... 4 Abbildungsverzeichnis... 12

Über die Internetseite Hier werden unter Download/aktuelle Versionen die verschiedenen Module als zip-dateien bereitgestellt.

Multicheck Schülerumfrage 2013

Die Sportbergbetriebe

Anbindung LMS an Siemens S7. Information

Ergebnisse. Umfrage Kurz-Statistiken Umfrage 'Feedback und Entertain 2.0'

0110 Internet Explorer 8. 1 Einleitung. Lernziele. Internet Explorer 8 für das Internet nutzen. Feeds abonnieren Lerndauer. 4 Minuten.

Wie Web 2.0 und Suche zusammenwachsen. Prof. Dr. Dirk Lewandowski

Handbuch - Mail-Sheriff Verwaltung

Warum brauche ich eine Website?

SWT II Projekt. Chat - Anwendung. Pflichtenheft 2000 SWT

MANAGED BUSINESS CLOUD. Individuell. Flexibel. Sicher.

Quick Guide Mitglieder

teischl.com Software Design & Services e.u. office@teischl.com

Microsoft PowerPoint Präsentationen in MP4 (H.264) umwandeln

Kurzanweisung für Google Analytics

PXL - Media - Portal. Das PXL-Media-Portal wurde von Grund auf neu programmiert und bietet als Medien Portal die standarisierte Darstellung von:

Themenschwerpunkt Social SEO

RSS Push Verfahren. Hongliang Jiang, Roland Höpfner Seminar Moderne Webtechnologien AG-NBI. 18. November 2009

RESTful Web. Representational State Transfer

Installation von horizont 4 bei Verwendung mehrerer Datenbanken

Acht Gute Gründe für Integration und einen Content Backbone

Ausblick: Archivierung elektronischer Standesamtsunterlagen

Cloud-Computing. Selina Oertli KBW

Persönliche Einladung. Zur IT Managers Lounge am 4. November 2009 in Köln, Hotel im Wasserturm.

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Zur Person. Alexander Balow. Branchenschwerpunkt Tourismus Spezialthema Onlinemarketing. PLANET IC GmbH Alexander Balow

BI in der Cloud eine valide Alternative Überblick zum Leistungsspektrum und erste Erfahrungen

Die itsystems Publishing-Lösung

Mobiles SAP für Entscheider. Permanente Verfügbarkeit der aktuellen Unternehmenskennzahlen durch den mobilen Zugriff auf SAP ERP.

Schriftgut- und Informationsverwaltung. Anleitung BürgerTOP

Tess Relay-Dienste mobil nutzen

bix BOE Java Tools bix Consulting GmbH & Co. KG BusinessITPeople

Fassade. Objektbasiertes Strukturmuster. C. Restorff & M. Rohlfing

Universal Search. `ljv^k. Whitepaper. Autor Peter Resele Datum 29. März 2010 Status Public

Abschlussarbeiten für StudentInnen

Digitaler*Ausstellungsbegleiter*für*Mobilgeräte ** * * * Alter: Studiengang: Geschlecht: $ $ $ $ Datum: Falls%Ja,%welches? Falls%ja, %welches?

Microblogging im TCC mit dem TCC Twitter

Sicher ist sicher! itbank Hosting!

SMS-Versand in MACS Einrichtung des SMS-Versand Verwendung des SMS-Versandes Der SMS-Versand Empfängerfeld Empfänger-Rufnummer Inhalt der SMS

Computeria Urdorf. Treff vom 25. März Clouds

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Der schnelle Weg zu Ihrer eigenen App

Textdokument-Suche auf dem Rechner Implementierungsprojekt

Der Kontowecker: Einrichtung

FAQ Kunden - elektronischer Kontoauszug (eka)

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller

Um zu prüfen welche Version auf dem betroffenen Client enthalten ist, gehen Sie bitte wie folgt vor:

Einsatzbearbeitung im Sanitätsdienst

ECC Forum. Willkommen

Manual Online-Reservation (Sup-Tool) für ASVZ-Teilnahmeberechtigte

Herzlich Willkommen. Der Weg zur eigenen Homepage. vorgestellt von Frank Kullmann

myfitapp myfitapp Die eigene Studio-App 2015 Innovatise UG, Stand: v3

Transkript:

Technische Aspekte einer Videosuchmaschine Björn Wilmsmann, CEO - MetaSieve GmbH 1

Über MetaSieve http://www.metasieve.com Softwareentwicklung Internet Software Spezialisiert auf Suchmaschinentechnologie emtain.tv, Deine Multimedia Findemaschine

Videosuche Metasuche für Onlinevideos vs. Suchfunktion auf den einzelnen Portalen Inhalte konzentrieren sich auf wenige Portale: YouTube, Dailymotion, Clipfish... Videoinhalte kleiner Anbieter sind schwer zu finden Viele Portale stellen API zur Verfügung

Unterschiede zur Textsuche Konzentration auf wenige Seiten vs. Gesamtes Internet Daher entweder gar kein oder nur begrenztes Crawling Meta-Informationen vs. Dokument Information Extraction vs. Information Retrieval

Meta-Suchmaschinen emtain.tv Google Video Yahoo Video Truveo Bing

Komponenten: APIs Programmierschnittstellen URLs, die XML / RSS / ATOM zurückliefern Vorteil: Strukturierte Daten, die sich direkt weiterverarbeiten lassen XSLT, um verschiedene APIs in ein einheitliches Format zu konvertieren

Komponenten: Cache Für jede Anfrage müssen die APIs der einzelnen Portale abgefragt werden Anfragen an APIs machen Großteil der Ladezeiten einer Ergebnisseite aus Daher: Caching

Komponenten: Crawler Analog zu Text-Suchmaschinen Durchsucht das Web nach neuen Dokumenten zur Indexierung Folgt Hyperlinks ausgehend von Seed URLs Teuer: Traffic und verteiltes Crawling Aber: Crawling ist begrenzt auf die für Videos relevante Teilmenge des Webs

Komponenten: Index Crawler / API nachgeschaltete Komponente Datenstruktur für durchsuchbare Inhalten Vektorbasiertes Modell Relevanz nach tf*idf Suffix Trees, Invertierter Index Lucene

Komponenten: Index Merging Indexgröße Datenhaltung Antwortzeit

Weitere Ansätze Nutzergenerierte Inhalte Echtzeit Ortsbasierte Suche Query By Example Audio Fingerprinting Bilderkennung, Spracherkennung

Nutzergenerierte Inhalte Nutzergenerierte Inhalte zur Gewinnung semantischer Daten. Semantische Konnotationen ermöglichen besseres Auffinden von Videos. Auch Videos mit verwandten Inhalten werden gefunden. Playlists: Gruppierung von Videos

Echtzeit Twitter, Facebook und Co. Activity Stream Videos gefiltert nach Zeitraum und Ort Interessant für aktuelle Informationen wie z.b. Nachrichten und aktuelle Trends

Ortsbasierte Suche iphone, Android, Blackberry Geolocation Suche nach Informationen zu einem bestimmten Ort

Query By Example Suche anhand von Beispielen,Finde Videos, die so ähnlich sind wie Video X Empfehlungen anhand von Nutzerpräferenzen à la Amazon

Audio Fingerprinting Abstrakte Merkmale des Audiosignals können genutzt werden, um Videos zu clustern Nutzer erhält Empfehlungen

Bilderkennung Mustererkennung in Bilddaten Vorverarbeitung: Normierung, Noise Reduction Merkmalsgewinnung Merkmalsreduktion anhand von Trennfähigkeit Klassifzierung

Spracherkennung Umsetzung gesprochener Sprache in textuelle Repräsentation oder Befehle Schwieriges Problem Rauschen Sprecherabhängigkeit Nicht jedes Video enthält gesprochenen Text

emtain.tv http://www.emtain.tv Deine Multimedia Findemaschine. Meta-Suchmaschine für Medieninhalte Aggregator für Videoinhalte Zusätzliche Informationsgewinnung durch Playlists

emtain.tv Videos erhalten durch die Verknüpfung mit anderen Videos zusätzliche Bedeutung Neue Inhalte Beziehungen zwischen einzelnen Videos schaffen neue Meta-Informationen Netzwerk-Effekt Playlists als Vermarktungstool

Die Technik hinter emtain.tv Java App Server Grails Rich Client Plugins Lucene Spring Cache Cloud Computing für Skalierbarkeit

Die Technik hinter emtain.tv Eingabe Suchdienst APIs Playlists Crawler Indexer Cache Suchergebnisse