Web Data Management Systeme



Ähnliche Dokumente
Integration, Migration und Evolution

Anleitung zur Erstellung und Bearbeitung von Seiten in Typo3. Typo3. Anleitung. Wenpas Informatik

How-to: Webserver NAT. Securepoint Security System Version 2007nx

TBooking: Integration der Online-Buchung auf der eigenen Homepage. Version 1.0. Bayern Reisen & Service GmbH Im Gewerbepark D Regensburg

Suche schlecht beschriftete Bilder mit Eigenen Abfragen

crm-now/ps Webforms Webdesigner Handbuch Erste Ausgabe

Kurzanweisung für Google Analytics

BitDefender Client Security Kurzanleitung

HTML5. Wie funktioniert HTML5? Tags: Attribute:

Gesucht und Gefunden: Die Funktionsweise einer Suchmaschine

Anlegen eines SendAs/RecieveAs Benutzer unter Exchange 2003, 2007 und 2010

Informatik 12 Datenbanken SQL-Einführung

Dokumentation Externe Anzeige von Evento Web Dialogen

Schritt für Schritt Hilfe Neufahrzeugkonfigurator

teischl.com Software Design & Services e.u. office@teischl.com

Suchmaschinenoptimierung (SEO) für Ihren Shop. Mario Rieß Chief Technology Officer

Webseiten und Web-Apps grafisch gestalten mit HTML5 Canvas ohne Flash und sonstige Tools

CODESOFT version 10. SOFTWARE SOLUTIONS Label Design ERP/Host Connectivity Data Management

SEMINAR Modifikation für die Nutzung des Community Builders

3. Neuen Newsbeitrag erstellen Klicken Sie auf das Datensatzsymbol mit dem +, damit Sie einen neuen Newsbeitrag erstellen können.

Wir beraten Sie. Wir unterstützen Sie. Wir schaffen Lösungen. Wir bringen Qualität. Wir beraten Sie. Wir unterstützen Sie. Wir schaffen Lösungen

Suchmaschinenoptimierung in Typo 3

Workflow Monitoring basierend auf den SemTalk Services. Semtation GmbH

Anleitung für IQES-Verantwortliche Persönliche Konten verwalten

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Kapiteltests zum Leitprogramm Binäre Suchbäume

Loggen Sie sich in Ihrem teamspace Team ein, wechseln Sie bitte zur Verwaltung und klicken Sie dort auf den Punkt Synchronisation.

Universal Dashboard auf ewon Alarmübersicht auf ewon eigener HTML Seite.

Fragebogen. zur Erschließung und Sicherung von Online-Dokumenten. Auswahl von elektronischen Publikationen

Titel. SCSM ITIL - CMDB - neue CI Klasse erstellen und benutzen. Eine beispielhafte Installationsanleitung zur Verwendung im Testlab

Einführung in das redaktionelle Arbeiten mit Typo3 Schulung am 15. und

Das Modul Hilfsmittel ermöglicht den Anwender die Verwaltung der internen Nachrichten, Notizen, Kontakte, Aufgaben und Termine.

Ursprung des Internets und WWW

Whitepaper. Produkt: combit Relationship Manager. Einbindung externer FiBu-/Warenwirtschaftsdaten. combit GmbH Untere Laube Konstanz

Document Management. Überblick DM

Anleitung Redmine. Inhalt. Seite 1 von 11. Anleitung Redmine

Verwenden von Adobe LiveCycle ES3 Connector für Microsoft SharePoint

Aktuelles, Mitteilungen und Veranstaltungen verwalten

VERWENDEN VON ADOBE DIGITAL ENTERPRISE PLATFORM DOCUMENT SERVICES CONNECTOR FÜR MICROSOFT SHAREPOINT 10.0

Das Handbuch zu KNetAttach. Orville Bennett Übersetzung: Thomas Bögel

Workshops. Gewinnen Sie mehr Zeit und Qualität im Umgang mit Ihrem Wissen

Erstellung botoptimierter Partnerlinks

TYPO3-Suchmaschinenoptimierung für Redakteure

1. Konfiguration Outlook 2007 MAPI (mit Autodiscover).

Webentwicklung mit Mozilla Composer I.

Vorstellung der Software Hystoria Im Rahmen des Hauptseminars Lernwerkzeuge - von Björn Winterberg und Jochen Feldkamp

Hilfetext zur Anschreibenverwaltung

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin:

Projekte Packen, Kopieren und Versenden

Lexmark Bild-Manager Windows-basierte Anwendung zum Bearbeiten und Bereinigen von Bildern und zum Erstellen von Anmerkungen für diese Bilder.

IAWWeb PDFManager. - Kurzanleitung -

INHALTSVERZEICHNIS Allgemeine Beschreibung... 3 Verwendung der Webseite... 4 Abbildungsverzeichnis... 12

Beheben von verlorenen Verknüpfungen

Layoutmodelle. Steffen Schwientek Große Klostergasse Friedberg schwientek@web.de Web :schlaukopp.org

Mit Suchmaschinen zum Erfolg. Optimierung von Unternehmenswebseiten und Suchmaschinenmarketing.

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Optimieren Sie Ihre n2n Webseite

Cayuga. A General Purpose Event Monotoring System. David Pfeiffer. 19. Juli 2007

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

Whitepaper. Produkt: combit Relationship Manager. Einbindung externer FiBu-/Warenwirtschaftsdaten. combit GmbH Untere Laube Konstanz

Proxy. Krishna Tateneni Übersetzer: Stefan Winter

Schutz von Online Datenbanken Technische Möglichkeiten

Infotag 2012: Projektmanagement mit Microsoft SharePoint. Thomas Marhöfer / Hagen Schellewald

Schritt 1: Verwenden von Excel zum Erstellen von Verbindungen mit SQL Server-Daten

Summer Workshop Mehr Innovationskraft mit Change Management

Typo3 Tutorial Bildarchiv

Übungsaufgabe zum ECDL-Modul 7

php Hier soll ein Überblick über das Erstellen von php Programmen gegeben werden. Inhaltsverzeichnis 1.Überblick Parameterübergabe...

Wichtige Information zur Verwendung von CS-TING Version 9 für Microsoft Word 2000 (und höher)

Microsoft Access 2013 Navigationsformular (Musterlösung)

Anleitung zum erstellen einer PDF-Datei aus Microsoft Word

Step by Step Webserver unter Windows Server von Christian Bartl

HSR git und subversion HowTo

Business Application Framework für SharePoint Der Kern aller PSC-Lösungen

Sichere s. Kundeninformation zur Verschlüsselung von s in der L-Bank

Lernprogramm "Veröffentlichen von WMS- Services"

8. Suchmaschinen Marketing Kongress SEO/SEM-Fehler welche Sie meiden sollten

Erstellen und Bearbeiten von Inhalten (Assets)

Content Management Systeme (CMS)

Erstellen einer in OWA (Outlook Web App)

Folgende Einstellungen sind notwendig, damit die Kommunikation zwischen Server und Client funktioniert:

Produktbeschreibung utilitas Ticketsystem

3 Richtlinienbasierte Verwaltung und Multi-Server- Administration

7. Übung - Datenbanken

Google Eine kurze Anleitung Stand: 3. August 2010

2.1 Grundlagen: Anmelden am TYPO3-Backend

datenfabrik. Validieren von -Adressen 1

Anleitung OpenCms 8 Webformular Auswertung

Anleitung auf SEITE 2

Benutzerhandbuch MedHQ-App

ArenaSchweiz AG. CMS Concrete5.7 Erste Schritte

Pfötchenhoffung e.v. Tier Manager

kreativgeschoss.de Webhosting Accounts verwalten

Meine erste Homepage - Beispiele

Mobile-Szenario in der Integrationskomponente einrichten

Anleitung Abwesenheitsmeldung und -Weiterleitung (Kundencenter)

:: Anleitung Hosting Server 1cloud.ch ::

Dieses Dokument soll dem Administrator helfen, die ENiQ-Software als Client auf dem Zielrechner zu installieren und zu konfigurieren.

Vereinfachte Ticketerfassung oxando GmbH

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Transkript:

Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel

Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS Zusammenfassung 15.06.2005 Arne Frenkel - Data Web Management Systems 2

Einführung WWW bietet gute Möglichkeit, Informationen zu verbreiten Um Informationen zu finden, werden Konzepte zum Suchen benötigt Dabei müssen große Mengen von Daten bewältigt werden, die im gesamten WWW verteilt sein können 15.06.2005 Arne Frenkel - Data Web Management Systems 3

Suchmaschinen z.b.,, Unterstützen: Stichwort-Suche Teilweise Suche im Usenet, nach Bildern oder Sound Verknüpfte Suche mit AND, OR, +/- Suchen nach kompletten Phrasen ( ) 15.06.2005 Arne Frenkel - Data Web Management Systems 4

Suchmaschinen Nachteile Keine Suche nach Metadaten Keine Suche nach Links Keine Suche nach strukturellen Eigenschaften Nur Text-Suche möglich Mehrfach gefundene Dokumente Keine Suche nach dynamischen Inhalten 15.06.2005 Arne Frenkel - Data Web Management Systems 5

Meta-Suchmaschine 8. Zusammengeführte Ergebnisse 3. Ergebnisse 2. Anfrage Meta 1. User-Anfrage Search Engine 4. Anfrage 5. Ergebnisse Search Engine 1 Search Engine 2 7. Ergebnisse User 6. Anfrage Search Engine n 15.06.2005 Arne Frenkel - Data Web Management Systems 6

W3QS (WWW Query System) Technion (Isreal Institute of Technology) SQL-Ähnlich Unterstützt: Inhaltliche und strukturelle Anfragen Eigene Programme können eingebunden werden Online Formulare automatisch ausfüllen 15.06.2005 Arne Frenkel - Data Web Management Systems 7

W3QS (WWW Query System) WWW wird als Knoten (Webseiten) und Kanten (Links) gesehen Es wird ein Startknoten festgelegt! SELECT n 2 FROM n 1, l 1, n 2 WHERE n 1.url = http://www.unimagdeburg.de AND n 2.title LIKE %Informatik% Gesucht werden alle Seiten, die über einen Link von n 1 zu erreichen sind und den Titel Informatik enthalten 15.06.2005 Arne Frenkel - Data Web Management Systems 8

W3QS (WWW Query System) Pfad von unbestimmter Länge SELECT FROM n 1, l 1,(n 2, l 2 ), l 3, n 3 WHERE n 1.url = http://www.uni-magdeburg.de n 3 : PERLCOND (n 3.title.content = /Informatik/i) ; Using ISEARCHd d 5 l 1000 -d bestimmt die maximale Länge des Pfads (n 2, l 2 ) -l bestimmt die maximale Anzahl von HTTP-Requests PERL-Programm kann verschiedene Dateiformate analysieren (z.b. HTML, Latex, Postscript) 15.06.2005 Arne Frenkel - Data Web Management Systems 9

WebSQL Universität von Toronto SQL-Ähnlich Unterstützt: Strukturelle Anfragen Annahme: Relationen für Dokumente und Links Document[url, title, text, type,..] Anchor[base, label, href] 15.06.2005 Arne Frenkel - Data Web Management Systems 10

WebSQL Verschiedene Arten von Links Interior: wenn Ziel und Basis-Dokument gleich sind a ( ) Local: wenn sich Ziel und Basis-Dokument auf gleichem Server befinden ( ) Global: wenn sich Ziel und Basis-Dokument auf verschiedenen Servern befinden ( ) 15.06.2005 Arne Frenkel - Data Web Management Systems 11

WebSQL SELECT d.url, d.title FROM Document d SUCH THAT http://www.uni-magdeburg.de WHERE d.title CONTAINS Informatik d Ausgegeben werden URL und Titel aller Seiten, die über einen internen oder externen Link von www.unimagdeburg.de zu erreichen sind und deren Titel Informatik enthält 15.06.2005 Arne Frenkel - Data Web Management Systems 12

WebLog Concordia Universität Logik-basierter Ansatz HTML-Tags können zur strukturierten Suche genutzt werden Leider wird nur die Suche von einer Seite aus unterstützt 15.06.2005 Arne Frenkel - Data Web Management Systems 13

WebLog WebLog stellt eine Reihe von Prädikaten zur Verfügung (z.b. <url> [<attr> -->> <val>]) informatik_urls.html[title --> Informatik URLs, hlink -->> L, occurs -->> T] <-- http://www.uni-magdeburg.de [hlink -->> L], href(l,u), U[title -> T], substring(t, Informatik ) 15.06.2005 Arne Frenkel - Data Web Management Systems 14

Information Integration Systems Anfragen an verschiedene Online-Quellen Um komplexere Antworten zu erlangen wichtige Aufgaben: Strukturierung Kombinieren Daten von HTML-Seiten müssen Strukturiert werden Wrapper-Programme interpretieren eine Anfrage und geben strukturierte Ergebnisse Mediatoren wählen Online Quellen aus und speichern Ergebnisse Sie gewinnen zu dem Informationen aus den Ergebnissen 15.06.2005 Arne Frenkel - Data Web Management Systems 15

Ariadne Erleichtert Erstellen von Wrappern durch Tools Web-Quellen sollen wie DB genutzt werden Stalker inductive-learning system Unterstützt Entwurf von eigenen Mediatoren Zum Gewinnen, Abfragen und Integrieren von Daten im Web 15.06.2005 Arne Frenkel - Data Web Management Systems 16

Ariadne 2-Phasen Algorithmus 1. Phase: Preprocessing 2. Phase: Planning-by-Rewriting 15.06.2005 Arne Frenkel - Data Web Management Systems 17

TSIMMIS (The Stanford-IBM Manager of Multiple Information Sources) Bietet Datenmodell und Anfrage-Sprache Verschiedene Informationen über gleiche reale Entitäten können kombiniert werden Außerdem bietet es Tools, um Komponenten zum Integrieren von Informationen zu erstellen 15.06.2005 Arne Frenkel - Data Web Management Systems 18

TSIMMIS (The Stanford-IBM Manager of Multiple Information Sources) MSL oder Lorel Mediator MSL Wrapper Information Sources Mediator Generator Wrapper Generator Komponenten von TSIMMIS 15.06.2005 Arne Frenkel - Data Web Management Systems 19

Zusammenfassung Such-Systeme Internet wird als große DB gesehen Meist wird von einem Startpunkt aus eine Suche angestoßen Information Integration Systems Informationen von verschiedenen Quellen werden strukturiert und kombiniert 15.06.2005 Arne Frenkel - Data Web Management Systems 20