Alphaversion einer vektorbasierten Suchmaschine
|
|
|
- Kora Schubert
- vor 7 Jahren
- Abrufe
Transkript
1 Alphaversion einer vektorbasierten Suchmaschine Samuel Broscheit Patrick Simianer Quoc Duy Trinh Universität Heidelberg Seminar für Computerlinguistik WS07/08 Hauptseminar Information Retrieval PD Dr. Karin Haenelt
2 Gliederung Motivation Aufbau Umfang Technische Voraussetzungen Struktur der Datenbank Erzeugung der Datenbank FACL Crawler runcrawl runrequests Scrubber Lemmatizer Vectorizer 2
3 Gliederung Aufbau Suchfunktionen Interface Evaluation Things we want to debug Erweiterungen Ressourcen 3
4 Motivation 4
5 Motivation Eine Suchmaschine schreiben Umsetzung des Gelernten Herausforderung ein großes Projekt anzugehen Programmentwicklung im Team Lernen anhand einer praktischen Problemstellung Einfach mal machen ==> Das Projekt wurde größer als ursprünglich geplant... 5
6 Aufbau 6
7 Umfang Bis jetzt etwas über 100Kb und 2870 Zeilen Quelltext Ca Revisionen im SVN Korpus: Ca Dokumente, davon: 2000 PDFs 200 Postcripts Restliche Dokumente HTML: Aktuelle CL-Seite public_html-verzeichnisse der Studenten Homepages der Dozenten Seiten der Fachschaft Referate Veranstaltungen Es ist geplant das Korpus mit den Dokumenten weiterer Homepages der CL- Institute deutschlandweit zu füllen. 7
8 Technische Voraussetzungen Server Apache PHP5 SQLite Importierte Ressourcen Scriptaculous Hunspell Hunspell-Dictionaries von OpenOffice.org PHPCrawl pdftotext ps2ascii gzip 8
9 Struktur der Datenbank Datenbank mit folgenden Tabellen: Dokumente + Verwaltungstabellen documents, documentslock, process Einstiegspunkte (URL) entrypoints Lemmata und deren Häufigkeit in den Dokumenten lemma, lemmaindocfrequency Teilweise mit Indexierungen um Geschwindigkeit zu erhöhen 9
10 Struktur der Datenbank 10
11 Erzeugung der Datenbank 11
12 Erzeugung der Datenbank runcrawl Instantiiert Crawler-Objekt mit Einstiegspunkt und weiteren Einstellungen (Timeout, crawldepth, useragentstring...) Crawler Angepasster PHPCrawl (Behandlung eines Seitenaufrufs - handlepagedata) Nimmt URL, liest Links aus und verfolgt diese (Links nur aus HTML- Dokumenten) Respektiert Regeln aus der robots.txt Erzeugt für jede ermittelte und gültige URL ein DBDocument-Objekt Trägt nur erwünschte (verarbeitbare) Dateitypen in die DB ein das neue DBDocument-Objekt trägt folgendes in die Datenbank ein: die URL den contenttype (z.b. text/html, text/plain, application/pdf,...) den aktuellen Timestamp 12
13 Erzeugung der Datenbank DBDocument Repräsentiert sämtliche Eigenschaften des Dokuments unter einer URL Prüft sich z.b. auf bestehende Existenz und Aktualität und führt bei Bedarf entsprechende Operationen aus Einfüge-, Aktualisierung-, Lösch- und Zustandsfunktionen Akzessormethoden id = 4 url = contenttype = application/pdf title = The Digital Millennium Copyright... hash = e29deadbeefa7a78ce3e (MD5) textdata = serialisiertes DocumentData-Objekt language = en_us timestamp = UNIX timestamp hits = Anzahl Klicks cosinusdenominator = linker Teil Nenner Cosinusmaß 13
14 Erzeugung der Datenbank Process Verwaltet einen runrequests-aufruf (documentslock werden gesetzt) Gibt runrequests die zu bearbeitenden URLs vor (s.o.) runrequests Instantiiert für jede URL ein PageRequest-Objekt und verwaltet dieses Leitet Dateien entsprechend ihren Typs an den Scrubber weiter Errechnet Hashwerte Datenbankoperationen wieder mit DBDocument Objekten PageRequest Ruft eine URL auf und lädt deren Inhalt herunter (tmp Datei oder in Speicher) 14
15 Erzeugung der Datenbank Scrubber Nimmt Dateien, Archive oder (Quell-)Text Erzeugt Plaintext konvertiert dabei von ISO ,ISO ,Windows-1252,CP1252,ASCII in UTF-8 Postscript wird mit ps2ascii und PDF Dateien mit pdftotext umgewandelt Extrahiert Titel aus PDF und HTML Dateien die Hürden dabei: jede HTML-Seite ist anders aufgebaut, so dass das suchen und finden eines Titels einige trial and error -Lernschritte benötigt bis man einen Großteil erwischt das Arbeiten mit regulären Ausdrücken wird gefährlich bis unmöglich, da man es mit teilweise mit sehr langen Dateien zu tun hat die zu Speicherfehlern führen oder das Programm an die Grenzen des Hauptspeichers bringt bei mehreren Konvertierungsschritten hintereinander ist muss man immer aufpassen, den Zielzeichensatz von UTF-8 nicht zu verlieren, da manche Funktionsaufrufe die Codierung wieder zerstören 15
16 Erzeugung der Datenbank DocumentData Enthält die Analysedaten des Textes Plaintext, der nur noch Whitspaces, Buchstaben und Zahlen enthält Textlänge Lemmatapositionen (dazu gleich mehr) Tokenlänge (dito) und die Funktion gettokenizedtext() der alle aus Buchstaben und Zahlen zusammenhängende Strings als Array zurück gibt, wobei im Schlüssel eines Eintrags die Position des Tokens im Text vermerkt ist 16
17 Lemmatizer(HunspellLemmatizer) verfügt über die Funktionen: setlanguage(sprachkürzel) stellt die Sprache des Lexikons und der Affixregeln ein. Das Sprachkürzel ist nach dem Localeschema (de_de, en_us,...) zu wählen lemmatize(term) Lemmatisiert den den Term suggest(term) Gibt einen Korrekturvorschlag für ein möglicherweise falsch geschriebenes Wort basiert auf hunspell-1.2.1, der in C++ geschriebenen Komponente von OpenOffice.org beinhaltet einige Morphologische Funktionen (suggest(), stem()), die wir uns zu Nutze machen wollten dazu haben wir eine PHP-Erweiterung geschrieben, so dass die Funktionen direkt in PHP nutzbar sind, ohne, dass man den Umweg über die Kommandozeile nehmen muß. Sonst würde für jeden Term das komplette Lexikon neu geladen (bei de_de.dic immerhin 1.5 MB) Erzeugung der Datenbank 17
18 Erzeugung der Datenbank Hunspell ist OpenSource ist aus MySpell gewachsen, da für die Ungarische Sprache komplexere morphologische Regeln nötig waren und MySpell für englisch programmiert wurde ist für europäischen Sprachen die erste Wahl und nicht umsonst die zentrale morphologische Komponente bei OpenOffice.org benötigt eine Datei mit Wortbildungsregeln und ein Dictionary, in dem jedem Wort seine Affixregel zugeordnet ist Außerdem enthält die Affix-Datei auch die Ersetzungsregeln für das Spellchecking Das schöne ist, dass man die Affix-Regeln auch problemlos selbst erweitern kann, wenn man auf Unstimmigkeit stößt Nur das Pflegen der Dictionaries ist sehr aufwändig 18
19 Erzeugung der Datenbank Ausschnitt aus Affix-Regel Datei Ausschnitt aus Lexikon 19
20 Erzeugung der Datenbank Vectorizer Analysiert den Plaintext von Scrubber Hat die Funktionen: guesslanguageoftext(tokenisierter TEXT) hier wird die Sprache anhand der Vorkommenshäufigkeit der Stopwörter im Text erraten und der Lemmatizer auf die entsprechende Sprache eingestellt analyzetext(tokenisierter TEXT) geht Token für Token durch den Text, ignoriert dabei Stopwörter jedes gefundene Token wird lemmatisiert (Häuser->Haus) und gegebenenfalls neu in der lemma-tabelle angelegt zu jedem Lemma wird seine Häufigkeit im Text gezählt und anschließend in der Tabelle lemmaindocfrequency der Eintrag docid, lemmaid, frequency, normalizedfrequency abgespeichert, der das aktuelle Dokument mit seinen Lemmata und deren Häufigkeit verknüpft Zusätzlich wird ein Array erstellt, das der Position jedes Tokens im Plaintext von Scrubber die jeweilige lemmaid zuordnet und die Länge des Tokens. So hat man später die Positionen der gefundenen Lemmata und kann schnell und einfach den Textausschnitt berechnen. Abschließend wird das DocumentData mit dem Plaintext und den Arrays gefüllt und in DBDocument abgespeichert 20
21 Suchfunktion Interface Verwendet Ajax Query kann mit and/und or/oder und Klammerung verfeinert werden 20 Treffer pro Seite In andere Seiten dynamisch integrierbar Bietet Permalink auf Query an 21
22 Query Lemmatizer 22
23 Query Lemmatizer 23
24 Demo 24
25 Query 25
26 Query Der Ablauf der Queryverarbeitung Die Suchanfrage wird an ein Objekt der Klasse Similarity(oder besser gesagt an eine ihrer Ableitungen CosinusNormalizedTermWeightSimilarity,...) übergeben Diese prüft mit einem Objekt der Klasse Query die Gültigkeit der Suchanfrage für jede vorhandene Sprache filtere Stoppwörter prüfe die Syntax der Klammerung und der logischen Operatoren jeder Suchterm wird lemmatisiert und wenn sein Lemma in der DB existiert in die SQL-Abfrage übernommen für jede Sprache wird ein Objekt der Klasse QueryVector erstellt der die Lemmatisierten Suchterme und die zugehörigen Teile der SQL-Abfrage enthält welches dann zurückgegeben wird Nun werden die SQL-Abfragen an die Datenbank gestellt und, wobei bei CosinusNormalizedTermWeightSimilarity die Berechnung und Sortierung sofort durch die SQL-Abfrage gemacht wird Nun wird ein Array mit Objekten der Klasse QueryResult gefüllt und an die Suchseite zurückgegeben 26
27 Query Die Klasse QueryResult hat die Funktionen getsnippet() Berechnet den Ausschnitt, der auf der Suchseite angezeigt wird, indem die Stelle mit dem nächsten Abstand zwischen zwei Suchwörtern sukzessive ermittelt wird und von da aus 5 Ausschnitte aneinander geklebt werden, die sich im Optimalfall sogar so überlappen, dass ein zusammenhängender Textausschnitt entsteht gettitle() gibt den Titel zurück getdocumentdata() holt aus der documents-tabelle das abgespeicherte DocumentsData-Objekt, mit dem gescrubbten Plaintext und den lemmata-positionen und die Attribute language, similarity und url 27
28 Evaluation 28
29 Things we want to debug Laufzeit ist bei mehr als 3 Wörter schon im mittleren Fall (jedes der Suchworte kommt maximal 150 mal vor) extrem lang (>30 sec) 29
30 Erweiterungen Auf unserer To-Do-Liste stehen u.a. folgende Punkte: Inverse Dokumentfrequenz Termgewichte erhöhen, wenn sie in Titeln und Überschriften gefunden werden Wahlmöglichkeit zwischen Cosinus, Dice und Jaccard Ausgabe von QueryParser-Meldungen ( x von y Wörter nicht gefunden, Ausdruck ungültig ) Crawler-Statistik (Bearbeitungszeiten...) RequestDelay per Domain Cache-Anzeige mit Highlights auf Query-Begriffe Bei gelöschten Dokumenten auf Cache verweisen Integration OpenThesaurus RSS-Feed zu Suchergebnis zusammenhängender Text -Suche '+' Operator zum Erhöhen eines Termgewichts Integration des PageRank Algorithmus ( 30
31 Werkzeuge & Ressourcen script.aculo.us Hunspell Hunspell-Dictionaries von OpenOffice.org PHPCrawl pdftotext ps2ascii gzip 31
32 Werkzeuge & Ressourcen Eclipse (+PHPEclipse + Subclipse) Subversion Ähnlichkeitsmaße für Vektoren Kursskripte Information Retrieval, Karin Haenelt, Materialsammlung zur Implementierung von Information Retrieval Systemen Kursskripte Information Retrieval, Karin Haenelt,
33 Herzlichen Dank für die Aufmerksamkeit! 33
Grundlagen der Informatik 2
Grundlagen der Informatik 2 Dipl.-Inf., Dipl.-Ing. (FH) Michael Wilhelm Hochschule Harz FB Automatisierung und Informatik [email protected] Raum 2.202 Tel. 03943 / 659 338 1 Gliederung 1. Einführung
Projektaufgabe Datenbankenverwaltung
Realisierung DB-gestützter Anwendungssysteme Projektaufgabe Datenbankenverwaltung Prof. Dr. Ingo Claßen HTW Berlin 1 Einleitung In den Datenbanklehrveranstaltungen im Studiengang Wirtschaftsinformatik
Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz
02_Grundlagen Lucene Übung Medienretrieval WS 07/08 Thomas Wilhelm, Medieninformatik, TU Chemnitz Was ist Lucene? (1) Apache Lucene is a high-performance, full-featured text search engine library written
Softwarepraktikum - Verteidigung Entwurf LDAP-Interfaces für majordomo und Web
Softwarepraktikum - Verteidigung Entwurf LDAP-Interfaces für majordomo und Web Michael Weiser, Steffen Wolf, 99IN 22. Mai 200 WEB-INTERFACE 2 Web-Interface. Softwareschnittstellen Webserver in Entwicklung
Textdokument-Suche auf dem Rechner Implementierungsprojekt
Textdokument-Suche auf dem Rechner Implementierungsprojekt Referent: Oliver Petra Seminar: Information Retrieval Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 19.01.2015 Überblick
ANDROID. Analyse der Android Plattform. Andre Rein, Johannes Florian Tietje. 28. Oktober 2010. FH-Gieÿen-Friedberg Android Praktikum
Analyse der Android Plattform Andre Rein, Johannes Florian Tietje FH-Gieÿen-Friedberg Android Praktikum 28. Oktober 2010 Topics 1 Übersicht Android Plattform Application Framework Activities und Services
JSCMS Dokumentation. (Stand: 27.05.09)
JSCMS Dokumentation (Stand: 27.05.09) Inhalt: CMS Symbole und Funktionen. 2 Verwalten.. ab 3 Seiten Verwalten.. 4 Blöcke Verwalten....6 Templates Verwalten....7 Template Editor...8 Metatags bearbeiten..
Die XML-Schnittstelle von FreelancerWelt.de Projektimport
Die XML-Schnittstelle von FreelancerWelt.de Projektimport Die Schnittstelle ermöglicht es neue IT Projekte auf FreelancerWelt.de automatisch einzustellen, bestehende zu aktualisieren oder zu löschen. Wenn
SUCHMASCHINEN XAPIAN. Michael Strzempek FH Wiesbaden, 5. Juni 2008
SUCHMASCHINEN XAPIAN Michael Strzempek FH Wiesbaden, 5. Juni 2008 INHALT 1. Motivation 2. Prinzip / Vokabular 3. Xapian 4. Omega 5. Datenbank Indizierung 6. Levenshtein Distanz 7. Boolesche Suche 8. Probabilistische
Abschnitt 4: Grundlagen der Datenbanktechnologie
Abschnitt 4: Grundlagen der Datenbanktechnologie Inhalt: Dateien vs. Datenbanken Datenbanken: Tabellen, Attribute und Datentyp Datenmodellierung mit dem Entity-Relationship-Modell Normalformen einer Datenbank
Die eigene, persönliche Webseite der Fakultät mittels Imperia (CMS) pflegen
Die eigene, persönliche Webseite der Fakultät mittels Imperia (CMS) pflegen 27.10.2004 Dipl.Ing. Dirk Osterkamp/@com 1 Die eigene, persönliche Webseite der Fakultät mittels Imperia (CMS) pflegen Zusammenhang
X10 Webinterface Benutzerhandbuch(ver0.9) 1. Wie das Webinterface gestartet wird und wie es eingerichtet werden muss:
X10 Webinterface Benutzerhandbuch(ver0.9) ACHTUNG : Bitte beachten Sie, das am X10 mindestens eine Firmwareversion R1644 oder höher installiert sein sollte um den fehlerfreien Betrieb des Webinterface
Installation des edu- sharing Plug- Ins für Moodle
Installation des edu- sharing Plug- Ins für Moodle [edu-sharing Team] [Dieses Dokument beschreibt die Installation und Konfiguration des edu-sharing Plug-Ins für das LMS Moodle.] edu- sharing / metaventis
Homepage mit einem WCMS: Typo3
Homepage mit einem WCMS: Typo3 Universität Zürich Institut für Mathematik Ziele Das Institut möchte sich anspruchsvoll darstellen. Daten (Vorlesungen/ Seminare/ Publikationen) sollen aktuell sein und durch
Drei-Schichten-Architektur. Informatik B - Objektorientierte Programmierung in Java. Vorlesung 17: 3-Schichten-Architektur 2
Universität Osnabrück 1 3 - Objektorientierte Programmierung in Java Zur Erinnerung: Aufteilung der Schichten GUI Vorlesung 17: 3-Schichten-Architektur 2 Fachkonzept Fachkonzept - Datenhaltung Datenhaltung
Gruppe: swp12-9 (Projektleiter: Benjamin Glatz) Datum: Lastenheft. Web Annotation mit Fragment Ids. Gruppe: swp12-9
Lastenheft Web Annotation mit Fragment Ids Gruppe: swp12-9 Inhaltsverzeichnis 1. Zielbestimmung...2 2. Produkteinsatz...2 3. Produktübersicht...3 4. Produktfunktionen...4 5. Produktdaten...7 6. Produktleistungen...8
Suche für Anwender in SharePoint 2013
Suche für Anwender in SharePoint 2013 Vorstellung Nico Thiemer Buch- und Fachartikelautor zum Thema SharePoint Trainer und Berater Microsoft SharePoint Dynamics CRM Office 365/Azure SharePoint und Dynamics
Webmail. Anleitung für Ihr online E-Mail-Postfach. http://webmail.willytel.de
Webmail Anleitung für Ihr online E-Mail-Postfach http://webmail.willytel.de Inhalt: Inhalt:... 2 Übersicht:... 3 Menü:... 4 E-Mail:... 4 Funktionen:... 5 Auf neue Nachrichten überprüfen... 5 Neue Nachricht
Datenbanken. Ein DBS besteht aus zwei Teilen:
Datenbanken Wikipedia gibt unter http://de.wikipedia.org/wiki/datenbank einen kompakten Einblick in die Welt der Datenbanken, Datenbanksysteme, Datenbankmanagementsysteme & Co: Ein Datenbanksystem (DBS)
Tabellenkalkulation 1. Einheit 5 Rechnerpraktikum EDV
Tabellenkalkulation 1 Einheit 5 Rechnerpraktikum EDV Inhalt Einführung in die Tabellenkalkulation Berechnungen in Excel Formeln und Bezüge Funktionen Arbeiten mit Datenlisten Sortieren und Filtern Übungen
DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER
DATENBANKEN SQL UND SQLITE VON MELANIE SCHLIEBENER INHALTSVERZEICHNIS 1. Datenbanken 2. SQL 1.1 Sinn und Zweck 1.2 Definition 1.3 Modelle 1.4 Relationales Datenbankmodell 2.1 Definition 2.2 Befehle 3.
Praktikum Information Retrieval Wochen 12: Suchmaschine
Praktikum Information Retrieval Wochen 12: Suchmaschine Melikka Khosh-Niat Matthias Jordan 23. Mai 3. Juni 2011 Lösungen: Upload bis 3. Juni 2011 Aktuelle Informationen, Ansprechpartner, Material und Upload
Projekt Online-Shop:
Mit einem Buchverwaltungsprogramm kann können über das Internet neue Datensätze in eine Online-Datenbank einund ausgegeben, sowie gelöscht und verändert werden. Die Internet-Site besteht aus den nebenstehenden
Web Scraping. Seminar Aktuelle Software-Engineering Praktiken für das World Wide Web JK 19.05.2010
Web Scraping Seminar Aktuelle Software-Engineering Praktiken für das World Wide Web JK 19.05.2010 Inhalt Einführung Motivation Dokumente herunterladen Scraping Document Object Model Regular Expressions
Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale?
Text Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale? Textklassifikationen Natürliche bzw. unstrukturierte Texte Normale Texte ohne besondere Merkmale und Struktur Semistrukturierte
AJAX SSL- Wizard Referenz
AJAX SSL- Wizard Referenz Version 1.0.2+ - 04.04.2011 Präambel Die vorliegende Dokumentation beschreibt den AJAX basierten SSL- Wizard der CertCenter AG. Der SSL- Wizard kann mit wenigen Handgriffen nahtlos
Installation des edu-sharing Plug-Ins für Moodle
Installation des edu-sharing Plug-Ins für Moodle [Matthias Hupfer, Steffen Hippeli] [Dieses Dokument beschreibt die Installation und Konfiguration des edu-sharing Plug-Ins für das LMS Moodle.] edu-sharing.com
HTTP- SOAP- Schnittstelle
HTTP- SOAP- Schnittstelle für Brief- und SMS- Versand und Account- Verwaltung Stand: 09. September 2009 Die Nutzung der Schnittstelle unterliegt den Allgemeinen Geschäftsbedingungen der OEKOPOST Deutschland
Einfu hrung in Subversion mit TortoiseSVN
Einfu hrung in Subversion mit TortoiseSVN Inhalt Konzept... 1 Begriffe... 1 Werkzeuge... 2 Arbeiten mit TortoiseSVN... 2 Vorbereitung... 2 Erster Checkout... 2 Hinzufügen eines neuen Verzeichnisses...
PHP Übungsaufgabe 2 1 / 5. Doing Web Apps. PHP Übungsaufgabe 2
1 / 5 Doing Web Apps PHP Übungsaufgabe 2 Werkzeuge Text-Editor, beispielsweise Notepad++ Webserver mit aktiviertem PHP Modul + MySQL-Datenbank Unterlagen SelfHTML PHP API Handbuch Alle Dokumente des Seminars
Carl-Engler-Schule Karlsruhe Datenbank 1 (5)
Carl-Engler-Schule Karlsruhe Datenbank 1 (5) Informationen zur Datenbank 1. Definition 1.1 Datenbank-Basis Eine Datenbank-Basis ist eine Sammlung von Informationen über Objekte (z.b Musikstücke, Einwohner,
CMS.R. Bedienungsanleitung. Modul Cron. Copyright 10.09.2009. www.sruttloff.de CMS.R. - 1 - Revision 1
CMS.R. Bedienungsanleitung Modul Cron Revision 1 Copyright 10.09.2009 www.sruttloff.de CMS.R. - 1 - WOZU CRON...3 VERWENDUNG...3 EINSTELLUNGEN...5 TASK ERSTELLEN / BEARBEITEN...6 RECHTE...7 EREIGNISSE...7
Projekt Weblog :: Integration
Projekt Weblog :: Integration Die Implementation des Formhandling Frameworks wird nun im Projekt Weblog integriert. Dafür stehen 2 Möglichkeiten zur Auswahl. Sie haben Ihre eigene Implementation der Actions,
Stefan Schröder Hard- und Softwareentwicklungen. Anleitung TSImport. Zum Neetzekanal Brietlingen
Stefan Schröder Hard- und Softwareentwicklungen Anleitung TSImport Stefan Schröder Hard- und Softwareentwicklungen Zum Neetzekanal 19 21382 Brietlingen e-mail: [email protected] Internet: http://www.sshus.de
Motivation Komponenten Konfiguration Modifikationen Suchmaschine Literatur. colibri Search. Eine Literatursuchmaschine für Fremdsprachenlerner
colibri Search Eine suchmaschine für Fremdsprachenlerner Seminar für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 11. Januar 2010 Überblick 1 2 3 4 5 colibri Search colibri Search ist eine
Dynamische Webseiten mit PHP 1
Dynamische Webseiten mit PHP 1 Webserver, PHP und MYSQL Ein Webserver dient dazu, Internetseiten an PCs zu senden, von denen sie aufgerufen werden. Beispiel: Sie tippen im Browser www.fosbosweiden.de ein.
Access 2010. für Windows. Andrea Weikert 1. Ausgabe, 4. Aktualisierung, Juni 2012. Grundlagen für Anwender
Andrea Weikert 1. Ausgabe, 4. Aktualisierung, Juni 2012 Access 2010 für Windows Grundlagen für Anwender ACC2010 2 Access 2010 - Grundlagen für Anwender 2 Mit Datenbanken arbeiten In diesem Kapitel erfahren
SYMPTOME U. a.: Wenn man nach der Datensicherung wieder mit dem ColorManager arbeiten will, kommt die Meldung. auf Deutsch oder.
Das Programm Backup On Stick verursacht immer öfter Fehlermeldungen von ColorManager, da die Datensicherung über nicht dokumentierte Wege außerhalb des SQL-Servers durchgeführt wird. Deshalb wird auch
Schrittweise Anleitung zur Installation von Zertifikaten der Bayerischen Versorgungskammer im Microsoft Internet Explorer ab Version 6.
Schrittweise Anleitung zur Installation von Zertifikaten der Bayerischen Versorgungskammer im Microsoft Internet Explorer ab Version 6.0 Diese Anleitung führt Sie Schritt für Schritt durch die komplette
Datenaustausch. Energiewirtschaft 3. Semester. Tillman Swinke
Datenaustausch Energiewirtschaft 3. Semester Tillman Swinke Frohes neues Jahr Organisatorisches Ab nächster Vorlesung: 30 min Fragestunde (Bitte Vorbereiten) Übungsklausur in der nächsten Vorlesung Agenda
Bedienungsanleitung. Homepage-Verwaltung mit Easy File Manager (EFM) http://fileman.qth.at
http://fileman.qth.at Homepage hochladen 1. Zuerst die erstellte Homepage (HTML, PHP) am eigenen PC mit einem Pack-Programm (z.b. 7-ZIP, siehe weiter unten) in eine ZIP-Datei einpacken. WICHTIGER HINWEIS:
Entwicklungstand der GUI
1/13 Entwicklungstand der GUI Dietrich Vogel [email protected] 7. Juli 2004 2/13 Inhalt 1.Konzept 2.Entwicklungsstand 3.Bestehende Probleme 4.Weitere Entwicklungsstrategie 5.Fragen, Diskussion
HTL-Website. TYPO3- Skriptum II. Autor: RUK Stand: 02.06.2010 Gedruckt am: - Version: V0.1 Status: fertig. Qualitätsmanagement
HTL-Website TYPO3- Skriptum II Autor: RUK Stand: 02.06.2010 Gedruckt am: - Version: V0.1 Status: fertig Qualitätsmanagement Erstellt Geprüft Freigegeben Name RUK Datum 02.06.2010 Unterschrift Inhaltsverzeichnis
Suchmaschinenoptimierung (SEO) Die Grundlagen was Sie wissen sollten?
Suchmaschinenoptimierung (SEO) Die Grundlagen was Sie wissen sollten? Search Engine Marketing SEA SEM = Search Engine Marketing Suchmaschinen-Marketing umfasst alle Maßnahmen zur Gewinnung von qualifizierten
Hinweise zu MapSolution Version 16.0
Hinweise zu MapSolution Version 16.0 0 Vorraussetzungen: Der Webbrowser Internet Explorer 8 ist veraltet und wird nicht mehr unterstützt. Falls Sie diesen Browser noch im Einsatz haben, nehmen Sie ein
Hinweise zur Bestellung anonymer Zählmarken
Allgemein Hinweise zur Bestellung anonymer Zählmarken Grundlage für die reguläre Ausschüttung im Bereich Texte im Internet / METIS ist die Zählung der Zugriffe mittels einer Zählmarke. Diese Zählmarke
Schlussbewertung FB VI SOFTWAREPROJEKT II WS 09/10 TEAM. Alexander Kalden Dominik Eckelmann Marcel Pierry Julian Heise Besha Taher
Schlussbewertung FB VI SOFTWAREPROJEKT II WS 09/10 TEAM Alexander Kalden Dominik Eckelmann Marcel Pierry Julian Heise Besha Taher 729631 745097 736477 745011 741297 Inhalt Schlussbewertung... 3 Bewertung
Prototypische Komponenten eines Information Retrieval Systems: Vektormodell
Prototypische Komponenten eines Information Retrieval Systems: Vektormodell Implementierung & Präsentation: Stefan Schmidt (Uni Mannheim) Kontakt: [email protected] Seminar: Information Retrieval WS2002/2003
Dokumentation zur Anlage eines JDBC Senders
Dokumentation zur Anlage eines JDBC Senders Mithilfe des JDBC Senders ist es möglich auf eine Datenbank zuzugreifen und mit reiner Query Datensätze auszulesen. Diese können anschließend beispielsweise
5. Suchmaschinen Herausforderungen beim Web Information Retrieval. Herausforderungen beim Web Information Retrieval. Architektur von Suchmaschinen
5. Suchmaschinen Herausforderungen beim Web Information Retrieval 5. Suchmaschinen 5. Suchmaschinen Herausforderungen beim Web Information Retrieval Verweisstrukturen haben eine wichtige Bedeutung Spamming
libreka! Content Backoffice
libreka! Anleitung zur Einstellung und Verwaltung Ihrer Titel über das libreka! v 1.4 1 Inhalt 1 ÜBER DIESES DOKUMENT... 3 2 DAS BACKOFFICE... 3 2.1 Aufruf und Anmeldung... 3 2.2 Menü Titel Status / Zugriffsbeschränkungen...
1. Handhabung. 1.1. Werkzeug- und Menüleiste
1. Handhabung 1.1. Werkzeug- und Menüleiste Neuer Ordner Ausschneiden Kopieren Einfügen Löschen separate Vorschau Ausloggen Neues Dokument Schnellsuche Datei importieren Schnellsuche Spaltenansicht = normale
Inverted Files for Text Search Engines
Inverted Files for Text Search Engines Justin Zobel, Alistair Moffat PG 520 Intelligence Service Emel Günal 1 Inhalt Einführung Index - Inverted Files - Indexkonstruktion - Indexverwaltung Optimierung
Klausurteilnehmer. Wichtige Hinweise. Note: Klausur Informatik Programmierung, 17.09.2012 Seite 1 von 8 HS OWL, FB 7, Malte Wattenberg.
Klausur Informatik Programmierung, 17.09.2012 Seite 1 von 8 Klausurteilnehmer Name: Matrikelnummer: Wichtige Hinweise Es sind keinerlei Hilfsmittel zugelassen auch keine Taschenrechner! Die Klausur dauert
R-Wörterbuch Ein Anfang... ein Klick auf einen Begriff führt, sofern vorhanden, zu dessen Erklärung.
R-Wörterbuch Ein Anfang... ein Klick auf einen Begriff führt, sofern vorhanden, zu dessen Erklärung. Carsten Szardenings [email protected] 7. Mai 2015 A 2 B 3 C 4 D 5 F 6 R 16 S 17 V 18 W 19 Z 20 H 7 I 8 K 9
Drei-Schichten-Architektur. Informatik B - Objektorientierte Programmierung in Java. Vorlesung 16: 3-Schichten-Architektur 1 Fachkonzept - GUI
Universität Osnabrück Drei-Schichten-Architektur 3 - Objektorientierte Programmierung in Java Vorlesung 6: 3-Schichten-Architektur Fachkonzept - GUI SS 2005 Prof. Dr. F.M. Thiesing, FH Dortmund Ein großer
CartCalc FAQ (frequently asked questions) häufige Fragen zu CartCalc
CartCalc FAQ (frequently asked questions) häufige Fragen zu CartCalc Installation Frage: Wie installiere ich CartCalc? Antwort: Die Installation von CartCalc erfolgt automatisch. Nach Einlegen der Demo-CD
Software-Engineering Grundlagen des Software-Engineering 7.3 Sourcecode-Verwaltung mit Versionsmanagement-Systemen Einführung in Subversion (SVN)
Software-Engineering Grundlagen des Software-Engineering 7.3 Sourcecode-Verwaltung mit Versionsmanagement-Systemen Einführung in Subversion (SVN) Prof. Dr. Rolf Dornberger Software-Engineering: 7.3 Versionsmanagement-Systeme
Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14
Universität Augsburg, Institut für Informatik Wintersemester 2013/14 Prof. Dr. W. Kießling 10. Oktober 2013 F. Wenzel, D. Köppl Suchmaschinen Vorlesung Suchmaschinen Semesterklausur Wintersemester 2013/14
Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten
Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten In dem Virtuellen Seminarordner werden für die Teilnehmerinnen und Teilnehmer des Seminars alle für das Seminar wichtigen Informationen,
Internetanbindung von Datenbanken
Internetanbindung von Datenbanken http://galahad.informatik.fh-kl.de/~miesel/index.html PHP -1 Gliederung Einführung PHP3 Datenbankanbindung mit PHP3 Sicherheitsprobleme Realisierung mit PHP3 Probleme
PHP und MySQL. Integration von MySQL in PHP. Zellescher Weg 12 Willers-Bau A109 Tel. +49 351-463 - 32424. Michael Kluge (michael.kluge@tu-dresden.
Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH) PHP und MySQL Integration von MySQL in PHP Zellescher Weg 12 Willers-Bau A109 Tel. +49 351-463 - 32424 ([email protected]) MySQL
Geschichte des Internets Suchmaschinen Fachinformationszentren. Institute for Science Networking
Geschichte des Internets Suchmaschinen Fachinformationszentren Kurze Geschichte des Internets Internet: Geschichte beginnt mit der Entwicklung paketvermittelter Netze. Bei der Paketvermittlung werden Nachrichten
Artikel Schnittstelle über CSV
Artikel Schnittstelle über CSV Sie können Artikeldaten aus Ihrem EDV System in das NCFOX importieren, dies geschieht durch eine CSV Schnittstelle. Dies hat mehrere Vorteile: Zeitersparnis, die Karteikarte
Anleitung zur Aktualisierung
CONTREXX AKTUALISIERUNG 2010 COMVATION AG. Alle Rechte vorbehalten. Diese Dokumentation ist urheberrechtlich geschützt. Alle Rechte, auch die der Modifikation, der Übersetzung, des Nachdrucks und der Vervielfältigung,
VMware vrealize Log Insight- Entwicklerhandbuch
VMware vrealize Log Insight- Entwicklerhandbuch vrealize Log Insight 2.5 Dieses Dokument unterstützt die aufgeführten Produktversionen sowie alle folgenden Versionen, bis das Dokument durch eine neue Auflage
MySql und PHP. Apache2: Konfigurieren für php4. ...\apache2\conf\httpd.conf aufrufen. Folgende Zeilen einfügen:
MySql und PHP Apache2: Konfigurieren für php4...\apache2\conf\httpd.conf aufrufen Folgende Zeilen einfügen: LoadModule php4_module "c:/php/php4apache2.dll" AddType application/x-httpd-php.php Wichtig!!
Plugins. Stefan Salich ([email protected]) Stand 2008-11-21
Plugins Stefan Salich ([email protected]) Stand 2008-11-21 Inhaltsverzeichnis 0 Einleitung...3 0.1 Sinn und Zweck...3 0.2 Änderungsübersicht...3 0.3 Abkürzungsverzeichnis...3 1 Einfügen eines Plugins...4 1.1
Bedeutung von i18n, L10n
i18n L10n Bedeutung von i18n, L10n i18n == Internationalization L10n == Localization Timon Schroeter 3 www.php-schulung.de Definitionen i18n, L10n i18n == Internationalization is the process of designing
Canto Cumulus Daten nach Daminion importieren
Canto Cumulus Daten nach Daminion importieren In diesem Kapitel erfahren Sie, wie Sie Ihre Daten bei einem Wechsel von Canto Cumulus nach Daminion importieren können. Cumulus bietet keine Funktion, alle
Datenbanksysteme SS 2007
Datenbanksysteme SS 2007 Frank Köster (Oliver Vornberger) Institut für Informatik Universität Osnabrück Kapitel 9c: Datenbankapplikationen Architektur einer Web-Applikation mit Servlets, JSPs und JavaBeans
Probeklausur: Programmierung WS04/05
Probeklausur: Programmierung WS04/05 Name: Hinweise zur Bearbeitung Nimm Dir für diese Klausur ausreichend Zeit, und sorge dafür, dass Du nicht gestört wirst. Die Klausur ist für 90 Minuten angesetzt,
VIVIT TQA Treffen in Köln am 18. 04. 2013. API- Programmierung und Nutzung bei HP Quality Center / ALM. Michael Oestereich IT Consultant QA
VIVIT TQA Treffen in Köln am 18. 04. 2013 API- Programmierung und Nutzung bei HP Quality Center / ALM Michael Oestereich IT Consultant QA Agenda Vorstellung der API- Versionen OTA- API SA- API REST- API
TYPO3-Schulung für Redakteure Stand: 5.4.2007
TYPO3-Schulung für Redakteure Stand: 5.4.2007 Um sich in TYPO3 einzuloggen, rufen Sie bitte im Internet die Seite http://www.vdi.de/t3_live/typo3 auf, geben Sie dort Ihren Benutzernamen und Ihr Passwort
MS Access 2013 Kompakt
2 ABFRAGEN Eine Abfrage ist im Wesentlichen der Filterung eines Datenbestandes sehr ähnlich. Auch hier werden aus einer Menge von Informationen nur jene Datensätze ausgewählt, die einem vorher definierten
AplusixAdmin : Administration von Aplusix 3 Benutzerhandbuch
1. Einleitung AplusixAdmin : Administration von Aplusix 3 Benutzerhandbuch Mai 2011 Deutsche Übersetzung von Marion Göbel verfaßt mit epsilonwriter AplusixAdmin ist die Verwaltungssoftware von Aplusix.
Die Statistiken von SiMedia
Die Statistiken von SiMedia Unsere Statistiken sind unter folgender Adresse erreichbar: http://stats.simedia.info Kategorie Titel Einfach Erweitert Übersicht Datum und Zeit Inhalt Besucher-Demographie
JooLIMS. Manueller Import
JooLIMS Manueller Import XAMPP 1.7.3 (nicht 1.7.4!, da Joomla 1.5 nicht unter 1.7.4 läuft) Joomla 1.5 installieren (nicht 1.6!) Download der Komponente Fabrik 2.1 (http://fabrikar.com/downloads/details/36/89)
s aufräumen in Thunderbird v45.3
Ihr Ansprechpartner: macrocom Support Tel: 06103/391-279 E-Mail: [email protected] E-Mails aufräumen in Thunderbird v45.3 Inhaltsangabe 1. Papierkorb löschen/leeren 2. Sortieren von E-Mails (zur besseren
Klausur zur Veranstaltung "Wirtschaftsinformatik I" Wintersemester 2007/2008
Dr. Axel Kalenborn BWL-Wirtschaftsinformatik Klausurtermin: 29.02.2008 Klausur zur Veranstaltung "Wirtschaftsinformatik I" Wintersemester 2007/2008 Vorbemerkungen: 1. Die Klausur umfasst insgesamt 9 Seiten.
Framework zur Unterstützung von Unit-Tests
JUnit Framework zur Unterstützung von Unit-Tests Automatisierte Ausführung von Tests Ideen dahinter Testgetriebene Entwicklung: Erst testen, dann programmieren Alle Testfälle häufig ausführen (nach jeder
Kurzanleitung für die Import/Export Funktion Kinderleicht Produkte importieren und aktualisieren und exportieren
Kurzanleitung für die Import/Export Funktion Kinderleicht Produkte importieren und aktualisieren und exportieren Sehr geehrter Online-Händler, damit Sie schnell mit Ihrem Onlineshop erfolgreich, möchten
Typo 3 installieren. Schritt 1: Download von Typo3
Typo 3 installieren Bevor Sie Typo3 installieren, müssen Sie folgende Informationen beachten: Typo3 benötigt eine leere Datenbank. Mit Ihrem Abonnement verfügen Sie über eine einzige Datenbank. Sie können
Dokumentation Goobi-Plugin
Dokumentation Goobi-Plugin für einen Import mittels SRU 1 Dokumentation Goobi-Plugin Technische Dokumentation für ein Goobi-Plugin zum Import von Katalogdaten via SRU für die Humboldt- Universität zu Berlin
Projektdokumentation
Projektdokumentation Schachspiel mit JavaScript Daniel Mockenhaupt Klasse 10b Projektdokumentation: Schachspiel mit JavaScript Seite 1 Einführung Ziel dieser Projektarbeit soll die Erstellung eines Schachspiels
Installationsanleitung dateiagent Pro
Installationsanleitung dateiagent Pro Sehr geehrter Kunde, mit dieser Anleitung möchten wir Ihnen die Installation des dateiagent Pro so einfach wie möglich gestalten. Es ist jedoch eine Softwareinstallation
Road Account Maut Control - Version 1.60
Road Account Maut Control - Version 1.60 Inhalt: 1 Einleitung... 2 2 Technische Voraussetzungen... 3 3 Funktionsbeschreibung... 4 3.1 Reiter Road Account... 4 3.1.1 Datei öffnen... 4 3.1.2 Wiederherstellen...
design kommunikation development
http://www.dkd.de dkd design kommunikation development Apache Solr - A deeper look Stefan Sprenger, Developer dkd Olivier Dobberkau, Geschäftsführer dkd Agenda Einführung Boosting Empfehlungen Ausblick
Mimosa NearPoint Mailarchivierung. Dokumentation Mimosa. Stand Dezember 2010
Dokumentation Mimosa Stand Dezember 2010 Inhalt Ansprechpartner... 3 Einführung... 4 Funktionsweise Mimosa NearPoint... 4 Umgang mit dem Mimosa Archiv... 5 Zugriff auf Ihr Mailarchiv über Mimosa Archive
Hilfe zur Dokumentenverwaltung
Hilfe zur Dokumentenverwaltung Die Dokumentenverwaltung von Coffee-CRM ist sehr mächtig und umfangreich, aber keine Angst die Bedienung ist kinderleicht. Im Gegensatz zur Foto Galeria können Dokumente
Endanwender Handbuch
Endanwender Handbuch INHALTSVERZEICHNIS Vorwort...3 Frontend und Backend...3 Das Dashboard...4 Profil Bearbeiten...6 Inhalte Verwalten...6 Seiten...6 Seite verfassen...7 Papierkorb...11 Werbebanner...11
DATENSERIALISIERUNG & INTERNETZUGRIFF. Am Beispiel einer RSS-Reader-App
DATENSERIALISIERUNG & INTERNETZUGRIFF Am Beispiel einer RSS-Reader-App AGENDA (1/2) Allgemeines Projekt Einführung Konzept Live Demo Ausblick AGENDA (2/2) Unterrichtseinheit Serialisierung Lokales speichern
So geht s Schritt-für-Schritt-Anleitung
So geht s Schritt-für-Schritt-Anleitung Software WISO Mein Büro 365 Thema Artikelimport Version/Datum ab 16.00.05.100 1. Einführung Über den Artikelimport haben Sie die Möglichkeit Artikel aus vielen gängigen
MySQL, phpmyadmin & SQL. Kurzübersicht
MySQL, phpmyadmin & SQL Kurzübersicht Referenzen MySQL Documentation: http://dev.mysql.com/doc PHP 5 / MySQL5. Studienausgabe. Praxisbuch und Referenz (Kannengießer & Kannengießer) 2 Datenbank anlegen
HS Information Retrieval
HS Information Retrieval Vergleichende Implementierung der grundlegenden IR-Modelle für eine Desktop-Suche Inhalt 1. Überblick 2. Recap: Modelle 3. Implementierung 4. Demo 5. Evaluation Überblick Ziele:
