METASEARCH PROGRAMMIERHANDBUCH. 17. 9. 2013 Manfred Schauer http://www.metajob.at



Ähnliche Dokumente
TYPO3-Suchmaschinenoptimierung für Redakteure

etutor Benutzerhandbuch XQuery Benutzerhandbuch Georg Nitsche

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Webalizer HOWTO. Stand:

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

Statuten in leichter Sprache

Leichtathletik Datenverarbeitung Handbuch

1 Mathematische Grundlagen

teamsync Kurzanleitung

Serienbrieferstellung in Word mit Kunden-Datenimport aus Excel

affilinet_ Flash-Spezifikationen

IT-SICHERHEIT IM UNTERNEHMEN Mehr Sicherheit für Ihre Entscheidung

Downloadfehler in DEHSt-VPSMail. Workaround zum Umgang mit einem Downloadfehler

auftrag.at NEU Wien, 9. August 2006

Wir machen neue Politik für Baden-Württemberg

Elexis-BlueEvidence-Connector

BERECHNUNG DER FRIST ZUR STELLUNGNAHME DES BETRIEBSRATES BEI KÜNDIGUNG

Schulung Marketing Engine Thema : Einrichtung der App

Abenteuer e-commerce Erfolgreich mit dem eigenen Onlineshop.

Erfahrungen mit Hartz IV- Empfängern

Anmeldung zu unserem Affiliate-Programm bei Affilinet

Erstellen der Barcode-Etiketten:

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

CMS.R. Bedienungsanleitung. Modul Cron. Copyright CMS.R Revision 1

User Manual Data 24. Login und Layout

Professionelle Seminare im Bereich MS-Office

Anleitung zur Erstellung von Serienbriefen (Word 2003) unter Berücksichtigung von Titeln (wie Dr., Dr. med. usw.)

Inventur. Bemerkung. / Inventur

How to do? Projekte - Zeiterfassung

Anwendungshinweise zur Anwendung der Soziometrie

MdtTax Programm. Programm Dokumentation. Datenbank Schnittstelle. Das Hauptmenü. Die Bedienung des Programms geht über das Hauptmenü.

Informationen als Leistung

GDI-Business-Line 3.x Ticketverwaltung

PHP - Projekt Personalverwaltung. Erstellt von James Schüpbach

Datenbanken Microsoft Access 2010

SMS-Dienst SMS-Dienst procar informatik AG Stand: FS 04/2011 Eschenweg Weiterstadt 1

Suchergebnisdarstellung in Google, Bing, Cuil, etc. Christina Ficsor

IBM SPSS Statistics Version 23. Einführung in Installation und Lizenzierung

PTV VISWALK TIPPS UND TRICKS PTV VISWALK TIPPS UND TRICKS: VERWENDUNG DICHTEBASIERTER TEILROUTEN

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Migration von statischen HTML Seiten

Kurzanleitung RACE APP

Tracking-Beispiele. Inhalt: Standard Tracking / Cookie Tracking Anchor-Tracking Direct Tracking Referer Tracking Tracking von Produkt-Feeds

Import der Schülerdaten Sokrates Web

Antolin-Titel jetzt automatisch in WinBIAP kennzeichnen

Kurzanleitung der Gevopa Plattform

Bedienungsanleitung: Onlineverifizierung von qualifiziert signierten PDF-Dateien

Aber zuerst: Was versteht man unter Stromverbrauch im Standby-Modus (Leerlaufverlust)?

Einführungskurs MOODLE Themen:

AutoCAD Dienstprogramm zur Lizenzübertragung

Word 2010 Schnellbausteine

Kundeninformation zur Meldungserfassung mit dem SAP Solution Manager der CPRO Industry Project and Solutions GmbH

Hilfe zur Konfiguration der Software Smart-eShop & Smart-Admin-Bereich

Tritt beim Aufruf ein Fehler aus, so wird eine MessageBox mit dem Fehlercode und der Kommandozeile angezeigt.

Erstellen und Bearbeiten von Inhalten (Assets)

Simon die linke Hand des Handwerks

Grundkenntnisse am PC Das Internet

mysql - Clients MySQL - Abfragen eine serverbasierenden Datenbank

Webseiten sind keine Gemälde. Webstandards für ein besseres Web. Webstandards für ein besseres Web

egovernment für das Open Source CMS Contao

Rundung und Casting von Zahlen

Online-Sendungsverfolgung. Morgenpost Briefservice GmbH

Folgende Voraussetzungen für die Konfiguration müssen erfüllt sein: - Ein Bootimage ab Version Optional einen DHCP Server.

Internationales Altkatholisches Laienforum

Hinweise zur Lizenzierung der winlactat 5 Software von mesics

Voraussetzungen für die Nutzung der Format Rechenzentrumslösung (Hosting)

Hilfedatei der Oden$-Börse Stand Juni 2014

Anleitung für die Formularbearbeitung

Lehrer: Einschreibemethoden

104 WebUntis -Dokumentation

Anleitung über den Umgang mit Schildern

Kapitel 4 Die Datenbank Kuchenbestellung Seite 1

BENUTZERHANDBUCH für. Inhaltsverzeichnis. 1. Anmeldung. 2. Rangliste ansehen. 3. Platzreservierung. 4. Forderungen anzeigen

WinWerk. Prozess 6a Rabatt gemäss Vorjahresverbrauch. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang Effretikon

1 Einleitung. Lernziele. automatische Antworten bei Abwesenheit senden. Einstellungen für automatische Antworten Lerndauer. 4 Minuten.

3 Wie bekommen Sie Passwortlevel 3 und einen Installateurscode?

Anleitung zum LPI ATP Portal

Virtueller Seminarordner Anleitung für die Dozentinnen und Dozenten

ecall sms & fax-portal

Angaben zu einem Kontakt...1 So können Sie einen Kontakt erfassen...4 Was Sie mit einem Kontakt tun können...7

Matrix42. Use Case - Sicherung und Rücksicherung persönlicher Einstellungen über Personal Backup. Version September

Wie benutzen Sie diese Internetseite?

die wichtigsten online-tools für augenoptiker websites

Programmers Manual Geodaten Ver. 2.0

Umgang mit Schaubildern am Beispiel Deutschland surft

Mit Sicherheit mehr Lebensqualität

AW: AW: AW: AW: Kooperationsanfrage anwalt.de

mit attraktiven visuellen Inhalten

Informationen zu den regionalen Startseiten

Barcodedatei importieren

Wie Sie mit Mastern arbeiten

Anbindung des eibport an das Internet

Wie kann ich in der Backstage-Ansicht eigene Dokumentationen einbinden?

Access Grundlagen für Anwender. Andrea Weikert 1. Ausgabe, 1. Aktualisierung, Juli inkl. zusätzlichem Übungsanhang ACC2010-UA

Externe Abfrage von für Benutzer der HSA über Mozilla-Thunderbird

Daten-Synchronisation zwischen dem ZDV-Webmailer und Outlook ( ) Zentrum für Datenverarbeitung der Universität Tübingen

PICALIKE API DOKUMENTATION

ACDSee 10. ACDSee 10: Fotos gruppieren und schneller durchsuchen. Was ist Gruppieren? Fotos gruppieren. Das Inhaltsverzeichnis zum Gruppieren nutzen

VibonoCoaching Brief -No. 18

Umsetzung Lastschrifteinreichungen im Internet-Banking Stand:

Transkript:

METASEARCH PROGRAMMIERHANDBUCH 17. 9. 2013 Manfred Schauer http://www.metajob.at

1. EINLEITUNG METASearch ist eine Sammlung von Schnittstellen, die es ermöglichen, Suchen nicht nur über die grafische Benutzeroberfläche von METAJob durchzuführen, sondern sie auch in beliebige Client-Programme zu integrieren und dadurch die Suchergebnisse maschinell weiterverarbeiten zu können. METASearch folgt einer REST 1 -Architektur. Anfragen werden über HTTP-GET-Requests an den METAJob-Server gesendet, wie z.b. http://www.metajob.at/metasearch?key=xyz&kw=php&location=4020&radius=20 Suchargumente werden dabei als URL-Parameter spezifiziert. Der METAJob-Server antwortet darauf mit einem XML-Dokument, welches das Suchergebnis kodiert, Beispiel: <?xml version= 1.0 encoding= UTF-8?> <metasearch> <state> <code>0</code> <text>ok</code> </state> <jobs> <job> <title>php Entwickler Klagenfurt</title> <location>wien, Graz</location> <found>2010-08-28</found> <snippet>... suchen wir einen PHP-Entwickler... Kenntnissen.</snippet> <url>http://www.mycompany.com/offer4711</url> <company>xyz GmbH</company> </job> <job>... </job> </jobs> </metasearch> In den folgenden Abschnitten sind die einzelnen Abfragen beschrieben. Vorher folgt jedoch ein allgemeiner Abschnitt mit Konventionen, die für alle Abfragen gelten. 2. ALLGEMEINE KONVENTIONEN QUERY-PARAMETER Suchargumente werden im URL als Teil des Query-Strings übergeben. Diese sog. Query-Parameter müssen kodiert werden, da hier nicht alle Zeichen verwendet werden können. Der URL...metasearch?key=xyz&kw=Büro ist nicht gültig. Der Wert Büro muss geeignet kodiert werden, der URL sieht danach richtigerweise so aus:...metasearch?key=xyz&kw=b%c3%bcro Diese Form der Kodierung heißt auch URL-Encoding oder Percent-Encoding und muss mit dem Zeichensatz UTF-8 durchgeführt werden. Jede Programmiersprache bietet passende Routinen an, wie z.b: encodeuricomponent in JavaScript, URLEncode.encode in Java oder urlencode in PHP. Alle Abfragen enthalten den Parameter key. Das ist ein Code zur Identifikation des Clients. Er wird von METAJob bereitgestellt. 1 http://en.wikipedia.org/wiki/representational_state_transfer Seite 1/4

ERGEBNIS-XML Abfragen liefern als Ergebnis ein Dokument mit Content-Type text/xml und encoding UTF-8. Das retournierte XML-Dokument besteht aus 2 Elementen (siehe dazu auch das Beispiel im einleitenden Abschnitt): 1. Das Element <state> zur Übermittlung von Statusinformation, siehe Tabelle 1. Es ist in der Antwort einer jeden Abfrage vorhanden. 2. Ein zweites Element, abhängig von der Abfrage selbst. Falls Jobs zurückgeliefert werden, ist es <jobs>. Siehe Tabelle 2. state state/code state/text Ergebnisstatus der Abfrage 0... Erfolg kleiner 0... Warnung. Ergebnis in <jobs> kann verarbeitet werden, der Client wird jedoch auf eine bestimmte Konstellation der Query-Parameter hingewiesen, die verbessert werden kann. größer 0... Fehler. <jobs> ist leer. Abfrage konnte nicht erfolgreich durchgeführt werden. Text zum Statuscode. Tabelle 1: <state>- jobs jobs/job jobs/job/title jobs/job/location jobs/job/found jobs/job/snippet jobs/job/text jobs/job/url jobs/job/company Enthält für jeden retournierten Job ein <job>-child-element. Element für einen Job. Jobtitel des Jobs. <title> kann auch fehlen, falls kein Titel ermittelt werden konnte. Ermittelte Einsatzorte bzw. Einsatzregionen. Element kann fehlen. Enthält einen oder mehrere durch Komma getrennte Regionen. Datum im Format yyyy-mm-dd. Gibt an, wann der URL des Jobs vom METAJob- Crawler zum ersten Mal gefunden wurde. Durch "..." getrennte Auszüge aus dem Nutztext des Jobinserats. Nur vorhanden, wenn der Parameter yntext nicht gesetzt ist, siehe auch jobs/job/text. Der beschreibende Text des Jobinserats im Plain-Text-Format. Dieses Element wird anstelle von snippet geliefert, falls der Parameter yntext=true gesetzt ist. Die Größe des zurückgelieferten XMLs erhöht sich dadurch wesentlich. URL des Jobangebots im Internet. Firmenname des ausschreibenden Unternehmens, wie auf www.metajob.at angezeigt. Tabelle 2: <jobs>- BERECHTIGUNGEN, ZUGRIFFSVERHALTEN Alle Abfragen benötigen einen key-parameter, das ist ein Schlüssel, den METAJob an jeden Client einmalig vergibt. Er berechtigt zur Durchführung eines bestimmten Kontingents von Abfragen pro Tag, max. 100000, das entspricht etwa 1 Abfrage pro Sekunde. Sollten Abfragen vom Client-Programm iterativ abgesetzt werden, muss zwischen zwei aufeinander folgenden Abfragen mindestens 1 Sekunde Sleep-Time eingehalten werden. 3. ABFRAGE: SUCHE NACH KRITERIEN Die Suche nach Kriterien liefert Jobs nach spezifizierten Suchkriterien wie Keywords, geografischer Region und Alter. Diese Abfrage entspricht jener Suchfunktionalität, die auch interaktiv auf der grafischen Benutzeroberfläche von METAJob in der Detailsuche zur Verfügung steht. Tabelle 3 zeigt die verfügbaren Parameter. Seite 2/4

key kw textall textsome textnone titleall titlesome titlenone location radius maxage Von METAJob zur Verfügung gestellter Schlüssel. Parameter muss angeführt werden. Keywords. 'kw' ist ein Synonym für den 'textall'-parameter. Dient nur der kürzeren und einfacheren Schreibweise. Eines oder mehrere durch Blank getrennte Keywords. Qualifiziert sind nur Jobs, die alle Keywords im Titel oder Inseratentext enthalten. Eines oder mehrere durch Blank getrennte Keywords. Qualifiziert sind Jobs, die mindestens eines der Keywords in Titel oder Inseratentext enthalten. Eines oder mehrere durch Blank getrennte Keywords. Qualifiziert sind Jobs, welche die genannten Keywords nicht enthalten. Diese Form von negativen Keywords machen nur Sinn in Kombination mit anderen wie z.b. textall oder textsome. Eines oder mehrere Keywords. Alle Wörter müssen im Jobtitel enthalten sein. Eines oder mehrere Keywords. Mindestens ein Wort muss im Jobitel enthalten sein. Eines oder mehrere Keywords. Jobs mit min. einem der genannten Keywords im Titel werden nicht geliefert. Eine oder mehrere geografische Regionen, angegeben durch deren Namen oder durch die Postleitzahl. Die Verwendung von Postleitzahlen empfiehlt sich dann, wenn Ortsnamen nicht eindeutig (homonym) sind, wie z.b. 'Sankt Johann', oder das Risiko durch eine falsche Schreibweise zu hoch ist. Radius zur Umkreissuche in km. Falls dieser Parameter vorhanden ist, werden Jobs nicht nur in den durch 'location' bestimmten Gemeinden geliefert, sondern auch in deren Umkreis mit dem spezifiziertem Radius. Mögliche Werte sind 10, 20, 30, 50, 100, 150, 200. Maximales Alter der gelieferten Jobs in Tagen. Unter Alter eines Jobs versteht man in METAJob die Zeit seit dem erstmaligen Auffindens des URLs der Job-Seite im Internet. Zulässige Werte sind ganze Zahlen größer gleich 1. maxresults Maximale Anzahl der zu retournierenden Jobs. Wert muss innerhalb von [10, 1000] liegen. Falls nicht gesetzt, gilt 200 als Defaultwert. yntext Wenn auf true gesetzt, wird für jeden Job anstelle von <snippet> das Element <text> retourniert. Tabelle 3: Parameter bei der Suche nach Kriterien 4. ABFRAGE: JOBS ZU EINER DOMAIN Diese Abfrage liefert alle auf METAJob verfügbaren Jobs zu einer bestimmten Internet-Domain, siehe Tabelle 4. key domain Von METAJob zur Verfügung gestellter Schlüssel. Parameter muss angeführt werden. Ein Domain-Name, wie z.b.: www.mycompany.com oder mycompany.at. Muss zumindest aus 2 Namensteilen bestehen, die durch Punkte getrennt sind. Subdomains, wie z.b. 'www', können inkludiert sein, werden aber generell ignoriert. Seite 3/4

ext yntext Mögliche Werte: 'true' und 'false'. Default ist 'true'. Bei ext='false' werden nur Jobs zur angegebenen Domain geliefert. Falls domain gleich 'mycompany.at' können z.b. Jobs der Domains 'www.mycompany.at', 'jobs.mycompany.at' oder 'mycompany.at' retourniert werden. Mit ext='true' werden Jobs einer erweiterten Domain-Menge retourniert. Firmen neigen dazu, Ihren Content unter mehreren Domains zu hosten. Variationen entstehen z.b. durch die Verwendung von unterschiedlichen Top-Level-Domains, wie z.b: mycompany.at versus mycompany.net, oder auch durch die Verwendung von Bindestrichen, wie z.b. my-company.at versus mycompany.at. METASearch liefert bei ext="true" die Vereinigungsmenge der Jobs der so verwandten Domains, jedoch nur dann, falls die Domains auf Rechnern gehostet werden, die sich im selben IP-C-Netz befinden. Beispiel: Falls domain gleich 'www.mycompany.at', können Jobs zu folgenden Domains retourniert werden: 1. mycompany.at, jobs.mycompany.at, www.mycompany.at. Diese werden auch bei ext='false' retourniert. 2. mycompany.com, www.mycompany.net, jobs.mycompany.net. Diese werden retourniert, falls die Domains auf "den selben Rechnern" wie mycompany.at gehostet werden, d.h. selbes IP-C-Netz. 3. my-company.at, www.my-company.com. Wie voriger Punkt. Wenn auf true gesetzt, wird für jeden Job anstelle von <snippet> das Element <text> retourniert. Tabelle 4: Parameter bei der Suche zu einer Domain Seite 4/4