Webcrawler. Tetiana Teplynska LMU München Centrum für Informations- und Sprachverarbeitung

Größe: px
Ab Seite anzeigen:

Download "Webcrawler. Tetiana Teplynska LMU München Centrum für Informations- und Sprachverarbeitung"

Transkript

1 Webcrawler Tetiana Teplynska LMU München Centrum für Informations- und Sprachverarbeitung

2 Inhalt Einführung: Definition Verwendung von Web Crawlers Probleme von Crawling Robots Exclusion: Robots.txt Robots <META> Tag Bibliotheken: Perl (Web scraper) Python (Beautifulsoup) References 2

3 Definition Ein Webcrawler ist ein Computerprogramm, das automatisch das World Wide Web durchsucht und Webseiten analysiert. Synonyme: Webcrawler, Spider, Searchbot, Robot, Walker, Wanderer 3

4 Verwendung von Web Crawlers Indizieren der Webseiten für Suchmaschinen Archivieren von Webseiten (e.g. The Internet Archive Analyze von Web Sammeln von -Adressen für Spammers 4

5 Probleme von Crawling Doppelter Inhalt Usability on the Web ( dead pages, veraltete/fehlerhafte Firefall Konfiguration von Web Servers) Spider traps Fehler in dem HTML-Code Fehlende Hochkommas bei den Attributen: <img src=myimage.gif> Fehlende schließende Tags Verwendung der falschen HTNL-Tags Falsche Verschachtelung von HTML-Tags. 5

6 Robots Exclusion Die Webseiten können darum bieten, dass die Crawlers auf bestimmte Teile der Dokumente nicht zugreifen dürfen. Zwei Standards: Robots Exclusion Protocol (robots.txt) Robots <META> Tag 6

7 Robots Exclusion Robots Exclusion Protocol (robots.txt): Wird spezifiziert, welche Bereiche der Webseite besucht werden dürfen Die Datei soll in dem Stammverzeichnis der Webseite liegen robots.txt muss als plain text mit ASCII-Kodierung gespeichert sein! Überprüfung: $ file -I robots.txt Disallow: robots.txt: / text/plain; charset=us-ascii Wenn Sie Ihre Seiten von allen Crawlern crawlen lassen möchten, benötigen Sie keine robots.txt-datei. 7

8 Twitter Robots Exclusion robots.txt wird beim scanning von URLs beachtet Beispiel: nt: Disallow: * * Disallow: / Google User-agent: Twitterbot Allow: /images Allow: /archives Google-Crawlers: Googlebot (Google Websuche), Googlebot-News, Googlebot-Image Werden mehrere User-Agents in der robots.txt-datei erkannt, folgt Google dem spezifischsten. User-agent: Googlebot nt: Disallow: * Disallow: / User-agent: Googlebot-Image Disallow: /personal 8

9 Robots <META> Tag: Robots Exclusion Spezifiziert die Seiten, die von einem Robot nicht indiziert werden sollen. Kann von einigen Robots ignoriert werden! Beispiele: <meta name="googlebot" content="noindex"> <meta name="robots" content="none" /> 9

10 Bibliotheken Web Scraping ist eine Software Technik für Extraktion der Informationen aus den Webseiten. Perl (Web Scraper) < html > < head > < name="description" content="beschreibung"> < /head > < body > < h1 >Test< /h1 > < /body > < /html > #!/usr/bin/perl use strict; use warnings; use Web::Scraper; my $content = do{ local $/; <$fh> }; my $parser = scraper { process 'meta[name="description"]', description => ;}; my $result = $parser->scrape( $content ); print $result->{description}; 10

11 Python (Beautifulsoup) Bibliotheken Beautiful Soup ist eine Python-Bibliothek, die für das Parsen von HTML- und XML-Dateien verwendet wird. Python 2.6+, Python 3 html_doc = """ <html><head><title>the Dormouse's story</title></head> <body> <p class="title"><b>the Dormouse's story</b></p> <p class="story">once upon a time there were three little sisters; and their names were <a href="http://example.com/elsie" class="sister" id="link1">elsie</a>, <a href="http://example.com/lacie" class="sister" id="link2">lacie</a> and <a href="http://example.com/tillie" class="sister" id="link3">tillie</a>; and they lived at the bottom of a well.</p> <p class="story">...</p> """ 11

12 Python (Beautifulsoup) Bibliotheken from bs4 import BeautifulSoup soup = BeautifulSoup(html_doc, 'html.parser') print(soup.prettify()) # <html> # <head> # <title> # The Dormouse's story # </title> # </head> # <body> # <p class="title"> # <b> # The Dormouse's story # </b> # </p> # <p class="story"> # Once upon a time there were three little sisters; and their names were # <a class="sister" href="http://example.com/elsie" id="link1"> # Elsie # </a> 12

13 Python (Beautifulsoup) soup.title # <title>the Dormouse's story</title> soup.title.name # u'title' soup.title.string # u'the Dormouse's story' soup.title.parent.name # u'head' Bibliotheken soup.p # <p class="title"><b>the Dormouse's story</b></p> soup.p['class'] # u'title' soup.a # <a class="sister" href="http://example.com/elsie" id="link1">elsie</a> soup.find_all('a') # [<a class="sister" href="http://example.com/elsie" id="link1">elsie</a>, # <a class="sister" href="http://example.com/lacie" id="link2">lacie</a>, # <a class="sister" href="http://example.com/tillie" id="link3">tillie</a>] 13

14 References [1] About /robots.txt: [2] About the Robots <META> tag, [3] Was ist die Meta-tag "ROBOTS" - meta name robots, [4] [5] https://dev.twitter.com/cards/getting-started [6] https://support.google.com/webmasters/answer/ ?hl=de [7] [8] [9] https://beautiful-soup-4.readthedocs.org/en/latest/ [10] https://web.csulb.edu/divisions/students/dss/accessibility/web/webaim- 12comm.html 14

Web Crawling Die Erschließung des Webs

Web Crawling Die Erschließung des Webs Web Crawling Die Erschließung des Webs Ronny Harbich Otto-von-Guericke-Universität 5. Dezember 2007 1/24 Ronny Harbich Web Crawling Die Erschließung des Webs Übersicht 1 2 3 4 2/24 Ronny Harbich Web Crawling

Mehr

Web Scraping. Seminar Aktuelle Software-Engineering Praktiken für das World Wide Web JK 19.05.2010

Web Scraping. Seminar Aktuelle Software-Engineering Praktiken für das World Wide Web JK 19.05.2010 Web Scraping Seminar Aktuelle Software-Engineering Praktiken für das World Wide Web JK 19.05.2010 Inhalt Einführung Motivation Dokumente herunterladen Scraping Document Object Model Regular Expressions

Mehr

Social Media. Live Beispiel

Social Media. Live Beispiel Social Media Live Beispiel Begriffe Der Querverweis URL LINK (Hyperlink) WEB-Adresse Verweis Bezeichnen die selbe Sache http://www.firma.de/angebot Landing Page Zeitschriften Tageszeitungen Andere Webseiten

Mehr

Suchmaschinen-Optimierung. SEO-Praxistipps für bessere Rankings

Suchmaschinen-Optimierung. SEO-Praxistipps für bessere Rankings Suchmaschinen-Optimierung SEO-Praxistipps für bessere Rankings SEO-Praxistipps Crawlbarkeit & Indexierung pistoor@mindshape.de 2 #1 Crawler-Steuerung durch robots.txt Crawler schaut in robots.txt-datei,

Mehr

Exkurs Suchmaschinen Grundlagen

Exkurs Suchmaschinen Grundlagen Exkurs Suchmaschinen Grundlagen Suchmaschinen = Google Rund 93% der deutschen Nutzer verwenden Google als Suchmaschine Suchmaschinen / Google Wie kommt die Zielgruppe auf die Webseite? 2 Möglichkeiten:

Mehr

Meta-Tags Übersicht. HTTP-EQUIV: Expires

Meta-Tags Übersicht. HTTP-EQUIV: Expires Meta-Tags Übersicht HTTP-EQUIV Expires Funktion HTML-Seiten werden, nachdem Sie diese geladen haben, im Cache Ihres Browsers gespeichert, damit Sie diese beim nächsten Aufruf nur noch von der lokalen Platte

Mehr

Einführung in Webspider

Einführung in Webspider Einführung in Webspider Dr. Christian Herta June 8, 2009 1 von 31 Dr. Christian Herta Einführung in Webspider Outline 1 Einführung 2 Anforderungen Robustness Politeness and Legal Issues Quality and Coverage

Mehr

Black Hat / White Hat 02. Februar 2009 Köln

Black Hat / White Hat 02. Februar 2009 Köln Black Hat / White Hat 02. Februar 2009 Köln Rechenbeispiel Suchvolumen 5.000.000 Conversion 1% Gewinn / Conversion = 25 Wieviel ist der 1. Platz wert? Wieviel ist der 2 Platz wert? Wieviel ist der 10 Platz

Mehr

Geschichte des Internets Suchmaschinen Fachinformationszentren. Institute for Science Networking

Geschichte des Internets Suchmaschinen Fachinformationszentren. Institute for Science Networking Geschichte des Internets Suchmaschinen Fachinformationszentren Kurze Geschichte des Internets Internet: Geschichte beginnt mit der Entwicklung paketvermittelter Netze. Bei der Paketvermittlung werden Nachrichten

Mehr

Suchmaschinen I Suchmaschinenoptimierung I Besucher werden Kunden. Wie werde ich im Internet gefunden!

Suchmaschinen I Suchmaschinenoptimierung I Besucher werden Kunden. Wie werde ich im Internet gefunden! Wie werde ich im Internet gefunden! Funktionsweise von Suchmaschinen? Informationen automatisch sammeln (robots, crawler, spider...) Informationen speichern und bewerten ( Datenbanken) Ergebnisausgabe

Mehr

Hand aufs Herz: Wie online ist Ihr Unternehmen?

Hand aufs Herz: Wie online ist Ihr Unternehmen? Hand aufs Herz: Wie online ist Ihr Unternehmen? Testen Sie Ihre Website in wenigen Schritten doch einfach mal selbst! Hallo! Mein Name ist Hans-Peter Heikens. Als Online Marketing Manager und Social Media

Mehr

Informatik I: Einführung in die Programmierung

Informatik I: Einführung in die Programmierung Informatik I: Einführung in die Programmierung 21. Das WWW befragen Albert-Ludwigs-Universität Freiburg Bernhard Nebel 13.01.2015 1 13.01.2015 B. Nebel Info I 3 / 17 Oft braucht ein Programm Informationen,

Mehr

Optimale Website-Architektur Suchmaschinenmarketing Kongress 2006

Optimale Website-Architektur Suchmaschinenmarketing Kongress 2006 blog.namics.com Optimale Website-Architektur Suchmaschinenmarketing Kongress 2006 Zürich, 14. Juni 2006 Jürg Stuker, CEO & Partner Bern, Frankfurt, Hamburg, München, St. Gallen, Zug, Zürich Ausgangslage

Mehr

Webspider mit curl. PHPWorld Kongress München, 9. November 2010 Stefan Fischerländer

Webspider mit curl. PHPWorld Kongress München, 9. November 2010 Stefan Fischerländer Webspider mit curl PHPWorld Kongress München, 9. November 2010 Stefan Fischerländer suchmaschinen optimierung consulting Kurzvorstellung - Stefan Fischerländer Stefan Fischerländer SEO-Schulungen und -Consulting

Mehr

David Mika. Donnerstag, den 15. März 2012. Verein zur Förderung der privaten Internet Nutzung e.v. Suchen und Finden im Internet. david@ping.

David Mika. Donnerstag, den 15. März 2012. Verein zur Förderung der privaten Internet Nutzung e.v. Suchen und Finden im Internet. david@ping. Suchen im David Mika Verein zur Förderung der privaten Nutzung e.v. Donnerstag, den 15. März 2012 Themenüberblick 1 2 3 4 5 6 Informationsflut im Jeder kann schnell und einfach Dokumente publizieren Aktuell

Mehr

Webseiten-Bericht für shagor5.net

Webseiten-Bericht für shagor5.net Webseiten-Bericht für shagor5.net Generiert am 11 Januar 2016 08:43 AM Der Wert ist 46/100 SEO Inhalte Seitentitel Free web hosting service with cpanel WordPress Joomla ecommerce hosting Länge : 79 Ideal,

Mehr

Webseiten-Bericht für bibekkumarshrestha.com.np

Webseiten-Bericht für bibekkumarshrestha.com.np Website SEO Analysis and Seo Service Webseiten-Bericht für bibekkumarshrestha.com.np Generiert am 19 Januar 2016 04:08 AM Der Wert ist 69/100 Improve Score for just $99 SEO Inhalte Seitentitel SEO Specialist

Mehr

Inhalt. 1 Einführung... 11. 2 Funktionsweise von Suchmaschinen... 21. 3 So werden Suchergebnisse gewichtet... 39

Inhalt. 1 Einführung... 11. 2 Funktionsweise von Suchmaschinen... 21. 3 So werden Suchergebnisse gewichtet... 39 1 Einführung.......................................................... 11 1.1 Eine kurze Geschichte von fast allem.................................. 12 1.2 Die Bedeutung von Suchmaschinen gestern, heute

Mehr

Themenschwerpunkt Social SEO

Themenschwerpunkt Social SEO Themenschwerpunkt Social SEO Der soziale Einfluss in die Ergebnisse der Google- Suche Definition Social SEO Social SEO bezeichnet Maßnahmen zur Steigerung der persönlichen bzw. emotionalen Ansprache der

Mehr

Deep Web Suchen wir was man finden könnte?

Deep Web Suchen wir was man finden könnte? Deep Web Suchen wir was man finden könnte? Dr. Dirk Lewandowski dirk.lewandowski@uni-duesseldorf.de www.durchdenken.de/lewandowski Gliederung Die Bedeutung des Deep Web Die Größe des Deep Web Strategien

Mehr

Informationsextraktion aus Websites

Informationsextraktion aus Websites Informationsextraktion aus Websites Michael Haas Service-Center Forschungsdaten, Universität Mannheim 22.01.2013 Lessons Learned - Kontext I Mein Hintergrund: B.A. Computerlinguistik,

Mehr

Websites optimieren für Google & Co.

Websites optimieren für Google & Co. Sebastian Röring Websites optimieren für Google & Co. schnell+kompakt Suchmaschinen link zu meiner Seite Diesen

Mehr

Geschichte der Suchmaschinen und heutige Vernetzungsstrukturen

Geschichte der Suchmaschinen und heutige Vernetzungsstrukturen Geschichte der Suchmaschinen und heutige Vernetzungsstrukturen Seminar Web Suchmaschinen - WS0304 I. Was gab es vor den WWW Suchmaschinen II. Die Geschichte der WWW Suchmaschinen III. Zusammenfassung und

Mehr

SEO Checkliste. 20 wichtige Basispunkte für eine saubere Suchmaschinenoptimierung. Meta Content Technik Struktur Keywords Erreichbarkeit Style Mobil

SEO Checkliste. 20 wichtige Basispunkte für eine saubere Suchmaschinenoptimierung. Meta Content Technik Struktur Keywords Erreichbarkeit Style Mobil SEO Checkliste 20 wichtige Basispunkte für eine saubere Suchmaschinenoptimierung Meta Content Technik Struktur Keywords Erreichbarkeit Style Mobil Seite 1 von 22 1. Ladezeit Eine schnelle Ladezeit ist

Mehr

Analysebericht. Zusammenfassung. Ergebnisse Website-Analyse: Technische Analyse

Analysebericht. Zusammenfassung. Ergebnisse Website-Analyse: Technische Analyse Analysebericht Zusammenfassung Projekt-URL: Projekt-Titel: Primäre Suchmaschine: Primäres Keyword: Weitere Keywords: http://www.e-commerce-blog.de/ E-COMMERCE-BLOG Magazin für ecommerce & Online Marketing

Mehr

Inhaltsverzeichnis. Inhaltsverzeichnis

Inhaltsverzeichnis. Inhaltsverzeichnis Vorwort Vorwort Im Rahmen der Studie mindex 2015. Welche SEO-Potenziale schlummern in Deutschlands Unternehmenswebsites? wurde der mindex entwickelt, ein Index, der den Optimierungsstand deutscher Unternehmen

Mehr

SEO für Blogger Erfolg in Google

SEO für Blogger Erfolg in Google SEO für Blogger Erfolg in Google BRUCE JACKSON SEO Agenda 1. SEO in 2015? 2. Wie kann ich mein Suchmaschinen Ranking verbessern? 3. Seiten Titel in 2015 4. Speed wir sind alle ungeduldig auch Google! 5.

Mehr

SEO - SUCHMASCHINENOPTIMIERUNG. OnPage auf Ihrer Website

SEO - SUCHMASCHINENOPTIMIERUNG. OnPage auf Ihrer Website SEO - SUCHMASCHINENOPTIMIERUNG OnPage auf Ihrer Website SUCHMASCHINENOPTIMIERUNG SEO ON-PAGE Alle Maßnahmen, zur besseren Auffindbarkeit Ihrer Website in den Suchmaschinen, die Sie selbst auf Ihrer Website

Mehr

Proseminar: Website-Management-Systeme

Proseminar: Website-Management-Systeme Proseminar: Website-Management-Systeme Thema: Web: Apache/Roxen von Oliver Roeschke email: o_roesch@informatik.uni-kl.de Gliederung: 1.) kurze Einleitung 2.) Begriffsklärung 3.) Was ist ein Web? 4.) das

Mehr

Web-Applications mit SOAP und RSS. Vortrag 8, Jonas Mitschang, 15.6.2005

Web-Applications mit SOAP und RSS. Vortrag 8, Jonas Mitschang, 15.6.2005 Web-Applications mit SOAP und RSS Vortrag 8, Jonas Mitschang, 15.6.2005 Inhalt Motivation Web Applications / Web Services SOAP - Simple Object Access Protocol RSS - Really Simple Syndication Bewertung

Mehr

HTML-Grundlagen (X)HTML:

HTML-Grundlagen (X)HTML: HTML-Grundlagen (X)HTML: < > beginnender HTML Tag schließender HTML Tag < /> leere HTML Elemente Attribute und Werte &.; Sonderzeichen, HTML Entities Aufbau einer Datei Ein

Mehr

INHALTSVERZEICHNIS... 1

INHALTSVERZEICHNIS... 1 Inhaltsverzeichnis INHALTSVERZEICHNIS... 1 COPS TOOLS SCHNELL-DOKUMENTATION... 2 1. GLOBALE OPERATIONEN...2 1.1 Create Customer...2 1.2 Mass Action...2 1.3 Show Queue...2 1.4 Sync Images...3 2. PROJEKTBEZOGENE

Mehr

TYPO3 KNOW-HOW INHALT. von Alexander Busch, MCITP, MCSA 2003, CCA, VCS. Spam-Schutz für Typo3... 2. Robots.txt in Typo3... 2. Captcha Extension...

TYPO3 KNOW-HOW INHALT. von Alexander Busch, MCITP, MCSA 2003, CCA, VCS. Spam-Schutz für Typo3... 2. Robots.txt in Typo3... 2. Captcha Extension... TYPO3 KNOW-HOW von Alexander Busch, MCITP, MCSA 2003, CCA, VCS INHALT Spam-Schutz für Typo3... 2 Robots.txt in Typo3... 2 Captcha Extension... 3 Meta Angaben... 3 TYPO3 Update 4.1.10 auf 4.2.6... 4 SPAM-SCHUTZ

Mehr

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters Suche, Suchmaschinen, Suchmaschinenoptimierung Workshop TYPO3 17.04.2012 Sybille Peters Sybille Peters Mitarbeiterin TYPO3 Team RRZN seit 4/2011 vorher im Suchmaschinenlabor des RRZN Seite 2 Überblick

Mehr

Kurze Einführung in Web Data Mining

Kurze Einführung in Web Data Mining Kurze Einführung in Web Data Mining Yeong Su Lee Centrum für Informations- und Sprachverarbeitung (CIS), LMU 17.10.2007 Kurze Einführung in Web Data Mining 1 Überblick Was ist Web? Kurze Geschichte von

Mehr

Recherchieren im Internet

Recherchieren im Internet Recherchieren im Internet Proseminar 1 Physik für Studierende des Lehramts Übersicht 1. Allgemeines zur Lage 2. google und mehr 3. Kataloge und Metasuchmaschinen 4. Fachspezifische Suchdienste 1. Allgemeines

Mehr

Mein Internetauftritt auf dem Prüfstand

Mein Internetauftritt auf dem Prüfstand Mein Internetauftritt auf dem Prüfstand Praxisseminar am 13.03.2008 Dr. Wolfgang Krauß Krauß-Marketing Unternehmensberatung Chemnitz www.krauss-marketing.de Das Marketing befindet sich im Umbruch These:

Mehr

Seitenaudit (SEO-Faktoren Erklärung) Seiten mit 4xx Status-Code. Seiten mit 5xx Status-Code. Richtig installierte 404-Seite

Seitenaudit (SEO-Faktoren Erklärung) Seiten mit 4xx Status-Code. Seiten mit 5xx Status-Code. Richtig installierte 404-Seite Seitenaudit (SEO-Faktoren Erklärung) Alle Faktoren für Audit der Seite Seiten mit 4xx Status-Code 4xx-Fehler weisen oft auf ein Problem auf einer Webseite hin. Wenn Sie zum Beispiel einen nicht funktionierenden

Mehr

Dynamische Webseiten

Dynamische Webseiten Dynamische Webseiten Seminar Medientechnik 30.06.2003 Dynamische Webseiten 1 Inhalt Allgemeine Funktionsweise eines Webservers Grundgedanke von dynamischen Webseiten Einschub: Dynamische Seitenerzeugung

Mehr

Erfolgreiche Suchmaschinenoptimierung (SEO) - Wie SEO-Agenturen Sie dabei unterstützen -

Erfolgreiche Suchmaschinenoptimierung (SEO) - Wie SEO-Agenturen Sie dabei unterstützen - Chris Wagner Senior Manager SEO Erfolgreiche Suchmaschinenoptimierung (SEO) - Wie SEO-Agenturen Sie dabei unterstützen - Vortrag IHK 19. Juni 2008 Agenda Die Zieltraffic AG im Überblick Grundlagen der

Mehr

Suchmaschinen-Optimierung

Suchmaschinen-Optimierung Suchmaschinen-Optimierung O n l i n e - M a r k e t i n g : W i e i h r e W e b s e i t e b e s s e r g e f u n d e n w e r d e n k a n n! V o r t r a g v o n S t e f f e n S c h w i e n t e k Online Marketing

Mehr

WEBPROGRAMMIERUNG DATEN AUS DEM WEB AUTOMATISIERT VERARBEITEN

WEBPROGRAMMIERUNG DATEN AUS DEM WEB AUTOMATISIERT VERARBEITEN WEBPROGRAMMIERUNG DATEN AUS DEM WEB AUTOMATISIERT VERARBEITEN Martin Guggisberg 5.9.2015 Weiterbildung: Programmieren im Unterricht mit Python AGENDA Fakten und Grundlagen zum Web Strukturierte Daten (JSON)

Mehr

Webseiten-Bericht für creator.pressreaders.eu

Webseiten-Bericht für creator.pressreaders.eu Webseiten-Bericht für creator.pressreaders.eu Generiert am 08 Dezember 2015 18:52 PM Der Wert ist 51/100 SEO Inhalte Seitentitel CREATOR - PRESSREADERS.EU Länge : 25 Perfekt, denn Ihr Seitentitel enthält

Mehr

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters

Suche, Suchmaschinen, Suchmaschinenoptimierung. Workshop TYPO3 17.04.2012 Sybille Peters Suche, Suchmaschinen, Suchmaschinenoptimierung Workshop TYPO3 17.04.2012 Sybille Peters Sybille Peters Mitarbeiterin TYPO3 Team RRZN seit 4/2011 vorher im Suchmaschinenlabor des RRZN Seite 2 Überblick

Mehr

Google Caffeine. Was ist es, was ändert sich, wie bereite ich mich vor?

Google Caffeine. Was ist es, was ändert sich, wie bereite ich mich vor? Google Caffeine Was ist es, was ändert sich, wie bereite ich mich vor? Wer ist das? Johannes Beus, SISTRIX Suchmaschinenoptimierung seit 5 Monaten Betrieb eigener Webprojekte unterschiedlichster Themengebiete

Mehr

Webspider. Dr. Christian Herta. June 11, von 14 Dr. Christian Herta Webspider

Webspider. Dr. Christian Herta. June 11, von 14 Dr. Christian Herta Webspider Webspider Dr. Christian Herta June 11, 2009 1 von 14 Dr. Christian Herta Webspider Referenz-Architektur: Mercator Referenz-Architektur: Webcrawler Mercator [2] modular und Komponenten-basiert, so wird

Mehr

XML Extensible Markup Language

XML Extensible Markup Language XML-Praxis XML Extensible Markup Language Jörn Clausen joern@techfak.uni-bielefeld.de Übersicht Woher? Wohin? Warum? Bestandteile von XML XML-Dokumente erstellen und bearbeiten XML-Praxis XML Extensible

Mehr

SEO in Magento 2. Magento Stammtisch Köln, Carmen

SEO in Magento 2. Magento Stammtisch Köln, Carmen SEO in Magento 2 Produktseiten Kategorieseiten CMS-Seiten Allgemeine Einstellungen HTML-Sitemap XML-Sitemap Rich-Snippets Robots.txt PageSpeed (Google) Extensions Produktseiten Magento 1 Magento 2 Meta-Angaben

Mehr

SEO - Optimierung von Websites für Suchmaschinen

SEO - Optimierung von Websites für Suchmaschinen WWW-Workshop 2005: Suchtechnologien & Web-CD SEO - Optimierung von Websites für Suchmaschinen Universität Zürich, 18.10.2005 Sandra Gubler, unicommunication Agenda 1. Einleitung 2. Verbindliche Regeln

Mehr

Internet-Partner der Wirtschaft. Suchmaschinen-Optimierung

Internet-Partner der Wirtschaft. Suchmaschinen-Optimierung Vitamine für Ihr Business Unser Thema heute: Suchmaschinen-Optimierung 1. Teil Der Vorfilm... Es sollte schon passen... Ihr Business Unser Service Uwe Stache / BB-ONE.net Catwalk für Google Step one Spezialisiert

Mehr

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache Lucene Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org 1 Apache Apache Software Foundation Software free of charge Apache Software

Mehr

Web-Recherche WS 2015/2016 3. Veranstaltung 29. Oktober 2015

Web-Recherche WS 2015/2016 3. Veranstaltung 29. Oktober 2015 Web-Recherche WS 2015/2016 3. Veranstaltung 29. Oktober 2015 Philipp Mayr - philipp.mayr@gesis.org Philipp Schaer - philipp.schaer@gesis.org GESIS Leibniz-Institut für Sozialwissenschaften 2 Themen der

Mehr

Black-Hat Search Engine Optimization (SEO) Practices for Websites

Black-Hat Search Engine Optimization (SEO) Practices for Websites Beispielbild Black-Hat Search Engine Optimization (SEO) Practices for Websites Damla Durmaz - 29. Januar. 2009 Proseminar Technisch Informatik Leitung: Georg Wittenburg Betreuer: Norman Dziengel Fachbereich

Mehr

Homepage-Optimierung. Mit der Homepage Kunden gewinnen!

Homepage-Optimierung. Mit der Homepage Kunden gewinnen! Homepage-Optimierung Mit der Homepage Kunden gewinnen! Der heutige Abend... Suchmaschinen Was, Wer, Wie, Warum?!? Was hat das mit mir zu tun? Die eigene Homepage Grundlagen, Aufbau, Struktur, Zielausrichtung

Mehr

Bilder SEO. WebMontag 18.06.2012. Thomas Wagner mi-service.de. Mitglied Kreatives Leipzig e.v.

Bilder SEO. WebMontag 18.06.2012. Thomas Wagner mi-service.de. Mitglied Kreatives Leipzig e.v. Bilder SEO Thomas Wagner mi-service.de WebMontag 18.06.2012 Thomas Wagner Diplom-Wirtschaftsingenieur (FH) Womit beschäftige ich mich den ganzen Tag? Konzeptionelles Marketing / Online Marketing Webentwicklung

Mehr

Web Data Management Systeme

Web Data Management Systeme Web Data Management Systeme Seminar: Web-Qualitätsmanagement Arne Frenkel Agenda Einführung Suchsysteme Suchmaschinen & Meta-Suchmaschinen W3QS WebSQL WebLog Information Integration Systems Ariadne TSIMMIS

Mehr

SEO technisch. SEO CAMPIXX 2010 Berlin - Markus Orlinski

SEO technisch. SEO CAMPIXX 2010 Berlin - Markus Orlinski SEO technisch SEO CAMPIXX 2010 Berlin - Markus Orlinski 1 Kurze Übersicht (1) Crawlbarkeit (2) Performance (3) Internationalität (4) SEO Paranoid (5) Diskussion / Fragen Wichtiger Hinweis: Hier verwendete

Mehr

ht://dig WWW Search Engine Software

ht://dig WWW Search Engine Software ht://dig WWW Search Engine Software Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Kurs: Information Retrieval Leitung: PD Dr. Karin Haenelt 22.01.2007 Erwin Glockner Übersicht Einführung

Mehr

Webseiten-Bericht für qiwork.pt

Webseiten-Bericht für qiwork.pt Webseiten-Bericht für qiwork.pt Generiert am 03 Dezember 2015 16:54 PM Der Wert ist 55/100 SEO Inhalte Seitentitel QIWORK. Creative Studio Länge : 25 Perfekt, denn Ihr Seitentitel enthält zwischen 10 und

Mehr

Web Services Einsatzmöglichkeiten für das Information Retrieval im WWW

Web Services Einsatzmöglichkeiten für das Information Retrieval im WWW Web Services Einsatzmöglichkeiten für das Information Retrieval im WWW Fabio Tosques & Philipp Mayr Frankfurt am Main, den 24. Mai 2005 27. Online-Tagung der DGI 2005 1 Überblick Datenanalyse mittels screen

Mehr

Inhalt. First. Max. Linie. Max. Linie

Inhalt. First. Max. Linie. Max. Linie First Inhalt Hier Mini IVZ eingeben! Erstellen auf den Arbeitsseiten (siehe Muster) Max. Linie Abstand untere Tabellenlinie zu Textanfang 1,8 cm -> also: manuell auf den Arbeitsseiten ziehen!!! 1 Einleitung.....................................................

Mehr

Crawling- & Indexierungssteuerung

Crawling- & Indexierungssteuerung First Erstellen auf den Arbeitsseiten (siehe Muster) Max. Linie KAPITEL 8 Hier Mini IVZ eingeben! Crawling- & Indexierungssteuerung Abstand untere Tabellenlinie zu Textanfang 1,8 cm -> also: manuell auf

Mehr

SEO - Suchmaschinenoptimierung

SEO - Suchmaschinenoptimierung SEO - Suchmaschinenoptimierung SEO - Suchmaschinenoptimierung Was machen wir heute? 1. Einführung in die Welt der Suchmaschinen 2. Offpage-Optimierung 3. Onpage-Optimierung 4. Best Practise Augsburg SEO

Mehr

Workflow, Business Process Management, 4.Teil

Workflow, Business Process Management, 4.Teil Workflow, Business Process Management, 4.Teil 24. Januar 2004 Der vorliegende Text darf für Zwecke der Vorlesung Workflow, Business Process Management des Autors vervielfältigt werden. Eine weitere Nutzung

Mehr

1 von 5 03.03.2010 19:10

1 von 5 03.03.2010 19:10 Statistik für kindgerechte-schule.ch (-02) - main 1 von 5 03.03. 19:10 Zuletzt aktualisiert: 03.03. - 15:55 Zeitraum: OK Zeitraum Monat Feb Erster Zugriff 01.02. - 00:18 Letzter Zugriff 28.02. - 23:53

Mehr

Domain Bericht http://modellbau-portal.net 10.03.2016 08:52:38

Domain Bericht http://modellbau-portal.net 10.03.2016 08:52:38 Domain Bericht http://modellbau-portal.net 10.03.2016 08:52:38 Der hier erstellte Bericht des kostenfreien seoboxx WebsiteSpider enthält in allen Listen ein Maximum von 25 Einträgen bis auf die Google

Mehr

Roboter Erkennung für Nutzungsstatistiken

Roboter Erkennung für Nutzungsstatistiken für Nutzungsstatistiken Vorgehen für die Filterung von automatisierten Zugriffen auf Dokumente in Repositorien für Nutzungsstatistiken Version 1.1, Juli 2013 Matthias Hitzler, Marco Recke Computer und

Mehr

CAS WEBDESIGN UND WEBPUBLISHING KURS 1 / TAG 1: GRUNDLAGEN DER WEBENTWICKLUNG

CAS WEBDESIGN UND WEBPUBLISHING KURS 1 / TAG 1: GRUNDLAGEN DER WEBENTWICKLUNG CAS WEBDESIGN UND WEBPUBLISHING KURS 1 / TAG 1: GRUNDLAGEN DER WEBENTWICKLUNG Von Markus Stauffiger / 4eyes GmbH DOZENTENTEAM FÜR JEDES THEMA EIN SPEZIALIST ANDI KELLER andi@4eyes.ch Mitgründer von 4eyes

Mehr

Mojolicious. Ich zeige dir jetzt, wie du mit Mojolicious eine Vorlage. Das Mojolicious-Gerüst

Mojolicious. Ich zeige dir jetzt, wie du mit Mojolicious eine Vorlage. Das Mojolicious-Gerüst 6 Ich zeige dir jetzt, wie du mit Mojolicious eine Vorlage für deine Web-Anwendung erstellst, die wir dann im Rest des Buchs immer weiter ausbauen. Sie enthält zu Beginn nur das Notwendige, um sie im Browser

Mehr

Webseiten-Bericht für opencart.com

Webseiten-Bericht für opencart.com Webseiten-Bericht für opencart.com Generiert am 22 Dezember 2015 08:23 AM Der Wert ist 41/100 SEO Inhalte Seitentitel Just a moment... Länge : 16 Perfekt, denn Ihr Seitentitel enthält zwischen 10 und 70

Mehr

Workshop I 13:30 14:30 Uhr Suchmaschinenoptimierung

Workshop I 13:30 14:30 Uhr Suchmaschinenoptimierung Brennpunkt etourism 2011 Workshop I 13:30 14:30 Uhr Suchmaschinenoptimierung Wolfgang Grabs-Schrempf Büro für emarketing, Webentwicklung & -Design Salzburg / Salzkammergut Inhalt 1. Suchroboter verstehen

Mehr

Visendo Fax Printer Troubleshooting

Visendo Fax Printer Troubleshooting Visendo Fax Server und Windows TIFF IFilter Volltextsuche in TIFF-Bildern Mit dem TIFF IFilter stellt Windows ein Instrument zur Verfügung, das die Suche nach TIFF- Dokumenten basierend auf dem Textinhalt

Mehr

Literaturverzeichnis. Zeitschriftenartikel. Onlinedokumente

Literaturverzeichnis. Zeitschriftenartikel. Onlinedokumente Literaturverzeichnis Zeitschriftenartikel Puscher Frank (2008) Erfolg durch Sichtbarkeit: Suchmaschinen-Werbung lohnt sich auch für kleinere Unternehmen. In: c t 03/08, S 88 90. Hannover: Heise Zeitschriften

Mehr

Webseiten-Bericht für duhard.fr

Webseiten-Bericht für duhard.fr Webseiten-Bericht für duhard.fr Generiert am 30 Dezember 2015 05:28 AM Der Wert ist 47/100 SEO Inhalte Seitentitel Website unavailable Länge : 19 Perfekt, denn Ihr Seitentitel enthält zwischen 10 und 70

Mehr

SEARCH ENGINE FRIENDLY DESIGN

SEARCH ENGINE FRIENDLY DESIGN SEARCH ENGINE FRIENDLY DESIGN KURZE VORSTELLUNG Kai Spriestersbach 11 Jahre Online Marketing-Erfahrung Speaker SMX München 2010-2015 SEO CAMPIXX 2011-2015 SEOkomm 2014 SEO DAY 2015 Referent der afs Akademie

Mehr

Apache Module Funktion, Konfiguration und Programmierung. Abruf einer Webseite, Request/ Response Cyle

Apache Module Funktion, Konfiguration und Programmierung. Abruf einer Webseite, Request/ Response Cyle Apache Module Funktion, Konfiguration und Programmierung Abruf einer Webseite, Request/ Response Cyle Einbindung von Modulen in Apache Einsatz von Standardmodulen Programmierung von Modulen Request/ Response

Mehr

SuchmaschinenOptimierung

SuchmaschinenOptimierung V 1 w Daniel Koch SuchmaschinenOptimierung Website-Marketing für Entwickler ADDISON-WESLEY An imprint of Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario Sydney Mexico

Mehr

SEO was es ist und warum es immer noch nicht tot ist

SEO was es ist und warum es immer noch nicht tot ist SEO was es ist und warum es immer noch nicht tot ist Contao Konferenz 2015 Mai 2015 Alexander Schultz Informatik Studium in Passau und Erlangen Seit 2007 im Online Marketing tätig Fachwirt Online Marketing

Mehr

TimeMachine. Time CGI. Version 1.5. Stand 04.12.2013. Dokument: time.odt. Berger EDV Service Tulbeckstr. 33 80339 München

TimeMachine. Time CGI. Version 1.5. Stand 04.12.2013. Dokument: time.odt. Berger EDV Service Tulbeckstr. 33 80339 München Time CGI Version 1.5 Stand 04.12.2013 TimeMachine Dokument: time.odt Berger EDV Service Tulbeckstr. 33 80339 München Fon +49 89 13945642 Mail rb@bergertime.de Versionsangaben Autor Version Datum Kommentar

Mehr

Seminar Peer-to-Peer Netzwerke 06/07

Seminar Peer-to-Peer Netzwerke 06/07 YaCy: P2P Web-Suchmaschine Seminar Peer-to-Peer Netzwerke 06/07 Lehrstuhl für Rechnernetze und Telematik Albert-Ludwigs-Universität Freiburg Fakultät für Angewandte Wissenschaften Daniel Rebei daniel@rebei.de

Mehr

SEO$Klinik! www.boardjunkies.de!! von!andreas!graap! www.andreasgraap.de!

SEO$Klinik! www.boardjunkies.de!! von!andreas!graap! www.andreasgraap.de! SEO$Klinik www.boardjunkies.de vonandreasgraap www.andreasgraap.de Einleitung DasZieldieserSEOKlinikistdieVerbesserungderSichtbarkeitihrerDomainbeiGoogleDeutschlandzurSteigerung derzugriffeüberdieorganischesuche.derfokusunsereranalyseliegtaufoptimierungsgstrategienfürbessere

Mehr

INHALT WEBSEITEN, SOCIAL MEDIA, SUCHMASCHINEN & CO. CAPINIO.DE WARUM INTERNET & ONLINE MARKETING?

INHALT WEBSEITEN, SOCIAL MEDIA, SUCHMASCHINEN & CO. CAPINIO.DE WARUM INTERNET & ONLINE MARKETING? WEBSEITEN, SOCIAL MEDIA, SUCHMASCHINEN & CO. INHALT TIPPS UND TRICKS FÜR DEN ERFOLGREICHEN ONLINE-AUFTRITT Über capinio Internet & Online Marketing Basisarbeit: die eigene Webseite Suchmaschinen Social

Mehr

Webseiten-Bericht für mynesthome.com

Webseiten-Bericht für mynesthome.com Webseiten-Bericht für mynesthome.com Generiert am 11 Dezember 2015 04:04 AM Der Wert ist 54/100 SEO Inhalte Seitentitel Buy Furniture Online from Latest Home Furnishings Store in India My Nest Lifestyle

Mehr

Informatik I: Einführung in die Programmierung

Informatik I: Einführung in die Programmierung Informatik I: Einführung in die Programmierung 21. Das WWW befragen Albert-Ludwigs-Universität Freiburg Bernhard Nebel 13.01.2015 13.01.2015 B. Nebel Info I 2 / 17 Oft braucht ein Programm Informationen,

Mehr

Besuchergewinnung über generische Suchergebnisse

Besuchergewinnung über generische Suchergebnisse 1 Besuchergewinnung über generische Suchergebnisse Ziele und Nebenbedingungen Janus Strategie Relevanz Prinzip Potenzial Ermittlung Sofortfrage? Sofortantwort. Search Engine Optimization (SEO) 2 Die Suche

Mehr

Angewandte Informatik

Angewandte Informatik Angewandte Informatik Teil 9.1 Web Seiten V1.3 12.03.2011 1 von 37 Inhaltsverzeichnis 3... Welche Browser werden verwendet? 4... Mit welchen Browser surft die Welt? 5... Wie kommt der Browser zur Seite?

Mehr

Webentwicklung mit Mozilla Composer I.

Webentwicklung mit Mozilla Composer I. Tutorium Webentwicklung mit Mozilla Composer I. Präsentation der Sitzung vom 12. Mai 2004 Martin Stricker martin.stricker@rz.hu-berlin.de Programm Erstellen und Bearbeiten von Webseiten mit dem HTML-Editor

Mehr

www.ev-forum-westfalen.de/efwm/

www.ev-forum-westfalen.de/efwm/ ZOLLER, Hanspeter 1/18 www.ev-forum-westfalen.de/efwm/ Was bedeuten IP, URL, DNS, HTML, PHP, CMS? Wie logge ich mich ein? Was bewirkt man mit den einzelnen Typo3-Symbolen ('icons')? Wie ändere ich den

Mehr

Was jeder Webmaster wissen und tun sollte.

Was jeder Webmaster wissen und tun sollte. Was jeder Webmaster wissen und tun sollte. So sollte Ihre Startseite nach neuesten Erkenntnissen aufgebaut sein. Präsentieren Sie hier kurz und knapp die wichtigsten Informatione Ihrer Website. Titel der

Mehr

Installationsanleitung zur Extension bluegate DirectURL

Installationsanleitung zur Extension bluegate DirectURL Installationsanleitung zur Extension bluegate DirectURL WICHTIGE HINWEISE VOR DER INSTALLATION: Die Installation dieser Extension darf nur von Fachpersonal vorgenommen werden. Eine unsachgemäße Installation

Mehr

ArenaSchweiz AG. CMS Concrete5.7 Erste Schritte

ArenaSchweiz AG. CMS Concrete5.7 Erste Schritte CMS Concrete5.7 Erste Schritte Anmelden Öffnen Sie Ihren Browser und geben Sie Ihre Website-Adresse ein, dazu «/login» Beispiel: http://www.domainname.ch/login Geben Sie Benutzername und Passwort ein und

Mehr

SEORCH. SEO Analyse. Die 4 wichtigsten OnPage SEO Faktoren: Hee! Vielleicht willst du deine Rankings in Google überwachen und SEORCH unterstützen?

SEORCH. SEO Analyse. Die 4 wichtigsten OnPage SEO Faktoren: Hee! Vielleicht willst du deine Rankings in Google überwachen und SEORCH unterstützen? SEORCH SEO CRAWLER KEYWORD MONITOR SEO TOOLS ABOUT SEO Analyse Datum: 26. April 2014 Website: http://internet-marketer-beruf.de Permalin k: h ttp://www.seorch.de/seo-ch eck/in tern et-marketer-beru f-de-2014-04-26-03-27-89.h

Mehr

Suchmaschinenoptimierung - 16 Tuning-Tipps wie Sie Ihre Website selber auf Platz 1 in allen Suchmaschinen katapultieren

Suchmaschinenoptimierung - 16 Tuning-Tipps wie Sie Ihre Website selber auf Platz 1 in allen Suchmaschinen katapultieren Suchmaschinenoptimierung - 16 Tuning-Tipps wie Sie Ihre Website selber auf Platz 1 in allen Suchmaschinen katapultieren Sie möchten die Positionierung Ihrer Internetseiten verbessern? Dann sollten Sie

Mehr

Interdisziplinäres Praktikum 181.149

Interdisziplinäres Praktikum 181.149 Interdisziplinäres Praktikum 181.149 Alexander Ölzant 9301547 E 190 884 423 27. Januar 2007 Inhaltsverzeichnis 1 Szenario 3 2 Scraping mit Lixto 3 3 Websource-Eingabe/Verknuepfung mit Content Extractor

Mehr

Informatik I: Einführung in die Programmierung

Informatik I: Einführung in die Programmierung Informatik I: Einführung in die Programmierung 23. Das WWW befragen Albert-Ludwigs-Universität Freiburg Bernhard Nebel 15.01.2016 15.01.2016 B. Nebel Info I 2 / 19 Oft braucht ein Programm Informationen,

Mehr

Website-SEO-Check (WSC)

Website-SEO-Check (WSC) Website-SEO-Check (WSC) 90% aller Websites machen mindestens einen der folgenden Fehler 1. Doppelter Content 2. Titel nicht aussagekräftig 3. Meta-Informationen nicht aussagekräftig 4. Falsche Suchwortdichte

Mehr

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller

Suchmaschinenalgorithmen. Vortrag von: Thomas Müller Suchmaschinenalgorithmen Vortrag von: Thomas Müller Kurze Geschichte Erste Suchmaschine für Hypertexte am CERN Erste www-suchmaschine World Wide Web Wanderer 1993 Bis 1996: 2 mal jährlich Durchlauf 1994:

Mehr

Informatik I: Einführung in die Programmierung

Informatik I: Einführung in die Programmierung Informatik I: Einführung in die Programmierung 23. Das WWW befragen Albert-Ludwigs-Universität Freiburg Bernhard Nebel 15.01.2016 1 15.01.2016 B. Nebel Info I 3 / 19 Oft braucht ein Programm Informationen,

Mehr

Oliver Lehmann Antje Lehmann. in Suchmaschinen. An imprint of Pearson Education

Oliver Lehmann Antje Lehmann. in Suchmaschinen. An imprint of Pearson Education Oliver Lehmann Antje Lehmann Top-Platzierungen in Suchmaschinen An imprint of Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario Sydney Mexico City Madrid Amsterdam Das Beste

Mehr