Themen und Typen der Suchanfragen an deutsche Web-Suchmaschinen Dr. Dirk Lewandowski Heinrich-Heine-Universität Düsseldorf, Abt. Informationswissenschaft
Inhalt 1. Einleitung 2. Themen der Web-Suche 3. Typen von Suchanfragen 4. Untersuchungsaufbau 5. Ergebnisse 6. Diskussion und Ausblick
1 Einleitung Nutzerverhalten der deutschen Suchmaschinen-Nutzer Nutzerverhalten wurde in mehreren Studien untersucht. Schwerpunkt liegt auf Recherchestrategien: Nutzung von Operatoren Länge der Anfragen Länge der Sessions Auswahl der Treffer Internationale Studien Recherchestrategien Themen der Web-Suche Anfragetypen
2 Themen der Web-Suche 11 Klassen nach Spink et al. (2001): People, places and things Computers or Internet Commerce, travel, employment, or economy Entertainment or recreation Health or sciences Sex or pornography Government Education or humanities Society, culture, ethnicity, or religion Performing or fine arts Unknown or other
Themen der Web-Suche Untersuchung läuft von 1997-2002. Basis: jeweils ca. 2.500 Anfragen (US-Suchmaschinen). Zuordnung der Themen durch zwei Personen. Populärste Kategorien (2002): People, Places and Things (>40%) Computers or Internet (~15%) Commerce, travel, employment or economy (~12%) Verschiebung von Entertainment hin zu Wirtschaft. Probleme: Zuordnungen ungenau und zumindest zum Teil subjektiv. Logfiles verschiedener Suchmaschinen als Grundlage.
3 Typen von Suchanfragen Unterscheidung nach Broder (2002): informationsorientiert (39-48%) navigationsorientiert (20-25%) transaktionsorientiert (22-36%) Basis: Nutzerbefragung und Logfile (AltaVista USA; 400 Anfragen). Probleme: Relativ geringe Datenbasis. Auswertung nur einer Suchmaschine. Unzureichende Beschreibung der Zuordnungen. Keine Folgeuntersuchungen.
Zwischenergebnis Suchanfragen an Suchmaschinen sind thematisch vielfältig. Anfragen verteilen sich zu jeweils nennenswerten Teilen auf die drei Typen informationsorientiert, navigationsorientiert und transaktionsorientiert. Zwei Fragen: Ist das Suchverhalten der deutschen Nutzer ähnlich? Sind die Anfragetypen in den Themenklassen unterschiedlich häufig?
4 Untersuchungsaufbau Untersuchung von insgesamt 1.500 Anfragen. Verwendete Suchmaschinen: Metager (Logfile) Fireball (Live-Suche) Seekport (Live-Suche) Zuordnung zu Themen und Typen durch zwei Personen.
5 Ergebnisse Anfragetypen Tabelle 1. Verteilung der Anfragen nach Typen in den untersuchten Suchmaschinen Suchmaschine Informationsorientiert navigationsorientiert transaktionsorientiert Fireball 47% 35% 18% Metager 42% 43% 15% Seekport 47% 42% 11% Durchschnitt 45% 40% 15%
Anfragetypen Alle Typen erreichen einen nennenswerten Anteil. Es bestehen Unterschiede zwischen den Nutzern der einzelnen Suchmaschinen. Deutliche Abweichungen gegenüber der Untersuchung von Broder: höherer Anteil navigationsorientierter Anfragen, weniger transaktionsorientierte. Gründe nicht genau bestimmbar: zeitliche Veränderungen? spezielles Verhalten der deutschen Nutzer? Verwendung von Produktsuchmaschinen für transakt. Anfragen?
Themen Verteilung auf Kategorien: Wirtschaft und Arbeit (29%) Personen und Orte (13%) alle anderen jeweils <10%, aber: alle Themenfelder sind besetzt. Große Unterschiede zu den Untersuchungen von Spink et al.: deutlich weniger Anfragen nach Personen und Orten (>40% vs. 13%) deutliche mehr nach Wirtschaft und Arbeit (29% vs. ~12%) Anfragen nach Sex und Pornographie: Metager: 3,2% Fireball: 10,2% Seekport: (gefiltert)
Kombinierte Auswertung von Themen und Anfragetypen Besonders hoher Anteil (>=70%) von informationsorientierten Anfragen bei den Themen Gesundheit und Wissenschaft Gesellschaft und Religion Besonders hoher Anteil (>40%) von navigationsorientierten Anfragen in Personen und Orte Wirtschaft und Arbeit Unterhaltung und Freizeit Regierung und Verwaltung Kunst Besonders hoher Anteil transaktionsorientierter Anfragen (>25%): Computer und Internet Wirtschaft und Arbeit Sex und Pornographie Entertainment
6 Diskussion und Ausblick
Ergebnisse Spezielle Themen- und Typenverteilung bei den Anfragen deutscher Nutzer. Hinsichtlich der Anfragetypen bestehen große Unterschiede in den einzelnen Themenbereichen. Suchmaschinen sollten unterschiedliche Anfragetypen berücksichtigen. Heutige Verfahren (v.a. linktopologische Rankingverfahren) haben Stärken v.a. bei navigationsorientierten Anfragen. In der Evaluierung bisher Konzentration auf informationsorientierte Anfragen. Eine Erweiterung auf die anderen Anfragetypen ist wünschenswert.
Ergebnisse (2) Bei bestimmten Themen kann es für Suchmaschinen sinnvoll sein, Unterstützung zu einzelnen Anfragetypen anzubieten. Bsp. Spezialbestände im Bereich Computer und Internet (Download von Software) Bsp. Audio- und Videosuche im Bereich Unterhaltung Basis sollte eine Erkennung der Anfragetypen sein.
Weitere Forschung Inwieweit bedienen die Suchmaschinen die Nutzererwartungen in Bezug auf die Anfragetypen? Bsp.: Werden Anfragen zu Gesundheit (i.d.r. informationsorientiert) von den Suchmaschinen durch Ergebnisse, die auf Transaktionen hinführen, beantwortet? Bsp.: Werden Anfragen nach Entertainment-Inhalten (oft transaktionsorientiert) entsprechend beantwortet? Für weitere Untersuchungen sollte die Einteilung der Themen verbessert/verfeinert werden. Direkter Vergleich von Anfragen aus D und USA. Verbesserung der Zuordnung der Anfragetypen durch ergänzende Nutzerbefragungen.
Vielen Dank. dirk.lewandowski@uni-duesseldorf.de www.durchdenken.de/lewandowski