%VALUIERUNG DER 4EXT2ETRIEVALSYSTEME $OMESTIC )NTELLIGENT -INER FOR 4EXT,ARS )) UND 4EXT%XTENDER

Größe: px
Ab Seite anzeigen:

Download "%VALUIERUNG DER 4EXT2ETRIEVALSYSTEME $OMESTIC )NTELLIGENT -INER FOR 4EXT,ARS )) UND 4EXT%XTENDER"

Transkript

1 %VALUIERUNG DER 4EXT2ETRIEVALSYSTEME $OMESTIC )NTELLIGENT -INER FOR 4EXT,ARS )) UND 4EXT%XTENDER 4 + TER - 2ITTBERGER # 7OMSER(ACKER Informationswissenschaft Universität Konstanz Konstanz Marc.Rittberger@uni-konstanz.de :USAMMENFASSUNG Bedingt durch die zunehmende Bedeutung der Verarbeitung textueller, unstrukturierter Informationen gewinnen Information Retrieval Systeme immer größere Bedeutung. Ausgehend von den Zielen der TREC-Konferenzen werden im Rahmen der GIRT-Initiative deutschsprachige Texte zur Evaluierung von Information Retrieval Systemen angeboten. Diese Texte wurden verwendet, um die Leistungsfähigkeit der vier kommerziellen Information Retrieval Systeme Domestic, Intelligent Miner for Text, Lars II und Text Extender zu untersuchen. Die ausgeglichenste Retrievalleistung zeigt der Intelligent Miner for Text, dessen Leistungsfähigkeit auch sonst sehr hoch eingeschätzt werden kann. Die Ergebnisse lassen die Folgerung zu, daß die Retrievalschnittstelle ein wichtiges Merkmal für den Erfolg einer Suche sein kann.!bstract: Information retrieval systems become more important as the significance of working with textuell or unstructered information grows. Comparable to the TREC-conference series the GIRT-initiative offers german texts to evaluate information retrieval systems. These texts were used to evaluate the commercially available retrieval systems Domestic, Intelligent Miner for Text, Lars II, and Text Extender. The most balanced results are schown by the Intelligent Miner for Text, whose retrieval power is estimated high. The overall * DEBIS AG, #,Universität Konstanz & Universität Hildesheim

2 results let us suppose, that the user interface may play an important role for the succes of a search. %INLEITUNG Der Übergang in die Informationsgesellschaft bedingt den sorgsamen und kontrollierten Umgang mit Informationen. Einen der wichtigsten Aspekte betrifft den Zugriff auf relevante Information aus dem großen Angebot verfügbarer Informationen. Dabei spielt die Ordnung und das Strukturieren von Information, sowie der kontrollierte Zugriff auf die Information eine tragende Rolle. Im Information Retrieval wird versucht, mit unstrukturierten Daten, vorwiegend Texten, optimale Lösungen für diese Fragestellungen anzubieten. Ein wesentlicher Bestandteil der Forschungsaktivitäten im Information Retrieval konzentriert sich dabei auf die Evaluierung und Überprüfung von Suchleistungen der Retrievalsysteme [Spark Jones 1981, Womser-Hacker 1989, Tague-Sutcliff 1995]. Diese Aktivitäten erhielten durch die seit 1992 durchgeführten Text-REtrieval-Conferences [Vorhees & Harman 1998] erhebliche Bedeutung, da in dieser Initiative die Suche in großen Datenbeständen mit verschiedenen Systemen und Aufgaben unter gleichen Testbedingungen im Vordergrund steht. Da die TREC-Initiative zunächst nur auf englischsprachige Dokumente beschränkt war und der Bedarf vergleichende Ergebnisse auch im Umfeld anderer Sprachen vorhanden war, wurde vom IZ- Sozialwissenschaften eine deutsche Testdatenbank GIRT (German Indexing and Retrieval Testdatabase) angeboten. Das Ziel der GIRT-Initiative war es,... einen Rahmen für einen aussagefähigen Vergleich moderner, intelligenter Indexierungs- und Retrievalsysteme zu schaffen, auf deren Basis die Leistungsfähigkeit dieser Systeme gegenüber herkömmlichen Standardsystemen beurteilt werden kann. [Frisch/Kluck 1997] An der Universität Konstanz wurde die Leistungsfähigkeit von vier Retrievalsystemen, DOMESTIC, Lars II, Intelligent Miner for Text und TextExtender, unter Nutzung der GIRT-Daten untersucht. Schwerpunkt der Evaluierung waren Unterschiede der auf boolescher Logik aufbauenden Systeme DOMESTIC und LARS II gegenüber den Ranking-Systemen TextExtender und Im Detail lassen sich die Ergebnisse in [Käter 1999] nachlesen, dessen Arbeit auf eine Projektkursarbeit des Aufbausstudienganges Informationswissenschaft an der Universität Konstanz aufbaut. Der Schwerpunkt der Projektkursarbeit lag dabei auf den Systemen DOMESTIC, LARS II und TextExtender. In [Käter 1999] wurden diese Untersuchung durch den Intelligent Miner for Text ergänzt und die vier verschiedenen Systeme vergleichend untersucht.

3 Intelligent Miner for Text zu identifizieren und den Wert von graphischen Benutzeroberflächen zu untersuchen. Wir werden im folgenden zunächst die vier beteiligten Systeme vorstellen, die Datenbank, Aufgaben und Testpersonen beschreiben. Im Anschluß werden der Retrievaltest und dessen Ergebnisse diskutiert. %VALUIERTE 2ETRIEVAL 3YSTEME - $/-%34)# ist ein Dokumenterfassungs- und Retrieval-System der Firma KTS Informationssysteme München. Mit diesem System lassen sich beliebige Informationen (Texte, Graphiken, Bilder,...) im Dialog erfassen, aktualisieren und verwalten. Es erlaubt branchenneutral den Aufbau, die Pflege und die Nutzung unternehmenseigener Datenbanken und eine leistungsstarke Suche zur Auffindung relevanter Dokumente über verschiedene Gesichtspunkte hinweg. Die Möglichkeit, einen integrierten, dynamisch fortschreibbaren Thesaurus zur Inhaltserschließung zu verwenden, stellt ein wesentliches Charakteristikum dieses Systems dar. Auf den Einsatz eines Thesaurus mußte jedoch bei der vorliegenden Evaluierung aus technischen Gründen bei allen vier Systemen verzichtet werden. Bei DOMESTIC handelt es sich um ein rein boolesches System, bei dem weder eine Rankingkomponente enthalten ist, noch die Möglichkeit einer Relevanzbewertung als Recherchehilfe vorgesehen ist. -,ARS )) ist ein allgemein einsetzbares, datenbankbasiertes Informations- und Retrievalsystem der Firma LARS GmbH in Frankfurt/Main, welches schwerpunktmäßig im Bereich Dokumentation und Literaturarchivierung Verwendung findet. Bei diesem System handelt es sich um eine Kombination aus einem relationalen Datenbanksystem und einem Volltextretrievalsystem. Es ist als Transaktionssystem (Dialogsystem) konzipiert und soll so eine komfortable Bedienung gewährleisten. Die graphische Benutzeroberfläche, die auf der Windowsphilosophie beruht, soll dabei die Handhabung erleichtern. Im Modus der Expertenrecherche werden Hilfsmittel angeboten, die eine syntaxkonforme Zusammenstellung von Suchanfragen unterstützen. Lars II ist ebenfalls ein rein boolesches System, so daß auch hier kein Ranking-Verfahren oder andere Relevanzbewertungen genutzt werden können. - 4EXT%XTENDER: IBM ergänzt sein Datenbanksystem DB2 um verschiedene Extender, mittels derer den Anwendern die Möglichkeit geboten wird, eine Datenbasis, neben relationalen Datentypen, um komplexe Datentypen (Text, Video,...) zu erweitern. Diese Extender erlauben es, komplexe Datentypen innerhalb einer Datenbank mit Hilfe von SQL-Abfragen in einer Datenbank

4 zu manipulieren bzw. abzufragen. Diese relationalen Extender sind modulare Erweiterungen, die auf dem objekt-relationalen Ansatz basieren und die DB2-Systeme um Funktionalitäten hinsichtlich des Umgangs mit jeweils einem bestimmten Datentyp erweitern und dessen adäquate Behandlung sicherstellen. Der TextExtender erlaubt es dabei, SQL-Abfragen für unstrukturierte Textdokumente in die Anwendungen einzubetten. Er unterstützt die Volltextindexierung, eine linguistische Suche und die Synonymsuche in insgesamt 17 Sprachen und erweitert DB2 so um die Fähigkeit des Erkennens von Textstrukturen und des Volltextretrievals. Dabei unterstützt er nicht nur die Suche nach explizit abgesetzten Deskriptoren, sondern auch die Suche nach deren Wortvarianten und Synonymen. Er beinhaltet die Retrievalmöglichkeiten der Wort- und der Wortgruppensuche, die Suche mit Hilfe von Trunkierungen, die proximity -Suche sowie die Suche anhand boolescher Operatoren. Ein besonderes Leistungsmerkmal des Extenders ist die Fähigkeit gefundene Dokumente entsprechend ihrer Übereinstimmung mit den Suchkriterien zu bewerten und diese als Rankingliste auszugeben. - Der )NTELLIGENT -INER FOR 4EXT, ein Rankingsystem der Firma IBM, besteht aus drei Komponenten: dem TextMiner, als eigentliche Suchmaschine, den Text Analyse Tools und den Web Access Tools. Der TextMiner ist eine Client-Server-Suchmaschine in Form einer Anwendungsschnittstelle, die leistungsfähige, linguistische Möglichkeiten beinhaltet. Dabei handelt es sich um ein inhaltsbasiertes Retrievalsystem, welches die Volltextsuche, die Indexierung in 16 Sprachen, das Indexieren von Dokumenten in etlichen Formaten (z.b. HTML-Dateien, unstrukturierte ASCII-Dateien, sowie diverse Textverarbeitungsformate etc.), die Suche nach groben Übereinstimmungen, boolesche Abfragen, die Freitextsuche und Hybridabfragen unterstützt. Ferner läßt sich, zum Zweck der Anfrageerweiterung, ein vordefinierter oder ein benutzerdefinierter Thesaurus integrieren bzw. die Möglichkeit des Relevanz Feedback nutzen. Um die Aufgaben des Minings zu erfüllen, bedient sich der TextMiner verschiedener Text Analyse Tools (Topic Categorization Tool, Clustering Tool, Feature Extraction Tool, Language Identification Tool), die den Benutzer bei der Formulierung der Suchanfrage unterstützen sollen, sich mit dem Erkennen und Extrahieren von (Schlüssel-) Informationen aus Textdokumenten befassen und Dokumente hinsichtlich ihres Inhaltes organisieren oder behandelte Themengebiete einer Sammlung aufdecken. Einige dieser Tools sind ausschließlich für die englische Sprache konzipiert.

5 4ESTDESIGN Für die vorliegende Evaluierung diente das Testdesign von GIRT als Grundlage. Im wesentlichen besteht die verwendete "Retrievalkollektion" aus drei Elementen: den Dokumenten bzw. der Datenbank, den Fragen bzw. Aufgaben und den Relevanzurteilen. $ATENBANK Für den Retrievaltest wurde die Datenbank SOLFOR des IZ Sozialwissenschaften in Bonn, die eigens für den Zweck der Schaffung einer besseren Vergleichbarkeit von deutschsprachigen Information Retrieval Systemen angelegt wurde, verwendet. Diese enthält Auszüge aus den Datenbanken FORIS (Forschungsinformationssystem Sozialwissenschaften) und SOLIS (Sozialwissenschaftliches Literaturinformationssystem). Für nahezu alle Dokumente, die in dieser Datenbank enthalten sind liegen Titel, Untertitel, Abstract, Autor, Klassifizierung, Zeitraum und bei FORIS zusätzlich geographischer Raum vor. Thematisch stammen die erfaßten Dokumente aus den Bereichen Industrie- und Betriebssoziologie, Frauenförderung und Migration und ethnische Minderheiten, aus den gedruckten Ausgaben des "sozialwissenschaftlichen Fachinformationsdienstes" (sofid) und den Zeitschriften soziale Welt und Kölner Zeitschrift für Soziologie und Sozialpsychologie".!UFGABEN Bei GIRT wurden neun Fragen als Grundlage für den Retrievaltest verwendet, von denen sechs für die vorliegende Evaluierung ausgewählt wurden. Gestrichen wurden die Fragen T1-T3, zum einen aus Zeitgründen und zum anderen, weil sich diese beim GIRT-Pretest als problematisch erwiesen hatten: 4 7ELCHE )NSTRUMENTARIEN INSBESONDERE DER 0ERSONALPOLITIK UND DER 7EITERQUALIFIKATION GIBT ES IN DEN "ETRIEBEN UND 5NTERNEHMEN DER 7IRTSCHAFT UND DES FFENTLICHEN $IENSTES ZUR & RDERUNG VON &RAUEN IN &¼HRUNGSPOSITIONEN 4 7ELCHE %INKOMMENSQUELLEN HABEN DIE AUSL NDISCHEN -ITB¼RGER IN DER "UNDESREPUBLIK $EUTSCHLAND 4 7ELCHE %INWANDERUNGSPOLITIK BETREIBEN DIE "2 $EUTSCHLAND UND DIE %UROP ISCHE 5NION 4 7ELCHE 5RSACHEN UND &ORMEN HABEN DIE &REMDENFEINDLICHKEIT UND DER 2ASSISMUS BEI *UGENDLICHEN 4 7ELCHE 3TUDIEN BEFASSEN SICH MIT DER!RMUT ALS SOZIALEM 0ROBLEM IN $EUTSCHLAND UNTER BESONDERER "ER¼CKSICHTIGUNG DER NEUEN "UNDESL NDER 4 7ELCHE 0RODUKTIONSKONZEPTE UND 2ATIONALISIERUNGSSTRATEGIEN WERDEN IN DEN "ETRIEBEN UND 5NTERNEHMEN EINGESETZT Die Eingabe der Suchterme wurde während des Tests durch einen Mittler vorgenommen, der die Anfragen der jeweiligen Versuchsperson in die jeweilige

6 Querystruktur transformierte (boolesche Operatoren, Trunkierungen etc.). Die Einschaltung des Mittlers erfolgte, da die Umsetzung von natürlichsprachlichen Suchanfragen in eine adäquate, zum Teil recht komplexe Querystruktur bei ungeübten Probanden zu erheblichen Schwierigkeiten und zahlreichen Syntaxfehlern hätte führen können. 4ESTPERSONEN Ein Aspekt der Evaluierungen zielte darauf ab zu untersuchen, wie gut unerfahrene Nutzer im Vergleich zu Erfahrenen mit den verschiedenen Retrievalsystemen umgehen können. Für die Rekrutierung der Versuchspersonen standen, da es sich um eine sozialwissenschaftliche Datenbank handelt und Verständnisschwierigkeiten hinsichtlich der Testaufgaben ausgeschlossen werden sollten, die sozialwissenschaftlichen Kenntnisse der Probanden im Vordergrund. Recherchekenntnisse und die Erfahrungen im Umgang mit Retrievalsystemen sollten von "keiner Erfahrung" bis hin zum "geübten, regelmäßigen Nutzer" diverser Datenbanksysteme bzw. Internetrecherchen reichen. Für die Evaluierung des Intelligent Miner for Text standen nicht dieselben zwölf Probanden zur Verfügung wie für die erste Evaluierung, jedoch wurde darauf geachtet, daß sie dieselben Kriterien erfüllten. 2ETRIEVALTEST Ausgangspunkt jedes Tests war eine Einführung der Testpersonen in die Thematik des Information Retrieval, deren Umfang in Abhängigkeit zu den Retrievalkenntnissen des jeweiligen Probanden stand. Angesprochen wurden Grundzüge der Freitext-Suche, der booleschen-suche und der Hybrid-Suche. Als besonders wichtig erwies sich die Einweisung der Probanden in die boolesche Logik und die damit einhergehenden Möglichkeiten. Hier wurde anhand kurzer Beispiele ein Schwerpunkt auf die Darstellung der Blockbildung gelegt. Ferner wurden die morphologischen Eigenschaften der linguistischen Verarbeitung bzw. des verwendeten linguistischen Index dargestellt. Zudem wurde der Einsatz zeichenkettenorientierter Operatoren für die Rechts-, Linkstrunkierung und die Maskierung innerhalb von Begriffen erläutert, bevor die Testpersonen die Testfragen erhielten. Die vom Probanden formulierte Anfrage wurde vom Mittler in die entsprechende Querysyntax übersetzt und eingegeben. Während die Testperson die Möglichkeit hatte, sich die resultierende Trefferliste anzuschauen und sich einzelne Dokumente anzeigen zulassen, wurden vom Mittler bzw. einem Protokollanten Notizen zu besonderen

7 Rückfragen und Auffälligkeiten gemacht. Zusätzlich wurden alle Rechercheschritte mittels der Lotus ScreenCam dokumentiert. Für die Bearbeitung von jeweils zwei Aufgaben standen jedem Probanden je Frage ca. 25 min zur Verfügung. Der exakte Zeitverbrauch wurde vom Mittler auf dem Protokollbogen notiert. Ferner wurden hier Suchfrage, Reformulierungsschritte, verwendete Deskriptoren und Anzahl der gefundenen bzw. ausgegebenen Dokumente festgehalten. Auf die Festsetzung eines generellen Cut-off Wertes wurde, aufgrund schlechter Erfahrungen aus GIRT verzichtet. Dennoch erfolgte bei den Rankingsystemen bei ca. der Hälfte der Recherchen die endgültige Einschränkung der Treffermenge über das Setzen eines Cut-off Wertes, d.h. die Dokumente wurden nur dann als Treffer ausgegeben, wenn sie einen vom Probanden festgelegten Rang- bzw. Rankingwert erreichten. Alle Probanden erhielten nach der Durchführung ihrer Recherchen einen Fragebogen, in dem sie neben ihren Retrievalerfahrungen persönliche Eindrücke und Einschätzungen bezüglich des Recherchetests dokumentieren sollten. Diese Angaben waren Ausgangspunkt für die spätere statistische Auswertung, bei der die Teilnehmer aufgrund ihrer Angaben in Gruppen eingeteilt und Hypothesen aufgestellt werden konnten. %RGEBNISSE DER %VALUIERUNGEN Anhand der ermittelten absoluten Zahlen und den daraus errechneten Effektivitätsmaßen konnten für jedes System Kennwerte gewonnen werden, die seine Retrievalleistung charakterisieren und somit einen Vergleich ermöglichten. Als Kenngröße zur Bewertung der Retrievaleffektivität der einzelnen Systeme wurden die Standardmaße Recall und Precision herangezogen. Zur Bestimmung der Mittelwerte der Ergebnisse wurde die Makromethode angewandt. Bei dieser Methode wird das gewählte Bewertungsmaß für jedes Retrievalergebnis getrennt berechnet; anschließend werden die Werte arithmetisch gemittelt, um die Vergleichbarkeit der Recherche in ihrer Gesamtheit und nicht die einzelner Dokumente zu erhalten. Betrachtet man innerhalb der statistischen Auswertung die gemittelten Recallund Precisionwerte der einzelnen Systeme, fällt es schwer eine eindeutige Aussage bezüglich des "besser seins" des einen oder anderen Retrievalsystems bzw. Modells zu treffen. Einzig das schwache Abschneiden des TextExtenders, bei dem sowohl der Recall als auch die Precision am geringsten ausfielen, läßt eine negative Beurteilung zu. Bei DOMESTIC fiel eine durchgehend inverse Relation zwischen schlechtem Recall und überdurchschnittlicher Precision auf. Lars II lag mit seinen Effektivitätswerten "unspektakulär" im Mittelfeld. Nur der

8 Intelligent Miner for Text konnte über den gesamten Test hinweg, im Vergleich zu den übrigen Systemen, eine ausgeglichen gute Retrievalleistung erbringen. Bei der Betrachtung der Ergebnisse der jeweiligen Systeme in Bezug auf die einzelnen Testaufgaben, fiel der Intelligent Miner for Text, sowohl beim Recall als auch der Precision positiv auf. Eine Zusammenfassung der Testpersonen in potentiell homogene Blöcke, die durch inhaltliche Kriterien basierend auf einem Fragebogen definiert wurden, ergab erstaunlicherweise bei keinem System einen aussagekräftigen, qualitativen Unterschied. Ein Grund für die fehlenden signifikanten Unterschiede zwischen den Testpersonen mit und ohne Retrievalerfahrung, die bei dieser Evaluierung aufgetreten sind, mag die Tatsache sein, daß die eigentliche Eingabe der Suchanfrage von den eingesetzten Mittlern übernommen wurde und von den Probanden keine dahingehenden Kenntnisse gefordert waren. Hier muß die Frage gestellt werden, ob sich das Einschalten eines Mittlers nicht doch ausgleichend zwischen erfahrenen und unerfahrenen Probanden auswirkte und die Ergebnisse nachhaltig beeinflußte. Vergleicht man die Ergebnisse der Rankingsysteme Intelligent Miner for Text und TextExtender mit denen der booleschen Systeme kann keine klare Aussage getroffen werden, mit welchem Modell letztlich effektiver gesucht wurde. Auch konnte die Fähigkeit der linguistischen Verarbeitung dieser beiden Systeme gemeinsam betrachtet keinen Effektivitätsvorsprung gegenüber den beiden anderen Systemen verzeichnen. Zu berücksichtigen ist hierbei, daß der TextExtender innerhalb der Evaluierungen das einzige System ohne graphische Benutzeroberfläche war. Durch den Einsatz der Mittler konnte zwar das Problem seitens der Eingabe der Suchanfrage eliminiert werden, doch die unübersichtliche Präsentation der Ergebnislisten konnte damit nicht behoben werden. Dieser Sachverhalt erschwerte die Recherche für die Probanden um ein Vielfaches und schränkt die Vergleichbarkeit der Ergebnisse erheblich ein, da die Bearbeitung der Aufgaben zumeist auf einem mehrstufigen Interaktionsprozeß mit den Systemen basierte. Klammert man aus diesen Gründen die Resultate des TextExtenders aus der Analyse aus, erhält man ein völlig anderes, kontroverses Bild. Werden lediglich die Ergebnisse des Intelligent Miner for Text und die der beiden booleschen Systemen betrachtet, so erreichte das Rankingsystem mit seiner linguistischen Verarbeitung sehr wohl effektivere Rechercheergebnisse. Es handelte sich jedoch auch hier um keine statistisch nachweisbaren Differenzen. Abschließend wurden die Ergebnisse auf Signifikanz getestet. Da es sich bei der Evaluierungsstudie des Intelligent Miner for Text nicht um dieselben Probanden handelte wie bei der Untersuchung der drei anderern Retrievalsysteme, wurde der Signifikanztest hier nach dem Wilcoxon/Kruskan-Wallis Verfahren

9 durchgeführt und die Ergebnisse der ersten Studie paarweise mit denen des Intelligent Miner for Text geprüft. Anhand dieser Berechnung kann die generalisierte Aussage getroffen werden, daß der Intelligent Miner for Text signifikant besser bzw. effektiver ist als der TextExtender. Gegenüber dem booleschen System Lars II waren die Differenzen innerhalb der Ergebnisse wohl nur rein zufällig, zumindest erbrachten die Berechnungen keine statistisch signifikanten Unterschiede. Bei der Betrachtung des Intelligent Miner for Text, gepaart mit den Resultaten von DOMESTIC, liegt bezüglich der Precision keine statistische Signifikanz vor, jedoch scheint das Rankingsystem im Hinblick auf den Recall DOMESTIC signifikant überlegen zu sein. Somit ließ sich ein signifikanter Unterschied lediglich gegenüber dem TextExtender ermittelt. Gegenüber den beiden anderen Systemen lassen sich zwar Tendenzen erkennen, die jedoch stochastisch nicht belegbar sind. Aufgabe eines Retrievalsystems ist der Nachweis relevanter Dokumente für den Benutzer. Die Ausgabe einer ungeordneten Liste, wie dies bei booleschen Systemen üblich ist, ist insbesonders bei großen Datenmengen unbefriedigend und für Reformulierungen nicht sonderlich hilfreich. Mit der Ausgabe einer sortierten Liste, wie es bei den Rankingsystemen der Fall ist, wird dem Benutzer zusätzlich die Möglichkeit gegeben zu entscheiden, ob er einen niedrigen Recall mit gegebenenfalls einer hohen Precision anstrebt, sprich sein Augenmerk vornehmlich auf die vorderen Ränge legt, oder ihm ein hoher Recall wichtiger ist und er sich auch am unteren Teil der Dokumentenliste orientiert. Um die Effektivität der Rankingkomponente verschiedener Retrievalsysteme miteinander vergleichen zu können, wurde Recall-Precision-Graphen benutzt. Hierbei wird jeder ausgegebene Rang als Cut-off genutzt und die jeweiligen Wertepaare berechnet. Anhand dieses Graphen, sowie der Berechnung des normalisierten Recall - hier erfolgt ein Vergleich mit einem optimalen System - konnte für den Intelligent Miner for Text ein deutlicher Effektivitätsvorteil gegenüber dem Textextender nachgewiesen werden. 2ES¼MEE UND!USBLICK Betrachtet man die Ergebnisse, so lassen sich zwei wichtige Tendenzen erkennen. Zum einen ist ein wesentlicher Unterschied zwischen den beiden Ranking-Systemen TextExtender und Intelligent Miner for Text sichtbar. Es liegt die Vermutung nahe, daß diese signifikanten Unterschiede auch ihre Ursache in der Benutzerschnittstelle haben, da die sonstigen Funktionalitäten der Systeme vergleichbar sind. Die Vergleiche zwischen booleschen und Ranking- Systemen haben zunächst keine signifikanten Unterschiede gezeigt, sehr wohl aber die Einzelbetrachtungen zwischen TextExtender und Intelligent Miner for

10 Text mit den booleschen Systemen. Auch hier liegt die Vermutung nahe, daß die Benutzerschnittstelle erheblichen Einfluß auf diese Ergebnisse hatte. Um diese Vermutungen zu verifizieren muß ein umfangreicherer Test wie der hier beschriebene durchgeführt werden. Dabei sollte zum einen die Zahl der Testpersonen vergrößert werden und zum anderen die Anzahl der unterschiedlichen Parameter möglichst auf die Schnittstelle beschränkt bleibt. Die hier vorliegende Untersuchung beinhaltet noch zu viele Freiheitsgrade, als daß der Einfluß der Benutzerschnittstelle oder Teile der Benutzerschnittstelle signifikant festgestellt werden konnte.,iteratur [Frisch & Kluck 1997] E. Frisch, M. Kluck. Pretest zum Projekt German Indexing and Retrieval Testdatabase (GIRT) unter Anwendung der Retrievalsysteme Messenger und freewaissf. Bonn 1997 [Käter 1999] T. Käter. Evaluierung des Text-Retrievalsystems Intelligent Miner for Text von IBM. Eine Studie im Vergleich zur Evaluierung anderer Systeme. Diplomarbeit Informationswissenschaft, Universität Konstanz [Sparck Jones 1981] K. Sparck Jones. Information retrieval experiment. Butterworths, 1981 [Tague-Sutcliffe 1995] J. Tague-Sutcliffe. Measuring information. An information services perspective. Academic Press: San Diego, London, 1995 [Voorhees & Harman 1998] E.M Voorhees, D.K. Harman. Sixth Text Retrieval Conference (TREC-6) (NIST SP ). Gaithersburg, MD, USA [Womser-Hacker 1989] C. Womser-Hacker. Der PADOK-Retrievaltest. Zur Methode und Verwendung statistischer Verfahren bei der Bewertung von Information-Retrieval-Systemen. Olms. 1989

Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de

Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de Deutsche Suchmaschinen im Vergleich: AltaVista.de, Fireball.de, Google.de und Lycos.de Joachim Griesbaum 1 / Marc Rittberger 2 / Bernard Bekavac 1 1 Universität Konstanz Fach D 87 D-78457 Konstanz 2 Heinrich-Heine-Universität

Mehr

2 Evaluierung von Retrievalsystemen

2 Evaluierung von Retrievalsystemen 2. Evaluierung von Retrievalsystemen Relevanz 2 Evaluierung von Retrievalsystemen Die Evaluierung von Verfahren und Systemen spielt im IR eine wichtige Rolle. Gemäß der Richtlinien für IR der GI gilt es,...

Mehr

Evaluierung und Retrievalmaße. Seminar experimentelle Evaluierung In Information Retrieval WS05/06

Evaluierung und Retrievalmaße. Seminar experimentelle Evaluierung In Information Retrieval WS05/06 Evaluierung und Retrievalmaße Seminar experimentelle Evaluierung In Information Retrieval WS05/06 Einleitung - Evaluierung Wichtig für IR Zusammenhang zwischen einer Suchanfrage und den zurückgegebenen

Mehr

Evaluation von IR-Systemen

Evaluation von IR-Systemen Evaluation von IR-Systemen Überblick Relevanzbeurteilung Übereinstimmung zwischen Annotatoren Precision Recall (Präzision u. Vollständigkeit) Text Retrieval Conference (TREC) Testkollektionen Beurteilen

Mehr

Wörter - Texte - Information. Möglichkeiten und Grenzen automatischer Erschließungsverfahren

Wörter - Texte - Information. Möglichkeiten und Grenzen automatischer Erschließungsverfahren Wörter - Texte - Information Möglichkeiten und Grenzen automatischer Erschließungsverfahren Automatische Indexierung - Einführung 1 Indexieren und Automatisches Indexieren Dokumente Volltexte bibliografische

Mehr

Teil 4. Aufbau von Datenbanken. Universitätsbibliothek Chemnitz - AG Informationskompetenz

Teil 4. Aufbau von Datenbanken. Universitätsbibliothek Chemnitz - AG Informationskompetenz Teil 4 Datenbanken I Aufbau von Datenbanken 30.08.2007 Überblick 1. Abfrage der Hausaufgabe: Erstellen einer Themenanalyse 2. Wiederholung Thematische Literaturrecherche: Was suche ich? 3. Thematische

Mehr

Information Retrieval. Peter Kolb

Information Retrieval. Peter Kolb Information Retrieval Peter Kolb Semesterplan Einführung Boolesches Retrievalmodell Volltextsuche, invertierter Index Boolesche Logik und Mengen Vektorraummodell Evaluation im IR Term- und Dokumentrepräsentation

Mehr

Alternativen zu Google. Prof. Dr. Dirk Lewandowski

Alternativen zu Google. Prof. Dr. Dirk Lewandowski Alternativen zu Google Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de Agenda Situation / warum Alternativen zu Google? Lohnt sich die Recherche in anderen Universalsuchmaschinen? Alternative

Mehr

Untersuchung zur Gleichwertigkeit des LOVIBOND CSB vario Küvettentest mit dem Hach * CSB Küvettentest

Untersuchung zur Gleichwertigkeit des LOVIBOND CSB vario Küvettentest mit dem Hach * CSB Küvettentest Untersuchung zur Gleichwertigkeit des LOVIBOND CSB vario Küvettentest mit dem CSB Küvettentest Inhaltsverzeichnis Seite Einleitung und Zielsetzung 1 Verwendete Methoden, Reagenzien und Geräte 1 Teil I

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

SQL. SQL SELECT Anweisung SQL-SELECT SQL-SELECT

SQL. SQL SELECT Anweisung SQL-SELECT SQL-SELECT SQL SQL SELECT Anweisung Mit der SQL SELECT-Anweisung werden Datenwerte aus einer oder mehreren Tabellen einer Datenbank ausgewählt. Das Ergebnis der Auswahl ist erneut eine Tabelle, die sich dynamisch

Mehr

Monte-Carlo Tests. Diplomarbeit. Wiebke Werft. Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf

Monte-Carlo Tests. Diplomarbeit. Wiebke Werft. Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf Monte-Carlo Tests Diplomarbeit Wiebke Werft Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf Düsseldorf im Dezember 2003 Betreuung: Prof. Dr. Arnold Janssen Inhaltsverzeichnis Einleitung

Mehr

Eine zentrale Recherche-Plattform für Bibliotheksressourcen

Eine zentrale Recherche-Plattform für Bibliotheksressourcen Bibliothek und Archiv der Technischen Universität Graz Mai 2014 Eine zentrale Recherche-Plattform für Bibliotheksressourcen http://tugraz.summon.serialssolutions.com/ Seit Dezember 2012 bietet die TU Graz

Mehr

Schubert Foo, Douglas Hendry: for Desktop Searching

Schubert Foo, Douglas Hendry: for Desktop Searching Schubert Foo, Douglas Hendry: Evaluation of Visual Aid Suite for Desktop Searching Sergey Tarassenko Einführung Weltweite Verbreitung von Elektronischen Information Schnelle Entwicklung von Suchmaschinen.

Mehr

1 Einleitung. Heute weiß man von allem den Preis, von nichts den Wert. Oscar Wilde

1 Einleitung. Heute weiß man von allem den Preis, von nichts den Wert. Oscar Wilde 1 Heute weiß man von allem den Preis, von nichts den Wert. Oscar Wilde 1 Einleitung 1.1 Zielsetzung und Vorgehensweise der Untersuchung Unternehmensbewertungen sind für verschiedene Anlässe im Leben eines

Mehr

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Basiert auf: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Basiert auf: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10. Fit für die Projektarbeit Thematische Literatursuche in 5 Schritten Basiert auf: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.2010 Thematische Literatursuche in 5 Schritten 1. Was suchen Sie?

Mehr

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Quelle: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.

Fit für die Projektarbeit. Thematische Literatursuche in 5 Schritten Quelle: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10. Fit für die Projektarbeit Thematische Literatursuche in 5 Schritten Quelle: Lotse, Skript zur Thematischen Literatursuche. Stand 1.10.2010 Thematische Literatursuche in 5 Schritten 1. Was suchen Sie? Analysieren

Mehr

Pilotierung der Unterrichtsbeispiele im Schuljahr 2007/2008. Naturwissenschaften

Pilotierung der Unterrichtsbeispiele im Schuljahr 2007/2008. Naturwissenschaften Pilotierung der Unterrichtsbeispiele im Schuljahr 2007/2008 Naturwissenschaften Im Schuljahr 2007/2008 wurde die Pilotierung der Unterrichtsbeispiele für die Naturwissenschaften durchgeführt. Insgesamt

Mehr

Frank Lammers. Statistik I: deskriptive und explorative Statistik. Lehr- und Übungsbuch

Frank Lammers. Statistik I: deskriptive und explorative Statistik. Lehr- und Übungsbuch Frank Lammers Statistik I: deskriptive und explorative Statistik Lehr- und Übungsbuch 2004 Verlag der Gesellschaft für Unternehmensrechnung und Controlling m.b.h. Vorwort I Vorwort zur zweiten Auflage

Mehr

Dirk Lewandowski. Web Information Retrieval Technologien zur Informationssuche im Internet. DGI-Schrift (Informationswissenschaft 7}

Dirk Lewandowski. Web Information Retrieval Technologien zur Informationssuche im Internet. DGI-Schrift (Informationswissenschaft 7} Dirk Lewandowski Web Information Retrieval Technologien zur Informationssuche im Internet DGI-Schrift (Informationswissenschaft 7} Inhalt Vorwort 9 Suchmaschinen im Internet - informationswissenschaftlich

Mehr

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten

Mehr

Erfolgreich suchen im Internet

Erfolgreich suchen im Internet Erfolgreich suchen im Internet Steffen-Peter Ballstaedt 05.10.2015 Statistik Weltweit: etwa 1 Milliarde Websites BRD: 15 Millionen Websites Das Internet verdoppelt sich alle 5,32 Jahre Die häufigste Aktivität

Mehr

Was wird evaluiert? in Abhängigkeit davon Wahl des Evaluierungswerkzeugs. Formen der Evaluierung: Datenanalytische Verfahren

Was wird evaluiert? in Abhängigkeit davon Wahl des Evaluierungswerkzeugs. Formen der Evaluierung: Datenanalytische Verfahren Evaluierung von IRS Evaluierungsarten Rapid-Prototyping Simulationstest (Wizard-of-Oz-Experimente) Kontrollierte Experimente Untersuchungen Empirische Langzeitstudien Managementmethoden wie (Kritische)

Mehr

Visualisierung in Informatik und Naturwissenschaften

Visualisierung in Informatik und Naturwissenschaften Visualisierung in Informatik und Naturwissenschaften Datenbankvisualisierung Sven Bernhard 12.06.1999 Datenbankvisualisierung Datenbanktheorie in 5 Minuten Visualisierung vs. Datenbanken Visualisierung

Mehr

Pilotierung der Unterrichtsbeispiele im Schuljahr 2008/2009 Englisch

Pilotierung der Unterrichtsbeispiele im Schuljahr 2008/2009 Englisch Pilotierung der Unterrichtsbeispiele im Schuljahr 2008/2009 Englisch Im Schuljahr 2008/2009 wurde die Pilotierung der Unterrichtsbeispiele für Englisch durchgeführt. Insgesamt waren für die Pilotierung

Mehr

Thematische Abfrage mit Computerlinguistik

Thematische Abfrage mit Computerlinguistik Thematische Abfrage mit Computerlinguistik Autor: Dr. Klaus Loth (ETH-Bibliothek Zürich) Zusammenfassung Der Beitrag befasst sich mit dem Einsatz der Computerlinguistik bei der thematischen Abfrage einer

Mehr

Fit für die Projektarbeit. Literaturrecherche leicht gemacht!

Fit für die Projektarbeit. Literaturrecherche leicht gemacht! Fit für die Projektarbeit Literaturrecherche leicht gemacht! Die thematische Literaturrecherche Schneeballsystem Ihnen ist eine gute Quelle bereits bekannt Sie werten nun das Literaturverzeichnis aus und

Mehr

Bei näherer Betrachtung des Diagramms Nr. 3 fällt folgendes auf:

Bei näherer Betrachtung des Diagramms Nr. 3 fällt folgendes auf: 18 3 Ergebnisse In diesem Kapitel werden nun zunächst die Ergebnisse der Korrelationen dargelegt und anschließend die Bedingungen der Gruppenbildung sowie die Ergebnisse der weiteren Analysen. 3.1 Ergebnisse

Mehr

Literaturrecherche Mentoring für Lehrer

Literaturrecherche Mentoring für Lehrer Literaturrecherche Mentoring für Lehrer VU Empirische Methoden Ao.Univ.-Prof. Mag. DI Dr. Christian Schlögl Anna Winkelbauer 0212038 geplante Recherchestrategie Suchbegriff: Mentoring für Lehrer Datenbank:

Mehr

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen

Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Rückblick Boole sches Retrieval als frühes, aber immer noch verbreitetes IR-Modell mit zahlreichen Erweiterungen Vektorraummodell stellt Anfrage und Dokumente als Vektoren in gemeinsamen Vektorraum dar

Mehr

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme Kapitel IR:II II. Grundlagen des Information Retrieval Retrieval-Evaluierung Indexterme IR:II-1 Basics STEIN 2005-2010 Batch-Mode-Retrieval einmaliges Absetzen einer Anfrage; nur eine Antwort wird geliefert

Mehr

Information-Retrieval: Evaluation

Information-Retrieval: Evaluation Information-Retrieval: Evaluation Claes Neuefeind Fabian Steeg 17. Dezember 2009 Themen des Seminars Boolesches Retrieval-Modell (IIR 1) Datenstrukturen (IIR 2) Tolerantes Retrieval (IIR 3) Vektorraum-Modell

Mehr

Trainingsmanagement Gutschein Management. Beschreibung

Trainingsmanagement Gutschein Management. Beschreibung Trainingsmanagement Beschreibung www.dastm.de info@dastm.de 1. Einführung... 2 2. Gutschein Funktionen... 3 2.1. Gutschein Menü... 3 2.2. Gutscheine anlegen... 4 Gutschein Kassenwirksam erfassen... 6 Gutschein

Mehr

Studienprojekt TaxoSearch Spezifikation

Studienprojekt TaxoSearch Spezifikation Studienprojekt TaxoSearch Spezifikation Semantisch gestützte Suche im Internet Lehrstuhl für Computerlinguistik Ruprecht-Karls-Universität Heidelberg WS 2002-2003 vorgestellt von Thorsten Beinhorn, Vesna

Mehr

Eine zentrale Recherche-Plattform für Bibliotheksressourcen

Eine zentrale Recherche-Plattform für Bibliotheksressourcen Eine zentrale Recherche-Plattform für Bibliotheksressourcen http://tugraz.summon.serialssolutions.com/ Die neue Literatursuchmaschine der TU Graz, der die Software-Lösung Summon TM der Firma Serials Solutions

Mehr

Wissenschaftliches Arbeiten und Informationskompetenz in den Wirtschaftswissenschaften (2a)

Wissenschaftliches Arbeiten und Informationskompetenz in den Wirtschaftswissenschaften (2a) Wissenschaftliches Arbeiten und Informationskompetenz in den Wirtschaftswissenschaften (2a) Schlüsselqualifikationen für Bachelor-Studierende (Ergänzungsbereich Modul E1) SoSe 2011 Alexander Holste / Schreibwerkstatt/Universitätsbibliothek

Mehr

QUANTITATIVE VS QUALITATIVE STUDIEN

QUANTITATIVE VS QUALITATIVE STUDIEN 1 QUANTITATIVE VS QUALITATIVE STUDIEN Q UA N T I TAT I V E ST U D I E (lat. quantitas: Größe, Menge) Q UA L I TAT I V E ST U D I E (lat.: qualitas = Beschaffenheit, Merkmal, Eigenschaft, Zustand) 2 QUANTITATIVES

Mehr

Federated Search: Integration von FAST DataSearch und Lucene

Federated Search: Integration von FAST DataSearch und Lucene Federated Search: Integration von FAST DataSearch und Lucene Christian Kohlschütter L3S Research Center BSZ/KOBV-Workshop, Stuttgart 24. Januar 2006 Christian Kohlschütter, 24. Januar 2006 p 1 Motivation

Mehr

MLA International Bibliography

MLA International Bibliography Württembergische Landesbibliothek MLA International Bibliography 09/12 Inhaltsverzeichnis 1. Über MLA...2 2. Startbildschirm (Advanced Search)...3 2.1 Eingabefelder in der Advanced Search...3 2.2 Sucheinschränkungen...3

Mehr

Semiautomatische Erschließung von Psychologie-Information

Semiautomatische Erschließung von Psychologie-Information PETRUS-Workshop "Automatische Erschließungsverfahren" 21./22.03.2011 Dipl.-Psych. Michael Gerards Semiautomatische Erschließung von Psychologie-Information Kontext Die Literaturdatenbank PSYNDEX: Erschließt

Mehr

Wissenschaftliche psychologische Fachinformationsrecherche in neun Schritten

Wissenschaftliche psychologische Fachinformationsrecherche in neun Schritten Wissenschaftliche psychologische Fachinformationsrecherche in neun Schritten Stand: 14.11.12 ZPID Universität Trier Mitglied der Leibniz-Gemeinschaft 1 Inhalt 1. Zweck der Suche definieren 2. Auswahl der

Mehr

3. Langer Samstag der Hausarbeiten - Campus Duisburg,

3. Langer Samstag der Hausarbeiten - Campus Duisburg, - Campus Duisburg, 28.06.2014 Wie recherchiere ich systematisch? Vom Schneeballprinzip zur Datenbankrecherche (Delia Bauer-Krupp) Schneeballprinzip Auswertung von Literaturhinweisen - im Literaturverzeichnis

Mehr

Literaturdatenbanken

Literaturdatenbanken Workshop Tipps und Tools für eine effektive Literaturrecherche in Pubmed/Medline 5. Kongress für Arzneimittelinformation Köln 04.02.2017 Dr. Mirjam Gnadt Arzneimittelinformationsstelle der Bayerischen

Mehr

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 12. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 12 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre II Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 18.2.15 Psychologie als Wissenschaft

Mehr

Vorschulische Sprachstandserhebungen in Berliner Kindertagesstätten: Eine vergleichende Untersuchung

Vorschulische Sprachstandserhebungen in Berliner Kindertagesstätten: Eine vergleichende Untersuchung Spektrum Patholinguistik 7 (2014) 133 138 Vorschulische Sprachstandserhebungen in Berliner Kindertagesstätten: Eine vergleichende Untersuchung Stefanie Düsterhöft, Maria Trüggelmann & Kerstin Richter 1

Mehr

IR Seminar SoSe 2012 Martin Leinberger

IR Seminar SoSe 2012 Martin Leinberger IR Seminar SoSe 2012 Martin Leinberger Suchmaschinen stellen Ergebnisse häppchenweise dar Google: 10 Ergebnisse auf der ersten Seite Mehr Ergebnisse gibt es nur auf Nachfrage Nutzer geht selten auf zweite

Mehr

Alle Menschen sind nicht gleich

Alle Menschen sind nicht gleich Alle Menschen sind nicht gleich Zur Bedeutung von Mittelwert und Streuung bei psychologischen Untersuchungen in der Lichttechnik Prof. Dr. Bernd Jödicke Martin Merkler Fachhochschule Konstanz Ökolux GmbH

Mehr

NOW YOU KNOW [ONTOS TM WHITE PAPER SERIES] Intelligentes Information Mining durch Ontologie [YVES BRENNWALD, ONTOS INTERNATIONAL AG]

NOW YOU KNOW [ONTOS TM WHITE PAPER SERIES] Intelligentes Information Mining durch Ontologie [YVES BRENNWALD, ONTOS INTERNATIONAL AG] NOW YOU KNOW [ SERIES] Intelligentes Information Mining durch Ontologie [YVES BRENNWALD, ONTOS INTERNATIONAL AG] 001 Information Mining Wissen in unstrukturierten Daten aufdecken Information Mining ist

Mehr

Massnahmen im Mahnverfahren in Bezug auf das Zahlverhalten der Kunden

Massnahmen im Mahnverfahren in Bezug auf das Zahlverhalten der Kunden Massnahmen im Mahnverfahren in Bezug auf das Zahlverhalten der Kunden Eine empirische Untersuchung verschiedener Massnahmen Bachelorarbeit zur Erlangung des akademischen Grades: Bachelor of Science in

Mehr

Carl-Engler-Schule Karlsruhe Datenbank 1 (5)

Carl-Engler-Schule Karlsruhe Datenbank 1 (5) Carl-Engler-Schule Karlsruhe Datenbank 1 (5) Informationen zur Datenbank 1. Definition 1.1 Datenbank-Basis Eine Datenbank-Basis ist eine Sammlung von Informationen über Objekte (z.b Musikstücke, Einwohner,

Mehr

LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel. AGMB-Tagung Basel, Seite

LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel. AGMB-Tagung Basel, Seite LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel AGMB-Tagung Basel, 08.09.2015 MEDPILOT und GREENPILOT schließen einen Bund fürs Leben: LIVIVO Interdisziplinäre Literatursuche: Datenquellen

Mehr

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation:

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation: 02. Mai 2005 P R O J E C T C O N S U L T GmbH GmbH 1 Agenda Einführung Automatische Klassifikation Qualität Veränderung des Arbeitsumfeldes Ausblick GmbH 2 1 Einführung GmbH 3 Eine Herausforderung geordnete

Mehr

Datenbanken & Informationssysteme (WS 2016/2017)

Datenbanken & Informationssysteme (WS 2016/2017) Datenbanken & Informationssysteme (WS 2016/2017) Klaus Berberich (klaus.berberich@htwsaar.de) Wolfgang Braun (wolfgang.braun@htwsaar.de) 0. Organisatorisches Dozenten Klaus Berberich (klaus.berberich@htwsaar.de)

Mehr

etutor Benutzerhandbuch Relationale Algebra Benutzerhandbuch Georg Nitsche

etutor Benutzerhandbuch Relationale Algebra Benutzerhandbuch Georg Nitsche etutor Benutzerhandbuch Benutzerhandbuch Relationale Algebra Georg Nitsche Version 1.0 Stand März 2006 Versionsverlauf: Version Autor Datum Änderungen 1.0 gn 6.3.2006 Fertigstellung der ersten Version

Mehr

8.2 Nicht parametrische Tests Vergleich CT/2D/3D. Abb. 28 Mann-Whitney-U-Test

8.2 Nicht parametrische Tests Vergleich CT/2D/3D. Abb. 28 Mann-Whitney-U-Test 41 8. Interpretationen der Studienergebnisse Im vorliegenden Kapitel werden die Studienergebnisse mit Hilfe des Mann-Whitney-U-Tests auf signifikante Unterschiede untersucht. Hierfür wurden die vorliegenden

Mehr

2. Methode Design Ein- und Ausschlusskriterien Suchstrategie Datenbanken

2. Methode Design Ein- und Ausschlusskriterien Suchstrategie Datenbanken 2. Methode 2.1. Design Für die Beantwortung der Forschungsfragen wurde ein Literaturreview gewählt. Das Ziel eines Literaturreviews ist es, den aktuellen Wissensstand zu einem Thema zu erheben, dieses

Mehr

Dataport IT Bildungs- und Beratungszentrum. Access Grundlagenseminar Access Aufbauseminar... 3

Dataport IT Bildungs- und Beratungszentrum. Access Grundlagenseminar Access Aufbauseminar... 3 Inhalt Access 2010 - Grundlagenseminar... 2 Access 2010 - Aufbauseminar... 3 Access 2010 - Von Excel zu Access... 4 Access 2010 - Programmierung Teil 1... 5 Access 2010 - Programmierung Teil 2... 6 Grundlagen

Mehr

12 BG EDV Access / Inf-SQL1 Theodor-Heuss-Schule Wetzlar

12 BG EDV Access / Inf-SQL1 Theodor-Heuss-Schule Wetzlar Abfragen aus einer Tabelle mit Hilfe der Datenbank-Sprache SQL SQL (Structured Query Language) ist eine Computersprache zum Speichern, Bearbeiten und Abfragen von Daten in relationalen Datenbanken. Eine

Mehr

Beschränktheit, Monotonie & Symmetrie

Beschränktheit, Monotonie & Symmetrie Beschränktheit, Monotonie & Symmetrie ein Referat Dies ist eine Beilage zum Gruppen-SOL - Projekt Potenz- & Exponentialfunktionen Ronald Balestra CH - 8046 Zürich www.ronaldbalestra.ch November 2015 Inhaltsverzeichnis

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 3 1 Inhalt der heutigen Übung Vorrechnen der Hausübung B.7 Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben C.1: Häufigkeitsverteilung C.2: Tukey

Mehr

Optimalcodierung. Thema: Optimalcodierung. Ziele

Optimalcodierung. Thema: Optimalcodierung. Ziele Optimalcodierung Ziele Diese rechnerischen und experimentellen Übungen dienen der Vertiefung der Kenntnisse im Bereich der Optimalcodierung, mit der die Zeichen diskreter Quellen codiert werden können.

Mehr

Bibliothek Seite 1. Recherchehinweise für Informationsdatenbanken

Bibliothek Seite 1. Recherchehinweise für Informationsdatenbanken Seite 1 Seite 2 Inhalt Übersicht über das Informationsangebot Generelle Hinweise zum Recherchieren Seite 3 Informationsplattformen Zwei Zugangsarten: Webbasierte Informationsdienste (Zugang über Bibliothekshomepage)

Mehr

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Methodenlehre. Vorlesung 11. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg Methodenlehre Vorlesung 11 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 03.12.13 Methodenlehre I Woche Datum Thema 1 FQ Einführung, Verteilung der Termine 1 25.9.13 Psychologie

Mehr

Release Notes SAPERION Version 7.1 SP 6

Release Notes SAPERION Version 7.1 SP 6 Release Notes SAPERION Version 7.1 SP 6 Copyright 016 Lexmark. All rights reserved. Lexmark is a trademark of Lexmark International, Inc., registered in the U.S. and/or other countries. All other trademarks

Mehr

DB2 Kurzeinführung (Windows)

DB2 Kurzeinführung (Windows) DB2 Kurzeinführung (Windows) Michaelsen c 25. Mai 2010 1 1 Komponenten von DB2 DB2 bietet zahlreiche graphische Oberflächen für die Verwaltung der verschiedenen Komponenten und Anwendungen. Die wichtigsten

Mehr

Geschlecht Gesamt % Schulart Gesamt %

Geschlecht Gesamt % Schulart Gesamt % 4. Ergebnisse 4.1 Beschreibung der tichprobe Im Rahmen der jugendärztlichen Untersuchung in der tadt Halle erklärten sich 2361 von 2844 chülerinnen bereit (83,0%), den Fragebogen auszufüllen, von denen

Mehr

Evaluierung von Suchmaschinen Qualitätsvergleich von Google- und Bing- Suchergebnissen unter besonderer Berücksichtigung von

Evaluierung von Suchmaschinen Qualitätsvergleich von Google- und Bing- Suchergebnissen unter besonderer Berücksichtigung von Evaluierung von Suchmaschinen Qualitätsvergleich von Google- und Bing- Suchergebnissen unter besonderer Berücksichtigung von Universal-Search-Resultaten Information Retrieval: Suchen bzw. Wiederfinden

Mehr

Das Frühwarnsystem für die. Das Frühwarnsystem für die Ausliefer-Produkt-Audits (APA) (APA)

Das Frühwarnsystem für die. Das Frühwarnsystem für die Ausliefer-Produkt-Audits (APA) (APA) Das Frühwarnsystem für die Das Frühwarnsystem für die Ausliefer-Produkt-Audits (APA) (APA) Das Frühwarnsystem für die Ausliefer-Produkt-Audits (APA) Gliederung: Auswertung der APA-Daten Datengrundlage

Mehr

Akademisches Lehrmaterial online

Akademisches Lehrmaterial online Akademisches Lehrmaterial online Christian Weber cweber@akleon.de Entstanden im Rahmen des DFN-Projekts META-AKAD gefördert mit Mitteln des BMBF Mitwirkende an der TU Kaiserslautern Universitätsbibliothek

Mehr

Angewandte Statistik 3. Semester

Angewandte Statistik 3. Semester Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen

Mehr

Eigene MC-Fragen "Wissenschaftliche Literatur suchen und auswählen"

Eigene MC-Fragen Wissenschaftliche Literatur suchen und auswählen Eigene MC-Fragen "Wissenschaftliche Literatur suchen und auswählen" 1. Hilfreich bei der Aufstellung von Wortlisten ist nicht Papier und Stift die 5-W-Strategie Block-Building-Approach Thesaurus Boolesche

Mehr

GBI-Genios: Recherchieren in wiso

GBI-Genios: Recherchieren in wiso GBI-Genios: Recherchieren in wiso Sachsenkonsortium Mai 2009 Martin Knab Mai.2009 / MK 1 Agenda Inhalte Suchtechnik Einfache Recherche Dokumentenanzeige Erweiterte Recherche Suchhistorie ebooks mein wiso

Mehr

NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE

NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE Was bedeutet NoSQL? Ein Sammelbegriff für alternative Datenbanklösungen, die

Mehr

User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten?

User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten? User Experience vs. Retrievaltests Wie lässt sich die Relevanz von Suchergebnissen bewerten? Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg dirk.lewandowski@haw-hamburg.de

Mehr

Literaturrecherche in Fachdatenbanken Ein Kurzleitfaden des Fachbereiches Pädagogik und Rehabilitation bei intellektueller Beeinträchtigung

Literaturrecherche in Fachdatenbanken Ein Kurzleitfaden des Fachbereiches Pädagogik und Rehabilitation bei intellektueller Beeinträchtigung Literaturrecherche in Fachdatenbanken Ein Kurzleitfaden des Fachbereiches Pädagogik und Rehabilitation bei intellektueller Beeinträchtigung Inhaltsverzeichnis 1. Zugang zu den Datenbanken... 2 2. Literaturrecherche

Mehr

Multimedia-Datenbanken im SS 2010 Einführung in MMDB

Multimedia-Datenbanken im SS 2010 Einführung in MMDB Multimedia-Datenbanken im SS 2010 Einführung in MMDB Dr.-Ing. Marcin Grzegorzek 27.04.2010 Ähnlichkeitssuche in Multimedia-Datenbanken 2/ 28 Inhalte und Termine 1. Einführung in MMDB 1.1 Grundlegende Begriffe

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

Teil I: Offenes Beispiel

Teil I: Offenes Beispiel Methodenlehreklausur 3/98 1 Teil I: Offenes Beispiel Sperka, Markus (1997). Zur Entwicklung eines Fragebogens zur Erfassung der Kommunikation in Organisationen (KomminO). Zeitschrift für Arbeits- und Organisationspsychologie,

Mehr

Supervised Learning Algorithmus für Stellenanzeigenklassifikation und Jobdeskriptoren Gewinnung

Supervised Learning Algorithmus für Stellenanzeigenklassifikation und Jobdeskriptoren Gewinnung Informatik Pawel Broda Supervised Learning Algorithmus für Stellenanzeigenklassifikation und Jobdeskriptoren Gewinnung Diplomarbeit Ludwig Maximilian Universität zu München Centrum für Informations- und

Mehr

Aufgaben Sigrun Schroth-Wiechert, Hannover Seite 1 von 6

Aufgaben Sigrun Schroth-Wiechert, Hannover Seite 1 von 6 Aufgaben Die folgende Auflistung von Wortpaaren ist ein Ergebnis des Kurses Deutsch der Technik: Forschungskurs Aufgabenstellung schriftlicher Arbeiten (C1), der in dieser Form am Fachsprachenzentrum erstmalig

Mehr

Im oberen Frame geben Sie Ihren Suchbegriff in das entsprechende Suchfeld ein.

Im oberen Frame geben Sie Ihren Suchbegriff in das entsprechende Suchfeld ein. Hilfethemen: Übersicht Thema 1: Oberfläche - Dreiteilung in Arbeitsbereiche Thema 2: Suchmodi Einfache Suche und Profisuche Thema 3: Suchfelder und Suchbegriffe Thema 4: Suchergebnis-Übersicht (Trefferliste)

Mehr

Mindbreeze Web Parts. für Microsoft SharePoint. Version 2016 Fall Release

Mindbreeze Web Parts. für Microsoft SharePoint. Version 2016 Fall Release Mindbreeze Web Parts für Microsoft SharePoint Version 2016 Fall Release Status: 04. Mai 2016 Copyright Mindbreeze GmbH, A-4020 Linz, 2017. Alle Rechte vorbehalten. Alle verwendeten Hard- und Softwarenamen

Mehr

Beschluss des Rates der IT-Beauftragten

Beschluss des Rates der IT-Beauftragten Beschluss des Rates der IT-Beauftragten Thema: Offene Dokumentenformate Gegenstand: Einführung offener Dokumentenformate in der Bundesverwaltung Datum: 28. November 2008 Anlagen: - Hintergrund: PROJEKTGRUPPE

Mehr

Was macht gute Versuche aus? ... aus der Sicht eines Biometrikers

Was macht gute Versuche aus? ... aus der Sicht eines Biometrikers Was macht gute Versuche aus?... aus der Sicht eines Biometrikers DLG-Technikertagung Soest, 28. Januar 2015 Andreas Büchse BASF SE, Ludwigshafen Vorbemerkung Einige Kriterien für Qualität von Experimenten

Mehr

CARM-Server. Users Guide. Version 4.65. APIS Informationstechnologien GmbH

CARM-Server. Users Guide. Version 4.65. APIS Informationstechnologien GmbH CARM-Server Version 4.65 Users Guide APIS Informationstechnologien GmbH Einleitung... 1 Zugriff mit APIS IQ-Software... 1 Zugang konfigurieren... 1 Das CARM-Server-Menü... 1 Administration... 1 Remote-Konfiguration...

Mehr

Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten

Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten Webinfolab / CHEVAL: Evaluationslabor für Information Retrieval Systeme mit semantischen und visuellen Komponenten Vortrag anlässlich der ODOK 2007 (20. September 2007, Graz) Joachim Pfister Schweizerisches

Mehr

7 Hypothesendiskussion

7 Hypothesendiskussion 7 287 Ausgehend von der Erörterung der theoretischen Grundlagen wissensintensiver Kooperationen320 wurden durch den Autor, in Verbindung mit einer Analyse und Darstellung der dem Einsatz aktiver Dokumente

Mehr

UNTERSUCHUNG BUCHUNGS- UND VERGLEICHSPORTALE DIE SCHWIERIGE SUCHE NACH DEM GÜNSTIGSTEN PREIS

UNTERSUCHUNG BUCHUNGS- UND VERGLEICHSPORTALE DIE SCHWIERIGE SUCHE NACH DEM GÜNSTIGSTEN PREIS FAQ PROJEKT MARKTWÄCHTER DIGITALE WELT UNTERSUCHUNG BUCHUNGS- UND VERGLEICHSPORTALE DIE SCHWIERIGE SUCHE NACH DEM GÜNSTIGSTEN PREIS 1. Was wurde untersucht? Die Untersuchung zu Buchungs- und Vergleichsportalen

Mehr

Praktikum Information Retrieval Wochen 12: Suchmaschine

Praktikum Information Retrieval Wochen 12: Suchmaschine Praktikum Information Retrieval Wochen 12: Suchmaschine Matthias Jordan 7. November 18. November 2011 Lösungen: Upload bis 18. November 2011 Aktuelle Informationen, Ansprechpartner, Material und Upload

Mehr

Tim Krämer. Archimetrix - Improved Software Architecture Recovery in the Presence of Design Deficiencies. 08. Mai 2013

Tim Krämer. Archimetrix - Improved Software Architecture Recovery in the Presence of Design Deficiencies. 08. Mai 2013 Tim Krämer 7kraemer@informatik.uni-hamburg.de Archimetrix - Improved Software Architecture Recovery in the Presence of Design Deficiencies 08. Mai 2013 Tim Krämer, 7kraemer@informatik.uni-hamburg.de Universität

Mehr

zu überprüfen und zu präzisieren. Dabei stehen folgende Fragestellungen im Vordergrund:

zu überprüfen und zu präzisieren. Dabei stehen folgende Fragestellungen im Vordergrund: 1. Einleitung Die Beschreibung und kritische Beurteilung von Alltagsargumentation wird durch das Wissen um häufig gebrauchte Denk- und Schlussmuster in einer Gesellschaft erleichtert. Abseits formal gültiger

Mehr

4.1. Campylobacter-Keimzahlen auf Hähnchenschenkeln innerhalb einer Handels- Packung

4.1. Campylobacter-Keimzahlen auf Hähnchenschenkeln innerhalb einer Handels- Packung 4. Ergebnisse 4.1. Campylobacter-Keimzahlen auf Hähnchenschenkeln innerhalb einer Handels- Packung Die Untersuchung der Verteilung der Campylobacter-Keimzahlen innerhalb einer Handels- Packung zeigte,

Mehr

Volltextsuche und Text Mining

Volltextsuche und Text Mining Volltextsuche und Text Mining Seminar: Einfuehrung in die Computerlinguistik Dozentin: Wiebke Petersen by Rafael Cieslik 2oo5-Jan-2o 1 Gliederung 1. Volltextsuche 1. Zweck 2. Prinzip 1. Index 2. Retrieval

Mehr

1 Vom elearning zum ilearning

1 Vom elearning zum ilearning 1 Vom elearning zum ilearning Peter Richert 1 und Jan Becker: Vom elektronischen Lernen zum interaktiven Lernen. Paper und Präsentation auf der First International GeoGebra Conference am 14. und 15. Juli

Mehr

Eine Untersuchung der Funktionen des Apache Wicket Webframeworks

Eine Untersuchung der Funktionen des Apache Wicket Webframeworks Eine Untersuchung der Funktionen des Apache Wicket Webframeworks Seminararbeit von Olaf Matticzk 1 15.01.2016 (c) by synaix 2016 synaix...your business as a service. Agenda 1. Einleitung 2. Webanwendungen

Mehr

Wie finde ich schnell relevante Literatur?

Wie finde ich schnell relevante Literatur? Platzhalter für Bild, Bild auf Titelfolie hinter das Logo einsetzen Wie finde ich schnell relevante Literatur? Suchtechniken im Katalog der UB In diesem Tutorial geht es um verschiedene Suchtechniken,

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Fragenkatalog 2 CAF-Gütesiegel - Fragenkatalog für den CAF-Aktionsplan (Verbesserungsplan)

Fragenkatalog 2 CAF-Gütesiegel - Fragenkatalog für den CAF-Aktionsplan (Verbesserungsplan) Fragenkatalog 2 CAF-Gütesiegel - Fragenkatalog für den CAF-Aktionsplan (Verbesserungsplan) Der Fragenkatalog deckt die Schritte sieben bis neun ab, die in den Leitlinien zur Verbesserung von Organisationen

Mehr