Promotionskolleg DIPF TU Darmstadt Knowledge Discovery in Scientific Literature Iryna Gurevych 1
Leitvision Fachinformation der Zukunft geht von der ubiquitären Verfügbarkeit der wissenschaftlichen Literatur im Web aus und zielt auf intelligente Mehrwertdienste für Fachcommunities Fundierung in modernsten Informatik-Methoden, z.b. Inhaltserschließung, Wissensentdeckung und Wissensaufbereitung Exzellente Grundlagenforschung darüber ist unser zentrales Ziel 2
Scientific publication databases Citation Index Scopus ISI Web of Knowledge Publisher ACM Portal IEEE Xplore Automatically generated CiteSeerX / ChemxSeer ACL Anthology / ACL Anthology Network DBLP Commercial search engine Google Scholar Microsoft Academic Search
Exploiting publication databases to support research process Simple search Keyword, author, publisher, date, Simple extraction outgoing/incoming citation Author profile Relation discovery Co author analysis Citation analysis Evaluating research excellence H index, g index, Impact factor Content analysis semantically similar articles Information Extraction Data Mining
Simple search and extraction Google Scholar ACM Digital Library
Microsoft Academic Search Citation Graph Citation analysis
Collaboration analysis ACL Anthology Network Collaboration Graph
Domain specific trend analysis MS Academic Search Domain Trend / Social Science
Evaluating Research Excellence H index of an author H index: definition Other statistical measures based on citation counts g index impact factor ACL Anthology Network Wikipedia/H index
Strategische Ziele (I) Grundlagen einer Informatik-fundierten Bildungsforschung und Bildungsinformation am DIPF legen Kompetenzen des DIPF und der TU Darmstadt unter dem Stichwort Bildungsinformatik bündeln Inhaltliche Schnittstellen stärken und Vorarbeiten für ein Verbundprojekt schaffen 10
Strategische Ziele (II) Teil einer Gesamtstrategie zur Etablierung der Zusammenarbeit zwischen dem DIPF und der TU Darmstadt (in Koop. mit dem FiF) Ergänzend zum LOEWE-Schwerpunkt Digital Humanities (Informatik + Geisteswissenschaften) zum DFG GK-Antrag Interaktive Informationsaufbereitung zur Unterstützung der Wissensarbeit (Sprachtechnologie + Computerlinguistik + Wissensverarbeitung) 11
Zielgruppe Bildungsforscher, die bei ihrer Forschungsarbeit durch intelligente Methoden unterstützt werden. 12
Themenkomplexe Semantische Anreicherung der wissenschaftlichen Literatur, z.b. Text-Mining, Textklassifikation, etc. Neuartige Informationsextraktionsanwendungen Automatische Kategorisierung und Clusterung der Publikationen Neue Methoden der Verlinkung wiss. Publikationen Semantische Anreicherung via Crowdsourcing Bewertung von Forschungstrends, Impact, Forschungsreputation Methoden und Modelle zur Messung der Qualität und des Impact von Publikationen, Autoren und Forschungsgruppen Methoden zur Erkennung von Trends in Forschung Methoden zur Analyse der interdisziplinären Verbindungen 13
Ein Beispielszenario Forscher Max Mustermann interessiert sich für eine Fragestellung, die auf Basis des Datensatzes X beantwortet werden kann Zu Datensatz X wurden ca. 1000 wissenschaftliche Publikationen veröffentlicht Das System sucht im Web nach relevanten Publikationen zum Datensatz X, strukturiert die gefundenen Ergebnisse nach Forschungsfragen, Variablen, Methoden, personalisiert die Ergebnisse und zeigt mittels Visualisierung z.b. die noch bestehenden Forschungslücken auf 14
Ende Finito Einde - Fin End 15