Text Mining - Wissensrohstoff Text
|
|
- Michaela Fuhrmann
- vor 8 Jahren
- Abrufe
Transkript
1 Text Mining - Wissensrohstoff Text Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik
2 Grundlagen und Begriff 2
3 Informatik und ihre Anwendungen Wissenschaftliches Rechnen 70er 80er Datenbanken, Digitalisierung von Geschäftsprozessen (Wirtschaftsinformatik) Digitalisierung von elektrotechnischen Anwendungen, Beginn der Textverarbeitung, SGML 90er seit 2000 Digitalisierung von analogen Medien, Vernetzung von verteilten Ressourcen: http, HTML, XML Internet basierte Dienste, Wissensmanagement 3
4 Digitalisierungsprojekte Bochum, 4. Februar
5 Das große Aber der Digitalisierung What do you do with a million books? (Gregory Crane, DL Magazine 2006) Wer soll das alles lesen? Wie können die Inhalte genutzt werden? Wie können die Ergebnisse ins Netz zurückfliessen? Bochum, 4. Februar
6 Definition Process of deriving high-quality information from text (Feldman & Sanger 2006) Text mining [is] "distant reading" i.e. opposed to "close reading (ttasovac on twitter, Jul. 5th 2010) Im weiteren Sinne: Technologie für die automatische Strukturierung und Transformierung von (meist sehr großen) Textkollektionen Bochum, 4. Februar
7 Text Mining (Begriff): Inhaltlich orientierter Zugriff auf unstrukturierte Daten Zugriffsergebnis bekannt Zugriffsergebnis nicht bekannt Strukturierte Daten Unstrukturierte Daten Datenabfrage Datenbank-Systeme Inhaltsabfrage Dokumentenmanagement-Systeme Datenanfrage Suchmaschinen, Data Mining Inhaltsanfrage Text Mining Werkzeuge 7
8 Text Mining Voraussetzung: Text ist digitaler Wissensrohstoff Wissensbasierte/ Regelbasierte Ansätze problematisch zu große Menge an Textdaten flexible Strukturen erforderlich Zeit, Geld und Repräsentationsformalismen beschränken die Codierung von Wissen Text Mining Forschungsbereich zwischen Information Retrieval und linguistischer Informatik 8
9 Text als Grundlage der Wissensverarbeitung Einige Arbeitshypothesen Wissen wird hauptsächlich durch (digitalen) Text vermittelt (Wissensgesellschaft) digitaler Text dient als Codierung von Wissen digitaler Text ist in sehr grossen Mengen verfügbar Text kann als digitaler Wissensrohstoff wiederverwendet werden (vgl. translation memories) semantische Relationen können unter Verwendung vorhandener Ressourcen (z.b. Lexika, Mark-ups u.a. Wissensquellen) automatisch extrahiert werden 9
10 Aufgaben des Text-Mining Erweitertes Text-Retrieval Finden von Definitionen, Erläuterungen, Referenzen, Zitaten ggf. mehrsprachig Unterstützung der explorativen Suche Inhaltsanalyse Extrahieren von Eigennamen und Fachterminologie Finden von fachspezifischen Schlüsselbegriffen Entdecken latenter semantischer Gemeinsamkeiten Berechnung semantischer Relationen zwischen Entitäten Clustern und Klassifizieren von Termen, Entitäten und Dokumenten Entdecken von interessanten Konzepten und Trends 10
11 Anwendungsbereiche des Text-Mining Konzeptbasierte Suche bzw. Finden ähnlicher Texte (Dokumente, Definitionen, Produktbeschreibungen...) WWW, Intranet, Portale Dokumenten-Management-Systeme, e/i/m-commerce Call Center, CRM Netzoptimierung und -verwaltung (Communities) Plagiatserkennung, Zitationsspuren, Text Reuse Dokumentenklassifikation und Clustering Archivierung und Suche Workflow-Optimierung ( s, Geschäftsvorfälle,...) Informationsstrukturierung und extraktion Aufbau von Ontologien Wissensakquisition Opinion Mining und Sentiment Analysis Trend und Topic Detection 11
12 Beispiele 12
13 Text Classification elektra.digicol.de
14 Text Classification: Use assign new stories to person in charge personal profile distribute to responsible person find scientific articles belonging to a topic find patents for a specific problem class
15 Similarity Search
16 Similarity Search Back links: find follow-up work Reconstruct discourse Measure impact Search by co-citation, context of reference Search contributions by author, etc.
17 Text Clustering Cluster search results Extract cluster labels Hierachical clusters
18 Text Clustering: Grafical Representation Cluster web sites Arrange by similarity
19 Taxonomies Hierachical organization of concepts Domains: patents, computer science, medical science Tasks Assignment of phrases to taxonomy concepts Automatic generation of taxonomies
20 Question Answering
21 Information Extraction Identify Names Locations Institutions Points in time, dates Amounts of money
22 Product Recommendations
23 Verfahren und ihre Voraussetzungen 23
24 Verfahren Stringbasierte Verfahren Editierdistanz und Alignment für N-Gramme (Buchstaben, Wortformen, Phrasen) Text Reuse und Zitationsgraphen Musterbasierte Verfahren Patterns, bootstrapping NER, Informations- und Relationsextraktion Inhaltsanalysen Topic Modelle und latent semantic analysis Machine learning (clustering, classification) Kookkurrenzbasiertes Text Mining Graphbasierte Verfahren Hybride Verfahren Anwendungsspezifische Kombinationen aus o.g. Verfahren 24
25 Voraussetzung Datenaufbereitung 1. Preprocessing: Säubern, LangID, Verweise, Filter: Zerlegung, Markup, Metadaten, Analysis of text Dokumente 3. Verarbeitung: - Indexierung - Muster basierte Verfahren - statistische Verfahren Ergebnisdatenbanken Vorstellungsvortrag GESIS dummy
26 Texte und Textparameter Text hat Struktur Wörter und ihre Reihenfolge nicht zufällig Satzfolge nicht zufällig Text hat Autor(en) Text hat Adressat(en) Text hat Entstehungskontext Text entsteht in einem Medium Entstehungskontext hat Zeit- und Raumkoordinaten Bezug zu Konzept der Fachsprachen und Sprachregister Rekonstruktion einzelner Textparameter interessante Fragestellung fürs Text Mining Modul Linguistische Informatik 26
27 Textstruktur und Termhierarchie: Algorithmen in C++ (Sedgwick) Inhalt Algorithmen in c++ Grundlagen... Sortieren Suchen Elementare Sortierverfahren Quicksort Grundalgorithmus Leistungsmerkmale ACM Hierarchy ACM CCS Theory of Computation Analysis of Algorithms and Problem Complexity Nonnumerical Algorithms and Problems Sorting and Searching Quicksort Pivot element
28 Textparameter finden ihren Niederschlag in Textmerkmalen N-Gram Frequenzen und Signifikanzen Kookkurrenzen getypte N-Gramme und Kookkurrenzen relative Häufigkeiten von (getypten) N-Grammen und Kookkurrenzen (z. B. relativer Anteil von Stopwörtern, Nomina oder Mehrworttermen) Ähnlichkeiten von N-Gramme und Kookkurrenzen (z. B. Editierdistanzen, Dice, ) Muster von (getypten) N-Gramme mit oder ohne Wildcards Veränderungen von Textmerkmalen über die Zeit Modul Linguistische Informatik 28
29 Patterns nach Winograd Patterns 1. einfache oder literal patterns 2. open patterns (Nutzung von Wildcards) 3. variable patterns (Nutzung von Variablen u. Lexika) 4. Satzstruktur Patterns - semantisch - syntaktisch (LFG) Vergleiche Ausdrücke (gemäß eines Ähnlichkeitsmaßes) und matche (abgleichen) in Bezug auf Constraints Modul Linguistische Informatik 29
30 Weitere Textmerkmale In der Literatur finden sich zahlreiche Beschreibungsparameter für Texte, die Einfluss auf die zu verarbeitenden Features haben, z.b. Entropy, Concentration, Dispersion, Repetition, Predictability, Grammaticality, Sentence Length, Spelling Accuracy u.v.m. (vgl. Testilova 1992, Semino & Short 2004, Jockers et. al. 2011, Schierle 2011) Modul Linguistische Informatik 30
31 Beispiel für Textmerkmale [Schierle 2011, S. 35] Modul Linguistische Informatik 31
32 Textmerkmale sind zentral fürs maschinelle Lernen im Text Mining Modul Linguistische Informatik 32
33 Abschließendes Beispiel Einfluss von Textmerkmalen auf die Qualität einer Sachgebietsklassifikation Naiver Bayes scher Klassifikator mit Unigrammen auf Filmempfehlungen: ~ 70% ['the', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog'] Selbe Anwendungsdomäne, aber mit den top most informative features: ~ 93% Modul Linguistische Informatik 33
34 Literatur Heyer, G., Quasthoff, U., Wittig, Th., Text Mining Wissensrohstoff Text, W3L Verlag: Bochum 2006 Manning, C., Schütze, H., Foundations of Statistical Language Processing, MIT Press: Cambridge (Mass.) 1999 Witten, I., Frank, E., Data Mining: Practical Machine Learning Tools and Techniques with JAVA Implementations, Morgan Kaufman: San Francisco
Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de
Text Mining Wissensrohstoff Text Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Grundlagen und Begriff 2 Informatik und ihre Anwendungen 1940-1960 Wissenschaftliches
MehrText Mining Wissensrohstoff Text
Text Mining Wissensrohstoff Text Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Text Mining 2 Text als Grundlage der Wissensverarbeitung Einige Arbeitshypothesen
MehrText-Mining: Einführung
Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:
MehrEXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN
EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,
MehrVO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft
, Informations- und Wissensmanagement Zentrum für Translationswissenschaft Grundlagen und Definitionen Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache.
MehrSemantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph!
Semantic Web Technologies I! Lehrveranstaltung im WS10/11! Dr. Andreas Harth! Dr. Sebastian Rudolph! www.semantic-web-grundlagen.de Ontology Engineering! Dr. Sebastian Rudolph! Semantic Web Architecture
MehrVorlesung Text und Data Mining S9 Text Clustering. Hans Hermann Weber Univ. Erlangen, Informatik
Vorlesung Text und Data Mining S9 Text Clustering Hans Hermann Weber Univ. Erlangen, Informatik Document Clustering Überblick 1 Es gibt (sehr viele) verschiedene Verfahren für das Bilden von Gruppen Bei
MehrSemantische Infomationsintegration à la carte?
Semantische Infomationsintegration à la carte? Ziele und Herausforderungen der Anwendung des CIDOC CRM. Historisch-Kulturwiss. Informationsverarbeitung, Universität Köln 1. Oktober 2010 1 Ein User Scenario
MehrWeb Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion
Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische
MehrSemantic Web Technologies I
Semantic Web Technologies I Lehrveranstaltung im WS11/12 Dr. Elena Simperl PD Dr. Sebastian Rudolph M. Sc. Anees ul Mehdi Ontology Engineering Dr. Elena Simperl XML und URIs Einführung in RDF RDF Schema
MehrThema. Intelligente Agenten im Web
Thema Intelligente Agenten im Web Einführendes Beispiel Suchmaschine Probleme: - Immer mehr falsche Informationen - Anwender werden überfordert - Zeitaufwand erhöht sich - Zunehmendes Sicherheitsrisiko
MehrSemestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.
Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....
MehrText Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818
Text Mining Praktikum Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Rahmenbedingungen Gruppen von 2- (max)4 Personen Jede Gruppe erhält eine Aufgabe Die
MehrANALYSIEREN VON SOCIAL MEDIA AKTIVITÄTEN
ANALYSIEREN VON SOCIAL MEDIA AKTIVITÄTEN PROFI-Webcast 10.03.2015 Dr. Michael Kosmowski Software-Architekt Tel.: 0721 46 46 46 64 44 E-Mail: m.kosmowski@profi-ag.de AGENDA Was passiert bei unseren Kunden?
MehrWelche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale?
Text Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale? Textklassifikationen Natürliche bzw. unstrukturierte Texte Normale Texte ohne besondere Merkmale und Struktur Semistrukturierte
MehrTextmining Klassifikation von Texten Teil 1: Naive Bayes
Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive
MehrDie Entwicklung eines Glossars (oder eines kontrollierten Vokabulars) für ein Unternehmen geht üblicherweise in 3 Schritten vor sich:
Glossare 1 Inhalt 1 Inhalt... 1 2 Prozesse... 1 3 Eine kleine Zeittabelle...... 1 4 Die ersten Schritte... 2 5 Die nächsten Schritte...... 2 6 Die letzten Schritte... 3 7 Das Tool...... 4 8 Beispiele...
MehrOntologien und Ontologiesprachen
Ontologien und Ontologiesprachen Semantische Datenintegration SoSe2005 Uni Bremen Yu Zhao Gliederung 1. Was ist Ontologie 2. Anwendungsgebiete 3. Ontologiesprachen 4. Entwicklung von Ontologien 5. Zusammenfassung
MehrBegriff 1 Begriff 2 Datenbank 1
Literaturrecherche Eine sorgfältige Literaturrecherche ist der erste fundamentale Schritt zur Anfertigung einer wissenschaftlichen Arbeit. Die Recherche sollte systematisch, genau, verständlich und nachvollziehbar
MehrSentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser
Sentiment Analysis (SA) Robert Bärhold & Mario Sänger Text Analytics WS 2012/13 Prof. Leser Gliederung Einleitung Problemstellungen Ansätze & Herangehensweisen Anwendungsbeispiele Zusammenfassung 2 Gliederung
MehrInnovationsbeobachtung!
! Innovationsbeobachtung! Dr. Feiyu Xu Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI)! Das ständige Radar Ein proaktiv handelndes Unternehmen identifiziert Chancen und Gefahren durch künftige
MehrÖkonomik der Agrar und Ernährungswirtschaft in ILIAS
ILIAS Open Source elearning Die ersten Schritte in ILIAS & Der Zugriff auf das Modul Ökonomik der Agrar und Ernährungswirtschaft in ILIAS Gliederung Login Einführung Was versteht man unter ILIAS? Hauptansichten
Mehrjuergen.vogt@uni-ulm.de
Benutzerregistrierung für SciFinder on WWW Mitglieder, auch Studenten, der Universität Ulm können SciFinder Scholar für nicht-kommerzielle Zwecke nutzen. Allerdings ist der Zugang personalisiert. Damit
MehrRedaktionelles Arbeiten auf Basis von Big-Data Methoden aus der Rundfunk/Fernseh-Perspektive
Redaktionelles Arbeiten auf Basis von Big-Data Methoden aus der Rundfunk/Fernseh-Perspektive Institut für Rundfunktechnik, 17. Februar 2014 Norbert Pillmayer, BU-Leiter Software Solutions, NorCom Information
Mehr... MathML XHTML RDF
RDF in wissenschaftlichen Bibliotheken (LQI KUXQJLQ;0/ Die extensible Markup Language [XML] ist eine Metasprache für die Definition von Markup Sprachen. Sie unterscheidet sich durch ihre Fähigkeit, Markup
MehrDaten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1
Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 2.800.000.000.000.000.000.000 Bytes Daten im Jahr 2012* * Wenn jedes Byte einem Buchstaben entspricht und wir 1000 Buchstaben auf
MehrSemantische Wikis Mag. Bernhard Krabina E-Government-Fachtagung 18. April 2008, Donau-Uni Krems
Zentrum für Verwaltungsforschung Managementberatungs- und WeiterbildungsGmbH Semantische Wikis Mag. Bernhard Krabina E-Government-Fachtagung 18. April 2008, Donau-Uni Krems Überblick Vorstellung KDZ Wikis
MehrSeminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006
Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet
MehrFRAGEBOGEN ANWENDUNG DES ECOPROWINE SELBSTBEWERTUNG-TOOLS
Dieser Fragebogen bildet eine wichtige Rückmeldung der Pilotweingüter über Verständnis, Akzeptanz und Effektivität des ECOPROWINE Selbstbewertung-tools für alle daran Beteiligten. Dieser Fragebogen besteht
MehrAmt für Natur und Umwelt Uffizi per la natira e l ambient Ufficio per la natura e l ambiente
Amt für Natur und Umwelt Uffizi per la natira e l ambient Ufficio per la natura e l ambiente Gürtelstrasse 89, 7001 Chur/Coira Telefon: 081 257 29 46 / Telefax 081 257 21 54 E-Mail: info@anu.gr.ch Internet:
MehrMathematisch-algorithmische Grundlagen für Big Data
Mathematisch-algorithmische Grundlagen für Big Data Numerische Algorithmen für Datenanalyse und Optimierung Prof. Dr. Peter Becker Fachbereich Informatik Hochschule Bonn-Rhein-Sieg Sommersemester 2016
Mehr!!!!T!!! Systems!() Multimedia Solutions
Inhalt. Was ist das semantische Web? Wie findet man einen Arzttermin mit Hilfe des semantischen Web? Wie gibt man Inhalten einen Sinn? Welche Werkzeuge stehen zur Verfügung? Wo können strukturierte Inhalte
MehrVektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig
Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model
MehrKurze Einführung in Web Data Mining
Kurze Einführung in Web Data Mining Yeong Su Lee Centrum für Informations- und Sprachverarbeitung (CIS), LMU 17.10.2007 Kurze Einführung in Web Data Mining 1 Überblick Was ist Web? Kurze Geschichte von
MehrSeminar Textmining SS 2015 Grundlagen des Maschinellen Lernens
Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 17.04.2015 Entscheidungsprobleme beim Textmining
MehrSeminar Datenbanksysteme
Seminar Datenbanksysteme Recommender System mit Text Analysis für verbesserte Geo Discovery Eine Präsentation von Fabian Senn Inhaltsverzeichnis Geodaten Geometadaten Geo Discovery Recommendation System
MehrMit dem Tool Stundenverwaltung von Hanno Kniebel erhalten Sie die Möglichkeit zur effizienten Verwaltung von Montagezeiten Ihrer Mitarbeiter.
Stundenverwaltung Mit dem Tool Stundenverwaltung von Hanno Kniebel erhalten Sie die Möglichkeit zur effizienten Verwaltung von Montagezeiten Ihrer Mitarbeiter. Dieses Programm zeichnet sich aus durch einfachste
MehrEinführung in die Informatik
Einführung in die Informatik Einleitung Organisatorisches, Motivation, Herangehensweise Wolfram Burgard 1.1 Vorlesung Zeit und Ort: Dienstags 10:00-12:00 Uhr Donnerstags 10:00-12:00 Uhr Gebäude 101 HS
MehrBig Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! 25.02.2016 Sascha Bäcker Dr.
Big Data im Call Center: Kundenbindung verbessern, Antwortzeiten verkürzen, Kosten reduzieren! 25.02.2016 Sascha Bäcker Dr. Florian Johannsen AGENDA 1. Big Data Projekt der freenet Group Dr. Florian Johannsen
MehrAPTs: Sind gezielte Angriffe normal? Jürgen Eckel Eckel.J@ikarus.at Helene Hochrieser Hochrieser.H@ikarus.at
APTs: Sind gezielte Angriffe normal? Jürgen Eckel Eckel.J@ikarus.at Helene Hochrieser Hochrieser.H@ikarus.at Welche Anomalien können gefunden werden? Wie lässt sich anormales Verhalten extrahieren? Zeithorizont
MehrMaschinelle Übersetzung
Hauptstudiumsprojekt SoSe 07 Maschinelle Übersetzung Walther v. Hahn, Cristina Vertan {vhahn,vertan}@informatik.uni-hamburg.de Wozu dient ein Projekt? Projekte im Umfang von 6 SWS dienen der Bearbeitung
MehrOnline-Publishing mit HTML und CSS für Einsteigerinnen
mit HTML und CSS für Einsteigerinnen Dipl.-Math. Eva Dyllong Universität Duisburg Dipl.-Math. Maria Oelinger spirito GmbH IF MYT 07-2002 Grundlagen Frau erfahrt, wie das Internet aufgebaut ist, aus welchen
MehrLehrpläne NRW Sek.stufe 2. Lernen im Kontext
Lehrpläne NRW Sek.stufe 2 Lernen im Kontext Fachliche Inhalte Lernziele Informatik NRW Fähigkeit, komplexe Zusammenhänge mit gedanklicher Schärfe zu durchdringen (Problemanalyse) Überblick über unterschiedliche
MehrInformationsextraktion
Informationsextraktion Bestimmte Anwendungen bei der semantischen Verarbeitung erfordern keine tiefe linguistische Analyse mit exakter Disambiguierung (= eine einzige und korrekte Lesart). Hierzu gehört
MehrBegleitgruppensitzung A1.12. 26. September 2013 PEAX Der Zugang zur vernetzten Welt
Begleitgruppensitzung A1.12 26. September 2013 PEAX Der Zugang zur vernetzten Welt Agenda Inhalt, Ablauf Ausgangslage Zielsetzung / Vision Digitale Identität als Grundlage für die elektronische Adressänderung
MehrXDOC Extraktion, Repräsentation und Auswertung von Informationen
XDOC Extraktion, Repräsentation und Auswertung von Informationen Manuela Kunze Otto-von-Guericke Universität Magdeburg Fakultät für Informatik Institut für Wissens- und Sprachverarbeitung Gliederung Ausgangspunkt
MehrBig Data vs. Smart Data Was der Mittelstand von Internet-Unternehmen lernen kann Mittelstand-Digital
Big Data vs. Smart Data Was der Mittelstand von Internet-Unternehmen lernen kann Mittelstand-Digital n³ matthias.nagel@nhochdrei.de Hannover, CeBIT 2015 Unsre Welt wird digital. Auswirkungen: Markt und
MehrEinführung. Information Retrieval. IR-Aufgaben. IR in Beispielen. Adhoc-Suche: Web. IR in Beispielen. Was ist IR? Norbert Fuhr
Einführung Information Retrieval Norbert Fuhr 13. Oktober 2011 IR in Beispielen Was ist IR? Daten Information Wissen Dimensionen des IR Rahmenarchitektur für IR-Systeme Adhoc-Suche: Web IR in Beispielen
MehrTHE KNOWLEDGE PEOPLE. CompanyFlyer.indd 1 07.03.2016 11:48:05
THE KNOWLEDGE PEOPLE CompanyFlyer.indd 1 07.03.2016 11:48:05 BE SMART IT-CONSULTING Smartes IT-Consulting für die Zukunft: Agilität, Dynamische IT, Komplexitätsreduzierung, Cloud, Industrie 4.0, Big Data
MehrOrganisation des Qualitätsmanagements
Organisation des Qualitätsmanagements Eine zentrale Frage für die einzelnen Funktionen ist die Organisation dieses Bereiches. Gerade bei größeren Organisationen Für seine Studie mit dem Titel Strukturen
MehrWebseiten sind keine Gemälde. Webstandards für ein besseres Web. Webstandards für ein besseres Web
Webseiten sind keine Gemälde Webkrauts Die Initiative für die Webkrauts ging von einem Blogeintrag im August 2005 aus. Nach dem Aufruf fanden sich innerhalb von etwa drei Tagen über 60 Interessierte zusammen.
MehrUpToNet xrm und Mobiles Büro Kommunikation intelligent steuern
UpToNet xrm und Mobiles Büro Kommunikation intelligent steuern UpToNet xrm - Die neue Dimension des Beziehungsmanagements UpToNet xrm Hier kommt nicht nur der Kunde an erster Stelle Unter allen Informationen
MehrBusiness Intelligence & Machine Learning
AUSFÜLLHILFE: BEWEGEN SIE DEN MAUSZEIGER ÜBER DIE ÜBERSCHRIFTEN. AUSFÜHRLICHE HINWEISE: LEITFADEN MODULBESCHREIBUNG Business Intelligence & Machine Learning Kennnummer Workload Credits/LP Studiensemester
MehrSemantic Web Services
Semantic Web Services Daniel Fischer TU Chemnitz - WS 2011/12 1 Gliederung (1) Web Services (2) Semantic Web Services: Motivation (3) Ontologien (4) Technologien 1. WSDL 2. SA-WSDL 3. WSMF / WSMO 4. OWL-S
MehrPredictive Modeling Markup Language. Thomas Morandell
Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML
MehrMobile Computing Fallstudie am Beispiel der sd&m AG Vortrag im Seminar Beratungsbetriebslehre am 26. Juni 2003
Mobile Computing Fallstudie am Beispiel der sd&m AG Vortrag im Seminar Beratungsbetriebslehre am 26. Juni 2003 S. Plogmann, O. Pietsch Seminar Beratungsbetriebslehre 26. Juni 2003 Seite 1 Inhalt Inhaltsverzeichnis
MehrBetter Backlinking Semantische Kategorisierung von Websites
Better Backlinking Semantische Kategorisierung von Websites Stephan Sommer-Schulz info@nerdbynature.net Inhaltsübersicht 1. Ziel: Kategorisierung 2. Backlinks 3. Kategorien - Auswahl 4. Semantische Verfahren
MehrInformationsflut bewältigen - Textmining in der Praxis
Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland
MehrErgebnisse des Workshops. IKT und Medien 2017. vom 25.06.2007 beim Forschungszentrum Informatik in Karlsruhe
Ergebnisse des Workshops IKT und Medien 2017 vom 25.06.2007 beim Forschungszentrum Informatik in Karlsruhe Die nachfolgenden Folien basieren auf den aufbereiteten Ergebnissen des moderierten Brainstormings
MehrHerzlich willkommen im Modul Informatik Grundlagen
Herbstsemester 2010/2011 Herzlich willkommen im Modul Informatik Grundlagen Wirtschaftsingenieurwesen: 1. Semester Dozent: Martin Hüsler Fachhochschule Nordwestschweiz FHNW / Martin Hüsler 1 Ablauf: 1.
MehrReasoner for the Semantic Web
Reasoner for the Semantic Web KAON & KAON2 Seminar A.I. Tools Erik Endres 18.1.2007 Übersicht Reasoner KAON1 KAON2 & Protégé Reasoner Ontologien machen Daten für Maschinen verarbeitbar. Reasoner setzen
MehrHP IT-Symposium 2006. www.decus.de 1
www.decus.de 1 Ralf Durben Principal Sales Consultant Oracle Deutschland GmbH Diagnostic und Tuning in Oracle Datenbanken www.decus.de 2 Zentrale Verwaltung HTTP/S HTTP/S HTML Konsole Überall nutzbar NET
MehrDie Anwendung von Work of Leaders in drei Schritten
BENUTZERHANDBUCH everything disg Work of Leaders Die Anwendung von Work of Leaders in drei Schritten Schritt 1: Vorab-Selbsteinschätzung Um für einen Teilnehmer ein Profil von Everything DiSG Work of Leaders
MehrLinked Samian Ware: Potentiale von Linked Data in der Archäologie. Florian Thiery M.Sc.
Linked Samian Ware: Potentiale von Linked Data in der Archäologie Florian Thiery M.Sc. Linked Samian Ware: Potentiale von Linked Data in der Archäologie Workshop der AG CAA Tübingen 15.02.2014 Als Grundlage
MehrXML und Datenbanken. Wintersemester 2003/2004. Vorlesung: Dienstag, 13:15-15:00 Uhr IFW A36. Übung: Dienstag, 15:15-16:00 Uhr IFW A36
XML und Datenbanken Wintersemester 2003/2004 Vorlesung: Dienstag, 13:15-15:00 Uhr IFW A36 Übung: Dienstag, 15:15-16:00 Uhr IFW A36 Dozenten: Dr. Can Türker IFW C47.2 Email: WWW: tuerker@inf.ethz.ch http://www.dbs.ethz.ch/~xml
MehrWerkzeuge für ein innovatives Wissensmanagement. W3L AG info@w3l.de
1 Werkzeuge für ein innovatives Wissensmanagement W3L AG info@w3l.de 2013 2 Informationen und Wissen John Naisbitt (15.01.1929 - ) Wir ertrinken in Informationen, aber wir hungern nach Wissen... 3 Wo und
MehrInhalt. Fragestellungen. ...we make the invisible visible... Analysen und deren Anwendung Erfahrungen
...we make the invisible visible... 1 Inhalt Fragestellungen Analysen und deren Anwendung Erfahrungen 2 Projektleiter Hat unsere Software eine klare, verständliche Struktur? Gibt es problematischen Code,
MehrEinführung in das Web Content Management System (CMS) Typo3
Einführung in das Web Content Management System (CMS) Typo3 Übung im Rahmen der Vorlesung ARIS (IW13vz/tzC) Chur, den 29.10.2014 Agenda Einführung und theoretische Grundlagen zu CMS Demonstration der Grundfunktionen
MehrText Mining mit LingPipe
Text Mining mit LingPipe Hauptseminar Information Retrieval PD Dr. Karin Haenelt Universität Heidelberg Vortrag von Alexander Kappe im Wintersemester 2008/2009 Übersicht Text Mining Definition & Abgrenzung
MehrWebservices an der BBAW
Webservices an der BBAW Stefan Dumont, Martin Fechner, Bryan Jurish, Marco Jürgens, Kai Zimmer 1. Berliner DH-Rundgang 1. September 2014 Webservices Webservices sind Programme, die für die Kommunikation
MehrVon Tags zu Semantischen Netzen
Von Tags zu Semantischen Netzen Einsatz im Resourcen-basierten Lernen httc Hessian Telemedia Technology Competence-Center e.v - www.httc.de Dipl.-Inf. Renato Domínguez García Doreen Böhnstedt, M. Sc. Dipl.-Inf.
MehrAGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom 21.10.2013b
AGROPLUS Buchhaltung Daten-Server und Sicherheitskopie Version vom 21.10.2013b 3a) Der Daten-Server Modus und der Tresor Der Daten-Server ist eine Betriebsart welche dem Nutzer eine grosse Flexibilität
MehrAnhang. 3. Was denken Sie: An wen richtet sich das Lernprogramm für Psycholinguistik? zu nicht nicht zu
Anhang Bitte füllen Sie den Fragebogen vollständig, ehrlich und genau aus! Es gibt keine falschen Antworten! Ihre Angaben sind anonym und werden absolut vertraulich behandelt. Sie werden nur zu Forschungs-
MehrIn 9 Schritten zum passenden Monitoring Tool. Die Universal-Checkliste für B2B-Unternehmen
In 9 Schritten zum passenden Monitoring Tool Die Universal-Checkliste für B2B-Unternehmen Schritt 1: Zielsetzung Welchen Zweck muss ein Monitoring Tool für Ihr Unternehmen erfüllen? Umfassende Themen-
MehrVDW Statistik Portal Häufig gestellte Fragen. Version 1.2 ( 2011-2013 Katharina Düngfelder & Markus A. Litters) Vorwort
Version 1.2 ( 2011-2013 Katharina Düngfelder & Markus A. Litters) Vorwort Sollten Sie mit dieser Anleitung oder dem irgendwelche Probleme oder Fragen haben, wenden Sie sich bitte an folgende Personen:
MehrPPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.
PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt
MehrSocial Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG
Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG DB Fernverkehr AG Dr.-Ing. Axel Schulz, Dr. Matthias Platho P.FMB 2, DB Fernverkehr AG Frankfurt, 22.05.2015 Motivation An meinem
MehrFuzzy Logik und Genetische Algorithmen für adaptive Prozesskontrolle
Fuzzy Logik und Genetische Algorithmen für adaptive Prozesskontrolle Umgang mit unsicherem Wissen VAK 03-711.08 Oliver Ahlbrecht 8. Dezember 2005 Struktur 1. Einleitung 2. Beispiel Cart-Pole 3. Warum Hybride
Mehr20.01.2015 Fabian Grimme und Tino Krüger 1 INDREX. Evaluierung von H2O. Enterprise Data Management Beuth Hochschule für Technik
20.01.2015 Fabian Grimme und Tino Krüger 1 INDREX Evaluierung von H2O Enterprise Data Management Beuth Hochschule für Technik 20.01.2015 Fabian Grimme und Tino Krüger 2 INDREX im Überblick In-Database
MehrMULTICHANNEL IN SOZIALEN NETZWERKEN
MULTICHANNEL IN SOZIALEN NETZWERKEN Sogenannte Web 2.0 Services haben in den vergangenen Jahren zunehmend an Benutzern gewonnen, die sich von den Arten der Kommunikation im alten Web in Foren, Chats, Communities
MehrRessourcen-Beschreibung im Semantic Web
Ressourcen-Beschreibung im Semantic Web Cristina Vertan Inhaltsübersicht Wie sollen die Ressourcen für Semantic Web annotiert werden? Was ist und wie funktioniert RDF? Wie kodiert man RDF-Statements in
MehrRauchen und Aussiedler: mitgebrachte Risiken oder Anpassung an die deutsche Allgemeinbevölkerung?
Rauchen und Aussiedler: mitgebrachte Risiken oder Anpassung an die deutsche Allgemeinbevölkerung? Katharina Reiss, Jacob Spallek, Doris Bardehle, Oliver Razum Abteilung Epidemiologie & International Public
MehrSchulung FRBR Functional Requirements for Bibliographic Records. Modul E: Der FRBRisierte Katalog oder Was bringt uns FRBR?
Arbeitsstelle für Standardisierung (AfS) 1. Oktober 2010 Schulung FRBR Functional Requirements for Bibliographic Records Modul E: Der FRBRisierte Katalog oder Was bringt uns FRBR? Lernziele Nach Bearbeitung
MehrWeb Mining und Farming
Web Mining und Farming Shenwei Song Gliederung Übersicht über Web Mining und Farming Web Mining Klassifikation des Web Mining Wissensbasierte Wrapper-Induktion Web Farming Übersicht über Web-Farming-Systeme
MehrAngewandte Informatik
Informatik Angewandte Informatik Theorie und Praxis im Gleichklang Das Studium der Angewandten Informatik ist im Gegensatz zu zum Beispiel Geo-Informatik oder Wirtschafts-Informatik keine Bindestrich-Informatik,
MehrStudenten- und Absolventensuche direkt an der Hochschule. Stellenwerk Preisliste 2016
Studenten- und Absolventensuche direkt an der Hochschule Stellenwerk Preisliste 2016 Stand 10 / 2015 Mit einem Klick am Campus Ihr Jobangebot auf www.stellenwerk.de Studenten- und Absolventensuche direkt
MehrFrauenforschung in der Informatik: Die Situation in Österreich
Frauenforschung in der Informatik: Die Situation in Österreich Andrea Birbaumer & Hilda Tellioğlu Technische Universität Wien Inhalt Stand der Frauenforschung in der Informatik in Österreich Möglichkeiten
MehrMessung und Aufwandsschätzung bei der Entwicklung von Web Applikationen. Frederik Kramer // Folie 1 von 14
Messung und Aufwandsschätzung bei der Entwicklung von Web Applikationen Frederik Kramer // Folie 1 von 14 Warum das ganze? Entwicklungskosten spielen eine immer wichtigere Rolle Messmethoden erlauben diese
MehrSoziale Netzwerke: Chance zur Verbesserung der Kommunikation mit den Bürgern
Soziale Netzwerke: Chance zur Verbesserung der Kommunikation mit den Bürgern Dr. André Schulz SAS Deutschland Göttingen, 6. September 2012 SAS Institute Ein Unternehmen der Zahlen SAS is the first company
MehrAnlage 1 B zur Spezifikation Anbieterwechsel Teil 1, Abläufe bei der Vorabstimmung
Anlage 1 B zur Spezifikation Anbieterwechsel Teil 1, Abläufe bei der Vorabstimmung Version: 1.0.0 Status: abgestimmt Editoren: Jürgen Dohle, Telekom Deutschland Tel: +49 228 181-45638 E-Mail: juergen.dohle@telekom.de
MehrQualitätssicherung bei der mobilen Datenerfassung
Qualitätssicherung bei der mobilen Datenerfassung Stephan Mäs Arbeitsgemeinschaft GIS Universität der Bundeswehr München http://www.unibw.de/bauv11/geoinformatik/agis 9. Seminar GIS & Internet 13.-15.
MehrZwischenablage (Bilder, Texte,...)
Zwischenablage was ist das? Informationen über. die Bedeutung der Windows-Zwischenablage Kopieren und Einfügen mit der Zwischenablage Vermeiden von Fehlern beim Arbeiten mit der Zwischenablage Bei diesen
Mehr5.3.1.6 Laborübung - Task Manager (Verwalten von Prozessen) in Windows Vista
5.0 5.3.1.6 Laborübung - Task Manager (Verwalten von Prozessen) in Windows Vista Einführung Drucken Sie diese Übung aus und folgen Sie den Anweisungen. In dieser Übung werden Sie sich den Task Manager
MehrComputergraphik & Digitale Bildverarbeitung
Übergangsbestimmungen für das Masterstudium Computergraphik & Digitale an der Technischen Universität Wien von der Studienkommission Informatik beschlossen am 20.9.2006 (1) Sofern nicht anderes angegeben
MehrMultimedia und Datenkommunikation
Multimedia und Datenkommunikation Einteilung in Unterpunkte Netzwerk Audioausgabe Internetzugang Basis des Projektes Büro 5 Mitarbeiter Datenaustausch via Diskette Kein Netzwerk Ein Nadeldrucker Netzwerke
MehrGrundlagen, Informationen und Hintergründe von Wiki Systemen
Grundlagen, Informationen und Hintergründe von Wiki Systemen Was ist Wiki? Wikis, auch WikiWikis und WikiWebs genannt, sind im World Wide Web verfügbare Seitensammlungen, die von den Benutzern nicht nur
MehrGEONET Anleitung für Web-Autoren
GEONET Anleitung für Web-Autoren Alfred Wassermann Universität Bayreuth Alfred.Wassermann@uni-bayreuth.de 5. Mai 1999 Inhaltsverzeichnis 1 Technische Voraussetzungen 1 2 JAVA-Programme in HTML-Seiten verwenden
MehrWebalizer HOWTO. Stand: 18.06.2012
Webalizer HOWTO Stand: 18.06.2012 Copyright 2003 by manitu. Alle Rechte vorbehalten. Alle verwendeten Bezeichnungen dienen lediglich der Kennzeichnung und können z.t. eingetragene Warenzeichen sein, ohne
MehrSoftwareprojektpraktikum Maschinelle Übersetzung
Softwareprojektpraktikum Maschinelle Übersetzung Jan-Thorsten Peter, Andreas Guta {peter,guta}@i6.informatik.rwth-aachen.de Vorbesprechung 4. Aufgabe 19. Mai 2015 Human Language Technology and Pattern
MehrVisualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten
Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten Arbeitspapier Zusammenfassung In diesem Arbeitspapier wird gezeigt, wie mit Hilfe der Google- Books Ngram Daten
Mehr