Automatisierte Erstellung von Pressedossiers durch Textmining
|
|
- Tomas Sternberg
- vor 6 Jahren
- Abrufe
Transkript
1 Automatisierte Erstellung von Pressedossiers durch Textmining Kontextualierung im journalistischen Umfeld Marcel Schöneberg Hochschule für Angewandte Wissenschaften Hamburg (HAW) Fakultät für Technik und Informatik Department Informatik Masterseminar Präsentation M. Schöneberg Automatisierte Dossiererstellung 1 / 28
2 1 Rückblick Grundprojekt 2 Masterarbeit Überblick Einführung Fragestellungen und Ziele Erste Ideen Related Work Konkrete Schritte Weitere mögliche Schritte Bewertung von Ergebnissen 3 Aktueller Fortschritt: Hauptprojekt 4 Chancen und Risiken 5 Fragen 6 Literatur M. Schöneberg Automatisierte Dossiererstellung Rückblick Grundprojekt 2 / 28
3 Zielsetzung [Sch14] Ursprüngliche Idee: Trenderkennung in Social Media Ziele von Projekt 1: Datenbasis schaffen Vorverarbeitungen durchführen und verstehen (Hierarchisches) Clustering als Experiment Daten kennenlernen These: Ausgewachsene Trends/Themen müssten einen Cluster bilden Untercluster zeigen ggf. kleinere Trends auf Ggf. als Basis für spätere Zeitreihenanalysen nutzen M. Schöneberg Automatisierte Dossiererstellung Rückblick Grundprojekt 3 / 28
4 Erfolge Vorhandene Datenbasis mit über Tweets zum Hashtag-Piraten Zeitraum: Erfahrungen mit Vorverarbeitung (z.b. Normalisierung, Stemming, NLP) Clustering mit verschiedenen Clustermengen und unterschiedlichen Untermengen des Korpus Diverse Stolpersteine kennengelernt M. Schöneberg Automatisierte Dossiererstellung Rückblick Grundprojekt 4 / 28
5 Misserfolge - Begründung für den Fokuswechsel Weitgehend nutzlose Resultate Cluster zumeist eher Sammlung aus unzusammenhängenden Begriffen (ggf. Zufallstreffer ) Auch Nutzung eines auf Nomen basierenden Korpus nicht erfolgversprechend Texte grundlegend zu kurz schlechte Sprache (Abkürzungen usw.) Clustering zu undurchsichtig Trenderkennung ist ein schwammiges Ziel Durchaus möglich 1 aber u.a: komplexe Vorverarbeitung etc. notwendig Keine gute Ausgangsbasis 1 Siehe Fazit von [Sch14] M. Schöneberg Automatisierte Dossiererstellung Rückblick Grundprojekt 5 / 28
6 1 Rückblick Grundprojekt 2 Masterarbeit Überblick Einführung Fragestellungen und Ziele Erste Ideen Related Work Konkrete Schritte Weitere mögliche Schritte Bewertung von Ergebnissen 3 Aktueller Fortschritt: Hauptprojekt 4 Chancen und Risiken 5 Fragen 6 Literatur M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 6 / 28
7 Einführung in die Thematik I Ziel: Erstellung von Dossiers Kontextualisierung eines Artikels Fokus auf textbasierten Dossiers: Keine multimedialen Inhalte usw. Dossiers: Verschiedene (Experten-) Definitionen vorhanden [Hä14] Arbeitsthese: Zusammenstellung von ähnlichen Artikeln Inhaltliche / semantische Nähe Erster Schritt: Nicht für alles geeignet Abbildung 1 Ähnlichkeit als Basis Distanzfunktionen (Zunächst) möglichst verständlich halten M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 7 / 28
8 Einführung in die Thematik II Abbildung: Realisierbarer Workflow M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 8 / 28
9 Einführung in die Thematik III Artikelarchiv: nach Sortierung ca Artikel (Englisch) von Journalisten Basierend auf dem Eurozine Netzwerk Größere Länge als Tweets Meta-Informationen vorhanden (Verlinkungen auf Inhaltsverzeichnisse, redaktionelle Focalpoints etc.) Sinnvoll nutzbar? semi-strukturiert in XML (Autor, Abstract, Überschriften usw.) M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 9 / 28
10 Einführung in die Thematik IV Beispiel Artikelarchiv hat ebenfalls Probleme: Nicht alle englischsprachig Enthält auch Zusammenfassungen etc. z.t. Gedichte (recht kurz, sprachlich besonders) Invalides XML M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 10 / 28
11 Fragestellungen und Ziele Automatisierbare Dossiererstellung möglich? Was sind Pressedossiers bzw. wie werden diese benutzt? Lassen sich fachliche Anforderungen in einen Algorithmus überführen? Sind journalistische Definitionen eines Dossiers mit Informatik umsetzbar? Wie kann man ein generiertes Ergebnisses bewerten? Versuch den Algorithmus übersichtlich zu halten M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 11 / 28
12 Erste Ideen I Viele Diskussionen und Ideen Simple Distanzfunktionen nutzen Facetten / abweichende Sichtweisen finden Vorhandene Clustering Techniken benutzen Vorschlagssysteme aufgrund von Lernalgorithmen / Crowd Metainformationen (Autoren, Herkunft) nutzen besserer Überblick Ggf. Distanzfunktionen verbessern M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 12 / 28
13 Erste Ideen II Zu einfach gedacht Geht nicht auf fachliche Anforderungen ein Clusteringverfahren oft sehr undurchsichtig (vgl. Projekt 1) Vorschlagssysteme brauchen (oft) eine Basis - Nicht vorhanden Coldstart problem Viele Systeme setzen auf Personalisierung oder die Crowd Ziel: automatisierte und neutrale Ergebnisse (z.b. [PL10], [KFD12], [LCLS10]) Ideen Den zweiten Schritt vor dem ersten tun Erlernen von Ähnlichkeit nicht im Fokus (Neuronale Netze usw.) Nicht ohne Weiteres anpassbar Nicht als erster Schritt M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 13 / 28
14 Related Work Forschungsprojekt der DPA Overview Project XML Ähnlichkeiten [TCY09] Distanzfunktionen [HRJM13] Content-based Recommender Systems [LGS] Überblick über Recommender Systems in der Breite [BOHG13] Article Recommender Systems [BDD + 12] M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 14 / 28
15 Konkrete Schritte I Ziel ist höchst experimentell Schrittweise annähern und verbessern Verbesserung der Distanzfunktion zwischen Dokumenten Bag of Words-Ansatz Ausgangsbasis: der Leitartikel später ggf. gewichtete Wortmenge M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 15 / 28
16 Konkrete Schritte II Gewichtete Wertungen von wichtigeren Teilen Gute Werte noch zu ermitteln 1 Abstract 2 Title 3 Subheadings 4 Text Anreicherung mit themenspezifischen Kategorien Wortmengen pro Thema (z.b. Wirtschaft, Politik usw.) einbringen Gewichtung des Bag of words zugunsten der (hierarchischen) Kategorien Erweiterung durch Erkenntnisse einer Fachexpertin M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 16 / 28
17 Distanzfunktionen Vieles hat wurde im Rahmen des Seminars schon angesprochen [Sip14] Zunächst Nutzung einer einfachen euklidischen Distanz (auf Basis der Gewichtungen) Verschiedene Relevanzmaße für Termhäufigkeiten (Termvorkommen, TF-IDF) Diverse Kriterien von Distanz möglich (Relevanz, Themenbreite, Neuigkeit etc.) Diverse Funktionen und Möglichkeiten vorhanden M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 17 / 28
18 Weitere mögliche Schritte Autoren nutzen um Herkunft des Artikels zu bestimmen Ggf. Einbeziehung von Inhaltsverzeichnissen der (Themen-)Zeitschriften Linguistische Verbesserungen (z.b. Nutzung von Ontologien etc.) Erkennung von Facetten eines Themas (europäische Sicht auf Ursprungsartikel) M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 18 / 28
19 Bewertung von Ergebnissen Verifikation der Ergebnisse über Focalpoints-Zusammenfassungen Testkorpus als Verifikationsbasis: Focalpoint-Artikel (redaktionell eingeordnet) (fast) zufällige Artikel (nicht im Focalpoint) Berechnete Dossierartikel sollten möglichst den Focalpointartikeln entsprechen Nutzung von Eigenschaften wie: Recall (Trefferquote): Precision (Genauigkeit): {relevant documents} {retrieved documents} {relevant documents} {relevant documents} {retrieved documents} {retrieved documents} Wissen einer Domänenexpertin [PR-] M. Schöneberg Automatisierte Dossiererstellung Masterarbeit Überblick 19 / 28
20 1 Rückblick Grundprojekt 2 Masterarbeit Überblick Einführung Fragestellungen und Ziele Erste Ideen Related Work Konkrete Schritte Weitere mögliche Schritte Bewertung von Ergebnissen 3 Aktueller Fortschritt: Hauptprojekt 4 Chancen und Risiken 5 Fragen 6 Literatur M. Schöneberg Automatisierte Dossiererstellung Aktueller Fortschritt: Hauptprojekt 20 / 28
21 Aktueller Fortschritt: Hauptprojekt I Aufgesetzter Testkorpus (Focalpoint Artikel + beliebige Artikel als Vergleichsbasis) Rapidminer 2 Verständnis und Hürden KDD Preprocessing Erste Versuche lauffähig Domänenübergreifendes Projekt Grundlegendes gemeinsames Verständnis M. Schöneberg Automatisierte Dossiererstellung Aktueller Fortschritt: Hauptprojekt 21 / 28
22 Aktueller Fortschritt: Hauptprojekt II (a) Process (c) Resultwindow (b) Script 2 M. Schöneberg Automatisierte Dossiererstellung Aktueller Fortschritt: Hauptprojekt 22 / 28
23 1 Rückblick Grundprojekt 2 Masterarbeit Überblick Einführung Fragestellungen und Ziele Erste Ideen Related Work Konkrete Schritte Weitere mögliche Schritte Bewertung von Ergebnissen 3 Aktueller Fortschritt: Hauptprojekt 4 Chancen und Risiken 5 Fragen 6 Literatur M. Schöneberg Automatisierte Dossiererstellung Chancen und Risiken 23 / 28
24 Chancen und Risiken I Chancen Viel Interesse - Editors don t scale HAW NextMedia 3 gefördert durch BMBF DPA Forschungsprojekt Risiken Zu abweichende Meinungen von Was ist ein Dossier Gefahr das Experten ihr Wissen nicht weitergeben können - Habe ich im Gefühl [McD83] Definitionen zu komplex oder zu unspezifisch um sie automatisiert umzusetzen Aufeinander aufbauender Prozess - wenn eins schief geht Problem 3 M. Schöneberg Automatisierte Dossiererstellung Chancen und Risiken 24 / 28
25 Fragen Vielen Dank für die Aufmerksamkeit! Fragen? M. Schöneberg Automatisierte Dossiererstellung Fragen 25 / 28
26 Literature I Bancu, Cristian ; Dagadita, Monica ; Dascalu, Mihai ; Dobre, Ciprian ; Trausan-Matu, Stefan ; Florea, Adina M.: ARSYS Article Recommender System. In: Proceedings of the th International Symposium on Symbolic and Numeric Algorithms for Scientific Computing. Washington, DC, USA : IEEE Computer Society, 2012 (SYNASC 12). ISBN , Bobadilla, J. ; Ortega, F. ; Hernando, A. ; GutiéRrez, A.: Recommender Systems Survey. In: Know.-Based Syst. 46 (2013), Juli, DOI /j.knosys ISSN Hälker, Nina: Dienen textminingbasierte Dossiers dem Wachsen einer gemeinsamen europäischen Erzählung? Arbeitspapier Harispe, Sébastien ; Ranwez, Sylvie ; Janaqi, Stefan ; Montmain, Jacky: Semantic Measures for the Comparison of Units of Language, Concepts or Entities from Text and Knowledge Base Analysis. In: CoRR abs/ (2013). M. Schöneberg Automatisierte Dossiererstellung Literatur 26 / 28
27 Literature II Kirshenbaum, Evan ; Forman, George ; Dugan, Michael: A Live Comparison of Methods for Personalized Article Recommendation at Forbes.Com. In: Proceedings of the 2012 European Conference on Machine Learning and Knowledge Discovery in Databases - Volume Part II. Berlin, Heidelberg : Springer-Verlag, 2012 (ECML PKDD 12). ISBN , Li, Lihong ; Chu, Wei ; Langford, John ; Schapire, Robert E.: A Contextual-bandit Approach to Personalized News Article Recommendation. In: Proceedings of the 19th International Conference on World Wide Web. New York, NY, USA : ACM, 2010 (WWW 10). ISBN , Lops, Pasquale ; Gemmis, Marco de ; Semeraro, Giovanni: In: Recommender Systems Handbook McDermott, John P.: Extracting Knowledge From Expert Systems. In: Bundy, Alan (Hrsg.): IJCAI, William Kaufmann, 1983, Peng, Chi-Chieh ; Liu, Duen-Ren: Combining Reputation and Content-based Filtering for Blog Article Recommendation in Social Bookmarking Websites. In: Proceedings of the 12th International Conference on Electronic Commerce: Roadmap for the Future of Electronic Business. New York, NY, USA : ACM, 2010 (ICEC 10). ISBN , 8 14 Precision-Recall diagram. M. Schöneberg Automatisierte Dossiererstellung Literatur 27 / 28
28 Literature III Schöneberg, Marcel: Erkennung von Trends in sozialen Netzwerken. Version: Projektbericht Sippel, Sigurd: Recommendations for cocktail recipes. (2014), Tekli, Joe ; Chbeir, Richard ; Yetongnon, Kokou: Survey: An Overview on XML Similarity: Background, Current Trends and Future Directions. In: Comput. Sci. Rev. 3 (2009), August, Nr. 3, DOI /j.cosrev ISSN M. Schöneberg Automatisierte Dossiererstellung Literatur 28 / 28
Automatisierte Dossier- Erstellung mittels Text-Mining
Automatisierte Dossier- Erstellung mittels Text-Mining Paul Assendorp Grundseminar 11.12.2014 Paul Assendorp Automatisierte Dossier-Erstellung 1 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick
MehrText Mining. Joachim Schole. Fakultät Technik und Informatik Hochschule für angewandte Wissenschaften Hamburg. Grundseminar, WS 2014
Text Mining Joachim Schole Fakultät Technik und Informatik Hochschule für angewandte Wissenschaften Hamburg Grundseminar, WS 2014 Joachim Schole (HAW Hamburg) Text Mining Grundseminar, WS 2014 1 / 26 Agenda
MehrBig Data bei unstrukturierten Daten. AW1 Vortrag Sebastian Krome
Big Data bei unstrukturierten Daten AW1 Vortrag Sebastian Krome Agenda Wiederholung Aspekte von Big Data Datenverarbeitungsprozess TextMining Aktuelle Paper Identification of Live News Events Using Twitter
MehrComplex Event Processing
[10] Armin Steudte HAW Hamburg Masterstudiengang Informatik - WS 2011/2012 Agenda Motivation Grundlagen Event Processing Networks Ausblick Quellen 2 Agenda Motivation Grundlagen Event Processing Networks
MehrVektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig
Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model
MehrText Mining für News-Sites Nina Hälker
Ablauf Department Informatik, HAW Hamburg Sommersemester 2014 A Motivation Aufbauprojekt Was sagt das Ausland? Fokus der Masterarbeit: Text Mining für News-Sites B Drei Papers: Fokus, Ergebnisse, eigenes
MehrShopBot, ein Software-Agent für das Internet
Software-Agenten p.1/20 ShopBot, ein Software-Agent für das Internet Eine Einführung in (Software-)Agenten Madeleine Theile Software-Agenten p.2/20 Aufbau des Vortrags grundlegende Theorie Definition Autonomy,
MehrExtraktion und Visualisierung von multidimensionalen Textinformationen zur Integration von Big Data in unternehmensspezifischen Wissenslandkarten
Extraktion und Visualisierung von multidimensionalen Textinformationen zur Integration von Big Data in unternehmensspezifischen Wissenslandkarten FOM Hochschulzentrum Dortmund, Fachbereich Wirtschaftsinformatik
MehrSocial Monitoring. HAW Hamburg Hochschule für Angewandte Wissenschaften University of Applied Sciences Master Informatik - Anwendungen 1 WS 2013/2014
HAW Hamburg Hochschule für Angewandte Wissenschaften University of Applied Sciences Master Informatik - Anwendungen 1 WS 2013/2014 Abdul-Wahed Haiderzadah abdul-wahed.haiderzadah@haw-hamburg.de Betreuer:
MehrExploring the knowledge in Semi Structured Data Sets with Rich Queries
Exploring the knowledge in Semi Structured Data Sets with Rich Queries Jürgen Umbrich Sebastian Blohm Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 www.kit.ed Overview
MehrEntwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion
Entwicklung einer Entscheidungssystematik für Data- Mining-Verfahren zur Erhöhung der Planungsgüte in der Produktion Vortrag Seminararbeit David Pogorzelski Aachen, 22.01.2015 Agenda 1 2 3 4 5 Ziel der
MehrGenerierung von sozialen Netzwerken. Steffen Brauer WiSe 2011/12 HAW Hamburg
Generierung von sozialen Netzwerken Steffen Brauer WiSe 2011/12 HAW Hamburg Agenda Motivation Soziale Netzwerke Modelle Metriken Forschungsumfeld Ausblick 2 Motivation Wo gibt es Netzwerke? Computernetzwerke
MehrSAS CONTEXTUAL ANALYSIS IN ACTION ERFAHRUNGEN AUS EINEM EIN SELBSTVERSUCH
SAS CONTEXTUAL ANALYSIS IN ACTION ERFAHRUNGEN AUS EINEM EIN SELBSTVERSUCH GERHARD SVOLBA COMPETENCE CENTER ANALYTICS WIEN, 17. NOVEMBER 2015 SAS CONTEXTUAL ANALYSIS 14.1 EIN BLICK IN DIE PRODUKTBESCHREIBUNG
MehrSpace Usage Rules. Neele Halbur, Helge Spieker InformatiCup 2015 19. März 2015
Space Usage Rules? InformatiCup 2015 1 Agenda 1. Vorstellung des Teams 2. Entwicklungsprozess und Umsetzung 3. Verbesserung der Strategien 4. Auswertung der Strategien 5. Ausblick 6. Fazit 2 Vorstellung
MehrEXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN
EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,
MehrSeminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK
Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 08.05.2014 Gliederung 1 Vorverarbeitung
MehrTechnologie für RIS und Portalverbund der nächsten Generation E-Government Experts Meeting 2010-02-16
Technologie für RIS und Portalverbund der nächsten Generation E-Government Experts Meeting 2010-02-16 Technologie4RISuPV.PPT/hoffmann/feb10/1 R4eGov Technologie4RISuPV.PPT/hoffmann/feb10/2 Ausgangspunkt:
MehrAutomatisierte Erstellung von Pressedossiers durch Textmining
Automatisierte Erstellung von Pressedossiers durch Textmining Projektbericht Marcel Schöneberg marcel.schoeneberg@haw-hamburg.de Hochschule für Angewandte Wissenschaften Hamburg (HAW) Fakultät für Technik
MehrKurze Einführung in Web Data Mining
Kurze Einführung in Web Data Mining Yeong Su Lee Centrum für Informations- und Sprachverarbeitung (CIS), LMU 17.10.2007 Kurze Einführung in Web Data Mining 1 Überblick Was ist Web? Kurze Geschichte von
MehrInnovation Management
Innovation Management 0 Preface Prof. Dr. Rolf Dornberger, Prof. Dr. Stella Gatziu Content 0 Preface 0.1 Organisational issues of the module Innovation Management 0.2 Literature 2 0.1 Organisational issues
MehrWarum Suche (trotzdem) bedeutend ist
Warum Suche (trotzdem) bedeutend ist Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information dirk.lewandowski@haw-hamburg.de Drei Themen 1 Agenda Wie steht die
MehrOntologien und Ontologiesprachen
Ontologien und Ontologiesprachen Semantische Datenintegration SoSe2005 Uni Bremen Yu Zhao Gliederung 1. Was ist Ontologie 2. Anwendungsgebiete 3. Ontologiesprachen 4. Entwicklung von Ontologien 5. Zusammenfassung
MehrCorporate Semantic Search -
Corporate Semantic Search - 3 Suchen nach Komplexen Zusammenhängen und Personalisierung im Unternehmenskontext Olga Streibel, Radoslaw Oldakowski Inhalt Semantische Suche: Suche im Web Semantische Suche
MehrUsability Metrics. Related Work. Von Torsten Rauschan (torsten.rauschan@haw-hamburg.de) HAW Hamburg M-Inf2 Anwendungen 2 Betreuer: Prof. Dr.
Usability Metrics Related Work Von Torsten Rauschan (torsten.rauschan@haw-hamburg.de) HAW Hamburg M-Inf2 Anwendungen 2 Betreuer: Prof. Dr. Zukunft Agenda Rückblick AW1 Motivation Related work QUIM SUM
MehrPolitische Inhalte in Social Media:
Politische Inhalte in Social Media: Twitter zur Landtagswahl in Nordrhein-Westfalen 2012 Überblick 1. Einführung 2. Methoden 3. Ergebnisse 4. Fazit 5. Ausblick 2 Einführung Einführung Twitter hat 2012
MehrSEO Standards im ecommerce Ist Ihr Shop wirklich up-to-date? ecommerce conference 2013 / Hamburg Tobias Jungcurt / SoQuero GmbH
SEO Standards im ecommerce Ist Ihr Shop wirklich up-to-date? ecommerce conference 2013 / Hamburg Tobias Jungcurt / SoQuero GmbH Über SoQuero SoQuero Online Marketing performanceorientierte Online-Marketing-Agentur
MehrDetecting Near Duplicates for Web Crawling
Detecting Near Duplicates for Web Crawling Gurmeet Singh Manku et al., WWW 2007* * 16th international conference on World Wide Web Detecting Near Duplicates for Web Crawling Finde near duplicates in großen
MehrData Mining im Einzelhandel Methoden und Werkzeuge
Fakultät Informatik Institut für Angewandte Informatik Professur Technische Informationssysteme Proseminar Technische Informationssysteme Data Mining im Einzelhandel Methoden und Werkzeuge Betreuer: Dipl.-Ing.
MehrDISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 392
DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 392 Social Business Intelligence: Entwicklung, Architekturen und Perspektiven
MehrText-Mining: Einführung
Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:
MehrPROSEMINAR: INFORMATIONSGEWINN DURCH EXPERIMENTE WS 09/10
PROSEMINAR: INFORMATIONSGEWINN DURCH EXPERIMENTE WS 09/10 DATA MINING ALS EXPERIMENT VORTRAG: CHRISTOPH NÖLLENHEIDT 26.01.10 Ablauf Das CRISP-DM-Modell Zwei verschiedene Standpunkte über die Theoriebildung
MehrEliminating waste in software projects: Effective knowledge management by using web based collaboration technology Diplom.de
Frederik Dahlke Eliminating waste in software projects: Effective knowledge management by using web based collaboration technology The enterprise 2.0 concept applied to lean software development Diplom.de
Mehrsemantische Informationssysteme
"Finden" nicht "Suchen" Fakultät TI Department Informatik AW1, Master, SS 2008 Gliederung 1 Motivation 2 Semantic Web 3 Ontologien 4 Zusammenfassung Gliederung 1 Motivation die perfekte Informationsplattform
MehrDas Internet im Wandel
Das Internet im Wandel Von der Homepage zum Social Business von Enrico Bock Sichtweise Internetagentur (Web)Strategie (Web)Design (Web)Technologie Gegründet 2004 von Enrico und Marcus Bock Was ist eigentlich
MehrDokumenten-Technologien
Dokumentenmanagement Dr. Ulrich Kampffmeyer PROJECT CONSULT Unternehmensberatung Dr. Ulrich Kampffmeyer GmbH Hamburg 2001/2005 Dokumenten-Technologien Von Dr. Ulrich Kampffmeyer Geschäftsführer der PROJECT
MehrUsability von Bedienkonzepten auf Tablets
Usability von Bedienkonzepten auf Tablets Milena Rötting Master Informatik HAW Hamburg 26. April 2012 Gliederung Einführung Verwandte Arbeiten User-defined Gestures Usability of ipad Apps and Websites
MehrModellierung eines Epidemie- Frühwarnsystems mit. Nicolas With Master Seminar WS 2012/13
Modellierung eines Epidemie- Frühwarnsystems mit SocialMedia Mining Nicolas With Master Seminar WS 2012/13 Agenda Einstieg Motivation Abgrenzung Ziel Status Projekt 1 Projekt 2 Ausblick Chancen Risiken
MehrProseminar - Data Mining
Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen
MehrOpinion Mining in der Marktforschung
Opinion Mining in der Marktforschung von andreas.boehnke@stud.uni-bamberg.de S. 1 Überblick I. Motivation Opinion Mining II. Grundlagen des Text Mining III. Grundlagen des Opinion Mining IV. Opinion Mining
MehrExtraktion von Metadaten als Basis für eine semantische Integration heterogener Informationssysteme
Extraktion von Metadaten als Basis für eine semantische Integration heterogener Informationssysteme Liane Haak, Axel Hahn Abteilung Wirtschaftsinformatik Carl von Ossietzky Universität Oldenburg Fakultät
MehrProseminar - Data Mining
Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,
MehrForschungsproposal-Seminar
Forschungsproposal-Seminar Was ist ein Forschungsproposal? Was soll durch dieses Seminar erreicht werden? Wie wird das Seminar durchgeführt? Wie kommt man zu einem Proposal? Wie gestaltet man ein Proposal?
MehrNutzen und Vorteile des Prozessmanagements mit ECM
Nutzen und Vorteile des Prozessmanagements mit ECM Balz Zürrer, Online Consulting AG Online Consulting AG Weststrasse 38 CH-9500 Wil Tel. +41 (0) 71 913 31 31 Fax +41 (0) 71 913 31 32 info@online.ch, www.online.ch
MehrQuellen: Towards a Human Computer InteractionPerspective. Übersicht. Warum visuelle Sprachen? Begriffsdefinitionen: Hinderungsgründe bisher:
Quellen: Towards a Human Computer InteractionPerspective von B.K. & B.K. LV: Visuelle Sprachen (03-763) Universität Bremen WS 2001/02 Visual Language Theory: Towards a Human- Computer Perspective; N. Hari
MehrBig Data - Datenquellen und Anwendungen
Big Data - Datenquellen und Anwendungen AW1 Präsentation Gerrit Thede Fakultät Technik und Informatik Department Informatik HAW Hamburg 18. November 2013 Outline 1 Einleitung 2 Datenquellen 3 Data Science
MehrData/Information Quality Management
Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!
MehrTeil 2: Schriftliche Ausarbeitung. Hinweise zur Gestaltung von Seminararbeiten und anderen wissenschaftlichen Aufsätzen
Teil 2: Schriftliche Ausarbeitung Hinweise zur Gestaltung von Seminararbeiten und anderen wissenschaftlichen Aufsätzen Elemente einer schriftlichen Arbeit Titel Autoren und ihre organisatorische Zugehörigkeit
MehrSoziales und Selbstgesteuertes Lernen
Soziales und Selbstgesteuertes Lernen Wolfgang Nejdl Forschungszentrum L3S Hannover 02/02/12 1 Web Science Informatik- und interdisziplinäre Forschung zu allen Aspekten des Web - Web of People - Web-Suche
MehrStrategien und Erfolgskontrolle im Electronic Business
Wirtschaft Bastian Pochstein Strategien und Erfolgskontrolle im Electronic Business Diplomarbeit HOCHSCHULE WISMAR Fachbereich Wirtschaft Diplomarbeit zum Thema: Strategien und Erfolgskontrolle im Electronic
MehrEntfernung von Duplikaten in Data Warehouses
Entfernung von Duplikaten in Data Warehouses Daniel Martens 11.09.2015, Informationsintegration, Seminar 1/41 Gliederung Problem & Motivation Domänen-unabhängige Verfahren Domänen-abhängige Verfahren DELPHI
MehrInnovative informationstechnische Ansätze für die Unterstützung moderner Arbeitsformen in Gegenwart und Zukunft. SmartPeople@Work
Innovative informationstechnische Ansätze für die Unterstützung moderner Arbeitsformen in Gegenwart und Zukunft SmartPeople@Work @E-Government Infoveranstaltung Luzern Jörg Hofstetter, www.hslu.ch/d3s
MehrI. Allgemeine Vorschriften. 1 Grundsatz der Gleichberechtigung
Studienordnung für den postgradualen Studiengang "International Business Informatics" an der Wirtschaftswissenschaftlichen Fakultät der Europa-Universität Viadrina Frankfurt (Oder) Gemäß 74 Absatz 1, Ziffer
MehrKundenmanagement im Krankenhaus
Kundenmanagement im Krankenhaus Volker Nürnberg Barbara Schneider Kundenmanagement im Krankenhaus Service Qualität Erreichbarkeit Volker Nürnberg Hochschule für angewandtes Management Erding Deutschland
MehrVisual Analytics: Buzzword oder Innovation?
Visual Analytics: Buzzword oder Innovation? Jens Rauch DOAG BI 2014 München, 03.04.2014 Jens Rauch Diplom-Psychologe und Informatiker (B. Sc.) Zwei Jahre Forschung im Bereich kognitiver Neurowissenschaft
MehrSoftware-Verifikation
Hochschule Wismar Fakultät für Wirtschaftswissenschaften Semesterarbeit (Arbeitsplan und Grobkonzeption) Software-Verifikation Fernstudiengang Master Wirtschaftsinformatik Modul: Formale Methoden Semester:
MehrDokumentenbasierte Steuerung von Geschäftsprozessen
Beitrag 13 Dokumentenbasierte Steuerung von Geschäftsprozessen Dominik Reichelt Professur für Produktionswirtschaft und Informationstechnik dominik.reichelt@iisys.de Abstract: Geschäftsprozesse im Verwaltungs-
MehrArbeiten mit Datenbanken
Prof. Dr. Rüdiger Zarnekow TU Berlin, Fakultät VII Kommunikationsmanagement Kommunikationsmanagement Inhalte und Ziele 1. wichtige Hinweise 2. Freie Datenbanken der TU 3. Schlagwortsuche 4. Übung 1 5.
MehrPraktikum Einführung
Praktikum Einführung Praktikum im Rahmen der Veranstaltung Sicherheit in Netzen im WS 08/09 Praktikumsleiter: Holger Plett Agenda Motivation AVISPA Einleitung Aufbau des Frameworks Elemente des Frameworks
MehrEinführung zum Seminar
Einführung zum Seminar Philipp Slusallek Computergraphik Universität des Saarlandes Übersicht Motivation Literatur Vortrag Bericht 1 Motivation Seminare Einführung und Training des wissenschaftlichen Arbeitens
Mehr1 Boolesches Retrieval (2)
2. Übung zur Vorlesung Internet-Suchmaschinen im Sommersemester 2009 mit Lösungsvorschlägen Prof. Dr. Gerd Stumme, M.Sc. Wi-Inf. Beate Krause 06. Mai 2009 1 Boolesches Retrieval (2) Eine Erweiterung des
MehrEinführung in Wissenschaftliches Arbeiten
Einführung in Wissenschaftliches Arbeiten Einleitung und Recherche Thomas Beckers, Sebastian Dungs, Norbert Fuhr, Matthias Jordan, Sascha Kriewel, Marc Lechtenfeld, Vu Tran Sommersemester 2013 Einführung
MehrRedundanz und Rationalität
Redundanz und Rationalität Digitale Redundanz und ökonomisches Gleichgewicht - Vortrag zur Berlinux 2005 Matthias Bärwolff Fachgebiet Informatik und Gesellschaft Technische Universität Berlin http://ig.cs.tu-berlin.de
MehrMasterstudium Informatik CURRICULUM 2006 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG
Masterstudium Informatik CURRICULUM 2006 IN DER VERSION 2013 MICHAEL KRISPER, BASISGRUPPE INFORMATIK & SOFTWAREENTWICKLUNG Infos für den Anfang Curriculum ist im Mitteilungsblatt veröffentlicht: http://www.mibla.tugraz.at/12_13/stk_16e/16e.html
MehrAlgorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation
Algorithmen zur Berechnung der Transitiven Hülle einer Datenbankrelation Daniel Reinhold Shenja Leiser 6. Februar 2006 2/28 Gliederung Einführung Transitive Hülle Definition Iterative Algorithmen 1. Naive
MehrWhitepaper Bio-Mode. Quelle: http://freshideen.com/trends/bio-kleidung.html
Whitepaper Bio-Mode Quelle: http://freshideen.com/trends/bio-kleidung.html Seite 1 von 11 Wo wird über Bio-Mode diskutiert? 0,79% 0,76% 0,00% 0,56% 5,26% 9,81% 9,93% 0,15% 72,73% News Soziale Netzwerke
MehrThe Economics of Higher Education in Germany
Michael Maihaus The Economics of Higher Education in Germany Salary Expectations, Signaling, and Social Mobility Tectum Verlag Dr. rer. pol. Michael Maihaus, born in Steinfurt/Germany in 1983, studied
MehrRecommender Systems. Stefan Beckers Praxisprojekt ASDL SS 2006 Universität Duisburg-Essen April 2006
Recommender Systems Stefan Beckers Praxisprojekt ASDL SS 2006 Universität Duisburg-Essen April 2006 Inhalt 1 - Einführung 2 Arten von Recommender-Systemen 3 Beispiele für RCs 4 - Recommender-Systeme und
MehrKurfzassung Deutsch. Poier Lorenz. MMag. Wilhelm Loibl
Kurfzassung Deutsch Novelty Mining Algorithmus zur Trendsporterkennung Poier Lorenz MMag. Wilhelm Loibl Einleitung Diese Arbeit versucht ein Instrument für die Erkennung von Trends im Tourismus durch die
MehrEvaluation von Websites
Evaluation von Websites Universitätsbibliothek interne Weiterbildung, 11. 2. 2011 Beatrix Stuber Website-Evaluation Warum? Jede/r kann heute eine Website aufschalten. Es gibt keine Qualitätskontrolle im
MehrKirche im Web 2.0...Möglichkeiten und Grenzen des Crowdsourcing. by Crowdsourcingblog.de
Kirche im Web 2.0...Möglichkeiten und Grenzen des Crowdsourcing Der Begriff,Crowdsourcing Crowdsourcing ist die Allokation von Wissen, Fähigkeiten und Kapital. Der Begriff wurde in 2006 erstmals von Jeff
MehrVorlesung Winter 2014/15 Prof. A. Müller
Vorlesung Winter 2014/15 Prof. A. Müller Silvia Jakob OPAC Fachportale ebook Pakete was ist drin!? link.pringer Adrian Müller Advanced Google query syntax / Blogsearch Frage-Antwort Systeme, Foren Microsoft
MehrEnterprise Social Network. Social Media im Unternehmen
Vorstellung Thorsten Firzlaff Diplom Informatiker / Geschäftsführer 15 Jahre Lotus Notes 3 Jahre Innovation Manager 3 Jahre Leitung Web2.0 Competence Center Referent auf vielen international Konferenzen
MehrSeminar im Sommersemester 2012 Prozessanalyse und Privatheit in Workflowmanagementsystemen http://dbis.ipd.kit.edu/1848.php
Seminar im Sommersemester 2012 Prozessanalyse und Privatheit in Workflowmanagementsystemen http://dbis.ipd.kit.edu/1848.php www.kit.edu 06.09 Veranstalter Institut für Programmstrukturen und Datenorganisation
MehrMobile! Usability Testing for Innovative Interfaces!
Mobile! Usability Testing for Innovative Interfaces! Jörn Siedentopp - Anwendungen II - 09.05.2010! Master of Science Informatik! Hochschule für Angewandte Wissenschaften Hamburg (HAW Hamburg)! 1! Inhalt!
MehrTeam Collaboration im Web 2.0
Team Collaboration im Web 2.0 barcampmitteldeutschland Team Collaboration im Web 2.0 Focus Social Bookmarking Torsten Lunze Team Collaboration in Web 2.0 Motivation Collaboration in verschiedenen Technologien
MehrWillkommen. Benutzerhandbuch für die OECD Online-Bibliothek
Willkommen Benutzerhandbuch für die OECD Online-Bibliothek Startseite Sie haben drei Möglichkeiten, zu den Studien und Statistiken der OECD zu gelangen: Klicken Sie oben auf die Kategorie, für die Sie
MehrWie schreibt man eine Ausarbeitung?
Wie schreibt man eine Ausarbeitung? Holger Karl Holger.karl@upb.de Computer Networks Group Universität Paderborn Übersicht Ziel einer Ausarbeitung Struktur Sprache Korrektes Zitieren Weitere Informationen
MehrMaschinelle Übersetzung
Hauptstudiumsprojekt SoSe 07 Maschinelle Übersetzung Walther v. Hahn, Cristina Vertan {vhahn,vertan}@informatik.uni-hamburg.de Wozu dient ein Projekt? Projekte im Umfang von 6 SWS dienen der Bearbeitung
MehrLeistungsbewertung. ENGLISCH Leistungsanforderungen Klasse 5/6 Beurteilungsbereiche. Klassenarbeiten (ca. 50%) Klassenarbeiten. Sonstige Mitarbeit
Klasse 5/6 Anzahl: 6 (Klasse 5) 5 schriftl. Arbeiten, 1 mündl. Kommunikationsprüfung (Klasse 6) Verteilung: 3 je Halbjahr Dauer: 45-60 Minuten kommunikative Kompetenzen (Hörverstehen, Leseverstehen, Schreiben,
MehrProling von Software-Energieverbrauch
Proling von Software-Energieverbrauch Seminar Ausgewählte Kapitel der Systemsoftwaretechnik: Energiegewahre Systemsoftware im Sommersemester 2013 Michael Fiedler 6. Juni 2013 1 Motivation (1) Grundproblem
MehrMicrosoft Office SharePoint Server 2007 Überblick. Gernot Kühn Partner Technical Specialist Microsoft Deutschland Gmbh Gernotk@microsoft.
Microsoft Office SharePoint Server 2007 Überblick Gernot Kühn Partner Technical Specialist Microsoft Deutschland Gmbh Gernotk@microsoft.com 30. Juli 2006 Munich, Germany 2007 Microsoft Office System Investitionen
MehrWaldwissen.net (Forest-knowledge.net)
Waldwissen.net (Forest-knowledge.net) Conference of Directors of State Forest Research Institutes, Vienna, July 5-6th 2004 project idea Establish an internet-based, scientifically sound, comprehensive
MehrIntelligente Systeme WS 2015/16
Lehrgebiet Intelligente Systeme WS 2015/16 Andreas Dengel Fragestellungen Automatisierung von intelligentem" Verhalten im Sinn eines Leistungsverstärkers für den Menschen, z.b. Verstehen von Bildern, Sprache
MehrSeminar Datenbanksysteme
Seminar Datenbanksysteme Recommender System mit Text Analysis für verbesserte Geo Discovery Eine Präsentation von Fabian Senn Inhaltsverzeichnis Geodaten Geometadaten Geo Discovery Recommendation System
MehrSemantic Web. Anwendungsbereiche & Entwicklungen. http://www.know-center.at. Dr. Michael Granitzer
Semantic Web Anwendungsbereiche & Entwicklungen Dr. Michael Granitzer - gefördert durch das Kompetenzzentrenprogramm Agenda Die Vision und warum das Semantic Web Sinn macht Grundlagen: Wissensrepräsentation
MehrSarmadi@kntu.ac.ir P- hdoroodian@gmail.com. shafaei@kntu.ac.ir BPOKM. 1 Business Process Oriented Knowledge Management
Sarmadi@kntu.ac.ir P- hdoroodian@gmail.com shafaei@kntu.ac.ir -. - 1 Business Process Oriented Knowledge Management 1 -..» «.. 80 2 5 EPC PC C EPC PC C C PC EPC 3 6 ; ; ; ; ; ; 7 6 8 4 Data... 9 10 5 -
MehrAnwendungsfall 1. Unternehmen: Versicherungsunternehmen in Hong Kong
Anwendungsfall 1 Unternehmen: Versicherungsunternehmen in Hong Kong Personalauswahl Zur Unterstützung der Personalauswahl mittels einer automatischen Vorselektion potenzieller Versicherungsvertreter aus
MehrProf. Dr. Udo Hahn. Seminar im Modul M-GSW-09 WiSe 2016/17
Seminar im Modul M-GSW-09 WiSe 2016/17 Prof. Dr. Udo Hahn Lehrstuhl für Angewandte Germanistische Sprachwissenschaft / Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller-Universität
MehrAnne Groß GI Fachgruppentreffen RE, 24./25.11.2011, Hamburg
Anforderungen an die Anforderungsspezifikation aus Sicht von Architekten und Usability Experten Anne Groß GI Fachgruppentreffen RE, 24./25.11.2011, Hamburg --- Motivation --- 2 Motivation Informationsquelle
MehrWeb Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion
Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische
MehrVertiefte Themen in Mobilen und Verteilten Systemen
Seminar Vertiefte Themen in Mobilen und Verteilten Systemen Veranstalter: Prof. Dr. Linnhoff-Popien Durchführung: Sebastian Feld Seminar Trends in Mobilen und Verteilten Systemen Folie 1 Termine Termine
MehrTextklassifizierung nach Erbkrankheiten aus OMIM Exposé einer Diplomarbeit
Textklassifizierung nach Erbkrankheiten aus OMIM Exposé einer Diplomarbeit betreut von: Prof. Ulf Leser, Jörg Hakenberg bearbeitet von: Juliane Rutsch September 24 November 24 Problemstellung Medizinische
MehrHerzlich willkommen! Online 22. März 2011
Herzlich willkommen! Online 22. März 2011 Webinar - Ablauf Twitter & Social Media Theorie Twitter heute! Deutschland & Global Twitter& Social Media Grundlagen Twitter & Social Media Marketing Welchen Nutzen
MehrKapitel 5: Statische Analyse
Kapitel 5: Statische Analyse Inhalt 5.1 Grundlagen 5.2 Analyse von Programmen 5.3 Analyse von Algorithmen 5.4 Analyse von Spezifikationen, Entwürfen und Prüfvorschriften Schlüsselbegriffe Statische Prüfung
MehrPro-Nursing. Professional Nursing Education and Training. Fachtagung Neue Kompetenzen für neue Beschäftigungsmöglichkeiten
Pro-Nursing Professional Nursing Education and Training Fachtagung Neue Kompetenzen für neue Beschäftigungsmöglichkeiten Prof. Dr. Ing. Madjid Fathi M. Sc. Marjan Khobreh Dr. med. Judith Hoffmann 1 Gesellschaftlicher
MehrGruppenentscheidungsprozesse im Requirements Engineering
11. Requirements Engineering Tagung 2012 Gruppenentscheidungsprozesse im Requirements Engineering Alexander Felfernig 1 und Leopold Weninger 2 1 Technische Universität Graz, Österreich 2 wsop GmbH, Österreich
MehrTRIFT Transfer of Innovation into the Field of Foreign Trade
TRIFT Transfer of Innovation into the Field of Foreign Trade Project Results Bearbeitet von Bezirksregierung Köln 1. Auflage 2013. Taschenbuch. 165 S. Paperback ISBN 978 3 631 62867 6 Format (B x L): 21
MehrHEALTH Institut für Biomedizin und Gesundheitswissenschaften
HEALTH Institut für Biomedizin und Gesundheitswissenschaften Konzept zur Verbesserung eines klinischen Information Retrieval Systems unter Verwendung von Apache UIMA und medizinischen Ontologien Georg
Mehriflat: Vision of Computer Supported Cooperative Work in Home Environment
iflat: Vision of Computer Supported Cooperative Work in Home Environment - - - AW2 - - Master Informatik HAW Hamburg Wintersemester - 03. Dezember 2008 Folie 1 AGENDA Kurzvorstellung iflat Kontext und
Mehr