Automatisierte Dossier- Erstellung mittels Text-Mining

Größe: px
Ab Seite anzeigen:

Download "Automatisierte Dossier- Erstellung mittels Text-Mining"

Transkript

1 Automatisierte Dossier- Erstellung mittels Text-Mining Paul Assendorp Grundseminar Paul Assendorp Automatisierte Dossier-Erstellung 1

2 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick Konferenzen & Forschung Paul Assendorp Automatisierte Dossier-Erstellung 2

3 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick Konferenzen & Forschung Paul Assendorp Automatisierte Dossier-Erstellung 3

4 Motivation Editors don t scale (nach Dr. Carsten Brosda, Amt Medien, Senatskanzlei Hamburg) Paul Assendorp Automatisierte Dossier-Erstellung 4

5 Was ist ein Dossier? Zusammenstellung von Dokumenten Zu thematischem Hintergrund politisch, historisch oder kulturell Aber: Keine eindeutige Definition Paul Assendorp Automatisierte Dossier-Erstellung 5

6 Automatisierte Dossier-Erstellung We emphasize that the complexity of language implies that automated content analysis methods [ ] are best thought of as amplifying and augmenting careful reading and thoughtful analysis [Grim13] Paul Assendorp Automatisierte Dossier-Erstellung 6

7 Automatisierte Dossier-Erstellung (2) Ansatz: Optimierung der Dossier-Erstellung Vorschläge für Domäne-Experten Leitartikel als Vorgabe Paul Assendorp Automatisierte Dossier-Erstellung 7

8 Automatisierte Dossier-Erstellung (3) [Sch14] Paul Assendorp Automatisierte Dossier-Erstellung 8

9 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick Konferenzen & Forschung Paul Assendorp Automatisierte Dossier-Erstellung 9

10 Textmining [FPSS96] Paul Assendorp Automatisierte Dossier-Erstellung 10

11 Textmining [FPSS96] Paul Assendorp Automatisierte Dossier-Erstellung 11

12 Preprocessing von Dokumenten Wie sehen Dokumente aus? Semistrukturierte Text-Dokumente Paul Assendorp Automatisierte Dossier-Erstellung 12

13 Preprocessing von Dokumenten Normalisierung Stemming Stopword-Eliminierung Paul Assendorp Automatisierte Dossier-Erstellung 13

14 Textmining [FPSS96] Paul Assendorp Automatisierte Dossier-Erstellung 14

15 Transformation Dokument Bag of Words Feature-Vektor über Vector Space Model (VSP) Jeder Term als eine Dimension: Key-Words Extraction [LIU12] Paul Assendorp Automatisierte Dossier-Erstellung 15

16 Distanzfunktion Einfache Distanz nach Euklid: dist Euklid v, w = v i w i 2 i [CLEV14] Paul Assendorp Automatisierte Dossier-Erstellung 16

17 Distanzfunktion (2) Cosinus-Ähnlichkeitsmaß Am meisten verbreitet beim Clustering [Feld07] cos x, y = i i xix i y i 2 y i 2 i [CLEV14] Paul Assendorp Automatisierte Dossier-Erstellung 17

18 Textmining [FPSS96] Paul Assendorp Automatisierte Dossier-Erstellung 18

19 Anwendungsklassen des Data Mining Klassifizierung ( ) Cluster-Analyse Assoziationsanalyse Numerische Vorhersage Paul Assendorp Automatisierte Dossier-Erstellung 19

20 Cluster-Analyse K-means Algorithmus Einfaches, populäres Verfahren nach MacQueen [Mac67] Künstliche neuronale Netze Selbstorganisierte Karten Neuronale Gase ART-Netze Paul Assendorp Automatisierte Dossier-Erstellung 20

21 Clusterbildung mittels Self Organizing Map (SOM) [CLEV14] Paul Assendorp Automatisierte Dossier-Erstellung 21

22 SOM (2) [CLEV14] Paul Assendorp Automatisierte Dossier-Erstellung 22

23 SOM (3) [CLEV14] Paul Assendorp Automatisierte Dossier-Erstellung 23

24 SOM (4) [CLEV14] Paul Assendorp Automatisierte Dossier-Erstellung 24

25 SOM (5) [CLEV14] Paul Assendorp Automatisierte Dossier-Erstellung 25

26 SOM (6) [CLEV14], Tool: SoKo-Wismar (Self-Organizing Kohonen Map) Paul Assendorp Automatisierte Dossier-Erstellung 26

27 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick Konferenzen & Forschung Paul Assendorp Automatisierte Dossier-Erstellung 27

28 Tools zum Textmining Rapidminer (YALE) Weka (Waikato Environment for Knowledge Analysis) Beagle Search (Apache Lucene) Hadoop mit z.b. Apache Tez oder Apache Mahout auf Spark Paul Assendorp Automatisierte Dossier-Erstellung 28

29 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick Konferenzen & Forschung Paul Assendorp Automatisierte Dossier-Erstellung 29

30 Aktueller Stand Vorarbeit durch Marcel Schöneberg (M.-Inf.), Nina Hälker (M.-Next Media) Datenbasis Eurozine Netzwerk ( [Sch2014] 2700 Journalistische Artikel Meta-Informationen semi-strukturiert in XML (Autor, Abstract, Überschriften usw.) Größtenteils englisch Paul Assendorp Automatisierte Dossier-Erstellung 30

31 Aktueller Stand (2) Einfache Distanzfunktion Distanz nach Euklid gemäß Gewichtung Dossier-Vorschläge anhand ähnlicher Dokumente Keine multimedialen Dossiers Paul Assendorp Automatisierte Dossier-Erstellung 31

32 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick Konferenzen & Forschung Paul Assendorp Automatisierte Dossier-Erstellung 32

33 Ausblick Verbesserung der Gewichtung durch Kenntnis der Fachdomäne Linguistische Verbesserungen Optimierung der Distanzfunktion Evaluierung von Methoden zum Clustering Entwicklung einer Toolchain Paul Assendorp Automatisierte Dossier-Erstellung 33

34 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick Konferenzen & Forschung Paul Assendorp Automatisierte Dossier-Erstellung 34

35 Konferenzen ACM SIGKKD Knowledge Discovery & Data Mining ACM SIGMOD Management of Data IEEE Big Data 2014 ISC Big Data Paul Assendorp Automatisierte Dossier-Erstellung 35

36 Forschung (Digital Journalism) Center for Digital Journalism Jay Rosen Digital Storytelling Bryan Alexander Paul Assendorp Automatisierte Dossier-Erstellung 36

37 Quellen [Clev14] CLEVE, Jürgen; LÄMMEL, Uwe: Data Mining. De Gruyter, 2014 [Grim13] GRIMMER, Justin; STEWARD, Brandon M.: Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts. Stanford University, 2013 [FPSS96] [Sch14] [Feld07] [Mac67] [Lui12] FAYYAD, Usma M.; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic: From Data Mining to Knowlege Discovery: An Overview. In: FYYAD, Usama M.; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic; UTHURU-SAMY, Ramasamy (Hrsg.): Advances in Knowlege Discovery and Data Mining. Menlo Park, Cambridge, London: MIT Press, 1996, S SCHÖNEBERG, Marcel: Automatisierte Erstellung von Pressedossiers durch Textmining: Kontextualierung im journalistischen Umfeld Masterseminar Ausarbeitung FELDMAN, Ronen; SANGER, James: The Text Mining Handbook: Advanced Approaches in Analysing Unstructured Data. Cambridge University Press, 2007 MACQUEEN, J.: Some methods for classification and analysis of multivariate observations. Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1: London, UK: Cambridge University Press LIU, Yuan-Chao; LIU, Ming; WANG, Ming: Application of Self-Organizing Maps in Text Clustering: A Review, Applications of Self-Organizing Maps Paul Assendorp Automatisierte Dossier-Erstellung 37

38 Vielen Dank für die Aufmerksamkeit! Gibt es Fragen? Paul Assendorp Automatisierte Dossier-Erstellung 38

Text-Mining: Einführung

Text-Mining: Einführung Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:

Mehr

Predictive Modeling Markup Language. Thomas Morandell

Predictive Modeling Markup Language. Thomas Morandell Predictive Modeling Markup Language Thomas Morandell Index Einführung PMML als Standard für den Austausch von Data Mining Ergebnissen/Prozessen Allgemeine Struktur eines PMML Dokuments Beispiel von PMML

Mehr

Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1

Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 Daten haben wir reichlich! 25.04.14 The unbelievable Machine Company 1 2.800.000.000.000.000.000.000 Bytes Daten im Jahr 2012* * Wenn jedes Byte einem Buchstaben entspricht und wir 1000 Buchstaben auf

Mehr

Text Mining. Joachim Schole. Fakultät Technik und Informatik Hochschule für angewandte Wissenschaften Hamburg. Grundseminar, WS 2014

Text Mining. Joachim Schole. Fakultät Technik und Informatik Hochschule für angewandte Wissenschaften Hamburg. Grundseminar, WS 2014 Text Mining Joachim Schole Fakultät Technik und Informatik Hochschule für angewandte Wissenschaften Hamburg Grundseminar, WS 2014 Joachim Schole (HAW Hamburg) Text Mining Grundseminar, WS 2014 1 / 26 Agenda

Mehr

Seminar aus Netzwerke und Sicherheit

Seminar aus Netzwerke und Sicherheit Seminar aus Netzwerke und Sicherheit Security in Business Applications Vorbesprechung 16.10.2008 Dr. Andreas Putzinger WS09/10 1 Intention Seminar kann als 2h BAK Seminar angerechnet werden. Zweiergruppen

Mehr

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion

Web Information Retrieval. Zwischendiskussion. Überblick. Meta-Suchmaschinen und Fusion (auch Rank Aggregation) Fusion Web Information Retrieval Hauptseminar Sommersemester 2003 Thomas Mandl Überblick Mehrsprachigkeit Multimedialität Heterogenität Qualität, semantisch, technisch Struktur Links HTML Struktur Technologische

Mehr

26. GIL Jahrestagung

26. GIL Jahrestagung GeorgAugustUniversität Göttingen 26. GIL Jahrestagung Einsatz von künstlichen Neuronalen Netzen im Informationsmanagement der Land und Ernährungswirtschaft: Ein empirischer Methodenvergleich Holger Schulze,

Mehr

Seminar. NoSQL Datenbank Technologien. Michaela Rindt - Christopher Pietsch. Richtlinien Ausarbeitung (15. November 2015)

Seminar. NoSQL Datenbank Technologien. Michaela Rindt - Christopher Pietsch. Richtlinien Ausarbeitung (15. November 2015) Seminar Datenbank Technologien Richtlinien Ausarbeitung (15. November 2015) Michaela Rindt - Christopher Pietsch Agenda 1 2 3 1 / 12 Richtlinien Ausarbeitung (15. November 2015) Teil 1 2 / 12 Richtlinien

Mehr

SALSAH eine virtuelle Forschungsumgebung für die Geisteswissenschaften

SALSAH eine virtuelle Forschungsumgebung für die Geisteswissenschaften SALSAH eine virtuelle Forschungsumgebung für die Geisteswissenschaften Zusammenfassung: Abstract: Einführung genuin digital Virtuelle Forschungsumgebungen für die Geisteswissenschaften in Bezug auf die

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006 Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet

Mehr

Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume

Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume Data Mining Künstliche Neuronale Netze vs. Entscheidungsbäume Grundseminar HAW Master Informatik 18.04.2017 Inhaltsübersicht Data Mining & Begriffswelt des Data Mining Klassifikation & Klassifikatoren

Mehr

Projekt Eurodelphes: Multimedia im Geschichtsunterricht

Projekt Eurodelphes: Multimedia im Geschichtsunterricht Projekt Eurodelphes: Multimedia im Geschichtsunterricht Priv.Doz. Gerrit Kalkbrenner Gliederung Ziele des Projektes Partner Didaktisches Konzept Ergebnisse Vorführung 2 Ziele des Projektes Multimedia im

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2012, SS 2012 1 Data Mining Pipeline Planung Aufbereitung Modellbildung Auswertung Wir wollen nützliches Wissen

Mehr

Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour auf bibliografischen Metadaten

Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour auf bibliografischen Metadaten Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour auf bibliografischen Metadaten Magnus Pfeffer (Dipl.-Inform., M.A. LIS) Universität Mannheim, Universitätsbibliothek [email protected]

Mehr

Exploration und Klassifikation von BigData

Exploration und Klassifikation von BigData Exploration und Klassifikation von BigData Inhalt Einführung Daten Data Mining: Vorbereitungen Clustering Konvexe Hülle Fragen Google: Riesige Datenmengen (2009: Prozessieren von 24 Petabytes pro Tag)

Mehr

Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen

Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut, keine vorgegebenen Klassen 7. Clusteranalyse (= Häufungsanalyse; Clustering-Verfahren) wird der multivariaten Statistik zugeordnet Voraussetzung wieder: Datenraum mit Instanzen, mehrere Attribute - kein ausgezeichnetes Zielattribut,

Mehr

Lenkung der QM-Dokumentation

Lenkung der QM-Dokumentation Datum des LAV-Beschlusses: 08.05.2007 Seite1 von 5 Inhalt 1 Zweck, Ziel... 1 2 Geltungsbereich... 1 3 Begriffe, Definitionen... 1 4 Beschreibung... 2 4.1 Struktur der QM-Dokumentation... 2 4.2 Aufbau der

Mehr

Advanced Analytics. Michael Ridder. Copyright 2000-2014 TIBCO Software Inc.

Advanced Analytics. Michael Ridder. Copyright 2000-2014 TIBCO Software Inc. Advanced Analytics Michael Ridder Was ist Advanced Analytics? 2 Was heißt Advanced Analytics? Advanced Analytics ist die autonome oder halbautonome Prüfung von Daten oder Inhalten mit ausgefeilten Techniken

Mehr

Mehr Umsatz durch Übersetzungen? Geht das?

Mehr Umsatz durch Übersetzungen? Geht das? 1 Mehr Umsatz durch Übersetzungen? Geht das? 2 Wozu sollen wir unsere Homepage übersetzen lassen? Unsere Geschäftspartner finden auch so alles, was sie wissen müssen. Diese und ähnliche Aussagen sind nicht

Mehr

Ansatz für einen CIDOC-CRM-Editor

Ansatz für einen CIDOC-CRM-Editor Ansatz für einen CIDOC-CRM-Editor HS WS 08/09: Das Semantic Web in Papierform und Praxis: CIDOC-CRM Dozent: Prof. Dr. Thaller Referent: Stefan Oertel Inhalt Grundsätzliche Anforderungen Welche Lösungen

Mehr

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery

Seminar Business Intelligence Teil II. Data Mining & Knowledge Discovery Seminar Business Intelligence Teil II Data Mining & Knowledge Discovery Was ist Data Mining? Sabine Queckbörner Was ist Data Mining? Data Mining Was ist Data Mining? Nach welchen Mustern wird gesucht?

Mehr

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller

Was ist Analyse? Hannover, CeBIT 2014 Patrick Keller Was ist? Hannover, CeBIT 2014 Patrick Keller Business Application Research Center Historie 1994: Beginn der Untersuchung von Business-Intelligence-Software am Lehrstuhl Wirtschaftsinformatik der Universität

Mehr

WEKA A Machine Learning Interface for Data Mining

WEKA A Machine Learning Interface for Data Mining WEKA A Machine Learning Interface for Data Mining Frank Eibe, Mark Hall, Geoffrey Holmes, Richard Kirkby, Bernhard Pfahringer, Ian H. Witten Reinhard Klaus Losse Künstliche Intelligenz II WS 2009/2010

Mehr

www.uni-erfurt.de/target/ringvorlesungen

www.uni-erfurt.de/target/ringvorlesungen www.uni-erfurt.de/target/ringvorlesungen Digitale Spiele als Ab-Bild der realen Welt Die Sicht eines Computergraphikers Paul Grimm Computer Graphics Applied Computer Science Erfurt University of Applied

Mehr

Soziale Netzwerke: Chance zur Verbesserung der Kommunikation mit den Bürgern

Soziale Netzwerke: Chance zur Verbesserung der Kommunikation mit den Bürgern Soziale Netzwerke: Chance zur Verbesserung der Kommunikation mit den Bürgern Dr. André Schulz SAS Deutschland Göttingen, 6. September 2012 SAS Institute Ein Unternehmen der Zahlen SAS is the first company

Mehr

10 SCHRITTE, UM EINE SPRACHE ERFOLGREICH ZU LERNEN SCHRITT 1

10 SCHRITTE, UM EINE SPRACHE ERFOLGREICH ZU LERNEN SCHRITT 1 ZE Sprachenzentrum 10 SCHRITTE, UM EINE SPRACHE ERFOLGREICH ZU LERNEN Zu jedem Schritt finden Sie im Selbstlernzentrum und auf unserer Internetseite Fragebögen, Lerntipps und andere Materialien aus, die

Mehr

Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale?

Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale? Text Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale? Textklassifikationen Natürliche bzw. unstrukturierte Texte Normale Texte ohne besondere Merkmale und Struktur Semistrukturierte

Mehr

Webseiten und Web-Apps grafisch gestalten mit HTML5 Canvas ohne Flash und sonstige Tools

Webseiten und Web-Apps grafisch gestalten mit HTML5 Canvas ohne Flash und sonstige Tools Webseiten und Web-Apps grafisch gestalten mit HTML5 Canvas ohne Flash und sonstige Tools 1 Kurze HTML-Geschichte Die HTML4-Spezifikation wurde im Dezember 1997 vorgelegt. Seitdem Stagnation! Das W3C arbeitete

Mehr

Social Media Krisen. Marcus Strobel

Social Media Krisen. Marcus Strobel Social Media Krisen Marcus Strobel Aufwärmprogramm Social Media Hass & Liebe zugleich Digitale Visitenkarte Gilt für Personen, Unternehmen & Marken Treiber der Entwicklung Wo stehen wir heute? Das Social

Mehr

Big Data Modewort oder echter Mehrwert. freenet Group Dr. Florian Johannsen

Big Data Modewort oder echter Mehrwert. freenet Group Dr. Florian Johannsen Big Data Modewort oder echter Mehrwert freenet Group Dr. Florian Johannsen freenet Group 2 Titel der Präsentation 07.07.2015 Mobilfunkgeschäft der freenet Group Austausch von Daten und Informationen Im

Mehr

Part-Of-Speech-Tagging mit Viterbi Algorithmus

Part-Of-Speech-Tagging mit Viterbi Algorithmus Part-Of-Speech-Tagging mit Viterbi Algorithmus HS Endliche Automaten Inna Nickel, Julia Konstantinova 19.07.2010 1 / 21 Gliederung 1 Motivation 2 Theoretische Grundlagen Hidden Markov Model Viterbi Algorithmus

Mehr

Optimieren Sie Ihre n2n Webseite

Optimieren Sie Ihre n2n Webseite N2N Autor: Bert Hofmänner 5.10.2011 Optimieren Sie Ihre n2n Webseite Einer der wichtigsten Faktoren für den Erfolg Ihrer Webseite in Suchmaschinen sind deren Inhalte. Diese können Sie mit einem Content

Mehr

!Umfrage!zum!deutschen!Mark!für! Persönlichkeitsdiagnostik!

!Umfrage!zum!deutschen!Mark!für! Persönlichkeitsdiagnostik! Ergebnissberichtzur UmfragezumdeutschenMarkfür Persönlichkeitsdiagnostik InnermetrixDeutschlandundPEpersonalityexpertshabenimJuli2013eineUmfragezum deutschenmarkfürpersönlichkeitsdiagnostikdurchgeführt.

Mehr

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl

C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl C09: Einsatz SAP BW im Vergleich zur Best-of-Breed-Produktauswahl Ein Seminar der DWH academy Seminar C09 Einsatz SAP BW im Vergleich zur Best-of-Breed- Produktauswahl Befasst man sich im DWH mit der Auswahl

Mehr

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik

Data Warehousing. Sommersemester 2005. Ulf Leser Wissensmanagement in der Bioinformatik Data Warehousing Sommersemester 2005 Ulf Leser Wissensmanagement in der Bioinformatik ... Der typische Walmart Kaufagent verwendet täglich mächtige Data Mining Werkzeuge, um die Daten der 300 Terabyte

Mehr

Neue Medien in der Erwachsenenbildung

Neue Medien in der Erwachsenenbildung Stang, Richard Neue Medien in der Erwachsenenbildung Statement zum DIE-Forum Weiterbildung 2000 "Zukunftsfelder der Erwachsenenbildung" Deutsches Institut für Erwachsenenbildung Online im Internet: URL:

Mehr

RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften Katharina Morik

RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften Katharina Morik technische universität RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften Katharina Morik Name Autor Ort und Datum Informatik: Linguistik: Methoden + Verfahren Forschungsfragen, Anforderungen

Mehr

Ergebnis der Kundenumfrage zum ArticleSpinningWizard2

Ergebnis der Kundenumfrage zum ArticleSpinningWizard2 Ergebnis der Kundenumfrage zum ArticleSpinningWizard2 Wir haben im März 2013 alle Kunden unserer Software ArticleSpinningWizard2, in den Versionen Standard und Professional, zu einer Kundenumfrage eingeladen.

Mehr

BigData Wie wichtig ist die Datenqualität bei der Analyse und Auswertung von großen Daten Praxisbeispiel. Christin Otto

BigData Wie wichtig ist die Datenqualität bei der Analyse und Auswertung von großen Daten Praxisbeispiel. Christin Otto BigData Wie wichtig ist die qualität bei der Analyse und Auswertung von großen Praxisbeispiel Christin Otto Was ist Big Data? Der Big Data Prozess Sammlung und Speicherung von Analyse der zum Gewinn von

Mehr

Onlinemarketing. Brauchen Gründer eine Webseite?

Onlinemarketing. Brauchen Gründer eine Webseite? Onlinemarketing Brauchen Gründer eine Webseite? Gliederung 1. Warum brauchen Gründer eine Webseite? 2. Wie muss die Webseite aussehen? 3. Was ist Onlinemarketing? 4. Warum sollten Gründer Onlinemarketing

Mehr

Freunde, Fans und Faszinationen: Das Potenzial von Social Media

Freunde, Fans und Faszinationen: Das Potenzial von Social Media Freunde, Fans und Faszinationen: Das Potenzial von Social Media Claus Fesel, DATEV eg PEAK, 5. Symposium für Verbundgruppen und Franchisesysteme Berlin, 10.05.2011 Social Media 13.05.2011 Social Media

Mehr

Data Mining als Arbeitsprozess

Data Mining als Arbeitsprozess Data Mining als Arbeitsprozess Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 31. Dezember 2015 In Unternehmen werden umfangreichere Aktivitäten oder Projekte im Bereich des Data Mining

Mehr

Methoden zur Visualisierung von Ergebnissen aus Optimierungs- und DOE-Studien

Methoden zur Visualisierung von Ergebnissen aus Optimierungs- und DOE-Studien Methoden zur Visualisierung von Ergebnissen aus Optimierungs- und DOE-Studien Katharina Witowski [email protected] Übersicht Beispiel Allgemeines zum LS-OPT Viewer Visualisierung von Simulationsergebnissen

Mehr

Elfenbeinturm 2.0 Wissenschaftskommunikation in Zeiten von Social Media recensio.net Rezensionsplattform für die europäische Geschichtswissenschaft

Elfenbeinturm 2.0 Wissenschaftskommunikation in Zeiten von Social Media recensio.net Rezensionsplattform für die europäische Geschichtswissenschaft Elfenbeinturm 2.0 Wissenschaftskommunikation in Zeiten von Social Media recensio.net Rezensionsplattform für die europäische Geschichtswissenschaft emedientage, 15. November 2012 recensio.net Bietet Historikern

Mehr

Entwicklung einer Methode zur Bewertung der Transformierbarkeit von On-Premise Anwendungssystemen in Software as a Service Lösungen

Entwicklung einer Methode zur Bewertung der Transformierbarkeit von On-Premise Anwendungssystemen in Software as a Service Lösungen Fakultät für Informatik Technische Universität München Entwicklung einer Methode zur Bewertung der Transformierbarkeit von On-Premise Anwendungssystemen in Software as a Service Lösungen Bachelorarbeit

Mehr

Map Reduce on Hadoop Seminar SS09. Similarity Join. Tim Felgentreff, Andrina Mascher

Map Reduce on Hadoop Seminar SS09. Similarity Join. Tim Felgentreff, Andrina Mascher Map Reduce on Hadoop Seminar SS09 Similarity Join Tim Felgentreff, Andrina Mascher Gliederung 2!! Aufgabe!! Demo!! Algorithmus!! Performance!! Veränderte Aufgabenstellung:!! Vergleich mit 1 Seite!! Ausblick!!

Mehr

myportal.robinson.de Social Infused Intranet @ ROBINSON

myportal.robinson.de Social Infused Intranet @ ROBINSON Social Infused Intranet @ ROBINSON Robinson Club GmbH Thema Name 14.06.2012 Folie 1 Agenda Wer ist ROBINSON Motivation für ein neues Intranet Projektablauf Der Lösungsansatz Die Lösung Next Steps Robinson

Mehr

Big Data Projekte richtig managen!

Big Data Projekte richtig managen! Big Data Projekte richtig managen! Stuttgart, Oktober 2014 Praktische Herausforderungen eines Big Data Projektes Definition: Was ist Big Data? Big data is a collection of data sets so large and comple

Mehr

Data Mining in SAP NetWeaver BI

Data Mining in SAP NetWeaver BI Martin Kießwetter, Dirk Vahl kam p Data Mining in SAP NetWeaver BI Galileo Press Bonn Boston 2.1 Was ist Data Mining? 17 2.2 Data Mining, KDD und Business Intelligence 20 2.3 KDD-Prozessmodelle 22 2.4

Mehr

Warum sich das Management nicht für agile Softwareentwicklung interessieren sollte - aber für Agilität

Warum sich das Management nicht für agile Softwareentwicklung interessieren sollte - aber für Agilität Warum sich das Management nicht für agile Softwareentwicklung interessieren sollte - aber für Agilität Marcus Winteroll oose GmbH Agenda I. Ziele und Zusammenarbeit II. Was wir vom agilen Vorgehen lernen

Mehr

Knowledge Management in der Technischen Dokumentation. Knowledge Management in der Technischen Dokumentation

Knowledge Management in der Technischen Dokumentation. Knowledge Management in der Technischen Dokumentation Knowledge Management in der Technischen Dokumentation Comet Communication GmbH 06. November 2008 Elke Grundmann Was ist Wissen? Wissen ist Wahrnehmung ODER Erkenntniszustand allgemeiner intersubjektiv-vermittelter

Mehr

Organisation und Systeme SOA: Erstellung von Templates für WebService Consumer und Provider in Java

Organisation und Systeme SOA: Erstellung von Templates für WebService Consumer und Provider in Java SOA: Erstellung von Templates für WebService Consumer und Provider in Java Entwicklung von Java WebService Provider- und Consumer-Bibliotheken zur Standardisierung der Karmann WebService Landschaft. Konzeption

Mehr

Die TMB Contentstrategie die wichtigste Folie!

Die TMB Contentstrategie die wichtigste Folie! Rückblick auf die Werkstätten des gestrigen Tages mit Ausblick & Handlungsempfehlungen für den Tourismus in Brandenburg Dialog zwischen Dieter Hütte und Jan Hoffmann im Rahmen des Tages des Brandenburgischen

Mehr

Was meinen die Leute eigentlich mit: Grexit?

Was meinen die Leute eigentlich mit: Grexit? Was meinen die Leute eigentlich mit: Grexit? Grexit sind eigentlich 2 Wörter. 1. Griechenland 2. Exit Exit ist ein englisches Wort. Es bedeutet: Ausgang. Aber was haben diese 2 Sachen mit-einander zu tun?

Mehr

Universität zu Köln Prof. Dr. Manfred Thaller Aktuelle Probleme digitaler Medien Referat von Marcel Kemmerich vom 18.12.14

Universität zu Köln Prof. Dr. Manfred Thaller Aktuelle Probleme digitaler Medien Referat von Marcel Kemmerich vom 18.12.14 Universität zu Köln Prof. Dr. Manfred Thaller Aktuelle Probleme digitaler Medien Referat von Marcel Kemmerich vom 18.12.14 Inhalt Das Deep Web Tor-Netzwerk & Hidden Services Hacktivism Regierung im Deep

Mehr

Social Media-Trendmonitor

Social Media-Trendmonitor Social Media-Trendmonitor Wohin steuern Unternehmen und Redaktionen im Social Web? Mai 2014 Social Media-Trendmonitor Inhalt Untersuchungsansatz Themenschwerpunkte Ergebnisse Seite 2 Untersuchungsansatz

Mehr

Inhaltsverzeichnis VII

Inhaltsverzeichnis VII Inhaltsverzeichnis 1 Der Aufbruch zum Digitalen Unternehmen........................... 1 1.1 Die Vorreiter................................................. 4 1.1.1 Die soziale Vernetzung bei CEMEX........................

Mehr

Konzept Themenkarte zur Verbesserung von Reviews

Konzept Themenkarte zur Verbesserung von Reviews Konzept Themenkarte zur Verbesserung von Reviews Daniel Ott Requirements Management GR/PST/25.11.11 GR/PST 25.11.11 1 Inhalt Motivation Anforderungsdokumente in der Praxis Probleme in der Qualitätssicherung

Mehr

SEO. am Beispiel von. Jürgen Schlott

SEO. am Beispiel von. Jürgen Schlott SEO am Beispiel von. Jürgen Schlott Kurzvorstellung Jürgen Schlott Director Marketing/Produkt FOCUS Online Seit 2006 verantwortlich für SEO Derzeit verantwortlich für Seite 2 - Das Konkurrenzumfeld Seite

Mehr

Erfassung der Leserprofile des VDZ-Newsletters New Media Trends & Insights USA

Erfassung der Leserprofile des VDZ-Newsletters New Media Trends & Insights USA Erfassung der Leserprofile des VDZ-Newsletters New Media Trends & Insights USA Alexander v. Reibnitz Geschäftsführer Digitale Medien und Neue Geschäftsfelder Berlin, 20. Februar 2006 Die Leserprofile des

Mehr

Better Backlinking Semantische Kategorisierung von Websites

Better Backlinking Semantische Kategorisierung von Websites Better Backlinking Semantische Kategorisierung von Websites Stephan Sommer-Schulz [email protected] Inhaltsübersicht 1. Ziel: Kategorisierung 2. Backlinks 3. Kategorien - Auswahl 4. Semantische Verfahren

Mehr

Latein an der Bettinaschule

Latein an der Bettinaschule Latein an der Bettinaschule Bettinaschule Frankfurt am Main Inhaltsverzeichnis Warum und wozu überhaupt Latein? Argumente für Latein als 2. Fremdsprache Was bietet die Bettinaschule? Was ist bei der Wahl

Mehr

HOW TO CREATE A FACEBOOK PAGE.

HOW TO CREATE A FACEBOOK PAGE. FAME FACT FIRST IN SOCIALTAINMENT SOCIAL MEDIA INSIGHTS KOSTENLOSE REPORTS, WHITEPAPERS UND WERTVOLLE LINKS HOW TO CREATE A FACEBOOK PAGE. famefact track by track GmbH, Schönhauser Allee 48, 10437 Berlin,

Mehr

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374

DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN. Nr. 374 DISKUSSIONSBEITRÄGE DER FAKULTÄT FÜR BETRIEBSWIRTSCHAFTSLEHRE MERCATOR SCHOOL OF MANAGEMENT UNIVERSITÄT DUISBURG-ESSEN Nr. 374 Eignung von Verfahren der Mustererkennung im Process Mining Sabrina Kohne

Mehr

Peter A. Henning/Anders T. Lehr (Hrsg.) Best Practice in E-Learning

Peter A. Henning/Anders T. Lehr (Hrsg.) Best Practice in E-Learning Peter A. Henning/Anders T. Lehr (Hrsg.) Best Practice in E-Learning 51 51 E-Learning ist nicht nur ein nationaler Wachstumsmarkt in allen Ländern der Europäischen Union, sondern bietet auch eine

Mehr

Big Data - Fluch oder Segen?

Big Data - Fluch oder Segen? mitp Professional Big Data - Fluch oder Segen? Unternehmen im Spiegel gesellschaftlichen Wandels von Ronald Bachmann, Guido Kemper, Thomas Gerzer 1. Auflage Big Data - Fluch oder Segen? Bachmann / Kemper

Mehr

Der Begriff Cloud. Eine Spurensuche. Patric Hafner 29.06.2012. geops

Der Begriff Cloud. Eine Spurensuche. Patric Hafner 29.06.2012. geops Der Begriff Cloud Eine Spurensuche Patric Hafner geops 29.06.2012 Motivation Der größte Hype der IT-Branche Hype heißt sowohl Rummel als auch Schwindel slashdot.org The cloud represents a foundational

Mehr

Der Business Analyst in der Rolle des agilen Product Owners

Der Business Analyst in der Rolle des agilen Product Owners Der Business Analyst in der Rolle des agilen Owners HOOD GmbH Susanne Mühlbauer Büro München Keltenring 7 82041 Oberhaching Germany Tel: 0049 89 4512 53 0 www.hood-group.com -1- Inhalte Agile Software

Mehr

IMS - Learning Design

IMS - Learning Design IMS - Learning Design Ein Vortrag zum Thema Learning Design von Maayan Weiss Inhalt Was ist IMS Learning Design? Kurzer Einblick Welche Lücken gibt es im e-learning? Was hat IMS-LD zu bieten. Wie sieht

Mehr

Die Bedeutung funktionaler Stadtregionen in der EU- Strukturfondsperiode 2014-2020

Die Bedeutung funktionaler Stadtregionen in der EU- Strukturfondsperiode 2014-2020 Die Bedeutung funktionaler Stadtregionen in der EU- Strukturfondsperiode 2014-2020 Barbara Crome Generaldirektion Europäische Kommission 1. Österreichischer Stadtregionstag und 56. Tagung des deutschösterreichischen

Mehr

Customer Service Social Media Radar

Customer Service Social Media Radar Customer Service Social Media Radar Tools für das Social Media Servicemanagement 31.10.2011 1 NICHT WAS SIE SAGEN, DEFINIERT HEUTE IHRE MARKE, SONDERN WAS DIE VERBRAUCHER ÜBER SIE SAGEN 31.10.2011 2 Kommunika?on

Mehr

Interactive exploration of neural networks in Python. 3-d simulation of the e-puck robot in virtual environments

Interactive exploration of neural networks in Python. 3-d simulation of the e-puck robot in virtual environments Studienprojekte Sommersemester 2014 Interactive exploration of neural networks in Python 3-d simulation of the e-puck robot in virtual environments, [email protected] Mercator Research Group Structure of Memory

Mehr

Cesium. Virtueller 3D Globus im Web. Elisabeth Leu, Camptocamp SA Emmanuel Belo, Camptocamp SA

Cesium. Virtueller 3D Globus im Web. Elisabeth Leu, Camptocamp SA Emmanuel Belo, Camptocamp SA Cesium Virtueller 3D Globus im Web Elisabeth Leu, Camptocamp SA Emmanuel Belo, Camptocamp SA Übersicht Camptocamp Was ist Cesium? Datenquellen Features OL3 Cesium Ausblick 2/41 Open Source Lösungen als

Mehr

HERZLICH WILLKOMMEN!

HERZLICH WILLKOMMEN! HERZLICH WILLKOMMEN! WORKSHOP: TEXTEN FÜR SOCIAL MEDIA UND WEB. EIN CRASHKURS FÜR EILIGE. Jens Reineking kurz präzise geistreich Hannover kurz präzise geistreich Wirkungsvolle Texte Welches ist Ihr Lieblingswort?

Mehr

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model

Mehr

... Peter Woetzel Director Product Management Online Software AG

... Peter Woetzel Director Product Management Online Software AG PRESTIGEenterprise Peter Woetzel Director Product Management Online Software AG PRESTIGEenterprise PRESTIGEenterprise 2015 PRESTIGEenterprise 4.3» Kampagnenorientierte Playlist Planung» Nachtschaltung

Mehr

Big & Smart Data. [email protected]

Big & Smart Data. bernard.bekavac@htwchur.ch Big & Smart Data Prof. Dr. Bernard Bekavac Schweizerisches Institut für Informationswissenschaft SII Studienleiter Bachelor of Science in Information Science [email protected] Quiz An welchem

Mehr

Informationsveranstaltung Master Wiwi. Major: Finance. Prof. Dr. Marcel Prokopczuk, CFA Institut für Finanzmarkttheorie

Informationsveranstaltung Master Wiwi. Major: Finance. Prof. Dr. Marcel Prokopczuk, CFA Institut für Finanzmarkttheorie Informationsveranstaltung Master Wiwi Major: Finance Prof. Dr. Marcel Prokopczuk, CFA Institut für Finanzmarkttheorie Beteiligte Institute am Major Finance Institut für Banken und Finanzierung Institut

Mehr

Best Practice: Integration von RedDot mit Livelink DM im Intranet/Extranet

Best Practice: Integration von RedDot mit Livelink DM im Intranet/Extranet Competence for the next level. Best Practice: Integration von RedDot mit Livelink DM im Intranet/Extranet Als Internet Company realisieren wir erfolgreiche E-Business Projekte für den Mittelstand & Großunternehmen.

Mehr

Umfrage. Social Media Monitoring

Umfrage. Social Media Monitoring Umfrage Social Media Monitoring Social Media Trendmonitor Inhalt Untersuchungsansatz Themenschwerpunkte Ergebnisse erstellt von / am LD / 08.03.2011 // 08.04.2011 geprüft von / am KS / 08.03.2011 freigegeben

Mehr

Informationsflut bewältigen - Textmining in der Praxis

Informationsflut bewältigen - Textmining in der Praxis Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland

Mehr

Überblick und Vergleich von NoSQL. Datenbanksystemen

Überblick und Vergleich von NoSQL. Datenbanksystemen Fakultät Informatik Hauptseminar Technische Informationssysteme Überblick und Vergleich von NoSQL Christian Oelsner Dresden, 20. Mai 2011 1 1. Einführung 2. Historisches & Definition 3. Kategorien von

Mehr

Grundlagen der Presse- und Öffentlichkeitsarbeit

Grundlagen der Presse- und Öffentlichkeitsarbeit Grundlagen der Presse- und Öffentlichkeitsarbeit Workshop zum Vorbereitungsseminar zu den Aktionstagen kein sexismus an hochschulen vom 14. bis 16. März 2008 in der Jugendherberge Kassel Wozu Öffentlichkeitsarbeit?!

Mehr

Clusteranalyse. Multivariate Datenanalyse. Prof. Dr. Dietmar Maringer. Abteilung für Quantitative Methoden, WWZ der Universität Basel

Clusteranalyse. Multivariate Datenanalyse. Prof. Dr. Dietmar Maringer. Abteilung für Quantitative Methoden, WWZ der Universität Basel Clusteranalyse Multivariate Datenanalyse Prof. Dr. Dietmar Maringer Abteilung für Quantitative Methoden, WWZ der Universität Basel Herbstsemester 2013 D Maringer: Datenanalyse Clusteranalyse (1) Ausgangssituation

Mehr

Textdokument-Suche auf dem Rechner Implementierungsprojekt

Textdokument-Suche auf dem Rechner Implementierungsprojekt Textdokument-Suche auf dem Rechner Implementierungsprojekt Referent: Oliver Petra Seminar: Information Retrieval Institut für Computerlinguistik Ruprecht-Karls-Universität Heidelberg 19.01.2015 Überblick

Mehr

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit,

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit, Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit, Wie kann ein PDF File angezeigt werden? kann mit Acrobat-Viewern angezeigt werden auf jeder Plattform!! (Unix,

Mehr

Komfort vs. Sicherheit. Prof. Dr. Klaus-Peter Kossakowski HAW Hamburg // DFN-CERT Services GmbH

Komfort vs. Sicherheit. Prof. Dr. Klaus-Peter Kossakowski HAW Hamburg // DFN-CERT Services GmbH Komfort vs. Sicherheit Prof. Dr. Klaus-Peter Kossakowski HAW Hamburg // DFN-CERT Services GmbH 2003-2011 DFN-CERT Services GmbH / Bochum // 19. Mai 2015 Folie 1 Fakt ist... Heute sind wir Menschen das

Mehr

Praktikum Einführung

Praktikum Einführung Praktikum Einführung Praktikum im Rahmen der Veranstaltung Sicherheit in Netzen im WS 08/09 Praktikumsleiter: Holger Plett Agenda Motivation AVISPA Einleitung Aufbau des Frameworks Elemente des Frameworks

Mehr

Selbstorganisierende Karten

Selbstorganisierende Karten Selbstorganisierende Karten Yacin Bessas [email protected] Proseminar Neuronale Netze 1 Einleitung 1.1 Kurzüberblick Die Selbstorganisierenden Karten, auch Self-Organizing (Feature) Maps, Kohonen-

Mehr

Was ist LDAP. Aufbau einer LDAP-Injection. Sicherheitsmaßnahmen. Agenda. LDAP-Injection. ITSB2006 WS 09/10 Netzwerkkonfiguration und Security

Was ist LDAP. Aufbau einer LDAP-Injection. Sicherheitsmaßnahmen. Agenda. LDAP-Injection. ITSB2006 WS 09/10 Netzwerkkonfiguration und Security Agenda Was ist LDAP Aufbau einer Sicherheitsmaßnahmen Was ist LDAP Abstract RFC4510 The Lightweight Directory Access Protocol (LDAP) is an Internetprotocol for accessing distributed directory services

Mehr

In 9 Schritten zum passenden Monitoring Tool. Die Universal-Checkliste für B2B-Unternehmen

In 9 Schritten zum passenden Monitoring Tool. Die Universal-Checkliste für B2B-Unternehmen In 9 Schritten zum passenden Monitoring Tool Die Universal-Checkliste für B2B-Unternehmen Schritt 1: Zielsetzung Welchen Zweck muss ein Monitoring Tool für Ihr Unternehmen erfüllen? Umfassende Themen-

Mehr