Forschunsprojekte und Independent Coursework. Prof. Dr. Christian Herta 29. Januar 2013

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Forschunsprojekte und Independent Coursework. Prof. Dr. Christian Herta 29. Januar 2013"

Transkript

1 Forschunsprojekte und Independent Coursework Prof. Dr. Christian Herta 29. Januar 2013

2 Forschungsgebiete Suchtechnologie, Text- und Webmining Verarbeitung unstrukturierter Daten, insbesondere Text Large scale Data-Analysis Hadoop-Ökosystem, Spark Maschinelles Lernen, Neuronale Netze, Deep Learning

3 Ziel: Aufbau eines Informationssystem Lehre/Lernen Datenbasis Webseiten, insbesondere Crawling der deutschen Hochschulwebseiten Skripte im pdf-format, etc. Anleitungen weitere Wissenbasen Soziale Interaktion Empfehlungen, Einstufen des Niveaus der Scripte

4 Module - Forschungsthemen Im Rahmen des Forschungsprojektes: Module entwickeln Klassifikation Erzeugung von Metadaten zur Verbesserung der Suche

5 Ziel: Entwicklung von wiederverwendbaren Modulen Verwendung von vorgegebenen Technologien/Frameworks Programmiersprache Java, Buildsystem maven Solr, UIMA, Gate, OpenNLP, libsvm

6 Forschungsprojekte

7 Autoverschlagwortung Kandidatenerzeugung Nomen (POS-Tagging) Nominalphrasen (regex auf POS-Tags) Ranking mittels maschinelles Lernen (libsvm etc.) Klassifikationsentscheidung Zweiklassenproblem: yes/no

8 Hierarchische Dokumenten-Klassifikation mit Hilfe von Ontologien Aufbau eine Taxonony im RDF(S)/OWL Format (z.b. mit Protege) für eine oder mehrere Fachdomänen der Lehre, wie Informatik, BWL... Automatische Einordnung von (gespiderten) Dokumenten (Hochschulcrawl) in die Taxonomie

9 Web Wrapping Beschränkung auf: Extraktion von relevanten Text aus HTML-Webseiten am Beispiel eines Hochschulcrawls Technologie: UIMA, Bibliotheken des maschinellen Lernens, wie libsvm, opennlp oder Entwicklung eines Informationsextraktionsystems mittels XPath, etc für feste Hosts Entwicklungslastig wichtig saubere, generische Umsetzung

10 Autoencoder basierend auf Neuronalen Netzen zur Ähnlichkeitsberechnung Beispieldatensatz: Xing Crawl Ich biete C++, Java, Programmieren,.. Berechung Buchhaltung, Controlling Input: Tag-Cloud Ähnlichste Begriffe zur Tag-Cloud Bestehender Code-Basis Assoziert mit Deep Learning

11 Automatischer Aufbau von Domänen-Vokabular (am Beispiel: Fachdomäne der Lehre, wie Informatik, BWL...) Phrasenerkennung (Nominalphrasen) mit computerlinguistischen und statistischen Methoden (POS-Tagging etc.) Erzeugung von Domänenvokabular unter Verwendung von statistischen oder informationstheoretischen Maßen (Term- Häufigkeitsverteilungen, Vergleichskorpora) oder mittels maschinellen Lernens (wie opennlp)

12 Entwicklung einer webbasierten Nutzerschnittstelle für das Lehr-/Lerninformationssystem auch als Kleingruppenarbeit inkl. Bewertungen und soziale Interaktion Technologie: Backend: JavaEE 6 oder Spring DI/MVC/Security/Data Persistenz und Suche: JPA, Solr und NoSql Datenbanken Viewtechnologie und Client: Vaadin, Freemarker, JSF, JSP, JQuery

13 Big Data und Online-Abfragen auf großen textuellen Datenquellen Datenhaltung in Dokumentendatenbanken, Columnstores, spezielle Datenstrukturen zur schnellen Abfrage Abfragen mittels Hearstpattern Spark zur Analyse von textuellen Daten Pig Latin Korpus z.b. Wikipedia und Crawls.. neben Text auch Linkgraph, Kategoriensystem etc. Vorverarbeitung: UIMA-Pipeline

14 Untersuchung und Vergleich verschiedener Verteilungsplattformen in Bezug auf die Anwendbarkeit im Data-Mining -speziell auf Deep Learning von Neuronalen Netzen. Hadoop Apache Hama Spark Nephele/PACT (TU Berlin) SciDB (Stonebraker)

15 Randbedingungen für Forschungsprojekt Programmiersprache: Java, Scala, (Groovy, Clojure) Verwenden von vorgegebenen Infrastrukturkomponenten und Bibliotheken, wie UIMA, Solr, Softwarequalität TDD Projektorganisation Regelmäßige Treffen (2-Wochen Rhythmus) Zielsetzung und Vorstellung der Ergebnisse

16 Independent Cousework Idealerweise assoziert zu den Forschungsprojekten als Independent Study Independent Production (z.b. Prototyp für Scriptbewertungen) auch in Verbindung mit Lehrbuch und korrespondierendem Beispielcode, wie Bücher Algorithms of the intelligent web, collective intelligence in action, groovy for domain specific languages Medienanalyse Monitoring of the social Web Trenderkennung, Opinion Mining Evaluation und Beipielprojekt mit Apache Stanbol

Logo MIA. Ein cloud basierter Marktplatz für Informationen und Analysen auf dem deutschsprachigen Web

Logo MIA. Ein cloud basierter Marktplatz für Informationen und Analysen auf dem deutschsprachigen Web Logo MIA Ein cloud basierter Marktplatz für Informationen und Analysen auf dem deutschsprachigen Web MIA Konsortium Ausgangslage Das deutschsprachige Web mit derzeit mehr als sechs Milliarden Webseiten

Mehr

Finden Sie Ihr IT-Wunschpraktikum oder eine engagieren Sie sich bei uns mit einer längerfristigen Werkstudentätigkeit!

Finden Sie Ihr IT-Wunschpraktikum oder eine engagieren Sie sich bei uns mit einer längerfristigen Werkstudentätigkeit! Finden Sie Ihr IT-Wunschpraktikum oder eine engagieren Sie sich bei uns mit einer längerfristigen Werkstudentätigkeit! Unser Angebot Praktikant/Werkstudent (m/w) im Bereich CRM-Client-Entwicklung Praktikant/Werkstudent

Mehr

Historisches Forschungsnetz. Eine virtuelle Forschungsumgebung. Daniel Burckhardt / Thomas Meyer, Humboldt-Universität zu Berlin

Historisches Forschungsnetz. Eine virtuelle Forschungsumgebung. Daniel Burckhardt / Thomas Meyer, Humboldt-Universität zu Berlin Historisches Forschungsnetz Eine virtuelle Forschungsumgebung Daniel Burckhardt / Thomas Meyer, Humboldt-Universität zu Berlin (Virtuelle) Forschung (Virtuelle) Forschung in Geschichtswissenschaften Arbeitstechniken

Mehr

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818

Text Mining Praktikum. Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Text Mining Praktikum Durchführung: Andreas Niekler Email: aniekler@informatik.uni-leipzig.de Zimmer: Paulinum (P) 818 Rahmenbedingungen Gruppen von 2- (max)4 Personen Jede Gruppe erhält eine Aufgabe Die

Mehr

Textanalyse mit UIMA und Hadoop.!! Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014

Textanalyse mit UIMA und Hadoop.!! Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014 Textanalyse mit UIMA und Hadoop Hans-Peter Zorn data2day, Karlsruhe, 27.11.2014 Über mich seit 2014: Big Data Scientist @ Inovex 2011-2013: TU Darmstadt, UKP Lab Etablierung der Hadoop-Infrastruktur Unterstützung

Mehr

Semantic Web. Anwendungsbereiche & Entwicklungen. http://www.know-center.at. Dr. Michael Granitzer

Semantic Web. Anwendungsbereiche & Entwicklungen. http://www.know-center.at. Dr. Michael Granitzer Semantic Web Anwendungsbereiche & Entwicklungen Dr. Michael Granitzer - gefördert durch das Kompetenzzentrenprogramm Agenda Die Vision und warum das Semantic Web Sinn macht Grundlagen: Wissensrepräsentation

Mehr

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013

Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien. Berlin, Mai 2013 Prozessoptimierung in der Markt- und Medienforschung bei der Deutschen Welle (DW) mit Big Data Technologien Berlin, Mai 2013 The unbelievable Machine Company? 06.05.13 The unbelievable Machine Company

Mehr

Prof. Dr.-Ing. Rainer Schmidt 1

Prof. Dr.-Ing. Rainer Schmidt 1 Prof. Dr.-Ing. Rainer Schmidt 1 Business Analytics und Big Data sind Thema vieler Veröffentlichungen. Big Data wird immer häufiger bei Google als Suchbegriff verwendet. Prof. Dr.-Ing. Rainer Schmidt 2

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

Big Data Anwendungen Chancen und Risiken

Big Data Anwendungen Chancen und Risiken Big Data Anwendungen Chancen und Risiken Dr. Kurt Stockinger Studienleiter Data Science, Dozent für Informatik Zürcher Hochschule für Angewandte Wissenschaften Big Data Workshop Squeezing more out of Data

Mehr

Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG

Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG Social Business Intelligence Text Mining und Hadoop bei DB Fernverkehr AG DB Fernverkehr AG Dr.-Ing. Axel Schulz, Dr. Matthias Platho P.FMB 2, DB Fernverkehr AG Frankfurt, 22.05.2015 Motivation An meinem

Mehr

INFORMATIONSLOGISTIK VERSUS SUCHE. Wie die aktive Bereitstellung von Informationen hilft, Zeit zu sparen und Ziele zu erreichen

INFORMATIONSLOGISTIK VERSUS SUCHE. Wie die aktive Bereitstellung von Informationen hilft, Zeit zu sparen und Ziele zu erreichen INFORMATIONSLOGISTIK VERSUS SUCHE Wie die aktive Bereitstellung von Informationen hilft, Zeit zu sparen und Ziele zu erreichen 2 Informationslogistik versus Suche Inhalt Seite Thema 3 Suchen 3 Grundlegende

Mehr

Rainer Klapper QS solutions GmbH

Rainer Klapper QS solutions GmbH Rainer Klapper QS solutions GmbH Der Handlungsbedarf Die CRM-Welt ist umgeben von Social Media Foren Communities Netzwerke CRM Blogs Fehlende Prozessintegration wird zunehmend zum Problem Wir bauen Brücken

Mehr

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006 Seminar Informationsintegration und Informationsqualität TU Kaiserslautern 30. Juni 2006 Gliederung Autonomie Verteilung führt zu Autonomie... Intra-Organisation: historisch Inter-Organisation: Internet

Mehr

Persönliche Daten. Beru iche Laufbahn. Softwareentwickler (Diplom) Entwurf und Implementierung eines Personalmanagement-Portals

Persönliche Daten. Beru iche Laufbahn. Softwareentwickler (Diplom) Entwurf und Implementierung eines Personalmanagement-Portals Robin Schürer Persönliche Daten Name Robin Schürer Anschrift Münchener Str. 80 85290 Geisenfeld Email kontakt@robinschuerer.de Telefon 0177 67 38 414 Xing xing.com/pro le/robin_schuerer geboren am 12.06.1981

Mehr

design kommunikation development

design kommunikation development http://www.dkd.de dkd design kommunikation development Apache Solr - A deeper look Stefan Sprenger, Developer dkd Olivier Dobberkau, Geschäftsführer dkd Agenda Einführung Boosting Empfehlungen Ausblick

Mehr

on Azure mit HDInsight & Script Ac2ons

on Azure mit HDInsight & Script Ac2ons Willkommen beim #GAB 2015! on Azure mit HDInsight & Script Ac2ons Lokale Sponsoren: HansPeter Grahsl Netconomy Entwickler & Berater FH CAMPUS 02 Twi9er: @hpgrahsl Überblick Inhalte Was ist HDInsight? Wozu

Mehr

MICHAEL RÜGER. Abschluss Diplom Fach Informatik. Geburtsjahr 1985 Profil-Stand April 2015

MICHAEL RÜGER. Abschluss Diplom Fach Informatik. Geburtsjahr 1985 Profil-Stand April 2015 MICHAEL RÜGER Abschluss Diplom Fach Informatik Geburtsjahr 1985 Profil-Stand April 2015 Triona Information und Technologie GmbH Wilhelm-Theodor-Römheld-Str. 14 55130 Mainz Fon +49 (0) 61 31 9 21-122 Fax

Mehr

Kooperatives Forschungsprojekt Online-Brief-Datenbank. Ein Beispiel für disziplinspezifische Anwendungen

Kooperatives Forschungsprojekt Online-Brief-Datenbank. Ein Beispiel für disziplinspezifische Anwendungen Kooperatives Forschungsprojekt Online-Brief-Datenbank. Ein Beispiel für disziplinspezifische Anwendungen Hochschule Darmstadt Hartmut Vinçon Uta Störl Editions- und Forschungsstelle Frank Wedekind Fachbereich

Mehr

5. Programmierschnittstellen für XML

5. Programmierschnittstellen für XML 5. Programmierschnittstellen für Grundlagen Dr. E. Schön FH Erfurt Sommersemester 2015 Seite 135 Programmierschnittstelle Notwendigkeit: Zugriff auf -Daten durch Applikationen wiederverwendbare Schnittstellen

Mehr

5. Programmierschnittstellen für XML

5. Programmierschnittstellen für XML 5. Programmierschnittstellen für für Medientechnologen Dr. E. Schön Wintersemester 2015/16 Seite 146 Notwendigkeit: Programmierschnittstelle Zugriff auf -Daten durch Applikationen wiederverwendbare Schnittstellen

Mehr

Forschungsprojekt SS 2009

Forschungsprojekt SS 2009 Forschungsprojekt SS 2009 Programmierung verteilter Systeme Institut für Informatik Universität Augsburg 86135 Augsburg Tel.: +49 821 598-2118 Fax: +49 821 598-2175 Web: www.ds-lab.org Gliederung n Ziel

Mehr

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org

Apache Lucene. Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org Apache Lucene Mach s wie Google! Bernd Fondermann freier Software Architekt bernd.fondermann@brainlounge.de berndf@apache.org 1 Apache Apache Software Foundation Software free of charge Apache Software

Mehr

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen

Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Big Data Plattformen für polystrukturierte Daten neue Chancen und Herausforderungen Oracle DWH-Konferenz 21. März 2012 Dr. Carsten Bange Gründer & Geschäftsführer BARC Big Data bietet Methoden und Technologien

Mehr

BRANCHENSCHWERPUNKTE Energiewirtschaft Customer Relationship Management

BRANCHENSCHWERPUNKTE Energiewirtschaft Customer Relationship Management PROFIL (KURZFORM) MARTIN LÜHRING FACHLICHE SCHWERPUNKTE Fachliche Anforderungsanalyse und Konzeption von Geschäftsprozessen Technische Konzeption und Implementierung von komplexen Datenbankbankanwendungen

Mehr

CitStorm. TU Berlin - Fachbereich CIT Kay Fleischmann Fridtjof Sander Gert Geidel Michael Thomas Constantin Gaul Thomas Misch. April, 09.

CitStorm. TU Berlin - Fachbereich CIT Kay Fleischmann Fridtjof Sander Gert Geidel Michael Thomas Constantin Gaul Thomas Misch. April, 09. CitStorm TU Berlin - Fachbereich CIT Kay Fleischmann Fridtjof Sander Gert Geidel Michael Thomas Constantin Gaul Thomas Misch April, 09. 2014 Projektbeschreibung ZIELSETZUNG Operatoren mit Twitter Storm

Mehr

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik

Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik Diplomarbeit: GOMMA: Eine Plattform zur flexiblen Verwaltung und Analyse von Ontologie Mappings in der Bio-/Medizininformatik Bearbeiter: Shuangqing He Betreuer: Toralf Kirsten, Michael Hartung Universität

Mehr

Quellen: Towards a Human Computer InteractionPerspective. Übersicht. Warum visuelle Sprachen? Begriffsdefinitionen: Hinderungsgründe bisher:

Quellen: Towards a Human Computer InteractionPerspective. Übersicht. Warum visuelle Sprachen? Begriffsdefinitionen: Hinderungsgründe bisher: Quellen: Towards a Human Computer InteractionPerspective von B.K. & B.K. LV: Visuelle Sprachen (03-763) Universität Bremen WS 2001/02 Visual Language Theory: Towards a Human- Computer Perspective; N. Hari

Mehr

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria

Analyse von unstrukturierten Daten. Peter Jeitschko, Nikolaus Schemel Oracle Austria Analyse von unstrukturierten Daten Peter Jeitschko, Nikolaus Schemel Oracle Austria Evolution von Business Intelligence Manuelle Analyse Berichte Datenbanken (strukturiert) Manuelle Analyse Dashboards

Mehr

Big Data Informationen neu gelebt

Big Data Informationen neu gelebt Seminarunterlage Version: 1.01 Copyright Version 1.01 vom 21. Mai 2015 Dieses Dokument wird durch die veröffentlicht. Copyright. Alle Rechte vorbehalten. Alle Produkt- und Dienstleistungs-Bezeichnungen

Mehr

EXASOL Anwendertreffen 2012

EXASOL Anwendertreffen 2012 EXASOL Anwendertreffen 2012 EXAPowerlytics Feature-Architektur EXAPowerlytics In-Database Analytics Map / Reduce Algorithmen Skalare Fkt. Aggregats Fkt. Analytische Fkt. Hadoop Anbindung R LUA Python 2

Mehr

Informationsflut bewältigen - Textmining in der Praxis

Informationsflut bewältigen - Textmining in der Praxis Informationsflut bewältigen - Textmining in der Praxis Christiane Theusinger Business Unit Data Mining & CRM Solutions SAS Deutschland Ulrich Reincke Manager Business Data Mining Solutions SAS Deutschland

Mehr

Softwaremanufaktur AW-SYSTEMS Kompetenzprofil Boreas

Softwaremanufaktur AW-SYSTEMS Kompetenzprofil Boreas Softwaremanufaktur AW-SYSTEMS Kompetenzprofil Boreas Ansprechpartner/in: Frau Nadine Fend Tel. +49 (5341) 29359-13 E-Mail: n.fend@aw-systems.net Website: www.aw-systems.net AW-SYSTEMS GmbH Moränenweg 90

Mehr

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur Suchmaschinen Anwendung RN Semester 7 Christian Koczur Inhaltsverzeichnis 1. Historischer Hintergrund 2. Information Retrieval 3. Architektur einer Suchmaschine 4. Ranking von Webseiten 5. Quellenangabe

Mehr

Von genial bis kriminell: Semantik und das Überleben im Web 2.0

Von genial bis kriminell: Semantik und das Überleben im Web 2.0 Von genial bis kriminell: Semantik und das Überleben im Web 2.0 Thomas Servatius Head of Hosting & Domains Europe and Shopping LYCOS Europe GmbH eco Kongress 2008_BEYOND THE BORDERS 11.09.2008 Agenda Einführung

Mehr

Von der digitalisierten zur analysierten Welt

Von der digitalisierten zur analysierten Welt Von der digitalisierten zur analysierten Welt CeBIT 2011 Dr. Wolfgang Martin Analyst, ibond Partner und Ventana Research Advisor Die digitalisierte Welt Auf dem Weg in die digitalisierte Welt Der Kunde

Mehr

Lehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr

Lehrangebot. Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr Lehrangebot Fachgebiet Informationssysteme Prof. Dr. Norbert Fuhr N. Fuhr, U. Duisburg-Essen Lehrangebot 1 Lehrangebot des FG Informationssysteme Datenbanken Internet-Suchmaschinen Information Retrieval

Mehr

Lehrgebiet Informationssysteme

Lehrgebiet Informationssysteme Lehrgebiet AG Datenbanken und (Prof. Michel, Prof. Härder) AG Heterogene (Prof. Deßloch) http://wwwlgis.informatik.uni-kl.de/ Was sind? Computergestützte Programmsysteme, die Informationen erfassen, dauerhaft

Mehr

Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale?

Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale? Text Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale? Textklassifikationen Natürliche bzw. unstrukturierte Texte Normale Texte ohne besondere Merkmale und Struktur Semistrukturierte

Mehr

Das Leben der Anderen

Das Leben der Anderen Das Leben der Anderen Twitter-Analyse mit Oracle12c, JSON und APEX Carsten Czarski Business Unit Database Oracle Deutschland B.V. & Co KG About: Carsten Czarski 1973 München Verheiratet zwei Kinder ORACLE

Mehr

Was Forschung von Lehre lernen kann Metadaten-Management im E-Learning

Was Forschung von Lehre lernen kann Metadaten-Management im E-Learning Was Forschung von Lehre lernen kann Metadaten-Management im E-Learning Prof. Dr.-Ing. habil. Ulrike Lucke Maximaler Raum für Titelbild (wenn kleiner dann linksbündig an Rand angesetzt) 1 Warum Metadaten?

Mehr

Data/Information Quality Management

Data/Information Quality Management Data/Information Quality Management Seminar WI/Informationsmanagement im Sommersemester 2002 Markus Berberov, Roman Eder, Peter Gerstbach 11.6.2002 Inhalt! Daten und Datenqualität! Einführung und Definition!

Mehr

Text-Mining: Einführung

Text-Mining: Einführung Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:

Mehr

Mehrrechner-Datenbanksysteme (Verteilte und Parallele DBS)

Mehrrechner-Datenbanksysteme (Verteilte und Parallele DBS) Mehrrechner-Datenbanksysteme (Verteilte und Parallele DBS) Prof. Dr. E. Rahm Wintersemester 2017/2018 Universität Leipzig Institut für Informatik http://dbs.uni-leipzig.de WS17/18, Prof. Dr. E. Rahm 0-1

Mehr

Finden Sie Ihr IT-Wunschpraktikum oder eine engagieren Sie sich bei uns mit einer längerfristigen Werkstudentätigkeit!

Finden Sie Ihr IT-Wunschpraktikum oder eine engagieren Sie sich bei uns mit einer längerfristigen Werkstudentätigkeit! Finden Sie Ihr IT-Wunschpraktikum oder eine engagieren Sie sich bei uns mit einer längerfristigen Werkstudentätigkeit! Unser Angebot Werkstudent (m/w) im Bereich Sales und Account Management Werkstudent/in

Mehr

Smart Content Creation and Annotation (SCCA)

Smart Content Creation and Annotation (SCCA) Smart Content Creation and Annotation (SCCA) Statusmeeting, 7. Oktober 2014 Agenda 1) Einleitung 2) Text Mining bei Neofonie 3) Text Mining für Unternehmen 4) Aufbau von Fachlexika 5) Big-Data-Technologien

Mehr

Prof. Dr. Udo Hahn. Seminar im Modul M-GSW-09 WiSe 2015/2016

Prof. Dr. Udo Hahn. Seminar im Modul M-GSW-09 WiSe 2015/2016 Seminar im Modul M-GSW-09 WiSe 2015/2016 Prof. Dr. Udo Hahn Lehrstuhl für Angewandte Germanistische Sprachwissenschaft / Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller-Universität

Mehr

C O C O O N. Wo ist Cocoon in die Apache Projekte einzureihen?

C O C O O N. Wo ist Cocoon in die Apache Projekte einzureihen? C O C O O N ein Web-Framework der Apache Software Foundation http://www.apache.org Wo ist Cocoon in die Apache Projekte einzureihen? Apache Server sehr leistungsfähiger HTTP-Server Tomcat Server Referenzimplementierung

Mehr

Data Warehousing 0-1. DBS-Module

Data Warehousing 0-1. DBS-Module Data Warehousing Sommersemester 2014 Prof. Dr. E. Rahm Universität Leipzig Institut für Informatik y y y http://dbs.uni-leipzig.de 0-1 DBS-Module Master-Studium Informatik 10-202-2215 Moderne Datenbanktechnologien

Mehr

Big Data im Retail-Sektor am Beispiel Kassenbondaten

Big Data im Retail-Sektor am Beispiel Kassenbondaten Big Data im Retail-Sektor am Beispiel Kassenbondaten REWE Systems GmbH Jonas Freiknecht inovex GmbH Bernhard Schäfer Business Analytics Day, 08.03.2017 AGENDA 1. Vorstellung REWE Systems GmbH und inovex

Mehr

Datenanalyse im Web. Einführung in das Thema. Prof. Dr. Ingo Claÿen. Beispiele für Daten im Web. Extraktion und Aggregation von Informationen

Datenanalyse im Web. Einführung in das Thema. Prof. Dr. Ingo Claÿen. Beispiele für Daten im Web. Extraktion und Aggregation von Informationen Datenanalyse im Web Einführung in das Thema Prof. Dr. Ingo Claÿen Hochschule für Technik und Wirtschaft Berlin Beispiele für Daten im Web Extraktion und Aggregation von Informationen Datenanalyse im Web

Mehr

Social Media Analytics Aktuelle Herausforderungen

Social Media Analytics Aktuelle Herausforderungen Lehrstuhl für Informatik 5 Informationssysteme RWTH Aachen Social Media Analytics Aktuelle Herausforderungen Ralf Klamma RWTH Aachen I5-KL-111010-1 Gesellschaft für Informatik Regionalgruppe Köln Themenabend

Mehr

dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung und Big Data im Informationsmanagement

dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung und Big Data im Informationsmanagement dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung und Big Data im Informationsmanagement dacore Datenbanksysteme AG Neue Konzepte zur Optimierung der Auslastungsplanung Die

Mehr

USER CASE: SCOUT ALS FRAMEWORK FÜR FINANCIAL TECH

USER CASE: SCOUT ALS FRAMEWORK FÜR FINANCIAL TECH USER CASE: 2. Scout User Group Meeting eclipsecon Unconference 2015 LUDWIGSBURG, 2. NOVEMBER 2015» DAVID KLEIN, ENRION GMBH Content 1. Kurzvorstellung Enrion 2. Die Suche nach einem passenden Framework

Mehr

Web Mining Übung. www.ke.tu-darmstadt.de/lehre/ss13/web-mining/uebungen. Aufgaben. Umfang

Web Mining Übung. www.ke.tu-darmstadt.de/lehre/ss13/web-mining/uebungen. Aufgaben. Umfang www.ke.tu-darmstadt.de/lehre/ss13/web-mining/uebungen zusätzliche Informationen, Registrierung, Upload, Übungsblätter Aufgaben aus dem Bereich Data-, Text- und Web-Mining Crawling, Textanalyse, Textklassifizierung,

Mehr

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining

Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Tiefgreifende Prozessverbesserung und Wissensmanagement durch Data Mining Ausgangssituation Kaizen Data Mining ISO 9001 Wenn andere Methoden an ihre Grenzen stoßen Es gibt unzählige Methoden, die Abläufe

Mehr

Web Data Mining. Alexander Hinneburg Sommersemester 2007

Web Data Mining. Alexander Hinneburg Sommersemester 2007 Web Data Mining Alexander Hinneburg Sommersemester 2007 Termine Vorlesung Mi. 10:00-11:30 Raum?? Übung Mi. 11:45-13:15 Raum?? Klausuren Mittwoch, 23. Mai Donnerstag, 12. Juli Buch Bing Liu: Web Data Mining

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information

Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Iryna Gurevych Sprachtechnologie-Feuerwerk: Aktuelle Anwendungsbeispiele und Zukunftsvisionen

Mehr

Bachelor-Arbeiten am Lehrstuhl Informatik VII. Dr. Frank Weichert. frank.weichert@tu-dortmund.de. technische universität dortmund

Bachelor-Arbeiten am Lehrstuhl Informatik VII. Dr. Frank Weichert. frank.weichert@tu-dortmund.de. technische universität dortmund Bachelor-Arbeiten am Lehrstuhl Dr. Frank Weichert frank.weichert@tu-.de F. Weichert Juli 2013 Bachelor Arbeiten am Lehrstuhl 1 Übersicht zum Lehrstuhl / Thematische Einordnung F. Weichert Juli 2013 Bachelor

Mehr

BARC-Intensivseminar Auswahl von Enterprise-Content- Management-Lösungen. Martin Böhn

BARC-Intensivseminar Auswahl von Enterprise-Content- Management-Lösungen. Martin Böhn BARC-Intensivseminar Auswahl von Enterprise-Content- -Lösungen Würzburg, 07. Mai 2007 Martin Böhn Wiesenweg 31 D-97084 Würzburg +49-931-8806510 www.barc.de Seminaragenda 1 Begrüßung, und Vorstellung, Erwartungen

Mehr

Präsentation des Dissertationsvorhabens Erste Schritte. Carola Carstens Hildesheim, 15. Oktober 2007

Präsentation des Dissertationsvorhabens Erste Schritte. Carola Carstens Hildesheim, 15. Oktober 2007 Präsentation des Dissertationsvorhabens Erste Schritte Carola Carstens Hildesheim, 15. Oktober 2007 Überblick Rahmenbedingungen Institut Thematische Interessen Erste Schritte Erfassung des State of the

Mehr

Entwicklung einer Probandenverwaltung im Rahmen der SHIP-Studie in Greifswald

Entwicklung einer Probandenverwaltung im Rahmen der SHIP-Studie in Greifswald Entwicklung einer Probandenverwaltung im Rahmen der SHIP-Studie in Greifswald Dörte Radke Institut für Community Medicine, Universitätsmedizin Greifswald 12. Juni 2013 Überblick 1 SHIP-Probandenmanagement

Mehr

Scandio SEBOL Search

Scandio SEBOL Search : : :, München Inhalt 1. Was ist SEBOL?...3 2. Index-Server...4 2.1. Warteschlange zur Indizierung...4 2.2. Plugin-Abarbeitung...4 2.3. Erweiterte Lucene-Indizierung...4 2.4. Index-Verteilung und Management...5

Mehr

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse?

Ein Beispiel. Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Ein Beispiel Ein Unternehmen will Internettechnologien im Rahmen des E- Business nutzen Welche Geschäftsprozesse? Dipl.-Kfm. Claus Häberle WS 2015 /16 # 42 XML (vereinfacht) visa

Mehr

Integration von ecodicology in die DARIAH Dienstewelt

Integration von ecodicology in die DARIAH Dienstewelt Integration von ecodicology in die DARIAH Dienstewelt Danah Tonne, Rainer Stotzka KIT Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft www.kit.edu

Mehr

Semantic Web Praktikum..und andere Praktika... WS 2004/05

Semantic Web Praktikum..und andere Praktika... WS 2004/05 Semantic Web Praktikum..und andere Praktika... WS 2004/05 Robert Baumgartner, Jürgen Dorn, Georg Gottlob, Marcus Herzog KFK Semantic Web Kernfachkombination Wirtschaftsinformatik Vertiefendes Wahlfach

Mehr

BIG DATA IM RETAIL-SEKTOR AM BEISPIEL KASSENBONDATEN BUSINESS ANALYTICS DAY

BIG DATA IM RETAIL-SEKTOR AM BEISPIEL KASSENBONDATEN BUSINESS ANALYTICS DAY BIG DATA IM RETAIL-SEKTOR AM BEISPIEL KASSENBONDATEN BUSINESS ANALYTICS DAY 08.03.2017 REWE Systems GmbH Jonas Freiknecht inovex GmbH Bernhard Schäfer AGENDA 1 / Vorstellung REWE Systems GmbH und inovex

Mehr

TONY GOERDTEN. Diplom-Ingenieur Chemie (TU) Oracle Certified Professional, Java SE 7 Programmer. Geburtsjahr 1970 Profil-Stand Juli 2015

TONY GOERDTEN. Diplom-Ingenieur Chemie (TU) Oracle Certified Professional, Java SE 7 Programmer. Geburtsjahr 1970 Profil-Stand Juli 2015 TONY GOERDTEN Diplom-Ingenieur Chemie (TU) Oracle Certified Professional, Java SE 7 Programmer Geburtsjahr 1970 Profil-Stand Juli 2015 Triona Information und Technologie GmbH Wilhelm-Theodor-Römheld-Str.

Mehr

Proseminar - Data Mining

Proseminar - Data Mining Proseminar - Data Mining SCCS, Fakultät für Informatik Technische Universität München SS 2014, SS 2014 1 Data Mining: Beispiele (1) Hausnummererkennung (Klassifikation) Source: http://arxiv.org/abs/1312.6082,

Mehr

Programmierung von Java- Webanwendungen. paluno

Programmierung von Java- Webanwendungen. paluno Programmierung von Java- Webanwendungen Gliederung 1 Vorstellung und Einführung 2 Basiswissen Web 3 XML und JSF- Einführung 4 JSF- Komponenten und RichFaces 5 Wiederholung der ersten Woche 6 JSF- Konzepte

Mehr

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht

Big-Data-Technologien - Überblick - Prof. Dr. Jens Albrecht Big-Data-Technologien - Überblick - Quelle: http://www.ingenieur.de/panorama/fussball-wm-in-brasilien/elektronischer-fussball-smartphone-app-helfen-training Big-Data-Anwendungen im Unternehmen Logistik

Mehr

STOFF- IDENT. System DAIOS. Workshop: STOFF-IDENT & openmasp 18. / 19.04.2013 Freising. marco.luthardt@hswt.de

STOFF- IDENT. System DAIOS. Workshop: STOFF-IDENT & openmasp 18. / 19.04.2013 Freising. marco.luthardt@hswt.de STOFF- IDENT System DAIOS Workshop: STOFF-IDENT & openmasp 18. / 19.04.2013 Freising marco.luthardt@hswt.de Überblick 1. Plattform - Vorschau 2. openmasp (OM) 3. STOFF-IDENT(SI) 4. Plattform - Fazit Folie

Mehr

HAGEN KLATT. Geburtsjahr 1989 Profil-Stand Juni Triona Information und Technologie GmbH Dekan-Laist-Straße 15a Mainz

HAGEN KLATT. Geburtsjahr 1989 Profil-Stand Juni Triona Information und Technologie GmbH Dekan-Laist-Straße 15a Mainz HAGEN KLATT Geburtsjahr 1989 Profil-Stand Juni 2017 Triona Information und Technologie GmbH Dekan-Laist-Straße 15a 55129 Mainz Fon +49 (0) 6131 / 501538-0 Mail projekte@triona.de FACHLICHE SCHWERPUNKTE

Mehr

MUSTAFA GERCEK. Bachelor of Science Wirtschaftsinformatik. Geburtsjahr 1992 Profil-Stand Oktober 2015

MUSTAFA GERCEK. Bachelor of Science Wirtschaftsinformatik. Geburtsjahr 1992 Profil-Stand Oktober 2015 MUSTAFA GERCEK Bachelor of Science Wirtschaftsinformatik Geburtsjahr 1992 Profil-Stand Oktober 2015 Triona Information und Technologie GmbH Wilhelm-Theodor-Römheld-Str. 14 55130 Mainz Fon +49 (0) 61 31

Mehr

Big Data Modewort oder echter Mehrwert. freenet Group Dr. Florian Johannsen

Big Data Modewort oder echter Mehrwert. freenet Group Dr. Florian Johannsen Big Data Modewort oder echter Mehrwert freenet Group Dr. Florian Johannsen freenet Group 2 Titel der Präsentation 07.07.2015 Mobilfunkgeschäft der freenet Group Austausch von Daten und Informationen Im

Mehr

Freiberuflicher IT Berater

Freiberuflicher IT Berater Freiberuflicher IT Berater Dipl. Informatiker André Winkler Festnetz: 040-76 75 16 24 Mobil: 0176-48 57 90 88 Email: mail@andre-winkler.de Anschrift: Mensingstr 29a, 21079 Hamburg ANDRE WINKLER Freiberuflicher

Mehr

R im Enterprise-Modus

R im Enterprise-Modus R im Enterprise-Modus Skalierbarkeit, Support und unternehmensweiter Einsatz Dr. Eike Nicklas HMS Konferenz 2014 Was ist R? R is a free software environment for statistical computing and graphics - www.r-project.org

Mehr

Künstliche Intelligenz im Steuerbereich

Künstliche Intelligenz im Steuerbereich Künstliche Intelligenz im Steuerbereich Steckbrief KI-Softwareprototypen KI-Softwareprototypen NeuMÜ Unsere Prototypen zielen auf folgende Prozessunterstützung ab: Vereinfachte Datenaufbereitung Proaktive

Mehr

Semantische Infomationsintegration à la carte?

Semantische Infomationsintegration à la carte? Semantische Infomationsintegration à la carte? Ziele und Herausforderungen der Anwendung des CIDOC CRM. Historisch-Kulturwiss. Informationsverarbeitung, Universität Köln 1. Oktober 2010 1 Ein User Scenario

Mehr

Softwaremanufaktur AW-SYSTEMS Kompetenzprofil Boreas

Softwaremanufaktur AW-SYSTEMS Kompetenzprofil Boreas Softwaremanufaktur AW-SYSTEMS Kompetenzprofil Boreas Ansprechpartner/in: Frau Nadine Fend Tel. +49 (5341) 29359-13 E-Mail: n.fend@aw-systems.net Website: www.aw-systems.net AW-SYSTEMS GmbH Moränenweg 90

Mehr

Schlussbewertung FB VI SOFTWAREPROJEKT II WS 09/10 TEAM. Alexander Kalden Dominik Eckelmann Marcel Pierry Julian Heise Besha Taher

Schlussbewertung FB VI SOFTWAREPROJEKT II WS 09/10 TEAM. Alexander Kalden Dominik Eckelmann Marcel Pierry Julian Heise Besha Taher Schlussbewertung FB VI SOFTWAREPROJEKT II WS 09/10 TEAM Alexander Kalden Dominik Eckelmann Marcel Pierry Julian Heise Besha Taher 729631 745097 736477 745011 741297 Inhalt Schlussbewertung... 3 Bewertung

Mehr

Large Scale Data Management

Large Scale Data Management Large Scale Data Management Beirat für Informationsgesellschaft / GOING LOCAL Wien, 21. November 2011 Prof. Dr. Wolrad Rommel FTW Forschungszentrum Telekommunikation Wien rommel@ftw.at Gartner's 2011 Hype

Mehr

MS SQL Server 2012 (4)

MS SQL Server 2012 (4) MS SQL Server 2012 (4) Data Mining, Analyse und multivariate Verfahren Marco Skulschus Jan Tittel Marcus Wiederstein Webseite zum Buch: http://vvwvv.comelio-medien.com/buch-kataiog/ms sql_server/ms sql

Mehr

M.Sc. Informatik, Studium angewandte Informatik M.Sc. Ing. Lasertechnik, Studium Laser und Photonik B.Sc. Elektrotechnik, Studium der Elektrotechnik

M.Sc. Informatik, Studium angewandte Informatik M.Sc. Ing. Lasertechnik, Studium Laser und Photonik B.Sc. Elektrotechnik, Studium der Elektrotechnik Profil T.D. Test Consultant Jahrgang 1991 Wohnort Nürnberg / Köln Nationalität Bangladesch Ausbildung M.Sc. Informatik, Studium angewandte Informatik M.Sc. Ing. Lasertechnik, Studium Laser und Photonik

Mehr

Softwarearchitektur als Mittel für Qualitätssicherung und SOA Governance

Softwarearchitektur als Mittel für Qualitätssicherung und SOA Governance Softwarearchitektur als Mittel für Qualitätssicherung und SOA Governance Mag. Georg Buchgeher +43 7236 3343 855 georg.buchgeher@scch.at www.scch.at Das SCCH ist eine Initiative der Das SCCH befindet sich

Mehr

Informationsgewinnung mit semantischen Technologien Die SMILA Plattform

Informationsgewinnung mit semantischen Technologien Die SMILA Plattform Informationsgewinnung mit semantischen Technologien Die SMILA Plattform Dr. Mario Lenz, VP Product Management, Empolis Information Management GmbH Seite 1 Empolis ist Ihnen heute schon viel näher als Sie

Mehr

Business Intelligence Data Warehouse. Jan Weinschenker

Business Intelligence Data Warehouse. Jan Weinschenker Business Intelligence Data Warehouse Jan Weinschenker 28.06.2005 Inhaltsverzeichnis Einleitung eines Data Warehouse Data Warehouse im Zusammenfassung Fragen 3 Einleitung Definition: Data Warehouse A data

Mehr

QUICK-START EVALUIERUNG

QUICK-START EVALUIERUNG Pentaho 30 für 30 Webinar QUICK-START EVALUIERUNG Ressourcen & Tipps Leo Cardinaals Sales Engineer 1 Mit Pentaho Business Analytics haben Sie eine moderne und umfassende Plattform für Datenintegration

Mehr

Cross-Media-Publishing im E-Learning Umfeld

Cross-Media-Publishing im E-Learning Umfeld Cross-Media-Publishing im E-Learning Umfeld Referent: Dipl.-Inf. Torsten Heinrich Fachhochschule Brandenburg Deckblatt_neu Überblick Zielsetzungen Merkmale Cross-Media-Publishing Das movii-system Publizieren

Mehr

Effzienzsteigerung durch intelligentes Datenmanagement

Effzienzsteigerung durch intelligentes Datenmanagement Effzienzsteigerung durch intelligentes Datenmanagement Analyse, Optimierung, Steuerung und Prognose von Prozessen Dr. Thomas Natschläger +43 7236 3343 868 thomas.natschlaeger@scch.at www.scch.at Das SCCH

Mehr

Datenbanken-Themen im OS "Data Mining" SS 2010

Datenbanken-Themen im OS Data Mining SS 2010 Prof. Dr.-Ing. Thomas Kudraß HTWK Leipzig, FIMN Datenbanken-Themen im OS "Data Mining" SS 2010 Die Vorträge sollten eine Dauer von 60 Minuten (Einzelvortrag) bzw. 45 Minuten (Doppelvortrag) haben. Nachfolgend

Mehr

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation?

Data Mining - Marketing-Schlagwort oder ernstzunehmende Innovation? 1. Konferenz der A Benutzer KFE in Forschung und Entwicklung Data Mining - Marketing-chlagwort oder ernstzunehmende Innovation? Hans-Peter Höschel,, Heidelberg 1. Konferenz der A Benutzer KFE in Forschung

Mehr

DSHL7: Eine Domain Specific Language für HL7v3 in Scala

DSHL7: Eine Domain Specific Language für HL7v3 in Scala DISL Seven DSHL7: Eine Domain Specific Language für HL7v3 in Scala Markus Gumbel, Ahmet Gül Institut für Medizinische Informatik Überblick Motivation: Warum eine DSL für HL7v3? Ansätze für eine DSL Beispiel:

Mehr

Teilnehmervortrag: Einsatz von CMS in medizinischen Forschungsnetzen. Matthias Löbe Universität Leipzig 1

Teilnehmervortrag: Einsatz von CMS in medizinischen Forschungsnetzen. Matthias Löbe Universität Leipzig 1 Teilnehmervortrag: Einsatz von CMS in medizinischen Forschungsnetzen Universität Leipzig 1 Gliederung Vorstellung Institut und Forschungsnetz Ergebnisse des CMS-Betriebs Technische Entwicklungen Zukünftiges

Mehr

ShopBot, ein Software-Agent für das Internet

ShopBot, ein Software-Agent für das Internet Software-Agenten p.1/20 ShopBot, ein Software-Agent für das Internet Eine Einführung in (Software-)Agenten Madeleine Theile Software-Agenten p.2/20 Aufbau des Vortrags grundlegende Theorie Definition Autonomy,

Mehr

BIW Wahlpflichtmodul. Einführung in Solr, Pipeline und REST. Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany

BIW Wahlpflichtmodul. Einführung in Solr, Pipeline und REST. Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany BIW Wahlpflichtmodul Einführung in Solr, Pipeline und REST Philipp Schaer, TH Köln (University of Applied Sciences), Cologne, Germany Version: 2018-05-29 Überblick über gängige Lösungen 2 3 in a nutshell

Mehr

Existierende Systeme I Bibliotheken & Frameworks

Existierende Systeme I Bibliotheken & Frameworks Projektgruppe: Generierung von Webanwendungen aus visuellen Spezifikationen Existierende Systeme I Bibliotheken & Frameworks Von Christian Schneider Paderborn, den 18.06.2004 Übersicht Motivation Dynamische

Mehr