Kurfzassung Deutsch. Poier Lorenz. MMag. Wilhelm Loibl

Größe: px
Ab Seite anzeigen:

Download "Kurfzassung Deutsch. Poier Lorenz. MMag. Wilhelm Loibl"

Transkript

1 Kurfzassung Deutsch Novelty Mining Algorithmus zur Trendsporterkennung Poier Lorenz MMag. Wilhelm Loibl Einleitung Diese Arbeit versucht ein Instrument für die Erkennung von Trends im Tourismus durch die Entwicklung neuer Wortkombinationen zu entwickeln. Novelty dient zur Erkennung bisher nicht bekannter Information. Basis für den Algorithmus ist ein Sprachkorpus der neue Daten mit vorhanden vergleicht und durch konvertierte Ähnlichkeitsberechnungen und Kookkurrenzanalysen, Aussagen über die Novelty der Dokumente liefert. Dieser Algorithmus beruht auf linguistischen Strukturen der Sprachwissenschaft, welche mithilfe von statistischen Analysen den Maschinen die Möglichkeit bieten, aus Zeichenfolgen, Inhalt zu extrahieren und zu interpretieren. Signifikante Kookkurrenzen sind Wortkombinationen, die in direktem Bezug zueinander stehen. Durch die Analyse dieser Kookkurrenzen und den Tools des Novelty Mining, die auf Neuheiten im Text Mining beruhen, kann der Computer auf Trendwortkombinationen schließen. Die erhebliche Internetpräsenz des Tourismussektors, laut Buhalis (2008), und die Verbreitung von Trendsportarten über das Internet, laut Geisler (2003, S ), verlangen nach einem Werkzeug zur Analyse der Daten um den Entwicklungen Schritt zu halten. Da Text Mining diese Fragestellung, laut Heyer, Quasthoff, & Wittig (2008), in Verbindung mit Novelty Mining lösen kann, ergibt sich folgende Forschungsfrage, die die Ansätze von Buhalis und Geisler verbindet: Wie kann ich zuverlässig aus einer Menge an touristischen Websites bei Sportarten Trends herauslesen? Trendsportarten sind eine wachsende und sich verändernde Bewegungskultur die den Akteuren Spielraum überlässt, individuelle Entwicklungen zu kreieren und die Trendsportart weiterzuentwickeln (Lamprecht & Stamm, 1998, S. 375). Der offensichtlich gesteigerte Bedarf nach Formen der Selbstinszenierung und nach Differenzierung wird durch das ökonomische System in der Entwicklung und Vermarktung der Trendsportarten erkannt, verstärkt und kanalisiert (Schwier, 2000, S. 49). Das Internet dient dabei als Vermittler und Verbreiter der neuesten Trends. Dabei sind viele Benutzer ihrer eigenen Kreativität überlassen und können sich im Rahmen ihrer technischen Fertigkeiten selbst inszenieren. 1

2 Text Mining Mit dem Terminus Text Mining (TM) werden computergestützte Verfahren für die semantische Analyse von Texten bezeichnet, welche die automatische bzw. semiautomatische Strukturierung von Texten, insbesondere sehr großen Mengen von Texten, unterstützen (Witschel, 2004, S. 35). Im Unterschied zur allgemeinen Websuche wird beim TM nach unbekannter Information gesucht, die durch das Ansammeln von enormen Textmengen gefunden werden sollte. Dabei werden die Texte durch statistische und musterbasierte Verfahren strukturiert um neue und relevante Informationen zu extrahieren. Die musterbasierten Verfahren basieren auf vorher definierten Mustern, die bei den untersuchten Texten entdeckt werden sollten. Im Gegensatz dazu basieren die statistischen Verfahren auf sprachstatistische Gesetzmäßigkeiten, wie Häufigkeiten und Vergleiche aus standardisierten Sprachdatenbanken (Heyer, Quasthoff, & Wittig, 2008, S. 1-18). Wissensverarbeitung Der Vergleich der zu analysierenden Daten mit einem Standardsprachkorpus, dient der Textklassifizierung. Dadurch können an der Häufigkeit der einzelnen Wörter, Abweichungen von den Standardtextressourcen festgestellt werden. Das Signifikanzmaß dient zur Textklassifizierung und berechnet die Wichtigkeit der einzelnen Wörter für den Korpus in dem Häufigkeitsklassen verglichen und Verfahren der Termwichtigkeit angewendet werden. Als Textressourcen zur Standardsprache gibt es Internetdatenbanken die geeignet sind und unentgeltlich genutzt werden können. Das Projekt Deutscher Wortschatz von der Universität Leipzig, das Institut für deutsche Sprache und die European Language Resource Association bieten Textsammlungen für statistische und clusterbasierte Analysen in der deutschen Sprache an. Um aus den unstrukturierten Texten Informationen zu erhalten müssen zuerst Gemeinsamkeiten und Unregelmäßigkeiten gefunden werden. Häufige gemeinsame Auftreten mit anderen Wörtern oder satzweise oder paragraphweise Auffälligkeiten sollten dabei entdeckt werden. Diese reinen Häufigkeitsanalysen dienen hauptsächlich der Bedeutungsanalyse der Wörter und ihre Verwendung statistisch darzustellen um die Dokumente zu klassifizieren. Bei der Trendsportanalyse liegt der Fokus auf die Identifizierung von Nomen. Nomen lassen sich im Deutschen durch die Großschreibung erkennen und sind weniger komplex als Verben in ihrer Deklination. Dennoch muss bei der Pluralbildung ein Stemmingverfahren 2

3 angewandt werden um die gleichen Terme in nicht deklinierter Grundform gemeinsam zu listen. Cluster Analyse Die Cluster Analyse dient zur Textklassifikation und vergleicht die Häufigkeit der vorkommenden Wörter der Texte mittels eines Ähnlichkeitskoeffizienten. Im ersten Schritt sollten die charakteristischen Wörter identifiziert werden und diese danach mittels Dokumentvektoren einem statistischen Verfahren unterziehen. Damit können einzelne Dokumente verglichen werden und festgestellt werden, welche inhaltlichen Schwerpunkte sie thematisieren. Der Algorithmus basiert auf Nennungen der Terme und unterscheidet nicht auf semantische Bedeutungen. Diese Methodik bevorzugt die Analyse beliebiger Texte und großer Textmengen, jedoch erschwert sie eine inhaltlich korrekte Analyse und dies sollte immer mit Bedacht in die Ergebnisse einbezogen werden. Die Cluster Analyse sollte nur die geeigneten Texte identifizieren und somit den Speicherbedarf und den Zeitaufwand optimieren. Zur Trendsportidentifikation verwendet werden Wikipedia Beiträge von den von Schwier (2000, S. 76) aufgelisteten Trendsportarten sowie von dem Term Trendsport als Dokumentvorlagen. Bei einer signifikanten Ähnlichkeit werden wir das Dokument unseren Novelty Mining Algorithmus unterziehen und zuerst signifikante Kookkurrenzen identifizieren. Kookkurrenzanalyse Semantische Zusammenhänge können laut Heyer, Quasthoff, & Wittig (2008) durch die Verwendung von Termen erkannt werden. Kookkurrenz bezeichnet das gemeinsame Auftreten zweier Wortformen in einem Textabschnitt. Wortformen die statistisch auffällig gemeinsam auftreten, bezeichnet man als signifikante Kookkurrenzen. Dabei unterscheidet man zwischen Nachbarschaftskookkurrenzen und Satzkookkurrenzen. Nachbarschaftskookkurrenzen sind Termini die direkt nebeneinander auftreten und Satzkookkurrenzen sind in den gleichen Sätzen enthalten sind. Ein weiterer Aspekt der Kookkurrenzanalyse ist die Identifizierung von Kohyponymen durch die Kookkurrenzen zweiter Ordnung. Die Kookkurrenzen zweiter Ordnung sind Wortformen die signifikant häufig in Kookkurrenzprofilen erster Ordnung enthalten sind. (Heyer, Quasthoff, & Wittig, 2008, S. 163) Dabei werden Terme aufgelistet die ähnliche Kookkurrenzprofile erster Ordnung haben. Daher bieten Trendsportarten eine gute Basis Kookkurrenzprofile zweiter Ordnung zu vergleichen um neue Trendsportarten zu entdecken. Die identifizierten Terme aus der Kookkurrenzanalyse erster Ordnung werden im Novelty Verfahren weiter überprüft. 3

4 Novelty Mining Die Verwendung von Social Media und Blogs haben in den letzten Jahren einen wesentlichen Beitrag zur außerordentlichen Steigerung der Datenmengen im Internet getragen. Bei diesen unstrukturierten Daten sammeln sich viele überflüssige und für ein bestimmtes Thema nicht relevante Daten an. Novelty Mining filtert die relevanten Daten heraus und definiert den Anteil der Daten der neu ist und nach aktuellem Wissensstand noch nicht im Vergleichskorpus aufscheint. Novelty Mining basiert auf zwei Phasen, zuerst bestimmt man die zum Thema relevanten Sätze, welche beispielswiese in einem Clustering Verfahren herausgefiltert werden. In der zweiten Phase wird in der relevanten Datenmenge nach neuer Information gesucht. In den Novelty Mining Publikationen wird die zweite Phase genauer definiert, da in der ersten Phase Verfahren aus dem Information Retrieval eingesetzt werden. Die Verfahren in der zweiten Phase stammen zumeist aus der Ähnlichkeitsmessung und werden dann konvertiert in eine Unähnlichkeit, welche als Novelty die vorher nicht bekannten Inhalte erkennen sollte. Novelty Mining basiert immer auf der satzweisen Erkennung und dem Vergleich mit den in der Datenbank vorhandenen Sätzen. Da die Kookkurrenzanalyse einzelne Terme identifiziert hat und die Trendsportanalyse sich vorwiegend auf die Erkennung von neuen Trendsportarten, somit Termen, fokussiert, müssen die Novelty Verfahren in abgeänderter Weise für den Trendsportalgorithmus angewendet werden. Der Algorithmus versucht einzelne Terme als novel zu erkennen und daher sollte der Sprachkorpus auf diese Wörter und deren Verwendung überprüft werden. Dabei könnte man die bisherige Verwendung sehr gut mit den Kookkurrenzen kontrollieren und dabei den Vergleich zu der bisherigen Verwendung und der aktuellen Verwendung anstellen. Falls der Term in der Datenbank noch nicht verwendet worden ist, sollte durch die Kookkurrenzanalyse zweiter Ordnung zumindest eine ähnliche sprachliche Verwendung wie andere Trendsportarten sichergestellt sein. Die davon nicht betroffenen Terme können nicht im Novelty Algorithmus berechnet werden, da dieser auf das in der Datenbank vorhandene Wissen aufbaut. Im Novelty Algorithmus überprüft man die vorher identifizierten Terme aus der Kookkurrenzanalyse erster Ordnung. Terme die in ihrer Verwendung im Dokument sich eindeutig von der Datenbank unterscheiden und wesentliche Trendsportidentifikatoren in den Kookkurrenzen haben sollten ausgewählt werden. Wiki Die ausgewerteten Terme sollten abschließend mittels Wikipedia einer Kontrolle unterzogen werden. Diese Begriffe können auf der Website durchführen und bei 4

5 einem Eintrag sollten die Begriffe verworfen werden. Trendsportarten sollten demnach nur identifiziert werden, wenn keine Einträge auf Wikipedia vorhanden sind. Conclusio Dieser Algorithmus und die Umsetzung auf Trendsportarten leistet zwar eine semantische Kontrolle der Verwendung in doppelter Hinsicht, sowohl im Clustering als auch in der Kookkurrenzüberprüfung, jedoch sind Begriffe, die nicht in der Datenbank enthaltenen sind, nicht zu kontrollieren. Diese Problematik verringert die Validität des Novelty Mining und außerdem ist das Novelty Mining in seinen bisherigen Anwendungen noch nicht zuverlässig um eine große Menge an Daten zu überprüfen. Diese Verfahren sollten zuerst auf kleinen Beispielsätzen überprüft werden und später in ihrer Umsetzung auf den spezifischen Bereich umgesetzt werden. Ein wesentlicher Einflussfaktor auf die Ergebnisse begründet der zugrunde liegende Sprachkorpus. Der Korpus das Projekt Deutscher Wortschatz ist nicht ausreichend spezialisiert im Bereich Trendsport, da die Inhalte sich aus Zeitungsberichten sammeln und nicht im Social Web oder auf Websites nach Daten suchen. Die gesuchten Trendsportarten stammen laut Schwier (2000) von Individuen und werden erst in späteren Phasen in Zeitungen veröffentlicht. Der Korpus sollte als Grundlage speziell auf das Anwendungsgebiet ausgerichtet sein und dem Anwender eine umfassende Satzdatenbank zur Verfügung stellen. Der Erfolg der Analyse hängt stark von der Größe und dem Inhalt des Sprachkorpus ab, da die Analyse aussagekräftiger wird umso mehr Information als Vergleichsparameter herangezogen werden kann. Die Novelty Analyse basiert auf satzweise und dokumentweise Vergleiche und muss für eine Trendsporterkennung so verändert werden, dass auch wenn das zu identifizierende Term nicht bekannt ist, es noch immer als novel und relevant für Trendsportarten erkannt werden kann. Der definierte Algorithmus basiert somit auf Kookkurrenzanalysen zweiter Ordnung die zuverlässig in der Verwendung eines Terms in einem Themenbereich ist. Durch die Textklassifizierung ist bereits gewährleistet, dass ein identifiziertes Nomen inhaltlich korrekt zugeordnet ist. 5

Midas Metadata yield by Data Analysis

Midas Metadata yield by Data Analysis Midas Metadata yield by Data Analysis Glossar powered by Was ist Text Mining? Unter Text Mining versteht sich im Allgemeinen die Extraktion von strukturierten Informationen aus unstrukturierten oder semistrukturierten

Mehr

Whitepaper Bio-Mode. Quelle: http://freshideen.com/trends/bio-kleidung.html

Whitepaper Bio-Mode. Quelle: http://freshideen.com/trends/bio-kleidung.html Whitepaper Bio-Mode Quelle: http://freshideen.com/trends/bio-kleidung.html Seite 1 von 11 Wo wird über Bio-Mode diskutiert? 0,79% 0,76% 0,00% 0,56% 5,26% 9,81% 9,93% 0,15% 72,73% News Soziale Netzwerke

Mehr

Supervised Learning Algorithmus für Stellenanzeigenklassifikation und Jobdeskriptoren Gewinnung

Supervised Learning Algorithmus für Stellenanzeigenklassifikation und Jobdeskriptoren Gewinnung Informatik Pawel Broda Supervised Learning Algorithmus für Stellenanzeigenklassifikation und Jobdeskriptoren Gewinnung Diplomarbeit Ludwig Maximilian Universität zu München Centrum für Informations- und

Mehr

Notationen zur Prozessmodellierung

Notationen zur Prozessmodellierung Notationen zur Prozessmodellierung August 2014 Inhalt (erweiterte) ereignisgesteuerte Prozesskette (eepk) 3 Wertschöpfungskettendiagramm (WKD) 5 Business Process Model and Notation (BPMN) 7 Unified Modeling

Mehr

Information Retrieval. Peter Kolb

Information Retrieval. Peter Kolb Information Retrieval Peter Kolb Semesterplan Einführung Boolesches Retrievalmodell Volltextsuche, invertierter Index Boolesche Logik und Mengen Vektorraummodell Evaluation im IR Term- und Dokumentrepräsentation

Mehr

Text-Mining: Einführung

Text-Mining: Einführung Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:

Mehr

Exposé zur Safari-Studie 2002: Der Mensch in IT-Projekten Tools und Methoden für den Projekterfolg durch Nutzerakzeptanz

Exposé zur Safari-Studie 2002: Der Mensch in IT-Projekten Tools und Methoden für den Projekterfolg durch Nutzerakzeptanz Exposé zur Safari-Studie 2002: Der Mensch in IT-Projekten Tools und Methoden für den Projekterfolg durch Nutzerakzeptanz Inhalt: Viele IT-Projekte scheitern nicht aus technisch bedingten Gründen, sondern

Mehr

IR Seminar SoSe 2012 Martin Leinberger

IR Seminar SoSe 2012 Martin Leinberger IR Seminar SoSe 2012 Martin Leinberger Suchmaschinen stellen Ergebnisse häppchenweise dar Google: 10 Ergebnisse auf der ersten Seite Mehr Ergebnisse gibt es nur auf Nachfrage Nutzer geht selten auf zweite

Mehr

ANALYSIEREN VON SOCIAL MEDIA AKTIVITÄTEN

ANALYSIEREN VON SOCIAL MEDIA AKTIVITÄTEN ANALYSIEREN VON SOCIAL MEDIA AKTIVITÄTEN PROFI-Webcast 10.03.2015 Dr. Michael Kosmowski Software-Architekt Tel.: 0721 46 46 46 64 44 E-Mail: m.kosmowski@profi-ag.de AGENDA Was passiert bei unseren Kunden?

Mehr

Wie Forschende mit Web 2.0 ihren Alltag bewältigen Ergebnisse der bundesweiten Science 2.0 Studie

Wie Forschende mit Web 2.0 ihren Alltag bewältigen Ergebnisse der bundesweiten Science 2.0 Studie Wie Forschende mit Web 2.0 ihren Alltag bewältigen Ergebnisse der bundesweiten Science 2.0 Studie Dr. Doreen Siegfried Bibliothekartag 2014, Bremen, 5.Juni 2014 Session: Neue Ansätze der Nutzungsforschung

Mehr

Datenstrukturen und Algorithmen. Christian Sohler FG Algorithmen & Komplexität

Datenstrukturen und Algorithmen. Christian Sohler FG Algorithmen & Komplexität Datenstrukturen und Algorithmen Christian Sohler FG Algorithmen & Komplexität 1 Clustering: Partitioniere Objektmenge in Gruppen(Cluster), so dass sich Objekte in einer Gruppe ähnlich sind und Objekte

Mehr

Volltextsuche und Text Mining

Volltextsuche und Text Mining Volltextsuche und Text Mining Seminar: Einfuehrung in die Computerlinguistik Dozentin: Wiebke Petersen by Rafael Cieslik 2oo5-Jan-2o 1 Gliederung 1. Volltextsuche 1. Zweck 2. Prinzip 1. Index 2. Retrieval

Mehr

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing

Domain-independent. independent Duplicate Detection. Vortrag von Marko Pilop & Jens Kleine. SE Data Cleansing SE Data Cleansing Domain-independent independent Duplicate Detection Vortrag von Marko Pilop & Jens Kleine http://www.informatik.hu-berlin.de/~pilop/didd.pdf {pilop jkleine}@informatik.hu-berlin.de 1.0

Mehr

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko Interdisziplinäre fachdidaktische Übung: Sprache und Modelle SS 2015: Grossmann, Jenko Einleitung Was ist ein Modell? Sprachlich orientierte Modelle Beispiele Wie entstehen Modelle? Zusammenhang Modell

Mehr

Vorstellung des Diplomarbeitsthemas. dawn. (direction. anticipation in web-navigation. navigation) Sebastian Stober 12.

Vorstellung des Diplomarbeitsthemas. dawn. (direction. anticipation in web-navigation. navigation) Sebastian Stober 12. Vorstellung des Diplomarbeitsthemas dawn (direction anticipation in web-navigation navigation) Sebastian Stober 12. August 2005 Motivation Suchmaschinen & Verzeichnisse bieten einem User einen guten Einstiegspunkt

Mehr

Linguistische Informatik

Linguistische Informatik Linguistische Informatik Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Das klassische Verarbeitungsmodell Lexikon Grammatik Input: natürlichsprachlicher Satz

Mehr

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest)

Der χ 2 -Test. Überblick. Beispiel 1 (χ 2 -Anpassungstest) Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln

Mehr

Christian Zietzsch / Norman Zänker. Text Mining. und dessen Implementierung. Diplomica Verlag

Christian Zietzsch / Norman Zänker. Text Mining. und dessen Implementierung. Diplomica Verlag Christian Zietzsch / Norman Zänker Text Mining und dessen Implementierung Diplomica Verlag Christian Zietzsch, Norman Zänker Text Mining und dessen Implementierung ISBN: 978-3-8428-0970-3 Herstellung:

Mehr

Der χ2-test Der χ2-test

Der χ2-test Der χ2-test Der χ 2 -Test Überblick Beim χ 2 -Test handelt es sich um eine Familie ähnlicher Tests, die bei nominal- oder ordinalskalierten Merkmalen mit zwei oder mehr Ausprägungen angewendet werden können. Wir behandeln

Mehr

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN

EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7.

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2004 Termin: 22. 7. 2004 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

STUDIE: Psychologische Verfahren der externen Personalauswahl aus Sicht der Bewerber

STUDIE: Psychologische Verfahren der externen Personalauswahl aus Sicht der Bewerber STUDIE: Psychologische Verfahren der externen Personalauswahl aus Sicht der Bewerber personnel insight Deinhardplatz 3 56068 Koblenz Tel.: 0261 9213900 nicole.broockmann@personnel-insight.de Theoretischer

Mehr

Förderantragberatung. SWOT-Analyse. und Projektbegleitung Gerhard Noack. Einführung. in die. SWOT-Analyse. Zukunftswerkstatt Materialien

Förderantragberatung. SWOT-Analyse. und Projektbegleitung Gerhard Noack. Einführung. in die. SWOT-Analyse. Zukunftswerkstatt Materialien P Förderantragberatung SWOT-Analyse Einführung in die SWOT-Analyse 1 Definition Die SWOT-Analyse ist das gegenüberstellende Betrachten und Zusammenführen der (eigenen) Stärken (Strengths) Schwächen (Weaknesses),

Mehr

Projektgruppe. Clustering und Fingerprinting zur Erkennung von Ähnlichkeiten

Projektgruppe. Clustering und Fingerprinting zur Erkennung von Ähnlichkeiten Projektgruppe Jennifer Post Clustering und Fingerprinting zur Erkennung von Ähnlichkeiten 2. Juni 2010 Motivation Immer mehr Internet-Seiten Immer mehr digitale Texte Viele Inhalte ähnlich oder gleich

Mehr

Neue Erkenntnisse aus unstrukturierten Daten gewinnen

Neue Erkenntnisse aus unstrukturierten Daten gewinnen Neue Erkenntnisse aus unstrukturierten Daten gewinnen Univ.-Prof. Dr. Josef Küng Institut für anwendungsorientierte Wissensverarbeitung (FAW) Johannes Kepler Universität Linz In Zusammenarbeit mit Mag.

Mehr

ABSCHNITT I EINLEITUNG

ABSCHNITT I EINLEITUNG 1 ABSCHNITT I EINLEITUNG A. Hintergrund des Problems Sprache wird von allen genutzt, um ihre Wünsche, Ideen und Überlegungen zu äußern. Außerdem benutzen Menschen auch Sprache, damit sie miteinander in

Mehr

Screenshot Xinoah Jens Forker Xinoah 2009

Screenshot Xinoah Jens Forker Xinoah 2009 Screenshot Xinoah Jens Forker Xinoah 2009 Xinoah in der Praxis als einfache Demo haben wir 1.918 Dokumente zum Thema Erneuerbare Energien aus Wikipedia ausgewählt diese 1.918 Dokumente sind durch die Vorverarbeitung

Mehr

BibSpider Eine neue Recherchemethode für Schlagwort- und Titelsuche

BibSpider Eine neue Recherchemethode für Schlagwort- und Titelsuche know-how innovation BibSpider Eine neue Recherchemethode für Schlagwort- und Titelsuche 05.09.2018, Adriano Meyer Broyn solution Zielsetzungen Zusammenspiel von Titeln und Inhaltserschliessung besser verstehen.

Mehr

Einheitlicher Ansprechpartner 2.0 / Suchtechnologie und Chatbots. Berlin,

Einheitlicher Ansprechpartner 2.0 / Suchtechnologie und Chatbots. Berlin, Einheitlicher Ansprechpartner 2.0 / Suchtechnologie und Chatbots Berlin, 12.07.2016 Suchmethoden im Überblick Keyword-basierte Suche Semantische Suche machine learning Suche Exakte Suche nach Textketten

Mehr

Clustern: Voraussetzungen

Clustern: Voraussetzungen Clustering Gruppen (Cluster) ähnlicher Elemente bilden Elemente in einem Cluster sollen sich möglichst ähnlich sein, u. den Elementen in anderen Clustern möglichst unähnlich im Gegensatz zu Kategorisierung

Mehr

Frequent Itemset Mining + Association Rule Mining

Frequent Itemset Mining + Association Rule Mining Frequent Itemset Mining + Association Rule Mining Studiengang Angewandte Mathematik WS 2015/16 Frequent Itemset Mining (FIM) 21.10.2015 2 Einleitung Das Frequent-Itemset-Mining kann als Anfang des modernen,

Mehr

Seminararbeit. Jan Dennis Bartels. Text Mining. Fakultät Technik und Informatik Studiendepartment Informatik

Seminararbeit. Jan Dennis Bartels. Text Mining. Fakultät Technik und Informatik Studiendepartment Informatik Seminararbeit Jan Dennis Bartels Text Mining Fakultät Technik und Informatik Studiendepartment Informatik Faculty of Engineering and Computer Science Department of Computer Science Jan Dennis Bartels Text

Mehr

CyMON - SDMS. Warum SDMS? Semantisches Dokumenten Management System

CyMON - SDMS. Warum SDMS? Semantisches Dokumenten Management System CyMON - SDMS Semantisches Dokumenten Management System Warum SDMS? Die Informationsgesellschaft basiert auf schneller Verfügbarkeit und einfacher Verwendbarkeit von großen Mengen an Daten und Informationen.

Mehr

25 Jahre Erfahrung. Sie kommunizieren multilingual? Wir haben die Prozesse.

25 Jahre Erfahrung. Sie kommunizieren multilingual? Wir haben die Prozesse. 25 Jahre Erfahrung Sie kommunizieren multilingual? Wir haben die Prozesse. Die Herausforderungen an technische Redakteure und an technische Fachübersetzer haben enorm zugenommen. Die Effizienz einzelner

Mehr

Projektdokumentation Gesichtserkennung per Eigengesichtsanalyse

Projektdokumentation Gesichtserkennung per Eigengesichtsanalyse Hochschule RheinMain Master Informatik Digitale Bildanalyse bei Prof. Dr. U. Schwanecke Projektdokumentation Gesichtserkennung per Eigengesichtsanalyse von Florian Feuerstein (florian feuerstein@web.de)

Mehr

NI-TDM-Datenformat. Komfortables Arbeiten mit TDM-Dateien in LabVIEW

NI-TDM-Datenformat. Komfortables Arbeiten mit TDM-Dateien in LabVIEW NI-TDM-Dateiformat NI-TDM-Datenformat Im Verlauf des gesamten Entwicklungsprozesses für ein neues Produkt werden große Mengen technischer Daten erzeugt sei es bei der Simulation bestimmter Vorgänge oder

Mehr

Digital Signage Lösung aus einer Hand

Digital Signage Lösung aus einer Hand Digital Signage Lösung aus einer Hand Mit unserer neuen Dienstleistung movebox cloud erstellen und verwalten Sie auf einfachste Weise attraktive Inhalte für Ihre Digitalen Plakate und interaktiven Kiosks.

Mehr

Metadaten in CLARIN-D

Metadaten in CLARIN-D Metadaten in CLARIN-D Zielstellung, PIDs, CMDI, OAI-PMH, Fedora Prof. Dr. Gerhard Heyer Torsten Compart Abt. Automatische Sprachverarbeitung Institut für Informatik, Universität Leipzig heyerasv@informatik.uni-leipzig.de

Mehr

Kurze Einführung in Web Data Mining

Kurze Einführung in Web Data Mining Kurze Einführung in Web Data Mining Yeong Su Lee Centrum für Informations- und Sprachverarbeitung (CIS), LMU 17.10.2007 Kurze Einführung in Web Data Mining 1 Überblick Was ist Web? Kurze Geschichte von

Mehr

Worteinbettung als semantisches Feature in der argumentativen Analyse

Worteinbettung als semantisches Feature in der argumentativen Analyse Worteinbettung als semantisches Feature in der argumentativen Analyse Bachelorverteidigung Kevin Lang 22.03.2016 Übersicht Was ist die argumentative Analyse? Worteinbettung und Word2Vec Resultate Diskussion

Mehr

Semantic Web: Das Web der nächsten Generation

Semantic Web: Das Web der nächsten Generation Semantic Web: Das Web der nächsten Generation Slim Abdennadher LMU München 8.2.2002 c S. Abdennadher 1 Einleitung Rechner erfunden als Werkzeug zur Durchführung von Berechnungen Dann entdeckt als Werkzeug

Mehr

Ablaufschema beim Testen

Ablaufschema beim Testen Ablaufschema beim Testen Schritt 1 Schritt 2 Schritt 3 Schritt 4 Schritt 5 Schritt 6 Schritt 7 Schritt 8 Schritt 9 Starten Sie die : Flashanimation ' Animation Ablaufschema Testen ' siehe Online-Version

Mehr

Professionelle Konversions- Analyse und -Optimierung

Professionelle Konversions- Analyse und -Optimierung Professionelle Konversions- Analyse und -Optimierung etracker GmbH 1 Ich verschreibe Ihnen eine Sammlung an Medikamenten auf Basis von Best-Practices. Probieren Sie die Medikamente der Reihe nach aus und

Mehr

Eine Grafik genauer beschreiben

Eine Grafik genauer beschreiben Eine Grafik genauer beschreiben KOMMUNIKATION NIVEAU NUMMER SPRACHE Mittelstufe B2_2057X_DE Deutsch Lernziele Wiederhole eine Grafik zu beschreiben und deine Analyse zu formulieren Übe, eine Grafik zu

Mehr

Wie fit ist Ihr KMUnternehmen?

Wie fit ist Ihr KMUnternehmen? Fit für die Zukunft Nutzen eines Fitness-Checks für Unternehmen Wie fit ist Ihr KMUnternehmen? Waren Sie persönlich in letzter Zeit zu einem ärztlichen Fitness-Check und wissen nun, wie Sie zwäg sind?

Mehr

Sprachstatistik: Das Zipf sche Gesetz

Sprachstatistik: Das Zipf sche Gesetz Sprachstatistik: Das Zipf sche Gesetz Korpus-Workshop Thema Korpus-Statistik Thomas Wittig Universität Leipzig Institut für Informatik wittig@uni-leipzig.de Principle of Least Effort 2 George K. Zipf:

Mehr

Informationsextraktion. Christoph Wiewiorski Patrick Hommers

Informationsextraktion. Christoph Wiewiorski Patrick Hommers Informationsextraktion Christoph Wiewiorski Patrick Hommers 1 Informationsextraktion(IE) - Einführung Ziel: Domänenspezifische Informationen aus freiem Text gezielt aufspüren und strukturieren Gleichzeitig

Mehr

Quellen des Neuen Die Integration von Ressourcen zur schulischen und universitären Bildung in die CLARIN-D-Infrastruktur

Quellen des Neuen Die Integration von Ressourcen zur schulischen und universitären Bildung in die CLARIN-D-Infrastruktur Quellen des Neuen Die Integration von Ressourcen zur schulischen und universitären Bildung in die CLARIN-D-Infrastruktur - Ein CLARIN-D Kurationsprojekt der F-AG Neuere Geschichte - Maret Keller, Christian

Mehr

Projektgruppe. FG Engels. Enthält eine zusätzliche Folie. Fabian Christ, Benjamin Nagel, Henning Wachsmuth. Anmeldung bis 28.

Projektgruppe. FG Engels. Enthält eine zusätzliche Folie. Fabian Christ, Benjamin Nagel, Henning Wachsmuth. Anmeldung bis 28. Enthält eine zusätzliche Folie Projektgruppe Fabian Christ, Benjamin Nagel, Henning Wachsmuth FG Engels Bereich SWT Anmeldung bis 28. Februar 2010 28. Januar 2010 1 Softwarespezifikation in der Praxis...

Mehr

TOYOTA I_SITE Mehr als Flottenmanagement

TOYOTA I_SITE Mehr als Flottenmanagement KOMPETENZ FÜR IHR UNTERNEHMEN KOMPETENZ FÜR IHR UNTERNEHMEN TOYOTA I_SITE Mehr als Flottenmanagement LÖSUNGEN FÜR GEBRAUCHTSTAPLER Kaufen Sie mit Vertrauen www.toyota-forklifts.at www.toyota-forklifts.de

Mehr

Automatisierte Verfahren für die Themenanalyse nachrichtenorientierter Textquellen

Automatisierte Verfahren für die Themenanalyse nachrichtenorientierter Textquellen methoden und forschungslogik der kommunikationswissenschaft Andreas Niekler Automatisierte Verfahren für die Themenanalyse nachrichtenorientierter Textquellen HERBERT VON HALEM VERLAG Bibliografische Information

Mehr

DWH Automatisierung mit Data Vault 2.0

DWH Automatisierung mit Data Vault 2.0 DWH Automatisierung mit Data Vault 2.0 Andre Dörr Trevisto AG Nürnberg Schlüsselworte Architektur, DWH, Data Vault Einleitung Wenn man die Entwicklung von ETL / ELT Prozessen für eine klassische DWH Architektur

Mehr

Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale?

Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale? Text Welche Textklassifikationen gibt es und was sind ihre spezifischen Merkmale? Textklassifikationen Natürliche bzw. unstrukturierte Texte Normale Texte ohne besondere Merkmale und Struktur Semistrukturierte

Mehr

Semiautomatische Erschließung von Psychologie-Information

Semiautomatische Erschließung von Psychologie-Information PETRUS-Workshop "Automatische Erschließungsverfahren" 21./22.03.2011 Dipl.-Psych. Michael Gerards Semiautomatische Erschließung von Psychologie-Information Kontext Die Literaturdatenbank PSYNDEX: Erschließt

Mehr

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation:

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation: 02. Mai 2005 P R O J E C T C O N S U L T GmbH GmbH 1 Agenda Einführung Automatische Klassifikation Qualität Veränderung des Arbeitsumfeldes Ausblick GmbH 2 1 Einführung GmbH 3 Eine Herausforderung geordnete

Mehr

Identifizierung einer unbekannten Verbindung durch Röntgen- Pulverbeugung mit Hilfe einer Datenbank für Pulverdiffraktogramme

Identifizierung einer unbekannten Verbindung durch Röntgen- Pulverbeugung mit Hilfe einer Datenbank für Pulverdiffraktogramme Versuch Nr. 5 Identifizierung einer unbekannten Verbindung durch Röntgen- Pulverbeugung mit Hilfe einer Datenbank für Pulverdiffraktogramme Einleitung: Ein wichtiges Anwendungsgebiet der Röntgen-Pulverbeugung

Mehr

Abb. 1 Tastatur und USB-Stick mit Fingerabdruckerkennung

Abb. 1 Tastatur und USB-Stick mit Fingerabdruckerkennung Funktionsweise einer Fingerabdruckerkennung 1. Einleitung Hallo zusammen! Heute möchte ich euch erklären, wie ein Fingerabdruckscanner funktioniert. Der eine oder andere mag dieser Technologie vielleicht

Mehr

fragfinn Prüfpraxis Spiele fragfinn e.v. Beuthstraße 6 10117 Berlin info@fragfinn.de www.fragfinn.de Tel. 030 24 04 84-50 Fax 030 24 04 84-58

fragfinn Prüfpraxis Spiele fragfinn e.v. Beuthstraße 6 10117 Berlin info@fragfinn.de www.fragfinn.de Tel. 030 24 04 84-50 Fax 030 24 04 84-58 fragfinn Prüfpraxis Spiele fragfinn e.v. Beuthstraße 6 10117 Berlin info@fragfinn.de www.fragfinn.de Tel. 030 24 04 84-50 Fax 030 24 04 84-58 1. Kinder und Online-Spiele im Internet... 2 2. Überblick Spieleformen...

Mehr

Identifizieren und Extrahieren von Musikveranstaltungen aus dem Web

Identifizieren und Extrahieren von Musikveranstaltungen aus dem Web hooolp.net Exposé zur Diplomarbeit Identifizieren und Extrahieren von Musikveranstaltungen aus dem Web Hung Le hle@informatik.hu-berlin.de 29. Juni 2009 Betreuer: Prof. Dr. Ulf Leser, Manfred Pokrandt

Mehr

Semiautomatische Erschließung von Psychologie-Information

Semiautomatische Erschließung von Psychologie-Information PETRUS-Workshop "Automatische Erschließungsverfahren" 21./22.03.2011 Dipl.-Psych. Michael Gerards Semiautomatische Erschließung von Psychologie-Information Kontext Die Literaturdatenbank PSYNDEX: Erschließt

Mehr

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model

Mehr

Kompendium semantische Netze

Kompendium semantische Netze Klaus Reichenberger Kompendium semantische Netze Konzepte, Technologie, Modellierung Inhaltsverzeichnis 1 Warum dieses Buch? 1 1.1 Was erwartet Sie in diesem Buch? I 2 Grundlagen semantischer Netze 3 2.1

Mehr

Web Mining und Farming

Web Mining und Farming Web Mining und Farming Shenwei Song Gliederung Übersicht über Web Mining und Farming Web Mining Klassifikation des Web Mining Wissensbasierte Wrapper-Induktion Web Farming Übersicht über Web-Farming-Systeme

Mehr

Extraktion der Tabellen aus XML-Dokumenten und Erkennung deren Semantik. Exposé zur Bachelorarbeit

Extraktion der Tabellen aus XML-Dokumenten und Erkennung deren Semantik. Exposé zur Bachelorarbeit Extraktion der Tabellen aus XML-Dokumenten und Erkennung deren Semantik Exposé zur Bachelorarbeit eingereicht von Irina Glushanok 23.04.2015 1 Einführung Um eine bequeme Suche nach passender Literatur

Mehr

Kompetenzraster Deutsch 7/8

Kompetenzraster Deutsch 7/8 Kompetenzraster Deutsch 7/8 Zuhören und Sprechen Schreiben Lesen Grammatik kann anderen zuhören, gezielt nachfragen und auf andere eingehen kann dem Schreibanlass angemessen schreiben, z.b. berichten,

Mehr

Werbung in Social Media

Werbung in Social Media Werbung in Social Media YOUTUBE UND XING EIN VERGLEICH DER MÖGLICHKEITEN IM SOCIAL WEB Die Gestaltungsmöglichkeiten und die Anwendungen im Web 2.0 könnten vielfältiger nicht sein. Zusammenfassend kann

Mehr

Recommender-System für Projektkollaborationen basierend auf wissenschaftlichen Publikationen und Patenten

Recommender-System für Projektkollaborationen basierend auf wissenschaftlichen Publikationen und Patenten basierend auf wissenschaftlichen Publikationen und Patenten PD Dr. Christoph Quix 1,2, Sandra Geisler 2, Rihan Hai 2 1 Fraunhofer-Institut für Angewandte Informationstechnik FIT http://fit.fraunhofer.de

Mehr

Anreize und finanzielles Entscheidungsverhalten

Anreize und finanzielles Entscheidungsverhalten Institut für Banking und Finance Executive Summary Anreize und finanzielles Entscheidungsverhalten Direktor Prof. Dr. Thorsten Hens Betreuerin: Dr. Kremena Bachmann Verfasser: Oliver Merz Executive Summary

Mehr

Process Communication Model

Process Communication Model Process Communication Model Der Schlüssel für konstruktive Kommunikation by Kahler Communication process communication model Überblick Das Process Communication Model ist ein von Dr. Taibi Kahler entwickeltes

Mehr

Data Science Marktforschung

Data Science Marktforschung Data Science Marktforschung Webinar 12. Juli 2018 Wie Data Science die Marktforschung verändert Christopher Harms, Consultant Research & Development Klassische Marktforschungsprojekte sind fokussiert auf

Mehr

SHARE_Personas Stimulierungsprojekt FFG Programm Benefit 5. Aussschreibung. Bernhard Wöckl Mai 2010

SHARE_Personas Stimulierungsprojekt FFG Programm Benefit 5. Aussschreibung. Bernhard Wöckl Mai 2010 SHARE_Personas Stimulierungsprojekt FFG Programm Benefit 5. Aussschreibung Bernhard Wöckl Mai 2010 Projektpartner CURE Center for Usability Research and Engineering Know-How in den Bereichen Personas Erstellung

Mehr

NOW YOU KNOW [ONTOS TM WHITE PAPER SERIES] Intelligentes Information Mining durch Ontologie [YVES BRENNWALD, ONTOS INTERNATIONAL AG]

NOW YOU KNOW [ONTOS TM WHITE PAPER SERIES] Intelligentes Information Mining durch Ontologie [YVES BRENNWALD, ONTOS INTERNATIONAL AG] NOW YOU KNOW [ SERIES] Intelligentes Information Mining durch Ontologie [YVES BRENNWALD, ONTOS INTERNATIONAL AG] 001 Information Mining Wissen in unstrukturierten Daten aufdecken Information Mining ist

Mehr

Britannica Academic Edition

Britannica Academic Edition Britannica Academic Edition Umfangreichste englischsprachige Allgemein- Enzyklopädie Aktuelle und verständliche Informationen von hoher Qualität über 100.000 neue und aktualisierte Artikeln Suchanforderungen

Mehr

Profiling Linked Open Data with ProLOD. LiDDM: A Data Mining System for Linked Data

Profiling Linked Open Data with ProLOD. LiDDM: A Data Mining System for Linked Data Profiling Linked Open Data with ProLOD LiDDM: A Data Mining System for Linked Data Seminar aus maschinellem Lernen Frederik Janssen, Dr. Heiko Paulheim 20. Dez.2011 Fachbereich 20 Informatik Seminar aus

Mehr

Bitte an das Labor weiterleiten Wichtige Produktinformation. WICHTIGER PRODUKT-SICHERHEITS- UND KORREKTURHINWEIS VITEK MS System: Einschränkungen

Bitte an das Labor weiterleiten Wichtige Produktinformation. WICHTIGER PRODUKT-SICHERHEITS- UND KORREKTURHINWEIS VITEK MS System: Einschränkungen Customer Service Wichtige Information Genf, 10. Februar 2017 FSCA 1016267 - VTK MS Bitte an das Labor weiterleiten Wichtige Produktinformation WICHTIGER PRODUKT-SICHERHEITS- UND KORREKTURHINWEIS VITEK

Mehr

Die Branche im Überblick Wer gehört dazu?

Die Branche im Überblick Wer gehört dazu? Die Branche im Überblick Wer gehört dazu? Beim Begriff Gesundheitswirtschaft denken viele von uns zunächst an Arztpraxen, Apotheken und Krankenhäuser. Tatsächlich gehören darüber hinaus noch viele weitere

Mehr

Die Personenbeschreibung im Fremdsprachenunterricht

Die Personenbeschreibung im Fremdsprachenunterricht Germanistik Mohamed Chaabani Die Personenbeschreibung im Fremdsprachenunterricht Forschungsarbeit 1 Die Personenbeschreibung im Fremdsprachenunterricht Chaabani Mohamed Abstract Gegenstand dieser Arbeit

Mehr

Betriebswirtschaftliche Schwerpunkte der Unternehmensgründung I

Betriebswirtschaftliche Schwerpunkte der Unternehmensgründung I Michael Schefczyk unter Mitarbeit von Frank Pankotsch Betriebswirtschaftliche Schwerpunkte der Unternehmensgründung I - Kopfkurs - Professionalisierungsstudium Start Up Counselling Das dieser Veröffentlichung

Mehr

Die SWOT-Analyse als Instrument zur Produktimplementierung im Gesundheitstourismus

Die SWOT-Analyse als Instrument zur Produktimplementierung im Gesundheitstourismus Wirtschaft Gerhard Gstettner Die SWOT-Analyse als Instrument zur Produktimplementierung im Gesundheitstourismus Erfolgsfaktoren und Maßnahmen für das Fallbeispiel Ötztaler Naturtherapie Masterarbeit Bibliografische

Mehr

Implementierung: Dokumentclustering

Implementierung: Dokumentclustering Implementierung: Dokumentclustering Max Jakob Florian Winkelmeier Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik HS Information Retrieval Dozentin: Dr. Karin Haenelt Wintersemester

Mehr

Servicestelle für Übersetzung Campus International. Das neue Wörterbuch der Universität Mannheim. Die Anmeldung

Servicestelle für Übersetzung Campus International. Das neue Wörterbuch der Universität Mannheim. Die Anmeldung Das neue Wörterbuch der Universität Mannheim Ebenso wie ein einheitliches Corporate Design, also ein optischer Auftritt, trägt auch eine einheitliche Corporate Language, ein einheitlicher sprachlicher

Mehr

Praktikum Textmining

Praktikum Textmining Praktikum Textmining Uwe Quasthoff Christoph Teichmann Abteilung Automatische Sprachverarbeitung November 16, 2010 Uwe Quasthoff, Christoph Teichmann (ASV) Praktikum Textmining November 16, 2010 1 / 19

Mehr

III. Ergebnisteil CD8 CD4. III.1. Separation von CD4 + und CD8 + T-Lymphozyten aus peripherem Blut

III. Ergebnisteil CD8 CD4. III.1. Separation von CD4 + und CD8 + T-Lymphozyten aus peripherem Blut 27 III. Ergebnisteil III.1. Separation von CD4 + und CD8 + T-Lymphozyten aus peripherem Blut Durch Anwendung des vorher schon im Material- und Methodenteil beschriebenen MACS-Systems konnten CD4 + bzw.

Mehr

Hochdeutscherwerb an Schweizer Schulen. Eine linguistische Analyse von vier mündlichen Erstklässlererzählungen

Hochdeutscherwerb an Schweizer Schulen. Eine linguistische Analyse von vier mündlichen Erstklässlererzählungen Germanistik Caroline Seeger-Herter Hochdeutscherwerb an Schweizer Schulen. Eine linguistische Analyse von vier mündlichen Erstklässlererzählungen Studienarbeit Lic.phil. Caroline Seeger Herter Hochdeutscherwerb

Mehr

Analytisches CRM in der Automobilindustrie

Analytisches CRM in der Automobilindustrie Analytisches CRM in der Automobilindustrie Dr. Frank Säuberlich Practice Manager European Customer Solutions Urban Science International GmbH Automobilhersteller müssen neue Wege gehen Anforderungen in

Mehr

Constraint-basierte Planung und Optimierung von Prüfungsterminen mithilfe einer graphischen Benutzeroberfläche

Constraint-basierte Planung und Optimierung von Prüfungsterminen mithilfe einer graphischen Benutzeroberfläche Douglas Cunningham,Petra Hofstedt, Klaus Meer, IngoSchmitt (Hrsg.): INFORMATIK 2015 LectureNotes in Informatics (LNI), Gesellschaft für Informatik, Bonn 2015 Constraint-basierte Planung und Optimierung

Mehr

Reporting Lösungen für APEX wähle Deine Waffen weise

Reporting Lösungen für APEX wähle Deine Waffen weise Reporting Lösungen für APEX wähle Deine Waffen weise Dietmar Aust Opal-Consulting Köln Schlüsselworte: Oracle APEX, Reporting, JasperReports, PL/PDF, BI Publisher, OPAL:XP, Doxxy, Oracle Rest Data Services

Mehr

Reisebewertungsportale und Konsumentenverhalten

Reisebewertungsportale und Konsumentenverhalten Reisebewertungsportale und Prof. Dr. Achim Spiller Dr. Katia L. Sidali Dr. Holger Schulze 20.01.2010 1 Gliederung Einleitung Ziele Methodische Vorgehensweise Ergebnisse der Studie Einleitung Geänderte

Mehr

Vorlesung Maschinelles Lernen

Vorlesung Maschinelles Lernen Vorlesung Maschinelles Lernen LACE Katharina Morik LS 8 Künstliche Intelligenz Fakultät für Informatik Technische Universität Dortmund 28.1.2014 1 von 71 Gliederung 1 Organisation von Sammlungen Web 2.0

Mehr

Fakultät für Mathematik, Informatik und Physik

Fakultät für Mathematik, Informatik und Physik Zusammenfassender Bericht LV-Evaluierung WS 2008/09 Stand: April 2009 - Zufriedenheit der Studierenden mit der Lehre - Arbeitsbereich Qualitätssicherung in Studium und Lehre Datum: April 2009 Vizerektorat

Mehr

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente.

T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Vektorraummodell T = {t 1,..., t n } sei die Menge der Terme. D = {d 1,..., d m } sei die Menge der Dokumente. Dokumente und Anfragen werden als Vektoren in einem Vektorraum aufgefaßt. Der Vektorraum wird

Mehr

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2008 Termin: 4. 7.

Semestralklausur zur Vorlesung. Web Mining. Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2008 Termin: 4. 7. Semestralklausur zur Vorlesung Web Mining Prof. J. Fürnkranz Technische Universität Darmstadt Sommersemester 2008 Termin: 4. 7. 2008 Name: Vorname: Matrikelnummer: Fachrichtung: Punkte: (1).... (2)....

Mehr

VO Sprachtechnologien, Informations- und Wissensmanagement

VO Sprachtechnologien, Informations- und Wissensmanagement , Informations- und Wissensmanagement Zentrum für Translationswissenschaft Rückblick: Definition Digital Humanities Hilfswissenschaft im Spannungsfeld zwischen geisteswissenschaftlichen Fragestellungen,

Mehr

Gliederung. 1. Einleitung (1) 1. Einleitung (2) On detecting differences between groups

Gliederung. 1. Einleitung (1) 1. Einleitung (2) On detecting differences between groups Seminar im Fach Informatik Sommersemester 2006 Sascha Rüger Gliederung 1. Einleitung 2. Data Mining Systeme 3. Auswertung 4. Weitere Untersuchungen 5. Fazit 1. Einleitung (1) wichtige Aufgabe der Datenanalyse:

Mehr

Wo sind meine Anforderungen?

Wo sind meine Anforderungen? Whitepaper Telekommunikation Wo sind meine Anforderungen? Eine effektive Lösung auf Basis von Confluence und JIRA 2011 SYRACOM AG 1 Einleitung Erfahrene Projektmitarbeiter sehen sich oftmals im Projektalltag

Mehr

Grundlagen und Definitionen

Grundlagen und Definitionen Grundlagen und Definitionen Wissensmanagement VO 340088 Bartholomäus Wloka https://www.adaptemy.com Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache. Kann

Mehr

Fachpresse Statistik (die Unvollendete)

Fachpresse Statistik (die Unvollendete) Fachpresse Statistik (die Unvollendete) Dies ist eine Sammelseite für Informationen, die bei den Recherchen zur Validierung der Fachpresse angefallen sind was in diesem Umfang nicht zu unserem Blog passt.

Mehr

2. Datenvorverarbeitung

2. Datenvorverarbeitung Kurzreferat Das Ziel beim Clustering ist es möglichst gleich Datensätze zu finden und diese in Gruppen, sogenannte Cluster zu untergliedern. In dieser Dokumentation werden die Methoden k-means und Fuzzy

Mehr

Was ist Statistik? Wozu dienen statistische Methoden?

Was ist Statistik? Wozu dienen statistische Methoden? 25. APRIL 2002: BLATT 1 Übersicht Was ist Statistik? Wozu dienen statistische Methoden? Was ist maschinelle Sprachverarbeitung? Welche Rolle spielen statistische Methoden in verschiedenen Teilbereichen

Mehr