Automatische Textzusammenfasung

Größe: px
Ab Seite anzeigen:

Download "Automatische Textzusammenfasung"

Transkript

1 Automatische Textzusammenfasung Katja Diederichs Francisco Mondaca Simon Ritter PS Computerlinguistische Grundlagen I - Jürgen Hermes - WS 09/10 Uni Köln

2 Gliederung 1) Einleitung & Überblick 2) Ansätze zur Textzusammenfassung 3) Stufen der Textzusammenfassung 4) Anwendungsbeispiel

3 Definition Eine Zusammenfassung ist ein Text, der aus einem oder mehreren Texten erstellt wird und einen relevanten Teil der Informationen des Textes oder der Texte beinhaltet. Sie ist nicht länger als die Hälfte des Originaltextes (vgl. Hovy 2003 : 584).

4 Text Multimediale Dokumente Online Dokumente Hypertexte Usw...

5 Typen von Zusammenfassungen Indikative: Sie stellen die Grundidee des Textes dar ohne auf den Inhalt näher einzugehen. Informative: Sie bieten eine kürzere Version des Textinhaltes.

6 Typen von Zusammenfassungen Extracts: Geben Teile des Originaltextes wortwörtlich wieder. Abstracts: Werden durch die Regenerierung von extrahiertem Inhalt erstellt.

7 Entwicklung Ende 1950, Anfang 1960: Statistische Verfahren Anfang 1980: Wissensbasierte Verfahren Aktuell: Annäherung der Qualität an menschliche Leistung

8 Ansätze zur Textzusammenfassung Klassischer statistischer Ansatz - Statistisches Verfahren entwickelt ein Extract - Statistische Verteilung von Merkmalen wird berücksichtigt ohne Text zu verstehen - Wichtigkeit eines Wortes = Häufigkeit seines Auftretens

9 Ansätze zur Textzusammenfassung Neuerer statistischer Ansatz Das System lernt anhand eines Korpus von menschlichen Abstracts, welche Sätze extrahiert werden sollen Trainingskorpus ingenieurwissenschaftliche Texte Testkorpus ingenieurwissenschaftlicher Text; darf nicht identisch mit Trainingskorpus sein!

10 Ansätze zur Textzusammenfassung Neuerer statistischer Ansatz Für jeden Satz: Errechnung der Wahrscheinlichkeit, mit der ein menschlicher Zusammenfasser ihn positiv bewerten würde Mittels: Abgleich der statistischen Merkmale im gegebenen Testkorpus mit denen des Trainingskorpus anhand bestimmter Kriterien

11 Ansätze zur Textzusammenfassung Neuerer statistischer Ansatz Kriterien für Sätze positiv oder negativ gewertet Satzlänge => Sätze unter 5 Wörtern negativ Indikatorphrasen => In conclusion... positiv Absatzstruktur => Erste 10, letzte 5 Absätze positiv Themasätze am Anfang/Ende positiv Schlüsselwörter => Viele Schlüsselwörter positiv Akronyme => Eigenname, Akronym(IBM) positiv

12 Ansätze zur Textzusammenfassung Neuerer statistischer Ansatz Ergebnisse dieses Verfahrens zeigen: - Die Übereinstimmung mit menschlichen Abstracts beträgt ca. 35% - Die Übereinstimmung innerhalb menschlicher Abstracts ist ebenso groß

13 Ansätze zur Textzusammenfassung Wissensbasierter Ansatz Kognitive Wende: Wissensverarbeitende Systeme, deren Teilaufgaben sich am menschlichen Vorgehen beim Zusammenfassen orientierten

14 Ansätze zur Textzusammenfassung Wissensbasierter Ansatz Modell wissensbasierten Zusammenfassens: Carstensen 2004

15 Ansätze zur Textzusammenfassung Wissensbasierter Ansatz Modell wissensbasierten Zusammenfassens: (zu Abb. 5.7): 1: Quelltext (externe Information) wird in Bedeutungsrepräsentation umgesetzt (vgl. menschliches Verstehen) 2: Erst diese Repräsentation wird gekürzt (Reduktion/Verdichtung) 3: Aus dieser Kürzung wiederum wird der Text, die externe Zusammenfassung produziert

16 Ansätze zur Textzusammenfassung Wissensbasierter Ansatz D ie d rei d a rg es tellten S chritte w erd en nicht von jed em S ys tem volls tä nd ig d urchla ufen Scisor (Jacobs/Rau, 1990) (analyseorientiert) Vom Original ausgehende Zusammenfassung STREAK (McKeown et al., 1995) Textzusammenfassungen aus strukturiertem Datenbestand

17 Stufen der Textzusammenfassung 1: Bestimmung des Themas V ers chied ene M ethoden: Lage Indikatorphrasen Häufigkeit von Wörtern & Sätzen Titelüberlappung Verknüpfungen Durch die Kombination der Kriterien werden die besten Ergebnisse erzielt

18 Stufen der Textzusammenfassung 2: Interpretation Informationen werden verschmolzen & neu geordnet Ergebnisse dieser Stufe sind meist noch zusammenhangslose, schwer zu lesende Texte

19 Stufen der Textzusammenfassung 3: Erstellung der Zusammenfassung Entstandene Rohfassung wird in die Form eines natürlichen, kohärenten Text gebracht - Kompression - Zusammenlegung von Sätzen - Generierung von Überschriften - Grammatikalische Neuordnung Bei Extracts: Smoothing

20 Anwendungsbeispiel

21 Literatur CARSTENSEN, Kai-Uwe (Hrsg.) ( ). Computerlinguistik und Sprachtechnologie. München: Elsevier. MITKOV, Ruslan (Hrsg.) (2003). The Oxford Handbook of Computational Linguistics. Oxford: Oxford University Press.

Computerlinguistik Dozent: Dr. Jürgen Hermes Sprachsynthese. Referenten: Oliver Hummel und Carolin Schneider

Computerlinguistik Dozent: Dr. Jürgen Hermes Sprachsynthese. Referenten: Oliver Hummel und Carolin Schneider Computerlinguistik Dozent: Dr. Jürgen Hermes Sprachsynthese Referenten: Oliver Hummel und Carolin Schneider Überblick 1. Einführung 2. Geschichte der Sprachsynthese 3. Text to Speech System 1. Sprachverarbeitung

Mehr

Text Mining und Textzusammenfassung. Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer

Text Mining und Textzusammenfassung. Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer Text Mining und Textzusammenfassung Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer Übersicht 1. Definition 2. Prozessablauf 3. Textzusammenfassung 4. Praxisbeispiel Definition Text Mining is the art

Mehr

INFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka

INFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION 1 22.12.09 Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION(IE) 1. Einleitung 2. Ziel der IE 3. Funktionalität eines IE-Systems 4. Beispiel 5. Übung

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 18/19 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 18/19 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Wintersemester 18/19 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Morphologie Wort Morphem Allomorph Sprachtypologie anhand

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Was ist Computerlinguistik? Definition Anwendungen Fragestellung

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Mehrdeutigkeit der Wortart Einführung in die Computerlinguistik Statistische Modellierung und Evaluation WS 2008/2009 Manfred Pinkal Sie haben in Moskau liebe genossen Sie haben in Moskau liebe Genossen

Mehr

Text-Mining: Einführung

Text-Mining: Einführung Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:

Mehr

Computerlinguistik und Sprachtechnologie

Computerlinguistik und Sprachtechnologie Computerlinguistik und Sprachtechnologie Eine Einführung 2., überarbeitete und erweiterte Auflage Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde

Mehr

Vom Suchen und Finden - Google und andere Ansätze

Vom Suchen und Finden - Google und andere Ansätze Vom Suchen und Finden - Google und andere Ansätze Norbert Fuhr Universität Duisburg Essen FB Ingenieurwissenschaften Abteilung Informatik 12. Mai 2005 Gliederung 1 Einführung 2 Grundlagen 3 Erweiterte

Mehr

Bachelorarbeit. Was ist zu tun?

Bachelorarbeit. Was ist zu tun? Bachelorarbeit Was ist zu tun? Titelseite Zusammenfassung/Summary Inhaltsverzeichnis Abkürzungsverzeichnis Einleitung Material und Methoden Ergebnisse Diskussion Ausblick Literaturverzeichnis Danksagung

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Modellierung I WS 2010/2011 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt

Mehr

Udo Ohm, Universität Bielefeld. Bildungssprachliche Fähigkeiten und berufliches Handeln

Udo Ohm, Universität Bielefeld. Bildungssprachliche Fähigkeiten und berufliches Handeln Bildungssprachliche Fähigkeiten und berufliches Handeln Überblick Sprachliche Vermittlung fachlicher Inhalte Schule und Ausbildung als semiotische Lehrzeit Bildungssprache (BICS vs. CALP) Beispiel: Lesekompetenz

Mehr

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....

Mehr

Maschinelle Textzusammenfassung

Maschinelle Textzusammenfassung Eine Präsentation von T. Lindemeier und F. Kratschmann Januar 2009 Machine Language Processing H. Zinsmeister Universität Konstanz *Hovy. 2003. The Potential and Limitations of Automatic Sentence Extraction

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Grundlagen Laura Kallmeyer Heinrich-Heine-Universität Düsseldorf Summer 2016 1 / 21 Diskrete Wahrscheinlichkeitsräume (1) Carstensen et al. (2010), Abschnitt

Mehr

TnT - Statistischer Part-of- Speech Tagger

TnT - Statistischer Part-of- Speech Tagger TnT - Statistischer Part-of- Speech Tagger 2. Teil der Präsentation des TnT Taggers von Thorsten Brants Präsentation von Berenike Loos Gliederung 1. Installation und Beschreibung des Programms 2. Erläuterungen

Mehr

Inhaltsverzeichnis. Bibliografische Informationen digitalisiert durch

Inhaltsverzeichnis. Bibliografische Informationen  digitalisiert durch Inhaltsverzeichnis 1 Computerlinguistik - Was ist das? 1 1.1 Aspekte der Computerlinguistik 1 1.1.1 Computer linguistik: Die Wissenschaft 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen 3 1.1.3

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Modellierung WS 2011/2012 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt

Mehr

Frequent Itemset Mining + Association Rule Mining

Frequent Itemset Mining + Association Rule Mining Frequent Itemset Mining + Association Rule Mining Studiengang Angewandte Mathematik WS 2015/16 Frequent Itemset Mining (FIM) 21.10.2015 2 Einleitung Das Frequent-Itemset-Mining kann als Anfang des modernen,

Mehr

Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten

Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten Arbeitspapier Zusammenfassung In diesem Arbeitspapier wird gezeigt, wie mit Hilfe der Google- Books Ngram Daten

Mehr

Computerlinguistik und Sprachtechnologie

Computerlinguistik und Sprachtechnologie Computerlinguistik und Sprachtechnologie Eine Einführung Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde und Hagen Langer Spektrum Akademischer Verlag

Mehr

2. Einfach drauf los schreiben

2. Einfach drauf los schreiben Die 3 Gebote 1. Schreiben 2. Einfach drauf los schreiben 3. Strukturieren 1 1. Schreiben 1.1 Sofort mit dem Schreiben beginnen! Entwicklung der Hypothesen Lesen & Exzerpieren Stimulierstellung, Versuchsdurchführung

Mehr

Stemming. OS Einblicke in die Computerlinguistik Felix Hain HTWK Leipzig

Stemming. OS Einblicke in die Computerlinguistik Felix Hain HTWK Leipzig Stemming OS Einblicke in die Computerlinguistik Felix Hain 12.06.2014 HTWK Leipzig Gliederung Motivation Der Begriff Stemming Potentielle Probleme Stemming-Algorithmen Ansätze Porter-Stemmer-Algorithmus

Mehr

Midas Metadata yield by Data Analysis

Midas Metadata yield by Data Analysis Midas Metadata yield by Data Analysis Glossar powered by Was ist Text Mining? Unter Text Mining versteht sich im Allgemeinen die Extraktion von strukturierten Informationen aus unstrukturierten oder semistrukturierten

Mehr

Was ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora

Was ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik

Mehr

Semiautomatische Erschließung von Psychologie-Information

Semiautomatische Erschließung von Psychologie-Information PETRUS-Workshop "Automatische Erschließungsverfahren" 21./22.03.2011 Dipl.-Psych. Michael Gerards Semiautomatische Erschließung von Psychologie-Information Kontext Die Literaturdatenbank PSYNDEX: Erschließt

Mehr

Einfluss externer multipler und dynamischer Repräsentationen auf Schülerargumentationen

Einfluss externer multipler und dynamischer Repräsentationen auf Schülerargumentationen Einfluss externer multipler und dynamischer Repräsentationen auf Schülerargumentationen 11.03.2014 Andreas Bauer Tagung der Gesellschaft für Didaktik der Mathematik in Koblenz Was ist eine Repräsentation?

Mehr

Biostatistik. Eine Einführung für Biowissenschaftler

Biostatistik. Eine Einführung für Biowissenschaftler Matthias Rudolf Wiltrud Kuhlisch Biostatistik Eine Einführung für Biowissenschaftler ein Imprint von Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario Sydney Mexico City

Mehr

Einfuhrung in die inhaltliche Erschließung. Grundlagen - Methoden - Instrumente

Einfuhrung in die inhaltliche Erschließung. Grundlagen - Methoden - Instrumente Jutta Bertram Einfuhrung in die inhaltliche Erschließung Grundlagen - Methoden - Instrumente ERGON VERLAG Inhalt Verzeichnis wichtiger Abkürzungen 11 Vorwort 13 Kapitel 1 - Inhaltserschließung im Überblick

Mehr

Wie man eine wissenschaftliche Abschlussarbeit schreibt

Wie man eine wissenschaftliche Abschlussarbeit schreibt Wie man eine wissenschaftliche Abschlussarbeit schreibt Zentrum für Informations- und Sprachverarbeitung Ludwig-Maximilian-Universität München Esma Ari 19. Mai 2014 1 Übersicht 1. Was ist eine wissenschaftliche

Mehr

Anfertigen von wissenschaftlichen Arbeiten. Peter Altenbernd - Hochschule Darmstadt

Anfertigen von wissenschaftlichen Arbeiten. Peter Altenbernd - Hochschule Darmstadt Anfertigen von wissenschaftlichen Arbeiten 1 Übersicht 1. Die Einleitung 2. Die Einführung 3. Der Inhalt 4. Experimente 5. Stand der Technik (Related Work) 6. Zusammenfassung Kurzfassung (Abstract) Anhang

Mehr

Volltextsuche und Text Mining

Volltextsuche und Text Mining Volltextsuche und Text Mining Seminar: Einfuehrung in die Computerlinguistik Dozentin: Wiebke Petersen by Rafael Cieslik 2oo5-Jan-2o 1 Gliederung 1. Volltextsuche 1. Zweck 2. Prinzip 1. Index 2. Retrieval

Mehr

2. Einfach drauf los schreiben

2. Einfach drauf los schreiben Sommersemster 2007 Analyse und Modellierung von Blickbewegungen Veranstalter: Hendrik Koesling Die 3 Gebote 1. Schreiben 2. Einfach drauf los schreiben 3. Strukturieren 1 1. Schreiben 1.1 Sofort mit dem

Mehr

Entwicklung und Überprüfung eines Indexes zur Beurteilung des Risikos physischer und sozialer Beeinträchtigungen durch die Arbeitszeitgestaltung

Entwicklung und Überprüfung eines Indexes zur Beurteilung des Risikos physischer und sozialer Beeinträchtigungen durch die Arbeitszeitgestaltung Entwicklung und Überprüfung eines Indexes zur Beurteilung des Risikos physischer und sozialer Beeinträchtigungen durch die Arbeitszeitgestaltung Ole Giebel Carsten Schomann Friedhelm Nachreiner Einleitung

Mehr

Erlebnisorientiertes Internetmarketing

Erlebnisorientiertes Internetmarketing Sandra Diehl Erlebnisorientiertes Internetmarketing Analyse, Konzeption und Umsetzung von Internetshops aus verhaltenswissenschaftlicher Perspektive Mit einem Geleitwort von Prof. Dr. Peter Weinberg Deutscher

Mehr

Vertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind

Vertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind Vertiefung der Grundlagen der Computerlinguistik Semesterüberblick und Einführung zur Dependenz Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 17.10.2017 Zangenfeind:

Mehr

Deckblatt (Download!) Titelblatt Inhaltsverzeichnis (S. 1) Einleitung mehrere thematisch konturierte Kapitel Schluss/Fazit Literaturverzeichnis

Deckblatt (Download!) Titelblatt Inhaltsverzeichnis (S. 1) Einleitung mehrere thematisch konturierte Kapitel Schluss/Fazit Literaturverzeichnis Deckblatt (Download!) Titelblatt Inhaltsverzeichnis (S. 1) Einleitung mehrere thematisch konturierte Kapitel Schluss/Fazit Literaturverzeichnis (fortlaufend) Abbildungen/Abbildungsverzeichnis, - nachweis

Mehr

Entscheidungsunterstützungssysteme

Entscheidungsunterstützungssysteme Vorlesung WS 2013/2014 Christian Schieder Professur Wirtschaftsinformatik II cschie@tu-chemnitz.eu Literatur zur Vorlesung Gluchowski, P.; Gabriel, R.; Dittmar, C.: Management Support Systeme und Business

Mehr

Gemeinsames TUM-LMU Seminar

Gemeinsames TUM-LMU Seminar Gemeinsames TUM-LMU Seminar Wissenschaftliches Arbeiten Akzeleratoren und ihr Einsatz im Hochleistungsrechnen (LMU) Akzeleratorarchitekturen (TUM) Prof. Dr. Dieter Kranzlmüller Dr. Karl Fürlinger MNM-Team

Mehr

Argumentieren mit multiplen und dynamischen Darstellungen. Jahrestagung der GDM in Weingarten Andreas Bauer

Argumentieren mit multiplen und dynamischen Darstellungen. Jahrestagung der GDM in Weingarten Andreas Bauer Argumentieren mit multiplen und en Darstellungen Jahrestagung der GDM in Weingarten Andreas Bauer 09.03.2012 Gliederung 1. Argumentieren im Mathematikunterricht 2. Darstellungen und Darstellungsarten 3.

Mehr

Einführung in HTML. Hui Dai. WS05/ Hui Dai 1

Einführung in HTML. Hui Dai. WS05/ Hui Dai 1 Einführung in HTML Hui Dai Hui Dai dai@in.tum.de 1 Elemente einer Internetseite: Textabsätze Farben Layout, d.h. Anordnung und Ausrichtung der einzelnen Elemente Überschriften Listen Tabellen Links Grafiken

Mehr

Human Capital Management: Anwendbarkeit und Nutzen einer monetären Human Capital Bewertung mit der Saarbrücker Formel nach Scholz, Stein & Bechtel

Human Capital Management: Anwendbarkeit und Nutzen einer monetären Human Capital Bewertung mit der Saarbrücker Formel nach Scholz, Stein & Bechtel Michael Kock. Human Capital Management: Anwendbarkeit und Nutzen einer monetären Human Capital Bewertung mit der Saarbrücker Formel nach Scholz, Stein & Bechtel Praxisorientierte Personal- und Organisationsforschung;

Mehr

Universität Potsdam Institut für Informatik. Masterstudium Computational Science

Universität Potsdam Institut für Informatik. Masterstudium Computational Science Universität Potsdam Institut für Informatik Masterstudium Computational Science Computational Science The Science of Computation Wissenschaft vom Berechnen Informatik Science, done computationally Computergestützte

Mehr

Einführung in die Computerlinguistik Statistische Grundlagen

Einführung in die Computerlinguistik Statistische Grundlagen Diskrete Wahrscheinlichkeitsräume (1) Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Wintersemester 2011/2012 In vielen Bereichen der CL kommt

Mehr

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig

Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model

Mehr

The Turn: Integration of Information Seeking and Retrieval in Context

The Turn: Integration of Information Seeking and Retrieval in Context The Turn: Integration of Information Seeking and Retrieval in Context 2005 by Ingwersen & Järvelin Kurs: Informationswissenschaft und Sprachtechnologie im Diskurs (WiSe13/14) DozentInnen: Wolfgang Stock

Mehr

11. Sitzung Auswertungsstrategien; Darstellung von Forschungsergebnissen

11. Sitzung Auswertungsstrategien; Darstellung von Forschungsergebnissen 11. Sitzung Auswertungsstrategien; Darstellung von Forschungsergebnissen 1 Gliederung der Vorlesung 1. Probleme der Auswertung bei quantitativem Vorgehen 2. Probleme der Auswertung bei qualitativem Vorgehen

Mehr

Magnesiumwerkstoffen im Automobilbau, statistische Untersuchung

Magnesiumwerkstoffen im Automobilbau, statistische Untersuchung Institut f. Statistik u. Wahrscheinlichkeitstheorie Beständigkeit von Verklebungen von Aluminiumund Magnesiumwerkstoffen im Automobilbau, statistische Untersuchung R. Dutter Forschungsbericht CS-2006-6

Mehr

1) Techniken wissenschaftlichen Arbeitens. 4) Technische Anforderungen an Hausarbeiten

1) Techniken wissenschaftlichen Arbeitens. 4) Technische Anforderungen an Hausarbeiten Müller-Rommel / Meyer 1 Guideline zum wissenschaftlichen Arbeiten 1) Techniken wissenschaftlichen Arbeitens 2) Arten wissenschaftlicher Arbeit 3) wissenschaftlicher Stil 4) Technische Anforderungen an

Mehr

Ensemble-Vorhersage. von Nils Kaiser Seminar Medienmeteorologie im WS 06/07

Ensemble-Vorhersage. von Nils Kaiser Seminar Medienmeteorologie im WS 06/07 Ensemble-Vorhersage von Nils Kaiser Seminar Medienmeteorologie im WS 06/07 Was ist die Wettervorhersage? 2 Gliederung 1. Einleitung 2. Numerische Wettervorhersage 3. Erzeugen eines Ensembles 4. Bewertung

Mehr

Leitfaden zur Diplomarbeit

Leitfaden zur Diplomarbeit AXEL SCHMID AUS- UND WEITERBILDUNG ROSENSTRASSE 3 4400 STEYR TEL. 0650/5584668 E-MAIL INFO@INSTITUT-UNTERBERGER.AT Leitfaden zur Diplomarbeit Grundsätzliches Die Diplomarbeit soll eine selbsterarbeitet

Mehr

Hinweise zum Verfassen einer Hausarbeit

Hinweise zum Verfassen einer Hausarbeit Hinweise zum Verfassen einer Hausarbeit 1. Umfang 2. Format 3. Aufbau 3.1. Titelblatt 3.2. Inhaltsverzeichnis 3.3. Einleitung 3.4. Hauptkapitel 3.5. Zusammenfassung 3.6. Literaturverzeichnis 4. Quellenangaben

Mehr

Wissenschaftliches Arbeiten und Forschen

Wissenschaftliches Arbeiten und Forschen Wissenschaftliches Arbeiten und Forschen 29.10.2013 Prof. Andreas Zieger MM24 Teil 2: Forschungsfragen und Ethik WS 2013_14 CvO Universität Oldenburg Institut für Sonder- und Rehabilitationspädagogik Quellen

Mehr

Leitfaden zur Diplomarbeit

Leitfaden zur Diplomarbeit TEL. 0650/5584668 AXEL SCHMID AUS- UND WEITERBILDUNG ROSENSTRASSE 3 4400 STEYR E-MAIL INFO@INSTITUT-UNTERBERGER.AT Leitfaden zur Diplomarbeit Grundsätzliches Die Diplomarbeit soll eine selbsterarbeitet

Mehr

DeGEvalAK Methoden Frühjahrstagung Wissenstransfer von Evaluationsbefunden

DeGEvalAK Methoden Frühjahrstagung Wissenstransfer von Evaluationsbefunden DeGEvalAK Methoden Frühjahrstagung 2018 Wissenstransfer von Evaluationsbefunden Gliederung Islamistischer Realismus Islamistischer Idealismus 1. Informationsportale für evidenzbasierte Präventionsprogramme

Mehr

3. Sitzung. Wie schreibe ich eine Hausarbeit?

3. Sitzung. Wie schreibe ich eine Hausarbeit? 3. Sitzung Wie schreibe ich eine Hausarbeit? Inhalt der heutigen Veranstaltung I. Aufgabe einer Hausarbeit II. Schreibprozess III. Themenfindung IV. Elemente einer Hausarbeit V. Fragestellung VI. Hausarbeit

Mehr

Angebot DIN/ISO-Kurzcheck per ipad Vorbereitung der Erstzertifizierung nach DIN EN 15224

Angebot DIN/ISO-Kurzcheck per ipad Vorbereitung der Erstzertifizierung nach DIN EN 15224 Angebot DIN/ISO-Kurzcheck per ipad Vorbereitung der Erstzertifizierung nach DIN EN 15224 2013 DIN-/ISO-Kurzcheck Jede Klinik, die sich für einen Systemwechsel entscheidet, steht vor zwei Problemen: a)

Mehr

Bio- Statistik 1. mit 87 Abbildungen, 40 Tabellen und 102 Beispielen

Bio- Statistik 1. mit 87 Abbildungen, 40 Tabellen und 102 Beispielen Bio- Statistik 1 Beschreibende und explorative Statistik - Wahrscheinlichkeitsrechnung und Zufallsvariablen - Statistische Maßzahlen - Wichtige Verteilungen - Beurteilende Statistik - Vertrauensintervalle

Mehr

Barrieren medialer Partizipation

Barrieren medialer Partizipation Sven Engesser Barrieren medialer Partizipation Ergebnisse eines explorativen Feldexperiments Gliederung 1. Fragestellung 2. Theoretische Grundlagen 3. Methodisches Vorgehen 4. Ergebnisse 5. Fazit 2 1.

Mehr

Tagger for German. Online BRILL-Tagger für das Deutsche

Tagger for German. Online BRILL-Tagger für das Deutsche Tagger for German Online BRILL-Tagger für das Deutsche Morphologie V/Ü, Anke Holler Uni Heidelberg, SS2007 Nataliya Mytyay Éva Mújdricza 19.07.2007 Designed by: Dóra Dobos Tagger for German Eric Brill

Mehr

Wahrscheinlichkeitstheorie Kapitel I - Einführende Beispiele

Wahrscheinlichkeitstheorie Kapitel I - Einführende Beispiele Wahrscheinlichkeitstheorie Kapitel I - Einführende Beispiele Georg Bol georg.bol@statistik.uni-karlsruhe.de Markus Höchstötter hoechstoetter@statistik.uni-karlsruhe.de Wahrscheinlichkeitstheorie Agenda:

Mehr

Inhalt 1 Einleitung 2 Theoretische Überlegungen zum Zusammenhang von Wirtschafts- und Bildungssystem und die Spielarten des Kapitalismus

Inhalt 1 Einleitung 2 Theoretische Überlegungen zum Zusammenhang von Wirtschafts- und Bildungssystem und die Spielarten des Kapitalismus Inhalt 1 Einleitung... 1 1.1 Zur Relevanz des Themas... 1 1.2 Ziel der Studie... 4 1.3 Vorgehen und Methodik der Studie... 7 1.4 Daten... 9 1.5 Aufbau der Studie... 12 2 Theoretische Überlegungen zum Zusammenhang

Mehr

Thema: Prototypische Implementierung des Vektormodells

Thema: Prototypische Implementierung des Vektormodells Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Hauptseminar: Information Retrieval WS 06/07 Thema: Prototypische Implementierung des Vektormodells Sascha Orf Carina Silberer Cäcilia

Mehr

Maschinelle Sprachverarbeitung Tokenisierung

Maschinelle Sprachverarbeitung Tokenisierung Maschinelle Sprachverarbeitung Tokenisierung Dr. Heike Zinsmeister FB Sprachwissenschaft Universität Konstanz 29. Oktober 2008 Gliederung 1 Einleitung 2 Einfache Textzerlegung 3 Herausforderungen an die

Mehr

Vorlesung: Statistik II für Wirtschaftswissenschaft

Vorlesung: Statistik II für Wirtschaftswissenschaft Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik Evaluation Annotation eines Goldstandard : Testkorpus mit der relevanten Zielinformation (z.b. Wortart) Automatische

Mehr

Ansätze zur Erfassung und Beurteilung menschlicher Arbeitsleistungen bei Dienstleistungen

Ansätze zur Erfassung und Beurteilung menschlicher Arbeitsleistungen bei Dienstleistungen Wirtschaft Andreas Schalk Ansätze zur Erfassung und Beurteilung menschlicher Arbeitsleistungen bei Dienstleistungen Diplomarbeit FernUniversität Gesamthochschule in Hagen Fachbereich Wirtschaftswissenschaft

Mehr

MASTERARBEIT (bzw. BACHELORARBEIT) TITEL DER ARBEIT. Vorname Nachname

MASTERARBEIT (bzw. BACHELORARBEIT) TITEL DER ARBEIT. Vorname Nachname Christian-Albrechts-Universität zu Kiel Wirtschafts- und Sozialwissenschaftliche Fakultät Lehrstuhl für Supply Chain Management MASTERARBEIT (bzw. BACHELORARBEIT) im Masterstudiengang (bzw. Bachelorstudiengang)

Mehr

Textmining Klassifikation von Texten Teil 1: Naive Bayes

Textmining Klassifikation von Texten Teil 1: Naive Bayes Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive

Mehr

Welche Bedeutung haben Entscheidungsregeln für die Reliabilität der Dateninterpretation im Evaluationsprozess?

Welche Bedeutung haben Entscheidungsregeln für die Reliabilität der Dateninterpretation im Evaluationsprozess? DeGEval/SEVAL-Tagung Welche Bedeutung haben Entscheidungsregeln für die Reliabilität der Dateninterpretation im Evaluationsprozess? Zürich,. September 0 Bäuerle, Vaccaro, Lankes & Schefcsik Überblick.

Mehr

Textsorten. Folien zum Tutorium Internationalisierung Go West: Preparing for First Contacts with the Anglo- American Academic World

Textsorten. Folien zum Tutorium Internationalisierung Go West: Preparing for First Contacts with the Anglo- American Academic World Textsorten Folien zum Tutorium Internationalisierung Go West: Preparing for First Contacts with the Anglo- American Academic World Alexander Borrmann Historisches Institut Lehrstuhl für Spätmittelalter

Mehr

Überblick: Formale Anforderungen an die Hausarbeit

Überblick: Formale Anforderungen an die Hausarbeit Überblick: Formale Anforderungen an die Hausarbeit 0 Formales 0 Regeln für die Gliederung 0 Regeln für die Zitierweise/Erstellen eines Literaturverzeichnisses 05.11.2014 2 Formale Regeln für die Gestaltung

Mehr

ELENA Elektronische Übermittlung von Einkommensnachweisen. Grundsätze der Modellierung

ELENA Elektronische Übermittlung von Einkommensnachweisen. Grundsätze der Modellierung ELENA Elektronische Übermittlung von Einkommensnachweisen Grundsätze der Modellierung Stabstelle: FA1B Land Steiermark Datum: 01.04.2010 01.04.2010 elena_modellierung.doc 1 Inhalt 1 Einführung... 2 2 Modellierung...

Mehr

Leitfaden zur Erstellung einer Projekt- oder Abschlussarbeit

Leitfaden zur Erstellung einer Projekt- oder Abschlussarbeit Leitfaden zur Erstellung einer Projekt- oder Abschlussarbeit Dipl.-Ing. Armin Rohnen LbA Juli 2015 Seite 1 Inhaltsverzeichnis 1. Zielsetzung der Projekt-/Abschlussarbeit... 3 2. Vorgehen... 3 2.1. Projektorganisation...

Mehr

Maschinelle Übersetzung

Maschinelle Übersetzung Maschinelle Übersetzung Wissensmanagement VO 340088 Bartholomäus Wloka https://www.adaptemy.com MÜ Ansätze Zwei Dimensionen: Verarbeitungstiefe Art der verwendeten Technik Seite 2 Verarbeitunstiefe Seite

Mehr

Maschinelle Übersetzung

Maschinelle Übersetzung Maschinelle Übersetzung Kluge Andreas, 13IN-M basierend auf Computerlinguistik und Sprachtechnologie, 3. Auflage, Spektrum, Heidelberg 2010 19. Juni 2014 Übersicht Gewünschte Funktionalität Schwierigkeiten

Mehr

Soziale Arbeit in der Medizinischberuflich orientierten Rehabilitation

Soziale Arbeit in der Medizinischberuflich orientierten Rehabilitation Soziale Arbeit in der Medizinischberuflich orientierten Rehabilitation Problemlagen erkennen geeignete Maßnahmen einleiten Marco Streibelt Bernhard Greitemann 1 Gliederung Teil 1: Die Sicht von außen MBOR:

Mehr

PETRUS Szenario 1 Automatische Sachgruppenvergabe

PETRUS Szenario 1 Automatische Sachgruppenvergabe PETRUS Szenario 1 Automatische Sachgruppenvergabe Elisabeth Mödden 1 Automatische Sachgruppenvergabe 1. DDC-Sachgruppen 2. Automatische Sachgruppenvergabe 3. Tests und Ergebnisse 4. Geschäftsprozesse und

Mehr

DELA Wörterbücher ===========================================================

DELA Wörterbücher =========================================================== DELA Wörterbücher =========================================================== Der Umgang mit externen Ressourcen in Unitex Was man beim Erstellen eigener Lexika beachten sollte? Ein Vortrag von Michaela

Mehr

Eigenschaften von Texten

Eigenschaften von Texten Eigenschaften von Texten 1 Statistische Eigenschaften von Text Wie ist die Häufigkeit verschiedener Wörter verteilt? Wie schnell wächst die Größe des Vokabulars mit der Größe eines Korpus? Solche Faktoren

Mehr

Konstruktionsbegleitende Toleranzsimulation mit

Konstruktionsbegleitende Toleranzsimulation mit Konstruktionsbegleitende Toleranzsimulation mit Unter Verwendung der GPS-Strategie DIN EN ISO 14638 und DIN EN ISO 8015 Christoph Bruns INNEO Solutions GmbH INNEO Quickfacts BESTE BONITÄT (AAA) UMSATZ

Mehr

Männerpolitische Grundsatzabteilung. Vereinbarkeit von Familie und Beruf aus Männersicht

Männerpolitische Grundsatzabteilung. Vereinbarkeit von Familie und Beruf aus Männersicht Männerpolitische Grundsatzabteilung Vereinbarkeit von Familie und Beruf aus Männersicht Vielen Dank den Sponsoren: Inhaltsverzeichnis 4 Inhaltsverzeichnis 5 Inhaltsverzeichnis 6 Vorwort 7 Danksagung 8

Mehr

Ziele und Herausforderungen

Ziele und Herausforderungen Ziele und Herausforderungen Text soll automatisch aus einer Quellsprache in eine Zielsprache übertragen werden Dabei soll die Funktion des Textes erhalten bleiben Es werden sowohl computerlinguistische

Mehr

Listed Private Equity; Performance, Einflussfaktoren und Portfolioeffekte

Listed Private Equity; Performance, Einflussfaktoren und Portfolioeffekte Fabian Stich Listed Private Equity; Performance, Einflussfaktoren und Portfolioeffekte Eine empirische Analyse PETER LANG Internationaler Verlag der Wissenschaften Inhaltsübersicht ix Inhaltsübersicht

Mehr

Vornorm DIN CLC/TS (VDE V ): CLC/TS 62046:2008

Vornorm DIN CLC/TS (VDE V ): CLC/TS 62046:2008 Inhalt Vorwort... 2 Einleitung... 8 1 Anwendungsbereich... 10 2 Normative Verweisungen... 10 3 Begriffe und Abkürzungen... 10 3.1 Begriffe... 10 3.2 Abkürzungen... 18 4 Auswahl von Schutzmaßnahmen... 18

Mehr

5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften

5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften 5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer Clusterstruktur kennen, verschiedene

Mehr

DISSERTATION. Diagnosespektrum in homöopathischen Arztpraxen eine prospektive Beobachtungsstudie und ein Vergleich zu konventionellen Arztpraxen

DISSERTATION. Diagnosespektrum in homöopathischen Arztpraxen eine prospektive Beobachtungsstudie und ein Vergleich zu konventionellen Arztpraxen Aus dem Institut für Sozialmedizin, Epidemiologie und Gesundheitsökonomie der Medizinischen Fakultät Charité Universitätsmedizin Berlin DISSERTATION Diagnosespektrum in homöopathischen Arztpraxen eine

Mehr

The ROC curve in screening with multiple markers: An application to the triple test in prenatal diagnostics

The ROC curve in screening with multiple markers: An application to the triple test in prenatal diagnostics Statistische Methoden in Evidenz-basierter Medizin und Health Technology Assessment 20. bis 21. November 2003 Freiburg The ROC curve in screening with multiple markers: An application to the triple test

Mehr

Lernen mit Neuen Medien

Lernen mit Neuen Medien Jörg Zumbach Lernen mit Neuen Medien Instruktionspsychologische Grundlagen Verlag W. Kohlhammer Inhalt 1 Einleitung: Warum Lernen mit Neuen Medien? Historischer Überblick und gegenwärtige Auffassungen

Mehr

5. Clusteranalyse Vorbemerkungen. 5. Clusteranalyse. Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften

5. Clusteranalyse Vorbemerkungen. 5. Clusteranalyse. Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften 5. Clusteranalyse Vorbemerkungen 5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer

Mehr

Tagging mit Hidden Markov Models und Viterbi-Algorithmus

Tagging mit Hidden Markov Models und Viterbi-Algorithmus Tagging mit Hidden Markov Models und Viterbi-Algorithmus Annelen Brunner, Stephanie Schuldes, Nicola Kaiser, Olga Mordvinova HS Parsing SoSe 2003 PD Dr. Karin Haenelt Inhalt Ziel des Seminarprojekts Theorie:

Mehr

Überblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register

Überblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Überblick Registervariation multidimensionale Analyse Register quantitative Analyse Dimensionen:

Mehr

ZEITMANAGEMENT UND BETREUUNG DER ARBEIT

ZEITMANAGEMENT UND BETREUUNG DER ARBEIT ZEITMANAGEMENT UND BETREUUNG DER ARBEIT 1 Betreuer als Ansprechpartner KONTAKT BETREUER / STUDENT Besprechung und Einweisung in die Aufgabenstellung Student arbeitet sich ein (Literatur, Kontaktstellen,

Mehr

Am Ball bleiben - Wie arbeite ich kontinuierlich und strukturiert? Wibke Derboven

Am Ball bleiben - Wie arbeite ich kontinuierlich und strukturiert? Wibke Derboven Am Ball bleiben - Wie arbeite ich kontinuierlich und strukturiert? Wibke Derboven 1 Umgang mit Zeit 15 Umgang mir Struktur 15 Wechselwirkung von Zeit und Struktur 10 Umgang mit Krisen 10 2 Umgang mit Zeit

Mehr

Möglichkeiten biografisch orientierter Unterrichtsarbeit in der Schule

Möglichkeiten biografisch orientierter Unterrichtsarbeit in der Schule Pädagogik Dr. Gerold Schmidt-Callsen Möglichkeiten biografisch orientierter Unterrichtsarbeit in der Schule Vor dem Hintergrund der Merkmale biografischer Arbeit von Hans-Georg Ruhe Studienarbeit Gerold

Mehr

Konzeption eines Qualitätscontrollings für die Stationäre Altenhilfe

Konzeption eines Qualitätscontrollings für die Stationäre Altenhilfe Uwe Bettig Konzeption eines Qualitätscontrollings für die Stationäre Altenhilfe PETER LANG Europäischer Verlag der Wissenschaften Inhaltsverzeichnis A Theoretischer Teil 1 Einleitung 21 1.1 Aufbau der

Mehr

Master-Arbeit. Titel der Arbeit. Betreuer: Matthias Splieth, M.Sc. Themensteller: Prof. Dr. Klaus Turowski

Master-Arbeit. Titel der Arbeit. Betreuer: Matthias Splieth, M.Sc. Themensteller: Prof. Dr. Klaus Turowski Master-Arbeit Titel der Arbeit Max Mustermann Magdeburg, 5. November 2012 Betreuer: Matthias Splieth, M.Sc. Themensteller: Prof. Dr. Klaus Turowski Otto-von-Guericke-Universität Magdeburg Magdeburg Research

Mehr

Dekonvolution von Omnikamerabildern

Dekonvolution von Omnikamerabildern 1 / 23 Dekonvolution von Omnikamerabildern Tobias Börtitz, Hermann Lorenz, Lutz Krätzer, Josef Söntgen Betreuer: Richard Schmidt HTW Dresden, Deutschland Abschluß Präsentation 15. Februar 2012 2 / 23 1

Mehr

Vortrag Iterative Prozessmodelle/SCRUM

Vortrag Iterative Prozessmodelle/SCRUM Vortrag Iterative Prozessmodelle/SCRUM von Marcus Hörger 1 Übersicht Einleitung Prozess Der Software-Entwicklungsprozess Prozessmodelle Lineare Prozessmodelle Das Phasenmodell Iterative Prozessmodelle

Mehr