Automatische Textzusammenfasung
|
|
|
- Meta Ursler
- vor 8 Jahren
- Abrufe
Transkript
1 Automatische Textzusammenfasung Katja Diederichs Francisco Mondaca Simon Ritter PS Computerlinguistische Grundlagen I - Jürgen Hermes - WS 09/10 Uni Köln
2 Gliederung 1) Einleitung & Überblick 2) Ansätze zur Textzusammenfassung 3) Stufen der Textzusammenfassung 4) Anwendungsbeispiel
3 Definition Eine Zusammenfassung ist ein Text, der aus einem oder mehreren Texten erstellt wird und einen relevanten Teil der Informationen des Textes oder der Texte beinhaltet. Sie ist nicht länger als die Hälfte des Originaltextes (vgl. Hovy 2003 : 584).
4 Text Multimediale Dokumente Online Dokumente Hypertexte Usw...
5 Typen von Zusammenfassungen Indikative: Sie stellen die Grundidee des Textes dar ohne auf den Inhalt näher einzugehen. Informative: Sie bieten eine kürzere Version des Textinhaltes.
6 Typen von Zusammenfassungen Extracts: Geben Teile des Originaltextes wortwörtlich wieder. Abstracts: Werden durch die Regenerierung von extrahiertem Inhalt erstellt.
7 Entwicklung Ende 1950, Anfang 1960: Statistische Verfahren Anfang 1980: Wissensbasierte Verfahren Aktuell: Annäherung der Qualität an menschliche Leistung
8 Ansätze zur Textzusammenfassung Klassischer statistischer Ansatz - Statistisches Verfahren entwickelt ein Extract - Statistische Verteilung von Merkmalen wird berücksichtigt ohne Text zu verstehen - Wichtigkeit eines Wortes = Häufigkeit seines Auftretens
9 Ansätze zur Textzusammenfassung Neuerer statistischer Ansatz Das System lernt anhand eines Korpus von menschlichen Abstracts, welche Sätze extrahiert werden sollen Trainingskorpus ingenieurwissenschaftliche Texte Testkorpus ingenieurwissenschaftlicher Text; darf nicht identisch mit Trainingskorpus sein!
10 Ansätze zur Textzusammenfassung Neuerer statistischer Ansatz Für jeden Satz: Errechnung der Wahrscheinlichkeit, mit der ein menschlicher Zusammenfasser ihn positiv bewerten würde Mittels: Abgleich der statistischen Merkmale im gegebenen Testkorpus mit denen des Trainingskorpus anhand bestimmter Kriterien
11 Ansätze zur Textzusammenfassung Neuerer statistischer Ansatz Kriterien für Sätze positiv oder negativ gewertet Satzlänge => Sätze unter 5 Wörtern negativ Indikatorphrasen => In conclusion... positiv Absatzstruktur => Erste 10, letzte 5 Absätze positiv Themasätze am Anfang/Ende positiv Schlüsselwörter => Viele Schlüsselwörter positiv Akronyme => Eigenname, Akronym(IBM) positiv
12 Ansätze zur Textzusammenfassung Neuerer statistischer Ansatz Ergebnisse dieses Verfahrens zeigen: - Die Übereinstimmung mit menschlichen Abstracts beträgt ca. 35% - Die Übereinstimmung innerhalb menschlicher Abstracts ist ebenso groß
13 Ansätze zur Textzusammenfassung Wissensbasierter Ansatz Kognitive Wende: Wissensverarbeitende Systeme, deren Teilaufgaben sich am menschlichen Vorgehen beim Zusammenfassen orientierten
14 Ansätze zur Textzusammenfassung Wissensbasierter Ansatz Modell wissensbasierten Zusammenfassens: Carstensen 2004
15 Ansätze zur Textzusammenfassung Wissensbasierter Ansatz Modell wissensbasierten Zusammenfassens: (zu Abb. 5.7): 1: Quelltext (externe Information) wird in Bedeutungsrepräsentation umgesetzt (vgl. menschliches Verstehen) 2: Erst diese Repräsentation wird gekürzt (Reduktion/Verdichtung) 3: Aus dieser Kürzung wiederum wird der Text, die externe Zusammenfassung produziert
16 Ansätze zur Textzusammenfassung Wissensbasierter Ansatz D ie d rei d a rg es tellten S chritte w erd en nicht von jed em S ys tem volls tä nd ig d urchla ufen Scisor (Jacobs/Rau, 1990) (analyseorientiert) Vom Original ausgehende Zusammenfassung STREAK (McKeown et al., 1995) Textzusammenfassungen aus strukturiertem Datenbestand
17 Stufen der Textzusammenfassung 1: Bestimmung des Themas V ers chied ene M ethoden: Lage Indikatorphrasen Häufigkeit von Wörtern & Sätzen Titelüberlappung Verknüpfungen Durch die Kombination der Kriterien werden die besten Ergebnisse erzielt
18 Stufen der Textzusammenfassung 2: Interpretation Informationen werden verschmolzen & neu geordnet Ergebnisse dieser Stufe sind meist noch zusammenhangslose, schwer zu lesende Texte
19 Stufen der Textzusammenfassung 3: Erstellung der Zusammenfassung Entstandene Rohfassung wird in die Form eines natürlichen, kohärenten Text gebracht - Kompression - Zusammenlegung von Sätzen - Generierung von Überschriften - Grammatikalische Neuordnung Bei Extracts: Smoothing
20 Anwendungsbeispiel
21 Literatur CARSTENSEN, Kai-Uwe (Hrsg.) ( ). Computerlinguistik und Sprachtechnologie. München: Elsevier. MITKOV, Ruslan (Hrsg.) (2003). The Oxford Handbook of Computational Linguistics. Oxford: Oxford University Press.
Computerlinguistik Dozent: Dr. Jürgen Hermes Sprachsynthese. Referenten: Oliver Hummel und Carolin Schneider
Computerlinguistik Dozent: Dr. Jürgen Hermes Sprachsynthese Referenten: Oliver Hummel und Carolin Schneider Überblick 1. Einführung 2. Geschichte der Sprachsynthese 3. Text to Speech System 1. Sprachverarbeitung
Text Mining und Textzusammenfassung. Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer
Text Mining und Textzusammenfassung Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer Übersicht 1. Definition 2. Prozessablauf 3. Textzusammenfassung 4. Praxisbeispiel Definition Text Mining is the art
INFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka
INFORMATIONSEXTRAKTION 1 22.12.09 Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION(IE) 1. Einleitung 2. Ziel der IE 3. Funktionalität eines IE-Systems 4. Beispiel 5. Übung
Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 18/19 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Wintersemester 18/19 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Morphologie Wort Morphem Allomorph Sprachtypologie anhand
Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Was ist Computerlinguistik? Definition Anwendungen Fragestellung
Einführung in die Computerlinguistik
Mehrdeutigkeit der Wortart Einführung in die Computerlinguistik Statistische Modellierung und Evaluation WS 2008/2009 Manfred Pinkal Sie haben in Moskau liebe genossen Sie haben in Moskau liebe Genossen
Text-Mining: Einführung
Text-Mining: Einführung Claes Neuefeind Fabian Steeg 22. April 2010 Organisatorisches Was ist Text-Mining? Definitionen Anwendungsbeispiele Textuelle Daten Aufgaben u. Teilbereiche Literatur Kontakt Sprechstunde:
Computerlinguistik und Sprachtechnologie
Computerlinguistik und Sprachtechnologie Eine Einführung 2., überarbeitete und erweiterte Auflage Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde
Vom Suchen und Finden - Google und andere Ansätze
Vom Suchen und Finden - Google und andere Ansätze Norbert Fuhr Universität Duisburg Essen FB Ingenieurwissenschaften Abteilung Informatik 12. Mai 2005 Gliederung 1 Einführung 2 Grundlagen 3 Erweiterte
Bachelorarbeit. Was ist zu tun?
Bachelorarbeit Was ist zu tun? Titelseite Zusammenfassung/Summary Inhaltsverzeichnis Abkürzungsverzeichnis Einleitung Material und Methoden Ergebnisse Diskussion Ausblick Literaturverzeichnis Danksagung
Einführung in die Computerlinguistik
Einführung in die Computerlinguistik Statistische Modellierung I WS 2010/2011 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt
Udo Ohm, Universität Bielefeld. Bildungssprachliche Fähigkeiten und berufliches Handeln
Bildungssprachliche Fähigkeiten und berufliches Handeln Überblick Sprachliche Vermittlung fachlicher Inhalte Schule und Ausbildung als semiotische Lehrzeit Bildungssprache (BICS vs. CALP) Beispiel: Lesekompetenz
xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis
Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....
Maschinelle Textzusammenfassung
Eine Präsentation von T. Lindemeier und F. Kratschmann Januar 2009 Machine Language Processing H. Zinsmeister Universität Konstanz *Hovy. 2003. The Potential and Limitations of Automatic Sentence Extraction
TnT - Statistischer Part-of- Speech Tagger
TnT - Statistischer Part-of- Speech Tagger 2. Teil der Präsentation des TnT Taggers von Thorsten Brants Präsentation von Berenike Loos Gliederung 1. Installation und Beschreibung des Programms 2. Erläuterungen
Einführung in die Computerlinguistik
Einführung in die Computerlinguistik Statistische Modellierung WS 2011/2012 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt
Frequent Itemset Mining + Association Rule Mining
Frequent Itemset Mining + Association Rule Mining Studiengang Angewandte Mathematik WS 2015/16 Frequent Itemset Mining (FIM) 21.10.2015 2 Einleitung Das Frequent-Itemset-Mining kann als Anfang des modernen,
Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten
Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten Arbeitspapier Zusammenfassung In diesem Arbeitspapier wird gezeigt, wie mit Hilfe der Google- Books Ngram Daten
Computerlinguistik und Sprachtechnologie
Computerlinguistik und Sprachtechnologie Eine Einführung Herausgegeben von: Kai-Uwe Carstensen, Christian Ebert, Cornelia Endriss, Susanne Jekat, Ralf Klabunde und Hagen Langer Spektrum Akademischer Verlag
2. Einfach drauf los schreiben
Die 3 Gebote 1. Schreiben 2. Einfach drauf los schreiben 3. Strukturieren 1 1. Schreiben 1.1 Sofort mit dem Schreiben beginnen! Entwicklung der Hypothesen Lesen & Exzerpieren Stimulierstellung, Versuchsdurchführung
Stemming. OS Einblicke in die Computerlinguistik Felix Hain HTWK Leipzig
Stemming OS Einblicke in die Computerlinguistik Felix Hain 12.06.2014 HTWK Leipzig Gliederung Motivation Der Begriff Stemming Potentielle Probleme Stemming-Algorithmen Ansätze Porter-Stemmer-Algorithmus
Midas Metadata yield by Data Analysis
Midas Metadata yield by Data Analysis Glossar powered by Was ist Text Mining? Unter Text Mining versteht sich im Allgemeinen die Extraktion von strukturierten Informationen aus unstrukturierten oder semistrukturierten
Was ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora
Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik
Semiautomatische Erschließung von Psychologie-Information
PETRUS-Workshop "Automatische Erschließungsverfahren" 21./22.03.2011 Dipl.-Psych. Michael Gerards Semiautomatische Erschließung von Psychologie-Information Kontext Die Literaturdatenbank PSYNDEX: Erschließt
Einfluss externer multipler und dynamischer Repräsentationen auf Schülerargumentationen
Einfluss externer multipler und dynamischer Repräsentationen auf Schülerargumentationen 11.03.2014 Andreas Bauer Tagung der Gesellschaft für Didaktik der Mathematik in Koblenz Was ist eine Repräsentation?
Biostatistik. Eine Einführung für Biowissenschaftler
Matthias Rudolf Wiltrud Kuhlisch Biostatistik Eine Einführung für Biowissenschaftler ein Imprint von Pearson Education München Boston San Francisco Harlow, England Don Mills, Ontario Sydney Mexico City
Einfuhrung in die inhaltliche Erschließung. Grundlagen - Methoden - Instrumente
Jutta Bertram Einfuhrung in die inhaltliche Erschließung Grundlagen - Methoden - Instrumente ERGON VERLAG Inhalt Verzeichnis wichtiger Abkürzungen 11 Vorwort 13 Kapitel 1 - Inhaltserschließung im Überblick
Wie man eine wissenschaftliche Abschlussarbeit schreibt
Wie man eine wissenschaftliche Abschlussarbeit schreibt Zentrum für Informations- und Sprachverarbeitung Ludwig-Maximilian-Universität München Esma Ari 19. Mai 2014 1 Übersicht 1. Was ist eine wissenschaftliche
Anfertigen von wissenschaftlichen Arbeiten. Peter Altenbernd - Hochschule Darmstadt
Anfertigen von wissenschaftlichen Arbeiten 1 Übersicht 1. Die Einleitung 2. Die Einführung 3. Der Inhalt 4. Experimente 5. Stand der Technik (Related Work) 6. Zusammenfassung Kurzfassung (Abstract) Anhang
Volltextsuche und Text Mining
Volltextsuche und Text Mining Seminar: Einfuehrung in die Computerlinguistik Dozentin: Wiebke Petersen by Rafael Cieslik 2oo5-Jan-2o 1 Gliederung 1. Volltextsuche 1. Zweck 2. Prinzip 1. Index 2. Retrieval
2. Einfach drauf los schreiben
Sommersemster 2007 Analyse und Modellierung von Blickbewegungen Veranstalter: Hendrik Koesling Die 3 Gebote 1. Schreiben 2. Einfach drauf los schreiben 3. Strukturieren 1 1. Schreiben 1.1 Sofort mit dem
Entwicklung und Überprüfung eines Indexes zur Beurteilung des Risikos physischer und sozialer Beeinträchtigungen durch die Arbeitszeitgestaltung
Entwicklung und Überprüfung eines Indexes zur Beurteilung des Risikos physischer und sozialer Beeinträchtigungen durch die Arbeitszeitgestaltung Ole Giebel Carsten Schomann Friedhelm Nachreiner Einleitung
Erlebnisorientiertes Internetmarketing
Sandra Diehl Erlebnisorientiertes Internetmarketing Analyse, Konzeption und Umsetzung von Internetshops aus verhaltenswissenschaftlicher Perspektive Mit einem Geleitwort von Prof. Dr. Peter Weinberg Deutscher
Vertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind
Vertiefung der Grundlagen der Computerlinguistik Semesterüberblick und Einführung zur Dependenz Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 17.10.2017 Zangenfeind:
Deckblatt (Download!) Titelblatt Inhaltsverzeichnis (S. 1) Einleitung mehrere thematisch konturierte Kapitel Schluss/Fazit Literaturverzeichnis
Deckblatt (Download!) Titelblatt Inhaltsverzeichnis (S. 1) Einleitung mehrere thematisch konturierte Kapitel Schluss/Fazit Literaturverzeichnis (fortlaufend) Abbildungen/Abbildungsverzeichnis, - nachweis
Entscheidungsunterstützungssysteme
Vorlesung WS 2013/2014 Christian Schieder Professur Wirtschaftsinformatik II [email protected] Literatur zur Vorlesung Gluchowski, P.; Gabriel, R.; Dittmar, C.: Management Support Systeme und Business
Gemeinsames TUM-LMU Seminar
Gemeinsames TUM-LMU Seminar Wissenschaftliches Arbeiten Akzeleratoren und ihr Einsatz im Hochleistungsrechnen (LMU) Akzeleratorarchitekturen (TUM) Prof. Dr. Dieter Kranzlmüller Dr. Karl Fürlinger MNM-Team
Argumentieren mit multiplen und dynamischen Darstellungen. Jahrestagung der GDM in Weingarten Andreas Bauer
Argumentieren mit multiplen und en Darstellungen Jahrestagung der GDM in Weingarten Andreas Bauer 09.03.2012 Gliederung 1. Argumentieren im Mathematikunterricht 2. Darstellungen und Darstellungsarten 3.
Einführung in HTML. Hui Dai. WS05/ Hui Dai 1
Einführung in HTML Hui Dai Hui Dai [email protected] 1 Elemente einer Internetseite: Textabsätze Farben Layout, d.h. Anordnung und Ausrichtung der einzelnen Elemente Überschriften Listen Tabellen Links Grafiken
Human Capital Management: Anwendbarkeit und Nutzen einer monetären Human Capital Bewertung mit der Saarbrücker Formel nach Scholz, Stein & Bechtel
Michael Kock. Human Capital Management: Anwendbarkeit und Nutzen einer monetären Human Capital Bewertung mit der Saarbrücker Formel nach Scholz, Stein & Bechtel Praxisorientierte Personal- und Organisationsforschung;
Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig
Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model
The Turn: Integration of Information Seeking and Retrieval in Context
The Turn: Integration of Information Seeking and Retrieval in Context 2005 by Ingwersen & Järvelin Kurs: Informationswissenschaft und Sprachtechnologie im Diskurs (WiSe13/14) DozentInnen: Wolfgang Stock
11. Sitzung Auswertungsstrategien; Darstellung von Forschungsergebnissen
11. Sitzung Auswertungsstrategien; Darstellung von Forschungsergebnissen 1 Gliederung der Vorlesung 1. Probleme der Auswertung bei quantitativem Vorgehen 2. Probleme der Auswertung bei qualitativem Vorgehen
1) Techniken wissenschaftlichen Arbeitens. 4) Technische Anforderungen an Hausarbeiten
Müller-Rommel / Meyer 1 Guideline zum wissenschaftlichen Arbeiten 1) Techniken wissenschaftlichen Arbeitens 2) Arten wissenschaftlicher Arbeit 3) wissenschaftlicher Stil 4) Technische Anforderungen an
Ensemble-Vorhersage. von Nils Kaiser Seminar Medienmeteorologie im WS 06/07
Ensemble-Vorhersage von Nils Kaiser Seminar Medienmeteorologie im WS 06/07 Was ist die Wettervorhersage? 2 Gliederung 1. Einleitung 2. Numerische Wettervorhersage 3. Erzeugen eines Ensembles 4. Bewertung
Leitfaden zur Diplomarbeit
AXEL SCHMID AUS- UND WEITERBILDUNG ROSENSTRASSE 3 4400 STEYR TEL. 0650/5584668 E-MAIL [email protected] Leitfaden zur Diplomarbeit Grundsätzliches Die Diplomarbeit soll eine selbsterarbeitet
Hinweise zum Verfassen einer Hausarbeit
Hinweise zum Verfassen einer Hausarbeit 1. Umfang 2. Format 3. Aufbau 3.1. Titelblatt 3.2. Inhaltsverzeichnis 3.3. Einleitung 3.4. Hauptkapitel 3.5. Zusammenfassung 3.6. Literaturverzeichnis 4. Quellenangaben
Wissenschaftliches Arbeiten und Forschen
Wissenschaftliches Arbeiten und Forschen 29.10.2013 Prof. Andreas Zieger MM24 Teil 2: Forschungsfragen und Ethik WS 2013_14 CvO Universität Oldenburg Institut für Sonder- und Rehabilitationspädagogik Quellen
Leitfaden zur Diplomarbeit
TEL. 0650/5584668 AXEL SCHMID AUS- UND WEITERBILDUNG ROSENSTRASSE 3 4400 STEYR E-MAIL [email protected] Leitfaden zur Diplomarbeit Grundsätzliches Die Diplomarbeit soll eine selbsterarbeitet
3. Sitzung. Wie schreibe ich eine Hausarbeit?
3. Sitzung Wie schreibe ich eine Hausarbeit? Inhalt der heutigen Veranstaltung I. Aufgabe einer Hausarbeit II. Schreibprozess III. Themenfindung IV. Elemente einer Hausarbeit V. Fragestellung VI. Hausarbeit
Angebot DIN/ISO-Kurzcheck per ipad Vorbereitung der Erstzertifizierung nach DIN EN 15224
Angebot DIN/ISO-Kurzcheck per ipad Vorbereitung der Erstzertifizierung nach DIN EN 15224 2013 DIN-/ISO-Kurzcheck Jede Klinik, die sich für einen Systemwechsel entscheidet, steht vor zwei Problemen: a)
Bio- Statistik 1. mit 87 Abbildungen, 40 Tabellen und 102 Beispielen
Bio- Statistik 1 Beschreibende und explorative Statistik - Wahrscheinlichkeitsrechnung und Zufallsvariablen - Statistische Maßzahlen - Wichtige Verteilungen - Beurteilende Statistik - Vertrauensintervalle
Barrieren medialer Partizipation
Sven Engesser Barrieren medialer Partizipation Ergebnisse eines explorativen Feldexperiments Gliederung 1. Fragestellung 2. Theoretische Grundlagen 3. Methodisches Vorgehen 4. Ergebnisse 5. Fazit 2 1.
Tagger for German. Online BRILL-Tagger für das Deutsche
Tagger for German Online BRILL-Tagger für das Deutsche Morphologie V/Ü, Anke Holler Uni Heidelberg, SS2007 Nataliya Mytyay Éva Mújdricza 19.07.2007 Designed by: Dóra Dobos Tagger for German Eric Brill
Wahrscheinlichkeitstheorie Kapitel I - Einführende Beispiele
Wahrscheinlichkeitstheorie Kapitel I - Einführende Beispiele Georg Bol [email protected] Markus Höchstötter [email protected] Wahrscheinlichkeitstheorie Agenda:
Inhalt 1 Einleitung 2 Theoretische Überlegungen zum Zusammenhang von Wirtschafts- und Bildungssystem und die Spielarten des Kapitalismus
Inhalt 1 Einleitung... 1 1.1 Zur Relevanz des Themas... 1 1.2 Ziel der Studie... 4 1.3 Vorgehen und Methodik der Studie... 7 1.4 Daten... 9 1.5 Aufbau der Studie... 12 2 Theoretische Überlegungen zum Zusammenhang
Thema: Prototypische Implementierung des Vektormodells
Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Hauptseminar: Information Retrieval WS 06/07 Thema: Prototypische Implementierung des Vektormodells Sascha Orf Carina Silberer Cäcilia
Maschinelle Sprachverarbeitung Tokenisierung
Maschinelle Sprachverarbeitung Tokenisierung Dr. Heike Zinsmeister FB Sprachwissenschaft Universität Konstanz 29. Oktober 2008 Gliederung 1 Einleitung 2 Einfache Textzerlegung 3 Herausforderungen an die
Vorlesung: Statistik II für Wirtschaftswissenschaft
Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 6 Genzwertsätze Einführung 1 Wahrscheinlichkeit: Definition und Interpretation
Einführung in die Computerlinguistik
Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik Evaluation Annotation eines Goldstandard : Testkorpus mit der relevanten Zielinformation (z.b. Wortart) Automatische
Ansätze zur Erfassung und Beurteilung menschlicher Arbeitsleistungen bei Dienstleistungen
Wirtschaft Andreas Schalk Ansätze zur Erfassung und Beurteilung menschlicher Arbeitsleistungen bei Dienstleistungen Diplomarbeit FernUniversität Gesamthochschule in Hagen Fachbereich Wirtschaftswissenschaft
MASTERARBEIT (bzw. BACHELORARBEIT) TITEL DER ARBEIT. Vorname Nachname
Christian-Albrechts-Universität zu Kiel Wirtschafts- und Sozialwissenschaftliche Fakultät Lehrstuhl für Supply Chain Management MASTERARBEIT (bzw. BACHELORARBEIT) im Masterstudiengang (bzw. Bachelorstudiengang)
Textmining Klassifikation von Texten Teil 1: Naive Bayes
Textmining Klassifikation von Texten Teil 1: Naive Bayes Dept. Informatik 8 (Künstliche Intelligenz) Friedrich-Alexander-Universität Erlangen-Nürnberg (Informatik 8) Klassifikation von Texten 1: Naive
Welche Bedeutung haben Entscheidungsregeln für die Reliabilität der Dateninterpretation im Evaluationsprozess?
DeGEval/SEVAL-Tagung Welche Bedeutung haben Entscheidungsregeln für die Reliabilität der Dateninterpretation im Evaluationsprozess? Zürich,. September 0 Bäuerle, Vaccaro, Lankes & Schefcsik Überblick.
Textsorten. Folien zum Tutorium Internationalisierung Go West: Preparing for First Contacts with the Anglo- American Academic World
Textsorten Folien zum Tutorium Internationalisierung Go West: Preparing for First Contacts with the Anglo- American Academic World Alexander Borrmann Historisches Institut Lehrstuhl für Spätmittelalter
Überblick: Formale Anforderungen an die Hausarbeit
Überblick: Formale Anforderungen an die Hausarbeit 0 Formales 0 Regeln für die Gliederung 0 Regeln für die Zitierweise/Erstellen eines Literaturverzeichnisses 05.11.2014 2 Formale Regeln für die Gestaltung
ELENA Elektronische Übermittlung von Einkommensnachweisen. Grundsätze der Modellierung
ELENA Elektronische Übermittlung von Einkommensnachweisen Grundsätze der Modellierung Stabstelle: FA1B Land Steiermark Datum: 01.04.2010 01.04.2010 elena_modellierung.doc 1 Inhalt 1 Einführung... 2 2 Modellierung...
Leitfaden zur Erstellung einer Projekt- oder Abschlussarbeit
Leitfaden zur Erstellung einer Projekt- oder Abschlussarbeit Dipl.-Ing. Armin Rohnen LbA Juli 2015 Seite 1 Inhaltsverzeichnis 1. Zielsetzung der Projekt-/Abschlussarbeit... 3 2. Vorgehen... 3 2.1. Projektorganisation...
Maschinelle Übersetzung
Maschinelle Übersetzung Wissensmanagement VO 340088 Bartholomäus Wloka https://www.adaptemy.com MÜ Ansätze Zwei Dimensionen: Verarbeitungstiefe Art der verwendeten Technik Seite 2 Verarbeitunstiefe Seite
Maschinelle Übersetzung
Maschinelle Übersetzung Kluge Andreas, 13IN-M basierend auf Computerlinguistik und Sprachtechnologie, 3. Auflage, Spektrum, Heidelberg 2010 19. Juni 2014 Übersicht Gewünschte Funktionalität Schwierigkeiten
Soziale Arbeit in der Medizinischberuflich orientierten Rehabilitation
Soziale Arbeit in der Medizinischberuflich orientierten Rehabilitation Problemlagen erkennen geeignete Maßnahmen einleiten Marco Streibelt Bernhard Greitemann 1 Gliederung Teil 1: Die Sicht von außen MBOR:
PETRUS Szenario 1 Automatische Sachgruppenvergabe
PETRUS Szenario 1 Automatische Sachgruppenvergabe Elisabeth Mödden 1 Automatische Sachgruppenvergabe 1. DDC-Sachgruppen 2. Automatische Sachgruppenvergabe 3. Tests und Ergebnisse 4. Geschäftsprozesse und
DELA Wörterbücher ===========================================================
DELA Wörterbücher =========================================================== Der Umgang mit externen Ressourcen in Unitex Was man beim Erstellen eigener Lexika beachten sollte? Ein Vortrag von Michaela
Eigenschaften von Texten
Eigenschaften von Texten 1 Statistische Eigenschaften von Text Wie ist die Häufigkeit verschiedener Wörter verteilt? Wie schnell wächst die Größe des Vokabulars mit der Größe eines Korpus? Solche Faktoren
Konstruktionsbegleitende Toleranzsimulation mit
Konstruktionsbegleitende Toleranzsimulation mit Unter Verwendung der GPS-Strategie DIN EN ISO 14638 und DIN EN ISO 8015 Christoph Bruns INNEO Solutions GmbH INNEO Quickfacts BESTE BONITÄT (AAA) UMSATZ
Männerpolitische Grundsatzabteilung. Vereinbarkeit von Familie und Beruf aus Männersicht
Männerpolitische Grundsatzabteilung Vereinbarkeit von Familie und Beruf aus Männersicht Vielen Dank den Sponsoren: Inhaltsverzeichnis 4 Inhaltsverzeichnis 5 Inhaltsverzeichnis 6 Vorwort 7 Danksagung 8
Ziele und Herausforderungen
Ziele und Herausforderungen Text soll automatisch aus einer Quellsprache in eine Zielsprache übertragen werden Dabei soll die Funktion des Textes erhalten bleiben Es werden sowohl computerlinguistische
Listed Private Equity; Performance, Einflussfaktoren und Portfolioeffekte
Fabian Stich Listed Private Equity; Performance, Einflussfaktoren und Portfolioeffekte Eine empirische Analyse PETER LANG Internationaler Verlag der Wissenschaften Inhaltsübersicht ix Inhaltsübersicht
Vornorm DIN CLC/TS (VDE V ): CLC/TS 62046:2008
Inhalt Vorwort... 2 Einleitung... 8 1 Anwendungsbereich... 10 2 Normative Verweisungen... 10 3 Begriffe und Abkürzungen... 10 3.1 Begriffe... 10 3.2 Abkürzungen... 18 4 Auswahl von Schutzmaßnahmen... 18
5. Clusteranalyse. Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften
5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer Clusterstruktur kennen, verschiedene
DISSERTATION. Diagnosespektrum in homöopathischen Arztpraxen eine prospektive Beobachtungsstudie und ein Vergleich zu konventionellen Arztpraxen
Aus dem Institut für Sozialmedizin, Epidemiologie und Gesundheitsökonomie der Medizinischen Fakultät Charité Universitätsmedizin Berlin DISSERTATION Diagnosespektrum in homöopathischen Arztpraxen eine
Lernen mit Neuen Medien
Jörg Zumbach Lernen mit Neuen Medien Instruktionspsychologische Grundlagen Verlag W. Kohlhammer Inhalt 1 Einleitung: Warum Lernen mit Neuen Medien? Historischer Überblick und gegenwärtige Auffassungen
5. Clusteranalyse Vorbemerkungen. 5. Clusteranalyse. Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften
5. Clusteranalyse Vorbemerkungen 5. Clusteranalyse Lernziele: Grundlegende Algorithmen der Clusteranalyse kennen, ihre Eigenschaften benennen und anwenden können, einen Test auf das Vorhandensein einer
Tagging mit Hidden Markov Models und Viterbi-Algorithmus
Tagging mit Hidden Markov Models und Viterbi-Algorithmus Annelen Brunner, Stephanie Schuldes, Nicola Kaiser, Olga Mordvinova HS Parsing SoSe 2003 PD Dr. Karin Haenelt Inhalt Ziel des Seminarprojekts Theorie:
Überblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register
GK C: Einführung in die Korpuslinguistik Anke Lüdeling [email protected] Sommersemester 2003 Überblick Registervariation multidimensionale Analyse Register quantitative Analyse Dimensionen:
ZEITMANAGEMENT UND BETREUUNG DER ARBEIT
ZEITMANAGEMENT UND BETREUUNG DER ARBEIT 1 Betreuer als Ansprechpartner KONTAKT BETREUER / STUDENT Besprechung und Einweisung in die Aufgabenstellung Student arbeitet sich ein (Literatur, Kontaktstellen,
Am Ball bleiben - Wie arbeite ich kontinuierlich und strukturiert? Wibke Derboven
Am Ball bleiben - Wie arbeite ich kontinuierlich und strukturiert? Wibke Derboven 1 Umgang mit Zeit 15 Umgang mir Struktur 15 Wechselwirkung von Zeit und Struktur 10 Umgang mit Krisen 10 2 Umgang mit Zeit
Möglichkeiten biografisch orientierter Unterrichtsarbeit in der Schule
Pädagogik Dr. Gerold Schmidt-Callsen Möglichkeiten biografisch orientierter Unterrichtsarbeit in der Schule Vor dem Hintergrund der Merkmale biografischer Arbeit von Hans-Georg Ruhe Studienarbeit Gerold
Konzeption eines Qualitätscontrollings für die Stationäre Altenhilfe
Uwe Bettig Konzeption eines Qualitätscontrollings für die Stationäre Altenhilfe PETER LANG Europäischer Verlag der Wissenschaften Inhaltsverzeichnis A Theoretischer Teil 1 Einleitung 21 1.1 Aufbau der
Master-Arbeit. Titel der Arbeit. Betreuer: Matthias Splieth, M.Sc. Themensteller: Prof. Dr. Klaus Turowski
Master-Arbeit Titel der Arbeit Max Mustermann Magdeburg, 5. November 2012 Betreuer: Matthias Splieth, M.Sc. Themensteller: Prof. Dr. Klaus Turowski Otto-von-Guericke-Universität Magdeburg Magdeburg Research
Dekonvolution von Omnikamerabildern
1 / 23 Dekonvolution von Omnikamerabildern Tobias Börtitz, Hermann Lorenz, Lutz Krätzer, Josef Söntgen Betreuer: Richard Schmidt HTW Dresden, Deutschland Abschluß Präsentation 15. Februar 2012 2 / 23 1
Vortrag Iterative Prozessmodelle/SCRUM
Vortrag Iterative Prozessmodelle/SCRUM von Marcus Hörger 1 Übersicht Einleitung Prozess Der Software-Entwicklungsprozess Prozessmodelle Lineare Prozessmodelle Das Phasenmodell Iterative Prozessmodelle
