Kapitel 9. Zusammenfassung & Ausblick

Größe: px
Ab Seite anzeigen:

Download "Kapitel 9. Zusammenfassung & Ausblick"

Transkript

1 Kapitel 9 Kapitel 9 Zusammenfassung & Ausblick In diesem Kapitel wird der Prozess der Erstellung einer Zielontologie aus einer Textkollektion zusammengefasst und herausgestellt, wie sich eine Ontologie, die mit dem beschriebenen Prozess erstellt wurde, nutzen lässt. Im Anschluss wird abschließend ein Ausblick auf zukünftige Entwicklungen gegeben. 9.1 Zusammenfassung In dieser Arbeit wurde ein System zur vollautomatischen Informationsextraktion aus natürlichsprachlichen, deutschen Texten mit anschließendem Ontologieaufbau namens Ontology On Demand (OOD) vorgestellt. Das System beinhaltet eine deutsche, Wikipedia-ähnliche Fachtextsammlung, die von Energieforschungsexperten im Rahmen eines Projekts namens EnArgus erstellt wurde und von OOD als Basis zur vollautomatischen Erstellung einer domänenspezifischen Ontologie benutzt wird. Technisch funktioniert die Verarbeitung in Form von einzelnen Modulen auf Java-Basis, die nacheinander auf die Texte angewendet werden und Annotationen mit Attribut-Wert-Paaren erzeugen. Dabei dienen Annotationen von früher laufenden Modulen als Input für später laufende Module. Zum automatischen Aufbau der Zielontologie wird eine Informationsextraktionskomponente eingesetzt, die in der Theorie zunächst syntaktische und schließlich grammatische Strukturen extrahieren, statistisch auswerten und die relevanten Strukturen dann zur Erkennung semantischer Zusammenhänge verwenden sollte. Somit sollte die Komponente

2 Ontology On Demand zunächst eine sogenannte Backbone-Ontologie mit linguistischen Informationen zur Ergänzung von Verben aufbauen, welche schließlich bei einem weiteren Verarbeitungsdurchlauf der Texte zur Erkennung der enthaltenen semantischen Strukturen verwendet worden wäre. Die praktische Umsetzung hat jedoch gezeigt, dass sich die extrahierten Verbinformationen durch Auswertung der Auftretenshäufigkeit nicht statistisch eindeutig in relevante und irrelevante Informationen unterteilen lassen. Somit konnte gezeigt werden, dass eine vollautomatische Extraktion von grammatischen Regeln in Bezug auf Verben sowie die Formalisierung dieser Regeln in einer Backbone-Ontologie nicht möglich ist. Dies liegt daran, dass Verben nicht häufiger zusammen mit den Präpositionen auftreten, die ein Präpositionalobjekt einleiten. Zwischen Verben und den umgebenden Präpositionalphrasen, die eine zum Verb kompatible semantische Rolle tragen können, kann es somit keinen statistisch belastbaren Zusammenhang geben, wenn es diesen zwischen Verben und Präpositionen ebenfalls nicht gibt. Es hat sich darüber hinaus jedoch gezeigt, dass periphäre semantische Rollen für die Informationsausbeute im Grunde nur von geringer Bedeutung sind, da Zeitrollen ohnehin stets fakultativ sind und die fakultativen Ortsrollen (insbesondere Location ) von der Informationsextraktion kaum als solche erkannt werden können. Obligatorische periphäre Rollen sind hingegen weder eindeutig qualifizierbar noch können sie ohne Interpretation des Textinhalts bzw. Wortneuschöpfung in einer Ontologie dargestellt werden. Die viel bedeutsameren primären Rollen tauchen hingegen so systematisch und vorhersagbar auf, dass sie sich ebenso gut aus der Syntax und ohne eine Backbone-Ontologie qualifizieren lassen. Die Empirie hat somit gezeigt, dass das Semantic Role Labeling insgesamt für die automatische Informationsextraktion praktisch keinen Nutzen bringt. Nachdem diese wichtigen Erkenntnisse gewonnen waren, wurde eine manuell erstellte Backbone-Ontologie in die Informationsextraktionskomponente implementiert. Die Informationsextraktionskomponente bildet die Fakten der Texte durch Annotationen und deren Attribut-Wert-Paare ab. Ein Modul zum Ontologieaufbau übersetzt die erzeugten Annotationen und Attribut-Wert-Paare in eine OWL-Datei, die schließlich die Zielontologie mit den semantischen Zusammenhängen aus den verarbeiteten Texten darstellt. Zur Beurteilung der Qualität und der Verwendbarkeit einer automatisch erstellten Ontologie wurde ein Testkorpus aus den Texten zusammengestellt. Die insgesamt 174 enthaltenen Fakten

3 Zusammenfassung & Ausblick wurden händisch in einer Vergleichsontologie modelliert. Die aus dem Testkorpus automatisch aufgebaute Zielontologie wurde anhand der manuell erstellten Vergleichsontologie ausgewertet. Es ergab sich für den automatischen Ontologieaufbau ein F1-Wert von 80,6. Dies entspricht einer mehr als 80%igen Entlastung eines menschlichen Ontologieerstellers, so dass von diesem nur noch etwas weniger als 20% korrigiert oder hinzugefügt werden muss. Ähnliche Systeme für das Englische erreichen im Mittelwert eine Verwendbarkeit von ca %. Die Evaluation einer Ontologie kann zwar stets nur einen sehr vagen Eindruck über die Güte geben. Die für OOD angestrebte Informationsausbeute von 80% konnte jedoch beim exemplarischen Vergleich für das Deutsche erreicht werden. 9.2 Applikation Es wird angestrebt, im EnArgus-Projekt eine durch OOD automatisch erstellte Ontologie aus der Fachtextsammlung als Grundlage für eine produktive, domänenspezifische Ontologie über den Fachbereich Energieforschung zu verwenden. Die Fachontologie ist für Suchanfragen von zentraler Bedeutung, da das Informationssystem EnArgus von zahlreichen Laien benutzt wird, die in einem ihnen unbekannten Fachgebiet schnell und präzise die Informationen abrufen können müssen, die sie suchen. Die Fachontologie wird hier benutzt, um dem Benutzer zu seiner Suche semantisch verwandte Begriffe vorzuschlagen, die er als Nicht-Experte im Fachgebiet Energieforschung nicht kennen kann. So wird der Benutzer durch eine semantische Suchapplikation dabei unterstützt, auch bei einer ungenauen Suche zu finden, wonach er sucht (Sikorski, Haarmann & Ohrem 2013). Die Benutzer des Informationssystems können die von OOD verwendete Textkollektion auch wiederum als Glossar zur einfachen Erklärung unbekannter Fachbegriffe benutzen. Das Ergebnis der Implementierung einer Fachontologie in das Auskunftssystem EnArgus ist eine leichtere und schnellere Suche nach präzisen Informationen für Nicht-Experten in einer fremden bzw. unvertrauten Domäne. OOD kann den Aufbau dieser Fachontologie in wesentlichem Maße erleichtern.

4 Ontology On Demand Die Technologie zum automatischen Aufbau einer Zielontologie aus natürlichsprachlichen Texten stellt somit eine große Hilfe für die semantische Interoperabilität dar. Im EnArgus-Projekt konnte mit der Implementierung dieser Technologie erfolgreich gezeigt werden, dass sich die Interoperabilität technisch herstellen lässt, auch wenn die jeweiligen Experten des Fachgebiets keine ausreichende Zeit, Willen oder Kenntnis haben, eine Ontologie manuell aufzubauen, oder hierfür nicht ausreichend personelle und finanzielle Ressourcen zur Verfügung stehen (Sikorski, Haarmann & Ohrem 2013). In anderen Anwendungsfeldern kann die entstehende Fachontologie ebenfalls als Ressource genutzt werden, um ein System, in das sie eingebettet ist, mit semantischen Informationen über das Fachgebiet Energieforschung zu versorgen. Umgekehrt kann OOD mit den Anpassungen an ein anderes Fachgebiet auch den Aufbau von domänenspezifischen Ontologien aus anderen Wissensbereichen unterstützen. 9.3 Ausblick Die praktische Realisierung von Ontology On Demand hat an vielen Stellen weiterführendes Potenzial zur Verbesserung und Weiterentwicklung der Informationsextraktion gezeigt. Es sollte versucht werden, andere Regeln aus extrahierten syntaktischen Informationen zu schließen. Die als Subjekt und Objekt erkannten Konzepte lassen sich z.b. mithilfe überlagernder Annotationen aus der Named Entitiy Recognition wie z.b. Person auf Belebtheit und Menschlichkeit untersuchen. So ergeben sich u.u. für jedes Verb Selektionsrestriktionen für dessen Subjekt- und Objektkomplemente, die sich möglicherweise auswerten und in der Backbone-Ontologie speichern lassen. In jedem Fall können die überlagernden Annotationen aber verwendet werden, um einen weiteren Ontologie-Ast z.b. mit Personen zu befüllen. Dies wurde bei OOD bisher offen gelassen, da die Texte des EnArgus-Korpus kaum Personenbezeichnungen enthielten. Die Person -Annotation enthält als Vorleistung für eine Erweiterung der Anaphernauflösung bereits die Angaben zum Vor- und Nachnamen. Später kann

5 Zusammenfassung & Ausblick vor allem durch den Nachnamen oder durch Wendungen wie z.b. "Die 42-Jährige" die Koreferenz über Pronomina hinaus weiter ausgebaut werden. Des Weiteren ist es denkbar, dass in der Vornamenliste des Gazetteers das jeweilige Geschlecht mit angegeben wird, um mit dem Genus bei der Auflösung ambiger Personalpronomen eine weitere Informationsquelle zur Disambiguierung zu haben. Weiterhin ist es denkbar, dass die einzelnen extrahierten Konzepte extern zu einer Wortsammlung zusammengestellt werden. Dies ist zumindest für einen auswertenden Zwischenschritt sinnvoll, weil sich hierdurch zwei weitere Informationsquellen ergeben: Erstens kann man die Konzepte, die jeweils entweder in Subjekt- oder in Objektposition mit einem Verb vorkommen, u.u. miteinander clustern. Hier liegt die Annahme zugrunde, dass die Konzepte, die zu demselben Verb das Subjekt (bzw. das direkte Objekt) bilden können, d.h. in paradigmatischer Stellung zueinander stehen (de Saussure ; Lommel 1967), veritable Merkmale gemeinsam haben müssen, so dass sich aus dem Clustering weitere ontologische Klassen unterhalb der Klassen Objekt und Person ergeben. Ein Problem hierbei ist jedoch sicherlich die Benennung der Unterklassen, da die Hyperonyme sich nicht direkt erschließen lassen. 51 Zweitens können die durch das Clustering entstandenen Unterklassen durch die extrahierten Modifikatoren mit Merkmalen belegt werden. Es lässt sich statistisch überprüfen, ob sich die Modifikatoren signifikant häufig auf Mitgliedskonzepte der geclusterten Unterklassen beziehen, so dass die gesamte Klasse mit einem entsprechenden Datatype Property belegt werden kann. Nach dieser Zuordnung kann man noch einen Schritt weiter gehen und Datatype Properties, die bei allen Unterklassen gleichermaßen vorkommen (oder je nach Datenmenge zumindest bei einem gewichtigen Teil 52 ), auf ihre jeweilige Oberklasse generalisieren. 51 Als Ausnahme hiervon könnte man, falls alle Mitgliedskonzepte bindestrichgetrennte Komposita mit gemeinsamem Endteil sind, den gemeinsamen letzten Bestandteil der Komposita als Oberbegriff annehmen. 52 Hierfür kann man einen Schwellenwert definieren, um auch bei geringerer Textmenge sicherzustellen, dass Merkmale auf Oberklassen generalisiert werden, auch wenn sie in den Texten nicht mit Konzepten aus allen Unterklassen erwähnt wurden.

6 Ontology On Demand Schlussbemerkungen Auch wenn der technische Fortschritt im Bereich Sprachverarbeitung in Zukunft weiter wachsen wird, bin ich davon überzeugt, dass dieser Entwicklungsprozess stets zwangsläufig von einer gewissen Fehlerrate begleitet sein muss. Allein die Bestimmung der Wortart durch einen POS Tagger hat eine geschätzte Fehlerquote von 5% bei Fachtexten. Auf der Information über die Wortart bauen jedoch fast alle folgenden Analysen der Informationsextraktion auf, so dass eine falsch zugewiesene Wortart sich zu einer ganzen Kette von Fehlinformationen ausbreiten kann. Die Ergebnisse dieser Dissertation haben erneut verdeutlicht, dass auch die Ambiguität sprachlicher Konstrukte auf fast allen Ebenen erheblich zu fehlenden oder falsch erkannten Informationen führen kann. Wenn man zusätzlich bedenkt, dass unsere Sprache stets von sehr viel Vagheit und Emotion geprägt ist und wir uns z.b. vieler unpräziser und bildlicher Ausdrücke bedienen, so wird uns bei objektiver Betrachtung klar, dass die zukünftige Sprachtechnologie vielleicht Vieles für uns effektiver machen kann, sie kann für uns jedoch niemals mehr sein als eine Arbeitserleichterung. Der technische Fortschritt im Bereich der künstlichen Intelligenz wird uns in Zukunft hoffentlich noch zahlreiche weitere, bahnbrechende Entwicklungen bescheren, die unser Leben einfacher und komfortabler machen. Die Probleme, die sich bei der Formalisierung von Fakten in eine Ontologie ergeben haben, zeigen uns jedoch auch, dass eine Ontologie niemals umfassend sein kann, dass ein Computer niemals so viel Wissen zur Verfügung haben kann wie ein Mensch und dass Maschinen auch in Zukunft weit davon entfernt sein werden, die menschliche Sprache in ebenbürtiger Weise zu beherrschen. Somit wird unsere Sprache auch in Zukunft das sein, was uns Menschen menschlich macht, so dass das populäre Zitat von Edward Sapir (1921) trotz des stolzen Alters von 92 Jahren nicht an Aktualität verlieren wird: Sprache ist eine ausschließlich dem Menschen eigene, nicht im Instinkt wurzelnde Methode zur Übermittlung von Gedanken, Gefühlen und Wünschen ( ).

Inaugural-Dissertation. Philosophie

Inaugural-Dissertation. Philosophie Ontology On Demand Vollautomatische Ontologieerstellung aus deutschen Texten mithilfe moderner Textmining-Prozesse Inaugural-Dissertation zur Erlangung des Grades eines Doktors der Philosophie in der Fakultät

Mehr

INFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka

INFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION 1 22.12.09 Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION(IE) 1. Einleitung 2. Ziel der IE 3. Funktionalität eines IE-Systems 4. Beispiel 5. Übung

Mehr

Informationsextraktion. Christoph Wiewiorski Patrick Hommers

Informationsextraktion. Christoph Wiewiorski Patrick Hommers Informationsextraktion Christoph Wiewiorski Patrick Hommers 1 Informationsextraktion(IE) - Einführung Ziel: Domänenspezifische Informationen aus freiem Text gezielt aufspüren und strukturieren Gleichzeitig

Mehr

Algorithmen und Formale Sprachen

Algorithmen und Formale Sprachen Algorithmen und Formale Sprachen Algorithmen und formale Sprachen Formale Sprachen und Algorithmen Formale Sprachen und formale Algorithmen (formale (Sprachen und Algorithmen)) ((formale Sprachen) und

Mehr

Semantic Role Labeling im modernen Text-Analyse-Prozess

Semantic Role Labeling im modernen Text-Analyse-Prozess Semantic Role Labeling im modernen Text-Analyse-Prozess Bastian Haarmann info@bastianhaarmann.de http://www.bastianhaarmann.de Agenda I Text-Analyse-Prozesse 1. Motivation 2. Informationsextraktion 3.

Mehr

Projektseminar "Texttechnologische Informationsmodellierung"

Projektseminar Texttechnologische Informationsmodellierung Projektseminar "Texttechnologische Informationsmodellierung" Ziel dieser Sitzung Nach dieser Sitzung sollten Sie: Einige standards und projekte vom Namen her kennen Einen Überblick über und einen Eindruck

Mehr

(Bamberg)

(Bamberg) Konzeption eines Frameworks für die Evaluation von Tag-Suggestion-Algorithmen Martin Garbe Steffen Oldenburg Lukas Zielinski Prof. Dr. Clemens Cap (Universität Rostock) 08.05.2008 (Bamberg) Übersicht Tags

Mehr

Semi-automatische Ontologieerstellung mittels TextToOnto

Semi-automatische Ontologieerstellung mittels TextToOnto Semi-automatische Ontologieerstellung mittels TextToOnto Mark Hall SE Computational Linguistics 14. Juni 2004 Zusammenfassung Das Erstellen von Ontologien ist ein komplexer und langwieriger Prozess. Um

Mehr

CyMON - SDMS. Warum SDMS? Semantisches Dokumenten Management System

CyMON - SDMS. Warum SDMS? Semantisches Dokumenten Management System CyMON - SDMS Semantisches Dokumenten Management System Warum SDMS? Die Informationsgesellschaft basiert auf schneller Verfügbarkeit und einfacher Verwendbarkeit von großen Mengen an Daten und Informationen.

Mehr

Terminologie-Extraktion: Beispiel

Terminologie-Extraktion: Beispiel Terminologie-Extraktion: Beispiel The major risks of long-term cardiotoxicity relate to treatment prior to the BMT, in particular, anthracyclines, ablative-dose Cytoxan (ie, dose > 150 mg/ kg), chest [radiation

Mehr

Proseminar Linguistische Annotation

Proseminar Linguistische Annotation Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation

Mehr

Re exivpronomen. Arbeitsblätter zum Ausdrucken von sofatutor.com

Re exivpronomen. Arbeitsblätter zum Ausdrucken von sofatutor.com Arbeitsblätter zum Ausdrucken von sofatutor.com Re exivpronomen 2 Gib an, ob es sich um Re exivpronomen oder Personalpronomen handelt. 3 Bestimme das Re exivpronomen und das Subjekt. 4 Bestimme den Kasus.

Mehr

Semantic Web für Menschen wie du und ich

Semantic Web für Menschen wie du und ich Semantic Web für Menschen wie du und ich benutzerfreundliche Anwendung semantischer Technologien Tobias Kuhn Institut für Informatik Universität Zürich 16. KnowTalk 1. Februar 2011 KnowGravity Inc., Zürich

Mehr

Psycholinguistik. p. 1/28

Psycholinguistik. p. 1/28 Psycholinguistik p. 1/28 Psycholinguistik: Allgemeine Fragen Wie und wo wird die Sprache im Gehirn verarbeitet? Sprachentwicklung 1: Wie erwerben Kinder ihre Muttersprache (Erstpracherwerb)? Sprachentwicklung

Mehr

Re exivpronomen. Arbeitsblätter zum Ausdrucken von sofatutor.com

Re exivpronomen. Arbeitsblätter zum Ausdrucken von sofatutor.com Arbeitsblätter zum Ausdrucken von sofatutor.com Re exivpronomen 2 Gib an, ob es sich um Re exivpronomen oder Personalpronomen handelt. 3 Bestimme das Re exivpronomen und das Subjekt. 4 Bestimme den Kasus.

Mehr

Named Entity Recognition auf Basis von Wortlisten

Named Entity Recognition auf Basis von Wortlisten Named Entity Recognition auf Basis von Wortlisten EDM SS 2017 Lukas Abegg & Tom Schilling Named Entity Recognition auf Basis von Wortlisten Lukas Abegg - Humboldt Universität zu Berlin Tom Schilling -

Mehr

Objektorientierte Programmierung. Kapitel 3: Syntaxdiagramme

Objektorientierte Programmierung. Kapitel 3: Syntaxdiagramme Stefan Brass: OOP (Java), 3. 1/31 Objektorientierte Programmierung Kapitel 3: Stefan Brass Martin-Luther-Universität Halle-Wittenberg Wintersemester 2014/15 http://www.informatik.uni-halle.de/ brass/oop14/

Mehr

Seminar Sicherheit und Softwareengineering WS 2013 / Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS

Seminar Sicherheit und Softwareengineering WS 2013 / Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS Requirements Documents Was sind Requirements Documents? Anforderungsdokumente in industriellen Software-Projekten Häufig in natürlicher Sprache

Mehr

Diskriminatives syntaktisches Reranking für SMT

Diskriminatives syntaktisches Reranking für SMT Diskriminatives syntaktisches Reranking für SMT Fortgeschrittene Themen der statistischen maschinellen Übersetzung Janina Nikolic 2 Agenda Problem: Ranking des SMT Systems Lösung: Reranking-Modell Nutzung

Mehr

Vorlesung Datenstrukturen

Vorlesung Datenstrukturen Vorlesung Datenstrukturen Objektorientierung in C++ (3) Aspekte der Vererbung (1) Dr. Frank Seifert Vorlesung Datenstrukturen - Sommersemester 2016 Folie 546 Zuweisung bei Vererbung Dr. Frank Seifert Vorlesung

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik WS 2/22 Manfred Pinkal Beispiel: Adjektive im Wahrig-Korpus Frequenzen in einem kleinen Teilkorpus: n groß - -

Mehr

Das konzeptionelle Datenmodell

Das konzeptionelle Datenmodell Das konzeptionelle Datenmodell Signifikanz der Datenmodellierung Anforderungsanalyse Effizienz der Anwendung. Redundanzfreiheit. Datenintegrität. Reibungsarme Umsetzung des Datenmodells in das physikalische

Mehr

Speech Recognition Grammar Compilation in Grammatikal Framework. von Michael Heber

Speech Recognition Grammar Compilation in Grammatikal Framework. von Michael Heber Speech Recognition Grammar Compilation in Grammatikal Framework von Michael Heber Agenda 1. Einführung 2. Grammatical Framework (GF) 3. Kontextfreie Grammatiken und Finite-State Modelle 4. Quellen 2 1.

Mehr

Was ist Statistik? Wozu dienen statistische Methoden?

Was ist Statistik? Wozu dienen statistische Methoden? 25. APRIL 2002: BLATT 1 Übersicht Was ist Statistik? Wozu dienen statistische Methoden? Was ist maschinelle Sprachverarbeitung? Welche Rolle spielen statistische Methoden in verschiedenen Teilbereichen

Mehr

Data Modelling versus Ontology Engineering

Data Modelling versus Ontology Engineering Data Modelling versus Ontology Engineering Ketevan Karbelashvili Seminar: Web Services and Semantic Web Inhalt Was ist Ontologie Datenmodelle vs. Ontologien Ontologie Engineering Ansatz - DOGMA Was ist

Mehr

Thesaurus 1. Merkmale:

Thesaurus 1. Merkmale: Thesaurus 1 Eine Dokumentationssprache ist eine Menge sprachlicher Ausdrücke, die, nach bestimmten Regeln angewendet, der Beschreibung von Dokumenten zum Zweck des Speicherns und einer gezielten Wiederauffindung

Mehr

Projektbericht Agententechnologie

Projektbericht Agententechnologie Projektbericht Agententechnologie Projekt Realisierung verteilter Agentensysteme im SoSe 2003 von Christian Poulter Inhaltsübersicht: 1. Einleitung 2. Projektziel / Szenario 3. Aufgaben des Marktagenten

Mehr

Künstliche Intelligenz. Potential und Anwendung

Künstliche Intelligenz. Potential und Anwendung Künstliche Intelligenz Potential und Anwendung Menschliche Intelligenz Intelligentere Maschinen dank künstlicher Intelligenz Bilder Bilder Texte Sprache Texte Sprache Verstehen von strukturierten und unstrukturierten

Mehr

Abkürzungen Einführung Übungsaufgaben... 13

Abkürzungen Einführung Übungsaufgaben... 13 Inhalt Abkürzungen............................................. 10 1 Einführung............................................. 11 1.1 Übungsaufgaben..................................... 13 2 Syntaktische

Mehr

Sprache und Barrierefreiheit Autorenunterstützung mit Sprachtechnologie Aufbau einer Sprachprüfung für Regeln aus Leichte Sprache Anwendung an einem

Sprache und Barrierefreiheit Autorenunterstützung mit Sprachtechnologie Aufbau einer Sprachprüfung für Regeln aus Leichte Sprache Anwendung an einem Sprache und Barrierefreiheit Autorenunterstützung mit Sprachtechnologie Aufbau einer Sprachprüfung für Regeln aus Leichte Sprache Anwendung an einem Beispiel Ziel: Gut verständliche Sprache Was bedeutet

Mehr

Relationen zwischen Nomen und ihren Assoziationen. Michael Roth

Relationen zwischen Nomen und ihren Assoziationen. Michael Roth Relationen zwischen Nomen und ihren Assoziationen Michael Roth 2 Assoziationen sind psychologisch interessant. Wie erfolgt der Zugriff auf sie? Welche Bedeutung haben sie? erfüllen einen linguistischen

Mehr

Entwurfsmuster (Design Patterns)

Entwurfsmuster (Design Patterns) Entwurfsmuster (Design Patterns) SEP 303 Entwurfsmuster (Design Patterns) In der alltäglichen Programmierarbeit tauchen viele Probleme auf, die man schon einmal gelöst hat und die man in der Zukunft wieder

Mehr

Text Mining und Textzusammenfassung. Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer

Text Mining und Textzusammenfassung. Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer Text Mining und Textzusammenfassung Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer Übersicht 1. Definition 2. Prozessablauf 3. Textzusammenfassung 4. Praxisbeispiel Definition Text Mining is the art

Mehr

Darstellung von Ontologien im Semantic Web - RDFS-

Darstellung von Ontologien im Semantic Web - RDFS- Darstellung von Ontologien im Semantic Web - RDFS- Cristina Vertan Inhalt Was kann man mit RDF nicht ausdrücken? Was sind Ontologien? Wie entwirft man eine Ontologie? Wie beschreibt man eine Ontologie

Mehr

Grammatik des Standarddeutschen III. Michael Schecker

Grammatik des Standarddeutschen III. Michael Schecker Grammatik des Standarddeutschen III Michael Schecker Einführung und Grundlagen Nominalgruppen Nomina Artikel Attribute Pronomina Kasus (Subjekte und Objekte, Diathese) Verbalgruppen Valenz und Argumente

Mehr

4 Diskussion 4.1 Korrelation der GW-Ganglinien

4 Diskussion 4.1 Korrelation der GW-Ganglinien 4 Diskussion 4.1 Korrelation der GW-Ganglinien Die GW-Messstationen wurden nach folgenden Kriterien ausgewählt: Erstens unterliegen sie keiner Beeinflussung durch Grundwasserentnahmen. Zweitens sind die

Mehr

INFORMATIONSEXTRAKTION IN SUCHMASCHINEN

INFORMATIONSEXTRAKTION IN SUCHMASCHINEN INFORMATIONSEXTRAKTION IN SUCHMASCHINEN S E M I N A R S U C H M A S C H I N E N S O M M E R S E M ESTER 2014 S T E FA N L A N G E R, C I S, U N I V E R S I TÄT M Ü N C H E N Schematische Architektur einer

Mehr

Ontologiesprachen. 1.Was ist eine Ontologie 2.Aufbau einer Ontologie 3.RDF 4.RDFSchema 5.DAML+OIL / OWL 6.Frame-Logic

Ontologiesprachen. 1.Was ist eine Ontologie 2.Aufbau einer Ontologie 3.RDF 4.RDFSchema 5.DAML+OIL / OWL 6.Frame-Logic Ontologiesprachen 1.Was ist eine Ontologie 2.Aufbau einer Ontologie 3.RDF 4.RDFSchema 5.DAML+OIL / OWL 6.Frame-Logic 1.Was ist eine Ontologie Der Begriff leitet sich vom griechischen onta (das Seiende)

Mehr

Partielle Analyse von Personen-, Orts- und Zeitangaben in Texten aus der Museumsdokumentation

Partielle Analyse von Personen-, Orts- und Zeitangaben in Texten aus der Museumsdokumentation Partielle Analyse von Personen-, Orts- und Zeitangaben in Texten aus der Museumsdokumentation Martin Scholz martin.scholz@i8.informatik.uni-erlangen.de 05.02.2009 Inhalt Anwendungsfall: Goldschmiede-Texte

Mehr

Inhaltsverzeichnis. Vorwort... 11

Inhaltsverzeichnis. Vorwort... 11 Inhaltsverzeichnis Vorwort... 11 1 Einleitung... 13 1.1 Denken und Sprache als Prozesse der Informationsverarbeitung. 14 1.2 Denken und Sprache in Verbindung mit anderen Prozessen... 17 1.3 Auf der Suche

Mehr

WEDKEX. Web-based Engineering Design Knowledge EXtraction. Frank Heyen, Janik M. Hager, Steffen M. Schlinger B.Sc. Informatik

WEDKEX. Web-based Engineering Design Knowledge EXtraction. Frank Heyen, Janik M. Hager, Steffen M. Schlinger B.Sc. Informatik WEDKEX Web-based Engineering Design Knowledge EXtraction Frank Heyen, Janik M. Hager, Steffen M. Schlinger B.Sc. Informatik Motivation Suche nach besseren Komponenten für ein vorhandenes System [HW] 2

Mehr

INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN

INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 14. OKTOBER 2011 1. Schlüsselworte Semantik, Informationsextraktion, Automatisierte Syntaxanalyse, Validierung, Chunking, Tagging,

Mehr

Universität Ulm Abteilung Künstliche Intelligenz. ExtrAns. Verarbeitung natürlicher, schriftlicher Sprache. C. Bohnacker

Universität Ulm Abteilung Künstliche Intelligenz. ExtrAns. Verarbeitung natürlicher, schriftlicher Sprache. C. Bohnacker UNIVERSITÄT ULM SCIENDO DOCENDO CURANDO Universität Ulm Abteilung Künstliche Intelligenz ExtrAns Verarbeitung natürlicher, schriftlicher Sprache C. Bohnacker Überblick Motivation Einleitung Eigenschaften

Mehr

Frage: Haben (127-a) und (127-b) verschiedene Tiefenstrukturen oder nicht?

Frage: Haben (127-a) und (127-b) verschiedene Tiefenstrukturen oder nicht? Modul 04-006-1003 (Syntax und Semantik) Syntax: Perlmutter & Soames 1979 Donnerstag, 9h15-10h45 Sommmersemester 2009 Fabian Heck Institut für Linguistik Universität Leipzig 8. Aktiv und Passiv (127) a.

Mehr

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....

Mehr

Informatik II Modellierung Übung 5 Petrinetze/Klassendiagramme

Informatik II Modellierung Übung 5 Petrinetze/Klassendiagramme I Informatik II Modellierung Übung 5 Petrinetze/Klassendiagramme Abgabetermin: 11. Juni 24.00 Uhr Per e-mail an Tutor Seite 1 / 9 Aufgabe 1 (3%) Klassendiagramme von einer abstrakten Klasse können keine

Mehr

Case-Based Reasoning und anderen Inferenzmechanismen

Case-Based Reasoning und anderen Inferenzmechanismen Case-Based Reasoning und anderen Inferenzmechanismen Daniel Müller 21 April 2006 DM () CBR und Inferenz 21 April 2006 1 / 31 Contents 1 Einleitung 2 Inferenzmechanismen Statistische Verfahren Data Mining

Mehr

Lösungsvorschlag für das Übungsblatt 8. Aufgabe1.

Lösungsvorschlag für das Übungsblatt 8. Aufgabe1. Lösungsvorschlag für das Übungsblatt 8. Aufgabe1. 3 Det A N VP R6 4 Any A N VP L3 5 Any intelligent N VP L4 6 Any intelligent cat VP L2 Nach den Regeln kann der Satz weiter nicht erzeugt warden, deswegen

Mehr

Elektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen 2 und / 27der. und der Computerlinguistik

Elektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen 2 und / 27der. und der Computerlinguistik Elektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen und der Linguistics Department Ruhr-University Bochum 18.1.2011 DSPIN-Workshop Sprachressourcen in der Lehre Erfahrungen, Einsatzszenarien,

Mehr

Linguistische Informatik

Linguistische Informatik Linguistische Informatik Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Das klassische Verarbeitungsmodell Lexikon Grammatik Input: natürlichsprachlicher Satz

Mehr

Java Vererbung. Inhalt

Java Vererbung. Inhalt Java Vererbung Inhalt 1 Zielsetzung... 2 1.1 Bewertung... 2 2 Grundlagen der Vererbung... 2 2.1 Super und Subklassen... 2 3 Überladen von Methoden... 4 3.1 Unterschiedliche Parameter... 4 3.2 Gleiche Parameter

Mehr

Gliederung. 1. Kurzeinstieg 2. Warum ist die Semantik so wichtig? 3. OWL 4. GO 5. Übersetzung 6. Zusammenfassung 7. Quellen

Gliederung. 1. Kurzeinstieg 2. Warum ist die Semantik so wichtig? 3. OWL 4. GO 5. Übersetzung 6. Zusammenfassung 7. Quellen Gliederung Gliederung 1. Kurzeinstieg 2. Warum ist die Semantik so wichtig? 3. OWL 4. GO 5. Übersetzung 6. Zusammenfassung 7. Quellen Marcus Lechner - Institut für Informatik Seite 1 Kurzeinstieg 1. Kurzeinstieg

Mehr

Sprachproduktion: grammatische Enkodierung nach Levelt 1989 bzw. Kempen & Hoenkamp 1987

Sprachproduktion: grammatische Enkodierung nach Levelt 1989 bzw. Kempen & Hoenkamp 1987 Sprachproduktion: grammatische Enkodierung nach Levelt 989 bzw. Kempen & Hoenkamp 987 dargestellt nach Schade & Eikmeyer 2003: Produktion von Syntagmen. In: Rickheit, G., Herrmann, T. & Deutsch, W.: (eds)

Mehr

MITARBEITERMOTIVATION:

MITARBEITERMOTIVATION: MITARBEITERMOTIVATION: EMOTIONEN SIND ENTSCHEIDEND Dale Carnegie Training Whitepaper Copyright 2012 Dale Carnegie & Associates, Inc. All rights reserved. Emotional_Engagement_111512_wp WARUM EMOTIONEN

Mehr

Übersicht. Prädikatenlogik höherer Stufe. Syntax der Prädikatenlogik 1. Stufe (mit Gleichheit)

Übersicht. Prädikatenlogik höherer Stufe. Syntax der Prädikatenlogik 1. Stufe (mit Gleichheit) Übersicht I Künstliche Intelligenz II Problemlösen III Wissen und Schlussfolgern 7. Logische Agenten 8. Prädikatenlogik 1. Stufe 9. Schließen in der Prädikatenlogik 1. Stufe 10. Wissensrepräsentation IV

Mehr

Ontologien. Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Ontologien: Konstrukte. Konzepte/Klassen

Ontologien. Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Ontologien: Konstrukte. Konzepte/Klassen Ontologien Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr Ursprung: semantische Netze aus der künstlichen Intelligenz (1970er) weiterentwickelt als terminologische Logiken, Beschreibungslogiken

Mehr

Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr

Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr 1 / 23 Ontologien Ursprung: semantische Netze aus der künstlichen Intelligenz (1970er) weiterentwickelt als terminologische Logiken,

Mehr

HPSG. Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer

HPSG. Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer HPSG Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer Gliederung Einleitung Kongruenz Allgemein Zwei Theorien der Kongruenz Probleme bei ableitungsbasierenden Kongruenztheorien Wie syntaktisch

Mehr

ENEA Eigennamen Extraction und Analyse

ENEA Eigennamen Extraction und Analyse ENEA Eigennamen Extraction und Analyse Studienprojekt 24.05.2007 Betreuer: Dr. Markus Demleitner Matthias Hartung Dr. Detlef Prescher Referentin: Małgorzata Szczerbik Das Ziel des Projekts war Ein Programm

Mehr

Allgemeine Psychologie - Denken und Sprache

Allgemeine Psychologie - Denken und Sprache Bachelorstudium Psychologie 3 Allgemeine Psychologie - Denken und Sprache Bearbeitet von Sieghard Beller, Andrea Bender 1. Auflage 2010. Taschenbuch. 318 S. Paperback ISBN 978 3 8017 2141 1 Format (B x

Mehr

Workshop WissKI für Uni Sammlungen. Martin Scholz , basierend auf

Workshop WissKI für Uni Sammlungen. Martin Scholz , basierend auf Workshop WissKI für Uni Sammlungen Martin Scholz 18.04.2016, basierend auf 26.11.2013 Ontologische Modellierung Was ist eine Ontologie? Terminologie Vokabular, um über Gegenstände eines Fachbereichs zu

Mehr

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Syntax. Sarah Bosch,

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Syntax. Sarah Bosch, Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Syntax Wiederholung Aufgabe 1 Was ist Syntax und womit beschäftigt sie sich? 3 Aufgabe 1 Was ist Syntax und womit beschäftigt

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Modellierung I WS 2010/2011 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt

Mehr

Empfehlenswerte Referenzen

Empfehlenswerte Referenzen Wenn Google etwas nicht finden kann, fragen sie Jack Bauer. ("Fakten über Jack Bauer") Inhalt Empfehlenswerte Referenzen...1 0 Wozu reguläre Ausdrücke?...1 1 Die Elemente regulärer Ausdrücke...2 2 Ein

Mehr

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko

Interdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko Interdisziplinäre fachdidaktische Übung: Sprache und Modelle SS 2015: Grossmann, Jenko Einleitung Was ist ein Modell? Sprachlich orientierte Modelle Beispiele Wie entstehen Modelle? Zusammenhang Modell

Mehr

Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität

Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität Eva Klien 7. Seminar GIS & Internet 15. bis 17. September 2004 UniBwMünchen Überblick Semantische Heterogenitätsprobleme

Mehr

Constraint-based Tutors. Educational Data Mining (Seminar) Robert Bärhold

Constraint-based Tutors. Educational Data Mining (Seminar) Robert Bärhold Constraint-based Tutors Educational Data Mining (Seminar) Robert Bärhold 10.06.2014 Gliederung Intelligent Tutoring Systems (ITS) Constraint-based Tutors Erläuterung Anwendung: J-Latte Data Mining Studentenmodell

Mehr

D1: Relationale Datenstrukturen (14)

D1: Relationale Datenstrukturen (14) D1: Relationale Datenstrukturen (14) Die Schüler entwickeln ein Verständnis dafür, dass zum Verwalten größerer Datenmengen die bisherigen Werkzeuge nicht ausreichen. Dabei erlernen sie die Grundbegriffe

Mehr

Morphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle

Morphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle Morphologische Merkmale Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle Merkmale Das Wort 'Merkmal' ' bedeutet im Prinzip soviel wie 'Eigenschaft'

Mehr

Datenzugriffskomponente mit JPA 2.1

Datenzugriffskomponente mit JPA 2.1 Datenzugriffskomponente mit JPA 2.1 (Grundlagen der Java Persistence Architecture) Vladislav Faerman Gliederung Einführung Konfiguration Objekt-Relationales Mapping (ORM) mit JPA Das zentrale Konzept der

Mehr

Kundenerwartungen gezielt kennen

Kundenerwartungen gezielt kennen Bachelor Thesis Bachelor of Science in Business Administration FH mit Vertiefung in International Management an der Kalaidos Fachhochschule Schweiz Kundenerwartungen gezielt kennen VERTRAULICH Betreuender

Mehr

Inhaltsverzeichnis. Bibliografische Informationen digitalisiert durch

Inhaltsverzeichnis. Bibliografische Informationen  digitalisiert durch Inhaltsverzeichnis 1 Computerlinguistik - Was ist das? 1 1.1 Aspekte der Computerlinguistik 1 1.1.1 Computer linguistik: Die Wissenschaft 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen 3 1.1.3

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Lerntheke: Sportlich, sportlich - Wortarten und Satzglieder trainieren

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Lerntheke: Sportlich, sportlich - Wortarten und Satzglieder trainieren Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Lerntheke: Sportlich, sportlich - Wortarten und Satzglieder trainieren Das komplette Material finden Sie hier: School-Scout.de VI

Mehr

Automatentheorie und formale Sprachen

Automatentheorie und formale Sprachen Automatentheorie und formale Sprachen Wiebke Petersen Wiebke Petersen Automatentheorie und formale Sprachen - WiSe12/13 1 Seminarplan Lektüre: Theoretische Grundlagen der Informatik, Rolf Socher, 2008

Mehr

LFG-basierter Transfer

LFG-basierter Transfer Inhaltsverzeichnis 1 2 2 Ein Beispiel 4 3 Strukturaufbau 7 4 Alternative Übersetzungen 8 5 Adjunkte 9 6 Kodeskription 10 http://www.ims.uni-stuttgart.de/ gojunaa/mue_tut.html 1 1 Um einen quellsprachlichen

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik Evaluation Annotation eines Goldstandard : Testkorpus mit der relevanten Zielinformation (z.b. Wortart) Automatische

Mehr

Anfertigen von wissenschaftlichen Arbeiten. Peter Altenbernd - Hochschule Darmstadt

Anfertigen von wissenschaftlichen Arbeiten. Peter Altenbernd - Hochschule Darmstadt Anfertigen von wissenschaftlichen Arbeiten 1 Übersicht 1. Die Einleitung 2. Die Einführung 3. Der Inhalt 4. Experimente 5. Stand der Technik (Related Work) 6. Zusammenfassung Kurzfassung (Abstract) Anhang

Mehr

Allgemeine Psychologie Denken und Sprache

Allgemeine Psychologie Denken und Sprache Allgemeine Psychologie Denken und Sprache von Sieghard Beller und Andrea Bender HOGREFE - GÖTTINGEN BERN WIEN PARIS OXFORD PRAG TORONTO ES CAMBRIDGE, MA AMSTERDAM. KOPENHAGEN. STOCKHOLM In haltsverzeich

Mehr

Handbuch: PlagScan PlugIn in Moodle 2.X und 3.X für den Nutzer

Handbuch: PlagScan PlugIn in Moodle 2.X und 3.X für den Nutzer Handbuch: PlagScan PlugIn in Moodle 2.X und 3.X für den Nutzer Stand: November 2015 Inhaltsverzeichnis 1. Aktivieren Sie PlagScan für die Erstellung von Aufgaben 2. Berichtsformen 3. PlagScan Einstellungen

Mehr

Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS

Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS Sandro Uhlmann Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS 1 Automatische Beschlagwortung mit dem

Mehr

3.1.2 Der Beitrag von Wortarten für die Sprachbeschreibung Bisherige Forschungsarbeiten und ihre Anwendung auf das Kreolische...

3.1.2 Der Beitrag von Wortarten für die Sprachbeschreibung Bisherige Forschungsarbeiten und ihre Anwendung auf das Kreolische... Inhaltsverzeichnis 1. Mauritius und das Kreolische auf Mauritius... 13 1.1 Landeskundlicher Teil ein Vorwort... 13 1.2 Zu Geographie, Bevölkerungsgruppen und Sprachen auf Mauritius... 14 1.3 Definition:

Mehr

Wissenschaftliches Schreiben. Recherche- und Schreibseminar Melanie Seiß

Wissenschaftliches Schreiben. Recherche- und Schreibseminar Melanie Seiß Wissenschaftliches Schreiben Recherche- und Schreibseminar Melanie Seiß Inhalt Wissenschaftliche Arbeit Nach Beendigung der Vorarbeit: Gliederung und Literatur mit DozentIn besprechen vor Beginn des Schreibens:

Mehr

12 Abstrakte Klassen, finale Klassen und Interfaces

12 Abstrakte Klassen, finale Klassen und Interfaces 12 Abstrakte Klassen, finale Klassen und Interfaces Eine abstrakte Objekt-Methode ist eine Methode, für die keine Implementierung bereit gestellt wird. Eine Klasse, die abstrakte Objekt-Methoden enthält,

Mehr

Konstruktion von Common Sense-Ontologien durch Analyse natürlicher Sprache

Konstruktion von Common Sense-Ontologien durch Analyse natürlicher Sprache Konstruktion von Common Sense-Ontologien durch Analyse natürlicher Sprache Bachelor of Science Abschlussarbeit Ruth Janning FernUniversität in Hagen Fakultät für Mathematik und Informatik, Lehrgebiet Wissensbasierte

Mehr

Das Informationsextraktions- System ANNIE. Anna Mazhayskaya Anna Vinenko

Das Informationsextraktions- System ANNIE. Anna Mazhayskaya Anna Vinenko Das Informationsextraktions- System ANNIE Anna Mazhayskaya Anna Vinenko 09.07.2007 Informationsextraktion Informationsextraktion versucht, spezifische Informationen aus textuellen Dokumenten zu extrahieren

Mehr

Grammatikformalismen SS 2007 Ausgewählte Musterlösungen Schreiben Sie eine LFG-Grammatik, die Sätze der folgenden Form erkennt:

Grammatikformalismen SS 2007 Ausgewählte Musterlösungen Schreiben Sie eine LFG-Grammatik, die Sätze der folgenden Form erkennt: Grammatikformalismen SS 2007 Ausgewählte usterlösungen 1 LFG Übungsblatt LFG 1 1. Schreiben Sie eine LFG-Grammatik, die Sätze der folgenden Form erkennt: (1) Der Lehrer schläft. (2) Sie schenkt dem Lehrer

Mehr

Interdisziplinärer Workshop. Zitat und Bedeutung September 2006 Elke Brendel, Jörg Meibauer & Markus Steinbach

Interdisziplinärer Workshop. Zitat und Bedeutung September 2006 Elke Brendel, Jörg Meibauer & Markus Steinbach » «: Interdisziplinärer Workshop Zitat und Bedeutung 29.-30. September 2006 Elke Brendel, Jörg Meibauer & Markus Steinbach Philosophisches Seminar Deutsches Institut Zitat & Bedeutung Brendel, Meibauer,

Mehr

Projektgruppe. Text Labeling mit Sequenzmodellen

Projektgruppe. Text Labeling mit Sequenzmodellen Projektgruppe Enes Yigitbas Text Labeling mit Sequenzmodellen 4. Juni 2010 Motivation Möglichkeit der effizienten Verarbeitung von riesigen Datenmengen In vielen Bereichen erwünschte automatisierte Aufgabe:

Mehr

Einführung in die Programmierung

Einführung in die Programmierung Einführung in die Programmierung Teil 3: Daten und Algorithmen Prof. Dr. Peer Kröger, Florian Richter, Michael Fromm Wintersemester 2018/2019 Übersicht 1. Datendarstellung durch Zeichenreihen 2. Syntaxdefinitionen

Mehr

Greedy Algorithms - Gierige Algorithmen

Greedy Algorithms - Gierige Algorithmen Greedy Algorithms - Gierige Algorithmen Marius Burfey 23. Juni 2009 Inhaltsverzeichnis 1 Greedy Algorithms 1 2 Interval Scheduling - Ablaufplanung 2 2.1 Problembeschreibung....................... 2 2.2

Mehr

Beispiel: Eine Choice-Liste...

Beispiel: Eine Choice-Liste... Beispiel: Eine Choice-Liste...! "#%$&! ; = '( ) )+**,-. /*0 1 2 ) 3 #%$+45* 6 7%$& -* 89 #6 #:/*0 #%$ < /0 # 1< ) 1< >?270 #@ < /0 # 1 2 ) )

Mehr

Syntax II. Das Topologische Feldermodell. Konstituententests Vorschau Konstituentenstruktur

Syntax II. Das Topologische Feldermodell. Konstituententests Vorschau Konstituentenstruktur Syntax II Das Topologische Feldermodell Konstituententests Vorschau Konstituentenstruktur Topologische Felder Syntax befasst sich mit den Regeln, mit denen man Wörter zu grammatischen Sätzen kombinieren

Mehr

1/19. Kern-Methoden zur Extraktion von Informationen. Sebastian Marius Kirsch Back Close

1/19. Kern-Methoden zur Extraktion von Informationen. Sebastian Marius Kirsch Back Close 1/19 Kern-Methoden zur Extraktion von Informationen Sebastian Marius Kirsch skirsch@moebius.inka.de 2/19 Gliederung 1. Verfahren zur Extraktion von Informationen 2. Extraktion von Beziehungen 3. Maschinelles

Mehr

RatSLAM. Torben Becker. 24. Mai HAW Hamburg

RatSLAM. Torben Becker. 24. Mai HAW Hamburg HAW Hamburg 24. Mai 2012 Gliederung 1 Motivation 2 3 Aussicht 2 / 21 Motivation Warum SLAM? Navigation Umgebungskartografie Feststellung der Position innerhalb eines Geländes ohne Funksignale Keine vorherige

Mehr

Bestandsaufnahme und Arbeit an einer Alpha-Version des Saros- Plugins für die IntelliJ-Plattform

Bestandsaufnahme und Arbeit an einer Alpha-Version des Saros- Plugins für die IntelliJ-Plattform Tobias Bouschen Institut für Informatik der Freien Universität Berlin, Arbeitsgruppe Software Engineering Bestandsaufnahme und Arbeit an einer Alpha-Version des Saros- Plugins für die IntelliJ-Plattform

Mehr

12. LA- und PS-Hierarchien im Vergleich

12. LA- und PS-Hierarchien im Vergleich Kapitel 12: LA- und PS-Hierarchien im Vergleich 210 12 LA- und PS-Hierarchien im Vergleich 121 Sprachklassen der LA- und PS-Grammatik 1211 Komplexitätsklassen der LA- und PS-Hierarchie LA-Grammatik PS-Grammatik

Mehr

Informationsextraktion mit endlichen Automaten

Informationsextraktion mit endlichen Automaten Informationsextraktion mit endlichen Automaten HS: Information Retrieval Dozentin: Dr. Karin Haenelt Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Referentinnen: Galina Sigwarth,

Mehr

Topic Maps. Wissensmanagement in Bildungseinrichtungen. Seminar Web Engineering Lars Heuer,

Topic Maps. Wissensmanagement in Bildungseinrichtungen. Seminar Web Engineering Lars Heuer, Topic Maps Wissensmanagement in Bildungseinrichtungen Seminar Web Engineering Lars Heuer, 14.01.2005 Inhalt Zielsetzung Problemstellung Was sind Topic Maps? Eigenschaften von Topic Maps Merging RDF Einsatz

Mehr