Kapitel 9. Zusammenfassung & Ausblick
|
|
- Gerd Beltz
- vor 7 Jahren
- Abrufe
Transkript
1 Kapitel 9 Kapitel 9 Zusammenfassung & Ausblick In diesem Kapitel wird der Prozess der Erstellung einer Zielontologie aus einer Textkollektion zusammengefasst und herausgestellt, wie sich eine Ontologie, die mit dem beschriebenen Prozess erstellt wurde, nutzen lässt. Im Anschluss wird abschließend ein Ausblick auf zukünftige Entwicklungen gegeben. 9.1 Zusammenfassung In dieser Arbeit wurde ein System zur vollautomatischen Informationsextraktion aus natürlichsprachlichen, deutschen Texten mit anschließendem Ontologieaufbau namens Ontology On Demand (OOD) vorgestellt. Das System beinhaltet eine deutsche, Wikipedia-ähnliche Fachtextsammlung, die von Energieforschungsexperten im Rahmen eines Projekts namens EnArgus erstellt wurde und von OOD als Basis zur vollautomatischen Erstellung einer domänenspezifischen Ontologie benutzt wird. Technisch funktioniert die Verarbeitung in Form von einzelnen Modulen auf Java-Basis, die nacheinander auf die Texte angewendet werden und Annotationen mit Attribut-Wert-Paaren erzeugen. Dabei dienen Annotationen von früher laufenden Modulen als Input für später laufende Module. Zum automatischen Aufbau der Zielontologie wird eine Informationsextraktionskomponente eingesetzt, die in der Theorie zunächst syntaktische und schließlich grammatische Strukturen extrahieren, statistisch auswerten und die relevanten Strukturen dann zur Erkennung semantischer Zusammenhänge verwenden sollte. Somit sollte die Komponente
2 Ontology On Demand zunächst eine sogenannte Backbone-Ontologie mit linguistischen Informationen zur Ergänzung von Verben aufbauen, welche schließlich bei einem weiteren Verarbeitungsdurchlauf der Texte zur Erkennung der enthaltenen semantischen Strukturen verwendet worden wäre. Die praktische Umsetzung hat jedoch gezeigt, dass sich die extrahierten Verbinformationen durch Auswertung der Auftretenshäufigkeit nicht statistisch eindeutig in relevante und irrelevante Informationen unterteilen lassen. Somit konnte gezeigt werden, dass eine vollautomatische Extraktion von grammatischen Regeln in Bezug auf Verben sowie die Formalisierung dieser Regeln in einer Backbone-Ontologie nicht möglich ist. Dies liegt daran, dass Verben nicht häufiger zusammen mit den Präpositionen auftreten, die ein Präpositionalobjekt einleiten. Zwischen Verben und den umgebenden Präpositionalphrasen, die eine zum Verb kompatible semantische Rolle tragen können, kann es somit keinen statistisch belastbaren Zusammenhang geben, wenn es diesen zwischen Verben und Präpositionen ebenfalls nicht gibt. Es hat sich darüber hinaus jedoch gezeigt, dass periphäre semantische Rollen für die Informationsausbeute im Grunde nur von geringer Bedeutung sind, da Zeitrollen ohnehin stets fakultativ sind und die fakultativen Ortsrollen (insbesondere Location ) von der Informationsextraktion kaum als solche erkannt werden können. Obligatorische periphäre Rollen sind hingegen weder eindeutig qualifizierbar noch können sie ohne Interpretation des Textinhalts bzw. Wortneuschöpfung in einer Ontologie dargestellt werden. Die viel bedeutsameren primären Rollen tauchen hingegen so systematisch und vorhersagbar auf, dass sie sich ebenso gut aus der Syntax und ohne eine Backbone-Ontologie qualifizieren lassen. Die Empirie hat somit gezeigt, dass das Semantic Role Labeling insgesamt für die automatische Informationsextraktion praktisch keinen Nutzen bringt. Nachdem diese wichtigen Erkenntnisse gewonnen waren, wurde eine manuell erstellte Backbone-Ontologie in die Informationsextraktionskomponente implementiert. Die Informationsextraktionskomponente bildet die Fakten der Texte durch Annotationen und deren Attribut-Wert-Paare ab. Ein Modul zum Ontologieaufbau übersetzt die erzeugten Annotationen und Attribut-Wert-Paare in eine OWL-Datei, die schließlich die Zielontologie mit den semantischen Zusammenhängen aus den verarbeiteten Texten darstellt. Zur Beurteilung der Qualität und der Verwendbarkeit einer automatisch erstellten Ontologie wurde ein Testkorpus aus den Texten zusammengestellt. Die insgesamt 174 enthaltenen Fakten
3 Zusammenfassung & Ausblick wurden händisch in einer Vergleichsontologie modelliert. Die aus dem Testkorpus automatisch aufgebaute Zielontologie wurde anhand der manuell erstellten Vergleichsontologie ausgewertet. Es ergab sich für den automatischen Ontologieaufbau ein F1-Wert von 80,6. Dies entspricht einer mehr als 80%igen Entlastung eines menschlichen Ontologieerstellers, so dass von diesem nur noch etwas weniger als 20% korrigiert oder hinzugefügt werden muss. Ähnliche Systeme für das Englische erreichen im Mittelwert eine Verwendbarkeit von ca %. Die Evaluation einer Ontologie kann zwar stets nur einen sehr vagen Eindruck über die Güte geben. Die für OOD angestrebte Informationsausbeute von 80% konnte jedoch beim exemplarischen Vergleich für das Deutsche erreicht werden. 9.2 Applikation Es wird angestrebt, im EnArgus-Projekt eine durch OOD automatisch erstellte Ontologie aus der Fachtextsammlung als Grundlage für eine produktive, domänenspezifische Ontologie über den Fachbereich Energieforschung zu verwenden. Die Fachontologie ist für Suchanfragen von zentraler Bedeutung, da das Informationssystem EnArgus von zahlreichen Laien benutzt wird, die in einem ihnen unbekannten Fachgebiet schnell und präzise die Informationen abrufen können müssen, die sie suchen. Die Fachontologie wird hier benutzt, um dem Benutzer zu seiner Suche semantisch verwandte Begriffe vorzuschlagen, die er als Nicht-Experte im Fachgebiet Energieforschung nicht kennen kann. So wird der Benutzer durch eine semantische Suchapplikation dabei unterstützt, auch bei einer ungenauen Suche zu finden, wonach er sucht (Sikorski, Haarmann & Ohrem 2013). Die Benutzer des Informationssystems können die von OOD verwendete Textkollektion auch wiederum als Glossar zur einfachen Erklärung unbekannter Fachbegriffe benutzen. Das Ergebnis der Implementierung einer Fachontologie in das Auskunftssystem EnArgus ist eine leichtere und schnellere Suche nach präzisen Informationen für Nicht-Experten in einer fremden bzw. unvertrauten Domäne. OOD kann den Aufbau dieser Fachontologie in wesentlichem Maße erleichtern.
4 Ontology On Demand Die Technologie zum automatischen Aufbau einer Zielontologie aus natürlichsprachlichen Texten stellt somit eine große Hilfe für die semantische Interoperabilität dar. Im EnArgus-Projekt konnte mit der Implementierung dieser Technologie erfolgreich gezeigt werden, dass sich die Interoperabilität technisch herstellen lässt, auch wenn die jeweiligen Experten des Fachgebiets keine ausreichende Zeit, Willen oder Kenntnis haben, eine Ontologie manuell aufzubauen, oder hierfür nicht ausreichend personelle und finanzielle Ressourcen zur Verfügung stehen (Sikorski, Haarmann & Ohrem 2013). In anderen Anwendungsfeldern kann die entstehende Fachontologie ebenfalls als Ressource genutzt werden, um ein System, in das sie eingebettet ist, mit semantischen Informationen über das Fachgebiet Energieforschung zu versorgen. Umgekehrt kann OOD mit den Anpassungen an ein anderes Fachgebiet auch den Aufbau von domänenspezifischen Ontologien aus anderen Wissensbereichen unterstützen. 9.3 Ausblick Die praktische Realisierung von Ontology On Demand hat an vielen Stellen weiterführendes Potenzial zur Verbesserung und Weiterentwicklung der Informationsextraktion gezeigt. Es sollte versucht werden, andere Regeln aus extrahierten syntaktischen Informationen zu schließen. Die als Subjekt und Objekt erkannten Konzepte lassen sich z.b. mithilfe überlagernder Annotationen aus der Named Entitiy Recognition wie z.b. Person auf Belebtheit und Menschlichkeit untersuchen. So ergeben sich u.u. für jedes Verb Selektionsrestriktionen für dessen Subjekt- und Objektkomplemente, die sich möglicherweise auswerten und in der Backbone-Ontologie speichern lassen. In jedem Fall können die überlagernden Annotationen aber verwendet werden, um einen weiteren Ontologie-Ast z.b. mit Personen zu befüllen. Dies wurde bei OOD bisher offen gelassen, da die Texte des EnArgus-Korpus kaum Personenbezeichnungen enthielten. Die Person -Annotation enthält als Vorleistung für eine Erweiterung der Anaphernauflösung bereits die Angaben zum Vor- und Nachnamen. Später kann
5 Zusammenfassung & Ausblick vor allem durch den Nachnamen oder durch Wendungen wie z.b. "Die 42-Jährige" die Koreferenz über Pronomina hinaus weiter ausgebaut werden. Des Weiteren ist es denkbar, dass in der Vornamenliste des Gazetteers das jeweilige Geschlecht mit angegeben wird, um mit dem Genus bei der Auflösung ambiger Personalpronomen eine weitere Informationsquelle zur Disambiguierung zu haben. Weiterhin ist es denkbar, dass die einzelnen extrahierten Konzepte extern zu einer Wortsammlung zusammengestellt werden. Dies ist zumindest für einen auswertenden Zwischenschritt sinnvoll, weil sich hierdurch zwei weitere Informationsquellen ergeben: Erstens kann man die Konzepte, die jeweils entweder in Subjekt- oder in Objektposition mit einem Verb vorkommen, u.u. miteinander clustern. Hier liegt die Annahme zugrunde, dass die Konzepte, die zu demselben Verb das Subjekt (bzw. das direkte Objekt) bilden können, d.h. in paradigmatischer Stellung zueinander stehen (de Saussure ; Lommel 1967), veritable Merkmale gemeinsam haben müssen, so dass sich aus dem Clustering weitere ontologische Klassen unterhalb der Klassen Objekt und Person ergeben. Ein Problem hierbei ist jedoch sicherlich die Benennung der Unterklassen, da die Hyperonyme sich nicht direkt erschließen lassen. 51 Zweitens können die durch das Clustering entstandenen Unterklassen durch die extrahierten Modifikatoren mit Merkmalen belegt werden. Es lässt sich statistisch überprüfen, ob sich die Modifikatoren signifikant häufig auf Mitgliedskonzepte der geclusterten Unterklassen beziehen, so dass die gesamte Klasse mit einem entsprechenden Datatype Property belegt werden kann. Nach dieser Zuordnung kann man noch einen Schritt weiter gehen und Datatype Properties, die bei allen Unterklassen gleichermaßen vorkommen (oder je nach Datenmenge zumindest bei einem gewichtigen Teil 52 ), auf ihre jeweilige Oberklasse generalisieren. 51 Als Ausnahme hiervon könnte man, falls alle Mitgliedskonzepte bindestrichgetrennte Komposita mit gemeinsamem Endteil sind, den gemeinsamen letzten Bestandteil der Komposita als Oberbegriff annehmen. 52 Hierfür kann man einen Schwellenwert definieren, um auch bei geringerer Textmenge sicherzustellen, dass Merkmale auf Oberklassen generalisiert werden, auch wenn sie in den Texten nicht mit Konzepten aus allen Unterklassen erwähnt wurden.
6 Ontology On Demand Schlussbemerkungen Auch wenn der technische Fortschritt im Bereich Sprachverarbeitung in Zukunft weiter wachsen wird, bin ich davon überzeugt, dass dieser Entwicklungsprozess stets zwangsläufig von einer gewissen Fehlerrate begleitet sein muss. Allein die Bestimmung der Wortart durch einen POS Tagger hat eine geschätzte Fehlerquote von 5% bei Fachtexten. Auf der Information über die Wortart bauen jedoch fast alle folgenden Analysen der Informationsextraktion auf, so dass eine falsch zugewiesene Wortart sich zu einer ganzen Kette von Fehlinformationen ausbreiten kann. Die Ergebnisse dieser Dissertation haben erneut verdeutlicht, dass auch die Ambiguität sprachlicher Konstrukte auf fast allen Ebenen erheblich zu fehlenden oder falsch erkannten Informationen führen kann. Wenn man zusätzlich bedenkt, dass unsere Sprache stets von sehr viel Vagheit und Emotion geprägt ist und wir uns z.b. vieler unpräziser und bildlicher Ausdrücke bedienen, so wird uns bei objektiver Betrachtung klar, dass die zukünftige Sprachtechnologie vielleicht Vieles für uns effektiver machen kann, sie kann für uns jedoch niemals mehr sein als eine Arbeitserleichterung. Der technische Fortschritt im Bereich der künstlichen Intelligenz wird uns in Zukunft hoffentlich noch zahlreiche weitere, bahnbrechende Entwicklungen bescheren, die unser Leben einfacher und komfortabler machen. Die Probleme, die sich bei der Formalisierung von Fakten in eine Ontologie ergeben haben, zeigen uns jedoch auch, dass eine Ontologie niemals umfassend sein kann, dass ein Computer niemals so viel Wissen zur Verfügung haben kann wie ein Mensch und dass Maschinen auch in Zukunft weit davon entfernt sein werden, die menschliche Sprache in ebenbürtiger Weise zu beherrschen. Somit wird unsere Sprache auch in Zukunft das sein, was uns Menschen menschlich macht, so dass das populäre Zitat von Edward Sapir (1921) trotz des stolzen Alters von 92 Jahren nicht an Aktualität verlieren wird: Sprache ist eine ausschließlich dem Menschen eigene, nicht im Instinkt wurzelnde Methode zur Übermittlung von Gedanken, Gefühlen und Wünschen ( ).
Inaugural-Dissertation. Philosophie
Ontology On Demand Vollautomatische Ontologieerstellung aus deutschen Texten mithilfe moderner Textmining-Prozesse Inaugural-Dissertation zur Erlangung des Grades eines Doktors der Philosophie in der Fakultät
MehrINFORMATIONSEXTRAKTION Computerlinguistik Referenten: Alice Holka, Sandra Pyka
INFORMATIONSEXTRAKTION 1 22.12.09 Computerlinguistik Referenten: Alice Holka, Sandra Pyka INFORMATIONSEXTRAKTION(IE) 1. Einleitung 2. Ziel der IE 3. Funktionalität eines IE-Systems 4. Beispiel 5. Übung
MehrInformationsextraktion. Christoph Wiewiorski Patrick Hommers
Informationsextraktion Christoph Wiewiorski Patrick Hommers 1 Informationsextraktion(IE) - Einführung Ziel: Domänenspezifische Informationen aus freiem Text gezielt aufspüren und strukturieren Gleichzeitig
MehrAlgorithmen und Formale Sprachen
Algorithmen und Formale Sprachen Algorithmen und formale Sprachen Formale Sprachen und Algorithmen Formale Sprachen und formale Algorithmen (formale (Sprachen und Algorithmen)) ((formale Sprachen) und
MehrSemantic Role Labeling im modernen Text-Analyse-Prozess
Semantic Role Labeling im modernen Text-Analyse-Prozess Bastian Haarmann info@bastianhaarmann.de http://www.bastianhaarmann.de Agenda I Text-Analyse-Prozesse 1. Motivation 2. Informationsextraktion 3.
MehrProjektseminar "Texttechnologische Informationsmodellierung"
Projektseminar "Texttechnologische Informationsmodellierung" Ziel dieser Sitzung Nach dieser Sitzung sollten Sie: Einige standards und projekte vom Namen her kennen Einen Überblick über und einen Eindruck
Mehr(Bamberg)
Konzeption eines Frameworks für die Evaluation von Tag-Suggestion-Algorithmen Martin Garbe Steffen Oldenburg Lukas Zielinski Prof. Dr. Clemens Cap (Universität Rostock) 08.05.2008 (Bamberg) Übersicht Tags
MehrSemi-automatische Ontologieerstellung mittels TextToOnto
Semi-automatische Ontologieerstellung mittels TextToOnto Mark Hall SE Computational Linguistics 14. Juni 2004 Zusammenfassung Das Erstellen von Ontologien ist ein komplexer und langwieriger Prozess. Um
MehrCyMON - SDMS. Warum SDMS? Semantisches Dokumenten Management System
CyMON - SDMS Semantisches Dokumenten Management System Warum SDMS? Die Informationsgesellschaft basiert auf schneller Verfügbarkeit und einfacher Verwendbarkeit von großen Mengen an Daten und Informationen.
MehrTerminologie-Extraktion: Beispiel
Terminologie-Extraktion: Beispiel The major risks of long-term cardiotoxicity relate to treatment prior to the BMT, in particular, anthracyclines, ablative-dose Cytoxan (ie, dose > 150 mg/ kg), chest [radiation
MehrProseminar Linguistische Annotation
Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation
MehrRe exivpronomen. Arbeitsblätter zum Ausdrucken von sofatutor.com
Arbeitsblätter zum Ausdrucken von sofatutor.com Re exivpronomen 2 Gib an, ob es sich um Re exivpronomen oder Personalpronomen handelt. 3 Bestimme das Re exivpronomen und das Subjekt. 4 Bestimme den Kasus.
MehrSemantic Web für Menschen wie du und ich
Semantic Web für Menschen wie du und ich benutzerfreundliche Anwendung semantischer Technologien Tobias Kuhn Institut für Informatik Universität Zürich 16. KnowTalk 1. Februar 2011 KnowGravity Inc., Zürich
MehrPsycholinguistik. p. 1/28
Psycholinguistik p. 1/28 Psycholinguistik: Allgemeine Fragen Wie und wo wird die Sprache im Gehirn verarbeitet? Sprachentwicklung 1: Wie erwerben Kinder ihre Muttersprache (Erstpracherwerb)? Sprachentwicklung
MehrRe exivpronomen. Arbeitsblätter zum Ausdrucken von sofatutor.com
Arbeitsblätter zum Ausdrucken von sofatutor.com Re exivpronomen 2 Gib an, ob es sich um Re exivpronomen oder Personalpronomen handelt. 3 Bestimme das Re exivpronomen und das Subjekt. 4 Bestimme den Kasus.
MehrNamed Entity Recognition auf Basis von Wortlisten
Named Entity Recognition auf Basis von Wortlisten EDM SS 2017 Lukas Abegg & Tom Schilling Named Entity Recognition auf Basis von Wortlisten Lukas Abegg - Humboldt Universität zu Berlin Tom Schilling -
MehrObjektorientierte Programmierung. Kapitel 3: Syntaxdiagramme
Stefan Brass: OOP (Java), 3. 1/31 Objektorientierte Programmierung Kapitel 3: Stefan Brass Martin-Luther-Universität Halle-Wittenberg Wintersemester 2014/15 http://www.informatik.uni-halle.de/ brass/oop14/
MehrSeminar Sicherheit und Softwareengineering WS 2013 / Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS
Isabell Kullack FEHLERANALYSE VON REQUIREMENTS DOCUMENTS Requirements Documents Was sind Requirements Documents? Anforderungsdokumente in industriellen Software-Projekten Häufig in natürlicher Sprache
MehrDiskriminatives syntaktisches Reranking für SMT
Diskriminatives syntaktisches Reranking für SMT Fortgeschrittene Themen der statistischen maschinellen Übersetzung Janina Nikolic 2 Agenda Problem: Ranking des SMT Systems Lösung: Reranking-Modell Nutzung
MehrVorlesung Datenstrukturen
Vorlesung Datenstrukturen Objektorientierung in C++ (3) Aspekte der Vererbung (1) Dr. Frank Seifert Vorlesung Datenstrukturen - Sommersemester 2016 Folie 546 Zuweisung bei Vererbung Dr. Frank Seifert Vorlesung
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik WS 2/22 Manfred Pinkal Beispiel: Adjektive im Wahrig-Korpus Frequenzen in einem kleinen Teilkorpus: n groß - -
MehrDas konzeptionelle Datenmodell
Das konzeptionelle Datenmodell Signifikanz der Datenmodellierung Anforderungsanalyse Effizienz der Anwendung. Redundanzfreiheit. Datenintegrität. Reibungsarme Umsetzung des Datenmodells in das physikalische
MehrSpeech Recognition Grammar Compilation in Grammatikal Framework. von Michael Heber
Speech Recognition Grammar Compilation in Grammatikal Framework von Michael Heber Agenda 1. Einführung 2. Grammatical Framework (GF) 3. Kontextfreie Grammatiken und Finite-State Modelle 4. Quellen 2 1.
MehrWas ist Statistik? Wozu dienen statistische Methoden?
25. APRIL 2002: BLATT 1 Übersicht Was ist Statistik? Wozu dienen statistische Methoden? Was ist maschinelle Sprachverarbeitung? Welche Rolle spielen statistische Methoden in verschiedenen Teilbereichen
MehrData Modelling versus Ontology Engineering
Data Modelling versus Ontology Engineering Ketevan Karbelashvili Seminar: Web Services and Semantic Web Inhalt Was ist Ontologie Datenmodelle vs. Ontologien Ontologie Engineering Ansatz - DOGMA Was ist
MehrThesaurus 1. Merkmale:
Thesaurus 1 Eine Dokumentationssprache ist eine Menge sprachlicher Ausdrücke, die, nach bestimmten Regeln angewendet, der Beschreibung von Dokumenten zum Zweck des Speicherns und einer gezielten Wiederauffindung
MehrProjektbericht Agententechnologie
Projektbericht Agententechnologie Projekt Realisierung verteilter Agentensysteme im SoSe 2003 von Christian Poulter Inhaltsübersicht: 1. Einleitung 2. Projektziel / Szenario 3. Aufgaben des Marktagenten
MehrKünstliche Intelligenz. Potential und Anwendung
Künstliche Intelligenz Potential und Anwendung Menschliche Intelligenz Intelligentere Maschinen dank künstlicher Intelligenz Bilder Bilder Texte Sprache Texte Sprache Verstehen von strukturierten und unstrukturierten
MehrAbkürzungen Einführung Übungsaufgaben... 13
Inhalt Abkürzungen............................................. 10 1 Einführung............................................. 11 1.1 Übungsaufgaben..................................... 13 2 Syntaktische
MehrSprache und Barrierefreiheit Autorenunterstützung mit Sprachtechnologie Aufbau einer Sprachprüfung für Regeln aus Leichte Sprache Anwendung an einem
Sprache und Barrierefreiheit Autorenunterstützung mit Sprachtechnologie Aufbau einer Sprachprüfung für Regeln aus Leichte Sprache Anwendung an einem Beispiel Ziel: Gut verständliche Sprache Was bedeutet
MehrRelationen zwischen Nomen und ihren Assoziationen. Michael Roth
Relationen zwischen Nomen und ihren Assoziationen Michael Roth 2 Assoziationen sind psychologisch interessant. Wie erfolgt der Zugriff auf sie? Welche Bedeutung haben sie? erfüllen einen linguistischen
MehrEntwurfsmuster (Design Patterns)
Entwurfsmuster (Design Patterns) SEP 303 Entwurfsmuster (Design Patterns) In der alltäglichen Programmierarbeit tauchen viele Probleme auf, die man schon einmal gelöst hat und die man in der Zukunft wieder
MehrText Mining und Textzusammenfassung. Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer
Text Mining und Textzusammenfassung Jürgen Kirkovits Doris Rongitsch Daniela Wagenhofer Übersicht 1. Definition 2. Prozessablauf 3. Textzusammenfassung 4. Praxisbeispiel Definition Text Mining is the art
MehrDarstellung von Ontologien im Semantic Web - RDFS-
Darstellung von Ontologien im Semantic Web - RDFS- Cristina Vertan Inhalt Was kann man mit RDF nicht ausdrücken? Was sind Ontologien? Wie entwirft man eine Ontologie? Wie beschreibt man eine Ontologie
MehrGrammatik des Standarddeutschen III. Michael Schecker
Grammatik des Standarddeutschen III Michael Schecker Einführung und Grundlagen Nominalgruppen Nomina Artikel Attribute Pronomina Kasus (Subjekte und Objekte, Diathese) Verbalgruppen Valenz und Argumente
Mehr4 Diskussion 4.1 Korrelation der GW-Ganglinien
4 Diskussion 4.1 Korrelation der GW-Ganglinien Die GW-Messstationen wurden nach folgenden Kriterien ausgewählt: Erstens unterliegen sie keiner Beeinflussung durch Grundwasserentnahmen. Zweitens sind die
MehrINFORMATIONSEXTRAKTION IN SUCHMASCHINEN
INFORMATIONSEXTRAKTION IN SUCHMASCHINEN S E M I N A R S U C H M A S C H I N E N S O M M E R S E M ESTER 2014 S T E FA N L A N G E R, C I S, U N I V E R S I TÄT M Ü N C H E N Schematische Architektur einer
MehrOntologiesprachen. 1.Was ist eine Ontologie 2.Aufbau einer Ontologie 3.RDF 4.RDFSchema 5.DAML+OIL / OWL 6.Frame-Logic
Ontologiesprachen 1.Was ist eine Ontologie 2.Aufbau einer Ontologie 3.RDF 4.RDFSchema 5.DAML+OIL / OWL 6.Frame-Logic 1.Was ist eine Ontologie Der Begriff leitet sich vom griechischen onta (das Seiende)
MehrPartielle Analyse von Personen-, Orts- und Zeitangaben in Texten aus der Museumsdokumentation
Partielle Analyse von Personen-, Orts- und Zeitangaben in Texten aus der Museumsdokumentation Martin Scholz martin.scholz@i8.informatik.uni-erlangen.de 05.02.2009 Inhalt Anwendungsfall: Goldschmiede-Texte
MehrInhaltsverzeichnis. Vorwort... 11
Inhaltsverzeichnis Vorwort... 11 1 Einleitung... 13 1.1 Denken und Sprache als Prozesse der Informationsverarbeitung. 14 1.2 Denken und Sprache in Verbindung mit anderen Prozessen... 17 1.3 Auf der Suche
MehrWEDKEX. Web-based Engineering Design Knowledge EXtraction. Frank Heyen, Janik M. Hager, Steffen M. Schlinger B.Sc. Informatik
WEDKEX Web-based Engineering Design Knowledge EXtraction Frank Heyen, Janik M. Hager, Steffen M. Schlinger B.Sc. Informatik Motivation Suche nach besseren Komponenten für ein vorhandenes System [HW] 2
MehrINFORMATIONSGEWINNUNG AUS KURZEN TEXTEN
INFORMATIONSGEWINNUNG AUS KURZEN TEXTEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 14. OKTOBER 2011 1. Schlüsselworte Semantik, Informationsextraktion, Automatisierte Syntaxanalyse, Validierung, Chunking, Tagging,
MehrUniversität Ulm Abteilung Künstliche Intelligenz. ExtrAns. Verarbeitung natürlicher, schriftlicher Sprache. C. Bohnacker
UNIVERSITÄT ULM SCIENDO DOCENDO CURANDO Universität Ulm Abteilung Künstliche Intelligenz ExtrAns Verarbeitung natürlicher, schriftlicher Sprache C. Bohnacker Überblick Motivation Einleitung Eigenschaften
MehrFrage: Haben (127-a) und (127-b) verschiedene Tiefenstrukturen oder nicht?
Modul 04-006-1003 (Syntax und Semantik) Syntax: Perlmutter & Soames 1979 Donnerstag, 9h15-10h45 Sommmersemester 2009 Fabian Heck Institut für Linguistik Universität Leipzig 8. Aktiv und Passiv (127) a.
Mehrxii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis
Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....
MehrInformatik II Modellierung Übung 5 Petrinetze/Klassendiagramme
I Informatik II Modellierung Übung 5 Petrinetze/Klassendiagramme Abgabetermin: 11. Juni 24.00 Uhr Per e-mail an Tutor Seite 1 / 9 Aufgabe 1 (3%) Klassendiagramme von einer abstrakten Klasse können keine
MehrCase-Based Reasoning und anderen Inferenzmechanismen
Case-Based Reasoning und anderen Inferenzmechanismen Daniel Müller 21 April 2006 DM () CBR und Inferenz 21 April 2006 1 / 31 Contents 1 Einleitung 2 Inferenzmechanismen Statistische Verfahren Data Mining
MehrLösungsvorschlag für das Übungsblatt 8. Aufgabe1.
Lösungsvorschlag für das Übungsblatt 8. Aufgabe1. 3 Det A N VP R6 4 Any A N VP L3 5 Any intelligent N VP L4 6 Any intelligent cat VP L2 Nach den Regeln kann der Satz weiter nicht erzeugt warden, deswegen
MehrElektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen 2 und / 27der. und der Computerlinguistik
Elektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen und der Linguistics Department Ruhr-University Bochum 18.1.2011 DSPIN-Workshop Sprachressourcen in der Lehre Erfahrungen, Einsatzszenarien,
MehrLinguistische Informatik
Linguistische Informatik Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Das klassische Verarbeitungsmodell Lexikon Grammatik Input: natürlichsprachlicher Satz
MehrJava Vererbung. Inhalt
Java Vererbung Inhalt 1 Zielsetzung... 2 1.1 Bewertung... 2 2 Grundlagen der Vererbung... 2 2.1 Super und Subklassen... 2 3 Überladen von Methoden... 4 3.1 Unterschiedliche Parameter... 4 3.2 Gleiche Parameter
MehrGliederung. 1. Kurzeinstieg 2. Warum ist die Semantik so wichtig? 3. OWL 4. GO 5. Übersetzung 6. Zusammenfassung 7. Quellen
Gliederung Gliederung 1. Kurzeinstieg 2. Warum ist die Semantik so wichtig? 3. OWL 4. GO 5. Übersetzung 6. Zusammenfassung 7. Quellen Marcus Lechner - Institut für Informatik Seite 1 Kurzeinstieg 1. Kurzeinstieg
MehrSprachproduktion: grammatische Enkodierung nach Levelt 1989 bzw. Kempen & Hoenkamp 1987
Sprachproduktion: grammatische Enkodierung nach Levelt 989 bzw. Kempen & Hoenkamp 987 dargestellt nach Schade & Eikmeyer 2003: Produktion von Syntagmen. In: Rickheit, G., Herrmann, T. & Deutsch, W.: (eds)
MehrMITARBEITERMOTIVATION:
MITARBEITERMOTIVATION: EMOTIONEN SIND ENTSCHEIDEND Dale Carnegie Training Whitepaper Copyright 2012 Dale Carnegie & Associates, Inc. All rights reserved. Emotional_Engagement_111512_wp WARUM EMOTIONEN
MehrÜbersicht. Prädikatenlogik höherer Stufe. Syntax der Prädikatenlogik 1. Stufe (mit Gleichheit)
Übersicht I Künstliche Intelligenz II Problemlösen III Wissen und Schlussfolgern 7. Logische Agenten 8. Prädikatenlogik 1. Stufe 9. Schließen in der Prädikatenlogik 1. Stufe 10. Wissensrepräsentation IV
MehrOntologien. Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Ontologien: Konstrukte. Konzepte/Klassen
Ontologien Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr Ursprung: semantische Netze aus der künstlichen Intelligenz (1970er) weiterentwickelt als terminologische Logiken, Beschreibungslogiken
MehrOntologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr
Ontologien (aus ISM Kap. 3. Wissensrepräsentation für Texte) Norbert Fuhr 1 / 23 Ontologien Ursprung: semantische Netze aus der künstlichen Intelligenz (1970er) weiterentwickelt als terminologische Logiken,
MehrHPSG. Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer
HPSG Referat zu dem Thema Kongruenz im Englischen Von Anja Nerstheimer Gliederung Einleitung Kongruenz Allgemein Zwei Theorien der Kongruenz Probleme bei ableitungsbasierenden Kongruenztheorien Wie syntaktisch
MehrENEA Eigennamen Extraction und Analyse
ENEA Eigennamen Extraction und Analyse Studienprojekt 24.05.2007 Betreuer: Dr. Markus Demleitner Matthias Hartung Dr. Detlef Prescher Referentin: Małgorzata Szczerbik Das Ziel des Projekts war Ein Programm
MehrAllgemeine Psychologie - Denken und Sprache
Bachelorstudium Psychologie 3 Allgemeine Psychologie - Denken und Sprache Bearbeitet von Sieghard Beller, Andrea Bender 1. Auflage 2010. Taschenbuch. 318 S. Paperback ISBN 978 3 8017 2141 1 Format (B x
MehrWorkshop WissKI für Uni Sammlungen. Martin Scholz , basierend auf
Workshop WissKI für Uni Sammlungen Martin Scholz 18.04.2016, basierend auf 26.11.2013 Ontologische Modellierung Was ist eine Ontologie? Terminologie Vokabular, um über Gegenstände eines Fachbereichs zu
MehrIvana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Syntax. Sarah Bosch,
Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Syntax Wiederholung Aufgabe 1 Was ist Syntax und womit beschäftigt sie sich? 3 Aufgabe 1 Was ist Syntax und womit beschäftigt
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Statistische Modellierung I WS 2010/2011 Manfred Pinkal Wortartinformation Wortartinformation ist eine wichtige Voraussetzung für die syntaktische Analyse. Woher kommt
MehrEmpfehlenswerte Referenzen
Wenn Google etwas nicht finden kann, fragen sie Jack Bauer. ("Fakten über Jack Bauer") Inhalt Empfehlenswerte Referenzen...1 0 Wozu reguläre Ausdrücke?...1 1 Die Elemente regulärer Ausdrücke...2 2 Ein
MehrInterdisziplinäre fachdidaktische Übung: Sprache und Modelle. SS 2015: Grossmann, Jenko
Interdisziplinäre fachdidaktische Übung: Sprache und Modelle SS 2015: Grossmann, Jenko Einleitung Was ist ein Modell? Sprachlich orientierte Modelle Beispiele Wie entstehen Modelle? Zusammenhang Modell
MehrVerbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität
Verbesserte Nutzbarkeit heterogener und verteilter Geodaten durch Semantische Interoperabilität Eva Klien 7. Seminar GIS & Internet 15. bis 17. September 2004 UniBwMünchen Überblick Semantische Heterogenitätsprobleme
MehrConstraint-based Tutors. Educational Data Mining (Seminar) Robert Bärhold
Constraint-based Tutors Educational Data Mining (Seminar) Robert Bärhold 10.06.2014 Gliederung Intelligent Tutoring Systems (ITS) Constraint-based Tutors Erläuterung Anwendung: J-Latte Data Mining Studentenmodell
MehrD1: Relationale Datenstrukturen (14)
D1: Relationale Datenstrukturen (14) Die Schüler entwickeln ein Verständnis dafür, dass zum Verwalten größerer Datenmengen die bisherigen Werkzeuge nicht ausreichen. Dabei erlernen sie die Grundbegriffe
MehrMorphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle
Morphologische Merkmale Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle Merkmale Das Wort 'Merkmal' ' bedeutet im Prinzip soviel wie 'Eigenschaft'
MehrDatenzugriffskomponente mit JPA 2.1
Datenzugriffskomponente mit JPA 2.1 (Grundlagen der Java Persistence Architecture) Vladislav Faerman Gliederung Einführung Konfiguration Objekt-Relationales Mapping (ORM) mit JPA Das zentrale Konzept der
MehrKundenerwartungen gezielt kennen
Bachelor Thesis Bachelor of Science in Business Administration FH mit Vertiefung in International Management an der Kalaidos Fachhochschule Schweiz Kundenerwartungen gezielt kennen VERTRAULICH Betreuender
MehrInhaltsverzeichnis. Bibliografische Informationen digitalisiert durch
Inhaltsverzeichnis 1 Computerlinguistik - Was ist das? 1 1.1 Aspekte der Computerlinguistik 1 1.1.1 Computer linguistik: Die Wissenschaft 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen 3 1.1.3
MehrUnterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Lerntheke: Sportlich, sportlich - Wortarten und Satzglieder trainieren
Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Lerntheke: Sportlich, sportlich - Wortarten und Satzglieder trainieren Das komplette Material finden Sie hier: School-Scout.de VI
MehrAutomatentheorie und formale Sprachen
Automatentheorie und formale Sprachen Wiebke Petersen Wiebke Petersen Automatentheorie und formale Sprachen - WiSe12/13 1 Seminarplan Lektüre: Theoretische Grundlagen der Informatik, Rolf Socher, 2008
MehrLFG-basierter Transfer
Inhaltsverzeichnis 1 2 2 Ein Beispiel 4 3 Strukturaufbau 7 4 Alternative Übersetzungen 8 5 Adjunkte 9 6 Kodeskription 10 http://www.ims.uni-stuttgart.de/ gojunaa/mue_tut.html 1 1 Um einen quellsprachlichen
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik Evaluation Annotation eines Goldstandard : Testkorpus mit der relevanten Zielinformation (z.b. Wortart) Automatische
MehrAnfertigen von wissenschaftlichen Arbeiten. Peter Altenbernd - Hochschule Darmstadt
Anfertigen von wissenschaftlichen Arbeiten 1 Übersicht 1. Die Einleitung 2. Die Einführung 3. Der Inhalt 4. Experimente 5. Stand der Technik (Related Work) 6. Zusammenfassung Kurzfassung (Abstract) Anhang
MehrAllgemeine Psychologie Denken und Sprache
Allgemeine Psychologie Denken und Sprache von Sieghard Beller und Andrea Bender HOGREFE - GÖTTINGEN BERN WIEN PARIS OXFORD PRAG TORONTO ES CAMBRIDGE, MA AMSTERDAM. KOPENHAGEN. STOCKHOLM In haltsverzeich
MehrHandbuch: PlagScan PlugIn in Moodle 2.X und 3.X für den Nutzer
Handbuch: PlagScan PlugIn in Moodle 2.X und 3.X für den Nutzer Stand: November 2015 Inhaltsverzeichnis 1. Aktivieren Sie PlagScan für die Erstellung von Aufgaben 2. Berichtsformen 3. PlagScan Einstellungen
MehrAutomatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS
Sandro Uhlmann Automatische Beschlagwortung mit dem Vokabular der Schlagwortnormdatei (SWD) und der Personennamendatei (PND) Erfahrungen aus dem DNB-Projekt PETRUS 1 Automatische Beschlagwortung mit dem
Mehr3.1.2 Der Beitrag von Wortarten für die Sprachbeschreibung Bisherige Forschungsarbeiten und ihre Anwendung auf das Kreolische...
Inhaltsverzeichnis 1. Mauritius und das Kreolische auf Mauritius... 13 1.1 Landeskundlicher Teil ein Vorwort... 13 1.2 Zu Geographie, Bevölkerungsgruppen und Sprachen auf Mauritius... 14 1.3 Definition:
MehrWissenschaftliches Schreiben. Recherche- und Schreibseminar Melanie Seiß
Wissenschaftliches Schreiben Recherche- und Schreibseminar Melanie Seiß Inhalt Wissenschaftliche Arbeit Nach Beendigung der Vorarbeit: Gliederung und Literatur mit DozentIn besprechen vor Beginn des Schreibens:
Mehr12 Abstrakte Klassen, finale Klassen und Interfaces
12 Abstrakte Klassen, finale Klassen und Interfaces Eine abstrakte Objekt-Methode ist eine Methode, für die keine Implementierung bereit gestellt wird. Eine Klasse, die abstrakte Objekt-Methoden enthält,
MehrKonstruktion von Common Sense-Ontologien durch Analyse natürlicher Sprache
Konstruktion von Common Sense-Ontologien durch Analyse natürlicher Sprache Bachelor of Science Abschlussarbeit Ruth Janning FernUniversität in Hagen Fakultät für Mathematik und Informatik, Lehrgebiet Wissensbasierte
MehrDas Informationsextraktions- System ANNIE. Anna Mazhayskaya Anna Vinenko
Das Informationsextraktions- System ANNIE Anna Mazhayskaya Anna Vinenko 09.07.2007 Informationsextraktion Informationsextraktion versucht, spezifische Informationen aus textuellen Dokumenten zu extrahieren
MehrGrammatikformalismen SS 2007 Ausgewählte Musterlösungen Schreiben Sie eine LFG-Grammatik, die Sätze der folgenden Form erkennt:
Grammatikformalismen SS 2007 Ausgewählte usterlösungen 1 LFG Übungsblatt LFG 1 1. Schreiben Sie eine LFG-Grammatik, die Sätze der folgenden Form erkennt: (1) Der Lehrer schläft. (2) Sie schenkt dem Lehrer
MehrInterdisziplinärer Workshop. Zitat und Bedeutung September 2006 Elke Brendel, Jörg Meibauer & Markus Steinbach
» «: Interdisziplinärer Workshop Zitat und Bedeutung 29.-30. September 2006 Elke Brendel, Jörg Meibauer & Markus Steinbach Philosophisches Seminar Deutsches Institut Zitat & Bedeutung Brendel, Meibauer,
MehrProjektgruppe. Text Labeling mit Sequenzmodellen
Projektgruppe Enes Yigitbas Text Labeling mit Sequenzmodellen 4. Juni 2010 Motivation Möglichkeit der effizienten Verarbeitung von riesigen Datenmengen In vielen Bereichen erwünschte automatisierte Aufgabe:
MehrEinführung in die Programmierung
Einführung in die Programmierung Teil 3: Daten und Algorithmen Prof. Dr. Peer Kröger, Florian Richter, Michael Fromm Wintersemester 2018/2019 Übersicht 1. Datendarstellung durch Zeichenreihen 2. Syntaxdefinitionen
MehrGreedy Algorithms - Gierige Algorithmen
Greedy Algorithms - Gierige Algorithmen Marius Burfey 23. Juni 2009 Inhaltsverzeichnis 1 Greedy Algorithms 1 2 Interval Scheduling - Ablaufplanung 2 2.1 Problembeschreibung....................... 2 2.2
MehrBeispiel: Eine Choice-Liste...
Beispiel: Eine Choice-Liste...! "#%$&! ; = '( ) )+**,-. /*0 1 2 ) 3 #%$+45* 6 7%$& -* 89 #6 #:/*0 #%$ < /0 # 1< ) 1< >?270 #@ < /0 # 1 2 ) )
MehrSyntax II. Das Topologische Feldermodell. Konstituententests Vorschau Konstituentenstruktur
Syntax II Das Topologische Feldermodell Konstituententests Vorschau Konstituentenstruktur Topologische Felder Syntax befasst sich mit den Regeln, mit denen man Wörter zu grammatischen Sätzen kombinieren
Mehr1/19. Kern-Methoden zur Extraktion von Informationen. Sebastian Marius Kirsch Back Close
1/19 Kern-Methoden zur Extraktion von Informationen Sebastian Marius Kirsch skirsch@moebius.inka.de 2/19 Gliederung 1. Verfahren zur Extraktion von Informationen 2. Extraktion von Beziehungen 3. Maschinelles
MehrRatSLAM. Torben Becker. 24. Mai HAW Hamburg
HAW Hamburg 24. Mai 2012 Gliederung 1 Motivation 2 3 Aussicht 2 / 21 Motivation Warum SLAM? Navigation Umgebungskartografie Feststellung der Position innerhalb eines Geländes ohne Funksignale Keine vorherige
MehrBestandsaufnahme und Arbeit an einer Alpha-Version des Saros- Plugins für die IntelliJ-Plattform
Tobias Bouschen Institut für Informatik der Freien Universität Berlin, Arbeitsgruppe Software Engineering Bestandsaufnahme und Arbeit an einer Alpha-Version des Saros- Plugins für die IntelliJ-Plattform
Mehr12. LA- und PS-Hierarchien im Vergleich
Kapitel 12: LA- und PS-Hierarchien im Vergleich 210 12 LA- und PS-Hierarchien im Vergleich 121 Sprachklassen der LA- und PS-Grammatik 1211 Komplexitätsklassen der LA- und PS-Hierarchie LA-Grammatik PS-Grammatik
MehrInformationsextraktion mit endlichen Automaten
Informationsextraktion mit endlichen Automaten HS: Information Retrieval Dozentin: Dr. Karin Haenelt Ruprecht-Karls-Universität Heidelberg Seminar für Computerlinguistik Referentinnen: Galina Sigwarth,
MehrTopic Maps. Wissensmanagement in Bildungseinrichtungen. Seminar Web Engineering Lars Heuer,
Topic Maps Wissensmanagement in Bildungseinrichtungen Seminar Web Engineering Lars Heuer, 14.01.2005 Inhalt Zielsetzung Problemstellung Was sind Topic Maps? Eigenschaften von Topic Maps Merging RDF Einsatz
Mehr