Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute

Save this PDF as:
 WORD  PNG  TXT  JPG

Größe: px
Ab Seite anzeigen:

Download "Gliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute"

Transkript

1 Das TIGER-Korpus: Annotation und Exploration Stefanie Dipper Forschungskolloquium Korpuslinguistik, Gliederung 1. TIGER-Korpus 2. Annotation 3. Visualisierung 4. Suche, Retrieval 5. Demo 6. Repräsentation 1. TIGER-Korpus TIGER-Korpus entstanden im Projekt TIGER (1999 heute) beteiligte Institute CoLi Saarbrücken (Uszkoreit) IMS Stuttgart (Rohrer) Germanistik Potsdam (Eisenberg) URL: Zeitungstext (Frankfurter Rundschau) baut auf NEGRA-Korpus auf mehr Sätze detailliertere Annotation Version 1 veröffentlicht Juli Sätze ( Tokens)

2 TIGER-Korpus: Annotationsebenen TIGER-Korpus: Syntax-Annotation Wörter/Tokens annotiert mit Wortart (POS), nach STTS Morphologie, Lemma (in Arbeit) Syntax Kategorie (Knoten) Funktion (Kantenlabel) (möglichst) theorieunabhängig kreuzende Kanten für nicht-lokale Abhängigkeiten (keine Spuren) NPs: keine Kopfauszeichnung (D vs. N als Kopf) sekundäre Kanten für Ellipsen etc. platzsparend flache Strukturen (keine unären Knoten, flache PP) virtueller Wurzelknoten Bsp: NPs, flache Strukturen Bsp: kreuzende Kanten (Topikalisierung)

3 Bsp: kreuzende Kanten (Extraposition) Bsp: sekundäre Kanten (Subjektslücke) 2. Annotation semi-automatische Annotation mit 1. Tool annotate, statistisch (Saarbrücken) 2. LFG-Grammatik, symbolisch (IMS Stuttgart) Konsistenzsicherung 2-malige, voneinander unabhängige Annotation (ca. 2x 50 sec/satz; Satz mit Ø 17,8 Tokens) anschließend Vergleich (> 2 min/satz) Bsp: sekundäre Kanten (Ellipse+Gapping)

4 Annotation via annotate Annotation via LFG-Grammatik 1. POS-Tagging statistischer TnT-Tagger schlägt wahrscheinlichsten POS-Tag vor korrekte Tags: 84% 2. Phrasen/Konstituenten syntaktische Struktur wird sukzessive erstellt, statistischer Parser macht Vorschläge korrekte Phrasen: 71% 1. kurze LFG-Einführung 2. Abbildung LFG TIGER 3. Disambiguierung LFG-Einführung (Lexical Functional Grammar) LFG-Einführung: c-struktur 2 (hier relevante) Repräsentationsebenen: 1. Konstituentenstruktur (c-struktur) Baum erzeugt durch kontextfreie Regeln 2. Funktionale Struktur (f-struktur) Attribut-Werte-Matrix erzeugt durch Projektion von c-struktur-knoten S NP VP VP V NP Hans NP Hans V lacht S VP V lacht

5 LFG-Einführung: f-struktur Verbindung c-struktur -- f-struktur PRED lachen<subj> SUBJ PRED Hans S NP VP ( SUBJ) = = NP Hans ( PRED ) = Hans Verbindung c-struktur -- f-struktur LFG-Grammatik: Beispiel c-struktur S NP VP ( SUBJ ) = = ( SUBJ ) = NP S = VP V PRED lachen<subj> SUBJ PRED Hans Hans lacht

6 LFG-Grammatik: Beispiel f-struktur (Skelett) LFG-Grammatik: Beispiel f-struktur (volle Struktur) TIGER: nicht-lokale Abhängigkeit LFG-Grammatik: Beispiel nicht-lokale Abhängigkeit CP NP C V CP Ein Mann kommt, der lacht.

7 LFG-Grammatik: Beispiel nicht-lokale Abhängigkeit LFG c-struktur und f-struktur c-struktur: Information über Lemma + Morphologie Kategorie (NP, VP,...) Baumstruktur (lokale Abhängigkeiten) f-struktur: Information über Funktion (SUBJ, HEAD,...) Baumstruktur (nicht-lokale Abhängigkeiten) Abbildung LFG TIGER Unterschiede LFG TIGER: Tokenisierung Unterschiede LFG TIGER Tokenisierung Morphologie Lemmatisierung Analyse z.b. Multiwords in der Regel : 1 Token in LFG-Grammatik 3 Tokens in TIGER z.b. Satzzeichen zusätzliche Kommata in LFG-Grammatik

8 Unterschiede LFG TIGER: Morphologie Unterschiede LFG TIGER: Lemmatisierung Unterspezifikation ihm in Hans hilft ihm : Masc.Dat.Sg oder Neut.Dat.Sg in TIGER MN.Dat.Sg in LFG-Grammatik z.b. Komposita Bundestagsmandat : Bundestagsmandat in TIGER Bund+Tag+Mandat in LFG-Grammatik z.b. derivierte Nomen Angefallene in das dort Angefallene : Angefallene in TIGER anfallen in LFG-Grammatik Unterschiede LFG TIGER: Analyse TIGER Auxiliare z.b. Auxiliar-Analyse TIGER LFG Auxiliar hat wird Kopf temporales Feature Vollverb geholfen müssen Komplement von Aux Kopf

9 LFG Auxiliare LFG: Disambiguierung LFG-Analysen oft sehr ambig Ein Mann kommt, der lacht : > 4 Analysen Mann als common vs. proper noun 1 Hauptsatz + Relativsatz vs. 2 Hauptsätze... OT-Marks zur automat. Disambiguierung z.b. Eigennamen generell dispräferiert Rest manuell disambiguiert 3. Visualisierung: TIGERGraphViewer 4. Suche, Retrieval: TIGERSearch s. TIGER-Beispiele von vorne versch. Exportformate (jpg, pdf, svg,...) läuft unter Microsoft Windows UNIX (Linux, Solaris, Mac OS X) verschiedene Importformate NEGRA-Exportformat PennTreebank-Format (Klammerstruktur) TIGER-XML... -> TIGERSearch für eigene Korpora nutzbar

10 TIGERSearch graphische und textuelle Sucheingabe Visualisierung der Matches durch TIGERGraphViewer farbige Markierung des matchenden Teilbaums Export entweder als Bild via Viewer (jpg, pdf,svg,...) oder als Textdatei in TIGER-XML -> erlaubt weitere Verarbeitung der Matches (via XSLT etc.) 5. Demo Korpus-Information Sucheingabe graphisch textuell, an CQP orientiert (Templates, Typen) Output Baum Frequenz-Tabelle 6. Interne Repräsentation: TIGER-XML Interface-Format für Import und Export Header-Information Korpusname und -beschreibung Autor, Datum, Format,... Feature-Deklaration Body-Information Baumstrukturen (Knoten, Kanten, Labels) ggf. matchender Subgraph TIGER-XML: Export via XSLT-Stylesheets Export von Tokens (satzweise) mit *-Markierung der matchenden Tokens mit POS TIGERSearch-Variablen mit ihren Features (Kategorie, POS,...) mit ihren Tokens Sätze im PennTreebank-Klammerformat die entsprechenden kontextfreien Regeln

11 Zusammenfassung TIGER-Korpus Eigenschaften Annotation Tools aus dem TIGER-Projekt TIGERGraphViewer TIGERSearch Anwendungen Suche Export

Überblick. VL: Einführung in die Korpuslinguistik. Annotation. Tokenbasierte Annotation

Überblick. VL: Einführung in die Korpuslinguistik. Annotation. Tokenbasierte Annotation Überblick VL: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2004 kurze Wiederholung syntaktische phonetische/phonologische Tokenbasierte pos-tagging & Lemmatisierung

Mehr

WS 2009/10 18.11.2009

WS 2009/10 18.11.2009 Übung 5 Vorbereitung Öffnen Sie einen Texteditor, z.b. Word, Emacs, Textedit etc. und legen Sie Ihre Antwortdatei an. Der Name der Antwortdatei sollte nach folgendem Schema aufgebaut sein: KL_ueb5_

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 Schütze & Zangenfeind: Konstituentensyntax

Mehr

. Syntaktische und semantische Annotation frühneuhochdeutscher Hexenverhörprotokolle. Fabian Barteld 29.11.2013

. Syntaktische und semantische Annotation frühneuhochdeutscher Hexenverhörprotokolle. Fabian Barteld 29.11.2013 .. Syntaktische und semantische Annotation frühneuhochdeutscher Hexenverhörprotokolle Fabian Barteld Fabian.Barteld@uni-hamburg.de 29.11.2013 Fabian Barteld Annotation frnhd. Hexenverhörprotokolle 29.11.2013

Mehr

fsq Ein Abfragesystem für syntaktisch annotierte Baumbanken

fsq Ein Abfragesystem für syntaktisch annotierte Baumbanken fsq Ein Abfragesystem für syntaktisch annotierte Baumbanken SFB 441, Universität Tübingen Syntaktisch annotierte Baumbanken Ursprünglich: Morphosyntaktische Tags (POS) Anreicherung mit syntaktischen Informationen

Mehr

XML als Beschreibungssprache syntaktisch annotierter Korpora

XML als Beschreibungssprache syntaktisch annotierter Korpora Sven Naumann XML als Beschreibungssprache syntaktisch annotierter Korpora In den letzten Jahren ist die Zahl der verfügbaren linguistisch annotierten Korpora ständig gewachsen. Zu den bekanntesten gehören

Mehr

Lemmatisierung. Einführung in die Korpuslinguistik. Lemmatisierung und Wortarttagging. Lemmatisierung. zum Erinnern... zum Erinnern...

Lemmatisierung. Einführung in die Korpuslinguistik. Lemmatisierung und Wortarttagging. Lemmatisierung. zum Erinnern... zum Erinnern... Lemmatisierung Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2007 zum Lemmatisieren braucht man also ein Lexikon, in dem die Lemmata mit ihrer Flexionsklasse

Mehr

Generierung & Übersetzung mit XLE

Generierung & Übersetzung mit XLE Generierung & Übersetzung mit XLE Grammatikentwicklung, SS 2010 1 /25 Worum es heute geht: Generierung mit XLE Übersetzung mit XLE 2 /25 Allgemein: Generierung Generierung ist: der Gegenbegriff zum Parsing

Mehr

Part of Speech Tagging. Linguistische Sicht. Carolin Deck

Part of Speech Tagging. Linguistische Sicht. Carolin Deck Part of Speech Tagging Linguistische Sicht Carolin Deck Gliederung 1. Begriffsklärung 2. Vorstellung zwei wichtiger Tagsets (STTS & PTTS) 3. Bedeutung des POS-Tagging für die Sprachwissenschaft 4. Tagzuweisung

Mehr

Projekt. Java-Anwendung für die Sequenzanalyse (Metagenomik und Transkriptomik)

Projekt. Java-Anwendung für die Sequenzanalyse (Metagenomik und Transkriptomik) Projekt Java-Anwendung für die Sequenzanalyse (Metagenomik und Transkriptomik) MHH Prof. Tümmler, Dr. Davenport FH Prof. Sprengel, Prof. Ahlers C. Davenport colindavengmail.com Version 27.09.2010 Spezifikation

Mehr

Merkmalsstrukturen. Merkmalsstrukturen. Merkmalsstrukturen (MS):

Merkmalsstrukturen. Merkmalsstrukturen. Merkmalsstrukturen (MS): (MS): Verbreiteter Formalismus in der Computerlinguistik. Ausführlich untersucht und beschrieben, (zumindest im Kern) auf MS basierende Ansätze: Categorical Unification Grammar [Uszkoreit, 1986] Functional

Mehr

Teil II: Phrasen und Phrasenstruktur

Teil II: Phrasen und Phrasenstruktur Teil II: Phrasen und Phrasenstruktur Übersicht: Grammatische Funktionen Kategorien Konstituenten & Strukturbäume Konstituententest Endozentrizität 1 Einfacher Satzbau Drei allgemeine Grundfragen der Syntax:

Mehr

Elementare statistische Methoden

Elementare statistische Methoden Elementare statistische Methoden Vorlesung Computerlinguistische Techniken Alexander Koller 28. November 2014 CL-Techniken: Ziele Ziel 1: Wie kann man die Struktur sprachlicher Ausdrücke berechnen? Ziel

Mehr

Linguistik für Kognitionswissenschaften

Linguistik für Kognitionswissenschaften Linguistik für Kognitionswissenschaften Computerlinguistik: Maschinelle Übersetzung Computerlinguistik Fehlübersetzung von engl. computational linguistics - computationelle Linguistik beinhaltet im weiteren

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax WS 2006/2007 Manfred Pinkal Einführung in die Computerlinguistik 2006/2007 M. Pinkal UdS 1 Morphologie und Syntax Gegenstand der Morphologie ist die Struktur

Mehr

Softwaretechnologie für die Ressourcenlinguistik

Softwaretechnologie für die Ressourcenlinguistik Tools und Frameworks FSU Jena Gliederung 1 Pipelines Formate 2 3 Übersicht Details Fazit Pipelines Formate Komponenten bilden eine Pipeline Text Sentence Splitter Tokenizer POS-Tagger Output Texte werden

Mehr

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK

Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Seminar Text- und Datamining Textmining-Grundlagen Erste Schritte mit NLTK Martin Hacker Richard Schaller Künstliche Intelligenz Department Informatik FAU Erlangen-Nürnberg 16.05.2013 Gliederung 1 Vorverarbeitung

Mehr

Informationsextraktion

Informationsextraktion Informationsextraktion Bestimmte Anwendungen bei der semantischen Verarbeitung erfordern keine tiefe linguistische Analyse mit exakter Disambiguierung (= eine einzige und korrekte Lesart). Hierzu gehört

Mehr

Formale Sprachen und Automaten: Tutorium Nr. 8

Formale Sprachen und Automaten: Tutorium Nr. 8 Formale Sprachen und Automaten: Tutorium Nr. 8 15. Juni 2013 Übersicht 1 Nachtrag 2 Besprechung von Übungsblatt 7 Aufgabe 1 Aufgabe 2 Aufgabe 3 3 CFG PDA Definitionen Ein Beispiel! Aufgabe 4 Der PDA als

Mehr

Korpusvorverarbeitung. Hauptseminar: Einführung in die Korpuslinguistik. Kodierung/Annotationsmaximen. Vorverarbeitung: erste Schritte.

Korpusvorverarbeitung. Hauptseminar: Einführung in die Korpuslinguistik. Kodierung/Annotationsmaximen. Vorverarbeitung: erste Schritte. Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Korpusvorverarbeitung Beispiel: DIE ZEIT aufbereitet für journalistische Zwecke, mitgeliefertes

Mehr

Äpfel. verkauft. Birnen PPER

Äpfel. verkauft. Birnen PPER TIGERSearch Ein Suchwerkzeug für Baumbanken Wolfgang Lezius Institut für Maschinelle Sprachverarbeitung Universität Stuttgart http://www.ims.uni-stuttgart.de/projekte/tiger Zusammenfassung In diesem Papier

Mehr

Vorlesung 7: LFG I. Einführung, c- und f-strukturen

Vorlesung 7: LFG I. Einführung, c- und f-strukturen Vorlesung 7: LFG I. Einführung, c- und f-strukturen Dozent: Gerold Schneider Übersicht Die Behandlung überkreuzender Abhängigkeiten Transformationen Diskontinuierliche Grammatiken Argumentskomposition

Mehr

Tutorial: Automatische Textannotation mit WebLicht

Tutorial: Automatische Textannotation mit WebLicht Tutorial: Automatische Textannotation mit WebLicht Inhalt 1. Was ist WebLicht?... 1 2. WebLicht starten... 1 3. Text importieren... 2 4. Verarbeitungsketten... 2 5. Wortarten- Tagging und Lemmatisierung...

Mehr

OpenChrom - die betriebssystemübergreifende Open-Source- Alternative zur ChemStation

OpenChrom - die betriebssystemübergreifende Open-Source- Alternative zur ChemStation OpenChrom - die betriebssystemübergreifende Open-Source- Alternative zur ChemStation Philip Wenig OpenChrom Kennen sie das Problem, dass sie mit der vorhandenen Software nicht die Auswertungen vornehmen

Mehr

Koordination in LFG und XLE

Koordination in LFG und XLE Koordination in LFG und XLE Grammatikentwicklung, SS 010 1 /1 Worum es heute geht: Koordinierte Strukturen Koordinierte NPs (sind speziell) /1 Einstieg: Vorschlag C-Struktur Beispiel: in the room and under

Mehr

Part-of-Speech- Tagging

Part-of-Speech- Tagging Part-of-Speech- Tagging In: Einführung in die Computerlinguistik Institut für Computerlinguistik Heinrich-Heine-Universität Düsseldorf WS 2004/05 Dozentin: Wiebke Petersen Tagging Was ist das? Tag (engl.):

Mehr

Einführung Computerlinguistik. Konstituentensyntax II

Einführung Computerlinguistik. Konstituentensyntax II Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 1 / 31 Take-away Phrasenstrukturgrammatik:

Mehr

LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora

LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora

Mehr

Tagging von Online-Blogs

Tagging von Online-Blogs Tagging von Online-Blogs Gertrud Faaß (vertreten durch Josef Ruppenhofer) STTS tagset and tagging: special corpora 24. September 2012 Faaß MODEBLOGS 1 Korpuslinguistische studentische Projekte am IwiSt

Mehr

SYNTAXANNOTATION. Theoretische Grundlagen und praktische Anwendung Am Beispiel Nebenläufige grammatische Verarbeitung.

SYNTAXANNOTATION. Theoretische Grundlagen und praktische Anwendung Am Beispiel Nebenläufige grammatische Verarbeitung. Seminararbeit SYNTAXANNOTATION Theoretische Grundlagen und praktische Anwendung Am Beispiel Nebenläufige grammatische Verarbeitung eingereicht von: Björn Metzinger Käppelistrasse 24 4600 Olten Tel.: 062/

Mehr

Finite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010

Finite-State-Morphologie in XLE. Grammatikentwicklung, SS 2010 Finite-State-Morphologie in XLE Grammatikentwicklung, SS 2010 1 / 20 Worum es heute geht: Nutzen von Finite-State-Morphologien... und wie man sie in XLE einbaut 2 / 20 Lexikon in XLE Bis jetzt: so genanntes

Mehr

Das Xerox Linguistics Environment (XLE) Ling 232 Maschinelle Übersetzung Dr. Heike Zinsmeister SS 2011

Das Xerox Linguistics Environment (XLE) Ling 232 Maschinelle Übersetzung Dr. Heike Zinsmeister SS 2011 Das Xerox Linguistics Environment (XLE) Ling 232 Maschinelle Übersetzung Dr. Heike Zinsmeister SS 2011 Hintergrund Übersicht Xerox Linguistics Environment (XLE) das Pargram-Projekt Lexical Functional Grammar

Mehr

Wortstellung nominaler Elemente im Mittelfeld

Wortstellung nominaler Elemente im Mittelfeld Wortstellung nominaler Elemente im Mittelfeld Untersuchung zur Stellung nominaler Elemente im deutschen Mittelfeld - Vortrag am 04.02.2004 - von: Olga Krasavina Stefan Träger Robert Lange Elena Briskina

Mehr

Spezielle Excel Eigenschaften mit ODS erstellen. 1 Übersicht der 'tagsets' und der Alternativen

Spezielle Excel Eigenschaften mit ODS erstellen. 1 Übersicht der 'tagsets' und der Alternativen Spezielle Excel Eigenschaften mit ODS erstellen Tipps & Tricks Frank Biedermann Grünenthal GmbH Zieglerstr. 6 52078 Aachen Frank.Biedermann@grunenthal.com Zusammenfassung Dieser Beitrag stellt Möglichkeiten

Mehr

Die Corpus Workbench und ihre Syntax. Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A.

Die Corpus Workbench und ihre Syntax. Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Die Corpus Workbench und ihre Syntax Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Die IMS Open Corpus Workbench (CWB) Mächtige Konkordanz- und Korpusanalyse-Software

Mehr

Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann

Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus 07.10.2014 LAUDATIO-Workshop Hagen Hirschmann Was ist ANNIS? ANNIS steht für ANNotation of Information Structure http://www.sfb632.uni-potsdam.de/d1/annis/

Mehr

FilterSurf. Einsatz, Funktionsweise und Komponenten

FilterSurf. Einsatz, Funktionsweise und Komponenten FilterSurf Einsatz, Funktionsweise und Komponenten OpenSource Internet-Inhaltsfilter auf Linux-Basis gefördert vom Bayerischen Ministerium für Unterricht und Kultus Weitere Informationen: www.filtersurf.de

Mehr

MetaQuotes Empfehlungen zum Gebrauch von

MetaQuotes Empfehlungen zum Gebrauch von MetaQuotes Empfehlungen zum Gebrauch von MetaTrader 4 auf Mac OS Auch wenn viele kommerzielle Angebote im Internet existieren, so hat sich MetaQuotes, der Entwickler von MetaTrader 4, dazu entschieden

Mehr

How to: Verwendung des Partitur-Editors mit geschriebenen Daten

How to: Verwendung des Partitur-Editors mit geschriebenen Daten How to: Verwendung des Partitur-Editors mit geschriebenen Daten Dieses Dokument erläutert die Verwendung vom EXMARaLDA Transkriptions-Editor bei der Arbeit mit geschriebenen Daten. Diese Anweisungen gelten

Mehr

Betriebshandbuch. MyInTouch Import Tool

Betriebshandbuch. MyInTouch Import Tool Betriebshandbuch MyInTouch Import Tool Version 2.0.5, 17.08.2004 2 MyInTouch Installationshandbuch Inhaltsverzeichnis Inhaltsverzeichnis... 2 Bevor Sie beginnen... 3 Einleitung...3 Benötigte Daten...3

Mehr

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 24.11.2014, 9 c.t. Zangenfeind: Morphologie 1 / 18 Wdh.: Klassifizierung

Mehr

Ziele und Herausforderungen

Ziele und Herausforderungen Ziele und Herausforderungen Text soll automatisch aus einer Quellsprache in eine Zielsprache übertragen werden Dabei soll die Funktion des Textes erhalten bleiben Es werden sowohl computerlinguistische

Mehr

Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge

Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge Korpuslinguistik in der linguistischen Lehre Erfolge und Misserfolge 18. Januar 2011 D-Spin Workshop, BBAW, Berlin Inhalt Ideen und Resultate Hoffnungen und Enttäuschungen Bedürfnisse und Probleme Ausblick

Mehr

NetMan Desktop Manager Quick-Start-Guide

NetMan Desktop Manager Quick-Start-Guide NetMan Desktop Manager Quick-Start-Guide In diesem Dokument wird die Installation von NetMan Desktop Manager beschrieben. Beachten Sie, dass hier nur ein Standard-Installationsszenario beschrieben wird.

Mehr

Eine Alternative: StarOffice 6.0

Eine Alternative: StarOffice 6.0 Eine Alternative: StarOffice 6.0 "Die voll ausgestattete Büro-Komplettsoftware" Michaela Hering, 5.11.2002 1 Information Überblick StarOffice 6.0 integriert Textverarbeitung mit HTML-Editor Tabellenkalkulation

Mehr

ATHOS Benutzertreffen

ATHOS Benutzertreffen ATHOS Benutzertreffen Report of the Lab Glashütten, 10. November 2010 HighQSoft GmbH, Karst Schaap karst.schaap@highqsoft.de www.highqsoft.de / www.highqsoft.com 10 November 2010-1 Themen Aktueller Stand

Mehr

Event Recognition Engine

Event Recognition Engine Event Recognition Engine Eine Analysis Engine im UIMA Framework Hauptseminar Information Retrieval Tobias Beck 10.01.2011 2 Übersicht: Einordnung UIMA Komponenten einer UIMA Pipeline Selbst erstellte Event

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax II WS 2008/2009 Manfred Pinkal Morphologie und Syntax Gegenstand der Morphologie ist die Struktur des Wortes: der Aufbau von Wörtern aus Morphemen, den kleinsten

Mehr

Kurzanleitung für die Import/Export Funktion Kinderleicht Produkte importieren und aktualisieren und exportieren

Kurzanleitung für die Import/Export Funktion Kinderleicht Produkte importieren und aktualisieren und exportieren Kurzanleitung für die Import/Export Funktion Kinderleicht Produkte importieren und aktualisieren und exportieren Sehr geehrter Online-Händler, damit Sie schnell mit Ihrem Onlineshop erfolgreich, möchten

Mehr

Bestellformular Messeaktion Rehab 2009

Bestellformular Messeaktion Rehab 2009 An Per Fax: 0228/97199-99 Bestellformular Messeaktion Rehab 2009 Phoenix Software GmbH, Adolf-Hombitzer-Straße 12, 53227 Bonn Tel.: 0228/97199-0; E-Mail: reha@phoenixsoftware.de Programme / Update Preis

Mehr

CIB INVOICE BEDIENUNGSANLEITUNG

CIB INVOICE BEDIENUNGSANLEITUNG > Technical Support & Services CIB INVOICE BEDIENUNGSANLEITUNG Technical Support & Services > Stand: 02. September 2014 Version 1.3 CIB software GmbH > Technical Support & Services > > Dokument DOKUMENT

Mehr

Optimierung des Business Service Monitoring durch Implementierung einer autonomen SMDB

Optimierung des Business Service Monitoring durch Implementierung einer autonomen SMDB Optimierung des Business Service Monitoring durch Implementierung einer autonomen SMDB Ingo Bruns, GAD eg Systems Management Leiter Monitoring, System Automation und Fernwartungssysteme; Produktmanager

Mehr

Kay-Michael Würzner Lothar Lemnitzer Bryan Jurish Alexander Geyken

Kay-Michael Würzner Lothar Lemnitzer Bryan Jurish Alexander Geyken Kollaborative Erstellung eines annotierten Korpus als Grundlage für die Anwendung statistischer Ansätze der automatischen Sprachverarbeitung auf internetbasierte Kommunikation Kay-Michael Würzner Lothar

Mehr

Visualisierung statistischer Daten 02.06.2010

Visualisierung statistischer Daten 02.06.2010 Visualisierung statistischer Daten 0.06.010 Lehrstuhl sozialwissenschaftliche Methodenlehre und Sozialstatistik Sebastian Jeworutzki Sebastian Jeworutzki Visualisierung statistischer Daten 0.06.010 1 Ablauf

Mehr

Arbeiten mit der Adressverwaltung Version / Datum V 1.0 / 13.08.2008

Arbeiten mit der Adressverwaltung Version / Datum V 1.0 / 13.08.2008 Software WISO Mein Geld Thema Arbeiten mit der Adressverwaltung Version / Datum V 1.0 / 13.08.2008 Das vorliegende Dokument gibt Ihnen Tipps zum Arbeiten mit der Software WISO Mein Geld, respektive der

Mehr

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der SS 2016: Grossmann, Jenko Die Beschreibung orientiert sich am Begriffssystem der Beschreibung natürlicher Sprachen Sprache in der steht

Mehr

Probabilistische kontextfreie Grammatiken

Probabilistische kontextfreie Grammatiken Mathematische Grundlagen III Probabilistische kontextfreie Grammatiken 14 Juni 2011 1/26 Ambiguität beim Parsing Wörter können verschiedene Bedeutungen haben und mehr als einer Wortkategorien angehören

Mehr

Computerlinguistische Verfahren und Theorien für die Textproduktion in der Technischen Redaktion. Melanie Siegel

Computerlinguistische Verfahren und Theorien für die Textproduktion in der Technischen Redaktion. Melanie Siegel Computerlinguistische Verfahren und Theorien für die Textproduktion in der Technischen Redaktion Melanie Siegel Produktion technischer Dokumente Verständlichkeit Lesbarkeit Übersetzbarkeit Konsistenz Rechtschreibung

Mehr

Handbuch für Android 1.5

Handbuch für Android 1.5 Handbuch für Android 1.5 1 Inhaltsverzeichnis 1 Leistungsumfang... 3 1.1 Über Boxcryptor Classic... 3 1.2 Über dieses Handbuch... 3 2. Installation... 5 3. Grundfunktionen... 5 3.1 Einrichtung von Boxcryptor

Mehr

Dr. Klaus Körmeier BlueBridge Technologies AG

Dr. Klaus Körmeier BlueBridge Technologies AG Dr. Klaus Körmeier BlueBridge Technologies AG Agenda Was ist ein SharePoint Wiki Anwendungsbeispiele und Erweiterungen Was ist beim Einsatz zu beachten Zusammenfassung Partner Partner BlueBridge AG SharePoint-Erfahrung

Mehr

General Architecture for Text Engineering - GATE

General Architecture for Text Engineering - GATE General Architecture for Text Engineering - GATE basierend auf dem GATE-Benutzerhandbuch sowie dem Tutorial des CLab-Teams der Universität Zürich 3. Juni 2011 1 1 Lernziele Grundkenntnisse in GATE Development

Mehr

IGEL UMS. Universal Management Suite. Oktober 2011. Florian Spatz Product Marketing Manager

IGEL UMS. Universal Management Suite. Oktober 2011. Florian Spatz Product Marketing Manager IGEL UMS Oktober 2011 Universal Management Suite Florian Spatz Product Marketing Manager Agenda Übersicht Update-Prozess Zusätzliche Funktionen ÜBERSICHT Übersicht Kategorie Remote Management Lösung Eigenschaften:

Mehr

Intelligente Recherchestrategien für e-humanities Universität Duisburg-Essen

Intelligente Recherchestrategien für e-humanities Universität Duisburg-Essen Intelligente Recherchestrategien für e-humanities Universität Duisburg-Essen Softwaretest TIGERSearch Version 2.1 TIGERSearch ist ein Korpussuchwerkzeug, ein Hilfsprogramm zur Untersuchung syntaktisch

Mehr

Grundlagen der Extensible Stylesheet Language

Grundlagen der Extensible Stylesheet Language Grundlagen der Extensible Stylesheet Language Transformations (XSLT) Marc Monecke monecke@informatik.uni-siegen.de Praktische Informatik Fachbereich Elektrotechnik und Informatik Universität Siegen, D-57068

Mehr

Einrichtungsanleitungen Hosted Exchange 2013

Einrichtungsanleitungen Hosted Exchange 2013 Hosted Exchange 2013 Inhalte Wichtiger Hinweis zur Autodiscover-Funktion...2 Hinweis zu Windows XP und Office 2003...2 Hosted Exchange mit Outlook 2007, 2010 oder 2013...3 Automatisch einrichten, wenn

Mehr

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Thomas Vanck

Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen. NLP-Pipeline. Tobias Scheffer Thomas Vanck Universität Potsdam Institut für Informatik Lehrstuhl Maschinelles Lernen NLP-Pipeline Tobias Scheffer Thomas Vanck NLP-Pipeline Folge von Verarbeitungsschritten für Informationsextraktion, Übersetzung,

Mehr

DocuWare unter Windows 7

DocuWare unter Windows 7 DocuWare unter Windows 7 DocuWare läuft unter dem neuesten Microsoft-Betriebssystem Windows 7 problemlos. Es gibt jedoch einige Besonderheiten bei der Installation und Verwendung von DocuWare, die Sie

Mehr

Installationsleitfaden bdf Process Control Center (PCC) 60

Installationsleitfaden bdf Process Control Center (PCC) 60 1 Einführung Diese Dokumentation beschreibt, wie Sie das bdf Process Control Center (PCC) Release 60 in einer SAP ECC60 EhP0, EhP2 oder EhP3 Umgebung installieren können. 2 Installationsvoraussetzungen

Mehr

EINFÜHRUNG IN DIE GERMANISTISCHE LINGUISTIK KAPITEL 4: SYNTAX LÖSUNGEN

EINFÜHRUNG IN DIE GERMANISTISCHE LINGUISTIK KAPITEL 4: SYNTAX LÖSUNGEN Bitte beachten Sie, dass an verschiedenen Stellen auch andere Lösungen denkbar sind. Ich habe versucht, die Lösungen ausführlicher zu formulieren; das soll aber nicht bedeuten, dass auch Ihre Lösungen

Mehr

GanttProject ein open source Projektmanagementtool

GanttProject ein open source Projektmanagementtool Professionelles Projektmanagement in der Praxis GanttProject ein open source Projektmanagementtool Referenten: Felix Steeger & Matthias Türk Team 6 Agenda I. Was ist GanttProject? II. Download & Installation

Mehr

Minimalistische Morphologie

Minimalistische Morphologie Minimalistische Morphologie minimalistisch: basiert auf wenigen Prinzipien befasst sich mit flektierten Wortformen und deren Rolle in der Syntax Basis-Annahmen 1. keine abstrakten Morpheme 2. maximale

Mehr

32.4 Anpassen von Menüs und Symbolleisten 795i

32.4 Anpassen von Menüs und Symbolleisten 795i 32.4 Anpassen von Menüs und Symbolleisten 795i Fortsetzung der Seiten in der 8. Auflage 32.4 Anpassen von Menüs und Symbolleisten 32.4.1 Anpassen von Menüs Die Menüs können um folgende Typen von Optionen

Mehr

NetDocu 3.0. Automatische Netzwerk-Dokumentation und Asset-Management.

NetDocu 3.0. Automatische Netzwerk-Dokumentation und Asset-Management. Automatische. Kurzer Überblick NetDocu - automatische Netzwerkdokumentation Inventarisierung und Asset-Management NetDocu ist das ideale Tool für Administratoren, IT-Mitarbeiter, Datenschutzbeauftragte

Mehr

Binäre Bäume Darstellung und Traversierung

Binäre Bäume Darstellung und Traversierung Binäre Bäume Darstellung und Traversierung Name Frank Bollwig Matrikel-Nr. 2770085 E-Mail fb641378@inf.tu-dresden.de Datum 15. November 2001 0. Vorbemerkungen... 3 1. Terminologie binärer Bäume... 4 2.

Mehr

MetaQuotes Empfehlungen zum Gebrauch von MetaTrader 4 auf Mac OS

MetaQuotes Empfehlungen zum Gebrauch von MetaTrader 4 auf Mac OS MetaQuotes Empfehlungen zum Gebrauch von MetaTrader 4 auf Mac OS Auch wenn viele kommerzielle Angebote im Internet existieren, so hat sich MetaQuotes, der Entwickler von MetaTrader 4, dazu entschieden

Mehr

Proseminar Linguistische Annotation

Proseminar Linguistische Annotation Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 51 Überblick über verschiedene Arten linguistischer

Mehr

AS-Call / Ecotalk Online-Meetings Anleitung & Systemvoraussetzungen, 2015

AS-Call / Ecotalk Online-Meetings Anleitung & Systemvoraussetzungen, 2015 AS-Call / Ecotalk Online-Meetings Anleitung & Systemvoraussetzungen, 2015 Anleitung für Webkonferenzen - Die wichtigsten Infos auf einen Blick Online-Meetings, Online-Beratungen und Webinare Der Weg zur

Mehr

Vorlesung: Lexikalisch Funktionale Grammatik Christian Fortmann Universität Zürich Sommersemester 2005

Vorlesung: Lexikalisch Funktionale Grammatik Christian Fortmann Universität Zürich Sommersemester 2005 Vorlesung: Lexikalisch Funktionale Grammatik 01.04.2005 Christian Fortmann Universität Zürich Sommersemester 2005 I. Lexikalisch Funktionale Grammatik - Repräsentationen Generative Theorien Die Lexikalisch

Mehr

HEALTH Institut für Biomedizin und Gesundheitswissenschaften

HEALTH Institut für Biomedizin und Gesundheitswissenschaften HEALTH Institut für Biomedizin und Gesundheitswissenschaften Konzept zur Verbesserung eines klinischen Information Retrieval Systems unter Verwendung von Apache UIMA und medizinischen Ontologien Georg

Mehr

Parsing-EinfŸhrung Ð 1

Parsing-EinfŸhrung Ð 1 Parsing-EinfŸhrung bersicht Falsifizierbarkeit, oder: Sind Grammatiken wissenschaftlich? Grammatik, Formalismus Kontextfreie Grammatiken Ableitungen Ziel Verstehen der linguistischen Motivation Intuitives

Mehr

Windows 8... 2. Verbindung mit WLAN BZPflege trennen... 29 Verbindung mit WLAN EDU-BZPflege automatisch erstellen... 30

Windows 8... 2. Verbindung mit WLAN BZPflege trennen... 29 Verbindung mit WLAN EDU-BZPflege automatisch erstellen... 30 WLAN EDU-BZPflege INHALTSVERZEICHNIS Windows 8... 2 Verbindung mit WLAN BZPflege trennen... 2 Verbindung mit WLAN EDU-BZPflege automatisch erstellen... 3 Verbindung mit WLAN EDU-BZPflege manuell erstellen...

Mehr

teamspace TM Outlook Synchronisation

teamspace TM Outlook Synchronisation teamspace TM Outlook Synchronisation Benutzerhandbuch teamsync Version 1.4 Stand Dezember 2005 * teamspace ist ein eingetragenes Markenzeichen der 5 POINT AG ** Microsoft Outlook ist ein eingetragenes

Mehr

Warenwirtschaft, Artikelverwaltung und Mehrlagerverwaltung

Warenwirtschaft, Artikelverwaltung und Mehrlagerverwaltung Warenwirtschaft, Artikelverwaltung und Mehrlagerverwaltung Inhalt Artikelanlage und Stückliste... 2 Einzelbuchung, Setbuchung... 3 Verkauf im Internet und POS... 4 Lagerstände und Dokumente... 4 Ressourcen

Mehr

Theoretische Informatik I

Theoretische Informatik I Theoretische nformatik inheit 3 Kontextfreie Sprachen 1. Kontextfreie Grammatiken 2. Pushdown Automaten 3. igenschaften kontextfreier Sprachen Theoretische nformatik inheit 3.1 Kontextfreie Grammatiken

Mehr

Spezielle Themen der KI. NLP Natural Language Processing Parsing

Spezielle Themen der KI. NLP Natural Language Processing Parsing Spezielle Themen der KI NLP Natural Language Processing Parsing Parsing Strategien top-down: Ausgehend von S Hypothesenbildung und Verifikation anhand der Grammatikregeln Ersetzung nicht-terminaler Symbole

Mehr

CSV-Import von Zählerständen im Energiesparkonto

CSV-Import von Zählerständen im Energiesparkonto CSV-Import von Zählerständen im Energiesparkonto (Stand: 20. März 2013) Inhalt 1. Einleitung... 2 2. Schritt für Schritt... 3 3. Für Spezialisten: die Zählerstände-CSV-Datei... 4 3.1. Allgemeiner Aufbau

Mehr

Auftragsdatei. aufpos_bezug K AN(50) Bezugsnummer zur Position z.b. Lieferschein-Nr. bem K AN(100) Bemerkung zum Auftrag

Auftragsdatei. aufpos_bezug K AN(50) Bezugsnummer zur Position z.b. Lieferschein-Nr. bem K AN(100) Bemerkung zum Auftrag 1. Schnittstelle Auslageraufträge 1.1. Allgemeines Neben der Erfassung der Auslageraufträge per Dialog ("Auslagerung nach FIFO" oder "Auslagerung manuell") können Auslageraufträge auch per Schnittstelle

Mehr

Whitepaper. Produkt: combit List & Label 16. List & Label Windows Azure. combit GmbH Untere Laube 30 78462 Konstanz

Whitepaper. Produkt: combit List & Label 16. List & Label Windows Azure. combit GmbH Untere Laube 30 78462 Konstanz combit GmbH Untere Laube 30 78462 Konstanz Whitepaper Produkt: combit List & Label 16 List & Label Windows Azure List & Label Windows Azure - 2 - Inhalt Softwarevoraussetzungen 3 Schritt 1: Neues Projekt

Mehr

Portable Software-Installation mit pkgsrc

Portable Software-Installation mit pkgsrc Portable Software-Installation mit pkgsrc Dipl.-Chem. Technische Fakultät Universität Bielefeld ro@techfak.uni-bielefeld.de AG Rechnerbetrieb SS 2006 pkgsrc 1 von 12 Übersicht Problemstellung Benutzersicht

Mehr

Theoretische Informatik I

Theoretische Informatik I Theoretische Informatik I Einheit 2.4 Grammatiken 1. Arbeitsweise 2. Klassifizierung 3. Beziehung zu Automaten Beschreibungsformen für Sprachen Mathematische Mengennotation Prädikate beschreiben Eigenschaften

Mehr

SCRIBUS WORKSHOP Handout Gimp

SCRIBUS WORKSHOP Handout Gimp SCRIBUS WORKSHOP Handout Gimp 1 Ziele des Workshops Was ist Gimp? Was kann ich mit Gimp machen? Wie erstelle ich ein Bild für Scribus? Wie erstelle ich eine Vektorgrafik für Scribus? Varia? 2 Was ist Gimp?

Mehr

Export-/Importanleitung für Citavi und EndNote

Export-/Importanleitung für Citavi und EndNote Export-/Importanleitung für Citavi und EndNote 1. Export aus Datenbanken und Bibliothekskatalogen Literaturdatenbanken und Bibliothekskataloge bieten Ihnen in der Regel die Möglichkeit an, gefundene Aufsätze

Mehr

Software für den Kurs

Software für den Kurs Software für den Kurs das Korpus wird auf der Kurshomepage zur Verfügung gestellt Emu Speech Database System erhältlich unter http://emu.sourceforge.net/index.shtml Ausgangsmaterial: Sprachdatenbank, die

Mehr

MetaQuotes Empfehlungen zum Gebrauch von MetaTrader 5 auf Mac OS

MetaQuotes Empfehlungen zum Gebrauch von MetaTrader 5 auf Mac OS MetaQuotes Empfehlungen zum Gebrauch von MetaTrader 5 auf Mac OS Auch wenn viele kommerzielle Angebote im Internet existieren, so hat sich MetaQuotes, der Entwickler von MetaTrader 5, dazu entschieden

Mehr

2. Word-Dokumente verwalten

2. Word-Dokumente verwalten 2. Word-Dokumente verwalten In dieser Lektion lernen Sie... Word-Dokumente speichern und öffnen Neue Dokumente erstellen Dateiformate Was Sie für diese Lektion wissen sollten: Die Arbeitsumgebung von Word

Mehr

Kontextfreie Grammatiken

Kontextfreie Grammatiken Kontextfreie Grammatiken Vorlesung Computerlinguistische Techniken Alexander Koller 16. Oktober 2015 Übersicht Worum geht es in dieser Vorlesung? Übungen und Abschlussprojekt Kontextfreie Grammatiken Computerlinguistische

Mehr

Linux I II III Res WN/TT NLTK XML Weka E XML BNC XSLT BNC/XML 7 BNC/XML XML BNC XSLT. Ressourcen-Vorkurs

Linux I II III Res WN/TT NLTK XML Weka E XML BNC XSLT BNC/XML 7 BNC/XML XML BNC XSLT. Ressourcen-Vorkurs BNC/XML 7 BNC/XML XML BNC XSLT extensible Markup Language I XML erlaubt es, strukturierte Daten in Textdateien zu speichern. Zum Schreiben und Lesen von XML-Dateien genügen einfache Text-Editoren wie Emacs

Mehr

QMS-Zertifizierung LDT-Befund-Verarbeitung

QMS-Zertifizierung LDT-Befund-Verarbeitung Concordiastraße 10 50169 Kerpen E-Mail: service@qms-standards.de WWW: www.qms-standards.de QMS-Zertifizierung LDT-Befund-Verarbeitung Ablaufbeschreibung zum Zertifizierungsprozess [QMS_CERT_LDT_Ablauf]

Mehr