Florian Zipser Humboldt-Universität zu Berlin
|
|
- Max Egger
- vor 5 Jahren
- Abrufe
Transkript
1 Humboldt-Universität zu Berlin LAUDATIO Workshop
2 Heterogene Domäne Linguistische Daten und Phänomene erfordern viele Annotationsarten Morphologie 2
3 Heterogene Domäne Linguistische Daten und Phänomene erfordern viele Annotationsarten Morphologie Syntax 3
4 Heterogene Domäne Linguistische Daten und Phänomene erfordern viele Annotationsarten Morphologie Koreferenz Syntax 4
5 Heterogene Domäne Linguistische Daten und Phänomene erfordern viele Annotationsarten Morphologie Koreferenz Syntax Rhetorische Strukturen 5
6 Heterogene Domäne Linguistische Daten und Phänomene erfordern viele Annotationsarten Morphologie Koreferenz Syntax Gesprochene Daten Rhetorische Strukturen 6
7 Heterogene Domäne Linguistische Daten und Phänomene erfordern viele Annotationsarten Morphologie Koreferenz Dialoge Syntax Gesprochene Daten Rhetorische Strukturen 7
8 Heterogene Domäne Linguistische Daten und Phänomene erfordern viele Annotationsarten Morphologie Unterschiedliche Sprachen Koreferenz Dialoge Syntax Gesprochene Daten Rhetorische Strukturen 8
9 Heterogene Domäne Linguistische Daten und Phänomene erfordern viele Annotationsarten Morphologie Unterschiedliche Sprachen Koreferenz Dialoge Verschiedene Syntax Sprachstufen Gesprochene Daten Rhetorische Strukturen 9
10 Heterogene Domäne Viele Tools, um Daten zu bearbeiten: Manuelle Annotationstools semi-automatische Annotationstools Automatische Annotationstools Suchtools Visualisierungstools 10
11 Heterogene Domäne Viele Tools, um Daten zu bearbeiten: EXMARaLDA Praat ELAN Tiger search ANNIS TrED Parser (Berkley, MALT, ) Arborator Toolbox Synpathie TreeTagger Weblicht MMAX2 RST UIMA WebANNO ATOMIC UAM UIMA (dkpro,...)... 11
12 Heterogene Domäne Viele verschiedene Formate GATE XML ELAN format MMAX2 format TEI TreeTagger format Generic XML TextGrid TCF GrAF TigerXML ANNIS format UAM format Toolbox format PTB format EXMARaLDA format rs3 PAULA CoNLL UIMA CAS Negra MAF PML XLSX 12
13 Interoperabilität Problem 1: Interoperabilität Viele Tools gut, Nutzer können wählen Aber Tools können nur selten interagieren Primärdaten müssen mehrmals aufbereitet werden (Tokenisierung) 13
14 Mehrebenenkorpora Problem 2: Mehrebenenkorpora Annotation unterschiedlicher Annotationsarten (Morphologie, Syntax, Koreferenzen) erfordert defacto unterschiedliche Korpora Aber: wir brauchen ein Korpus, das alles enthält 14
15 Nachhaltigkeit Problem 3: Nachhaltigkeit Einige Tools werden nicht mehr weiterentwickelt Formate werden nicht weiter unterstützt Was ist mit den Daten??? 15
16 Nachhaltigkeit Nachhaltigkeit der Daten erfordert Nachhaltigkeit der Speicherung Im Web: HTML (W3C) Allgemeine Datenbeschreibung: XML (W3C), JSON Modellierung: UML/ XMI (OASIS) Freitext: PDF bzw. pdf-a 16
17 Nachhaltigkeit Es gibt ideen zur Standardisierung: TEI (TEI consortium) GrAF (ISO) MAF (ISO) SynAF/isoTiger (ISO) Aber nur wenige Tools arbeiten damit, z.t. Sehr komplex Unausgereift Standards oft jünger als Tool 17
18 Anforderungen Was wir brauchen: Übertragung alter Daten in neue Formate/ Standards (Nachhaltigkeit) Austausch der Daten zwischen unterschiedlichen Tools (Interoperabilität) Verschmelzen verschiedener Annotationsarten und -ebenen (Mehrebenenkorpora) 18
19 SaltNPepper Nachhaltigkeit: Format XXX TEI GrAF MAF SynAF 19
20 SaltNPepper Austausch: ELAN format EXMARaLDA format 20
21 SaltNPepper Austausch: ELAN format EXMARaLDA format EXMARaLDA format ELAN format 21
22 SaltNPepper Austausch: ELAN format EXMARaLDA format EXMARaLDA format ELAN format Praat format Praat format 22
23 SaltNPepper Austausch: ELAN format EXMARaLDA format EXMARaLDA format ELAN format Praat format Praat format PAULA PAULA TigerXML TigerXML ANNIS format ANNIS format
24 SaltNPepper Austausch: ELAN format EXMARaLDA format EXMARaLDA format ELAN format Praat format PAULA n²-n Mappings Jedes einzelne muss implementiert werden Praat format PAULA TigerXML TigerXML ANNIS format ANNIS format
25 SaltNPepper Austausch: ELAN format EXMARaLDA format EXMARaLDA format ELAN format Praat format PAULA TigerXML Gemeinsammes Modell Praat format PAULA TigerXML ANNIS format ANNIS format
26 SaltNPepper Austausch: ELAN format EXMARaLDA format EXMARaLDA format ELAN format Praat format PAULA TigerXML ANNIS format Gemeinsames Modell Reduzierung auf 2n Mappings Praat format PAULA TigerXML ANNIS format
27 Salt Anforderungen an Metamodell: Tagsetunabhängig Beliebige Annotationsebenen Unterschiedliche Annotationsarten Theorieneutral 27
28 Salt Salt ist ein Graph? Ein Graph G= (V, E) mit: Einer Menge an Knoten V Einer Menge an Kanten E mit e= (v 1 V, v2 V) E. 28
29 Salt Ein Graph in der Linguistik? 29
30 Salt Ein Graph in der Linguistik? 30
31 Salt Ein Graph in der Linguistik? 31
32 Salt Ist das noch ein Graph? 32
33 Salt Und das? 33
34 Salt Oder das? 34
35 Salt Für Salt ja! 35
36 Salt Primärtext: Die Jugendlichen in Zossen wollen ein Musikcafé. 36
37 Salt Primärtext: Die Jugendlichen in Zossen wollen ein Musikcafé. 37
38 Salt Tokenisierung: t 1 t 2 t 1 t 2 t 3 t 4 t 5 t 6 t 7 0,4 5,16 17,19 20,26 27,33 34,37 38,47 Primärtext: Die Jugendlichen in Zossen wollen ein Musikcafé. 38
39 Salt Annotation: ART NN APPR NE VMFIN ART NN Tokenisierung: t 1 t 2 t 1 t 2 t 3 t 4 t 5 t 6 t 7 0,4 5,16 17,19 20,26 27,33 34,37 38,47 Primärtext: Die Jugendlichen in Zossen wollen ein Musikcafé. 39
40 Salt Annotation: Inf-Stat= new Inf-Stat= new Inf-Stat= new Mengen: s 1 s 2 s 3 Tokenisierung: t 1 t 2 t 1 t 2 t 3 t 4 t 5 t 6 t 7 0,4 5,16 17,19 20,26 27,33 34,37 38,47 Primärtext: Die Jugendlichen in Zossen wollen ein Musikcafé. 40
41 Salt Kanten: Tokenisierung: Primärtext: 41
42 Salt s 1 S SB HD OA Hierarchien: NP NK s 2 NK MNR AC s 14 NK PP NK s 3 NK NP Tokenisierung: t 1 t 2 t 1 t 2 t 3 t 4 t 5 t 6 t 7 0,4 5,16 17,19 20,26 27,33 34,37 38,47 Primärtext: Die Jugendlichen in Zossen wollen ein Musikcafé. 42
43 Salt Anforderungen an Metamodell: Tagsetunabhängig frei wählbare Attribut-Wert-Paare für Labels Beliebige Annotationsebenen unbegrenzte Anzahl an Labels Unterschiedliche Annotationsarten alles, was als Graph darstellbar ist Theorieneutral Semantikarmut, Salt kennt nur Zeichenketten 43
44 Pepper Pepper Converterframework Basiert auf Salt Nur eine Infrastruktur, die Arbeit machen die Plugins Pepper Salt SGraph SGraph SNode SNode SRelation SRelation Pepper module Pepper module Pepper module Pepper module TigerXML PAULA ANNIS
45 Pepper Drei Arten von Modulen: Importer: Format A Salt Manipulator: Salt Salt Exporter: Salt Format B PAULAImporter PAULA Salt ANNISExporter ANNIS format 45
46 Pepper Drei Arten von Modulen: Importer: Format A Salt Manipulator: Salt Salt Exporter: Salt Format B PAULAImporter PAULA Salt ANNISExporter ANNIS format Kombinierbarkeit TigerImporter TigerXML Salt ANNISExporter ANNIS format 46
47 Pepper Manipulation PAULAImporter PAULA Salt Manipulator (Sentencer) Salt ANNISExporter ANNIS format 47
48 Pepper Manipulation PAULAImporter PAULA Salt Manipulator (Sentencer) Salt ANNISExporter ANNIS format Kombinierbarkeit TigerImporter TigerXML Salt Manipulator (Sentencer) Salt ANNISExporter ANNIS format 48
49 Anforderungen Was wir brauchen: Übertragung alter Daten in neue Formate/ Standards (Nachhaltigkeit) Austausch der Daten zwischen unterschiedlichen Tools (Interoperabilität) Verschmelzen verschiedener Annotationsarten und -ebenen (Mehrebenenkorpora) 49
50 Mehrebenenkorpora Mehrebenenkorpora: verschiedene Annotationsarten gemeinsam durchsuchen und anzeigen 50
51 Mehrebenenkorpora Problem: es gibt nur wenige Mehrebenenannotationstools (bspw. WebAnno, ATOMIC) Idee: Verschmelzen der unterschiedlichen Formate (und somit der Ebenen) RS3 TigerXML CoNLL PTB 51
52 Mehrebenenkorpora Salt reduziert Merging zu Graphmerging new new new s 1 s 2 s 3 t 1 t 2 t 3 t 4 t 5 t 6 t 7 52
53 Mehrebenenkorpora Salt reduziert Merging zu Graphmerging new new new s 1 s 2 s 3 t 1 t 2 t 3 t 4 t 5 t 6 t 7 53
54 Mehrebenenkorpora Merger ist Plugin für Pepper (Manipulator) TigerImporter Merger TigerXML RSTImporter Salt Salt ANNISExporter ANNIS format rs3 Salt 54
55 Anforderungen Was wir brauchen: Übertragung alter Daten in neue Formate/ Standards (Nachhaltigkeit) Austausch der Daten zwischen unterschiedlichen Tools (Interoperabilität) Verschmelzen verschiedener Annotationsarten und -ebenen (Mehrebenenkorpora) 55
56 Fazit SaltNPepper Konvertierung von Korpora zwischen Formaten Erweiterbarkeit um neue Formate (Plugins) Open Source (Apache License 2.0) Öffentliche Plattform: GitHub
57 Fazit Nachhaltigkeit von Korpora, Formaten und Software hängt zusammen Problem: Projekte sind befristet! Oft stirbt Software nach Ende eines Projektes Verlust von Geld und Zeit 57
58 Fazit Nachhaltigkeit von Korpora, Formaten und Software hängt zusammen Problem: Projekte sind befristet! Oft stirbt Software nach Ende eines Projektes Verlust von Geld und Zeit Software braucht zum Überleben: Aktive Entwicklercommunity Open Source Öffentliche Plattform Gute Dokumentation 58
59 Danke für Ihre Aufmerksamkeit you the format monster Tiger PAULA ANNIS GrAF EXMARaLDA Pepper PTB TEI RST MMAX2 your weapon 59
60 Diese Folien wurden erstellt unter Verwendung von: Yuml Openclipart 60
Elektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen 2 und / 27der. und der Computerlinguistik
Elektronische Korpora in der Lehre Anwendungsbeispiele aus der theoretischen und der Linguistics Department Ruhr-University Bochum 18.1.2011 DSPIN-Workshop Sprachressourcen in der Lehre Erfahrungen, Einsatzszenarien,
MehrModellierung von linguistischen Forschungsdaten. Kolloquium Korpuslinguistik Carolin Odebrecht Humboldt-Universität zu Berlin
Modellierung von linguistischen Forschungsdaten Kolloquium Korpuslinguistik 13.11.2013 Carolin Odebrecht Humboldt-Universität zu Berlin Überblick 1. Forschungskontext 2. Forschungsfrage 3. Anwendungsbereich
MehrLAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora
LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora
MehrHerausforderungen in der Nutzung vorhandener Tools für arabische Daten
Herausforderungen in der Nutzung vorhandener Tools für arabische Daten Tillmann Feige und Alicia González Vorgehen 1 Hintergründe & Workflow 2 Die Annotation 2.1 Anforderungen 3 Visualisierung 3.1 Anforderungen
MehrVom digitalen Hausmeister zum international vernetzten Forschungsdatenzentrum. Die Entwicklung der digitalen Infrastruktur des
Vom digitalen Hausmeister zum international vernetzten Forschungsdatenzentrum. Die Entwicklung der digitalen Infrastruktur des Daniel Jettka, Hanna Hedeland, Timm Lehmberg 16.09.2015 1 Struktur und Profil
MehrLAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora
LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora
MehrANGEWANDTE LINGUISTISCHE DATENVERARBEITUNG PROF. DR. JÜRGEN ROLSHOVEN UTE WINKELMANN
ANGEWANDTE LINGUISTISCHE DATENVERARBEITUNG PROF. DR. JÜRGEN ROLSHOVEN 15.02.2016 UTE WINKELMANN EINLEITUNG Akronym: Text Engineering Software Laboratory Virtuelle Arbeitsumgebung für textprozessierende
MehrFürstinnenkorrespondenzen Experiment einer Nachnutzung. Stefan Dumont, Berlin
Fürstinnenkorrespondenzen Experiment einer Nachnutzung Stefan Dumont, Berlin Ressource Frühneuzeitliche Fürstinnenkorrespondenzen im mitteldeutschen Raum Ziel: Kulturhistorisch bedeutsame Korrespondenzen
MehrLAUDATIO-Repository für Anwender. Carolin Odebrecht Humboldt-Universität zu Berlin LAUDATIO-repository.org
LAUDATIO-Repository für Anwender Carolin Odebrecht Humboldt-Universität zu Berlin LAUDATIO-repository.org Arbeiten mit (historischen) Fragen, die oft gestellt werden: Korpora Wo finde ich Korpora aus dem
MehrSeminar für Sprachwissenschaft Werkzeuge und Ressourcen am Seminar für Sprachwissenschaft der Universität Tübingen
Seminar für Sprachwissenschaft Werkzeuge und Ressourcen am Seminar für Sprachwissenschaft der Universität Tübingen Kathrin Beck, Christopher Culy, Erhard Hinrichs KobRA Kick-off-Meeting, 16. November 2012
MehrExposé zur Diplomarbeit Entwicklung eines (Meta-)Modells für linguistisch annotierte Daten
Exposé zur Diplomarbeit Entwicklung eines (Meta-)Modells für linguistisch annotierte Daten Betreuer: Ulf Leser Anke Lüdeling Autor: email: Florian Zipser zipser@informatik.hu-berlin.de 1 1 Motivation Die
MehrGenerischer Modellvergleich mit EMF Compare
Fakultät Informatik Hauptseminar Technische Informationssysteme SS2010 Generischer Modellvergleich mit EMF Betreuer: Dipl.-Inf. Uwe Ryssel Dresden, 16.07.2010 Gliederung 1. Motivation 2. Eclipse Modeling
MehrGliederung. Das TIGER-Korpus: Annotation und Exploration. TIGER-Korpus. 1. TIGER-Korpus. entstanden im Projekt TIGER (1999 heute) beteiligte Institute
Das TIGER-Korpus: Annotation und Exploration Stefanie Dipper Forschungskolloquium Korpuslinguistik, 11.11.03 Gliederung 1. TIGER-Korpus 2. Annotation 3. Visualisierung 4. Suche, Retrieval 5. Demo 6. Repräsentation
MehrTutorial: Automatische Textannotation mit WebLicht
Tutorial: Automatische Textannotation mit WebLicht Inhalt 1. Was ist WebLicht?... 1 2. WebLicht starten... 1 3. Text importieren... 2 4. Verarbeitungsketten... 2 5. Wortarten- Tagging und Lemmatisierung...
MehrCLARIN-D. Überblick, Metadaten, Demo. Christoph Kuras. Abt. Automatische Sprachverarbeitung Institut für Informatik, Universität Leipzig
CLARIN-D Überblick, Metadaten, Demo Christoph Kuras Abt. Automatische Sprachverarbeitung Institut für Informatik, Universität Leipzig Institut für Informatik 1 CLARIN: Common Language Resource and Technology
MehrStrukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs
Strukturelle und linguistische Annotation in historischen Textkorpora am Beispiel des Deutschen Textarchivs Susanne Haaf, Alexander Geyken, Bryan Jurish, Matthias Schulz, Christian Thomas, Frank Wiegand
MehrMotivation Grundlagen Technologien Manipulation Ecore Genmodell Demo Persistenz Notification Ausblick GMF Fazit / Quellen
Motivation Grundlagen Technologien Manipulation Ecore Genmodell Demo Persistenz Notification Ausblick GMF Fazit / Quellen Soll ich Modellieren oder Programmieren? sowohl als auch!!! Produktivitäts-Steigerung
MehrProseminar Linguistische Annotation
Proseminar Linguistische Annotation Ines Rehbein und Josef Ruppenhofer SS 2010 Ines Rehbein und Josef Ruppenhofer (SS10) Linguistische Annotation April 2010 1 / 22 Seminarplan I. Linguistische Annotation
MehrInhalt. " DiaGen Historie und Beschreibung. " Architektur eines DiaGen-Editors. " Hypergraphen. " DiaGen-Editoren Komponenten
DIAGEN Sven Goeckels Seminar : Visuelle Sprachen Universität Bremen FB Informatik WS 2001/2002 Inhalt " DiaGen Historie und Beschreibung " " Hypergraphen " DiaGen-Editoren Komponenten? Modeler? Reducer?
Mehrxii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis
Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....
MehrInhaltsverzeichnis. Bibliografische Informationen digitalisiert durch
Inhaltsverzeichnis 1 Computerlinguistik - Was ist das? 1 1.1 Aspekte der Computerlinguistik 1 1.1.1 Computer linguistik: Die Wissenschaft 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen 3 1.1.3
MehrGI-Fachgruppentreffen RE Weak-Words und ihre Auswirkung auf die Qualität von Anforderungsdokumenten. Jennifer Krisch Daimler AG
GI-Fachgruppentreffen RE Weak-Words und ihre Auswirkung auf die Qualität von Anforderungsdokumenten Jennifer Krisch Daimler AG Inhalte 1 Motivation 2 Was sind Weak-Words? 3 Vorgehen bei der Analyse 4 Evaluation
MehrIch baue ein eigenes Korpus
Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Ich baue ein eigenes Korpus Datengewinnung und aufbereitung Datengewinnung Das Untersuchungsinteresse bestimmt die benötigte
MehrVernetzung von Daten im Deutschen Textarchiv
Vernetzung von Daten im Deutschen Textarchiv Susanne Haaf, Matthias Boenig, Christian Thomas, Alexander Geyken, Bryan Jurish, Frank Wiegand Berlin-Brandenburgische Akademie der Wissenschaften/Deutsches
MehrXML Publisher die universelle Lösung für Geschäftsdokumente
XML Publisher die universelle Lösung für Geschäftsdokumente Jürgen Menge TSBU Middleware ORACLE Deutschland GmbH Moderne Lösung zur Entwicklung, Erzeugung und Verteilung von Geschäftsdokumenten (Output
MehrTechnik und Arbeitsablauf für FALKO
Peter Adolphs Emil Kroymann Technik und Arbeitsablauf für FALKO 1 Software 1.1 EXMARaLDA Partitur-Editor EXMARaLDA ist ein Annotationswerkzeug für linguistische Korpora. Es wurde von der Universität Hamburg
MehrCurrent Workflow. formatted. Rules. Extensions. Rules. DOM processing with Meta API-calls. Code Generation (Smarty) XMLfile. Source code.
Current Workflow Rules T1 Rules Extensions XMLfile DOM processing with Meta API-calls Model 1 T2 Model 2 Code Generation (Smarty) Source code PP formatted sourcecode DTD V1 Rules XMI 1/21 Anbindung eines
MehrEinladung zur Vortragsreihe
Philologische Fakultät - Institut für Romanistik Einladung zur Vortragsreihe Digital Humanities Theorie und Methodik Stefan Dumont Berlin-Brandenburgische Akademie der Wissenschaften ediarum eine digitale
MehrModellgetriebene Entwicklungsprozesse in der Praxis - eine Bestandsaufnahme. Tillmann Schall, anaptecs GmbH
Modellgetriebene Entwicklungsprozesse in der Praxis - eine Bestandsaufnahme Tillmann Schall, anaptecs GmbH : Agenda Grundlagen modellgetriebener Entwicklungsprozesse Schritte zur Einführung Erfahrungen
MehrTextual Gridicism Edieren mit TextGrid
Textual Gridicism Edieren mit TextGrid Florian Enders, Celia Krause, Philipp Vanscheidt (Universität Trier / Technische Universität Darmstadt) 18. Januar 2013 Digitale Rekonstruktionen mittelalterlicher
MehrZur Dokumentation von XÖV-Standards
2. XÖV-Anwenderkonferenz Zur Dokumentation von XÖV-Standards Frank Steimke, OSCI Leitstelle Bremen Bremen, 26./27. April Rathaus / Haus der Bürgerschaft Motivation Funktionsweise Fazit Warum kompliziert,
MehrDokumentation gesprochener Sprache. Ein erster Anfang. Dr. Tina John
Dokumentation gesprochener Sprache Ein erster Anfang Organisatorisches Dozent: Büro: LS 10 R.408 @ Tel.: 880-3323 E-Mail: tjohn@isfas.uni-kiel.de Ort: Exp.-phonetischer Übungsraum (LS-8 R.20/21) 2 Organisatorisches
MehrRessourcen in den GSHS... am Beispiel LEXUS
> Digitale Ressourcen in den GSHS... am Beispiel LEXUS GSHS LIBRARY CONFERENCE Florenz 10.11.2006 < Marc Kemps-Snijders, Jaqcuelijn Ringersma, Peter Wittenburg MPI for Psycholinguistics, Netherlands
MehrKorpusannotation: Vom nachhaltigen Aufbereiten einer Ressource
Korpusannotation: Vom nachhaltigen Aufbereiten einer Ressource Kerstin Eckart 18. Februar 2013 Kerstin Eckart 1 / 45 Übersicht Konzepte und Beispiele Vorgehen beim Aufbereiten einer Ressource Entscheidungen
MehrCentrum für Informations- und Sprachverarbeitung. Dr. M. Hadersbeck, Digitale Editionen, BAdW München
# 1 Digitale Editionen und Auszeichnungssprachen Computerlinguistische FinderApps mit Facsimile-Reader Wittgenstein s Nachlass: WiTTFind Goethe s Faust: GoetheFind Hadersbeck M. et. al. Centrum für Informations-
MehrMetadatenqualität und - interoperabilität
Metadatenqualität und - interoperabilität Jürgen Braun 16.03.2010 KIM Interoperabilität von Metadaten Probleme: Metadaten werden nicht nach einheitlichen Regeln und Standards erfasst Die einzelnen Communities
MehrGATE General Architecture for Text Engineering. Alexander Hein & Erik Dießler (VL Text Analytics - 08.05.2008)
GATE General Architecture for Text Engineering Alexander Hein & Erik Dießler (VL Text Analytics - 08.05.2008) Überblick GATE Die Idee Die Architektur Was noch - JAPE / DIFF / GUK ANNIE Einige Beispiele
MehrGIS im Berufsalltag Mapping, Analysen und Gewinnung von Geodaten mit QGIS, Smartphones und Google Earth Pro
7-tägiger Kompaktkurs GIS im Berufsalltag Mapping, Analysen und Gewinnung von Geodaten mit QGIS, Smartphones und Google Earth Pro t z t e J : U NE x. 3 S I G Q mit Ihr Kursleiter Dissertation Globale Sedimentfrachtsimulationen
MehrPoseidon for UML. Einführung. Andreas Blunk
Poseidon for UML Einführung Andreas Blunk Gliederung 1) Editionen/Lizenzen 2) Die Programmoberfläche 3) Modelle speichern 4) Einführung am lebenden Objekt 5) Generierung (Doc & Code) 6) Funktionsumfang
MehrBlockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus. und seine Aufbereitung
Blockseminar Einführung in die Korpuslinguistik Seminarleitung: Yvonne Krämer, M.A. Das Korpus und seine Aufbereitung Bestandteile eines Korpus sind i.d.r.: Primärdaten Metadaten Annotationen Annotationen
MehrMethoden zur Visualisierung von ereignisdiskreten Analysedaten
Fakultät Informatik, Institut für Angewandte Informatik, Professur Technische Informationssysteme Methoden zur Visualisierung von ereignisdiskreten Analysedaten Referent: Hendrik Freund Betreuer: Vladimir
MehrUnternehmensdokumente mit dem XML Publisher erzeugen
Unternehmensdokumente mit dem XML Publisher erzeugen Jürgen Menge TSBU Middleware ORACLE Deutschland GmbH XML-Publisher Moderne Lösung zur Entwicklung und Verteilung von Geschäftsdokumenten (Output Management)
MehrWerkzeugunterstützung für UML Profiles. Verteidigung des Großen Belegs Andreas Pleuß
Werkzeugunterstützung für UML Profiles Verteidigung des Großen Belegs Andreas Pleuß Aufgabenstellung Sammlung der Anforderungen an UML Profiles Untersuchung bestehender UML-CASE-Tool Unterstützung Untersuchung
MehrKollaboratives Editieren von XML-Dokumenten in P2P-Systemen
Seminar-Ringvorlesung Kollaboratives Editieren von XML-Dokumenten in P2P-Systemen Hamburg, 19. Januar 2007 Übersicht Einführung Szenario Themenbereiche Vergleich mit existierenden Projekten Weiteres Vorgehen
MehrPython VS Perl. Storage Monitoring per API statt SNMP. Björn Müller Marcel Denia. comnet GmbH
Python VS Perl Storage Monitoring per API statt SNMP comnet GmbH Björn Müller Marcel Denia comnet GmbH 13.09.2017 Agenda Über uns Ausgangssituation Umsetzung Python Umsetzung Perl??? 13.09.2017 comnet
MehrCommon Warehouse Metamodel und Imperfektion
Common Warehouse Metamodel und Imperfektion Christoph Goebel Imperfektion und erweiterte Konzepte im Data Warehousing 2 Fragestellungen Welche Bedeutung haben Metadaten in der Information Supply Chain
MehrWerkzeugunabhängigkeit bei der Modellierung Schwierigkeiten und mögliche Lösungsansätze
Werkzeugunabhängigkeit bei der Modellierung Schwierigkeiten und mögliche Lösungsansätze Oliver Hofrichter (hofrichter@tzi.de) Lars Hamann (lhamann@tzi.de) Überblick Motivation Kontext Warum Werkzeugunabhängigkeit
MehrEntwurf und Umsetzung eines Werkzeugs für die Fluchtwegplanung
Entwurf und Umsetzung eines Werkzeugs für die Fluchtwegplanung Diplomarbeit Christian Weiprecht Bauhaus-Universität Weimar Fakultät Bauingenieurwesen Professur CAD in der Bauinformatik Inhaltsübersicht
MehrNoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE
NoSQL Datenbanken EIN ÜBERBLICK ÜBER NICHT-RELATIONALE DATENBANKEN UND DEREN POTENTIALE IM ALLGEMEINEN UND IN DER INDUSTRIE Was bedeutet NoSQL? Ein Sammelbegriff für alternative Datenbanklösungen, die
MehrOverview. Motivation Learner text and target hypoteses correction of POS-tags parsing the target hypothesis TH1
Overview Motivation Learner text and target hypoteses correction of POS-tags parsing the target hypothesis TH1 Motivation up -to -date learner corpora allow us to investigate surface structure features
MehrEinfach generieren. Susanne Klar, Michael Klar. Generative Programmierung verständlich und praxisnah ISBN Inhaltsverzeichnis
Einfach generieren Susanne Klar, Michael Klar Generative Programmierung verständlich und praxisnah ISBN 3-446-40448-1 Inhaltsverzeichnis Weitere Informationen oder Bestellungen unter http://www.hanser.de/3-446-40448-1
MehrPostfuse Eclipse Plugin zum Visualisieren von Graphen. Bachelorpraktikum - Review 2 - Design Gruppe: G 222
Postfuse Eclipse Plugin zum Visualisieren von Graphen Bachelorpraktikum - Review 2 - Design 05.02.2007 Gruppe: G 222 Gliederung Design Überlegungen Architektur Use-Cases Realisierungen Stand der Dinge
MehrSeminar Document Engineering
Das OpenDocument-Format als Austauschformat 12.12.2006 Gliederung Problemstellung Gliederung Einstieg Gliederung Problemstellung Sie bewerben sich mit diesem Schreiben... Gliederung Problemstellung...
MehrPilotprojekt XPlanung LK Harz
Pilotprojekt XPlanung LK Harz + Ausgangssituation-Anforderungen an die Software + Ist-Stand der technischen Realisierung + wichtige Abläufe und Funktionen + zu erwartende Effekte + praktische Vorführung
Mehrdeegree: AIXM WFS und WPS Services - GML-Anwendungen im Aviation-Bereich -
AIXM WFS und WPS Services deegree: AIXM WFS und WPS Services - GML-Anwendungen im Aviation-Bereich - Markus Schneider, 19.03.2014 (schneider@m-click.aero) Flugplan Standardbasierte Geo-Verarbeitung im
MehrRIF-Import in APIS IQ-Software
RIF-Import in APIS IQ-Software Die Schnittstelle wurde im Rahmen eines Hochschul-Projektes entwickelt und zur Verfügung gestellt. Sie ermöglicht den Import von Daten im sog. RIF-Format 1. Dabei handelt
MehrTECHNISCH-ABSTRAKTE METADATEN FÜR DIE SUCHE NACH HISTORISCHEN KORPORA
Korpuslinguistik Humboldt-Universität zu Berlin TECHNISCH-ABSTRAKTE METADATEN FÜR DIE SUCHE NACH HISTORISCHEN KORPORA 05102015 1 Ich suche historische Texte, die in Fraktur gedruckt sind! Motivation Ich
MehrSpring IDE. Christian Dupuis - Spring 2.0 Release Party
Spring IDE Torsten Jürgeleit, J Christian Dupuis - Spring 2.0 Release Party Agenda? Überblick? Spring Beans Unterstü? Spring Web Flow Unterstü? Geplante Erweiterungen? Demonstration Überblick? Spring gibt
MehrWorkshop XU Betrieb / Potsdam
Workshop XU Betrieb 30.6. / 1.7.2010 Potsdam Workshop XU Betrieb 30.6. / 1.7.2010 in Potsdam Erfahrungen mit Umweltberichterstattungen aus verschiedenen Bereichen Umwelt Lüttgert Dipl.-Ing. Matthias Lüttgert
MehrMassenamtssignaturen. 2 Lösungsansätze. Thomas Rössler Wien, 25. März
Massenamtssignaturen 2 Lösungsansätze Inhalt Anforderungen Prinzipelle Lösungsansätze und Basismodule PDF-AS Ansatz: MOA-AS XML-DSig für Druckströme: MASS Zusammenfassung Inhalt Anforderungen Prinzipelle
MehrXML-based Reference Modelling - Foundations of an EPC Markup Language (EPML)
XML-based Reference Modelling - Foundations of an EPC Markup Language (EPML) Jan Mendling Wirtschaftsuniversität Wien Markus Nüttgens Universität des Saarlandes Seite 1 Gliederung XML und Referenzmodellierung
MehrIIIF in der DDB Ziele und Visionen
IIIF in der DDB Ziele und Visionen KIM Workshop 2018 Universität Mannheim, 10. und 11. April 2018 Michael Büchner Deutsche Digitale Bibliothek Project Koordination Technik Inhalt 1. Deutsch Digitale Bibliothek
MehrKorpora. Referenten Duyen Tao-Pham Nedyalko Georgiev
Korpora Referenten Duyen Tao-Pham Nedyalko Georgiev Hauptseminar: Angewandte Linguistische Datenverarbeitung (WS 11/12) Dozent: Prof. Dr. Jürgen Rolshoven Sprachliche Informationsverarbeitung Universität
MehrMetropolplaner - Standardisierung von Geodatenformaten und Datenaustausch Workshop III
Metropolplaner - Standardisierung von Geodatenformaten und Datenaustausch Workshop III Robert Krätschmer, GDI-Service Rostock Delmenhorst, 25.04.2018 Zusammenfassung Workshop II Zusammenfassung Workshop
MehrModellgetriebene Entwicklung von Pervasive Games
AW1 Vortrag von Hauke Wittern Modellgetriebene Entwicklung von Pervasive Games Entwicklung einer domänenspezifischen Sprache 09.12.2008 Agenda Motivation Pervasive Games Modellgetriebene Softwareentwicklung
MehrTool-Chain. Übung. Eclipse, SVN, Ant, Cobertura, Metrics Labor "Software Engineering Experiment" Sebastian Meyer und Kai Stapel
Tool-Chain Übung Eclipse, SVN, Ant, Cobertura, Metrics Labor "Software Engineering Experiment" 2009 Sebastian Meyer und Kai Stapel 05.05.2009 Überblick SVN Grundlagen SVN in Eclipse Ant in Eclipse Cobertura
MehrDBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität
DBMS für spezielle Anwendungen XML als Mittel der Datenbank-Interoperabilität Seminarvortrag von D. Zimmermann 26-Februar-2004 Gliederung Datenbanken und Interoperabilität Begriffe Bedarf Ansätze XML als
MehrEinsatz von Scalable Vector Graphics (SVG) zur Modellrepräsentation und -manipulation in Web-Anwendungen mit J2EE. Motivation und Zielsetzung
Einsatz von Scalable Vector Graphics (SVG) zur Modellrepräsentation und -manipulation in Web-Anwendungen mit J2EE www.arsnova.de Java Forum Stuttgart, 01. Juli 2004 1 Agenda SVG als Lösungsansatz SVG/J2EE-Technologiestudie
MehrXML für Prozesse, XML in Prozessen Erfahrungen aus der Praxis
XML für Prozesse, XML in Prozessen Erfahrungen aus der Praxis Gerhard Lier Produktmanager X4 BPM Suite SoftProject GmbH 1 SoftProject GmbH Eine kurze Vorstellung Das Unternehmen: Geschäftsführer: Hauptsitz:
MehrHandbuch für die Erweiterbarkeit
Handbuch für die Erweiterbarkeit Inhalt Pakete für die Erweiterbarkeit... 2 Actions... 2 Items... 2 Itemset... 2 Die UseCaseNewAction... 3 Eigene Shapes... 4 Der Shape Container... 5 User Objects... 6
MehrWir machen dann mal Digital Humanities Software - ein Erfahrungsbericht
Wir machen dann mal Digital Humanities Software - ein Erfahrungsbericht Julia Damerow, Arizona State University, A Place Called Up Consulting Dirk Wintergrün, Max-Planck-Institut für Wissenschaftsgeschichte
MehrWas ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora
Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik
MehrAutomatische Mailverschlüsselung für alle leicht gemacht mit pretty Easy privacy (p p)
pretty Easy privacy Automatische Mailverschlüsselung für alle leicht gemacht mit pretty Easy privacy (p p) DuD 2017, Berlin, 21.6.2017 Lösungstag Hernâni Marques p p foundation
MehrLangzeitarchivierungsaspekte. im Dokumentenlebenszyklus
Document Engineering Langzeitarchivierungsaspekte im enlebenszyklus Motivation Disziplin der Computer Wissenschaft, welche Systeme für e aller Formen und Medien erforscht. enlebenszyklus en Management
MehrFWP Aktuelle Technologien zur Entwicklung verteilter Java-Anwendungen. Sommersemester Michael Theis, Lehrbeauftragter 1
FWP Aktuelle Technologien zur Entwicklung verteilter Java-Anwendungen Sommersemester 2017 2017 Michael Theis, Lehrbeauftragter 1 2 Servlet API Websockets JSF JAX-WS JAX-RS JMS JAXB JSON-P JEE Enterprise
MehrTextGrid Arbeitsgruppen
TextGrid Arbeitsgruppen Eine Reihe von Arbeitsgruppen in TextGrid behandeln bestimmte Themengebiete und sichern die Arbeitspaket-übergreifende Diskussion. Sie arbeiten Themengebiete zur effizienten Informationsweitergabe
MehrQuellen des Neuen Die Integration von Ressourcen zur schulischen und universitären Bildung in die CLARIN-D-Infrastruktur
Quellen des Neuen Die Integration von Ressourcen zur schulischen und universitären Bildung in die CLARIN-D-Infrastruktur - Ein CLARIN-D Kurationsprojekt der F-AG Neuere Geschichte - Maret Keller, Christian
MehrDas Repositorium der TU Berlin für Forschungsdaten und Publikationen
DepositOnce Das Repositorium der TU Berlin für Forschungsdaten und Publikationen Pascal Becker Universitätsbibliothek 8. DINI-/nestor-Workshop Forschungsdatenrepositorien Inhalte sind, sofern nicht anders
MehrSpatial Data on the Web Geodaten für Jedermann Bereitstellung von Geobasisdaten über gängige Webtechnologien
Spatial Data on the Web Geodaten für Jedermann Bereitstellung von Geobasisdaten über gängige Webtechnologien Clemens Portele interactive instruments Typische Suche und Nutzung von Daten in einer GDI Öffnen
MehrTextGrid: Eine modulare Plattform für kooperative Textdatenverarbeitung
workshop: Perspektiven der Digital Humanities - 12. Oktober 2011, Würzburg TextGrid: Eine modulare Plattform für kooperative Textdatenverarbeitung Thomas Kollatz - Salomon Ludwig Steinheim-Institut für
MehrKorpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus LAUDATIO-Workshop Hagen Hirschmann
Korpuslinguistik Annis 3 -Korpussuchtool Linguistische Suchen im Ridges-Korpus 07.10.2014 LAUDATIO-Workshop Hagen Hirschmann Was ist ANNIS? ANNIS steht für ANNotation of Information Structure http://www.sfb632.uni-potsdam.de/d1/annis/
MehrProjektseminar "Texttechnologische Informationsmodellierung"
Projektseminar "Texttechnologische Informationsmodellierung" Ziel dieser Sitzung Nach dieser Sitzung sollten Sie: Einige standards und projekte vom Namen her kennen Einen Überblick über und einen Eindruck
MehrXML in der Praxis: Technische Dokumentation
XML in der Praxis: Technische Dokumentation Ulrike Schäfer INFOTAKT information design tekom Berlin Brandenburg Regionaltreffen 23.11.2001 Ulrike Schäfer. www.infotakt.de. Folie 1 Übersicht Problemstellung
MehrService Plattform Extrapol
Service Plattform Extrapol Rico.Apitz@init.de 14. Microsoft Polizeikongress Köln, 29. September 2009 1. Vorstellung Extrapol 2. PolizeiGenerator 3. PolizeiRepository 4. PolizeiGateway 5. Extrapol im Zentrum
MehrCon guration as Code Über Ansible Ansible Grundlagen Live Demo Weitere Informationen
ANSIBLE CONFIGURATION AS CODE METANOOK 2018 Tobias Mende @tobias_mende tobias-men.de 1 DAS ERWARTET EUCH Con guration as Code Über Ansible Ansible Grundlagen Live Demo Weitere Informationen 2 CONFIGURATION
MehrEclipse und EclipseLink
Eclipse und EclipseLink Johannes Michler Johannes.Michler@promatis.de PROMATIS, Ettlingen Zugriff auf Oracle Datenbanken aus Eclipse RCP Anwendungen via EclipseLink 18.09.2009 1 Gliederung Eclipse als
MehrModellgetriebene Softwareentwicklung: Zusammenfassung und Ausblick. 7. Februar 2013
Modellgetriebene Softwareentwicklung: Zusammenfassung und Ausblick 7. Februar 2013 Überblick Zusammenfassung: Generell: Konzepte der Softwaretechnik im Kontext der modellgetriebenen Entwicklung Diskussion
MehrArbeitsgemeinschaft Geodateninfrastruktur Südhessen. Taxonomie: Begriffs-ID (mit Verschachtelungstiefe)
Arbeitsgemeinschaft Geodateninfrastruktur Südhessen Taxonomie: Begriffs-ID (mit Verschachtelungstiefe) Startseite-Funktionsweise-Inhalte-Gliederung-NutzergruppenGrundlagen-Intro -Geodaten bisher:-geodaten
MehrComputerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus
MehrLinguisticsweb.org. Ressourcen für die Ausbildung in den Digital Humanities
Linguisticsweb.org Dr. Sabine Bartsch (Januar 2011) Ressourcen für die Ausbildung in den Digital Humanities Am Beispiel nachhaltiger Vermittlung von Kompetenzen für die linguistische und philologische
Mehr- Pflegestelle. OKSTRA Objekte im Straßenund Verkehrswesen. Dr. Jochen Hettwer
AS 1997 - Pflegestelle OKSTRA Objekte im Straßenund Verkehrswesen Dr. Jochen Hettwer Inhalt des Vortrages Der OKSTRA - Definition und Zielsetzung Die OKSTRA-Klassenbibliothek (OKLABI) Datentransformation
MehrGemeinsam mehr erreichen.
Gemeinsam mehr erreichen. Mavenize SOA Templates Nürnberg 19. November 2015 "Mit unserer Begeisterung für führende Technologien vernetzen wir Systeme, Prozesse und Menschen. EINFACH MEHR > BEGEISTERUNG
MehrNutzung von Hypergraph-Vervollständigungen zur Realisierung von Diagramm- Vervollständigungen und Editieroperationen
Nutzung von Hypergraph-Vervollständigungen zur Realisierung von Diagramm- Vervollständigungen und Editieroperationen Steffen Mazanek Universität der Bundeswehr München GTD 2008, 14.11.2008 Hypergraph-Vervollständigung
MehrDatenstrukturen und Algorithmen in Open Street Map. Modul: Algorithmische Geometire Von: Elisabeth Lehmann 12INB-P
Datenstrukturen und Algorithmen in Open Street Map Modul: Algorithmische Geometire Von: Elisabeth Lehmann 12INB-P Inhalte 1) Was ist OpenStreetMap? 2) Das Konzept 3) Datenstrukturen in OSM a) Node b) Way
MehrDocTales - The DITA Storys
DocTales - The DITA Storys Inhalt 2 Inhalt Wer wir sind...4 DITA... 5 Was ist DITA... 5 Etymologie... 5 Geschichte... 5 Philosophie... 5 DITA-OT... 6 Was ist das DITA-OT...6 Ausgabeformate...6 Publikation
MehrNutzenpotentiale von strukturierten E- Rechnungen aus Sicht der WKÖ Gerhard Laga, WKÖ, AK Leiter E-Billing AUSTRIAPRO
Nutzenpotentiale von strukturierten E- Rechnungen aus Sicht der WKÖ Gerhard Laga, WKÖ, AK Leiter E-Billing AUSTRIAPRO Agenda Aktuelle Zahlen vom österreichischen Markt Nutzenpotential der strukturierten
MehrDeutsches Forschungsnetz
Deutsches Forschungsnetz Informationen zur Nutzung des Adobe Connect Dienstangebots 19. Workshop des VCC Videkonferenzen im Wissenschaftsnetz TU Dresden, 05./06. Juli 2016 Christian Meyer, DFN-Verein,
Mehr