des ehumanities Desktops



Ähnliche Dokumente
Hachiman Digital Handscrolls

Die virtuelle Forschungsumgebung WissKI

Grundzüge und Vorteile von XML-Datenbanken am Beispiel der Oracle XML DB

Frühling für iphone-apps

Kooperatives Forschungsprojekt Online-Brief-Datenbank. Ein Beispiel für disziplinspezifische Anwendungen

GATE General Architecture for Text Engineering. Alexander Hein & Erik Dießler (VL Text Analytics )

Seminar Informationsintegration und Informationsqualität. Dragan Sunjka. 30. Juni 2006

Porsche auf der Überholspur Smarte Dokumente als entscheidender Wettbewerbsvorteil

IT SECURITY MANAGEMENT MIT ARIS CLOUD ENTERPRISE

MOBILE ON POWER MACHEN SIE IHRE ANWENDUNGEN MOBIL?!

Semantic Web Services

Mobiles SAP für Entscheider. Permanente Verfügbarkeit der aktuellen Unternehmenskennzahlen durch den mobilen Zugriff auf SAP ERP.

Internet/Intranet nutzbringend angewandt!?!

Die "Digital Humanities" - und was sie NICHT sind.

DevOps und Continuous Delivery. Von Release Automation bis zur Feedbackschleife. Matthias Zieger codecentric AG

Storage Area Networks im Enterprise Bereich

DW2004. XML-Datenimport in das SAP Business Information Warehouse bei Bayer Material Science. 3. November Dr. Michael Hahne, cundus AG

Business Intelligence. Bereit für bessere Entscheidungen

Business Process Management. Cloud und Mobile Computing. BPMday 2013 Köln, 13. November Enzo Favuzzi - Sales Manager WebCenter & BPM

SALSAH eine virtuelle Forschungsumgebung für die Geisteswissenschaften

Verkäufer/-in im Einzelhandel. Kaufmann/-frau im Einzelhandel. belmodi mode & mehr ein modernes Unternehmen mit Tradition.

Daniel Völk, HIS Dr. Ernst A. Hartmann, iit. Projektträger:

Java und XML 2. Java und XML

Änderungsbasiertes Requirements Management mit agosense.requirements

Abschlussarbeiten für StudentInnen

Weblog. Projektdokumentation. Java NDK Fallstudie. Identifikation: ID Status: in Arbeit Version: 00.11

Überblick. Netzprogrammierung 7b. Zustand in Web Anwendungen. Zustand in HTTP HTTP ist zustandslos Zwei Interaktionen sind unabhängig voneinander

Weblogic Server: Administration für Umsteiger

Kontextualisierung von Sprachressourcen und -technologie in der geisteswissenschaftlichen Forschung

Semantische Wikis als Informationsdrehscheibe für verteilt arbeitende Softwareprojekte

X-Technologien. XML and Friends. Jörn Clausen 9. Juli 2001

Windows Azure für Java Architekten. Holger Sirtl Microsoft Deutschland GmbH

Transaction Validation for XML Documents based on XPath

Gemeinsam mehr erreichen.

Datenbank-Entwicklung in der Praxis

Elektiv - Flugsimulator Prof. Dr. Elke Hergenröther, Nils Röder, Björn Frömmer

Auswertung zu 5510P MES-Praktikum

Portal for ArcGIS - Eine Einführung

INDIVIDUELLE SOFTWARELÖSUNGEN CUSTOMSOFT CS GMBH

ShareFile Jörg Vosse

Windows 7, 8 und 10. Wohin soll die Reise gehen

Business Breakfast. Ludwigshafen, 11. Juni SHE Informationstechnologie AG 2015

Weboberflächen testen

Text Mining mit LingPipe

... Peter Woetzel Director Product Management Online Software AG

Unterstützung des Wissensmanagements durch Informations- und Kommunikationstechnologie

+++ Bitte nutzen Sie die integrierte Audio-Funktion von WebEx (Menü Audio -> Integrated Voice Conference -> Start auswählen), um uns zu hören!!!.

Software Engineering. Zur Architektur der Applikation Data Repository. Franz-Josef Elmer, Universität Basel, HS 2015

Echolot Qualitätssicherung mit Sonar

Event Recognition Engine

Metadaten METS. Markus Schnöpf Berlin-Brandenburgische Akademie der Wissenschaften IDE. IDE Autumn School 2012, Chemnitz

System-Modellierung. statisches & dynamisches Modell. System Model. System Model

Seminar Bassem Ben Helal

TNT SWISS POST AG KUNDENSERVICE. Kompetent I lokal I sofort erreichbar in vier Sprachen (DE, FR, IT & EN) THE PEOPLE NETWORK

Internetökonomie und Hybridität

Integration einer auf der Arden-Syntax basierenden Entscheidungsunterstützungskomponente. Telematikplattform

Microsoft Office SharePoint 2007

ALM As-A-Service TFS zur hausinternen Cloud ausbauen

Fünf Schritte zum erfolgreichen Requirements Management

Infrastructure Analytics mit idh logging Framework ILF

Grid-Systeme. Betrachtung verschiedener Softwareplattformen zur Realisierung von Grids und Vorstellung des Globus Toolkit Grid Systeme 1

Präsentation idh logging Framework ILF

Universität Leipzig Institut für Informatik Auffinden von Dubletten in ECommerce Datenbeständen

Jan 2014 Rev C

Data. Guido Oswald Solution Switzerland. make connections share ideas be inspired

DER INTELLIGENTE POS DER ZUKUNFT

PROZESSCONTROLLING MIT MICROSOFT TOOLS

Bausteine einer VRE für die Linguistik - Beispiel:

Property-Graph-Databases. 20 Jahre praktische Erfahrung

Oracle Bare Metal Cloud Service

EEX Kundeninformation

Big Data Performance Management

Hilfe, ich verstehe meine APEX Seite nicht mehr! DOAG Development Konferenz, Düsseldorf

WAN Beschleunigung schneller Datentransport, kurze Backupfenster

DOAG Konferenz 2009 Oracle E-Business Suite R12 - Ordnungsmäßigkeit. Oracle E-Business Suite R12 - November 2009

Einführung in die Informatik

AAI in TextGrid. Peter Gietz, Martin Haase, Markus Widmer DAASI International GmbH. IVOM-Workshop Hannover,

Integration von ecodicology in die DARIAH Dienstewelt

Outpacing change Ernst & Young s 12th annual global information security survey

Microsoft Azure für Java Entwickler

1 von :55

Gliederung. 1. That s Radiant 2. User Interface 3. Rollen 4. Installation 5. Extensions 6. Fazit

Ergebniszusammenfassung TU Clausthal

1 von :44

Der Begriff Cloud. Eine Spurensuche. Patric Hafner geops

Magento goes into the cloud Cloud Computing für Magento. Referent: Boris Lokschin, CEO

ViFlow Benutzertagung MS-SharePoint: Vom Modell zum Betrieb

Background for Hybrid Processing

Prozessorientierte Applikationsund Datenintegration mit SOA

Microsoft Azure Fundamentals MOC 10979

IVS Arbeitsgruppe Softwaretechnik Abschnitt Management komplexer Integrationslösungen

Weißt du, wieviel Sternlein stehen. Welche Typen von Systemen gibt es?

Security Patterns. Benny Clauss. Sicherheit in der Softwareentwicklung WS 07/08

MESSI DIE HDM MESSENGER DIENSTE. MI-Präsentationstag

FlexiScale - Web Hosting mit Cloud-Computing Hochschule Mannheim

Creating OpenSocial Gadgets. Bastian Hofmann

Integrated Search Einbindung von SharePoint Search in Office Apps Melanie Culver & Michael Appinger

Open Source Data Center Virtualisierung mit OpenNebula LinuxTag Berlin. Bernd Erk

Neues in ArcGIS Server 9.3 Matthias Schenker ESRI Geoinformatik AG

SAP-Konzepte für manuelle und automatisierte Lager

Transkript:

Historische i Semantik mit Hilfe des s Alexander Mehler Goethe Universität i Frankfurt Historische Semantik Computational Humanities computational historical semantics formalisiert berechenbar hermeneutisch intellektuell Informatik Git Geisteswissenschafti hft

Historische Semantik Forschungsszenario (Jussen 2006; Jussen, Mehler, Ernst 2007) Historische Semantik Forschungsszenario (Jussen 2011) Methode: Kookkurrenzanalyse Prime: auctoritas

Historische Semantik Forschungsszenario (Jussen 2011) Forschungsfragen: texttypbedingte Variation stilbedingte Variation semantische Variation historischer Hintergrund Historische Semantik Forschungsszenario auctoritas et/vel

Agenda 1. Das Korpus 2. 3. Linguistic Networks 4. Fragenkatalog 5. Zusammenfassung Das Korpus Das Korpus (Mehler et al. 2010ab) Patrologiae cursus completus sive bibliotheca universalis, integra, uniformis, commoda, oeconomica, omnium ss. patrum, doctorum scriptorum que ecclesiasticorum qui ab aevo apostolico ad usque Innocentii III tempora floruerunt (...) accurante J.-P. Migne, Parisiis: Excudebat Migne (...), 1844

Das Korpus Konversion der Patrologia Latina gemäß TEI P5 IN SGML DTD of the PLD IN 1 DTD conversion PLD PLD XML DTD PLD SGML DTD adapted 2 SX (Clark 1997) IN TEI P5 DTD 3 conversion into TEI P5 PLD XML PL according to TEI P5 4 text structure segmentation enhanced PL according to TEI P5 OUT (PLTF) Das Korpus Vorverarbeitungsschritte (Waltinger et al. 2009) 1. Sprachenerkennung, Lemmatisierung i & PoS Tagging 2. Named Entity & Instance Recognition 3. Satzerkennung, Auszeichnung syntaktischer Strukturen 4. Auszeichnung logischer Dokumentstrukturen

Das Korpus Zeitreihen zeitliche Ordnung der Dokumente der Patrologia Latina Agenda 1. Das Korpus 2. 3. Linguistic Networks 4. Fragenkatalog 5. Zusammenfassung

Bausteine 1 Administrator i t 2 Corpus Explorer 3 Annotator 4 Preprocessor 5 HSCM Lexicon Browser 6 7 Classifier

auctoritas et/vel Architektur (Gleim 2011) Java Applet Client Java Script Flash Command Dispatcher HTTP Process Manager Command Processors Preprocessor Annotator Chainer Classifier [ ] Image DB Core API Annotation API Storage API External Apps Master Data Storage Backends Matlab File System XML DB MySQL DB [ ]

Bausteine 1 Administrator i t 2 Corpus Explorer 3 Annotator 4 Preprocessor 5 HSCM Lexicon Browser 6 7 Classifier elexicon (Mehler e et al. a. 2010) 0) objektrelational Ressourcenintegration webbasiert

elexicon (Mehler et al. 2008) Agenda 1. Das Korpus 2. 3. Linguistic Networks 4. Fragenkatalog 5. Zusammenfassung

Linguistic Networks Demo: www.linguistic networks.net Agenda 1. Das Korpus 2. 3. Linguistic Networks 4. Fragenkatalog 5. Zusammenfassung

Fragenkatalog Welche Themen sind für welche Zielgruppe relevant?010) Zielgruppe Geisteswissenschaftler verwendungsorientiert: Suchen, Browsen, Annotieren Prämisse: sehr niedrige Einstiegsschwelle Zielgruppe Informatiker modellierungsorientiert: Entwerfen, Modellieren, Entwickeln, Testen, Optimieren, Fragenkatalog Anforderungen Ressourcen 1. Verfügbarkeit in Breite und Tiefe 2. pervasive computing 3. Vernetzung: von Korpus A zu Lexikon B zu Korpus C zu 4. Modifizierbarkeit, Erweiterbarkeit 5. Personalisierbarkeit Prozeduren 1. Erweiterbarkeit 2. Dokumentation 3. Kontrollierbarkeit it und Rekonstruierbarkeit k itvon Messresultaten t (Geisteswissenschaftler)

Fragenkatalog Wünsche, Hürden und Herausforderungen 1. Daten, Daten, Daten! 2. Urheberrechtsproblematik 3. Weiterverarbeitbarkeit Weiterverarbeitbarkeit und Interoperabilität 4. Erwartungshorizont bezogen auf Automatisierbarkeit, Geschwindigkeit (offline, online), Aussagekraft von Ergebnissen Part of speech (POS) tagging is [ ] often considered to be a solved task, with published tagging accuracies around 97%. Our evaluation [ ] shows that such high h accuracies can only be achieved under artificial i [ ] conditions. i In a real life scenario, accuracy drops below 93% with enormous variation between different text genres, making the taggers unsuitable for fully automatic ti processing. (Giesbrecht & Evert t2009) Agenda 1. Das Korpus 2. 3. Linguistic Networks 4. Fragenkatalog 5. Zusammenfassung

Zusammenfassung Historische Semantik hudesktop.hucompute.org / ehumanitiesdesktop.org www.linguistic networks.net Anforderungen