Institut für Dokumentologie und Editorik. Überblick. Institut für Dokumentologie und Editorik. Institut für Dokumentologie und Editorik.

Ähnliche Dokumente
Summer School Digitale Edition. TEI Vertiefung 4: Namen, Orte, Personen. Roman Bleier, ZIM -ACDH

Namen und Daten in der TEI

Der TEI-Header. TEI-Guidelines Kap. 2

Text Encoding Ini.a.ve kurz TEI. Seminar: Digitale Dokumente SoSe 2015, Dozent: Günther Görz Referen.nnen: Veronika Boehme und Kea Rahmann

TEI für Kritische Editionen

TEI: Metadaten (Kurzfassung)

Die TEI. in einer halben Stunde

TEI Übungseinheit. Erschließung geisteswissenschaftlicher Quellen mit digitalen Methoden September 2016 Martina Scholger

XML-Technologien Tutorium 6

Textauszeichnung in Prosa, Vers und Drama. TEI-Guidelines Kap. 3, 6, 7

Die Schlagwortnormdatei (SWD) in den digitalen Angeboten der Bayerischen Staatsbibliothek

Sarah Hartmann. ORCID DE Förderung der ORCID in Deutschland

XML-Technologien. Tutorium im Sommersemester Mai 2014

Collaborative Tagging als neuer Service von Hochschulbibliotheken

Generelle Planung Generische Entwicklung Planungen (Ausblick 2017/2018)

Encoded Archival Description (EAD)

Erfassung von DTA- und CLARIN-D-kompatiblen Metadaten. Frank Wiegand Deutsches Textarchiv

XML steht für Extensible Markup Language. Helmut Vonhoegen (2007) beschreibt XML unter anderem so:

Strukturierung eines TEI-Dokuments (TEI Kapitel 4)

Linked Open Cultural Heritage.

Linked Cultural Heritage.

Philipp Vanscheidt. Mainz, 22. Juni 2013

Deutsche Übersetzung des Dublin-Core-Metadaten-Elemente-Sets. Version 1.1

XML, TEI & and. Abkürz. Zu verwirrenden Begriffen für Editorinnen und Editoren im digitalen Zeitalter

Brandbook. How to use our logo, our icon and the QR-Codes Wie verwendet Sie unser Logo, Icon und die QR-Codes. Version 1.0.1

Lehrstuhl für Allgemeine BWL Strategisches und Internationales Management Prof. Dr. Mike Geppert Carl-Zeiß-Str Jena

Panta rei: Die Versionierung der DDC Probleme, Anforderungen und mögliche Lösungen

XML oder nicht XML das ist hier die Frage

VERSTEHEN UND VERSTANDEN WERDEN SIND DIE VORAUSSETZUNG FÜR JEDEN INFORMATIONS- AUSTAUSCH.

OO Programmiersprache vs relationales Model. DBIS/Dr. Karsten Tolle

Tutorial Excel Übung 9 Datenbanken III -1- Die Aufgabenstellung ist der folgenden URL zu entnehmen: Übung 9.

Grundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1

Textkodierung mit TEI (Titel des Tutorials) Aufgabe 09: Erstellen einer Manuskript-Beschreibung

TEI und XSLT. Referat von Hannah Goldschmidt und Christian Lütticke Datenbanktechnologie Sommersemester 2011

Standardelemente-Set Normdaten - Version 1.6

Seman&sche Daten für den Webau4ri6 einer Bibliothek

Namespaces, Application Profiles und Guidelines. Dr. Heike Neuroth Projekt-Management SUB Göttingen

<Trainingsinhalt> XML umsetzen und nutzen

Linux I II III Res WN/TT NLTK XML Weka E XML BNC XSLT BNC/XML 7 BNC/XML XML BNC XSLT. Ressourcen-Vorkurs

Magic Figures. We note that in the example magic square the numbers 1 9 are used. All three rows (columns) have equal sum, called the magic number.

Herausforderungen und Ansätze für Kontextmodelle. Prof. Dr. Bernhard Mitschang Industriekolloquium Nexus

XML, QPATH, XQUERY: NEUE KONZEPTE FÜR DATENBANKEN. 4. Übung SQL/XML

esense Compatibility Information

In diesem Abschnitt wollen wir uns mit der Architektur von Datenbank Managements Systemen beschäftigen.

DOWNLOAD OR READ : TUTORIUM ANALYSIS 1 UND LINEARE ALGEBRA 1 MATHEMATIK VON STUDENTEN F R STUDENTEN ERKL RT UND KOMMENTIERT PDF EBOOK EPUB MOBI

Topic Maps. Wissensmanagement in Bildungseinrichtungen. Seminar Web Engineering Lars Heuer,

Referat 09: TEI anpassen mit Roma

PRG2 Folien Zicari Teil 2 Einführung in Datenbanken SS 2007

BACK TO BLACK: AMY WINEHOUSE UND IHR VIEL ZU KURZES LEBEN (GERMAN EDITION) BY ALEXANDER SCHULLER, NICOLE VON BREDOW

Kurze Einführung in die Benutzung des Dokumentationswerkzeugs Doxygen

1.3 Charakteristische Eigenschaften von objektorientierten Systemen

Richtlinien für das Design der KML Webseite. KML TP2, Informationsdienste

Nutzungsstatistiken für digitale Dokumente. 5. Kongress Bibliothek & Information Deutschland 11. März 2013 im Congress Center Leipzig Daniel Beucke

Showcase(s): Was kann man mit XML-Daten forschen?

Das Thema: Die Olympischen Spiele in

XML Schema. Marco Skulschus Marcus Wiederstein. Webseite zum Buch: Comelio Medien

TEI-Toolbox Beispiele Digitale Edition der Rechnungen der Stadt Basel

Summer School Digitale Edition

Im Fluss der Zeit: Gedanken beim Älterwerden (HERDER spektrum) (German Edition)

GND und RDA. Brigitte Wiechmann. Deutsche Nationalbibliothek. 1 GND und RDA,

PHP objektorientiert

How To Use The Internet In School

Word. Verweise. Textmarken, Querverweise, Hyperlinks

Agenda. Datenauszeichnung mit RDF. Rahmen für semantische Technologien. XML als Basis-Technologie. Wiederholungsübung XML

Ist Katalogisierung zukunftsfähig? Ein Beitrag zur Begriffsverschiebung


Anwendungsentwicklung Datenbanken Datenbankentwurf. Stefan Goebel

Web-basierte Geoinformation im Planungsprozess , VU, 2013W; TU Wien, IFIP

Webseiten-Bericht für feedbackvote.com

DAS ERSTE MAL UND IMMER WIEDER. ERWEITERTE SONDERAUSGABE BY LISA MOOS

Martin Luther. Click here if your download doesn"t start automatically

H o c h s c h u l e D e g g e n d o r f H o c h s c h u l e f ü r a n g e w a n d t e W i s s e n s c h a f t e n

Digitales Edieren mit TextGrid

censhare Training Falstaff Verlag Januar 2015 For customers or partners with NDA

Logische Dokumentenstruktur mit SGML und XML

Records im Kontext Kontextualisierung 2.0 mit Matterhorn METS. 19. AUdS-Tagung Wien, Tobias Wildi,

CHE Persistente Identifikatoren für Kulturobjekte

Netzwerk Museum. Deutsches Museum Digital. Georg Hohmann. Museum von Babel Frankfurt,

Lehrstuhl für Allgemeine BWL Strategisches und Internationales Management Prof. Dr. Mike Geppert Carl-Zeiß-Str Jena

MPLab X. Projekt erstellen mit MPLabX und Source-Code von AB

Selbstbild vs. Fremdbild. Selbst- und Fremdwahrnehmung des Individuums (German Edition)

Geometrie und Bedeutung: Kap 5

Grundlagen der Programmentwurfstechnik Fundamentals of Software Engineering 1

Datenqualität im Museumskontext: Eine Anforderungsanalyse aus dem EU-Projekt Athena Plus

Word 10. Verweise Version: Relevant für: IKA, DA

Metadaten und Identifikatoren

Einrichtung von Arbeitsfolgen

THEMA: GUT VORBEREITET IST HALB ZERTIFIZIERT ANTWORTEN ZUR SAS VISUAL ANALYTICS-ZERTIFIZIERUNG" THOMAS WENDE

Logik für Informatiker Logic for computer scientists

Bundesamt für Landestopografie swisstopo KOGIS. FIG GM03: Workshop März 2014

Webseiten-Bericht für zap2login.net

DARIAH-DE Collection Registry und DARIAH Collection Description Data Model

Zur Neuedition von Humboldts Journal der Englandreise 1790 in der edition humboldt digital

Sport Northern Ireland. Talent Workshop Thursday 28th January 2010 Holiday Inn Express, Antrim

sample pages SAXOPHONE CARE DIE PFLEGE DES SAXOPHONS LIGATURE BLATTSCHRAUBE MOUTHPIECE MUNDSTÜCK NECK S-BOGEN (AUCH HALS) NECK SCREW HALSSCHRAUBE

SCHNELLES DENKEN, LANGSAMES DENKEN (GERMAN EDITION) BY DANIEL KAHNEMAN

RECHNUNGSWESEN. KOSTENBEWUßTE UND ERGEBNISORIENTIERTE BETRIEBSFüHRUNG. BY MARTIN GERMROTH

CNC ZUR STEUERUNG VON WERKZEUGMASCHINEN (GERMAN EDITION) BY TIM ROHR

FACHKUNDE FüR KAUFLEUTE IM GESUNDHEITSWESEN FROM THIEME GEORG VERLAG

Transkript:

- Einheit ist eine Vertiefung in TEI - Regularisierung und Normalisierung weiterer Schwerpunkt - Es sollen Möglichkeiten zur Verarbeitung der so bearbeiteten Dokumenten deutlich werden - Übungsmaterialien für die Schulung unter: http://nowalkowski.de/share/springschool2012/ Überblick - Regularisierung im Text - Regularisierung von Entitäten und Sacherschließung (Einschub: Pointing) - Indexerstellung - Normalisierung - Normdateien und Anbindung an externe Ressourcen Viel Spaß! Folie 1 Folie 2 Regularisierung im Text - Ausgangssituation: Regularisierung als Teil des Editionsprozesses - 2 Möglichkeiten - Dokumentation im TEI Header in der <editorialdecl /> in der <encodingdesc /> - correction hyphenation interpretation normalization quotation segmentation <editorialdecl> <normalization> <p>all words converted to Modern American spelling using Websters 9th Collegiate dictionary </p> </normalization> </editorialdecl> Verwendung der Elemente - <reg> Kennzeichnung einer vorgenommenen Regularisierung - <orig> Kennzeichnung einer Schreibweise im Original - <choice> Gruppierung unterschiedlicher Schreibweisen für eine Textstelle Folie 3 Folie 4 <orig> <reg> - Kennzeichnung des Bearbeitungsstandes - Kennzeichnung bei der Anzeige - Kennzeichnung einer Schreibweise als ediert - Interpretation, unleserliche Quelle Folie 5 Folie 6

<choice> - Anbieten von Alternativen - Rekonstruierbarkeit - Anbieten unterschiedlicher Editionen im Web Folie 7 Folie 8 @cert und @resp - Qualifizierung des Editionsprozesses - @cert Angaben zur Sicherheit der Lesart - mögliche Werte: unknown; low; medium; high - @resp Angabe des Bearbeiters oder einer Bearbeitenden Einrichtung Identifizierung von Entitäten und Sacherschließung - Auszeichnung von Entitäten durch <name type= xxx /> - Schwierigkeiten bei der Identifikation von Entitäten - Identifizierung durch @key - Benutzung von Identifiern (lokale oder globale) Folie 9 Folie 10 Identifizierung, TEI für Register Regularisierung und Sacherschließungund Erschließung Spring School 14. März durch bis 18. März 2011 Einschub: Pointing - Verweisen von einer Stelle im Dokument auf eine andere - Interne Stelle - Externe Stelle - Begriffsverwirrung: Pointing vs. Linking - Abbildung von Strukturen im Text jenseits der linearen Textstruktur Der URI und seine Bestandteile - Die URL als Beispiel einer URI - http://de.wikipedia.org/wiki/erich_m%c3%bchsam - Bestandteile einer URI (für unseren Zweck) - Verkürzung bei internen Links #Leben - aber wo ist das Leben? xml:id Folie 11 Folie 12

zurück zum Thema: @ref... - @ref verweist auf eine Ressource (intern oder extern), die die Entität beschreibt - Wert von @ref ist eine URI...und @nymref - Der kanonische Name einer Person - Beschreibung der Namensformen statt der Biografie - Vorteile einer zentralen Beschreibung - Erfassung in unterschiedlichen Listen in der <sourcedesc /> im TEI Header (model.listlike) - Gruppen von Personen: @ref= #e_muehsam #b_brecht Folie 13 Folie 14 Sprachen und Etymologie - Namensformen in verschiedenen Sprachen: <orth xml:lang="de DE" /> - Etymologische Beschreibungen durch Vokabular aus dem model.dictionary Sacherschließung im TEI Header - <listperson /> in der <particdesc /> der <profiledesc /> zur Beschreibung von Personen Text - <listplace /> in der <settingdesc /> der <profiledesc /> zur Beschreibung von Orten - Mehrere mittels @type typisierte Listen möglich - Beziehungen zwischen Personen oder Orten mittels <relation /> Folie 15 Folie 16 <listperson /> <listplace /> - Beschreibung mittels Elementen aus model.personlike: affiliation age birth death education event faith floruit langknowledge nationality. - Beschreibung mittels Elementen wie: bloc climate country district event geogname listplace location place placename population region settlement state terrain <person xml:id="karliv"> <persname>karl IV., getauft auf den Namen Wenzel</persName> <birth>1316</birth> <death>1378</death> <faith>römisch-katholisch</faith> </person> <place xml:id="prag"> <placename>prag</placename> <country>tschechien</country> </place> Folie 17 Folie 18

Übung 1 Anwenden eins Skripts - Der Textausschnitt enthält veraltete Schreibweisen, Personennamen und Ortsnamen - Arbeiten Sie den Text durch und zeichnen Sie aus: - Alte Schreibweisen unter Angabe der gängigen Schreibweise - Personen und Orte mit dem <name /> Element - Erstellen Sie eine Personen und Ortsliste im TEIHeader und referenzieren Sie mit @ref dorthin Folie 19 Folie 20 Folie 21 Folie 22 Indizes und Register - Zwei verschieden Ausgangssituationen: - Abbildung eines Registers aus der Quelle - Erstellung eines Register während der Erstellung der digitalen Edition Abbildung eines bestehenden Registers - Kapselung des Registers in einem <div /> Element (@type= index möglich) - Ein Register ist ein Liste. Gebrauch von <list /> <item /> - Verweise im <ref /> Element <div type="index"> <!--...--> <list type="index"> <item>ahlhaus<ref>193</ref></item> <item>bendtler<ref>443</ref></item> <item>brachinger<ref>181</ref></item> <item>dürrematt<ref>212</ref></item> </list> </div> Folie 23 Folie 24

Pointing Mehrdimensionale Register - Auf die entsprechende Passage kann direkt gezeigt werden. - Voraussetzung: identifizierbare Pagebreaks - Voraussetzung: Gebrauch des @target Attributs von <ref /> <list type="index"> <item>faas-hardegger, Margarethe<ref target="#p346">343</ref></item> </list> <p>sondern auch die Mutterschaftsversicherung und die Idee von bezahlter Hausarbeit.<pb xml:id="p346" /> Margarethe Hardegger machte eine Lehre als Telefonistin, gleich anschliessend holte sie mit Unterstützung ihres späteren Ehemanns, August Faas, die Matura nach. </p> - Register mit mehreren Hierarchiestufen - Lösungsansatz: eine verschachtelte Liste <list type="index"> <item>agriculture <list type="indexentry"> <item>ancient policy of Europe unfavourable to, <ref>371</ref></item> <item>cattle and tillage mutually improve each other, <ref>325</ref></item> <item>wealth arising from more solid than that which proceeds from commerce <ref>520</ref></item> </list> </item> </list> Folie 25 Folie 26 Übung 2 - Schauen Sie sich die Personenregistervorlage an und versuchen Sie diese in den <back /> Abschnitt des XML Dokuments einzuarbeiten - Verwenden Sie Pointing um auf die angegebenen Pagebreaks zu verweisen. Automatische Generierung eins Registers - Vorgehen - Auszeichnung der zu indizierenden Terme oder Passagen - Automatische Erstellung des Registers durch ein Skript - Verortung manuell oder automatisch nachträglich ersteller Register in der <back /> Sektion des TEI Dokuments - Benutzung von <divgen /> statt <div /> für automatisch erstellte Register Folie 27 Folie 28 Auszeichnung zu indexierender Textstellen - <index /> Element zur Auszeichnung von zu indexierenden Textstellen - <term /> Element zur Angabe des Index Terms <p>david's other principal backer, Josiah ha-kohen <index> <term>josiah ha-kohen b. Azarya</term> </index> b. Azarya, son of one of the last gaons of Sura. </p> Auszeichnung von Textpassagen - Vorgehen - Verweis auf eine Markierung im Text, bis zu der die Passage geht - Verweis im <index /> Element durch @spanto - Verweis auf einene gesetzte Markierung mittels des <anchor /> Elements <index spanto="#alamend"> <term>lemmatization, Arabic</term> </index> concerning which it is important to note... <!-- much learned material omitted here --> and now we can build our parser. <anchor xml:id="alamend"/> Folie 29 Folie 30

Sonderzeichen und mehrere Rgister - Problem: Sortierung von Sonderzeichen - Lösung: @sortkey im <item /> Element - Problem: Registerzugehörigkeit bei mehreren Registern - Lösung: @indexname im <index /> Element Mehrdimensionale Register - Problem: Wie werden Terme innerhalb einer Registerhierarchie im Text kenntlich gemacht? - Lösung: Abbildung der Hierarchie durch Verschachtelung von <index /> Elementen <p>the Svenska Sångarförbundet <index sortkey="sang" indexname="index-institutions"> <term>sångarförbundet</term> </index> was,coincidentally, founded </p> Folie 31 Folie 32 Übung 3 - Identifizieren Sie im folgenden Text Schlagworte und markieren Sie sie mittels des <index /> Elements - Benennen Sie mittels @indexname das Register in das die Schlagworte aufgenommen werden sollen - Verwenden Sie @xml:id um die Auszeichnung referenzierbar zu machen Normalisierung von Datentypen - Zeitpunkte, Perioden und Orte - 24.12.2010, 24. Dezember 2010, der erste Tag des Beth - die attische Zeit, das erste römische Triumvirat - 7km nördlich von Berlin, 10 Meilen westlich von Newcastle - Normalisierung zu Erläuterungszwecken - Normalisierung zu Prozessierungszwecken Folie 33 Folie 34 Datum und Zeit @period - Kenntlichmachung durch <date /> und <time /> - @when, @notbefore, @notafter, @from, @to - Notation im W3C Standard: YYYY MM DDTHH:MM:SS - Bestimmung von Epochen und Perioden - Benutzung ähnlich wie bei Entitäten und @ref - Inhalt ist eine URI die auf eine interne oder externe Ressource verweist <placename period="#christian">stauropolis</placename> Folie 35 Folie 36

Deklaration von Perioden Orte Folie 37 - Beschreibung des Zeitabschnitts in der <encodingdesc /> <classdecl /> im TEI Header - Benennungsproblem und Bestimmungsproblem - Unterelement von <place /> - Bestimmung der Position durch <location /> - Kontextualisierung mit <block />, <country /> und <settlement /> <location> <bloc>eu</bloc> <location> <country>france</country> <country key="fr"/> </location> <settlement type="city">lyon</settlement> <district type="arrondissement">perrache</district> <placename type="street">rue de la Charité</placeName> </location> Folie 38 Geolokalisierung Einheiten <measure> - Verwendung von Geokoordinaten nach WGS84 <location> <geo>45.769559 4.834843</geo> </location> - Verwendung anderer Geolokalisierungssysteme wie KML durch Auszeichnung in der <geodecl /> im TEI Header <encodingdesc> <geodecl datum="kml" /> </encodingdesc> - Auszeichnung von Maßen - Verknüpfung von Mengenangaben mit Werten in gebräuchlichen Maßeinheiten <measure type="currency"> 10-11-6d</measure> <measure type="area">2 merks of old extent</measure> <measure quantity="1.6" unit="km">1 Meile</measure> Folie 39 Folie 40 Folie 41 Normdateien: PND und GeoNames - Warum Normdateien? - Schwierigkeiten bei der Verwendung von Normdateien Folie 42 Personennormdatei - PND - Bereitstellung eines Identifikators für die eindeutige Indentifikation von Personen - Bestimmung der Person durch Metadaten - Namensansetzungen - Ursprung: bibliothekarischer Kontext: DNB - Harmonisierung durch VIAF - PND im nationalen Kontext etabliert, z.b Wikipedia - Link-Resolver: http://toolserver.org/~apper/pd/person/pnd-redirect/de/pnd - Bsp.: Adolf Friedrich (schwedischer König)

GeoNames Übung 4 - Frei zugängliche DB geographischer Orte mit - Namensvariationen, Geodaten, GoogleMaps und Wikipediaverlinkung, Umgebungssuche und mehr - Ambiguitäten: http://www.geonames.org/search.html?q=berlin - Eindeutige Identifizierung: - http://www.geonames.org/2950159/ - Recherchieren Sie für die im TEI Dokument enthaltenen Orte und Personen die jeweilige GeoNames ID, bzw. PND im Internet - Annotieren Sie die Personen und Orte mit <name type= person /> oder <name type= place /> - Tragen Sie die ID in ein hinzuzufügendes @key Attribut ein Folie 43 Folie 44