Grundlagen der Erschließung von Textinhalten. Karin Haenelt

Ähnliche Dokumente
Linguistische Grundlagen der Texterschließung

mit einem pilzförmigen Stopfen aus Kork oder einem anderen für den Kontakt mit Lebensmitteln zugelassenen Stoff mit Haltevorrichtung

Die Geschichte des Bauhauses: Von Weimar nach Chicago

Teil 3: Verstehen und Bearbeiten eines Lesetextes und wissenschaftssprachlicher Strukturen Lösungsschlüssel

Klausur zur DSH. Teil 3: Verstehen und Bearbeiten eines Lesetextes und wissenschaftssprachlicher Strukturen

21231_S32_S64_Dt.qxd :31 Uhr Seite S32 S64

Die Weissenhofsiedlung in Stuttgart. Bau und Planung Die Architekten Chronik der Weissenhofsiedlung Einfluss auf heutige Architektur

Die WEISSENHOF SIEDLUNG. Ein gebautes Manifest der Moderne. Ein kunsthistorischer Hörführer. Valerie Hammerbacher / Anja Krämer

Tipo e Progetto Urbano Weissenhof Stoccarda 1927

Informationsextraktion. Karin Haenelt

Information Retrieval Einführung

Seminar Textmining SS 2015 Grundlagen des Maschinellen Lernens

S.3

THE REAL PAPER ARCHITECT: SHIGERU BAN

Modulprüfung BG I/II / Studium Generale BG I/II-1/2

Bauhaus. 1. Schauen Sie sich zuerst die Bilder an. Wie finden Sie die Bauhaus-Architektur? 2. Lesen Sie danach den Text und machen Sie die Aufgaben.

Deutschland entdecken

Wörter - Texte - Information. Möglichkeiten und Grenzen automatischer Erschließungsverfahren

Studienprojekt TaxoSearch Spezifikation

Vorlesung Baugeschichte WS 2013/14: Baugeschichte des 19., 20. und 21. Jh.s : Wider den rechten Winkel

Diskursrelationen. in der deutschen Sprache. Monika Putzinger ( , A 332) PS Sprachgebrauch: Einführung in die Computerlinguistik

Geschichte und Theorie der modernen Architektur

Textsorten. Zahide Karabacak

12. LA- und PS-Hierarchien im Vergleich

Typisierung semantischer Relationen für Strategien der Wissensexploration

villa Zeitlos wohnenhaifa

Goldene Architektur in den Zwanzigern (?)

Kapitel IR:II. II. Grundlagen des Information Retrieval. Retrieval-Evaluierung Indexterme

Mit der Bauhausbag durch Weimar wandern. auf den Spuren von. Henry van de Velde

Semantic MediaWiki: Extension Semantic Forms eine kleine Anleitung

Sydney. Sydney Opera House. [ Wenn Paris die Stadt der Lichter ist, dann ist Sydney die Stadt der Feuerwerke. ]

RyB 4 Mies. RyB 4 Mies Cohe

THE MAGAZINE // N 12 // SPRING SUMMER 2013 collection

Suchmaschinen. Anwendung RN Semester 7. Christian Koczur

Marcel Breuer. Wohnen für die Sinne. Willkommen in der Ausstellung zum 100. Geburtstag von Marcel Breuer. Bis 3. August 2002.

1. Einführung in Temporallogik CTL

PETRUS Szenario 1 Automatische Sachgruppenvergabe

Haskell, Typen, und Typberechnung. Grundlagen der Programmierung 3 A. Überladung und Konversion in Haskell. Typisierung in Haskell



Präsentationsprüfung Grundkurs Kunst am : Umnutzung des Neuen Foyers der Bertolt-Brecht-Schule Darmstadt

H A U S LANGE H A U S ESTERS

Bachelorarbeit Erkennung von Fließtext in PDF-Dokumenten

Case-Based Reasoning und anderen Inferenzmechanismen

Lernen mit Semantischen Informationsstrukturen

Institut Entwerfen, Kunst und Theorie. P r o f e s s o r D r. W e r n e r S e w i n g. Vorlesung 01. Sommersemester

Was ist Statistik? Wozu dienen statistische Methoden?

CyMON - SDMS. Warum SDMS? Semantisches Dokumenten Management System

Inhaltsanalyse und CONTENTUS

RDF und SPARQL. Kursfolien. Karin Haenelt

Erfolg durch Wissen. Petershauser Straße 6, Hohenkammer

Neue Technologien für das Internet der Dienste

Nutzung maschinellen Lernens zur Extraktion von Paragraphen aus PDF-Dokumenten

Vorlesung Baugeschichte WS 2013/14: Baugeschichte des 19., 20. und 21. Jh.s : Funktionalismus

Clustern: Voraussetzungen

Vorlesung Sondergebiete des Wohnbaus Modul Wohnbau im Kontext Abteilung Wohnbau und Entwerfen Institut für Architektur und Entwerfen

Kapitel 10. JDBC und SQLJ. Prof. Dr. Wolfgang Weber Vorlesung Datenbanken 1

Modellbasierende Ermittlung von Kosten im denkmalgeschützten Bestand

Anja Schiller Matrikelnr.: Architektur & Städtebau

Information und Produktion. Rolland Brunec Seminar Wissen

Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko

Handlungskompetenzorientierung in

Vernetzt denken, kritisch reflektieren, kompetent anwenden: Arbeiten mit Modellen im Geographieunterricht

Curriculum für das Fach Latein in den Jgst. 6 und 7

Grundlagen der Programmierung 3 A

Klassenmethoden. Klassenvariablen. Für das Auslesen des Studentenzählers definieren wir eine öffentliche Klassenmethode:

: Die Zwanziger Jahre Neue Wege, neue Wohnformen

Dokumenten-Clustering. Norbert Fuhr

Information Retrieval Übung

Multimedia-Datenbanken im SS 2010 Einführung in MMDB

Context-Awareness: aktuelle Projekte. Wintersemester 2007/2008 HAW-Hamburg Jaroslaw Urich

Design Patterns II. Der Design Muster Katalog. Prof. Dr. Nikolaus Wulff

Schwerpunkte. 10. Felder (Arrays) Grundprinzip von Arrays. Klassifikation von Typen in Programmiersprachen

Haskell, Typen, und Typberechnung. Grundlagen der Programmierung 3 A. Einige andere Programmiersprachen. Typisierung in Haskell

3. Klassen Statische Komponenten einer Klasse. Klassenvariablen

Das Projekt Automatische Sacherschließung an der ZBW

Vorlesung Grundkurs Hochbau und Konstruktion Funktionalität DI Katharina Bayer

90 Licht+Wohnen 0410 PPVMEDIEN Kunstlicht

JetViewSoft Versions Update von V1.40 auf V1.50

Das neue Bauen. Rayner Banham, Die Revolution der Architektur: Theorie und Gestaltung im Ersten Maschinenzeitalter, Braunschweig 1990

J. Reinier van Kampenhout Robert Hilbrich Hans-Joachim Goltz. Workshop Echtzeit Fraunhofer FIRST

LIVIVO: Das neue ZB MED-Suchportal für Lebenswissenschaften Jana Pössel. AGMB-Tagung Basel, Seite

Vorlesung Datenstrukturen

NoAH Übersicht über das Honeypot-Projekt

bauhaus Pressefotos: Die Grand Tour des Bauhauses Berlin/Dessau/Weimar, 22. Februar 2012

13. Funktionale Konzepte in Java

HS Information Retrieval

Einführung in die Linguistik, Teil 4

Information Retrieval

Einfuhrung in die inhaltliche Erschließung. Grundlagen - Methoden - Instrumente

Kapitel 15: Von dynamischen zu statischen Typen. Grundlagen der Programmierung 1. Holger Karl. Wintersemester 2016/2017. Inhaltsverzeichnis 1

Normen. Einfach. Managen. Mit Beratung und Lösungen von Beuth.

Stahlrohrmöbel am Bauhaus

D3kjd3Di38lk323nnm. FARNSWORTH HOUSE Plano, Illinois, 1951, Mies van der Rohe. Tom Alphin, Der LEGO -Architekt, dpunkt.verlag, ISBN

Dokumentenmanagement mit active.pdm

Automatische Klassifikation: Stand der Technik und Veränderungen im Berufsbild des Dokumentars. Automatische Klassifikation:

LLG: PS-CURRICULUM 2015 für GK in Q1 und Q2 Seite 1 von 10

Zweigwahl in der 7. Jahrgangsstufe

EIGENSCHAFTEN VON SPRACHEN

Transkript:

Grundlagen der Erschließung von Textinhalten Karin Haenelt

Stand der Inhaltserschließung Information Retrieval No more than 40% precision for 20% recall (Sparck Jones 1987) Message Understanding Maschinelle Übersetzung 60 % der Resultate sind falsch 80 % der relevanten Texte werden nicht gefunden Eingeschränktes Fachgebiet Anfragen vorher bekannt Beste Ergebnisse 55 % precision / 45 % recall Entspricht nicht den Anforderungen an gute Übersetzungen

Gesuchte Einheiten Verknüpfungen Abstandsmaß Hintergrundinformation Grenzen der Ersatzverfahren Zeichen ketten Boole Zahlen statisch Thesaurus studierte 1937-42 in rec < 100% Kopenhagen. Danach arbeitete er in Stockholm und baute 1952 sein eigenes Haus in Hellebæk. bauen Baum bauchig Löbau pre < 100% 1913-1920 arbeitete Behrens für pre < 100% die Continental Gummi-Werke. 1956 gewann den ersten Preis für das Opernhaus in Sydney. Opernsaal. Konzertsaal. Das Innere [Breuer]... Es folgten.. das Wintersportzentrum Flaine in 1922 wurde Behrens Direktor der Architekturschule. pre < 100% rec < 100% rec < 100% pre < 100%

Inhaltserschließung - Ziele Funktionalität Zugriff auf inhaltliche Zusammenhänge Bildung thematischer Zusammenhänge Verfolgung inhaltlicher Zusammenhänge Weiterentwicklung der Zugriffsperspektiven auf Information Verarbeitung Robustheit Funktionalität Verarbeitung Effizienz

Potential der Inhaltserschließung Entwicklung der erforderlichen Technologien für Verarbeitung und Repräsentation von Struktur und Inhalt von Dokumenten Qualitätsverbesserungen in den Bereichen Text-Retrieval / Fakten-Retrieval Dokumentklassifikation Maschinelle Übersetzung, Kondensierung Eröffnung neuartiger Möglichkeiten für Aufbereitung von Information Angebot von Information Nutzung von Information

Komponenten der Verarbeitung Text-Repräsentation Texteigenschaft Text n Text Analyse Schichten Text n Syntax Thema Referenz Konzept Hintergrund Information t k t i t j Komplexität Verständlichkeit Textinhalt Text-Retrieval Fakt-Retrieval Textverarbeitung Klassifikation Abstracting Übersetzung Kontext Modell

Schichten der Textrepräsentation Syntax- Struktur Themen- Struktur Konzept- Struktur Referenz- Struktur Das Opernhaus wurde von entworfen passiv entwerfen Opernhaus <agent,act> <goal,exist> entwerfen Opernhaus

Textverstehen ein Konstruktionsprozess Das Opernhaus wurde im Hafen der Stadt erbaut Erkennen Opernhaus erbauen Hafen Konstruieren Interpretieren Konzertsaal Anwenden

Texte Offene Sichten auf offene Hintergrundinformation aktueller Text Hintergrund- Informations- Text Explizit eingeführte Verknüpfung Implizit eingeführte Verknüpfung

Linearer Text Komplexes Wissen Arten der Konstruktion satzintern satzübergreifend textübergreifend Arten der Anweisungen explizit semantisch geschlossen implizit semantisch offen Text Syntax Thema Referenz Konzept

Geschlossene Konstruktion satzintern: Konzeptstruktur Das Opernhaus wurde von entworfen cas: {nom,acc} cas: von+dat [num: sg genus: passiv agent-act: cas: von+dat goal-exist: cas: nom] <agent,act> <goal,exist> entwerfen Opernhaus

Geschlossene Konstruktion satzintern: Referenzstruktur Der Opernhauskomplex in Sydney, der Referenz auf Diskursobjekt Referenz auf Weltobjekt

Geschlossene Konstruktion textintern: Themenstruktur Künstler: Biographische Daten: Ausbildung: Stil: Werke:

Offene Konstruktion satzintern: Konzeptstruktur entwarf das Opernhaus in Sydney Opernhaus entwerfen in Sydney in Sydney entwerfen Opernhaus in Sydney

Offene Konstruktion satzextern: Konzeptstruktur 1952 baute sein Haus in Hellebæk. bauen Haus Brockhaus Wahrig Grundriss:.. das Haus hat einen klaren ~ Haus haben Grundriss Der offene Grundriss... offen is Grundriss

Offene Konstruktion satzextern: Themenstruktur studierte 1937-42 an der Kunstakademie in Kopenhagen, wo Kai Fisker und Steen Eiler Rasmussen seine Lehrer waren. Danach arbeitete er drei Jahre bei Gunnar Asplund in Stockholm. 1952 baute sein eigenes Haus in Hellebæk. Der offene Grundriss und die freie Raumgestaltung waren zu diesem Zeitpunkt in der dänischen Architektur etwas völlig Neues. Ausbildung Schaffen Tätigkeiten Lampugnani, Lexikon der Architektur des 20. Jh., 1983

Offene Konstruktion: satzextern: Themenstruktur 1 2 3 studierte 1)3) 1937 42 an der Kunstakademie in Kopenhagen, wo Kai Fisker und Steen Eiler Rasmussen seine Lehrer waren. Danach arbeitete 1)2)3 ) er drei Jahre bei Gunnar Asplund in Stockholm. 1956 baute 2)3) er sein eigenes Haus in Hellebæk.

Themenbildung Behrens Im Büro von Behrens arbeiteten unter anderen Le Corbusier (1910-11), Walter ->Gropius (1907-10) und Ludwig ->Mies van der Rohe (1908-11). Gropius 1907 trat er in das Büro von Peter -> Behrens ein, in dem neben ihm viele andere später berühmte Architekten gearbeitet hatten, unter ihnen Ludwig -> Mies van der Rohe und -> Le Corbusier. Le Corbusier Statt durch eine akademische Ausbildung erwarb sich Le Corbusier sein praktisches und künstlerisches Rüstzeug durch Mitarbeit bei Peter -> Behrens in Berlin 1919/11. Mies van der Rohe Danach arbeitete er drei Jahre bei Gunnar -> Asplund in Stockholm 1908 ging er zu Peter -> Behrens, Die drei Jahre bei Behrens (bis 1911) waren die entscheidende Zeit für Mies van der Rohes Ausbildung.

Status der Inhaltserschließung Nicht: Erzeugung der korrekten Textrepräsentation Sondern: Erzeugung einer Interpretation relativ zu einer Hintergrundinformation Ergebnisse abhängig von Informationsstand Eröffnung dynamischer Möglichkeiten für Verfolgung inhaltlicher Zusammenhänge Aktualisierung der Zugriffsmöglichkeiten auf Informationsquellen Weiterentwicklung des Wissens

Informationseinheiten und Informationsangebot Syntax- Struktur Themen- Struktur Referenz- Struktur passiv entwerfen Opernhaus Konzept- Struktur <agent,act> <goal,exist> entwerfen Opernhaus entwerfen Opernhaus

Informationseinheit: Konzepte Konzeptueller Zusammenhang der vorkommenden Wörter Aufgebaut: satzintern, satzextern, textextern explizit, implizit

Informationsangebot: Konzepte Handelnde Sachverhalt Ergebnis Zeit Ort Gropius bauen Faguswerke 1910/11 Berlin sollte entstehenbauhaus-archiv Darmstadt entstehen Bauhaus-Archiv 1976-78 Berliner Tiergarten bauen Haus 1952 Hellebæk entwerfen Opernhaus Sydney

Informationseinheit: Referenz Kospezifikationen textintern Jørn, Originellste Architektenbegabung in der modernen Architektur Dänemarks, er Referenzidentität textextern Kriterien?

Informationseinheit: Themen 1952 baute sein Haus in Hellebæk. bauen Haus Brockhaus Wahrig Grundriss:.. das Haus hat einen klaren ~ Haus haben Grundriss Der offene Grundriss... offen is Grundriss Dänemark Charakteristisch für die dynamische Architektur sind Häuser mit offenem Grundriss charact. mit is dyn Arch. Haus Haus Grundriss offen Grundriss

Informationseinheit: Themen Cluster über konzeptuelle Zusammenhänge Textsegmentierung durch Cluster Nicht notwendigerweise feste Grenzen Nicht notwendigerweise hierarchische Segmentierung überlappend

Informationsangebot: Themen studierte 1937-42 an der Kunstakademie in Kopenhagen, wo Kai Fisker und Steen Eiler Rasmussen seine Lehrer waren. Danach arbeitete er drei Jahre bei Gunnar Asplund in Stockholm. 1952 baute sein eigenes Haus in Hellebæk. Der offene Grundriss und die freie Raumgestaltung waren zu diesem Zeitpunkt in der dänischen Architektur etwas völlig Neues. Behrens Im Büro von Behrens arbeiteten unter anderen Le Corbusier (1910-11), Walter ->Gropius (1907-10) und Ludwig ->Mies van der Rohe (1908-11). Mies van der Rohe 1908 ging er zu Peter -> Behrens, Die drei Jahre bei Behrens (bis 1911) waren die entscheidende Zeit für Mies van der Rohes Ausbildung.

Anfragen Offene Sichten auf offene Information Anfrage Hintergrund- Informations- Text Explizit eingeführte Verknüpfung Implizit eingeführte Verknüpfung