Grundlagen der Erschließung von Textinhalten Karin Haenelt
Stand der Inhaltserschließung Information Retrieval No more than 40% precision for 20% recall (Sparck Jones 1987) Message Understanding Maschinelle Übersetzung 60 % der Resultate sind falsch 80 % der relevanten Texte werden nicht gefunden Eingeschränktes Fachgebiet Anfragen vorher bekannt Beste Ergebnisse 55 % precision / 45 % recall Entspricht nicht den Anforderungen an gute Übersetzungen
Gesuchte Einheiten Verknüpfungen Abstandsmaß Hintergrundinformation Grenzen der Ersatzverfahren Zeichen ketten Boole Zahlen statisch Thesaurus studierte 1937-42 in rec < 100% Kopenhagen. Danach arbeitete er in Stockholm und baute 1952 sein eigenes Haus in Hellebæk. bauen Baum bauchig Löbau pre < 100% 1913-1920 arbeitete Behrens für pre < 100% die Continental Gummi-Werke. 1956 gewann den ersten Preis für das Opernhaus in Sydney. Opernsaal. Konzertsaal. Das Innere [Breuer]... Es folgten.. das Wintersportzentrum Flaine in 1922 wurde Behrens Direktor der Architekturschule. pre < 100% rec < 100% rec < 100% pre < 100%
Inhaltserschließung - Ziele Funktionalität Zugriff auf inhaltliche Zusammenhänge Bildung thematischer Zusammenhänge Verfolgung inhaltlicher Zusammenhänge Weiterentwicklung der Zugriffsperspektiven auf Information Verarbeitung Robustheit Funktionalität Verarbeitung Effizienz
Potential der Inhaltserschließung Entwicklung der erforderlichen Technologien für Verarbeitung und Repräsentation von Struktur und Inhalt von Dokumenten Qualitätsverbesserungen in den Bereichen Text-Retrieval / Fakten-Retrieval Dokumentklassifikation Maschinelle Übersetzung, Kondensierung Eröffnung neuartiger Möglichkeiten für Aufbereitung von Information Angebot von Information Nutzung von Information
Komponenten der Verarbeitung Text-Repräsentation Texteigenschaft Text n Text Analyse Schichten Text n Syntax Thema Referenz Konzept Hintergrund Information t k t i t j Komplexität Verständlichkeit Textinhalt Text-Retrieval Fakt-Retrieval Textverarbeitung Klassifikation Abstracting Übersetzung Kontext Modell
Schichten der Textrepräsentation Syntax- Struktur Themen- Struktur Konzept- Struktur Referenz- Struktur Das Opernhaus wurde von entworfen passiv entwerfen Opernhaus <agent,act> <goal,exist> entwerfen Opernhaus
Textverstehen ein Konstruktionsprozess Das Opernhaus wurde im Hafen der Stadt erbaut Erkennen Opernhaus erbauen Hafen Konstruieren Interpretieren Konzertsaal Anwenden
Texte Offene Sichten auf offene Hintergrundinformation aktueller Text Hintergrund- Informations- Text Explizit eingeführte Verknüpfung Implizit eingeführte Verknüpfung
Linearer Text Komplexes Wissen Arten der Konstruktion satzintern satzübergreifend textübergreifend Arten der Anweisungen explizit semantisch geschlossen implizit semantisch offen Text Syntax Thema Referenz Konzept
Geschlossene Konstruktion satzintern: Konzeptstruktur Das Opernhaus wurde von entworfen cas: {nom,acc} cas: von+dat [num: sg genus: passiv agent-act: cas: von+dat goal-exist: cas: nom] <agent,act> <goal,exist> entwerfen Opernhaus
Geschlossene Konstruktion satzintern: Referenzstruktur Der Opernhauskomplex in Sydney, der Referenz auf Diskursobjekt Referenz auf Weltobjekt
Geschlossene Konstruktion textintern: Themenstruktur Künstler: Biographische Daten: Ausbildung: Stil: Werke:
Offene Konstruktion satzintern: Konzeptstruktur entwarf das Opernhaus in Sydney Opernhaus entwerfen in Sydney in Sydney entwerfen Opernhaus in Sydney
Offene Konstruktion satzextern: Konzeptstruktur 1952 baute sein Haus in Hellebæk. bauen Haus Brockhaus Wahrig Grundriss:.. das Haus hat einen klaren ~ Haus haben Grundriss Der offene Grundriss... offen is Grundriss
Offene Konstruktion satzextern: Themenstruktur studierte 1937-42 an der Kunstakademie in Kopenhagen, wo Kai Fisker und Steen Eiler Rasmussen seine Lehrer waren. Danach arbeitete er drei Jahre bei Gunnar Asplund in Stockholm. 1952 baute sein eigenes Haus in Hellebæk. Der offene Grundriss und die freie Raumgestaltung waren zu diesem Zeitpunkt in der dänischen Architektur etwas völlig Neues. Ausbildung Schaffen Tätigkeiten Lampugnani, Lexikon der Architektur des 20. Jh., 1983
Offene Konstruktion: satzextern: Themenstruktur 1 2 3 studierte 1)3) 1937 42 an der Kunstakademie in Kopenhagen, wo Kai Fisker und Steen Eiler Rasmussen seine Lehrer waren. Danach arbeitete 1)2)3 ) er drei Jahre bei Gunnar Asplund in Stockholm. 1956 baute 2)3) er sein eigenes Haus in Hellebæk.
Themenbildung Behrens Im Büro von Behrens arbeiteten unter anderen Le Corbusier (1910-11), Walter ->Gropius (1907-10) und Ludwig ->Mies van der Rohe (1908-11). Gropius 1907 trat er in das Büro von Peter -> Behrens ein, in dem neben ihm viele andere später berühmte Architekten gearbeitet hatten, unter ihnen Ludwig -> Mies van der Rohe und -> Le Corbusier. Le Corbusier Statt durch eine akademische Ausbildung erwarb sich Le Corbusier sein praktisches und künstlerisches Rüstzeug durch Mitarbeit bei Peter -> Behrens in Berlin 1919/11. Mies van der Rohe Danach arbeitete er drei Jahre bei Gunnar -> Asplund in Stockholm 1908 ging er zu Peter -> Behrens, Die drei Jahre bei Behrens (bis 1911) waren die entscheidende Zeit für Mies van der Rohes Ausbildung.
Status der Inhaltserschließung Nicht: Erzeugung der korrekten Textrepräsentation Sondern: Erzeugung einer Interpretation relativ zu einer Hintergrundinformation Ergebnisse abhängig von Informationsstand Eröffnung dynamischer Möglichkeiten für Verfolgung inhaltlicher Zusammenhänge Aktualisierung der Zugriffsmöglichkeiten auf Informationsquellen Weiterentwicklung des Wissens
Informationseinheiten und Informationsangebot Syntax- Struktur Themen- Struktur Referenz- Struktur passiv entwerfen Opernhaus Konzept- Struktur <agent,act> <goal,exist> entwerfen Opernhaus entwerfen Opernhaus
Informationseinheit: Konzepte Konzeptueller Zusammenhang der vorkommenden Wörter Aufgebaut: satzintern, satzextern, textextern explizit, implizit
Informationsangebot: Konzepte Handelnde Sachverhalt Ergebnis Zeit Ort Gropius bauen Faguswerke 1910/11 Berlin sollte entstehenbauhaus-archiv Darmstadt entstehen Bauhaus-Archiv 1976-78 Berliner Tiergarten bauen Haus 1952 Hellebæk entwerfen Opernhaus Sydney
Informationseinheit: Referenz Kospezifikationen textintern Jørn, Originellste Architektenbegabung in der modernen Architektur Dänemarks, er Referenzidentität textextern Kriterien?
Informationseinheit: Themen 1952 baute sein Haus in Hellebæk. bauen Haus Brockhaus Wahrig Grundriss:.. das Haus hat einen klaren ~ Haus haben Grundriss Der offene Grundriss... offen is Grundriss Dänemark Charakteristisch für die dynamische Architektur sind Häuser mit offenem Grundriss charact. mit is dyn Arch. Haus Haus Grundriss offen Grundriss
Informationseinheit: Themen Cluster über konzeptuelle Zusammenhänge Textsegmentierung durch Cluster Nicht notwendigerweise feste Grenzen Nicht notwendigerweise hierarchische Segmentierung überlappend
Informationsangebot: Themen studierte 1937-42 an der Kunstakademie in Kopenhagen, wo Kai Fisker und Steen Eiler Rasmussen seine Lehrer waren. Danach arbeitete er drei Jahre bei Gunnar Asplund in Stockholm. 1952 baute sein eigenes Haus in Hellebæk. Der offene Grundriss und die freie Raumgestaltung waren zu diesem Zeitpunkt in der dänischen Architektur etwas völlig Neues. Behrens Im Büro von Behrens arbeiteten unter anderen Le Corbusier (1910-11), Walter ->Gropius (1907-10) und Ludwig ->Mies van der Rohe (1908-11). Mies van der Rohe 1908 ging er zu Peter -> Behrens, Die drei Jahre bei Behrens (bis 1911) waren die entscheidende Zeit für Mies van der Rohes Ausbildung.
Anfragen Offene Sichten auf offene Information Anfrage Hintergrund- Informations- Text Explizit eingeführte Verknüpfung Implizit eingeführte Verknüpfung