Einführung in die Linguistische Datenverarbeitung I Prof. Dr. Reinhard Köhler

Größe: px
Ab Seite anzeigen:

Download "Einführung in die Linguistische Datenverarbeitung I Prof. Dr. Reinhard Köhler"

Transkript

1 Einführung in die Linguistische Datenverarbeitung I Prof. Dr. Reinhard Köhler Vorlesungsskript Teil 1 Unter Mitarbeit von Stefanie Okolowski und Sabine Patzschke 1

2 1. Das Fach Computerlinguistik Die Bezeichnung Linguistische Datenverarbeitung an deutschen Universitäten ist inhalt s- gleich mit der im angelsächsischen Sprachraum üblichen Bezeichnung Computational Linguistics, für die sich auch der eingedeutschte Ausdruck Computerlinguistik etabliert hat. Die Computerlinguistik ist ein interdisziplinäres Fach, das sich auch mit linguistischen, informatischen, psychologischen, kognitionswissenschaftlichen, mathematischen, philosophischen und kommunikationswissenschaft lichen Fragestellungen auseinandersetzt. Im Zentrum der computerlinguistischen Forschung stehen Sprache und Text, d.h. Systeme von sprachlichen Ze i- chen. Auf der einen Seite steht die Verwendung von Zeichensystemen durch die Menschen; wichtige Aspekte sind die Übermittlung von Informationen, das Vollziehen von (Sprach-) Handlungen, das Speichern von Wissen und das Ziehen von Schlüssen. Auf der anderen Seite wird die Möglichkeit der Repräsentation und Verarbeitung sprachlicher Daten auf maschineller Basis untersucht und zur Grundlage sprachtechnologischer und informations-logistischer Lösungen gemacht Zielsetzungen der Computerlinguistik Die Computerlinguistik beschäftigt sich mit der Verarbeitung natürlicher Sprache in Comp u- tersystemen. Sie hat im Wesentlichen zwei Ausrichtungen. Anwendungsorientierte Computerlinguistik Dieser Richtung der Linguistischen Datenverarbeitung geht es hauptsächlich um 1. die Schaffung von (Software-)Werkzeugen, die die Mensch-Maschine-Kommunikation (MMK) durch die Verarbeitung sprachlicher Daten erleichtern (z.b. die Möglichkeit, Computer bzw. allgemein Maschinen mittels gesprochener Befehle zu steuern, oder die akustische Ausgabe von Meldungen anstelle von Bildschirmanzeigen und Ausdrucken auf Papier); 2. maschinelle, vor allem softwaretechnische Hilfsmittel zur Verarbeitung von Texten in natürlicher Sprache zu verschiedensten Zwecken (z.b. maschinelle Übersetzung, Diktie r- programme, Rechtschreibungs-Korrekturprogramme usw.), ein Bereich, der seit Jahren in unserer Informations- und Kommunikations-Gesellschaft immer größere Bedeutung erlangt. Die automatische Verarbeitung natürlich-sprachlicher Texte wird angesichts der stetig wachsenden Informationsflut und der immer größeren Mengen an textuell dokumentiertem Wissen unverzichtbar. Information Retrieval (Das Wiederauffinden relevanter Daten und Texte) aus Archiven, Datenbanken, dem Internet etc. muss sich daher mehr und mehr auf Sprachverarbeitung durch Computer stützen. Ähnlich, wie die Erfindung und Schaffung von Maschinen in früheren Zeiten den Menschen körperlich schwere Arbeit (teilweise) abnahm, wird heute der Computer mit Hilfe der Computerlinguistik zu einer Maschine, die Teile der anders nicht zu bewältigenden Aufgaben im Bereich Information/Kommunikation übernehmen kann. Für diesen gesamten Bereich ist auch das Kürzel NLP (natural language processing, maschinelle Sprachverarbeitung) üblich. 2

3 Grundlagenorientierte Computerlinguistik Die Sprachwissenschaft bedient sich heute der Computertechnik als Instrument bei der emp i- rischen Forschung, bei der Beschreibung von Forschungsresultaten und bei der Überprüfung linguistischer Modelle und Hypothesen. So werden unter anderem Rechner eingesetzt, um sehr große Mengen von Sprachdaten (z.b. Textkorpora) untersuchen zu können (vor allem mit Hilfe statistischer und anderer quantitativer Methoden), um möglichst fehlerfrei und komfortabel komplexe Beschreibungen von Sprachen anfertigen zu können (Wörterbücher, Grammatiken), um große Sammlungen textueller Daten anzulegen und zu pflegen (Korpuslinguistik), um komplizierte linguistische Beschreibungen wie formale Grammatiken auf Vollständigkeit und Widerspruchsfreiheit zu prüfen, um Hypothesen und Sprachgesetze anhand von Datenmaterial an der Sprachwirklichkeit zu testen. Darüber hinaus erforscht diese computerlinguistische Teildisziplin, wie Menschen sprachlich vermittelte Informationen erkennen, interpretieren und verarbeiten. Diese Erkenntnisse werden dann formalisiert, in Algorithmen organisiert und schließlich in Programme umgewandelt, um die Prozesse, die bei menschlicher Sprachverarbeitung ablaufen, auf dem Computer zu simulieren. Somit werden neue Erkenntnisse erzielt, die man auch bei der Entwicklung maschineller sprachverstehender Systeme (angewandte Computerlinguistik) einsetzen kann. Linguistik Kommunikations- Informatik wissenschaft Linguistische Datenverarbeitung/ Computerlinguistik (Sprach-) Mathematik Psychologie Philosophie 1.2. Entstehung und Entwicklung der Computerlinguistik Man kann sagen, dass die Computerlinguistik so alt ist wie der Computer: 1945 wird der erste Computer (Z4) von Conrad Zuse in Deutschland entwickelt, ein Jahr später entsteht der ENIAC (Electron Numeric Integrator and Computer) in den USA; beide basieren auf Alan Turings Automaten-Modell der algorithmischen Verarbeitung. Linguistische Datenverarbeitung ist zunächst gleichbedeutend mit Ver- und Entschlüsselung von Texten (auch hier leistete Alan Turing Pionierwerk) wird das Georgetown-Experiment (automatische Übersetzung russischer Texte) durchgeführt. Im Zuge des kalten Krieges werden bedeutende Mittel für die Entwicklung der maschinellen Übersetzung vom US-Militär bereit gestellt. Aufgrund der vernichtenden Kritik des 3

4 ALPAC-Report (Automatic Language Processing Advisory Committee, ) werden die Förderungen wieder eingestellt. Entwicklung in den folgenden Jahrzehnten : Chomsky entwickelt die formalen Grammatiken. Fundamentale Forschung in instrumenteller Phonetik => erste maschinelle Spracherkennung (= Analyse und Interpretation gesprochener Sprache) Anfang der 50er. Erste probabilistische Ansätze innerhalb der natürlichen Sprachverarbeitung : Aufsplittung der NLP (Natural Language Processing) in symbolische und stochastische (wahrscheinlichkeitstheoretische) Paradigmen. Entstehung des Forschungsfeldes der Künstlichen Intelligenz mit seinem bedeutendsten Entwicklungsziel der Expertensysteme. Erste Programm-Module zur Überprüfung und Korrektur der Orthografie. Entwicklung von Dialog-Systemen (z.b. Eliza von Weizenbaum und Lunar von Woods). Dokumenten- Retrieval-Systeme : Stochastisches Paradigma gewinnt eine immer größere Bedeutung. Logikbasiertes Paradigma entsteht durch die Arbeiten von Colmerauer, Kay, Bresnan und Kaplan. Das Feld der NLP macht große Fortschritte, unter anderem durch Winograds SHRDLU (System, in dem ein simulierter Roboter Klötze innerhalb seiner Welt gemäß natürlichsprachlicher Anweisungen bewegt). Vollautomatische Übersetzung (SYSTRAN) : Wiedereinführung zweier Modelle, die Anfang der 60er Jahre an Bedeutung ve r- loren hatten, nämlich das Modell der Endlichen Automaten und das des Empirismus. Verbreitung von konnektionistischen Ansätzen (künstliche neuronale Netze). Unifikationsgrammatiken (LFG, GPSG, HPSG) kommen auf. Übersetzer-Hilfsmittel: Translation-Memory- Systeme. Ab 1990: Aufgrund der Speicherkapazität und der Schnelligkeit heutiger Computer gibt es inzwischen viele kommerzielle Programme, die auf den Forschungen im Gebiet der NLP beruhen (z.b.: Rechtschreibungs- und Grammatik-Korrekturprogramme, Diktier- und Vorlesesysteme, Textkategorisierung, Suchmaschinen, Dokumentenmanagement, Wissensmanagement, (multimediale) Hypertext- bzw. Hyperdokument-Systeme). Probabilistische und datengesteuerte Modelle haben sich auf dem Gebiet der NLP zunehmend etabliert. Durch die Entstehung des Internet erlangt Information Retrieval besondere Bedeutung. Allgemein hat die heutige Gesellschaft einen wachsenden Bedarf an Verfahren und Hilfsmitteln zur Bewältigung der Informationsflut (Stichwort Informationsgesellschaft; dynamische Bereiche Info r- mationstechnologie (IT) und Telekommunikation Das Studium der LDV/ CL in Trier Für das Studium des Fachs LDV an der Universität Trier werden folgende Schwerpunkte gesetzt: Grundlagen der LDV: Linguistische Grundlagen, Mathematische Grundlagen und Logik, Grundlagen der Informatik und Softwaretechnik, Wissenschaftstheorie; Aktuelle computerlinguistische Modelle und Verfahren (Lemmatisierung/ Tagging, Parsing, semantische Analyse, Textstruktur, Hypertexte) und ihre Anwendungen (maschinelle Übersetzung, Dialog- und Informationssysteme, multimediale Repräsentation, Information Retrieval,...); Quantitative Linguistik: Sprachstatistik, Sprachgesetze und Sprachtheorie, statistische Verfahren für Korpuslinguistik/NLP. 4

5 Eine Besonderheit der Computerlinguistik in Trier ist die Betonung der Quantitativen Linguistik (als einzige Universität in Deutschland bietet die Universität Trier sogar einen Promotionsstudiengang Quantitative Linguistik an). Wahrscheinlichkeitstheoretische Modelle, statistische und andere quantitative Methoden haben sich in der Computerlinguistik durchgesetzt und sind vor allem aus den sprachtechnologischen Anwendungen nicht mehr wegzudenken. 2. Sprachwissenschaftliche Grundfrage Wie kommt es, dass wir mithilfe bestimmter Geräusche Handlungen vollziehen können, z.b. Informationen vermitteln, eine Verpflichtung eingehen, Gefühle äußern,...? Das nachfolgende Modell soll verdeutlichen, dass ein Sprecher, wenn er eine Absicht hat und sich daraufhin sprachlich äußert, mittels bestimmter Geräusche, die eine Bedeutung tragen können, eine bestimmte Wirkung erzielen kann. Geräusch Bedeutung Absicht sprachliche Äußerung Wirkung Einerseits wird im Fall von Sprache von Einheiten wie Laut, Silbe oder Wort ausgegangen, andererseits lassen sich im Sprachschall diese konkreten Einheiten nicht finden. So dass es sich als schwierig erweist, zu diesen Einheiten Entsprechungen im Sprachschall ausfindig zu machen. Zur Klärung der Frage, wie eine physikalische Erscheinung (Schall) einen besonderen Effekt (Bedeutung, Wirkung) haben kann, bedient man sich in der Linguistik, wie auch in der Wissenschaft und Technik, eines Modells. Modelle werden zur Vereinfachung genutzt und beschränken sich nur auf die jeweils relevanten Aspekte. Zur Lösung der oben erwähnten sprachwissenschaftlichen Grundfrage bedarf es eines Modells der Kommunikation, der Sprache und des Textes. Hierfür soll ein vereinfachtes kybernetisches Kommunikationsmodell vorgestellt werden. Sprecher/ Hörer/ Autor/ Text Leser/ Expendient Perzipient V = Vokabular V E V gem V P E = Expendient P = Perzipient gem = gemeinsam Dieses ist ein sehr einfaches Modell, es abstrahiert völlig von der Komplexität des verwendeten Zeichensystems. So genügt z.b. nicht eine Menge von Zeichen (z.b. Wörtern), sondern es sind auch grammatische Regeln zur Verknüpfung dieser Zeichen und Regeln zur Ableitung der Bedeutung aus den generierten Ausdrücken erforderlich. Für die Seite des Sprechers/Autors sind analog Regeln zur Codierung der Bedeutung in Ausdrücke unabdingbar. In jedem Fall hängt die Möglichkeit einer erfolgreichen Kommunikation von der Größe der 5

6 Schnittmenge zwischen den Vokabularen (bzw. eben komplexen Regelsystemen) der Beteiligten ab. Neuere Modelle der Generierung bzw. Produktion wie auch der Analyse oder Interpretation sprachlicher Äußerungen für linguistische Zwecke sind meist in linguistische Analyseebenen organisiert.. Das komplexe Ganze wird in mehrere Teilmodelle untergliedert, da das Untersuchen einer einzelnen Ebene und ihres Zusammenwirkens leichter fällt als die Untersuchung des unstrukturierten Ganzen. Dafür könnte zum Beispiel folgendes Ebenenmodell verwendet werden: Phonetik Phonologie Morphologie Lexik Syntax Semantik Pragmatik Jede Ebene entspricht einer linguistischen Teildisziplin und somit einer eigenen Wissenschaft. Die Phonetik beschäftigt sich mit dem (Sprach-)Schall, und Phonologie untersucht die einzelnen Laute als bedeutungstragende Elemente und deren Funktionen. Die Morphologie beha n- delt die (Wort-)Formenlehre, während sich die Lexik mit dem Wortschatz auseinandersetzt. Unter Syntax versteht man die Analyse der Strukturen, die aus mehreren Wörtern bestehen (Phrasen oder Sätze), und die Semantik beschäftigt sich mit der Bedeutungslehre. Die Pragmatik hingegen hat die Zeichenverwendung als Thema. Eine solche Gliederung entspricht natürlich nicht der sprachlichen Wirklichkeit, sondern ist ein Konstrukt der Wissenschaft, somit ein Modell, dessen man sich bedient. Zusammenfassung o diskrete Einheiten der Sprache (Laut, Silbe, Wort,...) finden sich nicht im Sprachschall o zunächst Klärung der Frage, wie Schall eine Bedeutung/ Wirkung besitzen kann o allgemeine wissenschaftliche/ technische Vorgehensweise: Verwendung von Modellen o dienen Vereinfachung, auf relevante Aspekte beschränkt, übrige Informationen weggelassen o im linguistischen Zusammenhang sind Modelle der Kommunikation, der Sprache und des Texts erforderlich o Beispiel dafür: vereinfachtes kybernetisches Kommunikationsmodell: o altes Modell!, heute wissen wir, dass wir zur Verständigung ein komplexes o gemeinsames Codesystem benötigen o jegliche Modelle sprachlicher Äußerungen für (computer-) linguistische Zwecke sind mehrere Teilmodelle untergliedert o komplexes Ganzes in linguistische Analyseebenen unterteilt (es ist leichter, einzelne Ebenen als das Ganze zu untersuchen) o Beispiel für ein Ebenenmodell: Phonetik Phonologie Morphologie Lexik Syntax Semantik Pragmatik o jede Ebene entspricht einer wissenschaftlichen Teildisziplin: o Phonetik: (Sprach-)Schall o Phonologie: Analyse der Funktionen der Laute o Morphologie: (Wort-)Formenlehre o Lexik: Wortschatz o Syntax: Strukturen aus mehreren Wörtern (Phrasen, Sätze) o Semantik: Bedeutungslehre o Pragmatik: Zeichenverwendung o Eine solche Gliederung entspricht nicht der sprachlichen Wirklichkeit, sondern ist ein Konstrukt der Wissenschaft/ ein Modell 6

7 o auch die schon bekannten/ noch einzuführenden Einheiten/ Eigenschaften haben Modellcharakter 3. Strukturalismus Ferdinand de Saussure, Professor für Sprachwissenschaft an der Universität Genf, gilt als Urvater des Strukturalismus. Dieser beruht auf seinem 1916 posthum erschienenen Werk Cours de linguistique générale ; welches aufgrund der Mitschriften seiner Studenten (Bally und Sachehaye) von 1907 bis 1911 entstand. Der Strukturalismus löst die zuvor vorherrschende ü- berwiegend historisch-vergleichende (diachrone) Sprachwissenschaft (in Europa fast ausschließlich Indogermanistik) ab und wendet sich der synchronen (Betrachtung der Sprache zu einem gegebenen Zeitpunkt) Betrachtungsweise zu. Im Begriff Strukturalismus ist der Terminus Struktur enthalten, der für de Saussure besondere Wichtigkeit hatte. Die Strukturalisten setzten den Begriff Struktur mit dem des Systems gleich (im Gegensatz zur modernen Systemtheorie). Eine Struktur ist definiert als eine Menge von Elementen (in diesem Fall die Menge der sprachlichen Zeichen) und den Relationen zw i- schen den Elementen. Das bedeutet: Ein Zeichen erhält erst seinen sprachliches Wert durch die Beziehung zu anderen Zeichen. Sämtliche Zeichen stehen in Opposition zueinander, das heißt: Ein Zeichen lässt sich negativ als das beschreiben, was alle anderen Zeichen nicht sind. Zum Beispiel ein Tisch ist eben kein Stuhl oder kein Schrank, dadurch erhält der Ausdruck Tisch an sich erst seine Bedeutung. Die Bedeutung des Worts Tisch ist unscharf, auf jeden Fall endet die Reichweite der Gegenstände, die unter Tisch fallen da, wo die Reichweite anderer Wörter beginnt. Ein einsames Zeichen, ohne weitere Zeichen, mit denen es in Zusammenhang steht, hätte keine Funktion oder Bedeutung. Heute haben wir eine erweiterte Sichtweise. Aus der modernen Sicht besteht ein System aus Struktur und Funktionen (sowie aus Prozessen, soweit das betreffende System ein dynamisches ist). Beispiele für Systeme sind: physikalische Systeme wie das Sonnensystem, soziale Systeme wie die Familie oder konzeptuelle Systeme wie ein Algorithmus. Als Funktion eines Systems bezeichnet man die Transformation eines Inputs durch seine Struktur in einen Output. Zur Verdeutlichung: das Radio (die Struktur) transformiert elektrischen Strom aus der Steckdose und elektromagnetische Wellen von der Antenne (Input) in Musik oder Sprache (Output). Auch die Idee des Systems hat Modellcharakter. Wenn wir sagen, dass etwas ein System sei, so ist damit eigentlich gemeint, dass wir es aus bestimmten Gründen als System betrachten wollen; eine Gegebenheit der Natur ist es nicht. Die wichtigsten von de Saussure geprägten Begriffe (Dichotomien) des Strukturalismus: langue parole (= Sprache) Sie entspricht einem abstrakten System von Zeichen und Regeln, das alle Angehörigen einer Sprachgemeinschaft (wenigstens teilweise) kennen; dieses System ist nicht nur abstrakt sondern auch relational, da alle Zeichen durch Beziehungen zueinander definiert sind. (= Rede) Das ist die konkrete Realisierung der langue eines Individuums und somit der einzig beobachtbare Aspekt der Sprache (im gesprochenen oder geschriebenen Text). Elemente der parole werden durch das gebildet, was Sprecher bzw. Schreiber produzieren. Sie können dies nur aufgrund der langue. 7

8 langage = die allgemeine Sprachfähigkeit des Menschen Synchronie Diachronie Die synchrone Sprachwissenschaft untersucht und beschreibt eine Sprache (oder Teile einer Sprache) zu einem gegebenen Zeitpunkt, ohne mit früheren Eigenschaften (Wörtern, Formen, Regeln) zu argumentieren. Die diachrone Sprachwissenschaft untersucht den historischen Wandel von Elementen einer Sprache im Verlauf der Zeit. syntagmatisch paradigmatisch Syntagmatische Beziehungen eines Sprachelements ist sind ihr Verhältnis zu Vorgä n- gern und Nachfolgern, also eine horizontale Relation. Diese Beziehungen bestehen auf allen Ebenen der Sprache, also z.b. auf Satz-, Teilsatz-, Phrasen-, Wort-, Lautebene u.s.w. Paradigmatische Beziehungen eines Sprachelements bestehen in seiner Beziehung zu anderen Elementen, die an seiner Stelle stehen könnten. Diese Beziehungen bestehen auf allen Ebenen der Sprache, also z.b. auf Satz-, Teilsatz-, Phrasen-, Wort-, Lautebene u.s.w. Beispiel auf Wortebene (Beziehungen zwischen Lauten) Paradigmatische Beziehungen syntagmatische Beziehungen Hund Bund Band Hand Beispiel auf Satzebene (Beziehungen zwischen Wörtern) Paradigmatische Beziehungen syntagmatische Beziehungen Das Schloss Dieses Fenster Ein Tor Sein... Ihr... ist war blieb... wäre zu auf verschlossen neu... 8

9 redundant relevant Das ist alles, was nicht distinktiv (erforderlich zur Unterscheidung) ist. So sind zum Beispiel in die alten Äste 3 dieser 4 Pluralmarkierungen redundant, soweit es um das Merkmal Plural geht. Das heißt aber nicht, dass die 3 redundanten Markierungen nutzlos sind. Aus der Grammatik wissen wir, dass sie unter anderem für die Kongruenz ausgenutzt werden können. Redundanz ist also wichtig, um Informationsübermittlung sicher zu machen Relevant ist alles, was distinktiv, also zur Unterscheidung erforderlich ist. Ferdinand de Saussure prägte auch einen Zeichenbegriff, dieser ist zweiseitig. Er untersche i- det Ausdruck (= Bezeichnendes/ Form, französisch: signifiant) und Bedeutung (= Bezeichnetes/ Inhalt, französisch: signifié), wobei diese beiden Seiten des Zeichens untrennbar miteinander verbunden sind. Dies kann man folgendermaßen illustrieren: Arbitrarität / Konvention Zur Zeit des Aufkommens des Strukturalismus war es notwendig, darauf hinzuweisen, dass Symbole (dazu gehören die Zeichen der Sprache) keine natürliche Beziehung zwischen Ausdruck und Inhalt besitzen. Eine jede Sprache formt Ausdrücke für beliebige Bedeutungen, und dabei kommt die Verbindung zwischen Form und Inhalt durch Konvention zustande. Früher glaubte man, die Wörter seien mit dem Wesen der Dinge verbunden (z.b. aufgrund göttlicher Schöpfung). Man darf Arbitrarität allerdings nicht mit völliger Beliebigkeit ve r- wechseln. So wird man keine Sprache finden, in der die Bedeutung von du oder ist mit Ausdrücken kodiert ist, die zum Beispiel 22 Silben lang wären. Es gibt vielmehr allgemeine Sprachgesetze, die bestimmte Zusammenhänge steuern, so unter anderem den Zusammenhang zwischen Länge und Häufigkeit von Ausdrücken. Solche Gesetze untersucht die Quant i- tative Linguistik. 9

10 Zusammenfassung o F. de Saussure : Professor für Sprachwissenschaft in Genf, Urvater des Strukturalismus o posthum (1916) erschienenes Werk Cours de linguistique générale ; entstand aus Mitschriften seiner Studenten o Strukturalismus löste überwiegend historisch-vergleichende (diachrone) Sprachwissenschaft ab o Struktur = System = Menge von Elementen (sprachliche Zeichen) + Relationen zwischen den Elemente (ein Zeichen erhält sprachlichen Wert durch Beziehungen zu anderen Zeichen) o Heute: System = Struktur und Funktionen, System ist dynamisch, es laufen Prozesse ab o Beispiele für Systeme: Physikalische Systeme (Sonnensystem), soziale Systeme (Familie) o Wichtige Dichotomien des Strukturalismus: Langue : (= Sprache), abstraktes Zeichensystem/ Regeln, das alle Sprecher einer Sprachgemeinschaft kennen, alle Zeichen stehen in Beziehung zueinander Parole: (= Rede), konkrete Realisierung der langue, beobachtbarer Sprachaspekt langage: allgemeine Sprachfähigkeit des Menschen Synchronie: Beschreibung einer Sprache zu einem Zeitpunkt Diachronie: Untersuchung des historisches Wandel einer Sprache, im Zeitverlauf deskriptiv: (= beschreibend), wie Sprachbenutzer tatsächlich sprechen präskriptiv: (=normativ, vorschreibend), wie Sprachbenutzer zu sprechen haben, z.b. die traditionelle /vorstrukturalistische Grammatik; Schule, Sprachpolitik syntagmatisch: Beziehung eines Sprachelements zu Vorgängern und Nachfolgern, horizontal paradigmatisch: Verankerung eines Elements im System durch vertikale Austauschbarkeit (nicht nur Satzebene!) relevant: alles, was an Merkmal distinktiv ist redundant: überflüssiges/ nicht distinktives Merkmal; jedoch nicht nutzlos, sondern für Kongruenz ausgenutzt; Redundanz macht Informationsübermittlung sicher o Zeichenbegriff nach de Saussure: zwei untrennbar miteinander verbundene Seiten Ausdruck (= Form, signifiant) und Bedeutung (= Inhalt, signifié) o Arbitrarität: es gibt keine natürliche Beziehung zwischen Ausdruck und Inhalt, Verbindung zwischen Form und Inhalt konventionell; jedoch nicht völlig beliebig (gewisse Sprachgesetze regeln Zusammenhänge) 3.1. Verschiedene strukturalistische Schulen 1929 wurde die Prager Schule gegründet, die nach dem Funktionieren und nach den Funktionen von Sprache fragt. Sie ist stark sozio- und psycholinguistisch geprägt. Ihre bedeutenden Vertreter sind Roman Jakobson und Nikolai Trubetzkoy sowie Karl Bühler. Die Kopenhagener Schule wurde 1933 gegründet und versucht mit einem hohen Grad an Ab s- traktheit eine formalisierte Sprachbeschreibung zu erreichen. Dabei arbeitet diese Schule deduktiv, also von der langue aus. Besonders bemüht ist die Kopenhagener Schule auch um die Glossematik. Ihre bekanntesten Vertreter sind Hjelmslev und Brøndal. Im gleichen Jahr wurde die Amerikanische Schule gegründet, die auf Bloomfields Werk Language basiert und behavioristisch (nach Skinner) geprägt ist. Diese strukturalistische Schule arbeitet induktiv, von der parole aus, und die bekanntesten Anhänger sind Boas und Sapir. 10

11 Kommunikationsmodell nach Roman Jakobson Sender/ Sprecher Gegenstand Nachricht Kontaktmedium (Kanal) Sprachlicher Code Empfänger/ Hörer expressive Funktion: Ausdruckswunsch apellative Funktion: Hörer wird zu etwas aufgefordert referentielle Funktion: es soll ein Inhalt vermittelt werden phatische Funktion: Überprüfung des Kanals (Versteht mich der andere?) metasprachliche Funktion: Möglichkeit mit Sprache über Sprache zu reden poetische Funktion: Sprachform, Redewendungen, Organonmodell von Karl Bühler 1934 Ausdruck/ Appell/ Symptom Signal Z Zeichenfunktion Sender Empfänger Ausdruck (Schall) Z Darstellung/ Symbol Z Gegenstände und Sachverhalte apperzeptive Ergänzung: das Zeichen ist nicht ganz vollständig, doch der Hörer ist in der Lage, Informationen unbewusst zu ergänzen abstraktive Relevanz: alles Überflüssige wird ausgeblendet Zusammenfassung o Prager Schule: 1929 gegründet, Frage nach Funktionieren/ Funktionen von Sprache, stark sozio- und psycholinguistisch geprägt, Vertreter: Roman Jakobson und Nikolai Trubetzkoy, Anhänger Karl Bühler o Amerikanische Schule: 1933 gegründet, basiert auf Bloomfields Werk Language, behavioristisch geprägt vom (nach Skinner), arbeitet induktiv (von parole aus) o Kopenhagener Schule: 1933 gegründet, Suche nach formalisierter Sprachbeschreibung, arbeitet deduktiv (von langue aus), Glossematik, Vertreter: Louis Hjelmslev und Brøndal 11

Linguistik für Kognitionswissenschaften

Linguistik für Kognitionswissenschaften Linguistik für Kognitionswissenschaften Computerlinguistik: Maschinelle Übersetzung Computerlinguistik Fehlübersetzung von engl. computational linguistics - computationelle Linguistik beinhaltet im weiteren

Mehr

Frieder Nake: Information und Daten

Frieder Nake: Information und Daten Frieder Nake: Information und Daten Mit Grundlagen der Zeichentheorie nach Morris Seminar 31120: Information Philosophische und informationswissenschaftliche Perspektiven, SS 2004 Frieder Nake: Information

Mehr

Einführung Computerlinguistik. Überblick

Einführung Computerlinguistik. Überblick Einführung Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-14 Schütze & Zangenfeind: Überblick 1 / 30 Take-away Schütze

Mehr

Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1.

Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1. Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1. Zusammengefasst aus Ihren Beiträgen Wie bewerten sie das System ingesamt? Das Watson System verdeutlicht den Fortschritt der Künstlichen Intelligenz Forschung/Computerlinguistik/Informatik

Mehr

Maturandentag 2005 Computerlinguistik

Maturandentag 2005 Computerlinguistik Maturandentag 2005 Computerlinguistik http://www.ifi.unizh.ch/cl/ 13./14. September 2005 Maturandentag 2005 Computerlinguistik 13./14. September 2005 http://www.ifi.unizh.ch/cl/ 1 / 11 Computerlinguistik

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Vorläufiges Programm Einführung in die Computerlinguistik WS 2011/12 Manfred Pinkal 25.10.11 Einführung 8.11.11 Morphologie und Automaten 15.11.11 Morphologie und Automaten 22.11.11 Syntax 29.11.11 Parsing

Mehr

Informatik und Informationstechnik (IT)

Informatik und Informationstechnik (IT) Informatik und Informationstechnik (IT) Abgrenzung Zusammenspiel Übersicht Informatik als akademische Disziplin Informations- und Softwaretechnik Das Berufsbild des Informatikers in der Bibliothekswelt

Mehr

Die Informatik als junge Wissenschaft

Die Informatik als junge Wissenschaft Die Informatik als junge Wissenschaft Die Informatik ist die Wissenschaft von der automatischen Informationsverarbeitung. Die Informatik befasst sich mit den Gesetzmäßigkeiten und Prinzipien informationsverarbeitender

Mehr

Grundlagen der natürlichsprachlichen Mensch-Computer Interaktion

Grundlagen der natürlichsprachlichen Mensch-Computer Interaktion Grundlagen der natürlichsprachlichen Mensch-Computer Interaktion Donnerstag 29. 04. 2004 2-1 Richtziel: Erlernen möglicher Verwendung von Markup-Programmiersprachen für Modellierung der natürlichsprachlichen

Mehr

Grenzen und Gemeinsamkeiten: Die Beziehung zwischen der Computerlinguistik und den Digital Humanities

Grenzen und Gemeinsamkeiten: Die Beziehung zwischen der Computerlinguistik und den Digital Humanities Grenzen und Gemeinsamkeiten: Die Beziehung zwischen der Computerlinguistik und den Digital Humanities Gerhard Heyer Universität Leipzig heyer@informatik.uni-leipzig.de Institut für Informatik Kurzvorstellung

Mehr

Unterscheidung von System, Norm und Rede bei Coseriu anhand eines Beispiels!

Unterscheidung von System, Norm und Rede bei Coseriu anhand eines Beispiels! Was versteht man unter Konversion? Konversion ist das Überwechseln eines Wortes in eine andere Wortart ohne Veränderung seiner Ausdrucksseite. Konversion wird auch zero-derivation genannt und kommt häufig

Mehr

1 Vom Problem zum Programm

1 Vom Problem zum Programm 1 Vom Problem zum Programm Ein Problem besteht darin, aus einer gegebenen Menge von Informationen eine weitere (bisher unbekannte) Information zu bestimmen. 1 Vom Problem zum Programm Ein Algorithmus ist

Mehr

Wer ist schlauer: Mein Computer oder ich?

Wer ist schlauer: Mein Computer oder ich? Stephan Weller Fakultät für Wirtschaftsinformatik und Angewandte Informatik Otto-Friedrich Universität Bamberg Dank an Hans-Dieter Burkhard (Kinderuni HU Berlin, 2004, Warum sind wir schlauer als Roboter?

Mehr

Dossier Die Leipziger Schule der Übersetzungswissenschaft

Dossier Die Leipziger Schule der Übersetzungswissenschaft Dossier Die Leipziger Schule der Übersetzungswissenschaft 1. Einleitung 2. Gesetzmäßigkeiten in der Übersetzung (Otto Kade) 3. Translation und Translationslinguistik (Gert Jäger) 4. Pragmatische Aspekte

Mehr

2 Informationstheorie

2 Informationstheorie 2 Informationstheorie Formale Grundlagen der Informatik I Herbstsemester 2012 Robert Marti Vorlesung teilweise basierend auf Unterlagen von Prof. emer. Helmut Schauer Grundbegriffe Informatik (IT: Information

Mehr

Einführung in die Informatik

Einführung in die Informatik Einführung in die Informatik Geschichte und Einteilung der Informatik 01101101 01011001 11010011 10011000 00000011 00011100 01111111 11111111 00110100 00101110 11101110 01110010 10011101 00111010 2 Der

Mehr

Klausur Kommunikation I. Sommersemester 2003. Dipl.-Ing. T. Kloepfer

Klausur Kommunikation I. Sommersemester 2003. Dipl.-Ing. T. Kloepfer Kommunikation I 1 Klausur Kommunikation I Sommersemester 2003 Dipl.-Ing. T. Kloepfer Bearbeitungsinformationen Aufbau der Klausur Die Klausur ist wie folgt aufgebaut: Die Klausur ist in 18 Aufgaben unterteilt.

Mehr

6. ÜBERBLICK ÜBER DIE ÜBERSETZUNGSWISSENSCHAFT

6. ÜBERBLICK ÜBER DIE ÜBERSETZUNGSWISSENSCHAFT 26 6. ÜBERBLICK ÜBER DIE ÜBERSETZUNGSWISSENSCHAFT 6.1. GESCHICHTE DER ÜBERSETZUNGSWISSENSCHAFT Die Übersetzungswissenschaft ist eine sehr junge akademische Disziplin und wurde erst Anfang der 60er Jahre

Mehr

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik

Informationsveranstaltung Linguistische Informatik & Korpuslinguistik Informationsveranstaltung Linguistische Informatik & Korpuslinguistik Prof. Dr. Stefan Evert Professur für Korpuslinguistik http://www.linguistik.uni-erlangen.de/ 2 Was ist Linguistische Informatik? Korpuslinguistik

Mehr

Inhaltsverzeichnis. Danksagung. Einleitung 1

Inhaltsverzeichnis. Danksagung. Einleitung 1 Inhaltsverzeichnis Prolog Danksagung XI XVI Einleitung 1 1 Der Informationsbegriff.3 1.1 Die Geschichte des Informationsbegriffes 3 1.2 Das Sender-Kanal-Empfänger-Schema 6 1.3 Der sprachwissenschaftliche

Mehr

Geschichte der Maschinellen Übersetzung. Einleitung Entwicklungsgeschichte der MÜ

Geschichte der Maschinellen Übersetzung. Einleitung Entwicklungsgeschichte der MÜ Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ Einleitung MÜ als Modellierung des Übersetzungsprozesse MÜ als Mechanisierung menschlicher TätigkeitT Hochqualitative vollautomatische

Mehr

Lehrplan Physik. Bildungsziele

Lehrplan Physik. Bildungsziele Lehrplan Physik Bildungsziele Physik erforscht mit experimentellen und theoretischen Methoden die messend erfassbaren und mathematisch beschreibbaren Erscheinungen und Vorgänge in der Natur. Der gymnasiale

Mehr

Wissenschaftsphilosophie der Kognitionswissenschaft

Wissenschaftsphilosophie der Kognitionswissenschaft Wissenschaftsphilosophie der Kognitionswissenschaft Vorlesung 1. Einführung und Überblick In der heutigen Stunde erwartet Sie: eine Einführung in unser Thema o Themen einer Standard-Wissenschaftstheorie

Mehr

Sprechen wir über Zahlen (Karl-Heinz Wolff)

Sprechen wir über Zahlen (Karl-Heinz Wolff) Sprechen wir über Zahlen (Karl-Heinz Wolff) Die Überschrift ist insoweit irreführend, als der Autor ja schreibt und nicht mit dem Leser spricht. Was Mathematik im allgemeinen und Zahlen im besonderen betrifft,

Mehr

Schon als Tier hat der Mensch Sprache.

Schon als Tier hat der Mensch Sprache. Schon als Tier hat der Mensch Sprache. Herder und seine Abhandlung über den Ursprung der Sprache 2 Ebenen der Sprachursprungsfrage 1. Ontogenetischer Sprachursprung: Sprachentstehung im Individuum (Spracherwerb

Mehr

Wissen aus unstrukturierten natürlichsprachlichen

Wissen aus unstrukturierten natürlichsprachlichen ZKI Tagung AK Supercomputing, 19.-20. Okt. 2015 Wissen aus unstrukturierten natürlichsprachlichen Daten Sprachtechnologie und Textanalytik in the large Udo Hahn Jena University Language & Information Engineering

Mehr

Ziele und Herausforderungen

Ziele und Herausforderungen Ziele und Herausforderungen Text soll automatisch aus einer Quellsprache in eine Zielsprache übertragen werden Dabei soll die Funktion des Textes erhalten bleiben Es werden sowohl computerlinguistische

Mehr

Informatik Programmiersprachen eine kurze Übersicht

Informatik Programmiersprachen eine kurze Übersicht Informatik eine kurze Übersicht Seite 1 natürliche Sprachen (nach Wikipedia) ca 6500 gesprochene Sprachen davon etwa die Hälfte im Aussterben etwa 500 Schriftsprachen mit gedruckten Texten P. Bueghel Turmbau

Mehr

Modulehandbuch für die B.A.-Studiengänge der Fächergruppe Romanistik

Modulehandbuch für die B.A.-Studiengänge der Fächergruppe Romanistik Romanisches Seminar Modulehandbuch für die B.A.-Studiengänge der Fächergruppe Romanistik B.A. Französisch B.A. Italienisch B.A. Spanisch B.A. Portugiesisch (Nebenfach) 1 I. Module: Übersicht Modul 1: Modul

Mehr

Die Informatik-Studiengänge

Die Informatik-Studiengänge Die Informatik-Studiengänge Wissenswertes für Erstsemestler Prof. Dr. Till Tantau Studiendekan MINT-Studiengänge 11. Oktober 2010 Gliederung Wie sollten Sie richtig studieren? Der Bachelor-Studiengang

Mehr

Übersicht für Nebenfächer im Bachelor Mathematik

Übersicht für Nebenfächer im Bachelor Mathematik Übersicht für Nebenfächer im Bachelor Mathematik Im Nebenfachmodul kann aus den Fächern Biologie, BWL, Chemie, Informatik, Life Science, Sprachwissenschaften, Philosophie, Physik, Psychologie, VWL und

Mehr

4. AUSSAGENLOGIK: SYNTAX. Der Unterschied zwischen Objektsprache und Metasprache lässt sich folgendermaßen charakterisieren:

4. AUSSAGENLOGIK: SYNTAX. Der Unterschied zwischen Objektsprache und Metasprache lässt sich folgendermaßen charakterisieren: 4. AUSSAGENLOGIK: SYNTAX 4.1 Objektsprache und Metasprache 4.2 Gebrauch und Erwähnung 4.3 Metavariablen: Verallgemeinerndes Sprechen über Ausdrücke von AL 4.4 Die Sprache der Aussagenlogik 4.5 Terminologie

Mehr

Einführung (0) Erster funktionsfähiger programmgesteuerter Rechenautomat Z3, fertiggestellt 1941 Bild: Nachbau im Deutschen Museum München

Einführung (0) Erster funktionsfähiger programmgesteuerter Rechenautomat Z3, fertiggestellt 1941 Bild: Nachbau im Deutschen Museum München Einführung (0) Erster funktionsfähiger programmgesteuerter Rechenautomat Z3, fertiggestellt 1941 Bild: Nachbau im Deutschen Museum München Einführung (1) Was ist ein Rechner? Maschine, die Probleme für

Mehr

Einführung in die Wirtschaftsinformatik. Daten, Information, Wissen. IT works. Klaus Mairon 2015 1

Einführung in die Wirtschaftsinformatik. Daten, Information, Wissen. IT works. Klaus Mairon 2015 1 Einführung in die Daten, Information, Wissen IT works. Klaus Mairon 2015 1 Agenda è è Aufbau und Arbeitsweise Arten von n / Kategorien Beurteilung der Leistungsfähigkeit von n Netzwerke Klaus Mairon 2015

Mehr

Bedeutungswandel durch Metapher und Metonymie

Bedeutungswandel durch Metapher und Metonymie Heinrich- Heine- Universität Düsseldorf Sommersemester 2012 Seminar: Wortschatz- formal und inhaltlich (Französisch) Seminarleiterin: Nora Wirtz Referentin: Madelaine Schilken Datum: 24.05.2012 Bedeutungswandel

Mehr

Programmieren was ist das genau?

Programmieren was ist das genau? Programmieren was ist das genau? Programmieren heisst Computerprogramme herstellen (von griechisch programma für Vorschrift). Ein Computerprogramm ist Teil der Software eines Computers. Als Software bezeichnet

Mehr

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming

Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Morphologie (5) Wortarten (2) Part-of-Speech Tagging Stemming Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 24.11.2014, 9 c.t. Zangenfeind: Morphologie 1 / 18 Wdh.: Klassifizierung

Mehr

Profil der Wirtschaftsinformatik

Profil der Wirtschaftsinformatik Profil der Wirtschaftsinformatik WKWI und GI FB WI * Die folgenden Ausführungen formulieren das Profil der Wirtschaftsinformatik im deutschsprachigen Raum, wie es von der wissenschaftlichen Gemeinschaft,

Mehr

Brückenkurs / Computer

Brückenkurs / Computer Brückenkurs / Computer Sebastian Stabinger IIS 23 September 2013 Sebastian Stabinger (IIS) Brückenkurs / Computer 23 September 2013 1 / 20 Content 1 Allgemeines zum Studium 2 Was ist ein Computer? 3 Geschichte

Mehr

Kann ein Computer denken?

Kann ein Computer denken? Kann ein Computer denken? Fachbereich Betriebswirtschaft FH www.fh-koblenz.de/bw/komus www.komus.de www.fh-koblenz.de/bw/komus www.fh-koblenz.de/bw/komus 2 www.fh-koblenz.de/bw/komus 3 www.fh-koblenz.de/bw/komus

Mehr

Wiki Wissensmanagement Die richtigen Informationen zur richtigen Zeit am richtigen Ort

Wiki Wissensmanagement Die richtigen Informationen zur richtigen Zeit am richtigen Ort Wiki Wissensmanagement Die richtigen Informationen zur richtigen Zeit am richtigen Ort Übersicht Was bedeutet Wiki? Was ist ein Wiki? Was kann ein Wiki? (C)2005-2008 2 Inhalt Grundlagen Informationen anzeigen

Mehr

Einführung in die Computerlinguistik

Einführung in die Computerlinguistik Einführung in die Computerlinguistik Syntax WS 2006/2007 Manfred Pinkal Einführung in die Computerlinguistik 2006/2007 M. Pinkal UdS 1 Morphologie und Syntax Gegenstand der Morphologie ist die Struktur

Mehr

Einführung in die Computerlinguistik (I)

Einführung in die Computerlinguistik (I) Einführung in die Computerlinguistik (I) Universität Zürich Prof. Dr. Michael Hess Wintersemester 1999/2000 0.1 Begriffsklärung: Was ist Computerlinguistik? Eine erste Antwort auf die Frage lautet folgendermassen:

Mehr

Vier Gewinnt Nicolas Schmidt Matthias Dietsche Bernhard Weiß Benjamin Ruile Datum: 17.2.2009 Tutor: Prof. Schottenloher Spieltheorie

Vier Gewinnt Nicolas Schmidt Matthias Dietsche Bernhard Weiß Benjamin Ruile Datum: 17.2.2009 Tutor: Prof. Schottenloher Spieltheorie Vier Gewinnt Nicolas Schmidt Matthias Dietsche Bernhard Weiß Benjamin Ruile Datum: 17.2.2009 Tutor: Prof. Schottenloher Spieltheorie Präsentation Agenda I. Einführung 1. Motivation 2. Das Spiel Vier Gewinnt

Mehr

Codierung. H.-G. Hopf

Codierung. H.-G. Hopf Codierung H.-G. Hopf Inhalt Informationsübermittlung Codierung von Zeichen GDI: Codierung / 2 Inhalt Informationsübermittlung Codierung von Zeichen GDI: Codierung / 3 Ideale Kommunikation Übertragungskanal

Mehr

Practical Grammar Engineering Using HPSG. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel

Practical Grammar Engineering Using HPSG. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Practical Grammar Engineering Using HPSG Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Inhalt Organisatorisches HPSG Grammatiken Werkzeuge Kodierungen TDL Syntax Über dieses Seminar

Mehr

2. Digitale Codierung und Übertragung

2. Digitale Codierung und Übertragung 2. Digitale Codierung und Übertragung 2.1 Informationstheoretische Grundlagen 2.2 Speicherbedarf und Kompression 2.3 Digitalisierung, Digitale Medien Ludwig-Maximilians-Universität München Prof. Hußmann

Mehr

Zur Verteidigung der Informationstheorie gegen unlautere Angriffe. Bertrand Klimmek,, Mai 2004

Zur Verteidigung der Informationstheorie gegen unlautere Angriffe. Bertrand Klimmek,, Mai 2004 Zur Verteidigung der Informationstheorie gegen unlautere Angriffe Bertrand Klimmek,, Mai 2004 Historischer Überblick bis Mitte des 20. Jahrhunderts: Wohlfahrtsstaat, Keynesianismus, Sci-Fi theoretische

Mehr

Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz)

Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz) Wie funktioniert automatisierte Übersetzung? Prof. Josef van Genabith (Deutsches Forschungszentrum für Künstliche Intelligenz) 1 Maschinelle Übersetzung (MÜ) Überblick: Warum MÜ: Datenmenge, Qualität und

Mehr

Einfach gut formulieren

Einfach gut formulieren Karl-Heinz List Einfach gut formulieren Kurz, klar und korrekt schreiben für Chefs und Personaler Inhalt Inhalt Einleitung: Die Sprache im Beruf...7 Ökonomisch schreiben was heißt das?...11 Sprachgefühl

Mehr

Der Informatikunterricht vermittelt ein breites Grundverständnis über Funktionsweise, Möglichkeiten, Auswirkungen und Grenzen des Computers.

Der Informatikunterricht vermittelt ein breites Grundverständnis über Funktionsweise, Möglichkeiten, Auswirkungen und Grenzen des Computers. INFORMATIK Allgemeine Bildungsziele Der Informatikunterricht vermittelt ein breites Grundverständnis über Funktionsweise, Möglichkeiten, Auswirkungen und Grenzen des Computers. Er vermittelt das Verständnis

Mehr

Was bedeutet Kommunikation?

Was bedeutet Kommunikation? Was bedeutet Kommunikation? Lat. communicare: Alltagsebene: Weiterer Sinn: Mitteilen, teilnehmen lassen, gemeinsam machen, vereinigen Austausch von Gedanken Übermitteln von Daten, Informationen oder Signalen

Mehr

3. Sätze und Formeln

3. Sätze und Formeln Klaus Mainzer, Die Berechnung der Welt. Von der Weltformel zu Big Data, München 2014 29.07.14 (Verlag C.H. Beck, mit zahlreichen farbigen Abbildungen, geb. 24,95, S.352) (empfohlene Zitierweise: Detlef

Mehr

Einführung in die Informatik Grammars & Parsers

Einführung in die Informatik Grammars & Parsers Einführung in die Informatik Grammars & Parsers Grammatiken, Parsen von Texten Wolfram Burgard Cyrill Stachniss 12.1 Einleitung Wir haben in den vorangehenden Kapiteln meistens vollständige Java- Programme

Mehr

Bildverarbeitung in der Medizintechnik

Bildverarbeitung in der Medizintechnik Bildverarbeitung in der Medizintechnik Aufgrund einer Zusammenarbeit mit Würth Elektronik im Gebiet der Medizintechnik ist eine Arbeit aus dem Gebiet der Bildverarbeitung in der Medizintechnik ausgeschrieben.

Mehr

5. Maschinelle Verarbeitung natürlicher Sprache (Computerlinguistik) (1)

5. Maschinelle Verarbeitung natürlicher Sprache (Computerlinguistik) (1) 5. Maschinelle Verarbeitung natürlicher Sprache (Computerlinguistik) (1) 5.1 Vorbemerkungen Wissen, das als Ergebnis menschlichen Denkens vorliegt, wird durch Sprache mitgeteilt. Unterscheidung von Sprachen:

Mehr

Sprachbetrachtung und Medienrevolutionen

Sprachbetrachtung und Medienrevolutionen Priv.-Doz'in Dr. Elisabeth Burr Fakultät 2 / Romanistik Gerhard-Mercator-Universität Duisburg Sprachbetrachtung und Medienrevolutionen 1. EINFÜHRUNG Wie sehr Medienrevolutionen die Sprachbetrachtung determininieren,

Mehr

Herausforderungen bei der Übersetzung und Adaption eines englischen SLI-Screenings ins Deutsche

Herausforderungen bei der Übersetzung und Adaption eines englischen SLI-Screenings ins Deutsche Herausforderungen bei der Übersetzung und Adaption eines englischen SLI-Screenings ins Deutsche Bettina Fürst ULG Klinische Linguistik, MSc Präsentation der Abschluss- Arbeit 20. März 2010, Salzburg Forschungsfragen

Mehr

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Data Mining (ehem. Entscheidungsunterstützungssysteme) Data Mining (ehem. Entscheidungsunterstützungssysteme) Melanie Pfoh Anja Tetzner Christian Schieder Übung WS 2014/15 AGENDA TEIL 1 Aufgabe 1 (Wiederholung OPAL / Vorlesungsinhalte) ENTSCHEIDUNG UND ENTSCHEIDUNGSTHEORIE

Mehr

Automatische Gesprächsauswertung im Callcenter

Automatische Gesprächsauswertung im Callcenter Einleitung Forschungsbeitrag Automatische Gesprächsauswertung im Callcenter Projekt CoachOST Dipl.-Wirtsch.-Inf. Mathias Walther Prof. Dr. Taïeb Mellouli Lehrstuhl für Wirtschaftsinformatik und Operations

Mehr

Nebenfachübersicht im Bachelor und Master Mathematik

Nebenfachübersicht im Bachelor und Master Mathematik Nebenfachübersicht im Bachelor und Master Mathematik Bachelor Mathematik Im Nebenfachmodul kann aus den Fächern Biologie, BWL, Chemie, Informatik, Life Science, Sprachwissenschaften, Philosophie, Physik,

Mehr

Informatik I. Grundlagen der systematischen Programmierung. Peter Thiemann WS 2008/09. Universität Freiburg, Germany

Informatik I. Grundlagen der systematischen Programmierung. Peter Thiemann WS 2008/09. Universität Freiburg, Germany Informatik I Grundlagen der systematischen Programmierung Peter Thiemann Universität Freiburg, Germany WS 2008/09 Organisatorisches Vorlesung Di und Do, 11-13 Uhr, HS 101-00-036 Dozent Prof. Dr. Peter

Mehr

Menschenbilder im Informationszeitalter

Menschenbilder im Informationszeitalter Menschenbilder im Informationszeitalter Andreas Michels 20.12.2013 Menschenbilder im Informationszeitalter - Gliederung Teil I - Zunächst eine Begriffsbestimmung Was sind Menschenbilder Was charakterisiert

Mehr

Kann-Aussagen. Zum Beispiel:

Kann-Aussagen. Zum Beispiel: 1 Kann-Aussagen Hier finden Sie eine Anzahl Kann-Aussagen, Aussagen über Ihre Sprachkenntniss in Deutsch und Englisch. Ich bin daran interessiert, wie gut oder schlecht Sie Ihre eigene Sprachkenntnis in

Mehr

Allgemeine und Vergleichende Sprachwissenschaft (B.A./M.A)

Allgemeine und Vergleichende Sprachwissenschaft (B.A./M.A) Informationen zum Studium Allgemeine und Vergleichende Sprachwissenschaft (B.A./M.A) AVS ALS DISZIPLIN Das Fach Allgemeine und Vergleichende Sprachwissenschaft (AVS), befasst sich sowohl empirisch als

Mehr

Individuelles Bachelorstudium. Software Engineering for Physics

Individuelles Bachelorstudium. Software Engineering for Physics Individuelles Bachelorstudium Software Engineering for Physics 1 Qualifikationsprofil Das individuelle Bachelorstudium Software Engineering for Physics vermittelt eine breite, praktische und theoretische

Mehr

Analyse von Diskursen in Social Media Ein Werkstattbericht

Analyse von Diskursen in Social Media Ein Werkstattbericht Analyse von Diskursen in Social Media Ein Werkstattbericht Ausgangspunkt in der Kommunikationswissenschaft Bisherige Öffentlichkeit: Journalisten als zentrale Vermittler von Themen und Meinungen ( Gatekeeper

Mehr

Gutenberg-Gymnasium, Schulinternes Curriculum im Fach Physik, Klasse 9

Gutenberg-Gymnasium, Schulinternes Curriculum im Fach Physik, Klasse 9 Effiziente Energienutzung: eine wichtige Zukunftsaufgabe der Physik Strom für zu Hause Energie, Leistung, Wirkungsgrad Energie und Leistung in Mechanik, Elektrik und Wärmelehre Elektromotor und Generator

Mehr

Chancen und Grenzen (semi-) automatischer, semantischer Analyse medizinischer Dokumente

Chancen und Grenzen (semi-) automatischer, semantischer Analyse medizinischer Dokumente Chancen und Grenzen (semi-) automatischer, semantischer Analyse medizinischer Dokumente conhit-session: medizinische Dokumentation aktuelle Herausforderungen und Perspektiven Berlin 15.04.2015 ID Information

Mehr

Jubiläumsabo März / April 2012 Jubiläumsausgabe #1-12 Deutschland Euro 12,00 ISSN: 1864-8398 www.dokmagazin.de

Jubiläumsabo März / April 2012 Jubiläumsausgabe #1-12 Deutschland Euro 12,00 ISSN: 1864-8398 www.dokmagazin.de Nur jetzt! Jubiläumsabo März / April 2012 Jubiläumsausgabe #1-12 Deutschland Euro 12,00 ISSN: 1864-8398 www.dokmagazin.de Enterprise Search Strategien für Erfolg Dokumentenmanagement mit SharePoint: Neue

Mehr

Begriffsgeschichte und Diskursgeschichte

Begriffsgeschichte und Diskursgeschichte Dietrich Busse. Fritz Hermanns Wolfgang Teubert (Hrsg.) Begriffsgeschichte und Diskursgeschichte Methodenfragen und Forschungsergebnisse der historischen Semantik Westdeutscher Verlag. Opladen 1994 [vergriffen]

Mehr

Programmiersprachen und Programmierkonzepte

Programmiersprachen und Programmierkonzepte Programmiersprachen und Programmierkonzepte Inhalt Programmiersprachen- Entwicklung Programmiersprachen und Programmierparadigmen Die Geschichte der Programmiersprachen Anfänge vor 200 Jahren Programmierbare

Mehr

Einleitung...11. 1 Grundlagen der Fachkommunikation...17. 1.1 Translatoren und Fachkommunikation...17

Einleitung...11. 1 Grundlagen der Fachkommunikation...17. 1.1 Translatoren und Fachkommunikation...17 INHALT Einleitung...11 1 Grundlagen der Fachkommunikation...17 1.1 Translatoren und Fachkommunikation...17 1.1.1 Theorie und Praxis...17 1.1.2 Wissensmanagement...21 1.1.3 Rahmen und Träger der Fachkommunikation...22

Mehr

Ausarbeitung des Interpreter Referats

Ausarbeitung des Interpreter Referats Ausarbeitung des Interpreter Referats Gliederung 1. Programmiersprache 1.2. Syntax 1.2.1. Konkrete Syntax 1.2.2. Abstrakter Syntax Baum (Abstrakte Syntax) 2. Parser 2.1. Syntaktische Struktur einer Sprache

Mehr

Erste Schritte mit AmphIdent

Erste Schritte mit AmphIdent Erste Schritte mit AmphIdent Maximilian Matthe Dieses Dokument bietet eine einfache Gewöhnung an die Arbeit mit AmphIdent. Für eine tiefergehende Dokumentation lesen Sie das Handbuch zu AmphIdent. Inhaltsverzeichnis

Mehr

Grammatikschreibung im digitalen Zeitalter

Grammatikschreibung im digitalen Zeitalter :: Digitale Grammatikschreibung :: Grammatikschreibung im digitalen Zeitalter SEBASTIAN DRUDE Frankfurt, 2012 06 20 Habilitationsvortrag Grammatik: Beschreibung oder Theorie der Struktur einer Sprache

Mehr

Codierungstheorie Rudolf Scharlau, SoSe 2006 9

Codierungstheorie Rudolf Scharlau, SoSe 2006 9 Codierungstheorie Rudolf Scharlau, SoSe 2006 9 2 Optimale Codes Optimalität bezieht sich auf eine gegebene Quelle, d.h. eine Wahrscheinlichkeitsverteilung auf den Symbolen s 1,..., s q des Quellalphabets

Mehr

Modulhandbuch zum Bachelor-Studium für ein Lehramt an Grundschulen. Sprachliche Grundbildung (Studiengang ohne Vertiefung)

Modulhandbuch zum Bachelor-Studium für ein Lehramt an Grundschulen. Sprachliche Grundbildung (Studiengang ohne Vertiefung) Technische Universität Dortmund Institut für deutsche Sprache und Literatur Oktober 2012 Modulhandbuch zum Bachelor-Studium für ein Lehramt an Grundschulen (Studiengang ohne Vertiefung) Grundlagen der

Mehr

LERNZIELBUCH 1. Semester

LERNZIELBUCH 1. Semester LERNZIELBUCH 1. Semester Name des Schülers/der Schülerin:. Schuljahr RELIGION LERNBEREICH 1: Aufgeschlossenheit für religiöse Themen und Wertvorstellungen LERNBEREICH 2: Kenntnis der wesentlichen Inhalte

Mehr

D A T E N... 1 Daten Micheuz Peter

D A T E N... 1 Daten Micheuz Peter D A T E N.....! Symbole, Alphabete, Codierung! Universalität binärcodierter Daten! Elementare Datentypen! Speicherung binärcodierter Daten! Befehle und Programme! Form und Bedeutung 1 Daten Micheuz Peter

Mehr

Ohne Mathematik undenkbar!

Ohne Mathematik undenkbar! Die tägliche - Suche: Ohne Mathematik undenkbar! Dipl.-Wirt.Math. Jan Maruhn FB IV - Mathematik Universität Trier 29. März 2006 29. März 2006 Seite 1 Gliederung Einleitung und Motivation Das Internet als

Mehr

Die Geschichte des Computers

Die Geschichte des Computers Inhaltsverzeichnis Der Vorbote des Computers... 3 Der Erfinder des ersten Computers... 3 Die Computer... 4 Der erste Computer Z1... 4 Der zweite Computer Z3... 5 Der Mark I... 6 Der ENIAC... 7 Der SSEC...

Mehr

2 Der Schnelleinstieg *

2 Der Schnelleinstieg * 7 2 Der Schnelleinstieg * Eine Programmiersprache können Sie auf verschiedene Art und Weise lernen. Sie können sich zuerst mit den Konzepten befassen und anschließend mit der Praxis oder umgekehrt. Damit

Mehr

POS-ID Modul/Unit/Leistung CP Ja Nein Note

POS-ID Modul/Unit/Leistung CP Ja Nein Note Sprachnachweise Kleines Latinum Englisch (B2 CEF) weitere moderne europäische Fremdsprache (B1 CEF) 601040 Ergänzungsmodul 1: Alte Geschichte (großes 601011 Vorlesung: griechische oder römische Geschichte

Mehr

Castensen KU, Ebert Ch, Ebert C, Jekat S, Klabunde R, Langer H (Hrsg.). Computerlinguistik und Sprachtechnologie. 3. Auflage. Heidelberg: Spektrum

Castensen KU, Ebert Ch, Ebert C, Jekat S, Klabunde R, Langer H (Hrsg.). Computerlinguistik und Sprachtechnologie. 3. Auflage. Heidelberg: Spektrum Präsentation Natural Language and Text Processing in Biomedicine Matthias Baldauf WS 2010/11 Seminar Biomedizinische Informatik 09.12.2010 Einleitung Natural Language Processing (NLP) Computerlinguistik

Mehr

Gesellschaft für Informatik e.v. (GI) www.gi.de. Was ist Informatik?

Gesellschaft für Informatik e.v. (GI) www.gi.de. Was ist Informatik? Gesellschaft für Informatik e.v. (GI) www.gi.de Was ist Informatik? Was ist Informatik? Der Mensch hat seit jeher das Bedürfnis, seine Erkenntnisse anderen nicht nur in der direkten Ansprache über das

Mehr

Logo MIA. Ein cloud basierter Marktplatz für Informationen und Analysen auf dem deutschsprachigen Web

Logo MIA. Ein cloud basierter Marktplatz für Informationen und Analysen auf dem deutschsprachigen Web Logo MIA Ein cloud basierter Marktplatz für Informationen und Analysen auf dem deutschsprachigen Web MIA Konsortium Ausgangslage Das deutschsprachige Web mit derzeit mehr als sechs Milliarden Webseiten

Mehr

Warum studiere ich Informatik und das in Freiburg?

Warum studiere ich Informatik und das in Freiburg? Warum studiere ich Informatik, Studentin der Informatik, Albert-Ludwigs-Universität, Freiburg Mitglied der Fachschaft FAW Informatikjahr 2006 Überblick Warum Informatik Voraussetzungen Inhalte Aussichten

Mehr

Auffälliges Verhalten...? Auffälliges Verhalten...? Bedürfnisse. Warum visuelle Hilfsmittel? Kommunikation durch 02.09.2011

Auffälliges Verhalten...? Auffälliges Verhalten...? Bedürfnisse. Warum visuelle Hilfsmittel? Kommunikation durch 02.09.2011 Visuelle Hilfsmittel zur Kommunikation und Verhaltenssteuerung Charlotte Wandeler Claudia Surdmann Sabine Ell Auffälliges Verhalten...? Was passiert als nächstes? Ich verstehe nicht, was Du mir sagst...

Mehr

Presseinformation. Unser Ansatz ist eben auch operational

Presseinformation. Unser Ansatz ist eben auch operational Unser Ansatz ist eben auch operational Ulrich Rehrmann und Wolfgang Lalakakis, Gründer der GMVK Consulting Group, über den Markt für Geschäftsprozessoptimierungen, ICM Information Chain Management und

Mehr

Brückenkurs / Computer

Brückenkurs / Computer Brückenkurs / Computer Sebastian Stabinger IIS 22 September 2014 1 / 24 Content 1 Allgemeines zum Studium 2 Was ist ein Computer? 3 Geschichte des Computers 4 Komponenten eines Computers 5 Aufbau eines

Mehr

Inhaltsfelder Konzeptbezogene Kompetenzen Prozessbezogene Kompetenzen Interne Ergänzungen Kraft, Druck, mechanische und innere Energie

Inhaltsfelder Konzeptbezogene Kompetenzen Prozessbezogene Kompetenzen Interne Ergänzungen Kraft, Druck, mechanische und innere Energie 1 Inhaltsfelder Konzeptbezogene Kompetenzen Prozessbezogene Kompetenzen Interne Ergänzungen Kraft, Druck, mechanische und innere Energie Durchschnitts- und Momentangeschwindigkeit Geschwindigkeit und Kraft

Mehr

1 Computerlinguistik Was ist das?

1 Computerlinguistik Was ist das? 1 Computerlinguistik Was ist das? Kapitelherausgeber: Kai-Uwe Carstensen, Susanne Jekat und Ralf Klabunde Die Computerlinguistik ist das Fachgebiet, das sich mit der maschinellen Verarbeitung natürlicher

Mehr

9 Resümee. Resümee 216

9 Resümee. Resümee 216 Resümee 216 9 Resümee In der vorliegenden Arbeit werden verschiedene Methoden der Datenreduktion auf ihre Leistungsfähigkeit im sozialwissenschaftlichstatistischen Umfeld anhand eines konkreten Anwendungsfalls

Mehr

Modul: Soziale Kompetenz. Vier Ohren. Zeitl. Rahmen: ~ 45 min. Ort: drinnen

Modul: Soziale Kompetenz. Vier Ohren. Zeitl. Rahmen: ~ 45 min. Ort: drinnen Modul: Soziale Kompetenz Vier Ohren Zeitl. Rahmen: ~ 45 min. Ort: drinnen Teilnehmer: 3-20 Personen (Die Übung kann mit einer Gruppe von 3-6 Personen oder bis zu max. vier Gruppen realisiert werden) Material:

Mehr

1 Computerlinguistik Was ist das?

1 Computerlinguistik Was ist das? 1 Computerlinguistik Was ist das? Kapitelherausgeber: Kai-Uwe Carstensen, Susanne Jekat und Ralf Klabunde Die Computerlinguistik ist das Fachgebiet, das sich mit der maschinellen Verarbeitung natürlicher

Mehr

Kompetenzmodell für Informatik

Kompetenzmodell für Informatik Kompetenzmodell für Informatik als Grundlage des Lehrplans für den Pflichtgegenstand Informatik in der 5. Klasse und für den Wahlpflichtgegenstand Informatik in der 6. bis 8. Klasse Das Kompetenzmodell

Mehr

Formulierungshilfen für das wissenschaftliche Schreiben

Formulierungshilfen für das wissenschaftliche Schreiben Formulierungshilfen für das wissenschaftliche Schreiben 1. Einleitendes Kapitel 1.1.1 Einen Text einleiten und zum Thema hinführen In der vorliegenden Arbeit geht es um... Schwerpunkt dieser Arbeit ist...

Mehr

Methoden des wissenschaftlichen Übersetzens. Seite 1

Methoden des wissenschaftlichen Übersetzens. Seite 1 Methoden des wissenschaftlichen Übersetzens Seite 1 0. Einleitung 1. Der Text als Ausgangspunkt der Translation 2. Perspektiven der Textbetrachtung 2.1 Die punktuelle Perspektive 2.2 Die musterorientierte

Mehr

(2) (x 2 1 + x 2 2 + + x 2 n)(y 2 1 + y 2 2 + + y 2 n) = z 2 1 + z 2 2 + + z 2 n

(2) (x 2 1 + x 2 2 + + x 2 n)(y 2 1 + y 2 2 + + y 2 n) = z 2 1 + z 2 2 + + z 2 n Über die Komposition der quadratischen Formen von beliebig vielen Variablen 1. (Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1898, S. 309 316.)

Mehr