Mit der Entwicklung des Internets sind endliche Automaten noch weiter in den Fokus gerückt. Dafür sind mehrere Gründe ausschlaggebend:
|
|
- Bärbel Beyer
- vor 2 Jahren
- Abrufe
Transkript
1 Einleitung Endliche Automaten sind das Ergebnis der Entwicklung mathematischer Modelle für verschiedene mathematische, technische und naturwissenschaftliche Anwendungsbereiche. Als Pionierarbeiten gelten die Arbeiten von Huffman (1954), Mealy (1955) und Moore (1956), und auch Arbeiten von McCulloch /Pitts (1943) und Kleene (1956). Die Elektroingenieure Huffman, Mealy und Moore untersuchten Schaltkreise und beschrieben voneinander unabhängig deterministische Automaten auf ähnliche Weise. Hufmann entwickelte den Begriff des abstrakten Automaten, und Mealy und Moore führten abstrakte Automaten als mathematische Strukturen ein. Der Neurologe Warren McCulloch und der Mathematiker Walter Pitts beschrieben 1943 ein einfaches Modell der Nervenzellen. Kern dieses Modells sind Knoten, die Eingabesignale empfangen und Ausgabesignale senden können. Mit diesem Modell untersuchten sie die Berechenbarkeit von Funktionen. Sie zeigten, dass mit Hilfe von Netzwerken untereinander verschalteter Einheiten prinzipiell jede arithmetische und logische Funktion berechnet werden kann entwickelte der Mathematiker Stephen Cole Kleene, angeregt durch diese Untersuchung, reguläre Ausdrücke und endliche Automaten und modellierte die neuronalen Netze von McCulloch und Pitts durch endliche Automaten. Die Verwendung endlicher Automaten in der Sprachverarbeitung in der Zeit von 1958 bis 1999 skizziert und dokumentiert Kornai (1999). Das Buch dokumentiert eine frühe Entwicklung endlicher Automaten zum Parsing menschlicher Sprachen bereits im Jahr 1958 an der University of Pennsylvania unter der Leitung von Zellig S. Harris (Joshi/Hopely, 1999). Der akademische Hauptstrom entwickelte sich bis in die 80er-Jahre des 20. Jahrhunderts jedoch anders. Chomsky hatte in seinem Buch Syntactic Structures 1957 geschrieben: English is not a finite state language. Dieser Satz wurde in den folgenden Jahrzehnten zur Grundlage der Forschung nach einer erweiterten Komplexität natürlicher Sprachen und der Entwicklung von Grammatikformalismen (wie z.b. generative Transformationsgrammatik, Government and Binding, Generalized Phrase Structure Grammar, Lexical Functional Grammar, Head-driven phrase structure Grammar), die einer erweiterten Komplexität Rechnung tragen sollten. Kornai schreibt dazu: At that time neither careful attendance to linguistic detail nor husbanding of computational resources held much appeal, and the excitement Karin Haenelt Endliche Automaten: Einleitung Seite 1 von 6
2 generated by the breathtaking pace of development from Syntactic Structures to Aspects and the Standard Model, the Extended Standard Model, and the Revised Extended Standard Model kept most computational linguists too busy to think through the implications. (S. 3) Unterdessen entstand jedoch der Großteil der tatsächlich laufenden sprachtechnologischen Anwendungen auf der Basis der Technologie endlicher Automaten, und mit der Entwicklung der Anwendungen entwickelte man auch die Theorie weiter und umgekehrt. Als Beispiele praktischer und theoretischer Weiterentwicklungen seien genannt - Mathematische Analysen und Beweise (Schützenberger, 1961, und weitere Arbeiten, Choffrut, 1978) - grep-familie der UNIX-Werkzeuge zur Verarbeitung von Zeichenketten (Thompson, 1968) - XEROX finite state calculus (Kaplan/Kay, 1981) (Karttunen/Koskenniemi/Kaplan, 1987) - Two-level Morphologie (Koskenniemi, 1983) (Karttunen, 1983) - Programmbibliotheken mit Algorithmen für gewichtete Transduktoren (z.b. Mohri/Riley, 2002) - Open-Source-Bibliotheken (z.b. Helsinki Finite-State Transducer Technology HFST) Zusammenstellungen verschiedener Ansätze in mehreren Bereichen der Sprachverarbeitung geben Roche/Schabes (1997) und Kornai (1999). Die Anwendungsbereiche umfassen: Lexikalische Beschreibung, Morphologie, Phonologie, Part-of-Speech-Tagging, Satz-Parsing, Spracherkennung, OCR- Modellierung, Informationsextraktion, Maschinelle Übersetzung geschriebener und gesprochener Sprache, Sprachgenerierung. Neuere Zusammenstellungen finden sich in den Tagungsbänden der Finite-State Methods and Natural Language Processing-Konferenzen. Mit der Entwicklung des Internets sind endliche Automaten noch weiter in den Fokus gerückt. Dafür sind mehrere Gründe ausschlaggebend: - Besondere Eignung endlicher Automaten für die Massendatenverarbeitung: Um solche Massen von Daten verarbeiten zu können, wie sie im Internet vorliegen, stehen Robustheit, Schnelligkeit und Kompaktheit an oberster Stelle Karin Haenelt Endliche Automaten: Einleitung Seite 2 von 6
3 der Anforderungen. Endliche Automaten erfüllen diese Anforderungen besonders gut - Fortschritte in der Weiter-Entwicklung der Theorie endlicher Automaten für Zwecke der Sprachverarbeitung (einige Beispiele: Komplexe reguläre Ausdrücke im Xerox finite state caluclus, effiziente Algorithmen für gewichtete Transduktoren, Zusammenstellung zu Bibliotheken (Mohri) und Entwicklung von Open Source-Bibliotheken) - Fortschritte in der Bewertung der Adäquatheit endlicher Automaten für die Sprachverarbeitung o Die Frage nach der Komplexität menschlicher Fragen beurteilt man heute allgemein differenzierter. Bereits Chomsky (1957) erwähnt, dass die Aussage, dass die Strukturen menschlicher Sprachen an Komplexität die Möglichkeiten endlicher Automaten übersteigen, auf einer theoretischen Annahme beruht, die in der Praxis nicht unbedingt zutrifft: nämlich auf der Annahme, dass die betreffenden Konstruktionen unbegrenzt sind. Kein Mensch bettet aber beispielsweise Relativsätze in unbegrenzter Tiefe ein. Die Daten, die das Internet zur Verfügung stellt, ermöglichen es heutzutage, entsprechende Untersuchungen in großem Umfang durchzuführen und zu prüfen, wie weit endliche Automaten für die jeweiligen Aufgaben hinreichend sind. o Es hat sich gezeigt, dass es nicht adäquat ist, menschliche Sprachen mit einem abgeschlossenen Regelsatz zu modellieren. Vielmehr ist es erforderlich, Dimensionen wie Erfahrung und Kreativität zu berücksichtigen (Manning/Schütze, 1999, S. 3). Zu einer verbesserten Modellierung menschlicher Sprachen gehören nach heutiger Auffassung mindestens drei Komponenten Regeln Beispiele statistische Daten Für alle drei Komponenten gibt es etablierte Methoden der Modellierung mit endlichen Automaten o Es hat sich gezeigt, dass eine Modellierung menschlicher Sprachen mit endlichen Automaten auch zu nicht-trivialen Erkenntnissen über die Natur des Objekts führt. So konnte beispielweise eine klare Unterscheidung der Strukturen, die mit rein formalen Mittel erkennbar sind, und solcher, für die man eine weitere Interpretation benötigt, erarbeitet werden. Ein Ergebnis ist beispielsweise das partielle Parsing Karin Haenelt Endliche Automaten: Einleitung Seite 3 von 6
4 o von Satzstrukturen, das auf einer klaren Trennung syntaktischer und semantischer Eigenschaften der Satzstrukturen beruht (Abney, 1996). Es lassen sich zwar nicht alle Phänomene menschlicher Sprachen mit endlichen Automaten modellieren. Aber auch nicht alle Anwendungen benötigen eine vollständige und tiefgehende Verarbeitung. Vielmehr ermöglichen partielle Lösungen sehr viele nützliche Anwendungen. Überhaupt entsprechen partielle Lösungen viel besser dem Verhalten sozialer Gebilde als ein Streben nach vermeintlicher Vollständigkeit. Auch Sprache ist ein soziales Gebilde, und soziale Interaktion ist immer eine partielle Aktion: es werden nur so viele Ressourcen mobilisiert, wie für einen aktuellen Zweck benötigt werden. Dieses Skript ist angesichts des aktuellen Entwicklungsstandes und Bedeutung der Methoden als Einführung in das Gebiet endlicher Automaten für die Sprachverarbeitung gedacht. Im Fokus steht die tutorialartige Erschließung der Algorithmen und formalen Konstrukte, die insbesondere für die Sprachverarbeitung (wie beispielsweise komplexe reguläre Ausdrücke) entwickelt wurden. Ziel ist es, einerseits einige Grundlagen zu vermitteln und andererseits die Fähigkeit zu fördern, komplexere Fachliteratur einfacher lesen zu können. Literatur Steven ABNEY (1996). Tagging and Partial Parsing. In: Ken Church, Steve Young, and Gerrit Bloothooft (Hrsg.), Corpus-Based Methods in Language and Speech. Kluwer Academic Publishers, Dordrecht. Christian Choffrut (1978). Contributions à l étude de quelques familles remarquables de functions rationelles. Ph.D. thesis (these de doctorat d Etat), Université Paris 7, LITP: Paris. Warren MCCULLOCH und Walter PITTS (1943). A logical calculus of the ideas immanent in nervous activity. In: Bulletin of Mathematical Biophysics, 5, S David Albert HUFFMAN (1954). The synthesis of sequential switching circuits. In: Journal of the Franklin Institute 257, S. 3-4, und Karin Haenelt Endliche Automaten: Einleitung Seite 4 von 6
5 Aravind K. JOSHI und Philip HOPELY (1999). A parser from antiquity: an early application of finite state transducers to natural language parsing. In: András Kornai (Ed.) (1999). Extended Finite State Models of Language. (Studies in Natural Language Processing). Cambridge: Cambridge University Press. Ron M. KAPLAN und Martin KAY (1981). Phonological rules and finite-state transducers. In: Linguistic Society of America Meeting Handbook, Fifty-Sixth Annual Meeting, New York. Abstract Lauri Karttunen (1983). KIMMO: a general morphological processor. In: Texas Linguistic Forum, Nr. 22, S Department of Linguistics, The University of Texas at Austin, Austin, TX. Lauri Karttunen, Kimmo KOSKENNIEMI und Ron M. KAPLAN (1987). A compiler fort wolevel phonological rules. Technical report. Xerox Palo Alto Research Center and Center for the Study of Language and Information, Stanford University. Stephen Cole KLEENE (1956). Representation events in nerve nets and finite automata. In Shannon, McCarthy (Hrsg.) Automata Studies, Princeton. András KORNAI (Ed.) (1999). Extended Finite State Models of Language. (Studies in Natural Language Processing). Cambridge: Cambridge University Press. Kimmo KOSKENNIEMI (1983). Two-level morphology: A general computational model for word-form recognition and production. Publication 11, University of Helsinki, Department of General Linguistics, Helsinki. Christopher D. MANNING und Hinrich SCHÜTZE (1999). Foundations of Statistical Natural Language Processing. Cambridge, Mass., London: The MIT Press. Mohri, Mehryar (1997). Finite State Transducers in Language and Speech Processing. In: Computational George H. MEALY (1955). A method for synthesizing sequential circuits. Bell System Technical Journal 34:5, S Mehryar MOHRI und Michael RILEY (2002). Weighted Finite-State Transducers in Speech Recognition (Tutorial). Edward F. MOORE (1956). Gedanken experiments on sequential machines. In: Automata Studies, , Princeton University Press, Princeton, New Jersey, Karin Haenelt Endliche Automaten: Einleitung Seite 5 von 6
6 Emmanuel ROCHES und Yves SCHABES (1997). Finite-State Language Processing. Cambridge, Mass.: MIT Press. Marcel Paul SCHÜTZENBERGER (1961). A Remark on Finite Transducers. Information and Control, 4(2-3), S Ken THOMPSON (1968). Regular expression search algorithm. In: Communications oft he ACM, 11, S Karin Haenelt Endliche Automaten: Einleitung Seite 6 von 6
Einführung in die Computerlinguistik Überblick
Einführung in die Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2015-10-12 1 / 19 Was ist Computerlinguistik? Definition
Linguistik für Kognitionswissenschaften
Linguistik für Kognitionswissenschaften Computerlinguistik: Maschinelle Übersetzung Computerlinguistik Fehlübersetzung von engl. computational linguistics - computationelle Linguistik beinhaltet im weiteren
Einführung Computerlinguistik. Überblick
Einführung Computerlinguistik Überblick Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-10-14 Schütze & Zangenfeind: Überblick 1 / 30 Take-away Schütze
Informationsextraktion. Karin Haenelt 1.12.2012
Informationsextraktion Karin Haenelt 1.12.2012 Informationsextraktion Ziel Identifikation bestimmter Information (Daten) in einem unstrukturierten oder teilstrukturierten textuellen Dokument Transformation
Part-of-Speech Tagging. Stephanie Schuldes
Part-of-Speech Tagging Stephanie Schuldes 05.06.2003 PS Erschließen von großen Textmengen Geißler/Holler SoSe 2003 Motivation Ziel: vollständiges Parsing und Verstehen natürlicher Sprache Herantasten durch
Part-Of-Speech-Tagging mit Viterbi Algorithmus
Part-Of-Speech-Tagging mit Viterbi Algorithmus HS Endliche Automaten Inna Nickel, Julia Konstantinova 19.07.2010 1 / 21 Gliederung 1 Motivation 2 Theoretische Grundlagen Hidden Markov Model Viterbi Algorithmus
Anlage 1: Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Computerlinguistik
Anlage : Modularisierung des Bachelor-Studiengangs Theoretische und Angewandte Legende: PM = Pflichtmodul; WPM = Wahlpflichtmodul; WM = Wahlmodul VL = Vorlesung; PS = Proseminar; HS = Hauptseminar; Ü =
Grundbegriffe der Informatik
Grundbegriffe der Informatik Einheit 15: Reguläre Ausdrücke und rechtslineare Grammatiken Thomas Worsch Universität Karlsruhe, Fakultät für Informatik Wintersemester 2008/2009 1/25 Was kann man mit endlichen
Reguläre Ausdrücke. Karin Haenelt
Reguläre Ausdrücke Karin Haenelt 25.04.2010 1 Inhalt Einführung Definitionen Kleene-Theorem Schreibweisen regulärer Ausdrücke Eigenschaften regulärer Sprachen 2 Was sind reguläre Ausdrücke? Reguläre Ausdrücke
Patrick Simianer Visualisierung regulärer Ausdrücke
Patrick Simianer Visualisierung regulärer Ausdrücke Patrick Simianer 2010-06-28 Endliche Automaten HS bei Dr. Karin Haenelt Universitiät Heidelberg im Sommersemester 2010 1 Einleitung Überlegungen Protoypisches
Statistische Verfahren in der Computerlinguistik
Statistische Verfahren in der Computerlinguistik Zweiter Teil Einführung in die Computerlinguistik Sommersemester 2009 Übersicht Statistische vs. symbolische Verfahren in der CL Statistik beschreibende
Aufgabentypen die in der Klausur vorkommen
Aufgabentypen die in der Klausur vorkommen können 1. Nennen Sie fünf wichtige Anwendungsgebiete der Computerlinguistik. 2. Für welches der drei Anwendungsgebiete Maschinelle Übersetzung, Rechtschreibkorrektur
Informationsextraktion
Informationsextraktion Bestimmte Anwendungen bei der semantischen Verarbeitung erfordern keine tiefe linguistische Analyse mit exakter Disambiguierung (= eine einzige und korrekte Lesart). Hierzu gehört
Einführung in die Computerlinguistik Statistische Grundlagen
Statistik 1 Sommer 2015 Einführung in die Computerlinguistik Statistische Grundlagen Laura Heinrich-Heine-Universität Düsseldorf Sommersemester 2015 Statistik 2 Sommer 2015 Überblick 1. Diskrete Wahrscheinlichkeitsräume
Programmieren Formulierung eines Algorithmus in einer Programmiersprache
Zum Titel der Vorlesung: Programmieren Formulierung eines in einer Programmiersprache Beschreibung einer Vorgehensweise, wie man zu jedem aus einer Klasse gleichartiger Probleme eine Lösung findet Beispiel:
Was ist ein Compiler?
Was ist ein Compiler? Was ist ein Compiler und worum geht es? Wie ist ein Compiler aufgebaut? Warum beschäftigen wir uns mit Compilerbau? Wie ist die Veranstaltung organisiert? Was interessiert Sie besonders?
REKURSION UND DIE UNENDLICHKEITSFORDERUNG Geoffrey K. Pullum & Barbara C. Scholz
REKURSION UND DIE UNENDLICHKEITSFORDERUNG Geoffrey K. Pullum & Barbara C. Scholz 1. UNENDLICHKEIT ALS LINGUISTISCHE UNIVERSALIE In vielen kürzlichen Arbeiten stellten Linguisten die Unendlichkeit von Sätzen
Einführung Computerlinguistik. Konstituentensyntax II
Einführung Computerlinguistik Konstituentensyntax II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 2013-11-18 Schütze & Zangenfeind: Konstituentensyntax
Background for Hybrid Processing
Background for Hybrid Processing Hans Uszkoreit Foundations of LST WS 04/05 Scope Classical Areas of Computational Linguistics: computational morphology, computational syntax computational semantics computational
PPC und Data Mining. Seminar aus Informatik LV-911.039. Michael Brugger. Fachbereich der Angewandten Informatik Universität Salzburg. 28.
PPC und Data Mining Seminar aus Informatik LV-911.039 Michael Brugger Fachbereich der Angewandten Informatik Universität Salzburg 28. Mai 2010 M. Brugger () PPC und Data Mining 28. Mai 2010 1 / 14 Inhalt
Automaten und Formale Sprachen alias Theoretische Informatik. Sommersemester 2013
Automaten und Formale Sprachen alias Theoretische Informatik Sommersemester 2013 Dr. Sander Bruggink Übungsleitung: Jan Stückrath Sander Bruggink Automaten und Formale Sprachen 1 Deterministische Kellerautomaten
Maturandentag 2005 Computerlinguistik
Maturandentag 2005 Computerlinguistik http://www.ifi.unizh.ch/cl/ 13./14. September 2005 Maturandentag 2005 Computerlinguistik 13./14. September 2005 http://www.ifi.unizh.ch/cl/ 1 / 11 Computerlinguistik
Modellierung biologischer. Christian Maidorfer Thomas Zwifl (Seminar aus Informatik)
Modellierung biologischer Prozesse Christian Maidorfer Thomas Zwifl (Seminar aus Informatik) Überblick Einführung Arten von Modellen Die stochastische Pi-Maschine Warum Modelle Die Biologie konzentriert
Grammatiken. Einführung
Einführung Beispiel: Die arithmetischen Ausdrücke über der Variablen a und den Operationen + und können wie folgt definiert werden: a, a + a und a a sind arithmetische Ausdrücke Wenn A und B arithmetische
Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Theoretische und Angewandte Computerlinguistik
Universität Heidelberg Seite 4 8.0.009 Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Theoretische und Angewandte vom 8. Januar 009 Aufgrund von 4 des Landeshochschulgesetzes,
Informatik und Informationstechnik (IT)
Informatik und Informationstechnik (IT) Abgrenzung Zusammenspiel Übersicht Informatik als akademische Disziplin Informations- und Softwaretechnik Das Berufsbild des Informatikers in der Bibliothekswelt
Seminar A - Spieltheorie und Multiagent Reinforcement Learning in Team Spielen
Seminar A - Spieltheorie und Multiagent Reinforcement Learning in Team Spielen Michael Groß mdgrosse@sbox.tugraz.at 20. Januar 2003 0-0 Matrixspiel Matrix Game, Strategic Game, Spiel in strategischer Form.
Spezielle Themen der KI. NLP Natural Language Processing. Sprachverstehen
Spezielle Themen der KI NLP Natural Language Processing Sprachverstehen NLP - Verarbeitungsstufen des Sprachverstehen 47 Phonologie und Phonetik Phonologie Lautlehre oder Sprachgebilde-Lautlehre untersucht
1. Jurafsky und Martin
Vertiefung 1. Jurafsky und Martin Book Description (from amazon.com) This book offers a unified vision of speech and language processing, presenting state-of-the-art algorithms and techniques for both
Intelligente Unterstützung für argumentatives Schreiben
Intelligente Unterstützung für argumentatives Schreiben Christian Stab Workshop Text als Werkstu ck - Wege zu einer computergestu tzten U berarbeitung von deutschen Texten Deutsches Institut fu r Internationale
Fachgebiet. Theorie der Programmierung
Fachgebiet Theorie der Programmierung Ansprechpartner Prof. Franz Baader, Prof. Christel Baier, Prof. Heiko Vogler (Stand: Juli 2010) 1 Theorie der Programmierung In den Lehrveranstaltungen werden nicht
Einführung in die Linguistik, Teil 4
Einführung in die Linguistik, Teil 4 Menschliche Sprachverarbeitung im Rahmen der Kognitionswissenschaft Markus Bader, Frans Plank, Henning Reetz, Björn Wiemer Einführung in die Linguistik, Teil 4 p. 1/19
Einführung in die Informatik
Einführung in die Informatik Einleitung Organisatorisches, Motivation, Herangehensweise Wolfram Burgard Cyrill Stachniss 0.1 Vorlesung Zeit und Ort: Mo 16.00 18.00 Uhr Gebäude 101, HS 00-026 Informationen
Introduction to Computational Linguistics
Introduction to Computational Linguistics PD Dr. Frank Richter fr@sfs.uni-tuebingen.de. Seminar für Sprachwissenschaft Eberhard-Karls-Universität Tübingen Germany NLP Intro WS 2005/6 p.1 Incremental Linguistic
Einige Tipps zur Präsentation von Referaten mit PowerPoint sowie zur Anfertigung schriftlicher Arbeiten
Einige Tipps zur Präsentation von Referaten mit PowerPoint sowie zur Anfertigung schriftlicher Arbeiten Markus Knauff Institut für Kognitionsforschung Übersicht (1) Motivation und Einleitung Gestaltung
Einführung in die Informatik
Einführung in die Informatik Einleitung Organisatorisches, Motivation, Herangehensweise Wolfram Burgard 1.1 Vorlesung Zeit und Ort: Dienstags 10:00-12:00 Uhr Donnerstags 10:00-12:00 Uhr Gebäude 101 HS
Cognitive Systems Master thesis
Cognitive Systems Master thesis Recherche Phase SS 2011 Gliederung 1. Einleitung 2. Analogie Modelle 2.1 SME 2.2 Ava 2.3 Lisa 3. Zusammenfassung 4. Ausblick 2 Einleitung Analogie Problemsituation wird
Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Parsing mit NLTK. Beispiel: eine kleine kontextfreie Grammatik (cf. [BKL09], Ch. 8.
Gliederung Natürlichsprachliche Systeme I D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg 1 WS 2011/12, 26. Oktober 2011, c 2010-2012
18.05.11. letzte Änderung. Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Computerlinguistik
A 07-0- 8.05. 05 - Prüfungsordnung der Universität Heidelberg für den Bachelor-Studiengang Besonderer Teil Computerlinguistik vom 4. Juni 00 Geltung des Allgemeinen Teils Die Prüfungsordnung der Universität
Masterarbeit Organisation, Richtlinien und Aufbau Abteilung für Entwicklungs- und Persönlichkeitspsychologie Universität Basel
Masterarbeit Organisation, Richtlinien und Aufbau Abteilung für Entwicklungs- und Persönlichkeitspsychologie Universität Basel Allgemeines Eine Masterarbeit ist eine wissenschaftliche Arbeit im ausgewählten
VO 340088 Sprachtechnologien. Informations- und Wissensmanagement. Bartholomäus Wloka. Zentrum für Translationswissenschaft
, Informations- und Wissensmanagement Zentrum für Translationswissenschaft Grundlagen und Definitionen Maschinelle Sprachverarbeitung Breites Spektrum an Methoden der Computerverarbeitung von Sprache.
Programmieren in natürlicher Sprache: Automatische Code-Generierung
Programmieren in natürlicher Sprache: Automatische Code-Generierung Artem Titarenko Betreut von Mathias Landhäußer IPD Tichy, Fakultät für Informatik KIT Universität des Landes Baden-Württemberg und nationales
Double Degree: Bachelor in Philosophie, Politik und Ökonomik und in Commerce. 2C2D The best of both worlds!
Double Degree: Bachelor in Philosophie, Politik und Ökonomik und in Commerce 2C2D The best of both worlds! Der Zeitplan 2016/17 START UVIC COMITTEE DECISION UW/H NECESSARY DOCUMENTS SUBMITTED APPLICATION
Pädagogische Hochschule Heidelberg - FB II - Fach Englisch Fachinterne Meldung zur mündlichen Prüfung im Frühjahr/Herbst 20...
Pädagogische Hochschule Heidelberg - FB II - Fach Englisch Fachinterne Meldung zur mündlichen Prüfung im Frühjahr/Herbst 20... Name: (Zutreffendes bitte unterstreichen) E-Mail: Telefon: Studienbeginn Englisch:
Wirtschaftswissenschaften - MBA-Programme in den USA
Universität / Schule Arizona State University, W. P. Carey School of Business, Tempe, AZ E-mail: wpcareymba@asu.edu Babson College, F.W. Olin Graduate School of Business, Wellesley, MA E-mail: mbaadmission@babson.edu
Praktikum Einführung
Praktikum Einführung Praktikum im Rahmen der Veranstaltung Sicherheit in Netzen im WS 08/09 Praktikumsleiter: Holger Plett Agenda Motivation AVISPA Einleitung Aufbau des Frameworks Elemente des Frameworks
Verlaufsform. Verlaufsform. Aufbau (Zusammensetzung) Gliederung. Verlaufsform. Ähnliche Phänomene. Einleitung Geschichte der Verlaufsform :
Ruhr-Universität Bochum Germanistisches Institut Hauptseminar WS `04/`05 Dozentin: Dr. Pittner Referentinnen: Victoria Gilmuddinova, Nadine Herbst & Julia Kunze Verlaufsform Gliederung Einleitung Geschichte
1 Vom Problem zum Programm
1 Vom Problem zum Programm Ein Problem besteht darin, aus einer gegebenen Menge von Informationen eine weitere (bisher unbekannte) Information zu bestimmen. 1 Vom Problem zum Programm Ein Algorithmus ist
Physik und Chemie der Minerale
Physik und Chemie der Minerale Phasendiagramme Mehrere Komponenten Segregation, konstitutionelle Unterkühlung Keimbildung Kinetik des Kristallwachstums Kristallzüchtung Literaturauswahl D.T.J Hurle (Hrsg.):
Why you should care. by Thomas Krimmer. Thomas Krimmer @ACS Slide 1
Why you should care. by Thomas Krimmer Thomas Krimmer @ACS Slide 1 CAS Publication Record Abstracts (Millions) 1.5 papers per minute Source: CAS helpdesk, Statistical Summary 1907-2007, 02/10/2009 Thomas
Mathematisch-algorithmische Grundlagen für Big Data
Mathematisch-algorithmische Grundlagen für Big Data Numerische Algorithmen für Datenanalyse und Optimierung Prof. Dr. Peter Becker Fachbereich Informatik Hochschule Bonn-Rhein-Sieg Sommersemester 2016
Vektormodelle. Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig
Vektormodelle Universität zu Köln HS: Systeme der maschinellen Sprachverarbeitung Prof. Dr. J. Rolshoven Referentin: Alena Geduldig Gliederung Vektormodelle Vector-Space-Model Suffix Tree Document Model
University of Tirana
University of Tirana Address: Sheshi Nënë Tereza ; www.unitir.edu.al Tel: 04228402; Fax: 04223981 H.-D. Wenzel, Lehrstuhl Finanzwissenschaft, OFU Bamberg 1 University of Tirana The University of Tirana
The Modular Structure of Complex Systems. 30.06.2004 Seminar SoftwareArchitektur Fabian Schultz
The Modular Structure of Complex Systems 1 Modularisierung Vorteile Organisation Mehrere unabhängig Teams können gleichzeitig arbeiten Flexibilität Änderung einzelner Module Verständlichkeit Nachteile
Quellen: Towards a Human Computer InteractionPerspective. Übersicht. Warum visuelle Sprachen? Begriffsdefinitionen: Hinderungsgründe bisher:
Quellen: Towards a Human Computer InteractionPerspective von B.K. & B.K. LV: Visuelle Sprachen (03-763) Universität Bremen WS 2001/02 Visual Language Theory: Towards a Human- Computer Perspective; N. Hari
Formale Methoden: Ein Überblick
Formale Methoden, Heinrich Rust, Lehrstuhl für Software-Systemtechnik, BTU Cottbus, 2004-09-16, p. 1 Formale Methoden: Ein Überblick Heinrich Rust Lehrstuhl für Software-Systemtechnik BTU Cottbus 2004-09-16
Professur für Informationsmanagement Prof. Dr. Kolbe
Professur für Informationsmanagement Prof. Dr. Kolbe Lehre und Forschung 24. Oktober 2011 Fragestellungen des Informationsmanagements Wie sieht die Zukunft der IT aus? Was ist wichtiger für das Geschäft?
Wie schreibt man eine Literaturübersicht?
Wie schreibt man eine Literaturübersicht? Hinweis: Eine Literaturübersicht kann sowohl ein eigenständiger Text oder Teil einer wissenschaftlichen Arbeit sein. Im zweiten Fall findet sich in der Arbeit
"What's in the news? - or: why Angela Merkel is not significant
"What's in the news? - or: why Angela Merkel is not significant Andrej Rosenheinrich, Dr. Bernd Eickmann Forschung und Entwicklung, Unister GmbH, Leipzig UNISTER Seite 1 Unister Holding UNISTER Seite 2
Das P versus N P - Problem
Das P versus N P - Problem Dr. Michael Huber Habilitationsvortrag eines der sieben Milleniumsprobleme des Clay Mathematics Institute A gift to Mathematics from Computer Science (Steve Smale) Überblick
25.04.2001 Amtliche Mitteilungen / 20. Jahrgang Seite 25
25.04.2001 Amtliche Mitteilungen / 20. Jahrgang Seite 25 Berichtigung der Prüfungsordnung für den Studiengang Master of Science in Physics mit den Abschlüssen Bachelor of, Master of und Master of Science
Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1.
Lösungsvorschlag für das Übungsblatt 1. Aufgabe 1. Zusammengefasst aus Ihren Beiträgen Wie bewerten sie das System ingesamt? Das Watson System verdeutlicht den Fortschritt der Künstlichen Intelligenz Forschung/Computerlinguistik/Informatik
Präsupposition, Fokus, Topik
Johannes Dölling WiSe 2012/13 Präsupposition, Fokus, Topik (Modul 04-046-2018 Semantik/Pragmatik: Bedeutung und Diskurs) Seminar Mi 13.15-14.45 Beethovenstr. H1 5.16 Ein Kennzeichen von Kommunikation ist,
und schwenkt als erste irdische Sonde überhaupt in die Umlaufbahn eines anderen Planeten ein
13. November 2006 1 13. November 2006 1907 Paul Cornu startet den ersten Hubschrauber. 1960 In Karlstein am Main nimmt das erste deutsche Kernkraftwerk, das Versuchsatomkraftwerk Kahl, den Betrieb auf
Beschreibungslogiken. Daniel Schradick 1schradi@informatik.uni-hamburg.de
Beschreibungslogiken Daniel Schradick 1schradi@informatik.uni-hamburg.de Was sind Beschreibungslogiken? Definition: Formalisms that represent knowledge of some problem domain (the world ) by first defining
Wintersemester 2010/2011 Rüdiger Westermann Institut für Informatik Technische Universität München
Informatik 1 Wintersemester 2010/2011 Rüdiger Westermann Institut für Informatik Technische Universität München 1 0 Allgemeines Zielgruppen Siehe Modulbeschreibung Studierende anderer (nicht Informatik)
Seminar Werkzeuggestütze. tze Softwareprüfung. fung. Slicing. Sebastian Meyer
Seminar Werkzeuggestütze tze Softwareprüfung fung Slicing Sebastian Meyer Überblick Einführung und Begriffe Static Slicing Dynamic Slicing Erweiterte Slicing-Techniken Fazit 2 Was ist Slicing?? (I) Program
Ein bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort?
Ein bisschen Werbung Einführung in die Morphologie Einleitung, Grundbegriffe I Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 "Morphology is the conceptual centre of linguistics. This
Practical Grammar Engineering Using HPSG. Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel
Practical Grammar Engineering Using HPSG Frederik Fouvry, Petter Haugereid, Valia Kordoni, Melanie Siegel Inhalt Organisatorisches HPSG Grammatiken Werkzeuge Kodierungen TDL Syntax Über dieses Seminar
Einführung. Arbeitsgruppe. Proseminar Corporate Semantic Web. Prof. Dr. Adrian Paschke
Arbeitsgruppe Proseminar Corporate Semantic Web Einführung Prof. Dr. Adrian Paschke Arbeitsgruppe Corporate Semantic Web (AG-CSW) Institut für Informatik, Freie Universität Berlin paschke@inf.fu-berlin.de
Coma I. Einleitung. Computer und Algorithmen. Programmiersprachen. Algorithmen versus Programmiersprachen. Literaturhinweise
Coma I Einleitung 1 Computer und Algorithmen Programmiersprachen Algorithmen versus Programmiersprachen Literaturhinweise 2 Computer und Algorithmen Programmiersprachen Algorithmen versus Programmiersprachen
EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN
EXTRAKTION UND KLASSIFIKATION VON BEWERTETEN PRODUKTFEATURES AUF WEBSEITEN T-SYSTEMS MULTIMEDIA SOLUTIONS GMBH, 16. FEBRUAR 2012 1. Schlüsselworte Semantic Web, Opinion Mining, Sentiment Analysis, Stimmungsanalyse,
Automatisierte Dossier- Erstellung mittels Text-Mining
Automatisierte Dossier- Erstellung mittels Text-Mining Paul Assendorp Grundseminar 11.12.2014 Paul Assendorp Automatisierte Dossier-Erstellung 1 Gliederung Motivation Textmining Tools Aktueller Stand Ausblick
Sprachen/Grammatiken eine Wiederholung
Sprachen/Grammatiken eine Wiederholung Was sind reguläre Sprachen? Eigenschaften regulärer Sprachen Sprachen Begriffe Symbol: unzerlegbare Grundzeichen Alphabet: endliche Menge von Symbolen Zeichenreihe:
Seminar Analysis Konvexe Funktionen und einige wichtige Ungleichungen
Seminar Analysis Konvexe Funktionen und einige wichtige Ungleichungen Michael Schaeer 3.04.03 Abstract This seminar is about convex functions and several imortant ineualities. At the beginning the term
Could a robot be creative - and would we know?
Could a robot be creative - and would we know? By Margaret Boden Philip Meckseper Tina Mahler Margaret Boden Research Professor of Cognitive Science at the University of Susse Association for Artificial
Grundlagen der Informatik II. Teil I: Formale Modelle der Informatik
Grundlagen der Informatik II Teil I: Formale Modelle der Informatik 1 Einführung GdInfoII 1-2 Ziele/Fragestellungen der Theoretischen Informatik 1. Einführung abstrakter Modelle für informationsverarbeitende
Einführung. Information Retrieval. IR-Aufgaben. IR in Beispielen. Adhoc-Suche: Web. IR in Beispielen. Was ist IR? Norbert Fuhr
Einführung Information Retrieval Norbert Fuhr 13. Oktober 2011 IR in Beispielen Was ist IR? Daten Information Wissen Dimensionen des IR Rahmenarchitektur für IR-Systeme Adhoc-Suche: Web IR in Beispielen
Einführung in PERL 2 Reguläre Ausdrücke
Einführung in PERL 2 Reguläre Ausdrücke BASIEREND AUF FOLIEN VON DR. H. ZINSMEISTER und dem Buch `Einführung in Perl (Lama Buch) von RL Schwartz&T Phoenix sowie hwp://de.sel[tml.org/perl/sprache/regexpr.htm
Personalisierung. Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung. Data Mining.
Personalisierung Personalisierung Thomas Mandl Der Personalisierungsprozess Nutzerdaten erheben aufbereiten auswerten Personalisierung Klassifikation Die Nutzer werden in vorab bestimmte Klassen/Nutzerprofilen
Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information
Sprachtechnologie in der Wissenschaft: Digital-Turn in evidenzbasierter Bildungsforschung und -information Iryna Gurevych Sprachtechnologie-Feuerwerk: Aktuelle Anwendungsbeispiele und Zukunftsvisionen
Data Mining: Einige Grundlagen aus der Stochastik
Data Mining: Einige Grundlagen aus der Stochastik Hagen Knaf Studiengang Angewandte Mathematik Hochschule RheinMain 21. Oktober 2015 Vorwort Das vorliegende Skript enthält eine Zusammenfassung verschiedener
Lehrpläne NRW Sek.stufe 2. Lernen im Kontext
Lehrpläne NRW Sek.stufe 2 Lernen im Kontext Fachliche Inhalte Lernziele Informatik NRW Fähigkeit, komplexe Zusammenhänge mit gedanklicher Schärfe zu durchdringen (Problemanalyse) Überblick über unterschiedliche
Unterstützt HL7 die interdisziplinäre Zusammenarbeit?
Effiziente und wirtschaftliche Gesundheitsversorgung von heute und morgen nur mit Medizinischer Dokumentation und Medizinischer Informatik, Medizinischer Biometrie und Epidemiologie 5. bis 9. September
Semantische Infomationsintegration à la carte?
Semantische Infomationsintegration à la carte? Ziele und Herausforderungen der Anwendung des CIDOC CRM. Historisch-Kulturwiss. Informationsverarbeitung, Universität Köln 1. Oktober 2010 1 Ein User Scenario
Soziale Kommunikation. Vorlesung Johannes-Gutenberg-Universität Mainz Sommersemester 2011 PD Dr. phil. habil. Udo Thiedeke. Kommunikationsprobleme
Vorlesung Johannes-Gutenberg-Universität Mainz Sommersemester 2011 PD Dr. phil. habil. Udo Thiedeke Kommunikationsprobleme 1) Was ist Kommunikation? 2) Vom Austausch zur Unterscheidung 3) Zusammenfassung
Bringing sense and simplicity to life
Neue Einsatzbereiche der digitalen Spracherkennung: Informationsaufbereitung für Elektronische Patientenakten mit Wissensbanken und medizinischen Terminologien Klaus Stanglmayr Wednesday, June 20, 2007
Gliederung. Programmierparadigmen. Sprachmittel in SCHEME. Objekte: Motivation. Objekte in Scheme
Gliederung Programmierparadigmen D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg 1 Einführung Sprachmittel Sommer 2011, 20. Juni 2011,
8 Design Patterns. Events
8 Design Patterns. Events Jörn Loviscach Versionsstand: 28. März 2015, 19:13 Die nummerierten Felder sind absichtlich leer, zum Ausfüllen beim Ansehen der Videos: http://www.j3l7h.de/videos.html This work
Formulaic Sequences in German Essays: Comparing L1 with L2 data
Learner Corpus Research 15-17 September 2011 Louvain-la-Neuve, Belgium Cedric Krummes Sylvia Jaworska Astrid Ensslin c.krummes@bangor.ac.uk s.jaworska@qmul.ac.uk a.ensslin@bangor.ac.uk Bangor University
Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten
Visualisierung von lexikalischem Wandel im Deutschen auf Basis der Google- Books Ngram Daten Arbeitspapier Zusammenfassung In diesem Arbeitspapier wird gezeigt, wie mit Hilfe der Google- Books Ngram Daten
Die Informatik als junge Wissenschaft
Die Informatik als junge Wissenschaft Die Informatik ist die Wissenschaft von der automatischen Informationsverarbeitung. Die Informatik befasst sich mit den Gesetzmäßigkeiten und Prinzipien informationsverarbeitender
SWS im Prüfungsgebiet Module 1. Sem. 2. Sem. 3. Sem. 4. Sem. 5. Sem. 6. Sem. V Ü/L S V Ü/L S V Ü/L S V Ü/L S V Ü/L S V Ü/L S
Regelstudienplan SWS im Prüfungsgebiet Module 1. Sem. 2. Sem. 3. Sem. 4. Sem. 5. Sem. 6. Sem. V Ü/L S V Ü/L S V Ü/L S V Ü/L S V Ü/L S V Ü/L S Propädeutikum 1 1 Grundlagen der Informatik I Informatik und
Clubs, Most und Bits, oder wo die Kreativen ihre Ideen herholen
Clubs, Most und Bits, oder wo die Kreativen ihre Ideen herholen Zur Identifikation und Messung von kreativem Spillover in der Frankfurter Kreativwirtschaft Dr. Pascal Goeke Institut für Humangeographie
Objektorientierte Programmierung
Teil D Objektorientierte Programmierung Kapitel D 2001 Prof. Dr. Rainer Manthey Informatik I 1 Teil D Grundlagen der objektorientierten Programmierung 2001 Prof. Dr. Rainer Manthey Informatik I 2 Objektorientierung
Satzung des Fachbereichs Elektrotechnik und Informatik der Fachhochschule Lübeck zur Änderung der Prüfungsordnung und der Studienordnung für
1 Satzung des Fachbereichs Elektrotechnik und Informatik der Fachhochschule Lübeck zur Änderung der Prüfungsordnung und der Studienordnung für den Bachelor-Studiengang Informatik/Softwaretechnik (INF)
Text-Mining und Metadaten-Anreicherung Eine Einführung. Die Automatisierung in der semantischen Anreicherung von Text-Dokumenten
Text-Mining und Metadaten-Anreicherung Eine Einführung Die Automatisierung in der semantischen Anreicherung von Text-Dokumenten 26.05.2015 Inhalt Zeit ist Geld. Das gilt auch für die Recherche....3 Kann
Lehrveranstaltungsverzeichnis für den Studienplan 521 Bachelorstudium Informatik (03W) 15W
erstellt am 18.12.2015 um 02.31 Seite 1 von 10 Bachelorstudium Informatik Version: 03W SKZ: 521 Fach: Angewandte Informatik PF Stunden: 16.0 ECTS: 25.0 620.000 Einführung in die Informatik Bollin A. 12:00-14:00
Programmierparadigmen
Programmierparadigmen D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg Sommer 2011, 20. Juni 2011, c 2011 D.Rösner D. Rösner PGP 2011...
Organisatorisches. Zeit und Ort: Mo 12-14 MZH 1450 Mi 16-18 MZH 1460. Prof. Carsten Lutz Raum Cartesium 2.59 Tel. (218)-64431 clu@uni-bremen.
Logik Organisatorisches Zeit und Ort: Mo 12-14 MZH 1450 Mi 16-18 MZH 1460 Prof. Carsten Lutz Raum Cartesium 2.59 Tel. (218)-64431 clu@uni-bremen.de Position im Curriculum: Wahlbereich Bachelor-Basis, Theoretische