(1) Lexikalische Semantik: Kann man systematische Polysemie kontextuell (automatisch) bestimmen?
|
|
- Clemens Bach
- vor 6 Jahren
- Abrufe
Transkript
1 Vorgeschlagene Themenbereiche (1) Lexikalische Semantik: Kann man systematische Polysemie kontextuell (automatisch) bestimmen? naive Definition: Homonymie: eine Zeichenkette hat zwei oder mehr Lesarten, die semantisch (oder etymologisch) nicht miteinander verwandt sind: Bank Polysemie: eine Zeichenkette hat zwei oder mehr Lesarten, die semantisch miteinander zusammenhängen: verstehen systematische Polysemie: Lesartenvariation, die für alle Wörter einer bestimmten semantischen Klasse gilt: Schwein, Huhn Seit Bierwisch (1982) werden folgende Fälle systematischer Polysemie viel diskutiert. Schule (Universität, Kindergarten, Regierung (?), Oper, Theater,...) GEBÄUDE: Die Schule liegt an der Goethestraße. INSTITUTION: Er verließ die Schule mit 16. GRUPPE VON PERSONEN: Die Schule hat gestern einen Ausflug gemacht. Oper (Sonate, Operette, Lied,...) MUSIKSTÜCK: Ich habe gestern eine Oper gehört. ARTEFAKT: Die Oper liegt auf dem Tisch. In der Computerlinguistik gibt es das Bestreben, verschiedene 'Lesarten' (Senses) eines Wortes (einer Zeichenkette) automatisch zu bestimmen (word sense disambiguation, automatisches Lesartentagging). In einem weit verbreiteten Ansatz werden dabei sogenannte Kontextvektoren ausgewertet: man geht davon aus, dass die unterschiedlichen Lesarten zusammen mit unterschiedlichen Wörtern vorkommen. Ganz grob Schule als GEBÄUDE kommt vor mit Wörtern wie liegen, Backsteinbau, Auto, hinbringen,... Schule als INSTITUTION kommt vor mit Wörtern wie allgemeinbildend, Thema, lernen,... Anhand der Kontextwörter sollten dann die Lesarten voneinander abgrenzbar sein. Die Kontextwörter können automatisch bestimmt werden, wenn ein Teil des Textes von Hand vorklassifiziert ist. Aufgabe: Kann man die oben beschriebenen Lesarten von Institutionswörtern mit computerlinguistischen Methoden zum Lesartentagging (Kontextvektoren) finden? Welche Schwierigkeiten ergeben sich (a) für die theoretischen Grundlagen der Lesartenbestimmung (die naive Definition) und (b) für die verschiedenen computerlinguistischen Methoden? Bierwisch, Manfred (1982) Formal and lexical semantics. In: Linguistische Berichte 80, 3-17 Bierwisch, Manfred (1983) Semantische und konzeptuelle Interpretation lexikalischer Einheiten. In: Růžička, Rudolf & Motsch, Wolfgang (eds) Untersuchungen zur Semantik. Akademie Verlag, Berlin, Jurafsky, Daniel & Martin, James H. (2000) Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Prentice Hall, Upper Saddle River (NJ), Kapitel 3 Stevenson, Mark & Wilks, Yorick (2003) Word-Sense Disambiguation. In: Mitkov, Ruslan (ed) The Oxford Handbook of Computational Linguistics. Oxford University Press, Oxford,
2 (2) Syntax: Wortstellung nominaler Elemente im Mittelfeld Konstituenten im deutschen Mittelfeld können relativ frei umgestellt werden:... dass gestern ein Kind einer Frau geholfen hat... dass gestern einer Frau ein Kind geholfen hat... dass ein Kind gestern einer Frau geholfen hat... dass einer Frau gestern ein Kind geholfen hat etc. Allerdings sind nicht immer alle Permutationen moeglich, und manche sind es nur in bestimmten Kontexten.?... dass den Wein Otto braucht Welche Faktoren hier eine Rolle spielen, ist immer noch umstritten. In der Literatur werden z.b. genannt (Lenerz 77, Hoberg 81): Thema-Rhema, Informationsstruktur Definitheit Belebtheit Thematische Rollen (Agentivitaet) Verbsemantik (Psychverben, Unakkusativa) Schwere der Konstituenten... Aufgabe: Ueberlegen Sie, ob bzw. wie gut/einfach sich die vorgeschlagenen Faktoren mit Hilfe eines Korpus naeher untersuchen lassen. Welche Anforderungen werden an Korpora gestellt, die als Grundlage solcher Untersuchungen dienen sollen? Wo liegen die Probleme? deutsche Grammatiken Hoberg, Ursula (1981) Die Wortstellung in der geschriebenen deutschen Gegenwartssprache. Hueber, München Hoehle, Tilman (1982) Explikation fuer "normale Betonung" und "normale Wortstellung". In Abraham, Werner ( ed) Satzglieder im Deutschen. Narr, Tübingen, Lenerz, Jürgen (1977) Zur Abfolge nominaler Satzglieder im Deutschen. Narr, Tübingen Bei dieser Aufgabe wird Ihnen Dr. Stefanie Dipper (dipper@ling.uni-potsdam.de) helfen, die das TIGER-Korpus (deutsche Baumbank) mitentwickelt hat. (3) Textlinguistik: Wie kann man die Unterschiede zwischen zwei Mengen von Texten (Genres, Texte von verschiedenen Autoren, Texte aus verschiedenen Zeiten,...) modellieren?
3 Zwei Texte zum Thema 'Schule': (A) HwO 27a ( 1 ) Das Bundesministerium für Wirtschaft und Technologie kann im Einvernehmen mit dem Bundesministerium für Bildung und Forschung nach Anhören des ständigen Ausschusses des Bundesinstituts für Berufsbildung durch Rechtsverordnung bestimmen, daß der Besuch einer berufsbildenden Schule oder die Berufsausbildung in einer sonstigen Einrichtung ganz oder teilweise auf die Ausbildungszeit anzurechnen ist. ( 2 ) Die Handwerkskammer hat auf Antrag die Ausbildungszeit zu kürzen, wenn zu erwarten ist, daß der Lehrling ( Auszubildende ) das Ausbildungsziel in der gekürzten Zeit erreicht. (Gesetzestext aus der Handwerksordnung) (B) Saarland will ja jetzt als erstes Bundesland gutes Benehmen als eigenes Fach in der Schule einführen. Ich will nicht behaupten, daß diese Bemühung an und für sich schlecht ist, aber Benimm ist doch im Grunde keine Frage des Wissens sondern des Wollens. Grundsätzlich sind die meisten Menschen, und nicht nur die Schüler, doch einfach zu faul, "Danke" und "Bitte" zu sagen, die Tür aufzuhalten und zu grüßen. Ist ja nicht so, daß sie sich das nicht denken können. Und selbst wenn nicht, bei einer Wochenstunde sind das an die 40 Einheiten zum guten Benehmen. Was soll man da denn alles durchnehmen? Wie man Bananen mit dem Besteck ißt? (Weblog, , 14:40) Die Texte unterscheiden sich in mehreren Merkmalen. Dabei sind die Merkmale nicht immer kategorial sondern oft graduell A hat längere Sätze als B A hat mehr Nominalisierungen als B B verwendet im Ggs. zu A Personalpronomina in der 1.Person... Aufgabe: Wie überprüft man solche intuitiv erstellten Merkmalslisten? Wie leitet man aus einer solchen Liste von Merkmalen Textmodelle ab? Wie gewichtet man die Merkmale? Welche Merkmale sind wirklich relevant, um diese beiden texte zu unterscheiden? Methode: Wenn man die Unterschiede zwischen zwei Mengen von Texten modellieren möchte, muss man zunächst eine Menge von qualitativen Merkmalen herausarbeiten (und begründen), die zur Unterscheidung dieser Textmengen sinnvoll erscheinen (Wortlänge, Satzlänge, Tempus der Verben, Anzahl Fremdwörter etc.). Dann muss man diese Merkmale in den Textmengen zählen (manuell, semi-automatisch, automatisch). Die Zählungen können dann in einem statistischen Verfahren (Faktoranalyse) ausgewertet werden, bevor sie linguistisch interpretiert werden. Biber, Douglas, S. Conrad, and R. Reppen. (1998) Corpus linguistics: Investigating language structure and use. Cambridge University Press, Cambridge McEnery, Tony (2003) KOMMT NOCH (4) Morphologie/Sprachwandel: Wie werden englische Fremdwörter in das flexionsmorphologische System des Deutschen integriert? (Achtung: Dies ist kein sprachpflegerisches Referat!)
4 Wie fremde Wörter in eine Sprache integriert werden, ist von einer Vielzahl von Faktoren in der Geber- und der Nehmersprache abhängig. So scheint die Zuordnung eines Nomens zu einem Genus von der phonologischen Gestalt und von der Bedeutung beeinflusst zu werden. der File oder das File das oder die Dabei ist die Sprachgemeinschaft oft eine zeitlang unsicher Der Backslash in der letzten Zeile ist enorm wichtig. Er verhindert, dass Mails an diese Adresse noch ein weiteres Mail geforwarded werden. / meine Hervorhebung) Default: Yes, gibt an ob eine AFS Token zum Server geforwardet werden soll. ( meine Hervorhebung) Denn tatsächlich, so David Kennedy, ein Sicherheitsanalytiker der National Computer Security Association, wäre das Problem schon morgen nicht mehr vorhanden, wenn Listserv- Administratoren die Subscribe-Anfragen verifizierten. Bevor also dutzende von Mails an den vermeintlichen Abonnenten forgewardet werden, wird dieser nach seinem Einverständnis gefragt bzw. die Authenzität seiner Subscription wird eingeholt. ( meine Hervorhebung) Aufgabe: Beschreiben Sie, wie englische Fremdwörter in das flexionsmorphologische System des Deutschen integriert werden. Diskutieren Sie, ob die Integrationsprozesse kategorial oder eventuell auch probabilistisch ablaufen. komplexe Verben: Wie werden bei komplexen Verben die Präfixe/Partikeln klassifiziert? Nomina: Wie wird die Flexionsklasse eines Fremdworts gewählt? Ist der s-plural wirklich der Defaultplural? Wie wird das Genus eines Fremdworts bestimmt? Eisenberg, Peter (2001) Die grammatische Integration von Fremdwörtern. Was fängt das Deutsche mit seinen Latinismen und Anglizismen an? In: Stickel, Gerhard (ed) Neues und Fremdes im deutschen Wortschatz. de Gruyter, Berlin, (5) Morphologie: Fugenelemente oder Kompositionsstammformen? Die sogenannten 'Fugenelemente' in deutschen Wortbildungen (hier nur Nominalkomposita) (a) Arbeitsamt, Katzenfutter, Hundepfote,... werden unterschiedlich interpretiert. Fuhrhop (1998) und Eisenberg (1998) reden nicht von Fugen, sondern analysieren den Nichtkopf mit den zusätzlichen Elementen als Kompositionsstammform. Kompositionsstammformen gehören dann zu einem Nomen wie die Flexionsklasse etc. (z. B.Flexionsstamm Katze, Kompositionsstamm Katzen). Einige Nomina haben mehrere Kompositionsstammformen
5 (b) Kindergarten, Kindesentführung, Kindfrau, Kindstod Das kann man nach Fuhrhop und Eisenberg dadurch modellieren, dass man mehrere Kompositionsstämme angibt (so auch in Lüdeling & Fitschen 2002). Der Kopf eines Kompositums hat in dieser Analyse keinen Einfluss auf die 'Fuge'. Die 'Fuge' wird nicht semantisch interpretiert. Interessant ist aber in Fällen wie (b), wie die verschiedenen Stämme verteilt sind und zugewiesen werden. Krott (2001) hat für niederländische Fugen ein analogiebasiertes Modell vorgeschlagen, in dem sowohl Nichtkopf als auch Kopf einen Einfluss haben. Aufgabe: Wie kann man die Kompositionsstammanalyse korpusbasiert überprüfen? Wie hoch ist der Anteil der Nomina mit mehreren Kompositionsstammformen? Kann man diese ohne Rückgriff auf den Kopf erklären? Oder muss man Krotts Modell auf das Deutsche übertragen? 1 Eisenberg, Peter, Grundriss der deutschen Grammatik. Band 1: Das Wort. J.B. Metzler, Stuttgart. Fuhrhop, Nanna, Grenzfälle morphologischer Einheiten. Stauffenburg- Verlag, Tübingen. Krott, Andrea, Analogy in Morphology. The Selection of Linking Elements in Dutch Compounds. MPI Series in Psycholinguistics, Nijmegen. Lüdeling, Anke and Fitschen, Arne (2002) An integrated lexicon for the analysis of complex words in: Proceedings of EURALEX 2002 (6) Deutsch als Fremdsprache: Fehlerklassifikation Durch die Auswertung von Lernerkorpora (Korpora, in denen Aufsätze etc. von Sprachlernern gesammelt sind) können 'typische' Fehler von Lernern analysiert werden. Die Fehlerklassifikation von Lernerfehlern erweist sich dabei als schwierig. Strukturelle Fehler: wie muss die zugrundeliegende grammatische Analyse aussehen? Welche Annahmen über die Tiefe der Analyse der Lerner können gemacht werden? Nichtstrukturelle Fehler: Wann wurde eine bestimmte Konstruktion zu oft oder zu selten angewendet? Aufgabe: Erstellen Sie ein (kleines!) Lernerkorpus und zeigen Sie exemplarisch, wie Fehler sinnvoll klassifiziert und annotiert werden könnten Krott hat eine Übertragung vorgeschlagen, hier werden allerdings die Fälle, in denen die Wahl eindeutig ist, nicht ausgeschlossen. Daher müssten ihre Ergebnisse überprüft werden.
6
7
Wie kann man Unterschiede zwischen zwei Mengen von Texten modellieren?
Wie kann man Unterschiede zwischen zwei Mengen von Texten modellieren? Einleitung Faktorenenanalyse Multi-dimensional analysis (D. Biber 1998) Forschungsprojekt Marlon Berlin Kapka Borisova Stephan Klinger
MehrKL WS 03/04 - Anke Lüdeling. Gliederung. Polysemie. Systematische Polysemie
KL WS 03/04 - Anke Lüdeling Arbeitsgruppe Miniprojekt 1: Lexikalische Semantik Kann man systematische Polysemie kontextuell (automatisch) bestimmen? Anne Urbschat Ruprecht v.waldenfels Jana Drescher Emil
MehrÜberblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Überblick Registervariation multidimensionale Analyse Register quantitative Analyse Dimensionen:
MehrFugenelemente oder Kompositionsstammformen?
Fugenelemente oder Kompositionsstammformen? Referat: Fugenelemente oder Kompositionsstammformen Antje Herold-Langer, Angelika Port, Silke Peters, Pauline Villentschuk, Stefan Büch, Sascha Filyuta Lehrstuhl
MehrWortstellung nominaler Elemente im Mittelfeld
HS Korpuslinguistische Beschreibung von Phänomenen des Deutschen Wortstellung nominaler Elemente im Mittelfeld Untersuchung zur Stellung nominaler Elemente im deutschen Mittelfeld - Kurzvortrag, 19.11.2003
MehrÜberblick. Grundkurs C: Einführung in die Morphologie Komposition. Linguistische Analyse. Linguistische Analyse. (Linguistische) Theorie: -ung
Grundkurs C: Einführung in die Morphologie Komposition Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Überblick einige Folien zum Sinn linguistischer Analyse e Aspekte Muster, Rekursivität
MehrAufgabe. Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten
Aufgabe Erstellen eines kleinen Lernerkorpus exemplarisches Aufzeigen, wie Fehler sinnvoll klassifiziert und annotiert werden könnten Mitstreiterinnen: Elena Briskina, Julia Hantschel, Jenny Krüger, Stéphanie
MehrNatürlichsprachliche Systeme I Materialien zur Vorlesung
Natürlichsprachliche Systeme I Materialien zur Vorlesung D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg WS 2010/11, 19. Oktober 2010,
MehrEinleitung. Fragestellungen. Fragestellungen. Überblick. Ein kleines Experiment. Integration
Fragestellungen Wie werden englische Fremdwörter in das flexionsmorphologische System des Deutschen integriert? 1. Wie wird das Genus eines Fremdwortes bestimmt? Laufen diese Integrationsprozesse kategorial
MehrVorlesung Morphologie Flexion
Vorlesung Morphologie 13.6. - Flexion Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Vertretung: Hagen Hirschmann Flexion Inhalte heute Flexionskategorien & Paradigmata Nomen Adjektive
MehrIntegration englischer Fremdwörter im Deutschen
E Fragestellungen Wie werden englische Fremdwörter in das flexionsmorphologische System des Deutschen integriert? 1. Wie wird das Genus eines Fremdwortes bestimmt? Laufen diese Integrationsprozesse kategorial
MehrWortstellung nominaler Elemente im Mittelfeld
Wortstellung nominaler Elemente im Mittelfeld Untersuchung zur Stellung nominaler Elemente im deutschen Mittelfeld - Vortrag am 04.02.2004 - von: Olga Krasavina Stefan Träger Robert Lange Elena Briskina
MehrMaschinelle Sprachverarbeitung: KollokaKonen (Teil 2: Modelle von Wortsequenzen)
basierend auf H Schmid snlp 4 KollokaKonen Maschinelle Sprachverarbeitung: KollokaKonen (Teil 2: Modelle von Wortsequenzen) Basierend auf Kap 3 McEnery & Wilson (2001) & H Schmid snlp Vorlesungsskript
MehrVertiefung der Grundlagen der Computerlinguistik. Semesterüberblick und Einführung zur Dependenz. Robert Zangenfeind
Vertiefung der Grundlagen der Computerlinguistik Semesterüberblick und Einführung zur Dependenz Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 17.10.2017 Zangenfeind:
MehrKlausur in zwei Wochen Einführung in die Morphologie Flexion
Klausur in zwei Wochen Einführung in die Morphologie Flexion Anke Lüdeling Wintersemester 2002/2003 Bitte mailen Sie mir eventuelle Fragen und Punkte, die wir noch mal üben sollen bis Mittwoch 29.01.03,
MehrKann man systematische Polysemie kontextuell (automatisch) bestimmen?
Arbeitsgruppe Miniprojekt 1: Lexikalische Semantik Gliederung Kann man systematische Polysemie kontextuell (automatisch) bestimmen? Jana Drescher Emil Kroymann Anne Urbschat Gliederung Homonymie Lexem
MehrLemmatisierung und Stemming in Suchmaschinen
Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2016 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)
MehrLemmatisierung und Stemming in Suchmaschinen
Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2014 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)
MehrSemantische Klassifikation von Kollokationen auf Grundlage des DWDS- Wortprofils
Semantische Klassifikation von Kollokationen auf Grundlage des DWDS- Wortprofils Isabel Fuhrmann, Alexander Geyken, Lothar Lemnitzer Zentrum Sprache Berlin-Brandenburgische Akademie der Wissenschaften
MehrPolysemie zwischen Homonymie und Generalität
Essay zu Konzepten lexikalischer Ambiguität Polysemie zwischen Homonymie und Generalität Fabian Steeg 30. Dezember 2007 Mehrdeutigkeit (Ambiguität) ist eine grundlegende Eigenschaft natürlicher Sprache.
MehrKookkurrenzanalyse Noch einmal: Grundlagen
Noch einmal: Grundlagen Methodologische Basis der Ermittlung sprachlicher Strukturen über kontextbestimmtes Kookkurrenzverhalten: ausreichend große Korpora statistische korpuslinguistische Methoden nachträgliche
MehrStudienfach Linguistische Informatik. 1 Modulbezeichnung Grundlagen der Computerlinguistik I 7,5 ECTS
1 Modulbezeichnung Grundlagen der Computerlinguistik I 7,5 ECTS 2 Lehrveranstaltungen VL Grundlagen der Computerlinguistik 1 (2 SWS) UE Grundlagen der Computerlinguistik 1 (2 SWS) UE Arbeitstechniken der
MehrBedeutung als Vektor? Überlegungen zur Distributionellen Semantik
Bedeutung als Vektor? Überlegungen zur Distributionellen Semantik Christine Engelmann Germanistische Sprachwissenschaft (Friedrich-Schiller-Universität Jena) 18.01.2013 Forschungsbereich innerhalb der
MehrAuswahlbibliographie zum Studium der anglistischen Sprachwissenschaft
Helga Höhlein, Peter H. Marsden, Clausdirk Poliner Auswahlbibliographie zum Studium der anglistischen Sprachwissenschaft Mit Kommentaren Max Niemeyer Verlag Tübingen 1987 INHALT Seite Allgemeine Hilfsmittel.
MehrInterdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der Informatik. SS 2016: Grossmann, Jenko
Interdisziplinäre fachdidaktische Übung: Modelle für Sprachen in der SS 2016: Grossmann, Jenko Die Beschreibung orientiert sich am Begriffssystem der Beschreibung natürlicher Sprachen Sprache in der steht
MehrWortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank
Wortdekodierung Vorlesungsunterlagen Speech Communication 2, SS 2004 Franz Pernkopf/Erhard Rank Institute of Signal Processing and Speech Communication University of Technology Graz Inffeldgasse 16c, 8010
MehrLexikalisch-semantische Disambiguierung mit WordNet
Lexikalische Semantik Lexikalisch-semantische Disambiguierung mit WordNet Conrad Steffens Paper: Rada Mihalcea & Dan I. Moldovan: A Method for Word Sense Disambiguation of Unrestricted Text Lexikalisch-semantische
MehrSemantische Annotation. Hauptseminar: Einführung in die Korpuslinguistik. Lesartenannotation - Beispiel. Lesartenannotation
Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Semantische Annotation Lesarten annotieren (sense tagging) ein bisschen was zu Lesarten
MehrPS Lexikologie. Quiz Einführung Terminologie. PS Lexikologie 1
Quiz Einführung Terminologie PS Lexikologie 1 Was ist ein Wort? Wieviele Wörter hat der folgende Satz? Katharina hat den Kühlschrank nicht zugemacht. PS Lexikologie 2 Kommt drauf an! Wir unterscheiden
MehrKookkurrenzanalyse Einführung
Einführung Kookkurenzanalyse die grundlegende Idee 1) Beobachtung: In einem Korpus tritt Wort X 1000mal auf, Wort Y 100mal, Wort Z 10mal. 2) Wahrscheinlichkeit: Die Kombination XY ist 10mal so wahrscheinlich
MehrMorphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle
Morphologische Merkmale Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle Merkmale Das Wort 'Merkmal' ' bedeutet im Prinzip soviel wie 'Eigenschaft'
MehrMaschinelle morphologische Analyse für das Deutsche. Ein Überblick. Exposé zur Studienarbeit
Maschinelle morphologische Analyse für das Deutsche. Ein Überblick. Exposé zur Studienarbeit Peter Adolphs, 1. Juli 2005 Zusammenfassung: Ziel meiner Studienarbeit ist es, einen Überblick über bestehende
Mehr3.1.2 Der Beitrag von Wortarten für die Sprachbeschreibung Bisherige Forschungsarbeiten und ihre Anwendung auf das Kreolische...
Inhaltsverzeichnis 1. Mauritius und das Kreolische auf Mauritius... 13 1.1 Landeskundlicher Teil ein Vorwort... 13 1.2 Zu Geographie, Bevölkerungsgruppen und Sprachen auf Mauritius... 14 1.3 Definition:
MehrSystem der deutschen Sprache
System der deutschen Sprache Teil 1: Wintersemester 2012/13, Dr. Sandra Döring 15. Januar 2013 1 Veranstaltung 1 12.10.2012 1.1 Inhalt des Seminars Wegen zwei Seminaren (System der deutschen Sprache 1,
MehrKorpora. Referenten Duyen Tao-Pham Nedyalko Georgiev
Korpora Referenten Duyen Tao-Pham Nedyalko Georgiev Hauptseminar: Angewandte Linguistische Datenverarbeitung (WS 11/12) Dozent: Prof. Dr. Jürgen Rolshoven Sprachliche Informationsverarbeitung Universität
Mehrder Zweitsprache Deutsch Vortrag auf dem DGFF-Kongress Inger Petersen, Universität Oldenburg
Analyse von Schreibkompetenz in der Zweitsprache Deutsch Vortrag auf dem DGFF-Kongress 2009 02.10.2009 Inger Petersen, Universität Oldenburg Gliederung 1. Das Forschungsprojekt 2. Schreibkompetenz u. Schriftlichkeit
MehrSemantik. Anke Himmelreich Variabilität der Bedeutung. Universität Leipzig, Institut für Linguistik 1 / 44
1 / 44 Semantik Variabilität der Bedeutung Anke Himmelreich anke.assmann@uni-leipzig.de Universität Leipzig, Institut für Linguistik 21.04.2016 2 / 44 Inhaltsverzeichnis 3 Strukturelle Ambiguität 1 Ambiguität
MehrEin bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Organisatorisches. Organisatorisches. Plan (vorläufig) Material
Ein bisschen Werbung Einführung in die Morphologie Einleitung, Grundbegriffe I Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 "Morphology is the conceptual centre of linguistics. This
MehrDie pragmatische Gretchenfrage und ihre Folgen
Die pragmatische Gretchenfrage und ihre Folgen Johannes Dölling (Leipzig) Nun sag', wie hast du's mit der wörtlichen Bedeutung? Workshop zu Ehren von Manfred Bierwisch, Leipzig, 26.10.2005 1 Ein grundlegendes
MehrZum Problem der Anglizismen in der spanischen Pressesprache
Sprachen Verena Junker Zum Problem der Anglizismen in der spanischen Pressesprache Examensarbeit Universität des Saarlandes Fachrichtung 4.2 Romanistik Zum Problem der Anglizismen in der spanischen Pressesprache
MehrNLP - Analyse des Wissensrohstoffs Text
NLP - Analyse des Wissensrohstoffs Text Vorlesung Beginn: 8. April 2008 Dienstag 10.15 h - 11.45 h, in Raum 1607 oder 0443 Übungen Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Beginn:
Mehrg ( ) Aufbau des Vortrags
g Merkmale g Die Untersuchung von Biber (1) Arbeitsgruppe 3: Korpusbasierte Registeranalyse Wie kann mit korpuslinguistischen Mitteln zwischen verschiedenen Textsorten unterschieden werden? Marlon Berlin
MehrEinführung in die Computerlinguistik. Morphologie II
Einführung in die Computerlinguistik Morphologie II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 30.11.2015 Schütze & Zangenfeind: Morphologie II 1
MehrÜberblick. VL: Einführung in die Korpuslinguistik. Annotation. Tokenbasierte Annotation
Überblick VL: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2004 kurze Wiederholung syntaktische phonetische/phonologische Tokenbasierte pos-tagging & Lemmatisierung
MehrIvana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch,
Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Kontakt: ivana.bt.mk@gmail.com Betreff: EICL Wiederholung Aufgabe 1 Was ist Computerlinguistik? 4 Was ist Computerlinguistik?
MehrFriedrich-Alexander-Universität Professur für Computerlinguistik. Nguyen Ai Huong
Part-of-Speech Tagging Friedrich-Alexander-Universität Professur für Computerlinguistik Nguyen Ai Huong 15.12.2011 Part-of-speech tagging Bestimmung von Wortform (part of speech) für jedes Wort in einem
MehrVL Morphologie Hintergrund: Eine gemeinsame Analyse von Konversion, Derivation & Komposition
VL Morphologie Hintergrund: Eine gemeinsame Analyse von Konversion, Derivation & Komposition Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Plan Zusammenschau und Hintergrund: Komposition,
MehrLexikalische Substitutionen. Seminar: Sprachproduktion Dozentin: Prof. Dr. Helen Leuninger WS 09/10 Referenten: Anna Schmidt und Tim Krones
Lexikalische Substitutionen Seminar: Sprachproduktion Dozentin: Prof. Dr. Helen Leuninger WS 09/10 Referenten: Anna Schmidt und Tim Krones Gliederung 1 Substitutionen: Arten und Eigenschaften 2 Entstehung
MehrEinführung in die Grammatik der deutschen Gegenwartssprache
Karl-Ernst Sommerfeldt / Günter Starke Einführung in die Grammatik der deutschen Gegenwartssprache 3., neu bearbeitete Auflage unter Mitwirkung von Werner Hackel Max Niemeyer Verlag Tübingen 1998 Inhaltsverzeichnis
MehrEinführung in die Sprachwissenschaft des Deutschen. Syntax IV. PD Dr. Alexandra Zepter
Einführung in die Sprachwissenschaft des Deutschen Syntax IV PD Dr. Alexandra Zepter Überblick Syntax Fokus auf linearer Ordnung: Sprachtypen, Topologisches Feldermodell Fokus auf hierarchischer Ordnung:
MehrDeutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können
Deutsche Lernerwortarten im Falko Lernerkorpus Was Mehrebenen-POS-tags leisten können Marc Reznicek Humboldt-Universität zu Berlin STTS- Workshop 24.9.2012 Überblick STTS in Lernerkorpora Lernerfehler
Mehrde Gruyter Studienbuch Kognitive Grammatik Klassische Paradigmen und neue Perspektiven Bearbeitet von Wolfgang Wildgen
de Gruyter Studienbuch Kognitive Grammatik Klassische Paradigmen und neue Perspektiven Bearbeitet von Wolfgang Wildgen Reprint 2012 2008. Taschenbuch. VIII, 259 S. Paperback ISBN 978 3 11 019600 9 Format
MehrWolfgang Wildgen. Kognitive Grammatik. Klassische Paradigmen und neue Perspektiven. Walter de Gruyter Berlin New York
Wolfgang Wildgen Kognitive Grammatik Klassische Paradigmen und neue Perspektiven wde G Walter de Gruyter Berlin New York Inhaltsverzeichnis Vorbemerkung und Danksagung 1 1. Sprache und Denken und die Stellung
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik WS 2/22 Manfred Pinkal Beispiel: Adjektive im Wahrig-Korpus Frequenzen in einem kleinen Teilkorpus: n groß - -
MehrKollexem-Analyse. SE: Quantitative Analyse linguistischer Variation WS 2012/13. Germanistik
Kollexem-Analyse SE: Quantitative Analyse linguistischer Variation Germanistik WS 2012/13 WS 2012/13 1 / 14 Heutige Sitzung 1 Einführung: Quantitative syntaktische Analyse am Beispiel der Kollexem-Analyse
MehrMorphologie. Ending Khoerudin Deutschabteilung FPBS UPI
Morphologie Ending Khoerudin Deutschabteilung FPBS UPI Morphologie Was ist ein Wort? Morphologie ist linguistische Teildisziplin, die sich mit dem Gestalt, Flexion (Beugung) und Bildung von Wörtern beschäftigt.
MehrMaschinelle Sprachverarbeitung Tokenisierung
Maschinelle Sprachverarbeitung Tokenisierung Dr. Heike Zinsmeister FB Sprachwissenschaft Universität Konstanz 29. Oktober 2008 Gliederung 1 Einleitung 2 Einfache Textzerlegung 3 Herausforderungen an die
MehrQUALIA STRUKTUR NACH PUSTEJOVSKY
QUALIA STRUKTUR NACH PUSTEJOVSKY Angewandte Linguistische Datenverarbeitung Sprachliche Informationsverarbeitung Universität zu Köln Dozent: Prof. Dr. Jürgen Rolshoven Referentin: Corinna Asselborn 20.01.2014
MehrEinführung in die germanistische Linguistik
Jörg Meibauer / Ulrike Demske / Jochen Geilfuß-Wolfgang / Jürgen Pafel/Karl Heinz Ramers/Monika Rothweiler/ Markus Steinbach Einführung in die germanistische Linguistik 2., aktualisierte Auflage Verlag
MehrSyntaktische Tendenzen der Gegenwartssprache
Syntaktische Tendenzen der Gegenwartssprache Anforderungen: Regelmäßige Teilnahme: max. 2 Fehlzeiten Vorbereitung auf die Sitzung: Text lesen, Fragen notieren, mitdiskutieren (!) Leitung einer Sitzung
MehrArbeitsgruppe 3: Korpusbasierte Registeranalyse
Arbeitsgruppe 3: Korpusbasierte Registeranalyse Wie kann mit korpuslinguistischen Mitteln zwischen verschiedenen Textsorten unterschieden werden? Marlon Berlin Kapka Borisova Stephan Klinger Cornelius
MehrAutomatische Lexikonakquisition aus Textkorpora. Vortrag von Peter Adolphs Forschungskolloquium Korpuslinguistik 14. Juni 2006
Automatische Lexikonakquisition aus Textkorpora Vortrag von Peter Adolphs Forschungskolloquium Korpuslinguistik 14. Juni 2006 Inhalt Vorüberlegungen zu meiner Diplomarbeit Thema: (semi-)automatische Akquisition
MehrComplexity in grammar
Complexity in grammar Übersicht Timm Lichte HHU Düsseldorf WS 2015/2016, 16.12.2015 SFB 991 Was bisher geschah Komplexitätsmaße Informatische Komplexität / Beschreibungskomplexität bezogen auf: Grammatik
MehrArtikelwörter. Jason Rothe
Artikelwörter Jason Rothe Was ist das für 1 geiler Vortrag? Gliederung 1. Einleitung 2. Lehrbuchauszug 3. These 4. Stellung der Artikelwörter 5. Artikel vs. Artikelwort 6. Zuschreibung des Genus 7. Morphosyntaktische
MehrSprachlehr- & Sprachlernsysteme
Sprachlehr- & Sprachlernsysteme Tutorielle & Toolartige Systeme Einführung in die Computerlinguistik WS 04/05 Dozentin: Wiebke Petersen Referentin: Maria Ruhnke Tutorielle Systeme lernen durch Instruktion,
MehrIII. Sprachliche Ebenen
III. Sprachliche Ebenen 1. Wie viele Ebenen? 2. Modelle der Struktur gesprochener ; 3. Typologie und Universalien. 1. Sprachstratifikation (Wie viele Ebenen gibt es in der?) Das Problem bei der Definition
MehrEinleitung. 1. Gramm. Tempus - Temporalität. Referat: Tempusfehlerklassifikation
Referat: Tempusfehlerklassifikation Humboldt-Universität zu Berlin Institut für deutsche Sprache und Linguistik HS: Korpuslinguistische Bearbeitung von Phänomenen des Deutschen Dozentin: Prof. Dr. Anke
MehrEinführung in die portugiesische Sprachwissenschaft
Annette Endruschat Jürgen Schmidt-Radefeldt Einführung in die portugiesische Sprachwissenschaft Gunter Narr Verlag Tübingen Inhalt Vorwort 9 Abkürzungen und Abbildungsverzeichnis 12 1 Weltsprache Portugiesisch
MehrNatürliche Sprache Ambiguität: syntaktisch. Natürliche Sprache Ambiguität: lexikalisch-semantisch. Natürliche Sprache Ambiguität: syntaktisch
Ambiguität: lexikalisch-semantisch Homografie, Polysemie Konstanz liegt am Bodensee. Bei Konstanz des Luftdrucks... I saw that gasoline can explode [Ich sah diesen Benzinbehälter explodieren] [Ich sah,
Mehrxii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis
Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....
MehrEinführung in die Computerlinguistik: Morphologie und Automaten I
Einführung in die Computerlinguistik: Morphologie und Automaten I WS 2013/2014 Manfred Pinkal Morphologie Morphologie ist der Teilbereich der Linguistik, der sich mit der internen Struktur von Wörtern
MehrSatzstruktur und Wortstellung im Deutschen
Hauptstudium-Linguistik: Syntaxtheorie (DGA 32) WS 2016-17 / A. Tsokoglou Satzstruktur und Wortstellung im Deutschen 2. Satzstruktur und Wortstellung in den deskriptiven Grammatiken Relativ freie Wortstellung
Mehr2 Sprachliche Einheiten
2 Sprachliche Einheiten Inhalt Semiotische Begriffe Wörter Wortbestandteile Wortzusammensetzungen Wortgruppen Text und Dialog Wort- und Satzbedeutung 2.1 Semiotische Begriffe Semiotische Begriffe Semiotik
MehrEin bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Morphologie. 'Morphologie' Was ist ein Wort? Was ist ein Wort?
Ein bisschen Werbung Einführung in die Morphologie Einleitung, Grundbegriffe I Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 "Morphology is the conceptual centre of linguistics. This
MehrNLP Eigenschaften von Text
NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen
MehrGrammatik des Standarddeutschen. Michael Schecker
Grammatik des Standarddeutschen Michael Schecker Einführung und Grundlagen Nominalgruppen Nomina Artikel Attribute Pronomina Kasus (Subjekte und Objekte, Diathese) Verbalgruppen Valenz und Argumente Tempora
MehrComputerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus
MehrGrammatikanalyse. Prof. Dr. John Peterson. Sprechstunde: Montags, 14:30-15:30h Raum LS10/Raum 425. Sommersemester 2015 Donnerstags, 14:15h-15:45h
Grammatikanalyse Sommersemester 2015 Donnerstags, 14:15h-15:45h Prof. Dr. John Peterson Sprechstunde: Montags, 14:30-15:30h Raum LS10/Raum 425 1 Termin Thema 16.4. Einführung Zerlegung des Satzes in seine
MehrKomposita semantisch. VL Morphologie: Komposition. Komposita semantisch. Komposita semantisch. Komposita semantisch. Komposita semantisch
VL Morphologie: Komposition Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Unterspezifiziertheit bei Determinativkomposita keine Referenzfähigkeit des Nichtkopfs (und nachher noch mal
MehrGliederung. Informationsextraktion Materialien zur Vorlesung. Entwicklung eines regex für Firmennamen. Entwicklung eines regex für Firmennamen
Gliederung Informationsextraktion Materialien zur Vorlesung Beispiel: reguläre Ausdrücke für Firmennamen 1 D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke
MehrPhonologische Typologie (2) Alena Witzlack-Makarevich SoSe Sitzu
Phonologische Typologie (2) Alena Witzlack-Makarevich SoSe 2015 4. Sitzu Hauslektüre Bickel, Balthasar and Nichols, Johanna. 2007. InflecGonal morphology (aus T. Shopen Language Typology and Syntac1c Descrip1on)
MehrEinführung in die französische Morphologie
Nikolaus Schpak-Dolt Einführung in die französische Morphologie 2., neu bearbeitete Auflage Max Niemeyer Verlag Tübingen 2006 Inhalt Abkürzungen und Symbole Phomembestand XI XII Einleitung 1 l._ Gegenstandsbereich
MehrSchulcurriculum Gymnasium Korntal-Münchingen
Klasse: 10 Seite 1 Minimalanforderungskatalog; Themen des Schuljahres gegliedert nach Arbeitsbereichen Übergreifende Themen, die dem Motto der jeweiligen Klassenstufe entsprechen und den Stoff des s vertiefen,
MehrInhaltsverzeichnis. Vorwort 5
Inhaltsverzeichnis Vorwort 5 0 Einleitung 11 0.1 Ausgangspunkt und Fragestellung 11 0.2 Aufbau der Arbeit 16 Teill Theoretische Grundlagen 1 Anglizismen im Kontest von Entlehnung 21 1.1 Entlehnung 21 1.1.1
MehrAlgorithmen und Formale Sprachen
Algorithmen und Formale Sprachen Algorithmen und formale Sprachen Formale Sprachen und Algorithmen Formale Sprachen und formale Algorithmen (formale (Sprachen und Algorithmen)) ((formale Sprachen) und
MehrZwischensprachliche Variation bei Quantorenanhebung
Zwischensprachliche Variation bei Quantorenanhebung Johannes Neubarth Wolfgang Seeker 12. November 2007 Wiederholung: Mays Skopusprinzip (May 1985) Skopusprinzip Zwei Quantoren (Operatoren), die sich gegenseitig
MehrModulhandbuch Studiengang Bachelor of Arts (Kombination) Linguistik Prüfungsordnung: 2016 Nebenfach
Modulhandbuch Studiengang Bachelor of Arts (Kombination) Linguistik Prüfungsordnung: 2016 Nebenfach Wintersemester 2016/17 Stand: 10. Oktober 2016 Universität Stuttgart Keplerstr. 7 70174 Stuttgart Inhaltsverzeichnis
MehrEinführung in die Computerlinguistik
Einführung in die Computerlinguistik Statistische Verfahren in der lexikalischen Semantik Evaluation Annotation eines Goldstandard : Testkorpus mit der relevanten Zielinformation (z.b. Wortart) Automatische
MehrInhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es
Inhalt und Typen von Korpora Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt von Korpora Korpora können die verschiedensten Texte in den unterschiedlichsten Zusammensetzungen
MehrMETHODEN ZUR TEILAUTOMATISCHEN ERSTELLUNG VON TRANSFERWÖRTERSÜCHERN *
LDV-Forum Bd. 5, Nr. 2/3, Jg. 1987/88, S. 17-25 17 METHODEN ZUR TEILAUTOMATISCHEN ERSTELLUNG VON TRANSFERWÖRTERSÜCHERN * FACH BEITRÄGE Ulrich Heid Universität Stuttgart, Institut für Maschinelle Sprachverarbeitung,
MehrDer Beitrag psycholinguistischer Evidenz zur Analyse grammatischer Phänomene: Eine Studie zur endo- vs. exozentrischen Struktur von Komposita
aus: Kongressakten der IVG, Paris 2005. Der Beitrag psycholinguistischer Evidenz zur Analyse grammatischer Phänomene: Eine Studie zur endo- vs. exozentrischen Struktur von Komposita 1. Einleitung Heike
MehrEinführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren
Einführung in die Computerlinguistik Morphologie (1): morphembasierte Morphologie mit Transduktoren Dozentin: Wiebke Petersen 14.6.2010 Wiebke Petersen Einführung CL SoSe 2010 1 Morphologische Grundbegrie
MehrSubjekt und Subjektpositionen
Prof. Dr. Peter Gallmann Sommer 2017 U Subjekt und Subjektpositionen U 1 Subjekt: Kasus und semantische Rolle Wie in den vorangehenden Skripts ausgeführt, wird in der wissenschaftlichen Grammatik postuliert,
MehrDas Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten
Das Zusammenspiel interpretativer und automatisierbarer Verfahren bei der Aufbereitung und Auswertung mündlicher Daten Ein Fallbeispiel aus der angewandten Wissenschaftssprachforschung Cordula Meißner
MehrLAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora
LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora
MehrSimullda. Structured Interlingua MultiLingual Lexical Database Application. Sonja Weber
Simullda Structured Interlingua MultiLingual Lexical Database Application Sonja Weber 1 Gliederung Background Begriffsklärung Multilinguale Datenbanken WordNet Maschinelle Übersetzung Formale Begriffsanalyse
MehrModulhandbuch. für das Bachelor Nebenfach Computerlinguistik gültig ab Wintersemester (Version: )
Modulhandbuch für das Bachelor Nebenfach Computerlinguistik gültig ab Wintersemester 2013 (Version: 2013-06-26) 1 Modulübersicht V=Vorlesung, Ü=Übung, S=Seminar, P=Praktikum Semester Modulnr. Titel der
Mehr