Organisatorisches. VL: Einführung in die Korpuslinguistik. Wiederholung: linguistische Daten. Diskussion
|
|
- Richard Koenig
- vor 6 Jahren
- Abrufe
Transkript
1 Organisatorisches VL: Einführung in die Korpuslinguistik Anke Lüdeling Sommersemester 2004 Mailingliste: Sie können sich auf der eintragen Übung: Di 10:00-11:30 Uhr Gebrauchstexte Di 11:30-13:00 Uhr persönliche Kommunikation Wiederholung: linguistische Daten "Die korpuslinguistische Analyse ist erst mit der Entwicklung von Computern in den letzten Jahrzehnten möglich geworden. [...] Bevor es möglich war, mit elektronischen Texten zu arbeiten, benutzten Linguisten konstruierte und daher oft künstliche Beispiele, um ihre Hypothesen zu überprüfen. Elektronische Korpora ermöglichen es, große Mengen von authentischen Texten in Betracht zu ziehen und statistisch begründete Schlussfolgerungen zu ziehen." (aus einem studentischen Referat, 2004) Diskussion "Die korpuslinguistische Analyse ist erst mit der Entwicklung von Computern in den letzten Jahrzehnten möglich geworden." viele Methoden und Verfahren, die in der modernen Korpuslinguistik verwendet werden, stammen aus der historischen Linguistik, Soziolinguistik,... Analyse ist jetzt einfacher, standardisierter, Ergebnisse sind leichter reproduzierbar
2 Diskussion "Bevor es möglich war, mit elektronischen Texten zu arbeiten, benutzten Linguisten konstruierte und daher oft künstliche Beispiele, um ihre Hypothesen zu überprüfen." Indogermanisten, Junggrammatiker, Strukturalisten etc. haben immer authentische Beispiele verwendet konstruierte Beispiele und Grammatikalitätsurteile (Introspektion) sind nicht 'schlechter', sie beantworten aber andere Fragen Diskussion "Elektronische Korpora ermöglichen es, große Mengen von authentischen Texten in Betracht zu ziehen und statistisch begründete Schlussfolgerungen zu ziehen." man muss aber genau darauf achten, welche Texte man für welche Fragestellungen heranzieht statistische (quantitative) Auswertung nicht für alle Fragestellungen sinnvoll wenn statistische Aussagen gemacht werden, muss man genau wissen, was man rechnet (Verfahren, Verteilungen) Geschichte der Korpuslinguistik Textsammlungen werden schon im 19. Jhd. (und früher) verwendet, um Sprachwandel zu beschreiben grammatische Aussagen zu belegen/illustrieren Spracherwerb zu dokumentieren Wörterbücher zu erstellen Sprachvergleiche anzustellen... Geschichte der Korpuslinguistik Anm.: Gelegentlich erscheint auch sonst ein s in der Kompositionsfuge nach Femininum, ohne daß es in die Schriftsprache durchgedrungen ist, vgl. z.b. Gemeindsversammlung Hebel 452, 24, Huldszeichen Heine 2, 111, über Naturs Größe Le. 11, 209, 5, Sprachsverbesserer, Leibniz, Unvorgreifl. Ged. 67,3, Vernunftswahrheiten Le. 12, 434, 32. Belege für Anfügung eines s an einen weiblichen Genitiv sind noch: Erdens-Götter Lohenst., Cleop Hermann Paul (1959, Band V, 13)
3 Geschichte der Korpuslinguistik Textsammlungen im Wesentlichen Klassiker, gehobene Schriftsprache für tote Sprachen: alles, was verfügbar ist Wortlisten mit Wörtern in verschiedenen Sprachen keine quantitativen Aussagen möglich keine Ausgewogenheit Strukturalismus synchrone Sprachbetrachtung gesprochene Sprache Amerikanischer Strukturalismus: Boas ( Papa Franz ), Sapir, Bloomfield, Harris einflußreich bis in die 1960er, viele Methoden & Begrifflichkeiten werden heute noch verwendet korpusbasiert (Korpora oft sehr klein) Indianersprachen Strukturalismus Debatte: sollte eine Grammatik nur das gesammelte Fragment (das Korpus) beschreiben oder kann man Aussagen über ungesehene Daten machen Grundsätzliche Idee: eine Sprache ist endlich; wenn man lange genug sammelt, kann man ein komplettes Korpus erhalten Generative Theorie (Chomsky) neues Forschungsziel: SprecherInnen produzieren und verstehen unendlich viele Sätze/Wörter. Deswegen muss die Linguistik die zugrundeliegende Sprachfähigkeit beschreiben (und nicht nur eine gegebene Sammlung von Sätzen). Kompetenz vs. Performanz I-language vs. E-language
4 Generative Theorie in einem Korpus sind Performanzdaten gesammelt, d.h. es gibt viele außersprachliche Faktoren, die die Daten beeinflussen man kann daraus kein Kompetenzmodell ableiten (weil man die außersprachlichen Faktoren nicht herausfiltern kann) daher sollte sich der Linguist/die Linguistin auf Introspektion verlassen Generative Theorie Wenn es unendlich viele Sätze gibt, ist jede Auswahl zufällig. "Any natural corpus will be skewed. Some sentences won't occur because they are obvious, others because they are false, still others because they are impolite. The corpus, if natural, will be so wildly skewed that the description [based upon it] would be no more than a mere list." (Chomsky 1962, 159) Lösung: Introspektion? Introspektion und Korpusdaten Wie produktiv ist das deutsche Suffix -tum? Partikeln aus Partikelverben können nicht topikalisiert werden (Neeleman/Weermann 1993, Stiebels/Wunderlich 1994 u.v.a.) dem letzten Loch pfeifen kann man ins Gras beißen modifizieren? kommt im Korpus vor kommt im Korpus nicht vor Grammatikalität und Korpusdaten grammatisch immer, Wirtschaftskrise, nach 14 Jahren Kohl,... NPs mit 27 Genitivattributen: das Haus der Großmutter der Schwester des Verwalters der... ungrammatisch immmer, letzendlich, unkaputtbar, ich habe fertig,... "Some sentences won't occur because they are obvious, others because they are false, still others because they are impolite." (Chomsky 1962, 159, Hervorhebung AL)
5 Introspektion und Korpusdaten Introspektion und Korpusdaten aber: man braucht eine Norm (Introspektion!), um Korpusdaten zu filtern VM: ja, das scheint mir etwas zu weit auseinandergerissen, ich sehe auch gerade, achtundzwanzigster bis einunddreissigster bin ich also auch nicht da, habe ich gerade gesehen, das deckt sich also auch wieder mit Ihren, ich würde schon mal sagen, wir lassen es alle vierzehn Tage,... Korpusdaten zufällig, nicht ausgewogen Performanzdaten nachvollziehbar, überprüfbar natürliche Kontexte Frequenzanalysen möglich Introspektion jederzeit verfügbar nicht objektiv, nicht überprüfbar manchmal artifizell keine Frequenzdaten Fragestellungen Chomskys zur Korpuslinguistik Theoretische Linguistik Kompetenz, I-language, Struktur: Was ist grammatisch? Introspektion unendlich viele Typen, produktiv synchron Korpuslinguistik Performanz, E-language, Was kommt vor? Instanzen endliche Anzahl von Typen Variabilität, Frequenzdaten in einer Zeit verankert "It doesn't exist" (Chomsky in an interview, answering a question by Bas Aarts "What do you think of corpus linguistics?", 2001)
6 Korpuslinguistik nach 1950 weiterführende Korpusstudien in einigen Gebieten (Dialektologie, historische Linguistik,...) neues Interesse an der Korpuslinguistik, weil man für computerlinguistische und psycholinguistische Fragestellungen Frequenzdaten brauchte allerdings: immer noch keine maschinenlesbaren Korpora Frühe maschinenlesbare Korpora Roberto Busa: Korpus von mittelalterlichen Philosophietexten (Projekt mit IBM ), Konkordanzer (nett: Arbeit von Busa führte später zu folgender CD: Thomae Aquinatis Opera Omnia cum hypertextibus in CD-ROM ) andere Arbeiten an historischen Texten (griechische Bibel, andere religiöse Texte, etc.) Morton s Analyse von Autorenschaft Juillands Mechanolinguistik Frühe maschinenlesbare Korpora Memories of the early days are all of paper tape. It waved in and out of every machine, it dried and then cracked and split or it got damp when it lay limp and then sagged and stretched. Sometimes it curled round you like a hungry anaconda, at others it lay flat and lifeless and would not wind. Above all it extended to infinity in all directions. A Greek New Testament, half a million characters, ran to a mile of paper tape, and the complete concordance of it ran to seven miles (Morton 1980, 197). (zitiert nach Frühe maschinenlesbare Korpora Englisch Quirk (1960s) Survey of English Usage Francis & Kucera: Brown Corpus Svartvik (1970s): London-Lund Corpus Leech: Lancaster-Oslo-Bergen Corpus (LOB) verschiedene korpuslinguistische Zentren in Europa Firth: Kontext, Kollokationen Sinclair: COBUILD, Bank of English
7 Frühe maschinenlesbare Korpora 1 m Wörter (Francis/Kuceras Wortfrequenzen immer noch Standard) Annotationsmethoden werden entwickelt Suchmethoden werden entwickelt Diskussion der Zusammensetzung (sampling method) Second generation corpora viel größer (> 100 m Wörter) Standardisierungsinitiativen Netzwerke viel mehr korpusbasierte Forschung die Feindschaft zwischen generativen LinguistInnen und KorpuslinguistInnen scheint zu schwinden Grundbegriffe: Korpus "corpus linguistics is not a branch of linguistics, but the route into linguistics". Michael Hoey, remark at TALC 1998 Korpora sind Sammlungen von Texten (geschriebener Text, transkribierte gesprochene Sprache) Textkorpora Texte mit syntaktischer Struktur Baumbanken Sprachdaten (Sprachsignal evtl. mit Transkription, phonetische Annotation) Sprachkorpora Sprachdaten mit Transkription und weiterer Information wie Gestik, Mundbewegung etc. multimodale Korpora
8 Grundbegriffe: Korpus "Korpus" wird unterschiedlich definiert im Prinzip kann jeder Text/jede Textsammlung ein Korpus sein in der Korpuslinguistik geht man aber meistens (stillschweigend) davon aus, dass ein Korpus sinnvoll zusammengesetzt ist maschinenlesbar ist eine festgelegte Zusammensetzung & Größe hat Grundbegriffe: Korpus "Korpus" wird unterschiedlich definiert im Prinzip kann jeder Text/jede Textsammlung ein Korpus sein in der Korpuslinguistik geht man aber meistens (stillschweigend) davon aus, dass ein Korpus sinnvoll zusammengesetzt ist eine festgelegte Zusammensetzung & Größe hat maschinenlesbar ist linguistisch annotiert ist /12.05./ Grundbegriffe: Annotation Headerinformation strukturelle Annotation graphische Annotation logische Annotation positionelle Annotation Grundbegriffe: Annotation Headerinformation: Informationen über einen Text (oder Textausschnitt im Korpus) Informationen zum Text: Autor, Textsorte, Entstehungszeit, bibliographische Informationen Informationen zur Erstellung des Korpus: Digitalisierungsverfahren, Annotationsverfahren, beteiligte Personen, verwendete Programme,...
9 Grundbegriffe: Annotation strukturelle Annotation: Informationen zur Struktur eines Textes graphische Annotation: Zeile, Seite, Absatz, Überschrift logische Annotation: Satz, Phrase, Vers Grundbegriffe: Annotation positionelle Annotation: Annotation, die sich auf eine Korpusposition bezieht Einschub: Korpusposition das Korpus ist komplett sequenziert, jedes Wort ( Token) hat eine eindeutige Korpusposition Wenn heute schon zwei Drittel der Bergunfälle auf Unkenntnis oder Selbstüberschätzung der Akteure zurückzuführen sind, bedeutet dies auch,... daß die Absicherungshysterie am Ende genau das Gegenteil von dem bewirkt, was sie bezwecken will. Grundbegriffe: Annotation positionelle Annotation: Annotation, die sich auf eine Korpusposition bezieht zu jedem Token zb Lemmainformation, Wortart, flexionsmorphologische Information, Lesart,... zu jedem Satz zb Struktur, Satzmodus,...
10 Literatur Abney, Steven (1996) Statistical Methods in Linguistics. In: Klavans, Judith & Resnik, Philip (eds) The Balancing Act, MIT Press, Cambridge, MA Evert, Stefan & Fitschen, Arne (2001) Textkorpora. In: Carstensen, Kai-Uwe et al. (eds) Computerlinguistik und Sprachtechnologie. Eine Einführung. Spektrum Akademischer Verlag, Heidelberg McEnery, Tony & Wilson, Andrew (1996) Corpus Linguistics, Edinburgh University Press, Edinburgh The Encyclopedia of Language and Linguistics (1994) (R.E. Asher, editor) Pergamon Press, Oxford
Korpuslinguistik. Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, Korpuslinguistik. Jürgen Spitzmüller.
Vorlesungsreihe»Methoden der Linguistik«(WS 2004/05) Universität Zürich, 7.12.2004 1. Teil: Theorie Grundlegende theoretische Fragestellungen: Was sind überhaupt Korpora? Wozu Korpora? Was sollen Korpora
MehrEinleitung. Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal
Definitionen von Korpuslinguistik und das Repräsentativitätsmerkmal Einleitung 1. Einleitung 2. Definitionen von Korpuslinguistik 2.1 Entstehung 2.1.1 : korpusbasiert vs. korpusgestützt 2.1.2 Generative
MehrWiederholung: Forschungsfragen und Korpusdaten. GK C: Einführung in die Korpuslinguistik. Wiederholung: Forschungsfragen und Korpusdaten
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Wiederholung: Forschungsfragen und Korpusdaten Korpusdaten können benutzt werden um zu entscheiden,
MehrKorpus. Was ist ein Korpus?
Was ist ein Korpus? Korpus Endliche Menge von konkreten sprachlichen Äußerungen, die als empirische Grundlage für sprachwiss. Untersuchungen dienen. Stellenwert und Beschaffenheit des Korpus hängen weitgehend
MehrGrammatiken und linguistische Evidenz
Grammatiken und linguistische Evidenz SE: Quantitative Analyse linguistischer Variation Dozentin: Ines Rehbein 14.11.2012 Linguistische Variation (Ines Rehbein) WS 2012/13 1 / 28 Heutige Sitzung I. Zusammenfassung
MehrComputerlinguistische Grundlagen. Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Sommersemester 17 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistik: Schnittstellen Computerlinguistik aus
MehrSprachliche Ressourcen I - Korpora - Hauptseminar Sprachtechnologie Referentin am : Stefanie Grabbe
Sprachliche Ressourcen I - Korpora - Hauptseminar Sprachtechnologie Referentin am 15.5.2002: Stefanie Grabbe Institut für Angewandte Informationswissenschaft Definitionen Korpus das, 1. Belegsammlung von
MehrÜberblick. GK C: Einführung in die Korpuslinguistik. Fragen. Sprachwandel/Sprachvariation. Fragen. NB: Register
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Überblick Registervariation multidimensionale Analyse Register quantitative Analyse Dimensionen:
MehrKorpora im Sprachunterricht. GK C: Einführung in die Korpuslinguistik. Korpora im Sprachunterricht. Korpora im Sprachunterricht. Korpus als Material
GK C: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2003 Korpora können genutzt werden als direkte Verwendung von Korpora im Unterricht Suchen, Entdecken
MehrKorpora. Referenten Duyen Tao-Pham Nedyalko Georgiev
Korpora Referenten Duyen Tao-Pham Nedyalko Georgiev Hauptseminar: Angewandte Linguistische Datenverarbeitung (WS 11/12) Dozent: Prof. Dr. Jürgen Rolshoven Sprachliche Informationsverarbeitung Universität
MehrLinguistische Daten. Hauptseminar: Einführung in die Korpuslinguistik. Linguistische Daten. Introspektion. Psycholinguistische Experimente
Hauptseminar: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Introspektion Die Linguistin sitzt im Lehnstuhl und beurteilt Sprachdaten (arm-chair
Mehrheute HS: Korpuslinguistische Beschreibung von Phänomenen des Deutschen Wissenschaftliches Arbeiten Wissenschaftliches Arbeiten
HS: Korpuslinguistische Beschreibung von Phänomenen des Deutschen Anke Lüdeling WS 2003/2004 http://www2.hu-berlin.de/korpling/lehre/ws-2003/hs-phaenomene-deutsch/ heute Besprechung des Semesterplans,
MehrEinführung in die Korpuslinguistik
Einführung in die Korpuslinguistik SE: Quantitative Analyse linguistischer Variation Dozentin: Ines Rehbein 24.10.2012 Linguistische Variation (Ines Rehbein) Korpuslinguistik WS 2012/13 1 / 31 Überblick
MehrEszter Mózes: Tony McEnery & Andrew Hardie: Corpus Linguistics. Method, Theory and Practice Argumentum 8 (2012), Debreceni Egyetemi Kiadó
92 Recenzió Eszter Mózes Tony McEnery & Andrew Hardie: Corpus Linguistics. Method, Theory and Practice * Cambridge: Cambridge University Press, 2012, 294 Seiten Das vorliegende Buch wurde im Rahmen der
MehrJOBS OF TEENAGERS CODE 250
JOBS OF TEENAGERS Fertigkeit Hören Relevante(r) Deskriptor(en) Deskriptor 1: Kann Gesprächen über vertraute Themen die Hauptpunkte entnehmen, wenn Standardsprache verwendet und auch deutlich gesprochen
MehrCentrum für Informations- und Sprachverarbeitung. Dr. M. Hadersbeck, Digitale Editionen, BAdW München
# 1 Digitale Editionen und Auszeichnungssprachen Computerlinguistische FinderApps mit Facsimile-Reader Wittgenstein s Nachlass: WiTTFind Goethe s Faust: GoetheFind Hadersbeck M. et. al. Centrum für Informations-
MehrEinführung. Stefanie Dipper Stefan Evert Heike Zinsmeister
Einführung Stefanie Dipper Stefan Evert Heike Zinsmeister München, 28.1.2011 Korpus eine Sammlung gesprochener oder geschriebener Äußerungen typischerweise digitalisiert und maschinenlesbar Ebenen eines
MehrStudienfach Linguistische Informatik. 1 Modulbezeichnung Grundlagen der Computerlinguistik I 7,5 ECTS
1 Modulbezeichnung Grundlagen der Computerlinguistik I 7,5 ECTS 2 Lehrveranstaltungen VL Grundlagen der Computerlinguistik 1 (2 SWS) UE Grundlagen der Computerlinguistik 1 (2 SWS) UE Arbeitstechniken der
MehrLevel 1 German, 2011
90886 908860 1SUPERVISOR S Level 1 German, 2011 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am uesday Tuesday 1 November 2011 Credits: Five Achievement
MehrRelevante(r) Deskriptor(en) Deskriptor 5: Kann einfachen Interviews, Berichten, Hörspielen und Sketches zu vertrauten Themen folgen.
RULES IN THE FAMILY Fertigkeit Hören Relevante(r) Deskriptor(en) Deskriptor 5: Kann einfachen Interviews, Berichten, Hörspielen und Sketches zu vertrauten Themen folgen. (B1) Themenbereich(e) Familie und
MehrWortdekodierung. Vorlesungsunterlagen Speech Communication 2, SS Franz Pernkopf/Erhard Rank
Wortdekodierung Vorlesungsunterlagen Speech Communication 2, SS 2004 Franz Pernkopf/Erhard Rank Institute of Signal Processing and Speech Communication University of Technology Graz Inffeldgasse 16c, 8010
MehrÜberblick. VL: Einführung in die Korpuslinguistik. Annotation. Tokenbasierte Annotation
Überblick VL: Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2004 kurze Wiederholung syntaktische phonetische/phonologische Tokenbasierte pos-tagging & Lemmatisierung
MehrVORANSICHT. M 3: Do you like my decorations? Mit einem Kurzilm das Hörverstehen schulen (Klassen 5 bis 10) Die Materialien
I/A Communicative skills Listening 13 Christmas decorations (Kl. 5 10) 1 von 20 Do you like my decorations? Mit einem Kurzilm das Hörverstehen schulen (Klassen 5 bis 10) Ein Beitrag von Monika Schäfers,
MehrLemmatisierung. Einführung in die Korpuslinguistik. Lemmatisierung und Wortarttagging. Lemmatisierung. zum Erinnern... zum Erinnern...
Lemmatisierung Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2007 zum Lemmatisieren braucht man also ein Lexikon, in dem die Lemmata mit ihrer Flexionsklasse
MehrMitglied der Leibniz-Gemeinschaft
Methods of research into dictionary use: online questionnaires Annette Klosa (Institut für Deutsche Sprache, Mannheim) 5. Arbeitstreffen Netzwerk Internetlexikografie, Leiden, 25./26. März 2013 Content
MehrLevel 2 German, 2016
91126 911260 2SUPERVISOR S Level 2 German, 2016 91126 Demonstrate understanding of a variety of written and / or visual German texts on familiar matters 2.00 p.m. Tuesday 29 November 2016 Credits: Five
MehrBRITISH TEENAGERS TALKING ABOUT WHAT THEY EAT
BRITISH TEENAGERS TALKING ABOUT WHAT THEY EAT CODE 024 Fertigkeit Hören Relevante(r) Deskriptor(en) Deskriptor 5: Kann einfachen Interviews, Berichten, Hörspielen und Sketches zu vertrauten Themen folgen.
MehrLevel 1 German, 2012
90886 908860 1SUPERVISOR S Level 1 German, 2012 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am Tuesday 13 November 2012 Credits: Five Achievement
MehrDIBELS TM. German Translations of Administration Directions
DIBELS TM German Translations of Administration Directions Note: These translations can be used with students having limited English proficiency and who would be able to understand the DIBELS tasks better
MehrEin bisschen Werbung. Grundkurs C: Einführung in die Morphologie Einleitung, Grundbegriffe I. 'Morphologie' Was ist ein Wort? Was ist ein Wort?
Grundkurs C: Einführung in die Morphologie Einleitung, Grundbegriffe I Anke Lüdeling anke.luedeling@rz.hu-berlin.de Wintersemester 2002/2003 Ein bisschen Werbung "Morphology is the conceptual centre of
MehrGERMAN (Second Language)
GERMAN (Second Language) (Three Hours) Answers to this paper must be written on the paper provided separately. You will not be allowed to write during the first 15 minutes. This time is to be spent in
MehrBIRTHDAY PRESENTS FOR GRANDMOTHERS
BIRTHDAY PRESENTS FOR GRANDMOTHERS Fertigkeit Hören Relevante(r) Deskriptor(en) Deskriptor 5: Kann einfachen Interviews, Berichten, Hörspielen und Sketches zu vertrauten Themen folgen. (B1) Themenbereich(e)
MehrKurze Geschichten fuer Kinder und auch fuer Solche, welche die Kinder lieb haben (German Edition)
Kurze Geschichten fuer Kinder und auch fuer Solche, welche die Kinder lieb haben (German Edition) Click here if your download doesn"t start automatically Kurze Geschichten fuer Kinder und auch fuer Solche,
Mehr1 Einleitung. 1.1 Was ist Korpuslinguistik? Die Folklore der Sprachwissenschaft 1 kennt zwei Forschertypen:
1 Einleitung 1.1 Was ist Korpuslinguistik? Die Folklore der Sprachwissenschaft 1 kennt zwei Forschertypen: Der Denker 2 verbringt die meiste Zeit in seinem Sessel und denkt nach. Die Sprachtheorie, die
MehrWas ist ein Korpus. Zitat aus: Carstensen et al. Computerlinguistik und Sprachtechnologie: Eine Einführung. Kap. 4.2, Textkorpora
Was ist ein Korpus Korpora sind Sammlungen linguistisch aufbereitete(r) Texte in geschriebener oder gesprochener Sprache, die elektronisch gespeichert vorliegen. Zitat aus: Carstensen et al. Computerlinguistik
MehrArbeitsblatt Nein, Mann!
Exercise 1: Understanding the lyrics First of all, read through the song lyrics on the Liedtext sheet. You can find the English translations of the underlined words on the right hand side. Use a dictionary
MehrMontag Dienstag Mittwoch Donnerstag Freitag Samstag Sonntag
Fragebogen FS 23 German I Aussprache (pronunciation) Repeat the German phrases you hear and fill in any missing words on this sheet! Guten Tag! Das ist der Kugelschreiber. Ich habe meinen Kuli. Er ist
MehrNürnberg und der Christkindlesmarkt: Ein erlebnisreicher Tag in Nürnberg (German Edition)
Nürnberg und der Christkindlesmarkt: Ein erlebnisreicher Tag in Nürnberg (German Edition) Karl Schön Click here if your download doesn"t start automatically Nürnberg und der Christkindlesmarkt: Ein erlebnisreicher
Mehrausgezeichnet - doch! - Hinweis Nr. 1. zuerst - dann - danach - endlich - Hinweis Nr. 2.
1.08 Fragebogen Neue Wörter Gibt es neue Wörter heute? Alte Wörter ausgezeichnet - doch! - Hinweis Nr. 1. ein bißchen - hat den Apfel gegessen - zuerst - dann - danach - endlich - Hinweis Nr. 2. Perfekt
MehrLevel 2 German, 2013
91126 911260 2SUPERVISOR S Level 2 German, 2013 91126 Demonstrate understanding of a variety of written and / or visual German text(s) on familiar matters 9.30 am Monday 11 November 2013 Credits: Five
MehrLevel 1 German, 2014
90886 908860 1SUPERVISOR S Level 1 German, 2014 90886 Demonstrate understanding of a variety of German texts on areas of most immediate relevance 9.30 am Wednesday 26 November 2014 Credits: Five Achievement
MehrAVS-M Name des Moduls: Sprachtypologie und Universalienforschung
AVS-M 10 1. Name des Moduls: Sprachtypologie und Universalienforschung 2. Fachgebiet / Verantwortlich: Allgemeine und Vergleichende Sprachwissenschaft/ Prof. Dr. Johannes Helmbrecht 3. Inhalte des Moduls:
MehrThe English Tenses Die englischen Zeitformen
The English Tenses Die englischen Zeitformen Simple Present (Präsens einfache Gegenwart) Handlungen in der Gegenwart die sich regelmäßig wiederholen oder einmalig geschehen I go you go he goes she goes
MehrGrammatik und Stochastik
Grammatik und Stochastik Gerhard Jäger ZAS/Uni Potsdam Der Generativist: Evidently, one s ability to produce and recognize grammatical utterances is not based on notions of statistical approximation and
MehrPONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: ENGLISCH LERNEN MIT JUSTUS, PETER UND BOB
Read Online and Download Ebook PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: ENGLISCH LERNEN MIT JUSTUS, PETER UND BOB DOWNLOAD EBOOK : PONS DIE DREI??? FRAGEZEICHEN, ARCTIC ADVENTURE: Click link bellow
MehrDigital Humanities Research Collaboration Lower Saxony
DHD 2014 Passau Jörg Wettlaufer Göttingen Digital Humanities und Interdisziplinarität. Thesen für eine Kooperation zwischen Geisteswissenschaften und angewandter Informatik. Abb. verändert nach: ISBN:
Mehr"Die Bundesländer Deutschlands und deren Hauptstädte" als Thema einer Unterrichtsstunde für eine 5. Klasse (German Edition)
"Die Bundesländer Deutschlands und deren Hauptstädte" als Thema einer Unterrichtsstunde für eine 5. Klasse (German Edition) Florian Schwarze Click here if your download doesn"t start automatically Download
MehrEin bisschen Werbung. Einführung in die Morphologie Einleitung, Grundbegriffe I. Organisatorisches. Organisatorisches. Plan (vorläufig) Material
Ein bisschen Werbung Einführung in die Morphologie Einleitung, Grundbegriffe I Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 "Morphology is the conceptual centre of linguistics. This
MehrEin Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten. Click here if your download doesn"t start automatically
Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten Click here if your download doesn"t start automatically Ein Stern in dunkler Nacht Die schoensten Weihnachtsgeschichten Ein Stern in dunkler
MehrFuture plans. Exercise 1: Read the text below.
Exercise 1: Read the text below. Future plans Nächstes Jahr werde ich die Schule verlassen, weil ich die Schule hasse. Mit 18 werde ich einen Job finden. Ich möchte in einem Büro arbeiten, weil ich als
MehrName: Klasse: Standardisierte kompetenzorientierte schriftliche Reifeprüfung AHS. 18. September Englisch. Schreiben
Name: Klasse: Standardisierte kompetenzorientierte schriftliche Reifeprüfung AHS 18. September 2015 Englisch (B2) Schreiben Hinweise zum Beantworten der Fragen Sehr geehrte Kandidatin, sehr geehrter Kandidat!
MehrDas Zeitalter der Fünf 3: Götter (German Edition)
Das Zeitalter der Fünf 3: Götter (German Edition) Trudi Canavan Click here if your download doesn"t start automatically Das Zeitalter der Fünf 3: Götter (German Edition) Trudi Canavan Das Zeitalter der
MehrOn a Sunday Morning summary
On a Sunday Morning summary Connect the English sentences and their German translation Verbinde die englischen Sätze mit ihrer deutschen Übersetzung The hedgehog was standing at the door of his house He
MehrAnalyse und Interpretation der Kurzgeschichte "Die Tochter" von Peter Bichsel mit Unterrichtsentwurf für eine 10. Klassenstufe (German Edition)
Analyse und Interpretation der Kurzgeschichte "Die Tochter" von Peter Bichsel mit Unterrichtsentwurf für eine 10. Klassenstufe (German Edition) Janina Schnormeier Click here if your download doesn"t start
MehrLinguistische Grundlagen für die maschinelle Sprachverarbeitung
Linguistische Grundlagen für die maschinelle Sprachverarbeitung Anke Lüdeling Institut für deutsche Sprache und Linguistik anke.luedeling@rz.hu berlin.de Überblick Was ist Linguistik? linguistische Beschreibungsebenen
MehrName: Klasse: Standardisierte kompetenzorientierte schriftliche Reifeprüfung AHS. 19. September Englisch. Schreiben
Name: Klasse: Standardisierte kompetenzorientierte schriftliche Reifeprüfung AHS 19. September 2017 Englisch (B2) Schreiben Hinweise zum Beantworten der Fragen Sehr geehrte Kandidatin, sehr geehrter Kandidat!
MehrPressglas-Korrespondenz
Stand 14.01.2016 PK 2015-3/56 Seite 1 von 5 Seiten Abb. 2015-3/56-01 und Abb. 2015-3/56-02 Vase mit drei Gesichtern: Frau, Mann und Kind, farbloses Pressglas, teilweise mattiert, H 18,8 cm, D 15 cm Vase
MehrOrganisatorisches. Einführung in die Korpuslinguistik. Organisatorisches. Organisatorisches: Schein. Korpuslinguistik. Linguistische Daten
Organisatorisches Einführung in die Korpuslinguistik Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2005 Kontakt: anke.luedeling@rz.hu-berlin.de, 030-20939799 Webseite für Vorlesung http://www.linguistik.huberlin.de/korpuslinguistik/lehre/ss-2005/hskorpuslinguistik/index.php
Mehr6KRSSLQJDW&DPGHQ/RFN 1LYHDX$
)HUWLJNHLW+ UYHUVWHKHQ 1LYHDX$ Wenn langsam und deutlich gesprochen wird, kann ich kurze Texte und Gespräche aus bekannten Themengebieten verstehen, auch wenn ich nicht alle Wörter kenne. 'HVNULSWRU Ich
MehrKorrekturprogramme. Von Emine Senol & Gihan S. El Hosami
Korrekturprogramme Von Emine Senol & Gihan S. El Hosami Einleitung Millionen von Texten werden mit dem Computern täglich erfasst Fehler schleichen sich ein Korrekturprogramme helfen diese zu finden zu
MehrRESI A Natural Language Specification Improver
Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 RESI A Natural Language Specification Improver Dipl. Inform. Sven J. Körner Torben Brumm Prof. Dr. Walter F. Tichy Institute for Programming
MehrLehrplan für Linguistik / Allgemeine Sprachwissenschaft, Master
Version: 28.08.2016 Lehrplan für Linguistik / Allgemeine Sprachwissenschaft, Master Wintersemester 2016/17 M o d u l s i g e l n [ASW-M1] Sprachstrukturkurse: 53-985 (Wagner-Nagy, Südselkupisch) 53-990
MehrComputergestützte Korpuslinguistik und die Kollokationstheorie PS: Computerlinguistik Kristin Dill
Computergestützte Korpuslinguistik und die Kollokationstheorie PS: Computerlinguistik Kristin Dill Korpuslinguistik Die Korpuslinguistik ist ein Bereich der Linguistik, in dem Theorien über Sprache anhand
MehrE-PORTFOLIOS IM KURS NEUE MEDIEN IM FREMDSPRACHENUNTERRICHT
E-PORTFOLIOS IM KURS NEUE MEDIEN IM FREMDSPRACHENUNTERRICHT Anna Maria Schäfer Institut für Anglistik und Amerikanistik annamaria.schaefer@staff.uni-marburg.de Ablauf 1. Thema und Anforderungen 2. Umsetzung
MehrÜberregionale Tageszeitungen: Drei große Titel im Vergleich (German Edition)
Überregionale Tageszeitungen: Drei große Titel im Vergleich (German Edition) Christian Mueller Click here if your download doesn"t start automatically Überregionale Tageszeitungen: Drei große Titel im
MehrFachübersetzen - Ein Lehrbuch für Theorie und Praxis
Fachübersetzen - Ein Lehrbuch für Theorie und Praxis Radegundis Stolze Click here if your download doesn"t start automatically Fachübersetzen - Ein Lehrbuch für Theorie und Praxis Radegundis Stolze Fachübersetzen
MehrGrundkurs des Glaubens: Einführung in den Begriff des Christentums (German Edition)
Grundkurs des Glaubens: Einführung in den Begriff des Christentums (German Edition) Karl Rahner Click here if your download doesn"t start automatically Grundkurs des Glaubens: Einführung in den Begriff
MehrHäufigkeit des Vorlesens innerhalb einer Woche
Anteil der Eltern Anteil der Eltern Anteil der Eltern 6. Anhang Auswertung Umfrage Eltern England/Deutschland Tabelle 1: Frage 2 Wie oft lesen Sie Ihrem Kind unter der Woche vor? Häufigkeit des Vorlesens
MehrLAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora
LAUDATIO - Eine Infrastruktur zur linguistischen Analyse historischer Korpora Carolin Odebrecht, Humboldt-Universität zu Berlin Florian Zipser, Humboldt-Universität zu Berlin, INRIA Historische Textkorpora
MehrDie Intrige: Historischer Roman (German Edition)
Die Intrige: Historischer Roman (German Edition) Ehrenfried Kluckert Click here if your download doesn"t start automatically Die Intrige: Historischer Roman (German Edition) Ehrenfried Kluckert Die Intrige:
MehrNLP Eigenschaften von Text
NLP Eigenschaften von Text Dr. Andreas Hotho Dominik Benz Beate Krause Sommersemester 2008 Folie: 1 Übersicht Einführung Eigenschaften von Text Words I: Satzgrenzenerkennung, Tokenization, Kollokationen
MehrHausaufgabe 6-7. To be filled out by student: If homework late, what are the reasons: If correction late, what are the reasons:
Hausaufgabe 6-7 Homework due: 6-8 Last day of acceptance of homework: 6-4 Correction due: 6-10 Last day of acceptance of correction: 7-1 To be filled out by student: If homework late, what are the reasons:
MehrPodcast #1: das Wasser. Übungen. Das Wasser. I. Hör dir den Podcast an und vervollständige den Text. I. Listen to the podcast and complete the text.
Übungen I. Hör dir den Podcast an und vervollständige den Text. I. Listen to the podcast and complete the text. Ich trinke. Wasser ist. Wenn ich Wasser trinke, es mir gut. Wasser hat keine Kalorien. Wasser
MehrGrammatik: A quiz about London
Grammatik: A quiz about London Stand: 21.03.2016 Jahrgangsstufen Fach/Fächer Übergreifende Bildungsund Erziehungsziele Zeitrahmen Benötigtes Material 5 (E1) bzw. 6 (E2) im 2. Halbjahr Englisch Interkulturelle
MehrWörterbücher im Internet - Konzeptionen und Realisierungen
Sprachen Jana Kullick Wörterbücher im Internet - Konzeptionen und Realisierungen Studienarbeit TECHNISCHE UNIVERSITÄT CHEMNITZ Proseminar: Lexikologie und Lexikographie Sommersemester 1997 Angewandte
MehrCOMPUTER: Mission Berlin. November 9, 2006, eleven am. You've got 60 minutes and no extra life left.
13? D A C H F E G? Manuscript of the Episode INTRODUCTION. November 9, 2006, eleven am. You've got 60 minutes and no extra life left. Dieses Mal entkommst du mir nicht! Do you know what you are looking
MehrGerman translation: technology
A. Starter Write the gender and the English translation for each word, using a dictionary if needed. Gender (der/die/das) German English Handy Computer Internet WLAN-Verbindung Nachricht Drucker Medien
MehrWas Sie schon immer über Teneriffa wissen wollten: Erklärungen & Wissenswertes, Tipps & Highlights (German Edition)
Was Sie schon immer über Teneriffa wissen wollten: Erklärungen & Wissenswertes, Tipps & Highlights (German Edition) Guntram Müller-Jänsch Click here if your download doesn"t start automatically Was Sie
MehrFAIRTRADE project Exchange 2012 Scotland 2 nd 10 th of May
FAIRTRADE project Exchange 2012 Scotland 2 nd 10 th of May FAIRTRADE project evaluation: Pupils 1. Have you ever seen the FAIRTRADE logo on a Scottish product? 1. Hast du das FAIRTRADE Logo bereits einmal
MehrTote Hose: Worüber Männer schweigen. Ein Tagebuch (German Edition)
Tote Hose: Worüber Männer schweigen. Ein Tagebuch (German Edition) Walter Raaflaub Click here if your download doesn"t start automatically Tote Hose: Worüber Männer schweigen. Ein Tagebuch (German Edition)
MehrCOMPUTER: Mission Berlin. November 9, 2006, eleven am. You've got 60 minutes and no extra life left.
Episode 13 Göttliche Hilfe Die Kirche scheint der richtige Ort zu sein, um Informationen zu sammeln. Der Pastor erklärt Anna die Melodie und teilt ihr mit, dass sie der Schlüssel zu einer Zeitmaschine
MehrDie einfachste Diät der Welt: Das Plus-Minus- Prinzip (GU Reihe Einzeltitel)
Die einfachste Diät der Welt: Das Plus-Minus- Prinzip (GU Reihe Einzeltitel) Stefan Frà drich Click here if your download doesn"t start automatically Die einfachste Diät der Welt: Das Plus-Minus-Prinzip
Mehr"What's in the news? - or: why Angela Merkel is not significant
"What's in the news? - or: why Angela Merkel is not significant Andrej Rosenheinrich, Dr. Bernd Eickmann Forschung und Entwicklung, Unister GmbH, Leipzig UNISTER Seite 1 Unister Holding UNISTER Seite 2
MehrSoziale Arbeit mit rechten Jugendcliquen: Grundlagen zur Konzeptentwicklung (German Edition)
Soziale Arbeit mit rechten Jugendcliquen: Grundlagen zur Konzeptentwicklung (German Edition) Click here if your download doesn"t start automatically Soziale Arbeit mit rechten Jugendcliquen: Grundlagen
MehrSchöpfung als Thema des Religionsunterrichts in der Sekundarstufe II (German Edition)
Schöpfung als Thema des Religionsunterrichts in der Sekundarstufe II (German Edition) Juliane Timmroth Click here if your download doesn"t start automatically Schöpfung als Thema des Religionsunterrichts
MehrWas ist das? Wer an einem sonnigen Tag die runden Lichtflecken unter einem Baum einmal entdeckt hat, findet sie immer und überall wieder.
Was ist das? Wer an einem sonnigen Tag die runden Lichtflecken unter einem Baum einmal entdeckt hat, findet sie immer und überall wieder. Was hat es mit dem Phänomen auf sich? Der Light Walk verführt zum
MehrTextdatenbanken. Sommersemester Vorlesung. - Klassische Korpuslinguistik - Uwe Quasthoff
Textdatenbanken Sommersemester 2009 9. Vorlesung - Klassische Korpuslinguistik - Uwe Quasthoff Universität Leipzig Institut für Informatik quasthoff@informatik.uni-leipzig.de Zwei Wege der Lehrmaterialien
MehrMaterialien zu unseren Lehrwerken
Word order Word order is important in English. The word order for subjects, verbs and objects is normally fixed. The word order for adverbial and prepositional phrases is more flexible, but their position
MehrAnimation - Traumjob oder Vagabundentum?: Morgenmeeting, Nachtproben und glühende Kurven (Jobs, Praktika, Studium 65) (German Edition)
Animation - Traumjob oder Vagabundentum?: Morgenmeeting, Nachtproben und glühende Kurven (Jobs, Praktika, Studium 65) (German Edition) Michael Oschmann Click here if your download doesn"t start automatically
MehrInhalt und Typen von Korpora. Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es
Inhalt und Typen von Korpora Welche Sprachinhalte können Korpora haben und welche Arten von Korpora gibt es Inhalt von Korpora Korpora können die verschiedensten Texte in den unterschiedlichsten Zusammensetzungen
MehrAus FanLiebe zu Tokio Hotel: von Fans fã¼r Fans und ihre Band
Aus FanLiebe zu Tokio Hotel: von Fans fã¼r Fans und ihre Band Click here if your download doesn"t start automatically Aus FanLiebe zu Tokio Hotel: von Fans fã¼r Fans und ihre Band Aus FanLiebe zu Tokio
MehrDaten Methoden Theorien Definitionen & Operationalisierungen
Operationale Verfahren Daten Methoden Theorien Definitionen & Operationalisierungen Das Überbrückungsproblem Hypothese Explizite Formulierung einer als wahr vermuteten, begründbaren Aussage über das Phänomen
MehrMartin Luther. Click here if your download doesn"t start automatically
Die schönsten Kirchenlieder von Luther (Vollständige Ausgabe): Gesammelte Gedichte: Ach Gott, vom Himmel sieh darein + Nun bitten wir den Heiligen Geist... der Unweisen Mund... (German Edition) Martin
MehrEinführung in die Computerlinguistik Satz von Kleene
Einführung in die Computerlinguistik Satz von Kleene Dozentin: Wiebke Petersen 10.5.2010 Wiebke Petersen Einführung CL (SoSe2010) 1 Satz von Kleene (Stephen C. Kleene, 1909-1994) Jede Sprache, die von
MehrStar Trek: die Serien, die Filme, die Darsteller: Interessante Infod, zusammengestellt aus Wikipedia-Seiten (German Edition)
Star Trek: die Serien, die Filme, die Darsteller: Interessante Infod, zusammengestellt aus Wikipedia-Seiten (German Edition) Doktor Googelberg Click here if your download doesn"t start automatically Star
Mehr345/Rules in the family. Essen und Trinken. Schreibmaterial
CODE aa AT THE RESTAURANT FERTIGKEIT: HÖREN Relevante(r) Deskriptor(en) Ich kann einfache Gespräche über mir vertraute Themen verstehen, wenn deutlich gesprochen wird. (A2.2) Zielt ab auf Deskriptor 5
MehrSyntax-basierte maschinelle Übersetzung mit Baumübersetzern
yntax-basierte maschinelle Übersetzung mit Baumübersetzern Andreas Maletti Leipzig 28. April 2015 Maschinelle Übersetzung Original Übersetzung (GOOGLE TRANLATE) The addressees of this paper are students
MehrEMBEDDED READING NYSAFLT COLLOQUIUM/ROCHESTER REGIONAL
EMBEDDED READING NYSAFLT COLLOQUIUM/ROCHESTER REGIONAL MARCH 5, 2016 Laurie Clarcq www.heartsforteaching.com The purpose of language, used in communication, is to create a picture in the mind and/or the
MehrOrganisatorisches. HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen. Lernerkorpora als Datenquelle. Lernerkorpora als Datenquelle
HS: Korpuslinguistische Behandlung von Phänomenen des Deutschen WS 2004/2005 Anke Lüdeling anke.luedeling@rz.hu-berlin.de Organisatorisches 1. Vortrag: 15-20 Minuten + 5-10 Minuten Diskussion (gesamt 30
Mehr