Kapitel IR:IV. IV. Indexkonstruktion. Stammformreduktion n-gramme Termanreicherung Wortklassenbestimmung

Größe: px
Ab Seite anzeigen:

Download "Kapitel IR:IV. IV. Indexkonstruktion. Stammformreduktion n-gramme Termanreicherung Wortklassenbestimmung"

Transkript

1 Kapitel IR:IV IV. Indexkonstruktion Stammformreduktion n-gramme Termanreicherung Wortklassenbestimmung IR:IV-1 Index Construction STEIN

2 Bemerkungen: Die im folgenden vorgstellten Techniken und Algorithmen werden von einigen Autoren zur Textvorverarbeitung gezählt. Ziel der Verfahren ist es, die Retrieval-Performanz zu erhöhen und die Größe der Indexdateien zu reduzieren. IR:IV-2 Index Construction STEIN

3 Rückführung eines Wortes auf seinen Wortstamm durch Entfernung der Veränderung aufgrund von Flektion (Beugung). Die Flektion betrifft die Deklination bei Nomina (Kasus, Numerus, Genus) die Konjugation bei Verben (Person, Numerus, Zeit, Modus,... ) die Steigerung (Komparation) bei Adjektiven und Adverbien Ein (Wort-)Stamm ist der Teil des Wortes, der nach der Entfernung der Flektionsinformation (z. B. Affixen) übrigbleibt. Beispiel: connect connects connected connecting connection IR:IV-3 Index Construction STEIN

4 Bemerkungen: Verschiedene Untersuchungen haben gezeigt, dass Stammwortreduktion nicht zwangsläufig die Retrieval-Performanz erhöht. Deshalb wenden viele Internet- Suchmaschinen keine Stammwortreduktion an. IR:IV-4 Index Construction STEIN

5 Prinzipien [Frakes 1992] 1. Table-Lookup: Zu einem Wortstamm werden mögliche Flektionen (in einer Hash-Tabelle) gespeichert. Problematik: Speicherplatz. 2. Nachfolgervariation (successor variety): Wendet Wissen aus der strukturellen Linguistik an, um Morphem-Grenzen zu bestimmen. Problematik: schwierig zu automatisieren. 3. n-gramm-analyse: Typische 2-Gramme und 3-Gramme werden mittels Windowing identifiziert und zur Wortstammerkennung ausgenutzt. 4. Affix-Eliminierung: Regelbasierte Algorithmen zur Entdeckung von Präfixen und Suffixen. Wegen ihrer Effizienz und unmittelbar einleuchtenden Funktionsweise handelt es sich um das gebräuchlichste Prinzip. IR:IV-5 Index Construction STEIN

6 Affix-Eliminierung Prinzip: iterative longest match stemming 1. Entfernung des längsten, möglichen Matches auf Basis einer Regelmenge. 2. Wiederholung von Schritt 1, bis keine Regel mehr anwendbar ist. 3. Recodierung, um Unregelmäßigkeiten, die in den Regeln erfasst sind, zu korrigieren. IR:IV-6 Index Construction STEIN

7 Affix-Eliminierung Prinzip: iterative longest match stemming 1. Entfernung des längsten, möglichen Matches auf Basis einer Regelmenge. 2. Wiederholung von Schritt 1, bis keine Regel mehr anwendbar ist. 3. Recodierung, um Unregelmäßigkeiten, die in den Regeln erfasst sind, zu korrigieren. Notation: c steht für einen Konsonant, C für eine nichtleere Folge von Konsonanten. v steht für einen Vokal, V für eine nichtleere Folge von Vokalen. Jedes Wort ist von der Form [C](VC) m [V] Konsonant: Buchstaben außer A, E, I, O und U sowie Y nach einem Konsonanten. (in TOY ist Y demnach ein Konsonant, in LOVELY ein Vokal) Vokal: Buchstabe, der kein Konsonant ist IR:IV-7 Index Construction STEIN

8 Affix-Eliminierung: Porter-Algorithmus Konzepte: 9 Regelgruppen, die jeweils 3-20 Regeln enthalten die Regeln in jeder Gruppe sind sortiert, Anwendung von oben nach unten nur eine Regel pro Gruppe darf zur Anwendung kommen Aufbau einer Regel: <Bedingung> S1 S2 IR:IV-8 Index Construction STEIN

9 Affix-Eliminierung: Porter-Algorithmus Konzepte: 9 Regelgruppen, die jeweils 3-20 Regeln enthalten die Regeln in jeder Gruppe sind sortiert, Anwendung von oben nach unten nur eine Regel pro Gruppe darf zur Anwendung kommen Aufbau einer Regel: <Bedingung> S1 S2 Semantik: Falls eine Zeichenkette mit S1 endet und die Teilzeichenkette vor S1 (= Wortstamm) <Bedingung> erfüllt, wird S1 durch S2 ersetzt. Bedingungen: (m>x) Anzahl von Vokal-Konsonant-Folgen ist größer x. (*S) Wortstamm endet mit dem String S. (*v*) Wortstamm enthält einen Vokal. (*o) Wortstamm endet mit cvc, wobei der zweite Konsonant c {W, X, Y}. (*d) Wortstamm endet mit zwei identischen Konsonanten. IR:IV-9 Index Construction STEIN

10 Affix-Eliminierung: Porter-Algorithmus Auswahl einiger Regeln: Regelgruppe Bedingung Suffix Ersetzung Beispiel 1a Null sses ss caresses caress 1a Null ies i ponies poni 1b (m>0) eed ee feed feed agreed agree 1b (*v*) ed ε plastered plaster bled bled 1b (*v*) ing ε motoring motor sing sing 1c (*v*) y i happy happi sky sky 2 (m>0) biliti ble sensibiliti sensible IR:IV-10 Index Construction STEIN

11 Affix-Eliminierung: Porter-Algorithmus Originaltext: Document will describe marketing strategies carried out by U.S. companies for their agricultural chemicals, report predictions for market share of such chemicals, or report market statistics for agrochemicals, pesticide, herbicide,fungicide,insecticide, fertilizer, predicted sales, market share, stimulate demand, price cut, volume of sales Nach dem Stemming: market strateg carr compan agricultur chemic report predict market share chemic report market statist agrochem pesticid herbicid fungicid insecticid fertil predict sale stimul demand price cut volum sale IR:IV-11 Index Construction STEIN

12 Affix-Eliminierung: Porter-Algorithmus Schwächen des Algorithmus: schwer zu modifizieren: Auswirkungen von Änderungen lassen sich kaum abschätzen neigt zur Übergeneralisierung: policy/police university/universe organization/organ erfasst eindeutige Generalisierungen nicht: European/Europe matrices/matrix machine/machinery generiert Stämme, die zum Teil schwer zu interpretieren sind: iteration/iter general/gener IR:IV-12 Index Construction STEIN

Stemming. OS Einblicke in die Computerlinguistik Felix Hain HTWK Leipzig

Stemming. OS Einblicke in die Computerlinguistik Felix Hain HTWK Leipzig Stemming OS Einblicke in die Computerlinguistik Felix Hain 12.06.2014 HTWK Leipzig Gliederung Motivation Der Begriff Stemming Potentielle Probleme Stemming-Algorithmen Ansätze Porter-Stemmer-Algorithmus

Mehr

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Morphologie. Sarah Bosch,

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Morphologie. Sarah Bosch, Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Morphologie Wiederholung Aufgabe 1 Was ist Morphologie, Morphem? 3 Aufgabe 1 Was ist Morphologie, Morphem? Teildisziplin der

Mehr

Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval

Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval Viele Folien in diesem Abschnitt sind eine deutsche Übersetzung der Folien von Raymond J. Mooney (http://www.cs.utexas.edu/users/mooney/ir-course/).

Mehr

Artikelspiel erstellt von L. Schikowski M.A., Universität Göttingen, IIK e.v. Göttingen, lschikowski@gmail.com, Gruppen-/Partnerarbeit

Artikelspiel erstellt von L. Schikowski M.A., Universität Göttingen, IIK e.v. Göttingen, lschikowski@gmail.com, Gruppen-/Partnerarbeit Genus Rede Kardinalzahl Prädikat Konsonant Modus Stamm Vokal Subjekt Plural Prä-/Suffix Genitiv Artikel mit Grammatikbegriffen üben Präteritum Numerus Funktionsverbgefüge Plusquamperfekt Konjugation Kasus

Mehr

Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval

Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval Einfaches Tokenizing Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval Zerlege Text in eine Sequenz einzelner Token (Terme). Manchmal sind Interpunktion (e-mail),

Mehr

Morphologie: Was bisher geschah. Morphologie IV. Morphologie. Überblick. Derivation

Morphologie: Was bisher geschah. Morphologie IV. Morphologie. Überblick. Derivation Morphologie: Was bisher geschah Morphologie IV Derivation Gerrit Kentner Wortbegriff, Morphembegriff, Morphemklassifikation Derivation Komposition 18. Januar 2012 1 / 22 2 / 22 Morphologie Überblick heute:

Mehr

2. Textvorverarbeitung. nicht alle Wörter in einem Dokument sind gleich wichtig, um die Semantik eines Dokuments

2. Textvorverarbeitung. nicht alle Wörter in einem Dokument sind gleich wichtig, um die Semantik eines Dokuments Textvorverarbeitung 2. Textvorverarbeitung nicht alle Wörter in einem Dokument sind gleich wichtig, um die Semantik eines Dokuments auszudrücken deswegen lohnt es sich oft, eine Vorverarbeitung durchzuführen

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik. Das komplette Material finden Sie hier: School-Scout.

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik. Das komplette Material finden Sie hier: School-Scout. Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Grammatik Das komplette Material finden Sie hier: School-Scout.de kurz & bündig Band 6 Hartwig Lödige Grammatik INHALT Inhalt Zur

Mehr

Einführung in die Computerlinguistik und Sprachtechnologie

Einführung in die Computerlinguistik und Sprachtechnologie Einführung in die Computerlinguistik und Sprachtechnologie Vorlesung im WiSe 2018/19 (B-GSW-12) Prof. Dr. Udo Hahn Lehrstuhl für Computerlinguistik Institut für Germanistische Sprachwissenschaft Friedrich-Schiller-Universität

Mehr

Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval

Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval KSM Implementierung Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval KSM wird ein einfaches in Java geschriebenes Vektorraum-Retrieval- System werden Entsteht

Mehr

Flexion. Grundkurs Germanistische Linguistik (Plenum) Judith Berman Derivationsmorphem vs. Flexionsmorphem

Flexion. Grundkurs Germanistische Linguistik (Plenum) Judith Berman Derivationsmorphem vs. Flexionsmorphem Grundkurs Germanistische Linguistik (Plenum) Judith Berman 23.11.04 vs. Wortbildung (1)a. [saft - ig] b. [[An - geb] - er] Derivationsmorphem vs. smorphem (4)a. Angeber - saftiger b. saftig - Safts c.

Mehr

Information Retrieval

Information Retrieval Information Retrieval Sommersemester 2009 Vorlesungen 10-11 Uwe Quasthoff Universität Leipzig Institut für Informatik quasthoff@informatik.uni-leipzig.de Information Retrieval und Implementierung Verfahren

Mehr

Deutsch Grammatik Sekundarstufe 1 Die 5 Wortarten

Deutsch Grammatik Sekundarstufe 1 Die 5 Wortarten Deutsch Grammatik Sekundarstufe 1 Die 5 Wortarten Theorie und Klassenübungen (mit Lösungen) Geeignet für 8. bis 10. Schuljahr MSV- Unterricht ILF- Unterricht Als Skript verwendbar Mit Kommentaren und Erklärungen

Mehr

Tokenisierung und Lemmatisierung in Suchmaschinen

Tokenisierung und Lemmatisierung in Suchmaschinen Tokenisierung und Lemmatisierung in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2010 Stefan Langer stefan.langer@cis.uni-muenchen.de Übung: Tokenisierung (5 min) Was ist

Mehr

Sicherer MAC für Nachrichten beliebiger Länge

Sicherer MAC für Nachrichten beliebiger Länge Sicherer MAC für Nachrichten beliebiger Länge Korollar Sicherer MAC für Nachrichten beliebiger Länge Sei F eine Pseudozufallsfunktion. Dann ist Π MAC2 für Π = Π MAC sicher. Nachteile: Für m ({0, 1} n 4

Mehr

LATEINISCHE GRAMMATIK

LATEINISCHE GRAMMATIK LATEINISCHE GRAMMATIK von Dr. Hans Rubenbauer und Dr. J. B. Hofmann neubearbeitet von R. Heine C. C. Buchners Verlag, Bamberg J. Lindauer Verlag, München R. Oldenbourg Verlag, München INHALT Vorwort zur

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Das Grammatikfundament: Wortarten. Das komplette Material finden Sie hier:

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Das Grammatikfundament: Wortarten. Das komplette Material finden Sie hier: Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Das Grammatikfundament: Wortarten Das komplette Material finden Sie hier: School-Scout.de Uta Livonius Das Grammatikfundament: Wortarten

Mehr

Phonetische Lexika Morphologische Analysen. Uwe D. Reichel IPSK, LMU München 9. Januar 2008

Phonetische Lexika Morphologische Analysen. Uwe D. Reichel IPSK, LMU München 9. Januar 2008 Phonetische Lexika Morphologische Analysen Uwe D. Reichel IPSK, LMU München reichelu@phonetik.uni-muenchen.de 9. Januar 2008 Inhalt Terminologie Finite-State-Methoden Schwierigkeiten der deutschen Morphologie

Mehr

1 Das Lernen der norwegischen Sprache Begrifflichkeit... 11

1 Das Lernen der norwegischen Sprache Begrifflichkeit... 11 Inhalt Seite Vorwort 3 Einleitung 10. 1 Das Lernen der norwegischen Sprache... 10 2 Begrifflichkeit... 11 1 Wortarten... 11 2 Veränderbarkeit von Wörtern.... 12 Substantive 13. 3 Grundsätzliches... 13

Mehr

Grammatiktheoretische und psycholinguistische Aspekte der Flexionsmorphologie Embick und Marantz (2005) über regelmäßige und unregelmäßige Verben

Grammatiktheoretische und psycholinguistische Aspekte der Flexionsmorphologie Embick und Marantz (2005) über regelmäßige und unregelmäßige Verben Grammatiktheoretische und psycholinguistische Aspekte der Flexionsmorphologie Embick und Marantz (2005) über regelmäßige und unregelmäßige Verben Gereon Müller & Andreas Opitz Institut für Linguistik Universität

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Klett kompakt Wissen Deutsch Klasse 5-10

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Klett kompakt Wissen Deutsch Klasse 5-10 Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Klett kompakt Wissen Deutsch Klasse 5-10 Das komplette Material finden Sie hier: School-Scout.de Sonja Alof Astrid Wilmot-Günther

Mehr

Lemmatisierung und Stemming in Suchmaschinen

Lemmatisierung und Stemming in Suchmaschinen Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2016 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)

Mehr

Lemmatisierung und Stemming in Suchmaschinen

Lemmatisierung und Stemming in Suchmaschinen Lemmatisierung und Stemming in Suchmaschinen Hauptseminar Suchmaschinen Computerlinguistik Sommersemester 2014 Stefan Langer stefan.langer@cis.uni-muenchen.de Trefferquote (Recall) und Genauigkeit (Precision)

Mehr

Kapitel 2: Formale Sprachen Gliederung. 0. Grundbegriffe 1. Endliche Automaten 2. Formale Sprachen 3. Berechnungstheorie 4. Komplexitätstheorie

Kapitel 2: Formale Sprachen Gliederung. 0. Grundbegriffe 1. Endliche Automaten 2. Formale Sprachen 3. Berechnungstheorie 4. Komplexitätstheorie Gliederung 0. Grundbegriffe 1. Endliche Automaten 2. Formale Sprachen 3. Berechnungstheorie 4. Komplexitätstheorie 2.1. 2.2. Reguläre Sprachen 2.3. Kontextfreie Sprachen 2/1, Folie 1 2015 Prof. Steffen

Mehr

Zeichenketten Benedikt Straßner. Programming Systems Group Martensstr Erlangen Germany

Zeichenketten Benedikt Straßner. Programming Systems Group Martensstr Erlangen Germany Zeichenketten 16.04.2018 Benedikt Straßner Programming Systems Group Martensstr. 3 91058 Erlangen Germany Übersicht String Matching Algorithmen Naive Stringsuche Knuth Morris Pratt (KMP) Algorithmus Boyer-Moore

Mehr

Morphologie: Was bisher geschah. Morphologie IV. Morphologie. Überblick. Flexion

Morphologie: Was bisher geschah. Morphologie IV. Morphologie. Überblick. Flexion Morphologie: Was bisher geschah Morphologie IV Gerrit Kentner Wortbegriff, Morphembegriff, Morphemklassifikation Derivation Komposition 19. Dezember 2012 1 / 34 2 / 34 Morphologie Überblick heute: Wortformbildung:

Mehr

Morphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle

Morphologische Merkmale. Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle Morphologische Merkmale Merkmale Merkmale in der Linguistik Merkmale in der Morpholgie Morphologische Typologie Morphologische Modelle Merkmale Das Wort 'Merkmal' ' bedeutet im Prinzip soviel wie 'Eigenschaft'

Mehr

Einführung in die Computerlinguistik. Morphologie II

Einführung in die Computerlinguistik. Morphologie II Einführung in die Computerlinguistik Morphologie II Hinrich Schütze & Robert Zangenfeind Centrum für Informations- und Sprachverarbeitung, LMU München 30.11.2015 Schütze & Zangenfeind: Morphologie II 1

Mehr

Seminar Ib Wort, Name, Begriff, Terminus Sommersemester Morphologie. Walther v.hahn. v.hahn Universität Hamburg

Seminar Ib Wort, Name, Begriff, Terminus Sommersemester Morphologie. Walther v.hahn. v.hahn Universität Hamburg Seminar Ib Wort, Name, Begriff, Terminus Sommersemester 2006 Morphologie Walther v.hahn v.hahn Universität Hamburg 2005 1 Morphologie: Definition Definitionen: Morphologie ist die Lehre von den Klassen

Mehr

Übungsblätter. Schulgrammatik extra. Deutsch. 5. bis 10. Klasse. Kopiervorlagen zum Üben und Wiederholen von Grammatik

Übungsblätter. Schulgrammatik extra. Deutsch. 5. bis 10. Klasse. Kopiervorlagen zum Üben und Wiederholen von Grammatik Übungsblätter Schulgrammatik extra Deutsch 5. bis 10. Klasse Kopiervorlagen zum Üben und Wiederholen von Grammatik Die Wortarten Das Substantiv (Nomen) Das Substantiv (Nomen) und der Artikel... 1 Das Substantiv

Mehr

1 Das Lernen der schwedischen Sprache Begrifflichkeit... 11

1 Das Lernen der schwedischen Sprache Begrifflichkeit... 11 Inhalt Seite Vorwort 3 Einleitung 10 1 Das Lernen der schwedischen Sprache.................... 10 2 Begrifflichkeit........................................ 11 1 Wortarten.........................................

Mehr

Einstieg in die Informatik mit Java

Einstieg in die Informatik mit Java 1 / 20 Einstieg in die Informatik mit Java Literalkonstanten Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 20 1 Ganzzahlige Konstanten 2 Gleitkommakonstanten 3 Zeichenkonstanten

Mehr

Flexion bei Nomen Verbalflexion Flexion und Wortarten Repetitorium. Morphologie IV. Flexion. Gerrit Kentner. 19. Dezember / 34

Flexion bei Nomen Verbalflexion Flexion und Wortarten Repetitorium. Morphologie IV. Flexion. Gerrit Kentner. 19. Dezember / 34 Morphologie IV Flexion Gerrit Kentner 19. Dezember 2012 1 / 34 Morphologie: Was bisher geschah Wortbegriff, Morphembegriff, Morphemklassifikation Derivation Komposition 2 / 34 Morphologie heute: Wortformbildung:

Mehr

Status quo. Wortbildungslehre, Formenlehre. Wortbildung. Wortbildung(slehre)

Status quo. Wortbildungslehre, Formenlehre. Wortbildung. Wortbildung(slehre) Wortbildung Wortbildung, Formenlehre Wortbildungslehre Wortbildung(slehre) Wortbildungslehre, Formenlehre Wortbildung, Morphologie (Formenlehre) Wortbildung und Morphologie (Formenlehre) Ägyptische EO

Mehr

Vorwort 13 Ä Phonetik/Phonologie 15 AI -Laut-und Buchstabensystem des Deutschen..: 15 Ä2 Vokale (Vokalphoneme)...16 A3 Diphthonge ;... 17 A 4 Konsonanten (Konsonantenphoneme)... 18 A 4. 1 Prävokalische

Mehr

Kleine deutsche Grammatik für Schule und Alltag

Kleine deutsche Grammatik für Schule und Alltag Georg Vollmer Kleine deutsche Grammatik für Schule und Alltag Mit den wichtigsten Regeln der Rechtschreibung und Zeichensetzung Vandenhoeck & Ruprecht Quellen: S. 59: 2003 Lappan Verlag. Zeichnungen: Katrin

Mehr

Erste Hilfe. Grammatik

Erste Hilfe. Grammatik Erste Hilfe Grammatik Duden Erste Hilfe Duden Erste Hilfe Grammatik Dudenverlag Berlin Die Duden-Sprachberatung beantwortet Ihre Fragen zu Rechtschreibung, Zeichensetzung, Grammatik u. Ä. montags bis

Mehr

Inhaltsverzeichnis. Abkürzungen... 9 Niveaustufentests Tipps & Tricks Auf einen Blick Auf einen Blick Inhaltsverzeichnis

Inhaltsverzeichnis. Abkürzungen... 9 Niveaustufentests Tipps & Tricks Auf einen Blick Auf einen Blick Inhaltsverzeichnis Inhaltsverzeichnis Inhaltsverzeichnis Abkürzungen... 9 Niveaustufentests... 10 Tipps & Tricks... 18 1 Der Artikel... 25 1.1 Der bestimmte Artikel... 25 1.2 Der unbestimmte Artikel... 27 2 Das Substantiv...

Mehr

L 3. L a 3. P a. L a m 3. P a l. L a m a 3. P a l m. P a l m e. P o 4. P o p 4. L a. P o p o 4. L a m. Agnes Klawatsch

L 3. L a 3. P a. L a m 3. P a l. L a m a 3. P a l m. P a l m e. P o 4. P o p 4. L a. P o p o 4. L a m. Agnes Klawatsch 1 L 3 P 1 L a 3 P a 1 L a m 3 P a l 1 L a m a 3 P a l m 2 P 3 P a l m e 2 P o 4 L 2 P o p 4 L a 2 P o p o 4 L a m 4 L a m p 6 N a 4 L a m p e 6 N a m 5 5 A A m 6 6 N a m e N a m e n 5 A m p 7 M 5 A m p

Mehr

R a i n e r N i e u w e n h u i z e n K a p e l l e n s t r G r e v e n T e l / F a x / e

R a i n e r N i e u w e n h u i z e n K a p e l l e n s t r G r e v e n T e l / F a x / e R a i n e r N i e u w e n h u i z e n K a p e l l e n s t r. 5 4 8 6 2 8 G r e v e n T e l. 0 2 5 7 1 / 9 5 2 6 1 0 F a x. 0 2 5 7 1 / 9 5 2 6 1 2 e - m a i l r a i n e r. n i e u w e n h u i z e n @ c

Mehr

S o n n t a g, 5. A u g u s t

S o n n t a g, 5. A u g u s t S o n n t a g, 5. A u g u s t 2 0 1 8 R ü c k b l i c k, A b s c h i e d, v i e l p a s s i e r t u n d k e i n e Z e i t D r e i M o n a t e s i n d v e r g a n g e n, v o l l g e s t o p f t m i t s

Mehr

F r e i t a g, 3. J u n i

F r e i t a g, 3. J u n i F r e i t a g, 3. J u n i 2 0 1 1 L i n u x w i r d 2 0 J a h r e a l t H o l l a, i c h d a c h t e d i e L i n u x - L e u t e s i n d e i n w e n i g v e r n ü n f t i g, a b e r j e t z t g i b t e

Mehr

S o n n t a g, 2 6. N o v e m b e r

S o n n t a g, 2 6. N o v e m b e r S o n n t a g, 2 6. N o v e m b e r 2 0 1 7 A u s f l u g n a c h N e v a d a u n d A r i z o n a D e r g r o ß e S o h n u n d i c h g i n g e n a u f e i n e F a h r t i n R i c h t u n g N e v a d a

Mehr

Filtern von Stoppwörtern mit endlichen Automaten

Filtern von Stoppwörtern mit endlichen Automaten Filtern von Stoppwörtern mit endlichen Automaten Im Rahmen des Hauptseminars: Endliche Automaten für die Sprachverarbeitung -SS 2005- PD Dr. Karin Haenelt Ruprecht-Karls-Universität Heidelberg Seminar

Mehr

2. Natürliche Sprache

2. Natürliche Sprache 2. Natürliche Sprache Rückblick Information Retrieval an der Schnittstelle zwischen Bibliotheks- und Kommunikationswissenschaft, Computerlinguistik und Informatik Informationsbedürfnis des Benutzers als

Mehr

Lies die Sätze und schreibe die entsprechende Zeitform in das Kästchen!

Lies die Sätze und schreibe die entsprechende Zeitform in das Kästchen! check 8. check 9. Wann bricht ein Vulkan aus? Verben in Zeitformen check 8. Wann bricht ein Vulkan aus? text- und Satzstrukturen kennen und anwenden / 4 Lies die Sätze und schreibe die entsprechende Zeitform

Mehr

Jahresplan Klassenstufe 6

Jahresplan Klassenstufe 6 Jahresplan Klassenstufe 6 Wochen/ Stunden Thematik Kompetenzen und Inhalte 4 (16) Oh, wie schön ist Panama! Bemerkungen Beherrschen von Verfahren des Beschreibens und Berichtens (LB2) Reisebericht Personenbeschreibung

Mehr

Stichwortverzeichnis. Anhang. Bedingungssatz siehe Konditionalsatz Befehlsform

Stichwortverzeichnis.  Anhang. Bedingungssatz siehe Konditionalsatz Befehlsform Anhang 130 A Adjektiv 68 73, 112 Bildung aus anderen Wörtern 69 mit Genitiv 63 Übersicht Deklination 108 109 Adverb 74 77, 112 Steigerung 76 Stellung 77 Typen (lokal, temporal, kausal, modal) 75 adverbiale

Mehr

Der Boyer-Moore Algorithmus

Der Boyer-Moore Algorithmus Der Boyer-Moore Algorithmus Hauptseminar Pattern-Matching und Textalgorithmen 29.10.2002 Thomas Hellwig Der Naive Algorithmus Um auf den Boyer-Moore Algorithmus hinzuleiten, betrachten wir zuerst das grundsätzliche

Mehr

Das Komma - Ein bedeutsamer Strich

Das Komma - Ein bedeutsamer Strich Weitere Downloadprodukte aus der Schreib- und Lernwerkstatt sowie dem Fern-Coaching: Übungen zu b oder d Übungen zu langen und kurzen Vokalen Übungen zu langen und kurzen Vokalen in Silbenschrift Übungen

Mehr

Kapitel 18 Fehlertolerantes Retrieval

Kapitel 18 Fehlertolerantes Retrieval Kapitel 18 Fehlertolerantes Retrieval HHU Düsseldorf, WS 2008/09 Information Retrieval 272 Eingabefehler in den Dokumenten in den Suchanfragen Formen Leerzeichenfehler ("...ofthe..."; "th_ebook") Fehler

Mehr

Nr. Kategorie Übung Lernziel/Inhalt Typ Bezug zu. 01 Verb Zeitformen erkennen Zeitformen erkennen Multiple Choice AH S. 92

Nr. Kategorie Übung Lernziel/Inhalt Typ Bezug zu. 01 Verb Zeitformen erkennen Zeitformen erkennen Multiple Choice AH S. 92 Die Sprachstarken 5 Übersicht «Interaktives Rechtschreib- und Grammatiktraining online» Die Sprachstarken 5, Interaktives Rechtschreib- und Grammatiktraining online Nr. Kategorie Übung Lernziel/Inhalt

Mehr

Algorithmen und Datenstrukturen 2

Algorithmen und Datenstrukturen 2 Algorithmen und Datenstrukturen 2 Lerneinheit 3: Greedy Algorithmen Prof. Dr. Christoph Karg Studiengang Informatik Hochschule Aalen Sommersemester 2016 10.5.2016 Einleitung Einleitung Diese Lerneinheit

Mehr

Interdisziplinäre fachdidaktische Übung: Formale Sprache Definitionen, Funktionen

Interdisziplinäre fachdidaktische Übung: Formale Sprache Definitionen, Funktionen Interdisziplinäre fachdidaktische Übung: Formale Sprache Definitionen, en SS 2013: Grossmann, Jenko 1 Definitionen Folgenden Begriffe werden oft synonym verwendet: Formale Sprache Programmiersprache Computersprache

Mehr

Inhalt.

Inhalt. Inhalt EINLEITUNG II TEIL A - THEORETISCHE ASPEKTE 13 GRAMMATIK 13 Allgemeines 13 Die sprachlichen Ebenen 15 MORPHOLOGIE 17 Grundbegriffe der Morphologie 17 Gliederung der Morpheme 18 Basis- (Grund-) oder

Mehr

Theoretische Grundlagen der Informatik

Theoretische Grundlagen der Informatik Theoretische Grundlagen der Informatik Vorlesung am 10.01.2012 INSTITUT FÜR THEORETISCHE 0 KIT 12.01.2012 Universität des Dorothea Landes Baden-Württemberg Wagner - Theoretische und Grundlagen der Informatik

Mehr

Kap. 1: Text Retrieval. 1.1 Übersicht und Motivation

Kap. 1: Text Retrieval. 1.1 Übersicht und Motivation Kap. 1: Text Retrieval Übersicht / Motivation Termextraktion (Inhaltserschliessung) Modelle für Textretrieval Indexstrukturen (Zugriffspfade) Evaluierung von IR-Systemen Kap.1-1 1.1 Übersicht und Motivation

Mehr

Partizip II als Adjektiv. NIVEAU NUMMER SPRACHE Mittelstufe B1_2032G_DE Deutsch

Partizip II als Adjektiv. NIVEAU NUMMER SPRACHE Mittelstufe B1_2032G_DE Deutsch Partizip II als Adjektiv GRAMMATIK NIVEAU NUMMER SPRACHE Mittelstufe B1_2032G_DE Deutsch Lernziele Wiederhole das Partizip II Wende das Partizip II von verschiedenen Verben an Lerne und übe das Partizip

Mehr

Einstieg in die Informatik mit Java

Einstieg in die Informatik mit Java Vorlesung vom 18.4.07, Literalkonstanten Übersicht 1 Ganzzahlige Konstanten 2 Gleitkommakonstanten 3 Zeichenkonstanten 4 Zeichenketten 5 Boolsche Konstanten 6 null Referenz Literalkonstanten Literalkonstanten

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik-Trainer 2 - Deklination & Konjugation

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Grammatik-Trainer 2 - Deklination & Konjugation Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Grammatik-Trainer 2 - Deklination & Konjugation Das komplette Material finden Sie hier: School-Scout.de Inhalt Seite Vorwort 4 Didaktisch-methodische

Mehr

Inhalt. Einleitung. Wortarten 1

Inhalt. Einleitung. Wortarten 1 Inhalt Einleitung XI Wortarten 1 1 Was sind Wörter? 2 1.1 Mehr oder weniger als ein Wort 2 Erster Problemfall: Verbzusätze trennbarer Verben 3 Zweiter Problemfall: Infinitivkonjunktion bei trennbaren Verben

Mehr

Algorithmen und Datenstrukturen (für ET/IT)

Algorithmen und Datenstrukturen (für ET/IT) Algorithmen und Datenstrukturen (für ET/IT) Sommersemester 2014 Dr. Tobias Lasser Computer Aided Medical Procedures Technische Universität München Programm heute 7 Fortgeschrittene Datenstrukturen 8 Such-Algorithmen

Mehr

Nr. Kategorie Übung Lernziel/Inhalt Typ Bezug zu. Plusquamperfekt bilden. 03 Verb Zeitformen bilden Futur 1 Futur 1 bilden Tabelle ergänzen

Nr. Kategorie Übung Lernziel/Inhalt Typ Bezug zu. Plusquamperfekt bilden. 03 Verb Zeitformen bilden Futur 1 Futur 1 bilden Tabelle ergänzen Die Sprachstarken 6 Übersicht «Interaktives Rechtschreib- und Grammatiktraining online» Die Sprachstarken 6, Interaktives Rechtschreib- und Grammatiktraining online Nr. Kategorie Übung Lernziel/Inhalt

Mehr

Lerninhalte ALFONS Lernwelt Deutsch 5. Klasse

Lerninhalte ALFONS Lernwelt Deutsch 5. Klasse Lerninhalte ALFONS Lernwelt Deutsch 5. Klasse 1. Lesen und Raten 1. Rückwärts lesen, vorwärts schreiben 2. Rückwärts hören, vorwärts schreiben 3. Fremdwortgalgen 4. Höre auf den Satz 5. Schau auf den Satz

Mehr

Kapitel 14. Worte. HHU Düsseldorf, WS 2008/09 Information Retrieval 216

Kapitel 14. Worte. HHU Düsseldorf, WS 2008/09 Information Retrieval 216 Kapitel 14 Worte HHU Düsseldorf, WS 2008/09 Information Retrieval 216 Schriftsystemerkennung Zeichensätze erkennen: falls Unicode eingesetzt wird, kein Problem wenn nicht: automatische Schriftsystemerkennung

Mehr

Schulinternes Curriculum Deutsch Klasse 5 Hauptschulzweig KGS-Schneverdingen 2016

Schulinternes Curriculum Deutsch Klasse 5 Hauptschulzweig KGS-Schneverdingen 2016 Zu Beachten: Anzahl der en: 6 en (5-7) Dauer der en: nicht länger als 2x45 min Die Liste der Themen stellt keine verbindliche Reihenfolge dar. Im Schuljahr 5 oder 6 sollten die Schüler einen Vortrag /

Mehr

PÄDAGOGISCHE FAKULTÄT. Einführung in die Morphologie der deutschen Sprache

PÄDAGOGISCHE FAKULTÄT. Einführung in die Morphologie der deutschen Sprache MASARYK - UNIVERSITÄT IN BRNO PÄDAGOGISCHE FAKULTÄT Lehrstuhl für deutsche Sprache und Literatur Einführung in die Morphologie der deutschen Sprache Studienmaterial für die Lehramtstudenten PhDr. Olga

Mehr

Algorithmen und Datenstrukturen II

Algorithmen und Datenstrukturen II Algorithmen und Datenstrukturen II Algorithmen zur Textverarbeitung III: D. Rösner Institut für Wissens- und Sprachverarbeitung Fakultät für Informatik Otto-von-Guericke Universität Magdeburg Sommer 2009,

Mehr

orpho-syntaktische Merkmale

orpho-syntaktische Merkmale M Gereon Müller Institut für Linguistik 13.10.2005 Universität Leipzig www.uni-leipzig.de/ muellerg Gliederung Merkmale Merkmalssysteme Merkmale Fragestellung: Was sind die Grundbausteine (formatives)

Mehr

D5 WA D5 WA D5 WA D5 WA

D5 WA D5 WA D5 WA D5 WA 1 Was ist unter einem Substantiv/Nomen zu verstehen? Durch was ist es gekennzeichnet? Gib drei Beispiele! 1 Hauptwort (Namenwort), das Lebewesen, Gegenstände, aber auch Vorgestelltes und Gedachtes bezeichnet;

Mehr

LAF Mathematik. Näherungsweises Berechnen von Nullstellen von Funktionen

LAF Mathematik. Näherungsweises Berechnen von Nullstellen von Funktionen LAF Mathematik Näherungsweises Berechnen von Nullstellen von Funktionen von Holger Langlotz Jahrgangsstufe 12, 2002/2003 Halbjahr 12.1 Fachlehrer: Endres Inhalt 1. Vorkenntnisse 1.1 Nicht abbrechende Dezimalzahlen;

Mehr

Der Rechtschreibunterricht. an der Grundschule Am Weyer

Der Rechtschreibunterricht. an der Grundschule Am Weyer an der Grundschule Am Weyer Informationen zum Umgang mit der Rechtschreibwerkstatt Rechtschreibung aus verschiedenen Perspektiven Rechtschreibung in der Gesellschaft; Rechtschreibung in den Richtlinien;

Mehr

Verzeichnis grundlegender grammatischer Fachausdrücke Vorbemerkung*

Verzeichnis grundlegender grammatischer Fachausdrücke Vorbemerkung* Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland Verzeichnis grundlegender grammatischer Fachausdrücke (von der Kultusministerkonferenz zustimmend zur

Mehr

Vorlesung Morphologie Flexion

Vorlesung Morphologie Flexion Vorlesung Morphologie 13.6. - Flexion Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 Vertretung: Hagen Hirschmann Flexion Inhalte heute Flexionskategorien & Paradigmata Nomen Adjektive

Mehr

Vorlesung Information Retrieval Wintersemester 04/05

Vorlesung Information Retrieval Wintersemester 04/05 Vorlesung Information Retrieval Wintersemester 04/05 16. November 2004 Institut für Informatik III Universität Bonn Tel. 02 28 / 73-45 31 Fax 02 28 / 73-43 82 jw@informatik.uni-bonn.de 1 Themenübersicht

Mehr

Informatik III. Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung

Informatik III. Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung Informatik III Christian Schindelhauer Wintersemester 2006/07 5. Vorlesung 09.11.2006 schindel@informatik.uni-freiburg.de 1 Äquivalenzklassen Definition und Beispiel Definition Für eine Sprache L Σ* bezeichnen

Mehr

Stemming. Referenten: Johannes Lang Rossen Kowatschew

Stemming. Referenten: Johannes Lang Rossen Kowatschew Universität Heidelberg Institut für Computerlinguistik HS Information Retrieval WS 01/02 Leitung: Dr. Karin Haenelt 04.02. 2002 Stemming. Referenten: Johannes Lang Rossen Kowatschew Gliederung Einführung:

Mehr

Einstieg in die Informatik mit Java

Einstieg in die Informatik mit Java 1 / 30 Einstieg in die Informatik mit Java Datentypen Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 30 1 Überblick 2 Ganzzahlige Typen 3 Gleitkommatypen 4 Zeichen, char

Mehr

TU München. Hauptseminar: WS 2002 / Einführung in Suffix - Bäume

TU München. Hauptseminar: WS 2002 / Einführung in Suffix - Bäume TU München Hauptseminar: WS 2002 / 2003 Einführung in Suffix - Bäume Bearbeiterin: Shasha Meng Betreuerin: Barbara König Inhalt 1. Einleitung 1.1 Motivation 1.2 Eine kurze Geschichte 2. Tries 2.1 Basisdefinition

Mehr

Verzeichnis Grundlegender Grammatischer Fachausdrücke

Verzeichnis Grundlegender Grammatischer Fachausdrücke Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland Verzeichnis Grundlegender Grammatischer Fachausdrücke (von der Kultusministerkonferenz zustimmend zur

Mehr

Englisch, aber richtig!

Englisch, aber richtig! Malcolm Shuttleworth Englisch, aber richtig! Der 20-Punkte-Plan zum Verlernen der häufigsten Fehler Mit zahlreichen Illustrationen des Autors Anaconda Die Deutsche Nationalbibliothek verzeichnet diese

Mehr

4 Der Gauß Algorithmus

4 Der Gauß Algorithmus 4 Der Gauß Algorithmus Rechenverfahren zur Lösung homogener linearer Gleichungssysteme Wir betrachten ein GLS (1) a 11 x 1 + a 1 x + + a 1n x n = a 1 x 1 + a x + + a n x n = a m1 x 1 + a m x + + a mn x

Mehr

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Geschichte kompaktwissen Klasse

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Geschichte kompaktwissen Klasse Unterrichtsmaterialien in digitaler und in gedruckter Form Auszug aus: Geschichte kompaktwissen 5.-10. Klasse Das komplette Material finden Sie hier: School-Scout.de 3 INHALT Alle Lern-Videos auf einen

Mehr

5. Klasse. Grammatik. Deutsch. Grammatik. in 15 Minuten

5. Klasse. Grammatik. Deutsch. Grammatik. in 15 Minuten Grammatik 5. Klasse Deutsch Grammatik in 15 Minuten Klasse So übst du mit diesem Buch Im Inhaltsverzeichnis findest du alle für deine Klassenstufe wichtigen Themengebiete. Du hast zwei Möglichkeiten: 1.

Mehr

VL Morphologie Derivation 2. Anke Lüdeling Sommersemester 2008

VL Morphologie Derivation 2. Anke Lüdeling Sommersemester 2008 VL Morphologie Derivation 2 Anke Lüdeling anke.luedeling@rz.hu-berlin.de Sommersemester 2008 produktiv aktiv stündlich, minütlich, zweimonatlich, täglich Basis: N, gibt Zeitraum an Ergebnis: jedes N produktiv

Mehr

Informatik II, SS 2016

Informatik II, SS 2016 Informatik II - SS 2016 (Algorithmen & Datenstrukturen) Vorlesung 21 (15.7.2016) String Matching (Textsuche) Approximate String Matching Algorithmen und Komplexität Textsuche / String Matching Gegeben:

Mehr

Einleitung 3. s Die unpersönlichen Sätze 14 Übungen Die bejahenden und die verneinenden Sätze 17 Übungen 20

Einleitung 3. s Die unpersönlichen Sätze 14 Übungen Die bejahenden und die verneinenden Sätze 17 Übungen 20 INHALTSVERZEICHNIS Einleitung 3 Kapitel I Der einfache Satz 1. Allgemeines 4 2. Der Aussagesatz, der Fragesatz und der Aufforderungssatz 5 6 3. Stellung der Nebenglieder des Satzes 8 1 9 4. Die unbestimmt-persönlichen

Mehr

Algorithmen und Datenstrukturen 1 VU 6.0 Nachtragstest SS Oktober 2014

Algorithmen und Datenstrukturen 1 VU 6.0 Nachtragstest SS Oktober 2014 Technische Universität Wien Institut für Computergraphik und Algorithmen Arbeitsbereich für Algorithmen und Datenstrukturen 186.813 Algorithmen und Datenstrukturen 1 VU 6.0 Nachtragstest SS 2014 22. Oktober

Mehr

Optimalitätstheoretische Syntax

Optimalitätstheoretische Syntax Optimalitätstheoretische Syntax Gereon Müller Institut für Linguistik gereon.mueller@uni-leipzig.de Vorlesung Sommersemester 2005 Vorgänger und Alternativen: Wettbewerb/Blockade-Syntax [1] (1) Zentrale

Mehr

Deutsch. Verbtabellen. Langenscheidt. Alles Wichtige rund ums Verb von A bis Z. ab A1

Deutsch. Verbtabellen. Langenscheidt. Alles Wichtige rund ums Verb von A bis Z. ab A1 Langenscheidt Verbtabellen Alles Wichtige rund ums Verb von A bis Z Deutsch ab A1 Inhaltsverzeichnis Inhaltsverzeichnis Benutzerhinweise... 3 Abkürzungen... 7 Tipps & Tricks zum Konjugationstraining...

Mehr

Grammatikübungen. Regeln und Formen zum Üben. 5. bis 10. Klasse. 5. bis 10. Klasse. Von Lehrern empfohlen

Grammatikübungen. Regeln und Formen zum Üben. 5. bis 10. Klasse. 5. bis 10. Klasse. Von Lehrern empfohlen Deutsch 150 Grammatikübungen Regeln und Formen zum Üben Von Lehrern empfohlen Duden 150 Grammatikübungen Regeln und Formen zum Üben 3., aktualisierte Auflage Mit Illustrationen von Steffen Butz Dudenverlag

Mehr

Einführung in die Linguistik

Einführung in die Linguistik Karl-Dieter Bünting Einführung in die Linguistik io. Auflage Athenäum Verlag 1983 Inhaltsverzeichnis V o r w o r t z u r e r s t e n u n d z u r s i e b t e n A u f l a g e... 1 1 Grundbegriffe 13 Allgemeine

Mehr

Preiselastizität der Nachfrage

Preiselastizität der Nachfrage Elastizität MB Beispiel: Könnte die Bahn ihre Einnahmen steigern, wenn sie ihre Preise für Fahrkarten erhöht? Elastizitäten (allgemein): Prozentuale Veränderungen von Nachfrage oder Angebot, wenn sich

Mehr

LEXIKALISCHE SEMANTIK II: GRAMMATISCHE BEDEUTUNG

LEXIKALISCHE SEMANTIK II: GRAMMATISCHE BEDEUTUNG LEXIKALISCHE SEMANTIK II: GRAMMATISCHE BEDEUTUNG 1. DIE GRAMMATISCHE BEDEUTUNG VON WORTEN Neben der konzeptuellen Bedeutung haben sprachliche Ausdrücke auch eine grammatische Bedeutungskomponente, die

Mehr

Morphologie. 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln

Morphologie. 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln Morphologie 1. Flexion und Derivation 2. Analyse mittels lexikalischer Regeln Morphologie Flexion Deklination Flexion der Nomina: Deklination Hund Hund-es Hund-e Hund-en (Stamm + Suffix) Mann Mann-es Männ-er

Mehr

Einführung in die Informatik 2

Einführung in die Informatik 2 Einführung in die Informatik 2 Suchen in Texten Sven Kosub AG Algorithmik/Theorie komplexer Systeme Universität Konstanz E 202 Sven.Kosub@uni-konstanz.de Sprechstunde: Freitag, 12:30-14:00 Uhr, o.n.v.

Mehr