Schriftsysteme. Schriftsysteme. Seminar: Suchmaschinen Dozent: Stefan Langer CIS, Universität München Wintersemester 2010



Ähnliche Dokumente
Schriftsysteme. Schriftsysteme. Seminar: Sprachenidentifizierung Dozent: Stefan Langer CIS, Universität München Wintersemester 2009

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Erfahrungen mit Hartz IV- Empfängern

4. AUSSAGENLOGIK: SYNTAX. Der Unterschied zwischen Objektsprache und Metasprache lässt sich folgendermaßen charakterisieren:

Repetitionsaufgaben Wurzelgleichungen

R. Brinkmann Seite Schriftliche Übung Mathematik Stochastik II (Nachschreiber) Jan. 2007

Anleitung über den Umgang mit Schildern

Themenblock 2: Datenmodellierung mit ERM

1 Mathematische Grundlagen

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Hallo Japan 2016 Bewerbungsformular

L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016

Geld Verdienen im Internet leicht gemacht

Die Post hat eine Umfrage gemacht

Erstellen von x-y-diagrammen in OpenOffice.calc

Outlook und Outlook Express

Elexis-BlueEvidence-Connector

Grundlagen der Theoretischen Informatik, SoSe 2008

Diese Anleitung wurde erstellt von Niclas Lüchau und Daniel Scherer. Erste Anmeldung. Schritt 1: Anmeldung..2. Schritt 2: Passwort setzen 3

Das Freiwillige Soziale Jahr. Der Bundes-Freiwilligen-Dienst

Was bedeutet Inklusion für Geschwisterkinder? Ein Meinungsbild. Irene von Drigalski Geschäftsführerin Novartis Stiftung FamilienBande.

Einführung in. Logische Schaltungen

Carolo Knowledge Base

Veröffentlichen von Apps, Arbeitsblättern und Storys. Qlik Sense Copyright QlikTech International AB. Alle Rechte vorbehalten.

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Gezielt über Folien hinweg springen

Abwesenheitsnotiz im Exchange Server 2010

Tastatur auf Hebräisch umstellen

Professionelle Seminare im Bereich MS-Office

Technical Note Nr. 101

Familienrecht Vorlesung 6. Familienrecht

Primzahlen und RSA-Verschlüsselung

Menü auf zwei Module verteilt (Joomla 3.4.0)

Ein Vorwort, das Sie lesen müssen!

Layoutmodelle. Steffen Schwientek Große Klostergasse Friedberg schwientek@web.de Web :schlaukopp.org

Handbuch. NAFI Online-Spezial. Kunden- / Datenverwaltung. 1. Auflage. (Stand: )

Unser Konzept zur rechtssicheren Buchung selbständiger Pflegekräfte

IT-SICHERHEIT IM UNTERNEHMEN Mehr Sicherheit für Ihre Entscheidung

Bundesverband Flachglas Großhandel Isolierglasherstellung Veredlung e.v. U g -Werte-Tabellen nach DIN EN 673. Flachglasbranche.

Mind Mapping am PC. für Präsentationen, Vorträge, Selbstmanagement. von Isolde Kommer, Helmut Reinke. 1. Auflage. Hanser München 1999

Anmeldung zu Seminaren und Lehrgängen

Kapitel 3. Codierung von Text (ASCII-Code, Unicode)

Anleitungen Einzelsituation

SCHRITT 1: Öffnen des Bildes und Auswahl der Option»Drucken«im Menü»Datei«...2. SCHRITT 2: Angeben des Papierformat im Dialog»Drucklayout«...

Wichtiges Thema: Ihre private Rente und der viel zu wenig beachtete - Rentenfaktor

Aufgabensammlung Bruchrechnen

Kulturelle Evolution 12

Teaser-Bilder erstellen mit GIMP. Bildbearbeitung mit GIMP 1

Dann zahlt die Regierung einen Teil der Kosten oder alle Kosten für den Dolmetscher.

Was meinen die Leute eigentlich mit: Grexit?

Geisteswissenschaftlicher Hochschuldialog der Universitäten Erlangen und Damaskus

MuP-Arbeitshilfen. Kreativität organisieren Der innovative Prozess. Problem-Phase

Bewertung des Blattes

Lösungsmethoden gewöhnlicher Differentialgleichungen (Dgl.)

Erfahrungsbericht Kurume Universität Bekka-Programm

Rundung und Casting von Zahlen

SIMP 1.01 Protokollspezifikation (Mindestanforderung)

Browsereinstellungen für moneycheck24 in Explorer unter Windows

4. BEZIEHUNGEN ZWISCHEN TABELLEN

Ist Fernsehen schädlich für die eigene Meinung oder fördert es unabhängig zu denken?

Stammdatenanlage über den Einrichtungsassistenten

Wie kann ich mein Profil pflegen und/oder ihm ein PDF hinzufügen? Sie vermissen die Antwort auf IHRE Frage? Bitte lassen Sie uns Ihnen weiterhelfen:

Lehrer: Einschreibemethoden

Beispiel Shop-Eintrag Ladenlokal & Online-Shop im Verzeichnis 1

Windows. Workshop Internet-Explorer: Arbeiten mit Favoriten, Teil 1

Module Entwicklung. Um diese Eigenschaft aufzurufen, starten Sie die Adami Vista CRM Applikation und wählen Sie den Entwicklung Menü.

Teamentwicklung. Psychologische Unternehmensberatung Volker Rudat

Rhetorik und Argumentationstheorie.

CTI SYSTEMS S.A. CTI SYSTEMS S.A. 12, op der Sang. Fax: +352/ L Lentzweiler. G.D.

Elternzeit Was ist das?

teamsync Kurzanleitung

Erstellen einer Collage. Zuerst ein leeres Dokument erzeugen, auf dem alle anderen Bilder zusammengefügt werden sollen (über [Datei] > [Neu])

LEITFADEN ZUR SCHÄTZUNG DER BEITRAGSNACHWEISE

Lizenzierung von SharePoint Server 2013

Verkaufsstätten. Dipl.- Ing.(FH) M.Eng.(TU) Thomas Höhne

Was ist Leichte Sprache?

Mit dem Tool Stundenverwaltung von Hanno Kniebel erhalten Sie die Möglichkeit zur effizienten Verwaltung von Montagezeiten Ihrer Mitarbeiter.

Urheberrecht in der Schule Was Lehrer, Eltern, Schüler, Medienzentren und Schulbehörden vom Urheberrecht wissen sollten

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

4.1 Wie bediene ich das Webportal?

Sehbehindertentag 6. Juni. Kontraste. helfen schwachen Augen

Zwischenablage (Bilder, Texte,...)

Denken und Träumen - Selbstreflexion zum Jahreswechsel

Elektrische Logigsystem mit Rückführung

Definition und Begriffe

Lehreinheit E V2 Verschlüsselung mit symmetrischen Schlüsseln

bagfa ist die Abkürzung für unseren langen Namen: Bundes-Arbeits-Gemeinschaft der Freiwilligen-Agenturen.

Die Größe von Flächen vergleichen

SWOT Analyse zur Unterstützung des Projektmonitorings

Warum reicht Zähneputzen nicht?

Avenue Oldtimer Liebhaber- und Sammlerfahrzeuge. Ihre Leidenschaft, gut versichert

Whitepaper. Produkt: combit Relationship Manager 7. combit Relationship Manager -rückläufer Script. combit GmbH Untere Laube Konstanz

Wir machen neue Politik für Baden-Württemberg

Übungskomplex Felder (1) Eindimensionale Felder Mehrdimensionale Felder

Auf der linken Seite wählen Sie nun den Punkt Personen bearbeiten.

Sonderrundschreiben. Arbeitshilfe zu den Pflichtangaben in Immobilienanzeigen bei alten Energieausweisen

FAMILIENSTAND ALLEINERZIEHENDE MÜTTER

James W. Heisig Klaus Gresbrand Die Kana lernen und behalten

Organisation des Qualitätsmanagements

Transkript:

Seminar: Suchmaschinen Dozent: Stefan Langer CIS, Universität München Wintersemester 2010

Übung (5 min) Welche kennen Sie? Finden Sie jeweils ein Beispiel für jeden der unten angegebenen Typen Alphabete Konsonantenschriften (engl consonantary oder abjad) Abugida (Zwischending zwischen Silbenschrift und Alphabet) Silbenschriften logographische 2

Typen von n Alphabete Lateinische Schrift Griechische Schrift Kyrillische Schrift Konsonantenschriften (engl consonantary oder abjad) Arabische Schrift Hebräisch Abugida (Zwischending zwischen reiner Silbenschrift und Alphabet) Devanagari (für Hindi u.a.) + die meisten indischen ) Silbenschriften Kana (Katakana/Hiragana; Japanisch) logographische Chinesisch (und Ableger, z.b. japanische Kanji) 3

Alphabet In einem Alphabet werden alle Phoneme einer Sprache durch Zeichen ausgedrückt (also Vokale und Konsonanten). Ein Alphabet ist damit eine phonemische Wiedergabe einer Sprache. Einschränkungen: Lautveränderungen, die nicht in der Schrift wiedergegeben sind (Englisch!) Bsp. "light" vgl. dt. "Licht" Laute können auch durch Kombinationen von Zeichen wiedergegeben werden (z.b. Deutsch sch, English sh) Verhältnis Laut-Zeichen kann auch sein 0:N N:0 N:0: z.b. Frz. Écoutent ([ekut]) 0:N: z.b. Deutscher Knacklaut/Glottalverschluss (ver'eisen) 4

Schreibung in Alphabetschriften In Alphabetschriften werden unterschiedliche Wortformen in der Regel auch in der Schreibung ausgedrückt Teilweise werden in der Schreibung morphologische Regularitäten erhalten, die es in der gesprochenen Sprache nicht mehr vorhanden sind: Frz.: donner, donne, donnes, donne, donnons, donnez, donnent 5

Konsonantenschrift In einer Konsonantenschrift werden alle Konsonanten einer Sprache durch Zeichen ausgedrückt (Vokale nicht). Einschränkungen: Das Arabische z.b. schreibt keine Kurzvokale, aber Langvokale (allerdings durch Buchstaben, die auch für Konsonanten stehen können) القمر Al-q(a)m(a)r Diakritika können optional verwendet werden, um die kurzen Vokale anzuzeigen ال ق م ر 6

Schreibung in Konsonantenschriften In Konsonantenschriften werden unterschiedliche Wortformen in der Regel auch in der Schreibung ausgedrückt, wenn sie Konsonanten betreffen; Vokaländerungen sind in der Schrift nicht sichtbar 7

Abugida (Untertyp einer Silbenschrift) Beispiel Devanagari (indische Schrift v.a. verwendet für Hindi): (Abbildung aus wikipedia.de) Vokale werden dargestellt, indem die Konsontenzeichen modifiziert werden. Im Gegensatz zu einer reinen Silbenschrift lässt sich also im Zeichen, das die Silbe repräsentiert, der Konsonantenanteil noch isolieren. 8

Morphologie / Schreibung in Abugidas Hier gilt ähnliches wie für Alphabetschriften 9

Silbenschriften Jedes Zeichen steht für eine ganze Silbe V.a. Japanisch (Hiragana, Katakana) und einige ältere bzw. ausgestorbene Sprachen 10

Logographische Bei logographische n stehen die Zeichen nicht für einzelne Laute, sondern für ganze Morpheme oder Wörter Logographisch haben oft ideographische und piktographische Aspekte; d.h. die Zeichen stehen direkt für Begriffe oder haben bildhaften Bezug zum dargestellten Begriff Beispiele: Das Chinesische ist ein (weitgehend) logographisches Schriftsystem. Da das Chinesische eine isolierende Sprache ist, besteht keine Notwendigkeit Flexionssuffixe in das System zu integrieren Das Japanische verwendet Chinesische Schriftzeichen, häufig aber in anderer Bedeutung als im Chinesischen. Flexionsendungen werden durch Hiragana- Zeichen (Silbenschrift) dargestellt 11

Groß- und Kleinschreibung Manche unterscheiden zwischen Groß- und Kleinschreibung Lateinische Schriftzeichen Griechisch Großschreibung für bestimmte Wortarten; Satzanfang; Markierung (Majuskeln) Generelle Problem der Groß- Kleinkonversion Erhöhung der Ambiguität Spezielle Probleme der Groß- Kleinkonversion Buchstabenersetzungen GRÜSSE Grüße Akzentwegfall, z. B. Französisch égalité Egalité (selten Égalité) Sprachenspezifische Groß-Kleinkonversion für einzelne Buchstaben Türkisch I ı İ i (normalerweise I i) 12

Diakritika Diakritika sind Zeichen, die zu Buchstaben hinzutreten; z.b. Akzentzeichen im Französischen. Die Abgrenzung von Buchstaben mit Diakritika zu eigenständigen Buchstaben ist schwierig Diakritika werden in vielen Sprachen inkonsistent verwendet Eventuell werden Diakritika nur auf Kleinbuchstaben gesetzt. Diakritika werden bei Widergabe in anderen Sprachen gerne weggelassen ähnliches gilt für sprachspezifische Buchstaben wie Ø tastaturbedingt Diakritika können unterschiedlich realisiert werden (zusammengesetzte Buchstaben vs. getrennte Realisierung (combining diacritical marks) Normalisierung erforderlich 13

Ligaturen Ligaturen sind zusammengesetzte Buchstaben, z.b. ff, fi, fl, ft Es gibt auch historische Ligaturen, die zu eigenständigen Buchstaben geworden sind, z.b. w, ß Bei der Normalisierung werden Ligaturen in der Regel aufgelöst und die Einzelbuchstaben 14

Schriftrichtung Links nach rechts (europäische Sprachen) Rechts nach links (arabische Schrift, Hebräisch) القمر Al-q(a)m(a)r 15