Document Engineering
|
|
- Georg Kappel
- vor 6 Jahren
- Abrufe
Transkript
1 Zeichen- und Fontmanagement - Grundlagen 25. November 2005
2 Gliederung 1 Zeichen 2 Zeichenkodierung 3 Font 4 Fontmanagement
3 Was ist ein Zeichen? (Schrift-)Zeichen: The smallest component of written language that has semantic value refers to the abstract meaning and/or shape, rather than a specific shape Glyphen: grafische Darstellung einzelner Schriftzeichen Quelle:
4 Zeichenkodierung Ziel Verarbeitung Speicherung Austausch von Text Kodierungsmodell Glyph Zahldarstellung Namen
5 Kodierungsmodelle ISO 646 Codepage 437 Mac OS Roman KOI8-R ISO/IEC 8859 Unicode
6 ISO 646 Zeichen Zeichenkodierung Font Fontmanagement 7-bit-Zeichenkodierung 0-31 Steuerzeichen (Control Character) 32 Leerzeichen druckbare Zeichen (Buchstaben, Ziffern,...) 127 Löschzeichen Quelle: internet/ref_char_646.html
7 ISO 646-IRV International Reference Version (1972) Quelle: internet/ref_char_646.html
8 ISO 646-US (ASCII) American Standard Code for Information Interchange International Reference Version (1992) Quelle: internet/ref_char_646.html
9 ISO nationale Varianten Quelle: internet/ref_char_646.html
10 Codepage 437 auch: DOS-US, OEM-US, DOSLatinUS 8-bit-Code verwendet von IBM-PCs und MS-DOS 0-31 Grafikzeichen wie US-ASCII europäische Schriftzeichen, Blockgrafikzeichen, mathematische Symbole und einige griechische Zeichen Quelle:
11 Codepage 437
12 Mac OS Roman von Mac OS verwendeter 8-bit-Zeichensatz für Westeuropa und Amerika oft abgekürzt als MacRoman Zeichen entsprechen ISO 646-US
13 KOI8-R Zeichen Zeichenkodierung Font Fontmanagement Kod Obmena Informacie, 8 bit Code für Informationsaustausch, 8 Bit RFC Registration of a Cyrillic Character Set Besonderheit: kyrillische Buchstaben nicht in natürlicher Ordnung
14 KOI8-R Zeichen Zeichenkodierung Font Fontmanagement Quelle:
15 KOI8-R Zeichen Zeichenkodierung Font Fontmanagement Kod Obmena Informacie, 8 bit Code für Informationsaustausch, 8 Bit RFC Registration of a Cyrillic Character Set Besonderheit: kyrillische Buchstaben nicht in natürlicher Ordnung Beispiel: Russki Tekst russkij tekst Quelle:
16 ISO/IEC 8859 Normenfamilie 15 Teilnormen erste 128 Zeichen identisch ASCII 32 (zum Teil unbenutzte) Steuerzeichen ( ) 160 geschütztes Leerzeichen 173 Bindestrich regionale Sonderzeichen Quelle:
17 ISO/IEC 8859 Normenfamilie ISO Westeuropäisch Latin-1 ISO Zentraleuropäisch Latin-2 ISO Südeuropäisch Latin-3 ISO Nordeuropäisch Latin-4 ISO Kyrillisch.. (ISO ) Latin/Devanagari.. ISO Südosteuropäisch Quelle:
18 Zeichenkodierung Probleme zu wenig mögliche Zeichen gleiche Zahl kodiert verschiedene Zeichen 200 = kyrillisches Zeichen,» oder Blockgrafik
19 Unicode Zeichen Zeichenkodierung Font Fontmanagement What is Unicode? Unicode provides a unique number for every character, no matter what the platform, no matter what the program, no matter what the language. Quelle: Ziele von Unicode Eindeutigkeit Effizienz Kompatibilität
20 Wie werden die Ziele erreicht? Eindeutigkeit ausreichend großer Coderaum ( Codepositionen) 17 planes mit je 2 16 Codepositionen plane Codepositionen 0 U+0000 U+FFFF 1 U U+1FFFF U+F0000 U+FFFFF 16 U U+10FFFF
21 Wie werden die Ziele erreicht? Eindeutigkeit bereits Zeichen definiert in Unicode Version 4.0 U+0041 A LATIN CAPITAL LETTER A Zeichen werden nie entfernt Codepositionen unveränderlich Zeichennamen unveränderlich
22 Wie werden die Ziele erreicht? Effizienz eine Kodierung für alle Sprachen verschiedene Bytekodierungen UTF-8, UTF-16, UTF-32 Unicode Transfomation Format variable Byteanzahl (UTF-8, UTF-16) plane 0 - basic multilingual plane (BMP) Sortierung von Codepositionen und Bytekodierung identisch
23 Wie werden die Ziele erreicht? Kompatibilität ein Code für alle Plattformen alle Bytekodierungen unterstützen kompletten Coderaum Zero Extending der Bytekodierungen Bits Standard Binär Zeichen 7 ASCII A 8 UTF A 16 UTF A 32 UTF A ASCII auf ersten 128 Codepositionen
24 Unicode Bytekodierung Beispiel: UTF-8 Unicode-Bereich UTF-8-Kodierung F 0xxxxxxx FF 110xxxxx 10xxxxxx FFFF 1110xxxx 10xxxxxx 10xxxxxx FFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx Quelle:
25 Unicode Zeichen Zeichenkodierung Font Fontmanagement Unicode definiert Codepositionen Zeichennamen Bitdarstellung Unicode ist keine Schriftart keine grafische Darstellung von Zeichen
26 Was ist ein Font? A collection of glyphs used for the visual depiction of character data. Oft mit verschiedenen Parametern wie z. B.: Schriftgrösse Schriftschnitt Unterstreichung... Quelle:
27 Verwaltung der Glyphen Bitmapzeichen Zeichen als Anordnung von Punkten in einem Raster definiert Vektorzeichen Umrisshülle (engl. Outline) durch Abfolge von Kurven und Geraden definiert
28 Kodierung von Vektorzeichen Beziér-Kurven defniert durch Bézier-Punkte (Anfangs-, End- und zwei Stützpunkte) Vorteil: sehr komplex, deshalb nur wenige Stützpunkte benötigt Quadratische B-Splines definiert durch De Boor-Punkte Vorteil: einfacher und schneller berechenbar als Beziér-Kurven Nachteil: nicht so komplex, deshalb mehr Speicherplatz benötigt
29 Koordinatensystem und Einheit Problem: verschiedene Geräte-Koordinatensysteme Lösung: Benutzer-Koordinatensystem Koordinatenursprung X- und Y-Achse Festlegung der Einheit auf den Achsen Problem: Welche Einheit verwenden Lösung: z. B. Punkt (wird verwendet für Schriftgrößen) unit introduced by/in millimeters Fournier-point Pierre Fournier Didot point Ambroise Didot German Didot point American printer s point Nelson Hawks PostScript point Warnock and Geschke
30 Verwaltung der Glyphen Bitmapzeichen schnelle Ausgabe auf Punktrastern Bitmaps für alle Schriftgrössen erforderlich (nur ganzzahlige Skalierung + Treppeneffekt) Vektorzeichen Umrechnung in Rasterform erforderlich nur ein Vektor für alle Schriftgrössen (fast beliebig skalierbar)
31 Verwaltung der Glyphen Pixelsprung
32 Auszeichnungen Erklärung Schriftauszeichnungen sind Stilmittel, um Hervorhebungen im Text vozunehmen. Beispiele schräggestellt kursiv fett KAPITÄLCHEN Quelle:
33 Ligatur Zeichen Zeichenkodierung Font Fontmanagement Erklärung Eine Ligatur ist eine Buchstabenverbindung. Beispiele ff fl ffl fi ff fl ffl fi
34 Zeichencodes Darstellung zuorden Dekodierungs-Schema Problem: Zeichencodes unterscheiden sich in Kodierungen Lösung: Darstellungen eindeutige Namen geben z. B. LATIN CAPITAL LETTER A Dekodierungsvektor als Zuordnung zwischen Zeichencode und Name
35 diakritische Zeichen Erklärung Diakritische Zeichen sind zu Buchstaben gehörige kleine Zeichen wie Punkte, Striche, Häkchen oder Kringel, die eine besondere Aussprache oder Betonung markieren. Beispiele ó ò ô õ ŏ ō ō o ȯ ọ ö ő oo o ø Quelle:
36 diakritische Zeichen effizientere Speicherung Glyphen für diakritische Zeichen und Buchstaben getrennt speichern Kombination über Dekodierungsvektor + =
37 Ausrichtung von Zeichen Problem: wie Zeichen ausrichten crazy cr azy Lösung: Abstand der Referenzpunkte festlegen crazy
38 Ausrichtung von Zeichen nicht-proportional/monospaced/diktengleich IM IM proportional IM IM
39 Kerning Zeichen Zeichenkodierung Font Fontmanagement Erklärung Unter Kerning versteht man das Zusammen- oder Auseinanderrücken von Buchstabenpaaren. Beispiele AV LV LT Y. Yo AV LV LT Y. Yo
40 Fragen?
Einführung in die Programmiertechnik
2008 Martin v. Löwis Einführung in die Programmiertechnik Darstellung von Text 2008 Martin v. Löwis 2 Plain Text Abstraktion: Text wird durch eine Folge von Symbolen (Buchstaben, Zahlen, Interpunktion)
MehrCodierung von Text. PC in Betrieb nehmen. Der ASCII-Code (American Standard Code for Information Interchange) ASCII
Codierung von Text Der ASCII-Code (American Standard Code for Information Interchange) ASCII Zeichenvorrat 1: A,B,C,D...Z,a,b,c z,0,1..9, usw. Zeichenvorrat 2: 0,1 Codetabelle ASCII: (Auszug) A 0100 0001
MehrUnicode und UTF-8. Anna-Katharina Wurst. 28. April 2015. WP5 Angewandte Programmierung
28. April 2015 WP5 Angewandte Programmierung David Kaumanns & Sebastian Ebert SoSe 2015 CIS Ludwig-Maximilians-Universität München 2 Inhalt 1 Zeichensätze ASCII ISO 8859-x Unicode 2 Kodierung UTF-8 3 Anwendung
MehrKapitel 3. Codierung von Text (ASCII-Code, Unicode)
Kapitel 3 Codierung von Text (ASCII-Code, Unicode) 1 Kapitel 3 Codierung von Text 1. Einleitung 2. ASCII-Code 3. Unicode 2 1. Einleitung Ein digitaler Rechner muss jede Information als eine Folge von 0
Mehr64-040 Modul IP7: Rechnerstrukturen
64-040 Modul IP7: 4. Textkodierung Norman Hendrich & Jianwei Zhang Universität Hamburg MIN Fakultät, Vogt-Kölln-Str. 30, D-22527 Hamburg {hendrich,zhang}@informatik.uni-hamburg.de WS 2010/2011 Hendrich
MehrTechnische Informatik (RO)
Technische Informatik (RO) Zahlensysteme, Digitale Systeme (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten, Sequentielle Schaltungen (6) Informationskodierung (7,8) Fortsetzung
MehrGrundlagen der Datenverarbeitung
Grundlagen der Datenverarbeitung Zeichendarstellung Christian Gürtler MultiAugustinum 9. November 2014 Christian Gürtler (MultiAugustinum) Grundlagen der Datenverarbeitung 9. November 2014 1 / 16 Inhaltsverzeichnis
Mehr» ASCII = American Standard Code for Information Interchange.» ASCII ist Standard in Windows und Unix (und Unix-Derivaten).» ASCII ist eigentlich ein
1 2 » ASCII = American Standard Code for Information Interchange.» ASCII ist Standard in Windows und Unix (und Unix-Derivaten).» ASCII ist eigentlich ein 7-Bit-Zeichensatz, d. h. das erste Bit jedes Bytes
Mehralphanumerische Zeichen
Darstellung von Text 7 Bit pro Zeichen genügen (2 7 = 128) 26 Kleinbuchstaben 26 Großbuchstaben 10 Ziffern alphanumerische Zeichen Sonderzeichen wie '&', '!', ''' nicht druckbare Steuerzeichen, z.b. -
MehrHauptspeicherinhalt. Ton. Vektorgrafik Bitmapgrafik Digit. Video. 1. Darstellung von Daten im Rechner. Abb. 1.1: Einteilung der Daten
Hauptspeicherinhalt Programmcode Daten numerisch logisch alphanumerisch Ton Grafik Ganze Zahlen Gleitkommazahlen Zeichen Zeichenketten vorzeichenlos mit Vorzeichen Vektorgrafik Bitmapgrafik Digit. Video
Mehr03 XML Grundlagen. Manuel Burghardt Lehrstuhl für Medieninformatik
Markupsprachen 03 XML Grundlagen Manuel Burghardt Warum XML? Nachteile von SGML und HTML SGML ist für die meisten Aufgaben zu komplex, und dadurch nicht sofort einsetzbar (komplexe Metasprache) HTML ist
Mehr2 Repräsentation von elementaren Daten
2 Repräsentation von elementaren Daten Alle (elemtaren) Daten wie Zeichen und Zahlen werden im Dualsystem repräsentiert. Das Dualsystem ist ein spezielles B-adisches Zahlensystem, nämlich mit der Basis
MehrU+1F4A9 = What every Programmer should know about Unicode. 2. Semester Medieninformatik. Prof. Dr.-Ing. Carsten Bormann cabo@tzi.
U+1F4A9 = What every Programmer should know about Unicode 2. Semester Medieninformatik Prof. Dr.-Ing. Carsten Bormann cabo@tzi.de 1 Textuelle Information Zeichen Primäre Informationsquelle im Web: Text
MehrSonderzeichen, TEI und Unicode
Sonderzeichen, TEI und Unicode O. Duntze Behandlung von Sonderzeichen Bei Transkriptionen älterer und/oder handschriftlicher Texte häufig Sonderzeichen Inzwischen zahlreiche Sonderzeichen im Unicode-Standard
MehrUnicode und Zeichensätze
02 Unicode G. Görz, J. Schneeberger Lehrstuhl Informatik 8 (KI) josef.schneeberger@fh-deggendorf.de! Unicode und Zeichensätze Unter Mitarbeit von Olaf Winterstein (Greifswald 08) 2 Was ist Unicode? Internationaler
MehrGliederung. Was ist der Unicode? Warum gibt es den Unicode? Wie funktioniert er? Wo ist mein Schriftzeichen? Kritische Stimmen
Unicode Gliederung Was ist der Unicode? Warum gibt es den Unicode? Wie funktioniert er? Wo ist mein Schriftzeichen? Kritische Stimmen Was ist der Unicode? ein Datensatz von Schriftzeichen wie viele andere
Mehr11/2/05. Darstellung von Text. ASCII-Code. American Standard Code for Information Interchange. Parity-Bit. 7 Bit pro Zeichen genügen (2 7 = 128)
Darstellung von Text ASCII-Code 7 Bit pro Zeichen genügen (2 7 = 128) 26 Kleinbuchstaben 26 Großbuchstaben 10 Ziffern Sonderzeichen wie '&', '!', ''' nicht druckbare Steuerzeichen, z.b. - CR (carriage
Mehr11/2/05. Darstellung von Text. ASCII-Code. American Standard Code for Information Interchange. ASCII-Tabelle. Parity-Bit. Länderspezifische Zeichen
Darstellung von Text ASCII-Code 7 Bit pro Zeichen genügen ( 7 = 18) 6 Kleinbuchstaben 6 Großbuchstaben 10 Ziffern Sonderzeichen wie '&', '!', ''' nicht druckbare Steuerzeichen, z.b. - CR (carriage return
Mehr4.1 Fontmanagement. Seminar Document Engineering. Michael Boehnke. Fontmanagement
4.1 Seminar Document Engineering Michael Boehnke 01 Motivation 01 Was ist Schrift? Hat der Rechner damit etwa Probleme? Was heisst das für mich? 02 So... ZDv 37/10 102. Die Uniform der Bundeswehr weist
MehrDatenaustausch. Energiewirtschaft 3. Semester. Tillman Swinke
Datenaustausch Energiewirtschaft 3. Semester Tillman Swinke Frohes neues Jahr Organisatorisches Ab nächster Vorlesung: 30 min Fragestunde (Bitte Vorbereiten) Übungsklausur in der nächsten Vorlesung Agenda
MehrDaten und Informationen
Daten und Informationen Vorlesung vom 17. Oktober 2016 Birger Krägelin Inhalt Repräsentation und Abstraktion Zahlendarstellung Stellenwertsysteme Rechnen mit Zahlen Gleitkommazahlen, Rundungsproblematik
MehrDaten und Informationen
Daten und Informationen Vorlesung vom 23. Oktober 2017 Birger Krägelin Inhalt Repräsentation und Abstraktion Zahlendarstellung Stellenwertsysteme Rechnen mit Zahlen Gleitkommazahlen, Rundungsproblematik
MehrSonderzeichen, TEI und Unicode. TEI-Guidelines Kap. 5
Sonderzeichen, TEI und Unicode TEI-Guidelines Kap. 5 Behandlung von Sonderzeichen! Bei Transkriptionen älterer und/oder handschriftlicher Texte häufig Sonderzeichen! Inzwischen zahlreiche Sonderzeichen
MehrKodierung. Kodierung von Zeichen mit dem ASCII-Code
Kodierung Kodierung von Zeichen mit dem ASCII-Code Weiterführende Aspekte zur Kodierung: Speicherplatzsparende Codes Fehlererkennende und -korrigierende Codes Verschlüsselnde Codes Spezielle Codes, Beispiel
MehrGlobalisierung und Lokalisierung Fremdsprachen auf Embedded Systemen. Embedded Computing Conference 2012 Vera Mirković, CSA Engineering AG
Globalisierung und Lokalisierung Fremdsprachen auf Embedded Systemen Embedded Computing Conference 2012 Vera Mirković, CSA Engineering AG CSA Engineering AG Seit 1989 in Solothurn Software Entwicklung
MehrRückblick. Addition in der b-adischen Darstellung wie gewohnt. Informatik 1 / Kapitel 2: Grundlagen
Rückblick Addition in der b-adischen Darstellung wie gewohnt 5 0 C E + D 4 2 D = 44 Rückblick Multiplikation in der b-adischen Darstellung wie gewohnt 1 0 1 0 1 0 1 = 45 Rückblick Darstellung negativer
MehrKlaus Schild, XML Clearinghouse Aufbau von XML- Dokumenten
Aufbau von XML- Dokumenten Lernziele Wie ist ein XML-Dokument aufgebaut? Was sind Elemente und was sind Attribute? Wann sollten Attribute und wann Elemente verwendet werden? Elemente ist ein Anfangs-Tag
MehrA あ. Zeichensaetze & Co. http://www.mehnle.net/papers/charsets+co Julian Mehnle <julian@mehnle.net>
A あ Zeichensaetze & Co. http://www.mehnle.net/papers/charsets+co Julian Mehnle Inhalt INHALT 1 ZEICHENSÄTZE, ZEICHENKODIERUNGEN, SCHRIFTEN, SCHRIFTARTEN...3 2 BUCHSTABENSUPPE...5 3
MehrDocument Engineering. Zeichen- und Fontmanagement Realisierung in Dateiformaten. Daniel Weber. Document Engineering p. 1
Document Engineering Zeichen- und Fontmanagement Realisierung in Dateiformaten Daniel Weber Document Engineering p. 1 Inhalt Grundbegriff: Font-Management Kodierungsmodelle in wichtigen Dateiformaten Migration
MehrUnicode-Integration in FrameMaker?
Unicode-Integration in FrameMaker? tekom-tagung 22.-23.4.2004, Aachen FrameMaker Tutorial TF6 Dipl.-Ing. Michael Müller-Hillebrand, Erlangen Unicode-Integration in FrameMaker?, 1/20 Was bedeutet Unicode-fähig?
MehrAuch 2007 wird diese Empfehlung allerdings immer noch nicht universell befolgt.
UTF-8 Kodierung UTF-8 (Abk. für 8-bit Unicode Transformation Format) ist die am weitesten verbreitete Kodierung für Unicode Zeichen. Unicode ist ein internationaler Standard, in dem langfristig für jedes
MehrFunktionale Aspekte. Pia Lobenstein
Funktionale Aspekte Pia Lobenstein 20.05.2010 Gliederung 1. Funktionale Aspekte Klassische Datenmodellierung Definition Potentielle Probleme 2. Internationalisierung Motivation Lokalisierung und Internationalisierung
MehrEinführung in das Textsatzsystem (L A )TEX
Einführung in das Textsatzsystem (L A )TEX Vorlesung über (LA)TEX im Sommersemester 2009 univer@tati+ studii heydelbergen@+ Arno Trautmann Heidelberg Vorlesung 3 am 24. April 2009 ...3 Schreiben früher,
MehrMotivation und Überblick
Motivation und Überblick Drei große Bereiche der Vorlesung: Darstellung von Zahlen in Rechnern Verarbeitung von Binärdaten auf der Ebene digitaler Schaltungen Programmierung auf Maschinenebene und relativ
Mehr7. Übung zur Vorlesung Grundlagen der Informatik
7. Übung zur Vorlesung Grundlagen der Informatik 13.Interne Darstellung von Daten In der Vorlesung wurde bereits darauf hingewiesen, dass ein Rechner intern lediglich die Zustände 0 (kein Signal liegt
MehrDatentypen printf und scanf. Programmieren in C Dr. Michael Zwick
Datentypen printf und scanf Programmieren in C Dr. Michael Zwick April June 2015 Monday Tuesday Wednesday Thursday Friday 17 20 Apr 21 22 23 24 Arbeitsblatt 1-1 Ausgabe Arbeitsblatt 1 Beginn Tutorium Arbeitsblatt
MehrB: Basis des Zahlensystems 0 a i < B a i є N 0 B є (N > 1) Z = a 0 B 0 + a 1 B 1 + a 2 B a n-1 B n-1
Polyadisches Zahlensystem B: Basis des Zahlensystems 0 a i < B a i є N 0 B є (N > 1) Ganze Zahlen: n-1 Z= a i B i i=0 Z = a 0 B 0 + a 1 B 1 + a 2 B 2 +... + a n-1 B n-1 Rationale Zahlen: n-1 Z= a i B i
MehrRechnerorganisation. IHS 2015/2016 H.-D. Wuttke, K. Henke
Rechnerorganisation Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen (9) Rechneraufbau
Mehr1 Funktionsaufrufe. Informatik I: Einführung in die Programmierung 4. Funktionen: Aufrufe und Definitionen. Funktionsaufrufe
1 Funktionsaufrufe Informatik I: Einführung in die Programmierung 4. : und en Albert-Ludwigs-Universität Freiburg Bernhard Nebel 21./25. Oktober 2016 21./25. Oktober 2016 B. Nebel Info I 3 / 36 Funktionsaufrufe
MehrGrundlagen der Informationstechnik
Grundlagen der Informationstechnik 2 Um die Funktionsweise der Computernetze zu verstehen, ist ein grundlegendes Verständnis der Informationstechnik (IT) nötig. Bei diesen Grundlagen handelt es sich um
MehrRechnerstrukturen. Michael Engel und Peter Marwedel. Sommer TU Dortmund, Fakultät für Informatik
Rechnerstrukturen Michael Engel und Peter Marwedel TU Dortmund, Fakultät für Informatik Sommer 2014 Folien a. d. Basis von Materialien von Gernot Fink und Thomas Jansen 10. April 2014 1/37 1 Repräsentation
MehrB Tastatur, Schriftzeichen, Beschleuniger
1 Copyright 1994, 1996 by Axel T. Schreiner. All Rights Reserved. B Tastatur, Schriftzeichen, Beschleuniger Je nach Plattform verwendet OPENSTEP verschiedene Tastaturen. Trotzdem sind überall alle Zeichen
MehrWie rechnet ein Rechner?
0 Motivation Jörg Roth 2 Wir gehen in dieser Vorlesung der Frage nach Wie rechnet ein Rechner? Als Softwareentwickler könnten wir in einem Programm z.b. folgende Anweisung schreiben: a = a+2*b; Wie wird
MehrRepräsentation von Daten Binärcodierung von rationalen Zahlen und Zeichen
Kapitel 4: Repräsentation von Daten Binärcodierung von rationalen Zahlen und Zeichen Einführung in die Informatik Wintersemester 2007/08 Prof. Bernhard Jung Übersicht Codierung von rationalen Zahlen Konvertierung
MehrBitmap-, PostScript- und TrueType-Fonts Proseminar Textkodierung und Auszeichnung
Bitmap-, PostScript- und TrueType-Fonts Proseminar Textkodierung und Auszeichnung Matthias Bethke bethke@linguistik.uni-erlangen.de Linguistische Informatik Universität Erlangen-Nürnberg Sommersemester
MehrHerzlich Willkommen zur Informatik I. Bits und Bytes. Zahlensystem zur Basis 10 (Dezimalzahlen) Warum Zahlensysteme betrachten?
Herzlich Willkommen zur Informatik I Bits und Bytes Zahlen im Computer: Binärzahlen, Hexadezimalzahlen Text im Computer: ASCII-Code und Unicode Quelle: http://www.schulphysik.de/rgb.html Bit: eine binäre
MehrLinux I II III Res WN/TT NLTK XML Weka E Rechte Encoding. Linux III. 3 Linux III. Rechte Encoding. Ressourcen-Vorkurs
Linux III 3 Linux III Rechte Encoding Rechte I In der Unix-Welt gibt es drei wichtige Rechte: Read (r) Eine Datei lesen bzw. den Inhalt eines Verzeichnisses anzeigen Write (w) Eine Datei ändern bzw. eine
MehrKodierung. Bytes. Zahlensysteme. Darstellung: Zahlen
2 Einführung in die Informationstechnik VI Information und ihre Darstellung: Zahlen, Zeichen, Texte Heute 1. Information und Daten 2. Informationsdarstellung 1. Zahlen 1. Binärsystem 2. Dezimalsystem 3.
MehrLinux I II III Res WN/TT Rechte Encoding. Linux III. 3 Linux III. Rechte Encoding. Ressourcen-Vorkurs
Linux III 3 Linux III Rechte Encoding Rechte I In der Unix-Welt gibt es drei wichtige Rechte: Read (r) Eine Datei lesen bzw. den Inhalt eines Verzeichnisses anzeigen Write (w) Eine Datei ändern bzw. eine
MehrEinstieg in die Informatik mit Java
1 / 30 Einstieg in die Informatik mit Java Datentypen Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 30 1 Überblick 2 Ganzzahlige Typen 3 Gleitkommatypen 4 Zeichen, char
MehrModul: Programmierung B-PRG Grundlagen der Programmierung 1 Teil 1 V5
Modul: Programmierung B-PRG Grundlagen der Programmierung 1 Teil 1 V5 Zeichenketten, Strings und Listen Professur für Graphische Datenverarbeitung Institut für Informatik Fachbereich Informatik und Mathematik
MehrModul: Programmierung B-PRG Grundlagen der Programmierung 1 Teil 1 V5
Modul: Programmierung B-PRG Grundlagen der Programmierung 1 Teil 1 V5 Zeichenketten, Strings und Listen Professur für Graphische Datenverarbeitung Institut für Informatik Fachbereich Informatik und Mathematik
MehrFundamentale Ideen der Informatik PH Weingarten Sommersemester 2014 Paul Libbrecht CC-BY
Fundamentale Ideen der Informatik PH Weingarten Sommersemester 2014 Paul Libbrecht CC-BY Vorlesung 6: Repräsentationen Themenkarte Verschlüsselung Netzwerk Versionierung Programmverlauf Java Instruktionen
MehrMerke: Mit jedem zusätzlichen Bit verdoppelt sich die Anzahl der darstellbaren Zahlen bzw. Zustände
1 2 Merke: Mit jedem zusätzlichen Bit verdoppelt sich die Anzahl der darstellbaren Zahlen bzw. Zustände 3 Die Zuordnung der Himmelsrichtungen zu den dreistelligen Binärzahlen, also Norden 000 Süden 001
Mehr4 Lokalisierung undinternationalisierung
4 Lokalisierung undinternationalisierung In diesemkapitel lernen Sie ein Linux-System für einen Benutzerineiner anderen Sprache einzurichten. Dadurch, dass das Internet die Erde zu einem globalen Dorf
MehrVorkurs Informatik WiSe 15/16
Konzepte der Informatik Dr. Werner Struckmann / Stephan Mielke, Jakob Garbe, 22.10.2015 Technische Universität Braunschweig, IPS Inhaltsverzeichnis Codierung Aspekte der Binär-Codierung Binärcode Codetabellen
MehrProf. Dr. Oliver Haase Karl Martin Kern Achim Bitzer. Programmiertechnik Zahlensysteme und Datendarstellung
Prof. Dr. Oliver Haase Karl Martin Kern Achim Bitzer Programmiertechnik Zahlensysteme und Datendarstellung Zahlensysteme Problem: Wie stellt man (große) Zahlen einfach, platzsparend und rechnergeeignet
MehrProgrammierkurs Java
Programmierkurs Java Variablen und Datentypen Prof. Dr. Stefan Fischer Institut für Telematik, Universität zu Lübeck http://www.itm.uni-luebeck.de/people/fischer #2 Überblick Welche Datentypen gibt es
MehrMultimediale Werkzeuge. Textformate, Medienobjekte
Multimediale Werkzeuge Textformate, Medienobjekte Geschichte/ Eigenschaften von Textformaten Gebräuchliche Textformate, z.b. für HTML Files, Programme: ASCII (American Standard Code for Inform. Interchange)
MehrWintersemester Maschinenbau und Kunststofftechnik. Informatik. Tobias Wolf Seite 1 von 11
Kapitel 11 Zeichenverarbeitung Seite 1 von 11 Zeichenverarbeitung - Jedem Zeichen ist ein Zahlencode zugeordnet. - Dadurch wird ermöglicht, zwischen verschiedenen Systemen Texte auszutauschen. - Es werden
MehrDV- und Informationssysteme (ID11)
DV- und Informationssysteme (ID11) Inhalte der Veranstaltung Organisatorisches (Termine, Lehrmaterialien etc.) Prüfung Ziele der Veranstaltung Inhalte der Veranstaltung 1. Grundbegriffe Bits und Bytes
MehrLaTeX - Präambel eines Dokuments. Anja Aue
LaTeX - Präambel eines Dokuments Anja Aue 28.02.17 Aufbau eines Dokuments \documentclass{article} \begin{document} Guten Tag \end{document} Präambel Textteil, bestehend aus den Befehlen und dem Inhalt
MehrZahlen und Zeichen (1)
Zahlen und Zeichen () Fragen: Wie werden Zahlen repräsentiert und konvertiert? Wie werden negative Zahlen und Brüche repräsentiert? Wie werden die Grundrechenarten ausgeführt? Was ist, wenn das Ergebnis
MehrInhalt. Zeichen und Zeichenketten (engl. Strings)
Inhalt Inhalt: 4. Programmiersprache C 4.1 Programmaufbau in C 4.2 Basisdatentypen und einfache Anweisungen 4.3 Steuerfluss-Konstrukte 4.4 Arbeit mit indizierten Größen (Felder) 4.5 Arbeit mit Pointern
MehrSMS Zeichensatz GSM 7-Bit (GSM 03.38)
SMS Zeichensatz GSM 7-Bit (GSM 03.38) Version 1.0 08.03.2010 Web: http://www.sms-expert.de Der Zeichensatz GSM 7-Bit (GSM 03.38) ist der Standardzeichensatz für Kurznachrichten. In diesem Dokument finden
MehrSTV - Zusatzspezifikation CbC XML Schema v1.0
1/6 S TEU ER V ER W A LTU N G FÜ R STEN TU M LIEC H TEN STEIN STV - Zusatzspezifikation CbC XML Schema v1.0 Datum 09.11.2017 v1.0 Inhaltsverzeichnis 1 Einleitung 3 1.1 Zweck dieses Dokumentes 3 2 XML Meldung
MehrVorkurs Informatik WiSe 16/17
Konzepte der Informatik Dr. Werner Struckmann / Stephan Mielke, Jakob Garbe, 13.10.2016 Technische Universität Braunschweig, IPS Inhaltsverzeichnis Codierung Aspekte der Binär-Codierung Binärcode Codetabellen
MehrZeichensatzkonvertierung in Oracle-DB. moving objects GmbH Martin Busik Hamburg - Mai 2003 www.moving-objects.de
Zeichensatzkonvertierung in Oracle-DB moving objects GmbH Martin Busik Hamburg - Mai 2003 www.moving-objects.de moving objects GmbH? Beratung Anforderungserhebung Geschäftprozessanalyse Coaching? Schulung
MehrIn C++ kann man fünf Teilsprachen, die bezüglich Syntax und Semantik differieren, unterscheiden. Objektorientierte Erweiterungen von C
Bemerkungen zu C++: In C++ kann man fünf Teilsprachen, die bezüglich Syntax und Semantik differieren, unterscheiden. Es sind: C-Sprache Objektorientierte Erweiterungen von C Templates Standardbibliothek
MehrDokumentation über die Zusammenhänge von Bit, Byte, ASCII- Code, Hexadezimal- Code und z.b. deren Einsatz beim Farbsystem
Dokumentation über die Zusammenhänge von Bit, Byte, ASCII- Code, Hexadezimal- Code und z.b. deren Einsatz beim Farbsystem Von Eugen Schott & Michael McKeever TG IT 12/4 Lehrer: Herr Köller Inhaltsverzeichnis:
MehrLexikalische Struktur von Fortran 95. Normierte Zeichensätze
Lexikalische Struktur von Fortran 95. Normierte Zeichensätze Im Folgenden steht für ein Leerzeichen! ASCII (American Standard Code for Information Interchange. Es gibt eine DIN-Norm die dem entspricht),
MehrEinheit Datentypen in der Programmiersprache C Schwerpunkt: Elementare (arithmetische) Datentypen
Einheit Datentypen in der Programmiersprache C Schwerpunkt: Elementare (arithmetische) Datentypen Kurs C/C++ Programmierung, WS 2008/2009 Dipl.Inform. R. Spurk Arbeitsgruppe Programmierung FR 6.2 Informatik
MehrDeutsche Fassung. Informationstechnik Europäische Zeichenvorräte und deren Codierung 8-Bit-Einzelbyte-Codierung
TECHNISCHE SPEZIFIKATION TECHNICAL SPECIFICATION SPÉCIFICATION TECHNIQUE CEN/TS 1923 Mai 2003 ICS 35.040 Deutsche Fassung Informationstechnik Europäische Zeichenvorräte und deren Codierung 8-Bit-Einzelbyte-Codierung
MehrGrundbegriffe der Informatik
Grundbegriffe der Informatik Einheit 3: Alphabete, Abbildungen, Aussagenlogik Thomas Worsch Karlsruher Institut für Technologie, Fakultät für Informatik Wintersemester 2010/2011 1/32 Überblick Alphabete
Mehr2. Vorlesung: Boolesche Algebra
2. Vorlesung: Boolesche Algebra Wiederholung Codierung, Decodierung Boolesche Algebra UND-, ODER-Verknüpfung, Negation Boolesche Postulate Boolesche Gesetze 1 Wiederholung 2 Bits und Bitfolgen Bit: Maßeinheit
MehrKapitel 6 Abstände. Buchstabenabstand Dickte und Laufweite
Kapitel 6 Abstände Typografische Gestaltungsmittel sind nicht nur Buchstaben, Ziffern oder Linien sondern auch der freie Raum zwischen diesen Elementen. Die Abstände zwischen diesen Elementen haben eine
MehrBild 1: ff in Form zweier Glyphe und als Ligatur
II.2 Zeichen und Zeichenkodierung In Computern können Texte nur bearbeitet werden, wenn die Texte als Folge von Zeichen vorliegen. Man kann z.b. nur in ihnen suchen, wenn die Texte eine Kette von alphanumerischen
MehrGrundlagen der Informationstechnik
Grundlagen der Informationstechnik 2 Um die Funktionsweise der Computernetze zu verstehen, ist ein grundlegendes Verständnis der Informationstechnik (IT) nötig. Bei diesen Grundlagen handelt es sich um
MehrDIGITALISIERUNG VON BILDERN. Ivana
DIGITALISIERUNG VON BILDERN Ivana WAS IST DIGITALISIERUNG? Begriff aus dem Lateinischen Überprüfung analoger Größen diskrete Werte Produkt = Digitalisat Analoge Speicherung von Informationen auf digitalen
Mehr1 DATEN - INFORMATION - WISSEN. Marcel Götze
GRUNDKURS INFORMATIK 1 DATEN - INFORMATION - WISSEN Marcel Götze Überblick 1. Daten, Information, Wissen 2. Fortsetzung Informationsdarstellung 1. Zahlensysteme 1. Binärsystem, Hexadezimalsystem 2. Bilder
MehrProgrammieren. INE1, Montag M. Thaler, Office TG208. ZHAW, M. Thaler, K. Rege, G. Burkert
Programmieren INE, Montag M. Thaler, tham@zhaw.ch Office TG208 http://www.zhaw.ch/~tham Um was geht es? Problemstellung Algorithmus(Vorgehen) Implementierung 2 Lernziele Siekönnen erklären, was "Programmieren"
Mehrdenn sonst kann man gleich mit der Schreibmaschine schreiben
denn sonst kann man gleich mit der Schreibmaschine schreiben Seitenlayout 3 1,5 DIN A4 Hochformat einseitig bedruckt Seitenränder in cm: siehe rechts Seitenzahl: Abstand der Kopfzeile von oben:
Mehr5. Darstellung und Verarbeitung von Textzeichen
1 5. Darstellung und Verarbeitung von Textzeichen 5.1. Einführung Computer werden nicht nur zum Rechnen mit Zahlen oder zur Verarbeitung aussagenlogischer Werte eingesetzt. Man kann mit ihnen auch Texte
MehrWie man Sonderzeichen erfasst
B E N U T Z E R D O K U M E N TA T I O N ( A L E P H I N O 4. 0 ) Wie man Sonderzeichen erfasst Ex Libris Deutschland GmbH (2010) Version 4.0 Zuletzt aktualisiert: 22.9.2010 1 EINFÜHRUNG...4 2 EINGABE
MehrZeichen, -ketten, die formatiert werden sollen, müssen erst markiert werden!
Zeichenformatierung Zeichen, -ketten, die formatiert werden sollen, müssen erst markiert werden! Zeichenformate werden entweder über die Formatierungssymbolleiste oder das Menü FORMAT Zeichen vergeben.
MehrInformation und ihre Darstellung
. Information und ihre Darstellung Wintersemester 207/208. Informationsdarstellung Äquivalente Information in verschiedenen Darstellungen: Schrift: Die Katze sitzt am Fenster Bild Sprache Zeichensprache.
Mehr1. Informationsdarstellung. Darstellung und Bedeutung. Darstellung und Bedeutung. Interpretation ??? 1. Kapitel
Wintersemester 207/208. Informationsdarstellung Äquivalente Information in verschiedenen Darstellungen: Schrift: Die Katze sitzt am Fenster Bild Sprache Zeichensprache. Kapitel Prof. Matthias Werner Professur
MehrBedienungsanleitung / Handbuch / Datenblatt
Bedienungsanleitung / Handbuch / Datenblatt Sie benötigen einen Reparaturservice für Ihren Etikettendrucker oder suchen eine leicht zu bedienende Etikettensoftware? Wir helfen Ihnen gerne weiter. Ihr Partner
MehrJava Einführung Objekt-Datentypen und Strings. Kapitel 8 und 9
Java Einführung Objekt-Datentypen und Strings Kapitel 8 und 9 Inhalt Was sind Objekt-Datentypen Sonderheiten bei Zuweisung und Vergleich Zeichenketten (Strings) Zeichencodes Char, Char-Arrays und Strings
MehrORTHOGRAFIE. Design Manual
ORTHOGRAFIE Design Manual Februar 2016 Einleitung Orthografie Das Erste richtet sich in nahezu allen Belangen der Schreibweise nach der vom amtlichen Regelwerk zugelassenen sogenannten Agentur-Rechtschreibung
MehrSchrift & Typografie I. DI (FH) Dr. Alexander Berzler
Schrift & Typografie I DI (FH) Dr. Alexander Berzler Schrift & Typografie Theorie Der Ausdruck Typografie/Typographie geht zurück auf die Worte "typos" (Abdruck, Abbild, Form) und "graphein" (schreiben,
MehrXML. Teil 1: Grundbegriffe. Abteilung Informatik WS 02/03
XML Teil 1: Grundbegriffe Abteilung Informatik WS 02/03 Was ist XML? XML-Anwendung: eine XML- Auszeichnungssprache WS 02/03 XML - 2 Was ist XML nicht? XML ist keine...... Programmiersprache... Netzwerk-Kommunikationsprotokoll...
MehrGrundlagen der Informatik 0
Technische Universität Darmstadt 01.07.2013 Grundlagen der Informatik 0 Vorlesung 0 Java ist eine Programmiersprache Ilkay Baytekin Douglas Crockford http://media.smashingmagazine.com/wp-content/uploads/2012/04/doug-crockford-image.jpg
Mehr2. Web 2.0, Semantic Web. 3. Wissensmanagement. 1. Methoden des Wissensmanagements. 2. Software. 4. Wissensrepräsentation
Überblick GRUNDKURS INFORMATIK 2 DATEN-INFORMATION-WISSEN 1. Informatik Grundlagen: Informationsdarstellung, Information und Daten, Algorithmen, Problemlösung. 2. Web 2.0, Semantic Web 3. Wissensmanagement
MehrINTERSTENO 2011 Paris World championship professional word processing
USED OPERATING SYSTEM USED WORD PROCESSING SOFTWARE COMPETITION ID A 1 Instructions for participants Öffnen Sie die Datei WINDENERGY.DOC, speichern Sie sofort unter WINDENERGYXXX.DOC oder DOCX, wobei XXX
Mehres alles getan. Wenn eine afm-datei für gewünschten Font sind
GESS Mit Also Standardfall wie Circumflex-Akzent), den HowTo: Postscript Sonderzeichen. Spanischen z.b. kann im auch tschechischen möglich GESS Schriften ist. tabs Das das kann betrifft zcaron auch. man
MehrZahlen- und Buchstabencodierung. Zahlendarstellung
Dezimalsystem: Zahlen- und Buchstabencodierung Zahlendarstellung 123 = 1 10 2 + 2 10 1 + 3 10 0 1,23 = 1 10 0 + 2 10-1 + 3 10-2 10 Zeichen im Dezimalsystem: 0,1,...9 10 ist die Basis des Dezimalsystems
MehrKodierung. Kodierung von Zeichen mit dem ASCII-Code
Kodierung Kodierung von Zeichen mit dem ASCII-Code Weiterführende Aspekte zur Kodierung: Speicherplatzsparende Codes Fehlererkennende und -korrigierende Codes Verschlüsselnde Codes Spezielle Codes, Beispiel
Mehr