Modul IP7: Rechnerstrukturen

Größe: px
Ab Seite anzeigen:

Download "Modul IP7: Rechnerstrukturen"

Transkript

1 Modul IP7: Rechnerstrukturen 4. Textkodierung Norman Hendrich & Jianwei Zhang MIN Fakultät, Vogt-Kölln-Str. 30, D Hamburg WS 2009/2010 Hendrich & Zhang 1

2 Inhalt Textkodierung Adhoc-Kodierungen ASCII und ISO-8859 Unicode Tips und Tricks Literatur Hendrich & Zhang 2

3 Textkodierung Darstellung von Texten Ad-Hoc Kodierungen Flaggen-Alphabet Braille-Code Morse-Code ASCII und ISO Unicode Hendrich & Zhang 3

4 Textkodierung Wiederholung: Zeichenkette Zeichenkette (engl. string): Eine Folge von Zeichen Wort (engl. word): Eine Folge von Zeichen, die in einem gegebenen Zusammenhang als Einheit bezeichnet wird. Worte mit 8 Bit werden als Byte bezeichnet. Stelle (engl. position): Die Lage/Position eines Zeichens innerhalb einer Zeichenkette. Beispiel s = H e l l o, w o r l d! Hendrich & Zhang 4

5 Textkodierung - Adhoc-Kodierungen Flaggen-Signale (Bauer & Goos, 1981) Hendrich & Zhang 5

6 Textkodierung - Adhoc-Kodierungen Flaggen-Alphabet (Bauer & Goos, 1981) Hendrich & Zhang 6

7 Textkodierung - Adhoc-Kodierungen Braille: Blindenschrift Symbole als 2x3 Matrix (geprägte Punkte) Erweiterung auf 2x4 Matrix (für Computer) bis zu 64 (256) mögliche Symbole diverse Varianten ein Symbol pro Buchstabe ein Symbol pro Silbe Kurzschrift/Steno Hendrich & Zhang 7

8 Textkodierung - Adhoc-Kodierungen Morse-Code Hendrich & Zhang 8

9 Textkodierung - Adhoc-Kodierungen Morse-Code: Eindeutigkeit? Punkt steht für kurzen Ton, Strich für langen Ton bestimmte Morse-Sequenzen sind mehrdeutig Pause zwischen den Symbolen notwendig Hendrich & Zhang 9

10 Textkodierung - Adhoc-Kodierungen Morse-Code: Baumdarstellung (Ausschnitt) Anordnung der Symbole entsprechend ihrer Kodierung Hendrich & Zhang 10

11 Textkodierung - ASCII und ISO-8859 ASCII American Standard Code for Information Interchange eingeführt 1967, aktualisiert 1986: ANSI X viele Jahre der dominierende Code für Textdateien alle Zeichen einer typischen Schreibmaschine Erweiterung des früheren 5-bit Fernschreiber-Codes 7-bit pro Zeichen, 128 Zeichen insgesamt 95 druckbare Zeichen: Buchstaben, Ziffern, Sonderzeichen (Kodierung im Bereich 21..7E) 33 Steuerzeichen (engl: control characters) (0..1F,7F) Hendrich & Zhang 11

12 Textkodierung - ASCII und ISO-8859 ASCII: Codetabelle SP = Leerzeichen, CR = carriage-return, LF = line-feed ESC = escape, DEL = delete, BEL = bell, usw. Hendrich & Zhang 12

13 Textkodierung - ASCII und ISO-8859 ISO-8859 Familie Erweiterung von ASCII um Sonderzeichen und Umlaute 8-bit Kodierung: bis max. 256 Zeichen darstellbar Latin-1: Westeuropäisch Latin-2: Mitteleuropäisch Latin-3: Südeuropäisch Latin-4: Baltisch -5: Kyrillisch -6: Arabisch -7: Griechisch usw. immer noch nicht für mehrsprachige Dokumente geeignet Hendrich & Zhang 13

14 Textkodierung - ASCII und ISO-8859 ISO Erweiterung von ASCII für westeuropäische Sprachen Hendrich & Zhang 14

15 Textkodierung - ASCII und ISO-8859 ISO Erweiterung von ASCII für slawische Sprachen Hendrich & Zhang 15

16 Textkodierung - ASCII und ISO-8859 Microsoft: Codepage 437 Zeichensatz des IBM-PC ab 1981 Erweiterung von ASCII auf einen 8-bit Code einige Umlaute (westeuropäisch) Graphiksymbole Details: verbesserte Version: Codepage 850, 858 ( -Symbol an 0xD5) Codepage 1252 entspricht ISO Sonderzeichen liegen an anderen Positionen als bei ISO-8859 Hendrich & Zhang 16

17 Textkodierung - ASCII und ISO-8859 Windows: Codepage 850 Hendrich & Zhang 17

18 Textkodierung - ASCII und ISO-8859 Austausch von Texten? die meisten gängigen Codes (abwärts-) kompatibel mit ASCII unterschiedliche Kodierung für Umlaute (soweit vorhanden) unterschiedliche Kodierung der Sonderzeichen Unterschiedliche Konvention für Zeilenende DOS/Windows: CR/LF (0D 0A) Unix/Linux: LF Mac OS 9: CR Konverter-Tools: dos2unix, unix2dos, iconv Hendrich & Zhang 18

19 Textkodierung - Unicode Unicode: Motivation zunehmende Vernetzung und Globalisierung internationaler Datenaustausch? Erstellung mehrsprachiger Dokumente? Unterstützung orientalischer oder asiatischer Sprachen? ASCII oder ISO reicht nicht aus temporäre Lösungen konnten sich nicht durchsetzen, z.b: ISO-2022: Umschaltung zwischen mehreren Zeichensätzen durch Spezialbefehle (Escapesequenzen). Unicode als System zur Kodierung aller Zeichen aller bekannten (lebenden oder toten) Schriftsysteme Hendrich & Zhang 19

20 Textkodierung - Unicode Unicode: Versionen und History auch abgekürzt als UCS: Universal Character Set zunehmende Verbreitung (Betriebssysteme, Applikationen) Darstellung erfordert auch entsprechende Schriftarten : europäisch, nahöstlich, indisch 1.0.1: ostasiatisch (Han) akzeptiert als ISO Standard 5.1.0: über Zeichen enthalten ( de.wikipedia.org/wiki/unicode) Hendrich & Zhang 20

21 Textkodierung - Unicode Unicode: Schreibweise ursprüngliche Version nutzt 16-bit pro Zeichen die sogenannte Basic Multilingual Plane Schreibweise hexadezimal als U+xxxx Bereich von U U+FFFF Schreibweise in Java-Strings: \uxxxx z.b. \u03a9 für Ω, \u20a0 für das -Symbol mittlerweile mehr als 2 16 Zeichen Erweiterung um Extended Planes U U+10FFFF Hendrich & Zhang 21

22 Textkodierung - Unicode Unicode: in Webseiten (HTML) HTML-Header informiert über verwendeten Zeichensatz Unterstützung und Darstellung abhängig vom Browser Demo: <html> <head> <META http-equiv="content-type" content="text/html; charset=utf-8"> <title>utf-8 Sampler</title> </head>... Hendrich & Zhang 22

23 Textkodierung - Unicode Unicode: Latin-Zeichen Zeichen im Bereich U+0000 bis U+007F wie ASCII Bereich von U+0100 bis U+017F für Latin-A (europäische Umlaute und Sonderzeichen) viele weitere Sonderzeichen ab U+0180 (Latin-B, Latin-C, usw.) Hendrich & Zhang 23

24 Textkodierung - Unicode Unicode: Mathematische Symbole und Operatoren Vielfältige Auswahl von Symbolen und Operatoren griechisch: Letterlike Symbols: Pfeile: Operatoren: Dingbats: Hendrich & Zhang 24

25 Textkodierung - Unicode Unicode: Chinesisch Varianten: chinesisch, japanisch, koreanisch U+3400 bis U+4BDF U+4E00 bis U+9FCF Hendrich & Zhang 25

26 Textkodierung - Unicode Unicode: Java2D Fontviewer (Sun Microsystems, Java JDK examples: Java2D/Font2DTest) Hendrich & Zhang 26

27 Textkodierung - Unicode Unicode: Repräsentation? 16-bit für jedes Zeichen, bis zu Zeichen schneller Zugriff auf einzelne Zeichen über Arrayzugriffe (Index) aber: doppelter Speicherbedarf gegenüber ASCII/ISO Verwendung u.a. in Java: Datentyp char ab Unicode-3: mehrere Planes zu je Zeichen direkte Repräsentation aller Zeichen erfordert 32-bit/Zeichen vierfacher Speicherbedarf gegenüber ISO bei Dateien ist möglichst kleine Dateigröße wichtig effizientere Kodierung üblich: UTF-16 und UTF-8 Hendrich & Zhang 27

28 Textkodierung - Unicode UTF-8 effiziente Kodierung von westlichen Unicode-Texten Zeichen werden mit variabler Länge kodiert, 1..4-Bytes volle Kompatibilität mit ASCII Hendrich & Zhang 28

29 Textkodierung - Unicode UTF-8: Algorithmus Unicode-Bereich UTF-Kodierung Anzahl (hexadezimal) (binär) Zeichen F 0xxx xxxx FF 110x xxxx 10xx xxxx FFFF 1110 xxxx 10xx xxxx 10xx xxxx FFFF xxx 10xx xxxx 10xx xxxx 10xx xxxx 2 20 untere 128 Zeichen kompatibel mit ASCII Sonderzeichen westlicher Sprachen je zwei Bytes führende Eins markiert Multi-Byte Zeichen Anzahl der führenden Einsen gibt Anzahl der Bytes an Zeichen ergibt sich als Bitstring aus den xxx...x theoretisch bis zu sieben Folgebytes a 6-bit: max Zeichen Hendrich & Zhang 29

30 Textkodierung - Tips und Tricks Sprach-Einstellungen: Locale Locale: die Sprach-Einstellungen und Parameter auch: i18n ( internationalization ) Sprache der Benutzeroberfläche Tastaturlayout/-belegung Zahlen-, Währungs, Datums-, Zeitformate Linux/POSIX: Einstellung über die Locale-Funktionen der Standard C-Library Java: java.util.locale Windows: Einstellung über System/Registry-Schlüssel Hendrich & Zhang 30

31 Textkodierung - Tips und Tricks dos2unix, unix2dos Umwandeln von ASCII-Texten (z.b. Programm-Quelltexte) zwischen DOS/Windows und Unix/Linux Maschinen Umwandeln von a.txt in Ausgabedatei b.txt: dos2unix a.txt -c iso b.txt dos2unix -c ascii a.txt -c iso b.txt dos2unix -c mac a.txt b.txt Umwandeln von Unix nach DOS/Windows, Codepage 850: unix2dos -850 a.txt b.txt Hendrich & Zhang 31

32 Textkodierung - Tips und Tricks iconv Das Schweizer-Messer zur Umwandlung von Textkodierungen. Optionen: -f, --from-code=<encoding> Kodierung der Eingabedatei -t, --to-code=<encoding> Kodierung der Ausgabedatei -l, --list Liste der unterstützten Kodierungen ausgaben -o, --output=<filename> Name der Ausgabedatei Beispiel: iconv -f=iso t=utf-8 -o foo.utf8.txt foo.txt Hendrich & Zhang 32

33 Textkodierung - Literatur Literatur: Vertiefung Java Tutorial: Internationalization Trail java.sun.com/docs/books/tutorial/i18n/index.html Hendrich & Zhang 33

64-040 Modul IP7: Rechnerstrukturen

64-040 Modul IP7: Rechnerstrukturen 64-040 Modul IP7: 4. Textkodierung Norman Hendrich & Jianwei Zhang Universität Hamburg MIN Fakultät, Vogt-Kölln-Str. 30, D-22527 Hamburg {hendrich,zhang}@informatik.uni-hamburg.de WS 2010/2011 Hendrich

Mehr

Einführung in die Programmiertechnik

Einführung in die Programmiertechnik Einführung in die Programmiertechnik Darstellung von Text Plain Text Abstraktion: Text wird durch eine Folge von Symbolen (Buchstaben, Zahlen, Interpunktion) dargestellt Verzicht auf Informationen über

Mehr

Codierung von Text. PC in Betrieb nehmen. Der ASCII-Code (American Standard Code for Information Interchange) ASCII

Codierung von Text. PC in Betrieb nehmen. Der ASCII-Code (American Standard Code for Information Interchange) ASCII Codierung von Text Der ASCII-Code (American Standard Code for Information Interchange) ASCII Zeichenvorrat 1: A,B,C,D...Z,a,b,c z,0,1..9, usw. Zeichenvorrat 2: 0,1 Codetabelle ASCII: (Auszug) A 0100 0001

Mehr

Einführung in die Programmiertechnik

Einführung in die Programmiertechnik 2008 Martin v. Löwis Einführung in die Programmiertechnik Darstellung von Text 2008 Martin v. Löwis 2 Plain Text Abstraktion: Text wird durch eine Folge von Symbolen (Buchstaben, Zahlen, Interpunktion)

Mehr

Modul IP7: Rechnerstrukturen

Modul IP7: Rechnerstrukturen 64-040 Modul IP7: Rechnerstrukturen http://tams.informatik.uni-hamburg.de/ lectures/2011ws/vorlesung/rs Kapitel 7 Andreas Mäder Fakultät für Mathematik, Informatik und Naturwissenschaften Technische Aspekte

Mehr

» ASCII = American Standard Code for Information Interchange.» ASCII ist Standard in Windows und Unix (und Unix-Derivaten).» ASCII ist eigentlich ein

» ASCII = American Standard Code for Information Interchange.» ASCII ist Standard in Windows und Unix (und Unix-Derivaten).» ASCII ist eigentlich ein 1 2 » ASCII = American Standard Code for Information Interchange.» ASCII ist Standard in Windows und Unix (und Unix-Derivaten).» ASCII ist eigentlich ein 7-Bit-Zeichensatz, d. h. das erste Bit jedes Bytes

Mehr

Modul InfB-RS: Rechnerstrukturen

Modul InfB-RS: Rechnerstrukturen A. Mäder 1 MIN-Fakultät Fachbereich Informatik 64-040 Modul InfB-RS: Rechnerstrukturen https://tams.informatik.uni-hamburg.de/ lectures/2018ws/vorlesung/rs Kapitel 5 Andreas Mäder Universität Hamburg Fakultät

Mehr

64-040 Modul IP7: Rechnerstrukturen

64-040 Modul IP7: Rechnerstrukturen 64-040 Modul IP7: 4. Textkodierung Norman Hendrich Universität Hamburg MIN Fakultät, Department Informatik Vogt-Kölln-Str. 30, D-22527 Hamburg hendrich@informatik.uni-hamburg.de WS 2013/2014 Norman Hendrich

Mehr

Modul InfB-RS: Rechnerstrukturen

Modul InfB-RS: Rechnerstrukturen 64-040 Rechnerstrukturen 64-040 Modul InfB-RS: Rechnerstrukturen http://tams.informatik.uni-hamburg.de/ lectures/2014ws/vorlesung/rs Kapitel 7 Andreas Mäder Universität Hamburg Fakultät für Mathematik,

Mehr

Modul InfB-RS: Rechnerstrukturen

Modul InfB-RS: Rechnerstrukturen A. Mäder 1 MIN-Fakultät Fachbereich Informatik 64-040 Modul InfB-RS: Rechnerstrukturen https://tams.informatik.uni-hamburg.de/ lectures/2016ws/vorlesung/rs Kapitel 7 Andreas Mäder Universität Hamburg Fakultät

Mehr

Mehrsprachigkeit. PHP Usergroup Würzburg / Florian Eibeck - Florian Eibeck

Mehrsprachigkeit. PHP Usergroup Würzburg / Florian Eibeck - Florian Eibeck Mehrsprachigkeit PHP Usergroup Würzburg / 30.11.2006 - Warum Mehrsprachigkeit? Die meisten Programmierer machen sich erst Gedanken um Mehrsprachigkeit, wenn ein Problem auftritt. Das Problem sind dann

Mehr

Basisinformationstechnologie I Wintersemester 2011/ Oktober 2011 Grundlagen II

Basisinformationstechnologie I Wintersemester 2011/ Oktober 2011 Grundlagen II Basisinformationstechnologie I Wintersemester 2011/12 19. Oktober 2011 Grundlagen II Themenüberblick Grundlagen II Kurzwiederholung: Information, Daten, Bits, Bitfolgen Datenverarbeitungsgrößen: Bits,

Mehr

7. Übung zur Vorlesung Grundlagen der Informatik

7. Übung zur Vorlesung Grundlagen der Informatik 7. Übung zur Vorlesung Grundlagen der Informatik 13.Interne Darstellung von Daten In der Vorlesung wurde bereits darauf hingewiesen, dass ein Rechner intern lediglich die Zustände 0 (kein Signal liegt

Mehr

Document Engineering

Document Engineering Zeichen- und Fontmanagement - Grundlagen 25. November 2005 Gliederung 1 Zeichen 2 Zeichenkodierung 3 Font 4 Fontmanagement Was ist ein Zeichen? (Schrift-)Zeichen: The smallest component of written language

Mehr

Modul InfB-RS: Rechnerstrukturen

Modul InfB-RS: Rechnerstrukturen A. Mäder 1 MIN-Fakultät Fachbereich Informatik 64-040 Modul InfB-RS: Rechnerstrukturen https://tams.informatik.uni-hamburg.de/ lectures/2017ws/vorlesung/rs Kapitel 7 Andreas Mäder Universität Hamburg Fakultät

Mehr

Grundlagen der Datenverarbeitung

Grundlagen der Datenverarbeitung Grundlagen der Datenverarbeitung Zeichendarstellung Christian Gürtler MultiAugustinum 9. November 2014 Christian Gürtler (MultiAugustinum) Grundlagen der Datenverarbeitung 9. November 2014 1 / 16 Inhaltsverzeichnis

Mehr

2 Repräsentation von elementaren Daten

2 Repräsentation von elementaren Daten 2 Repräsentation von elementaren Daten Alle (elemtaren) Daten wie Zeichen und Zahlen werden im Dualsystem repräsentiert. Das Dualsystem ist ein spezielles B-adisches Zahlensystem, nämlich mit der Basis

Mehr

Hauptspeicherinhalt. Ton. Vektorgrafik Bitmapgrafik Digit. Video. 1. Darstellung von Daten im Rechner. Abb. 1.1: Einteilung der Daten

Hauptspeicherinhalt. Ton. Vektorgrafik Bitmapgrafik Digit. Video. 1. Darstellung von Daten im Rechner. Abb. 1.1: Einteilung der Daten Hauptspeicherinhalt Programmcode Daten numerisch logisch alphanumerisch Ton Grafik Ganze Zahlen Gleitkommazahlen Zeichen Zeichenketten vorzeichenlos mit Vorzeichen Vektorgrafik Bitmapgrafik Digit. Video

Mehr

David Neugebauer, Informationsverarbeitung - Universität zu Köln, Seminar BIT I

David Neugebauer, Informationsverarbeitung - Universität zu Köln, Seminar BIT I David Neugebauer, Informationsverarbeitung - Universität zu Köln, Seminar BIT I Inhaltsverzeichnis 1 Codierung: Zeichensätze 1 1.1 Vorgeschichte......... 1 1.2 Vorüberlegung......... 1 1.3 ASCII. 2 1.4

Mehr

ERA-Zentralübung Maschinenprogrammierung

ERA-Zentralübung Maschinenprogrammierung ERA-Zentralübung Maschinenprogrammierung M. Meyer LRR TU München 25.11.2016 Inhalt Aufgabe 4.1 Aufgabe 4.2 Zeichensätze Aufgabe 4.1 Leuchtbandanzeige/Bargraph Bit Nr: 15 14 13 12 11 10 9 8 7 6 5 4 3 2

Mehr

2 Darstellung von Zahlen und Zeichen

2 Darstellung von Zahlen und Zeichen 2.1 Bits, Byte, Datenworte und Logikpegel 89 2 Darstellung von Zahlen und Zeichen Computer- bzw. Prozessorsysteme führen Transformationen durch, die Eingaben X auf Ausgaben Y abbilden, d.h. Y = f (X ).

Mehr

Rechnerorganisation 12. Vorlesung

Rechnerorganisation 12. Vorlesung Rechnerorganisation 12. Vorlesung Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen

Mehr

5. Darstellung und Verarbeitung von Textzeichen

5. Darstellung und Verarbeitung von Textzeichen 1 5. Darstellung und Verarbeitung von Textzeichen 5.1. Einführung Computer werden nicht nur zum Rechnen mit Zahlen oder zur Verarbeitung aussagenlogischer Werte eingesetzt. Man kann mit ihnen auch Texte

Mehr

alphanumerische Zeichen

alphanumerische Zeichen Darstellung von Text 7 Bit pro Zeichen genügen (2 7 = 128) 26 Kleinbuchstaben 26 Großbuchstaben 10 Ziffern alphanumerische Zeichen Sonderzeichen wie '&', '!', ''' nicht druckbare Steuerzeichen, z.b. -

Mehr

Wie rechnet ein Rechner?

Wie rechnet ein Rechner? 0 Motivation Jörg Roth 2 Wir gehen in dieser Vorlesung der Frage nach Wie rechnet ein Rechner? Als Softwareentwickler könnten wir in einem Programm z.b. folgende Anweisung schreiben: a = a+2*b; Wie wird

Mehr

Rechnerorganisation 12. Vorlesung

Rechnerorganisation 12. Vorlesung Rechnerorganisation 12. Vorlesung Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen

Mehr

Rechnerorganisation 12. Vorlesung

Rechnerorganisation 12. Vorlesung Rechnerorganisation 12. Vorlesung Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen

Mehr

4. Daten. K. Bothe, Institut für Informatik, HU Berlin, GdP, WS 2015/16

4. Daten. K. Bothe, Institut für Informatik, HU Berlin, GdP, WS 2015/16 4. Daten K. Bothe, Institut für Informatik, HU Berlin, GdP, WS 2015/16 Version: 19. Okt. 2015 Was ist Informatik? Begriffsbestimmung (Gegenstand): "Informatik ist die Wissenschaft... der maschinellen Verarbeitung,

Mehr

Grundlagen der Informatik Arbeit mit Zeichen und Zeichenketten

Grundlagen der Informatik Arbeit mit Zeichen und Zeichenketten Grundlagen der Informatik Arbeit mit Zeichen und Zeichenketten Prof. Dr.-Ing. Thomas Wiedemann Fachgebiet Informatik / Mathematik Überblick Textfunktionen Grundlagen der Informatik I - 1 - T.Wiedemann-

Mehr

Informationsdarstellung. 2 Informationsdarstellung. Ziele. 2 Informationsdarstellung Texte. Texte WS 2017/2018

Informationsdarstellung. 2 Informationsdarstellung. Ziele. 2 Informationsdarstellung Texte. Texte WS 2017/2018 Fakultät Informatik Institut Systemarchitektur Professur Datenschutz und Datensicherheit WS 2017/2018 2. Informationsdarstellung Dr.-Ing. Elke Franz Elke.Franz@tu-dresden.de 2 Informationsdarstellung Ziele

Mehr

Motivation und Überblick

Motivation und Überblick Motivation und Überblick Drei große Bereiche der Vorlesung: Darstellung von Zahlen in Rechnern Verarbeitung von Binärdaten auf der Ebene digitaler Schaltungen Programmierung auf Maschinenebene und relativ

Mehr

Unicode und URI Grundvoraussetzung für das Semantic Web von Harald Cichos

Unicode und URI Grundvoraussetzung für das Semantic Web von Harald Cichos Unicode und URI Grundvoraussetzung für das Semantic Web von Harald Cichos Seminar: Semantic Web Wintersemester 2005/2006 Universität Jena Seminarleiter: Prof. Dr. C. Beckstein, Dr. H. Sack, Dipl.-Inform.

Mehr

Unicode und UTF-8. Anna-Katharina Wurst. 28. April 2015. WP5 Angewandte Programmierung

Unicode und UTF-8. Anna-Katharina Wurst. 28. April 2015. WP5 Angewandte Programmierung 28. April 2015 WP5 Angewandte Programmierung David Kaumanns & Sebastian Ebert SoSe 2015 CIS Ludwig-Maximilians-Universität München 2 Inhalt 1 Zeichensätze ASCII ISO 8859-x Unicode 2 Kodierung UTF-8 3 Anwendung

Mehr

Einstieg in die Informatik mit Java

Einstieg in die Informatik mit Java Vorlesung vom 18.4.07, Literalkonstanten Übersicht 1 Ganzzahlige Konstanten 2 Gleitkommakonstanten 3 Zeichenkonstanten 4 Zeichenketten 5 Boolsche Konstanten 6 null Referenz Literalkonstanten Literalkonstanten

Mehr

Einstieg in die Informatik mit Java

Einstieg in die Informatik mit Java 1 / 30 Einstieg in die Informatik mit Java Datentypen Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 30 1 Überblick 2 Ganzzahlige Typen 3 Gleitkommatypen 4 Zeichen, char

Mehr

Einstieg in die Informatik mit Java

Einstieg in die Informatik mit Java 1 / 20 Einstieg in die Informatik mit Java Literalkonstanten Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 20 1 Ganzzahlige Konstanten 2 Gleitkommakonstanten 3 Zeichenkonstanten

Mehr

Rechnerorganisation 12. Vorlesung

Rechnerorganisation 12. Vorlesung Rechnerorganisation 12. Vorlesung Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen

Mehr

Vom Bit zum CBC. Vom Bit zum CBC. Crashkurs - Digitale Verschlüsselungstechnik. ein Vortrag von Marius Schwarz. im Rahmen des KP 2018

Vom Bit zum CBC. Vom Bit zum CBC. Crashkurs - Digitale Verschlüsselungstechnik. ein Vortrag von Marius Schwarz. im Rahmen des KP 2018 Vom Bit zum CBC Vom Bit zum CBC Crashkurs - Digitale Verschlüsselungstechnik ein Vortrag von Marius Schwarz im Rahmen des KP 2018 Vom Bit zum CBC 0 Vom Bit zum CBC Am Anfang war die Null... 0 Vom Bit zum

Mehr

Datentypen printf und scanf. Programmieren in C Dr. Michael Zwick

Datentypen printf und scanf. Programmieren in C Dr. Michael Zwick Datentypen printf und scanf Programmieren in C Dr. Michael Zwick April June 2015 Monday Tuesday Wednesday Thursday Friday 17 20 Apr 21 22 23 24 Arbeitsblatt 1-1 Ausgabe Arbeitsblatt 1 Beginn Tutorium Arbeitsblatt

Mehr

Imperia Unicode- und Multi-Language-HOWTO

Imperia Unicode- und Multi-Language-HOWTO Imperia Unicode- und Multi-Language-HOWTO Konzeption, Implementierung und Pflege mehrsprachiger Web-Sites mit Imperia Guido Flohr Imperia Unicode- und Multi-Language-HOWTO: Konzeption, Implementierung

Mehr

Modul InfB-RS: Rechnerstrukturen

Modul InfB-RS: Rechnerstrukturen A. Mäder 1 MIN-Fakultät Fachbereich Informatik 64-040 Modul InfB-RS: Rechnerstrukturen https://tams.informatik.uni-hamburg.de/ lectures/2017ws/vorlesung/rs Kapitel 4 Andreas Mäder Universität Hamburg Fakultät

Mehr

Rückblick. Addition in der b-adischen Darstellung wie gewohnt. Informatik 1 / Kapitel 2: Grundlagen

Rückblick. Addition in der b-adischen Darstellung wie gewohnt. Informatik 1 / Kapitel 2: Grundlagen Rückblick Addition in der b-adischen Darstellung wie gewohnt 5 0 C E + D 4 2 D = 44 Rückblick Multiplikation in der b-adischen Darstellung wie gewohnt 1 0 1 0 1 0 1 = 45 Rückblick Darstellung negativer

Mehr

Rechnerstrukturen, Teil 1. Vorlesung 4 SWS WS 15/16

Rechnerstrukturen, Teil 1. Vorlesung 4 SWS WS 15/16 Rechnerstrukturen, Teil 1 Vorlesung 4 SWS WS 15/16 Prof. Dr Jian-Jia Chen Dr. Lars Hildebrand Fakultät für Informatik Technische Universität Dortmund lars.hildebrand@tu-.de http://ls1-www.cs.tu-.de Übersicht

Mehr

Technische Informatik (RO)

Technische Informatik (RO) Technische Informatik (RO) Zahlensysteme, Digitale Systeme (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten, Sequentielle Schaltungen (6) Informationskodierung (7,8) Fortsetzung

Mehr

Kapitel 2: Darstellung von Information. Inhalt. Einfache Datentypen (Fortsetzung) Erste Programme (mit Ausgabe) Exkurs: Grammatiken

Kapitel 2: Darstellung von Information. Inhalt. Einfache Datentypen (Fortsetzung) Erste Programme (mit Ausgabe) Exkurs: Grammatiken Kapitel 2: Wintersemester 2005/06 Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Inhalt Einfache Datentypen (Fortsetzung) Erste

Mehr

Skript. EDV Grundlagen

Skript. EDV Grundlagen PAUL-EHRLICH-SCHULE Frankfurt-Höchst Berufs-, Fach-, Fachoberschule Informatik FOS FS Skript EDV Grundlagen Datum: Name: Klasse: 1. Daten die Welt der Bits und Bytes Daten begegnen uns im Alltag in vielfältiger

Mehr

Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung)

Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) Wintersemester 2005/06 Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich Informatik Lehrstuhl

Mehr

Informationsdarstellung. 2 Informationsdarstellung. Ziele. 2 Informationsdarstellung Texte. Texte WS 2018/2019

Informationsdarstellung. 2 Informationsdarstellung. Ziele. 2 Informationsdarstellung Texte. Texte WS 2018/2019 Fakultät Informatik Institut Systemarchitektur Professur Datenschutz und Datensicherheit WS 2018/2019 2. Informationsdarstellung Dr.-Ing. Elke Franz Elke.Franz@tu-dresden.de 2 Informationsdarstellung Ziele

Mehr

Wo sind wir? Übersicht lexikale Struktur von Java

Wo sind wir? Übersicht lexikale Struktur von Java Wo sind wir? Java-Umgebung Lexikale Konventionen Datentypen Kontrollstrukturen Ausdrücke Klassen, Pakete, Schnittstellen JVM Exceptions Java Klassenbibliotheken Ein-/Ausgabe Collections Threads Applets,

Mehr

Auch 2007 wird diese Empfehlung allerdings immer noch nicht universell befolgt.

Auch 2007 wird diese Empfehlung allerdings immer noch nicht universell befolgt. UTF-8 Kodierung UTF-8 (Abk. für 8-bit Unicode Transformation Format) ist die am weitesten verbreitete Kodierung für Unicode Zeichen. Unicode ist ein internationaler Standard, in dem langfristig für jedes

Mehr

Grundlagen der Informatik

Grundlagen der Informatik Grundlagen der Informatik (Wintersemester 2008/2009) Jörg Roth Jörg Roth 2 0 Motivation und Überblick Drei große Bereiche der Vorlesung: Darstellung von Zahlen in Rechnern Verarbeitung von Binärdaten auf

Mehr

Fundamentale Ideen der Informatik PH Weingarten Sommersemester 2014 Paul Libbrecht CC-BY

Fundamentale Ideen der Informatik PH Weingarten Sommersemester 2014 Paul Libbrecht CC-BY Fundamentale Ideen der Informatik PH Weingarten Sommersemester 2014 Paul Libbrecht CC-BY Vorlesung 6: Repräsentationen Themenkarte Verschlüsselung Netzwerk Versionierung Programmverlauf Java Instruktionen

Mehr

Herzlich Willkommen zur Informatik I. Bits und Bytes. Zahlensystem zur Basis 10 (Dezimalzahlen) Warum Zahlensysteme betrachten?

Herzlich Willkommen zur Informatik I. Bits und Bytes. Zahlensystem zur Basis 10 (Dezimalzahlen) Warum Zahlensysteme betrachten? Herzlich Willkommen zur Informatik I Bits und Bytes Zahlen im Computer: Binärzahlen, Hexadezimalzahlen Text im Computer: ASCII-Code und Unicode Quelle: http://www.schulphysik.de/rgb.html Bit: eine binäre

Mehr

Kapitel 3. Codierung von Text (ASCII-Code, Unicode)

Kapitel 3. Codierung von Text (ASCII-Code, Unicode) Kapitel 3 Codierung von Text (ASCII-Code, Unicode) 1 Kapitel 3 Codierung von Text 1. Einleitung 2. ASCII-Code 3. Unicode 2 1. Einleitung Ein digitaler Rechner muss jede Information als eine Folge von 0

Mehr

Merke: Mit jedem zusätzlichen Bit verdoppelt sich die Anzahl der darstellbaren Zahlen bzw. Zustände

Merke: Mit jedem zusätzlichen Bit verdoppelt sich die Anzahl der darstellbaren Zahlen bzw. Zustände 1 2 Merke: Mit jedem zusätzlichen Bit verdoppelt sich die Anzahl der darstellbaren Zahlen bzw. Zustände 3 Die Zuordnung der Himmelsrichtungen zu den dreistelligen Binärzahlen, also Norden 000 Süden 001

Mehr

Ein- und Ausgabe. Buchstaben als Zahlen: Kodierung. Kodierungsstandards. ASCII-Zeichensatz-Tabelle

Ein- und Ausgabe. Buchstaben als Zahlen: Kodierung. Kodierungsstandards. ASCII-Zeichensatz-Tabelle Ein- und Ausgabe Übersicht Wie werden Schriftzeichen kodiert? Ein- und Ausgabe von ASCII-Zeichen Eingabe: get/1, get_code/1 Ausgabe: put_code/1, nl/0, tab/1 Konvertierung: name/2, atom_codes/2, number_codes/2

Mehr

Daten und Informationen

Daten und Informationen Daten und Informationen Vorlesung vom 17. Oktober 2016 Birger Krägelin Inhalt Repräsentation und Abstraktion Zahlendarstellung Stellenwertsysteme Rechnen mit Zahlen Gleitkommazahlen, Rundungsproblematik

Mehr

Daten und Informationen

Daten und Informationen Daten und Informationen Vorlesung vom 23. Oktober 2017 Birger Krägelin Inhalt Repräsentation und Abstraktion Zahlendarstellung Stellenwertsysteme Rechnen mit Zahlen Gleitkommazahlen, Rundungsproblematik

Mehr

U+1F4A9 = What every Programmer should know about Unicode. 2. Semester Medieninformatik. Prof. Dr.-Ing. Carsten Bormann cabo@tzi.

U+1F4A9 = What every Programmer should know about Unicode. 2. Semester Medieninformatik. Prof. Dr.-Ing. Carsten Bormann cabo@tzi. U+1F4A9 = What every Programmer should know about Unicode 2. Semester Medieninformatik Prof. Dr.-Ing. Carsten Bormann cabo@tzi.de 1 Textuelle Information Zeichen Primäre Informationsquelle im Web: Text

Mehr

Wintersemester Maschinenbau und Kunststofftechnik. Informatik. Tobias Wolf Seite 1 von 11

Wintersemester Maschinenbau und Kunststofftechnik. Informatik. Tobias Wolf  Seite 1 von 11 Kapitel 11 Zeichenverarbeitung Seite 1 von 11 Zeichenverarbeitung - Jedem Zeichen ist ein Zahlencode zugeordnet. - Dadurch wird ermöglicht, zwischen verschiedenen Systemen Texte auszutauschen. - Es werden

Mehr

Programmieren. INE1, Montag M. Thaler, Office TG208. ZHAW, M. Thaler, K. Rege, G. Burkert

Programmieren. INE1, Montag M. Thaler, Office TG208.  ZHAW, M. Thaler, K. Rege, G. Burkert Programmieren INE, Montag M. Thaler, tham@zhaw.ch Office TG208 http://www.zhaw.ch/~tham Um was geht es? Problemstellung Algorithmus(Vorgehen) Implementierung 2 Lernziele Siekönnen erklären, was "Programmieren"

Mehr

2 Die Codierung Sehen wir uns mal den vereinfachten Weg der Informationen von der Tastatur aus bis zum Filesystem an:

2 Die Codierung Sehen wir uns mal den vereinfachten Weg der Informationen von der Tastatur aus bis zum Filesystem an: Name Klasse Datum 1 Allgemeines Daten werden bekanntermaßen im Computer in einem flüchtigen Speicher, dem RAM verarbeitet. Insofern gehen sie verloren, sobald der Rechner ausgeschaltet wird. Weiterhin

Mehr

Rechnerstrukturen. Michael Engel und Peter Marwedel. Sommer TU Dortmund, Fakultät für Informatik

Rechnerstrukturen. Michael Engel und Peter Marwedel. Sommer TU Dortmund, Fakultät für Informatik Rechnerstrukturen Michael Engel und Peter Marwedel TU Dortmund, Fakultät für Informatik Sommer 2014 Folien a. d. Basis von Materialien von Gernot Fink und Thomas Jansen 10. April 2014 1/37 1 Repräsentation

Mehr

Einführung in die Programmierung Wintersemester 2008/09

Einführung in die Programmierung Wintersemester 2008/09 Einführung in die Programmierung Wintersemester 2008/09 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund : Darstellung von Information Inhalt Einfache Datentypen

Mehr

Informatik. Wiederholung Felder (Arrays), string. Vorlesung

Informatik. Wiederholung Felder (Arrays), string. Vorlesung Informatik Vorlesung 04 Wiederholung Felder (Arrays), string 19. November 2018 WiSe 2018 FB Ing - SB Umwelttechnik und Dienstleistung - Informatik Thomas Hoch 1 Ein C++ Programm: Wiederholung #include

Mehr

8. Ausdrücke, Operatoren (einfache Typen)

8. Ausdrücke, Operatoren (einfache Typen) 8. Ausdrücke, Operatoren (einfache Typen) Teil 2 Java-Beispiel: Unicode.java K. Bothe, Institut für Informatik, HU Berlin, GdP, WS 2015/16 Version: 16. Nov. 2015 2 Typumwandlung Cast-Operator 3 Unterschiedliche

Mehr

Linux I II III Res WN/TT NLTK XML Weka E Rechte Encoding. Linux III. 3 Linux III. Rechte Encoding. Ressourcen-Vorkurs

Linux I II III Res WN/TT NLTK XML Weka E Rechte Encoding. Linux III. 3 Linux III. Rechte Encoding. Ressourcen-Vorkurs Linux III 3 Linux III Rechte Encoding Rechte I In der Unix-Welt gibt es drei wichtige Rechte: Read (r) Eine Datei lesen bzw. den Inhalt eines Verzeichnisses anzeigen Write (w) Eine Datei ändern bzw. eine

Mehr

Linux I II III Res WN/TT Rechte Encoding. Linux III. 3 Linux III. Rechte Encoding. Ressourcen-Vorkurs

Linux I II III Res WN/TT Rechte Encoding. Linux III. 3 Linux III. Rechte Encoding. Ressourcen-Vorkurs Linux III 3 Linux III Rechte Encoding Rechte I In der Unix-Welt gibt es drei wichtige Rechte: Read (r) Eine Datei lesen bzw. den Inhalt eines Verzeichnisses anzeigen Write (w) Eine Datei ändern bzw. eine

Mehr

8. Ausdrücke, Operatoren (einfache Typen)

8. Ausdrücke, Operatoren (einfache Typen) 8. Ausdrücke, Operatoren (einfache Typen) Typumwandlung Cast-Operator Teil 2 Java-Beispiel: Unicode.java Version: 16. Nov. 2015 Unterschiedliche Typen Typumwandlung: Übersicht Zuweisung x = y; Ausdruck

Mehr

Java-Applikationen (Java-Programme)

Java-Applikationen (Java-Programme) Java-Applikationen (Java-Programme) Eine erste Applikation: 1 2 3 4 5 6 7 8 9 10 // Quelltext HalloWelt.java // Programm gibt den Text Hallo Welt aus public class HalloWelt public static void main(string[]

Mehr

Programmierkurs C++ Variablen und Datentypen

Programmierkurs C++ Variablen und Datentypen Programmierkurs C++ Variablen und Datentypen Prof. Dr. Stefan Fischer Institut für Telematik, Universität zu Lübeck http://www.itm.uni-luebeck.de/people/fischer #2 Überblick Welche Datentypen gibt es in

Mehr

Rechnerorganisation. IHS 2015/2016 H.-D. Wuttke, K. Henke

Rechnerorganisation. IHS 2015/2016 H.-D. Wuttke, K. Henke Rechnerorganisation Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen (9) Rechneraufbau

Mehr

Rechnerorganisation. IHS 2018/2019 H.-D. Wuttke, K. Henke

Rechnerorganisation. IHS 2018/2019 H.-D. Wuttke, K. Henke Rechnerorganisation Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen (9) Rechneraufbau

Mehr

4 Lokalisierung undinternationalisierung

4 Lokalisierung undinternationalisierung 4 Lokalisierung undinternationalisierung In diesemkapitel lernen Sie ein Linux-System für einen Benutzerineiner anderen Sprache einzurichten. Dadurch, dass das Internet die Erde zu einem globalen Dorf

Mehr

Klaus Schild, XML Clearinghouse Aufbau von XML- Dokumenten

Klaus Schild, XML Clearinghouse Aufbau von XML- Dokumenten Aufbau von XML- Dokumenten Lernziele Wie ist ein XML-Dokument aufgebaut? Was sind Elemente und was sind Attribute? Wann sollten Attribute und wann Elemente verwendet werden? Elemente ist ein Anfangs-Tag

Mehr

Basisinformationstechnologie I

Basisinformationstechnologie I Basisinformationstechnologie I Wintersemester 2014/15 29. Oktober 2014 Grundlagen II Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // jan.wieners@uni-koeln.de

Mehr

Java Einführung Objekt-Datentypen und Strings. Kapitel 8 und 9

Java Einführung Objekt-Datentypen und Strings. Kapitel 8 und 9 Java Einführung Objekt-Datentypen und Strings Kapitel 8 und 9 Inhalt Was sind Objekt-Datentypen Sonderheiten bei Zuweisung und Vergleich Zeichenketten (Strings) Zeichencodes Char, Char-Arrays und Strings

Mehr

Unicode und Zeichensätze

Unicode und Zeichensätze 02 Unicode G. Görz, J. Schneeberger Lehrstuhl Informatik 8 (KI) josef.schneeberger@fh-deggendorf.de! Unicode und Zeichensätze Unter Mitarbeit von Olaf Winterstein (Greifswald 08) 2 Was ist Unicode? Internationaler

Mehr

Unicode-Integration in FrameMaker?

Unicode-Integration in FrameMaker? Unicode-Integration in FrameMaker? tekom-tagung 22.-23.4.2004, Aachen FrameMaker Tutorial TF6 Dipl.-Ing. Michael Müller-Hillebrand, Erlangen Unicode-Integration in FrameMaker?, 1/20 Was bedeutet Unicode-fähig?

Mehr

Einheit Datentypen in der Programmiersprache C Schwerpunkt: Elementare (arithmetische) Datentypen

Einheit Datentypen in der Programmiersprache C Schwerpunkt: Elementare (arithmetische) Datentypen Einheit Datentypen in der Programmiersprache C Schwerpunkt: Elementare (arithmetische) Datentypen Kurs C/C++ Programmierung, WS 2008/2009 Dipl.Inform. R. Spurk Arbeitsgruppe Programmierung FR 6.2 Informatik

Mehr

Hier finden Sie eine Zusammenfassung der Operatoren von C++ und ihre Bezeichnung bzw. Verwendung. UND ODER. zusammengesetzte Zuweisung Bitoperatoren

Hier finden Sie eine Zusammenfassung der Operatoren von C++ und ihre Bezeichnung bzw. Verwendung. UND ODER. zusammengesetzte Zuweisung Bitoperatoren Übersichtstabellen Operatoren in C++ und ihre Bedeutung (Übersicht) Hier finden Sie eine Zusammenfassung der Operatoren von C++ und ihre Bezeichnung bzw. Verwendung. Operator Bezeichnung Arithmetische

Mehr

Multimediale Werkzeuge. Textformate, Medienobjekte

Multimediale Werkzeuge. Textformate, Medienobjekte Multimediale Werkzeuge Textformate, Medienobjekte Geschichte/ Eigenschaften von Textformaten Gebräuchliche Textformate, z.b. für HTML Files, Programme: ASCII (American Standard Code for Inform. Interchange)

Mehr

03 XML Grundlagen. Manuel Burghardt Lehrstuhl für Medieninformatik

03 XML Grundlagen. Manuel Burghardt Lehrstuhl für Medieninformatik Markupsprachen 03 XML Grundlagen Manuel Burghardt Warum XML? Nachteile von SGML und HTML SGML ist für die meisten Aufgaben zu komplex, und dadurch nicht sofort einsetzbar (komplexe Metasprache) HTML ist

Mehr

Encodings im LMS der Berufsfachschule BBB. Michael Schneider

Encodings im LMS der Berufsfachschule BBB. Michael Schneider Encodings im LMS der Berufsfachschule BBB Michael Schneider michael.schneider@bbbaden.ch 31. Juli 2007 Inhaltsverzeichnis 1 Encodings 1 1.1 ASCII........................................... 1 1.2 8-Bit

Mehr

1 Funktionsaufrufe. Informatik I: Einführung in die Programmierung 4. Funktionen: Aufrufe und Definitionen. Funktionsaufrufe

1 Funktionsaufrufe. Informatik I: Einführung in die Programmierung 4. Funktionen: Aufrufe und Definitionen. Funktionsaufrufe 1 Funktionsaufrufe Informatik I: Einführung in die Programmierung 4. : und en Albert-Ludwigs-Universität Freiburg Bernhard Nebel 21./25. Oktober 2016 21./25. Oktober 2016 B. Nebel Info I 3 / 36 Funktionsaufrufe

Mehr

Wiederholung, Abbruch von Schleifen, switch-anweisung Datentypen, char, formatierte Ausgabe

Wiederholung, Abbruch von Schleifen, switch-anweisung Datentypen, char, formatierte Ausgabe Informatik Vorlesung 03b Wiederholung, Abbruch von Schleifen, switch-anweisung Datentypen, char, formatierte Ausgabe 12. November 2018 WiSe 2018 FB Ing - SB Umwelttechnik und Dienstleistung - Informatik

Mehr

Grundlagen der Informationstechnik

Grundlagen der Informationstechnik Grundlagen der Informationstechnik 2 Um die Funktionsweise der Computernetze zu verstehen, ist ein grundlegendes Verständnis der Informationstechnik (IT) nötig. Bei diesen Grundlagen handelt es sich um

Mehr

Informationsdarstellung 2.2

Informationsdarstellung 2.2 Beispiele für die Gleitkommadarstellung (mit Basis b = 2): 0,5 = 0,5 2 0-17,0 = - 0,53125 2 5 1,024 = 0,512 2 1-0,001 = - 0,512 2-9 3,141592... = 0,785398... 2 2 n = +/- m 2 e Codierung in m Codierung

Mehr