Modul IP7: Rechnerstrukturen
|
|
- Etta Feld
- vor 5 Jahren
- Abrufe
Transkript
1 Modul IP7: Rechnerstrukturen 4. Textkodierung Norman Hendrich & Jianwei Zhang MIN Fakultät, Vogt-Kölln-Str. 30, D Hamburg WS 2009/2010 Hendrich & Zhang 1
2 Inhalt Textkodierung Adhoc-Kodierungen ASCII und ISO-8859 Unicode Tips und Tricks Literatur Hendrich & Zhang 2
3 Textkodierung Darstellung von Texten Ad-Hoc Kodierungen Flaggen-Alphabet Braille-Code Morse-Code ASCII und ISO Unicode Hendrich & Zhang 3
4 Textkodierung Wiederholung: Zeichenkette Zeichenkette (engl. string): Eine Folge von Zeichen Wort (engl. word): Eine Folge von Zeichen, die in einem gegebenen Zusammenhang als Einheit bezeichnet wird. Worte mit 8 Bit werden als Byte bezeichnet. Stelle (engl. position): Die Lage/Position eines Zeichens innerhalb einer Zeichenkette. Beispiel s = H e l l o, w o r l d! Hendrich & Zhang 4
5 Textkodierung - Adhoc-Kodierungen Flaggen-Signale (Bauer & Goos, 1981) Hendrich & Zhang 5
6 Textkodierung - Adhoc-Kodierungen Flaggen-Alphabet (Bauer & Goos, 1981) Hendrich & Zhang 6
7 Textkodierung - Adhoc-Kodierungen Braille: Blindenschrift Symbole als 2x3 Matrix (geprägte Punkte) Erweiterung auf 2x4 Matrix (für Computer) bis zu 64 (256) mögliche Symbole diverse Varianten ein Symbol pro Buchstabe ein Symbol pro Silbe Kurzschrift/Steno Hendrich & Zhang 7
8 Textkodierung - Adhoc-Kodierungen Morse-Code Hendrich & Zhang 8
9 Textkodierung - Adhoc-Kodierungen Morse-Code: Eindeutigkeit? Punkt steht für kurzen Ton, Strich für langen Ton bestimmte Morse-Sequenzen sind mehrdeutig Pause zwischen den Symbolen notwendig Hendrich & Zhang 9
10 Textkodierung - Adhoc-Kodierungen Morse-Code: Baumdarstellung (Ausschnitt) Anordnung der Symbole entsprechend ihrer Kodierung Hendrich & Zhang 10
11 Textkodierung - ASCII und ISO-8859 ASCII American Standard Code for Information Interchange eingeführt 1967, aktualisiert 1986: ANSI X viele Jahre der dominierende Code für Textdateien alle Zeichen einer typischen Schreibmaschine Erweiterung des früheren 5-bit Fernschreiber-Codes 7-bit pro Zeichen, 128 Zeichen insgesamt 95 druckbare Zeichen: Buchstaben, Ziffern, Sonderzeichen (Kodierung im Bereich 21..7E) 33 Steuerzeichen (engl: control characters) (0..1F,7F) Hendrich & Zhang 11
12 Textkodierung - ASCII und ISO-8859 ASCII: Codetabelle SP = Leerzeichen, CR = carriage-return, LF = line-feed ESC = escape, DEL = delete, BEL = bell, usw. Hendrich & Zhang 12
13 Textkodierung - ASCII und ISO-8859 ISO-8859 Familie Erweiterung von ASCII um Sonderzeichen und Umlaute 8-bit Kodierung: bis max. 256 Zeichen darstellbar Latin-1: Westeuropäisch Latin-2: Mitteleuropäisch Latin-3: Südeuropäisch Latin-4: Baltisch -5: Kyrillisch -6: Arabisch -7: Griechisch usw. immer noch nicht für mehrsprachige Dokumente geeignet Hendrich & Zhang 13
14 Textkodierung - ASCII und ISO-8859 ISO Erweiterung von ASCII für westeuropäische Sprachen Hendrich & Zhang 14
15 Textkodierung - ASCII und ISO-8859 ISO Erweiterung von ASCII für slawische Sprachen Hendrich & Zhang 15
16 Textkodierung - ASCII und ISO-8859 Microsoft: Codepage 437 Zeichensatz des IBM-PC ab 1981 Erweiterung von ASCII auf einen 8-bit Code einige Umlaute (westeuropäisch) Graphiksymbole Details: verbesserte Version: Codepage 850, 858 ( -Symbol an 0xD5) Codepage 1252 entspricht ISO Sonderzeichen liegen an anderen Positionen als bei ISO-8859 Hendrich & Zhang 16
17 Textkodierung - ASCII und ISO-8859 Windows: Codepage 850 Hendrich & Zhang 17
18 Textkodierung - ASCII und ISO-8859 Austausch von Texten? die meisten gängigen Codes (abwärts-) kompatibel mit ASCII unterschiedliche Kodierung für Umlaute (soweit vorhanden) unterschiedliche Kodierung der Sonderzeichen Unterschiedliche Konvention für Zeilenende DOS/Windows: CR/LF (0D 0A) Unix/Linux: LF Mac OS 9: CR Konverter-Tools: dos2unix, unix2dos, iconv Hendrich & Zhang 18
19 Textkodierung - Unicode Unicode: Motivation zunehmende Vernetzung und Globalisierung internationaler Datenaustausch? Erstellung mehrsprachiger Dokumente? Unterstützung orientalischer oder asiatischer Sprachen? ASCII oder ISO reicht nicht aus temporäre Lösungen konnten sich nicht durchsetzen, z.b: ISO-2022: Umschaltung zwischen mehreren Zeichensätzen durch Spezialbefehle (Escapesequenzen). Unicode als System zur Kodierung aller Zeichen aller bekannten (lebenden oder toten) Schriftsysteme Hendrich & Zhang 19
20 Textkodierung - Unicode Unicode: Versionen und History auch abgekürzt als UCS: Universal Character Set zunehmende Verbreitung (Betriebssysteme, Applikationen) Darstellung erfordert auch entsprechende Schriftarten : europäisch, nahöstlich, indisch 1.0.1: ostasiatisch (Han) akzeptiert als ISO Standard 5.1.0: über Zeichen enthalten ( de.wikipedia.org/wiki/unicode) Hendrich & Zhang 20
21 Textkodierung - Unicode Unicode: Schreibweise ursprüngliche Version nutzt 16-bit pro Zeichen die sogenannte Basic Multilingual Plane Schreibweise hexadezimal als U+xxxx Bereich von U U+FFFF Schreibweise in Java-Strings: \uxxxx z.b. \u03a9 für Ω, \u20a0 für das -Symbol mittlerweile mehr als 2 16 Zeichen Erweiterung um Extended Planes U U+10FFFF Hendrich & Zhang 21
22 Textkodierung - Unicode Unicode: in Webseiten (HTML) HTML-Header informiert über verwendeten Zeichensatz Unterstützung und Darstellung abhängig vom Browser Demo: <html> <head> <META http-equiv="content-type" content="text/html; charset=utf-8"> <title>utf-8 Sampler</title> </head>... Hendrich & Zhang 22
23 Textkodierung - Unicode Unicode: Latin-Zeichen Zeichen im Bereich U+0000 bis U+007F wie ASCII Bereich von U+0100 bis U+017F für Latin-A (europäische Umlaute und Sonderzeichen) viele weitere Sonderzeichen ab U+0180 (Latin-B, Latin-C, usw.) Hendrich & Zhang 23
24 Textkodierung - Unicode Unicode: Mathematische Symbole und Operatoren Vielfältige Auswahl von Symbolen und Operatoren griechisch: Letterlike Symbols: Pfeile: Operatoren: Dingbats: Hendrich & Zhang 24
25 Textkodierung - Unicode Unicode: Chinesisch Varianten: chinesisch, japanisch, koreanisch U+3400 bis U+4BDF U+4E00 bis U+9FCF Hendrich & Zhang 25
26 Textkodierung - Unicode Unicode: Java2D Fontviewer (Sun Microsystems, Java JDK examples: Java2D/Font2DTest) Hendrich & Zhang 26
27 Textkodierung - Unicode Unicode: Repräsentation? 16-bit für jedes Zeichen, bis zu Zeichen schneller Zugriff auf einzelne Zeichen über Arrayzugriffe (Index) aber: doppelter Speicherbedarf gegenüber ASCII/ISO Verwendung u.a. in Java: Datentyp char ab Unicode-3: mehrere Planes zu je Zeichen direkte Repräsentation aller Zeichen erfordert 32-bit/Zeichen vierfacher Speicherbedarf gegenüber ISO bei Dateien ist möglichst kleine Dateigröße wichtig effizientere Kodierung üblich: UTF-16 und UTF-8 Hendrich & Zhang 27
28 Textkodierung - Unicode UTF-8 effiziente Kodierung von westlichen Unicode-Texten Zeichen werden mit variabler Länge kodiert, 1..4-Bytes volle Kompatibilität mit ASCII Hendrich & Zhang 28
29 Textkodierung - Unicode UTF-8: Algorithmus Unicode-Bereich UTF-Kodierung Anzahl (hexadezimal) (binär) Zeichen F 0xxx xxxx FF 110x xxxx 10xx xxxx FFFF 1110 xxxx 10xx xxxx 10xx xxxx FFFF xxx 10xx xxxx 10xx xxxx 10xx xxxx 2 20 untere 128 Zeichen kompatibel mit ASCII Sonderzeichen westlicher Sprachen je zwei Bytes führende Eins markiert Multi-Byte Zeichen Anzahl der führenden Einsen gibt Anzahl der Bytes an Zeichen ergibt sich als Bitstring aus den xxx...x theoretisch bis zu sieben Folgebytes a 6-bit: max Zeichen Hendrich & Zhang 29
30 Textkodierung - Tips und Tricks Sprach-Einstellungen: Locale Locale: die Sprach-Einstellungen und Parameter auch: i18n ( internationalization ) Sprache der Benutzeroberfläche Tastaturlayout/-belegung Zahlen-, Währungs, Datums-, Zeitformate Linux/POSIX: Einstellung über die Locale-Funktionen der Standard C-Library Java: java.util.locale Windows: Einstellung über System/Registry-Schlüssel Hendrich & Zhang 30
31 Textkodierung - Tips und Tricks dos2unix, unix2dos Umwandeln von ASCII-Texten (z.b. Programm-Quelltexte) zwischen DOS/Windows und Unix/Linux Maschinen Umwandeln von a.txt in Ausgabedatei b.txt: dos2unix a.txt -c iso b.txt dos2unix -c ascii a.txt -c iso b.txt dos2unix -c mac a.txt b.txt Umwandeln von Unix nach DOS/Windows, Codepage 850: unix2dos -850 a.txt b.txt Hendrich & Zhang 31
32 Textkodierung - Tips und Tricks iconv Das Schweizer-Messer zur Umwandlung von Textkodierungen. Optionen: -f, --from-code=<encoding> Kodierung der Eingabedatei -t, --to-code=<encoding> Kodierung der Ausgabedatei -l, --list Liste der unterstützten Kodierungen ausgaben -o, --output=<filename> Name der Ausgabedatei Beispiel: iconv -f=iso t=utf-8 -o foo.utf8.txt foo.txt Hendrich & Zhang 32
33 Textkodierung - Literatur Literatur: Vertiefung Java Tutorial: Internationalization Trail java.sun.com/docs/books/tutorial/i18n/index.html Hendrich & Zhang 33
64-040 Modul IP7: Rechnerstrukturen
64-040 Modul IP7: 4. Textkodierung Norman Hendrich & Jianwei Zhang Universität Hamburg MIN Fakultät, Vogt-Kölln-Str. 30, D-22527 Hamburg {hendrich,zhang}@informatik.uni-hamburg.de WS 2010/2011 Hendrich
MehrEinführung in die Programmiertechnik
Einführung in die Programmiertechnik Darstellung von Text Plain Text Abstraktion: Text wird durch eine Folge von Symbolen (Buchstaben, Zahlen, Interpunktion) dargestellt Verzicht auf Informationen über
MehrCodierung von Text. PC in Betrieb nehmen. Der ASCII-Code (American Standard Code for Information Interchange) ASCII
Codierung von Text Der ASCII-Code (American Standard Code for Information Interchange) ASCII Zeichenvorrat 1: A,B,C,D...Z,a,b,c z,0,1..9, usw. Zeichenvorrat 2: 0,1 Codetabelle ASCII: (Auszug) A 0100 0001
MehrEinführung in die Programmiertechnik
2008 Martin v. Löwis Einführung in die Programmiertechnik Darstellung von Text 2008 Martin v. Löwis 2 Plain Text Abstraktion: Text wird durch eine Folge von Symbolen (Buchstaben, Zahlen, Interpunktion)
MehrModul IP7: Rechnerstrukturen
64-040 Modul IP7: Rechnerstrukturen http://tams.informatik.uni-hamburg.de/ lectures/2011ws/vorlesung/rs Kapitel 7 Andreas Mäder Fakultät für Mathematik, Informatik und Naturwissenschaften Technische Aspekte
Mehr» ASCII = American Standard Code for Information Interchange.» ASCII ist Standard in Windows und Unix (und Unix-Derivaten).» ASCII ist eigentlich ein
1 2 » ASCII = American Standard Code for Information Interchange.» ASCII ist Standard in Windows und Unix (und Unix-Derivaten).» ASCII ist eigentlich ein 7-Bit-Zeichensatz, d. h. das erste Bit jedes Bytes
MehrModul InfB-RS: Rechnerstrukturen
A. Mäder 1 MIN-Fakultät Fachbereich Informatik 64-040 Modul InfB-RS: Rechnerstrukturen https://tams.informatik.uni-hamburg.de/ lectures/2018ws/vorlesung/rs Kapitel 5 Andreas Mäder Universität Hamburg Fakultät
Mehr64-040 Modul IP7: Rechnerstrukturen
64-040 Modul IP7: 4. Textkodierung Norman Hendrich Universität Hamburg MIN Fakultät, Department Informatik Vogt-Kölln-Str. 30, D-22527 Hamburg hendrich@informatik.uni-hamburg.de WS 2013/2014 Norman Hendrich
MehrModul InfB-RS: Rechnerstrukturen
64-040 Rechnerstrukturen 64-040 Modul InfB-RS: Rechnerstrukturen http://tams.informatik.uni-hamburg.de/ lectures/2014ws/vorlesung/rs Kapitel 7 Andreas Mäder Universität Hamburg Fakultät für Mathematik,
MehrModul InfB-RS: Rechnerstrukturen
A. Mäder 1 MIN-Fakultät Fachbereich Informatik 64-040 Modul InfB-RS: Rechnerstrukturen https://tams.informatik.uni-hamburg.de/ lectures/2016ws/vorlesung/rs Kapitel 7 Andreas Mäder Universität Hamburg Fakultät
MehrMehrsprachigkeit. PHP Usergroup Würzburg / Florian Eibeck - Florian Eibeck
Mehrsprachigkeit PHP Usergroup Würzburg / 30.11.2006 - Warum Mehrsprachigkeit? Die meisten Programmierer machen sich erst Gedanken um Mehrsprachigkeit, wenn ein Problem auftritt. Das Problem sind dann
MehrBasisinformationstechnologie I Wintersemester 2011/ Oktober 2011 Grundlagen II
Basisinformationstechnologie I Wintersemester 2011/12 19. Oktober 2011 Grundlagen II Themenüberblick Grundlagen II Kurzwiederholung: Information, Daten, Bits, Bitfolgen Datenverarbeitungsgrößen: Bits,
Mehr7. Übung zur Vorlesung Grundlagen der Informatik
7. Übung zur Vorlesung Grundlagen der Informatik 13.Interne Darstellung von Daten In der Vorlesung wurde bereits darauf hingewiesen, dass ein Rechner intern lediglich die Zustände 0 (kein Signal liegt
MehrDocument Engineering
Zeichen- und Fontmanagement - Grundlagen 25. November 2005 Gliederung 1 Zeichen 2 Zeichenkodierung 3 Font 4 Fontmanagement Was ist ein Zeichen? (Schrift-)Zeichen: The smallest component of written language
MehrModul InfB-RS: Rechnerstrukturen
A. Mäder 1 MIN-Fakultät Fachbereich Informatik 64-040 Modul InfB-RS: Rechnerstrukturen https://tams.informatik.uni-hamburg.de/ lectures/2017ws/vorlesung/rs Kapitel 7 Andreas Mäder Universität Hamburg Fakultät
MehrGrundlagen der Datenverarbeitung
Grundlagen der Datenverarbeitung Zeichendarstellung Christian Gürtler MultiAugustinum 9. November 2014 Christian Gürtler (MultiAugustinum) Grundlagen der Datenverarbeitung 9. November 2014 1 / 16 Inhaltsverzeichnis
Mehr2 Repräsentation von elementaren Daten
2 Repräsentation von elementaren Daten Alle (elemtaren) Daten wie Zeichen und Zahlen werden im Dualsystem repräsentiert. Das Dualsystem ist ein spezielles B-adisches Zahlensystem, nämlich mit der Basis
MehrHauptspeicherinhalt. Ton. Vektorgrafik Bitmapgrafik Digit. Video. 1. Darstellung von Daten im Rechner. Abb. 1.1: Einteilung der Daten
Hauptspeicherinhalt Programmcode Daten numerisch logisch alphanumerisch Ton Grafik Ganze Zahlen Gleitkommazahlen Zeichen Zeichenketten vorzeichenlos mit Vorzeichen Vektorgrafik Bitmapgrafik Digit. Video
MehrDavid Neugebauer, Informationsverarbeitung - Universität zu Köln, Seminar BIT I
David Neugebauer, Informationsverarbeitung - Universität zu Köln, Seminar BIT I Inhaltsverzeichnis 1 Codierung: Zeichensätze 1 1.1 Vorgeschichte......... 1 1.2 Vorüberlegung......... 1 1.3 ASCII. 2 1.4
MehrERA-Zentralübung Maschinenprogrammierung
ERA-Zentralübung Maschinenprogrammierung M. Meyer LRR TU München 25.11.2016 Inhalt Aufgabe 4.1 Aufgabe 4.2 Zeichensätze Aufgabe 4.1 Leuchtbandanzeige/Bargraph Bit Nr: 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Mehr2 Darstellung von Zahlen und Zeichen
2.1 Bits, Byte, Datenworte und Logikpegel 89 2 Darstellung von Zahlen und Zeichen Computer- bzw. Prozessorsysteme führen Transformationen durch, die Eingaben X auf Ausgaben Y abbilden, d.h. Y = f (X ).
MehrRechnerorganisation 12. Vorlesung
Rechnerorganisation 12. Vorlesung Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen
Mehr5. Darstellung und Verarbeitung von Textzeichen
1 5. Darstellung und Verarbeitung von Textzeichen 5.1. Einführung Computer werden nicht nur zum Rechnen mit Zahlen oder zur Verarbeitung aussagenlogischer Werte eingesetzt. Man kann mit ihnen auch Texte
Mehralphanumerische Zeichen
Darstellung von Text 7 Bit pro Zeichen genügen (2 7 = 128) 26 Kleinbuchstaben 26 Großbuchstaben 10 Ziffern alphanumerische Zeichen Sonderzeichen wie '&', '!', ''' nicht druckbare Steuerzeichen, z.b. -
MehrWie rechnet ein Rechner?
0 Motivation Jörg Roth 2 Wir gehen in dieser Vorlesung der Frage nach Wie rechnet ein Rechner? Als Softwareentwickler könnten wir in einem Programm z.b. folgende Anweisung schreiben: a = a+2*b; Wie wird
MehrRechnerorganisation 12. Vorlesung
Rechnerorganisation 12. Vorlesung Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen
MehrRechnerorganisation 12. Vorlesung
Rechnerorganisation 12. Vorlesung Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen
Mehr4. Daten. K. Bothe, Institut für Informatik, HU Berlin, GdP, WS 2015/16
4. Daten K. Bothe, Institut für Informatik, HU Berlin, GdP, WS 2015/16 Version: 19. Okt. 2015 Was ist Informatik? Begriffsbestimmung (Gegenstand): "Informatik ist die Wissenschaft... der maschinellen Verarbeitung,
MehrGrundlagen der Informatik Arbeit mit Zeichen und Zeichenketten
Grundlagen der Informatik Arbeit mit Zeichen und Zeichenketten Prof. Dr.-Ing. Thomas Wiedemann Fachgebiet Informatik / Mathematik Überblick Textfunktionen Grundlagen der Informatik I - 1 - T.Wiedemann-
MehrInformationsdarstellung. 2 Informationsdarstellung. Ziele. 2 Informationsdarstellung Texte. Texte WS 2017/2018
Fakultät Informatik Institut Systemarchitektur Professur Datenschutz und Datensicherheit WS 2017/2018 2. Informationsdarstellung Dr.-Ing. Elke Franz Elke.Franz@tu-dresden.de 2 Informationsdarstellung Ziele
MehrMotivation und Überblick
Motivation und Überblick Drei große Bereiche der Vorlesung: Darstellung von Zahlen in Rechnern Verarbeitung von Binärdaten auf der Ebene digitaler Schaltungen Programmierung auf Maschinenebene und relativ
MehrUnicode und URI Grundvoraussetzung für das Semantic Web von Harald Cichos
Unicode und URI Grundvoraussetzung für das Semantic Web von Harald Cichos Seminar: Semantic Web Wintersemester 2005/2006 Universität Jena Seminarleiter: Prof. Dr. C. Beckstein, Dr. H. Sack, Dipl.-Inform.
MehrUnicode und UTF-8. Anna-Katharina Wurst. 28. April 2015. WP5 Angewandte Programmierung
28. April 2015 WP5 Angewandte Programmierung David Kaumanns & Sebastian Ebert SoSe 2015 CIS Ludwig-Maximilians-Universität München 2 Inhalt 1 Zeichensätze ASCII ISO 8859-x Unicode 2 Kodierung UTF-8 3 Anwendung
MehrEinstieg in die Informatik mit Java
Vorlesung vom 18.4.07, Literalkonstanten Übersicht 1 Ganzzahlige Konstanten 2 Gleitkommakonstanten 3 Zeichenkonstanten 4 Zeichenketten 5 Boolsche Konstanten 6 null Referenz Literalkonstanten Literalkonstanten
MehrEinstieg in die Informatik mit Java
1 / 30 Einstieg in die Informatik mit Java Datentypen Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 30 1 Überblick 2 Ganzzahlige Typen 3 Gleitkommatypen 4 Zeichen, char
MehrEinstieg in die Informatik mit Java
1 / 20 Einstieg in die Informatik mit Java Literalkonstanten Gerd Bohlender Institut für Angewandte und Numerische Mathematik Gliederung 2 / 20 1 Ganzzahlige Konstanten 2 Gleitkommakonstanten 3 Zeichenkonstanten
MehrRechnerorganisation 12. Vorlesung
Rechnerorganisation 12. Vorlesung Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen
MehrVom Bit zum CBC. Vom Bit zum CBC. Crashkurs - Digitale Verschlüsselungstechnik. ein Vortrag von Marius Schwarz. im Rahmen des KP 2018
Vom Bit zum CBC Vom Bit zum CBC Crashkurs - Digitale Verschlüsselungstechnik ein Vortrag von Marius Schwarz im Rahmen des KP 2018 Vom Bit zum CBC 0 Vom Bit zum CBC Am Anfang war die Null... 0 Vom Bit zum
MehrDatentypen printf und scanf. Programmieren in C Dr. Michael Zwick
Datentypen printf und scanf Programmieren in C Dr. Michael Zwick April June 2015 Monday Tuesday Wednesday Thursday Friday 17 20 Apr 21 22 23 24 Arbeitsblatt 1-1 Ausgabe Arbeitsblatt 1 Beginn Tutorium Arbeitsblatt
MehrImperia Unicode- und Multi-Language-HOWTO
Imperia Unicode- und Multi-Language-HOWTO Konzeption, Implementierung und Pflege mehrsprachiger Web-Sites mit Imperia Guido Flohr Imperia Unicode- und Multi-Language-HOWTO: Konzeption, Implementierung
MehrModul InfB-RS: Rechnerstrukturen
A. Mäder 1 MIN-Fakultät Fachbereich Informatik 64-040 Modul InfB-RS: Rechnerstrukturen https://tams.informatik.uni-hamburg.de/ lectures/2017ws/vorlesung/rs Kapitel 4 Andreas Mäder Universität Hamburg Fakultät
MehrRückblick. Addition in der b-adischen Darstellung wie gewohnt. Informatik 1 / Kapitel 2: Grundlagen
Rückblick Addition in der b-adischen Darstellung wie gewohnt 5 0 C E + D 4 2 D = 44 Rückblick Multiplikation in der b-adischen Darstellung wie gewohnt 1 0 1 0 1 0 1 = 45 Rückblick Darstellung negativer
MehrRechnerstrukturen, Teil 1. Vorlesung 4 SWS WS 15/16
Rechnerstrukturen, Teil 1 Vorlesung 4 SWS WS 15/16 Prof. Dr Jian-Jia Chen Dr. Lars Hildebrand Fakultät für Informatik Technische Universität Dortmund lars.hildebrand@tu-.de http://ls1-www.cs.tu-.de Übersicht
MehrTechnische Informatik (RO)
Technische Informatik (RO) Zahlensysteme, Digitale Systeme (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten, Sequentielle Schaltungen (6) Informationskodierung (7,8) Fortsetzung
MehrKapitel 2: Darstellung von Information. Inhalt. Einfache Datentypen (Fortsetzung) Erste Programme (mit Ausgabe) Exkurs: Grammatiken
Kapitel 2: Wintersemester 2005/06 Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Inhalt Einfache Datentypen (Fortsetzung) Erste
MehrSkript. EDV Grundlagen
PAUL-EHRLICH-SCHULE Frankfurt-Höchst Berufs-, Fach-, Fachoberschule Informatik FOS FS Skript EDV Grundlagen Datum: Name: Klasse: 1. Daten die Welt der Bits und Bytes Daten begegnen uns im Alltag in vielfältiger
MehrEinführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung)
Wintersemester 2005/06 Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung) (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich Informatik Lehrstuhl
MehrInformationsdarstellung. 2 Informationsdarstellung. Ziele. 2 Informationsdarstellung Texte. Texte WS 2018/2019
Fakultät Informatik Institut Systemarchitektur Professur Datenschutz und Datensicherheit WS 2018/2019 2. Informationsdarstellung Dr.-Ing. Elke Franz Elke.Franz@tu-dresden.de 2 Informationsdarstellung Ziele
MehrWo sind wir? Übersicht lexikale Struktur von Java
Wo sind wir? Java-Umgebung Lexikale Konventionen Datentypen Kontrollstrukturen Ausdrücke Klassen, Pakete, Schnittstellen JVM Exceptions Java Klassenbibliotheken Ein-/Ausgabe Collections Threads Applets,
MehrAuch 2007 wird diese Empfehlung allerdings immer noch nicht universell befolgt.
UTF-8 Kodierung UTF-8 (Abk. für 8-bit Unicode Transformation Format) ist die am weitesten verbreitete Kodierung für Unicode Zeichen. Unicode ist ein internationaler Standard, in dem langfristig für jedes
MehrGrundlagen der Informatik
Grundlagen der Informatik (Wintersemester 2008/2009) Jörg Roth Jörg Roth 2 0 Motivation und Überblick Drei große Bereiche der Vorlesung: Darstellung von Zahlen in Rechnern Verarbeitung von Binärdaten auf
MehrFundamentale Ideen der Informatik PH Weingarten Sommersemester 2014 Paul Libbrecht CC-BY
Fundamentale Ideen der Informatik PH Weingarten Sommersemester 2014 Paul Libbrecht CC-BY Vorlesung 6: Repräsentationen Themenkarte Verschlüsselung Netzwerk Versionierung Programmverlauf Java Instruktionen
MehrHerzlich Willkommen zur Informatik I. Bits und Bytes. Zahlensystem zur Basis 10 (Dezimalzahlen) Warum Zahlensysteme betrachten?
Herzlich Willkommen zur Informatik I Bits und Bytes Zahlen im Computer: Binärzahlen, Hexadezimalzahlen Text im Computer: ASCII-Code und Unicode Quelle: http://www.schulphysik.de/rgb.html Bit: eine binäre
MehrKapitel 3. Codierung von Text (ASCII-Code, Unicode)
Kapitel 3 Codierung von Text (ASCII-Code, Unicode) 1 Kapitel 3 Codierung von Text 1. Einleitung 2. ASCII-Code 3. Unicode 2 1. Einleitung Ein digitaler Rechner muss jede Information als eine Folge von 0
MehrMerke: Mit jedem zusätzlichen Bit verdoppelt sich die Anzahl der darstellbaren Zahlen bzw. Zustände
1 2 Merke: Mit jedem zusätzlichen Bit verdoppelt sich die Anzahl der darstellbaren Zahlen bzw. Zustände 3 Die Zuordnung der Himmelsrichtungen zu den dreistelligen Binärzahlen, also Norden 000 Süden 001
MehrEin- und Ausgabe. Buchstaben als Zahlen: Kodierung. Kodierungsstandards. ASCII-Zeichensatz-Tabelle
Ein- und Ausgabe Übersicht Wie werden Schriftzeichen kodiert? Ein- und Ausgabe von ASCII-Zeichen Eingabe: get/1, get_code/1 Ausgabe: put_code/1, nl/0, tab/1 Konvertierung: name/2, atom_codes/2, number_codes/2
MehrDaten und Informationen
Daten und Informationen Vorlesung vom 17. Oktober 2016 Birger Krägelin Inhalt Repräsentation und Abstraktion Zahlendarstellung Stellenwertsysteme Rechnen mit Zahlen Gleitkommazahlen, Rundungsproblematik
MehrDaten und Informationen
Daten und Informationen Vorlesung vom 23. Oktober 2017 Birger Krägelin Inhalt Repräsentation und Abstraktion Zahlendarstellung Stellenwertsysteme Rechnen mit Zahlen Gleitkommazahlen, Rundungsproblematik
MehrU+1F4A9 = What every Programmer should know about Unicode. 2. Semester Medieninformatik. Prof. Dr.-Ing. Carsten Bormann cabo@tzi.
U+1F4A9 = What every Programmer should know about Unicode 2. Semester Medieninformatik Prof. Dr.-Ing. Carsten Bormann cabo@tzi.de 1 Textuelle Information Zeichen Primäre Informationsquelle im Web: Text
MehrWintersemester Maschinenbau und Kunststofftechnik. Informatik. Tobias Wolf Seite 1 von 11
Kapitel 11 Zeichenverarbeitung Seite 1 von 11 Zeichenverarbeitung - Jedem Zeichen ist ein Zahlencode zugeordnet. - Dadurch wird ermöglicht, zwischen verschiedenen Systemen Texte auszutauschen. - Es werden
MehrProgrammieren. INE1, Montag M. Thaler, Office TG208. ZHAW, M. Thaler, K. Rege, G. Burkert
Programmieren INE, Montag M. Thaler, tham@zhaw.ch Office TG208 http://www.zhaw.ch/~tham Um was geht es? Problemstellung Algorithmus(Vorgehen) Implementierung 2 Lernziele Siekönnen erklären, was "Programmieren"
Mehr2 Die Codierung Sehen wir uns mal den vereinfachten Weg der Informationen von der Tastatur aus bis zum Filesystem an:
Name Klasse Datum 1 Allgemeines Daten werden bekanntermaßen im Computer in einem flüchtigen Speicher, dem RAM verarbeitet. Insofern gehen sie verloren, sobald der Rechner ausgeschaltet wird. Weiterhin
MehrRechnerstrukturen. Michael Engel und Peter Marwedel. Sommer TU Dortmund, Fakultät für Informatik
Rechnerstrukturen Michael Engel und Peter Marwedel TU Dortmund, Fakultät für Informatik Sommer 2014 Folien a. d. Basis von Materialien von Gernot Fink und Thomas Jansen 10. April 2014 1/37 1 Repräsentation
MehrEinführung in die Programmierung Wintersemester 2008/09
Einführung in die Programmierung Wintersemester 2008/09 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund : Darstellung von Information Inhalt Einfache Datentypen
MehrInformatik. Wiederholung Felder (Arrays), string. Vorlesung
Informatik Vorlesung 04 Wiederholung Felder (Arrays), string 19. November 2018 WiSe 2018 FB Ing - SB Umwelttechnik und Dienstleistung - Informatik Thomas Hoch 1 Ein C++ Programm: Wiederholung #include
Mehr8. Ausdrücke, Operatoren (einfache Typen)
8. Ausdrücke, Operatoren (einfache Typen) Teil 2 Java-Beispiel: Unicode.java K. Bothe, Institut für Informatik, HU Berlin, GdP, WS 2015/16 Version: 16. Nov. 2015 2 Typumwandlung Cast-Operator 3 Unterschiedliche
MehrLinux I II III Res WN/TT NLTK XML Weka E Rechte Encoding. Linux III. 3 Linux III. Rechte Encoding. Ressourcen-Vorkurs
Linux III 3 Linux III Rechte Encoding Rechte I In der Unix-Welt gibt es drei wichtige Rechte: Read (r) Eine Datei lesen bzw. den Inhalt eines Verzeichnisses anzeigen Write (w) Eine Datei ändern bzw. eine
MehrLinux I II III Res WN/TT Rechte Encoding. Linux III. 3 Linux III. Rechte Encoding. Ressourcen-Vorkurs
Linux III 3 Linux III Rechte Encoding Rechte I In der Unix-Welt gibt es drei wichtige Rechte: Read (r) Eine Datei lesen bzw. den Inhalt eines Verzeichnisses anzeigen Write (w) Eine Datei ändern bzw. eine
Mehr8. Ausdrücke, Operatoren (einfache Typen)
8. Ausdrücke, Operatoren (einfache Typen) Typumwandlung Cast-Operator Teil 2 Java-Beispiel: Unicode.java Version: 16. Nov. 2015 Unterschiedliche Typen Typumwandlung: Übersicht Zuweisung x = y; Ausdruck
MehrJava-Applikationen (Java-Programme)
Java-Applikationen (Java-Programme) Eine erste Applikation: 1 2 3 4 5 6 7 8 9 10 // Quelltext HalloWelt.java // Programm gibt den Text Hallo Welt aus public class HalloWelt public static void main(string[]
MehrProgrammierkurs C++ Variablen und Datentypen
Programmierkurs C++ Variablen und Datentypen Prof. Dr. Stefan Fischer Institut für Telematik, Universität zu Lübeck http://www.itm.uni-luebeck.de/people/fischer #2 Überblick Welche Datentypen gibt es in
MehrRechnerorganisation. IHS 2015/2016 H.-D. Wuttke, K. Henke
Rechnerorganisation Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen (9) Rechneraufbau
MehrRechnerorganisation. IHS 2018/2019 H.-D. Wuttke, K. Henke
Rechnerorganisation Mathematische Grundlagen (1) Boolesche Algebren: BMA, BAA (2,3) Kombinatorische Schaltungen (4,5) Automaten (6,7) Sequentielle Schaltungen (8) Programmierbare Strukturen (9) Rechneraufbau
Mehr4 Lokalisierung undinternationalisierung
4 Lokalisierung undinternationalisierung In diesemkapitel lernen Sie ein Linux-System für einen Benutzerineiner anderen Sprache einzurichten. Dadurch, dass das Internet die Erde zu einem globalen Dorf
MehrKlaus Schild, XML Clearinghouse Aufbau von XML- Dokumenten
Aufbau von XML- Dokumenten Lernziele Wie ist ein XML-Dokument aufgebaut? Was sind Elemente und was sind Attribute? Wann sollten Attribute und wann Elemente verwendet werden? Elemente ist ein Anfangs-Tag
MehrBasisinformationstechnologie I
Basisinformationstechnologie I Wintersemester 2014/15 29. Oktober 2014 Grundlagen II Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // jan.wieners@uni-koeln.de
MehrJava Einführung Objekt-Datentypen und Strings. Kapitel 8 und 9
Java Einführung Objekt-Datentypen und Strings Kapitel 8 und 9 Inhalt Was sind Objekt-Datentypen Sonderheiten bei Zuweisung und Vergleich Zeichenketten (Strings) Zeichencodes Char, Char-Arrays und Strings
MehrUnicode und Zeichensätze
02 Unicode G. Görz, J. Schneeberger Lehrstuhl Informatik 8 (KI) josef.schneeberger@fh-deggendorf.de! Unicode und Zeichensätze Unter Mitarbeit von Olaf Winterstein (Greifswald 08) 2 Was ist Unicode? Internationaler
MehrUnicode-Integration in FrameMaker?
Unicode-Integration in FrameMaker? tekom-tagung 22.-23.4.2004, Aachen FrameMaker Tutorial TF6 Dipl.-Ing. Michael Müller-Hillebrand, Erlangen Unicode-Integration in FrameMaker?, 1/20 Was bedeutet Unicode-fähig?
MehrEinheit Datentypen in der Programmiersprache C Schwerpunkt: Elementare (arithmetische) Datentypen
Einheit Datentypen in der Programmiersprache C Schwerpunkt: Elementare (arithmetische) Datentypen Kurs C/C++ Programmierung, WS 2008/2009 Dipl.Inform. R. Spurk Arbeitsgruppe Programmierung FR 6.2 Informatik
MehrHier finden Sie eine Zusammenfassung der Operatoren von C++ und ihre Bezeichnung bzw. Verwendung. UND ODER. zusammengesetzte Zuweisung Bitoperatoren
Übersichtstabellen Operatoren in C++ und ihre Bedeutung (Übersicht) Hier finden Sie eine Zusammenfassung der Operatoren von C++ und ihre Bezeichnung bzw. Verwendung. Operator Bezeichnung Arithmetische
MehrMultimediale Werkzeuge. Textformate, Medienobjekte
Multimediale Werkzeuge Textformate, Medienobjekte Geschichte/ Eigenschaften von Textformaten Gebräuchliche Textformate, z.b. für HTML Files, Programme: ASCII (American Standard Code for Inform. Interchange)
Mehr03 XML Grundlagen. Manuel Burghardt Lehrstuhl für Medieninformatik
Markupsprachen 03 XML Grundlagen Manuel Burghardt Warum XML? Nachteile von SGML und HTML SGML ist für die meisten Aufgaben zu komplex, und dadurch nicht sofort einsetzbar (komplexe Metasprache) HTML ist
MehrEncodings im LMS der Berufsfachschule BBB. Michael Schneider
Encodings im LMS der Berufsfachschule BBB Michael Schneider michael.schneider@bbbaden.ch 31. Juli 2007 Inhaltsverzeichnis 1 Encodings 1 1.1 ASCII........................................... 1 1.2 8-Bit
Mehr1 Funktionsaufrufe. Informatik I: Einführung in die Programmierung 4. Funktionen: Aufrufe und Definitionen. Funktionsaufrufe
1 Funktionsaufrufe Informatik I: Einführung in die Programmierung 4. : und en Albert-Ludwigs-Universität Freiburg Bernhard Nebel 21./25. Oktober 2016 21./25. Oktober 2016 B. Nebel Info I 3 / 36 Funktionsaufrufe
MehrWiederholung, Abbruch von Schleifen, switch-anweisung Datentypen, char, formatierte Ausgabe
Informatik Vorlesung 03b Wiederholung, Abbruch von Schleifen, switch-anweisung Datentypen, char, formatierte Ausgabe 12. November 2018 WiSe 2018 FB Ing - SB Umwelttechnik und Dienstleistung - Informatik
MehrGrundlagen der Informationstechnik
Grundlagen der Informationstechnik 2 Um die Funktionsweise der Computernetze zu verstehen, ist ein grundlegendes Verständnis der Informationstechnik (IT) nötig. Bei diesen Grundlagen handelt es sich um
MehrInformationsdarstellung 2.2
Beispiele für die Gleitkommadarstellung (mit Basis b = 2): 0,5 = 0,5 2 0-17,0 = - 0,53125 2 5 1,024 = 0,512 2 1-0,001 = - 0,512 2-9 3,141592... = 0,785398... 2 2 n = +/- m 2 e Codierung in m Codierung
Mehr