Multimediale Werkzeuge. Textformate, Medienobjekte

Ähnliche Dokumente
Multimediale Werkzeuge. Textformate, Medienobjekte

Multimediale Werkzeuge. Textformate, Medienobjekte

Escape-Sequenzen. Dr. Norbert Spangler

Protokollgrundlagen (Schicht 2)

2 Darstellung von Zahlen und Zeichen

Einstieg in die Informatik mit Java

Einstieg in die Informatik mit Java

Merke: Mit jedem zusätzlichen Bit verdoppelt sich die Anzahl der darstellbaren Zahlen bzw. Zustände

Einstieg in die Informatik mit Java

Wintersemester Maschinenbau und Kunststofftechnik. Informatik. Tobias Wolf Seite 1 von 11

Wie rechnet ein Rechner?

Rechnerstrukturen. Michael Engel und Peter Marwedel. Sommer TU Dortmund, Fakultät für Informatik

Informatikgrundlagen I Grundlagen der Informatik I

Skript. EDV Grundlagen

Kapitel 2: Darstellung von Information. Inhalt. Einfache Datentypen (Fortsetzung) Erste Programme (mit Ausgabe) Exkurs: Grammatiken

Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung)

Einführung in die Informatik

Einführung in die Programmiertechnik

Programmieren in C Einführung

@ A Q R ( ) Die Bedeutung der Steuerzeichen wird auf der Seite H2 (Tafel 2) erklärt. 6E 6F TAFELN, TABELLEN TAFEL 1. Schriftzeichen.

Datentypen printf und scanf. Programmieren in C Dr. Michael Zwick

2 Darstellung von Zahlen und Zeichen

Modul IP7: Rechnerstrukturen

Zahlen und Zeichen (1)

2 Darstellung von Zahlen und Zeichen

Einführung in die Programmierung Wintersemester 2008/09

Rechnerstrukturen WS 2012/13

Grundlagen der Informatik

Hauptspeicherinhalt. Ton. Vektorgrafik Bitmapgrafik Digit. Video. 1. Darstellung von Daten im Rechner. Abb. 1.1: Einteilung der Daten

Wie werden die Barcode Prüfziffern berechnet?

Einführung in die Programmiertechnik

Algorithmen und Datenstrukturen (für ET/IT)

03 XML Grundlagen. Manuel Burghardt Lehrstuhl für Medieninformatik

Anwender- dokumentation

Thema 1 -- Fortsetzung. Computersystem, Informationsdarstellung

Organisatorisches. Algorithmen und Datenstrukturen (für ET/IT) Programm heute. Was sind primitive Datentypen? Primitive Datentypen

Algorithmen und Datenstrukturen (für ET/IT)

T c) Daten welcher Größenordnung kann ein Register aufnehmen: Byte, kilobytes, megabytes, gigabytes or terabytes?

X = {x 1,x 2,...} sei ein Symbolalphabet eines Kodes. In diesem Kode sind card(x) = X Sachverhalte darstellbar

Organisatorisches. Algorithmen und Datenstrukturen (für ET/IT) Programm heute. Definition Datenstruktur. Nächste Woche keine Vorlesung!

Wie werden die Barcode Prüfziffern berechnet?

Fundamentale Ideen der Informatik PH Weingarten Sommersemester 2014 Paul Libbrecht CC-BY

5. Darstellung und Verarbeitung von Textzeichen

David Neugebauer, Informationsverarbeitung - Universität zu Köln, Seminar BIT I

Informationsdarstellung. 2 Informationsdarstellung. Ziele. 2 Informationsdarstellung Texte. Texte WS 2017/2018

Basisinformationstechnologie I Wintersemester 2011/ Oktober 2011 Grundlagen II

Clevere Algorithmen programmieren

Grundlagen der Informationstechnik

Codierung von Text. PC in Betrieb nehmen. Der ASCII-Code (American Standard Code for Information Interchange) ASCII

Grundlagen der Technischen Informatik. Codierung und Fehlerkorrektur. Kapitel 4.2. Codewörter. Codewörter. Strukturierte Codes

Algorithmen und Datenstrukturen (für ET/IT)

Übung zur Wirtschaftsinformatik I. Zahlensysteme / Codierung

Kapitel 3. Codierung von Text (ASCII-Code, Unicode)

4. Daten. K. Bothe, Institut für Informatik, HU Berlin, GdP, WS 2015/16

2 Repräsentation von elementaren Daten

Grundlagen der Informationstechnik

Programm heute. Algorithmen und Datenstrukturen (für ET/IT) Was sind primitive Datentypen? Bits und Bytes. Primitive Datentypen. Sommersemester 2014

E-ConsentPro und Online-Portal E-Consent. Drucken unter Firefox ab Version 52

Leistung übertragbar

Michael Seeboerger-Weichselbaum. Das Einsteigerseminar JavaScript 4., überarbeitete Auflage

Erstellen von Web-Seiten HTML und mehr...

Dirk Ammelburger XML. Grundlagen der Sprache und Anwendungen in der Praxis HANSER

Kapitel 1. Programmierkurs. 1.2 Allgemeiner Aufbau des Computers. 1.1 Hallo, Computer...?

Algorithmen und Datenstrukturen (für ET/IT)

Grundlagen der Informationstechnik

Datenaustausch. Energiewirtschaft 3. Semester. Tillman Swinke

Strings. Daten aus Dateien einlesen und in Dateien speichern.

- Anleitungen. Browsereinstellungen. Gerhard Toppler

Was ist Wirtschaftsinformatik?

Grundlagen der Datenverarbeitung

Hilfestellung. für die Benutzung der elektronischen Ausgabe Anlegen eines naturnahen Kindergartens - Ein Leitfaden

Kodierung. Bytes. Zahlensysteme. Darstellung: Zahlen

Grundlagen der Informatik Arbeit mit Zeichen und Zeichenketten

7. Übung zur Vorlesung Grundlagen der Informatik

Voyager 9520/40 Voyager GS9590 Eclipse 5145 Kurzanleitung


alphanumerische Zeichen

3. Informationsdarstellung

Algorithmen und Datenstrukturen

Eine Reihe häufig benötigter Datentypen ist in C vordefiniert

Barcode- Referenzhandbuch

Informationsdarstellung. 2 Informationsdarstellung. Ziele. 2 Informationsdarstellung Texte. Texte WS 2018/2019

Arbeiten mit Acrobat. Vorstellung von Adobe Acrobat Bearbeitung des Dokuments Präsentationen erstellen Teamarbeit

» ASCII = American Standard Code for Information Interchange.» ASCII ist Standard in Windows und Unix (und Unix-Derivaten).» ASCII ist eigentlich ein

Einführung in die Informatik für Naturwissenschaftler und Ingenieure (alias Einführung in die Programmierung)

Mikroprozessoren Grundlagen AVR-Controller Input / Output (I/O) Interrupt Mathematische Operationen

Ein Teletutorium Experiment

Technische Informatik (RO)

Einführung in die Programmierung

Rechnerorganisation 12. Vorlesung

Rechnerorganisation 12. Vorlesung

T e) Welche Eigenschaft müssen Byte-, Wyde-, Tetra- und Octa-Adressen beim MMIX haben?

Algorithmen und Datenstrukturen (für ET/IT)

Standardmäßig (wenn gerade kein Fenster im Programm geöffnet ist) stehen folgende Möglichkeiten zur Verfügung:

Bluetooth Linear Imager Scanner. Programmierung-Anleitung

javascript Coding-Guidelines 2. Ausgabe Februar 2015 Der Guideline beschreibt den verwendeten Coding-Stil von javascript als eigene Richtline.

Kapitel 2: Darstellung von Information Inhalt Einführung in die Informatik für Naturwissenschaftler und Ingenieure

Transkript:

Multimediale Werkzeuge Textformate, Medienobjekte File/Datei organisation: Binaer, Gruppe von 8 bits, 1 Byte: 2 x 4er Gruppen (Nibble). Darstellung als Binaer (4 stellen Nibble), Octal (Ziffern 0-7,3 stellen pro Byte), Dezimal (0-255 pro byte, wie bei IP Adressen), Hexadezimal (Ziffern 0-F, 2 Stellen pro Byte). Wie geben wir diesen Bits und Bytes eine Bedeutung im Sinne von Schriftzeichen? Geschichte/ Eigenschaften von Textformaten Gebräuchliche Textformate, z.b. für HTML Files, Programme: ASCII (American Standard Code for Inform. Interchange) 1874: Baudot Code (Emile Baudot), für Telegrafen, Fernschreiber, basiert auf

einem noch früheren Code von Carl- Friedrich Gauss und Wilhelm Weber in 1834!! (Wikipedia: Baudot Code) 1901: Modifiziert. 5 bits, also nur 32 Symbole. Nur Großbuchstaben + Sonderzeichen. Zahlen mit Umschaltzeichen 1963: American Standard Association (Später: ANSI) veröffentlicht ersten ASCII Code 1967: Erweitert um Kleinbuchstaben und Sonderzeichen womöglich der erfolgreichste "Software" Standard! seit ueber 40 Jahren stabil. Teil von Unicode als unterste 128 Zeichen. Hat 7 bit. Tastaturen: oft 7 bit + 1 Paritätsbit (Fehlererkennung) Ursprüngliche Ein/Ausgabegeräte von Computern waren Fernschreiber (engl. Teletype, daher auch die Bezeichnung tty in Unix/Linux fuer Ein/Ausgabegeräte. Der Befehl tty in Linux gibt den Namen des grade an

Standard Input angeschlossenen Eingabegeraetes an, und unter /dev sind viele tty... gelistet. Die ASCII Code Tabelle ist: Aus: http://de.selfhtml.org Man beachte: Es gibt dort keine Umlaute. Später gab es eine Erweiterung für weitere Sprachen (z.b. Umlaute) mit Nutzung des 8. Bits:

Latin-1, Westeuropäisch: Aus: http://de.selfhtml.org

Die 32 ersten ASCII Zeichen sind Steuerzeichen (sh. www.ascii-code.com): ASCII control characters (character code 0-31) The first 32 characters in the ASCII-table are unprintable control codes and are used to control peripherals such as printers. DEC OCT HEX BIN Symbol HTML Number HTML Name Description 0 000 00 00000000NUL � Null char 1 001 01 00000001SOH  Start of Heading 2 002 02 00000010STX  Start of Text 3 003 03 00000011ETX  End of Text 4 004 04 00000100EOT  End of Transmission 5 005 05 00000101ENQ  Enquiry 6 006 06 00000110ACK  Acknowledgment 7 007 07 00000111BEL  Bell 8 010 08 00001000BS  Back Space 9 011 09 00001001HT Horizontal Tab 10 012 0A 00001010LF Line Feed 11 013 0B 00001011VT  Vertical Tab 12 014 0C 00001100FF  Form Feed 13 015 0D 00001101CR Carriage Return 14 016 0E 00001110SO  Shift Out / X-On 15 017 0F 00001111SI  Shift In / X-Off 16 020 10 00010000DLE  Data Line Escape 17 021 11 00010001DC1  Device Control 1 (oft. XON) 18 022 12 00010010DC2  Device Control 2 19 023 13 00010011DC3  Device Control 3 (oft. XOFF) 20 024 14 00010100DC4  Device Control 4 21 025 15 00010101NAK  Negative Acknowledgement 22 026 16 00010110SYN  Synchronous Idle 23 027 17 00010111ETB  End of Transmit Block 24 030 18 00011000CAN  Cancel 25 031 19 00011001EM  End of Medium 26 032 1A 00011010SUB  Substitute 27 033 1B 00011011ESC  Escape 28 034 1C 00011100FS  File Separator

29 035 1D 00011101GS  Group Separator 30 036 1E 00011110RS  Record Separator 31 037 1F 00011111US  Unit Separator 1985: Erweiterung auf 8 bit code durch ECMA (European Computer Manufacturer's Association) als ISO-8859. Die dadurch resultierenden oberen 128 Zeichen enthalten Sonderzeichen unterschiedlicher Sprachen, je nach Version.: ISO 8859 - -1 Latin-1, Westeuropäisch -2 Latin-2, Mitteleuropäisch -3 Latin-3, Südeuropäisch -4 Latin-4, Baltisch -5 Kyrillisch -6 Arabisch -7 Griechisch -8 Hebräisch -9 Latin-5, Türkisch -10 Latin-6, Nordisch -11 Thai -13 Latin-7, Baltisch -14 Latin-8, Keltisch -15 Latin-9, Westeuropäisch -16 Latin-10, Südosteuropäisch

(aus: http://de.wikipedia.org/wiki/iso_8859) 1991: Unicode veröffentlicht, von Unicode Consortium 1997: International Standards Organisation (IS0). 1998 Version 2.1 2000 Version 3.0 2001 Version 3.1 üblicherweise 16 bit (ca. 65k Zeichen) auch Version mit 32 bit (ca. 4*10^9 Zeichen. Verschiedene Schriften sind in sog. Skripten zusammen gefasst: Angefangen mit Lateinischen Alphabet, dann Griechisch, Kyrillisch, Hebräisch,... japanisches Hiragana, und Katakana, chinesische Schriftzeichen -> ca. 21000 Zeichen, ca. 6000 Codes für Firmen Symbole.

16 bit: UCS 2 (Universal Character Set), UTF16 32 bit: UCS 4 (Unterarten von Unicode), UTF32 UTF-8 (Abk. für 8-bit Unicode Transformation Format) ist die am weitesten verbreitete Kodierung für Unicode-Zeichen. Beachte: UTF-8 ist ein code mit ungleichen Zeichenlaengen. Deutsche Umlaute werden z.b. mittels 2 Bytes dargestellt (anders als in ASCII mit nur 1 Byte!) Im untersten Bereich (128 Zeichen) entspricht UTF-8 genau dem ASCII-Code: Das höchste Bit ist 0, die restliche 7-Bit- Kombination ist das ASCII-Zeichen. (sh. http://de.wikipedia.org/wiki/utf-8) Fazit: -> Textformate: Geben uns: Langzeitstabilität Austauschbarkeit über alle möglichen Rechner plattformen

Durch Sprachen wie HTML, SGML, Latex Flexibilität für die Darstellung von Multimedia-Inhalten. Beispiele Ansehen von verschiedenen Textformaten mit hilfe des Linux/Unix Befehls od (fuer Octal Dump ): Mit einem Editor, z.b. gedit, erzeuge ein Text File, z.b. mit den Worten Dies ist ein Test öäüß, und speichere ihn als ASCII Westeuropäisch, UTF8, UTF16 und UTF32 (in gedit möglich mit File- Save As Character Encoding Add or Remove, dann entprechende Auswahl). Abspeichern z.b. im ersten Fall mit Namen testwesternascii.txt. Wie unterscheiden sie die resultierenden Dateigrößen der 4 Dateien (Westeuropäisch, UTF8, UTF16, UTF32)?

Mit od -c testwesternascii.txt wird der Inhalt des Files Byte-weise angezeigt, wobei jedes Byte als ASCII Character oder Sonderzeichen angezeigt wird. Dies kann man dann vergleichen mit od -c testutf8.txt od -c testutf16.txt od -c testutf32.txt Wo gibt es Unterschiede? Mit od -t cu1... kann man zusätzlich die Dezimaldarstellung der Bytes unter den ASCII Charactern sehen. Nun nehme einen Word Processor, wie LibreOffice (.odt Format). Öffne ein Dokument, schreibe die gleichen Worte, und speichere das Dokument als test.odt. Wie groß ist das File? Nun sehe es an mit: od -c testodt.odt Was kann man beobachten? Man sieht dass hier sehr viele Formatierungsbefehle des Word Processors im File vorhanden sind. Wenn wir z.b. HTML

Dateien schreiben wollen, wollen wir aber unsere eigenen, zu HTML gehoerenden Befehle verwenden. Daher ist es wichtig, diese Datei wirklich in einem Text Format (ASCII, UTF 8, UTF16, oder teils UTF32) zu speichern, was ein Browser erkennen und interpretieren kann. Browsertest fuer die Textformate Nehme einen Editor, wie gedit, und erzeuge ein File mit einer HTML Test Seite, inklusive Umlaute: <html> Dies ist ein Test öäüß </html> Speicher dies als Western (ISO 8859-15) mit namen htmltestwestern.html dann als UTF8, UTF16, und UTF32, mit entsprechenden Namen. Öffne diese Dateien mit dem Firefox und dem Chromium. Was kann man beobachten? Hinweis: Bei Smart Phones mit Android Betriebssystem lassen sich einiger der gezeigten Befehle nutzen, indem man die Apps Terminal IDE und BusyBox vom Play Store laed (frei).

HTML Textobjekte, Eigenschaften: Schriftart, Größe, Positionierung, einfügen von Hyper-Links HTML Editoren, wie MS Word, können auf einfache Weise HTML Seiten mit formatiertem Text erzeugen, inklusive Hyper-Links und auch Bildern oder Zeichnungen. Aber: HTML Quell file wird groß, ist nicht mehr gut Lesbar HTML hat mehr Möglichkeiten, ist mehr wie eine Programmiersprache. Z.b. externe Definitionen über style Files. Auch: Kleine Programme in JAVA oder JAVAScript u.ä. sind in Word nicht zu machen. Z.B. Eingabefelder. Weiter: zusätzliche Multimedia-Objekte, Ton, Video, 3-Dimensionale Modelle, die

man in einem Fenster ansehen und drehen kann. Ähnlich Ton, Bild, Video-Objekte: Es gibt verschiedene Formate, z.b. komprimiert/ unkomprimiert, verschiedene Kompressionsarten, verschiedene Wiedergabearten JAVAScript Anwendungen / Eigenschaften: Automation, z.b. Bild verändert sich wenn man die Maus darüber bewegt. Eingaben, die weiter verarbeitet werden, z.b. Berechnungen (kleiner Taschenrechner in Webseite). Neue Fenster öffnen, schliessen, Größe verändern. Ist Script, welches auf dem lokalen Rechner ausgeführt wird (Client) Kein Executable, sondern das Skript wird erst auf dem lokalen Rechner

"interpretiert" (d.h. langsam), analog zu BASIC in früheren Rechnern. Ist Plattform-unabhängig, läuft im Browser. D.h. überall wo Browser läuft, läuft das Skript! Geschichte: 1995: Objektorientierte Skriptsprache, ursprünglich von Netscape und SUN entwickelt 1996: Microsoft, Internet Explorer 3, Javascript fähig, nennt sich Jscript aus rechtlichen Gründen, und schlägt eigenen Weg ein, ist aber im wesentlichen Kompatibel. 1997 Internet Explorer 4 mit Sprachumfang von Javascript 1.1. Aber auch eigene, inkompatible Spracherweiterungen. 1998: ECMA Script wird von ISO Standardisiert. Netscape: Javascript 1.4, kompatibel mit ECMA-262

2002: Mozilla 1.0 mit Javascript 1.5 Skript wird auf dem Client ausgeführt (Rechner Zuhause) Ähnlichkeit zu JAVA: Syntax und einige Schlüsselwörter vergleichbar,aber anderes System: JAVA: Zu kompilierende Programmiersprache Javascript: Interpretierte Programmiersprache für Webbrowser. Document Object Model (DOM) Anschaulich: Speicher für Inputs in Webseiten, z.b. Tabellen. Speicherstruktur Daten/Object Interface für Javascript Standardisiert durch W3C, in 90ern => Stellt Funktionalität zur Verfügung, z.b. Ein/Ausgabe für Javascript Nachzulesen unter: wikipedia.org und http://unicode.e-workers.de

-Siehe auch die Javascript Beispiele (auf unserer Webseite): dragdrop.html veranschaulicht drag/drop und resizing in Javascript SlideRulePicketVirtual n909 es.html veranschaulicht begrenzte Bewegungen in Javascript gs_scicalc.htm veranschaulicht Buttons und Funktionen mit Ein/Ausgabe Fenstern in Javascript PDF: Portable Document Format Seit 1993 von Adobe, am Anfang auch Reader kostenpflichtig Aktuelle Version: 1.6, in Acrobat ab Version 7 Plattformunabhängige Druckdarstellung (anders als z.b. HTML, der die fein- Formatierung dem Browser überlasst)

Anwendung des Formats: Beschreibungssprache für Dokumente, Verwandtschaft zu Postscript, ps, (gedacht nur fuer Drucker), aber anders als diese keine Programmiersprache, aber mehr Möglichkeiten zur Dokumenten- Beschreibung Passwortschutz möglich, zum Ausdrucken, zum kopieren in Zwischenablage, zum Ändern des Dokuments. Obwohl Beschreibungssprache, können kleinere Änderungen (z.b. Tippfehler korrigieren) vorgenommen werden. Auch in Betriebssystemen, z.b. von Apple, um sicher zu stellen daß Bildschirm Bild genau der Druck-Ausgabe entspricht. Erzeugen der PDF Dokumente mittels Acrobat Destiller, erzeugt PDF File beim Drucken auf PDF. Interessant: Möglichkeit zum Einfügen von Kommentaren und Markierungen in PDF File, z.b. für Korrekturen, Feedback

an Autor. Meist Distiller nötig. Geht auch im freien Acrobat Reader ab 7.0, wenn PDF Autor es zugelassen hat. Unterstützt Vektorgrafiken und Pixelgrafiken. Vektorgrafiken sind z.b. Schriftarten oder vordefinierte Objekte. Lassen sich dadurch beliebig Skalieren (vergrößern), ohne an Qualität zu verlieren. PDF unterstützt beliebige Schriftarten, sind in PDF File ladbar und dann darstellbar. Durch Pixelgrafiken sind Bilder, Fotos, Scans darstellbar. Z.B. beim Einscannen von Dokumenten, Einbinden von Bildern in Dokument. Auch Links sind möglich (ähnlich wie HTML) Z.B. Conference Proceedings (Sammlung von Artikeln/Papers der Konferenz): Meist verfügbar in HTML und PDF.

Links z.b. vom Namen des Autors zum Paper. Z.B. Buch: Links vom Inhaltsverzeichnis zu den entsprechenden Kapiteln.