Konzepte der Informatik

Ähnliche Dokumente
Konzepte der Informatik

Aufgaben zu Stellenwertsystemen

Grundlagen der Informatik

Primzahlen und RSA-Verschlüsselung

Ein polyadisches Zahlensystem mit der Basis B ist ein Zahlensystem, in dem eine Zahl x nach Potenzen von B zerlegt wird.

BITte ein BIT. Vom Bit zum Binärsystem. A Bit Of Magic. 1. Welche Werte kann ein Bit annehmen? 2. Wie viele Zustände können Sie mit 2 Bit darstellen?

Konzepte der Informatik

Gliederung. Was ist der Unicode? Warum gibt es den Unicode? Wie funktioniert er? Wo ist mein Schriftzeichen? Kritische Stimmen

Im Original veränderbare Word-Dateien

Kapitel 3. Codierung von Text (ASCII-Code, Unicode)

Leichte-Sprache-Bilder

Zahlensysteme. von Christian Bartl

Binärdarstellung von Fliesskommazahlen

Informationsdarstellung im Rechner

Zahlensysteme Seite -1- Zahlensysteme

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Zahlensysteme. Zahl Stellenwert Zahl Zahl =

Binär Codierte Dezimalzahlen (BCD-Code)

Daten verarbeiten. Binärzahlen

Anzahl Pseudotedraden: Redundanz: Weitere Eigenschaften?

40-Tage-Wunder- Kurs. Umarme, was Du nicht ändern kannst.

4 Binäres Zahlensystem

Grundlagen der Informatik I Informationsdarstellung

Theoretische Informatik SS 04 Übung 1

Zahlensysteme: Oktal- und Hexadezimalsystem

Jede Zahl muss dabei einzeln umgerechnet werden. Beginnen wir also ganz am Anfang mit der Zahl,192.

Informationsblatt Induktionsbeweis

Englische Division. ... und allgemeine Hinweise

Die Post hat eine Umfrage gemacht

Binäre Bäume. 1. Allgemeines. 2. Funktionsweise. 2.1 Eintragen

Professionelle Seminare im Bereich MS-Office

2. Negative Dualzahlen darstellen

Was meinen die Leute eigentlich mit: Grexit?

A1.7: Entropie natürlicher Texte

Lineare Gleichungssysteme

Einführung in die Informatik I

Das Leitbild vom Verein WIR

Informationssysteme Gleitkommazahlen nach dem IEEE-Standard 754. Berechnung von Gleitkommazahlen aus Dezimalzahlen. HSLU T&A Informatik HS10

Serienbrieferstellung in Word mit Kunden-Datenimport aus Excel

Anleitung über den Umgang mit Schildern

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Zahlensysteme Das 10er-System

Zeichen bei Zahlen entschlüsseln

Das RSA-Verschlüsselungsverfahren 1 Christian Vollmer

10.1 Auflösung, Drucken und Scannen

Anleitung zur Erstellung von Serienbriefen (Word 2003) unter Berücksichtigung von Titeln (wie Dr., Dr. med. usw.)

Papa - was ist American Dream?

Zwischenablage (Bilder, Texte,...)

Einführung in die Programmierung

Was man mit dem Computer alles machen kann

Facharbeit Informatik. Thema:

Prof. Dr. Oliver Haase Karl Martin Kern Achim Bitzer. Programmiertechnik Zahlensysteme und Datendarstellung

1. Stellenwerte im Dualsystem

Das sogenannte Beamen ist auch in EEP möglich ohne das Zusatzprogramm Beamer. Zwar etwas umständlicher aber es funktioniert

Stapelverarbeitung Teil 1

Tevalo Handbuch v 1.1 vom

Der Kalender im ipad

infach Geld FBV Ihr Weg zum finanzellen Erfolg Florian Mock

Guide DynDNS und Portforwarding

Persönliche Zukunftsplanung mit Menschen, denen nicht zugetraut wird, dass sie für sich selbst sprechen können Von Susanne Göbel und Josef Ströbl

Modul 114. Zahlensysteme

Alle Schlüssel-Karten (blaue Rückseite) werden den Schlüssel-Farben nach sortiert und in vier getrennte Stapel mit der Bildseite nach oben gelegt.

Microcontroller Kurs Microcontroller Kurs/Johannes Fuchs 1

Kurzanleitung. MEYTON Aufbau einer Internetverbindung. 1 Von 11

Papierverbrauch im Jahr 2000

Zahlenwinkel: Forscherkarte 1. alleine. Zahlenwinkel: Forschertipp 1

Vorgestellt von Hans-Dieter Stubben

Hardware - Software - Net zwerke

Gezielt über Folien hinweg springen

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Datei Erweiterungen Anzeigen!

PowerPoint: Text. Text

Wir basteln einen Jahreskalender mit MS Excel.

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt 3 1. Semester ARBEITSBLATT 3 RECHNEN MIT GANZEN ZAHLEN

Informationen zum neuen Studmail häufige Fragen

4. AUSSAGENLOGIK: SYNTAX. Der Unterschied zwischen Objektsprache und Metasprache lässt sich folgendermaßen charakterisieren:

Erstellen einer Collage. Zuerst ein leeres Dokument erzeugen, auf dem alle anderen Bilder zusammengefügt werden sollen (über [Datei] > [Neu])

COMPUTER RECHNEN BINÄR

Sowohl die Malstreifen als auch die Neperschen Streifen können auch in anderen Stellenwertsystemen verwendet werden.

Paper Computer Science Experiment

iloq Privus Bedienungsanleitung Schließanlagen Programmierung Version 1 - Copyright 2013

Grundlagen der Informatik (BSc) Übung Nr. 5

Binär- und Hexadezimal-Zahl Arithmetik.

Wichtige Forderungen für ein Bundes-Teilhabe-Gesetz

Eva Douma: Die Vorteile und Nachteile der Ökonomisierung in der Sozialen Arbeit

Grundlagen der Informatik Übungen 1.Termin

Internationales Altkatholisches Laienforum

Lehreinheit E V2 Verschlüsselung mit symmetrischen Schlüsseln

1. Das dekadische Ziffernsystem (Dezimalsystem) Eine ganze Zahl z kann man als Summe von Potenzen zur Basis 10 darstellen:

Sich einen eigenen Blog anzulegen, ist gar nicht so schwer. Es gibt verschiedene Anbieter. ist einer davon.

1 Mathematische Grundlagen

Sollsaldo und Habensaldo

WORKSHOP für das Programm XnView

Wintersemester Maschinenbau und Kunststofftechnik. Informatik. Tobias Wolf Seite 1 von 18

Mind Mapping am PC. für Präsentationen, Vorträge, Selbstmanagement. von Isolde Kommer, Helmut Reinke. 1. Auflage. Hanser München 1999

Transkript:

Konzepte der Informatik Vorkurs Informatik zum WS 2011/2012 26.09. - 30.09.2011 17.10. - 21.10.2011 Dr. Werner Struckmann / Christoph Peltz Stark angelehnt an Kapitel 1 aus "Abenteuer Informatik" von Jens Gallenbacher 1

Codierung Verfahren, welches die Symbole einer Nachricht in eine andere Form bringt ohne den Informationsgehalt einzuschränken. Codierung wird dazu verwendet, die Informationen von der für Menschen verständliche Form in eine für Maschinen verarbeitbare und über Netzwerke kommunizierbare Form umzuwandeln und wieder zurück. Beispiel: Morsecode Code verwendet drei Symbole: Punkt ( ), Strich ( ) und Pause ( ) M O R S E C O D E Quelle: Wikipedia 2

Aspekte der Binär-Codierung Binärcode Codetabellen Codebaum Einsparung von Bits Groß- und Kleinschreibung Informationsgehalt verschiedener Symbole Präfixbildung 3

Binärcode Binärcode / 0/1-Code Ein Binärcode besteht nur aus zwei Zeichen, 0 und 1. Diese beiden Zeichen repräsentieren die beiden Zustände Ausgeschaltet und Eingeschaltet, welche von einem Computer gut verarbeitet werden können. 4

Binärcode Dualsystem* Zahlensystem, das nur zwei verschiedene Ziffern zur Darstellung von Zahlen benutzt Zahlen werden nur mit Ziffern, welche die Werte Null oder Eins annehmen, dargestellt Stellenwertsystem mit der Basis 2 Zahlen 0 bis 8: Null: 0 Eins: 1 Zwei: 10 Drei: 11 Vier: 100 Fünf: 101 Sechs: 110 Sieben:111 Acht: 1000 * Quelle der Folien 5-14: Wikipedia 5

Binärcode Definition und Darstellung von Dualzahlen Ziffern zi werden wie im gewöhnlich verwendeten Dezimalsystem ohne Trennzeichen hintereinander geschrieben. Beispiel: Dezimalzahl 29 29 = 1 * 24 + 1 * 23 + 1 * 22 + 0 * 21 + 1 * 20 = [11101]2 6

Binärcode Umrechnen von Dezimalzahlen in andere Stellenwertsysteme Schreiben Sie die Dezimalzahl 42 als Dual-, Oktal- und als Hexadezimalzahl. Dualzahl: 101010 Rechenweg: 42 : 2 = 21 Rest 0 21 : 2 = 10 Rest 1 10 : 2 = 5 Rest 0 5 : 2 = 2 Rest 1 2 : 2 = 1 Rest 0 1 : 2 = 0 Rest 1 7

Binärcode Oktalzahl: 52 Rechenweg: 42 : 8 = 5 Rest 2 5 : 8 = 0 Rest 5 Hexadezimalzahl: 2A Rechenweg: 42 : 16 = 2 Rest 10 2 : 16 = 0 Rest 2 8

Binärcode Dualzahlen Verschiedene Darstellungsformen der Zahl dreiundzwanzig im Dualsystem: [10111]2 101112 10111(2) 10111B 0b10111 HLHHH L0LLL 9

Binärcode Grundrechenarten im Dualsystem Addition Beispiel 0+0=0 0+1=1 1+0=1 1 + 1 = 10 Multiplikation 0 0 1 1 0=0 1=0 0=0 1=1 Subtraktion Beispiel 0 0=0 0 1 = 1 1 0=1 1 1=0 Beispiel Division Beispiel 0 / 0 = n.def. 0/1=0 1 / 0 = n.def. 1/1=1 10

Binärcode Schriftliche Addition A = 10011010 (154) B = 00110110 (54) Merker = 11111 Ergebnis = 11010000 (208) 11

Binärcode Schriftliche Subtraktion Die Subtraktion verhält sich analog zur Addition. 0 0=0 0 1 = 1 1 0=1 1 1=0 Eine Zahl im Dualsystem kann von der anderen wie im folgenden Beispiel dargestellt subtrahiert werden: 12

Binärcode Schriftliche Multiplikation Wird im Dualsystem genauso durchgeführt wie im Dezimalsystem Beispiel: 1100 * 1101 1100 1101 1100 + 1100 + 0000 + 1100 10011100 13

Binärcode Schriftliche Division 1000010 : 11 = 10110 Rest 0 (= 22 im Dezimalsystem) 011 00100 011 0011 011 000 00 0 14

Codetabellen American Standard Code for Information Interchange ASCII ist der bekannteste Code. Es handelt sich dabei um eine Tabelle, in der alle Zeichen des (amerikanischen) Alphabets entsprechenden Sequenzen aus 0 und 1 zugeordnet werden. _(Leer) A B C D E F G 00000 00001 00010 00011 00100 00101 00110 00111 H I J K L M N O 01000 01001 01010 01011 01100 01101 01110 01111 P Q R S T U V W 10000 10001 10010 10011 10100 10101 10110 10111 X Y Z., : # 11000 11001 11010 11011 11100 11101 11110 11111 Welche Weisheit mag sich wohl hinter dem Code 01001 00011 01000 00000 00100 00101 01110 01011 00101 11100 00000 00001 01100 10011 01111 00000 00010 01001 01110 00000 01001 00011 01000 verbergen? 15

Codebaum Ein Codebaum vereinfacht die Decodierung. Man geht einfach entlang des jeweiligen Pfads (0 oder 1) und sobald man an ein Symbol gelangt, schreibt man es auf und beginnt von Neuem. Decodieren Sie 01000 00001 01100 01100 01111. 16

Bits und Bytes Byte (engl. Bissen ) ist sozusagen ein Happen aus dem Datensalat eines Computers. Es stellt eine kleine Informationseinheit dar. Bit ist englisch als Verkleinerungsform von Byte zu sehen und auch die Abkürzung für Binary Digit, also deutsch Ziffer im Binärsystem. Ein Bit ist also die kleinste Informationsmenge, die man im Computer identifizieren kann. Da alle Symbole die gleiche Anzahl an Bit haben, können wir ganz einfach berechnen, wie viel Bit eine Nachricht mit 100 Zeichen hat : 100 Zeichen mal 5 Bit pro Zeichen gleich 500 Bit. 17

Einsparung von Bits Codieren wir zum Beispiel eine Gen-Sequenz AGATGCCGTTACGA mit diesem Code. 000010011100001101000011100011000110011110100101000000100011001110 0001 Das macht genau 70 Bit. Wenn wir aber einen neuen Code hierfür nehmen, lässt sich die Anzahl der Bits auf 28 senken. 0010001110010110111100011000 18

Groß- und Kleinschreibung Ohne Groß- und Kleinschreibung: ICH HABE LIEBE GENOSSEN Mit Groß- und Kleinschreibung: Ich habe liebe Genossen & Ich habe Liebe genossen Wenn man die Groß- und Kleinschreibung einführt, enthalten alle Symbole mehr Informationen. 19

Informationsgehalt verschiedener Symbole an atte ieen are ei eine eient, a ra er u i err, eine eit it eru, nun ote erne ieer ei u einer utter. In diesem Text stehen nur die Vokale (A,E,I,O,U) und die Konsonanten N, R und T, die meist verwendeten Buchstaben in unserer Sprache. Hns htt sbn Jhr b snm Hrrn gdnt, d sprch r z hm Hrr, mn Zt st hrm, nn wllt ch grn wdr hm zu mnr Mttr. Der gleiche Text, nur fehlen hier alle Vokale. Allerdings ist er deutlich besser lesbar. Hier noch einmal der Originaltext: Hans hatte sieben Jahre bei seinem Herren gedient, da sprach er zu ihm Herr, meine Zeit ist herum, nun wollte ich gerne wieder heim zu meiner Mutter. 20

Informationsgehalt verschiedener Symbole Wenn man unterschiedliche Buchstaben entfernt, entfernt man also auch unterschiedlich viel Informationsgehalt. Das Weglassen von Vokalen scheint nicht so schlimm zu sein wie das von Konsonanten. Das bedeutet, dass nicht jeder Buchstabe die gleiche Menge an Informationen enthält. Dann sollte es doch konsequent sein, wenn nicht jeder Buchstabe die gleiche Anzahl an Bits besäße. Wahrscheinlich könnte man dadurch auch die Größe einer Nachricht und damit die Übermittlungsdauer verringern. Zum Beispiel beim Morsen: der häufigste Buchstabe in unserer Sprache ist das E, dieser wird nur als einzelner kurzer Ton gesendet. Das Q hingegen wird viel seltener verwendet und besitzt beim Morsen auch einen längeren Code lang lang kurz lang. Es liegt also nahe, auch bei der Codierung durch diese Methode Speicherplatz zu sparen. 21

Codebaum Optimierung Verschieben Sie das E um 2 Stellen nach links. 22

Codebaum Optimierung 23

Codebaum Optimierung Jetzt versperren wir mit dem E die Buchstaben D, F und G 24

Präfixbildung Präfix Ein Präfix ist ein Wort oder eine Zeichenfolge, die mit dem Anfang einer anderen Zeichenfolge identisch ist. In der Codierung versucht man Präfixe zu vermeiden, da man dann codierte Nachrichten nicht mehr direkt decodieren kann. E ist mit seinem Code 001 also die Präfix zu den Buchstaben D ( 00100 ), F ( 00110 ) und G ( 00111 ). 25

Präfixbildung Präfixlösung Um die drei Buchstaben wieder codierbar zu machen, müssen wir drei anderen Buchstaben einen längeren Code geben. Zum Beispiel Q, X und Y, welche bei der Häufigkeit unter 0,05% liegen und daher nur sehr selten gebraucht werden. So erhalten die D, F und G sowie Q, X und Y einen 6-stelligen Pfad. Wie viele Bits benötigt man für das Wort GESELLE in den beiden Versionen? 26

Präfixbildung Präfixlösung Das selbe Verfahren lässt sich natürlich auch bei anderen Symbolen anwenden. Zum Beispiel bei dem Leerzeichen, welches von allen Symbolen am häufigsten verwendet wird. Andere Satzzeichen wie Doppelpunkt ( : ), Gedankenstrich ( - ) oder die Raute ( # ) kommen hingegen nur sehr selten vor. Nehmen wir also das Leerzeichen und verschieben es drei Stellen nach links. Dadurch blockieren die Buchstaben A, B und C. Dann verschieben wir die Satzzeichen Doppelpunkt, Gedankenstrich und Raute um eine Stelle nach rechts und fügen die drei blockierten Buchstaben ein. 27

Präfixbildung Präfixlösung 28

Präfixbildung Präfixlösung Allerdings ist A auch ein Buchstabe, der häufig verwendet wird und ist mit einem 6-stelligen Code denkbar schlecht codiert. Demnach ist dies nicht die optimale Lösung für das Problem. Es muss also alles etwas freier im Codebaum getauscht werden. Am besten wird es wohl sein, wenn das Leerzeichen sowie das E 3 Bits erhalten, N, I, S und R jeweils 4 Bit, A, T, D, H, U, L, C und G 5 Bit, Q, Doppelpunkt, Gedankenstrich und Raute 7 Bit und die restlichen Zeichen 6 Bit erhalten. 29

Präfixbildung Präfixlösung Mit diesem Codebaum lässt sich nun die Bit Anzahl dieses Satzes: HANS ZOG EIN TUECHLEIN AUS DER TASCHE, WICKELTE DEN KLUMPEN HINEIN, SETZTE IHN AUF DIE SCHULTER UND MACHTE SICH AUF DEN WEG NACH HAUS., welcher mit dem Anfangsbaum 670 Bit hätte, auf 552 Bit verringern. Dieses Verfahren wird für Archive wie Zip, ARJ, RAR usw. genutzt. Diese Programme nutzen allerdings auch, dass ganze Worte häufig vorkommen und können somit bis über 90% Speicherplatz sparen. Andere Verfahren komprimieren ganze Blöcke von Daten (bzip2) oder auch Teilwörter (LZ77, LZMA). 30

Moderne Text-Kodierung (UTF-8) In Anbetracht der immer stärkeren Globalisierung und des Wunsches eine Kodierung für alle Sprachen der Welt anzubieten, wurde Unicode entwickelt. Unicode definiert Codepoints für eine vielzahl an Zeichen die benutzt werden (z.b. Griechisch, Arabisch, Chinesisch). Es gibt im aktuellen Standard 6 um die 1.1 Millionen definierte Codepoints. Die effiziente Codierung der Texte ist hier äußerst wichtig. UTF-8 ist in den ersten 128 Codepoints identisch mit ASCII, das bedeutet, dass die weit verbreiteten ASCII-Texte automatisch UTF-8 konform sind. 31

Moderne Text-Kodierung (UTF-8) Ein UTF-8 Zeichen, dass mit einer 1 beginnt zeigt an, dass es entweder der Beginn eines Mehr-Byte-Zeichens oder Teil eines solchen Zeichens ist. Ein UTF-8 Zeichen kann somit 1 bis 6 Byte lang sein, wobei die am häufigsten genutzten Zeichen in den unteren Code-Regionen zu finden sind. Diese Kodierung ist selbstkorrigierend. Falls Teile eines Zeiches verloren gehen, ist nur das eine Zeichen betroffen, der Beginn eines neuen Zeichens kann ohne Probleme ermittelt werden. Quelle (Grafik): Wikipedia 32

Vielen Dank für Ihre Aufmerksamkeit! 33