Diskrete Cosinustransformation (DCT)

Ähnliche Dokumente
Bildkompression InTh, 2005, JPEG, Hak, Rur, 1

Standbildcodierung. Dipl.-Ing. Guido Heising. Digitale Videotechnik, SS 02, TFH Berlin, Dipl.-Ing. G. Heising G. Heising, K.

Grafikformate. Grafikformate. Digitale Bildverarbeitung Bildkompression

Digitalisierung. analoges Signal PAM. Quantisierung

Multimediatechnik / Video

MPEG Audio Layer 1. Fachbereich Medieninformatik. Hochschule Harz. Referat. Kolja Schoon. Thema: MPEG Audio Layer 1

Proseminar Datenkomprimierung Dr. U. Tamm. JPEG - Kompression WS 2002/03. Torsten Zichner

Multimediatechnik / Video

'LJLWDOH%LOGHUXQG'DWHLIRUPDWH

Kompression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Folie 2

Verlustbehaftete Kompression. JPEG: Joint Photographic Experts Group

Digitales Video. Digitales Video

Image Compression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Vorlesung FH-Hagenberg SEM. Backfrieder-Hagenberg. Backfrieder-Hagenberg

JPEG Kompression technische Realisierung

Image Compression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Vorlesung FH-Hagenberg SEM. Backfrieder-Hagenberg. Backfrieder-Hagenberg

Image Compression. Vorlesung FH-Hagenberg DSB

Datenkompression. 1 Allgemeines. 2 Verlustlose Kompression. Holger Rauhut

Verlustbehaftete Kompression. Verfahren zur verlustbehafteten Bildkodierung (auch verlustfreier Modus vorhanden)

Graphische Datenverarbeitung

JPEG - Kompression. Steffen Grunwald, Christiane Schmidt, Stephan Weck TIT01EGR BA-Mannheim 21. Mai 2002

Übung zur Vorlesung. Digitale Medien. Vorlesung: Heinrich Hußmann Übung: Renate Häuslschmid, Hanna Schneider

ffl Die Portable Bitmap Utilities (PBM) manipulieren monochrome Bilder. ffl Die Portable Greymap Utilities (PGM) manipulieren Grauwert-Bilder.

Kompressionsverfahren

Verlustfreie Kompressionsverfahren. RLE, LZW, Huffmann, CCITT, ZIP

Perlen der Informatik I Wintersemester 2012 Aufgabenblatt 6

Algorithmen und Datenstrukturen (für ET/IT)

Lossy Bildkompression: Techniken und Bildqualität

1 Einführung. Bildformate Analyse der LSB-Ersetzung Weitere steganographische Algorithmen. Syndromkodierung in der Steganographie

Universität Trier. Fachbereich IV. Wintersemester 2004/2005. Wavelets made easy. Kapitel 2 Mehrdimensionale Wavelets und Anwendungen

Thema: JPEG / Motion JPEG. Fachbereich Medieninformatik. Hochschule Harz. JPEG / Motion JPEG. Referat. Autor: Andreas Janthur

Datenkompression. Vortrag von Markus Durzinsky Student der Otto-von-Guericke-Universität Magdeburg

Bildkompression Proseminar Datenkompression Daniel Koch

Die diskrete Cosinustransformation

Digitale Medien. Übung zur Vorlesung. Vorlesung: Heinrich Hußmann Übung: Renate Häuslschmid

Inhaltsverzeichnis. 1 Einführung 1

Invertierung, Separierbarkeit

JPEG, MPEG & Co. Alex Titze Angewandte Informatik FHTW-Berlin

Kap.4 JPEG: Bildkompression. Ziel: Gegeben sind Daten y R N. Bestimme C R N N mit C C T = I, so dass x = C y dünbesetzt ist.

Kompressionsverfahren

Hauptdiplomklausur Informatik Februar 2006: Multimedia Systems

Datenkompressionsverfahren für mobile Endgeräte

compressed domain image retrieval

Algorithmen und Datenstrukturen (für ET/IT)

Bildkompression am Beispiel JPEG

Datenkomprimierung. Lauflängenkodierung

J.P.E.G. Standard. J.P.E.G. Eigenschaften. J.P.E.G. System. JPEG Verschlüsselungsschritte. Farbmodell

Einführung Aufgabe 3 - MPEG. Tobias Reinsch 2011

5 JPEG. 5.1 Bayer Filter. 5.2 Überblick. 5.3 Diskrete Cosinus-Transformation. 5.4 Bildmodell. 5.5 Codierung. 5.6 Übertragungsmodi

Grafikformate: JPG - PNG

Mathematische Methoden der graphischen Datenverarbeitung

Einführung Medienforscher Aufgabe 3 - MPEG. Tobias Reinsch 2011

Darstellung als Filterbank. Annahme für die Codierung: bestimmter Betrachtungsabstand, Wiedergabegröße Bestimmter Betrachtungswinkel für das Auge.

Run Length Coding und Variable Length Coding

DCT: Diskrete Kosinus-Transformation

2. Digitale Codierung und Übertragung

(Bitte geben Sie bei der Beantwortung von Fragen eine Begründung bzw. bei der Lösung von Kurzaufgaben eine kurze Berechnung an!)

Digitale Bilder. Ein Referat von Jacqueline Schäfer und Lea Pohl Am

JPEG. Seminar: Kompressionsalgorithmen. Ruslan Ragimov. 5. September 2012

Grafikformate. Grafikformate. Digitale Bildverarbeitung Bildkompression

Digitales Rauschen. Fachbereich Medieninformatik. Hochschule Harz. Digitales Rauschen. Referat. Joachim Schenk. Abgabe:

Bilddatenformate BMP GIF JPG. Digitale Bildverarbeitung Liedtke 7.1. Bezeichnung: Microsoft Windows Bitmap, BMP, DIB

Relevante Frequenztransformationen

Datenkompression. Theorie

Curriculum. Lineare Algebra 1.

Der JPEG-Standard. Der JPEG-Standard. Der JPEG-Standard. Der JPEG-Standard. Lineare Quantisierung

Inhalte. Photogram. Aufnahmesysteme. HS BO Lab. für Photogrammetrie: Digitalisierung analoger Bilder 1

Quantisierung, Umwandlung der Werte in Bits

MPEG Video Layer 1. Fachbereich Medieninformatik. Hochschule Harz. Referat. Kolja Schoon. Thema: MPEG Video Layer 1

9 Fourier-Transformation

Beschränktheit, Monotonie & Symmetrie

Kompressionsverfahren- JPEG 2000

Independent JPEG Group. JPEG Software Tools

Mathematik für Naturwissenschaftler II SS 2010

Grundlagen der Bildverarbeitung: Übung 3

HTBLA Neufelden Fourierreihen Seite 1 von 14. Peter Fischer

HTBL Steyr Bildkomprimierung Seite 1 von 9. Ernst Geretschläger

Zusatzaufgabe 3 für Informatiker

Spektrumanalyse. Inhalt. I. Einleitung 2. II. Hauptteil 2-8

Digitale Bildverarbeitung (DBV)

, Franz J. Hauck, Verteilte Systeme, Univ. Ulm, [2006w-MMK-D-VoD.fm, ]

Analyse und Vergleich aktueller Videokompressionsverfahren

Beispielhafte Testfragen (auch aus Schülerreferaten, Fragen können redundant sein, keine Audio Kompression berücksichtigt):

Angewandte Mathematik und Programmierung

Rudolf Mäusl. Fernsehtechnik. Vom Studiosignal zum DVB-Sendesignal 4., erweiterte und überarbeitete Auflage. lhp Hüthig Verlag

2. Digitale Codierung und Übertragung

Videos für das Internet

Bilder. Bildsuchmaschiene. Bildsuche. Überblick. Beispiele im WWW. Inhaltsbasierte Bildsuche Motivation

Filtern, JPEG, MP3. Fourier-Analyse JPEG MP3. Filtern - Wavelet

Puls-Code-Modulation. Thema: PCM. Ziele

Mathematik I Herbstsemester 2018 Kapitel 2: Stetigkeit

Digitales Fernsehen DVB

Datenkompression: Fraktale Kompression. H. Fernau

Quellencodierung NTM, 2006/05, 9.3 Quellencodierung, Rur, 1

Huffman-Kodierung. Fachbereich Medieninformatik. Hochschule Harz. Huffman-Kodierung. Referat. Henner Wöhler. Abgabe:

Digitalisierung. Vorlesung FH-Hagenberg MBI

Basisinformationstechnologie II

Pulse Code Modulation

Woraus besteht ein Bild? (c) Winfried Heinkele

Musterlösung. Prüfung: Datenformate für interaktive Medien + Computergrafik und Bildverarbeitung

Transkript:

Fachbereich Medieninformatik Hochschule Harz Diskrete Cosinustransformation (DCT) Referat Björn Wöldecke 10954 Abgabe: 15.01.2007

Inhaltsverzeichnis Einleitung / Vorwort... 1. Methoden zur Datenreduktion... 2. Diskrete Cosinustransformation (DCT)... 3. Quantisierung / Irrelevanzreduktion... 4. Redundanzreduktion... 5. Literaturverzeichnis... 1 1 2 4 4 5

Einleitung / Vorwort In der heutigen Zeit, da die Digitalisierung der Medien immer weiter fortschreitet, werden auch die Kompressionsmethoden für multimediale Inhalte immer ausgefeilter. Eine wichtige Grundvoraussetzung für viele Datenreduktionsverfahren ist hierbei die diskrete Cosinustransformation, die unter anderem bei JPEG und MPEG zum Einsatz kommt. 1. Methoden zur Datenkompression Nach [SCHMIDT] gibt es zwei grundlegende Ansätze zur Datenkompression: die Redundanz- und die Irrelevanzreduktion. Mittels der Redundanzreduktion wird versucht, überflüssige (=redundante) Daten möglichst vollständig zu eliminieren. Die Daten werden dabei lediglich in eine kompaktere Form umgewandelt und es ist jederzeit möglich die ursprüngliche Form wiederherzustellen. Man spricht in diesem Zusammenhang auch von verlustloser Kompression. Die Irrelevanzreduktion ist dagegen radikaler. Unwichtige (=irrelevante) Daten werden hier einfach weggelassen. Man spricht dann von verlustbehafteter Kompression. Die DCT allein ist noch kein Kompressionsverfahren. Sie wird lediglich eingesetzt, um Bilddaten in eine günstigere Form für die nachfolgende Datenreduktion umzuwandeln. Dazu wird das Bild zuerst in Blöcke von jeweils 8x8 Pixeln zerlegt. Jeder dieser Blöcke durchläuft anschließend die diskrete Cosinustransformation. Vereinfacht ausgedrückt, werden dabei Regelmäßigkeiten im Bild gefunden und in Form von Zahlenwerten (DCT-Koeffizienten) wiedergegeben. Diese werden dann durch Quantisierung gemäß psychophysischer Parameter in ihrer Genauigkeit beschränkt (Irrelevanzreduktion) wodurch sie optimal für eine abschließende Redundanzreduktion vorbereitet sind. Zerlegung in 8x8-Blöcke DCT Quantisierung Redundanzreduktion Abb. 1: Schema der JPEG-Kompression Abb. 1 zeigt eine schematische Darstellung des Kompressionsvorgangs, wie er auch bei JPEG zum Einsatz kommt. 1 Detaillierte Informationen zur JPEG-Kompression können bei [SCHMIDT] S. 138-142 und [REIMERS] S. 60-71 nachgelesen werden. Seite: 1

2. Diskrete Cosinustransformation (DCT) Ein digitalisiertes Graustufen-Bild besteht aus einer Abfolge von Helligkeitswerten. Im Prinzip ist das nichts anderes als eine mathematische Funktion von diskreten Werten (diskrete Funktion), die in einer Wertetabelle niedergeschrieben wurden. Eine Funktion lässt sich jedoch mittels Fourier-Analyse in eine Form überführen, die aus mehreren Sinus- und Cosinusfunktionen besteht (vgl. [PAPULA] S. 158 ff). Das bedeutet, dass sich die Bildinformation aus mehreren überlagerten Frequenzen zusammensetzen lässt. Da aber diskrete Werte vorliegen, muss die diskrete Fouriertransformation verwendet werden. Aufgrund der Möglichkeit, den unbenutzten negativen Wertebereich für t mit einer gespiegelten Version der Werte zu belegen, lässt sich eine gerade Funktion erzeugen. Dadurch werden alle Sinusanteile (ungerade Funktion) zu Null und fallen somit weg. Das heißt, man kann sich auf eine diskrete Cosinustransformation beschränken. 2 Helligkeitswerte 110 112 111 109 106 105 107 107 98 97 97 95 92 90 94 91 DCT Abb. 2: Transformation eines Bildblocks (die Zahlenwerte stammen aus [SCHMIDT] S. 140 Abb. 3.50) 404 42-1,2-3,2 0,4-0,8 1,2-6,4-0,4-0,8-0,4-1,2 1,76 4,4-0,8-3,2 DCT-Koeffizienten 2 Eine genauere mathematische Abhandlung hierzu lässt sich bei [SCHMIDT] S. 138-140 nachlesen. Seite: 2

Mit Gleichung (1.2) lassen sich die DCT-Koeffizienten für jeden Pixel eines Bild-Blocks bestimmen. Meistens wird N = 8 gewählt, so dass jeweils Blöcke von 8x8 Pixeln transformiert werden. Das Ergebnis ist dann wieder ein gleich großer Block bestehend aus den DCT-Koeffizienten (Abb. 2). Man kann sich das Ergebnis von Gleichung (1.2) auch als Überlagerung von DCT-Basisfunktionen vorstellen (Abb. 3). Jeder der Blöcke steht für eine horizontale und vertikale Ortsfrequenz. Von besonderem Interesse ist dabei der linke obere Block. Er besteht nur aus einer einheitlichen Fläche, die den durchschnittlichen Grauwert des Bild-Blocks angibt. In der bisherigen Betrachtung wurde der Einfachheit halber nur von einem Graustufen-Bild ausgegangen. Die Chrominanz-Werte (Farbton), die in Farbbildern zusätzlich zu den Luminanz-Werten (Helligkeit) gespeichert werden, lassen sich nach dem gleichen Prinzip transformieren. Horizontale Ortsfrequenz Vertikale Ortsfrequenz Abb. 3: DCT-Basisfunktionen [REIMERS] Seite: 3

3. Quantisierung / Irrelevanzreduktion Wie bereits in Abschnitt 2 erwähnt wurde, werden die DCT-Koeffizienten noch einer Irrelevanzreduktion unterzogen. Dies geschieht durch Division der DCT-Koeffizienten durch die Quantisierungsschrittweite und anschließender Rundung auf ganzzahlige Werte. Für jeden DCT-Koeffizienten wird eine eigene Quantisierungsschrittweite angegeben. Die Werte liegen als Quantisierungsmatrix (Abb. 4) vor, die dieselbe Größe hat, wie die DCT-Koeffizientenmatrix. Es existieren separate Quantisierungsmatrizen für Helligkeit und Farbe. Die Werte hierfür wurden empirisch in psychologischen Experimenten ermittelt. Dass die Quantisierung zu keinen bzw. nur gering sichtbaren Verlusten führt, liegt daran, dass der menschliche Sehsinn bei höheren Ortsfrequenzen schlechter zwischen Helligkeits- und Farbabstufungen unterscheiden kann. Da die hochfrequenten Anteile oft sehr klein sind, werden diese durch die Quantisierung meist vollständig eliminiert. 110 112 111 109 106 105 107 107 98 97 97 95 92 90 94 91 DCT-Koeffizienten Quantisierung 4 4 5 6 4 5 6 7 5 6 7 8 6 7 8 8 101 10 0 1 0 0 0-1 0 0 0 0 0 1 0 0 DCT-Koeffizienten (quantisiert) 4. Redundanzreduktion Quantisierungsmatrix Abb. 4: Quantisierung und Sequenzierung von DCT-Koeffizienten (die Zahlenwerte stammen aus [SCHMIDT] S. 140 Abb. 3.50) Dadurch, dass die DCT-Koeffizienten durch die Quantisierung in ihrem Wertebereich beschränkt wurden, wird nicht mehr für alle Koeffizienten die gleiche Anzahl an Bits benötigt. Die höherwertigen Bits sind in den Fällen geringerer Bitanzahl also immer Null und können deshalb eingespart werden. Eine weitere Möglichkeit besteht darin, mittels Run- Length-Encoding alle restlichen DCT-Koeffizienten, die den Wert Null haben, komplett wegzulassen. Dazu müssen die DCT-Koeffizienten aber in eine spezielle Zickzack-Reihenfolge (Abb. 4) gebracht werden. Dadurch wird sichergestellt, dass die höheren Frequenzen - bei denen die Wahrscheinlichkeit größer ist, dass sie Null werden - erst zum Schluss kommen. (vgl. [REIMERS] S. 65-66) Seite: 4

5. Literaturverzeichnis [SCHMIDT] Ulrich Schmidt, Professionelle Videotechnik, 4. aktualisierte und erweiterte Auflage, Springer Verlag, 2005 [REIMERS] Ulrich Reimers, DVB, Second Edition, Springer Verlag, 2005 [PAPULA] Lothar Papula, Mathematik für Ingenieure und Naturwissenschaftler, 10. Auflage, Friedr. Vieweg & Sohn Verlagsgesellschaft, 2001 Seite: 5