Qualitätsmessung. Übersicht. Einleitung. Einleitung Grundlagen MSE PSNR SSIM Quellen

Ähnliche Dokumente
Bildverarbeitung Herbstsemester Punktoperationen

Statistische Kenngrößen. Histogramm. Grundlagen zur statistischen Signalverarbeitung. Statistische Beschreibung von Audio

Antrittsvorlesung Seh ich schlecht oder ist der Rasen verschwommen?

Statistik K urs SS 2004

Lage- und Streuungsparameter

Grundlagen der Videotechnik, Farbe 2

W-Seminar: Versuche mit und am Menschen 2017/2019 Skript

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Versuch C: Auflösungsvermögen Einleitung

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

Diese Lücken sollten nicht auch bei Ihnen vorhanden sein: Aufgrund einer statistischen Untersuchung entsteht eine geordnete bzw. ungeordnete, die durc

Ausführliche Lösungen zu ausgewählten Aufgaben von ÜB 5 und 6. Streudiagramm

TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN

Diskrete Cosinustransformation (DCT)

Praktikum Sensitometrie Bestimmung des Signal Rausch Verhältnisses (SRV) eines Flachbett-Scanners

1 Einführung. Bildformate Analyse der LSB-Ersetzung Weitere steganographische Algorithmen. Syndromkodierung in der Steganographie

Kapitel 2. Mittelwerte

Kapitel 5. Prognose. Zeitreihenanalyse wird aus drei Gründen betrieben: Beschreibung des Verlaufs von Zeitreihen.

Bildverarbeitung Herbstsemester

Distributed Algorithms. Image and Video Processing

Der diskrete Kalman Filter

2. Schnitterkennung Video - Inhaltsanalyse

Abwägen von Qualität und Leistung beim Dekodieren von H.264 Video. Diplomverteidigung Michael Roitzsch

Passive Fingerabdrücke / Übertragbarkeit

Passive Fingerabdrücke / Sicherheit

Bildverarbeitung: Filterung. D. Schlesinger () Bildverarbeitung: Filterung 1 / 17

Protokoll. Messung des Visuellen Auflösungsvermögens durch Bestimmung der Modulationsübertragungsfunktion (MÜF) mit dem Campbell Muster

Einführung in die medizinische Bildverarbeitung WS 12/13

TEIL 11: BIVARIATE ANALYSE FÜR ORDNINALSKA- LIERTE VARIABLEN

Mustererkennung. Übersicht. Unüberwachtes Lernen. (Un-) Überwachtes Lernen Clustering im Allgemeinen k-means-verfahren Gaussian-Mixture Modelle

Liebe Bianca, hier die Zusammenfassung Ihrer Ergebnisse. Ihr Beauty-Score: Ihr Beauty-Quotient: 117. Ihre Figuranalyse:

Kalibration einer CCD-Kamera oder DSLR-Kamera zur Messung der Helligkeit des Himmelshintergrundes

Industrielle OCR für die Herstellung von Bildröhren

Digitale Bildverarbeitung Einheit 5 Bilder und Statistik

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Kapitel VII - Konzentration von Merkmalswerten

Heron-Verfahren. Inhaltsverzeichnis. Beispiel. aus Wikipedia, der freien Enzyklopädie

Übungen mit dem Applet Vergleich von zwei Mittelwerten

Übungen mit dem Applet. by Michael Gärtner

Hackenbusch und Spieltheorie

Kapitel 7. Crossvalidation

Chapter 2 Image Similarity. Chapter 2 Image Similarity

Zu hell oder zu dunkel? Histogramm im ueye Cockpit nutzen

Technische Universität Dresden

Digitale Bildbearbeitung und Fotografie. Dozenten: Arne Scheffer

5 Exkurs: Deskriptive Statistik

Eizo Monitortest Onlineanwendung zur Beurteilung Ihres Monitors

Korrektur: Lineare Regression in Excel

M0 BIO - Reaktionszeit

Gebrauchsanleitung für Lehrpersonen Verwendung der Excel- Auswertungsbogen für ein Schülerinnen- und Schülerfeedback

LARSIM-Anwendertreffen 2014

Kurzbericht (Aktenzeichen: II 3-F / SWD ) Titel (Langfassung): Trittschalldämmung von austauschbaren Bodenbelägen

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Die erhobenen Daten werden zunächst in einer Urliste angeschrieben. Daraus ermittelt man:

Digitale Bildverarbeitung Einheit 6 Punktoperationen

Beispiel 4 (Einige weitere Aufgaben)

2. Schnitterkennung Videoanalyse

Observatoriumspraktikum WS 2006/07. Teil 1 CCD-Kamera Dunkelstrombestimmung

Ganzrationale Funktionen

Webergänzung zu Kapitel 10

Übungen mit dem Applet Wahrscheinlichkeitsnetz

P2-55: Franck-Hertz-Versuch

Digitale Bildbearbeitung und Fotografie. Dozenten: Arne Scheffer, Olaf Glaser

Stretching Fitswork und Photoshop. Markus Blauensteiner AAS Gahberg 2014

Skript zum Kurz-Referat:

Übungen mit dem Applet Zentraler Grenzwertsatz

Statistik I. Methodologie der Psychologie

Übung: Computergrafik 1

Physikalisches Fortgeschrittenenpraktikum Gammaspektroskopie. Auswertung

QUADRATISCHE GLEICHUNGENN

Videokompression am Beispiel H.264

Was sind Zusammenhangsmaße?

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Physik für Biologen und Zahnmediziner

4. Segmentierung von Objekten Video - Inhaltsanalyse

Versuch 17: Kennlinie der Vakuum-Diode

compressed domain image retrieval

Biometrieübung 10 Lineare Regression. 2. Abhängigkeit der Körpergröße von der Schuhgröße bei Männern

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Mathematik: Mag. Schmid Wolfgang Arbeitsblatt 5 4. Semester ARBEITSBLATT 5 WURZELGLEICHUNGEN

Praktikum Sensitometrie

1. Inhaltsverzeichnis. 2. Abbildungsverzeichnis

Einfache Varianzanalyse für unabhängige Stichproben

Medizinisches Beispiel

Deskriptive Statistik

FH Gießen-Friedberg, FB 06 (MNI) Lösungen zu Übungsblatt 5 Lineare Algebra 21. November 2008 Prof. Dr. H.-R. Metz

Medienforensik - Manipulationserkennung. Multimedia Sicherheit, Martin Steinebach

3.2 Streuungsmaße. 3 Lage- und Streuungsmaße 133. mittlere Variabilität. geringe Variabilität. große Variabilität

ANOVA und Transformationen

Begriffe (moodle-intern) Bedeutung Beispiel

Mathematisch-Naturwissenschaftliche Fakultät I der Humboldt-Universität zu Berlin Institut für Physik Physikalisches Grundpraktikum.

Statistische Methoden in den Umweltwissenschaften

Auswertung P2-10 Auflösungsvermögen

1 EINLEITUNG MESSKONZEPTE UND IHRE EIGENSCHAFTEN... 7

Transkript:

Qualitätsmessung Übersicht Einleitung Grundlagen MSE PSNR SSIM Quellen Einleitung Bei der verlustbehafteten Kompression von Videodaten unterscheiden sich Ausgangsbild und Ergebnis. Es wird versucht, Bildinformationen, die das visuelle System des Menschen nicht oder nicht so stark wahnimmt, zu entfernen oder mit geringerer Genauigkeit abzuspeichern. Je größer die Kompression, desto mehr Informationen müssen entfernt werden. Bei zu großer Kompression wird der Unterschied zur Quelle immer stärker sichtbar, die Qualität leidet. Zur Messung der Qualität von Videomaterial gibt es verschiedene Verfahren, die einen Zahlenwert ergeben, der etwas über die Qualität des Materials aussagt. Man kann zum einen die mathematischen Unterschiede zwischen dem ursprünglichem und dem komprimierten Videomaterial messen. So kann man erkennen, wie viele Bildinformationen entfernt wurden. Da jedoch die menschliche Wahrnehmung bestimmte Informationen nicht oder nicht so stark wahrnimmt, sagt die rein mathematische Ähnlichkeit nicht viel über die tatsächliche wahrgenommene Bildqualität aus. Andere Verfahren versuchen, das menschliche visuelle Wahrnehmungssystem mit mathematischen Modellen nachzuempfinden und so die wahrgenommene Qualität zu errechnen. Wir werden hier die 3 populärsten Qualitätsindizes unter die Lupe nehmen: MSE (Mean Squared Error) PSNR (Peak Signal to Noise Ratio) SSIM (Structural SIMilarity)

MSE Der MSE (Mean Squared Error) beschränkt sich auf die rein qualitative Betrachtung von Bildfehlern. Ein Referenz und ein Testbild werden miteinander verglichen, und es wird für jedes Pixel der Unterschied in der Helligkeitskomponente betrachtet und diese Differenzen quadriert und aufsummiert. Diese Summe wird dann über die Anzahl der Pixel gemittelt. Als Ergebnis erhalten wir die durchschnittliche quadrierte Abweichung zwischen den beiden Bilder. Manchmal wird anstelle des MSE auch der RMSE (Root Mean Squared Error) angegeben. RMSE ist die Quadratwurzel aus MSE. PSNR PSNR (Peak Signal to Noise Ratio) basiert auf dem MSE und ist im Grunde eine Anpassung an die menschliche Wahrnehmung, die Reize logarithmisch wahrnimmt. PSNR (Einheit db) ist folgendermaßen definiert: PSNR=20 10 log 255 RMSE Es gibt einige leicht davon abweichende Definitionen, diese ist aber die gebräuchlichste. Je größer der RMSE, desto kleiner der PSNR Wert. Also gilt bei PSNR: Je größer desto besser. Wenn man viele Test und Referenzbilder von einer Anzahl Testpersonen bewerten lässt und die gemittelte Wertung gegen den PSNR Wert aufträgt, erhält man folgendes Diagramm [1]: Auf der y-achse ist die Bewertung der Testpersonen aufgetragen (MOS, Mean Opinion Score), auf der x-achse stehen die PSNR Werte.

Wenn man alle Markierungen bei einem bestimmten PSNR Wert betrachtet, so sieht man vor allem im Mittelteil des Graphen eine enorme Spannweite. Bilder mit einem PSNR von ungefähr 30 db wurden von den Testpersonen mit Wertungen zwischen 25 und fast 80 auf einer Skala zwischen 1 und 100 versehen. Bilder, die von den Testpersonen mit einer Qualität von 80 bewertet wurden, hatten PSNR Werte zwischen 30 und 50 db. Diese enorme Diskrepanz zwischen der wahrgenommenen und der mathematischen Qualität ist die große Schwäche von MSE und PSNR. Das kann man auch sehr gut an dieser Bilderserie verdeutlichen: Hier einige Beispielbilder [1], alle haben einen identischen MSE und somit auch PSNR: Referenzbild SSIM = 1.0000 Kontrastkorrigiertes Bild SSIM = 0.9168 Helligkeitskorrigiertes Bild SSIM = 0.9900 Extreme JPEG Blockartefakte SSIM = 0.6949 Weichgezeichnetes Bild SSIM = 0.7052 Salz und Pfeffer -Rauschen SSIM = 0.7748 Obwohl diese Bilder konstuiert sind und in der Realität nicht in dieser extremen Form auftreten, zeigen sie doch die Schwächen dieser beiden Verfahren klar auf. PSNR ist in der compare() Funktion von Avisynth eingebaut, dort werden auch noch einige weitere statistische Daten über die Unterschiede der 2 Clips, die der Funktion übergeben werden angezeigt.

SSIM Einen ganz anderen Ansatz verfolgt der Qualitätsindex SSIM. Hier wird versucht, die Ähnlichkeit der Bildstruktur (Structural SIMilarity) zu erfassen. Der Begriff Struktur eines Bildes bezeichnet die Abhängigkeiten zwischen benachbarten Bildpunkten, die unabhängig von der Helligkeit und dem Kontrast in dieser Region des Bildes sind. Beim Vergleich zweier Bilder (Videoframes) wird ein Bildfenster von 11x11 Pixeln (dieses Fenster wird einer drehsymmetrischen Gaussverteilung gewichtet, um weiter entfernte Pixel weniger stark zu berücksichtigen) wird nacheinander über das ganze Frame bewegt, so dass jeder Bildpunkt einmal in der Mitte des Fensters war. Jetzt werden die Inhalte beider Fenster verglichen. Das geschieht in 3 Stufen: Der Erste Test (luminance comparison) untersucht, ob die Bildfenster sich in der durchschnittlichen Helligkeit unterscheiden. Der zweite Test (contrast comparison) untersucht, wie groß der Unterschied zwischen den Kontrasten der Fenster ist. Im dritten Test (structural comparison) wird die Struktur der Bilder verglichen. Jeder dieser Test ergibt eine Maßzahl, die zwischen 0 (total unterschiedlich) und 1 (identisch) liegt. Die Maßzahlen werden verrechnet. Dann wird das Bildfenster um ein Pixel verschoben und das Verfahren für das neue Fenster wiederholt. Am Ende werden die Wertungen für alle Fenster zu einer Gesamtwertung zusammengefasst, oder es wird anhand der Werte eine Fehlerkarte für das Bild erstellt. Um den Ansatz zu verdeutlichen, betrachten wir jetzt 2 Signale, die wir vergleichen wollen. Diese zwei Signale seien Teile der Helligkeitskomponente einer Bildzeile, das blaue Signal ist das Original und das rote Signal ist z.b. durch verlustbehaftete Kompression verändert. 10 9 8 7 6 5 4 3 2 1 0-1 -2-3 -4 Signale 0 1 2 3 4 5 6 7 Sig 1 Sig 2 Die negativen Werte im blauen Signal machen zwar nicht wirklich Sinn, aber es geht hier in erster Linie ums Prinzip.

Im ersten Schritt wird die lokale Bildhelligkeit bestimmt, also die Helligkeit des Bildes an der betrachteten Stelle. Da hohe Werte für helle Pixel stehen und niedrige für dunkle kann man die Durchschnittshelligkeit als Durchschnitt der Pixelwerte berechnen. Die Durchschnittshelligkeiten sind als grüne Linie für das rote Signal und als lilane Linie für das blaue Signal in das Schaubild eingetragen. Die beiden Bildteile haben unterschiedliche Bildhelligkeiten. Diese unterschiedlichen Helligkeiten fließen in eine erste Wertung, dem Helligkeitsvergleich (luminance comparison) ein. Als nächstes werden die beiden Bildteile auf die gleiche Durchschnittshelligkeit gebracht, indem die jeweilige durchschnittliche Helligkeit abgezogen wird: Helligkeitskorrigiert 8 7 6 5 4 3 2 1 0-1 -2-3 -4-5 -6-7 0 1 2 3 4 5 6 7 Lumk1 Lumk2 Jetzt wird von den helligkeitskorrigierten Signalen der Kontrast bestimmt. Als Maß dafür nimmt man die sog. Standardabweichung, die Wurzel des mittleren Quadrats der Abweichung vom Mittelwert der Helligkeit. Diese Standardabweichung ist umso größer, je größer die Ausschläge des Signals sind, d.h. Je unterschiedlicher hell die einzelnen Pixel unserer Bildzeile sind. Das rote Signal hat also eine größere Standardabweichung als das blaue Signal, und somit einen größeren Kontrast. Die unterschiedlichen Kontraste fließen in die zweite Wertung, den Kontrastvergleich oder contrast comparison ein. Die Signale werden jetzt auch auf die selbe Standardabweichung und somit Kontrast gebracht, indem sie durch ihre Standardabweichung geteilt werden.

Kontrastkorrigiert 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0-0,1-0,2-0,3-0,4-0,5-0,6 0 1 2 3 4 5 6 7 Conk1 Conk2 Um die Ähnlichkeit zwischen diesen beiden Signalen zu bestimmen, bedient man sich eines mathematischen Werkzeugs, dem Skalarprodukt oder auch innerem Produkt. Das Ergebnis des Skalarprodukts der beiden Vektoren fließt in die dritte Wertung ein, den Strukturvergleich (structural comparison). Die drei Wertungen werden kombiniert und ergeben den SSIM Wert für diese beiden Bildteile, der zwischen 0 und 1 liegt. Je höher die Werte, desto größer die strukturelle Ähnlichkeit. SSIM ist gegenüber Helligkeits- und Kontraständerungen nicht so empfindlich wie PSNR, da diese Faktoren separat bewertet werden. Das deckt sich mit unserer Wahrnehmung, die Helligkeits- und Kontrastverschobenen Bilder oben empfinden wir qualitativ nicht als wesentlich schlechter, während die Bilder, bei denen die Bildstruktur zerstört ist, deutlich schlechter aussehen. Auch statistische Messungen haben ergeben, dass SSIM den subjektiven Qualitätseindruck deutlich besser modelliert als PSNR.

Man sieht auf diesem Diagramm [1], dass die Bewertungen der Testpersonen und die SSIM Bewertungen viel weniger weit auseinanderliegen, als die PSNR. Der MOS für Bilder mit gleichem SSIM Wert unterscheiden sich in Extremfällen um 30 Punkte, im Normalfall aber nur zwischen 10 und 20 Punkte. Die SSIM Werte für Bilder gleichen MOS liegen höchstens ca 0.35 in den niederqualitativen Bereichen auseinander. Generell gilt: Je besser die Qualität der Bilder, desto mehr stimmen SSIM und MOS übereinander. Jedoch sieht man, dass trotz der besseren Korrelation, nicht annähernd von einer objektiven Qualitätsmessung gesprochen werden kann. Man sollte deshalb SSIM nicht zu hoch bewerten. Es gibt ein SSIM Plugin von lefungus für avisynth, das es erlaubt, mit avisynth SSIM Messungen durchzuführen. Jedoch weicht die Implementierung aus Geschwindigkeitsgründen vom ursprünglichen Konzept ab. Es wird ein 8x8 Bildfenster ohne Gewichtung verwendet, ausserdem wurde ein Lumimasking Mechanismus eingebaut, der die SSIM Wertungen nochmals nach psychovisuellen Gesichtspunkten gewichtet. Der Originalentwurf sieht weiterhin nur die Bewertung der Helligkeitswerte vor, während das Plugin auch die Farbigkeit strukturell auswertet. Quellen: [1]http://www.cns.nyu.edu/~zwang/files/research/ssim/index.html (Inzwischen ist die endgültige Version des Papers über SSIM verfügbar, die Informationen über SSIM hier stammen aus einem Vordruck vom Mai 2004)