Termin3 Klassifikation multispektraler Daten unüberwachte Verfahren

Ziel Termin3 Klassifikation multispektraler Daten unüberwachte Verfahren Einteilung (=Klassifikation) der Pixel eines multispektralen Datensatzes in eine endliche Anzahl von Klassen. Es sollen dabei versucht werden, folgende Objektarten voneinander abzugrenzen: Waldflächen Felder Wasserflächen (Seen bzw. Flußläufe) Straßen bzw. Wege vegetationslose Flächen PCA Problematik: wir haben 7 oder 8 Kanäle können aber immer nur 3 gleichzeitig darstellen Lösung: PCA - Principal Component Analyses Ziel: Reduzieren der Informationen von vielen Kanälen auf wenige Kanäle, damit die Informationen gleichzeitig darstellbar sind Wie geht das? Reduktion ist nur möglich wenn bereits Abhängigkeiten zwischen den einzelnen Kanälen bestehen. Wie sieht man das? Scatterplotts! Zeigen und erklären Was bedeuten Korrelationskoeffizienten mit Beträgen von mehr als 0.9? Welche spektralen Kanäle würden Sie unbedingt für eine Klassifikation verwenden und auf welche würden Sie gegebenenfalls verzichten? Durchführen PCA mit Tools Algorithm Library Image Prozessing Image Transformations PCA Analyse LOG-File List of Midpoint Values: Man hat die Möglichkeit die Richtung der HK vorzudefinieren, machen wir nicht Std Dev range: Man kann die Varianzen der Hauptkomponenten beeinflussen, weglassen Anschauen Scatterplott HK - Hauptkomponenten sind unkorelliert Interpretation des PCA-Logs: Für jeden Kanal Mittelwert und Standardabweichung Was sagt die Deviation aus: Die Werte streuen im Durchschnitt um den Wert X um den Mittelwert. In der Deviation ist auch das Bildrauschen enthalten, was bei allen Kanälen erst mal als gleich angenommen wird. Dementsprechend sind für uns natürlich Kanäle mit hoher STDABW interessanter, da bei diesen der Signalanteil höher ist. (Signal-Rausch-Verhältnis)

Kovarianzmatrix der Eingangskanäle: Gleicher Kanal auf gleicher Kanal entspricht 100% = Quadrat der Standardabweichung Kleine Werte = Korrelieren wenig, Große Werte korrelieren stark Tatsächliche Korelation z.b wischen 1 und 4, Wurzel(514,08) x Wurzel(1324,72) entspricht Korr. 100%, d.h. 100% = 825,239 also 438,75 = 53,17 % Variance gibt an wie viel Prozent der Gesamt Streuung man mit dem einen Kanal erklären kann, Spalten sind Kanäle, Zeilen sind Hauptkomponenten Linearkombination (Zusammensetzung der Hauptkomponenten): HK1 = 0.28743*Ch1+ 0.22855*Ch2 + 0.41035*Ch3 + 0.26599*Ch4 + 0.66606*Ch5 0.08582*Ch6 0.41834*Ch7 Jetzt soll verglichen werden, ob die Informationen, die in optimierten Bandkombinationen sichtbar werden auch im PCA enthalten sind. Wasser, Geologie 457, Vegetation 432 123, 157 Mal die Logdaten anschauen

Decorrelation Stretch Falls die zu kombinierenden Kanäle zu stark korrelieren, sollte ein decorrelation stretch durchgeführt werden. Das ist eine Art Hauptkomponentenanalyse, deren Aufgabe es ist die HK zu finden und dann aus den errechneten HK eine Rücktransformation in die Original Kanäle durchzuführen. Es soll Rauschen entfernt werden, indem bei Rücktransformation der oder die höchsten Eigenchannels weggelassen werden, da in diesen das Rauschen steckt. Durchführen Decorrelation stretch mit Tools Algorithm Library Image Prozessing Enhancements Decorr Unüberwachte Klassifizierung Hinweis Sie benötigen den beim ersten Termin erstellten multispektralen Datensatz der Landsat ETM Aufnahme vom Juli 2001 (vgl. Termin 1, dort: Aufgabe 3). Da Sie diesen Datensatz verändern, legen Sie bitte unbedingt vorab eine Sicherungskopie an. Methodik Eine Klassifikation multispektraler Daten basiert auf dem Prinzip Pixel mit ähnlichen spektralen Werten reflektieren elektromagnetische Strahlung in vergleichbarer Weise, weshalb es sich um gleichartige Objekte handelt. Damit läßt sich die Fragestellung auf folgende zwei Aspekte zurückführen: Wie bestimme ich die Ähnlichkeit von Pixeln? Wann betrachte ich zwei Pixel als so ähnlich, daß ich sie einer gemeinsamen Klasse zuordne? Die erste Frage führt zum Konzept des spektralen Merkmalsraumes. Dies besagt: man betrachte die Grauwerte der einzelnen spektralen Kanäle als Koordinaten eines kartesischen Koordinatensystems. Dann ist die Position eines Pixel in diesem Merkmalsraum definiert durch seinen Grauwertvektor. Die Distanz (als Maß für das Verschiedensein ) zweier Pixel läßt sich dann bsw. als der euklidische Abstand ihrer beiden Vektoren berechnen. Zur Beantwortung der zweiten Frage dienen Verfahren der Clusteranalyse. Sie nutzen in dieser Übung das Verfahren K-Means. Ein Pixel wird dabei jener Klasse zugeordnet, zu deren Mittelpunkt es den geringsten euklidischen Abstand aufweist. (Alle weiteren Zusammenhänge sind Gegenstand der Vorlesung...) Spektraler Merkmalsraum Der multispektrale Datensatz umfaßt 6 spektrale Kanäle. Daraus ergibt sich ein 6-dimensionaler Merkmalsraum. Da so etwas schlecht darstellbar ist, betrachten Sie zunächst Projektionen in die Ebene (Scatterplots) von jeweils 2

spektralen Kanälen. Übung Geofernerkundung SoSe 2013 Hierfür nutzen Sie in Geomatica die Option Scatterplot (siehe Abbildung 1 links). Dort können Sie die Grauwertverteilung aus jeweils 2 Kanälen gegenüberstellen. Wählen Sie hierzu unter X axis bzw. Y axis jeweils einen Kanal aus und vergleichen Sie die Verteilungen im Plot. (Hinweis: Sie können das Erscheinungsbild über Graph Controls anpassen) Unüberwachte Klassifizierung, k-means Zur Druchführung dieses Klassifikationsverfahrens müssen Sie lediglich angeben, in wie viele Klassen Sie den Bildinhalt einteilen möchten und welche Werte die Klassenmittelpunkte bei der ersten Berechnung haben sollen (Startwerte). Da es sich um ein iteratives Verfahren handelt, benötigt der Rechner zusätzlich noch mind. ein Abbruchkriterium. Hierfür nutzen Sie den Min Threshold (sinnvoll sind hier Werte zwischen 0.1 und 0.01) sowie die maximale Anzahl Iterationen. Umsetzung in Geomatica Zunächst müssen Sie dem Datensatz einen weiteren Layer hinzufügen (vgl. Abbildung 1, rechts). Es reicht hierbei 1 Layer vom Typ 8-bit aus, verwenden Sie bitte keinesfalls 32 bit real. Wählen Sie dann Analysis Image Classification unsupervised Wählen Sie Ihren Datensatz aus und starten Sie eine neue Session. Im daraufhin erscheinenden Session Configurator können Sie jene spektralen Kanäle auswählen, die Sie zur Klassifikation nutzen wollen. Als Output Channel nutzen Sie bitte den neuen Kanal 7 (keinesfalls einen der 6 spektralen Kanäle!!). Weiter mit OK Im Dialog Unsupervised Classification definieren Sie die Parameter Ihrer Klassifikation. Wählen Sie hier als Algorithmus K-Means, geben Sie die gewünschte Anzahl Klassen (sinnvoll sind ca. 15 bis 20), die Maximale Anzahl Iterationen sowie den Min. Threshold an. Wählen Sie zusätzlich die Optionen Show report und Save signatures. Anschließend OK Max Class: Maximale Anzahl der Klassen Max Iteration: Maximale Anzahl der Wiederholungen der Optimierung Min Treshold: Grenzwert für die Maximale Änderung des Klassenschwerpunktes Max Samplesize: Maximale Klassengröße k-means: Minimum Distance Fuzzy k-means: Minimum Distance mit Pufferbereich Iso data: Mix von Minimum Distance und Maximum Likelyhood (Braucht eine Wahrscheinlichkeitsverteilung)

Hinweis: Den Report sollten Sie für spätere Auswertungen als *.txt file speichern. Führen Sie die unüberwachte Klassifizierung mit verschiedenen Klassenanzahlen und unterschiedlicher Auswahl an Kanälen durch. Vergleichen Sie Ihre Ergebnisse. Welche Anzahl Klassen erscheint Ihnen zweckmäßig? Welche spektralen Kanäle nutzen Sie? Vergleichen Sie dies mit Ihrer Antwort auf die verzichtbaren Kanäle im Abschnitt zum spektralen Merkmalsraum. Exportieren auch nach Vectordaten, ras2poly