Seminar Geobotanik: Datenqualität und Beobachterfehler



Ähnliche Dokumente
Zeichen bei Zahlen entschlüsseln

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

geben. Die Wahrscheinlichkeit von 100% ist hier demnach nur der Gehen wir einmal davon aus, dass die von uns angenommenen

Dieses erste Kreisdiagramm, bezieht sich auf das gesamte Testergebnis der kompletten 182 getesteten Personen. Ergebnis

Berechnung der Erhöhung der Durchschnittsprämien

Gibt es einen Geschmacksunterschied zwischen Coca Cola und Cola Zero?

Das Vermögen der privaten Haushalte in Nordrhein-Westfalen ein Überblick auf der Basis der Einkommens- und Verbrauchsstichprobe

A1.7: Entropie natürlicher Texte

Das Wachstum der deutschen Volkswirtschaft

Pädagogik. Melanie Schewtschenko. Eingewöhnung und Übergang in die Kinderkrippe. Warum ist die Beteiligung der Eltern so wichtig?

Physik & Musik. Stimmgabeln. 1 Auftrag

Eine der Aktien hat immer einen höheren Gewinn als die andere Aktie. Ihre Aufgabe ist es diese auszuwählen.

Das große ElterngeldPlus 1x1. Alles über das ElterngeldPlus. Wer kann ElterngeldPlus beantragen? ElterngeldPlus verstehen ein paar einleitende Fakten

Professionelle Seminare im Bereich MS-Office

Praktikum Physik. Protokoll zum Versuch: Geometrische Optik. Durchgeführt am

Statistische Auswertung:

QM: Prüfen -1- KN

ONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Erfolg und Vermögensrückgänge angefertigt im Rahmen der Lehrveranstaltung Nachrichtentechnik von: Eric Hansen, am:

Ohne Fehler geht es nicht Doch wie viele Fehler sind erlaubt?

Tutorial: Homogenitätstest

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

1. LINEARE FUNKTIONEN IN DER WIRTSCHAFT (KOSTEN, ERLÖS, GEWINN)

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Senkung des technischen Zinssatzes und des Umwandlungssatzes

Welche Unterschiede gibt es zwischen einem CAPAund einem Audiometrie- Test?

Vermögensbildung: Sparen und Wertsteigerung bei Immobilien liegen vorn

1 topologisches Sortieren

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b.

II. Zum Jugendbegleiter-Programm

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

DAS PARETO PRINZIP DER SCHLÜSSEL ZUM ERFOLG

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Die neue Aufgabe von der Monitoring-Stelle. Das ist die Monitoring-Stelle:

Was meinen die Leute eigentlich mit: Grexit?

Charakteristikum des Gutachtenstils: Es wird mit einer Frage begonnen, sodann werden die Voraussetzungen Schritt für Schritt aufgezeigt und erörtert.

Zahlen auf einen Blick

Lineare Funktionen. 1 Proportionale Funktionen Definition Eigenschaften Steigungsdreieck 3

Übung 5 : G = Wärmeflussdichte [Watt/m 2 ] c = spezifische Wärmekapazität k = Wärmeleitfähigkeit = *p*c = Wärmediffusität

1 Mathematische Grundlagen

Insiderwissen Hintergrund

Das RSA-Verschlüsselungsverfahren 1 Christian Vollmer

Ihr Weg in die Suchmaschinen

Sowohl die Malstreifen als auch die Neperschen Streifen können auch in anderen Stellenwertsystemen verwendet werden.

Sollsaldo und Habensaldo

Lernerfolge sichern - Ein wichtiger Beitrag zu mehr Motivation

Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU

Stichprobenauslegung. für stetige und binäre Datentypen

2.5.2 Primärschlüssel

Grundlagen der Inferenzstatistik

Individuelles Qualifikationsprofil für

Erstellen von x-y-diagrammen in OpenOffice.calc

Kugel-Fächer-Modell. 1fach. 3fach. Für die Einzelkugel gibt es 3 Möglichkeiten. 6fach. 3! Möglichkeiten

impact ordering Info Produktkonfigurator

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Projekte für reale Herausforderungen Projektarbeit: Einleitung und Gliederung. Projekte für reale Herausforderungen

Kulturelle Evolution 12

V 2 B, C, D Drinks. Möglicher Lösungsweg a) Gleichungssystem: 300x y = x + 500y = 597,5 2x3 Matrix: Energydrink 0,7 Mineralwasser 0,775,

Gutes Leben was ist das?

Multicheck Schülerumfrage 2013

Leichte-Sprache-Bilder

Lineare Gleichungssysteme

Gleichungen Lösen. Ein graphischer Blick auf Gleichungen

Spielanleitung. Art.-Nr.: Spieleautoren: Arno Steinwender und Christoph Puhl

Lichtbrechung an Linsen

Mitarbeiterbefragung zur Führungsqualität und Mitarbeitermotivation in Ihrem Betrieb

Der Leverage-Effekt wirkt sich unter verschiedenen Umständen auf die Eigenkapitalrendite aus.

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

«Eine Person ist funktional gesund, wenn sie möglichst kompetent mit einem möglichst gesunden Körper an möglichst normalisierten Lebensbereichen

Die reellen Lösungen der kubischen Gleichung

4. Erstellen von Klassen

Studieren- Erklärungen und Tipps

Die Post hat eine Umfrage gemacht

Lösung Fall 8 Anspruch des L auf Lieferung von Panini á 2,-

Quantilsschätzung als Werkzeug zur VaR-Berechnung

Willkommen zur Vorlesung Statistik

Kennlinienaufnahme elektronische Bauelemente

Ugra Proof Certification Tool

Inhalt. Allgemeine Einführung. Argumentationsvermögen. Räumliches Vorstellungsvermögen. Begabungen und Fähigkeiten messen

Falten regelmäßiger Vielecke

Grundbegriffe der Informatik

Zahlenwinkel: Forscherkarte 1. alleine. Zahlenwinkel: Forschertipp 1

Lösungshinweise zur Einsendearbeit 2 SS 2011

Handbuch ECDL 2003 Basic Modul 5: Datenbank Grundlagen von relationalen Datenbanken

Abiturprüfung Mathematik 2008 (Baden-Württemberg) Berufliche Gymnasien ohne TG Analysis, Aufgabe 1

4 Aufzählungen und Listen erstellen

Korrelation (II) Korrelation und Kausalität

Psychologie im Arbeitsschutz

Kurzanleitung. MEYTON Aufbau einer Internetverbindung. 1 Von 11

Fachbericht zum Thema: Anforderungen an ein Datenbanksystem

Daten sammeln, darstellen, auswerten

Tipp III: Leiten Sie eine immer direkt anwendbare Formel her zur Berechnung der sogenannten "bedingten Wahrscheinlichkeit".

10.1 Auflösung, Drucken und Scannen

EINMALEINS BEZIEHUNGSREICH

Suchmaschinenoptimierung (SEO) für Ärzte Fallbeispiel Google

Änderung des IFRS 2 Anteilsbasierte Vergütung

mehrmals mehrmals mehrmals alle seltener nie mindestens **) in der im Monat im Jahr 1 bis 2 alle 1 bis 2 Woche Jahre Jahre % % % % % % %

Die Online-Meetings bei den Anonymen Alkoholikern. zum Thema. Online - Meetings. Eine neue Form der Selbsthilfe?

Vibono Coaching Brief -No. 39

Transkript:

Seminar Geobotanik: Friederich Angermüller, Nils Tjaden SS 2007 1 Einleitung Für einen fortschreitenden Kenntnisstand in der Forschung sind zuverlässige Daten essentiell, da die Glaubwürdigkeit und Aussagekraft der Aussagen hauptsächlich von Präzision und Akkuratesse abhängt, mit welcher die Daten die reale Welt abbilden. Somit hängt der Wert einer wissenschaftlichen Arbeit entscheidend davon ab, ob gegebenenfalls auftretende Fehler und Inkonsistenzen in den Daten bei deren Auswertung einerseits entsprechend beachtet werden und andererseits überhaupt sinnvoll erklärt werden können. Bei der Aufnahme von Vegetationsdaten, wie der Deckung oder Abundanz einer Art müssen oftmals Schätzungen vorgenommen werden, was naturgemäß zu Ungenauigkeiten und Fehlern führt. Auch wenn unterschiedliche Personen gemeinsam an einem solchen Projekt arbeiten, können personenspezifische Unterschiede die Ergebnisse signifikant beeinflussen. Inglis & Lincoln Smith (1995) haben gezeigt, dass selbst scheinbar einfache Methoden von solchen Fehlern behaftet sein können: Beim Zählen von Seegrasschößlingen auf Unterwasserplots verschiedener Größen kamen verschiedene Beobachter teilweise (in Abhängigkeit von der Plotgröße) zu signifikant unterschiedlichen Ergebnissen. Leider sind solche Unterschiede zwischen verschiedenen Beobachtern in Ausmaß und Richtung in der Regel nicht konsistent, sodass sie bei der Auswertung der Daten nicht ohne weiteres heraus gefiltert werden können. Es ist daher sinnvoll, sich vor der Datenerhebungim Gelände mit der Fehlerquelle Mensch und ihrem potentiellen Einfluss auf die Datenqualität vertraut zu machen. Diese Ausarbeitung beschäftigt sich daher mit Ursprung, Form und Ausmaß von Beobachterfehlern. Dabei soll auch die Fehleranfälligkeit verschiedener Methoden, sowie deren Abhängigkeit vom Erfahrungsschatz verschiedener Personen betrachtet werden.

2 Datenaufnahme im Gelände Als erstes soll hier die Art des Fehlers untersucht werden. Im Englischen wird hier zwischen accuracy (Akkuratesse) und precision (Präzision) unterschieden. Präzision bezeichnet die Streuung um einen Wert: je höher die Präzision, desto näher bei einander liegen alle gemessenen Werte. Akkuratesse hingegen gibt an, wie gut der Mittelwert der gemessen Werte mit dem wahren Wert übereinstimmt. Beide Fehlereigenschaften sind unabhängig von einander. So ist ein geringe Variabilität nicht zwingend ein gutes Ergebnis, da der ermittelte Wert doch beträchtlich von wahren Wert abweichen kann. Hingegen kann eine hohe Variabilität durchaus einen im Durchschnitt guten Wert ergeben, der nahe am wahren Wert liegt (siehe Abbildung 1). Ebenfalls entscheidend für die Qualität der Daten ist Variabilität im Bezug auf die formulierte Forschungsfrage. Bevor also eine Aussage die Realität betreffend gemacht werden kann, müssen Akkuratesse und Präzision der Daten diesbezüglich betrachtet werden. Das größte Problem dabei ist, dass man den wahren Wert in der Regel nicht kennt und sich daher nur auf Annahmen stützen kann. So besteht die Gefahr durch die vorher formulierte Hypothese eine Methode zu wählen, die einen wahren Wert schätzt, der die Hypothese bestätigt. Wenn man allerdings untersuchen will, ob sich z.b. ein Untersuchungsobjekt, das sich zu einem Zeitpunkt x in Zustand A befindet, zu einem späteren Zeitpunkt in einem anderen Zustand befindet, ist es nicht notwendig, den wahren Wert von A zu kennen, solange davon ausgegangen werden kann, dass der Fehler (Akkuratesse), der bei der Messung von A gemacht wurde bei weiteren Zustandsmessungen konstant bleibt. Abbildung 1: Begriffsklärung Präzision und Akkuratesse. a) Hohe Präzision: die Messdaten zeigen eine geringe Streuung. b) Hohe Akkuratesse: die Mittelwerte der Messdaten kommen den realen Daten recht nahe. c) Hohe Präzision und Akkuratesse. Seminar Geobotanik 2007 2

2.1 Deckungsschätzung Zur Schätzung der Deckung gibt es eine Vielzahl unterschiedlicher Methoden, die sich natürlich auch hinsichtlich ihrer Anfälligkeit für Beobachterfehler unterscheiden. Dethier et al. (1993) untersuchten die Vor- und Nachteile von einfacher visueller Schätzung gegenüber der so genannten random-point - Methode. Dabei wird an zufälligen Punkten im Aufnahmeplot eine Nadel o.ä. senkrecht in die Vegetation gesteckt und jene Organismen notiert, die die Nadel berühren. Aus den Frequenzen wird dann auf die Deckung geschlossen. Der Vorteil dieser Methode liegt einerseits in ihrer Objektivität und andererseits in der Tatsache, dass es möglich ist, die Genauigkeit (oder Ungenauigkeit) der Aufnahme durch theoretische Betrachtungen zur Verteilung der beprobten Populationen abschätzen zu können (Dethier et al. 1993). Allerdings ist diese Methode gegenüber der subjektiveren visuellen Schätzung signifikant weniger genau, wenn nur ein einziger Aufnahmedurchgang pro Plot gemacht werden kann (Dethier et al. 1993). Dafür kann man davon ausgehen, dass die Ergebnisse bei wiederholter Aufnahme gegen den wahren Abundanzwert konvergieren - was natürlich nur von Nutzen ist, wenn man genug Zeit für mehrere Aufnahmedurchgänge hat. Überhaupt ist der Zeitaufwand bei dieser Methode in etwa doppelt so groß wie bei der visuellen Schätzung. Außerdem neigt die Methode dazu, seltene Arten nicht zu erfassen. Die Überschätzung von Arten geringer Deckung findet hier ebenso statt wie bei der visuellen Schätzung. Grund dafür ist vermutlich, dass der Beobachter dem unbewussten Drang unterliegt, Individuen, die sich zwar nah an der Nadel befinden, sie aber nicht berühren dennoch als Treffer zu zählen (Dethier et al. 1993). Photographische Methoden sind in der Regel wenig beobachterabhängig, haben dafür mit anderen Problemen zu kämpfen. Besonders schwierig ist diese Methode, wenn Organismen in mehreren Schichten übereinander angeordnet sind: Dann werden noch mehr Arten nicht erfasst als bei der Verwendung von Zufallspunkten, da ein Photo aufgrund seiner Zweidimensionalität nur Oberflächen und nicht etwa weitere, darunterliegende Flächen abbilden kann. Hinzu kommen Probleme in der Vergleichbarkeit bzw. Wiederholbarkeit bei unterschiedlichen Lichtverhältnissen (Schattenwurf, Bewölkung etc.), die z.b. bei wiederholter Aufnahme eines Plots zu verschiedenen Zeitpunkten die Ergebnisse verfälschen können. Dethier et al. (1993) kommen zu dem Schluss, dass die einfache visuelle Schätzung zwar in einem gewissen Maße subjektiv ist, die Daten jedoch genau und vor allem auch von anderen Beobachtern wiederholbar sind. Auch sind von Laien aufgenommene Daten nicht signifikant schlechter als solche, die von Personen mit jahrelanger Erfahrung in der Deckungsschätzung aufgenommen wurden. Auch aufgrund des niedrigen Zeitbedarfs und der höheren Effizienz wenn eine Aufnahme aller Arten erforderlich ist, ist die visuelle, subjektive Schätzung eine legitime Methode. Seminar Geobotanik 2007 3

2.2 presence/absence - Daten Presence/absence - Aufnahmen gelten im Allgemeinen als weniger anfällig für Beobachterfehler als Deckungsschätzungen, da sie zwar ebenso Artenkenntnis erfordern, die schwierige Schätzung des Flächenanteils, den die jeweiligen Arten ausmachen aber wegfällt. Sie sind daher besonders sinnvoll bei großskaligen Aufnahmen mit vielen beteiligten Personen. Ringvall et al. (2005) zeigten, dass hier die Konsistenz zwischen verschiedenen Beobachtern besser ist als bei Deckungsschätzungen verschiedenster Methoden. Dazu betrachteten sie die Standardabweichungen der Beobachter von der wahren Frequenz verschiedener Arten bei einer presence/absence - Aufnahme und verglichen sie mit denen aus anderen Studien, in denen andere Methoden mit denselben Arten getestet worden waren. Aus Tabelle 1 ist ersichtlich, dass die Abweichungen vom wahren Wert bei den presence/absence - Aufnahmen tendentiell geringer sind, wobei allerdings gesagt werden muss, dass diese Werte nicht direkt miteinander verglichen werden können, da die jeweiligen Aufnahmen unabhängig von einander an unterschiedlichen Orten stattfanden. Tabelle 1: Vergleich der durchschnittlichen Abweichungen von Daten verschiedener Beobachter vom wahren Wert bei verschiedenen Methoden anhand zwei verschiedener Arten. Datenquelle: Ringvall et al. (2005) Methode Standardabweichungen Vaccinium vitis-idaea Deschampsia flexuosa presence/absence 2,9-8,0% 1,95-10,4% Deckung (Zufallspunkte) 6-18% 12-16% Deckung (visuelle Schätzung) 25-54% 30-50% Allerdings spielt bei der Aufnahme von presence/absence - Daten die persönliche Erfahrung eine große Rolle: Ringvall et al. (2005) verglichen die Daten von den bei ihrem Experiment beteiligten Mitarbeitern der schwedischen Forest Soil Inventory (FSI) und National Forest Inventory (NFI). Dabei lieferten die erfahreneren und besser ausgebildeten Beobachter vom FSI die besseren Daten (siehe Tabelle 2). Typische Gründe für Inkonsistenzen zwischen Beobachtern sind Fehlidentifikationen von Arten, das Übersehen von selteneren Arten sowie Probleme bei der Einhaltung der Plotgrenzen. Die Frage, ob ein Individuum sich noch innerhalb des Plots befindet oder nicht, kann zwar recht eindeutig definiert werden (z.b. wenn sich die Sproßachse/ein Blatt/ein gewisser Prozentsatz des Individuums im Plot befinden wird das Individuum als anwesend betrachtet). Aber dennoch spielt auch hier der unterbewusste Drang etwa eine seltene Art noch als anwesend zu betrachten, obwohl sie sich knapp außerhalb des Plots befindet eine Rolle. Da seltene oder schwer zu bestimmende Arten Seminar Geobotanik 2007 4

Tabelle 2: Mittelwerte und Standardabweichungen der presence/absence - Aufnahmen verschiedener Beobachter in Relation zu einer Referenzaufnahme (verändert nach Ringvall et al. (2005)). die Ungenauigkeiten zwischen verschiedenen Beobachtern erhöhen, sollte (sofern es die Aufgabenstellung zulässt) mit einer begrenzten Artenliste gearbeitet werden, die solche Arten nicht berücksichtigt (Ringvall et al. 2005). Des weiteren sind Artenaufnahmen besonders Tiere betreffend meist abhängig von Jahresund Tageszeit. So zeigt sich beispielsweise der Phrynocephalus versicolor nur in den Mittagsstunden (Oddie et al. 2003). Auch bei Pflanzen gilt es das saisonale Auftreten der Individuen zu beachten. Besonders Therophyten und Kryptophyten sind davon betroffen (Hall & Okali 1978). 2.3 Vollständigkeit und Aufnahmezeit Dieser Abschnitt beschäftigt sich mit der Frage der Vollständigkeit bei einer Aufnahme und wie diese von der Zeit abhängig ist. Die Gefahr auch hier fehlerhafte Daten zu erzeugen wird kaum beachtet. Eine konkrete Zeitbeschränkung ist laut Archaux et al. (2006) nicht von Nöten, wenn eine Regel eingführt wurde, die das Ende der Aufnahmezeit festlegt. Ein Beispiel wäre: Es wurde keine neue Art innerhalb der letzten 5 min gefunden (bei einer Plotgröße von 0,25-4 m 2 ). 2.3.1 Vollständigkeit Archaux et al. (2006) konnten einen annähernd logistischen Zusammenhang zwischen Zeitaufwand bei der Aufnahme und Anzahl gefundener Gefäßpflanzenarten feststellen. Dafür untersuchten in zentralfranzösischen Tieflandwäldern auf 400-m 2 -Plots Ende Mai 2002 professionelle Botaniker die Artenzahl aller Gefäßpflanzen. Die verschiedenen Grup- Seminar Geobotanik 2007 5

pen hatten jeweils eine Stunden Zeit ihre Aufnahme anzufertigen (Pflanzen deren Art erst mittels Literatur bestimmt werden konnten wurden nach den 60 min nachgeschlagen). Nach einer Stunden waren aber erst 70 bis 80% der der gesamten Artenzahl gefunden (siehe Abbildung 2), wobei die tatsächliche Gesamtartenzahl aus den erhobenen Datensätzen geschätzt und dann der zu jedem Zeitpunkt erreichte Prozentsatz der einzelnen Gruppen A-D errechnet wurde. Bei der Gruppe 0 wurde im nachhinein eine gründliche mehrtägig Aufnahme durchgeführt, die dann als Vollständige Liste angenommen wurde. Anzumerken ist auch, dass das schlechtere Ergebnis von Gruppe D dadurch zu erklären wäre, dass diese 19 Tage nach den anderen die Flächen untersuchte. Somit ist dies ein Zeichen für die Abhängigkeit gegenüber der Saisonalität (zusätzlich Kapitel presence/absence). Abbildung 2: Beziehung zwischen verstrichener Zeit (x-achse) und erreichter Vollständigkeit (y-achse) bezüglich aller Gefäßpflanzen auf 400m 2 -Plots. A-D: vier verschiedene Beobachter. Vollständigkeitsschätzung mittels second-order- Jacknife-Methode und einem Beobachter 0 dessen Abschätzung der Vollständigkeit durch eine mehrtägige Nachanalyse ermittelt wurde (Quelle: Archaux et al. (2006)) Abbildung 3 zeigt einen schnelle Abnahme der neu aufgenommenen Arten bei hoher Bedeckung (Klasse 3 vollständig nach 5 min) nach Braun-Blanquet-Klassen im Zeitverlauf, eine langsame hingegen bei niedriger Bedeckung. So verläuft die Kurve der Klasse r nahezu waagrecht. Bei einer kurzen Aufnahmezeit bedeutet dies, dass nur wenige der selteneren Arten, die auch meist die gefährdeten sind, nicht mit aufgenommen werden. (90% der Arten die nach 45 min Aufgenommen werden gehören zu r oder + ) Seminar Geobotanik 2007 6

Abbildung 3: Die Anzahl der minütlich aufgenomenen Arten (y-achse) sortiert nach Braun-Blanquet-Klassen in Abhänigkeit von der Zeit (x-achse). Datengrundlage: alle 68 Datensetze der Aufnahme von 2002 2.3.2 Fehlbestimmung Die Gefahr der Fehlbestimmung bei einigermaßen erfahrenen Feldarbeitern hingegen schätzen Archaux et al. (2006) und auch Scott & Hallam (2002) nicht so bedeutend ein. Sie kommen auf einen Anteil von 6,8 % bzw. 7,4% falsch bestimmten Pflanzen Abbildung4. Zu Beginn der Aufnahme liegt der prozentuale Anteil an falsch bestimmten Pflanzen erst bei ungefähr 3% und nimmt dann mit der Zeit zu. (Archaux et al. 2006). Erst nach 45 Minuten stabilisiert sich der Wert auf die oben schon erwähnten 6,8%. Dies mag daran liegen, dass man im Feld erst jene Arten aufschreibt, die einem geläufig sind und dann erst zu den schwierigeren übergeht. Erst nach 45 Minuten stabilisiert sich der Wert auf die oben schon erwähnten 6,8%. 2.3.3 Artenreichtum und Beobachter Die Vollständigkeit von Vegetationsaufnahmen nimmt bei einer Zunahme des Artenreichtums und bei gleicher Aufnahmezeit in der Regel ab (Archaux et al. 2006). Dies führt zu einer Angleichung von artenreichen an artenärmere Plots. Erst nach 30 Minuten sind bei einer Plotgröße von 400m 2 diese Unterschiede in der erreichten Vollständigkeit nicht mehr signifikant. Durch die zu Beginn des Kapitels formulierte Regel verschwindet dieser Unterschied zwischen schnellen und langsameren Arbeitern. Zwar brauchen letztere länger, bis die Regel erfüllt wurde aber die Artenzahl ist nahezu indentisch mit den schneller Arbeitenden (Gray & Azuma 2005). Seminar Geobotanik 2007 7

Abbildung 4: Der prozentuale Anteil der falsch bestimmten Pflanzen ( y-achse ) in Abhängigkeit von der verstrichenen Zeit in Minuten ( x-achse ) 2.4 Kartierung Auch bei der Kartierung von Vegetationseinheiten und Biotoptypen können beobachterspezifische Fehler und Ungenauigkeiten auftreten. Cherrill & McClean (1999) untersuchten die in Großbritannien übliche phase 1 - Methode zur schnellen Biotopkartierung auf großen Flächen, indem sie 6 erfahrene Ökologen jeweils dasselbe Gebiet kartieren liessen. Ausschnitte aus diesen Karten werden in Abbildung 5a) verglichen. Diese zeigt deutlich krasse Unterschiede zwischen den Beobachtern: die maximale Übereinstimmung zwischen zwei Karten liegt in diesem Ausschnitt bei 30%, die minimale bei 1,1%. Auch bei der Frage nach dem dominanten Typen herrscht keine Einigkeit. Der Biotoptyp Bracken (dominiert von Adlerfarn, Pteridium aquilinum) taucht als einziger in allen sechs Karten auf. Die schlechtesten Übereinstimmungen wurden auf extensiven, artenreichen Flächen erzielt (Abbildung 5b)). Ein Grund für diese deutlichen Unterschiede ist die Tatsache, dass die Einordnung in einen Biotoptypen aufgrund von Artzusammensetzung und relativen Abundanzen ungleich komplexer ist, als das bloße Identifizieren von Arten bei einer presence/absence - Aufnahme. Auch neigen manche Beobachter dazu, Vegetationseinheiten aufzunehmen, die per Definition bei dieser Methode aufgrund zu geringer Größe nicht berücksichtigt werden dürften. Desweiteren bereitet das Handbuch zu dieser Methode Probleme, da es an einigen Stellen recht vage formuliert ist. Leider sind die Fehler, die durch diese Ungenauigkeiten verursacht werden von denen, die auf unterschiedliche Beobachter zurück zu führen sind kaum zu separieren. Außerdem ist anhand der Karten von Beobachter B und C in Abbildung 5a) ein weiteres Phänomen zu erkennen, das vollkommen unabängig von der verwendeten Kartierungsmethode ist. Es ist üblich, zu Orientierung im Gelände und als Grundlage für die Kartierung bestehendes Kartenmaterial (z.b. Topografische Karten, in diesem Fall aus Seminar Geobotanik 2007 8

Abbildung 5: Biotoptypenkartierung einer Fläche in Northumberland (GB) durch sechs erfahrene Ökologen nach der phase 1 - Methode. a) Vergleich der verschiedenen Ergebnisse der sechs Beobachter (A-F) anhand eines Kartenausschnittes. Grüne Bereiche: der einzige Biotoptyp, der in allen sechs Karten zu finden ist. Rote Linie: Grenze zweier aneinandergranzender Kartenblätter. b) Übereinstimmung der Karten der 6 Ökologen: die besten Übereinstimmungen finden sich auf den Waldflächen im Norden der Karte. Grüne Markierung: der Kartenausschnitt aus a). Verändert nach Cherrill & Mc- Clean (1999). Seminar Geobotanik 2007 9

Armeebeständen) zu verwenden. Die Grenze zwischen zwei Kartenblättern (rote Linie) hat hier den Beobachter zu einem abrupten Wechsel des Biotoptypen verleitet, der bei sorgfältigerer Kartierung sicher anders ausgesehen hätte. Um die beobachterspezifischen Fehler bei einer solchen Methode zu minimieren, empfehlen Cherrill & McClean (1999) einerseits, die Beobachter in Gruppen zu trainieren und andererseits die Aufnahmen (entgegen der üblichen Praxis) in Zweiergruppen durch zu führen. Der größere Aufwand an Zeit und Personal sowie die Möglichkeit, schwieriger einschätzbare Vegetationseinheiten mit einem Mitarbeiter zu diskutieren sollten dazu beitragen, die Ergebnise erkennbar zu verbessern. 2.5 Auswirkung der Fehler auf die Statistik Inwieweit der Messfehler auch in der Auswertung ein Rolle spielt soll in diesem Abschnitt behandelt werde. Ebenso inwiefern es zu einer unterschiedlichen Interpretation gleicher Quellen kommt. Anhand der Arbeit von Gotfryd & Hansell (1985) soll hier die Problematik der multivariaten statistischen Auswertung und die Gefahr der Fehlinterpretation bei PCA (Hauptkomponentenanalyse) und Diskriminanzanalyse erörtert werden. Gerade von diesen wird häufig auf Funktionen, die das System erklären sollen, rückgeschlossen. 2.5.1 Multivariate Statistik Bei sehr ähnlichen Habitaten wirkt sich der Messfehler stärker aus als bei heterogenen Habitaten (Gotfryd & Hansell 1985). Hier werden die feinen Unterschiede von den Beobachtungsfehlern überdeckt. Bei diesem Experiment wurden 20 Variablen der Vegetation in einem Eichen-Ahorn-Wald aufgenommen; z.b: Anzahl der Baumarten, Bodenbedeckung, maximale Kronendachhöhe, etc. Gotfryd & Hansell (1985) konnten nun zeigen, dass die Beziehung der Variablen bei der PCA zu den Hauptkomponenten (HK) stark von Forschergruppe zu Forschergruppe variieren. Dies betraf sogar die 1.HK, der der größte Anteil bei der Erklärung der Daten zukommt. Die Gruppe D identifizierte so mit ihren Daten die Bedeckungsachse (Kronendach, Bodenbedeckung, etc.) als Haupteinflussfaktor auf die gemessenen Daten, also eine senkrechte Achse. Gruppe A hingegen identifizierte als wichtigsten Einfluss eher waagrechte Faktoren (Distanzmaße bei Bäumen). Aus einem mehr geometrischen Blickwinkel betrachtet ergab sich eine Abweichung zwischen den Geraden der HKs im allgemeinen zwischen 40 und 50. Es besteht also nur eine schwache Übereinstimmung der Achsenrichtung und es kommt zu unterschiedlichen Interpretationen. Abbildung 6 zeigt die jeweils von Gruppe F bzw. P gemessenen Datenwolken in einem von der ersten und zweiten HK aufgespannten Koordinatensystem. Die verschiedenen Flächen umschließen dabei 95% der Daten eines Plots. Gleiche Farbe bedeutet gleicher Plot. In Idealfall müss- Seminar Geobotanik 2007 10

ten beide Graphen das gleiche Bild zeigen (diese könnte auch gespiegelt sein). Dies würde dann bedeuten, dass die gleichen Daten gemessen wären. Die geringe Übereinstimmung ist jedoch frappierend und führt logischer Weise zu unterschiedlichen Interpretation der Daten bei den verschiedenen Gruppen. Abbildung 6: Die Daten von Beobachter F (Grafik a) und P (Grafik b) aufgenommen in einem Eichen-Ahorn-Wald. Die farbigen Flächen umschließen 95% der beobachteten individuellen Daten. Gleiche Farbe und Ziffer bezeichnet dabei denselben Plot. Jeder Plot kommt nur einmal pro Gruppe vor. Mischfarben ergeben sich aus dem Überlappen der Farbflächen. Aufgespannt wird das Koordinatensystem durch die 1. und 2. HK. Nach Gotfryd & Hansell (1985) Gotfryd & Hansell (1985) verglich auch die einzelnen Datensätze der untersuchten vier Gruppen mit dem Gesamtdatensatz aller Gruppen (Abbildung 7). Die Linien in der Abbildung umschließen 95% aller Daten die am gleichen Plot aufgenommen wurden. Die Buchstaben geben den Mittelwert der individuellen Datensätze zu den jeweiligen Plots an. Aufgespannt wird das Koordinatensystem von der aus allen Daten errechneten 1. und 2. HK. So zeigt sich, dass die Gruppe A (rot)zum Beispiel tendenziell eine Abweichung in gleiche Richtung vom Gesamtmittel aufweist. In diesem Fall wäre der Fehler bei einer Fragestellung, die die Differenzen untereinander betrifft nicht so groß, da diese Differenzen der Daten mit den Differenzen des Gesamtdatensatz übereinstimmen würden. Bei absoluten Fragenstellungen hingegen wäre das Ergebnis falsch (vorrausgesetzt die errechneten Werte aus dem Gesamtdatensatz entspräche den wahren Werten). Die Gruppe F hingegen weist eine solche Orientierung zum Gesamtdatensatz nicht auf. Gotfryd & Hansell (1985) verglich des weiteren die Daten von Johnston (1979) mit nochmals an gleichen Stelle aufgenommenen Daten fünf Jahre später. Trotz der Zeitdifferenz zeigte sich nun nur eine geringe Abweichung in der Interpretation. Oder nochmals geometrisch ausgedrückt, der Winkel zwischen den beiden Achsen der ersten Hauptkomponente betrug hier nur 5. Dies mag aber an den deutlich heterogenen Habitattypen (Grasland und Wald) liegen. Seminar Geobotanik 2007 11

Abbildung 7: Die Daten von vier Beobachtergruppen (a, f, p, d), aufgenommen in einem Eichen-Ahorn-Wald. Die Linien umschließen 95% aller Daten die am gleichen Plot aufgenommen wurden. Die Buchstaben geben den Mittelwert der individuellen Datensätze zu den jeweiligen Plots an. Aufgespannt wird das Koordinatensystem von der aus allen Daten errechneten 1. HK (x-achse) und 2. HK (y-achse). Nach Gotfryd & Hansell (1985) Seminar Geobotanik 2007 12

Zusammen fassend lässt sich sagen, dass je homogener die verschiedenen Plots untereinander sind, desto deutlicher wird das Ergebnis von den Beobachterfehlern überprägt. 3 Zusammenfassung Zusammenfassend lässt sich feststellen, dass Beobachterfehler einen großen Einfluss auf die Datenqualität haben können, aber nicht zwangsläufig müssen bzw. dass die Variationen innerhalb der Datensätze nicht zwingend auf eine komplexe Umwelt schließen lassen. Es ist daher angebracht, sich vor der Datenerhebung mit dieser Problematik auseinander zu setzen, um die Fehler möglichst gering zu halten. Wie groß der Fehler schlussendlich ist, hängt zu einem großen Anteil von der verwendeten Methode ab: presence/absence - Aufnahmen sind zum Beispiel in der Regel konsistenter als Deckungsschätzungen, erfordern aber eine gute Artenkenntnis. Ob man freiwillige Laien mit der Aufnahme von Daten betraut ist eine nicht eindeutig zu beantwortende Frage. Ohne solche ist es nahezu unmöglich große Gebieten zu beproben und dabei entsprechende Datenmengen zu bekommen. Andererseits kann die Qualität der Daten eher fraglich sein, wobei auch hier die verwendete Methode eine wichtige Rolle spielt. Um Probleme zu vermeiden ist eine intensive Einführung in die Messmethoden erforderlich. Außerdem sollte die Übereinstimmung von Messungen am selben Objekt getestet werden, um eine Abschätzung des Beobachterfehlers zu erhalten. Desweiteren sollte niemals nur ein Feldarbeiter als einziger einen bestimmten Plot beproben. Es soll hier aber auch erwähnt sein, das gerade durch die Arbeit von Freiwilligen bei ökologisch-wissenschaftlichen Arbeiten deren Aufmerksamkeit gegenüber der Natur zunimmt und das Interesse an der Wissenschaft geweckt werden kann. Besonders in Ländern, in denen das Umweltbewußtsein nicht sehr ausgeprägt ist ist dies von Bedeutung. Sobald eine Aufnahme über mehrere Jahreszeiten hinweg erfolgt, sollten in allen betroffenen Jahreszeiten Aufnahmen auf allen Plots stattfinden. Auch die Auswirkung der Tageszeit kann besonders bei Tieren von Bedeutung sein. Ebenso wäre eine Untersuchung bezüglich Artenzahl bei Sonnenschein und Regen interessant. Diese ist aber so weit uns bekannt noch nicht erfolgt. Auch ist z.b. die Auswertung von Daten, die mittels multivariater Statistik aufgearbeitet wurden, nicht nur durch im Feld gemachte Fehler betroffen, da auch bei Interpretation der hierbei erzeugten Grafiken ein gewisser Ermessensspielraum gegeben ist. Hier ist eine intensive Diskussion der Methode, der Ergebnisse und der daraus möglichen Abschätzung einer sinnvollen Interpretation von höchster Wichtigkeit. Seminar Geobotanik 2007 13

Literatur Archaux Frédéric, Gosselin Frédéric, Bergès Laurent, Chevalier Richard (2006): Effects of sampling time, species richness an observer on the exhaustivness of plant censuses. Journal of Vegetation science 17, S. 299 306 Cherrill Andrew, McClean Colin (1999): The reliability of Phase 1 habitat mapping in the UK. Landscape and Urban Planning 45, S. 131 143 Dethier Megan N., Graham Elizabeth S., Cohen Sarah, Tear Lucinda M. (1993): Visual versus random-point percent cover estimations: objective is not always better. Marine Ecology Progress Series 96, S. 93 100 Gotfryd Arnie, Hansell Roger I. C. (1985): The impact of observer bias on multivariate analyses of vegetation structure. Oikos 45, S. 223 234 Gray Andrew N., Azuma David L. (2005): Repeatablity and implementation of a forest vegetation indicator. Ecological Indicators 5, S. 57 71 Hall John B., Okali D. U. U. (1978): Observer-bias in a floristic survey of compelx tropical vegetation. Jounal of Ecology 66, S. 241 249 Inglis Graeme J., Lincoln Smith Marcus P. (1995): An examination of observer bias as a source of error in surveys of seagrass shoots. Australian Journal of Ecology 20, S. 273 281 Johnston R. F. (1979): Replication of habitat profiles for birds. Occ Paper Mus Nat Hist Univ Kansas S. 1 11 Oddie Kate R., Ariunaa Togloom, Enkhnasan Davaadorj (2003): Ecological sampling desing an observer bias: an example from toad-headed agama in the southern gobi, mongolia. Mongolian Journal of Biological Sciences 1, S. 49 54 Ringvall Anna, Petersson Hans, Ståhl Göran, Lämås Tomas (2005): Surveyor consistency in presence/absence sampling for monitoring vegetation in a boreal forest. Forest Ecology and Management 212, S. 109 117 Scott W. Andrew, Hallam Caroline J. (2002): Assessing species misidentification rates through quality assurance of vegetation monitoring. Plant Ecology 165, S. 101 115 Seminar Geobotanik 2007 14