Friedrich Schiller - Universität. Räumliche Autokorrelation und deskriptive Methoden

Größe: px
Ab Seite anzeigen:

Download "Friedrich Schiller - Universität. Räumliche Autokorrelation und deskriptive Methoden"

Transkript

1 Friedrich Schiller - Universität Institut für Geographie Wintersemester 2004/2005 Hausarbeit zum Hauptseminar: Analyse und Modellierung räumlicher Daten Leiter: Dr. Martin Herold Thema: Räumliche Autokorrelation und deskriptive Methoden Verfasser: Christian Pfeifer Wanderslebenstr. 7, Jena Abgegeben am

2 Inhalt 1 Einleitung 2 2 Allgemeine deskriptive Methoden Mittelwerte Arithmetische Mittel Median und Modus Streuungsmaße Standartabweichung und Varianz Schiefe und Exzess Nearest Neighbor -Analyse Histogramm Datenniveaus Objektarten 7 3 Räumliche Autokorrelation Hinführung Das erste Gesetz der Geographie Berechnung der räumliche Autokorrelation Geary s (c) Index Moran s (I) Index Probleme Datenherkunft MAUP Spatial Sampling 13 4 Schlussbemerkung 15 Literatur 15 1

3 1 Einleitung Um herauszufinden wie bestimmte Eigenschaften im Raum verteilt sind bedarf es spezieller statistischer Methoden, besonders dann, wenn die zu untersuchenden Eigenschaften in Beziehung zum Raum oder zu anderen Merkmalen stehen. Um diese Beziehungen für den Betrachter sichtbar zu machen werden diese durch deskriptive Methoden analysiert und in Form einer einzigen oder weniger Zahlen ausgedrückt. In dieser Arbeit soll dabei ein Hauptaugenmerk auf die Datenanalyse in Bezug auf die räumliche Autokorrelation gelegt werden. Diese, soviel soll schon gesagt werden, beschäftigt sich mit der räumlichen Beziehung zwischen Objekten und ihren Nachbarn. Oder wie MORAN schon 1948 schrieb The presence, absence, or characteristics of some spatial objects may sometimes have significant impacts on the presence, absence, or characteristics of the neighboring objects. ( LO & YEUNG 2002: 117) Aber bevor auf diese spezielle deskriptive Methode der räumlichen Autokorrelation eingegangen wird, sollen zuvor ausgewählte, grundlegende Verfahren und Sachverhalte der traditionellen deskriptiven Statistik erläutert werden. 2 Allgemeine deskriptive Methoden Die deskriptive bzw. beschreibende Statistik befasst sich mit der Analyse und Darstellung von räumlichen und zeitlichen Daten. Die Methoden der deskriptiven Statistik haben das Ziel, die oft großen Datenmengen mit nur wenigen Zahlen zu charakterisieren, so dass sie für den Betrachter gut interpretierbar sind. Dabei zählt die Visualisierung der Daten, wie z.b. in einer Karte, zu den besten Methoden bestimmte Muster in den Daten zu erfassen. Zu den deskriptiven Methoden gehört der Mittelwert und die Streuung, welche nun kurz vorgestellt werden (LO & YEUNG 2002: 350 & HELMSCHROT & FINK 2001). 2.1 Mittelwerte Durch die Mittelwerte (engl. central tendency) wird das Zentrum der Verteilung charakterisiert. Mittelwerte können u.a. durch das arithmetische Mittel, den Median oder den Modus angeben werden (HELMSCHROT & FINK 2001) Arithmetische Mittel Das arithmetische Mittel berechnet man aus der Summe aller Einzelwerte, dividiert durch die Gesamtzahl aller Stichprobenfälle (siehe Formel 1). Man sollte diese Formel anwenden, wenn die Formel 1: Mittelwert x m Werte hauptsächlich um das arithmetische Mittel verteilt sind. Ist (HELMSCHROT & FINK 2001) die Stichprobe zu heterogen (weicht zu sehr von der Glockenform ab) bringt dieses Verfahren zu große Nachteile mit sich (HELMSCHROT & FINK 2001). 2

4 2.1.2 Median und Modus Der Median ist der Wert, der die nach der Größe geordnete Verteilung in 2 gleichgroße Bereiche teilt. Beispiel: Gegeben ist ein beliebige Zahlenreihe mit den Werten 1, 3, 5, 7, 66. Der mittlere Wert also der Median ist hier 5. Bei einer ungeraden Anzahl von Stichproben wird der Median von den beiden in der Mitte stehenden Zahlen gebildet. Der Median hat den Vorteil, dass er sich im Gegensatz zum arithmetischen Mittel nicht durch einzelne hohe Werte beeinflussen lässt. Der Modus hingegen zeigt den am häufigsten vorkommenden Merkmalswert einer Datenreihe oder einer Klasse auf (LO & YEUNG 2002: 351 & HELMSCHROT & FINK 2001). 2.2 Streuungsmaße Die Streuung (engl.: dispersion) gibt an, wie weit die Merkmalswerte um das Zentrum verteilt sind. Um die Streuung anzugeben gibt es vier gebräuchliche Möglichkeiten Standartabweichung und Varianz Nach LO & YEUNG (2002: 351) ist die Standartabweichung die wichtigste Maßeinheit um die Streuung zu charakterisieren. Um die Standartabweichung berechnen zu können, muss vorher die Varianz gebildet werden. Denn die Standartabweichung ergibt sich, aus der Wurzel der Varianz (siehe Fromel 3). Die Varianz selbst wird nach der Formel 2 berechnet. Hier muss die Summe der quadrierten Abweichungen vom Mittelwert x m, durch die Gesamtzahl der Elemente n dividiert werden. Formel 3: Varianz s² (HELMSCHROT & FINK 2001) Formel 2: Standartabweichung s (HELMSCHROT & FINK 2001) Die Standartabweichung gibt an, wie sich die Streuung einer Verteilung um den Mittelwert verhält. Allerdings hat sie den Nachteil, dass man die Standartabweichungen zweier verschiedener Stichproben nur vergleichen kann, wenn deren arithmetische Mittel in etwa gleichgroß sind (LO & YEUNG 2002: 351 & HELMSCHROT & FINK 2001). 3

5 2.2.2 Schiefe und Exzess Die Schiefe (engl.: skewness) wie der Exzess (engl.: kurtosis) sind Formenparameter, d.h. sie geben Auskunft über die Form der Verteilung. Die Schiefe [ ] stellt ein Maß für die Symmetrie der Verteilung um das arithmetische Mittel dar und errechnet sich (HELMSCHROT & FINK 2001) aus der Differenz des Mittelwert x m vom Median Me, welche durch die Standartabweichung s dividiert wird, wie in Formel 4 abgebildet. Wenn die Form der Verteilung symmetrisch ist, dann hat die Schiefe g einen Wert von 0, ist g größer als 0 handelt es sich um eine positive Schiefe, der Median ist links vom Mittel. Bei einer negativen Schiefe hingegen ist g kleiner als 0 und der Median rechts vom Mittel. Formel 4: Schiefe g (HELMSCHROT & FINK 2001) Formel 5: Exzess Ez (HELMSCHROT & FINK 2001) Der Exzess hingegen ist ein Maß für die Steilheit der Verteilung. So beschreibt er, ob die Merkmalsverteilung spitz oder flach um das Zentrum verteilt ist. Berechnet wird er, wie in Formel 5 aufgezeigt. Von einer spitzen Verteilung spricht man, wenn der Exzess Ez größer als eins ist und damit steiler zuläuft als eine Normalverteilung. Keinen Exzess (Ez = 1) findet man bei einer Normalverteilung vor. Ist der Exzess kleiner als eins (negativer Exzess) ist die Verteilung flacher als eine Normalverteilung (LO & YEUNG 2002: 351). 2.3 Nearest Neighbor -Analyse Bei der Nearest Neighbor -Analyse werden Verteilungsmuster von Punkten auf einer Fläche untersucht. Dabei kann bestimmt werden, ob die Messpunkte regelmäßig, unregelmäßig oder in Clustern (Gruppen) auftreten. Diese Einordnung [in regelmäßig, unregelmäßig oder in Clustern] erfolgt über das Messen der Distanzen zwischen gepaarten Datenpunkten. Gepaart werden dabei die Punkte mit der geringsten räumlichen Distanz zueinander - die Nearest Neighbor. (DUMFARTH & LORUP 2000) Um Verwechslungen mit der räumliche Autokorrelation aus dem Weg zu gehen, muss klar festgestellt werden, dass bei der Nearest Neighbor -Analyse nur die räumliche Verteilung der Punkte bestimmt wird, nicht aber im Zusammenhang mit den Ausmaß der Werte, den diese Punkte haben 4

6 Abbildung 1: Mögliche Verteilungsmuster (a) regelmäßig, (b) unregelmäßig, (c) gruppiert (DUMFARTH & LORUP 2000) Bei der Nearest Neighbor -Analyse gibt es einige Dinge zu beachten, um mögliche Ungenauigkeiten und Fehlmessungen so gering wie möglich zu halten. Weil es notwendig ist, die Punktdichte in dem Gebiet zu kennen, muss die Größe der Fläche, in dem die Analyse durchgeführt werden soll, genau festgelegt werden. Ist nämlich die zu untersuchende Fläche zu groß im Verhältnis zur Anzahl der Punkte, erhält man eine viel geringere Punktdichte als wenn man für die gleiche Anzahl von Punkten eine kleineres Gebiet für die Untersuchung verwendet. Auch das Problem des Kanteneffektes (engl.: edge effect) sollte nicht vernachlässigt werden. Das Problem liegt hier darin, dass es unter Umständen auch Punkte außerhalb der Grenzen der Untersuchungsmatrix gibt, zu denen aber von den Punkten am Rande der Matrix keine Distanz gemessen werden kann, obwohl diese am nächsten liegen. Um dies zu verhindern, sollte auch eine Messung zu Punkten außerhalb der Untersuchungsmatrix zugelassen werden (LO & YEUNG 2002: 357). 2.4 Histogramm Neben der Karte ist das Histogramm (siehe Diagramm 1) eine der verbreitesten Möglichkeiten Daten visuell darzustellen. Ein Histogramm zeigt an, wie viele Merkmalsausprägungen in einer bestimmten vorher festgelegten Klasse sind. Dabei gibt die y-achse Auskunft über die Häufigkeit der Variable (z.b.: Anzahl von Temperaturwerten) und die x- Achse zeigt die Klassen, in denen die Werte eingeordnet werden (z.b.: in der Klasse 0-5 C liegen 3 Werte). Es liegt also eine Klassenhäufigkeitsverteilung vor, durch die man erkennen kann, wie sich die Diagramm 1: Histogramm [rot] mit Normalverteilung [schwarz] (DUMFARTH & LORUP 2000) 5

7 Werte über das gestammte Wertespektrum verteilen. Die wichtigste Form einer Häufigkeitsverteilung ist die glockenförmige Normalverteilung. Diese ist so bedeutend, da viele statistische Methoden auf Daten angewiesen sind, die aus einer normalverteilten Grundgesamtheit kommen. Bei einer Normalverteilung liegt das arithmetisches Mittel und Median nahe beieinander (oder sind gleich) und repräsentieren die Mitte der Datenmenge (HELMSCHROT & FINK 2001). 2.5 Datenniveaus Da bestimmte deskriptive Methoden nur bei Daten bestimmter Skalenart angewendet werden können, sollen hier die verschieden Skalen kurz vorgestellt werden. Das Problem liegt hier in dem Umstand, dass Daten verschiedenste Merkmalsausprägungen repräsentieren, die in unterschiedlichsten Maßeinheiten gemessen werden. So kann ein Datensatz aus Temperaturdaten bestehen, die in C gespeichert werden oder aber die Entfernungen repräsentieren, die in Metern gemessen werden. Dabei muss beachtet werden, dass man zwar sagen kann, 2m sind doppelt so viel wie 4m, aber 10 C sind nicht doppelt so warm wie 5 C, weil die Maßeinheit Grad Celsius einen zufälligen Nullpunkt hat, im Gegensatz zu Kelvin oder dem metrischen System (HELMSCHROT & FINK 2001). Nominalskalierte Daten sind mit Werten unterschiedlicher Merkmale besetzt und eine Rangfolge der Merkmale kann nicht gebildet werden. Beispiele hierfür sind Namen, Religionszugehörigkeit aber auch bei Ja-Nein-Fragen wie Hat der Haushalt einen PKW?. Die Ordinalskala gilt für Werte, deren Merkmale in eine Rangfolge gebracht werden kann und die Abstände zwischen benachbarten Werten sind nicht immer identisch. Beispiele sind Erdzeitalter, Zensuren oder das Einkaufsverhalten (oft, regelmäßig, selten). Bei intervallskalierten Daten sind die Abstände zwischen benachbarten Werten identisch, aber es gibt keinen definierten Nullpunkt. Darunter fällt die schon oben erwähnte Maßeinheit Grad Celsius, aber auch der Intelligenzquotient. Ratioskalen unterscheiden sich von der intervallskalierten nur in dem Punkt, dass hier ein definierter Nullpunkt festgelegt ist. Dazu gehört die Angabe von Entfernung in Metern, das Gewicht in Kilogramm oder das Einkommen in Euro. (HELMSCHROT & FINK 2001) 6

8 2.6 Objektarten Ähnlich wie bei den Skalenarten ist die Anwendung von statistischen Methoden nur an bestimmte Objektarten gekoppelt (siehe Geary s (c) Index ). Geographische Objekte werden nach ihrer Topologieausdehnung, also der Art wie sie den Raum ausfüllen gemessen. Punkte haben keine dimensionale Ausbreitung, also auch keine Länge, Breite oder Höhe. Punkte können verwendet werden um die räumliche Verteilung von Ereignissen und deren Muster wiederzugeben. Linien haben genau eine Dimension, die Länge. Sie werden verwendet, um Distanzen zu messen oder lineare Objekte darzustellen, beispielsweise Strassen. Flächenobjekte haben eine zwei dimensionale Ausdehnung, die Länge und Breite, aber keine Höhe. Sie werden verwendet, um natürliche Objekte wie Felder oder künstliche Objekte wie Bevölkerungsverteilungen darzustellen. Oberflächen und Volumen sind dreidimensional. Sie finden Verwendung bei der Darstellung von natürlichen Objekten wie digitalen Geländemodellen oder bei Phänomenen wie das Besucherpotential eines Einkaufszentrums. Zeit wird oft als eine weitere Dimension angesehen, kann aber nach LONGLEY et al. (2002: 101) im GIS nur schwer simuliert werden. Wichtig ist noch zu wissen, wie sich die einzelnen Dimensionen zueinander verhalten. So kann man ein höher dimensionales Objekt auf eine niederes Herunterrechnen, aber nicht umgekehrt. Wie man ein Objekt letztendlich im GIS darstellt, hängt auch von dem Maßstab ab. For example, on a less-detailed map of the world, New York is represented as zerodimensional point. On a more-detailed map such as a road atlas it will be represented as twodimensional point. (LONGLEY et al. 2001: 101) In Wirklichkeit ist die Stadt aber dreidimensional und kann als solche auch von bestimmten Softwaresystemen wiedergegeben werden (LONGLEY et al. 2001: 101). 3 Räumliche Autokorrelation 3.1 Hinführung Das Problem der traditionellen statistischen Analysen ist, dass es bei der Untersuchung von Zusammenhängen, die eine stochastische Abhängigkeit aufweisen, zu fehlerhaften Resultaten kommt. So sind Fehlschätzungen der Korrelation zwischen stochastisch abhängigen Variablen möglich, wodurch Test- und Schätzverfahren verzerrte Ergebnisse liefern und Fehlinterpretationen die Folge sind. Allerdings kommen stochastische abhängige Variablen in der Statistik, sehr oft vor und ihre genaue Analyse ist meist von großem Interesse. (BAHRENBERG et al. 2003²: ) Stochastische Abhängigkeit heißt, dass bestimmte statistische Ereignisse nicht unabhängig voneinander auftreten. 7

9 Die Ursache für das Unvermögen der traditionellen Statistik mit Daten umzugehen, die stochastische Abhängig sind, liegt darin, dass sie auf Zufallsvariablen basiert. Darunter versteht man, dass die verschiednen Datenwerte der Zufallsvariable rein zufällig zustande kommen und somit unabhängig voneinander sind (ABLER et al. 1992: 154). Am Beispiel eines Würfelexperiments soll dies verdeutlicht werden. Würfelt man eine 6 hat dies keinerlei Einfluss auf den nächsten Würfeldurchgang. Die Wahrscheinlichkeit wieder eine 6 zu würfeln ist bei jeden Durchgang gleich groß. Vorherige Ereignisse haben keinen Einfluss auf nachfolgende Ereignisse. In Hinblick auf die räumliche Verteilung von Datenpunkten bedeutet dies, daß die verschiedenen Werte einer Variablen unabhängig von ihrer räumlichen Position zustande kommen. Erscheinungen wie Distanz der Werte zueinander, Nachbarschaft, Nähe, Richtung und dergleichen haben also keinen Einfluß auf den Wert eines bzw. aller Datenwerte. (DUMFARTH & LORUP 2000) Dass dies aber nicht den Gegebenheiten der Realität entspricht, ist leicht erkennbar und wird am Beispiel des Bodenmarktes deutlich. Denn dann würde die räumliche Verteilung der Grundstückspreise keinerlei Muster aufzeigen, da ja alles zufallsverteilt ist. Im Stadtzentrum beispielsweise würden sich willkürlich sehr teure Grundstücke mit sehr billigen oder mittelteuren abwechseln. Bei der Geostatistik geht man daher den Ansatz an, dass die Werte, die eine Variable annehmen kann, durch eine Funktion gesteuert wird, weshalb man von regionalisierten Variablen spricht. Das heißt, dass die Werte eines Gebietes bzw. einer Region einander ähnlich sind, weil sie sich ja untereinander beeinflussen können und dass mit zunehmender Entfernung die Ähnlichkeit abnimmt. Dies beschrieb W. TOBLER mit dem ersten Gesetz der Geographie, welches im nächsten Abschnitt erläutert werden wird. Weiterhin geht man davon aus, dass die Verbreitung eines Phänomens nur ausreichend mit zu Hilfenahme von räumlichen Eigenschaften (z.b.: Distanz oder Nachbarschaft) erklärt werden kann (DUMFARTH & LORUP 2000). 3.2 Das erste Gesetz der Geographie und mehr (und seine Folgen) W. TOBER formulierte 1970 das erste gesetzt der Geographie und beschrieb somit das schon seit langem bekannte Phänomen, das sich benachbarte Objekte oft ähnlicher waren als weit entfernte. The first law of geography is that everything is related to everything else, but near things are more related than distant things. (TOBLER 1970 in ABLER 1992: 155) Dieses Gesetz der Geographie ist, so LONGLEY et al. (2001: 99), die allgemeinste Formulierung über die Verteilung räumlicher Erscheinungen. Mit seinem Gesetzt beschreibt TOBLER die räumliche Autokorrelation, also den Grad, mit dem nahe und entfernte Dinge miteinander verbunden sind (LONGLEY et al. 2001: 99). Die räumliche Autokorrelation ist eine Bezeichnung für die Abhängigkeit zwischen benachbarten Orten, wie es überall auf der Erdoberfläche vorkommt. In practice, the 8

10 existence of spatial autocorrelation means that if A and B are close together, what happens at A is related to what happens at B, and vice-versa. (ABLER et al 1992: 287) Obwohl es logisch erscheint, dass Dinge die sich räumlich nahe sind, auch ähnliche Merkmale aufweisen, kann der Umkehrschluss, dass sich die Merkmale von Objekten, die weit entfernt von einander sind, stark unterscheiden, nicht so einfach gezogen werden. Für ABLER et al. (1992: 287) ist vielmehr die Frage entscheidend, wie weit zwei Orte von einander entfernt sein müssen, damit sich diese nicht gegenseitig beeinflussen, sie also unabhängig voneinander sind. Es soll nur kurz erwähnt werden, dass der gleiche Umstand auf die Zeit bezogen zeitliche Autokorrelation genannt wird (LONGLEY et al. 2001: 99). Bei der Bestimmung der räumliche Autokorrelation sind die Lage der Objekte zueinander und ihre Merkmalsausprägung die wichtigsten Faktoren. Dabei werden gleichzeitig die Gemeinsamkeiten im Ort und in der Eigenschaft miteinander verglichen (siehe Abschnitt 3.3 Berechnung der räumlichen Autokorrelation). Wenn Objekte nahe beieinander liegen bzw. benachbart sind und sie das gleichen Merkmal beinhalten, dann spricht man von einem Muster mit positiver räumlichen Autokorrelation. Conversely, negative Spatial autocorrelation is said to exist when features which are close together in space tend to be more dissimilar in attributes than features which are further apart (in opposition to Tobler s Law). (LONGLEY et al. 2001: 100,101) Eine räumliche Autokorrelation ist nicht vorhanden, wenn die Merkmale unabhängig vom Ort sind (LONGLEY et al. 2001: 101). Abbildung 2: Typen der räumlichen Autokorrelation (LO & YEUNG 2002: 117) An Abbildung 2 sind die drei wichtigsten Typen von räumliche Autokorrelationen aufgezeigt. Die Klassifizierung richtet sich nach der relativen Verteilung räumlicher Objekte und ihrer Nachbarn. Feld A zeigt die extremste Form positiver Autokorrelation zwischen benachbarten Zellen. Hier liegen jeweils die schwarzen und weißen Zellen in einer homogenen Fläche zusammen bzw. räumliche Objekte, die die gleichen Eigenschaften haben, liegen räumlich nah beieinander. Das genaue Gegenteil, also eine extrem negative räumliche Autokorrelation, zeigt das Feld C. Hier grenzen an jedes schwarze Feld jeweils nur weiße Felder und 9

11 Abbildung 3: Bevölkerungsverteilung in Kalifornien und Iowa (ABLER et al. 1992: 84) umgekehrt. Eine zufällige räumliche Autokorrelation sieht man im Feld B. Dort gibt es keine größeren Cluster von Objekten mit den gleichen Werten.( LONGLEY et al. 2001: 101 & LO & YEUNG 2002: 117) In Abbildung 3 sieht man ein praktisches Beispiel für die unterschiedliche Typen räumliche Autokorrelation. Hier wird auch deutlich, dass weniger die durchschnittliche Bevölkerungsdichte von Interesse ist (was auch in der traditionellen Statistik berechnet werden kann), sondern dass es für eine Interpretation viel interessanter (aber auch schwieriger) zu wissen ist, wo Ballungen und wo ländliche Gebiete sind. Beide Regionen sind von der Fläche her in etwa gleich groß, haben aber eine vollkommen unterschiedliche Bevölkerungsverteilung. In San Bernardino herrscht aufgrund des nur in wenigen Teilen erreichbaren Grundwassers eine starke räumliche Autokorrelation der Bevölkerung. Im Gegensatz dazu steht das Gebiet in Iowa, das nur eine schlechte räumliche Autokorrelation aufweist, was u.a. auf die gleichmäßig vorkommenden Ressourcen zurückzuführen ist (ABLER et al. 1992: 83). 3.3 Berechnung der räumliche Autokorrelation Bei der Berechnung der räumliche Autokorrelation werden zwei Werte miteinander verglichen. Erstens die Gleichwertigkeit der Attribute und zweitens die Ähnlichkeit des Ortes der Objekte, welche mit den Attributen besetzt sind. Dabei hängt es von dem verwendeten Datentyp ab, mit welcher Methode die Attribute miteinander verglichen werden können und von dem Objekttyp, 10

12 wie die Nachbarschaft festgestellt werden kann (LONGLEY et al. 2001: 114). Zwei der wichtigsten Methoden, die räumliche Autokorrelation anzugeben, ist der Geary s (c) Index und der Moran s (I) Index (LO & YEUNG 2002: 351) Geary s (c) Index Der von Geary entwickelte Index ist eine Maß zur Angabe der räumliche Autokorrelation für Objekte mit intervallskalierten Attributdaten. Deshalb kann man diesen Index gut bei der Analyse von Datenansammlungen verwenden, die von Erhebungsgebieten (engl. census tracts) stammen. Der Geary s (c) Index misst die Ähnlichkeit der Werte von i und j (siehe Formel 6). Die Variable z i entspricht dem Wert des Objektes c i. Die Ähnlichkeit des Ortes, wo sich i und j befinden, wird durch die boolesche Variable w ij angegeben, wobei w ij = 1 ist, wenn sie benachbart sind und wij = 0, wenn sie es nicht sind (LO & YEUNG 2002: 351,352). Aber das ist nur eine von vielen Möglichkeiten, w ij zu definieren, denn w ij repräsentiert die Nachbarschaftsbeziehungen und da diese je nach Aufgabe anders festgelegt werden können, muss diese auch in der Formel entsprechend definiert werden (BAHRENBERG et al. 2003²: ). Daraus ergibt sich dann der Index (c) wie in Formel 7 beschrieben, wobei s ² die Varianz des Merkmale z i ist. Wenn das Ergebnis von c = 1 ist, dann sind die Merkmale der Objekte unabhängig von ihrer Lage verteilt. Der Index (c) ist kleiner als eins, wenn gleiche Merkmale an gleichen Orten vorkommen, es also eine positive räumliche Autokorrelation gibt. Und schließlich kann (c) auch größer als eins sein, wenn sich Merkmale und Lage der Objekte unterscheiden, also eine negative räumliche Autokorrelation vorliegt (LO & YEUNG 2002: 351,352). Formel 6: Berechnung des Geary s (c) Index (LO & YEUNG 2002: 351) Formel 7: Berechnung des Geary s (c) Index (LO & YEUNG 2002: 351) 11

13 3.3.2 Moran s (I) Index Der Moran s (I) Index hat starke Ähnlichkeit mit Geary s Index mit dem Unterschied, dass hier die Ergebnisse dem Betrachter wahrscheinlich logischer erscheinen. Denn hier stehen positive Ergebnisse auch für eine positive räumliche Autokorrelation und negative für eine negative räumliche Autokorrelation. Wenn der Index 0 ist, weist dies auf unabhängige unkorrelierte Daten hin, mit zufälliger Anordnung. Die Variablen in der unteren Formel 8 zur Berechnung des Index (I) werden fast genauso definiert wie bei Geary s (c) Index. Allerdings wird c ij nach der oberen Formel 8 beschrieben. z i steht wieder für den Wert des Objektes i und j. Die Variable ist der Mittelwert, s² entspricht der Varianz von z i. Die räumliche Nähe für i und j wird wieder durch w ij, angegeben (LO & YEUNG 2002:352). Moran s and Gearie s Index kann man nur bei flächenhaften Objekten anwenden. Es gibt aber Punkt, Linien und Rasterobjekte für die auch über Umwege eine Berechnung der räumliche Autokorrelation möglich ist. Bei Punktdaten kann man beispielsweise die Punkte in Flächen umwandeln und dann so die oben erwähnten Indizes anwenden. Die räumliche Autokorrelation zwischen linienförmigen Objekte kann man berechen, Formel 8: Berechnung des Moran s (I) Index wenn die Linien Verbindungen zwischen (LO & YEUNG 2002: 352) Punkten repräsentieren, die mit Merkmalen besetzt sind. So wird dann die Merkmalsähnlichkeit von den Punktpaaren mit anderen Punktpaaren verglichen und die räumliche Nähe wird dadurch gemessen ob es eine direkte Verbindung zwischen den Punktpaaren gibt. Bei Rasterdaten wird einfach verglichen, ob einzelne Rasterzellen gleiche Außengrenzen haben (LO & YEUNG 2002: 352). 3.4 Probleme Datenherkunft Ein allgemeines Problem, das viele Analysen betrifft, ist, dass man nicht weiß, ob die Ergebnisse stimmen, weil man nicht sicher sein kann, dass die Daten, die diesen zu Grunde liegen, korrekt sind. Mit den Worten von LONGLEY et al. (2001: 137) ausgedrückt: Uncertainties in data lead to uncertainties in the result of analysis. Die Ursache liegt u.a. in der Generalisierung und Bündelung der rohen Ausgangsdaten (welche die Realität widerspiegeln sollen), z.b.: wenn Krankheitsfälle nur pro Bezirk angegeben werden oder 12

14 Bevölkerungszahlen nur für ein bestimmtes Gebiet angeboten werden. Obwohl man die Ursache für dieses Problem nicht beheben kann, ist es doch möglich, es genau zu quantifizieren, um so zumindest die schlimmsten Effekte zu verringern. Die Probleme kommen auch daher, weil in einen GIS Daten unterschiedlichster Herkunft, Maßstabes, Detailgenauigkeit und Klassifizierung miteinander verschmelzt werden (LONGLEY et al. 2001: 137) MAUP Das modifiable areal unit problem (MAUP) tritt auf, wenn willkürlich festgelegte Grenzen für die Berechnung von räumlichen Ereignissen genutzt werden. Dies tritt z.b. bei Volkszählungsdaten auf, die in bestimmten Flächen angegeben werden, oder die Angabe des Wahlergebnisses wird höchstens in der Größe von Stadtvierteln gemacht, nicht aber in der von Einzelpersonen. Vom statistischen Standpunkt her sind diese Grenzen beliebig festgelegt worden weil, They do not necessarily consider with breaks in the data. Thus, changing the boundaries of units [ ] can affect the appearance of the data. (HEYWOOD et al. 2002²: 125) Deshalb ist es sehr problematisch, zwei Karten oder Datensätze miteinander zu vergleichen, die denselben Ausschnitt zeigen, aber deren Flächeneinheiten sich unterscheiden (HEYWOOD et al. 2002²: 125 & LONGLEY et al. 2001: 138). 3.5 Spatial Sampling Als letztes soll noch kurz auf das spatial sampling eingegangen werden, da die durch das sampling reduzierten Daten auch bei der Analyse der räumliche Autokorrelation verwendet werden. Sampling ist ein Prozess, bei dem aus einem Feld mit vielen Objekten, einige wenige herausgesucht werden. Dies ist nötig, da die reale Welt unendlich komplex ist, ein GIS aber nicht unendlich viele Daten verarbeiten kann. Daher braucht es eine Reduzierung der Daten, wie es durch das sampling geschieht. Die sampling Modelle (engl.: sampling scheme, siehe Abbildung 4) bestimmen die räumliche Verteilung der einzelnen Stichprobenpunkte im Untersuchungsgebiet (LONGLEY et al. 2001: 103). Das Feld A in Abbildung 4 zeigt eine einfache zufällige Stichprobe, also eine, in der jeder Punkt die gleiche Wahrscheinlichkeit hatte, gezogen zu werden. Dieses Modell hat den Vorteil, dass es statistisch völlig korrekt ist, aber es weist in der Praxis einige Schwierigkeiten auf. So kann es vorkommen, das kleine, aber wichtige Bereiche unterpräsentiert werden, es sei denn es handelt sich um eine sehr große Anzahl von Stichproben. Bei einer systematischen Stichprobe wird der erste Punkt zufällig ermittelt und an diesem dann die restlichen entlang eines festen Schemas ausgerichtet, wie in Feld B zu sehen. Diese Methode ist einfach durchzuführen, kann aber bei Daten die periodischen Änderungen unterliegen, starke Fehler verursachen. 13

15 Eine strategische Zufallstichprobe findet man dann vor, wenn man das Untersuchungsgebiet in bestimmte Teilgebiete gliedert und dann in jedem Teilgebiet eine zufällige Stichrobe nimmt (siehe Abbildung 4, Feld C).Dieses Modell scheint am geeignetsten, weil nur eine geringe Anzahl von Stichproben gezogen werden muss. Allerdings leidet dieses Modell auch unter denselben Problemen wie die Zufallsstichprobe. Das letzte hier aufgeführte sampling Modell zeigt ein strategisches, systematisches und unangepasstes Modell. Wie der Name schon sagt, vereinigt es die Vorgehensweise und auch Vorteile der drei vorher genannten Modelle (LO & YEUNG 2002: 118,119). Zur Stichprobenanzahl lässt sich sagen, dass je heterogener räumliche Phänomene verteilt sind, desto mehr Stichproben sollten genommen werden, um die ganze breite des Umfanges zu erfassen. Und je homogener die Verteilung desto weniger Stichproben müssen genommen werden. Zu beachten ist, dass aus Gründen der Repräsentativität eine gewisse Mindestanzahl an Stichproben gesammelt werden müssen (LONGLEY et al. 2001: 118). Abbildung 4: Vier geographische sampling Modelle (LO & YEUNG 2002: 118 ) 14

16 4 Schlussbemerkung Wie hoffentlich gezeigt werden konnte ist die Analyse räumlich korrelierter Daten eine komplexe, aber aufschlussreiche Methodik mit vielfachen Anwendungsmöglichkeiten. Trotzdem ist mir beim lesen der vielfältigen Literatur aufgefallen, dass immer wieder erwähnt wird, dass die Methoden zur Analyse räumlichen korrelierter Daten nur schlecht oder gar nicht in GIS integriert sind, wie auch LO & YEUNG (2002: 350) bemängeln. Lediglich mit Idris32 so LO & YEUNG (2002: 350) ist es möglich räumlichen Autokorrelation mit den Modul AUTOCORR zu bestimmen. Hingegen bietet das weit verbreitet ArcInfo keine direkte Unterstützung bei der Analyse von räumlichen Autokorrelation. Nur durch eine Kopplung mit anderen Statistikprogrammen (z.b.: SPSS) kann diese Funktion implementiert werden. Bleibt zu hoffen, dass in Zukunft diesem Gebiet der Datenanalyse mehr Aufmerksamkeit geschenkt wird, um deren Bedeutung gerecht zu werden. Literatur ABLER R.F., MARCUS G. M. & J. M. OLSEN (1992): Geography s inner worlds, Pervasive Themes in Contemporary American Geography. New Jersey. BAHRENBERG G., GIESE E. & J. NIPPER (2003²): Statistische Methoden in der Geographie, Bd. 2. Berlin, Stuttgart. HEYWOOD I., CORNELIUS S. & S. CARVER (2002²): An Introduction to Geographical Information Systems. Essex. LO C. P. & A. K.W. YEUNG (2002): Concepts and Techniques of Geographic Information Systems. New Jersey. LONGLEY P. A., GOODCHILD M.F., MAGUIRE D. J. & D.W. RHIND (2001): Geographic Information, Systems and Science. Chichester, New York. Internetliteratur HELMSCHROT J. & M. FINK (2001): Skript zum Proseminar Statistik, (letzter Aufruf 2002) DUMFARTH E. & E. J. LORUP (2000): Geostatistik I - Theorie und Praxis, (letzter Aufruf ) 15

Business Value Launch 2006

Business Value Launch 2006 Quantitative Methoden Inferenzstatistik alea iacta est 11.04.2008 Prof. Dr. Walter Hussy und David Tobinski UDE.EDUcation College im Rahmen des dokforums Universität Duisburg-Essen Inferenzstatistik Erläuterung

Mehr

Evaluation der Normalverteilungsannahme

Evaluation der Normalverteilungsannahme Evaluation der Normalverteilungsannahme. Überprüfung der Normalverteilungsannahme im SPSS P. Wilhelm; HS SPSS bietet verschiedene Möglichkeiten, um Verteilungsannahmen zu überprüfen. Angefordert werden

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Maßzahlen für zentrale Tendenz, Streuung und andere Eigenschaften von Verteilungen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische

Mehr

Auswertung und Darstellung wissenschaftlicher Daten (1)

Auswertung und Darstellung wissenschaftlicher Daten (1) Auswertung und Darstellung wissenschaftlicher Daten () Mag. Dr. Andrea Payrhuber Zwei Schritte der Auswertung. Deskriptive Darstellung aller Daten 2. analytische Darstellung (Gruppenvergleiche) SPSS-Andrea

Mehr

Auswertung mit dem Statistikprogramm SPSS: 30.11.05

Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Auswertung mit dem Statistikprogramm SPSS: 30.11.05 Seite 1 Einführung SPSS Was ist eine Fragestellung? Beispiel Welche statistische Prozedur gehört zu welcher Hypothese? Statistische Berechnungen mit

Mehr

Webergänzung zu Kapitel 10

Webergänzung zu Kapitel 10 Webergänzung zu Kapitel 10 10.1.4 Varianzanalyse (ANOVA: analysis of variance) Im Kapitel 10 haben wir uns hauptsächlich mit Forschungsbeispielen beschäftigt, die nur zwei Ergebnissätze hatten (entweder

Mehr

5. Schließende Statistik. 5.1. Einführung

5. Schließende Statistik. 5.1. Einführung 5. Schließende Statistik 5.1. Einführung Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen.

Mehr

Florian Frötscher und Demet Özçetin

Florian Frötscher und Demet Özçetin Statistische Tests in der Mehrsprachigkeitsforschung Aufgaben, Anforderungen, Probleme. Florian Frötscher und Demet Özçetin florian.froetscher@uni-hamburg.de SFB 538 Mehrsprachigkeit Max-Brauer-Allee 60

Mehr

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18 3. Deskriptive Statistik Ziel der deskriptiven (beschreibenden) Statistik (explorativen Datenanalyse) ist die übersichtliche Darstellung der wesentlichen in den erhobenen Daten enthaltene Informationen

Mehr

Studiendesign/ Evaluierungsdesign

Studiendesign/ Evaluierungsdesign Jennifer Ziegert Studiendesign/ Evaluierungsdesign Praxisprojekt: Nutzerorientierte Evaluierung von Visualisierungen in Daffodil mittels Eyetracker Warum Studien /Evaluierungsdesign Das Design einer Untersuchung

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.) ue biostatistik: nichtparametrische testverfahren / ergänzung 1/6 h. Lettner / physik Statistische Testverfahren Einige Statistische Tests für den Ein- Zwei- und k-stichprobenfall (Nach Sachs, Stat. Meth.)

Mehr

Einführung in die statistische Datenanalyse I

Einführung in die statistische Datenanalyse I Einführung in die statistische Datenanalyse I Inhaltsverzeichnis 1. EINFÜHRUNG IN THEORIEGELEITETES WISSENSCHAFTLICHES ARBEITEN 2 2. KRITIERIEN ZUR AUSWAHL STATISTISCH METHODISCHER VERFAHREN 2 3. UNIVARIATE

Mehr

Linearer Zusammenhang von Datenreihen

Linearer Zusammenhang von Datenreihen Linearer Zusammenhang von Datenreihen Vielen Problemen liegen (möglicherweise) lineare Zusammenhänge zugrunde: Mein Internetanbieter verlangt eine Grundgebühr und rechnet minutenweise ab Ich bestelle ein

Mehr

Willkommen zur Vorlesung Statistik (Master)

Willkommen zur Vorlesung Statistik (Master) Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungsfreie Verfahren Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften

Mehr

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung

Herzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel

Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel Grundlagen quantitativer Sozialforschung Interferenzstatistische Datenanalyse in MS Excel 16.11.01 MP1 - Grundlagen quantitativer Sozialforschung - (4) Datenanalyse 1 Gliederung Datenanalyse (inferenzstatistisch)

Mehr

Methoden der empirischen Sozialforschung I

Methoden der empirischen Sozialforschung I Methoden der empirischen Sozialforschung I Annelies Blom, PhD TU Kaiserslautern Wintersemester 2011/12 Übersicht Quantitative Datenauswertung: deskriptive und induktive Statistik Wiederholung: Die wichtigsten

Mehr

Transistor-Mismatch bei einem Strom-DAC in 65nm-Technologie

Transistor-Mismatch bei einem Strom-DAC in 65nm-Technologie Electronic Vision(s) Universität Heidelberg Transistor-Mismatch bei einem Strom-DAC in 65nm-Technologie Projektpraktikum Für den Studiengang Bachelor Physik Christian Graf 2011 1 Inhaltsverzeichnis Inhaltsverzeichnis

Mehr

Kaplan-Meier-Schätzer

Kaplan-Meier-Schätzer Kaplan-Meier-Schätzer Ausgangssituation Zwei naive Ansätze zur Schätzung der Survivalfunktion Unverzerrte Schätzung der Survivalfunktion Der Kaplan-Meier-Schätzer Standardfehler und Konfidenzintervall

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst Excel Edition ^ Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3

Mehr

Willkommen zur Vorlesung Statistik

Willkommen zur Vorlesung Statistik Willkommen zur Vorlesung Statistik Thema dieser Vorlesung: Varianzanalyse Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften Prof. Dr. Wolfgang

Mehr

1 Verteilungen und ihre Darstellung

1 Verteilungen und ihre Darstellung GKC Statistische Grundlagen für die Korpuslinguistik Kapitel 2: Univariate Deskription von Daten 8.11.2004 Univariate (= eindimensionale) Daten bestehen aus Beobachtungen eines einzelnen Merkmals. 1 Verteilungen

Mehr

Statistik und Wahrscheinlichkeitsrechnung

Statistik und Wahrscheinlichkeitsrechnung Statistik und Wahrscheinlichkeitsrechnung Übung 2 28.02.2008 1 Inhalt der heutigen Übung Beschreibende Statistik Gemeinsames Lösen der Übungsaufgaben 2.1: Häufigkeitsverteilung 2.2: Tukey Boxplot 25:Korrelation

Mehr

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen Warum überhaupt Gedanken machen? Was fehlt, ist doch weg, oder? Allgegenwärtiges Problem in psychologischer Forschung Bringt Fehlerquellen

Mehr

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1

Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 LÖSUNG 3A Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Mit den Berechnungsfunktionen LG10(?) und SQRT(?) in "Transformieren", "Berechnen" können logarithmierte Werte sowie die Quadratwurzel

Mehr

Teil II: Einführung in die Statistik

Teil II: Einführung in die Statistik Teil II: Einführung in die Statistik (50 Punkte) Bitte beantworten Sie ALLE Fragen. Es handelt sich um multiple choice Fragen. Sie müssen die exakte Antwortmöglichkeit angeben, um die volle Punktzahl zu

Mehr

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge

Füllmenge. Füllmenge. Füllmenge. Füllmenge. Mean = 500,0029 Std. Dev. = 3,96016 N = 10.000. 485,00 490,00 495,00 500,00 505,00 510,00 515,00 Füllmenge 2.4 Stetige Zufallsvariable Beispiel. Abfüllung von 500 Gramm Packungen einer bestimmten Ware auf einer automatischen Abfüllanlage. Die Zufallsvariable X beschreibe die Füllmenge einer zufällig ausgewählten

Mehr

Datenanalyse mit Excel. Wintersemester 2013/14

Datenanalyse mit Excel. Wintersemester 2013/14 Datenanalyse mit Excel 1 KORRELATIONRECHNUNG 2 Korrelationsrechnung Ziel der Korrelationsrechnung besteht im bivariaten Fall darin, die Stärke des Zusammenhangs zwischen zwei interessierenden statistischen

Mehr

Graphische Darstellung einer univariaten Verteilung:

Graphische Darstellung einer univariaten Verteilung: Graphische Darstellung einer univariaten Verteilung: Die graphische Darstellung einer univariaten Verteilung hängt von dem Messniveau der Variablen ab. Bei einer graphischen Darstellung wird die Häufigkeit

Mehr

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik

8. Statistik Beispiel Noten. Informationsbestände analysieren Statistik Informationsbestände analysieren Statistik 8. Statistik Nebst der Darstellung von Datenreihen bildet die Statistik eine weitere Domäne für die Auswertung von Datenbestände. Sie ist ein Fachgebiet der Mathematik

Mehr

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 1 Einführung in die statistische Datenanalyse Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau 2 Gliederung 1.Grundlagen 2.Nicht-parametrische Tests a. Mann-Whitney-Wilcoxon-U Test b. Wilcoxon-Signed-Rank

Mehr

Einführung in statistische Analysen

Einführung in statistische Analysen Einführung in statistische Analysen Andreas Thams Econ Boot Camp 2008 Wozu braucht man Statistik? Statistik begegnet uns jeden Tag... Weihnachten macht Deutschen Einkaufslaune. Im Advent überkommt die

Mehr

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen 4. Datenanalyse und Modellbildung Deskriptive Statistik 2-1 2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen Für die Auswertung einer Messreihe, die in Form

Mehr

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER DAS THEMA: INFERENZSTATISTIK IV INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE Inferenzstatistik für Zusammenhänge Inferenzstatistik für Unterschiede

Mehr

Einfache statistische Auswertungen mit dem Programm SPSS

Einfache statistische Auswertungen mit dem Programm SPSS Einfache statistische Auswertungen mit dem Programm SPSS Datensatz: fiktive_daten.sav Dipl. Päd. Anne Haßelkus Dr. Dorothea Dette-Hagenmeyer 11/2011 Überblick 1 Deskriptive Statistiken; Mittelwert berechnen...

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

12. Vergleich mehrerer Stichproben

12. Vergleich mehrerer Stichproben 12. Vergleich mehrerer Stichproben Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Häufig wollen wir verschiedene Populationen, Verfahren, usw. miteinander vergleichen. Beipiel: Vergleich

Mehr

Phrasensammlung für wissenschaftliches Arbeiten

Phrasensammlung für wissenschaftliches Arbeiten Phrasensammlung für wissenschaftliches Arbeiten Einleitung In diesem Aufsatz/dieser Abhandlung/dieser Arbeit werde ich... untersuchen/ermitteln/bewerten/analysieren... Um diese Frage zu beantworten, beginnen

Mehr

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum)

Skriptum zur Veranstaltung. Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik. 1. Version (mehr Draft als Skriptum) Skriptum zur Veranstaltung Quantitative Methoden (Mathematik/Statistik) Teil Induktive Statistik 1. Version (mehr Draft als Skriptum) Anmerkungen, Aufzeigen von Tippfehlern und konstruktive Kritik erwünscht!!!

Mehr

Einfache statistische Auswertungen mit dem TI-Nspire

Einfache statistische Auswertungen mit dem TI-Nspire 1. Neues Dokument und darin eine neue Seite anlegen Als Typ 6: Lists & Spreadsheet wählen. Darin die Messwerte in einer Spalte erfassen. Dies ergibt die Urliste. Wenn mehrere Messwerte vorliegen, die diejenigen,

Mehr

Einfache Statistiken in Excel

Einfache Statistiken in Excel Einfache Statistiken in Excel Dipl.-Volkswirtin Anna Miller Bergische Universität Wuppertal Schumpeter School of Business and Economics Lehrstuhl für Internationale Wirtschaft und Regionalökonomik Raum

Mehr

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung

Kapitel 3. Zufallsvariable. Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion. Erwartungswert, Varianz und Standardabweichung Kapitel 3 Zufallsvariable Josef Leydold c 2006 Mathematische Methoden III Zufallsvariable 1 / 43 Lernziele Diskrete und stetige Zufallsvariable Wahrscheinlichkeitsfunktion, Dichte und Verteilungsfunktion

Mehr

Selbstorganisierende Karten

Selbstorganisierende Karten Selbstorganisierende Karten Yacin Bessas yb1@informatik.uni-ulm.de Proseminar Neuronale Netze 1 Einleitung 1.1 Kurzüberblick Die Selbstorganisierenden Karten, auch Self-Organizing (Feature) Maps, Kohonen-

Mehr

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de

1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de 1. Allgemeine Hinweise Alexander.Martin.Koenig@TU-Clausthal.de Man sollte eine Excel-Tabelle immer so übersichtlich wie möglich halten. Dazu empfiehlt es sich, alle benötigten Daten, Konstanten und Messwerte

Mehr

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung?

1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 86 8. Lageparameter Leitfragen 1) Warum ist die Lage einer Verteilung für das Ergebnis einer statistischen Analyse von Bedeutung? 2) Was ist der Unterschied zwischen Parametern der Lage und der Streuung?

Mehr

1.4 Installation eines Qualitätsmanagementsystems

1.4 Installation eines Qualitätsmanagementsystems Ko n t r o l l f r a g e n : 1 Geben Sie vier Argumente an, die für die Installation eines Qualitätsmanagementsystems sprechen. 2 Erläutern Sie den Zusammenhang zwischen einem funktionierenden Qualitätsmanagementsystem

Mehr

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen

Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen. Anteile Häufigkeiten Verteilungen DAS THEMA: VERTEILUNGEN LAGEMAßE - STREUUUNGSMAßE Anteile Häufigkeiten Verteilungen Lagemaße Streuungsmaße Merkmale von Verteilungen Anteile Häufigkeiten Verteilungen Anteile und Häufigkeiten Darstellung

Mehr

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit

Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Messgeräte: Mess-System-Analyse und Messmittelfähigkeit Andreas Berlin 14. Juli 2009 Bachelor-Seminar: Messen und Statistik Inhalt: 1 Aspekte einer Messung 2 Mess-System-Analyse 2.1 ANOVA-Methode 2.2 Maße

Mehr

Statistik, Geostatistik

Statistik, Geostatistik Geostatistik Statistik, Geostatistik Statistik Zusammenfassung von Methoden (Methodik), die sich mit der wahrscheinlichkeitsbezogenen Auswertung empirischer (d.h. beobachteter, gemessener) Daten befassen.

Mehr

Statistik I für Betriebswirte Vorlesung 5

Statistik I für Betriebswirte Vorlesung 5 Statistik I für Betriebswirte Vorlesung 5 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 07. Mai 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 5 1 Klassische Wahrscheinlichkeitsdefinition

Mehr

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1

Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008. Aufgabe 1 Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik I (mit Kurzlösung) Wintersemester 2007/2008 Aufgabe 1 Ihnen liegt

Mehr

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro

Auswerten mit Excel. Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro Auswerten mit Excel Viele Video-Tutorials auf Youtube z.b. http://www.youtube.com/watch?v=vuuky6xxjro 1. Pivot-Tabellen erstellen: In der Datenmaske in eine beliebige Zelle klicken Registerkarte Einfügen

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik [descriptive statistics] Ziel der deskriptiven (beschreibenden) Statistik einschließlich der explorativen Datenanalyse [exploratory data analysis] ist zunächst die übersichtliche

Mehr

Dokumentation. estat Version 2.0

Dokumentation. estat Version 2.0 Dokumentation estat Version 2.0 Installation Die Datei estat.xla in beliebiges Verzeichnis speichern. Im Menü Extras AddIns... Durchsuchen die Datei estat.xla auswählen. Danach das Auswahlhäkchen beim

Mehr

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8

Profil A 49,3 48,2 50,7 50,9 49,8 48,7 49,6 50,1 Profil B 51,8 49,6 53,2 51,1 51,1 53,4 50,7 50 51,5 51,7 48,8 1. Aufgabe: Eine Reifenfirma hat für Winterreifen unterschiedliche Profile entwickelt. Bei jeweils gleicher Geschwindigkeit und auch sonst gleichen Bedingungen wurden die Bremswirkungen gemessen. Die gemessenen

Mehr

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch

- Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch 1 2 - Eine typische Ausfallrate, wie sie bei vielen technischen Anwendungen zu sehen ist hat die Form einer Badewanne, deshalb nennt man diese Kurve auch Badewannenkurve. -mit der Badewannenkurve lässt

Mehr

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent

1. Maße der zentralen Tendenz Beispiel: Variable Anzahl der Geschwister aus Jugend '92. Valid Cum Value Frequency Percent Percent Percent Deskriptive Statistik 1. Verteilungsformen symmetrisch/asymmetrisch unimodal(eingipflig) / bimodal (zweigipflig schmalgipflig / breitgipflig linkssteil / rechtssteil U-förmig / abfallend Statistische Kennwerte

Mehr

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots Einleitung Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots von Irmela Herzog Im Rahmen der Herbsttagung der AG DANK (Datenanalyse und Numerische Klassifikation)

Mehr

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel

Anhand des bereits hergeleiteten Models erstellen wir nun mit der Formel Ausarbeitung zum Proseminar Finanzmathematische Modelle und Simulationen bei Raphael Kruse und Prof. Dr. Wolf-Jürgen Beyn zum Thema Simulation des Anlagenpreismodels von Simon Uphus im WS 09/10 Zusammenfassung

Mehr

RUPRECHTS-KARLS-UNIVERSITÄT HEIDELBERG

RUPRECHTS-KARLS-UNIVERSITÄT HEIDELBERG Die Poisson-Verteilung Jianmin Lu RUPRECHTS-KARLS-UNIVERSITÄT HEIDELBERG Ausarbeitung zum Vortrag im Seminar Stochastik (Wintersemester 2008/09, Leitung PD Dr. Gudrun Thäter) Zusammenfassung: In der Wahrscheinlichkeitstheorie

Mehr

Brückenkurs Statistik für Wirtschaftswissenschaften

Brückenkurs Statistik für Wirtschaftswissenschaften Peter von der Lippe Brückenkurs Statistik für Wirtschaftswissenschaften Weitere Übungsfragen UVK Verlagsgesellschaft mbh Konstanz Mit UVK/Lucius München UVK Verlagsgesellschaft mbh Konstanz und München

Mehr

Methoden Quantitative Datenanalyse

Methoden Quantitative Datenanalyse Leitfaden Universität Zürich ISEK - Andreasstrasse 15 CH-8050 Zürich Telefon +41 44 635 22 11 Telefax +41 44 635 22 19 www.isek.uzh.ch 11. September 2014 Methoden Quantitative Datenanalyse Vorbereitung

Mehr

9. Schätzen und Testen bei unbekannter Varianz

9. Schätzen und Testen bei unbekannter Varianz 9. Schätzen und Testen bei unbekannter Varianz Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Schätzen und Testen bei unbekannter Varianz Wenn wir die Standardabweichung σ nicht kennen,

Mehr

Einfache statistische Testverfahren

Einfache statistische Testverfahren Einfache statistische Testverfahren Johannes Hain Lehrstuhl für Mathematik VIII (Statistik) 1/29 Hypothesentesten: Allgemeine Situation Im Folgenden wird die statistische Vorgehensweise zur Durchführung

Mehr

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik)

Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) 2 3 Klausur-Nr = Sitzplatz-Nr Prüfung zu Modul 26 (BA Bw) bzw. 10 (BA IB) (Wirtschaftsstatistik) Klausurteil 1: Beschreibende Statistik BeStat-1 (7 ) n = 400 Personen wurden gefragt, wie viele Stück eines

Mehr

Professur für Betriebswirtschaftslehre, insbesondere Verkehrsbetriebslehre und Logistik. GIS Tutorium

Professur für Betriebswirtschaftslehre, insbesondere Verkehrsbetriebslehre und Logistik. GIS Tutorium Professur für Betriebswirtschaftslehre,, M.A. GIS Grundlagen Geographisches Informationssystem (hier: MapInfo Professional 7.5) Digitale Erfassung, Speicherung, Organisation, Modellierung und Analyse von

Mehr

Trendlinien in Diagrammen (Excel 2010)

Trendlinien in Diagrammen (Excel 2010) Trendlinien in Diagrammen (Excel 2010) Trendlinien in Diagrammen (Excel 2010)... 1 Allgemeines... 2 Informationen über Prognosen und das Anzeigen von Trends in Diagrammen... 3 AUSWÄHLEN DES PASSENDEN TRENDLINIETYPS

Mehr

1. GEGENSTAND UND GRUNDBEGRIFFE DER STATISTIK

1. GEGENSTAND UND GRUNDBEGRIFFE DER STATISTIK 1 1. GEGENSTAND UND GRUNDBEGRIFFE DER STATISTIK 1.1 Gegenstand der Statistik Die Statistik stellt ein Instrumentarium bereit, um Informationen über die Realität oder Wirklichkeit verfügbar zu machen. Definition

Mehr

Statistik I für Betriebswirte Vorlesung 2

Statistik I für Betriebswirte Vorlesung 2 Statistik I für Betriebswirte Vorlesung 2 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik 16. April 2015 PD Dr. Frank Heyde Statistik I für Betriebswirte Vorlesung 2 1 ii) empirische

Mehr

TÜV Service tested Prüfgrundlagen

TÜV Service tested Prüfgrundlagen TÜV Service tested Prüfgrundlagen 60 Grundsätzliche Prüfgrundlagen Für die Auszeichnung TÜV Service tested müssen drei Voraussetzungen erfüllt sein: 1. Die Gesamtzufriedenheit muss von den Kunden des Unternehmens

Mehr

Empirische Methoden PM-EMP-P12-040828

Empirische Methoden PM-EMP-P12-040828 Studiengang Pflegemanagement Fach Empirische Methoden Art der Leistung Prüfungsleistung Klausur-Knz. Datum 28.08.2004 Die Klausur besteht aus 5 Aufgaben, von denen alle zu lösen sind. Ihnen stehen 90 Minuten

Mehr

Deskriptive Statistik

Deskriptive Statistik Deskriptive Statistik In der beschreibenden Statistik werden Methoden behandelt, mit deren Hilfe man Daten übersichtlich darstellen und kennzeichnen kann. Die Urliste (=Daten in der Reihenfolge ihrer Erhebung)

Mehr

Einführung in die Statistik mir R

Einführung in die Statistik mir R Einführung in die Statistik mir R ww w. syn t egris.de Überblick GESCHÄFTSFÜHRUNG Andreas Baumgart, Business Processes and Service Gunar Hofmann, IT Solutions Sven-Uwe Weller, Design und Development Jens

Mehr

Mittelwert und Standardabweichung

Mittelwert und Standardabweichung Professur E-Learning und Neue Medien Institut für Medienforschung Philosophische Fakultät Einführung in die Statistik Mittelwert und Standardabweichung Überblick Mittelwert Standardabweichung Weitere Maße

Mehr

Anwendungshinweise zur Anwendung der Soziometrie

Anwendungshinweise zur Anwendung der Soziometrie Anwendungshinweise zur Anwendung der Soziometrie Einführung Die Soziometrie ist ein Verfahren, welches sich besonders gut dafür eignet, Beziehungen zwischen Mitgliedern einer Gruppe darzustellen. Das Verfahren

Mehr

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Analytische Statistik I Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10 Testen Anpassungstests (goodness of fit) Weicht eine gegebene Verteilung signifikant von einer bekannten

Mehr

Multivariate Statistik

Multivariate Statistik Hermann Singer Multivariate Statistik 1 Auflage 15 Oktober 2012 Seite: 12 KAPITEL 1 FALLSTUDIEN Abbildung 12: Logistische Regression: Geschätzte Wahrscheinlichkeit für schlechte und gute Kredite (rot/blau)

Mehr

Varianzanalyse ANOVA

Varianzanalyse ANOVA Varianzanalyse ANOVA Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/23 Einfaktorielle Varianzanalyse (ANOVA) Bisher war man lediglich in der Lage, mit dem t-test einen Mittelwertsvergleich für

Mehr

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln

Häufigkeitstabellen. Balken- oder Kreisdiagramme. kritischer Wert für χ2-test. Kontingenztafeln Häufigkeitstabellen Menüpunkt Data PivotTable Report (bzw. entsprechendes Icon): wähle Data Range (Zellen, die die Daten enthalten + Zelle mit Variablenname) wähle kategoriale Variable für Spalten- oder

Mehr

Statistik II für Betriebswirte Vorlesung 3

Statistik II für Betriebswirte Vorlesung 3 PD Dr. Frank Heyde TU Bergakademie Freiberg Institut für Stochastik Statistik II für Betriebswirte Vorlesung 3 5. November 2013 Beispiel: Aktiensplit (Aczel & Sounderpandan, Aufg. 14-28) Ein Börsenanalyst

Mehr

(VU) Übungen zur Einführung in die statistische Datenanalyse II. Inhalte Statistik I. Inhalte Statistik I Deskriptive Statistik

(VU) Übungen zur Einführung in die statistische Datenanalyse II. Inhalte Statistik I. Inhalte Statistik I Deskriptive Statistik II Übungen zur II Organisatorische Hinweise Keine Anwesenheitspflicht (aber empfehlenswert) Einführung in die statistische Datenanalyse II (VU) Lehrinhalte (.ppt Folien): elearning.univie.ac.at 3 Prüfungstermine:

Mehr

Eine Einführung in R: Statistische Tests

Eine Einführung in R: Statistische Tests Eine Einführung in R: Statistische Tests Bernd Klaus, Verena Zuber Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE), Universität Leipzig http://www.uni-leipzig.de/ zuber/teaching/ws12/r-kurs/

Mehr

Grundlagen der Inferenzstatistik

Grundlagen der Inferenzstatistik Grundlagen der Inferenzstatistik (Induktive Statistik oder schließende Statistik) Dr. Winfried Zinn 1 Deskriptive Statistik versus Inferenzstatistik Die Deskriptive Statistik stellt Kenngrößen zur Verfügung,

Mehr

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell

Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Einfaktorielle Versuchspläne 27/40 Weitere (wählbare) Kontraste in der SPSS Prozedur Allgemeines Lineares Modell Abweichung Einfach Differenz Helmert Wiederholt Vergleich Jede Gruppe mit Gesamtmittelwert

Mehr

Grundlegende Eigenschaften von Punktschätzern

Grundlegende Eigenschaften von Punktschätzern Grundlegende Eigenschaften von Punktschätzern Worum geht es in diesem Modul? Schätzer als Zufallsvariablen Vorbereitung einer Simulation Verteilung von P-Dach Empirische Lage- und Streuungsparameter zur

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik 3 Multivariate Statistik 4 Regression 5 Ergänzungen Explorative Datenanalyse EDA Auffinden von Strukturen

Mehr

Statistische Tests (Signifikanztests)

Statistische Tests (Signifikanztests) Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)

Mehr

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des.

Im Modell der Varianzanalyse (mit festen Effekten) ist das. aus dem Durchschnittsmesswert für y plus dem Effekt des. Einfatorielle Varianzanalyse Varianzanalyse untersucht den Einfluss verschiedener Bedingungen ( = nominalsalierte(r) Variable(r)) auf eine metrische Variable. Die Bedingungen heißen auch atoren und ihre

Mehr

Statistische Auswertung:

Statistische Auswertung: Statistische Auswertung: Die erhobenen Daten mittels der selbst erstellten Tests (Surfaufgaben) Statistics Punkte aus dem Punkte aus Surftheorietest Punkte aus dem dem und dem Surftheorietest max.14p.

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren)

Multiple Regression. Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Multiple Regression 1 Was ist multiple lineare Regression? Ziel: Vorhersage der Werte einer Variable (Kriterium) bei Kenntnis der Werte von zwei oder mehr anderen Variablen (Prädiktoren) Annahme: Der Zusammenhang

Mehr

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten.

a) Zeichnen Sie in das nebenstehende Streudiagramm mit Lineal eine Regressionsgerade ein, die Sie für passend halten. Statistik für Kommunikationswissenschaftler Wintersemester 2009/200 Vorlesung Prof. Dr. Helmut Küchenhoff Übung Cornelia Oberhauser, Monia Mahling, Juliane Manitz Thema 4 Homepage zur Veranstaltung: http://www.statistik.lmu.de/~helmut/kw09.html

Mehr

Grundlagen der Datenanalyse

Grundlagen der Datenanalyse Schematischer Überblick zur Behandlung quantitativer Daten Theorie und Modellbildung Untersuchungsdesign Codierung / Datenübertragung (Erstellung einer Datenmatrix) Datenerhebung Fehlerkontrolle / -behebung

Mehr

Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur 09.02.2005 - GRUPPE A - BEARBEITER/IN (NAME, VORNAME):

Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur 09.02.2005 - GRUPPE A - BEARBEITER/IN (NAME, VORNAME): Veranstaltung Statistik (BWL) an der FH Frankfurt/Main im WS 2004/05 (Dr. Faik) Klausur 09.02.2005 - GRUPPE A - BEARBEITER/IN (NAME, VORNAME): MATRIKELNUMMER: Alte Prüfungsordnung/Neue Prüfungsordnung

Mehr

Motivation. Jede Messung ist mit einem sogenannten Fehler behaftet, d.h. einer Messungenauigkeit

Motivation. Jede Messung ist mit einem sogenannten Fehler behaftet, d.h. einer Messungenauigkeit Fehlerrechnung Inhalt: 1. Motivation 2. Was sind Messfehler, statistische und systematische 3. Verteilung statistischer Fehler 4. Fehlerfortpflanzung 5. Graphische Auswertung und lineare Regression 6.

Mehr

Parametrische vs. Non-Parametrische Testverfahren

Parametrische vs. Non-Parametrische Testverfahren Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer

Mehr

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8

Box-and-Whisker Plot -0,2 0,8 1,8 2,8 3,8 4,8 . Aufgabe: Für zwei verschiedene Aktien wurde der relative Kurszuwachs (in % beobachtet. Aus den jeweils 20 Quartaldaten ergaben sich die folgenden Box-Plots. Box-and-Whisker Plot Aktie Aktie 2-0,2 0,8,8

Mehr

Einfache Varianzanalyse für unabhängige Stichproben

Einfache Varianzanalyse für unabhängige Stichproben Einfache Varianzanalyse für unabhängige Stichproben VARIANZANALYSE Die Varianzanalyse ist das dem t-test entsprechende Mittel zum Vergleich mehrerer (k 2) Stichprobenmittelwerte. Sie wird hier mit VA abgekürzt,

Mehr