2 Distanzen. Distanzen von Objekten. Einleitung Distanzen Repräsentation Klassifikation Segmentierung

Größe: px
Ab Seite anzeigen:

Download "2 Distanzen. Distanzen von Objekten. Einleitung Distanzen Repräsentation Klassifikation Segmentierung"

Transkript

1 2 von Objekten Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

2 Gliederung Kapitel 2: von Objekten 2.1 Objekte und Merkmale 2.2 Merkmalstypen und ihre Nominale Merkmale Ordinale Merkmale Quantitative Merkmale 2.3 Aggregation von Quantitative Merkmale Nominale Merkmale Gemischte Datenmatrizen Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

3 Schematische Vorgehensweise Objekte Merkmale Interpretation Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

4 2.1 Objekte und Merkmale Einige grundlegende Definitionen (Wiederholung): G = {1, 2, 3,...} Grundgesamtheit von Objekten N = {1,...,n} Falls G = N Falls N G M = {1,...,m} Objektmenge Vollerhebung Stichprobe aus der Grundgesamtheit Merkmalsmenge Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

5 Die Datenmatrix A = (a ik ) n m = a a 1m.... Datenmatrix a n1... a nm mit a ik als Ausprägung des Merkmals k bei Objekt i Zeilen von A (Objektvektoren): a T i = (a i1,...,a im ), i N Spalten von A (Merkmalsvektoren): a k = a 1k. a nk, k M A k Menge der möglichen Ausprägungen bei Merkmal k Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

6 Beispiel: Hörer einer Vorlesung Merkmale Alter Geschlecht Wohnort Semester Studiengang Prüfungen Objekte 1 22 männlich Augsburg 5 BWL mit VD 2 25 männlich Karlsruhe 10 Mathe mit HD 3 21 weiblich München 4 VWL mit VD 4 28 männlich Augsburg 13 BWL mit VD 5 24 männlich Augsburg 8 BWL ohne VD = A Merkmal k Ausprägungsmenge A k Alter Menge der natürlichen Zahlen Geschlecht {männlich, weiblich} Wohnort Menge aller Orte Semester Menge der natürlichen Zahlen Studiengang {BWL, VWL, Mathematik, Informatik,...} Prüfungen {ohne Vordiplom, mit Vordiplom, mit Hauptdiplom} Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

7 Ähnlichkeit contra Verschiedenheit Man benötigt ein Maß, das die Ähnlichkeit zweier Objekte quantifiziert. Ähnlichkeitsmaß (AM): Je größer ein Wert, desto ähnlicher sind sich zwei Objekte. Folgen: Was bedeutet ein Wert AM = 0? Wie groß ist die Ähnlichkeit zweier identischer Objekte? Übergang zu einem Verschiedenheitsmaß Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

8 Definition: Distanzindex Sei N = 1,...,n eine Menge von n Objekten. Die Abbildung heißt Distanzindex, wenn gilt: d : N N R + d(i, i) = 0 d(i, j) = d(j, i) d(i,j) 0 [Reflexivität] [Symmetrie] [Nichtnegativität] Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

9 Distanzindex: Mögliche Eigenschaften Dreiecksungleichung ( ): d(i, j) d(i, h) + d(h, j) i, j, h N Ist beispielsweise erfüllt bei räumlichem Abstandsbegriff j i h Aber: Ist nicht immer haltbar bzw. sinnvoll (Beispiel: Hoher Distanzindex entspricht schwachem Bedarfsverbund bei Supermarkteinkauf) Tee Zucker Kaffee Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

10 Distanzindex: Mögliche Eigenschaften Ultrametrische Ungleichung (U): d(i, j) max { d(i, h), d(j, h) } i, j, h N Es gilt: (U) ( ) ( ) (U) D.h. (U) ist stärker als ( ) Identitätseigenschaft (I): i, j N mit d(i, j) = 0 i = j Ist i.a. nicht erfüllt, da verschiedene Objekte häufig gleiche Merkmalsausprägungen besitzen. Beispiel: Patienten mit identischen Krankheitssymptomen * Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

11 Distanzindex: Mögliche Eigenschaften Äquivalenzeigenschaft (A): i, j N mit d(i, j) = 0 d(i, h) = d(j, h) h N D.h. i und j sind äquivalente Objekte. Bemerkung: (A) ist Abschwächung von (I). Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

12 Definition: Metriken Ein Distanzindex, der die Eigenschaft ( ) (U) ( ), (I) (U), (I) erfüllt, heißt Quasimetrik, erfüllt, heißt Quasiultrametrik, erfüllt, heißt Metrik, erfüllt, heißt Ultrametrik. Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

13 Definition: Distanzmatrix Zusammenfassung aller paarweisen zu einer Matrix: D = (d(i,j)) n n = d(1, 1) d(1,n)..... d(n, 1) d(n,n) bzw. D = (d ij ) n n = d 11 d 1n..... d n1 d nn Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

14 Eigenschaften der Distanzmatrix Eine Distanzmatrix D besitzt folgende Eigenschaften: ist quadratisch ist symmetrisch enthält in der Hauptdiagonalen ausschließlich Nullen Somit müssen nur 1 2 zwar n (n 1) berechnet werden und d 12 d 1n.... d n 1n Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

15 Gewinnung von Bestimmung der je Merkmal und anschließende Aggregation zur Gesamtdistanzmatrix (siehe Abschnitte 2.2, 2.3) Direkte Beurteilung von Objektpaaren (ohne Berücksichtigung von Merkmalen) Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

16 Gewinnung von, direkte Beurteilung: Bei der direkten Beurteilung von Objektpaaren (ohne Vorgabe von Merkmalen) werden jeder Versuchsperson die möglichen Objektpaare vorgelegt, wobei die Ähnlichkeit durch einen Wert aus einem vorher festgelegten Bereich quantifiziert werden soll. Beispiel zur direkten Beurteilung: Die Parteien SPD, CDU und FDP sollten bezüglich ihrer Verschiedenheit auf einer Skala von Null (Parteien sind identisch) bis zehn (Parteien sind maximal verschieden) beurteilt werden. Folgendes Ergebnis sei festgehalten worden: CDU - FDP 4 CDU - SPD 7 SPD - FDP 5 D = FDP SPD CDU 4 7 FDP 5 Vor- und Nachteile dieser Methodik: Vorteile: + implizite Berücksichtigung mehrerer, nicht weiter spezifizierter Merkmale + einfache, schnelle Datenerhebung Nachteile: - Interpretationsschwierigkeiten, da Merkmale unbekannt - nur bei kleiner Objektmenge zweckmäßig (bei n = 10 bereits = 45 Paarvergleiche) Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

17 2.2 Merkmalstypen und ihre Grundsätzlich lassen sich folgende Merkmalstypen unterscheiden: Quantitative Merkmale: Alle Ausprägungen des Merkmals werden intuitiv durch reelle Zahlen benannt. Qualitative Merkmale: Die Ausprägungen des Merkmals werden intuitiv durch Worte oder Begriffe, nicht aber durch Zahlen, wiedergegeben (nominale oder ordinale Merkmale). Da es häufig von Vorteil ist, daß die Ausprägungen eines Merkmals durch Zahlen wiedergegeben werden, quantifiziert man i.d.r. die qualitativen Merkmale. Dies geschieht mit Hilfe einer Abbildung, die man Skala nennt. Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

18 Definition: Skala Sei k ein Merkmal mit der Ausprägungsmenge A k. Dann heißt die Abbildung f : A k Reine Skala. Bemerkung: Die Abbildung f sollte so gewählt werden, dass die Informationen und Relationen, die für bzw. zwischen den einzelnen Merkmalsausprägungen a ik gelten, auch für die Bildwerte f(a ik ) korrekt sind. Messungen erfordern oft schon eine Skala. Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

19 Nominale Merkmale Definition: Ein Merkmal k heißt nominal oder klassifikatorisch, wenn für die Ausprägungen nur nach Gleichheit (=) oder Ungleichheit ( ) unterschieden werden kann. Bezüglich der Äquivalenz ( ) zweier Objekte gilt: Die Abbildung f : A k R mit i k j a ik = a jk bzw. i k j a ik a jk a ik a jk f(a ik ) f(a jk ) heißt Nominalskala. Jeder Distanzindex hat dann die Form: d k (i, j) = 0 für f(a ik ) = f(a jk ) c für f(a ik ) f(a jk ), mit c > 0 Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

20 Distanzindex nominaler Daten Beispiel: Geschlecht der Hörer Objekte Alter Geschlecht Wohnort Semester Studiengang Prüfungen 1 22 männlich mit VD 2 25 männlich mit HD 3 21 weiblich mit VD 4 28 männlich mit VD 5 24 männlich ohne VD f Geschlecht (weiblich) = 0 f Geschlecht (männlich) = 1 c = 1 D Geschl. = Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

21 Eigenschaften von Nominalskalen Satz: Jede injektive, reelle Abbildung ist eine Nominalskala. Jeder Distanzindex einer Nominalskala ist eine Quasi-Ultrametrik mit der Eigenschaft (A) (Äquivalenzeigenschaft). Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

22 Ordinale Merkmale Definition: Ein Merkmal k heißt ordinal (komparativ), wenn die Ausprägungen vollständig geordnet werden können. Bezüglich der Ordnung zweier Objekte gilt: i j k a ik < a jk niedrigerer Rang i j k a ik = a jk gleicher Rang i k j a ik > a jk höherer Rang Die Abbildung f : A k R mit heißt Ordinalskala. a ik < a jk f(a ik ) < f(a jk ) Ein Distanzindex hat im einfachsten Fall die Form: d k (i, j) = f(a ik ) f(a jk ) Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

23 Distanzindex ordinaler Daten Beispiel: Prüfungen der Hörer Objekte Alter Geschlecht Wohnort Semester Studiengang Prüfungen 1 22 männlich mit VD 2 25 männlich mit HD 3 21 weiblich mit VD 4 28 männlich mit VD 5 24 männlich ohne VD f Prüfg. (ohne VD) = 1 f Prüfg. (mit VD) = 2 f Prüfg. (mit HD) = 3 c = 1 D Prüfg. = Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

24 Eigenschaften von Ordinalskalen Satz: Jede streng monotone, reelle Abbildung ist eine Ordinalskala. Der o.g. Distanzindex der Ordinalskala ist eine Quasimetrik mit der Eigenschaft (A) (Äquivalenzeigenschaft). Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

25 Quantitative Merkmale Definition: Ein Merkmal k heißt quantitativ (kardinal, metrisch), wenn es ordinal ist und die Differenzen von Ausprägungspaaren vollständig geordnet werden können. Dies bedeutet insbesondere, dass das Ausmaß der Unterschiedlichkeit zweier Ausprägungen bestimmt werden kann und aussagekräftig ist. Die Abbildung f : Ak R mit f(a ik ) = α a ik + β (α > 0, β R) heißt Intervallskala. Die Abbildung f : Ak R mit f(a ik ) = α a ik (α > 0) heißt Verhältnisskala. Die Abbildung f : Ak N 0 mit f(a ik ) = a ik heißt Absolutskala. Jeder Distanzindex einer quantitativen Skala hat die Form: d k (i, j) = φ k f(a ik ) f(a jk ) p φk ermöglicht eine merkmalspezifische lineare Gewichtung. p ermöglicht eine hohe Gewichtung großer Differenzen in Merkmalsausprägungen. Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

26 Distanzindex metrischer Daten Beispiel: Alter der Hörer Objekte Alter Geschlecht männlich 2 25 männlich 3 21 weiblich 4 28 männlich 5 24 männlich f(a ik ) = α a ik + β = a ik (d.h. α = 1, β = 0) φ = 1; p = 1 φ = 1; p = D Alter = D Alter = Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

27 Eigenschaften von metrischen Skalen Satz: Jede positive lineare Abbildung ist eine Intervallskala. Für eine Intervallskala gilt für beliebige Funktionen f: f(a ik ) f(a jk ) f(a i k) f(a j k) = const. Für eine Verhältnisskala gilt für beliebige Funktionen f: f(a ik ) f(a i k) = const. Der Distanzindex einer quantitativen Skala ist unabhängig von β. Die Wirkung von α kann über die φ k beeinflusst werden. Der Distanzindex ist eine Quasimetrik mit der Äquivalenzeigenschaft (A). Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

28 2.3 Aggregation von Aufgabe: Sinnvolle Aggregation der einzelnen, merkmalspezifisch ermittelten. Dabei unterscheidet man zwischen ausschließlich nominalen Merkmalen, ausschließlich quantitativen Merkmalen oder gemischten Datenmatrizen. Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

29 Distanzaggregation von nominal skalierten Daten Da nominal polytome Merkmale in mehrere binäre Merkmale überführt werden können, werden im Folgenden zunächst binäre Merkmale betrachtet. Dazu werden die Objekte generell durch den Besitz einer bestimmten Eigenschaft charakterisiert. Distanzaggregation bei binären Merkmalen - Idee Zwei Objekte (i, j) weisen bezüglich mehrerer binärer Merkmale eine große Ähnlichkeit auf, wenn häufig - d.h. bei vielen Merkmalen - die gleiche Ausprägung Ja/Ja bzw. 1/1 Nein/Nein bzw. 0/0 zu beobachten ist. Häufige Kombinationen wie Ja/Nein bzw. Nein/Ja weisen auf eine hohe Verschiedenheit hin. Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

30 Distanzaggregation bei binären Merkmalen - Umsetzung Gegeben sei eine Datenmatrix A = (a ik ) n m mit a ik {1,0}. Berechne Kontingenztabelle für binäre Merkmale gemäß 1 (Ja) 0 (Nein) 1 (Ja) α ij β ij 0 (Nein) γ ij δ ij und m := α ij + β ij + γ ij + δ ij mit beispielsweise α ij = { k : a ik = a jk = 1 } Jeder aggregierte Distanzindex d(i, j) ist somit eine Funktion von α ij, β ij, γ ij,δ ij. Es gilt also: d(i, j) = f(α ij, β ij, γ ij,δ ij ) 0 Forderungen an d(i, j): monoton wachsend mit βij und γ ij monoton fallend mit αij und δ ij symmetrisch in βij und γ ij Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

31 Distanzaggregation bei binären Merkmalen - Umsetzung (2) Varianten für die Bildung von d(i, j): 1. Anzahl nicht übereinstimmender Merkmale d(i, j) = β ij + γ ij = m (α ij + δ ij ) 2. Anteil nicht übereinstimmender Merkmale d(i, j) = β ij + γ ij m 3. Gewichteter Anteil nicht übereinstimmender Merkmale d(i, j) = λ (β ij + γ ij ) λ (β ij + γ ij ) + (1 λ) (α ij + δ ij ) mit λ (0, 1) (Beispiel siehe Vorlesung) Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

32 Direkte Distanzaggregation bei nominal-polytom skalierten Merkmalen Sei d k (i, j) = { 0 für aik = a jk c > 0 für a ik a jk 1. Ungewichtete Aggregation der merkmalspezifischen d(i, j) = m d k (i,j) k=1 2. Gewichtete Aggregation der merkmalspezifischen d(i, j) = 1 m A k m A k d k (i,j) k=1 k=1 Bemerkung: Variante (2.) gewichtet Merkmale mit vielen Merkmalsausprägungen stärker als solche mit wenigen, d.h. Wenige Ausprägungen Beitrag zu d(i, j) ist klein Viele Ausprägungen Beitrag zu d(i, j) ist groß (Beispiel siehe Vorlesung) Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

33 Distanzaggregation bei metrischen Merkmalen Vorüberlegung: Jeder Okjektvektor a i kann als Punkt im m-dimensionalen Raum dargestellt werden. Die geometrische Anschauung legt es also nahe, die Distanz zwischen i und j durch die Euklidsche Distanz (oder eine Verallgemeinerung dieser) zu messen. Definition: Distanzindex für metrische Merkmale Sei A = (a ik ) n m eine quantitative Datenmatrix. Dann heißt d(i, j) mit d(i, j) = ( m k=1 φ k a ik a jk p ) 1 p, φ k > 0, p N gewichtete L p -Distanz von i und j. Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

34 Spezialfälle der gewichteten L p -Distanz Man spricht von einer City-Block-Distanz für p = 1: d(i, j) = m φ k a ik a jk k=1 Euklidschen Distanz für p = 2: d(i, j) = m φ k a ik a jk 2 k=1 Tschebyscheff-Distanz für p : (Grafik und Beispiel siehe Vorlesung) d(i, j) = max k (φ k a ik a jk ) Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

35 Spezialfälle der gewichteten L p -Distanz City-Block-Distanz Merkmal 2 Euklidscher Abstand Tschebyscheff-Abstand Objekt j Objekt i Merkmal 1 Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

36 Gewichtete L p -Distanz: Beispiel Objekte Alter Semester L L L Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

37 L p -Distanzindex: Eigenschaften Satz: Jede L p -Distanz ist eine Quasimetrik Es gilt d L1 d L2... d L i,j Die Rangordnung der d ij kann sich bei Verwendung unterschiedlicher L p - ändern. Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

38 L p -Distanzindex: Potentielle Probleme Merkmale mit hoher Varianz werden bei Distanzaggregation hoch gewichtet. Abhilfe: Gewichtung z.b. mit merkmalsspezifischen Varianzen oder Spannweiten, d.h. φ k = Var(a k ) bzw. φ k = max(a k ) min(a k ) Sind zwei Merkmale k 1 und k 2 hoch korreliert, dann liefern beide Merkmale etwa die gleiche Information bzgl. der Ähnlichkeit der Objekte. Also werden ähnliche Informationen im Distanzindex mehrfach berücksichtigt. Abhilfe: die Mahalanobis-Distanz Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

39 Die Mahalanobis-Distanz Sei A = (a ik ) n m eine quantitative Datenmatrix. Dann heißt d ij mit d ij = m k=1 m s kl (a ik a jk )(a il a jl ) = (a i a j ) T S 1 (a i a j ) l=1 Mahalanobis-Distanz von i und j, wobei (s kl ) m m = S 1 = (Cov(A)) 1 und s kl = 1 n n (a ik a k )(a il a l ) mit a k = 1 n i=1 n i=1 a ik Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

40 Mahalanobis-Distanz: Beispiel Objekte Alter Semester ergibt: L (Berechnung siehe Vorlesung) Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

41 Mahalanobis-Distanz: Beispiel mit R > # Alter, Semester > A = cbind(c(22,25,21,28,24), c(5,10,4,13,8)); > > # Anzahl der Objekte > n = dim(a)[1]; > > # Distanzmatrix > d = matrix(0,n,n) > > # Kovarianzmatrix > S = ((n-1)/n)*cov(a); > > for (i in 1:n) d[i,] = mahalanobis(a,a[i,],s); > > # Kosmetik > d = d[lower.tri(d)]; > attr(d,"class")<-"dist"; > attr(d,"size")<-n; > > d; Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

42 Mahalanobis-Distanz: Eigenschaften Sind zwei Merkmale k und l hoch korreliert, dann liefern beide Merkmale etwa die gleiche Information bzgl. der Ähnlichkeit der Objekte. Die Mahalanobis- Distanz versieht in diesem Fall den Beitrag der beiden Merkmale mit einem niedrigeren Gewicht s kl. Sind die Merkmale paarweise unkorreliert, d.h. s kl = 0 für k l, dann werden Merkmale mit großer Varianz bei der Berechnung von d ij weniger stark berücksichtigt, da dann gilt: d ij = m s kk (a ik a jk ) 2 = k=1 m k=1 1 s kk (a ik a jk ) 2 = Beachte: In diesem Fall ist S Diagonalmatrix und damit auch S 1. Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

43 Aggregation gemischter Datenmatrizen Ausgangssituation: Für jedes Merkmal k = 1,...,m ist ein Distanzindex d k (i, j) gegeben, der das entsprechende Skalenniveau adäquat berücksichtigt. Gesucht: Eine Aggregationsregel g, die die Distanzindizes d 1,...,d m zu einer gemeinsamen Distanz d zusammenfasst. Forderungen an eine Aggregationsregel: Aggregationsregel g : g(0,..., 0) = 0 Gilt für alle Merkmale k = 1,..., m d k (i, j) = d k (i, j ) so folgt daraus auch d(i, j) = d(i, j ) Gilt für alle Merkmale k = 1,..., m d k (i, j) d k (i, j ) und für mind. ein k d k (i, j) < d k (i, j ) so folgt daraus auch d(i, j) < d(i, j ) Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

44 Aggregation gemischter Datenmatrizen (I) Linear homogene Aggregationen Sei A = (a ik ) n m eine gemischte Datenmatrix und d 1,...,d m seien die Distanzindizes der Merkmale. Dann ergeben sich für φ k > 0 folgende Distanzindizes: (a) d(i,j) = (b) d(i,j) = m k=1 m k=1 φ k d k (i,j) φ k d k (i,j) max i,j (d k(i,j)) (c) d(i,j) = max (d k(i,j)) k Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

45 Linear homogene Aggregationen: Beispiel Geschlecht (1) Studiengang (2) Prüfungen (3) D D D Mit φ 1 = 1, φ 2 = 1 2, φ 3 = 1 2 D (a) ergibt sich D (b) D (c) Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

46 Aggregation gemischter Datenmatrizen (II) Aggregationen mit Entscheidungsregeln Sei A = (a ik ) n m eine gemischte Datenmatrix und d 1,...,d m seien die Distanzindizes der Merkmale. Dann ergibt sich für φ k > 0 folgender aggregierter Distanzindex: d(i,j) = m k=1 φ k {(u,v) : u < v, d k (u,v) < d k (i,j)} (Rangordnungsregel) Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

47 Aggregation mit Entscheidungsregeln: Beispiel Geschlecht (1) Studiengang (2) Prüfungen (3) D D D Mit φ 1 = φ 2 = φ 3 = 1 ergibt sich D Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

48 Vergleich der Aggregationen (I) Linear homogene Aggregation (a) d(1, 4) < d(1, 5) = d(4, 5) < d(1, 2) = d(1, 3) = d(2, 4) = d(3, 4) < d(2, 5) = d(3, 5) < d(2, 3) (II) Aggr. mit Rangordnungsregel d(1, 4) < d(1, 5) = d(4, 5) < d(1, 2) = d(1, 3) = d(2, 4) = d(3, 4) < d(3, 5) < d(2, 3) = d(2, 5) Die unterschiedlichen Ansätze kommen zu sehr ähnlichen aber im allgemeinen nicht gleichen Ergebnissen. (Philosophie der Datenanalyse) Datenanalyse II - Stefan Etschberger - Universität Augsburg - SS

Ähnlichkeits- und Distanzmaße

Ähnlichkeits- und Distanzmaße Einheit 1 Ähnlichkeits- und Distanzmaße IFAS JKU Linz c 2015 Multivariate Verfahren 1 0 / 41 Problemstellung Ziel: Bestimmung von Ähnlichkeit zwischen n Objekten, an denen p Merkmale erhoben wurden. Die

Mehr

Mathematisch-Statistische Verfahren des Risiko-Managements - SS

Mathematisch-Statistische Verfahren des Risiko-Managements - SS Clusteranalyse Mathematisch-Statistische Verfahren des Risiko-Managements - SS 2004 Allgemeine Beschreibung (I) Der Begriff Clusteranalyse wird vielfach als Sammelname für eine Reihe mathematisch-statistischer

Mehr

Einführung in die Ähnlichkeitsmessung

Einführung in die Ähnlichkeitsmessung Einführung in die Ähnlichkeitsmessung Reading Club SS 2008 Similarity Stefanie Sieber stefanie.sieber@uni-bamberg.de Lehrstuhl für Medieninformatik Otto-Friedrich-Universität Bamberg Agenda Worum geht

Mehr

Variablen und Skalenniveaus

Variablen und Skalenniveaus Analytics Grundlagen Variablen und Skalenniveaus : Photo Credit: Unsplash, Roman Mager Statistik Was ist eigentlich eine Variable? Variable In der Datenanalyse wird häufig die Bezeichnung Variable verwendet.

Mehr

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK

htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 1 EINFÜHRUNG IN DIE STATISTIK: BESCHREIBENDE STATISTIK htw saar 2 Grundbegriffe htw saar 3 Grundgesamtheit und Stichprobe Ziel: Über eine Grundgesamtheit (Population) soll eine Aussage über ein

Mehr

Kapitel 5. Eigenwerte. Josef Leydold Mathematik für VW WS 2017/18 5 Eigenwerte 1 / 42

Kapitel 5. Eigenwerte. Josef Leydold Mathematik für VW WS 2017/18 5 Eigenwerte 1 / 42 Kapitel 5 Eigenwerte Josef Leydold Mathematik für VW WS 2017/18 5 Eigenwerte 1 / 42 Geschlossenes Leontief-Modell Ein Leontief-Modell für eine Volkswirtschaft heißt geschlossen, wenn der Konsum gleich

Mehr

4 Lineare Abbildungen und Matrizen

4 Lineare Abbildungen und Matrizen Mathematik I für inf/swt, Wintersemester /, Seite 8 4 Lineare Abbildungen und Matrizen 4 Kern und Injektivität 4 Definition: Sei : V W linear Kern : {v V : v } ist linearer eilraum von V Ü68 und heißt

Mehr

Datenerhebung, Skalenniveaus und Systemdatei

Datenerhebung, Skalenniveaus und Systemdatei Datenerhebung, Skalenniveaus und Systemdatei Institut für Geographie 1 Beispiele für verschiedene Typen von Fragen in einer standardisierten Befragung (3 Grundtypen) Geschlossene Fragen Glauben Sie, dass

Mehr

Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth

Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth Lineare Algebra Mathematik II für Chemiker Daniel Gerth Überblick Lineare Algebra Dieses Kapitel erklärt: Was man unter Vektoren versteht Wie man einfache geometrische Sachverhalte beschreibt Was man unter

Mehr

Euklidische und unitäre Vektorräume

Euklidische und unitäre Vektorräume Kapitel 7 Euklidische und unitäre Vektorräume In diesem Abschnitt ist der Körper K stets R oder C. 7.1 Definitionen, Orthonormalbasen Definition 7.1.1 Sei K = R oder C, und sei V ein K-Vektorraum. Ein

Mehr

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6. Statistik-Tutorium. Lösungsskizzen Übung SS2005. Thilo Klein. Grundstudium Sommersemester 2008

Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6. Statistik-Tutorium. Lösungsskizzen Übung SS2005. Thilo Klein. Grundstudium Sommersemester 2008 Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6 Lösungsskizzen Übung SS2005 Grundstudium Sommersemester 2008 Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6 Inhalt Serie 1 Serie 2 Serie 3 Serie 4 Serie

Mehr

Kapitel 5. Eigenwerte. Ein Leontief-Modell für eine Volkswirtschaft heißt geschlossen, wenn der Konsum gleich der Produktion ist, d.h. wenn.

Kapitel 5. Eigenwerte. Ein Leontief-Modell für eine Volkswirtschaft heißt geschlossen, wenn der Konsum gleich der Produktion ist, d.h. wenn. Kapitel 5 Eigenwerte Josef Leydold Mathematik für VW WS 2016/17 5 Eigenwerte 1 / 42 Geschlossenes Leontief-Modell Ein Leontief-Modell für eine Volkswirtschaft heißt geschlossen, wenn der Konsum gleich

Mehr

Statistik II: Grundlagen und Definitionen der Statistik

Statistik II: Grundlagen und Definitionen der Statistik Medien Institut : Grundlagen und Definitionen der Statistik Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Hintergrund: Entstehung der Statistik 2. Grundlagen

Mehr

Formale Begriffsanalyse

Formale Begriffsanalyse Formale Begriffsanalyse I Kontexte, Begriffe und Begriffsverbände 3 Mehrwertige Kontexte und Begriffliches Skalieren Die Elemente von G nennen wir die Gegenstände, die von M die (mehrwertigen) Merkmale

Mehr

Inhalt. Mathematik für Chemiker II Lineare Algebra. Vorlesung im Sommersemester Kurt Frischmuth. Rostock, April Juli 2015

Inhalt. Mathematik für Chemiker II Lineare Algebra. Vorlesung im Sommersemester Kurt Frischmuth. Rostock, April Juli 2015 Inhalt Mathematik für Chemiker II Lineare Algebra Vorlesung im Sommersemester 5 Rostock, April Juli 5 Vektoren und Matrizen Abbildungen 3 Gleichungssysteme 4 Eigenwerte 5 Funktionen mehrerer Variabler

Mehr

Statistik IV für Studenten mit dem Nebenfach Statistik Lösungen zu Blatt 9 Gerhard Tutz, Jan Ulbricht SS 07

Statistik IV für Studenten mit dem Nebenfach Statistik Lösungen zu Blatt 9 Gerhard Tutz, Jan Ulbricht SS 07 Statistik IV für Studenten mit dem Nebenfach Statistik Lösungen zu Blatt 9 Gerhard Tutz, Jan Ulbricht SS 07 Ziel der Clusteranalyse: Bilde Gruppen (cluster) aus einer Menge multivariater Datenobjekte (stat

Mehr

Mathematik 1 Bachelorstudiengang Maschinenbau

Mathematik 1 Bachelorstudiengang Maschinenbau Mathematik 1 Bachelorstudiengang Maschinenbau Prof Dr Stefan Etschberger Hochschule Augsburg Sommersemester 2012 Übersicht 4 Lineare Algebra 1 Grundlegendes 2 Aussagenlogik 3 Mengen 4 Lineare Algebra Lernziele

Mehr

Geometrische Deutung linearer Abbildungen

Geometrische Deutung linearer Abbildungen Geometrische Deutung linearer Abbildungen Betrachten f : R n R n, f(x) = Ax. Projektionen z.b. A = 1 0 0 0 1 0 0 0 0 die senkrechte Projektion auf die xy-ebene in R 3. Projektionen sind weder injektiv

Mehr

Korrelationsmatrix. Statistische Bindungen zwischen den N Zufallsgrößen werden durch die Korrelationsmatrix vollständig beschrieben:

Korrelationsmatrix. Statistische Bindungen zwischen den N Zufallsgrößen werden durch die Korrelationsmatrix vollständig beschrieben: Korrelationsmatrix Bisher wurden nur statistische Bindungen zwischen zwei (skalaren) Zufallsgrößen betrachtet. Für den allgemeineren Fall einer Zufallsgröße mit N Dimensionen bietet sich zweckmäßiger Weise

Mehr

Grundbegriffe. Bibliografie

Grundbegriffe. Bibliografie Grundbegriffe Merkmale und Merkmalsausprägungen Skalen und Skalentransformation Einführung und Grundbegriffe II 1 Bibliografie Bleymüller / Gehlert / Gülicher Verlag Vahlen Statistik für Wirtschaftswissenschaftler

Mehr

Statistik. Jan Müller

Statistik. Jan Müller Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen

Mehr

Kapitel 2: Lineare Gleichungssysteme

Kapitel 2: Lineare Gleichungssysteme Vorlesung Höhere Mathematik: Numerik (für Ingenieure) Kapitel 2: Lineare Gleichungssysteme Jun.-Prof. Dr. Stephan Trenn AG Technomathematik, TU Kaiserslautern Sommersemester 205 HM: Numerik (SS 205), Kapitel

Mehr

Brückenkurs Mathematik. Mittwoch Freitag

Brückenkurs Mathematik. Mittwoch Freitag Brückenkurs Mathematik Mittwoch 5.10. - Freitag 14.10.2016 Vorlesung 4 Dreiecke, Vektoren, Matrizen, lineare Gleichungssysteme Kai Rothe Technische Universität Hamburg-Harburg Montag 10.10.2016 0 Brückenkurs

Mehr

Vektoren und Matrizen

Vektoren und Matrizen Universität Basel Wirtschaftswissenschaftliches Zentrum Vektoren und Matrizen Dr. Thomas Zehrt Inhalt: 1. Vektoren (a) Einführung (b) Linearkombinationen (c) Länge eines Vektors (d) Skalarprodukt (e) Geraden

Mehr

Kapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit

Kapitel 17. Unabhängigkeit und Homogenität Unabhängigkeit Kapitel 17 Unabhängigkeit und Homogenität 17.1 Unabhängigkeit Im Rahmen der Wahrscheinlichkeitsrechnung ist das Konzept der Unabhängigkeit von zentraler Bedeutung. Die Ereignisse A und B sind genau dann

Mehr

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein.

Alle weiteren Messoperationen schließen die Klassifikation als Minimaloperation ein. 1 unterschiedliche Skalenniveaus Wir haben zuvor schon kurz von unterschiedlichen Skalenniveaus gehört, nämlich dem: - Nominalskalenniveau - Ordinalskalenniveau - Intervallskalenniveau - Ratioskalenniveau

Mehr

2. Dezember Lineare Algebra II. Christian Ebert & Fritz Hamm. Skalarprodukt, Norm, Metrik. Matrizen. Lineare Abbildungen

2. Dezember Lineare Algebra II. Christian Ebert & Fritz Hamm. Skalarprodukt, Norm, Metrik. Matrizen. Lineare Abbildungen Algebra und Algebra 2. Dezember 2011 Übersicht Algebra und Algebra I Gruppen & Körper Vektorräume, Basis & Dimension Algebra Norm & Metrik Abbildung & Algebra I Eigenwerte, Eigenwertzerlegung Singulärwertzerlegung

Mehr

BC 1.2 Mathematik WS 2016/17. BC 1.2 Mathematik Zusammenfassung Kapitel II: Vektoralgebra und lineare Algebra. b 2

BC 1.2 Mathematik WS 2016/17. BC 1.2 Mathematik Zusammenfassung Kapitel II: Vektoralgebra und lineare Algebra. b 2 Zusammenfassung Kapitel II: Vektoralgebra und lineare Algebra 1 Vektoralgebra 1 Der dreidimensionale Vektorraum R 3 ist die Gesamtheit aller geordneten Tripel (x 1, x 2, x 3 ) reeller Zahlen Jedes geordnete

Mehr

3.6 Eigenwerte und Eigenvektoren

3.6 Eigenwerte und Eigenvektoren 3.6 Eigenwerte und Eigenvektoren 3.6. Einleitung Eine quadratische n n Matrix A definiert eine Abbildung eines n dimensionalen Vektors auf einen n dimensionalen Vektor. c A x c A x Von besonderem Interesse

Mehr

Teil I. Lineare Algebra I Vorlesung Sommersemester Olga Holtz. MA 378 Sprechstunde Fr und n.v.

Teil I. Lineare Algebra I Vorlesung Sommersemester Olga Holtz. MA 378 Sprechstunde Fr und n.v. Teil I Lineare Algebra I Vorlesung Sommersemester 2011 Olga Holtz MA 378 Sprechstunde Fr 14-16 und nv holtz@mathtu-berlinde Sadegh Jokar MA 373 Sprechstunde, Do 12-14 und nv jokar@mathtu-berlinde Kapitel

Mehr

Mehrdimensionale Skalierung

Mehrdimensionale Skalierung Mehrdimensionale Skalierung Datenanalyse Dietmar Maringer Abteilung für Quantitative Methoden, WWZ der Universität Basel Herbstsemester 2010 D Maringer: Datenanalyse Mehrdimensionale Skalierung (1) Problemstellung

Mehr

3. Merkmale und Daten

3. Merkmale und Daten 3. Merkmale und Daten Ziel dieses Kapitels: Vermittlung des statistischen Grundvokabulars Zu klärende Begriffe: Grundgesamtheit Merkmale (Skalenniveau etc.) Stichprobe 46 3.1 Grundgesamtheiten Definition

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Kapitel 1 Beschreibende Statistik

Kapitel 1 Beschreibende Statistik Beispiel 1.5: Histogramm (klassierte erreichte Punkte, Fortsetzung Bsp. 1.1) 0.25 0.2 Höhe 0.15 0.1 0.05 0 0 6 7 8,5 10 11 erreichte Punkte Dr. Karsten Webel 24 Beispiel 1.5: Histogramm (Fortsetzung) Klasse

Mehr

9 Metrische und normierte Räume

9 Metrische und normierte Räume 9 Metrische und normierte Räume Idee: Wir wollen Abstände zwischen Punkten messen. Der Abstand soll eine reelle Zahl 0 sein (ohne Dimensionsangabe wie Meter...). 9.1 Definition Sei X eine Menge. Eine Metrik

Mehr

Mathematik 1 für Wirtschaftsinformatik

Mathematik 1 für Wirtschaftsinformatik für Wirtschaftsinformatik Wintersemester 2012/13 Hochschule Augsburg : Gliederung 1 Grundlegende 2 Grundlegende 3 Aussagenlogik 4 Komplexe Zahlen 5 Lineare Algebra 6 Lineare Programme 5 Lineare Algebra

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. Datenanalyse II. Stefan Etschberger Sommersemester 2005

Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg. Datenanalyse II. Stefan Etschberger Sommersemester 2005 Institut für Statistik und Mathematische Wirtschaftstheorie Universität Augsburg Datenanalyse II Stefan Etschberger Sommersemester 2005 Organisatorisches Vorlesung Montag, 10.15-11.45 Uhr Vorlesungsmaterialien

Mehr

Modul 04: Messbarkeit von Merkmalen, Skalen und Klassierung. Prof. Dr. W. Laufner Beschreibende Statistik

Modul 04: Messbarkeit von Merkmalen, Skalen und Klassierung. Prof. Dr. W. Laufner Beschreibende Statistik Modul 04: Messbarkeit von Merkmalen, Skalen und 1 Modul 04: Informationsbedarf empirische (statistische) Untersuchung Bei einer empirischen Untersuchung messen wir Merkmale bei ausgewählten Untersuchungseinheiten

Mehr

Teil I: Deskriptive Statistik

Teil I: Deskriptive Statistik Teil I: Deskriptive Statistik 2 Grundbegriffe 2.1 Merkmal und Stichprobe 2.2 Skalenniveau von Merkmalen 2.3 Geordnete Stichproben und Ränge 2.1 Merkmal und Stichprobe An (geeignet ausgewählten) Untersuchungseinheiten

Mehr

Statistisches Testen

Statistisches Testen Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall

Mehr

Daten, Datentypen, Skalen

Daten, Datentypen, Skalen Bildung kommt von Bildschirm und nicht von Buch, sonst hieße es ja Buchung. Daten, Datentypen, Skalen [main types of data; levels of measurement] Die Umsetzung sozialwissenschaftlicher Forschungsvorhaben

Mehr

Deskriptive Statistik Erläuterungen

Deskriptive Statistik Erläuterungen Grundlagen der Wirtschaftsmathematik und Statistik Erläuterungen Lernmaterial zum Modul - 40601 - der Fernuniversität Hagen 7 2.1 Einfache Lageparameter aus einer gegebenen Messreihe ablesen Erklärung

Mehr

Die wichtigste Klasse von Funktionen zwischen Vektorräumen sind die linearen Abbildungen.

Die wichtigste Klasse von Funktionen zwischen Vektorräumen sind die linearen Abbildungen. Definition: Lineare Abbildung Lineare Abbildungen Die wichtigste Klasse von Funktionen zwischen Vektorräumen sind die linearen Abbildungen. 8.1 Definition: Lineare Abbildung Eine Funktion f : V Ñ W zwischen

Mehr

Statistische Grundlagen I

Statistische Grundlagen I Statistische Grundlagen I Arten der Statistik Zusammenfassung und Darstellung von Daten Beschäftigt sich mit der Untersuchung u. Beschreibung von Gesamtheiten oder Teilmengen von Gesamtheiten durch z.b.

Mehr

6 Distanzfunktionen (2) 6 Distanzfunktionen. 6.1 Eigenschaften und Klassifikationen. Einführung

6 Distanzfunktionen (2) 6 Distanzfunktionen. 6.1 Eigenschaften und Klassifikationen. Einführung 6 en 6 en (2) 1. Eigenschaften und Klassifikation 2. en auf Punkten Minkowski L m Gewichtete Minkowski L m w Quadratische d q Quadratische Pseudo Dynamical Partial Semi Pseudo Chi Quadrat Semi Pseudo Kullback

Mehr

6 Distanzfunktionen. Quadratische Pseudo. 1. Eigenschaften und Klassifikation

6 Distanzfunktionen. Quadratische Pseudo. 1. Eigenschaften und Klassifikation 6 Distanzfunktionen 1. Eigenschaften und Klassifikation 2. Distanzfunktionen auf Punkten Minkowski Distanzfunktion L m Gewichtete Minkowski Distanzfunktion L m w Quadratische Distanzfunktion d q Quadratische

Mehr

Forschungsmethoden in der Sozialen Arbeit

Forschungsmethoden in der Sozialen Arbeit Forschungsmethoden in der Sozialen Arbeit Fachhochschule für Sozialarbeit und Sozialpädagogik Alice- Salomon Hochschule für Soziale arbeit, Gesundheit, Erziehung und Bildung University of Applied Sciences

Mehr

1 Lineare Algebra. 1.1 Matrizen und Vektoren. Slide 3. Matrizen. Eine Matrix ist ein rechteckiges Zahlenschema

1 Lineare Algebra. 1.1 Matrizen und Vektoren. Slide 3. Matrizen. Eine Matrix ist ein rechteckiges Zahlenschema 1 Lineare Algebra 1.1 Matrizen und Vektoren Slide 3 Matrizen Eine Matrix ist ein rechteckiges Zahlenschema eine n m-matrix A besteht aus n Zeilen und m Spalten mit den Matrixelementen a ij, i=1...n und

Mehr

Matrizen. a12 a1. a11. a1n a 21. a 2 j. a 22. a 2n. A = (a i j ) (m, n) = i te Zeile. a i 1. a i 2. a i n. a i j. a m1 a m 2 a m j a m n] j te Spalte

Matrizen. a12 a1. a11. a1n a 21. a 2 j. a 22. a 2n. A = (a i j ) (m, n) = i te Zeile. a i 1. a i 2. a i n. a i j. a m1 a m 2 a m j a m n] j te Spalte Mathematik I Matrizen In diesem Kapitel werden wir lernen was Matrizen sind und wie man mit Matrizen rechnet. Matrizen ermöglichen eine kompakte Darstellungsform vieler mathematischer Strukturen. Zum Darstellung

Mehr

Lösungsmenge L I = {x R 3x + 5 = 9} = L II = {x R 3x = 4} = L III = { }

Lösungsmenge L I = {x R 3x + 5 = 9} = L II = {x R 3x = 4} = L III = { } Zur Einleitung: Lineare Gleichungssysteme Wir untersuchen zunächst mit Methoden, die Sie vermutlich aus der Schule kennen, explizit einige kleine lineare Gleichungssysteme. Das Gleichungssystem I wird

Mehr

Viele wichtige Operationen können als lineare Abbildungen interpretiert werden. Beispielsweise beschreibt die lineare Abbildung

Viele wichtige Operationen können als lineare Abbildungen interpretiert werden. Beispielsweise beschreibt die lineare Abbildung Kapitel 3 Lineare Abbildungen Lineare Abbildungen sind eine natürliche Klasse von Abbildungen zwischen zwei Vektorräumen, denn sie vertragen sich per definitionem mit der Struktur linearer Räume Viele

Mehr

Brückenkurs Mathematik

Brückenkurs Mathematik Brückenkurs Mathematik 6.10. - 17.10. Vorlesung 3 Geometrie Doris Bohnet Universität Hamburg - Department Mathematik Mi 8.10.2008 1 Geometrie des Dreiecks 2 Vektoren Länge eines Vektors Skalarprodukt Kreuzprodukt

Mehr

6. f : Abb(R, R) R mit ϕ f(ϕ) := ϕ(1) Hinweis:f :V W über K bedeutet Abbildung f zwischen den Vektorräumen V und W über demselben

6. f : Abb(R, R) R mit ϕ f(ϕ) := ϕ(1) Hinweis:f :V W über K bedeutet Abbildung f zwischen den Vektorräumen V und W über demselben Aufgabe 74. Untersuchen Sie die folgenden Abbildungen auf Linearität. 1. f : R 2 R 2 mit (x, y) f(x, y) := (3x + 2y, x) 2. f : R R mit x f(x) := ϑx + ζ für feste ϑ, ζ R 3. f : Q 2 R mit (x, y) f(x, y)

Mehr

4.3 Bilinearformen. 312 LinAlg II Version Juni 2006 c Rudolf Scharlau

4.3 Bilinearformen. 312 LinAlg II Version Juni 2006 c Rudolf Scharlau 312 LinAlg II Version 0 20. Juni 2006 c Rudolf Scharlau 4.3 Bilinearformen Bilinearformen wurden bereits im Abschnitt 2.8 eingeführt; siehe die Definition 2.8.1. Die dort behandelten Skalarprodukte sind

Mehr

5.1 Determinanten der Ordnung 2 und 3. a 11 a 12 a 21 a 22. det(a) =a 11 a 22 a 12 a 21. a 11 a 21

5.1 Determinanten der Ordnung 2 und 3. a 11 a 12 a 21 a 22. det(a) =a 11 a 22 a 12 a 21. a 11 a 21 5. Determinanten 5.1 Determinanten der Ordnung 2 und 3 Als Determinante der zweireihigen Matrix A = a 11 a 12 bezeichnet man die Zahl =a 11 a 22 a 12 a 21. Man verwendet auch die Bezeichnung = A = a 11

Mehr

5.5 PRE-Maße (Fehlerreduktionsmaße) 6

5.5 PRE-Maße (Fehlerreduktionsmaße) 6 359 5.5 PRE-Maße (Fehlerreduktionsmaße) 6 5.5.1 Die grundlegende Konstruktion Völlig andere, sehr allgemeine Grundidee zur Beschreibung von Zusammenhängen. Grundlegendes Prinzip vieler statistischer Konzepte.

Mehr

Eigenwerte und Diagonalisierung

Eigenwerte und Diagonalisierung Eigenwerte und Diagonalisierung Wir wissen von früher: Seien V und W K-Vektorräume mit dim V = n, dim W = m und sei F : V W linear. Werden Basen A bzw. B in V bzw. W gewählt, dann hat F eine darstellende

Mehr

IV. Matrizenrechnung. Gliederung. I. Motivation. Lesen mathematischer Symbole. III. Wissenschaftliche Argumentation. i. Rechenoperationen mit Matrizen

IV. Matrizenrechnung. Gliederung. I. Motivation. Lesen mathematischer Symbole. III. Wissenschaftliche Argumentation. i. Rechenoperationen mit Matrizen Gliederung I. Motivation II. Lesen mathematischer Symbole III. Wissenschaftliche Argumentation IV. Matrizenrechnung i. Rechenoperationen mit Matrizen ii. iii. iv. Inverse einer Matrize Determinante Definitheit

Mehr

Gegenbeispiele in der Wahrscheinlichkeitstheorie

Gegenbeispiele in der Wahrscheinlichkeitstheorie Gegenbeispiele in der Wahrscheinlichkeitstheorie Mathias Schaefer Universität Ulm 26. November 212 1 / 38 Übersicht 1 Normalverteilung Definition Eigenschaften Gegenbeispiele 2 Momentenproblem Definition

Mehr

Kapitel XII - Kennzahlen mehrdimensionaler Zufallsvariablen

Kapitel XII - Kennzahlen mehrdimensionaler Zufallsvariablen Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel XII - Kennzahlen mehrdimensionaler Zufallsvariablen Wahrscheinlichkeitstheorie Prof. Dr. W.-D. Heller Hartwig Senska

Mehr

Lineare Abbildungen und Matrizen

Lineare Abbildungen und Matrizen Stefan Ruzika Mathematisches Institut Universität Koblenz-Landau Campus Koblenz 31. Mai 2016 Stefan Ruzika 9: Lineare Abbildungen und Matrizen 31. Mai 2016 1 / 16 Gliederung 1 Schulstoff 2 Körper 3 Vektorräume

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale

6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale 6Korrelationsanalyse:Zusammengangsanalysestetiger Merkmale Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig und mindestens ordinalskaliert, typischerweise

Mehr

4 Matrizenrechnung. Beide Operationen geschehen also koeffizientenweise. Daher übertragen sich die Rechenregeln von K(m n, k).

4 Matrizenrechnung. Beide Operationen geschehen also koeffizientenweise. Daher übertragen sich die Rechenregeln von K(m n, k). 4 Matrizenrechnung Der Vektorraum der m n Matrizen über K Sei K ein Körper und m, n N\{0} A sei eine m n Matrix über K: a a 2 a n a 2 a 22 a 2n A = = (a ij) mit a ij K a m a m2 a mn Die a ij heißen die

Mehr

1 Die Jordansche Normalform

1 Die Jordansche Normalform Matthias Tischler Karolina Stoiber Ferienkurs Lineare Algebra für Physiker WS 4/5 A Die Jordansche Normalform Vierter Tag (9.03.205) Im Zusammenhang mit der Lösung komplexer Differentialgleichungssysteme

Mehr

2. Mathematische Grundlagen

2. Mathematische Grundlagen 2. Mathematische Grundlagen Erforderliche mathematische Hilfsmittel: Summen und Produkte Exponential- und Logarithmusfunktionen 21 2.1 Endliche Summen und Produkte Betrachte n reelle Zahlen a 1, a 2,...,

Mehr

Methoden der Klassifikation und ihre mathematischen Grundlagen

Methoden der Klassifikation und ihre mathematischen Grundlagen Methoden der Klassifikation und ihre mathematischen Grundlagen Mengenlehre und Logik A B "Unter einer 'Menge' verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten unserer Anschauung

Mehr

6.3 Eigenwerte. γ ist Eigenwert von T [T] B B γi ist nicht invertierbar.

6.3 Eigenwerte. γ ist Eigenwert von T [T] B B γi ist nicht invertierbar. Um zu zeigen, dass die irreduziblen Teiler eines reellen Polynoms höchstens den Grad 2 haben, fassen wir nun (x γ) und (x γ) zusammen und stellen fest, dass (x (a + b i))(x ((a b i)) = x 2 2a + (a 2 +

Mehr

Konvexe Menge. Eine Menge D R n heißt konvex, wenn für zwei beliebige Punkte x, y D auch die Verbindungsstrecke dieser Punkte in D liegt, d.h.

Konvexe Menge. Eine Menge D R n heißt konvex, wenn für zwei beliebige Punkte x, y D auch die Verbindungsstrecke dieser Punkte in D liegt, d.h. Konvexe Menge Eine Menge D R n heißt konvex, wenn für zwei beliebige Punkte x, y D auch die Verbindungsstrecke dieser Punkte in D liegt, dh Kapitel Extrema konvex: h x + h y D für alle h [0, ], und x,

Mehr

7 Lineare Abbildungen und Skalarprodukt

7 Lineare Abbildungen und Skalarprodukt Mathematik II für inf/swt, Sommersemester 22, Seite 121 7 Lineare Abbildungen und Skalarprodukt 71 Vorbemerkungen Standard Skalarprodukt siehe Kap 21, Skalarprodukt abstrakt siehe Kap 34 Norm u 2 u, u

Mehr

Die deskriptive (beschreibende) Statistik hat als Aufgabe, große Datenmengen durch wenige Kennzahlen. oder Grafiken zu beschreiben.

Die deskriptive (beschreibende) Statistik hat als Aufgabe, große Datenmengen durch wenige Kennzahlen. oder Grafiken zu beschreiben. Die deskriptive (beschreibende) Statistik hat als Aufgabe, große Datenmengen durch wenige Kennzahlen wie Lage- und Streuungsmaße oder Grafiken zu beschreiben. Solche Datenmengen entstehen bei der Untersuchung

Mehr

Metrische Räume und stetige Abbildungen. Inhaltsverzeichnis

Metrische Räume und stetige Abbildungen. Inhaltsverzeichnis Metrische Räume und stetige Abbildungen Vortrag zum Seminar zur Analysis, 19. 04. 2010 René Koch, Stefan Lotterstedt In der Vorlesung Analysis I haben wir uns mit der Stetigkeit von reellen (komplexen)

Mehr

Matrizen, Determinanten, lineare Gleichungssysteme

Matrizen, Determinanten, lineare Gleichungssysteme Matrizen, Determinanten, lineare Gleichungssysteme 1 Matrizen Definition 1. Eine Matrix A vom Typ m n (oder eine m n Matrix, A R m n oder A C m n ) ist ein rechteckiges Zahlenschema mit m Zeilen und n

Mehr

0 Einführung: Was ist Statistik

0 Einführung: Was ist Statistik 0 Einführung: Was ist Statistik 1 Datenerhebung und Messung 2 Univariate deskriptive Statistik Häufigkeitsverteilungen Statistische Kennwerte 3 Multivariate Statistik 4 Regression 5 Ergänzungen Deskriptive

Mehr

6 Lineare Gleichungssysteme

6 Lineare Gleichungssysteme 6 LINEARE GLEICHUNGSSYSTEME 3 6 Lineare Gleichungssysteme Unter einem linearen Gleichungssystem verstehen wir ein System von Gleichungen α ξ + + α n ξ n = β α m ξ + + α mn ξ n = β m mit Koeffizienten α

Mehr

1 Einleitung Definitionen, Begriffe Grundsätzliche Vorgehensweise... 3

1 Einleitung Definitionen, Begriffe Grundsätzliche Vorgehensweise... 3 Inhaltsverzeichnis 1 Einleitung 1 1.1 Definitionen, Begriffe........................... 1 1.2 Grundsätzliche Vorgehensweise.................... 3 2 Intuitive Klassifikation 6 2.1 Abstandsmessung zur Klassifikation..................

Mehr

Kapitel 5 KONVERGENZ

Kapitel 5 KONVERGENZ Kapitel 5 KONVERGENZ Fassung vom 21. April 2002 Claude Portenier ANALYSIS 75 5.1 Metrische Räume 5.1 Metrische Räume DEFINITION 1 Sei X eine Menge. Eine Abbildung d : X X! R + heißt Metrik oder Distanz

Mehr

8.2 Invertierbare Matrizen

8.2 Invertierbare Matrizen 38 8.2 Invertierbare Matrizen Die Division ist als Umkehroperation der Multiplikation definiert. Das heisst, für reelle Zahlen a 0 und b gilt b = a genau dann, wenn a b =. Übertragen wir dies von den reellen

Mehr

Kapitel 4. Determinante. Josef Leydold Mathematik für VW WS 2017/18 4 Determinante 1 / 24

Kapitel 4. Determinante. Josef Leydold Mathematik für VW WS 2017/18 4 Determinante 1 / 24 Kapitel 4 Determinante Josef Leydold Mathematik für VW WS 2017/18 4 Determinante 1 / 24 Was ist eine Determinante? Wir wollen messen, ob n Vektoren im R n linear abhängig sind bzw. wie weit sie davon entfernt

Mehr

6. Normale Abbildungen

6. Normale Abbildungen SKALARPRODUKE 1 6 Normale Abbildungen 61 Erinnerung Sei V ein n-dimensionaler prä-hilbertraum, also ein n-dimensionaler Vektorraum über K (R oder C) versehen auch mit einer Skalarprodukt, ra K Die euklidische

Mehr

10 Kriterien für absolute Konvergenz von Reihen

10 Kriterien für absolute Konvergenz von Reihen 10 Kriterien für absolute Konvergenz von Reihen 10.1 Majoranten- und Minorantenkriterium 10.3 Wurzelkriterium 10.4 Quotientenkriterium 10.9 Riemannscher Umordnungssatz 10.10 Äquivalenzen zur absoluten

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9. Januar 2011 BOOTDATA11.GDT: 250 Beobachtungen für die Variablen...

Mehr

Principal Component Analysis (PCA)

Principal Component Analysis (PCA) Principal Component Analysis (PCA) Motivation: Klassifikation mit der PCA Berechnung der Hauptkomponenten Theoretische Hintergründe Anwendungsbeispiel: Klassifikation von Gesichtern Weiterführende Bemerkungen

Mehr

Grundsätzliches Rechnen mit Matrizen Anwendungen. Matrizenrechnung. Fakultät Grundlagen. Juli 2015

Grundsätzliches Rechnen mit Matrizen Anwendungen. Matrizenrechnung. Fakultät Grundlagen. Juli 2015 Matrizenrechnung Fakultät Grundlagen Juli 2015 Fakultät Grundlagen Matrizenrechnung Übersicht Grundsätzliches 1 Grundsätzliches Matrixbegriff Rechenregeln Spezielle Matrizen 2 Matrizenrechnung Determinanten

Mehr

Kapitel 1. Vektoren und Matrizen. 1.1 Vektoren

Kapitel 1. Vektoren und Matrizen. 1.1 Vektoren Kapitel 1 Vektoren und Matrizen In diesem Kapitel stellen wir die Hilfsmittel aus der linearen Algebra vor, die in den folgenden Kapiteln öfters benötigt werden. Dabei wird angenommen, dass Sie die elementaren

Mehr

Basis eines Vektorraumes

Basis eines Vektorraumes Basis eines Vektorraumes Basisergänzungssatz: Ist U V ein Unterraum von V und dim V = n, so kann jede Menge linear unabhängiger Vektoren aus U zu einer Basis von U erweitert werden Und es gilt: Beweis:

Mehr

Clusteranalyse. Clusteranalyse. Fragestellung und Aufgaben. Abgrenzung Clusteranalyse - Diskriminanzanalyse. Rohdatenmatrix und Distanzmatrix

Clusteranalyse. Clusteranalyse. Fragestellung und Aufgaben. Abgrenzung Clusteranalyse - Diskriminanzanalyse. Rohdatenmatrix und Distanzmatrix TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM R. Biometrische und Ökonometrische Methoden II SS 00 Fragestellung und Aufgaben Abgrenzung

Mehr

Höhere Mathematik für die Fachrichtung Physik

Höhere Mathematik für die Fachrichtung Physik Karlsruher Institut für Technologie Institut für Analysis Dr. Christoph Schmoeger Michael Hott, M. Sc. WS 5/.. Höhere Mathematik für die Fachrichtung Physik Lösungsvorschläge zum 4. Übungsblatt Aufgabe

Mehr

Bivariate Verteilungen

Bivariate Verteilungen Bivariate Verteilungen Tabellarische Darstellung: Bivariate Tabellen entstehen durch Kreuztabulation zweier Variablen. Beispiel: X Y Student(in) Herkunft Fakultät 0001 Europa Jura 000 Nicht-Europa Medizin

Mehr

9 Vektorräume mit Skalarprodukt

9 Vektorräume mit Skalarprodukt 9 Skalarprodukt Pink: Lineare Algebra 2014/15 Seite 79 9 Vektorräume mit Skalarprodukt 9.1 Normierte Körper Sei K ein Körper. Definition: Eine Norm auf K ist eine Abbildung : K R 0, x x mit den folgenden

Mehr

Assoziation & Korrelation

Assoziation & Korrelation Statistik 1 für SoziologInnen Assoziation & Korrelation Univ.Prof. Dr. Marcus Hudec Einleitung Bei Beobachtung von 2 Merkmalen stellt sich die Frage, ob es Zusammenhänge oder Abhängigkeiten zwischen den

Mehr

Zahlen und metrische Räume

Zahlen und metrische Räume Zahlen und metrische Räume Natürliche Zahlen : Die natürlichen Zahlen sind die grundlegendste Zahlenmenge, da man diese Menge für das einfache Zählen verwendet. N = {1, 2, 3, 4,...} bzw. N 0 = {0, 1, 2,

Mehr

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8

Wiederholung Statistik I. Statistik für SozialwissenschaftlerInnen II p.8 Wiederholung Statistik I Statistik für SozialwissenschaftlerInnen II p.8 Konstanten und Variablen Konstante: Merkmal hat nur eine Ausprägung Variable: Merkmal kann mehrere Ausprägungen annehmen Statistik

Mehr

Grundbegriffe (1) Grundbegriffe (2)

Grundbegriffe (1) Grundbegriffe (2) Grundbegriffe (1) S.1 Äquivalenzklasse Unter einer Äquivalenzklasse versteht man eine Klasse von Objekten, die man hinsichtlich bestimmter Merkmalsausprägungen als gleich (äquivalent) betrachtet. (z.b.

Mehr

1 Euklidische und unitäre Vektorräume

1 Euklidische und unitäre Vektorräume 1 Euklidische und unitäre Vektorräume In diesem Abschnitt betrachten wir reelle und komplexe Vektorräume mit Skalarprodukt. Dieses erlaubt uns die Länge eines Vektors zu definieren und (im Fall eines reellen

Mehr

9.2 Invertierbare Matrizen

9.2 Invertierbare Matrizen 34 9.2 Invertierbare Matrizen Die Division ist als Umkehroperation der Multiplikation definiert. Das heisst, für reelle Zahlen a 0 und b gilt b = a genau dann, wenn a b =. Übertragen wir dies von den reellen

Mehr

Vektorräume. 1. v + w = w + v (Kommutativität der Vektoraddition)

Vektorräume. 1. v + w = w + v (Kommutativität der Vektoraddition) Vektorräume In vielen physikalischen Betrachtungen treten Größen auf, die nicht nur durch ihren Zahlenwert charakterisiert werden, sondern auch durch ihre Richtung Man nennt sie vektorielle Größen im Gegensatz

Mehr