Elemente der Analysis II Kapitel 3: Lineare Abbildungen und Gleichungssysteme Informationen zur Vorlesung: http://www.mathematik.uni-trier.de/ wengenroth/ J. Wengenroth () 15. Mai 2009 1 / 35
3.1 Beispiel 3.1 Beispiel Sei p = [p 1,..., p n ] der Vektor der Preise von Gütern mit Nummern 1,..., n. Jedes x = [x 1,..., x n ] beschreibt einen Warenkorb mit x k Einheiten (Stück, Liter, Gewicht,...) des Gutes Nummer k. Dieser Warenkorb hat dann den Wert f (x) = p 1 x 1 + p 2 x 2 +... + p n x n = p, x. Wie schon in Satz 1.9 bemerkt, ist dann f (ax) = af (x) (der a-fache Warenkorb ist das a-fache wert) und f (x+y) = f (x)+f (y) (der Wert von zwei Körben ist die Summe der Werte). (Beachte, dass auch dieses Modell eine Vereinfachung ist. Tatsächlich würde man wohl Rabatte aushandeln, wenn man viel einkauft.) J. Wengenroth () 15. Mai 2009 2 / 35
3.2 Definition 3.2 Definition Eine Abbildung f : R n R m heißt linear, wenn für alle x, y R n und a R gelten: f (ax) = af (x) und f (x + y) = f (x) + f (y). J. Wengenroth () 15. Mai 2009 3 / 35
3.3 Satz 3.3 Satz (a) f : R n R m ist genau dann linear, wenn für alle x, y R n und a, b R gilt f (ax + by) = af (x) + bf (y). (b) Ist f : R n R m linear, ( so gilt ) für alle x1,..., x p R n und p p a 1,... a p R, dass f a j x j = a j f (x j ). j=1 j=1 (Linearkombinationen) (c) f = [f 1,..., f m ] : R n R m ist genau dann linear, wenn alle Komponentenfunktionen f k : R n R linear sind. (d) Summen, Vielfache, Zusammensetzungen und Kompositionen linearer Abbildungen sind linear (natürlich, falls sie definiert sind). J. Wengenroth () 15. Mai 2009 4 / 35
Beweis Beweis (a) = folgt aus f (ax + by) = f (ax) + f (by) = af (x) + bf (y). = folgt mit b = 0 bzw. a = b = 1. (b) folgt induktiv aus (a) (c) folgt aus der komponentenweisen Definition von Summen und Vielfachen von Vektoren. (d) Die Linearität von f + g, [f, g] und αf rechnet man direkt nach. Für f : R h R m und g : R m R p beide linear ist g(f (ax + by)) = g(af (x) + bf (y)) = ag(f (x)) + bg(f (y)). J. Wengenroth () 15. Mai 2009 5 / 35
3.4 Satz (Darstellungssatz) 3.4 Satz (Darstellungssatz) Jede lineare Abbildung f : R n R ist von der Form f (x) = p, x mit p = [f (e1),..., f (e n )] R n und den Einheitsvektoren e1,..., e n. Beweis: Wegen 1.6 (a) ist x = (b) (für a k = x k ) folgt also n k=1 x k e k für jedes x = [x 1,..., x n ]. Mit 3.3 n n f (x) = x k f (e k ) = x k p k = x, p = p, x. k=1 k=1 J. Wengenroth () 15. Mai 2009 6 / 35
3.4 Satz (Darstellungssatz) 3.4 Satz (Darstellungssatz) (a) Bemerkung: Eine lineare Abbildung R n R ist also durch die n Werte f (e1),..., f (e n ) der Standardbasis eindeutig bestimmt und damit sehr leicht auszurechnen. (Ist z1,..., z n irgendeine Basis des R n, so ist f auch durch f (z1),..., f (z n ) eindeutig bestimmt, aber nur dann leicht auszurechnen, wenn man die Koeffizienten in x = n k=1 a k z k effektiv bestimmen kann). (b) Anschaulich (n = 2) bedeutet 3.4, dass der Graph Γ f = {[x 1, x 2, f (x 1, x 2 )] : [x 1, x 2 ] R2} die Ebene in R3 ist die [1, 0, f (1, 0)], [0, 1, f (0, 1)] und den Ursprung [0, 0, 0] = [0, 0, f (0, 0)] enthält. (c) Interpretation von p k = f (e k ) : Dies ist der Faktor (Preis) mit dem die k-te Komponente x k von x = [x 1,..., x n ] zum Funktionswert f (x) beiträgt. J. Wengenroth () 15. Mai 2009 7 / 35
3.5 Beispiel 3.5 Beispiel Ein Unternehmen produziere aus 3 Rohstoffen zwei Produkte. Input: x 1 Menge der ersten, x 2 Menge des zweiten, x 3 Menge des dritten Rohstoffs. Output: f 1 (x 1, x 2, x 3 ) produzierte Menge des ersten Produkts bei Einsatz x 1, x 2, x 3. f 2 (x 1, x 2, x 3 ) produzierte Menge des zweiten Produkts bei Einsatz x 1, x 2, x 3. Modell: f = [f 1, f 2 ] : R3 R2. J. Wengenroth () 15. Mai 2009 8 / 35
3.6 Matrizen 3.6 Matrizen (a) Sei f : R n R m eine lineare Abbildung mit Komponentenfunktionen f 1,..., f m : R n R, das heißt f j (x) ist die j-te Komponente des Vektors f (x) R m. Die f k sind wieder linear (wegen Satz 3.3(c)) und deshalb gibt es nach Satz 3.4 für jedes j = 1, 2,..., m einen Vektor p j = [p j 1, pj 2,..., pj n] R n (nämlich p j k = f j(e k )), so dass f j (x) = p j 1 x 1 + p j 2 x 2 +... + p j nx n (b) Die lineare Abbildung f ist also durch die n m Zahlen p1 1,..., p1 n, p2 1,..., p2 n,..., p1 m,..., pm n eindeutig bestimmt und leicht auszurechnen. Es bietet sich an, diese Zahlen in eine Tabelle zu schreiben: p1 1 p1 2... p1 n p2 1 p2 2... p2 n P =. p1 m p2 m... pn m J. Wengenroth () 15. Mai 2009 9 / 35
3.6 Matrizen 3.6 Matrizen (b) Eine solche Tabelle heißt m n-matrix. Die Vektoren p j = [p j 1,..., pj n] R n heißen Zeilen von P und die p1 k Spaltenvektoren. heißen Spalten von P. p m k Eine m n-matrix hat also m Zeilen und n Spalten. Mit dem Symbol R m n bezeichnen wir die Menge aller m n-matrizen. (c) Alternative (übliche) Schreibweise: p j k = p j,k. Der erste/obere Index j ist die Zeilennummer und der zweite/untere Index k ist die Spaltennummer. Oft schreibt man P = [p j,k ] j {1,...,m} oder nur k {1,...n} P = [p jk ], falls die Dimensionen n und m klar sind. J. Wengenroth () 15. Mai 2009 10 / 35
3.6 Matrizen 3.6 Matrizen (d) Die Unterscheidung zwischen Zeilen und Spalten ist ab jetzt wesentlich, und wir fassen ab jetzt Vektoren immer als SPALTEN auf, das heißt R n = R n 1. (e) Zusammenfassung: Ist f : R n R m eine lineare Abbildung und zugehöriger Matrix P = [p jk ] (wobei p j,k die j-te Komponente von f (e k )), so gilt für x = x 1. x n R n f (x) = p 1,1 x 1 + p 1,2 x 2 +... + p 1,n x n. p m,1 x 1 + p m,2 x 2 +... + p m,n x n J. Wengenroth () 15. Mai 2009 11 / 35
3.6 Matrizen 3.6 Matrizen (f) Wir definieren deshalb für P R m n und x R n das Produkt p 1,1 x 1 + p 1,2 x 2 +... + p 1,n x n P x =. R m p m,1 x 1 + p m,2 x 2 +... + p m,n x n (g) Jede lineare Abbildung R n R m ist also von der Form x P x. J. Wengenroth () 15. Mai 2009 12 / 35
3.7 Beispiel 3.7 Beispiel In der Situation von Beispiel 3.5 sei konkret f 1 (x 1, x 2, x 3 ) = 2x 1 + 4x 2 + x 3 f 2 (x 1, x 2, x 3 ) = 6x 1 + x 2 + 2x 3 [ ] 2 4 1 Dann hat man also P =. Das Unternehmen erhalte eine 6 1 2 Anfrage, ob es y 1 Stück von Gut 1 und y 2 Stück von Gut 2 liefern könne. x 1 Die Geschäftsführung frag sich dann: Gibt es Input x = x 2, so dass x [ ] 3 y1 f (x) = y =, also y 2 (1) 2x 1 + 4x 2 + x 3 = y 1? (2) 6x 1 + x 2 + 2x 3 = y 2 J. Wengenroth () 15. Mai 2009 13 / 35
3.7 Beispiel 3.7 Beispiel Subtraktion des dreifachen der ersten Gleichung von der zweiten liefert, dass das Gleichungssystem äquivalent ist zu (1) 2x 1 + 4x 2 + x 3 = y 1 (3) 11x 2 x 3 = y 2 3y 1. Dieses neue System kann man nun explizit auflösen: Wähle irgendein x 3 R Definiere x 2 = 1 11 (y 2 3y 1 + x 3 ) x 1 = 1 2 (y 1 x 3 4x 3 ) Es gibt also sehr viele Lösungen, und man kann die Anfrage positiv beantworten (und sich dann überlegen, welches x 3 zu einer Lösung mit weiteren günstigen Eigenschaften führt). J. Wengenroth () 15. Mai 2009 14 / 35
3.7 Beispiel 3.7 Beispiel Bemerkungen: In realistischen Beispielen hat man viel mehr Variablen x 1,..., x n und viel mehr Gleichungen. Die Menge der Lösungen {x R n : f (x) = y} ist also eine Niveaumenge zu Niveau y. Weil man 3 Unbekannte und 2 Gleichungen hat, ist es nicht überraschend, dass es viele Lösungen gibt. [ ] 2 4 1 2x Vorsicht: Ist Q =, so hat 1 + 4x 2 + x 3 = 1 4 8 2 4x 1 + 8x 2 + 2x 3 = 1 keine Lösung. (Die zweite Zeile von Q ist ein Vielfaches der ersten Zeile). J. Wengenroth () 15. Mai 2009 15 / 35
3.8 Lineare Gleichungssysteme (LGS) 3.8 Lineare Gleichungssysteme (LGS) (a) Für eine m n-matrix P = [p j,k ] und y R m heißt die Gleichung P x = y ein LGS mit m Gleichungen und n Unbekannten oder LGS m n. Jedes x R n, das diese Gleichung erfüllt heißt eine Lösung des LGS. L(P, y) = {x R n : P x = y} heißt Lösungsmenge. (b) P x = y ist eine kurze und elegante Schreibweise für p 1,1 x 1 + p 1,2 x 2 +... + p 1,n x n = y 1.. p m,1 x 1 + p m,2 x 2 +... + p m,n x n = y m J. Wengenroth () 15. Mai 2009 16 / 35
3.8 Lineare Gleichungssysteme (LGS) 3.8 Lineare Gleichungssysteme (LGS) (c) LGS treten sehr oft mit riesigen Dimensionen n und m auf (Computertomographie: n m 106) (d) Hat P die Spalten p1,..., p n, so ist P x = x 1 p1 +..., +x n p n. Es gibt also genau dann eine Lösung von P x = y, wenn y eine Linearkombination der Spalten ist. (e) Für y = O R m gibt es immer mindestens eine Lösung, nämlich x = O R n. Oft gibt es aber auch x O mit P x = O. J. Wengenroth () 15. Mai 2009 17 / 35
3.9 Rekursive Algorithmen 3.9 Rekursive Algorithmen (a) Der Gaußsche Algorithmus (Eliminationsverfahren) ist eine einfache Methode, wie man das Problem Finde alle Lösungen des LGS m n P x = y auf ein kleineres LGS (m 1) (n 1) zurückführt. Das neue Problem wird mit der selben Methode auf ein noch kleineres LGS (m 2) (n 2) zurückgeführt, bis man schließlich entweder ein LGS 1,q oder ein LGS p,1 erhält (das man leicht lösen kann). So eine Methode nennt man rekursiven Algorithmus. (b) Türme von Hanoi Gegeben: Drei Stäbe, auf einem davon n Scheiben nach der (verschiedenen) Größe geordnet. Ziel: Stapel von einem Stab a auf anderen c bewegen. Erlaubte Züge: Oberste Scheibe eines Stabs auf einen anderen legen, so dass nie eine größere Scheibe über einer kleineren liegt. Algorithmus: Verschiebe (n 1) Scheiben von a (über c) nach b. Verschiebe oberste (einzige) Scheibe von a nach c. Verschiebe (n 1) Scheiben von b (über a) nach c. J. Wengenroth () 15. Mai 2009 18 / 35
3.10 Der Gauß-Algorithmus 3.10 Der Gauß-Algorithmus Gesucht sind alle Lösungen x R n das LGS m n P x = y für gegebene Matrix P R m n und y R m, also p 1,1 x 1 + p 1,2 x 2 +... + p 1,n x n = y 1.. p m,1 x 1 + p m,2 x 2 +... + p m,n x n = y m. Lösungsstrategie: Elimination der Unbekannten x n aus den ersten (m 1) Gleichungen durch Addition geeigneter Vielfacher der letzten Gleichung zu den übrigen. Das geht, falls der Koeffizient p m,n ungleich 0 ist. Sonst Vertausche die Reihenfolge der Gleichungen. J. Wengenroth () 15. Mai 2009 19 / 35
3.10 Der Gauß-Algorithmus 3.10 Der Gauß-Algorithmus I n Vertausche gegebenenfalls die Zeilen, so dass p m,n 0. (Falls nicht möglich, gehe zu V n ). II n Für j = 1,..., m 1 setze α j = p j,n p m,n und addiere das α j -fache der letzten Zeile zur j-ten Zeile. Dies liefert das LGS m n mit der selben Lösungsmenge p 1,1 x 1 +... + p 1,n 1 x n 1 = ỹ 1.. P x = ỹ p m 1,1 x 1 +... + p m 1,n 1 x n 1 = ỹ n 1 p m,1 x 1 +... + p m,n 1 x n 1 + p m,n x n = y n mit p j,k = p j,k + α j p m,k und ỹ j = y j + α j y m. III n Löse durch die Schritte I n 1 bis IV n 1 das kleinere LGS m 1,n 1. IV n Dann löst x = [x 1,..., x n ] das LGS P x = y x = [x 1,..., x n 1 ] löst P x = ỹ und x n = 1 p m,n (y n p m,1 x 1 p m,2 x 2... p m,n 1 x n 1 ) J. Wengenroth () 15. Mai 2009 20 / 35
3.10 Der Gauß-Algorithmus 3.10 Der Gauß-Algorithmus V n Falls p 1,n = p 2,n =... = p m,n = 0 ist Schritt I n nicht durchführbar. In diesem Fall gilt: x = [x 1,..., x n ] löst P x = y x = [x 1,..., x n 1 ] löst das LGS m,n 1 P x = y mit P = p 1,1... p 1,n 1. p m,1... p m,n 1 (und x n ist beliebig). J. Wengenroth () 15. Mai 2009 21 / 35
3.11 Bemerkung zum Gauß-Algorithmus 3.11 Bemerkung zum Gauß-Algorithmus (a) Die Schritte IV und V besagen, dass man für jede Lösung x des kleineren System eine (IV) beziehungsweise unendlich viele (V) Lösungen des Ausgangssystems erhält. (b) Es ist möglich, dass das kleinere System keine Lösung hat. Dann hat auch das Ausgangssystem keine Lösung, das System heißt dann inkonsistent. (c) Durch Umbenennen der Variablen x 1,..., x n und Vertauschen der Zeilen (Pivotieren) erhält man Varianten des Algorithmus. In der Literatur oft zuerst: x 1 aus Gleichungen 2 bis n eliminieren. (d) Lösen von LGS 1,n p 1 x 1 +... + p n x n = y ist einfach: Wähle k mit p k 0 und beliebige x l R für l k und löse nach x k auf. p 1 x 1 = y 1 (e) Lösen von LGS m,1. p n x n = y n und überprüfe die anderen. ist auch einfach: Löse eine Gleichung J. Wengenroth () 15. Mai 2009 22 / 35
3.12 Beispiel a 3.12 Beispiel x 1 + 0x 2 + 2x 3 = 1 2x 1 + x 2 + x 3 = 0 2x 1 + x 2 + 1 2 x 3 = 2 I 3 Keine Vertauschung nötig. II 3 α 1 = 2 1/2 = 4, α 2 = 1 1/2 = 2. Das neue LGS ist } 7x 1 4x 2 = 9 Px = ỹ 2x 1 x 2 = 4 2x 1 + x 2 + 1/2x 3 = 2 III 3 Lösen des LGS 2 2 in II 3 : I 2 Wieder keine Vertauschung nötig. II 2 α 1 = 4 1 = 4. Das neue LGS ist ( 7 4( 2))x 1 = 9 4( 4) x 1 = 7 2x 1 x 2 = 4 III 2 Das LGS in II 2 hat Lösung x 1 = 7. IV 2 Das LGS in II 3 hat Lösung x 1 = 7, x 2 = 10. IV 3 Das LGS 3 3 P x = y hat Lösung x 1 = 7, x 2 = 10, x 3 = 4 J. Wengenroth () 15. Mai 2009 23 / 35
3.12 Beispiel 3.12 Beispiel (b) Gesucht sind alle Lösungen des LGS 3 3 x 1 + x 2 x 3 = 0 x 1 x 2 + 2x 3 = 3 3x 1 + x 2 = 1 I 3 p 3,1 = 0. Vertausche 1. und 3. Zeile. Neues LGS 3 3. 3x 1 + x 2 = 1 x 1 x 2 + 2x 3 = 3 x 1 + x 2 x 3 = 0 II 3 α 1 = 0 1 = 0, α 2 = 2 1 = 2. Neues LGS 3 3 } 3x 1 + x 2 = 1 3x 1 + x 2 = 3 Px = ỹ x 1 + x 2 x 3 = 0 J. Wengenroth () 15. Mai 2009 24 / 35
3.12 Beispiel 3.12 Beispiel III 3 Löse LGS 2 2 in II 3. I 2 Keine Vertauschung nötig. II 2 α 1 = 1. Das neue LGS 2 2 ist 0 x 1 = 2 } P x = ỹ 3x 1 + x 2 = 3. III 2 Das LGS 1 1 in II 2 hat keine Lösung. IV 2 Das LGS 2 2 in II 3 hat keine Lösung. IV 3 Das LGS 3 3 P x = y in I 3 hat keine Lösung. J. Wengenroth () 15. Mai 2009 25 / 35
3.13 Simultanes Lösen von LGS 3.13 Simultanes Lösen von LGS Gegeben seien eine m n Matrix P und s Vektoren y1,..., y s R m. Gesucht sind Lösungen x1,..., x s R n von P x l = y l für alle l = 1,..., s. Eine Möglichkeit: s mal Gauß-Algorithmus durchführen. Bessere Variante: Die Matrix P im Schritt II hängt nicht von der rechten Seite ab, also sind alle kleineren Probleme wieder von der Form P x l = ỹ l. Nur IV hängt von y l ab. Schreibt man x1,..., x s als Spalten einer Matrix Q R n s (also q j,l = xj l) und y1,..., y1 als Spalten einer Matrix R Rm s (also r j,l = yj l ), so ist r j,l = yj l = [P x l ] j = p j,1 x1 l +... + p j,nx n = p j,1 q 1,l +... + p j,n q n,l J. Wengenroth () 15. Mai 2009 26 / 35
3.14 Matrix-Multiplikation 3.14 Matrix-Multiplikation (a) Für m, n, q N und Matrizen P R m n und Q n s definieren wir das Produkt R = P Q R m s durch [P Q] j,l = n p j,k q k,l = p j,1 q 1,l +... + p j,n q n,l. k=1 (b) Das Element in der j-ten Zeile und l-ten Spalte von P Q ist also das Skalarprodukt der j-ten Zeile von P und der l-ten Spalte von Q. Außerdem ist die l-te Spalte von P Q gleich dem Produkt von P mit der l-ten Spalte von Q. (c) Die j-te Zeile von P Q ist gleich dem Produkt der j-ten Zeile p j R 1 n von P mit Q R n m. J. Wengenroth () 15. Mai 2009 27 / 35
3.14 Matrix-Multiplikation 3.14 Matrix-Multiplikation (d) Seien f : R n R m linear, also f (x) = P x, wobei P R m n die Spalten f (e1),..., f (e n ) hat, sowie g : R q R n linear, also g(y) = Q y, wobei Q R n q die Spalten g(e1),..., g(e q ) hat. Dann ist f g : R q R m linear und (f g)(e l ) = f (g(e l )) = P g(e l ) = P l-te Spalte von Q. Also: f g(y) = (P Q) y. J. Wengenroth () 15. Mai 2009 28 / 35
3.15 Satz 3.15 Satz (a) A R m n, B R n q, C R q r = (A B) C = A (B C) Assoziativität (b) A R m n, B, C R n q = A (B + C) = A B + A C Distributivität (wobei die Summe von Matrizen gleicher Dimension komponentenweise erklärt ist). J. Wengenroth () 15. Mai 2009 29 / 35
3.16 Beispiel 3.16 Beispiel (a) Für A R m n und B R n q mit q m ist kein Produkt B mit A definiert! (b) Selbst wenn [ A B ] und B A [ definiert ] sind, ist sehr oft A B B A. 1 0 1 1 Etwa A =, B = : 0 2 0 1 [ ] [ ] 1 1 1 2 A B = aber B A = 0 2 0 2 J. Wengenroth () 15. Mai 2009 30 / 35
3.17 Inverse Matrizen 3.17 Inverse Matrizen 1 0... 0 0 1 0 0 (a) Für n N heißt E n =. 1. Rn n 0... 1 die n n-dimensionale Einheitsmatrix (nur auf der Diagonalen Einsen sonst Nullen). Für A R m n gilt dann A E n = A und E m A = A. (b) Eine quadratische Matrix A R n n heißt invertierbar, wenn es B R n n gibt mit A B = E n. (c) Satz: A B = E n = B A = E n. J. Wengenroth () 15. Mai 2009 31 / 35
3.17 Inverse Matrizen 3.17 Inverse Matrizen (d) Folgerung: A B = E n und A C = E n = B = C. Beweis: (1) A (B C) = A B A C = E n E n = 0 (2) B C = E n (B C) = (B A) (B C) = B (A (B C)) = B 0 = 0. (3) B = C. (e) Ist also A R n n invertierbar, so gibt es genau eine Matrix B R n n mit B A = E n. Diese Matrix heißt Inverse von A, und wir schreiben dann [ B = A 1 ]. [ ] 1 2 1 (f) A = ist invertierbar mit A 0 3 1 2 = 3. 0 1/3 [ ] 1 2 (g) M = ist nicht invertierbar. 4 8 [ ] 2 x = = M x = 0. Wäre M invertierbar, folgte 1 x = M 1 M x = 0, was nicht der Fall ist. J. Wengenroth () 15. Mai 2009 32 / 35
3.18 Satz 3.18 Satz Sei A R n n eine quadratische Matrix. (a) Ist A invertierbar, so besitzt das LGS n n A x = y für jedes y R n genau eine Lösung, nämlich x = A 1 y. (b) Sind alle n LGS n n A x = e k (k-ter Einheitsvektor) lösbar mit Lösung x k R n, so ist A invertierbar und x1,... x n sind die Spalten von A 1. J. Wengenroth () 15. Mai 2009 33 / 35
3.18 Satz 3.18 Satz Beweis. (a) x = A 1 y ist eine Lösung, weil A (A 1 y) = (A A 1 ) y = E n y = y. Ist z R n irgendeine Lösung, so folgt aus Satz 3.17 (c) z = A 1 A z = A 1 y. (b) Nach Definition der Matrixmultiplikation sind A x k = e k die Spalten von A [x1,..., x n ]. Andererseits hat E n gerade die Spalten e1,..., e n. J. Wengenroth () 15. Mai 2009 34 / 35