$Id: norm.tex,v 1.57 2018/06/08 16:27:08 hk Exp $ $Id: jordan.tex,v 1.34 2018/07/12 20:08:29 hk Exp $ 4 Funktionenfolgen und normierte Räume 4.7 Kompakte Mengen Am Ende der letzten Sitzung hatten wir zwei Normen 1 und 2 auf demselben Vektorraum E äquivalent genannt wenn sie dieselben offenen Mengen definieren, wenn also eine Menge U E genau dann bezüglich 1 offen ist wenn sie bezüglich 2 offen ist. Es hatte sich herausgestellt das die beiden Normen genau dann äquivalent sind wenn sie sich gegeneinander abschätzen lassen, wenn es also Konstanten A, B > 0 mit x 2 A x 1 und x 1 B x 2 für alle x E gibt. Zum Auftakt dieser Sitzung wollen wir ein weiteres Beispiel behandeln, seien a, b R mit a < b gegeben und bezeichne C 1 [a, b] den Vektorraum aller stetig differenzierbaren Funktionen auf [a, b]. Nach Aufgabe (31.a) haben wir auf C 1 [a, b] die beiden Normen 1 und definiert durch x 1 := x + x und x := x(a) + x für jedes x C 1 [a, b]. Wir behaupten das diese beiden Normen auf C 1 [a, b] äquivalent sind. Zunächst ist für jedes x C 1 [a, b] sofort x = x(a) + x x + x = x 1. Für x C 1 [a, b] erhalten wir weiter für jedes t [a, b] t x(t) = x(a) + t x (s) ds x(a) + x (s) ds x(a) + (b a) x a also ist x x(a) + (b a) x und insgesamt haben wir x 1 = x + x x(a) + (b a + 1) x (b a + 1) x. Nach dem Lemma sind unsere beiden Normen damit äquivalent. Als eine erste Anwendung des Kompaktheitsbegriffs werden wir jetzt zeigen das alle Normen auf dem R n äquivalent sind. Satz 4.27 (Alle Normen im R n sind äquivalent) Sei n N mit n 1. Dann sind je zwei Normen auf dem R n äquivalent. Beweis: Es reicht zu zeigen, dass jede Norm auf dem R n zu äquivalent ist. Zunächst gilt für jedes x R n x = x 1 e 1 + + x n e n x 1 e 1 + + x n e n M x 17-1 a
mit M := e 1 + + e n > 0. Aus dieser Ungleichung folgt bereits das die Norm bezüglich stetig ist, denn für alle x, y R n haben wir x y x y M x y. Nach Satz 25 ist die Menge C := {x R n : x = 1} kompakt und nach Lemma 23.(d) nimmt auf C das Minimum an, es gibt also eine Konstante A > 0 mit x A für alle x R n mit x = 1. Sei jetzt 0 x R n. Dann ist x/ x C, also folgt x x = x x A, d.h. x (1/A) x. Für x = 0 gilt dies trivialerweise und nach Lemma 26 sind die beiden Normen äquivalent. Als eine zweite Anwendung wollen wir jetzt den Fundamentalsatz der Algebra beweisen. Bei der Integration rationaler Funktionen in 2.4 hatten wir diesen Satz zur Herleitung der allgemeinen reellen Partialbruchzerlegung verwendet, wir hatten benötigt das jedes normierte Polynom p über den komplexen Zahlen sich als ein Produkt p(x) = (x z 1 )... (x z n ) schreiben ließ, wobei z 1,..., z n dann die komplexen Nullstellen des Polynoms sind. Ebenfalls schon in 2.4 hatten wir durch schrittweises Herausziehen einzelner Nullstellen eingesehen, dass es ausreicht zu zeigen das jedes nicht konstante, komplexe Polynom eine komplexe Nullstelle besitzt. Satz 4.28 (Fundamentalsatz der Algebra) Jedes komplexe Polynom p mit grad(p) 1 hat eine Nullstelle. Beweis: Schreibe p(z) = n k=0 a kz k mit a n 0. Wir setzen µ := inf{ p(z) : z C}. Nach I. 4.Lemma 7 existiert ein r 1 > 0 mit p(z) > a n 2 z n für alle z C mit z r 1. Weiter wähle ein r 2 > 0 mit a n r2 n /2 > µ und setze r 0 := max{r 1, r 2 } > 0. Für jedes z C mit z r 0 ist dann p(z) > a n 2 z n a n 2 rn 2 > µ, 17-2
also ist auch µ = inf{ p(z) : z B r0 (0)}. Da p stetig ist und B r0 (0) kompakt ist, existiert nach Lemma 23.(d) ein z 0 C mit p(z 0 ) = µ. Wir müssen also nur zeigen das µ = 0 ist. Angenommen es wäre µ > 0. Dann betrachten wir das Polynom mit grad(q) = n, q(0) = 1 und q(z) := p(z + z 0) p(z 0 ) q(z) = p(z + z 0) µ 1 für alle z C. Es gibt ein 1 k n so, dass q die Form q(z) = 1 + b k z k + n i=k+1 mit b k 0 hat. Wegen b k / b k = 1 gibt es weiter einen Winkel θ R mit e ikθ b k = b k. Wegen b i z i ( ) lim (1 n k r 0 rk b k ) = 1 > 0 und lim b k b k+j r j = b k > 0 r 0 existiert ein r > 0 mit 1 r k b k > 0 und b k n k i=1 b k+i r i > 0. Setze z := re iθ. Dann ist q(z) = 1 b n k n k k r k + b k+j r k+j e i(k+j)θ 1 b k r k + b k+j r k+j ) n k n k = 1 b k r k + b k+j r k+j = 1 r ( b k k b k+j r j < 1 im Widerspruch zu q(z) 1. Dieser Widerspruch beweist µ = 0 und somit hat p eine Nullstelle. Das Vorgehen in diesem Beweis ist examplarisch für viele Kompaktheitsanwendungen, das Existenzproblem eine Nullstelle zu finden wird in das Problem umgewandelt von einer bereits konstruierten Zahl z 0 nachzuweisen das sie eine Nullstelle ist. 17-3
5 Eigenwerte und die Jordansche Normalform Nachdem wir nun den ersten analytischen Abschnitt beendet haben, kommen wir jetzt zur linearen Algebra. In diesen Kapiteln werden wir nur die unmittelbar einzusehenden Aussagen wirklich beweisen, für die Beweise der meisten komplizierteren Aussagen fehlen uns leider die notwendigen Hilfsmittel. Wir beginnen mit dem grundlegenden Begriff der Eigenwerte einer linearen Abbildung, der sich als das zentrale Hilfsmittel der folgenden Kapitel herausstellen wird. 5.1 Eigenwerte und Eigenvektoren Man kann Eigenwerte und Eigenvektoren sowohl für Matrizen als auch allgemeiner für lineare Abbildungen definieren. In diesem Abschnitt behandeln wir dabei die linearen Abbildungen. Definition 5.1 (Eigenwerte und Eigenvektoren linearer Abbildungen) Sei V ein Vektorraum über K {R, C}. Ein Endomorphismus von V ist eine lineare Abbildung T : V V. Sei nun T ein Endomorphismus von V. Ist λ K so, heißt ein Vektor v V ein Eigenvektor zu λ wenn T v = λ v gilt. Weiter heißt λ ein Eigenwert von T wenn es einen von Null verschiedenen Eigenvektor zu λ gibt. Beachte das der Nullvektor zu jedem λ K ein Eigenvektor ist, mit dieser Festlegung wird die Menge aller Eigenvektoren zu beliebigen λ K ein Untervektorraum werden, wie wir etwas weiter unten sehen werden. Wir betrachten zunächst einige Beispiele. 1. Zunächst sei T : R 2 R 2 ; (x, y) (2x, 3y), x- und y-achse werden also unabhängig voneinander umskaliert. Für jedes t R sind dann T (t, 0) = (2t, 0) = 2 (t, 0) und T (0, t) = (0, 3t) = 3 (0, t). Damit hat T zumindest die beiden Eigenwerte λ = 2 und λ = 3 und die Eigenvektoren für λ = 2 sind die Elemente der x-achse und die für λ = 3 die Elemente der y-achse. Mehr Eigenwerte gibt es nicht. Denn nehmen wir uns einen Vektor v R 2, der weder auf der x- noch auf der y-achse liegt, so ist v = (x, y) mit x, y 0 und somit ist T v = T (x, y) = (2x, 3y) kein Vielfaches von v = (x, y), d.h. v ist kein Eigenvektor. 17-4
2. Als nächstes Beispiel wollen wir die Scherung betrachten. Für jedes x R gilt dabei T : R 2 R 2 ; (x, y) (x + 2y, y) T (x, 0) = (x, 0), d.h. λ = 1 ist ein Eigenwert von T mit den Elementen der x-achse als Eigenvektoren. In diesem Beispiel gibt es keine weiteren Eigenwerte oder Eigenvektoren. Denn ist v R 2 nicht auf der x-achse, so ist v = (x, y) mit y 0. Dann ist T (x, y) = (x + 2y, y) kein Vielfaches von v = (x, y). Hier haben wir also genau einen Eigenwert λ = 1. 3. Es kann auch passieren, dass es überhaupt keine Eigenwerte gibt. Sei etwa T : R 2 R 2 eine Drehung um einen Winkel 0 < ϕ < π. Dann wird offenbar kein von Null verschiedener Vektor auf einen Vielfachen abgebildet, und somit gibt es in diesem Beispiel keine Eigenwerte. 4. Wir betrachten den Vektorraum V = C (R) aller unendlich oft differenzierbaren Funktionen von R nach R. Als lineare Abbildung nehmen wir das Ableiten T = d dx : C (R) C (R); f f. Was sind nun die Eigenwerte von T? Die Eigenvektoren zu einer reellen Zahl λ R sind diejenigen unendlich oft differenzierbaren Funktionen f : R R mit λf = T f = f, und für jedes λ R sehen wir eine solche Funktion, nämlich f λ : R R; x e λx. Bis auf Vielfache sind dies die einzigen Eigenvektoren zum Eigenwert λ R, denn ist f : R R eine differenzierbare Funktion mit f = λf, so haben wir d dx f(x)e λx = (f (x) λf(x))e λx = 0 für alle x R, nach 1.Lemma 1 gibt es also eine Konstante C R mit f(x)e λx = C, beziehungsweise f(x) = Ce λx für alle x R. Damit ist überhaupt jede reelle Zahl λ ein Eigenwert von T und die Eigenvektoren zu λ sind genau die angegebenen Funktionen. Wie schon oben bemerkt, bildet die Menge aller Eigenvektoren zu einem Eigenwert stets einen von Null verschiedenen Untervektorraum von V. Hierzu werden wir den 17-5
Begriff des Kerns einer linearen Abbildung T aus I. 9 verwenden, dieser war der Untervektorraum aller Vektoren x mit T x = 0. Lemma 5.1 (Eigenräume linearer Abbildungen) Seien K {R, C}, V ein Vektorraum über K und T ein Endomorphismus von V. Für jedes λ K ist dann die Menge E λ (T ) := {v V T v = λv} der Eigenvektoren von T zu λ ein Untervektorraum von V, genannt der zu λ gehörige Eigenraum. Es ist E λ (T ) = Kern(λ T ). Beweis: Für v E ist genau dann v E λ (T ) wenn T v = λv, also wenn (λ T )v = 0, gilt. Damit ist E λ (T ) = Kern(λ T ) und dies ist nach I. 9.Lemma 9.(e) auch ein Untervektorraum. Wie im letzten Semester ist λ T eine verkürzte Schreibweise für die lineare Abbildung λ id V T. Ist unser Vektorraum V endlich erzeugt, so hatten wir in I. 9.Lemma 10 gesehen, dass auch jeder Untervektorraum U von V endlich erzeugt ist, und somit eine Dimension dim U dim V besitzt. Wenden wir dies auf die Eigenräume eines Endomorphismus an, so ergibt sich die sogenannte geometrische Vielfachheit eines Eigenwerts. Definition 5.2 (Geometrische Vielfachheit eines Eigenwerts) Seien K {R, C}, V ein endlich erzeugter Vektorraum über K, T ein Endomorphismus von V und λ K ein Eigenwert von K. Dann heißt die Dimension dim E λ (T ) die geometrische Vielfachheit des Eigenwerts λ. 5.2 Eigenwerte von Matrizen Seien K {R, C} und n N mit n 1. In I. 10 hatten wir gesehen das die Endomorphismen des K n alle die Form T A x := Ax mit einer n n-matrix A über K haben. Wir übertragen die Sprechweisen des vorigen Abschnitts dann auf die Matrix A, d.h. Eigenwerte, Eigenvektoren, Eigenräume und geometrische Vielfachheiten von A sind diejenigen von T A. Im reellen Fall K = R können wir uns A auch als komplexe Matrix denken und dann von den komplexen Eigenwerten von A reden. Wie berechnet man nun die Eigenwerte und Eigenvektoren einer Matrix A? Für jede Zahl λ K bestehen 17-6
die Äquivalenzen λ ist ein Eigenwert von A Es gibt ein 0 x K n mit Ax = λx Es gibt ein 0 x K n mit λx Ax = 0 Das homogene lineare Gleichungssystem (λ A)x = 0 hat eine nicht triviale Lösung Die Matrix λ A ist nicht regulär det(λ A) = 0. Die erhaltene Bedingung det(λ A) = 0 fassen wir nun als eine Gleichung für den gesuchten Eigenwert λ auf. Damit sind die Eigenwerte λ der Matrix A die Lösungen der Gleichung det(λ A) = 0, und diese wird als die charakteristische Gleichung der Matrix A bezeichnet. Als ein Beispiel wollen wir einmal die Eigenwerte und Eigenvektoren der 3 3 Matrix 9 4 8 A = 11 6 8 8 4 7 berechnen. Die charakteristische Gleichung ist dann λ + 9 4 8 11 λ 6 8 8 4 λ 7 = λ + 9 4 8 2 λ λ 2 0 λ + 1 0 λ + 1 = λ + 5 4 8 0 λ 2 0 λ + 1 0 λ + 1 = (λ 2) λ + 5 8 λ + 1 λ + 1 = (λ 2)((λ + 1)(λ + 5) 8(λ + 1)) = (λ 2)(λ + 1)(λ 3)! = 0. Diese Gleichung hat genau die drei Lösungen λ = 1, λ = 2 und λ = 3 und dies sind damit auch die Eigenwerte von A. Wir wollen jetzt auch noch die zugehörigen Eigenräume berechnen. Starten wir mit dem Eigenwert λ = 1. Wir hatten gesehen, dass die Eigenvektoren zu einem Eigenwert λ von A genau die Lösungen x des homogenen linearen Gleichungssystems (λ A)x = 0 sind. Die Matrix λ A hatten wir schon zur Berechnung der charakteristischen Gleichung hingeschrieben, und hier müssen wir nur λ = 1 einsetzen, um zu unseren linearen Gleichungssystem zu kommen. Die Eigenvektoren zum Eigenwert λ = 1 sind damit die Lösungen des homogenen linearen Gleichungssystems 8x 4y + 8z = 0 11x 7y + 8z = 0 8x + 4y 8z = 0 Lösen wir dieses Gleichungssystem über das Gaußsche Eliminationsverfahren 8 4 8 8 4 8 11 7 8 0 3 3, 2 8 4 8 0 0 0 17-7
so ergibt sich die Lösung als 3 y = 3z = y = 2z und 8x = 4y 8z = 16z = x = 2z. 2 Wir erhalten damit beispielsweise mit z = 1 den Eigenvektor 2 u = 2, 1 und tatsächlich gilt Au = 9 4 8 11 6 8 8 4 7 2 2 1 = 2 2 1 = u. Das explizite Aufstellen des homogenen linearen Gleichungssystems (λ A)x = 0 ist dabei gar nicht nötig, denn wir schreiben anschließend ja sowieso nur seine Koeffizientenmatrix hin, und diese ist einfach die Matrix λ A, die wir zur Bestimmung der charakteristischen Gleichung bereits berechnet haben, und in ihr können wir den Wert für λ einfach einsetzen. Beispielsweise wird die Rechnung für den Eigenwert λ = 2 zu mit den Lösungen 11 4 8 11 4 8 8 4 5 11 4 8 0 0 0 0 12 11 9 11 11 4 8 0 4 3 0 0 0 y = 3 z, 11x = 4y 8z = 11z = x = z 4 und für z = 4 haben wir den Eigenvektor v = zum Eigenwert λ = 2. Da die Rechnung für λ = 3 nichts neues bringt, notieren wir hier nur als Ergebnis den Eigenvektor 1 w = 1 1 zum Eigenwert λ = 3. In diesem Beispiel haben wir also drei verschiedene Eigenwerte und jeder dieser Eigenwerte hat einen eindimensionalen Eigenraum. Dies repräsentiert in gewisser Weise den Normalfall. Eine zufällig herausgegriffene n n Matrix hat n verschiedene (komplexe) Eigenwerte, die alle einen eindimensionalen Eigenraum haben. Dies ist aber nur der Normalfall und keinesfalls die einzige Möglichkeit. 4 3 4 17-8