11 Normalformen von Matrizen Wir wenden uns in diesem Kapitel noch einmal der Untersuchung linearer Abbildungen auf endlichdimensionalen Vektorräumen und deren Darstellung mittels Matrizen zu Speziell geht es um die Frage, welche Normalformen solche Darstellungsmatrizen unter einer zugelassenen Klasse von Transformationen haben Dabei werden wir immer davon ausgehen, dass der betrachtete Vektorraum V nicht der triviale Nullraum ist Primärdekomposition IndiesemAbschnitt betrachtenwirhäufigeinelineareabbildung f : V V aufeinem Vektorraum V über dem Körper K und ein Polynom p(x) = p 0 +p 1 x+ +p n x n K[x] mit Koeffizienten in K Der Ausdruck p(f) bezeichnet die Einsetzung von f in p, also die lineare Funktion p(f) = p 0 id V +p 1 f + p n f f } {{ } n mal bzw p(f) : V V x p 0 x+p 1 f(x)+ +p n f n (x) Oft schreiben wir die Hintereinanderausführung (Komposition) von Funktionen ohne das Operationssymbol, also statt f p(f) schreiben wir etwa einfach fp(f) Definition 111: Ist f : V V eine lineare Abbildung auf dem Vektorraum V, so heisst der Teilraum W von V f-invariant oder f-stabil, wenn gilt f(w) W Beispiel 11: (a) Für jede lineare Abbildung f : V V sind die Teilräume im(f) und kern(f) f-invariant (b) Sei D : Pol(R) Pol(R) die Differentiationsabbildung auf dem Raum der Polynome mit reellen Koeffizienten Für jedes n ist der Teilraum Pol n (R), also der Raum der Polynome vom Grad kleiner oder gleich n, D-invariant (c) Der eindimensionale Teilraum, welcher von einem nicht-trivialen Vektor x 0 aufgespannt wird, ist f invariant genau dann, wenn x ein Eigenvektor von f ist (d) Ist V ein Vektorraum über dem Körper K, f : V V linear, und p Pol(K) ein Polynom mit Koeffizienten in K, dann ist der Teilraum kern(p(f)) ein f-invarianter Teilraum von V Ist etwa V ein reeller Vektorraum und p(x) = +x, dann ist p(f) = id V +f f y kern(p(f)) bedeutet also y +f(f(y)) = 0 Ist also x kern(p(f)), dann gilt wegen der Linearität von f also f(x) kern(p(f)) 0 = f(x+f(f(x)) ) = f(x)+f(f(f(x))) = p(f)(f(x)), } {{ } =0 Satz 113: Sei V ein Vektorraum über dem Körper K, sei f : V V linear, und sei p(x) K[x] ein Polynom mit Koeffizienten in K Dann sind die Unterräume im(p(f)) und kern(p(f)) beide f-invariant 139
Ist nun etwa V ein n-dimensionaler Vektorraum über K, f : V V linear, und W ein f-invarianter Teilraum von V der Dimension r, dann induziert f eine lineare Abbildung f W : W W w f(w) Sei B W = {w 1,,w r } eine Basis von W und sei B = {w 1,,w } {{ } r,v 1,,v n r } } {{ } W V eine Basis von V Die Darstellungsmatrix von f bzgl der Basis B hat also die Form einer sogenannten Blockmatrix ( ) X Y A(f,B,B) =, 0 Z wobei X die r r Matrix A(f W,B W,B W ) ist, Y Mat r (n r) (K), Z Mat (n r) (n r) (K) Nehmen wir nun weiter an, dass V = V 1 V ist, wobei sowohl V 1 als auch V f- invariante Teilräume von V sind Ist nun B 1 eine Basis für V 1 und B eine Basis für V, dann ist B = B 1 B eine Basis für V Man sieht, dass die Darstellungsmatrix von f bzgl B von der Form ( ) A1 0 A(f,B,B) = 0 A ist, wobei A 1 = A(f V1,B 1,B 1 ), A = A(f V,B,B ) Allgemein, für V = k i=1 V i, wobei V i jeweils f-invariant und B i eine Basis von V i ist, hat die Darstellungsmatrix von f bzgl der Basis B = k i=1 B i die Blockdiagonalform A 1 0 A A(f,B,B) =, 0 A k wobei A i = A(f Vi,B i,b i ) für alle 1 i k Unser Ziel besteht nun darin, für den Vektorraum V eine spezielle Basis B zu finden, bzgl welcher die Darstellungsmatrix von f eine besonders günstige Form hat Ist f linear aufv, so sind alledarstellungsmatrizen A(f,B,B)von f füreine beliebige Basis B ähnlich Ähnliche Matrizen haben dasselbe charakteristische Polynom (vgl Korollar zu Satz 8) Ausserdem haben ähnliche Matrizen dasselbe Minimalpolynom Ist nämlich B = PAP 1 und a(a) = n i=0 a ia i = 0, dann ist auch n n a(b) = a i (PAP 1 ) i = a i PA i P 1 = P ( n a i A i) P 1 = 0 i=0 i=0 140 i=0
Es ist also sinnvoll, vom charakteristischen Polynom bzw Minimalpolynom einer linearen Abbildung f zu sprechen, ohne auf eine bestimmte Basis Bezug zu nehmen Satz 114 (Primärdekomposition): Sei V ein vom Nullraum verschiedener endlichdimensionaler Vektorraum über K und sei f : V V linear Seien das charakteristische Polynom bzw das Minimalpolynom von f (bzw seiner Darstellungsmatrix) von der Gestalt c f = p d 1 1 pd pd k k bzw m f = p e 1 1 pe pe k k, wobei p 1,,p k K[x] irreduzible und paarweise relativ prime Polynome sind (also jeweils keinen gemeinsamen nicht-konstanten Faktor haben) (i) Dann ist jeder der Teilräume V i = kern(p e i i (f)) f-invariant und es gilt V = k i=1 V i (ii) Sei f i : V i V i jeweils die von f auf V i induzierte Abbildung Dann ist p d i i das charakteristische Polynom von f i und p e i i das Minimalpolynom von f i Korollar 1: Für alle 1 i k gilt: dim(v i ) = d i grad(p i ) Korollar : Liegen alle Eigenwerte von f im Körper K, ist also c f = (x λ 1 ) d1 (x λ k ) d k und m f = (x λ 1 ) e1 (x λ k ) e k fürλ 1,,λ k K, dannistv i = kern(f λ i id) e i einf-invarianterteilraumderdimension d i und es gilt V = k i=1 V i Beispiel 115: Wir betrachten die Abbildung f : R 3 R 3 (x,y,z) ( z,x+z,y +z) Bzgl der kanonischen Basis ist die Darstellungsmatrix von f von der Gestalt 0 0 1 A = 1 0 1 0 1 1 Daraus sehen wir durch einfache Rechnung, dass c f = m f = (x+1)(x 1) Wegen Korollar ist also R 3 darstellbar als die direkte Summe R 3 = kern(f +id) kern(f id), wobei der Summand kern(f + id) die Dimension 1 und der Summand kern(f id) die Dimension hat Nun gilt (f +id)(x,y,z) = (x z,x+y +z,y +z), {(1,,1)} ist also eine Basis für kern(f +id) Weiter gilt (f id) (x,y,z) = (x y +z, x+y z,x y +z), 141
{(0,1,1),(1,1,0)} ist also eine Basis für kern(f id) Eine Basis von R 3, bzgl welcher die Darstellungsmatrix von f eine Blockdiagonalform besitzt, ist also B = {(1,,1),(0,1,1),(1,1,0} Die Transformationsmatrix von B zur kanonischen Basis ist 1 0 1 P = 1 1, 1 1 0 und die Blockdiagonalmatrix, welche f bzgl der Basis B darstellt, ist somit 1 P 1 AP = 1 1 0 Beispiel 116: Wir betrachten die Differentialgleichung (D n +a n 1 D n 1 + +a 1 D+a 0 )f = ( d dt )n f +a n 1 ( d dt )n 1 f + +a 1 d dt f +a 0f = 0 mit Koeffizienten a i C Der Lösungsraum aller unendlich oft differenzierbaren Funktionen f sei mit V bezeichnet; V ist ein Vektorraum über C Aus der Theorie der Differentialgleichungen wissen wir, dass die Dimension von V genau n ist Aus der Differentialgleichung extrahieren wir nun das Polynom m(x) = x n +a n 1 x n 1 + +a 1 x+a 0 Über dem algebraisch abgeschlossenen Körper C lässt sich m(x) zerlegen in Linearfaktoren, also für gewisse α i C und natürliche Zahlen e i haben wir m(x) = (x α 1 ) e 1 (x α ) e (x α k ) e k Also ist D : V V eine lineare Abbildung mit Minimalpolynom m(x) Wegen des Korollars ist also der Lösungsraum V die direkte Summe der Lösungsräume V i der Differentialgleichungen (D α i id) e i f = 0 Die Lösungen der Differentialgleichung (D α i id) r f = 0 können aber einfach bestimmt werden Durch Induktion weist man leicht nach, dass gilt (D αid) r f = e αt D r (e αt f) ( ) Die Funktion f ist also eine Lösung genau dann, wenn D r (e αt f) = 0 Das ist der Fall genau dann, wenn e αt f ein Polynom vom Grad höchstens r 1 ist Daher ist {e αt,te αt,,t r 1 e αt } eine Basis für den Lösungsraum von (D α i id) r f = 0 14
Wir betrachten nun noch einen Spezialfall des Primärdekompositionssatzes Wir nehmen an, dass jeder irreduzible Faktor p i von m f linear ist, und jeder Exponent e i = 1; also m f (x) = (x λ 1 ) (x λ k ) für paarweise verschiedene λ i K Wir wissen schon aus früheren Überlegungen, dass f : V V diagonalisierbar ist (also eine Diagonalmatrix als Darstellungsmatrix hat für eine geeignete Basis) genau dann, wenn V eine Basis besitzt, welche aus Eigenvektoren von f besteht Nun können wir die Diagonalisierbarkeit auch mittels der Faktorisierung des Minimalpolynoms charakterisieren Satz 117: Sei V ein vom Nullraum verschiedener endlichdimensionaler Vektorraum, und sei f : V V linear Dann sind die folgenden Aussagen äquivalent: (i) das Minimalpolynom m f von f ist das Produkt verschiedener Linearfaktoren; (ii) f ist diagonalisierbar Beispiel 118: Wir betrachten die lineare Abbildung f : R 3 R 3 (x,y,z) (7x y z, x+7y +z, x+y +10z) Bzgl der kanonischen Basis von R 3 hat f die Darstellungsmatrix 7 1 A = 1 7 10 Durch einfaches Nachrechnen sieht man, dass c f = (x 6) (x 1) und m f = (x 6)(x 1) Somit folgt aus Satz 117, dass f diagonalisierbar ist Beispiel 119: Wir betrachten eine Matrix A bzw die dadurch dargestellte lineare Abbildung auf C : A = ( ) 1, 5 f A : ( C ( C x x A y) y) Das charakteristische Polynom von A bzw der Abbildung f A ist Die Eigenwerte sind also ±i Eigenvektor zu i : c A = c fa = x +1 = (x i)(x+i) ( ) +i, Eigenvektor zu i : 5 ( ) i 5 143
C hat also eine Basis B bestehend aus Eigenvektoren von A, und die Transformationsmatrix von B in die kanonische Basis ist ( ) +i i P =, mit P 1 = 1 ( ) 5i 1+i 5 5 10 5i 1 i Mittels dieser Transformationsmatrizen ist A diagonalisierbar: ( ) i 0 P 1 AP = 0 i Es gibt aber keine Matrix mit rationalen oder reellen Elementen, welche A diagonalisiert Satz 1110: Sei V ein vom Nullraum verschiedener endlichdimensionaler Vektorraum und seien f, g : V V diagonalisierbare lineare Abbildungen Dann sind f und g simultan diagonalisierbar (in dem Sinn, dass es eine Basis von V gibt, welche gleichzeitig aus Eigenvektoren von f und g besteht) genau dann, wenn gilt f g = g f Korollar: Seien A,B Mat n n (K) diagonalisierbar Die Matrizen A und B sind simultan diagonalisierbar (in dem Sinn, dass es eine invertierbare Matrix P gibt, für welche sowohl P 1 AP als auch P 1 BP Diagonalmatrizen sind) genau dann, wenn AB = BA Beispiel: ( 1 1 0 )( ) 1 1 = ( 4 4 ) = ( 1 1 )( ) 1 1 0 Dreiecksgestalt Im Primärdekompositionssatz haben wir gesehen, dass die Darstellungsmatrix einer linearen Abbildung auf einem endlichdimensionalen Vektorraum bzgl einer geeigneten Basis die Form einer Blockdiagonalmatrix hat Zerfällt das Minimalpolynom über dem Grundkörper K in paarweise verschiedene Linearfaktoren, so ist diese Blockdiagonalmatrix eine Diagonalmatrix Was aber passiert im Fall, dass das Minimalpolynom zwar in Linearfaktoren zerfällt, welche aber nicht notwendig verschieden sind; also im Fall m f = k (x λ i ) e i, e i 1? i=1 Diese Situation tritt immer ein, wenn K ein algebraisch abgeschlossenener Körper ist, etwa C Wir zeigen, dass in diesem Fall die Darstellungsmatriz bzgl einer geeigneten Basis obere Dreiecksgestalt hat, also unterhalb der Diagonale nur 0 vorkommt Definition 1111: Ein quadratische Matrix A = (a ij ) Mat n n (K) heisst triangulär bzw in (oberer) Dreiecksgestalt, wenn a ij = 0 für alle i > j Aufgrund von Korollar zu Satz 114 (Primärdekompositionssatz) haben wir in unserer Situation k k V = kern(f λ i id) e i = V i, i=1 i=1 144
wobei die direkten Summanden V i f-invariant sind Wie oben betrachten wir die Restriktion von f auf die Primärkomponente V i, also f i : V i V i Dann ist die e i -te Potenz der Abbildung f i λ i id die Nullabbildung auf V i Dafür führen wir einen neuen Begriff ein Definition 111: Eine lineare Abbildung f : V V heisst nilpotent gdw es ein m N gibt, sodass f m = 0 Ebenso heisst eine quadratische Matrix A nilpotent gdw es ein m N gibt, sodass A m = 0 Für jede Abbildung f Hom K (V,V) gilt f 0 = id V, und für jede Matrix A Mat n n (K) gilt A 0 = I n Ist also V nicht der Nullraum bzw n 0, dann ist f 0 0 und A 0 0 In allen diesen nichttrivialen Fällen bedeutet also nilpotent zu sein, dass eine Potenz f m bzw A m mit m > 0 verschwindet Beispiel 1113: (a) Die lineare Abbildung f(x,y,z) = (0,x,y) auf R 3 ist nilpotent Tatsächlich gilt f 3 (x,y,z) = f (0,x,y) = f(0,0,x) = (0,0,0), also f 3 = 0 (b) Sind alle Eigenwerte der linearen Abbildung f auf C n gleich 0, dann ist c f = x n Der Satz von Cayley-Hamilton besagt dann f n = c f (f) = 0, f ist also nilpotent (c) Die Differentiationsabbildung D auf Pol n (K) ist nilpotent Satz 1114: Sei V ein vom Nullraum verschiedener n-dimensionaler Vektorraum (n N), und sei f Hom(V,V) eine nilpotente lineare Abbildung Dann gibt es eine geordnete Basis B = (b 1,,b n ) von V, sodass f(b 1 ) = 0, f(b ) span({b 1 }), f(b n ) span({b 1,,b n 1 }) Korollar: Ist f nilpotent, dann gibt es eine geordnete Basis von V, bzgl welcher die Darstellungsmatrix von f triangulär ist, und in welcher ausserdem alle Diagonalelemente 0 sind Satz 1115 (Dreiecksgestalt): Sei V ein vom Nullraum verschiedener endlichdimensionaler Vektorraum über dem Körper K Sei f Hom K (V,V) eine lineare Abbildung auf V, deren charakteristisches Polynom und Minimalpolynom die Darstellung k k c f = (x λ i ) d i, m f = (x λ i ) e i i=1 haben, für paarweise verschiedene λ 1,,λ k K und e i d i Dann gibt es eine geordnete Basis von V, bzgl welcher die Darstellungsmatrix M von f triangulär ist Noch genauer gesagt ist die Darstellungsmatrix M eine Blockdiagonalmatrix der Form A 1 A M =, i=1 A k 145
wobei jede Teilmatrix A i eine (d i d i ) obere Dreiecksmatrix ist, in welcher alle Diagonalelemente λ i sind Korollar: Jede quadratische Matrix über C ist ähnlich zu einer Dreiecksmatrix Beispiel 1116: Wie in Beispiel 115 betrachten wir f Hom R (R 3,R 3 ) f : R 3 R 3 (x,y,z) ( z,x+z,y +z) Bzgl der kanonischen Basis ist die Darstellungsmatrix von f von der Gestalt 0 0 1 A = 1 0 1 0 1 1 In Beispiel 115 haben wir schon gesehen R 3 = kern(f +id) kern(f id), wobei der Summand kern(f + id) die Dimension 1 und der Summand kern(f id) die Dimension hat V 1 = kern(f +id) = span((1,,1)) Wir suchen nun eine Basis von V = kern(f id) im Sinne von Satz 1114 b 1 = ( 1,0,1) kern(f id)\{0} Als nächstes suchen wir nun einen Vektor b mit der Eigenschaft (f id)(b ) span(b 1 ), also (f id)(b ) = αb 1 für ein α R Der Vektor b = (0,1,1) erfüllt diese Bedingung Die Darstellungsmatrix von f id bzgl der geordneten Basis (b 1,b ) von V ist ( ) 0 1 0 0 Die Darstellungsmatrix der Abbildung f, welche von f induziert wird auf V ist also ( ) 1 1 0 1 Somit ist also die Darstellungsmatrix von f bzgl der geordneten Basis die Dreieckmatrix B = ((1,,1),( 1,0,1),(0,1,1)) 1 0 0 0 1 1 0 0 1 Satz 1117 (Jordan-Dekomposition): Sei V ein vom Nullraum verschiedener endlichdimensionaler Vektorraum über dem Körper K, und sei f Hom K (V,V) eine lineare Abbildung auf V, welche alle ihre Eigenwerte in K hat (also c f zerfällt über K vollständig in Linearfaktoren) Dann gibt es lineare Abbildungen g,h Hom K (V,V), sodass 146
f = g +h, g ist diagonalisierbar, h ist nilpotent, und g h = h g Alternativ könnte man den Beweis zu Satz 1117 auch über die Darstellungsmatrix von f führen, die ja laut Satz 1115 Dreiecksgestalt besitzt Vergleiche dazu Beispiel 1118 Mankann auch zeigen, dass die Abbildungen g und h in Satz1117 eindeutig bestimmt sind Beispiel 1118: In Beispiel 1116 haben wir gesehen, dass bzgl der Basis die lineare Abbildung die Darstellungsmatrix B = ((1,,1),( 1,0,1),(0,1,1)) f : R 3 R 3 (x,y,z) ( z,x+z,y +z) 1 0 0 T = 0 1 1 0 0 1 besitzt Offensichtlich können wir T darstellen als R+S für 1 0 0 0 0 0 R = 0 1 0 und S = 0 0 1 0 0 1 0 0 0 Das ist die Jordan-Dekomposition von T Mittels der Transformationsmatrix 1 1 0 P = 0 1 1 1 1 führen wir die Betrachtung zurück auf die kanonische Basis Wir erhalten die Darstellungsmatrizen PRP 1 = 1 1 1 1 0 und PSP 1 = 1 1 1 1 0 0 0 1 1 1 1 1 1 Der Diagonalanteil von f ist also g(x,y,z) = 1 (x+y z,x+z, x+y +z), 147
und der nilpotente Anteil von f ist h(x,y,z) = 1 ( x y z,0,x+y +z) Jordan-Normalform Um die Darstellung als Dreiecksmatrix noch zu verbessern, müssen wir uns fragen, ob wir noch bessere Basen finden können für die direkten Summanden im Primärdekompositionssatz Wie am Beginn des Kapitels vereinbart, ist V {0} Definition 1119: Für eine nilpotente lineare Abbildung f Hom K (V,V) ist der Index die kleinste positive ganze Zahl k mit f k = 0 Lemma 110: Sei f Hom K (V,V) nilpotent mit Index p Dann ist (i) {0} = kernf 0 kernf kernf p 1 kernf p = V eine Kette echt ineinander enthaltener Teilräume von V; (ii) {x,f(x),,f p 1 (x)} eine linear unabhängige Teilmenge von V, für jedes x V \ kernf p 1 Satz 111: Sei V ein endlichdimensionaler Vektorraum über K undsei f Hom K (V,V) so, dass kernf i kernf i+1 für ein i 1 Ist {v 1,,v s } eine Basis von kernf i und ist {v 1,,v s,w 1,,w t } eine Basis von kernf i+1, dannist S = {f(w 1 ),,f(w t )}einelinear unabhängigeteilmenge vonkernf i Definition 11: Sei λ K, und sei n eine positive natürliche Zahl Eine elementare Jordan-Matrix 1 zum Eigenwert λ ist eine (quadratische) n n Matrix J = (j kl ), in welcher j kk = λ für alle 1 k n, j k,k+1 = 1 für alle 1 k < n, und alle anderen Elemente 0 sind Also λ 1 0 0 0 0 λ 1 0 0 0 0 λ 0 0 J = 0 0 0 λ 1 0 0 0 0 λ Eine Jordan-Blockmatrix zum Eigenwert λ ist eine Blockmatrix der Form J 1 J, J k wobei k 1 und jeder Block eine elementare Jordan-Matrix zum Eigenwert λ ist Alle anderen Elemente sind 0 Satz 113: Sei V ein vom Nullraum verschiedener endlichdimensionaler Vektorraum über dem Körper K 1 Marie Ennemond Camille Jordan, 1838 19 148
(i) Istf Hom K (V,V)nilpotent, danngibteseinegeordnetebasisvonv bzgl welcher die Darstellungsmatrix von f eine Jordan-Blockmatrix zum Eigenwert 0 ist; (ii) ist f Hom K (V,V) so, dass alle Eigenwerte von f in K sind (also c f (x) = (x λ 1 ) d1 (x λ k ) d k für λ1,,λ k K), dann gibt es eine geordnete Basis von V bzgl welcher die Darstellungsmatrix von f eine Blockdiagonalmatrix J 1 J J k ist, in welcher jedes J i eine Jordan-Blockmatrix zum Eigenwert λ i ist Definition 114: Sei f Hom K (V,V) so, dass alle Eigenwerte von f in K liegen Dann heisst eine Matrix von der Form wie in Satz 113(ii) eine Jordan-Matrix von f Sei A Mat n n (K) so, dass alle Eigenwerte von A in K liegen Dann ist die (eine) Jordan-Normalform von A die (eine) Jordan-Matrix einer (jeder) linearen Abbildung, welche A als Darstellungsmatrix (bzgl einer Basis) hat Bemerkung 115: Eine Jordan-Matrix zu einer Abbildung f ist (wenn überhaupt) nicht eindeutig definiert Insbesondere ist die Ordnung der Jordanblöcke nicht festgelegt Wohl aber ist die Anzahl der Blöcke, ihre Grösse, und die Anzahl der elementaren Jordanmatrizen in diesen Blöcken festgelegt Um einer Eindeutigkeit näher zu kommen, könnte man etwa die Blöcke absteigend nach Grösse anordnen Über dem Grundkörper R könnte man auch noch die Eigenwerte ordnen, und somit Eindeutigkeit herstellen Zusammenfassend lässt sich folgendes feststellen: Satz 116: Hat die lineare Abbildung f : V V bzw eine Darstellungsmatrix A von f (bzgl einer Basis) das charakteristische Polynom und das Minimalpolynom c(x) = (x λ 1 ) d1 (x λ k ) d k m(x) = (x λ 1 ) e1 (x λ k ) e k, dann hat die Jordan-Matrix von f bzw die Jordan-Normalform von A folgende Gestalt: der Eigenwert λ i kommt d i mal in der Diagonale vor (also so oft wie die algebraische Vielfachheit von λ i ), die Anzahl der elementaren Jordan-Matrizen zu λ i ist dimkern(f i λ i id) (also die geometrische Vielfachheit von λ i ), und zumindest eine dieser elementaren Jordan-Matrizenhatdie Grösseindex(f i λ i id) index(f i λ i id) Beispiel 117: Wir betrachten die nilpotente Abbildung f : R 4 R 4 (x,y,z,w) (0,x,w,0) 149
Der Index von f ist Mit der Notation aus dem Beweis von Satz 113 haben wir also W 1 = kernf = {(0,y,z,0) y,z R}, W = kernf = R 4 Als Basen für diese Teilräume haben wir etwa B 1 = {(0,1,0,0),(0,0,1,0)}, B = B 1 C = {(0,1,0,0),(0,0,1,0)} {(1,0,0,0),(0,0,0,1)} Das Bild von C unter f ist B 1, und somit erhalten wir (wie im Beweis von Satz 113 die Anordnung (1,0,0,0), (0,0,0,1), (0,1,0,0), (0,0,1,0) Zählen wir also nun diese Elemente spaltenweise von unten her auf, so erhalten wir die geordnete Basis B = ((0,1,0,0),(1,0,0,0),(0,0,1,0),(0,0,0,1)) Die Darstellungsmatrix von f bzgl B ist 0 1 0 0 0 1 0 0 Das ist die Darstellung von f mittels einer Jordan Blockmatrix Beispiel 118: Die Matrix A = 1 3 0 7 4 0 9 5 hat das charakteristische Polynom bzw das Minimalpolynom c A (x) = (x 1) 3 bzw m A (x) = (x 1) Aufgrund von Satz 116 ist somit 1 1 1 1 die Jordan-Normalform von A Im Computeralgebrasystem Maple berechnet man die Jordan-Normalform der Matrix A wie folgt: > with(linearalgebra): > JordanForm(A); Maple kann möglicherweise eine andere Reihenfolge der elementaren Jordan-Blöcke erzeugen 150
Beispiel 119: Die Matrix A = hat das charakteristische Polynom 1 1 1 0 0 0 0 0 0 0 1 0 0 0 0 1 1 0 1 1 1 0 Der Eigenraum zum Eigenwert 1 ist c A (x) = (x 1) 3 (x ) E 1 = {(0,0,x, x,0) T x R}, also die geometrische Vielfachheit des Eigenwertes 1 ist 1 Der Eigenraum zum Eigenwert ist E = {(x,y, y,0,0) T x,y R}, also die geometrische Vielfachheit des Eigenwertes ist Somit kommt in der Jordan-Normalform von A der Eigenwert 1 dreimal in der Diagonale vor mit nur einer zugehörigen elementaren Jordan-Matrix; der Eigenwert kommt zweimal in der Diagonale vor mit zugehörigen elementaren Jordan-Matrizen Also ist die Jordon-Normalform von A 1 1 1 1 1 Beispiel 1130: (i) Wir betrachten die lineare Abbildung f : R 7 R 7 mit c f (x) = (x 1) 3 (x ) 4 und m f (x) = (x 1) (x ) 3 Für jede Jordan-Matrix von f gilt also: der Eigenwert 1 kommt dreimal in der Diagonale vor, und es gibt Blöcke zum Eigenwert 1, der Eigenwert kommt viermal in der Diagonale vor, und es gibt 3 Blöcke zum Eigenwert Bis auf mögliche Umordnungen der Jordan-Blöcke ist also 1 1 1 1 1 151
die Jordan-Matrix von f (ii) Seien f und c f wie in (i), aber m f (x) = (x 1) (x ) Dann kommt der Eigenwert viermal in der Diagonale der Jordon-Normalform vor, und es gibt Blöcke zum Eigenwert Abhängig von der konkreten Gestalt von f sind also 1 1 1 1 1 1 1 1 1 1 und die möglichen Formen der Jordan-Normalform 1 1 Definition 1131: Sei f Hom K (V,V) so, dass alle Eigenwerte in K liegen Eine geordnete Basis von V, bzgl welcher die Darstellungsmatrix von f eine Jordan-Matrix ist, heisst eine zu f gehörige Jordan-Basis Algorithmus 113: (Berechnung einer Jordan-Basis) (i) Zu einer gegebenen elementaren Jordan-Matrix der Grösse m m λ 1 λ 1 J = λ 1 λ erfüllen die Elemente einer Jordan-Basis B = (b 1,,b m ) folgende Bedingungen: f(b 1 ) = λb 1, f(b ) = λb +b 1, f(b 3 ) = λb 3 +b, f(b m 1 ) = λb m 1 +b m, f(b m ) = λb m +b m 1 Die Elemente einer Jordan-Basis müssen also natürlich linear unabhängig sein und es muss gelten (i) b 1 kern(f λid), und (ii) (f λid)(b i ) = b i 1 für alle i =,,m Solche Basiselemente müssen also existieren (sonst könnte J nicht die Jordan-Matrix von f sein) und können bestimmt werden als die Lösungen des linearen Gleichungssystems 15
(i), (ii) (ii) Für eine allgemeine Jordan-Matrix wendet man obiges Verfahren an auf jede einzelne elementare Jordan-Matrix und fügt schliesslich die so gewonnenen Basen zu einer geordneten Basis des ganzen Raumes zusammen Beispiel 1133: Wir betrachten die lineare Abbildung f : R 3 R 3 (x,y,z) (x+y, x+3y, x+y +z) Bzgl der kanonischen Basis ist A = 1 1 0 1 3 0 1 1 die Darstellungsmatrix von f Das charakteristische Polynom und das Minimalpolynom sind c f (x) = (x ) 3 und m f (x) = (x ) Also ist die Jordan-Normalform Die relevante Abbildung ist also J = 1 (f id)(x,y,z) = ( x+y, x+y, x+y) Wir wählen das erste Element der Jordan-Basis so, dass b 1 kern(f id), also etwa b 1 = (1,1,1) Wir wählen b so, dass es unabhängig ist von b 1 und (f id)(b ) = b 1 Für b = (u,v,w) muss also gelten u+v = 1 Der Vektor b = (1,,1) ist eine mögliche Wahl Schliesslich wählen wir b 3 so, dass es unabhängig ist von b 1 und b und b 3 kern(f id) Offensichtlich erfüllt b 3 = (1,1,0) diese Bedingung Somit ist B = ((1,1,1),(1,,1),(1,1,0)) eine Jordan-Basis zu f Die Basistransformationsmatrix von B zur kanonischen Basis ist 1 1 1 P = 1 1 1 1 0 153
Damit lässt sich die Matrix A in die Jordan-Matrix J ähnlichkeitstransformieren: P 1 AP = J Beispiel 1134: Bzgl der kanonischen Basis {1,x,x,x 3,x 4 } von R 4 [x] (Polynome mit reellen Koeffizienten vom Grad 4) hat die Differentiationsabbildung D die Darstellungsmatrix 0 1 0 0 0 0 0 0 0 A = 0 0 0 3 0 0 0 0 0 4 0 0 0 0 0 Das charakteristische Polynom ist x 5, der einzige Eigenwert ist 0, und der Eigenraum zum Eigenwert 0 wird aufgespannt von {1} Daher hat die Jordan-Matrix von D die Gestalt 0 1 0 0 0 0 0 1 0 0 J = 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 Für eine Jordan-Basis (p 1,,p 5 ) muss also gelten Jordan-Basen zu D sind also Dp 1 = 0 und Dp i = p i 1 für i =,,5 (1,x, 1 x, 1 6 x3, 1 4 x4 ) oder (4,4x,1x,4x 3,x 4 ) Satz 1135: Jede quadratische Matrix A über C ist ähnlich zu ihrer Transponierten A T Beispiel 1136: Wir demonstrieren die Nützlichkeit der Jordan-Normalform etwa bei der Lösung von Systemen linearer Differentialgleichungen In Beispiel 8 haben wir bereits ein System linearer gewöhnlicher Differentialgleichungen mit konstanten Koeffizienten betrachtet Dabei handelt es sich um ein System von Gleichungen der Form x 1 = a 11 x 1 + a 1 x + + a 1n x n x = a 1 x 1 + a x + + a n x n x n = a n1 x 1 + a n x + + a nn x n, wobei a ij K, K = R oder C, und die gesuchten Lösungen x 1,,x n differenzierbare Funktionen in t über dem Körper K sind, also x i C K (t) In Matrixnotation können wir dieses Gleichungssystem schreiben als (1) X = AX, 154
wobei X = (x 1,,x n ) T und A = (a ij ) Wir nehmen an, dass A alle Eigenwerte in K hat, und ähnlich ist zur Jordan-Normalform J A Sei P die zugehörige Transformationsmatrix, also Setzen wir Y := P 1 X, so erhalten wir und somit P 1 AP = J A () PY = (PY) = X = AX = APY, (3) Y = P 1 X = P 1 APY = J A Y Die Form von J A bedeutet im allgemeinen, dass (3) deutlich einfacher zu lösen ist als (1) Die Lösungen Y von (3) können überdies mittels X = PY in Lösungen von (1) transformiert werden Wir führen diesen Ansatz für das System durch Also für schreiben wir das Gleichungssystem als Durch einfache Rechnung sehen wir x 1 = x 1 + x x = x 1 + 3x x 3 = x 1 + 4x x 3 x 1 1 1 0 X = x, A = 1 3 0 x 3 1 4 1 X = AX c A (x) = (x+1)(x ) = m A (x) Die geometrische Vielfachheit beider Eigenwerte ist 1 Die Jordan-Normalform von A ist also 1 J A = 1 Wir bestimmen nun eine Jordan-Basis (p 1,p,p 3 ) zur von A definierten linearen Abbildung; die Elemente dieser Basis werden später die Spalten der Transformationsmatrix P sein Die Vektoren p 1,p,p 3 müssen linear unabhängig sein und die Bedingungen (A+I 3 )p 1 = 0, (A I 3 )p = 0, (A I 3 )p 3 = p erfüllen Geeignete Vektoren sind etwa 0 1 1 p 1 = 0, p = 1, p 3 = 0 1 1 0 155
Also ist P = 0 1 1 0 1 0 1 1 0 die Transformationsmatrix von A in die Jordan-Normalform: P 1 AP = J A Anstatt des ursprünglichen Systems betrachten wir nun das System also Y = J A Y, y 1 = y 1, y = y + y 3, y 3 = y 3 Die erste und die dritte Gleichung ergeben offensichtlich Die zweite Gleichung lautet somit und besitzt die Lösung y 1 (t) = α 1 e t und y 3 (t) = α 3 e t y = y +α 3 e t, y (t) = α e t +α 3 te t Für den Lösungsvektor Y ergibt sich also α 1 e t Y = α e t +α 3 te t α 3 e t Schliesslich erhalten wir daraus den allgemeinen Lösungsvektor α e t +α 3 (t 1)e t X = PY = α e t +α 3 te t α 1 e t +α e t +α 3 te t für das ursprüngliche Gleichungssystem 156