Mehrdimensionale Analysis

Ähnliche Dokumente
i j m f(y )h i h j h m

(a), für i = 1,..., n.

Übungen zur Ingenieur-Mathematik III WS 2012/13 Blatt

Extrema multivariater Funktionen

Rückblick auf die letzte Vorlesung. Bemerkung

Analysis 2, Woche 9. Mehrdimensionale Differentialrechnung I. 9.1 Differenzierbarkeit

1 Umkehrfunktionen und implizite Funktionen

8 Extremwerte reellwertiger Funktionen

5.10. Mehrdimensionale Extrema und Sattelpunkte

3. Approximation von Funktionen und Extremwertprobleme im R n

Thema14 Der Satz über inverse Funktionen und der Satz über implizite Funktionen

Mehrdimensionale Differentialrechnung Übersicht

2 Funktionen in mehreren Variablen: Differentiation

M U = {x U f 1 =... = f n k (x) = 0}, (1)

Extremwerte von Funktionen mehrerer reeller Variabler

Analysis II 14. Übungsblatt

Musterlösung zu den Übungen zur Vorlesung Mathematik für Physiker II. x 2

Anwendungen der Differentialrechnung

Teil 6. Differentialrechnung mehrerer Veränderlicher

Lösungsvorschlag zur Nachklausur zur Analysis

AM3: Differenzial- und Integralrechnung im R n. 1 Begriffe. 2 Norm, Konvergenz und Stetigkeit. x 1. x 2. f : x n. aus Platzgründen schreibt man:

4.5 Lokale Extrema und die Hessesche Form

3. Mai Zusammenfassung. g x. x i (x).

Folgerungen aus dem Auflösungsatz

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 89

f(x) f(x 0 ) lokales Maximum x U : gilt, so heißt x 0 isoliertes lokales Minimum lokales Minimum Ferner nennen wir x 0 Extremum.

4.4 Lokale Extrema und die Hessesche Form

Scheinklausur Analysis 2 Ss Juli 2008

1.6 Implizite Funktionen

Probeklausur zur Analysis 2, SoSe 2017

Vorlesung Mathematik für Ingenieure II (Sommersemester 2008)

TECHNISCHE UNIVERSITÄT MÜNCHEN

Vorlesung Mathematik für Ingenieure 2 (Sommersemester 2009)

Extremalprobleme mit Nebenbedingungen

Analysis II. Vorlesung 52. Diffeomorphismen

Prof. Dr. H. Brenner Osnabrück SS Analysis II. Vorlesung 50. Hinreichende Kriterien für lokale Extrema

Topologie und Differentialrechnung mehrerer Veränderlicher, SS 2009 Modulprüfung/Abschlussklausur. Aufgabe Punkte

Wenn man den Kreis mit Radius 1 um (0, 0) beschreiben möchte, dann ist. (x, y) ; x 2 + y 2 = 1 }

Thema 12 Differentialrechnung, Partielle Ableitungen, Differenzierbarkeit, Taylor-Formel, Lokale Extrema

Karlsruher Institut für Technologie (KIT) SS 2013 Institut für Analysis Prof. Dr. Tobias Lamm Dr. Patrick Breuning

MATHEMATIK 2 FÜR DIE STUDIENGÄNGE CHE- MIE UND LEBENSMITTELCHEMIE

(x, x + y 2, x y 2 + z 3. = e x sin y. sin y. Nach dem Umkehrsatz besitzt f dann genau auf der Menge

Nachklausur zur Analysis 2, SoSe 2017

Klausur zu Analysis II - Lösungen

40 Lokale Extrema und Taylor-Formel

9 Höhere partielle Ableitungen und die Taylorformel

Technische Universität München Zentrum Mathematik. Übungsblatt 12

Analysis II. Vorlesung 47

Implizite Funktionen, der Umkehrsatz und Extrema unter Nebenbedingungen

0.1 Hauptsatz über implizite Funktionen

Konvexe Menge. Eine Menge D R n heißt konvex, wenn für zwei beliebige Punkte x, y D auch die Verbindungsstrecke dieser Punkte in D liegt, d.h.

10 Ableitungen höherer Ordnung

Mathematik II für Studierende der Informatik. Wirtschaftsinformatik (Analysis und lineare Algebra) im Sommersemester 2016

Analysis II 13. Übungsblatt

Mathematische Grundlagen für die Vorlesung. Differentialgeometrie

TECHNISCHE UNIVERSITÄT MÜNCHEN

10 Der Satz über implizite Funktionen und Umkehrfunktionen

Musterlösung zu Blatt 1

Mathematik für Anwender II

Analysis II. 8. Klausur mit Lösungen

H.J. Oberle Analysis III WS 2012/ Differentiation

1 Partielle Differentiation

Lösungen zu den Hausaufgaben zur Analysis II

UNIVERSITÄT KARLSRUHE Institut für Analysis HDoz. Dr. P. C. Kunstmann Dipl.-Math. M. Uhl. Sommersemester 2009

10 Untermannigfaltigkeiten

53 Der Satz über implizite Funktionen

Implizite Funktionen. Ist für eine stetig differenzierbare Funktion f : R n R m R n. so lässt sich das Gleichungssystem

1 Übungsaufgaben zu Kapitel 1

Karlsruher Institut für Technologie Institut für Analysis Dr. Andreas Müller-Rettkowski Dr. Vu Hoang. Sommersemester

Elemente der Analysis II

Musterlösung. Aufgabe 1 a) Die Aussage ist falsch. Ein Gegenbeispiel ist die Funktion f : [0, 1] R, die folgendermaßen definiert ist:

7.11. Extrema unter Nebenbedingungen

Analysis II. Aufgaben zum Stoff der Analysis I und II Lösungsvorschlag

Wiederholung von Linearer Algebra und Differentialrechnung im R n

Integraldarstellung des Restgliedes; Lagrangesche Restgliedformel;

f(x, y) = 0 Anschaulich bedeutet das, dass der im Rechteck I J = {(x, y) x I, y J}

4.7 Der Taylorsche Satz

2 Extrema unter Nebenbedingungen

Musterlösung Klausur zu Analysis II. Verständnisteil

Serie 3. z = f(x, y) = 9 (x 2) 2 (y 3) 2 z 2 = 9 (x 2) 2 (y 3) 2, z 0 9 = (x 2) 2 + (y 3) 2 + z 2, z 0.

Übungen zur Ingenieur-Mathematik III WS 2011/12 Blatt Aufgabe 25: Berechnen Sie den kritischen Punkt der Funktion

Wirtschaftsmathematik: Formelsammlung (V1.40)

MIA Analysis einer reellen Veränderlichen WS 06/07. Kapitel VI. Differenzierbare Funktionen in einer Veränderlichen

18.2 Implizit definierte Funktionen

Höhere Mathematik II für die Fachrichtung Physik Lösungsvorschläge zum 8. Übungsblatt. ). 12x 3 Die Hessematrix von f ist gegeben durch H f (x, y) =

Nachklausur Analysis 2

Mathematik II. Vorlesung 46. Der Gradient

Lineare Algebra und analytische Geometrie II

Klausur HM II/III F 2003 HM II/III : 1

Übungen zu Grundlagen der Mathematik 2 Lösungen Blatt 12 SS 14. Aufgabe 44. Bestimmen Sie die Taylor-Polynome der Funktion.

Umkehrfunktion. g (y) = f (x) 1, x = g(y), Umkehrfunktion 1-1

B Lösungen. Aufgabe 1 (Begriffe zur Differenziation) Sei (x, y) R 2 Berechnen Sie zur Abbildung. f(x, y) := x sin(xy) f : R 2 R,

Vorlesung Einführung in die Mathematische Optimierung (Wintersemester 2013/14)

Vorlesung Einführung in die Mathematische Optimierung (Wintersemester 2013/14)

Höhere Mathematik für Physiker II

Institut für Analysis WiSe 2018/2019 Prof. Dr. Dirk Hundertmark Dr. Markus Lange. Analysis 1. Aufgabenzettel 14

Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth

1 Eingebettete Untermannigfaltigkeiten des R d

3.2 Implizite Funktionen

Transkript:

19 Mehrdimensionale Analysis Als Erstes untersuchen wir skalare Funktionen auf dem R n auf das Vorliegen von Extremalstellen. Der Satz von Fermat gilt auch hier, und eine Betrachtung der zweiten Ableitung in Form der Hessematrix ergibt hinreichende Bedingungen für das Vorliegen von Maxima und Minima. Daran schließt eine kurze Diskussion konvexer Funktionen an. Als Zweites formulieren wir den lokalen Umkehrsatz für Abbildungen des R n in sich. Wir beweisen ihn recht ausführlich zuerst innerhalb der Kategorie der lipschitzstetigen Abbildungen. Höhere Regularität betrachten wir erst danach und bereitet keine neuen Probleme. Eine unmittelbare Folge des Umkehrsatzes ist der fundamentale Satz über implizite Funktionen. Er bildet die Grundlage für die Definition gleichungsdefinierter Mannigfaltigkeiten, und daran anknüpfend die Diskussion von Extrema mit Nebenbedingungen und der Methode der Lagrangemultiplikatoren. 19-a Die Taylorsche Formel Die Formel von Taylor in höheren Dimensionen ist eine direkte Folge der klassischen Formel in einer Dimension. Ist die Strecke [a, a + h] im Definitionsbereich von f enthalten, so können wir die Funktion t f (a + th), 0 t 1, um t = 0 entwickeln und bei t = 1 auswerten, um f (a + h) darzustellen entsprechende Differenzierbarkeit von f vorausgesetzt. Dabei treten die höheren Richtungsableitungen k h f (a) k t f (a + th) t=0 (c)-machobs: 19.1

392 19 Mehrdimensionale Analysis Abb 1 Verbinddungsstrecke [a, a + h] Ω a + h a auf, die wir anschließend durch die partiellen Ableitungen von f der Ordnung k darstellen werden. 1 Satz von Taylor in höheren Dimensionen Sei f : V W eine Abbildung der Klasse C r +1. Gehört [a, a + h] zum Definitionsbereich von f, so gilt f (a + h) = T r a f (h) + Rr a f (h) mit dem r -ten Taylorpolynom T r a f (h) r k=0 1 k! k h f (a) an der Stelle a und dem zugehörigen Restglied R r a f (h) = 1 r! 1 0 (1 t) r r +1 h f (a + th) dt. Nach Voraussetzung ist ϕ : t f (a + th) für 0 t 1 wohldefiniert und aufgrund der Kettenregel 18.17 eine C r +1 -Kurve in W. Für diese gilt ϕ(1) = r k=0 ϕ (k) (0) k! + 1 r! 1 (1 t) r ϕ (r +1) (t) dt. 0 aufgrund der klassischen Taylorformel mit dem Restglied in Integralform. Mit und allgemeiner ϕ (t) = h f (a + th) ϕ (k) (t) = k hf (a + th), 0 k r + 1, folgt hieraus die Behauptung. Bemerkungen a. Diese Formulierung des Satzes von Taylor ist koordinatenunabhängig, denn sie benötigt lediglich die Richtungsableitung h. b. Im eindimensionalen Fall n = 1 ist k h f (a + th) = f (k) (a + th)h k. Wir erhalten damit wieder die klassische Taylorformel 8.22. 19.2 (c)-machobs:16.10.2017~11:42

Die Taylorsche Formel 19-a 393 Multiindex-Notation Es bleibt die Frage, wie die Richtungsableitungen k hf durch die partiellen Ableitungen von f dargestellt werden. Hierfür hat sich die Multiindex-Notation bewährt. Ein Multiindex α ist ein n-tupel mit ganzzahligen, nichtnegativen Komponenten, also α = (α 1,.., α n ) N n 0. Potenzen von x = (x 1,.., x n ) R n mit α = (α 1,.., α n ) sind definiert als x α x α1 1.. xαn n = n i=1 x α i i. Entsprechend erklärt man die Ableitungsoperatoren α α1 1.. αn n = n i=1 α i i, wobei vereinbarungsgemäß 0 i = id. Es ist also α f = α1 1.. αn n f = α1+..+αn x α1 1.. xαn n Es wird α 1 -mal nach x 1, α 2 -mal nach x 2,.., α n -mal nach x n differenziert. Ist α i = 0, so wird nicht nach x i differenziert. Für hinreichend oft differenzierbares f kommt es wegen des Lemmas von Schwarz 18.28 auf die Reihenfolge der partiellen Ableitungen nicht an, nur auf die jeweilige Anzahl. Genau diese Informationen beinhaltet der Multiindex. Schließlich setzt man noch α! α 1!.. α n! und α = α 1 +.. + α n, genannt die Länge von α. Da alle Komponenten von α nichtnegativ sind, kann man auf Beträge verzichten. a. Für f C (R 3 ) mit f (x, y, z) = e x y 4 sin z ist (4,3,2) f = 24e x y sin z. b. Für f C 4 (R 3 ) ist f. 1 (3, 1, 0)! (3,1,0) f = 1 6 f xxxy, 1 (1, 0, 2)! (1,0,2) f = 1 2 f xzz. Wir benötigen noch folgende Verallgemeinerung der binomischen Formel. (c)-machobs:16.10.2017~11:42 19.3

394 19 Mehrdimensionale Analysis 2 Lemma Für m 1 und λ = (λ 1,.., λ n ) gilt (λ 1 +.. + λ n ) m = n i 1,..,i m=1 = α =m λ i1 λ im m! α 1! α n! λα1 1 λαn n = m! α! λα. α =m Die erste Identität drückt aus, dass wir (λ 1 +.. + λ n ) m erhalten, indem wir sämtliche Produkte aus m Faktoren aus den Elementen λ 1,.., λ n bilden und diese aufsummieren. Dies beweist man durch Induktion. Die zweite Identität folgt hieraus durch kombinatorische Überlegungen. Die Anzahl aller im ersten Schritt gebildeten Produkte, die wegen der Kommutativität der Multiplikation gleich dem Produkt λ α1 1.. λαn n m! α 1!.. α n!. sind, ist Denn einerseits müssen wir alle Permutation der m Faktoren zählen deren Anzahl ist m!. Andererseits dürfen wir nicht die Permutationen der identischen Faktoren untereinander zählen deren Anzahl ist α 1!.. α n!. Dies ergibt die zweite Identität. Die dritte Identität verwendet lediglich die Multiindex-Notation. Beispiel Für n = 2 ist dies die klassische binomische Formel. Denn mit α = α 1 + α 2 = m ist α 2 = m α 1. Schreiben wir k für α 1, so folgt (λ 1 + λ 2 ) m = α =m m! α! λα = m k=0 m! k!(m k)! λk 1 λm k 2. 3 Korollar Ist das Lemma von Schwarz anwendbar, so gilt im Standardfall 1 m! m h = α =m 1 α! hα α, m 0. Für m = 0 ergeben beide Seiten vereinbarungsgemäß die Identität, und es nichts zu zeigen. Für m = 1 ist h = h1e 1+..+h ne n = h 1 1 +.. + h n n = α =1 h α α, da alle Multiindizes der Länge 1 von der Form (.., 0, 1, 0,..) sind. Die Behauptung gilt hier also ebenfalls. Und können wir mithilfe des Lemmas von Schwarz sämtliche Ableitungen nach e 1,.., e n und Multiplikationen mit h 1,.., h n vertauschen, so gilt aufgrund des letzten Lemmas 2 19.4 (c)-machobs:

Die Taylorsche Formel 19-a 395 1 m! m h = 1 m! (h 1 1 +.. + h n n ) m = 1 α! (h 1 1 ) α1 (h n n ) αn α =m = α =m 1 α! hα1 1 hαn n α1 1 αn n = 1 α! hα α. α =m 4 Satz von Taylor in Multiindex-Notation Sei f : R n R m eine Abbildung der Klasse C r +1. Gehört [a, a + h] zum Definitionsbereich von f, so gilt mit f (a + h) = R r a α r f (h) = (r + 1) 1 α! α f (a)h α + R r a f (h) α =r +1 h α 1 (1 t) r α f (a + th) dt. α! 0 Im Fall m = 1 also im Fall einer skalaren Funktion existiert außerdem ein ξ [a, a + h], so dass R r af (h) = α =r +1 1 α! α f (ξ)h α. Mit dem Satz von Taylor 1 und der binomischen Formel 2 ist R r af (h) = 1 r! 1 (1 t) r 0 α =r +1 (r + 1)! h α α f (a + th) dt α! 1 = (r + 1) (1 t) r h α 0 α! α f (a + th) dt. (1) α =r +1 Ziehen wir alle t-unabhängigen Terme vor das Integral, so erhalten wir die erste Restgliedformel. Für eine skalare Funktion besteht der Integrand in (1) aus dem Produkt einer Linearkombination stetiger skalarer Ableitungen von f mit der auf [0, 1] nichtnegativen Funktion (1 t) r. Hierauf können wir den Mittelwertsatz der Integralrechnung 11.7 anwenden. Berücksichtigen wir noch 1 (1 t) r dt = 1 0 r + 1, so erhalten wir R r a f (h) = α =r +1 = α =r +1 h α 1 α! α f (a + θh) (r + 1) (1 t) r dt 0 1 α! α f (ξ)h α (c)-machobs: 19.5

396 19 Mehrdimensionale Analysis mit einem θ [0, 1] und ξ = a + θh [a, a + h]. Dies ist die zweite Restgliedformel. Beispiel Wir bestimmen das qudratische Taylorpolynom von f : R 3 R mit f (x, y, z) = xy 2 sin z an der Stelle a = (1, 2, 0). Die relevanten partiellen Ableitungen sind sowie f x = y 2 sin z, f y = 2xy sin z, f z = xy 2 cos z f xx = 0, f yy = 2x sin z, f zz = xy 2 sin z, f xy = 2y sin z, f yz = 2xy cos z, f zx = y 2 cos z. Die meisten partiellen Ableitungen wie auch die Funktion selbst verschwinden bei a mit Ausnahme von f z (a) = 4, f xz (a) = 4, f yz (a) = 4. Die zugehörigen Koeffizienten sind sämtlich 1. Somit erhalten wir Ta 2 f = 4z + 4(x 1)z + 4(y 2)z = 4(1 + x 1 + y 2)z = 4(x + y 2)z. Wir benötigen die Taylorformel vor allem bis zum quadratischen Restglied für skalare Funktionen auf dem Standardraum R n. Hierbei spielt die Hessematrix eine zentrale Rolle. Definition Für eine C 2 -Funktion f : R n R heißt Hf (a) ( f xk x l (a) ) 1 k,l n die Hessematrix oder Hessische von f an der Stelle a. Wegen des Satzes von Schwarz ist die Hessische einer C 2 -Funktion immer eine symmetrische Matrix. Beispiele a. Für eine quadratische Form f : R n R, f (x) = 1 2 Ax, x = 1 2 n a kl x k x l k,l=1 mit einer symmetrischen Matrix A = (a kl ) und dem Standardskalarprodukt ist f xk x l = a kl, 1 k, l n. 19.6 (c)-machobs:

Die Taylorsche Formel 19-a 397 Also ist Hf = A. Für nicht-symmetrisches A ist allgemeiner f xk x l = a kl + a lk, 1 k, l n, 2 und damit Hf = (A + A )/2. 5 Notiz Es ist 2 vf (a) = Hf (a)v, v. Denn 2 vf (a) = 2 t f (a + tv) t=0 = t ( und Letzteres ist gleich Hf (a)v v. f xi (a + tv)v i) t=0 1 i n = f xi x j (a)v i v j, 1 i,j n 6 Quadratische Taylorformel Sei f : R n R zweimal stetig differenzierbar. Gehört [a, a + h] zum Definitionsbereich von f, so gilt f (a + h) = f (a) + f (a), h + 1 Hf (ξ)h, h (2) 2 mit einem ξ [a, a + h]. Dies folgt aus der Taylorformel 4 für r = 1. Der Multiindex der Länge 0 ergibt den Term f (a), die Multiindizes der Länge 1 den linearen Term n f xk (a)h k = f (a), h. k=1 Das Restglied für skalare Funktionen 4 ergibt den Term α =2 1 α! α f (ξ)h α = 1 2 n k,l=1 f xk x l (ξ)h k h l = 1 Hf (ξ)h, h 2 wobei die erste Identität auf der binomischen Formel beruht. Bemerkung Dieses Ergebnis ergibt sich auch direkt aus dem entsprechenden eindimensionalen Satz. Für ϕ(t) = f (a + th) gilt ϕ(1) = ϕ(0) + ϕ (0) + 1 (1 t)ϕ (t) dt. 0 Mit dem Mittelwertsatz der Integralrechnung 11.7 ist 1 (1 t)ϕ (t) dt = ϕ (θ) 0 1 (1 t) dt = 1 0 2 ϕ (θ) mit einem θ [0, 1]. Mit ϕ (0) = f (a), h und ϕ (θ) = Hf (ξ)h, h ergibt dies (2). (c)-machobs: 19.7

398 19 Mehrdimensionale Analysis Eine C -Funktion f : V R können wir um einen Punkt a seines Definitionsbereiches formal in seine Taylorreihe T a f (x) r 0 α =r 1 α! α f (a)(x a) α entwickeln. Bereits im eindimensionalen Fall braucht diese jedoch in keinem Punkt x a zu konvergieren. Und selbst wenn sie konvergiert, muss sie nicht die Funktion f darstellen siehe das Gegenbeispiel von Cauchy 8.26. Ist dies aber der Fall, so nennt man die Funktion f reell analytisch in n Variablen. Es gilt zum Beispiel folgender Satz in einer wie in mehreren Dimensionen. 7 Satz Sei f : R n R von der Klasse C. Existiert zu einer Kugel B r (a) im Definitionsbereich von f ein M > 0, so dass 1 sup α f (x) M α! x B r (a) r α, α Nn 0, so konvergiert die Taylorreihe T a f auf jeder abgeschlossenen Kugel in B r (a) absolut und gleichmäßig gegen f. Da wir den Satz nicht benötigen, beweisen wir ihn auch nicht. Seine Voraussetzung ist zum Beispiel erfüllt für die in Kapitel 9 betrachteten elementaren Funktionen. 19.8 (c)-machobs:

Lokale Extrema 19-b 399 19-b Lokale Extrema Für skalare Funktionen ist es sinnvoll, nach der Existenz lokaler Extrema zu fragen. Diese sind genau wie für Funktionen einer Variablen erklärt. Definition Eine Funktion f : V R besitzt im Punkt a ein lokales Minimum, wenn es eine Umgebung U von a im Definitionsbereich von f gibt, so dass f (a) f (x), x U. Das lokale Minimum heißt strikt, wenn sogar f (a) < f (x), x U {a}. Der Punkt a selbst heißt eine Minimalstelle von f. Entsprechend sind lokales Maximum und Maximalstelle erklärt. Minima und Maxima werden gemeinsam als Extrema bezeichnet, und Minimalund Maximalstellen gemeinsam als Extremalstellen. Für diese gilt der Satz von Fermat 8.9 entsprechend auch hier. 8 Satz von Fermat Besitzt die Funktion f : V R im Punkt a eine Extremalstelle und ist sie dort total differenzierbar, so ist Df (a) = 0. Der Definitionsbereich von f : V R ist vereinbarungsgemäß offen. Somit ist f auf einer offenen Umgebung von a erklärt. Für jeden Vektor v 0 ist dann ϕ : t f (a + tv) auf einem offenen Intervall um 0 erklärt und besitzt in t = 0 ein lokales Extremum. Da ϕ dort auch differenzierbar ist, gilt nach dem klassischen Satz von Fermat 8.9 0 = ϕ (0) = d dt t=0 f (a + tv) = Df (a)v. Da dies für jeden Vektor v 0 gilt, ist Df (a) = 0. Für ein beliebiges Skalarprodukt, besitzt die Funktion f : R 2 R, f (x) = x, x aufgrund der Definitheit bei x = 0 ein striktes Minimum. Und in der Tat verschwindet Df (x) = 2x, auch bei x = 0. Wie in der eindimensionalen Theorie werden Punkte, in denen die Ableitung verschwindet, als kritische Punkte bezeichnet. Definition Ist f : V R im Punkt c total differenzierbar und Df (c) = 0, so heißt c ein kritischer oder stationärer Punkt von f. (c)-machobs: 19.9

400 19 Mehrdimensionale Analysis Der Satz von Fermat besagt also auch für skalare Funktionen mehrerer Variablen, dass eine Extremstelle im Innern notwendig ein kritischer Punkt ist, wenn die Funktion dort total differenzierbar ist. Dies gilt allerdings nicht mehr, wenn die Extremstelle am Rand des Definitionsbereichs liegt. Ebensowenig ist ein kritischer Punkt notwendigerweise eine Extremstelle. In der eindimensionalen Theorie können wir hinreichende Bedingungen für die Existenz eines lokalen Extremums mithilfe der zweiten Ableitung formulieren. Für eine C 2 -Funktion f : R R beispielsweise ist f (c) = 0, f (c) > 0 hinreichend für die Existenz eines strikten lokalen Minimums bei c. In höheren Dimensionen wird die zweite Ableitung von f aber nicht mehr durch eine reelle Zahl, sondern in expliziten Koordinaten durch die symmetrische Hessematrix dargestellt. Es geht also darum, analoge hinreichende Bedingungen bezüglich solcher Operatoren zu formulieren. Definite Matrizen Sei S(n) der Raum aller reellen symmetrischen n n-matrizen. Dies ist ein reeller Vektorraum der Dimension n(n + 1)/2. Definition Eine Matrix A S(n) heißt (i) positiv definit, geschrieben A > 0, falls Av, v > 0, 0 v R n, (ii) positiv semidefinit, geschrieben A 0, falls Av, v 0, v R n, (iii) negativ definit, geschrieben A < 0, falls A > 0, (iv) negativ semidefinit, geschrieben A 0, falls A 0, (v) indefinit, geschrieben A 0, im verbleibenden Fall. Eine Matrix A S(n) ist also indefinit, wenn Av, v das Vorzeichen wechselt. Beispiel Alle diese Fälle treten bereits bei 2 2-Diagonalmatrizen ( ) α 0 A = 0 β auf. So gilt A > 0 genau dann, wenn α, β > 0, oder A 0 genau dann, wenn αβ < 0 10. 19.10 (c)-machobs:

Lokale Extrema 19-b 401 Im definiten Fall gilt noch eine stärkere Aussage. 9 Lemma Für eine Matrix A S(n) sind äquivalent: (i) Es ist A > 0. (ii) Es gibt ein µ > 0, so dass Av, v µ v 2 für alle v R n. (iii) Es gibt ein µ > 0, so dass A µi 0. (i) (ii) Die quadratische Form Q : R n R, Q(v) = Av, v ist stetig und nach Voraussetzung auf der Einheitssphäre S n 1 positiv. Wegen der Kompaktheit von S n 1 nimmt sie ihr Minimum an, so dass µ inf u S n 1 Q(u) > 0. Für ein beliebiges 0 v R n gilt dann mit u = v/ v die Abschätzung Av, v = v 2 Q(u) µ v 2. Dies bleibt auch für v = 0 gültig, womit (ii) gezeigt ist. (ii) (iii) Aus der Voraussetzung folgt (A µi)v, v = Av, v µ v 2 0, v R n. Somit ist A µi 0. (iii) (i) Mit der letzten Ungleichung gilt also A > 0. Av, v µ v 2 > 0, v 0, Die Definitheitseigenschaften einer symmetrischen Matrix lassen sich direkt aus ihren Eigenwerten ablesen, die ja reell sind. 10 Lemma Sind λ 1 λ 2.. λ n die Eigenwerte von A S(n), so gilt: (i) A > 0 λ 1 > 0, (ii) A 0 λ 1 0, (iii) A < 0 λ n < 0, (iv) A 0 λ n 0, (v) A 0 λ 1 λ n < 0. Eine symmetrische Matrix A besitzt ein Orthonormalsystem von Eigenvektoren v 1,.., v n zu den Eigenwerten λ 1,.., λ n. Es ist also Av k = λ k v k, v k, v l = δ kl. (c)-machobs: 19.11

402 19 Mehrdimensionale Analysis Für v = α 1 v 1 +.. + α n v n ist dann Av = λ 1 α 1 v 1 +.. + λ n α n v n und n n Av, v = λ i α i α j v i, v j = λ i α 2 i. i,j=1 i=1 Daraus ergeben sich alle Behauptungen. Zum Beispiel ist für v 0 Av, v λ 1 n i=1 α 2 i = λ 1 v 2 > 0 λ 1 > 0. Speziell für symmetrische 2 2-Matrizen ergibt sich hieraus folgendes 11 Korollar Für eine reelle symmetrische 2 2-Matrix A = (a ij ) gilt: (i) A > 0 det A > 0 a 11 > 0, (ii) A < 0 det A > 0 a 11 < 0, (iii) A 0 det A < 0. Bezeichnen λ 1 und λ 2 die beiden Eigenwerte von A, so gilt bekanntlich det A = λ 1 λ 2. Ist det A < 0, so haben beide Eigenwerte entgegengesetztes Vorzeichen, und A ist indefinit 10. Ist det A > 0, so ist A definit, und a 11 = Ae 1, e 1 entscheidet über das Vorzeichen. Nun benötigen wir noch eine Stetigkeitsaussage für Matrizenfunktionen, deren einfachen Beweis wir übergehen. 12 Lemma Die Matrixfunktion A : V S(n) sei stetig und A(c) > 0. Dann existiert eine Umgebung U von c, so dass A(x) > 0 für alle x U. Hinweis Das Lemma wird falsch mit anstelle von >. Lokale Extremstellen Nun zurück zum eigentlichen Problem, der Charakterisierung von Extremalstellen. Wir formulieren die Ergebnisse für Minimalstellen, für Maximalstellen sind die Aussagen entsprechend abzuwandeln. 13 Satz Ist c eine lokale Minimalstelle einer C 2 -Funktion f : R n R, so ist Hf (c) 0. Für jedes v R n besitzt die Hilfsfunktion ϕ : t f (c + tv) in t = 0 ein lokales Minimum. Also gilt ϕ (0) = vf 2 (c) = Hf (c)v, v 0. Da dies für alle v R n gilt, folgt die Behauptung. 19.12 (c)-machobs:

Lokale Extrema 19-b 403 Abb 2 Das Paraboloid x 2 + y 2 Dieser Satz formuliert eine notwendige, aber nicht hinreichende Bedingung, wie bereits die kubische Parabel t t 3 in einer Dimension zeigt. Um die Existenz einer Minimalstelle zu garantieren, braucht es etwas mehr. 14 Satz Sei c ein kritischer Punkt einer C 2 -Funktion f : R n R. Gilt Hf (x) 0 in einer Umgebung U von c, so ist c eine lokale Minimalstelle. Gilt sogar Hf (c) > 0, so ist c eine strikte lokale Minimalstelle. Es ist B r (c) U für ein r > 0. Für h < r ist dann die Strecke [c, c + h] ganz in U enthalten, und es gilt 6 f (c + h) = f (c) + Hf (ξ)h, h mit einem ξ [c, c + h]. Da Hf (ξ)h, h 0 nach Voraussetzung, folgt f (c + h) f (c), h < r. Also ist c eine Minimalstelle. Gilt sogar Hf (c) > 0, so ist Hf (ξ)h, h > 0 für alle ξ B r (c) und h 0, wenn r hinreichend klein ist 12. Also folgt mit demselben Argument f (c + h) > f (c), 0 < h < r, und c ist eine strikte Minimalstelle. Typische Fälle Der definite Fall Betrachte die Funktion f : R 2 R mit f (x, y) = x 2 + y 2. (c)-machobs: 19.13

404 19 Mehrdimensionale Analysis Es ist ( ) ( ) 2x 2 0 f =, Hf =. 2y 0 2 Also ist 0 der einzige kritische Punkt von f. Da außerdem Hf > 0 auf ganz R 2, ist 0 eine lokale strikte Minimalstelle. Der Graph von f ist ein nach oben geöffnetes Paraboloid siehe Abbildung 2. Für die Funktion x 2 y 2 ist 0 entsprechend eine lokale strikte Maximalstelle, und ihr Graph ein nach unten geöffnetes Paraboloid. Ist die Hessische in einem kritischen Punkt nur semidefinit, so ist mindestens einer ihrer Eigenwerte Null. In diesem Fall kann der Graph sehr unterschiedliche Gestalt annehmen. Der semidefinite Fall Betrachte die Funktionen f, g, h : R 2 R mit f (x, y) = x 2 + y 4, g(x, y) = x 2, h(x, y) = x 2 + y 3. In allen Fällen ist 0 ein kritischer Punkt mit Hessematrix ( ) 2 0 0. 0 0 Die Funktionen verhalten sich um 0 jedoch sehr unterschiedlich: f hat ein striktes Minimum ähnlich zu Abbildung 2, g hat ein nichtisoliertes Minimum wie in Abbildung 3, h bildet einen sogenannten Affensattel wie in Abbildung 4. Der semidefinite Fall ist in vielen Fällen schwierig zu behandeln. Oft kann man ihn aber als eine nicht typische oder entartete Situation betrachten, die normalerweise nicht auftritt. Betrachtet man nur die nichtentarteten Fälle, so wird die Situation meist sehr viel übersichtlicher. Definition Ein kritischer Punkt c einer C 2 -Funktion f : R n R heißt nichtdegeneriert oder nichtentartet, falls det Hf (c) 0. Andernfalls heißt er entartet oder degeneriert. Abb 3 Die Rinne x 2 19.14 (c)-machobs:

Lokale Extrema 19-b 405 Abb 4 Der Affensattel x 2 + y 3 In einem nichtentarteten kritischen Punkt kann die Hessische nicht semidefinit sein, sie ist entweder definit oder indefinit. Dieser Fall hat ebenfalls einen eigenen Namen. Definition Ein nichtentarteter kritischer Punkt c einer C 2 -Funktion f heißt Sattelpunkt, falls die Hessische Hf (c) indefinit ist. Im Falle einer Funktion zweier Variablen ist dies äquivalent mit der Bedingung det Hf (c) < 0. In höheren Dimensionen ist diese Bedingung jedoch nur hinreichend, aber nicht notwendig, denn die Anzahl positiver wie negativer Eigenwerte kann positiv und gerade und die Determinante damit positiv sein. Sattelpunkt im R 2 Betrachte die Funktion f : R 2 R mit f (x, y) = x 2 y 2. Es ist f = ( 2x 2y ), Hf = ( 2 0 0 2 ). Hier ist 0 wieder der einzige kritische Punkt von f, und es ist Hf 0. Es liegt somit ein Sattelpunkt wie in Abbildung 5 vor. Abb 5 Der Sattel x 2 y 2 (c)-machobs: 19.15

406 19 Mehrdimensionale Analysis Ein Beispiel Betrachte f : R 2 R mit f (x, y) = y 2 (x 1) + x 2 (x + 1). Zuerst suchen wir sämtliche kritischen Punkte, also diejenigen Punkte (x, y) mit ( ) y 2 + 3x 2 + 2x f (x, y) = = 0. 2y(x 1) Dies ist äquivalent mit dem nichtlinearen Gleichungssystem y 2 + 3x 2 + 2x = 0, 2y(x 1) = 0. Aus der zweiten Gleichung folgt x = 1 y = 0. Für y = 0 ergibt die erste Gleichung x = 0 x = 2/3. Somit erhalten wir zwei kritische Punkte c = (0, 0), c = ( 2/3, 0). Für x = 1 führt die erste Gleichung zu y 2 + 5 = 0, welche keine reelle Lösung besitzt. Somit gibt es keine weiteren kritischen Punkte. Nun betrachten wir die Hessematrix ( ) 6x + 2 2y Hf (x, y) = 2y 2x 2 an diesen Punkten. Es ist ( ) ( ) 2 0 2 0 Hf (c ) =, Hf (c ) = 0 2 0 10/3 indefinit respektive negativ definit. Somit liegt bei c ein Sattelpunkt und bei c ein striktes lokales Maximum. Weitere kritische Punkte gibt es nicht. Das Lemma von Morse Die Bedeutung nichtentarteter kritischer Punkte besteht darin, dass Funktionen lokal bereits durch die Anzahl der negativen Eigenwerte der Hessischen vollständig charakterisiert sind. Man nennt die Anzahl der negativen Eigenwerte von Hf (c) den Index des kritischen Punktes c. Alles andere spielt lokal keine Rolle, wie der folgende Satz zeigt. Ein Beweis findet man zum Beispiel in Lang, Real Analysis, Kapitel VII. 15 Lemma von Morse Die C 3 -Funktion f : R n R besitze einen nichtentarteten kritischen Punkt c mit Index k. Dann existieren lokale Koordinaten u = (u 1,.., u n ) um c so, dass f (u) f (c) = u 2 1.. u2 k + u2 k+1 +.. + u2 n. 19.16 (c)-machobs:

Lokale Extrema 19-b 407 Abb 6 a 3 Punkt mit minimaler Quadrat- Abstandssumme a 4 c a 2 a 1 Das heißt, es gibt eine Koordinatentransformation 1 ϕ : U 0 U c, u ϕ(u) von einer offenen Umgebung U 0 von 0 auf eine offene Umgebung U c von c, so dass (f ϕ)(u) f (c) = u 2 1.. u2 k + u2 k+1 +.. + u2 n. In den richtigen Koordinaten wird damit f bis auf eine unwichtige additive Konstante zu einer quadratischen Form, die vollständig durch den Index k des kritischen Punktes c bestimmt ist. Da dieser Index nur die n + 1 Werte 0,.., n annehmen kann, erhalten wir folgendes 16 Korollar Im R n gibt es lokal genau n + 1 verschiedene nichtentartete kritische Punkte, und zwar strikte Minimalstellen, strikte Maximalstellen, und Sattelpunkte mit Index k = 1,.., n 1. Zwei Extremwertaufgaben Als Anwendungsbeispiele betrachten wir zwei typische Extremwertaufgaben sowie das Maximumprinzip für harmonische Funktionen. Extremwertaufgabe Gegeben sind m Punkte a 1,.., a m im R n. Gesucht ist ein Punkt c im R n, so dass die Summe aller ihrer quadrierten Abstände zum Punkt c minimal wird. Gesucht ist demnach das Minimum der Funktion 2 f : R n R, f (x) = 1 2m m x a i 2. i=1 1 Genauer einen Diffeomorphismus dazu später mehr in Abschnitt c. 2 Die Division mit m vereinfacht nur die folgenden Formeln und hat keine tiefere Bedeutung. (c)-machobs: 19.17

408 19 Mehrdimensionale Analysis Das Quadrat der euklidischen Norm ist differenzierbar, mit ( x a i 2 ) = 2(x a i ). Also ist f (x) = 1 m (x a i ) = x 1 m a i. m m i=1 Dieser Gradient besitzt einen einzigen kritischen Punkt in c = 1 m m a i, i=1 dem arithmetischen Mittel der Punkte a 1,.., a m. Stellen wir uns jedem Punkt mit der Masse 1 versehen vor, so entspricht dies dem Schwerpunkt des entsprechenden starren Körpers. Die Hessische von f ist Hf (x) = I > 0 in allen Punkten. Daher liegt ein striktes Minimum vor. Aus der Geometrie des Problems ist aber ohnehin klar, dass dies ein lokales und sogar globales Minimum ist. 17 Extremwertaufgabe mit Nebenbedingung Zu bestimmen ist derjenige Quader, der bei vorgegebener Kantenlänge das größte Volumen einschließt. Sind x, y, z die Kantenlängen des Quaders, so ist also die Funktion V = xyz zu maximieren unter der Vorgabe, dass x + y + z = c konstant ist. Ein allgemeines Verfahren für solche Extremwertaufgaben mit Nebenbedingungen werden wir später kennenlernen, hier gehen wir direkt vor. Aufgrund der Homogenität des Problems in allen drei Koordinaten können wir die Gesamtkantenlänge auf einen beliebigen positiven Wert fixieren, zum Beispiel auf x + y + z = 3. Dann ist z = 3 x y, und es ist die Funktion V = V (x, y) = xy(3 x y) = 3xy x 2 y xy 2 auf dem positiven Quadranten x, y > 0 zu maximieren. Es ist ( ) 3y 2xy y 2 V (x, y) = 3x 2xy x 2. i=1 19.18 (c)-machobs:

Lokale Extrema 19-b 409 Kritische Punkte sind einerseits (0, 0), (0, 3) und (3, 0), aber dies sind offensichtlich Minimalstellen. Bleibt nur noch der kritische Punkt (1, 1) mit z = 1. Die Hessische ist ( ) 2y 3 2x 2y HV (x, y) =, 3 2x 2y 2x und es gilt ( ) HV (x, y) 2 1 = < 0. (1,1) 1 2 Somit liegt ein striktes lokales Maximum vor, welches auch das globale Maximum darstellt. Das Maximum wird also von einem Quader mit drei gleichen Seiten erreicht, was auch nicht weiter überrascht. Das Maximumprinzip für harmonische Funktionen Es gibt eine wichtige Klasse von Funktionen, wo man die Existenz lokaler Extrema von vornherein ausschließen kann. Dies beruht auf dem Maximumprinzip. Definition Eine C 2 -Funktion u : R n R heißt harmonisch, falls überall n u u xi x i = 0. i=1 a. Auf einem Intervall ist eine Funktion u harmonisch genau dann, wenn u = 0, also wenn sie linear ist. b. Für n 2 ist u : R n {0} R, log x, n = 2 u(x) = x 2 n, n 3 harmonisch. 18 Maximumprinzip Ist u harmonisch auf einer Umgebung der offenen und beschränkten Menge Ω R n, so nimmt u ihr Maximum nur auf dem Rand von Ω an. Genauer gilt: (i) max Ω u = max Ω u. (ii) Ebenso nimmt u sein Maximum auf dem Rand an. (iii) Ist u auf dem Rand von Ω konstant, so ist u überall konstant. (c)-machobs: 19.19

410 19 Mehrdimensionale Analysis Die Idee ist, dass u nichts anderes ist als die Spur der Hessischen Hu, und diese ist wiederum gleich der Summe ihrer Eigenwerte. In jedem Punkt gilt also λ 1 +.. + λ n = spur Hu = u = 0. Ist wenigstens ein Eigenwerte positiv, so muss mindestens ein anderer Eigenwert negativ sein, und umgekehrt. In diesem Fall ist die Hessische also indefinit, und es kann kein Extremum vorliegen. Bleibt nur noch der entartetete Fall zu behandeln, wo alle Eigenwerte verschwinden. Dies führen wir hier nicht aus. 19-c Umkehrabbildungen Wir betrachten nun vektorwertige Abbildungen. Zuerst wollen wir die Frage studieren, unter welchen Bedingungen eine Abbildung ϕ : R n R m, x u = ϕ(x) umkehrbar ist. Mit anderen Worten: Wann können wir die Gleichung u = ϕ(x), nach x auflösen? Oder genauer: Wann können wir das System von m im Allgemeinen nichtlinearen Gleichungen in n Variablen, u 1 = ϕ 1 (x 1,.., x n ), u 2 = ϕ 2 (x 1,.., x n ), : u m = ϕ m (x 1,.., x n ), nach x 1,.., x n auflösen? Den eindimensionalen Fall behandelten wir in Abschnitt 7-b. Ist I ein Intervall und f : I R stetig, so ist f umkehrbar dann und nur dann, wenn f streng monoton ist. In diesem Fall ist J = f (I) ein Intervall, die Umkehrfunktion f 1 auf f (I) wohldefiniert, und ebenfalls stetig und streng monoton 7.15. In höheren Dimensionen steht uns das Monotoniekriterium jedoch nicht zur Verfügung, und die Sache ist komplizierter. So ist zum Beispiel die Abbildung ϕ in Abbildung 7 lokal injektiv, aber nicht global injektiv, denn die beiden Punkte links werden auf denselben Punkt rechts abgebildet. Also ist ϕ nicht umkehrbar. In einem ersten Schritt vereinfachen wir daher die Aufgabe, indem wir sie lokalisieren was ohnehin bei vielen analytischen Problemen eine sinnvolle 19.20 (c)-machobs:

Umkehrabbildungen 19-c 411 Herangehensweise ist. Wir gehen also von einem festen Punkt x 0 und dessen Bild u 0 aus, also einer partikulären Lösung der Gleichung u 0 = ϕ(x 0 ). Wir fragen dann, ob es Umgebungen U von x 0 und V von u 0 gibt, in denen die Gleichung u = ϕ(x) eindeutig nach x auflösbar ist. Beschränken wir uns auf kleine Umgebungen, so können wir in einem zweiten Schritt das Problem linearisieren, indem wir die typischerweise nichtlineare Abbildung ϕ lokal durch ihre Linearisierung im Punkt x 0 approximieren. Dies ist ohnehin ein wichtiger Spezialfall des allgemeinen Problems und führt zu u = u 0 + Dϕ(x 0 )(x x 0 ). Die lineare Algebra lehrt nun, dass diese Gleichung uneingeschränkt lösbar ist genau dann, wenn u und x von derselben Dimension sind und Dϕ(x 0 ) invertierbar ist, also det Dϕ(x 0 ) 0 gilt. Die Umkehrabbildung ist dann x = x 0 + Dϕ 1 (x 0 )(u u 0 ). Für die lokale Umkehrbarkeit einer differenzierbaren Abbildung ϕ um einen Punkt x 0 ist es somit sicher notwendig zu verlangen, dass Dϕ(x 0 ) regulär ist. Das fundamentale Ergebnis ist, dass dies auch hinreichend ist. 19 Umkehrsatz Es sei ϕ : R n R n stetig differenzierbar und det Dϕ(x 0 ) 0. Dann existieren Umgebungen U von x 0 und V von u 0 = ϕ(x 0 ) sowie eine stetig differenzierbare Abbildung ψ : V U, so dass ψ ϕ = id U, ϕ ψ = id V. Ist außerdem ϕ von der Klasse C r mit 1 r, so ist auch die lokale Umkehrabbildung ψ von der Klasse C r. Abb 7 Lokal, aber nicht global injektive Abbildung (c)-machobs: 19.21

412 19 Mehrdimensionale Analysis Abb 8 Abbildung und Umkehrabbildung U x 0 ϕ V u0 ψ Im Detail bedeutet dies, dass ϕ die offene Menge U bijektiv auf die offene Menge V abbildet und deren lokale Umkehrung ψ = (ϕ U) 1 ebenfalls stetig differenzierbar ist vergleiche Abbildung 8. Etwas Terminologie Der Satz über die Existenz lokaler Umkehrabbildungen gehört zu den wichtigsten Hilfsmitteln der Analysis. Wir wollen seine wesentlichen Aspekte deshalb auch begrifflich herausstellen. Definition Eine C 1 -Abbildung ϕ : R n R n heißt regulär im Punkt x 0 und x 0 heißt regulärer Punkt von ϕ, wenn det Dϕ(x 0 ) 0. Die Abbildung ϕ heißt regulär, wenn sie in jedem Punkt ihres Definitionsbereichs regulär ist. Ein nicht-regulärer Punkt heißt singulärer Punkt. Definition (i) (ii) Sei Ω R n offen. Eine C 1 -Abbildung ϕ : Ω R n ist ein Diffeomorphismus, genauer ein Diffeomorphismus von Ω auf Ω, wenn gilt: Ω = ϕ(ω) ist offen, ϕ : Ω Ω ist bijektiv, (iii) ϕ 1 : Ω Ω ist ebenfalls C 1. a. Eine affine Abbildung R n R n, x u = Ax + b ist ein Diffeomorphismus des R n genau dann, wenn det A 0. Die Umkehrabbildung ist natürlich u x = A 1 (u b). b. Ist I ein offenes Intervall und f : I R regulär, so verschwindet die Ableitung f nirgends. Also ist gemäß dem Satz über C 1 -Umkehrfunktionen f ein Diffeomorphismus von I auf I = f (I). Die Ableitung der Umkehrfunktion g ist g = 1 f g. 19.22 (c)-machobs:

Umkehrabbildungen 19-c 413 c. Sind ϕ : Ω Ω und ψ : Ω Ω Diffeomorphismen, so auch ϕ 1 : Ω Ω, ψ ϕ : Ω Ω. Die Diffeomorphismus-Eigenschaft zieht die Regularität nach sich: 20 Lemma Ein Diffeomorphismus ϕ ist in jedem Punkt seines Definitionsbereichs regulär. Da ϕ und ϕ 1 beide differenzierbar sind, können wir auf die Identität ϕ 1 ϕ = id die Kettenregel 18.8 anwenden und erhalten D(ϕ 1 ) ϕ Dϕ = I. Also gilt auch det(d(ϕ 1 ) ϕ) det(dϕ) = 1. Somit kann det Dϕ nirgends verschwinden, und ϕ ist in jedem Punkt regulär. Die Umkehrung dieses Sachverhalts gilt im Globalen im Allgemeinen nicht. Aus der Regularität einer Abbildung folgt nicht ihre Injektivität und damit auch nicht ihre Umkehrbarkeit, wie schon Abbildung 7 nahe legt. Denn Regularität allein beschreibt eine lokale, Umkehrbarkeit dagegen eine globale Eigenschaft. Im Lokalen gilt jedoch die Umkehrung. Dazu nennen wir eine C 1 -Abbildung um einen Punkt lokal diffeomorph oder einen lokalen Diffeomorphismus, wenn ihre Einschränkung auf eine hinreichend kleine Umgebung dieses Punktes einen Diffeomorphismus ergibt. Mit diesen Begriffen erhalten wir folgende knappe Formulierung des Umkehrsatzes. 21 Kurzfassung des Umkehrsatzes Lokal um einen regulären Punkt ist eine C 1 -Abbildung diffeomorph. Die Stärke des Umkehrsatzes besteht darin, dass für seine Anwendung nur die Regularität in einem Punkt gegeben sein muss. Dies impliziert die lokale Injektivität der Abbildung. Ist diese jedoch bekannt, so gilt alles Weitere bereits für stetige Abbildungen. Das Ergebnis ist folgender Satz, der auch als Satz von der Invarianz der Dimension bekannt ist. 22 Brouwerscher Umkehrsatz Ist ϕ : Ω R n eine stetige und injektive Abbildung einer offenen Menge Ω im R n, so ist Ω = ϕ(ω) offen und die Umkehrabbildung ϕ 1 : Ω Ω ebenfalls stetig. Ein relativ einfacher Beweis basiert auf der Theorie des Abbildungsgrads, doch geht dies über den Rahmen dieser Vorlesung hinaus. (c)-machobs: 19.23

414 19 Mehrdimensionale Analysis Koordinatentransformationen Einen Diffeomorphismus ϕ : Ω Ω, u x = ϕ(u) kann man auffassen als eine Koordinatentransformation, die auf der Zielmenge Ω mit Koordinaten x neue Koordinaten u aus der Menge Ω einführt. Koordinatentransformationen sind ein wichtiges Hilfsmittel, um mathematische Probleme zu lösen, und viele mathematische und physikalische Probleme haben ihre eigenen speziellen Koordinatensysteme. Die wichtigsten sind sicherlich die Polar-, Zylinder- und Kugelkoordinaten. Polarkoordinaten In der euklidischen Ebene lässt sich jeder Punkt durch seinen Abstand r zum Nullpunkt und den Winkel ϕ seines Ortsvektors mit der positiven x-achse beschreiben. Umgekehrt wird durch ( ) ( ) ( ) r x r cos ϕ ψ : = ϕ y r sin ϕ jedem Koordinatenpaar (r, ϕ) der entsprechende Punkt (x, y) in der Ebene zugeordnet die Transformation heißt hier ψ, da ϕ bereits den Winkel bezeichnet. Für die so definierte Abbildung ψ : [0, ) R R 2, (r, ϕ) (x, y) ist ( ) cos ϕ r sin ϕ Dψ =, det Dψ = r. sin ϕ r cos ϕ Somit ist ψ regulär in allen Punkten mit r > 0 und definiert dort einen lokalen Diffeomorphismus. Für r = 0 dagegen ist ψ nicht einmal injektiv, denn ψ(0, ϕ) = (0, 0), ϕ R. Aber auch für r > 0 ist ψ nicht injektiv, denn aufgrund der Periodizität der Kreisfunktionen gilt ja ψ(r, ϕ + 2πn) = ψ(r, ϕ), n Z. Daher ist ψ ein Koordinatensystem nur nach Einschränkung auf geeignete Teilgebiete, wie zum Beispiel (0, ) (0, 2π) oder allgemeiner (0, ) (α, α + 2π), α R. 19.24 (c)-machobs:

Umkehrabbildungen 19-c 415 Abb 9 Polarkoordinaten ψ r r ϕ ϕ ϕ+2π Für die Umkehrabbildung ist dann jeweils der geeignete Zweig der Arcusfunktionen zu wählen. In vielen Fällen ist eine Rücktransformation jedoch nicht erforderlich, und die Mehrdeutigkeit der Polarkoordinaten kein Problem. Kugelkoordinaten Im euklidischen Raum lässt sich jeder Punkt durch seinen Abstand r zum Nullpunkt und zwei Winkel θ und ϕ beschreiben, dem Azimutwinkel θ seines Ortsvektors zur z-achse und dem Polarwinkel ϕ seiner Projektion auf die xy-ebene. Umgekehrt wird durch r x r cos ϕ sin θ ψ : θ y = r sin ϕ sin θ ϕ z r cos θ Abb 10 Kugelkoordinaten z θ r y x ϕ (c)-machobs: 19.25

416 19 Mehrdimensionale Analysis jedem Koordinatentripel (r, θ, ϕ) der entsprechende Punkt (x, y, z) im Raum zugeordnet. Für die so definierte Abbildung ψ : [0, ) R 2 R 3, (r, θ, ϕ) (x, y, z) ist cos ϕ sin θ r cos ϕ cos θ r sin ϕ sin θ Dψ = sin ϕ sin θ r sin ϕ cos θ r cos ϕ sin θ, cos θ r sin θ 0 und eine kurze Rechnung ergibt det Dψ = r 2 sin θ. Diese Jacobideterminante verschwindet somit genau auf der z-achse. Transformation von Differenzialoperatoren Unter Koordinatentransformationen transformieren sich auch Differenzialoperatoren. Oft geht es auch gerade darum, diese zu vereinfachen. Sucht man beispielsweise rotationssymmetrische Lösungen einer Differenzialgleichung, so ist es sicher sinnvoll, diese in Polarkoordinaten auszudrücken. Sei ϕ : u x = ϕ(u) eine Koordinatentransformation, sei g eine skalare Funktion von x und g = g ϕ dieselbe Funktion in den Koordinaten u. Gemäß der Kettenregel gilt D g = Dg Dϕ, wobei Dg an der Stelle ϕ ausgewertet wird. Für die partiellen Ableitungen ergibt sich somit g u i = n j=1 g x j ϕ j u i = n j=1 g x j x j u i wobei die zweite Schreibweise lediglich die naheliegende Abkürzung x j = ϕ j (u) verwendet. Das bedeutet, dass sich die partiellen Ableitungen mit der Transponierten der Jacobimatrix des Koordinatenwechsels transformieren, wenn wir diese als Spaltenvektoren schreiben: g = (Jϕ) g. Dies folgt natürlich auch direkt mit der Kettenregel mit g = (D g) = (Dg Dϕ) = (Dϕ) (Dg) = (Jϕ) g. 19.26 (c)-machobs:

Umkehrabbildungen 19-c 417 23 Notiz Unter einer Koordinatentransformation ϕ : x = ϕ(u) transfomiert sich der Nablaoperator mit der Transponierten der Jacobimatrix: u = Jϕ x. Polarkoordinaten Für ( ) ( ) ( ) r x r cos ϕ ψ : =. (3) ϕ y r sin ϕ ist ( ) ( ) cos ϕ r sin ϕ cos ϕ sin ϕ Dψ =, Dψ =. sin ϕ r cos ϕ r sin ϕ r cos ϕ Somit ist ( r ϕ ) ( ) ( ) cos ϕ sin ϕ x =. r sin ϕ r cos ϕ Dies kann man auch umkehren. Mit der Inversen der Transponierten, ( ) cos ϕ r Dψ 1 sin ϕ = sin ϕ r 1, cos ϕ erhält man ( x y y ) ( ) ( ) cos ϕ r 1 sin ϕ r = sin ϕ r 1. (4) cos ϕ Dies kann man auch direkt ausrechnen, und meist ist dies auch der übersichtlichere Weg. Für g(r, ϕ) = g(x, y) ist g r = g x x r + g y y r, und entsprechend mit ϕ für r. Mit (3) erhält man also das lineare Gleichungssystem g r = Auflösen ergibt g cos ϕ x + g sin ϕ y, g g g = r sin ϕ + r cos ϕ ϕ x y. g g = cos ϕ x r 1 g sin ϕ r ϕ, g g = sin ϕ y r + 1 g cos ϕ r ϕ. ϕ Das Ergebnis ist natürlich dasselbe wie in (4). (c)-machobs: 19.27

418 19 Mehrdimensionale Analysis Laplaceoperator in Polarkoordinaten Aufgrund von (4) ist x = cos ϕ r 1 r sin ϕ ϕ. Beachtet man die Produktregel, so folgt hieraus 2 x = (cos ϕ r 1 r sin ϕ ϕ)(cos ϕ r 1 r sin ϕ ϕ) Analog ergibt sich = cos 2 ϕ 2 r + 1 r 2 sin ϕ cos ϕ ϕ 1 r sin ϕ cos ϕ r ϕ + 1 r sin2 ϕ r 1 r sin ϕ cos ϕ r ϕ + 1 1 sin ϕ cos ϕ ϕ + r 2 r 2 sin2 ϕ ϕ 2 = 1 r sin2 ϕ r + 2 y = 1 r cos2 ϕ r Also erhalten wir sin 2ϕ r 2 ϕ + cos 2 ϕ r 2 sin 2ϕ r 2 ϕ + sin 2 ϕ r 2 + = 2 x + 2 y = 2 r + 1 r r + 1 r 2 2 ϕ. sin 2ϕ r ϕ + sin2 ϕ r r 2 ϕ 2. sin 2ϕ r ϕ + cos2 ϕ r r 2 ϕ. 2 Suchen wir nun rotationssymmetrische harmonische Funktionen u in der Ebene, so soll die Funktion in Polarkoordinaten, v(r, ϕ) u(r cos ϕ, r sin ϕ), also nicht von ϕ abhängen und v ϕ = 0 gelten. Somit suchen wir eine Lösung der Gleichung v r r + 1 r v r = 0. Deren allgemeine Lösung ist v = a + b log r, also u = a + b log x 2 + y 2. Diese Funktion ist allerdings im Nullpunkt stetig und differenzierbar dann und nur dann, wenn b = 0. Somit sind die einzigen rotationssymmetrischen und auf ganz R 2 harmonischen Funktionen die konstanten Funktionen. Laplaceoperator in Kugelkoordinaten Suchen wir im R 3 nach rotationssymmetrischen harmonischen Funktionen, so führt der Ansatz u(x, y, z) = v(r ) zu der Differenzialgleichung v r r + 2 r v r = 0. 19.28 (c)-machobs:

Implizite Funktionen 19-d 419 Die allgemeine Lösung ist in diesem Fall v r = b/r 2 und damit v = a + b/r, also u = a + b x 2 + y 2 + z 2. Auch in diesem Fall sind die einzigen rotationssymmetrischen und auf ganz R 3 harmonischen Funktionen die konstanten Funktionen. 19-d Implizite Funktionen Der Umkehrsatz 19 sagt aus, dass eine stetig differenzierbare Abbildung f : R n R n, w = f (x) lokal um f (x 0 ) = w 0 eine stetig differenzierbare Umkehrabbildung genau dann besitzt, wenn det Df (x 0 ) 0. In diesem Fall werden die n Koordinaten von x durch die n Gleichungen w i = f i (x 1,.., x n ), i = 1,.., n, lokal eindeutig und in stetig differenzierbarer Weise als Funktionen von w in der Nähe von w 0 bestimmt. Daher sagt man auch n Gleichungen bestimmen im Allgemeinen n Unbekannte. Nun betrachten wir in gleicher Weise eine Abbildung f : R n R m, w = f (x) mit m n. Ist m > n, so handelt es sich um ein überbestimmtes System, das nicht für alle w in der Nähe von w 0 gelöst werden kann, wenn überhaupt. Dies ist bereits bei linearen Gleichungen offensichtlich. Diesen Fall werden wir daher nicht betrachten. Bleibt der Fall m < n. Da die Anzahl der Gleichungen kleiner ist als die Anzahl der Koordinaten, spricht man von einem unterbestimmten System. Um die Darstellung zu vereinfachen, schreiben wir jetzt m + n für die Dimension des Urbildraumes, und betrachten eine Abbildung f : R n+m R m, w = f (x). Die Vermutung liegt nahe, dass hier durch m Gleichungen auch nur m Koordinaten von x bestimmt werden, während n Koordinaten noch frei gewählt werden können. Somit sind keine eindeutigen Lösungen zu erwarten, sondern Familien von Lösungen, die von n freien Koordinaten abhängen. (c)-machobs: 19.29

420 19 Mehrdimensionale Analysis Betrachten wir zuerst wieder die Linearisierung des Problems in einer Umgebung von w 0 = f (x 0 ). Statt w = f (x) betrachten wir also wobei w = w 0 + Df (x 0 )(x x 0 ), (5) ( ) fk Df (x 0 ) = (x 0 ) x l 1 k m,1 l n+m durch eine m (n + m)-matrix dargestellt wird. Diese ist natürlich nicht invertierbar. Hat sie aber maximalen Rang m, so gibt es eine Umordnung der Spalten von Df (x 0 ) derart, dass die hintere m m-untermatrix ( ) fk B = (x 0 ) x l 1 k m,n+1 l n+m maximalen Rang m hat und somit invertierbar ist. Nummerieren wir die Koordinaten entsprechend dieser Umordnung um und schreiben x = (x 1,.., x n, x n+1,.., x n+m ) = (u 1,.., u n, v 1,.., v m ) = (u, v), so geht Gleichung (5) über in w w 0 = A(u u 0 ) + B(v v 0 ), (6) wobei die Matrix A aus den verbleibenden vorderen n Spalten von Df (x 0 ) besteht. Da A regulär ist, können wir diese Gleichung nach u auflösen und erhalten v v 0 = B 1 (w w 0 ) B 1 A(u u 0 ). Für jedes feste w ist die Lösungsmenge von (6) somit der n-dimensionale affine Unterraum L(w) = { (u, v) : v v 0 = B 1 (w w 0 ) B 1 A(u u 0 ), u R n}. Die n Koordinaten u von x bestimmen somit für jedes w eindeutig die übrigen m Koordinaten v von x. Soweit das linearisierte Problem. Der Satz über implizite Funktionen sagt nun aus, dass lokal dasselbe auch für das nichtlineare Problem gilt. Um die Formulierung dieses Satzes zu vereinfachen, gehen wir davon aus, dass wir die Koordinaten bereits so nummeriert haben, dass die hintere Untermatrix von Df (x 0 ) maximalen Rang hat, und bezeichnen diese Koordinaten wie 19.30 (c)-machobs:

Implizite Funktionen 19-d 421 Abb 11 Einfacher Satz über implizite Funktionen v v 0 Γ (ϕ) U V u 0 u zuvor mit (u, v). Dementsprechend sei ( ) ( ) fk fk f u =, f v = u l v l 1 k m,1 l n 1 k,l m Auch betrachten wir zunächst nur Lösungen von w = f (x) mit festem w. 24 Einfacher Satz über implizite Funktionen (Ifs) Sei f : R n R m R m, w = f (u, v) stetig differenzierbar und f (u 0, v 0 ) = w 0. Gilt det f v (u 0, v 0 ) 0, so existieren eine Umgebung U V von (u 0, v 0 ) sowie eine stetig differenzierbare Abbildung. ϕ : U V, u v = ϕ(u), so dass { (u, v) U V : f (u, v) = w0 } = { (u, ϕ(u)) : u U }. Innerhalb des Fensters U V um (u 0, v 0 ) sind die einzigen Lösungen der Gleichung f (u, v) = w 0 also genau diejenigen, die auf dem Graphen Γ (ϕ) von ϕ liegen. Andere Lösungen gibt es in U V nicht. Insbesondere ist ϕ(u 0 ) = v 0. In diesem Sinne wird die implizite Gleichung f (u, v) = w 0 lokal nach v aufgelöst durch die stetig differenzierbare Funktion v = ϕ(u). Diese Funktion ϕ lässt sich allerdings nur in den wenigsten Fällen explizit angeben. Es handelt sich eben um eine nur implizit durch f definierte Funktion. 25 Zusatz Für die Ableitung der impliziten Funktion ϕ gilt Dϕ(u) = fv 1 u. (u,ϕ(u)) Ist außerdem f von der Klasse C r mit 1 r, so gilt dies auch für ϕ. (c)-machobs: 19.31

422 19 Mehrdimensionale Analysis Für u U gilt ja f (u, ϕ(u)) = w 0. Da f und ϕ stetig differenzierbar sind, können wir die Kettenregel 18.8 anwenden und erhalten 0 = D(f (u, ϕ(u))) = f u + f v ϕ u, wobei f u und f v an der Stelle (u, ϕ(u)) ausgewertet werden. Da aus Stetigkeitsgründen det f v 0 in einer hinreichend kleinen Umgebung U, können wir die letzte Gleichung nach ϕ u auflösen und erhalten die Behauptung. Die Regularitätsaussage folgt unmittelbar aus dem entsprechenden Ergebnis für den Umkehrsatz. Tatsächlich haben wir im vorangehenden Beweis eine stärkere Aussage bewiesen. Die Menge M = {(u, v) U V : f (u, v) = w 0 } können wir ebensogut für alle w in einer hinreichend kleinen Umgebung von w 0 betrachten. Dies führt zu folgendem Satz. 26 Allgemeiner Satz über implizite Funktionen (Ifs) Sei f : R n R m R m, w = f (u, v) stetig differenzierbar und f (u 0, v 0 ) = w 0. Gilt det f v (u 0, v 0 ) 0, so existieren Umgebungen U V von (u 0, v 0 ) und W von w 0 sowie eine stetig differenzierbare Abbildung Φ : U W V, v = Φ(u, w), so dass für jedes w W {(u, v) U V : f (u, v) = w } = {(u, Φ(u, w)) : u U }. Ist außerdem f von der Klasse C r mit 1 r, so gilt dies auch für Φ. In dem Fenster U V ist also nicht nur die Menge {f = w 0 } der Graph einer Abbildung. Dasselbe gilt auch für jede Menge {f = w} mit w in einer hinreichend kleinen Umgebung von w 0, und die Abhängigkeit von w ist ebenso regulär wie die Abbildung f. Alle diese Mengen werden durch die Abbildung Φ beschrieben. Skalare Funktionen Als erste Anwendung des Satzes über implizite Funktionen betrachten wir skalare Funktionen. Sei zunächst f : R 2 R, (x, y) f (x, y) 19.32 (c)-machobs:

Implizite Funktionen 19-d 423 Abb 12 Niveaulinien y 0 x 0 eine Funktion zweier Variablen, p 0 = (x 0, y 0 ) ein beliebiger Punkt im Definitionsbereich von f und c 0 = f (x 0, y 0 ). Wir wollen die Frage untersuchen, wie in der Nähe von p 0 die Niveaumengen f 1 (c) für c in der Nähe von c 0 aussehen. Ist f x (x 0, y 0 ) 0, so können wir die Gleichung c = f (x, y) lokal nach x auflösen und jede Niveaumenge von f um p 0 als Graph einer Funktion g : y x darstellen. Ist f y (x 0, y 0 ) 0, so können wir diese Gleichung lokal nach y auflösen und jede Niveaulinie als Graph einer Funktion h : x y darstellen. Sind beide Bedingungen erfüllt, so sind beide Darstellungen möglich. Außerdem gilt dann g (y 0 ) = f y 0, h (x 0 ) = f x 0. p0 p0 f x Das lokale Bild entspricht somit qualitativ dem in Abbildung 12. Gilt dagegen f x (x 0, y 0 ) = 0, f y (x 0, y 0 ) 0, so ist auch h (x 0 ) = 0. Die Niveaulinie durch p 0 hat somit einen Flachpunkt und sieht im Allgemeinen wie in Abbildung 13 links aus. Entsprechendes gilt, wenn die Rollen von x und y vertauscht sind. Der nächste Satz überträgt diese Betrachtungen auf Funktionen R n R. 27 Satz Sei f : R n+1 R stetig differenzierbar mit n 1 und f (p 0 ) 0. Dann ist lokal um p 0 jede Niveaufläche f 1 (c) mit c in einer hinreichend kleinen Umgebung von c 0 = f (p 0 ) darstellbar als Graph einer stetig differenzierbaren Funktion R n R. f y (c)-machobs: 19.33

424 19 Mehrdimensionale Analysis Wegen f (p 0 ) 0 ist mindestens eine partielle Ableitung von f nicht Null. Nennen wir diese Koordinate v und die restlichen n Koordinaten u, so ist der Ifs anwendbar, und lokal auf jeder Niveaufläche die Koordinate v als Funktion der Koordinaten u darstellbar. Lokal um einen Punkt p 0 mit f (p 0 ) = 0 gelten solche Aussagen nicht. Dies zeigen die folgenden beiden Beispiele. a. Betrachte φ : R 2 R, φ(x, y) = x 2 + y 2. Der Gradient von ϕ verschwindet im Nullpunkt und sonst nicht. Die Niveaumengen dieser Funktion sind Kreislinie, c > 0, φ 1 (c) = Nullpunkt, c = 0, leere Menge, c < 0. Also sind in keiner Umgebung von 0 die Niveaumengen von φ als Graphen einer Funktion darstellbar. In jedem anderen Punkt ist dies möglich: auf den beiden Koordinatenachsen gibt es jeweils eine Möglichkeit, innerhalb der vier offenen Quadranten deren zwei. b. Dasselbe gilt für ψ : R 2 R, ψ(x, y) = x 2 y 2. Die Niveaumengen dieser Funktion sind zwei Hyperbelbögen durch x-achse, c > 0, ψ 1 (c) = beide Winkelhalbierende, c = 0, zwei Hyperbelbögen durch y-achse, c < 0. Abb 13 Niveaulinien mit f y (x 0, y 0 ) = 0 respektive f x (x 0, y 0 ) = 0 y 0 y 0 x 0 x 0 19.34 (c)-machobs:

Implizite Funktionen 19-d 425 Abb 14 Niveaulinien von x 2 + y 2 mit zwei regulären Punkten φ 1 (ε) φ 1 (1) Newtonsche Bewegungsgleichungen Die klassische newtonsche Bewegungsgleichung eines reibungsfreien Teilchens der Masse 1 auf der reellen Achse unter dem Einfluss eines Potentials V : R R ist ẍ = V (x), x R. Als System erster Ordnung lauten die Gleichungen ẋ = y, ẏ = V (x). Die Gesamtenergie dieses System ist die Summe aus kinetischer und potentieller Energie, E : R 2 R, E(x, ẋ) = ẋ2 2 + V (x). Diese ist konstant entlang jeder Lösung, denn d dt E(x, ẋ) = E xẋ + Eẋẍ = V (x)ẋ ẋv (x) = 0. Abb 15 Niveaulinien von x 2 y 2 mit zwei regulären Punkten ψ 1 (1) ψ 1 ( 1) ψ 1 (0) (c)-machobs: 19.35

426 19 Mehrdimensionale Analysis Abb 16 Ein Potential V und sein Phasenportrait V c b a x ẋ E = c E = b E = a x Das ist der klassische Energieerhaltungssatz. Jede Lösungskurve ist somit in einer Niveaumenge der Energiefunktion enthalten, und die Niveaumengen liefern bereits Aufschlüsse über die Lösungen der Differenzialgleichung ẍ = V (x). Betrachte also die Niveaumengen von E. Wegen E = (V (x), ẋ) liegen kritische Punkte genau dann vor, wenn V (x) = 0 ẋ = 0. Diese entsprechen kritischen Punkten des Potentials V auf der x-achse. Alle anderen Punkte sind regulär, und die zugehörigen Niveaulinien sind reguläre, stetig differenzierbare Kurven. Wegen E(x, y) = E(x, y) verlaufen diese symmetrisch zur x-achse und schneiden die x-achse immer senkrecht, da Eẋ = 0 ẋ = 0, während an diesen Stellen V (x) 0. Mit diesen Überlegungen lässt sich bereits das sogenannte Phasenportrait zur Gleichung ẍ = V (x) vollständig beschreiben. 19.36 (c)-machobs:

Implizite Funktionen 19-d 427 Reguläre Punkte Die Formulierung des Ifs geht davon aus, dass bereits eine geeignete Zerlegung der Koordinaten in x = (u, v) vorliegt. Im Allgemeinen ist diese jedoch nicht gegeben, und oft gibt es auch mehr als eine solche Zerlegung. Wir formulieren den Ifs daher ein weiteres Mal ohne Bezug auf spezielle Koordinaten. Zentral ist hier der Begriff des regulären Punktes. Bisher hatten wir erklärt, dass ein Punkt p regulär heißt für eine stetig differenzierbare Abbildung R R f (p) 0 f : R n R genau dann, wenn f (p) 0. R n R n det Df (p) 0 Wir verallgemeinern nun diese Definition auf beliebige Abbildungen R n R m. Definition Sei f : R n R m stetig differenzierbar. Ein Punkt p im Definitionsbereich von f heißt regulärer Punkt von f, falls Df (p) surjektiv ist. Andernfalls heißt er singulärer oder kritischer Punkt von f. Bemerkungen a. Für eine C 1 -Abbildung f : R n R m ist Df (p) surjektiv genau dann, wenn rang Df (p) = m. Somit beinhaltet diese Definition die obigen Spezialfälle. b. Andererseits gilt rang Df (p) min {n, m}. Im Fall n < m kann also f keine regulären Punkte haben. c. Insbesondere haben Kurven γ : R R n für n 2 keine regulären Punkte im Sinne dieser Definition. Der früher eingeführte Begriff des regulären Punktes einer Kurve?? fällt somit nicht darunter. Der Begriff regulär wird in so vielen Kontexten verwendet, dass solche Kollisionen manchmal auftreten. 28 Niveauflächensatz Sei f : R m+n R m stetig differenzierbar mit n 1. Dann ist lokal um einen regulären Punkt jede Niveaumenge von f der Graph einer stetig differenzierbaren Abbildung ϕ : R n R m. Nach Voraussetzung ist rang Df (p) = m. Durch geeignete Nummerierung der Koordinaten können wir daher erreichen, dass die letzten m Spalten von Df (p) linear unabhängig sind. Schreiben wir jetzt x = (u, v) R n R m wie üblich, so gilt rang f v (p) = m det f v (p) 0. Wir können damit den Ifs 26 anwenden und erhalten eine Umgebung X = U V R n R m (c)-machobs: 19.37

428 19 Mehrdimensionale Analysis von p, eine Umgebung W R m Abbildung von f (p) und eine stetig differenzierbare Φ : U W V, so dass für jedes w W f 1 (w) X = {(u, v) X : f (u, v) = w } = {(u, v) X : v = Φ(u, w), u U } = Γ (Φ(, w)). Somit ist lokal um p jede Niveaumenge von f der Graph einer stetig differenzierbaren Abbildung. Bemerkung Der Satz gilt im Prinzip auch für n = 0. In diesem Fall ist der Umkehrsatz 19 anwendbar, und die Niveaumengen bestehen aus isolierten Punkten. 19-e Mannigfaltigkeiten Der Graph einer stetig differenzierbaren Funktion R R respektive R 2 R ist ein eindimensionales Kurvenstück in der Ebene beziehungsweise ein zweidimensionales Flächenstück im Raum. Nicht alle Kurven oder Flächen sind jedoch als Graphen einer einzigen Funktion darstellbar. Das zeigen schon die Kreislinie S 1 und die Sphäre S 2. Man kann diese Mengen aber als Niveaumengen einer einzigen, stetig differenzierbaren Funktion beschreiben. So können wir die n-dimensionale Einheitssphäre schreiben als S n = f 1 (1) mit f : R n+1 R, f (x) = x1 2 +.. + x2 n+1. Jeder Punkt in S n ist ein regulärer Punkt von f. Somit ist die Sphäre S n lokal immer als Graph einer Funktion R n R darstellbar 28. Der Begriff der Mannigfaltigkeit verallgemeinert diese Überlegung. 29 Definition Eine nichtleere Teilmenge M des R n+m, wobei n 0 und m 1, heißt Mannigfaltigkeit der Kodimension m, wenn es eine offene Umgebung U von M in R n+m und eine C 1 -Abbildung f : U R m ohne singuläre Punkte gibt, so dass M = f 1 (0) = {x U : f (x) = 0}. 19.38 (c)-machobs:

Mannigfaltigkeiten 19-e 429 Abb 17 Keine Mannigfaltigkeiten Bemerkungen a. Der Wert 0 hat keine besondere Bedeutung und kann durch jeden anderen Wert ersetzt werden. b. Mannigfaltigkeiten der Kodimension 1 werden auch Hyperflächen genannt. Im R 2 und R 3 spricht man von Kurven respektive Flächen. c. Im Fall n = 0 besteht M aus isolierten Punkten. Es ist aber sinnvoll, auch solche Objekte als Mannigfaltigkeiten zu betrachten. d. Genauer haben wir hier gleichungsdefinierte Untermannigfaltigkeiten des R n+m definiert. Der differenzialtopologische Begriff der Mannigfaltigkeit ist wesentlich allgemeiner. Bevor wir zu den Beispielen kommen, stellen wir fest, dass lokal jede Mannigfaltigkeit wie der Graph einer Funktion aussieht. 30 Satz Eine Mannigfaltigkeit M im R n+m der Kodimension m ist lokal um jeden Punkt der Graph einer C 1 -Abbildung ϕ : R n R m. Sei M = f 1 (0) mit einer C 1 -Abbildung f : R n+m R m ohne singuläre Punkte. Somit ist jeder Punkt p in M ein regulärer Punkt von f, und die Behauptung folgt mit dem Niveauflächensatz 28. Man kann jede solche Abbildung ϕ wie im vorangehenden Satz als ein lokales Koordinatensystem auf M betrachten. Die Anzahl n dieser Koordinaten ist überall dieselbe und wird als Dimension der Mannigfaltigkeit M bezeichnet. Ihre Kodimension m ist die Anzahl der Gleichungen, durch die M bestimmt wird. Die Summe aus Dimension und Kodimension einer Mannigfaltigkeit ist immer die Dimension des Gesamtraumes. Dies gilt auch für die Dimension 0. Eine 0-dimensionale Mannigfaltigkeit ist eine Menge isolierter Punkte. Ihre Kodimension ist die Dimension des Gesamtraumes. Die geometrischen Gebilde in Abbildung 17 sind dagegen keine Mannigfaltigkeiten, denn solche besitzen keine Ecken, keine Selbstschnitte, und haben überall dieselbe Dimension. (c)-machobs: 19.39

430 19 Mehrdimensionale Analysis 31 a. Die Menge M = {1/n : n 1} ist eine 0-dimensionale Mannigfaltigkeit in R, die Menge M {0} dagegen nicht. b. Ist f : R R regulär, so ist jede nichtleere Menge f 1 (c) eine 0-dimensionale Mannigfaltigkeit, nämlich genau ein Punkt. c. Die Sphären S n R n+1 sind Mannigfaltigkeiten der Dimension n und Kodimension 1. Dies gilt auch für S 0 = { 1, 1} als Teilmenge von R. d. Ist A : R n+m R m linear und surjektiv, so ist der lineare Vektorraum A 1 (0) = ker A eine Mannigfaltigkeit der Dimension n und Kodimension m. e. Für 0 s n ist R s R s {0} R n eine Mannigfaltigkeit der Dimension s und Kodimension n s. f. Der Graph einer C 1 -Abbildung ϕ : R n R m, v = ϕ(u) ist eine n-dimensionale Mannigfaltigkeit im R n+m. Denn ist Ω R n der offene Definitionsbereich von ϕ, so ist U = Ω R m offen in R n R m R n+m und f : U R m, f (u, v) = v ϕ(u) stetig differenzierbar. Wegen f v = Id sind alle Punkte von f regulär, und es ist Γ (ϕ) = {(u, v) U : v = ϕ(u)} = {(u, v) U : f (u, v) = 0} = f 1 (0). Also ist der Graph von ϕ eine n-dimensionale Mannigfaltigkeit in R n+m. 32 Hyperboloid und Kegel Betrachte die Funktion f : R 3 R, f (x, y, z) = x 2 + y 2 z 2, und ihre Niveaumengen M c = f 1 (c) = {(x, y, z) : x 2 + y 2 z 2 = c}. Jeder Punkt mit Ausnahme des Koordinatenursprungs ist ein regulärer Punkt von f, und dieser liegt auf M 0. Daher ist jede Menge M c mit c 0 eine Mannigfaltigkeit der Kodimension 1 und Dimension 2, also eine Fläche im R 3. Für c > 0 ist dies ein einschaliges Hyperboloid, für c < 0 ein zweischaliges Hyperboloid. Für c = 0 erhält man einen Kegel, der aufgrund seiner Spitze im Nullpunkt keine Mannigfaltigkeit bildet. Reguläre Werte Die Definition einer Mannigfaltigkeit M = f 1 (0) verlangt von der definierenden Funktion f mehr als tatsächlich erforderlich ist. Es genügt, dass jeder 19.40 (c)-machobs:

Mannigfaltigkeiten 19-e 431 Abb 18 Einschaliges Hyperboloid, Kegel, und zweischaliges Hyperboloid Punkt auf M selbst ein regulärer Punkt von f ist. Dies führt zum Begriff des regulären Wertes. Wie zuvor sei n 0 und m 1. Definition Sei f : R n+m R m stetig differenzierbar. Ein Punkt w R m heißt regulärer Wert von f, wenn die Menge f 1 (w) entweder leer ist oder nur aus regulären Punkten besteht. Andernfalls heißt w ein singulärer oder kritischer Wert von f. Bemerkungen a. Ein regulärer Punkt ist also ein Punkt im Definitionsbereich, ein regulärer Wert ein Punkt im Wertebereich einer Funktion. b. Der Wert eines regulären Punktes muss kein regulärer Wert sein, denn auch nichtreguläre Punkte können auf denselben Wert abgebildet werden siehe Abbildung 19. c. Ob w ein regulärer Wert von f ist, hängt auch vom Definitionsbereich der Funktion ab. Für die Funktion f : (x, y, z) x 2 + y 2 z 2 des letzten Beispiels 32 ist 0 kein regulärer Wert, da 0 f 1 (0), f (0) = 0. Entfernen wir den Nullpunkt aus dem Definitionsbereich, wird 0 ein regulärer Wert. Die zugehörige Niveaufläche ist ein Kegel ohne seine Spitze, und diese Menge ist eine Mannigfaltigkeit. Mit diesem Begriff erhalten wir folgende äquivalente Charakterisierung einer Mannigfaltigkeit. 33 Satz Eine nichtleere Teilmenge M des R n+m ist eine Mannigfaltigkeit der Dimension n genau dann, wenn es eine C 1 -Funktion f : R n+m R m mit regulärem Wert 0 gibt, so dass M = f 1 (0). (c)-machobs: 19.41

432 19 Mehrdimensionale Analysis Abb 19 Zwei kritische Punkte, zwei reguläre Punkte sowie zwei kritische Werte w 2 w 1 r 1 c 1 c 2 r 2 Ist M = f 1 (0) eine Mannigfaltigkeit im Sinne unserer Definition 29, so ist insbesondere jeder Punkt in f 1 (0) ein regulärer Punkt und damit 0 selbst ein regulärer Wert von f. Sei umgekehrt 0 ein regulärer Wert von f. Dann ist jeder Punkt p in M = f 1 (0) ein regulärer Punkt von f und damit Df (p) surjektiv. Dies ist äquivalent mit der Eigenschaft, dass die Determinante einer geeigneten Auswahl von m Spalten von Df (p) nicht verschwindet. Diese Determinante hängt stetig von p ab und ist somit auch auf einer offenen Umgebung von p nicht Null. Es existiert also zu jedem p M eine Umgebung U(p) in R n+m, so dass rang Df (x) = m, x U(p). Setzen wir jetzt U = p M U(p), so erhalten wir eine m umfassende offene Menge U ohne singuläre Punkte von f. Also ist M eine Mannigfaltigkeit im Sinne unserer Definition 29. Vereinbarung Im Folgenden heiße eine nichtleere Teilmenge M des R n+m eine f-definierte Mannigfaltigkeit, wenn f : R n+m R m stetig differenzierbar mit regulärem Wert 0 ist und M = f 1 (0) gilt. Tangentialraum und Normalraum Jedem Punkt p einer Mannigfaltigkeit M können wir Tangentialvektoren zuordnen. Dazu betrachten wir beliebige Kurven auf M durch p und deren Geschwindigkeitsvektoren in diesem Punkt. 34 Definition Ein Vektor v R n+m heißt Tangentialvektor an M im Punkt p, wenn es eine C 1 -Kurve γ : R M gibt mit γ(0) = p, γ(0) = v. 19.42 (c)-machobs:

Mannigfaltigkeiten 19-e 433 Abb 20 Zum Tangentialraum w 2 w 1 p γ 1 γ 2 M ϕ q u 1 R n u 2 Die Menge aller Tangentialvektoren an M im Punkt p heißt der Tangentialraum von M an p und wird mit T p M bezeichnet. Der Raum T p M ist ein Vektorraum derselben Dimension wie M : 35 Satz Sei M eine f-definierte Mannigfaltigkeit im R n+m. Dann ist T p M = ker Df (p), p M. Insbesondere ist jeder Tangentialraum T p M ein Vektorraum mit derselben Dimension wie M. Der Beweis ist leider etwas umständlich. Zu jedem Tangentialvektor v T p M existiert definitionsgemäß eine C 1 -Kurve γ : R M mit γ(0) = p und γ(0) = v. Also ist f γ 0 und damit auch 0 = (f γ). (0) = Df (p) γ(0) = Df (p)v. Also ist v ker Df (p). Da dies für jedes v T p M gilt, folgt T p M ker Df (p). (7) Um auch die umgekehrte Inklusion zu zeigen, konstruieren wir eine Basis in ker Df (p). Sei dazu wieder x = (u, v) eine geeignete Nummerierung der Koordinaten so, dass M lokal um p als Graph einer Abbildung ϕ : R n R m, u v = ϕ(u) mit p = (q, ϕ(q)) dargestellt werden kann. Betrachte dann die Bilder der Koordinatenachsen durch q, also die Kurven γ i : R M, γ i (t) = (q + te i, ϕ(q + te i )), 1 i n. (c)-machobs: 19.43