Skript zur Vorlesung Analysis 2
|
|
|
- Erika Thomas
- vor 6 Jahren
- Abrufe
Transkript
1 Skript zur Vorlesung Analysis 2 Sommersemester 213 Prof. Dr. Benjamin Schlein Inhaltsverzeichnis 1 Fourier-Reihen 2 2 Gewöhnliche Differentialgleichungen Differentialgleichungen erster Ordnung, elementare Lösungsmethoden Existenz und Eindeutigkeit Differentialgleichungen höherer Ordnung Lineare Differentialgleichungen Lineare Differentialgleichungen mit konstanten Koeffizienten Grundlagen der Stabilitätstheorie Differentialrechnung in mehreren Veränderlichen Definition der Ableitung für Funktionen auf R n Mittelwertsatz Höhere Ableitungen, Taylor Entwicklung, lokale Extrema Umkehrabbildung und Satz über implizite Funktionen Mannigfaltigkeiten in R n Extrema mit Nebenbedingungen Integrale, die von einem Parameter abhängen Konservative Vektorfelder Holomorphe Funktionen
2 1 Fourier-Reihen Wir betrachten in diesem Kapitel periodische Funktionen. Eine Funktion f : R C heisst periodisch, mit Periode T >, falls f(t + T ) = f(t) für alle t [; T ). Jede auf [; T ) definierte Funktion f kann durch die Definition f(t + kt ) := f(t) für alle k Z, und alle t [; T ) periodisch fortgesetzt werden. Ein wichtiges Beispiel einer periodischen Funktion ist die Exponentialfunktion f(t) = e it. f hat die Periode T = 2π, weil e i(t+2π) = e it e 2πi = e it für alle t [; 2π). T = 2π ist die Fundamentalperiode der Funktion f, d.h. es existiert keine Periode T > mit T < T. Für j Z ist die Funktion f(t) = e ijt auch periodisch. Die Fundamentalperiode von f(t) = e ijt ist 2π/ j. T = 2π ist auch eine Periode von f(t) = e ijt, für alle j Z. In der Tat e ij(t+2π) = e ijt e 2πij = e ijt für alle j Z. {e ijt } j Z ist damit eine unendliche Familie von 2π-periodischen Funktionen. Analog, für ein beliebiges L >, ist {e ijt/l } j Z eine unendliche Familie von Funktionen mit Periode T = 2π/L. Lemma 1.1. Seien j, k Z. Dann gilt 2π { e ikx e ijx 2π falls j = k dx = sonst Bemerkung (aus Analysis 1): eine C-wertige Funktion f : [a; b] C ist integrierbar, falls Re f und Im f integrierbar sind. In diesem Fall definieren wir b a fdx = b a Re f(x)dx + b a Im f(x)dx Beweis: Wir haben e ikx e ijx = e i(k j)x = cos((k j)x) + i sin((k j)x). Für k j gilt und analog, 2π cos((k j)x) dx = 1 (sin(2π(k j)) sin()) = k j 2π Dagegen, für k = j ist e i(k j)x = 1 und 2π sin((k j)x) dx = e i(k j)x dx = 2π 2
3 Definition 1.2. Sei f : R C eine 2π-periodische Funktion, auf [; 2π] integrierbar. Für ein beliebiges j Z ist dann die Funktion e ijx f(x) auch 2π-periodisch und auf [; 2π] integrierbar. Wir definieren den j-ten Fourierkoeffizienten von f durch f(j) = 1 2π 2π f(x)e ijx dx Weiter, für N N, definieren wir die N-te Fourier Partialsumme (F N f)(x) = N j= N f(j) e ijx Konvergiert die Folge (F N f)(x) für N, dann wird der Grenzwert durch (Ff)(x) = j= f(j)e ijx = lim N (F Nf)(x) bezeichnet. (Ff) wird die Fourier-Reihe von f genannt. Wir werden sehen, dass unter geeigneter Annahme der Funktion f, die Fourier-Reihe von f mit f übereinstimmt; die Fourier-Reihe gibt also eine nützliche Darstellung von periodischen Funktionen als Limes von Linearkombinationen von den Funktionen e ijx (ähnlich wie die Taylorreihe eine nützliche Darstellung von analytischen Funktionen gibt). Um zu zeigen, dass Ff = f gilt, brauchen wir das folgende Lemma. Lemma 1.3 (Lemma von Riemann-Lebesgue). Sei f : [a; b] C integrierbar. Dann gilt lim k b a e ±ikx f(x)dx = Bemerkung: Die Idee hinter dem Lemma von Riemann-Lebesgue ist die folgende: Die Funktion e ikx hat (Fundamental-) Periode 2π/k. Deswegen gilt I eikx dx = für jedes Intervall der Länge 2π/k. Wenn wir annehmen können, dass f auf diesen kleinen Intervallen näherungsweise konstant ist, dann muss auch I f(x)eikx dx näherungsweise verschwinden. Da wir [a; b] in kleine Intervalle der Länge (2π)/k zerlegen können, muss auch das Integral b a f(x)eikx dx klein sein. Wenn man eine reguläre Funktion f betrachtet, dann kann man die Aussage des Riemann-Lebesgue Lemmas verfeinern. Ist f m-mal differenzierbar, dann existiert eine Konstante C m mit b f(x)e ikx dx C m k m a Wir werden zurück zur Beziehung zwischen Regularität und Abfall von oszillierenden Integralen in den Übungen kommen. Beweis: O.B.d.A. betrachten wir eine reelwertige Funktion f : [a; b] R. Sei ε > fest gewählt. Aus Analysis 1 (Proposition 9.3) existiert eine Teilung T = {a = x < x 1 < < x n = b} von [a; b], mit S(T ) ε b 2 f(x)dx S(T ) a 3
4 D.h. es existieren h j = sup x [xj 1 ;x j ] f(x j ), mit h j (x j x j 1 ) ε b 2 f(x)dx j=1 a h j (x j x j 1 ) Mit anderen Worten, für beliebige ε > existiert eine Treppenfunktion g(x) := j=1 h j 1 [xj 1 ;x j )(x) j=1 auf [a; b] mit g(x) f(x) für alle x [a; b] und b a g(x) f(x) dx = b a (g(x) f(x)) ε/2 (1) Hier benutzen wir die Notation 1 I (x) für die charakteristische Funktion des Intervalls I, definiert durch 1 I (x) = 1, falls x I und 1 I (x) =, falls x I. b a Nun bemerken wir, dass g(x)e ikx dx = und damit b h j 1 [xj 1 ;x j ](x)e ikx = j=1 a b a xj h j j=1 g(x)e ikx dx 2 k x j 1 e ikx dx = h j für k (oder k ). Also existiert K > gross genug, mit b für alle k > K. Aus (1) bekommen wir b a a j=1 g(x)e ikx dx ε 2 j=1 f(x)e ikx b dx (f(x) g(x))e ikx b dx + g(x)e ikx dx a a b b f(x) g(x) dx + g(x)e ikx dx ε a a h j e ikx j e ikx j 1 ik Satz 1.4. Sei f : R C (2π)-periodisch und differenzierbar. Dann gilt für alle x [; 2π]. lim (F Nf) (x) = f(x) N 4
5 Beweis: Es gilt Aus Lemma 1.1 gilt Damit F N f(x) = N k= N f(k)e ikx = 1 2π 2π f(x) = 1 2π 2π F N f(x) f(x) = 1 2π 2π = 1 2π 2π x x = 1 π 2π π dtf(x) N k= N dtf(t) dt (f(t) f(x)) N k= N e ik(x t) N k= N ds (f(x + s) f(x)) ds (f(x + s) f(x)) e ik(x t) e ik(t x) N k= N N k= N e iks e iks wobei wir die Periodizität von f und e iks im letzten Schritt benutzt haben. Wir berechnen nun N k= N Damit gilt Wir definieren e iks = e ins ( 1 + e is + + e 2iNs) = e ins eis(2n+1) 1 e is 1 F N f(x) f(x) = 1 π f(x + s) f(x) ds 2π π sin s/2 g(s) := { f(x+s) f(x) sin(s/2) falls s 2f (x) falls s = Da f differenzierbar ist, ist g stetig bei s =,weil = sin((n + 1/2)s) f(x + s) f(x) f(x + s) f(x) s/2 lim = 2 lim s sin(s/2) s s sin(s/2) = 2f (x) sin(s(n + 1/2)) sin s/2 f differenzierbar impliziert insbesondere, dass f stetig ist. Damit ist g auf [ π; π] stetig, und deswegen sicher integrierbar. Lemma 1.3 impliziert also, dass π ds g(s) sin((n + 1/2)s) = 1 [ π π ] dsg(s)e is(n+1/2) dsg(s)e is(n+1/2) π 2i π π für N. Wir haben in Satz 1.4 die punktweise Konvergenz der Fourier-Reihe gegen f. Unter der Annahme, dass f differenzierbar ist, ist die Konvergenz eigentlich gleichmässig. Um das zu zeigen, werden wir die zwei folgenden Lemmata brauchen. 5
6 Lemma 1.5. Sei f C 1 (R; C) 2π-periodisch. Wie üblich bezeichnen wir mit f(j) die Fourier Koeffizienten von f. Weiter bezeichnen wir mit f (j) die Fourier Koeffizienten von f. Es gilt f (j) = ij f(j) Proof. Durch partielle Integration bekommen wir f (j) = 1 2π 2π f (x)e ijx dx = f(2π) f() 2π + ij 2π dxf(x)e ijx = ij 2π f(j) Lemma 1.6. Sei f : R C 2π-periodisch. Dann gilt und 2π f(x) F N f(x) 2 dx = 2π Beweis: Wir berechnen 2π f(x) F N f(x) 2 dx = F N f(x) 2 = 2π = = 2π 2π dx ( 2π N k= N f(x) f(x) 2 dx + N j= N 2π Das zeigt (2). Analog finden wir 2π f(j) f(x) 2 dx 2π f(x) 2 dx 2π f(k) 2 N k= N N j,k= N f(x)e ijx N j= N 2π N k= N f(k) 2 (2) f(x) 2 (3) f(k)e ikx ) f(x) N j= N 2π f(j) f(k) dxe ix(j k) f(j) 2 N k= N f(j)e ijx 2π f(k) f(x)e ikx dx 2π F N f(x) 2 = N j= N 2π f(k) f(j) dxe ix(j k) = 2π N j= N f(j) 2 Aus (2) folgt nun (3). Satz 1.7. Sei f C 1 (R; C) 2π-periodisch. Dann konvergiert die Funktionenfolge F N f f gleichmässig, für N. Beweis: Wir haben schon punktweise Konvergenz gezeigt, d.h. f(x) = lim N F Nf(x) = lim N N j= N f(j)e ijx = f(j)e ijx. j= 6
7 Es gilt N k= N k f(k) 2 = N k= N f (k) 2 1 2π f (x) 2. 2π Damit konvergiert die Summe k= k 2 f(k) 2 absolut. Wir erhalten ( F N f(x) f(x) = f(k)e ikx + f( k)e ikx) k=n+1 k=n+1 k=n+1 ( f(k) + f( k) ) k 2 ( f(k) 2 + f( k) 2) + k=n+1 1 k 2 für N. Hier haben wir die Ungleichung 2 f(k) k 2 + k 2 f(k) 2 benutzt. Was können wir nun sagen über die Fourier-Reihe, falls die periodische Funktion f nicht differenzierbar ist? Im nächsten Satz zeigen wir, dass wir immer noch Konvergenz von F N f gegen f haben, aber in einem schwächeren Sinn; wir erhalten nämlich Konvergenz im Sinn von quadratischem Mittel. Satz 1.8. Sei f : R C 2π periodisch und über [; 2π] integrierbar. Dann gilt und die Parsevalsche Identität 2π lim N dx f(x) F N f(x) 2 = (4) lim N N k= N f(k) 2 = 1 2π f(x) 2 dx 2π Ist f differenzierbar, so folgt (4) aus der gleichmässigen Konvergenz F N f f. Im Allgemeinen zeigen wir (4) indem wir zunächst f durch eine differenzierbare Funktion approximieren. Dazu benutzen wir das folgende Lemma. Lemma 1.9. Sei f : R C 2π-periodisch und auf [; 2π] integrierbar. Sei ε >. Dann existiert g C 1 (R; C), 2π-periodisch, so dass 2π f g 2 dx ε Beweis: Sei K := sup x [;2π) f(x) <. Wie im Beweis von Lemma 1.3, finden wir zunächst eine Teilung = x < x 1 < < x n = 2π, und eine Treppenfunktion h(x) = n j=1 h j1 [xj ;x j 1 )(x) mit h j K für alle j = 1,..., n, so dass 2π f(x) h(x) dx ε 8K. 7
8 Dann gilt f(x) h(x) f(x) + h(x) 2K und damit 2π f(x) h(x) 2 dx 2K 2π f(x) h(x) dx ε 4. Nun approximieren wir für ein beliebiges j {1,..., n} die charakteristische Funktion 1 [xj 1 ;x j ) durch eine differenzierbare Funktion. Wir setzen δ = ε/4 n j=1 h2 j. Ist x j x j 1 < δ dann setzen wir einfach θ j (x) =. Sonst setzen wir falls x [; x j 1 ] sin 2 ((x x j 1 )π/δ) falls x [x j 1 ; x j 1 + δ/2] θ j (x) = 1 falls x [x j 1 + δ/2; x j δ/2] sin 2 ((x x j )π/δ) falls x [x j δ/2; x j ] falls x [x j, 2π] Wir setzen θ j durch Periodizität auf R fort. Nach einfacher Rechnungen ist θ j C 1 (R), 2π-periodisch, mit Weiter 2π θ j (x) 1 [xj 1 ;x j )(x) 2 δ = ε 4 n j=1 h2 j Wir definieren nun g(x) = n j=1 h jθ j (x). Offenbar gilt g C 1 (R), 2π-periodisch. h(x) g(x) = j=1 ) h j (1 [xj 1 ;x j )(x) θ j (x). Da die verschiedenen Summanden auf disjukten Intervallen getragen werden, gilt auch und damit 2π Das gibt 2π h(x) g(x) 2 = h(x) g(x) 2 dx = j=1 h 2 j j=1 2π h 2 j 1 [xj 1 ;x j )(x) θ j (x) 2 1 [xj 1 ;x j )(x) θ j (x) 2 dx δ h 2 j ε 4 2π 2π f(x) g(x) 2 dx 2 f(x) h(x) 2 dx + 2 h(x) g(x) 2 dx ε Hier haben wir benutzt, dass f(x) g(x) f(x) h(x) + h(x) g(x) und also, dass f(x) g(x) 2 ( f(x) g(x) + g(x) h(x) ) 2 2 f(x) g(x) g(x) h(x) 2. j=1 8
9 Beweis von Satz 1.8: Sei ε > festgewählt. Dann finden wir g C 1 (R; C) mit f(x) g(x) 2 dx < ε 9 Das impliziert auch, dass F N f(x) F N g(x) 2 = F N (f g)(x) 2 f(x) g(x) 2 ε 9 Weiter, da g differenzierbar ist, gilt F N g g gleichmässig. Aus Analysis 1 (Satz 9.13) folgt, dass F N g(x) g(x) 2 dx für N. Für N gross genug ist also F N g(x) g(x) 2 dx ε 9 Insgesamt, F N f(x) f(x) 2 dx ( f(x) g(x) + g(x) F N g(x) + F N g(x) F N f(x) ) 2 dx 3 f(x) g(x) 2 dx + 3 g(x) F N g(x) 2 dx + 3 F N g(x) F N f(x) 2 dx ε falls N gross genug ist. Bemerkungen: 2π-periodische Funktionen können als Funktionen auf dem Einheitskreis S 1 = {e iϕ : ϕ R} gedacht werden. Ganz ähnlich kann man auch periodische Funktionen mit einer beliebigen Periode L > betrachten (solche Funktionen werden mit Funktionen auf dem Kreis von Radius L/2π identifiziert werden). In diesem Fall wird die Fourier-Reihe durch die Funktionen {e 2πijx/L } j Z definiert. Sei V := {f : R C : f 2π-periodisch und auf [; 2π] stetig} Es ist einfach zu sehen, dass V ein unendlich dimensionaler Vektorraum ist. Für f, g V definieren wir das Skalarprodukt f, g = 2π f(x)g(x) 9
10 Die Funktionen {e ijx } j Z sind wegen Lemma 1.1 ein Orthonormalsystem auf V bezüglich dem Skalarprodukt.,.. Satz 1.8 besagt dann, dass {e ijx } j Z eine Orthonormalbasis von V ist, d.h., dass jedes Element von V beliebig gut durch endliche lineare Kombinationen von den orthonormal Funktionen {e ijx } j Z approximiert werden kann. Die Fourier-Reihe f(x) = f j= (j)e ijx gibt dann einfach die Darstellung von f als Grenzwert von endlichen linearen Kombinationen der Basis-Funktionen. Die Fourierkoeffizienten werden deswegen durch die Produkte f (j) = e ijx, f gegeben. Bemerke, dass V bezüglich der vom Skalarprodukt induzierten Metrik nicht vollständig ist. Um dieses Problem zu lösen, kann man die Vervollsändigung Ṽ von V betrachten (jeder Skalarproduktraum kann vervollständigt werden). Ṽ ist ein Vektorraum, mit einem Skalarprodukt [.,.] so, dass: 1) Ṽ vollständig, bezüglich der von [.;.] induzierten Metrik ist, 2) V kann mit einem dichten Unterraum von Ṽ identifiziert werden, 3) Für f, g V gilt [f; g] = f; g. Ṽ ist ein sogenannter Hilbertraum (ein Skalarproduktraum, der vollständig ist, bezüglich der aus dem Skalarprodukt induzierten Metrik); es wird mit L 2 ([; 2π]) bezeichnet. Mehr zu diesem Thema in der Vorlesung Funktionalanalysis. Ein Grund, warum Fourier-Reihen sehr nützlich sind, ist die Tatsache, dass Ableitungen auf Fourierkoeffizienten sehr einfach wirken. Aus Lemma 1.5 folgt, dass die Fourierkoeffizienten von f (m) (x) einfach durch (ij) m ˆf(j) gegeben sind. Differentialoperatoren sind, in diesem Sinn, diagonal im Fourierraum (wo die Funktion f durch ihre Fourierkoeffizienten { ˆf(j)} j Z parametrisiert wird). 2 Gewöhnliche Differentialgleichungen Differentialgleichungen sind Gleichungen, bei denen die Unbekannten Funktionen sind. Die Differentialgleichung definiert eine Beziehung zwischen den gesuchten Funktionen und ihren Ableitungen. Gewöhnliche Differentialgleichugen (auf Englisch ordinary differential equations oder einfach ODEs) sind Differentialgleichungen, wo die unbekannten Funktionen einer einzelnen reellen Variablen sind. Bei partiellen Differentialgleichungen sind dagegen die unbekannten Funktionen von mehreren Variablen. Hier werden wir nur gewöhnliche Differentialgleichungen betrachten (partielle Differentialgleichungen werden erst im vierten Semester untersucht). Differentialgleichungen haben sehr viele Anwendungen. Die ganze Physik wird z.b. durch Differentialgleichungen formuliert: Die Newtonsche Gleichung der klassischen Mechanik, die Maxwell Gleichungen der Elektrodynamik, die Schrödingergleichung der Quantenmechanik, die Einsteingleichung der allgemeinen Relativitätstheorie sind alle Beispiele von Differentialgleichungen. Dabei ist nur die Newtonsche Gleichung eine gewöhnliche Differentialgleichung, die anderen sind partielle Differentialgleichungen. Die Newtonsche Gleichung beschreibt die Bewegung von Teilchen und Körpern unter der Wirkung von Kräften. Seien x(t) = (x 1 (t), x 2 (t), x 3 (t)) R 3 die Koordinaten eines Teilchens mit Masse m zur Zeit t. Sei F (x) = (F 1 (x), F 2 (x), F 3 (x)) ein Kraftfeld. D.h. F (x) ist die Kraft, die im Punkt x auf das Teilchen wirkt. Dann besagt die Newtonsche Gleichung, dass die Beschleunigung des Teilchens, die aus der zweiten Ableitung x (t) gegeben ist, proportional zur wirkenden Kraft ist. Genauer, mx (t) = F (x(t)) (5) 1
11 Die Ableitung der vektorwertigen Funktion x(t) ist komponentenweise zu verstehen; d.h. x (t) = (x 1 (t), x 2 (t), x 3 (t)). Um die Trajektorie der Teilchen zu bestimmen, muss man also eine Funktion x(t) finden, so dass für alle t erfüllt ist. Z.B., die Erde bewegt sich unter der Wirkung des Gravitationsfelds der Sonne. In einem Koordinatensystem, wo die Sonne an der Stelle x = liegt, ist die Gravitationkraft, die die Sonne auf einem Körper der Masse m ausübt aus F (x) = Gm x x 3 gegeben, für eine geeignete Konstante G. Bezeichnet also x(t) die Position der Erde zur Zeit t, so muss x(t) die Gleichung mx (t) = Gm x x 3 x (t) = G x x 3 (6) erfüllen. Diese Differentialgleichung hat mehrere Lösungen. Die Lösung kann eindeutig festgestellt werden, falls man geeignete Anfangsbedingungen spezifiziert. Schon Kepler hat herausgefunden, dass Lösungen von (6) immer auf einer Ebene bleiben und Ellypsen, Hyperbeln oder Parabeln beschreiben (für die Erde ist die Lösung eine Ellypse). Gewöhnliche Differentialgleichungen werden nach ihrer Ordnung klassifiziert; die Ordnung der Differentialgleichung ist die Ordnung der höchsten Ableitung in der Gleichung. Eine Differentialgleichung erster Ordnung ist eine Differentialgleichung der Form y (x) = f(x, y(x)) für die n unbekannten Funktionen y(x) = (y 1 (x),..., y n (x)) einer reellen Variable x R. Eine Differentialgleichung m-ter Ordnung hat die Form y (m) (x) = f(x, y(x), y (x),..., y (m 1) (x)). Die Lösung einer Differentialgleichung ist normalerweise nicht eindeutig. Sie wird aber oft eindeutig durch Spezifizierung von geeigneten Anfangsbedingungen. Z.B. eine Gleichung erster Ordnung für die n unbekannten Funktionen y(x) = (y 1 (x),..., y n (x)) wird oft eindeutig, falls wir die Bedingung y(x ) = (y () 1,..., y() n ) für ein x R und für einen Vektor (y () 1,..., y() n ) R n verlangen. Gleichungen höherer Ordnung brauchen natürlich mehr Anfangsbedingungen. Eine Gleichung m-ter Ordnung wird oft eindeutig, falls wir Anfangsbedingungen für y, y,..., y (m 1) verlangen. Eine Differentialgleichung mit Anfangsbedingungen wird als ein Anfangswertproblem oder ein Cauchy-Problem bezeichnet. Bei der Untersuchung von gewöhnlichen Differentialgleichungen werden für uns die folgenden Fragen eine wichtige Rolle spielen: Existiert eine Lösung der Differentialgleichung? Ist die Lösung unter Berücksichtigung von geeigneten Anfangsbedingungen eindeutig (d.h. ist die Lösung des Anfangswertproblems eindeutig)? Ist es möglich die Lösung explizit zu finden? Welche Methoden können verwendet werden, um die Lösung einer Differentialgleichung zu finden? Wie hängt die Lösung von den Anfangsbedingungen ab (Stabilitätstheorie für Differentialgleichungen)? Wir werden sehen, es ist nur selten möglich die Lösung einer Differentialgleichung explizit zu schreiben. Dagegen können Existenz und Eindeutigkeit der Lösungen unter allgemeinen Voraussetzungen gezeigt werden. 2.1 Differentialgleichungen erster Ordnung, elementare Lösungsmethoden Wir betrachten hier gewöhnliche Differentialgleichungen erster Ordnung. 11
12 Definition 2.1. Sei n 1, U R n+1, f C(U; R n ). Dann ist y (x) = f(x, y(x)) (7) eine gewöhnliche Differentialgleichung erster Ordnung. Eine Lösung dieser Differentialgleichung auf einem Intervall I R ist eine Funktion y C 1 (I; R n ) so, dass (x, y(x)) U und (7) erfüllt für alle x I ist. Für x R, y R n mit (x, y ) U heisst { y (x) = f(x, y(x)) y(x ) = y (8) ein Anfangswertproblem oder ein Cauchy-Problem. Eine Lösung des Anfangswertproblems (8) ist eine Lösung der Differentialgleichung (7), die auch die Anfangsbedingung y(x ) = y erfüllt (insbesondere muss x I sein). Ist n = 1, so heisst die Differentialgleichung skalar (die gesuchte Funktion hat Werten in R). Ist dagegen n > 1, so heisst die Differentialgleichung vektoriell (man spricht in diesem Fall von einem System von Diferentialgleichungen). Wir betrachten ein paar Beispiele von Differentialgleichungen, wo die Lösungen explizit berechnet werden können (der Einfachheit halber betrachten wir hier Beispiele von skalaren Gleichungen; wir werden einige Beispiele von vektoriellen Gleichungen später betrachten, wenn wir lineare Differentialgleichungen untersuchen werden). Beispiele: Sei n = 1, I R ein offenes Intervall, U = I R, und f(x, y) = g(x) (unabhängig von y), für ein g C(I). Wir betrachten die Differentialgleichung ϕ (x) = g(x) Sei G C 1 (I) eine Stammfunktion von g, mit G = g. Dann ist G eine Lösung der Differentialgleichung. Sei ϕ eine andere Lösung der Differentialgleichung. Dann gilt (ϕ G) (x) = für alle x I. Das zeigt, dass jede Lösung die Form ϕ(x) = G(x)+c hat, für eine Konstante c R. Betrachten wir nun das Anfangswertproblem { ϕ (x) = g(x) ϕ(x ) = y für ein x I und ein y R. Die Lösung des Anfangswertproblems ist insbesondere die Lösung der Differentialgleichung und hat deswegen die Form Die Bedingung ϕ(x) = G(x) + c y = ϕ(x ) = G(x ) + c c = y G(x ) bestimmt die Konstante c eindeutig. Die einzige Lösung des Anfangswertproblems ist aus ϕ(x) = G(x) G(x ) + y 12
13 gegeben. Bemerke, dass die eindeutige Lösung auch als geschrieben werden kann. ϕ(x) = y + x x g(t)dt Sei wieder n = 1, U = R 2, und f(x, y) = y. Die Differentialgleichung (7) nimmt dann die Form ϕ (x) = ϕ(x) (9) Die Funktion ϕ(x) = ce x erfüllt diese Differentialgleichung auf R, für beliebige c R. Wir behaupten jede Lösung auf R hat diese Form. Sei in der Tat ϕ eine Lösung von (9) auf R. Dann gilt d dx (ex ϕ(x)) = e x (ϕ(x) + ϕ (x)) = für alle x R. Es existiert also eine Konstante c R mit e x ϕ(x) = c für alle x R, d.h. mit ϕ(x) = ce x für alle x R. Betrachten wir nun das Anfangswertproblem { ϕ (x) = ϕ(x) ϕ(x ) = y für x, y R. Die Lösung des Anfangswertproblem hat die Form y(x) = ce x. Die Anfangsbedingung y(x ) = y bestimmt die Konstante c R durch y = y(x ) = ce x c = y e x Die eindeutige Lösung des Anfangswertproblems ist also y(x) = y exp( (x x )). Wir betrachten das Anfangswertproblem { ϕ (x) = a(ϕ(x) bϕ 2 (x)) ϕ() = y (1) für a, b, y >. Die Differentialgleichung in (1) heisst die logistische Gleichung oder die Differentialgleichung des beschränkten exponentiellen Wachstums, und hat z.b. Anwendungen in der Biologie (die Lösung beschreibt das Wachstum einer idealen Bakterienpopulation). Um die Gleichung zu lösen bemerken wir, dass 1 ϕ(x) bϕ 2 (x) ϕ (x) = a Integration über x gibt x 1 ϕ(t) bϕ 2 (t) ϕ (t)dt = a Wir substituieren y = ϕ(t) und bekommen ϕ(x) ϕ() x 1 dy = ax y by2 13 dt = ax
14 Aus finden wir 1 y by 2 = 1 y(1 by) = 1 y + b 1 by log ϕ(x)(1 by ) y (1 bϕ(x)) = ax Nach leichter algebraischer Manipulationen bekommen wir die eindeutige Lösung des Anfangswertsproblems ϕ(x) = y e ax 1 + by (e ax 1) Im letzten Beispiel haben wir die Methode der Trennung der Variablen benutzt. Wir zeigen im nächsten Satz, dass diese Methode immer angewandt werden kann, falls die Funktion f(x, y) auf der rechten Seite von (7) das Produkt einer Funktion von x mit einer Funktion von y ist. Satz 2.2. Seien I, J R offene Intervalle, g C(I), h C(J), mit h(j). Sei (x, y ) I J. Seien G(x) = x x g(t)dt, und H(y) = y y 1 h(t) dt Weiter, sei I I ein offenes Intervall mit G(I ) H(J) und x I. Dann existiert genau eine Lösung ϕ C 1 (I ) des Anfangswertproblems { ϕ (x) = g(x)h(ϕ(x)) ϕ(x ) = y (11) Ferner ist ϕ : I J die einzige Funktion mit H(ϕ(x)) = G(x) für alle x I. (12) Bemerkung: Die Aussage impliziert, dass Differentialgleichungen der Form (11) durch Trennung der Variablen gelöst werden können. Das bedeutet, dass (11) zunächst als 1 h(ϕ(x)) ϕ (x) = g(x) umgeschrieben werden kann. Integration über x ergibt dann und damit und x x 1 h(ϕ(t)) ϕ (t)dt = ϕ(x) ϕ(x ) x x g(t)dt 1 x h(y) dy = g(t)dt x H(ϕ(x)) = G(x) Die eindeutige Lösung des Anfangswertproblems kann dann durch Umkehrung der Funktion H bestimmt werden. 14
15 Beweis: Da H C 1 (J) mit H (y) = 1/h(y) für alle y J ist H injektiv. Damit ist H : J H(J) bijektiv und also invertierbar. Sei T : H(J) J die Umkehrfunktion. Dann ist T C 1 (H(J)) mit T (z) = 1/H (T (z)) = h(t (z)), für alle z H(J). Die Gleichung (12) definiert eindeutig eine Funktion ϕ = T G C 1 (I ). Diese Funktion erfüllt ϕ (x) = h(t G(x))G (x) = h(ϕ(x))g(x) und ϕ(x ) = T G(x ) = T () = y. D.h. ϕ ist eine Lösung des Anfangswertsproblems. Das zeigt die Existenz der Lösung. Es bleibt die Eindeutigkeit zu zeigen. Sei dazu ϕ C 1 (I ) eine andere Lösung des Anfangswertproblems. Es folgt, dass ϕ(i ) J. Sei ψ = H ϕ G. Dann gilt ψ = (H ϕ) ϕ G = 1 h ϕ ϕ g = auf I, Damit muss ψ konstant auf I sein. Da aber ψ(x ) = H( ϕ(x )) G(x ) =, muss ψ(x) = für alle x I. D.h. H ϕ = G auf I, und deswegen, ϕ = ϕ. Das zeigt die Eindeutigkeit der Lösung. 2.2 Existenz und Eindeutigkeit In diesem Abschnitt möchten wir zeigen, dass unter geeigneten Voraussetzungen an der Funktion f, das Anfangswertproblem (8) eine eindeutige Lösung besitzt. Dazu werden wir den Banachschen Fixpunktsatz anwenden. Erinnere aus Analysis 1, dass ein metrischer Raum vollständig heisst, wenn jede Cauchy-Folge in M konvergiert. Wir haben in Analysis 1 gezeigt, dass R n, versehen mit der Standardmetrik vollständig für alle n N ist. Satz 2.3 (Banachscher Fixpunktsatz). Sei M, versehen mit der Metrik d, ein vollständiger metrischer Raum. T : M M eine Abbildung mit der Eigenschaft, dass es eine Konstante < c < 1 existiert, mit d(t (x 1 ), T (x 2 )) c d(x 1, x 2 ) für alle x 1, x 2 M (eine solche Abbildung heisst eine Kontraktion; Kontraktionen sind insbesondere stetig). Dann gibt es genau ein x M mit T (x) = x (ein solches x heisst ein Fixpunkt der Abbildung T ; der Satz besagt, dass jede Kontraktion auf einem vollständigen metrischen Raum genau einen Fixpunkt besitzt). Beweis: Wir zeigen zunächst die Eindeutigkeit. Nehme an, dass x 1, x 2 zwei Fixpunkte der Abbildung T sind. Dann gilt d(x 1, x 2 ) = d(t (x 1 ), T (x 2 )) c d(x 1, x 2 ) Da aber c < 1 ist diese Ungleichung nur möglich, falls d(x 1, x 2 ) =. Also x 1 = x 2. Nun zeigen wir die Existenz eines Fixpunktes. Sei x M beliebig. Dann definieren wir rekursiv eine Folge x n in M durch x 1 = T (x ) und x n+1 = T (x n ). Für n 1 gilt dann d(x n+1, x n ) = d(t (x n ), T (x n 1 )) cd(x n, x n 1 ) c n d(x 1, x ) 15
16 Es folgt, dass, für beliebige n > m, d(x n, x m ) d(x n, x n 1 ) + d(x n 1, x n 2 ) + + d(x m+1, x m ) = d(x j, x j 1 ) j=m+1 d(x 1, x ) d(x 1, x ) j=m+1 j=m+1 c j c j = d(x 1, x ) c m+1 1 c für m. D.h. x n ist eine Cauchy-Folge auf M. Da M vollständig ist, muss x n konvergieren. Sei x = lim n x n. Da aber T stetig ist, muss Also, x ist ein Fixpunkt von T. T (x) = lim n T (x n) = lim n x n+1 = x Bemerkung: Der Beweis besagt, dass für jede x M, die Folge T T T (x ) gegen dem Fixpunkt konvergiert. In praktischen Situationen, ergibt dies ein Verfahren, um den Fixpunkt von T zu approximieren. Um die Existenz und Eindeutigkeit der Lösung von Anfangswertprobleme zu beweisen, werden wir den Banach schen Fixpunktsatz auf dem Raum C(I, R n ) = {f : I R n stetig } anwenden. Hier ist I R ein kompaktes Intervall. Dieser Raum ist mit der Metrik d(f, g) = sup f(x) g(x) x I versehen. Wir haben in Analysis 1 gezeigt, dass C(I, R n ) vollständig ist (siehe Proposition 6.25 und die Diskussion danach; bemerke, dass die Kompaktheit von I impliziert, wegen dem Satz von Maximum, dass jede stetige Funktion auf I auch beschränkt ist. Deswegen ist C(I; R n ) = C b (I; R n )). Das nächsten Lemma impliziert dann, dass jede abgeschlossene Teilmenge von C(I; R n ) vollständig ist. Lemma 2.4. Sei M ein vollständiger metrischer Raum, und A M abgeschlossen. Dann ist A vollständig (bezüglich der von M induzierten Metrik). Beweis: Sei x n eine Cauchy-Folge in A. Dann ist x n auch eine Cauchy-Folge in M. Die Vollständigkeit von M impliziert, dass x n in M konvergent. Sei x M der Grenzwert von x n, als Folge in M. Da A abgeschlossen ist und x n A für alle n ist, muss dann aber x A sein. Damit ist x n auch in A konvergent. Ein anderer Begriff spielt bei der Untersuchung der Existenz und Eindeutigkeit von Lösungen von Anfangswertproblemen eine wichtige Rolle. Das ist der Begriff der Lipschitz-Stetigkeit. 16
17 Definition 2.5. Seien (M 1, d 1 ), (M 2, d 2 ) zwei metrische Räume, A M 1. Eine Funktion f : A M 2 heisst Lipschitz-stetig falls eine Konstante L > existiert, mit für alle x, y A. Bemerkungen: d M2 (f(x), f(y)) Ld M1 (x, y) Jede Lipschitz-stetige Funktion ist gleichmässig stetig und damit auch stetig. Nicht alle gleichmässig stetigen Funktionen sind Lipschitz-stetig. Z.B. f(x) = x auf [; 1] ist gleichmässig stetig, aber nicht Lipschitz-stetig. Tatsache (Übung): Eine differenzierbare Funktion f : (a; b) R ist genau dann Lipschitz-stetig, falls die Ableitung beschränkt ist. Wir sind nun bereit, um Existenz und Eindeutigkeit von Lösungen von Anfangswertprobleme der Form (8) zu zeigen. Wir bezeichnen im Folgenden mit. die euklidische Norm auf R n, die durch a 2 = n j=1 a j 2 für a = (a 1,..., a n ) R n definiert ist. Satz 2.6 (Picard-Lindelöf). Sei Ω R R n offen, (x, y ) Ω, f C(Ω; R n ) Lipschitzstetig in der zweiten Variablen. Das bedeutet, dass L > mit f(x, y) f(x, y ) L y y für alle x R, y R n, y R n mit (x, y), (x, y ) Ω existiert. Dann gibt es ein ε >, so dass das Anfangswertproblem { ϕ (x) = f(x, ϕ(x)) ϕ(x ) = y (13) eine eindeutige Lösung ϕ C 1 ([x ε; x + ε]; R n ) besitzt. Bemerkung: Satz 2.6 zeigt nur die Existenz und Eindeutigkeit einer lokalen Lösung, in der Nähe vom Punkt x, wo die Anfangsbedingung gegeben ist. Wir werden später sehen, unter welchen Bedingungen die Existenz und Eindeutigkeit einer globalen Lösung gezeigt werden kann. Der Beweis benutzt die Tatsache, dass eine Funktion ϕ C([x ε; x + ε], R n ) genau dann eine Lösung des Anfangswertproblem (13) ist, wenn ϕ(x) = y + x x f(t, ϕ(t))dt (14) Aus (14) folgt in der Tat sofort, dass ϕ(x ) = y ist. Ferner, aus der Stetigkeit von ϕ und von f, und aus dem Hauptsatz der Integralrechnung folgt auch, dass ϕ C 1 ([x ε; x + ε]; R n ) mit ϕ (x) = f(x, ϕ(x)) gilt. Anderseits, falls ϕ C 1 ([x ε; x + ε], R n ) eine Lösung von (13) ist, dann folgt ϕ(x) = ϕ(x ) + x x ϕ (t)dt = y + x x f(t, ϕ(t))dt. 17
18 Beweis: Sei δ > so klein, dass K = [x δ; x + δ] B δ (y ) Ω. Da K R n+1 kompakt und f stetig ist, folgt, dass M := sup{ f(x, y) : (x, y) K} < Wir wählen nun { < ε min δ, δ 2L, und wir setzen I = [x ε; x + ε]. Wir definieren } δ 2M (15) A = {g C(I; R n ) : g(x) y δ für alle x I} A ist dann eine abgeschlossene Teilmenge von C(I; R n ), versehen mit der Metrik d(f, g) = sup x I f(x) g(x) (Beweis: Übung). Es folgt aus Lemma 2.4, dass A ein vollständiger metrischer Raum ist. Wir definieren nun die Abbildung T : A C(I; R n ) durch (T φ)(x) = y + x x f(t, φ(t))dt. Offenbar ist T φ C(I; R n ), für alle φ A (d.h. die Abbildung ist wohldefiniert). Weiter gilt, für alle x I und alle φ A, x (T φ)(x) y = f(t, φ(t))dt ε sup{ f(t, φ(t)) : t I} x ε sup{ f(x, y) : x I, y B δ (y )} ε sup{ f(x, y) : (x, y) K} = εm δ/2 aus der Wahl (15). Damit gilt T φ A, für alle φ A. Weiter, für φ, ψ A, finden wir d(t φ, T ψ) = sup x I ε sup t I (T φ)(x) (T ψ)(x) = sup x I x (f(t, φ(t)) f(t, ψ(t))) dt x f(t, φ(t)) f(t, ψ(t)) Lε sup φ(t) ψ(t) = εld(φ, ψ) 1 d(φ, ψ) t I 2 Damit ist T : A A eine Kontraktion. Es folgt aus Satz 2.3, dass ϕ A mit T (ϕ) = ϕ. Da ϕ C(I; R n ) ist t f(t, ϕ(t)) stetig, und damit ϕ = T ϕ C 1 ([x ε; x + ε]; R n ) existiert. Ferner gilt ϕ(x ) = (T ϕ)(x ) = y und, aus dem Hauptsatz der Integralrechnung, ϕ (x) = f(x, ϕ(x)) Damit ist ϕ eine Lösung des Anfangswertproblems (13) auf I (wir haben hier das Argument unten (14) wiederholt). Das zeigt die Existenz einer Lösung. Wir zeigen nun die Eindeutigkeit. Sei dazu ψ C 1 ([x ε; x + ε]; R n ) eine andere Lösung von (13). Ist ψ A, so muss T ψ = ψ, weil ψ eine Lösung von (13) ist. Dann muss aber ψ = ϕ, weil ϕ der einzelne Fixpunkt von T ist. Ist ψ A, dann muss es ein x I geben, mit ψ(x) y > δ. O.B.d.A. nehmen wir an, es existiert x I, x > x mit ψ(x) y > δ. Wir setzen dann x 1 = inf{x I, x > x : ψ(x) y > δ} 18
19 Aus Stetigkeit von ψ muss dann ψ(x 1 ) y = δ sein. Also x1 δ = ψ(x 1 ) y = f(t, ψ(t))dt ε sup{ f(x, y) : (x, y) K} δ/2 was ein Widerspruch ist. Bemerkungen: x Die Lipschitz-Bedingung ist tatsächlich für die Existenz der Lösung nicht notwendig (Stetigkeit von f ist für die Existenz hinreichend). Dagegen ist die Lipschitz- Bedingung für die Eindeutigkeit der Lösung wichtig. Betrachte in der Tat das Anfangswertproblem { ϕ (x) = ϕ(x) ϕ() = In diesem Fall ist f(x, y) = y stetig, aber nicht Lipschitz-stetig in der Nähe von y =. Für ein beliebiges a ist dann die Funktion { falls x < a ϕ(x) = 1 4 (x a)2 falls x a eine Lösung. Ferner ist auch ϕ(x) = eine Lösung. Es existieren also unendlich viele Lösungen dieses Anfangswertproblems. Satz 2.6 besagt die Existenz und Eindeutigkeit einer Lösung auf einem genügend kleinen Intervall um x. Im Allgemeinen existieren keine globalen Lösungen. Betrachte in der Tat das Anfangswertproblem { ϕ (x) = 2xϕ 2 (x) (16) ϕ() = 1 Durch Trennung der Variablen finden wir die eindeutige Lösung ϕ(x) = 1 1 x 2 auf dem Intervall ( 1; 1). Auf dem Intervall [a; b] existiert also keine Lösung, falls a 1 oder b 1 (insbesondere existiert keine Lösung auf R. Aus der letzten Bemerkung stellt sich die Frage, ob es möglich ist, unter stärkeren Annahmen an f, die Existenz und Eindeutigkeit einer globalen Lösung zu zeigen. Die Antwort ist ja: Eine Lösung auf einem vorgegebenen Intervall [a; b] existiert immer (und ist eindeutig), falls die Funktion f(x, y) in der Variablen y auf ganz R n die Lipschitz- Bedingung erfüllt (die Funktion f(x, y) = xy 2, die in (16) vorkommt, ist nur für y in einem kompakten Intervall Lipschitz-stetig). Das ist der Inhalt des nächsten Satzes. Satz 2.7 (Picard-Lindelöf, globale Version). Sei I = [a; b] R ein nicht-leeres kompaktes Intervall, x I, f C(I R n, R n ) Lipschitz-stetig in der zweiten Variablen. D.h. es existiere L > mit f(x, y) f(x, y ) L y y 19
20 für alle x I, y, y R n. Dann hat für jede y R n das Anfangswertproblem { ϕ (x) = f(x, ϕ(x)) ϕ(x ) = y (17) eine eindeutige Lösung ϕ C 1 (I; R n ). Bemerkung: Satz 2.7 kann auch benutzt werden, um die Existenz und Eindeutigkeit von Lösungen auf R zu zeigen. In der Tat eine Lösung auf R existiert und genau dann eindeutig ist, wenn sie auf dem Intervall [ m; m] existiert und ist eindeutig, für alle m N. Beweis: Für ϕ C(I; R n ), definieren wir ϕ L = sup e 2L x x ϕ(x) x [a;b] Es ist einfach zu überprüfen, dass. L eine Norm ist. Ferner, es gilt e 2L(b a) ϕ ϕ L ϕ (18) wobei ϕ = sup x [a;b] ϕ(x). Sei ϕ n eine Folge in C(I; R n ). Dann impliziert (18): ϕ n konvergiert bezüglich. L ϕ n konvergiert bezüglich., und ϕ n ist Cauchy-Folge bezüglich. L ϕ n ist Cauchy-Folge bezüglich.. (Man sagt, die zwei Normen. und. L sind äquivalent). Es folgt insbesondere, dass (C(I; R n ),. L ) ein vollständiger metrischer Raum ist. Auf C(I; R n ) definieren wir nun die Abbildung x (T φ)(x) = y + f(t, φ(t))dt x Dann gilt, für beliebige x [a; b], x > x, x x (T φ)(x) (T ψ)(x) = (f(t, φ(t)) f(t, ψ(t)))dt f(t, φ(t)) f(t, ψ(t)) dt x x L x x φ(t) ψ(t) dt = L L φ ψ L x Analog gilt auch für x [a; b] mit x < x, x x e 2L t x e 2L t x φ(t) ψ(t) dt x e 2L(t x ) dt 1 2 e2l x x φ ψ L (T φ)(x) (T ψ)(x) 1 2 e2l x x φ ψ L Damit gilt e 2L x x (T φ)(x) (T ψ)(x) 1 2 φ ψ L für alle x [a; b] und also T φ T ψ L 1 2 φ ψ L 2
21 Es folgt, dass T eine Kontraktion ist. Das impliziert, dass es einen eindeutigen Fixpunkt ϕ C(I; R n ), mit T ϕ = ϕ gibt. Es ist dann einfach zu sehen, dass ϕ C 1 (I; R n ) eine Lösung von (17) ist. Zur Eindeutigkeit: Ist ψ C 1 (I; R n ) eine Lösung von (17), so ist insbesondere ψ C(I; R n ). Damit kann man T auf ψ anwenden. Da ψ eine Lösung des Anfangswertproblem ist, muss aber T ψ = ψ. Damit ist ψ = ϕ, weil T nur einen Fixpunkt haben kann. 2.3 Differentialgleichungen höherer Ordnung Differentialgleichungen höherer Ordnung hängen auch von den höheren Ableitungen der gesuchten Funktion y(x) ab. Definition 2.8. Seien n, k N\{} fest, Ω R R n k offen, f C(Ω, R n ). Dann ist y (k) (x) = f(x, y(x), y (x),..., y (k 1) (x)) (19) eine Differentialgleichung k-ter Ordnung. Eine Lösung von (19) auf einem Intervall I R ist eine Funktion y C k (I; R n ) so, dass ( ) x, y(x), y (x),..., y (k) (x) Ω und (19) gilt, für alle x I. Für gegebene (x, y, y 1,..., y k ) Ω ist { y (k) = f(x, y(x),..., y (k 1) (x)) y (j) (x ) = y j, für j = 1, 2,..., (k 1) (2) ein Anfangswertproblem oder ein Cauchy-Problem k-ter Ordnung. Man kann Resultate über die Existenz und Eindeutigkeit der Lösung von Anfangswertproblemen k-ter Ordnung aus den entsprechenden Resultaten für Gleichungen erster Ordnung herleiten, indem man bemerkt, dass eine Gleichung k-ter Ordnung zu einer Gleichung erster Ordnung in mehreren Variablen äquivalent ist. In der Tat, das Anfangswertproblem (2) kann wie folgt umgeschrieben werden. Wir definieren die neue Funktion ψ(x) = (y(x), y (x),..., y (k 1) (x)). Dann ist ψ eine Funktion mit Werten in R n k. Wir definieren ferner f(x, z, z 1,..., z k 1 ) := (z 1, z 2,..., z k 1, f(x, z, z 1,..., z k 1 )) für alle (x, z, z 1,..., z k 1 ) Ω. Auch f hat Werte in R n k. Es ist dann leicht zu sehen, dass (2) zu dem Anfangswertproblem ψ (x) = f(x, ψ(x)) mit der Anfangsbedingung ψ(x ) = (y, y 1,..., y k 1 ) R n k äquivalent ist. Damit haben wir ein Problem k-ter Ordnung in Dimension n in einem Problem erster Ordnung in Dimension nk umgeschrieben. Wir erhalten deswegen das folgende Existenz- und Eindeutigkeitsresultat. 21
22 Satz 2.9. Seien n, k N\{} fest, Ω R R n k offen, f C(Ω, R n ) Lipschitz-stetig in alle Argumenten nach dem ersten. D.h. es existiere L > mit f(x, z, z 1,..., z k 1 ) f(x, z, z 1,..., z k 1 ) L z z für alle x R, z = (z,..., z k 1 ), z = (z,... z k 1 ) Rn k mit (x, z), (x, z ) Ω. Sei (x, y,..., y k 1 ) Ω. Dann existiert ein ε > so, dass das Anfangswertproblem (2) eine eindeutige Lösung ϕ C k ([x ε; x + ε], R n ) hat. Beweis: Es genügt zu zeigen, dass die Funktion f(x, z, z 1,..., z k 1 ) = (z 1, z 2,..., z k 1, f(x, z, z 1,..., z k 1 )) Lipshitz-stetig in z = (z, z 1,..., z k 1 ) ist. Dazu bemerken wir, dass f(x, z) f(x, z ) = (z1 z 1, z 2 z 2,..., z k 1 z k 1, f(x, z) f(x, z )) z z + f(x, z) f(x, z ) (L + 1) z z. 2.4 Lineare Differentialgleichungen Die Differentialgleichung erster Ordnung y (x) = f(x, y(x)) (21) heisst linear, falls die Funktion f(x, y) affin in der Variable y R n ist, d.h. falls eine offene Teilmenge A R, eine matrixwertige Funktion a C(A; R n n ) und eine vektorwertige Funktion b C(A; R n ) existieren mit f(x, y) = a(x)y + b(x) (22) Für ein beliebiges x A bezeichnet hier a(x)y die Anwendung der n n Matrix a(x) auf dem Vektor y R n. Die Differentialgleichung (21) heisst linear und homogen, falls f(x, y) linear in y ist, d.h. falls f die Form (22) hat, mit b =. Skalare lineare Differentialgleichungen: Wir betrachten zunächst den skalaren Fall, mit n = 1. Sei I R ein Intervall und a C(I). Für x I und y R beliebig, untersuchen wir das skalare, lineare und homogene Anfangswertproblem { y (x) = a(x)y(x) y(x ) = y Das Anfangswertproblem hat eine eindeutige Lösung (aus Satz 2.7). Durch Trennung der Variablen finden wir, dass die eindeutige Lösung aus ( x ) ϕ(x) = y exp a(t)dt x gegeben ist. 22
23 Sei nun, wie vorher, I R ein Intervall und a C(I). Weiter, sei b C(I). Für beliebige x I und y R, untersuchen wir das skalare, lineare (aber inhomogene) Anfangswertproblem { y (x) = a(x)y(x) + b(x) y(x ) = y Aus Sazt 2.7, hat dieses Anfangswertproblem eine eindeutige Lösung. Die Lösung kann durch die Methode der Variation der Konstante gefunden werden. Man findet zunächst die allgemeine Lösung der homogenen Differentialgleichung y (x) = a(x)y(x), die aus ( x ) y(x) = c exp a(t)dt x für eine beliebige Konstante c R gegeben ist. Um die inhomogene Gleichung zu lösen, betrachtet man den Ansatz ( x ) y(x) = c(x) exp a(t)dt x bei welchem die Konstante c aus der Lösung der homogenen Gleichung nun von x abhängt. Dann ist ( x ) ( x ) y (x) = c (x) exp a(t)dt + c(x)a(x) exp a(t)dt x x ( x ) = c (x) exp a(t)dt + a(x)y(x) x Wir sehen also, dass y(x) eine Lösung des inhomogenen Anfangswertproblems ist, g.d.w. ( x ) ( x ) c (x) exp a(t)dt = b(x) c (x) = b(x) exp a(t)dt x x Wir finden also, dass die eindeutige Lösung des inhomogenen Anfangswertproblems aus ( x ( t ) ) ( x ) ϕ(x) = y + b(t) exp a(s)ds dt exp a(t)dt x x x gegeben ist. Vektorielle lineare Differentialgleichungen: Wir kommen nun zum allgemeinen Fall n 1. Sei I R ein Intervall, x I, a C(I, R n n ) eine matrix-wertige stetige Funktion auf I. Wir untersuchen das lineare, homogene Anfangswertproblem { y (x) = a(x)y(x) y(x ) = y (23) für ein beliebiges y R n. Es lohnt sich in diesem Fall zunächst eine matrix-wertige Differentialgleichung zu lösen. Aus Satz 2.7 folgt nämlich, dass eine eindeutige Lösung ϕ C 1 (I, R n n ) des Anfangswertproblems { ϕ (x) = a(x)ϕ(x) (24) ϕ(x ) = 1 23
24 existiert, wobei 1 die Identitätsmatrix auf R n ist. Bemerke, dass, für alle x I, ϕ(x) hier eine n n Matrix bezeichnet. Die Ableitung ϕ (x) ist wieder eine Matrix, mit Einträgen (ϕ (x)) ij = ϕ ij (x), wobei ϕ ij(x) die Einträge von ϕ(x) sind (d.h. die Matrix wird Einträge-weise differenziert). Das Produkt a(x)ϕ(x) soll dann als Produkt von zwei Matrizen verstanden werden. Die Matrixgleichung (24) ist einfach ein System von n 2 Differentialgleichungen, oder äquivalent, eine vektorielle Differentialgleichung für eine Unbekannte ϕ(x) mit n 2 Komponenten (deswegen kann man Satz 2.7 anwenden). Analog existiert eine eindeutige Lösung ψ C 1 (I; R n n ) des Anfangswertproblems { ψ (x) = ψ(x)a(x) (25) ψ(x ) = 1 Wir behaupten nun, dass ψ(x)ϕ(x) = 1 für alle x I. In der Tat, die Anfangsbedingung impliziert, dass ψ(x )ϕ(x ) = 1. Anderseits d dx [ψ(x)ϕ(x)] = ψ (x)ϕ(x) + ψ(x)ϕ (x) = ψ(x)a(x)ϕ(x) + ψ(x)a(x)ϕ(x) = D.h. ψ(x)ϕ(x) ist konstant auf I und deswegen ψ(x)ϕ(x) = 1, für alle x I. Das impliziert insbesondere, dass die Lösungen ϕ(x) und ψ(x) invertierbar sind, für alle x I. Wir können nun die Lösung ϕ(x) des Anfangswertproblems (24) benutzen, um die Lösung von (23) zu konstruieren. Aus Satz 2.7 wissen wir nämlich schon, dass (23) eine eindeutige Lösung besitzt. Wir behaupten nun, dass die eindeutige Lösung von (23) aus y(x) = ϕ(x)y gegeben ist. In der Tat, y(x ) = ϕ(x )y = 1y = y und y (x) = ϕ (x)y = a(x)ϕ(x)y = a(x)y(x) (26) Mit anderen Worten, die eindeutige Lösung von (23) bekommt man einfach durch Anwendung der Matrix ϕ(x) auf die Anfangsbedingung y R n. Aus der Darstellung der Lösung von (23) als y(x) = ϕ(x)y folgt einfach, dass der Lösungsraum der linearen Differentialgleichung in (23) eine lineare Struktur hat. Für gegebene a C(I; R n n ) definieren wir nämlich den Lösungsraum der Differentialgleichung y (x) = a(x)y(x) als L h := { y C 1 (I; R n ) : y (x) = a(x)y(x) } (d.h. L h ist die Menge aller Lösungen der Differentialgleichung, unabhängig von der Anfangsbedingung). Wir haben schon bewiesen, dass ein beliebiges y L die Form y(x) = ϕ(x)y(x ) hat. Das impliziert offenbar, dass L h ein Vektorraum ist. Da die Matrix ϕ(x) invertierbar ist, folgt auch, dass y (1),..., y (m) L h genau dann linear unabhängig sind, wenn y (1) (x ),..., y (m) (x ) R n linear unabhängig sind. Das impliziert, dass dim L h = dim R n = n (mit anderen Worten, die Formel y(x) = ϕ(x)y(x ) erlaubt uns L h mit R n zu identifizieren). 24
25 Die Lösung der Matrix-Gleichung (24) erlaubt uns auch inhomogene lineare Differentialgleichungen zu berechnen. Sei nämlich I R ein Intervall, x I, y R n, a C(I; R n n ) und b C(I; R n ). Dann hat das Anfangswertproblem { y (x) = a(x)y(x) + b(x) y(x ) = y (27) die eindeutige Lösung ( x ) y(x) = ϕ(x) y + ϕ 1 (t)b(t)dt x (28) wobei ϕ C 1 (I; R n n ) die eindeutige Lösung von (24) ist. In der Tat, aus ϕ(x ) = 1 folgt sofort, dass (28) die Bedingung y(x ) = y erfüllt. Weiter gilt ( x ) y (x) = ϕ (x) y + ϕ 1 (t)b(t) + ϕ(x)ϕ 1 (x)b(x) = a(x)y(x) + b(x) x Wir haben in (28) benutzt, dass ϕ(x) für alle x I invertierbar ist. Es folgt aus diesem Ausdruck für die Lösung des Anfangswertproblems (27), dass der Lösungsraum der inhomogenen linearen Differentialgleichung y (x) = a(x)y(x) + b(x), definiert durch L i = { y C 1 (I; R n ) : y (x) = a(x)y(x) + b(x), für alle x I } aus x { x } L i = L h + ϕ(x) ϕ 1 (t)b(t) = y(x) = y h (x) + ϕ(x) ϕ 1 (t)b(t) : y h L h x x gegeben ist. Allgeiner, für eine beliebige Lösung z L i, gilt L i = z + L h. D.h. L i ist ein affiner Raum. Lineare Differentialgleichungen höherer Ordnung: Lineare homogene und inhomogene Differentialgleichungen höherer Ordnung können als lineare homogene und inhomogene Differentialgleichungen erster Ordnung mit höherer Dimension geschrieben werden, ähnlich wie in Sektion 2.3 erklärt wird. Sei zum Beispiel I R ein Intervall, x I, a,..., a n 1 C(I) und b C(I) reelwertig. Der Lösungsraum L h der linearen homogenen Differentialgleichung y (n) (x) + a n 1 (x)y (n 1) (x) + + a y(x) = der Ordnung n ist ein linearer Vektorraum mit Dimension n. Zu jeder (y, y 1,..., y n 1 ) gibt es genau eine Lösung y L h, mit y(x ) = y, y (x) = y 1,..., y (n 1) (x ) = y n 1. Der Lösungsraum L i der linearen inhomogenen Gleichung y (n) (x) + a n 1 (x)y (n 1) (x) + + a y(x) + b(x) = ist so, dass L i = z + L h, für ein beliebiges z L i. Bemerke, dass es im Gegensatz zum skalaren Fall n = 1, wo die Lösung von homogenen und inhomogenen Problemen mit Trennung der Variablen und Variationen der 25
26 Konstanten immer gefunden werden kann, bei vektoriellen linearen Problemen (und also bei Probleme höheren Ordnung) kein allgemeines Rezept gibt, um Lösungen zu finden. Wir haben nur gezeigt, dass die Lösung jeder vektoriellen linearen Gleichung zur Berechnung der Lösung ϕ C 1 (I; R n n ) der Matrix-Gleichung (24) reduziert werden kann (und wir haben die Darstellung der Lösung durch die Matrix ϕ(x) benutzt, um allgemeine Eigenschaften der Lösungen zu diskutieren). Im Allgemeinen kann man aber ϕ nicht explizit berechnen. Eine Ausnahme, wo die Berechnung von ϕ auf die Lösung von linearen Gleichungsystemen reduziert werden kann, ist der Fall von linearen Gleichungen mit konstanten Koeffizienten, die durch Konstanten a R n n und b R n charakterisiert ist. 2.5 Lineare Differentialgleichungen mit konstanten Koeffizienten Sei n N und A R n n eine festgewählte n n Matrix. In (23) setzen wir dann a(x) = A für alle x R n. Wir bekommen die lineare homogene Differentialgleichung mit konstanten Koeffizienten y (x) = Ay(x) (29) für eine unbekannte Funktion y C 1 (R; R n ). Sei L h = { y C 1 (R; R n ) : y (x) = Ay(x) } der Lösungsraum der Differentialgleichung (29). Wir wissen schon, dass L h ein Vektorraum der Dimension n ist. Ist eine Basis y (1),..., y (n) des Lösungsraums L h gegeben, so kann man die eindeutige Lösung des Anfangswertproblems { y (x) = Ay(x) y(x ) = y (3) bestimmen, indem man den Vektor y als eine lineare Kombination der Basisvektoren ausdruckt: y = c j y (j) (x ) j=1 Das ist möglich, weil {y (j) (x )} n j=1 eine Basis von Rn ist. Dann ist die eindeutige Lösung von (3) aus y(x) = c j y (j) (x) gegeben. j=1 Wie können wir nun eine Basis von L h finden? Sei v R n ein Eigenvektor von A mit Eigenwert λ, d.h. Av = λv. Dann ist y(x) = ve λx L h, weil y (x) = λve λx = Ave λx = Ay(x). Nehmen wir nun an, dass die Matrix A n linear unabhängige Eigenvektoren v 1,..., v n R n, mit Eigenwerten λ 1,..., λ n R (nicht notwendigerweise verschiedenen), besitzt. Dann sind die Funktionen y j (x) = v j e λ jx, für j = 1,..., n, linear unabhängig und damit eine Basis von L h. 26
27 Es passiert oft, dass eine Matrix A R n n auf C, aber nicht auf R diagonalisierbar ist. Sei λ = γ + iω C\R ein komplexer Eigenwert von A, mit Eigenvektor v C n \{}; wir zerlegen v = u + iw, mit u, w R n. Da A reelle Einträge hat, ist auch λ = γ iω ein Eigenwert von A, mit Eigenvektor v = u iw. Die zwei Funktionen ỹ 1 (x) = ve λx = (u + iw)e iωx e γx = [(u cos ωx w sin ωx) + i (u sin ωx + w cos ωx)] e γx ỹ 2 (x) = (u iw)e iωx e γx = [(u cos ωx w sin ωx) i (u sin ωx + w cos ωx)] e γx sind dann komplexe Lösungen der Differentialgleichung (29). Weil wir uns vor allem für reelle Lösungen interessieren, möchten wir ỹ 1 und ỹ 2 durch die reellen linearen Kombinationen y 1 (x) = ỹ1(x) + ỹ 2 (x) 2 y 2 (x) = ỹ1(x) ỹ 2 (x) 2i = (u cos ωx w sin ωx) e γx = (u sin ωx + w cos ωx) e γx (31) ersetzen. Seien also ṽ 1,..., ṽ n C n linear unabhängige Eigenvektoren von A, zu den Eigenwerten λ 1,..., λ n C. Für jedes j = 1,..., n unterscheiden wir zwei Fälle. Sei zunächst λ j R. Dann ist mit ṽ j auch ṽ j ein Eigenvektor von A zum Eigenwert λ. Mindestens einer der zwei Vektoren Re ṽ j = (ṽ j + ṽ j )/2 und Im ṽ j = (ṽ j ṽ j )/2i ist nicht Null und deswegen ein reeller Eigenvektor v R n von A zum Eigenwert λ. Wir setzen, dann y j (x) = ve λx Sei nun λ j C\R. Dann ist mit λ j auch λ j ein Eigenwert von A. D.h. es existiert i j mit λ i = λ j. Dann setzen wir, gemäss (31), y j (x) = (Re v j cos(im λ j ) Im v j sin(im λ j ) e Re λ j y i (x) = (Re v j sin(im λ j ) Im v j cos(im λ j ) e Re λ j Damit konstruieren wir n linear unabhängige und reelle Lösungen y j der Differentialgleichung y (x) = Ay(x); das gibt eine Basis vom Lösungsraum L h. Es gibt natürlich auch den Fall, dass die Matrix A nicht diagonalisierbar ist. D.h., dass keine n linearen unabhängigen Eigenvektoren von a existieren. In diesem Fall ist die Suche nach einer Basis des Lösungsraums L h komplizierter. Es hilft, die Lösung der Differentialgleichung y (x) = Ay(x) durch Exponenzierung von A zu konstruieren. Lösung durch Exponentialabbildung: Die Matrix A = (a ij ) ist ein Element von R n n. Auf diesem Raum ist die euklidische Norm aus A 2 = N a ij 2 = Tr A A i,j=1 gegeben. Es gibt eine andere natürliche Norm für Matrixen, nämlich die Operator-Norm. Wir definieren die Operatornorm von A durch Av A op = sup v R n v 27
28 wobei Av und v die euklidischen Normen von Av und v, als Elemente von R n, sind. Es ist einfach zu zeigen, dass. op wirklich eine Norm ist. Die Operatornorm hat die Eigenschaft, dass Av A op v, für einen beliebigen Vektor v R n (das folgt direkt aus der Definition). Sind also A, B R n n zwei Matrizen, dann gilt (AB bezeichnet die Multiplikation der zwei Matrizen A und B; das entspricht der Verknüpfung der zwei Abbildungen) ABv A Bv A B v für alle v R n. Es folgt, dass AB op A op B op Es gilt 1 n A A op A (32) für jede A R n n. D.h. die zwei Normen. und. op auf R n n sind äquivalent (das gilt übrigens für jede zwei Normen auf einem beliebigen endlich dimensionalen Vektorraum). Man kann (32) wie folgt beweisen. Es gilt Av 2 = a ji v i = j=1 i=1 j=1 i 1 =1 i 2 =1 j=1 i 1 =1 i 2 =1 a ji1 a ji2 v i1 v i2 ( aji1 2 v i2 2 + a ji2 2 v j 2) = v 2 A 2 Das impliziert, dass Av / v A für alle v R n, und damit, dass A op A. Anderseits, A 2 = Tr A A = e j, A Ae j = j=1 Ae j 2 j=1 A 2 op e j 2 n A 2 op wobei die Vektoren e j = (,...,, 1,,..., ) die Standardbasis von R n sind. Wir betrachten nun für A R n n die Folge B N := N j= A j j! j=1 Wir bemerken, dass, für N > M, N B N B M op = j=m+1 A j j! op N j=m+1 A j op j! N j=m+1 A j j! Aus der Konvergenz der Reihe j= A j /j! auf R folgt, dass B N B M op, da N, M. Das impliziert auch, dass B N B M bezüglich der euklidischen Norm 28
29 auf R n n. Also ist B N eine Cauchy-Folge auf R n n, bzg. der euklidischen Norm, und damit konvergiert B N. Wir definieren exp(a) := lim N N j= A j j! j= A j j! Wir bemerken nun, dass die matrixwertige Funktion ϕ(x) = exp(a(x x )) definiert für beliebige x R, das Anfangswertproblem { ϕ (x) = Aϕ(x) ϕ(x ) = 1 (33) löst. Die Anfangsbedingung ϕ(x ) = 1 ist offenbar erfüllt. Wir zeigen nun, dass ϕ(x) die Differentialgleichung erfüllt. Sei dazu R > fest. Auf x [x R; x + R] konvergiert die matrixwertige Potenzreihe B N (x) = N j= gleichmässig gegen exp(a(x x )). Die Ableitung B N(x) = N j= A j j! j(x x ) j 1 = A N j=1 A j j! (x x ) j A j 1 N 1 (j 1)! (x x ) j 1 A j = A j! (x x ) j j= konvergiert auch gleichmässig gegen A exp(a(x x )). Aus Analysis 1 (Proposition 8.29) folgt, dass ϕ C 1 ([ R; R]; R n n ), mit ϕ (x) = Aϕ(x) für alle x [ R; R] (bemerke, dass Proposition 8.29 in Analysis 1 nur für R-wertige Funktionenfolgen formuliert ist. Das Resultat lässt sich aber trivial auf matrixwertige Funktionen erweitern, indem man die n 2 Komponenten der Matrix separat untersucht). Da R > beliebig ist, folgt dass ϕ C 1 (R; R n n ) das Anfangswertproblem (33) auf ganz R löst. Wie in (26), ist nun die eindeutige Lösung des Anfangswertproblems (3) durch Anwendung der Matrix ϕ(x) auf die Anfangsbedingung, d.h. y(x) = ϕ(x)y = exp(a(x x ))y Ferner, das inhomogene Anfangswertpbroblem mit konstanten Koeffizienten y (x) = ay(x)+b, mit der Anfangsbedingung y(x ) = y, hat, gemäss (28) die eindeutige Lösung ( x ) y(x) = e a(x x ) y + e a(x x) bdt. x Aus einem praktischen Sichtpunkt ist die Berechnung der Exponenitalabbildung exp(a(x x )) durch die Diagonalisierung von A möglich. Ist nämlich A = U 1 DU, 29
30 für eine diagonale Matrix D = diag(d 1,..., d n ), so gilt A m = (U 1 DU) m = U 1 D m U. Es folgt exp(a(x x )) = m= A m (x x ) m m! = m= U 1 D m U (x x ) m m! = U 1 D m (x x ) m U m! m= ( ) = U 1 d m 1 diag (x x ) m d m n (x x ) m,..., U m! m! m= m= ) = U 1 diag (e (x x )d 1,..., e (x x )d n U. Ist die Matrix a nicht diagonalisierbar, so ist die Berechnung von exp((x x )a) schwieriger. In diesem Fall kann die jordansche Normalform der Matrix A verwendet werden. Für beliebige A R n n kann man nämlich eine invertierbare Matrix U und eine blockdiagonal Matrix J = J 1... J J k finden, so dass A = U 1 JU. J heisst die Jordan Normalform von A. Die Blöcke J i haben die Form λ i 1... λ i 1... J i = (34)... λ i 1... λ i Die Einträge λ i auf der Diagonalen der Matrixen J i sind die Eigenwerte von A. Die Anzahl der Blöcke mit Eigenwert λ i ist aus der geometrischen Vielfachheit von λ i gegeben (d.h. die Dimension des Eigenraumes mit Eigenwert λ j ). Die Gesamtdimension der Jordanblöcke mit Eigenwert λ i ist dagegen die algebraische Vielfachheit von λ i (die Vielfachheit von λ i als Nullstelle des charakteristischen Polynoms). Sind algebraische und geometrische Vielfachheit gleich, so ist jeder Jordanblock mit Eigenwert λ i eine 1 1 Matrix mit Eintrag λ i (ist das der Fall für alle Eigenwerte von A, dann ist J diagonal und A diagonalisierbar). Der Ausdruck A = U 1 JU erlaubt uns, die Exponentialabbildung exp(ta) zu berechnen, für ein beliebiges t R (t = x x in unserer Anwendung). In der Tat exp(ta) = exp(u 1 tju) = U 1 exp(tj)u Die Anwendung der Exponentialabbildung an der Blockdiagonale Matrix tj ist wieder blockdiagonal, mit Blöcken exp(tj i ), wobei die J i die Form (34) haben. Sei J i eine l l 3
31 Matrix. Dann liefert die Berechnung von exp(tj i ) (Beweis: Übung) t tλ i t... 1 t 2 t 2!... l 1 (l 1)! tλ i t... t 1 t... l 2 exp tλ i t = etλ i (l 2)! t... tλ i... 1 Damit kann man in Prinzip die Exponentialabbildung ϕ(x) = exp(a(x x )) für jede Matrix A R n n berechnen. Mit dieser Methode kann man also immer die eindeutige Lösung des Anfangswertproblems (3) finden. Skalare, lineare, homogene Differentialgleichungen höherer Ordnung mit konstanten Koeffizienten: Eine skalare, lineare, homogene Differentialgleichung der Ordnung n N mit konstanten Koeffizienten hat die Form a n ϕ (n) (x) + a n 1 ϕ (n 1) (x) + + a 1 ϕ (x) + a ϕ(x) = (35) für eine Funktion ϕ C n (R), und für Konstanten a,..., a n R. Definieren wir y = (ϕ, ϕ,..., ϕ (n 1) ) C 1 (R; R n ), dann nimmt (35) die Form 1... y 1... (x) = y(x) =: Ay(x) 1 a a n a 1 a n a 2 a n... a n 1 a n Es ist einfach zu sehen, dass die Matrix A genau dann (in C) diagonalisierbar ist, wenn sie n verschiedene Eigenwerten hat (Übung: Gilt Av 1 = λv 1 und Av 2 = λv 2 für ein λ C, dann existiert κ C mit v 1 = κv 2 ). Obwohl die Matrix A nicht immer diagonalisierbar ist, ist es hier trotzdem einfach, eine Basis für den n dimensionalen Lösungsraum L h = y Cn (R) : a j ϕ (j) (x) = zu bestimmen, ohne explizit die jordansche Normalform von A zu berechnen. Wir definieren dazu das Polynom Dann nimmt (35) die Form j= p(s) = a n s n + a n 1 s n a 1 s + a ( ) d p ϕ = (36) dx Aus dem Fundamentalsatz der Algebra (Satz 2.33 in Analysis 1) existieren k N, λ 1,..., λ k C voneinander unterschiedliche, n 1,..., n k N\{} mit k j=1 n j = n so, dass k p(s) = a n (s λ j ) n j (37) j=1 31
32 Wir können also (36) als ( ) d p ϕ = a n dx k j=1 ( ) d nj dx λ j ϕ = (38) schreiben. Bemerke hier, dass die Ordnung der Operatoren (d/dx λ j ) n j keine Rolle spielt (die verschiedenen Monomen kommutieren miteinander). Wir bemerken ferner, dass ( ) d k dx λ [f(x)e λx ] = f (k) (x)e λx (39) In der Tat ( ) d dx λ [f(x)e λx ] = f (x)e λx + λf(x)e λx λf(x)e λx = f (x)e λx Wenden wir diese Formel k Mal an, so finden wir (39). Aus (36) erhalten wir also ( ) d ( ) d nj ( ) d nm p [x l e λmx ] = a n dx dx λ j dx λ m [x l e λmx ] j m ( ) d nj [ d n = a n dx λ m ] j xl e λmx = nm dx j m für alle l =, 1, 2,..., n m 1. Die n Funktionen {y m,l (x) = x l e λmx : m = 1,..., k, und l =, 1,..., n m 1} sind also Lösungen der Differentialgleichung p(d/dx)ϕ =. Diese Funktionen sind linear unabhängig (Beweis: Übung), und definieren also eine Basis des Lösungsraums L h, wenn wir L h als einen Vektorraum über C betrachten. Mit anderen Worten, jede Lösung von (35) kann als eine endliche lineare Kombination der Funktionen y m,l geschrieben werden. Für gegebene Anfangsbedingungen y(x ) = y, y (x ) = y 1,..., y (n 1) (x ) = y n 1 kann man also die eindeutige Lösung des Anfangswertproblems bestimmen, indem man Konstanten α m,l findet, so dass y(x) = k m=1 m 1 l=1 α m,l x l e λmx (4) alle Anfangsbedingungen an der Stelle x = x erfüllt. Die resultierende Lösung (4) ist, für reelle Anfansbedingungen y,..., y n 1 R automatisch reell. Falls man aber eine Basis für L h betrachtet als R-Vektorraum, sucht, so muss man wie oben die Lösungen x l e λ jx, x l e λ jx mit λ j C\R durch die reellen linearen Kombinationen x l cos((im λ j )x)e (Re λ j)x und x l sin((im λ j )x)e (Re λ j)x ersetzen (das ist immer möglich, wenn die Koeffizienten a,..., a n R, weil für jede Nullstelle λ von p auch λ eine Nullstelle ist). 32
33 Skalare, lineare, inhomogene Differentialgleichungen höherer Ordnung mit konstanten Koeffizienten: Auch inhomogene, skalare, lineare Differentialgleichungen von höherer Ordnung mit konstanten Koeffizienten kann man mit dieser Methode lösen. Aus der Untersuchung von allgemeinen linearen Differentialgleichungen wissen wir schon, dass der Lösungsraum der inhomogenen Gleichung a n y (n) (x) + a n 1 y (n 1) (x) + + a y(x) + b = (41) aus L i = z + L h gegeben ist, wobei z eine beliebige Lösung der inhomogenen Gleichung ist. Also braucht man, um den Lösungsraum von (41) zu finden, einfach eine einzige Lösung von (41) zu finden. Das ist aber einfach. Ist z.b. a, dann kann man einfach z als die konstante Funktion z(x) = b/a wählen. Allgemeiner, sei j {, 1,..., n} der kleinste Index mit a j. Dann ist z(x) = (b/a j )x j /j! eine Lösung von (41). Der Lösungsraum von (41) ist also aus L i = { (b/a j )x j /j!} + L h gegeben. Die eindeutige Lösung von (41), unter den Anfangsbedingungen y(x ) = y, y (x ) = y 1,..., y (n 1) (x ) = y n 1, kann man also bestimmen, indem man Konstanten α m,l findet, so dass die Anfangsbedingungen erfüllt. Beispiel: Sei y(x ) = b a j x j j! + k m=1 m 1 l= y + 2γy + ω 2 y = α m,l x l e λmx Die Gleichung kann als p(d/dx)y = geschrieben werden, mit dem Polynom Das Polynom p hat die Nullstellen p(s) = s 2 + 2γs + ω 2 s = γ ± γ 2 ω 2 Ist γ > ω, dann sind die zwei Nullstellen verschiedenen und reell. Damit sind ( ) γ+ γ y 1 (x) = e 2 ω 2 x und ( ) γ γ y 2 (x) = e 2 ω 2 x eine Basis für den Lösungsraum. Ist dagegen γ = ω, dann hat p die einzige reelle Nullstelle s = γ. Damit sind y 1 (x) = e γx und y 2 (x) = xe γx eine Basis für den Lösungsraum. Ist dagegen γ < ω, dann sind die zwei Nullstellen von p komplex. In diesem Fall sind y 1 (x) = cos( ω 2 γ2 x)e γx und y 2 (x) = sin( ω 2 γ2 x)e γx eine Basis des Lösungsraums. 33
34 2.6 Grundlagen der Stabilitätstheorie In diesem Abschnitt untersuchen wir die Abhängigkeit der Lösung einer Differentialgleichung von der Anfangsbedingung und der Form der Gleichung. In vielen Situationen erwartet man, dass eine kleine Änderung der Anfangsbedingungen nur eine kleine änderung der Lösung erzeugen kann. Analog, falls wir das Anfangswertproblem y (x) = f(x, y(x)), y(x ) = y untersuchen, dann erwarten wir, dass eine kleine Änderung der Funktion f nur eine kleine Änderung der Lösung produziert. Mit anderen Worten, wir untersuchen die Stabilität der Lösung von Anfangswertproblemen. Da Differentialgleichugen nur selten explizit gelöst werden können, ist ihre Stabilität sehr wichtig in praktischen Anwendungen. In der Physik passiert es zum Beispiel sehr oft, dass man eine komplizierte Differentialgleichung y (x) = f(x, y(x)) durch eine einfachere Differentialgleichung y (x) = f (x, y(x)) ersetzt, wobei die Differenz f f in geeignetem Sinne klein ist. Damit diese Approximation nützlich sein kann, muss aber die Differenz der zwei Lösungen y(x) und y (x) (unter geeigneten Anfangsbedingungen) klein sein. Wir brauchen also die Stabilität der Gleichung ohne, dass wir die Gleichung explizit lösen können. Ein wichtiges Hilfmittel um Stabilität zu beweisen ist das Lemma von Gronwall. Lemma 2.1 (Gronwall Lemma). Sei I = [x ; x 1 ] mit x 1 > x, a, b R mit b, y C(I), so dass x y(x) a + b y(t)dt x für alle x I. Dann gilt für alle x I. Bemerkung: y(x) a exp(b(x x )) Das Lemma von Gronwall zeigt insbesondere, dass jede Lösung der Differential- Ungleichung y (x) by(x), mit der Anfangsbedingung y(x ) = y, aus der Lösung der Differentialgleichung y (x) = by(x), mit der selben Anfangsbedingung, nach oben beschränkt wird. Sei in der Tat y C 1 ([x ; x 1 ]) so, dass y (x) by(x) und y(x ) = y. Dann gilt y(x) = y(x ) + Lemma 2.1 zeigt dann, dass x x y (t)dt y + b y(x) y e b(x x ) x x y(t)dt was genau die eindeutige Lösung der Gleichung y (x) = by(x) mit der Anfangsbedingung y(x ) = y ist. Die differentielle Form von dem Gronwall-Lemma, die wir in der ersten Bemerkung diskutiert haben, gilt (im Gegensatz zur Integralform im Lemma 2.1) auch für b <. In diesem Fall zeigt das Lemma von Gronwall, dass jede y C 1 ([x ; x 1 ]), mit y (x) by(x) und y(x ) = y exponentiell abfällt, für x > x. 34
35 Beweis: Sei ϕ : I R durch ϕ(x) = y(x)e b(x x ) definiert. Dann muss Es gilt ϕ(x) ae b(x x ) + be b(x x ) ψ (x) = bae b(x x ) b 2 x x x y(t)dt =: ψ(x) x ϕ(t)e b(t x) + bϕ(x) = b [ψ(x) ϕ(x)] für alle x I. Damit gilt ϕ(x) ψ(x) ψ(x ) = a für alle x I. Im nächsten Satz benutzen wir Gronwall-Lemma, um die Stabilität von gewöhnlichen Differentialgleichungen bzg. Variationen der Anfangsbedingungen zu beweisen. Satz Sei Ω R R n offen, f C(Ω; R n ) Lipschitz-stetig im zweiten Argument. D.h. es existiere L > mit f(x, y 1 ) f(x, y 2 ) L y 1 y 2 für alle x R, y 1, y 2 R n mit (x, y 1 ), (x, y 2 ) Ω. Seien ϕ, ψ C 1 (I; R n ) zwei Lösungen der Differentialgleichung y (x) = f(x, y(x)) auf einem Intervall I R. Dann gilt, für beliebige x, x 1 I, ϕ(x 1 ) ψ(x 1 ) ϕ(x ) ψ(x ) e L x 1 x Insbesondere folgt aus Satz 2.11, dass die Lösung ϕ(x) des Anfangswert- Bemerkung: problems { ϕ (x) = f(x, ϕ(x)) ϕ(x ) = y stetig (sogar Lipschitz-stetig) von der Anfangsbedingung y abhängt. Beweis: Sei, o.b.d.a, x > x. Wir setzen y(x) = ϕ(x) ψ(x). Aus folgt und damit y (x) = ϕ (x) ψ (x) = f(x, ϕ(x)) f(x, ψ(x)) x y(x) = y(x ) + (f(t, ϕ(t)) f(t, ψ(t))) dt x x y(x) y(x ) + f(t, ϕ(t)) f(t, ψ(t)) dt x y(x ) + L x x y(t) dt Anwendung von Lemma 2.1 auf die Funktion g(x) = y(x) impliziert, dass y(x) y(x ) e L(x x ) 35
36 Analog kann man auch die Stabilität von Differentialgleichungen bzg. Änderungen (Störungen) der Gleichung zeigen. Wir betrachten die Differentialgleichung y (x) = f(x, ϕ(x), z), die von einem zusätzlichen Parameter z R m abhängt. Für jede z R m haben wir eine andere Differentialgleichung. Die Frage, die wir im nächsten Satz untersuchen, ist, wie ändert sich die Lösung der Differentialgleichung, falls wir den Parameter z (und eventuell auch die Anfangsbedingung) ein bisschen variieren. Satz Sei I = [x ; x 1 ] R, f C(I R n R m ; R n ). Es existieren M, L > mit f(x, y 1, z 1 ) f(x, y 2, z 2 ) L y 1 y 2 + M z 1 z 2 für alle x I, y 1, y 2 R n, z 1, z 2 R m. Seien y 1, y 2 R n und z 1, z 2 R m beliebig gewählt und seien ϕ 1, ϕ 2 C 1 (I; R n ) die eindeutigen Lösungen von den Anfangswertproblemen { ϕ 1 (x) = f(x, ϕ 1 (x), z 1 ) ϕ 1 (x ) = y 1 und { ϕ 2 (x) = f(x, ϕ 2 (x), z 2 ) ϕ 2 (x ) = y 2 Dann gilt für alle x I. ϕ 1 (x) ϕ 2 (x) ( y 1 y 2 + M x 1 x z 1 z 2 ) e L x x Bemerkung: Wählen wir z 1 = z 2, dann sind wir zurück bei Satz Beweis: Sei y(x) = ϕ 1 (x) ϕ 2 (x). Aus finden wir und damit ϕ 1 (x) = y 1 + ϕ 2 (x) = y 2 + x x f(t, ϕ 1 (t), z 1 )dt x x f(t, ϕ 2 (t), z 2 )dt x y(x) = (y 1 y 2 ) + (f(t, ϕ 1 (t), z 1 ) f(t, ϕ 2 (t), z 2 )) x x y(x) y 1 y 2 + f(t, ϕ 1 (t), z 1 ) f(t, ϕ 2 (t), z 2 ) x y 1 y 2 + x x (L y(t) + M z 1 z 2 ) ( y 1 y 2 + M z 1 z 2 x 1 x ) + L für alle x I. Lemma 2.1 impliziert also, dass für alle x > x. x y(x) ( y 1 y 2 + z 1 z 2 x 1 x ) e L(x x ) x y(t) 36
37 Satz 2.11 zeigt die orbitale Stabilität der Differentialgleichung y (x) = f(x, y(x)), unter geeigneter Annahme an f. Orbitale Stabilität bedeutet, dass falls wir zwei Anfangsbedingungen y 1, y 2 betrachten, mit y 1 y 2 klein, dann bleibt der Abstand y 1 (x) y 2 (x) klein, für alle festen x R. Der Fehler kann aber im Limes x gross werden. Eine stärkere Form von Stabilität ist die sogenannte asymptotische Stabilität. In diesem Fall bleibt der Fehler klein, gleichmässig in x und verschwindet, da x. Ein besonderes Beispiel von asymptotischer Stabilität hat man bei Attraktoren. Definition Sei Ω R n offen, f C(Ω; R n ). Ein Punkt y Ω heisst ein Attraktor, falls eine offene Umgebung V von y existiert, so dass für alle y V, das Anfangswertproblem { y (x) = f(y(x)) y(x ) = y eine eindeutige Lösung y C 1 ([x ; ); R n ) hat, mit der Eigenschaft lim y(x) = x y. Ist y R n ein Attraktor, dann kann man sich einfach überzeugen, dass f(y ) = (sonst würde y (x) f(y ) und y(x) könnte nicht konvergieren. Beweis: Übung). Anderseits, jede y R n mit f(y ) = definiert eine stationäre (d.h. konstante) Lösung y(x) = y von der Gleichung y (x) = f(y). Die Frage, ob ein solcher Punkt ein Attraktor ist, ist gerade die Frage, ob die stationäre Lösung y(x) = y asymptotisch stabil ist. Man findet, dass die Stabilität von stationären Lösungen mit der Ableitung von f an der Stelle y zu tun hat. Das diskutieren wir im nächsten Satz, für den skalaren Fall n = 1 (eine analoge Aussage gilt auch für n > 1; in diesem Fall braucht man aber Kenntnisse aus der Differentialrechnung in mehreren Veränderlichen, die wir noch nicht haben). Satz Sei f C 1 (R), mit sup x R f (x) <, und y R mit f(y ) = und f (y ) <. Dann ist y ein Attraktor für die Differentialgleichung y (x) = f(y(x)). Beweis: O.B.d.A. können wir annehmen, dass y =. Sei f () = λ, für ein λ >. Wir schreiben (da f() = ) mit f(y) = f() + 1 = f ()y + y d dt f(ty)dt = y 1 R(y) = 1 f (ty)dt ( f (ty) f () ) dt = f ()y + yr(y) 1 ( f (ty) f () ) dt Die Stetigkeit von f impliziert, dass R(y) für y. Wir finden also ein ε > mit sup R(y) λ/2. y [ ε;ε] Für ein beliebiges x R, sei nun y C 1 ([x ; )) die Lösung der Differentialgleichung y (x) = f(y(x)) mit der Anfangsbedingung y(x ) = y für ein y [ ε/2; ε/2] (bemerke, dass Satz 2.7 die Existenz einer globalen Lösung für dieses Anfangswertproblem garantiert). 37
38 Wir behaupten, dass y(x) ε für alle x [x ; ). Ist das nicht der Fall, so setzen wir x 1 = inf{x [x ; ) : y(x) > ε} Aus der Stetigkeit von y(x) gilt dann y(x) ε für alle x [x ; x 1 ]. Wir setzen nun ϕ(x) = y(x) exp( f ()(x x )), für alle x > x. Es gilt dann ϕ(x ) = y und ϕ (x) = ( y (x) f ()y(x) ) exp( f ()(x x )) = ( f(y(x)) f ()y(x) ) exp( f ()(x x )) = y(x)r(y(x)) exp( f ()(x x )) = R(y(x))ϕ(x) (42) Da y(x) ε für alle x [x ; x 1 ], ist R(y(x)) λ/2 für alle x [x ; x 1 ]. Damit ist ϕ (x) (λ/2) ϕ(x) für alle x [x ; x 1 ]. Die Identität zeigt also, dass Aus Lemma 2.1 folgt, dass Das ergibt ϕ(x) = ϕ(x ) + x x ϕ (t)dt x x ϕ(x) y + ϕ (t) dt y + (λ/2) x ϕ(t) dt x ϕ(x) y e (λ/2)(x x ) y(x) y e (λ/2)(x x ) für alle x [x ; x 1 ]. Damit ist y(x 1 ) y ε/2. Aus Stetigkeit von y existiert also ein δ > mit y(x) ε für alle x [x 1 δ; x 1 + δ], im Widerspruch zur Definition von x 1. Das zeigt, dass y(x) ε für alle x R. Aus (42) folgt also, dass ϕ (x) (λ/2) ϕ(x) für alle x > x. Das ergibt ϕ(x) y exp((λ/2)(x x )) für alle x > x und y(x) y e (λ/2)(x x ) für alle x > x. Das zeigt, dass y(x), für x, für alle Anfangsbedingungen y mit y ε/2. 3 Differentialrechnung in mehreren Veränderlichen 3.1 Definition der Ableitung für Funktionen auf R n Wiederholung von Begriffen aus der linearen Algebra und Analysis 1. In Analysis 1 (siehe Definition 2.34) haben wir den Begriff vom Vektorraum definiert. Ein Vektorraum über R ist nämlich eine Menge V, versehen mit einer Addition + : V V V und einer skalaren Multiplikation : R V V, die eine Reihe von Axiomen erfüllen. Ein normierter Vektorraum ist ein Vektorraum V, auf dem eine Abbildung. : V R definiert ist, mit den Eigenschaften: i) x für alle x V, x = genau dann, 38
39 wenn x = ; ii) αx = α x für alle x V und α R; iii) x + y x + y. Eine Norm. auf einem Vektorraum V erzeugt immer eine Metrik auf V, die durch d(x, y) = x y definiert wird. Also ist jeder normierte Vektorraum ein metrischer Raum. Wir sagen der normierte Vektorraum V ist vollständig, falls V, versehen mit der aus der Norm induzierten Metrik, ein vollständiger metrischer Raum ist. Seien nun V und W zwei Vektorräume über R. Eine Abbildung L : V W heisst linear, falls L(x + λy) = L(x) + λl(y) für alle x, y V und λ R. Wir bezeichnen die Menge aller linearen Abbildungen L : V W mit L(V, W ). Seien L, M L(V, W ) und λ R. Wir definieren dann die Abbildungen L + M, λl : V W durch (L + M)(x) = L(x) + M(x), und (λl)(x) = λl(x) für alle x V. Offenbar gilt L + M, λl L(V, W ). Damit hat L(V, W ) die Struktur eines Vektorraumes über R (es ist leicht zu überprüfen, dass Summe und skalare Multiplikation alle notwendigen Axiome erfüllen). Nehmen wir nun an, V, W seien normierte Vektorräume. Für L L(V, W ) definieren wir dann L op := Lv sup v V \{} v = sup Lv = v V, v 1 sup Lv (43) v V, v =1 Eine lineare Abbildung L L(V, W ) heisst beschränkt, falls L op <. Das ist leicht zu zeigen: Eine Abbildung L L(V, W ) ist genau dann beschränkt, falls sie auf V stetig ist. Ferner, eine Abbildung L L(V, W ) ist genau dann auf V stetig, falls sie in v = stetig ist. Wir bezeichnen L(V, W ) := {L L(V, W ) : L beschränkt ist} = {L L(V, W ) : L stetig ist} die Teilmenge von L(V, W ) die aus beschränkten Abbildungen besteht. Es ist einfach zu zeigen, dass L(V, W ) ein linearer Unterraum von L(V, W ) ist. Also ist L(V, W ) selbst ein Vektorraum. Man kann dann leicht beweisen, dass (43) eine Norm auf L(V, W ) definiert. Man nennt L op die Operatornorm von L. L(V, W ), versehen mit der Norm. op ist also ein normierter Vektorraum. Tatsache: Ist W vollständig, so ist auch L(V, W ) ein vollständig normierter Vektorraum, unabhängig davon, ob V vollständig ist oder nicht (ein vollständiger normierter Vektorraum heisst ein Banach-Raum). Sind V, W, X drei Vektorräume, und L L(V, W ) und M L(W, X) zwei lineare Abbildungen, so können wir die Verknüpfung L M : V X durch (L M)(v) := L(M(v)) definieren. Wir bezeichnen oft die Verknüpfung L M als L M oder einfach als LM. Es ist leicht zu sehen, dass LM L(V, X) eine lineare Abbildung ist. Sind ferner V, W, X drei normierte Vektorräume und L L(V, W ) und M L(W, X) beschränkt, dann ist auch LM beschränkt und LM op L op M op Also, für jede L L(V, W ) und M L(W, X), ist LM L(V, X). Insbesondere, für jede L, M L(V, V ) ist LM L(V, V ). Das definiert ein Produkt auf dem Vektorraum L(V, V ). 39
40 Sei V ein Vektorraum. Eine lineare Abbildung L L(V, R) heisst ein lineares Funktional auf V. Sei V ein normierter Vektorraum. Der Raum L(V, R) aller stetigen linearen Funktionalen auf V heisst der Dualraum von V und wird oft mit V bezeichnet. Versehen mit der Operatornorm Lv = sup v V, v 1 Lv ist V ein normierter Vektorraum. Da R vollständig ist, ist V immer vollständig. Wir werden in dieser Vorlesung nur endlich dimensionale Vektorräume betrachten. Jeder Vektorraum V mit dim V = n < ist isomorph zu R n (ein Isomorphismus ist nach Wahl einer Basis von V gegeben). Auf R n ist die standard euklidische Norm durch (x 1,..., x n ) 2 = x j 2 definiert. Auf R n ist auch ein Skalarprodukt definiert. Für x = (x 1,..., x n ) und y = (y 1,,y n ) setzen wir x y = x j y j j=1 Dann gilt x 2 = x x. Wir haben in Analysis 1 bewiesen, dass R n, versehen mit der euklidischen Norm., ein vollständiger normierter Vektorraum ist. Tatsache: Auf einem endlich dimensionalen Vektorraum sind alle zwei Normen äquivalent. D.h., falls. 1,. 2 zwei Normen auf R n sind, dann es gibt eine Konstante c > mit j=1 1 c x 1 x 2 c x 1 für alle x R n. Die Äquivalenz der zwei Normen impliziert, dass eine Folge x n auf R n genau dann bzg.. 1 konvergiert, wenn sie bzg.. 2 konvergiert und dass eine Folge x n auf R n genau dann bzg.. 1 eine Cauchy-Folge ist, wenn sie bzg.. 2 eine Cauchy-Folge ist. Da R n versehen mit der Standardnorm vollständig ist, ist R n bzg. einer beliebigen Norm ein vollständiger Vektorraum (es ist natürlich möglich, auf R n eine Metrik d zu finden, so dass (R n, d) nicht vollständig ist; eine solche Metrik d kann dann aber nicht von einer Norm induziert werden). Sei L : R n R m eine lineare Abbildung. Dann existiert eine m n Matrix L = (l ij ), so dass L(x) = Lx, wobei das Produkt Lx durch ( Lx) i = l ij x j definiert ist. Wir identifizieren deswegen die lineare Abbildung L mit der entsprechenden Matrix L. Jede lineare Abbildung L : R n R m ist beschränkt. In der Tat, falls wir auch mit L = (l ij ) die Matrix bezeichnen, die der Abbildung L zugeordnet ist, so gilt L op L, wobei m L = Tr L L = l ij 2 < j=1 i=1 j=1 4
41 die Standardnorm von L ist, falls wir L als ein Element von R m n betrachten. Es folgt, dass jede lineare Abbildung zwischen R n und R m automatisch stetig ist, d.h. L(R n, R m ) = L(R n, R m ). Der Dualraum zu R n ist der Vektorraum (R n ) = L(R n, R) aller linearen Funktionalen auf R n (weil jedes lineare Funktional auf R n stetig ist). Ein beliebiges lineares Funktional L auf R n kann also mit einer 1 n Matrix identifiziert werden. Mit anderen Worten, jedes lineare Funktional L auf R n kann mit einem Vektor a R n identifiziert werden, so dass L(x) = a x = a j x j wobei a x das Skalarprodukt auf R n bezeichnet. Man kann sich leicht davon überzeugen, dass für ein solches lineares Funktional, L op = j=1 sup L(x) = sup a x = a x R n, x 1 x R n, x 1 wobei a die Standardnorm auf R n bezeichnet. Es folgt, dass (R n ) R n als normierte Vektorräume identifiziert werden können. Partielle Ableitungen. Nach dieser kurzen Wiederholung aus der linearen Algebra, sind wir bereit, den Begriff von Ableitung auf mehrdimensionale Vektorräume zu definieren. Wir werden der Einfachkeit halber Funktionen betrachten, die auf einer Teilmenge von R n definiert sind, mit Werten auf R m. Die Definitionen können aber einfach auf Funktionen zwischen zwei beliebigen (endlich dimensionalen) Vektorräumen verallgemeinert werden (weil jeder endlich dimensionale Vektorraum isomorph zu R n ist). Auf R n werden wir immer die euklidische Standardnorm betrachten. Es ist aber einfach, die Definitionen auf beliebige andere Normen zu erweitern (weil jede Norm zur Standardnorm äquivalent ist). Also, obwohl wir nur Funktionen f : R n U R m betrachten werden, kann man den Begriff von Ableitung für beliebige Funktionen zwischen zwei normierten endlich dimensionalen Vektorräumen definieren. Definition 3.1. Sei U R n offen, x U, i {1,..., n}. Eine Funktion f : U R heisst im Punkt x partiell differenzierbar in der i-ten Koordinate, falls der Limes f f(x + he i ) f(x ) (x ) := lim x i h h existiert. Hier sind die Vektoren e 1,..., e n die Standardbasis von R n, d.h. wir haben e i = (,..., 1,,..., ). In diesem Fall heisst die Zahl f/ x i (x ) die i-te partielle Ableitung von f an der Stelle x. Die Funktion f heisst an der Stelle x U partiell differenzierbar, falls f in jeder Koordinate an der Stelle x partiell differenzierbar ist. Die Funktion f heisst auf U partiell differenzierbar, falls f an der Stelle x partiell differenezierbar ist, für jede x U. Bemerkung: Die partielle Ableitung in der i-ten Koordinate ist die gewöhnliche Ableitung bezüglich der i-ten Variablen von f, wenn die anderen (n 1) Koordinaten konstant gehalten werden. D.h. die i-te partielle Ableitung von f an der Stelle x = (x 1,..., x n) 41
42 R n ist die Ableitung der Funktion einer Variablen t f(x 1, x 2,..., x i + t, x i+1,..., x n) an der Stelle t =. Bemerkung: Analog kann man die partielle Ableitungen einer vektorwertigen Funktion definieren. Sei wie oben U R n offen und f : U R m. Für j = 1,..., m, sei f m : U R die m-te Komponente von f; d.h. es gelte f(x) = (f 1 (x),..., f m (x)). Dann sagen wir, dass f im Punkt x in der i-ten Koordinate partiell differenzierbar ist, falls f j an der Stelle x in der i-ten Koordinate partiell differenzierbar ist, für alle j = 1,..., m. In diesem Fall ist die i-te partielle Ableitung von f aus dem Vektor gegeben. f x i (x ) = ( f1 x i (x ),..., f m x i (x ) ) R m Es stellt sich heraus, dass der Begriff von partieller Differenzierbarkeit ein bisschen zu schwach ist. Viele Resultate, die wir für differenzierbare Funktionen auf R kennen, gelten für eine auf einer offenen Teilmenge U R n definierte, partiell differenzierbare Funktion f nicht. Z.B. zeigt das folgende Beispiel, dass partielle Differenzierbarkeit einer Funktion nicht ihre Stetigkeit impliziert. Beispiel: Auf R 2 definieren wir die Funktion { xy falls (x, y) (, ) f(x, y) = x 2 +y 2 falls (x, y) = (, ) Wir behaupten, dass f auf R 2 partiell differenzierbar ist. In der Tat ist f offenbar an der Stelle (x, y) in der ersten Koordinate partiell differenzierbar für alle (x, y) (, ). Wir behaupten, f auch an der Stelle (, ) in der ersten Koordinate partiell differenzierbar ist. In der Tat f(h, ) f(, ) lim = lim h h h h = Analog kann man zeigen, dass f überall in der zweiten Koordinate partiell differenzierbar ist. Also ist f auf R 2 partiell differenzierbar. Wir behaupten nun, dass f an der Stelle (, ) nicht stetig ist. In der Tat haben wir 1/k 2 lim f(1/k, 1/k) = lim k k 1/k 2 + 1/k 2 = 1 2 Also, obwohl die Folge (1/k, 1/k) (, ) konvergiert, ist f(1/k, 1/k) f(, ). Ableitung auf R n. Wir brauchen also einen stärkeren Begriff von Differenzierbarkeit für Funktionen, die auf Teilmengen von R n definiert sind. Um den richtigen Begriff zu finden, möchten wir zunächst den Begriff von Differenzierbarkeit für Funktionen einer Variablen umschreiben. Sei U R offen, und x U. Eine Funktion f : U R ist an der Stelle x falls der Grenzwert f(x + h) f(x ) lim h h existiert. Es folgt: f ist in x differenzierbar, falls ein Zahl L R existiert s.d. f(x + h) f(x ) Lh = o( h ) 42
43 im Limes h. Das bedeutet, f ist an der Stelle x differenzierbar, falls sich f in der Nähe von x durch eine lineare Funktion approximieren lässt. Ist das der Fall, so ist L eindeutig bestimmt und aus L = f (x ) gegeben. Dieser Begriff lässt sich nun auf Funktionen verallgemeinern, die auf einer offenen Teilmenge von R n definiert sind. Definition 3.2. Sei U R n offen, f : U R m und x U. Die Funktion f heisst an der Stelle x differenzierbar, wenn eine lineare Abbildung L : R n R m existiert, so dass f(x + h) f(x ) L(h) lim = h h In diesem Fall heisst die Abbildung L die Ableitung oder das Differential von f an der Stelle x und wird mit L = Df(x ) bezeichnet. f heisst auf U differenzierbar, falls f an der Stelle x differenzierbar ist, für alle x U. Bemerkung: Ist f an der Stelle x differenzierbar, so ist die Ableitung Df(x ) eindeutig bestimmt. Gilt in der Tat so muss Da f(x + h) f(x ) L(h) f(x + h) f(x ) M(h) lim =, und lim = h h h h für alle K >, erhalten wir Lx Mx x L(h) M(h) lim = h h = L(x/K) M(x/K) x/k Lx Mx x L(x/K) M(x/K) L(h) M(h) = lim = lim = K x/k h h für alle x R n. Das bedeutet und deswegen L = M. L M op = Lx Mx sup = x R n \{} x Bemerkung: Ist f an der Stelle x differenzierbar, so ist die Ableitung Df(x ) : R n R m eine lineare Abbildung. Man kann also Df(x ) mit einer n m Matrix identifizieren. Wie für jede lineare Abbildung zwischen endlich dimensionale Vektorräume, ist Df(x ) beschränkt, Df(x ) op <, und damit auch stetig. Bemerkung: Es folgt, dass eine Funktion f ist an der Stelle x differenzierbar, falls sie sich lokal durch eine lineare Abbildung approximieren lässt, d.h. falls L L(R n, R m ) existiert, s.d. f(x + h) f(x ) Lh = o( h ) Bemerkung: Sei U R n offen. Sei f : U R m mit Komponenten f 1,..., f m : U R. D.h. es gelte f(x 1,..., x n ) = (f 1 (x 1,..., x n ),..., f m (x 1,..., x n )) für alle (x 1,..., x n ) 43
44 U. Dann ist f an der Stelle x U genau dann differenzierbar, wenn f j an der Stelle x differenzierbar ist, für alle j = 1,..., m. Das folgt aus der Tatsache, dass eine Folge x (n) = (x (n) 1,..., x(n) m ) R m genau dann gegen x = (x 1,..., x m ) R m konvergiert, wenn x (n) j x j für alle j = 1,..., m. Satz 3.3. Sei U R n offen, x U, und f : U R m an der Stelle x differenzierbar. Dann ist f an der Stelle x stetig. Beweis: Sei L die Ableitung von f an der Stelle x. Wir schreiben f(x + h) f(x ) = [f(x + h) f(x ) L(h)] + L(h) Da f differenzierbar an der Stelle x ist, gilt f(x + h) f(x ) L(h) für h. Anderseits, L(h) L op h für h. Also f(x + h) f(x ) f(x + h) f(x ) L(h) + L(h) für h. Das zeigt, dass f an der Stelle x stetig ist. Richtungsableitungen. Ist f an der Stelle x differenzierbar, so existieren alle partiellen Ableitungen von f an der Stelle x. Ferner existieren alle Richtungsableitungen. Proposition 3.4. Sei U R n offen, x U und f : U R m an der Stelle x differenzierbar. Dann f(x + tv) f(x ) lim = Df(x )(v) t t für alle v R n (hier ist t R) und insbesondere existiert der Grenzwert auf der linken Seite. Man nennt den Grenzwert auf der linken Seite die Richtungsableitung von f in der Richtung v. Beweis: Aus Differenzierbarkeit folgt, dass f(x + h) f(x ) L(h) lim = h h Insbesondere, falls h = tv für ein festes v R n und t R, gilt (weil, wegen Linearität, L(tv) = tl(v)) f(x + tv) f(x ) L(tv) = lim = v 1 lim f(x + tv) f(x ) t tv t L(v) t und damit f(x + tv) f(x ) lim = L(v) t t 44
45 Wählen wir v = e j, dann impliziert Proposition 3.4, dass alle partiellen Ableitungen ( f/ x j )(x ) für j = 1,..., n existieren. Es folgt auch, dass die partielle Ableitung ( f/ x j )(x ) die j-te Kolumne der Matrix Df(x ) ist. Mit anderen Worten, sei f : U R m, mit Komponenten f 1,..., f m : U R, so dass f(x) = (f 1 (x), f 2 (x),..., f m (x)) für alle x U. Sei f an der Stelle x differenzierbar. Dann kann die lineare Abbildung Df(x ) : R n R m durch die m n Matrix mit Einträge (Df(x )) i,j = f i x j (x ) für i = 1,..., m und j = 1,..., n (44) dargestellt werden. Diese Matrix heisst die Funktionalmatrix, oder die Jacobi-Matrix von f an der Stelle x. Wie wir schon gemerkt haben, impliziert die Existenz der Jacobi-Matrix nicht, dass f an der Stelle x differenzierbar ist. Man findet aber, dass Existenz und Stetigkeit der partiellen Ableitungen die Differenzierbarkeit von f implizieren. Dieses Kriterium ist wichtig, weil es uns erlaubt, die Differenzierbarkeit von Funktionen, einfach durch Untersuchung der partiellen Ableitungen, zu beweisen. Proposition 3.5. Sei U R n offen, f : U R m. Ferner, nehmen wir an, dass die partiellen Ableitungen f/ x j (x) auf U existieren und stetig sind. Dann ist f auf U differenzierbar. Beweis: O.B.d.A. betrachten wir den Fall m = 1 (die Differenzierbarkeit von f(x) = (f 1 (x),..., f m (x)) ist mit der Differenzierbarkeit von f 1,..., f m äquivalent). Der Einfachkeit halber untersuchen wir zunächst den Fall n = 2. Wir nehmen an = (, ) U, und wir zeigen die Differenzierbarkeit in diesem Punkt. Sei h = (h 1, h 2 ) so klein, dass B h () U. Wir schreiben f(h 1, h 2 ) f(, ) = f(h 1, h 2 ) f(h 1, ) + f(h 1, ) f(, ) Da die Abbildung y f(h 1, y) stetig differenzierbar ist (aus Existenz und Stetigkeit der partiellen Ableitung in der y-richtung), können wir schreiben f(h 1, h 2 ) f(h 1, ) = h2 dy f y (h 1, y) = f y (, )h 2 + h2 Analog ist x f(x, ) stetig differenzierbar. Deswegen Also haben wir f(h 1, ) f(, ) = h1 dx f (x, ) x = f (, ) + x f(h 1, h 2 ) f(, ) f x (, )h 1 f = h1 dx y (, )h 2 h1 ( f f (x, ) (, ) x x 45 ( f dy y (h 1, y) f ) (, ) y ( f dx x ) ) f (x, ) (, ) x h2 ( f + dy y (h 1, y) f ) (, ) y
46 Die Differenzierbarkeit von f an der Stelle (, ) folgt, falls wir zeigen können, dass h1 dx ( ) f f h2 ( f (x, ) (, ) + dy x x y (h 1, y) f ) y (h 1, y) = o( (h 1, h 2 ) ) da (h 1, h 2 ). Sei also ε > fest. Da die partiellen Ableitungen stetig sind, finden wir δ > so dass f f (x, y) (, ) x x ε und 2 f f (x, y) (, ) y y ε 2 für alle (x, y) R 2 mit (x, y) δ. Sei nun (h 1, h 2 ) δ. Dann gilt auch (h 1, y) δ, für alle y h 2 (angenommen h 2 >, sonst ist die Aussage war für alle h 2 y ). Damit gilt f y (h 1, y) f (, ) y ε 2 für alle y h 2 und also h2 ( f dy y (h 1, y) f ) (, ) ε h 2 y 2 ε h 2 Ähnlich gilt (x, ) δ für alle x h 1 (oder h 1 x, falls h 1 < ). Deswegen f f (x, ) (, ) x x ε 2 für alle x h 1 und also h1 dx ( f x ) f (x, ) (, ) ε h 1 ε h x 2 2 Es folgt, dass für alle ε > ein δ > existiert, so dass 1 h1 ( ) f f h2 ( f (h 1, h 2 ) dx (x, ) (, ) + dy x x y (h 1, y) f ) (, ) ε y für alle (h 1, h 2 ) δ. Das zeigt die Behauptung. Die Verallgemeinerung zu n 3 lassen wir als Übung. Der Gradient. Sei U R n, offen und f : U R eine reel-wertige Abildung, differenzierbar an der Stelle a U. Das Differential von f an der Stelle a ist dann eine lineare Abbildung Df(a) : R n R und kann mit einer 1 n Matrix identifiziert werden. Mit anderen Worten, Df(a) ist ein lineares Funktional auf R n. Wie jedes lineare Funktional auf R n kann Df(a) mit einem Vektor v = (v 1,... v n ) R n, mit der Eigenschaft, dass Df(a)(y) = v y = 46 v j y j j=1
47 für alle y = (y 1,..., y n ) R n identifiziert werden. Man nennt den Vektor v den Gradienten von f an der Stelle a und man benutzt die Notation v = f(a). Nach (44) sind die Komponenten vom Gradient aus ( f f(a) = (a),..., f ) (a) x 1 x n gegeben. Für einen beliebigen Einheitsvektor e R n gilt, nach Proposition 3.4, d dt f(a + te) t= = Df(a)(e) = f(a) e D.h. die Zuwachsrate der Funktion f in der Richtung e ist aus dem Skalarprodukt f(a) e gegeben. Nehmen wir an f(a). Das Skalarprodukt f(a) e ist dann maximal über allen möglichen Einheitsvektoren e R n, mit e = 1, falls e = f(a)/ f(a). Für e = f(a)/ f(a) gilt dann d f(a) f(a + te) = f(a) dt f(a) = f(a) Wir haben bewiesen, dass der Vektor f(a) in die Richtung der grössten Zuwachsrate der Funktion f an der Stelle a zeigt. Die Länge von f(a) ist dann genau die grösste Zuwachsrate von f an der Stelle a (das gilt auch, falls f(a) = ). Stetige Differenzierbarkeit. Sei U R n offen. Eine Funktion f : U R m heisst auf U stetig differenzierbar, falls die Ableitung Df(x) existiert, für alle x U, und falls die Abbildung Df : U L(R n ; R m ) stetig ist. Aus Proposition 3.5 folgt, dass f auf U genau dann stetig differenzierbar ist, wenn die partielle Ableitung f i / x j (x) für alle i = 1,..., m und alle j = 1,..., n auf U existiert und stetig ist. Wir setzen C 1 (U; R m ) := {f : U R m : f auf U stetig differenzierbar ist}. Rechenregeln. Wir sammeln in der nächsten Proposition ein paar nützliche elementare Regeln für die Berechnung von Ableitungen von Funktionen mit mehreren Veränderlichen. Proposition 3.6. Sei U R n offen, a U. a) Seien f, g : U R m differenzierbar an der Stelle a und λ R. Dann ist auch f + λg : U R m differenzierbar an der Stelle a und D(f + λg)(a) = Df(a) + λdg(a). b) Ist f konstant auf U, so gilt Df(x) = für alle x U. c) Ist f : R n R m linear, dann gilt Df(x) = f, für alle x R n. Beweis: Teil (a) und (b) sind offenbar, nach Definition der Ableitung und linearität des Limes. Zu Teil (c) bemerken wir, dass f(x + h) = f(x) + f(h). Das impliziert, dass f(x + h) f(a) f(h) = = o( h ) Damit ist die lineare Abbildung L = f die Ableitung von f an der Stelle x. 47
48 Kettenregel. Die Ableitung der Verknüpfung zweier Funktionen kann durch die Kettenregel berechnet werden. Satz 3.7. Sei U R n und G R p offen. f : U R p, g : G R m, mit f(u) G. Sei a U, f differenzierbar an der Stelle a, g differenzierbar an der Stelle f(a). Dann ist die Funktion g f : U R m differenzierbar an der Stelle a U, und D(g f)(a) = Dg(f(a)) Df(a) wobei das Produkt auf der rechten Seite die Komposition der zwei linearen Abbildungen Df(a) : R n R p und Dg(f(a)) : R p R m ist. Mit anderen Worten, die m n Matrix D(g f)(a) ist aus dem Produkt der m p Matrix Dg(f(a)) mit der p n Matrix Df(a) gegeben. Beweis: Sei b = f(a), L = Df(a), M = Dg(b). Für h R n, h R p setzen wir η 1 (h) = f(a + h) f(a) L(h), und η 2 ( h) = g(b + h) g(b) M( h) Nach Differenzierbarkeit von f an der Stelle a und von g an der Stelle b, gilt η 1 (h) = o( h ), und η 2 ( h) = o( h ) für h, h. Sei nun h R n beliebig und h = L(h) + η 1 (h). Dann gilt Also b + h = f(a) + L(h) + η 1 (h) = f(a + h) (g f)(a + h) = g(f(a + h)) = g(b + h) = g(b) + M( h) + η 2 ( h) = g(f(a)) + M(L(h)) + M(η 1 (h)) + η 2 ( h) Die Behauptung folgt, falls wir zeigen können, dass i) M(η 1 (h)) = o( h ) und ii) η 2 ( h)) = o( h ) für h. Um i) zu zeigen, bemerken wir einfach, dass M(η 1 (h)) h M op η 1 (h) h für h, weil η 1 (h) = o( h ). Anderseits, um ii) zu beweisen, benutzen wir, dass η 1 (h) h für h klein genug (weil η 1 (h) = o( h )). Deswegen gilt h = L(h) + η 1 (h) L(h) + η 1 (h) ( L + 1) h für h klein genug. Da η 2 ( h) = o( h ) existiert, für ein beliebiges ε > ein δ > mit η 2 ( h) ε h ( L + 1)ε h für alle h R n mit h δ. Das bedeutet, dass η 2 ( h) = o( h ) und zeigt ii). 48
49 Beispiel. Sei q : R R 3 die Bahn eines Teilchens als Funktion der Zeit. Sei T : R R 3 R die Temperatur als Funktion von der Zeit und von der Position im Raum. Die vom Teilchen zur Zeit t gespürte Temperatur ist aus der Funktion t T (t, q(t)) gegeben. Sind q und T differenzierbar, so ist auch t T (t, q(t)) differenzierbar, mit d T 3 T (t, q(t)) = (t, q(t)) + dt t j=1 T x j (t, q(t))q j(t) Das Resultat folgt mit der Definition f : R R 4 durch f(t) = (t, q 1 (t), q 2 (t), q 3 (t)). Nach Differenzierbarkeit von q ist auch f differenzierbar, mit Da T (t, q(t)) = (T f)(t) folgt, dass f (t) = (1, q 1(t), q 2(t), q 3(t)) (T f) (t) = DT (f(t)) f (t) = ( T )(f(t)) f (t) = T 3 (t, q(t)) + t 3.2 Mittelwertsatz j=1 T x j (t, q(t))q j(t) Für eine auf [a; b] stetige und auf (a; b) differenzierbare Funktion f : [a; b] R besagt der Mittelwertsatz, dass ein ξ (a; b) existiert, mit f(b) f(a) = f (ξ)(b a). Wir zeigen hier eine analoge Aussage für Funktionen mit mehreren Veränderlichen. Satz 3.8 (Mittelwertsatz). Sei U R n offen, f : U R differenzierbar. Seien a, b U mit [a; b] = {(1 λ)a + λb : λ [; 1]} U Dann gibt es ein ξ [a; b] (ξ a, b) mit f(b) f(a) = f(ξ) (b a) Beweis: Sei φ : [, 1] R n durch φ(t) = (1 t)a + tb definiert. Sei ψ : [; 1] R durch ψ(t) = f(φ(t)) definiert. Nach der Kettenregel ist ψ ist dann auf [; 1] stetig und auf (; 1) differenzierbar, mit ψ (t) = f(φ(t)) φ (t) = f((1 t)a + tb) (b a) Aus dem Mittelwertsatz für Funktionen einer Variablen existiert t (; 1) mit f(b) f(a) = ψ(1) ψ() = ψ (t )(1 ) = f((1 t )a + t b) (b a) Die Behauptung folgt, mit ξ = (1 t )a + t b. Für Funktionen mit Werten auf R m, m > 1, gilt i.a. der Mittelwertsatz nicht (unabhängig davon, ob die Funktion eine oder mehrere Veränderliche hat; siehe Bemerkung unter Satz 8.9 in Analysis 1). Man kann aber eine Mittelwertabschätzung zeigen (siehe Proposition 8.1 in Analysis 1 für die Mittelwertabschätzung für Funktionen einer Variablen). 49
50 Satz 3.9 (Mittelwertabschätzung). Sei U R n offen, f : U R m differenzierbar, a, b U mit [a; b] = {(1 λ)a + λb : λ [; 1]} U Sei Df(x) op M für alle x [a; b]. Dann gilt f(b) f(a) M b a Beweis: O.B.d.A. können wir annehmen, dass f(b) f(a). Wir setzen e = f(b) f(a) f(b) f(a) Rm. Wir definieren die lineare Funktion φ : R m R durch φ(x) = x e. Wir bemerken, dass, wegen Linearität, φ auf R m differenzierbar ist, mit Dφ = φ. Ferner, da e = 1, gilt φ op 1 (eigentlich φ op = 1). Wir definieren auch die Funktion g : R n R durch g(x) = φ(f(x) f(a)) Es gilt g(a) = und g(b) = f(b) f(a). Aus der Kettenregel ist g auf U differenzierbar, mit Dg(x) = Dφ(f(x) f(a)) Df(x) = φ Df(x) Für x [a; b] gilt also Dg(x) op φ op Df(x) op M Der Mittelwertsatz 3.8 für die Funktion g impliziert, dass ein ξ [a; b] mit f(b) f(a) = g(b) g(a) = Dg(ξ) (b a) Dg(ξ) op b a M b a existiert. Eine Anwendung der Mittelwertabschätzung ist der Beweis der Tatsache, dass eine auf einem offenen und zusammenhängenden Gebiet U R n definierte Funktion f mit Df = auf U konstant sein muss. Definition 3.1. Ein Streckenzug auf R n ist eine Menge der Form [a 1 ; a 2 ] [a 2 ; a 3 ] [a p 1 ; a p ] für ein p N, und für Punkten a 1,..., a n R n (hier bezeichnet [a; b] = {(1 λ)a + λb : λ [; 1]} der Segment zwischen a und b). a heisst Anfangspunkt und a n heisst Endpunkt des Streckenzuges. Wir sagen dann der Streckenzug verbindet die Punkten a und a p. Eine offene Teilmenge U R n heisst zusammenhängend falls je zwei Punkten in U durch einen Streckenzug in U verbinden werden können. Proposition Sei U R n offen und zusammenhängend, f : U R m differenzierbar, mit Df(x) = für alle x U. Dann ist f konstant auf U. 5
51 Beweis: Ist [a; b] U dann gilt, aus Satz 3.9 mit M =, f(b) = f(a). Seien nun x, y U beliebig. Da U zusammenhängend ist gibt es ein Streckenzug [a ; a 1 ] [a p 1 ; a p ] in U, mit a = x und a p = y. Also f(x) = f(a 1 ) = f(a 2 ) = = f(a p 1 ) = f(y). Bemerkung: die Annahme, dass U zusammenhängend ist, ist notwendig. Sei U = {x R 2 : x < 1 oder x 3 < 1} und f : U R durch f(x) = falls x < 1 und f(x) = 1 falls x 3 < 1 definiert. Dann ist U offen, und Df(x) = für alle x U, aber f ist auf U nicht konstant. 3.3 Höhere Ableitungen, Taylor Entwicklung, lokale Extrema Sei U R n offen, und f : U R m differenzierbar. Die Ableitung von f ist dann eine Funktion Df : U L(R n ; R m ) mit Werten in den linearen Abbildungen zwischen R n und R m. Man kann L(R n ; R m ) mit dem Vektorraum R mn identifizieren (weil jede lineare Abbildung in L(R n ; R m ) mit einer m n Matrix identifiziert werden kann). Man kann sich also fragen, ob die Abbildung Df differenzierbar ist. Ist Df an der Stelle a U differenzierbar, dann heisst f an der Stelle a zweimal differenzierbar. Die zweite Ableitung ist eine lineare Abbildung D 2 f(a) : R n R mn, d.h. D 2 f(a) L(R n ; R n m ) R mn2. Iterativ kann man höhere Ableitungen definieren. Ist f auf U k-mal differenzierbar, und ist die k-te Ableitung D k f : U R mnk an der Stelle a differenzierbar, dann sagt man, dass f an der Stelle a (k + 1)-mal differenzierbar ist, und man bezeichnet die (k + 1)-te Ableitung mit D k+1 f(a) L(R n ; R mnk ) R mnk+1. Man bemerke, dass die Abbildung D 2 f(a) : R n L(R n ; R m ) R n m mit der bilinearen Abbildung D 2 f(a) : R n R n R m, definiert durch (D 2 f(a))(v, v ) = (D 2 f(a)(v))(v ), identifiziert werden kann (wir benutzen die selbe Notation D 2 f(a) für die lineare Abbildung R n L(R n ; R m ) und für die bilineare Abbildung R n R n R m ). Wir erinnern hier, dass eine Abbildung b : R n R n R m bilinear heisst, falls die zwei Bedingungen b(v 1 + λv 2, v) = b(v 1, v) + λb(v 2, v) b(v, v 1 + λv 2 ) = b(v, v 1 ) + λb(v, v 2 ) (Linearität im ersten Argument) (Linearität im zweiten Argument) (45) für alle v, v 1, v 2 R n, λ R erfüllt sind. Analog kann D 3 f(a) mit einer trilinearen Form identifiziert werden und D k f(a) mit einer k-linearen Abbildung auf R n, mit Werten in R m. Höhere partielle Ableitungen. Sei nun f : U R partiell differenzierbar. Dann ist f/ x j wieder eine Funktion auf U mit Werten in R. Ist diese neue Funktion partiell differenzierbar, so können wir die partiellen Ableitungen zweiter Ordnung 2 f = ( ) f x j x i x j x i 51
52 definieren. Iterativ kann man partielle Ableitungen höherer Ordnung definieren (die Ordnung einer partiellen Ableitung ist die gesamte Anzahl von partiellen Ableitungen). Um die Notation ein bisschen zu vereinfachen, schreiben wir, für eine partielle Ableitung der Ordnung k, k f i1 i2... ik f = = ( ( ( ))) f.... x i1 x i2... x ik x i1 x i2 x ik 1 x ik Wir sagen, die Funktion f : U R ist k-mal partiell differenzierbar, falls alle partiellen Ableitungen der Ordnung kleiner oder gleich k existieren. Wir sagen, dass eine Funktion f : U R m k-mal partiell differenzierbar ist, falls f(x) = (f 1 (x),..., f m (x)) und jede Komponente f 1,..., f m : U R k-mal partiell differenzierbar ist. Für k N, k 1, bezeichnen wir mit C k (U; R m ) die Menge der Funktionen f : U R m, die auf U k-mal differenzierbar sind, so dass D k f stetig ist. Nach Proposition 3.5 ist C k (U; R m ) genau die Menge der Funktionen f : U R m, für die alle partiellen Ableitungen der Ordnung kleiner oder gleich k existieren und stetig sind. Zur Berechnung von höheren partiellen Ableitungen ist es sehr nützlich zu bemerken, dass (unter geeigneten Annahmen an f) sich partielle Ableitungen miteinander vertauschen, d.h. i j f = j i f. Das wird in dem nächsten Satz bewiesen. Satz 3.12 (Schwarz). Sei U R 2 offen, (x, y ) U, und f : U R in U partiell differenzierbar. Falls y x f auf U existiert und an der Stelle (x, y ) stetig ist, dann existiert auch x y f an der Stelle (x, y ) und x y f(x, y ) = y x f(x, y ). Bemerkung. O.B.d.A. können wir (x, y ) = (, ) betrachten. Da erhalten wir y f(x, ) = lim y f(x, y) f(x, ) y f(x,y) f(x,) y f(x, ) y f(, ) y x y f(; ) = lim = lim lim x x x y Analog gilt = lim x lim y f(x, y) f(x, ) f(, y) + f(, ) xy f(,y) f(,) y x y x f(; ) = lim y lim x f(x, y) f(, y) f(x, ) + f(, ) xy Das Problem ist also zu zeigen, dass die zwei Grenzwerte vertauscht werden können. Beweis: O.B.d.A. nehmen wir an, dass (x, y ) = (, ) und dass y x f(, ) = (sonst ersetze f(x, y) durch f(x, y) y x f(, )xy). Wir definieren die Funktion φ(x, y) = f(x, y) f(x, ). Gemäss (46) sind wir an (46) f(x, y) f(, y) f(x, ) + f(, ) xy 52 = φ(x, y) φ(, y) xy
53 interessiert. Für festgehaltene y ist φ differenzierbar nach x und es gilt x φ(x, y) = x f(x, y) x f(x, ) Der Mittelwertsatz (für Funktionen einer Variablen) zeigt, es existiert < θ < 1 mit φ(x, y) φ(, y) = x x φ(θx, y) = x[ x f(θx, y) x f(θx, )] (47) Nun ist die Funktion y x f(θx, y), für festgehaltene x und θ nach y differenzierbar, mit Ableitung y x f(θx, y) (wir benutzen hier die Existenz der zweiten partiellen Ableitung y x f auf U). Der Mittelwertsatz (für eine Variable) impliziert also, dass ein < θ < 1 existiert, mit x f(θx, y) x f(θx, ) = y y x f(θx, θ y) Aus (47) folgt, dass und damit φ(x, y) φ(, y) = xy y x f(θx, θ y) f(x, y) f(, y) f(x, ) + f(, ) xy = y x f(θx, θ y) Sei nun ε > beliebig fest gewählt. Da y x f an der Stelle (, ) stetig ist, und da y x f(, ) =, existiert ein δ > mit y x f(w, z) ε für alle (w, z) R 2 mit (w, z) δ. Seien also (x, y) R 2, mit (x, y) δ. Dann gilt auch (θx, θ y) δ, für alle θ, θ (, 1). Deswegen gilt y x f(θx, θ y) ε und f(x,y) f(x,) y f(,y) f(,) y x = f(x, y) f(, y) f(x, ) + f(, ) xy ε Das gilt für alle (x, y) δ, und also insbesondere für feste x ( δ, δ) und y. Da f(x, y) f(x, ) f(, y) f(, ) lim = y f(x, ), und lim = y f(, ) y y y y erhalten wir y f(x, ) y f(, ) x ε für alle x ( δ, δ). Da ε > beliebig ist, es folgt, dass y f(x, ) y f(, ) lim = x x (und insbesondere, dass der Grenzwert existiert). Das zeigt, dass x y f(, ) =. Durch wiederholte Anwendung von Satz 3.12 bekommen wir das folgende Korollar für partielle Ableitungen beliebiger Ordnung. 53
54 Korollar Sei U R n offen. Sei k N und f C k (U). Dann gilt für alle i 1,..., i k {1,..., n} und alle Permutationen π der Zahlen {1,..., k}, i1... ik f = iπ1... iπk f. Bespiel: Sei f C 4 (U). Dann x1 x1 x2 x2 f = x1 x2 x1 x2 f = x1 x2 x2 x1 f =.... Bemerkung: Nicht nur die verschiedenen partiellen Ableitungen, sondern auch beliebige Richtungsableitungen vertauschen sich miteinander. Differentialoperatoren. Man kann partielle Ableitungen als Operatoren interpretieren, die auf differenzierbare Funktionen wirken. Sei p(ξ 1,..., ξ n ) = p i1,...,i n ξ i ξn in i 1,...,i n :i 1 + +i n k ein Polynom in den n Variablen ξ 1,..., ξ n. Dann definieren wir den entsprechenden Differentialoperator p ( 1,..., n ) = p i1,...,i n i n in i 1,...,i n :i 1 + +i n k Der Operator p( 1,..., n ) ist linear und bildet Funktionen in C k (U) nach Funktionen in C(U). Der Operator ist wohldefiniert aus Satz 3.12, weil die verschiedenen partiellen Ableitungen sich miteinander vertauschen (wäre das nicht der Fall, so würden zwei verschiedene Operatoren dem selben Polynom entsprechen). Eine weitere Folgerung von Satz 3.12 ist die folgende Bemerkung: Seien p 1, p 2 zwei Polynome in n Variablen der Ordnung k 1 und k 2, sei p 1 p 2 das Produkt der zwei Polynome (ein Polynom in n Variablen der Ordnung k 1 + k 2 ). Dann gilt p 1 ( 1,..., n ) p 2 ( 1,..., n ) = (p 1 p 2 )( 1,..., n ) als Identität zweier Operatoren auf C (k 1+k 2 ) (U). Das Produkt auf der linken Seite ist die Komposition von zwei (linearen) Abbildungen. Beispiel: Sei p(ξ 1,..., ξ n ) = n j=1 ξ2 j. Der Laplace-Operator auf Rn ist aus := p ( 1,..., n ) = j 2 = j=1 gegeben. Der Laplace-Operator wirkt auf C 2 (R n ). 2 x 2 j=1 j Taylor Entwicklung. Wir erinnern uns an den Begriff der Taylor-Entwicklung für Funktionen einer Variablen (siehe Kapitel 8.6 im Skript zu Analysis 1). Sei f C m+1 ([a; x]). Dann existiert ξ (a; x), so dass f(x) = f(a) + f (a)(x a) + + f (m) (a) (x a) m + f (m+1) (ξ) m! (m + 1)! (x a)m+1. 54
55 Sei nun U R n offen, a U und h R n mit a + h U. Sei weiter f C m+1 (U) R-wertig. Wir setzen φ(t) = f(a + th). Dann ist φ C m+1 ([, 1]), mit φ(1) = f(a + h) und φ() = f(a). Das impliziert, dass f(a + h) = f(a) + m j=1 φ (j) () j! + φ(m+1) (θ) (m + 1)! für ein θ (; 1). Wir müssen die Ableitungen von φ berechnen. Es gilt φ (t) = Df(a + th)(h) = h f(a + th) und deswegen φ () = h f(a). Induktiv bekommen wir φ (j) (t) = (h ) j f(a + th) Der Operator (h ) j ist ein Differentialoperator der Ordnung j. Man findet (h ) j j! ( ) j = h i i = i=1 i 1,...,i n :i 1 + +i n=j h i h in n i 1!i 2!... i n! i n in und also die Taylor-Entwicklung f(a + h) = f(a) + + m j=1 i 1,...,i n :i 1 + +i n=j i 1,...,i n:i 1 + +i n=m+1 1 i 1!i 2!... i n! 1 i 1!i 2!... i n! ( i in n f ( ) i n in f (a) h i h in n ) (a + θh) h i h in n (48) Es ist nützlich, eine kompaktere Notation für die höheren partiellen Ableitungen einzuführen. Ein Multiindex ist eine n-tupel i = (i 1,..., i n ) mit i j N für alle j = 1,..., n. Der Betrag des Multiindexes i = (i 1,..., i n ) wird als i = i 1 + i i n definiert. Für den Multiindex i definieren wir weiter die partielle Ableitung der Ordnung i i := i 1 1 i n in und h i := h i h in n für alle h = (h 1,..., h n ) R n. Wir setzen auch i! := i 1!i 2!... i n!. Dann lässt sich (48) als f(a + h) = m j= i: i =j ( i f)(a) i! h i + i: i =m+1 ( i f)(a + θh) i! h i (49) schreiben, für ein beliebiges f C m+1 (U), U R n offen, a U und h klein genug. In (49) bilden die ersten m Termen das m-te Taylor-Polynom von f an der Stelle a: p m (h) = m j= i: i =j 55 ( i f)(a) i! h i
56 Der letzte Term auf der rechten Seite von (49) heisst das Restglied. Das Restglied ist offenbar O( h m+1 ), für h. In den Übungen wird ferner bewiesen, dass m+1 1 ( lim f(a i f)(a) h h m+1 + h) h i =. i! j= i: i =j Wir haben in (45) bemerkt, dass die r-te Ableitung D r f(a) als die r-lineare Form D r f(a) :R n R n R (v 1, v 2,..., v r ) D r f(a)(v 1,..., v r ) = (((D r f(a)(v 1 ))(v 2 ))... )(v r ) interpretiert werden kann. Man kann dann überprüfen, dass 1 r! Dr f(a)(h, h,..., h) = i: i =r Damit können wir die Taylor-Entwicklung (49) als ( i f)(a) h i = 1 i! i 1!i 2!... i n! ( i n in f)(a)h i h in n i: i =r f(a + h) = m r= D r f(a)(h,..., h) r! + Dm+1 f(a + θh)(h,..., h) (m + 1)! (5) umschreiben. Man bemerke, dass, für feste a, D r f(a)(h,..., h) ein homogenes Polynom von Grad r in h ist. D.h. g(h) := D r f(a)(h,..., h) ist ein Polynom in h, mit der Eigenschaft g(th) = t r g(h) für alle t R. Lokale Extrema und kritische Punkte. Sei U R n offen und f : U R. Ein Punkt a U heisst ein lokales Minimum von f, falls eine offene Umgebung A U von a existiert, mit f(a) = min{f(x) : x A}. a heisst ein lokales Maximum von f, falls eine offene Umgebung A U von a existiert, so dass f(a) = max{f(x) : x A}. a U heisst ein lokales Extremum, falls a entweder ein lokales Minimum oder ein lokales Maximum ist. Für eine Funktion φ einer Variablen haben wir in Analysis 1 bewiesen, dass, falls φ an der Stelle t R differenzierbar ist, mit φ (t), t kein Extremum sein kann. Im nächsten Satz zeigen wir die analoge Aussage für Funktionen mehrerer Veränderlichen. Satz Sei U R n offen, a U und f : U R differenzierbar an der Stelle a. Es gelte f(a). Dann ist a kein Extremum von f. Beweis: Sei e R n ein Einheitsvektor mit e f(a). Wir setzen φ(t) = f(a + te) für t R, mit t klein genug (damit a+te U). φ ist an der Stelle t = differenzierbar, mit φ () = e f(a). Also ist R keine Extremalstelle von φ. D.h. φ nimmt in jeder Umgebung von Werten grösser als φ() = f(a) und Werten kleiner als φ() = f(a) an. Das zeigt, dass a keine Extremalstelle von f ist. Seien U, f wie oben. Wir sagen a U ist ein kritischer Punkt von f, falls f in a differenzierbar ist und f(a) =. Ist a U ein Extremum von f, so muss entweder f an der Stelle a nicht differenzierbar sein, oder a muss ein kritischer Punkt sein. 56
57 Sei nun f C p (U) und a eine kritische Stelle von f. Es existiere 1 < r < p mit D r f(a). Sei r die kleinste ganze Zahl mit dieser Eigenschaft. Dann gilt, aus (5), f(a + h) = f(a) + 1 r! Dr f(a)(h,..., h) + O( h r+1 ) (51) für h. Die Frage, ob a ein Maximum, ein Minimum oder keine Extremalstelle ist, wird vom Verhalten von D r f(a)(h,..., h) bestimmt. Definition Sei p : R n R ein homogenes Polynom. Wir sagen p ist positiv definit, wenn p(h) > für alle h p ist positiv semidefinit, wenn p(h) für alle h p ist negativ definit, wenn p(h) < für alle h p ist negativ semidefinit, wenn p(h) für alle h p ist indefinit, wenn p weder positiv noch negativ semidefinit ist Ist p indefinit, so nimmt p Werte mit beiden Vorzeichen. Bemerkung. Ist p : R n R ein homogenes Polynom von ungeradem Grad r, so ist entweder p oder p indefinit. In der Tat p( h) = ( 1) r p(h) = p(h) D.h. entweder ist p oder p nimmt positive und negative Werte an. Beispiele: Sei n = 2, r = 2. Dann ist p(h 1, h 2 ) = h h 2 2 positiv definit p(h 1, h 2 ) = (h 1 + h 2 ) 2 positiv semidefinit p(h 1, h 2 ) = h 2 1 h 2 2 negativ definit p(h 1, h 2 ) = (h 1 + h 2 ) 2 seminegativ definit p(h 1, h 2 ) = h 1 h 2 indefinit Aus (51) folgt einfach, falls a ein lokales Minimum ist, so muss D r f(a) positiv semidefinit sein, und falls a ein lokales Maximum ist, so muss D r f(a) negativ semidefinit sein. Die umgekehrten Aussagen gelten i.a. nur, wenn D r f(a) positiv bzw. negativ definit sind (statt nur semidefinit). Das ist der Inhalt der nächsten Proposition. Proposition Sei U R n offen, f C p (U), a U eine kritische Stelle von f, und r < p so, dass (wie in (51)) für h. Dann gilt f(a + h) = f(a) + 1 r! Dr f(a)(h,..., h) + O( h r+1 ) a) Ist D r f(a)(h,..., h) positiv definit, so ist a ein lokales Minimum. b) Ist D r f(a)(h,..., h) negativ definit, so ist a ein lokales Maximum. 57
58 c) Ist D r f(a)(h,..., h) indefinit, so ist a kein Extremum. Bemerkung: Ist D r f(a)(h,..., h) positiv semidefinit (aber nicht positiv definit) oder negativ semidefinit (aber nicht negativ definit), so wird in Proposition 3.16 keine Aussage über die kritische Stelle a gemacht. In diesem Fall ist eine tiefere Untersuchung notwendig. Beweis: a) Das Polynom h D r f(a)(h,..., h) ist stetig und D r f(a)(h,..., h) > für alle h S = {h R n : h = 1} (S n 1 ist die Einheitssphäre in R n ). Da S R n kompakt ist, folgt aus dem Sazt vom Maximum, dass α = inf h S D r f(a)(h,..., h) >. Für ein beliebiges h R n, h schreiben wir h = h e für ein e S. Dann gilt Das gibt D r f(a)(h,..., h) = h r D r f(a)(e,..., e) α h r. f(a + h) = f(a) + 1 r! Dr f(a)(h,..., h) + O( h r+1 ) f(a) + α r! h r + O( h r+1 ) = f(a) + α r! h r (1 + O( h )) f(a) für alle h R n klein genug. Das zeigt, dass a ein lokales Minimum ist. Analog zeigt man die Aussage b). Um c) zu zeigen, finden wir e 1, e 2 S mit D r f(a)(e 1,..., e 1 ) > und D r f(a)(e 2,..., e 2 ) <. Für λ > beliebig finden wir f(a + λe 1 ) = f(a) + λr r! Dr f(a)(e 1,..., e 1 )(1 + O(λ)) > f(a) und f(a + λe 2 ) = f(a) + λr r! Dr f(a)(e 2,..., e 2 )(1 + O(λ)) < f(a) für alle λ > klein genug. Damit ist a kein Extremum. Besonders wichtig ist der Fall, dass an einem kritischen Punkt a einer Funktion f C 3 (U), die zweite Ableitung nicht verschwindet. In diesem Fall hängt die Frage, ob a ein Minimum, ein Maximum oder keine Extremalstelle ist, mit dem Verhalten der quadratischen Form D 2 f(a)(h, h) zusammen. Wir bemerken, dass, falls h = (h 1,..., h n ), Wir definieren die n n Matrix D 2 f(a)(h, h) = i,j=1 H ij = i j f(a) = 2 f x i x j (a)h i h j. 2 f x i x j (a). Die Matrix H ij heisst die Hesse sche Matrix von f an der Stelle a, die quadratische Form D 2 f(a)(h, h) = n i,j=1 H ijh i h j die Hesse sche Form. Aus Satz 3.12 folgt, dass die Matrix H ij symmetrisch ist (d.h. H ij = H ji ). Die Hesse sche Form heisst nicht entartet, falls det(h ij ). Tatsache: Ist die Hesse sche Form nicht entartet, dann ist sie entweder positiv definit, negativ definit oder indefinit (der Fall, dass D 2 f(a) positiv 58
59 semidefinit, aber nicht positiv definit, und der Fall, dass D 2 f(a) negativ semidefinit, aber nicht negativ definit ist, sind ausgeschlossen). Diese Aussage folgt aus der Bemerkung, dass eine symmetrische n n Matrix immer durch eine unitäre Matrix diagonalisierbar ist. Seien λ 1,..., λ n die (nicht notwendigerweise verschiedenen) Eigenwerte von H ij. Ist D 2 f(a) nicht entartet, so gilt λ i für alle i = 1,..., n. Es gibt also nur drei Möglichkeiten: 1) alle Eigenwerte sind positiv, 2) alle Eigenwerte sind negativ, 3) es gibt positive und negative Eigenwerte. Im Fall 1) ist D 2 f(a) positiv definit, im Fall 2) ist D 2 f(a) negativ definit und im Fall 3) ist D 2 f(a) indefinit. Es folgt aus dieser Bemerkung, dass, falls die Hesse sche Form nicht entartet ist, man immer durch Untersuchung von D 2 f(a) entscheiden kann, ob der kritische Punkt a ein Maximum, ein Minimum oder kein Extremum ist. 3.4 Umkehrabbildung und Satz über implizite Funktionen Für differenzierbare Funktionen einer Variablen f : R Ω R haben wir in Analysis 1 gezeigt, dass, unter der Bedingung f (a), die Umkehrabbildung lokal wohldefiniert und an der Stelle f(a) differenzierbar, mit (f 1 ) (f(a)) = 1/f (a), ist. Wir möchten nun eine analoge Aussage für Funktionen mehrerer Variablen beweisen. Die Bedingung f (a) wird hier durch die Bedingung ersetzt, dass Df(a) invertierbar ist. Satz 3.17 (Satz über die Umkehrabbildung). Sei U R n offen, f : U R n stetig differenzierbar, a U und Df(a) L(R n ; R n ) invertierbar. Dann existieren offene Umgebungen V von a und W von f(a) so, dass f : V W bijektiv und f 1 : W V stetig differenzierbar. Ferner gilt Df 1 (f(a)) = (Df(a)) 1. Bemerkung: Seien f 1,..., f n : U R die Komponenten von f, d.h. es gelte f(x) = (f 1 (x),..., f n (x)) für alle x U. Die Invertierbarkeit von Df(a) ist dann äquivalent zur Bedingung, dass ( ) fi (a) det. x j Im Beweis des Satzes (genauer gesagt, um die Stetigkeit der Ableitung von f 1 zu zeigen) werden wir die folgende Proposition benutzen. Proposition Sei i,j n GL(R n ) = {L L(R n ; R n ) : L ist invertierbar} Die Menge GL(R n ) ist in L(R n ; R n ) offen (bezüglich der aus der Operatornorm (oder aus jeder anderen Norm) induzierten Topologie). Die Abbildung i : GL(R n ) GL(R n ), definiert durch i(l) = L 1 ist stetig. Beweis: Sei L L(R n ; R n ) invertierbar. Dann gilt L 1 L 1 y x op = sup = sup y y x Lx = 1 Lx inf x x 59
60 und deswegen Das impliziert, dass Lx inf x x = 1 L 1 op Lx 1 L 1 op x (52) für alle x R n. Sei nun L GL(R n ) invertierbar und L L(R n ; R n ) mit L L op < L 1 1. Dann gilt, für ein beliebiges x R n, Lx L x (L L )x ( L 1 1 op L L op ) x c x (53) für ein c >. Das zeigt, dass L injektiv und deswegen auch invertierbar ist (eine lineare Abbildung L L(R n ; R n ) ist genau dann bijektiv, wenn sie injektiv ist). Das impliziert, dass {L L(R n ; R n ) : L L op < L 1 1 op } GL(R n ) und also, dass GL(R n ) offen ist. Aus (53) finden wir auch L 1 op = 1 inf x Lx x 1 L 1 1 = op L L L 1 op 1 L 1 op op L L op Da L 1 L 1 = L 1 (L L)L 1 erhalten wir L 1 L 1 op L 1 op L 1 op L L op L L 1 op L L op L L op Das zeigt, dass die Abbildung i(l) = L 1 stetig an der Stelle L ist, für jede L GL(R n ). Beweis von Satz O.B.d.A können wir annehmen, dass a = und f() = (sonst ersetzen wir f durch die Funktion f(x) = f(x + a) f(a)). Wir definieren φ : U R n durch φ(x) = f(x) Df()(x). Dann gilt f(x) = Df()(x)+φ(x) und Df(x) = Df()+ Dφ(x) für alle x U. Insbesondere gilt φ() = f() = und Dφ() =. Da f stetig differenzierbar ist, ist die Abbildung x Dφ(x) stetig. Also existiert r > mit Dφ(x) op 1 2 Df() 1 op für alle x B r := {x R n : x r }. Aus der Mittelwertabschätzung gilt dann φ(x 1 ) φ(x 2 ) 1 2 Df() 1 op x 1 x 2 (54) für alle x 1, x 2 B r. Insbesondere, mit x 2 =, finden wir φ(x) (2 Df() 1 op ) 1 x für alle x B r (weil φ() = ). 6
61 Schritt 1. Für alle r r gilt f(b r ) B r/2 Df() 1 op. D.h. für jede y R n mit y r/(2 Df() 1 op ) existiert ein x B r mit f(x) = y. Beweis. Für beliebige y B r/2 Df() 1 op definieren wir ψ y : B r R n durch ψ y (x) = Df() 1 (y φ(x)). Es gilt f(x) = y genau dann, wenn ψ y (x) = x, d.h. wenn x ein Fixpunkt von ψ y ist. Wir möchten den Banachschen Fixpunktsatz anwenden, um zu zeigen, dass ψ y einen Fixpunkt in B r besitzt. Dazu bemerken wir zunächst, dass ψ y (x) = Df() 1 op y φ(x) Df() 1 op ( y + φ(x) ) r für alle y B r/2 Df() 1 op und x B r (wir haben hier (54) gebraucht). Das zeigt, dass für alle y B r/2 Df() 1 op, ψ y : B r B r. Ferner haben wir und deswegen ψ y (x 1 ) ψ y (x 2 ) = Df() 1 (φ(x 1 ) φ(x 2 )) ψ y (x 1 ) ψ y (x 2 ) = Df() 1 op φ(x 1 ) φ(x 2 ) 1 2 x 1 x 2 für alle x B r (wieder wegen (54)). Es folgt, dass für alle y B r/2 Df() 1 op, ψ y eine Kontraktion auf B r ist. Da B r ein vollständiger metrischer Raum ist, folgt aus Satz 2.3, dass für alle y B r/2 Df() 1 op ein x B r mit f(x) = y existiert. Schritt 2. Es gilt 1 2 Df() 1 x 1 x 2 f(x 1 ) f(x 2 ) 3 Df() op x 1 x 2 op 2 für alle x 1, x 2 B r. Insbesondere ist f auf B r injektiv. Beweis: Wir haben f(x) = φ(x) + Df()(x). Aus (54) gilt f(x 1 ) f(x 2 ) Df() x 1 x 2 + φ(x 1 ) φ(x 2 ) ( ) 1 Df() op + 2 Df() 1 x 1 x 2 op Aus 1 = Df()Df() 1 folgt, dass 1 Df() op Df() 1 op und damit Das ergibt Df() 1 1 op Df() op. f(x 1 ) f(x 2 ) 3 Df() op 2 x 1 x 2 für alle x 1, x 2 B r. Anderseits gilt aus (52) und wieder aus (54), f(x 1 ) f(x 2 ) Df()(x 1 x 2 ) φ(x 1 ) φ(x 2 ) ( ) 1 1 Df() 1 op 2 Df() 1 x 1 x 2 op 1 = 2 Df() 1 x 1 x 2. op 61
62 Sei nun r < r fest. Wir setzen W = B r/(2 Df() 1 op) = {x R n : x < r/2 Df() 1 op }, und V = f 1 (W ) B r = {x B r : f(x) < r}. W ist offen. Da f stetig, ist auch V offen. Es folgt aus Schritten 1 und 2, dass f : V W bijektiv ist. Die Injektivität folgt aus Schritt 2, weil V B r. Die Surjektivität folgt dagegen aus Schritt 1, weil für jede y B r/(2 Df() 1 op, x B r B r mit f(x) = y existiert. Wir bezeichnen die Inverse mit g : W V. Für y 1, y 2 W setze x 1 = g(y 1 ) und x 2 = g(y 2 ). Aus Schritt 2 haben wir g(y 1 ) g(y 2 ) = x 1 x 2 2 Df() 1 op f(x 1 ) f(x 2 ) = 2 Df() 1 op y 1 y 2 Also ist g auf W stetig (sogar Lipschitz-stetig). Schritt 3. g ist an der Stelle differenzierbar. Es gilt Dg() = Df() 1. Beweis. Da g() = müssen wir zeigen, dass g(y) Df() 1 (y) = o( y ) für y. Sei < ε < 1 festgewählt. Da x φ(x) stetig, existiert δ > so, dass Dφ(x) ε/(2 Df() 1 op ) für alle x δ. Nach Definition von r > gilt δ r. Für y R n mit y < δ/(2 Df() 1 op, sei x = g(y). Dann gilt x δ. Ferner f(x) = y = Df()(x) + φ(x) Wir multiplizieren rechts und links mit der Matrix Df() 1 und erhalten Aus der Mittelwertabschätzung für φ, g(y) Df() 1 (y) = Df() 1 (φ(x)) g(y) Df() 1 (y) = Df() 1 φ(x) = Df() 1 (φ(x) φ()) Da ε > beliebig ist, folgt die Behauptung. Df() 1 op φ(x) φ() ε 2 x ε 2 g(y) ε Df() 1 op y Wir haben somit folgendes bewiesen: Für jede a U mit Df(a) invertierbar, existieren offene Umgebungen V von a und W von f(a), so dass f : V W bijektiv ist, und so, dass f 1 : W V stetig und an der Stelle a differenzierbar ist, mit Df 1 (f(a)) = (Df(a)) 1. Da x Df(x) stetig, und da die Menge der invertierbaren linearen Abbildungen GL(R n ) in L(R n, R n ) offen ist, finden wir eine offene Umgebung V V von a so, dass Df(x) invertierbar ist, für alle x V. Wir setzen W = f(v ); da f 1 stetig ist, ist auch W offen. f 1 ist dann in jedem Punkt von W differenzierbar und Df 1 (f(x)) = (Df(x)) 1 = Df(x) 1. Da die Abbildung i : GL(R n ) GL(R n ) stetig ist, ist Df(x) 1 = i(df(x)) als Komposition zweier stetiger Abbildungen wieder stetig. Damit ist f 1 : W V stetig differenzierbar. 62
63 Definition Seien X, Y zwei metrische Räume. Ein Homöomorphismus von X nach Y ist eine Bijektion f : X Y, so dass f und f 1 stetig sind. Ist f : X Y ein Homöomorphismus, so ist auch f 1 ein Homöomorphismus. Eine stetige Bijektion f : X Y ist genau dann ein Homöomorphismus, wenn f(u) offen in Y für jede U offen in X ist (weil eine Abbildung genau dann stetig ist, wenn das Urbild jeder offenen Menge wieder offen ist; siehe Analysis 1, Prop. 6.18). Zwei metrische Räume X, Y heissen homöomorph, wenn ein Homöomorphismus f : X Y existiert. Seien nun U R n und V R m offen. Ein Homöomorphismus f : U V heisst ein Diffeomorphismus, falls f und f 1 stetig differenzierbar sind. Zwei offene Mengen U R n und V R m heissen diffeomorph, wenn ein Diffeomorphismus f : U V existiert. Eine Bijektion f : U V ist genau dann ein Diffeomorphismus, wenn f 1 ein Diffeomorphismus ist. Bemerkung: Ist U R n, V R m und f : U V ein Diffeomorphismus, dann gilt f 1 f(x) = x für alle x U. Die Kettenregel impliziert, dass Df 1 (f(x)) Df(x) = 1, wobei Df 1 (f(x)) L(R m ; R n ) und Df(x) L(R n ; R m ). Das ist nur möglich, falls m n. Analog impliziert f f 1 (x) = x, dass Df(f 1 (x)) Df 1 (x) = 1 und also, dass n m. Es folgt, dass n = m. Mit anderen Worten können nur Mengen der gleichen Dimension zueinader diffeomorph sein. Tatsache: Sind U R n und V R m nicht leer und offen, und f : U V ein Homöomorphismus, dann muss n = m sein. Bemerkung: Der Satz der Umkehrabbildung besagt, dass falls U R n offen ist, a U, f : U R n stetig differenzierbar, mit Df(a) invertierbar, dann ist f lokal in der Nähe von a ein Diffeomorphismus. D.h. es existieren offene Umgebungen V von a und W von f(a), so dass f : V W ein Diffeomorphismus ist. Eine wichtige Anwendung des Satzes über die Umkehrabbildung ist der Satz über implizite Funktionen. Oft werden Teilmengen von R n durch Gleichungen definiert. Z.B. ist {(x, y) R 2 : y = x 3 } eine Teilmenge von R 2. In diesem Fall ist die Teilmenge besonders einfach, weil sie als Graph einer Funktion geschrieben werden kann. Das ist i.a. nicht möglich. Z.B. für den Einheitskreis S = {(x, y) R 2 : x 2 + y 2 = 1} existiert keine Funktion g, definiert auf einer Teilmenge U R, mit der Eigenschaft, dass S = {(x, g(x)) : x U}. Trotzdem ist es in diesem Fall möglich, S lokal als Graph zu schreiben. Betrachten wir z.b. den Punkt (, 1) auf S. Es ist dann einfach zu sehen, dass offene Umgebungen U R von und V R von 1 und eine differenzierbare Funktion g : U V existiert, mit der Eigenschaft, dass S (U V ) = {(x, g(x)) : x U}. In diesem Fall ist es sogar möglich, g(x) = 1 x 2 explizit zu schreiben. Ein anderes Beispiel ist das sogenannte kartesische Blatt T = {(x, y) R 2 : x 3 2xy + y 3 = }. 63
64 Wie S, kann auch T nicht global als Graph einer Funktion geschrieben werden. Ist es möglich, T lokal als Graph zu schreiben? Der Punkt (1, 1) ist z.b. in T. Es ist einfach zu sehen (vgl. Bild von T ), dass offene Umgebungen U, V R von 1 und eine differenzierbare Funktion f : U V existieren, so dass f(1) = 1 und T (U V ) = {(x, f(x)) : x U}. Kann T in der Nähe von jedem seiner Punkte lokal als Graph einer Funktion geschrieben werden? Nein: Es ist einfach zu sehen, dass in der Nähe von (, ), T nicht als Graph geschrieben werden kann. Was unterscheidet also die Punkte (1, 1) und (, ) auf T? Sei f(x, y) = x 3 2xy + y 3, so dass T Menge aller Nullstellen von f ist. Dann gilt f (x, y) = 2x + 3y2 y Wir zeigen im nächsten Satz, dass der fundamentale Unterschied zwischen (1, 1) und (, ) die Tatsache ist, dass ( f/ y)(1, 1) = 2 während ( f/ y)(, ) =. Satz 3.2 (Satz über implizite Funktionen). Seien m, n N\{}, U R m R n offen und nicht leer. Sei f C 1 (U; R n ) und (x, y ) U mit f(x, y ) =. Es gelte ( ) fi det (x, y ) (55) y j 1 i,j n Dann existieren offene Umgebungen V R m von x und W R n von y und eine stetig differenzierbare Funktion g : V W, so dass Ferner gilt {(x, y) V W : f(x, y) = } = {(x, g(x)) : x V } Dg(x ) = (D y f(x, y )) 1 D x f(x, y ). (56) Bemerkung: D y f(x, y ) und D x f(x, y ) bezeichnen die Ableitung von f als Funktion von y bei festen x = x, bzw. die Ableitung von f als Funktion von x, bei festen y = y. D y f(x, y ) ist eine n n Matrix und D x f(x, y ) eine n m Matrix. Die Bedingung (55) bedeutet genau, dass die Matrix D y f(x, y ) invertierbar ist. In diesem Fall ist die Inverse D y f(x, y ) 1 wieder eine n n Matrix und D y f(x, y ) 1 D x f(x, y ) eine n m Matrix. Damit ist (56) konsistent mit der Tatsache, dass g eine Teilmenge von R m auf einer Teilmenge von R n abbildet. Bemerkung: Seien f 1,..., f n : U R die Komponenten von f, s.d. f(x, y) = (f 1 (x, y),..., f n (x, y)) für alle (x, y) U gelte. Dann ist die vektorielle Gleichung f(x, y) = das System von n Gleichungen f 1 (x 1,..., x m, y 1,..., y n ) = f 2 (x 1,..., x m, y 1,..., y n ) =... f n (x 1,..., x m, y 1,..., y n ) = Der Satz besagt, dass, falls D y f(x, y ) invertierbar ist, kann man das Gleichungssystem lokal für (y 1,..., y n ) lösen. Sind die Funktionen f 1,..., f n linear oder affin, dann ist die Behauptung schon aus der linearen Algebra bekannt (in diesem Fall ist die Ableitung D y f(x, y ) unabhängig von (x, y ) und die Behauptung gilt natürlich global). 64
65 Beweis: Wir definieren die Hilfsfunktion F : U R m R n durch F (x, y) = (x, f(x, y)). Da f C 1 (U; R n ), ist F stetig differenzierbar. Die Ableitung von F an der Stelle (x, y ) ist aus der Blockmatrix ( ) 1R m DF (x, y ) = D x f(x, y ) D y f(x, y ) mit der n m Matrix D x f(x, y ) = (( f i / x j )(x, y )) und mit der n n Matrix D y f(x, y ) = (( f i / y j )(x, y )) gegeben (1 R m ist die Identität auf R m ). Nach Annahme ist D y f(x, y ) invertierbar; sei D y f(x, y ) 1 die Inverse. Wir behaupten, dass auch DF (x, y ) invertierbar ist. In der Tat, explizite Berechnung zeigt, dass ( ) ( ) 1R m 1R m D x f(x, y ) D y f(x, y ) D y f(x, y ) 1 D x f(x, y ) D y f(x, y ) 1 ( ) 1R m =. 1 R n Deswegen ist DF (x, y ) invertierbar. Aus dem Satz über die Umkehrabbildung (Satz 3.17) folgt, dass offene Umgebungen U 1 R m R n von (x, y ) und U 2 R m R n von F (x, y ) = (x, ) existieren, so dass F : U 1 U 2 ein Diffeomorphismus ist. Da U 1 eine offene Umgebung von (x, y ) ist, kann man offene Umgebungen Ṽ Rm von x und W R n von y, mit Ṽ W U 1. Dann ist F (Ṽ W ) U 2 eine offene Umgebung von (x, ) (weil F ein Homöomorphismus ist), und F : Ṽ W F (Ṽ W ) wieder ein Diffeomorphismus. Sei G : F (Ṽ W ) Ṽ W die Inverse dieses Diffeomorphismus. Da F (x, y) = (x, f(x, y)), existiert eine Funktion G : F (Ṽ W ) W mit G(x, y) = (x, G(x, y)) für alle (x, y) F (Ṽ W ). Da G differenzierbar ist, ist auch G differenzierbar. Da F (Ṽ W ) eine offene Umgebung von (x, ) ist, finden wir eine offene Umgebung V Ṽ von x mit {(x, ) : x V } F (Ṽ W ). Dann können wir φ : V W durch φ(x) = G(x, ) definieren (d.h. durch G(x, ) = (x, φ(x)) für alle x V ). Da G differenzierbar ist, ist auch φ differenzierbar. Für (x, y) V W Ṽ W gilt dann D.h. f(x, y) = F (x, y) = (x, ) G(x, ) = (x, y) y = G(x, ) y = φ(x) {(x, y) V W : f(x, y) = } = {(x, φ(x)) : x V } Aus f(x, φ(x)) = für alle x V folgt, mit der Kettenregel, dass = Df(x, φ(x )) Dg(x ) = D x f(x, φ(x )) 1 R m + D y f(x, φ(x )) Dφ(x ) Das gibt (56). Beispiel. Sei f(x, y) = x 3 2xy + y 3 und, wie oben, T = {(x, y) R 2 : f(x, y) = } das kartesische Blatt. Es gilt f y (x, y) = 2x + 3y2, und f x (x, y) = 3x2 2y 65
66 Ist (x, y ) T mit 2x + 3y 2, dann kann man, in der Nähe von (x, y ), T als Graph einer Funktion von x schreiben. Wir bemerken, (x, y ) T mit 2x + 3y 2 = impliziert, dass ( ) y6 2y 3 = 2y 3 16 y3 1 = Das ist nur bei y = oder y = 2 2/3 möglich. Also existieren für jede (x, y ) T, mit der Ausnahmen (x, y ) = (, ) und (x, y ) = (4/3, 2 2/3), offene Umgebungen V R von x und W R von y und eine C 1 -Funktion φ : V W, so dass und T (V W ) = {(x, y) V W : f(x, y) = } = {(x, φ(x)) : x V } φ (x ) = ( f/ x)(x, y ) ( f/ y)(x, y ) = 3x2 2y 3y 2 2x. Analog finden wir, dass für alle (x, y ) T mit den Ausnahmen von (x, y ) = (, ) und (x, y ) = (2 2/3, 4/3) offene Umgebungen V von y und W von x und eine C 1 -Funktion ψ : V W existieren, so dass T (W V ) = {(x, y) W V : f(x, y) = } = {(ψ(y), y) : y V } und ψ (y ) = 3x2 2x 3y 2 2y. 3.5 Mannigfaltigkeiten in R n Wir untersuchen in diesem Abschnitt besondere Teilmengen von R n, genannt Mannigfaltigkeiten oder Untermannigfaltigkeiten des R n, die lokal wie R k aussehen, für ein k n. Bevor wir zur genaueren Definition von Mannigfaltigkeit kommen, betrachten wir einige Beispiele von Teilmengen von R n, die lokal wie R k für k = 1 oder k = 2 aussehen. Im Fall k = 1 spricht man von Kurven. Das Begriff von Kurven kann verschiedene Bedeutungen haben. Eine parametrisierte Kurve ist eine Abbildung φ : I R n, für ein Intervall I R. Eine parametrisierte Kurve kann zum Beispiel die Bewegung eines Teilchens im Raum beschreiben, als Funktion der Zeit t I. Eine parametrisierte Kurve ist also nicht nur durch die Bahn des Teilchens charakteriziert, sondern auch von dem Zeitplan (die parametriesierte Kurve bestimmt die Position des Teilchens zu jeder Zeit, nicht nur seine Trajektorie). Sind wir nur an der Bahn interessiert, und nicht am Zeitplan, so können wir die folgende Äquivalenzrelation im Raum der parametrisierten Kurven definieren. Wir sagen zwei parametrisierte Kurve ϕ 1 : I 1 R n, ϕ 2 : I 2 R n, für zwei Intervalle I 1, I 2 R sind äquivalent, falls eine monoton wachsende stetige und surjektive Funktion ψ : I 1 I 2 existiert, so dass φ 1 = φ 2 ψ. In diesem Fall heisst ψ eine Parametertransformation. Man kann sich leicht davon überzeugen, dass das wirklich eine Äquivalenzrelation definiert. Man kann dann eine Kurve als eine Äquivalenzklasse von parametrisierten Kurven definieren. Mit anderen Worten, eine Kurve wird somit als die Bildmenge einer parametrisierten Kurve definiert. 66
67 Man könnte auch Kurven als Graph von Funktionen definieren. Das ist aber zu restriktiv; z.b. der Kreis S 1 = {(x, y) R 2 : x 2 + y 2 = 1} kann nicht als Graph {(x, y) R 2 : y = f(x)} einer Funktion von x geschrieben werden. Es ist auch unmöglich, S 1 als Graph {(x, y) R 2 : x = f(y)} einer Funktion von y zu schreiben. Immerhin, der Kreis S 1 ist die Vereinigung der Graphen von zwei Funktionen, nämlich f 1 (x) = (1 x 2 ) 1/2 und f 2 (x) = (1 x 2 ) 1/2. Wenn wir nur Funktionen auf offene Teilmengen von R betrachten möchten, so können wir S 1 als die Vereinigung der Graphen von vier Funktionen schreiben, nämlich y = ± 1 x 2 auf x ( 1; 1) und x = ± 1 y 2 auf y ( 1; 1). Zwei dieser Abbildungen definieren y als Funktion von x, die anderen zwei geben x als Funktion von y. Ausgehend aus diesem Beispiel kann man also berlegen, Kurven als Vereinigungen von Graphen zu definieren. Gemäss dieser Definition kann man sich auch vorstellen, eine Kurve differenzierbar zu nennen, wenn sie als Vereinigung von Graphen von differenzierbaren Funktionen geschrieben werden kann (wir werden von C 1 - Kurven sprechen, unter der Annahme, dass die Funktionen stetig differenzierbar sind). Man muss hier ein bisschen aufpassen. Es gibt einen Unterschied zwischen der gegebenen Definition von differenzierbarer Kurve und differenzierbarer parametrisierte Kurve. Z.B. die parametrisierte Kurve φ(t) = (t 3, t 2 ) R 2 ist differenzierbar. Die Bildmenge T = {φ(t) : t R} kann aber neben (, ) nicht als Graph einer differenzierbaren Funktion geschrieben werden. Deswegen ist T keine differenzierbare Kurve im obigen Sinne. Wir werden sehen, die Bildmenge der parametrisierten Kurve φ(t) ist keine differenzierbare Kurve, weil φ () =. Analog kann man Teilmengen von R n, die lokal wie R 2 aussehen, betrachten. In diesem Fall spricht man von Flächen. Auch hier muss man zwischen parametrisierten Flächen und Fläche als Bildmenge von parametrisierten Flächen unterscheiden. Wie für Kurven, kann man Flächen als Vereinigung von Graphen beschreiben. Die Sphäre S 2 = {(x, y, z) : x 2 +y 2 +z 2 = 1} R 3 ist nicht der Graph einer einzelne Funktion, kann aber als Vereinigung der folgenden sechs Graphen betrachtet werden, die auf offenen Teilmengen von R 2 definiert sind: z = ± 1 x 2 y 2, definiert auf (x, y) < 1, y = ± 1 x 2 z 2 auf (x, z) < 1 und x = ± 1 y 2 z 2 definiert auf (y, z) < 1. Weil die Funktionen, aus dessen Graphen S 2 besteht, stetig differenzierbar sind, sagt man S 2 ist eine differenzierbare Fläche, oder eine C 1 -Fläche. Wir erweitern diese Definitionen, um differenzierbare Mannigfaltigkeiten M R n der Dimensin k einzuführen. Definition Seien n, k N, mit k < n. Ein C 1 -Mannigfaltigkeitstück der Dimension k in R n ist eine Teilmenge von R n die, nach allfälliger Unnumerierung der Koordinaten, die Form {(x 1,..., x n ) R n : (x k+1,..., x n ) = φ(x 1,..., x k ) und (x 1,..., x k ) G} hat, wobei G R k offen und zusammenhängend ist und φ C 1 (G; R n k ). Eine Menge M R n heisst eine C 1 -Mannigfaltigkeit der Dimension k, falls für jede a M eine offene Umgebung U R n von a existiert, so dass U M ein C 1 -Mannigfaltigkeitstück der Dimension k ist. Eine C 1 -Mannigfaltigkeit der Dimension k = 1 heisst eine C 1 - Kurve. Eine C 1 -Mannigfaltigkeit der Dimension k = 2 heisst eine C 1 -Fläche. Eine C 1 -Mannigfaltigkeit M der Dimension n 1 in R n heisst eine Hyperfläche. 67
68 Bemerkung: Kurz gesagt, eine C 1 -Mannigfaltigkeit der Dimension k ist eine Teilmenge von R n, die lokal aus dem Graph einer stetig differenzierbaren Abbildung φ : R k G R n k gegeben ist. Beispiele: Der Kreis S 1 = {(x, y) R 2 : x 2 + y 2 = 1} ist eine C 1 -Kurve. Die Sphäre S n 1 = {(x 1,..., x n ) R n : (x 1,..., x n ) = 1} R n ist eine C 1 -Mannigfaltigkeit der Dimension (n 1) (d.h. S n 1 ist eine Hyperfláche). Die Bildmenge {(t 3, t 2 ) R 2 : t R} der parametrisierten Kurve φ(t) = (t 3, t 2 ) ist keine C 1 -Mannigfaltigkeit, weil sie in der Nähe von (, ) nicht als Graph einer stetig differenzierbare Funktion geschrieben werden kann. Die Bildmenge der parametrisierten Kurve φ(t) = (cos t, sin(2t)) ist keine C 1 -Kurve, weil sie in der Nähe von φ(π/2) = (, ) nicht als Graph einer Funktion geschrieben werden kann (nach Definition dürfen Mannigfaltigkeiten keine Selbst- Durchschnitte haben). Statt Teilmengen von R n durch Vereinigung von Graphen zu definieren, kann man sie als Lösungsmengen von Gleichungen definieren. Z.B. definiert die Gleichung x 2 + y 2 = 1 den Kreis S 1, also eine Mannigfaltigkeit der Dimension eins. Man kann sich analog vorstellen, dass die Gleichung f(x 1,..., x n ) =, für eine Funktion f : R n U R, eine Teilmenge von R n definiert, die lokal wie R n 1 aussieht. Im nächsten Satz zeigen wir, dass, falls a U die Gleichung f(a) = erfüllt, und falls f(a), dann ist die Menge {x U : f(x) = } in der Nähe von a ein Mannigfaltigkeitstück. Proposition Sei U R n offen, f C 1 (U), und a U mit f(a) = und f(a). Dann es existiert eine offene Umgebung G R n von a so, dass G {x U : f(x) = } ein C 1 -Mannigfaltigkeitstück der Dimension (n 1) ist. D.h. die Lösungsmenge der Gleichung f(x) = ist, in der Nähe von a eine Mannigfaltigkeit. Gilt ferner f(x) für alle x U mit f(x) =, dann ist {x U : f(x) = } eine C 1 -Mannigfaltigkeit der Dimension n 1. Beweis: Die Bedingung f(a) impliziert, dass j {1,..., n} mit f/ x j (a) existiert. O.B.d.A nehmen wir an f/ x n (a). Nach dem Satz über implizite Funktionen, existieren eine Umgebung V R n 1 von (a 1,..., a n 1 ), eine Umgebung W R von a n und eine Funktion φ C 1 (V ) mit Werten in W, so dass V W {(x 1,...,x n ) U : f(x 1,..., x n 1, x n ) = } Die Behauptung folgt, mit G = V W. = {(x 1,..., x n 1, φ(x 1,..., x n 1 )) R n : (x 1,..., x n 1 ) V }. Allgemeiner, sei f : R n U R m, für ein m < n. Die Gleichung f(x) = ist dann ein System von m Gleichungen f 1 (x 1,..., x n ) = f 2 (x 1,..., x n ) =... f m (x 1,..., x n ) = Sind die m Gleichungen in geeignetem Sinne unabhängig, so kann man sich vorstellen, dass f(x) = eine Mannigfaltigkeit der Dimension k = n m definiert. Wir müssen verstehen, in welchen Sinne die Gleichungen unabhängig sein müssen. Dazu definieren wir den Begriff vom Rang einer linearen Abbildung. 68
69 Definition Sei L L(R n ; R m ). Der Rang der Matrix L ist Rg L = dim Ran (L) = dim L(R n ) = n dim ker(l). Mit anderen Worten, der Rang von L ist die maximale Anzahl von linear unabhängige Spalten in der Matrix L. Aus der linearen Algebra, RgL ist auch die maximale Anzahl von linear unabhängigen Zeilen in L. Definition Sei U R n offen und f C 1 (U; R m ), mit m n. Wir sagen, f ist regulär an der Stelle a U, falls Df(a) Rang m hat. Ist m = n, so ist f genau dann an der Stelle a regulär, wenn Df(a) invertierbar ist. Satz Sei U R n offen, f C 1 (U; R m ). Sei a U mit f(a) = und so, dass f regulär an der Stelle a ist. Dann existiert eine offene Umgebung G U von a in R n, so dass G {x U : f(x) = } ein Mannigfaltigkeitstück in R n der Dimension k = n m ist. Ist f an der Stelle x regulär, für alle x U mit f(x) =, dann ist {x U : f(x) = } eine Mannigfaltigkeit in R n der Dimension k = n m. Beweis: Nach Unnumerierung der Koordinaten können wir annehmen, dass die m Spalten f f (a), (a),..., f (a) (57) x k+1 x k+2 x n linear unabhängig sind (wir haben hier k = n m gesetzt). Wir schreiben Df(a) = (D 1 f(a), D 2 f(a)), wobei D 1 f(a) die m k Matrix ist, die aus allen partiellen Ableitungen nach x 1,..., x k besteht und D 2 f(a) die m m Matrix ist, die aus allen partielle Ableitungen nach x k+1,..., x n besteht. Die Matrix D 2 f(a) ist nach (57) invertierbar. Der Satz über implizite Funktionen impliziert, dass eine offene Umgebung V von (a 1,..., a k ) in R k, eine offene Umgebung W von (a k+1,..., a n ) in R m und eine stetig differenzierbare Funktion φ : V W existieren, so dass V W {x U : f(x) = } = {(x 1,..., x k, φ(x 1,..., x k )) : (x 1,..., x k ) V } Die Behauptung folgt, mit G = V W. Bemerkung: Der Satz zeigt, dass die richtige Verallgemeinerung der Bedingung f(a) in Proposition 3.22 aus der Bedingung RgDf(a) = m gegeben ist. Statt C 1 -Mannigfaltigkeiten durch Graphen von stetig differenzierbaren Funktionen zu definieren, kann man auch lokale reguläre Parametrisierungen (genannt Karten) benutzen. Wir geben hier die alternative Definition, obwohl wir im Folgenden weiter mit der ursprünglichen Definition arbeiten. Alternative Definition von Mannigfaltigkeiten: Seien n, k N,mit 1 k < n. Eine k- dimensionale C 1 -Mannigfaltigkeit in R n (oder eine C 1 -Untermannigfaltigkeit des R n ) ist eine nicht-leere Menge M R n, so dass für alle a M eine offene Umgebung U R n von a, eine offene Menge G R k und eine reguläre Abbildung ϕ C 1 (G; R n ) so, dass ϕ(g) = M U und ϕ : G M U ein Homöomorphismus ist. Das Paar (G, ϕ) heisst eine Karte von M in der Nähe vom Punkt a. Übung: Zeigen Sie, dass diese Definition mit der ursprünglichen Definition übereinstimmt. 69
70 Bemerkung: Die alternative Definition von Mannigfaltigkeiten durch Karten lässt sich auch zum Fall k = n erweitern. Dann gilt: Eine Teilmenge M R n ist genau dann eine Mannigfaltigkeit der Dimension n, wenn M offen ist. Bemerkung: Statt von C 1 -Mannigfaltigkeit in R n spricht man in der Literatur oft von C 1 -Untermannigfaltigkeit des R n. Man benutzt das Wort Untermannigfaltigkeit, weil die Mengen, die wir betrachten, immer Teilmengen von R n sind. Das Wort Mannigfaltigkeit der Dimension k wird dann für allgemeinere Mengen benutzt, die lokal das Bild einer regulären Funktion auf einer offenen Teilmenge von R k sind. Ein wichtiges Resultat der Differentialgeometrie besagt dann, dass jede C 1 -Mannigfaltigkeit der Dimension n in R 2n eingebettet werden kann (Einbettungsatz von Whitney). Bemerke, dass die Dimension (mindestens) 2n sein muss; die Klein sche Flasche ist ein berühmtes Beispiel einer zwei dimensionale C 1 -Mannigfaltigkeit, die nicht in R 3 eingebettet werden kann. In dieser Vorlesung werden wir immer C 1 -Untermannigfaltigkeiten des R n betrachten; wir werden aber das Wort C 1 -Mannigfaltigkeiten in R n benutzen. Sei nun M R n eine Mannigfaltigkeit der Dimension k < n und a M ein Punkt auf der Mannigfaltigkeit. Wir möchten den Begriff von Tangentialraum zu M an a M einführen. Dazu betrachten wir parametrisierte Kurven auf M, die durch a gehen. Sei I ein offenes Intervall in R. Eine differenzierbare parametrisierte Kurve auf M ist eine differenzierbare Abbildung ϕ : I R n, mit ϕ(t) M für alle t I. Es gelte ϕ(t ) = a. Der Vektor ϕ (t ) = (ϕ 1(t ),..., ϕ n(t )) heisst der Tangentialvektor zu der Kurve ϕ im Punkt ϕ(t ) = a. Definition Der Tangentialraum T a (M) zu M an der Stelle a M besteht aus allen Tangentialvektoren zu differenzierbaren Kurven auf M, die durch a gehen. Mit anderen Worten, ξ R n ist genau dann Element von T a (M), wenn ein Intervall I R, ein t I und eine Kurve ϕ C 1 (I; R n ) mit ϕ(t) M für alle t I, ϕ(t ) = a und ϕ (t ) = ξ existieren. Proposition Sei M eine Mannigfaltigkeit in R n der Dimension k < n und a M. T a (M) ist ein linearer Unterraum von R n, mit dim T a (M) = k. Beweis: Die Definition von T a (M) hängt nur von M in der Nähe von a ab. D.h. T a (M) = T a (M U) für jede, beliebig kleine Umgebung U R n von a. Aus diesem Grund können wir annehmen, dass eine offene Menge V R k und ein ψ C 1 (V ; R n ) existieren, so dass M = {(x, ψ(x)) : x V } Wir führen die Notation x (1) = (x 1,..., x k ) und x (2) = (x k+1,..., x n ) ein. Dann a = (a (1), a (2) ), wobei a (2) = ψ(a (1) ). Sei nun t ϕ(t) eine differenzierbare Kurve auf M, mit ϕ(t ) = a. Wir bezeichnen φ 1 (t) = (ϕ 1 (t),..., ϕ k (t)) und φ 2 (t) = (ϕ k+1 (t),..., ϕ n (t)), wobei ϕ 1,..., ϕ n die Komponenten von ϕ sind. Da ϕ(t) M für alle t, muss gelten φ 2 (t) = ψ(φ 1 (t)) für alle t genügend nahe zu t. Also ϕ(t) = (φ 1 (t), ψ(φ 1 (t))) und ϕ (t ) = (φ 1(t ), Dψ(a (1) )(φ 1(t ))) Wir setzen v = φ 1 (t ) R k. Dann ist ϕ (t ) = (v, Dψ(a (1) )v) R n. 7
71 Anderseits, für gegebene v R k, können wir die Kurve ϕ(t) = (a (1) +tv, ψ(a (1) +tv)) definieren. Dann ist ϕ offenbar eine differenzierbare Kurve auf M, mit ϕ() = a und φ () = (v, Dψ(a (1) )(v)). Wir haben also gezeigt, dass T a (M) = {(v, Dψ(a (1) )v) : v R k } T a (M) ist also ein linearer Raum, mit Dimension k (die Vektoren (e i, Dψ(a (1) )(e i )), für i = 1,..., k sind eine Basis von T a (M), falls e i, i = 1,..., k, die Standard-Basis von R k bezeichnet). Falls die Mannigfaltigkeit M als Lösungsmenge einer Gleichung f(x) = gegeben ist, so kann man eine andere Charakterisierung von T a (M) angeben. Sei zunächst U R n und f C 1 (U) reelwertig. Es gelte f(x) für alle x U mit f(x) =. Dann ist M = {x U : f(x) = } eine Mannigfaltigkeit der Dimenison n 1. Wir sind im Tangentialraum T a (M) interessiert, für ein a M. Wir wissen schon T a (M) ist ein linearen Raum mit dim T a (M) = n 1. Sei ϕ(t) eine parametrisierten Kurve auf M, mit ϕ(t ) = a. Dann gilt f(ϕ(t)) = für alle t. Wir erhalten: und deswegen = d dt f(ϕ(t)) t=t = f(ϕ(t )) ϕ (t ) T a (M) {ξ R n : ξ f(a) = } Da der Raum {ξ R n : ξ f(a) = } auch Dimension n 1 hat, gilt T a (M) = {ξ R n : ξ f(a) = } Wir haben bewiesen, dass der Gradient f(a) senkrecht zum Tangentialraum T a (M) steht. Sei nun f C 1 (U; R m ) regulär an der Stelle x, für alle x U mit f(x) =. Dann ist M = {x U : f(x) = } eine C 1 -Mannigfaltigkeit der Dimension k = n m. Seien f 1,..., f m die Komponenten von f. Ähnlich wie oben, gilt T a (M) = {ξ R n : f 1 (a) ξ = = f m (a) ξ = } Da die m Zeilen f j (a), j = 1,..., m, von Df(a) linear unabhängig sind (weil f regulär ist), ist es klar, dass der Raum {ξ R n : f 1 (a) ξ = = f m (a) ξ = } die Dimension k = n m hat. Es ist manchmal auch nützlich, neben dem Begriff vom Tangentialraum T a (M) auch den Begriff der Tangelntialebene einzuführen. Die Tangentialebene an der Mannigfaltigkeit M im Punkt a ist die Teilmenge von R n, die aus allen Tangentialvektoren zu M in a besteht, die aber vom Punkt a ausgehen. Mit anderen Worten, Tangentialebene zu M in a = {a + ξ R n : ξ T a (M)} Falls M = {x U : f(x) = } für eine Funktion f C 1 (U; R m ) regulär im Punkt a, dann gilt Tangentialebene zu M in a = {a + ξ R n : ξ f j (a) = für alle j = 1,..., m} = {ξ R n : (ξ a) f j (a) = für alle j = 1,..., m} Bemerke, dass im Gegensatz zum Tangentialraum T a (M), die Tangentialebene kein linearer Raum ist. 71
72 3.6 Extrema mit Nebenbedingungen Wir betrachten eine reelwertige Funktion f, definiert auf einer offenen Teilmenge Ω R n. In diesem Abschnitt möchten wir Extrema von f(x) finden, unter der zusätzlichen Nebenbedingung x M, wobei M R n eine Mannigfaltigkeit mit Dimension k < n, enthalten in Ω, ist. Wir sagen a Ω ist ein lokales bedingtes Minimum von f mit der Nebenbedingung x M, falls eine offene Umgebung A Ω in R n existiert, so dass f(a) = min{f(x) : x A M}. Analog definiert man den Begriff vom lokalen bedingten Maximum. a Ω heisst ein lokales bedingtes Extremum von f, falls a entweder ein lokales bedingtes Minimum oder ein lokales bedingtes Maximum ist. Nehmen wir an f C 1 (Ω). Wegen der Nebenbedinungen können bedingte Extrema a M existieren, für die f(a). Wir suchen also andere Kriteria, um Extrema mit Nebenbedingungen zu charakterisieren. Manchmal kann man dieses Problem einfach lösen, indem man eine Parametrisierung von M benutzt. Sei z.b. f C 1 (R 2 ) und nehmen wir an, wir suchen s := sup{f(x 1, x 2 ) : x x 2 2 = 1} Dann können wir einen Parameter t [, 2π) einführen und x 1 = cos t, x 2 = sin t schreiben. Damit ist das gesuchte Supremum s durch s = sup g(t) t [,2π), wobei g(t) = f(cos t, sin t), gegeben. Das Problem mit Nebenbedingungen wurde damit zu einem Problem (in einer Dimension, statt zwei) ohne Nebenbedingungen reduziert. Extrema sind nun durch g (t) = charakterisiert. Analog kann man die Nebenbedingung entfernen, falls M explizit als Graph einer differenzierbaren Funktion geschrieben werden kann. Nehmen wir an, wir suchen s := sup{x 2 yz : x 2 + y 2 + z 2 = 1, x, y, z } Das Maximum wird angenommen, weil die Funktion f(x, y, z) = x 2 yz stetig und die Menge {(x, y, z) R 3 : x 2 + y 2 + z 2 = 1, x, y, z } kompakt ist. Das Maximum hat offenbar x, y, z >. Wir haben {(x, y, z) R 3 : x 2 + y 2 + z 2 = 1, x, y, z > } = {( 1 y 2 z 2, y, z) : (y, z) G} mit der offenen Menge G = {(y, z) R 2 : y 2 + z 2 < 1, y, z > }. Wir haben also s = sup{g(y, z) : (y, z) G}, wobei g(y, z) = f(1 y 2 z 2, y, z) = (1 y 2 z 2 )yz. Um s zu finden, berechnen wir also g(y, z) = (z 3y 2 z z 3, y 3z 2 y y 3 ) Die Bedingung g(y, z) = gibt, nach kurzer Rechnung, y = z = 1/2. Das Maximum der Funktion f wird also im Punkt (x, y, z) = (1/ 2, 1/2, 1/2) angenommen und beträgt f(1/ 2, 1/2, 1/2) = 1/8. 72
73 Das letzte Beispiel war einfach, weil wir die Mannigfaltigkeit explizit als Graph schreiben konnten. Das ist natürlich nicht immer möglich. Deswegen ist der folgende Satz nützlich, um Extrema einer differenzierbaren Funktion f unter der Nebenbedingung g(x) = zu finden. Proposition 3.28 (Lagrange-Multiplikatoren, eine Nebenbedingung). Sei U R n offen, g C 1 (U) reelwertig, und M = {x U : g(x) = }. Sei a M, so dass g(a). Dann ist M in der Nähe von a eine Mannigfaltigkeit der Dimension n 1 (eine Hyperfläche). Sei nun f eine reelwertige Funktion, definiert und differenzierbar in der Nähe von a. Sei a eine bedingte lokale Extremalstelle von f auf M. Dann existiert λ R mit f(a) = λ g(a) Der Parameter λ heisst ein Lagrange-Multiplikator. Proof. Nehmen wir an f(a) ist nicht proportional zu g(a). Dann existiert ξ R n mit ξ g(a) = aber ξ f(a). Die Bedingung ξ g(a) = impliziert, dass ξ T a (M). Also existiert eine parametrisierte Kurve ϕ : I M, mit ϕ(t ) = a und ϕ (t ) = ξ für ein t I. Betrachte nun die Funktion h(t) = f(ϕ(t)). Es gilt h (t ) = f(ϕ(t )) ϕ (t ) = f(a) ξ Das heisst, in jeder Umgebung von t nimmt h(t) Werte kleiner und grösser als h(t ) = f(a) an. Das zeigt, dass f auf U M Werte kleiner und grösser als f(a) annimmt, für jede offene Umgebung U von a. Deswegen ist a keine bedingte Extremalstelle von f. Die Proposition gibt uns eine Rezept, um Extrema einer differenzierbaren Funktion f mit der Nebenbedingung g(x) = zu finden. Die Gleichungen { f(x) = λ g(x) g(x) = bilden ein System von (n + 1)-Gleichungen für die (n + 1) Unbekannten x 1,..., x n, λ. Lösungen dieses Gleichungsystemes, zusammen mit Punkten x R n mit g(x) =, wo f nicht differenzierbar ist, sind dann die einzigen möglichen Kandidaten für bedingte lokale Extremalstellen. Beispiel: Betrachten wir noch einmal das Beispiel von oben. Wir suchen s := sup{x 2 yz : x 2 + y 2 + z 2 = 1, x, y, z } Wir setzen f(x, y, z) = x 2 yz und g(x, y, z) = x 2 + y 2 + z 2 1. Bei bedingten Extrema muss gelten: f(x, y, z) = λ g(x, y, z) für ein λ R. Das ergibt die vier Gleichungen 2xyz = 2λx x 2 z = 2λy x 2 y = 2λz x 2 + y 2 + z 2 = 1 73
74 Da x, y, z > gelten muss, implizieren die zweite und dritte Gleichung, dass y = z. Die erste Gleichung gibt dann λ = y 2, und damit liefert die dritte Gleichung x 2 = 2y 2. Einsetzen im letzten Gleichung ergibt 4y 2 = 1, und damit y = z = 1/2 und x = 1/ 2. Bis jetzt haben wir Probleme mit einer Nebenbedingung der Form g(x) = untersucht, für eine reelwertige Funktion g. Im Folgenden untersuchen wir den Fall, dass g Werte in R m hat, für ein m < n. In diesem Fall ist die vektorielle Gleichung g(x) = eigentlich ein System mit m Gleichungen. Man spricht dann von m Nebenbedingungen. Auch in diesem Fall kann man Extrema finden, indem man Lagrange-Multiplikatoren einführt. Proposition 3.29 (Lagrange Multiplikatoren, m Nebenbedingungen). Sei U R n offen, g C 1 (U; R m ) für ein m < n. Sei M = {x U : g(x) = }. Sei a M, so dass g regulär an der Stelle a ist (d.h. Rg (Dg(a)) = m; in diesem Fall ist M in der Nähe von a ein Mannigfaltigkeitstück der Dimension k = n m). Sei f eine reelwertige C 1 -Funktion, definiert in einer Umgebung von a in R n. Sei a eine lokale bedingte Extremalstelle von f auf M. Dann ist f(a) eine lineare Kombination von g 1 (a),..., g m (a). D.h. es existieren λ 1,..., λ m R mit f(a) = m λ j g j (a) j=1 wobei g 1,..., g m : U R die Komponenten von g sind. Beweis: Nehmen wir an, dass f(a) nicht eine lineare Kombination von g 1 (a),..., g m (a) ist. Dann existiert ξ R n, so dass ξ g i (a) = für alle i = 1,..., m und ξ f(a). Das impliziert, dass ξ T a (M). Damit existiert eine differenzierbare parametrisierte Kurve ϕ : I M, so dass ϕ(t ) = a und ϕ (t ) = ξ. Sei nun h(t) = f(ϕ(t)). Dann ist h (t ) = f(a) ξ Damit ist t keine Extremalstelle von f(ϕ(t)). Das zeigt, dass a keine bedingte lokale Extremalstelle von f sein kann. Um bedingte Extremalstellen einer Funktion f auf R n mit m Nebenbedingungen g(x) = zu finden, muss man also die n + m Gleichungen m f(x) = λ j g j (x) g(x) = j=1 für die (n + m) Unbekannten x 1,..., x n, λ 1,..., λ m lösen. Die einzigen Kandidaten für Extremalstellen sind Lösungen dieser Gleichungen und Punkte auf M, wo f nicht differenzierbar ist. Beispiel (aus der statistischen Mechanik): Ein Molekül habe n mögliche Zustände, mit Energien E 1,..., E n. In der statistischen Mechanik wird ein System von vielen Molekülen durch die Wahrscheinlichkeiten p 1,..., p n [; 1] beschrieben, dass ein Molekül im j- ten Zustand gefunden wird (die Wahrscheinlichkeit p j gibt die Fraktion zwischen den 74
75 Molekülen im j-ten Zustand und der gesamten Anzahl von Molekülen). Der Zustand des Vielteilchensystems wird durch Maximierung der Entropie H(p 1,..., p n ) = p j log p j j=1 unter den Nebenbedingungen p p n = 1 und Ē = p j E j j=1 bestimmt (wir möchten also die Entropie bei feste mittlerer Energie Ē maximieren). Sei p = (p 1,..., p n ). Wir setzen g 1 (p) = p p n 1 und g 2 (p) = n j=1 p je j. Es gilt g 1 (p) = (1, 1,..., 1) und g 2 (p) = (E 1,..., E n ). Da H(p) = ( log p 1 1,..., log p n 1) finden wir aus der Gleichung H(p) = λ 1 g 1 (p) + λ 2 g 2 (p), dass 1 log p j = λ 1 + λ 2 E j für alle j = 1,..., n. Das ergibt log p j = 1 λ 1 λ 2 E j und also p j = e (λ 1+1) e λ 2E j =: ke λ 2E j Die Bedingung g 1 (p) = bestimmt die Konstante k. Wir finden p j = e λ 2E j n j=1 e λ 2E j Die Bedingung g 2 (p) = ergibt die Gleichung E = j=1 E j e λ 2E j n j=1 e λ 2E j Diese Gleichung erlaubt uns im Prinzip, λ 2 zu bestimmen. In der statistischen Mechanik setzte man λ 2 = k B /T, wobei k B die sogenannte Boltzmann-Konstante ist, und T die absolute Temperatur des Systems ist. Die Temperatur wird von der mittleren Energie bestimmt. Der Zustand vom System zur Temperatur T (d.h. zur mittleren Energie E) ist der sogenannte Gibbs-Zustand, charakterisiert durch die Wahrscheinlichkeiten p j = e k BE j /T n i=1 e k BE i /T. Lagrange-Multiplikatoren und die oben erklärten Strategien, um bedingte Extrema zu finden, sind auch nützlich, um (globale) Extrema von Funktionen auf Teilmengen von R n zu suchen, die einen Rand haben. Wir betrachten ein Beispiel, um die Situation zu erklären. 75
76 Beispiel: Wir suchen das globale Maximum und das globale Minimum von f(x, y, z) = x 2 + y + z 2 auf D := {(x, y, z) R 3 : x 2 + y 2 + z 2 1 und x 2 + y 2 1/2}. Wir zerlegen D in verschiedenen Teile. Wir setzten: D 1 = {(x, y, z) R 3 : x 2 + y 2 + z 2 < 1 und x 2 + y 2 < 1/2}, D 2 = {(x, y, z) R 3 : x 2 + y 2 + z 2 = 1 und z > 1/ 2}, D 3 = D 2 D 4 = {(x, y, z) R 3 : x 2 + y 2 = 1/2, z ( 1/ 2; 1/ 2)}, D 5 = {(x, y, z) R 3 : x 2 + y 2 = 1/2, z = 1/ 2}, D 6 = D 5. Wir suchen separate lokale Extrema in den Mengen D 1,..., D 5. Das globale Maximum von f in D ist das grösste lokale Maximum, das wir in D 1,..., D 6 finden werden, und analog für das globale Minimum von f. 1) Extrema auf D 1 werden durch die Bedingung f(x) = charakterisiert. Da f(x) = (2x, 1, 2z), existiert kein Punkt x D 1 mit f(x) =. Also gibt es kein lokales Extremum in D 1. 2) Lokale Extrema auf D 2 werden durch die Nebenbedingung g(x, y, z) = x 2 + y 2 + z 2 = 1 charakterisiert. Ist x D 2 ein lokales bedingtes Extremum, dann muss λ R existieren mit f(x) = λ g(x). Mit g(x) = 2(x, y, z) wir finden 2x = 2λx 1 = 2λy 2z = 2λz x 2 + y 2 + z 2 = 1 Da z in D 2, folgt λ = 1. Das ergibt y = 1/2 und x 2 + z 2 = 3/4. Der Kreis {(x, 1/2, z) : x 2 + z 2 = 3/4} schneidet D 2 wenn z > 1/ 2. Auf diesem Kreis ist f konstant, gegeben aus f(x, 1/2, z) = 5/4, für alle (x, z) R 2 mit x 2 + z 2 = 3/4. 3) Aus Symmetrie, kann die Funktion f auf D 3 nur auf dem Kreis {(x, 1/2, z) : x 2 + z 2 = 3/4} extremal sein, wo f = 5/4 ist. 4) Wir betrachten nun die Teilmenge D 4, wo Extrema von f mit der Nebenbedingung g(x, y, z) = x 2 +y 2 1/2 = gesucht werden sollen. Die Gleichung f(x) = λ g(x) wird zu 2x = 2λx 1 = 2λy 2z = x 2 + y 2 = 1/2 Wir finden die Lösungen (x, y, z) = (, ±1/ 2, ) und (x, y, z) = (±1/2, 1/2, ). Es gilt f(, ±1/ 2, ) = ±1/ 2 f(±1/2, 1/2, ) = 3/4. 76
77 5) Auf D 5 haben wir die Nebenbedingungen g 1 (x, y, z) = x 2 + y 2 1/2 = und g 2 (x, y, z) = z 1/ 2 =. Die Gleichung f(x) = λ 1 g 1 (x) + λ 2 g 2 (x) gibt 2x = 2λ 1 x 1 = 2λ 1 y 2z = λ 2 x 2 + y 2 = 1/2 z = 1/ 2 Es gibt die Lösungen (±1/2, 1/2, 1/ 2) und (, ±1/ 2, 1/ 2). Es gilt f(±1/2, 1/2, 1/ 2) = 5/4 f(, ±1/ 2, 1/ 2) = ±1/ 2 + 1/2. 6) Aus Symmetrie können Extrema in D 6 nur an den Stellen (±1/2, 1/2, 1/ 2) und (, ±1/ 2, 1/ 2) gefunden werden. Wie in D 5 finden wir f(±1/2, 1/2, 1/ 2) = 5/4 und f(, ±1/ 2, 1/ 2) = ±1/ 2 + 1/2. Durch Vergleich der Werte von f in den gefundenen Kandidaten für Maxima und Minima, finden wir max f(x) = 5/4, und min f(x) = 1 x D x D 2 Das Maximum wird auf dem Kreisbogen y = 1/2, x 2 + z 2 = 3/4, mit z 1/ 2 angenommen. Das Minimum wird in (, 1/ 2, ) angenommen. 3.7 Integrale, die von einem Parameter abhängen. Sei f(x, y) eine stetige Funktion von zwei Variablen, definiert auf einer Produktmenge I U, wobei I R ein Intervall ist und U R n. Für feste y U können wir dann f über x integrieren (weil f(x, y) für feste y als Funktion von x stetig und deswegen auch integrierbar ist). Das Resultat ist eine Funktion auf U. Wir möchten in diesem Abschnitt einige Eigenschaften von dieser Funktion diskutieren. Satz 3.3. Seien a, b R, a < b, U R n und f C([a; b] U). Dann ist die Funktion ϕ : U R, definiert durch stetig. ϕ(y) = b a f(x, y) dx (58) Beweis: Sei y U und y n eine Folge in U, mit y n y. O.B.d.A. können wir r > finden, mit y n B r (y) = {z R n : z y r} U für alle n N (sonst betrachten wir nur y n für n gross genug). Wir setzen dann F n (x) := f(x, y n ) und F (x) := f(x, y). Aus Stetigkeit von f gilt offenbar F n (x) F (x) punktweise. Wir behaupten nun F n F gleichmässig auf [a; b]. Da [a; b] B r (y) kompakt ist, ist f auf [a; b] B r (y) gleichmässig stetig. Für ε > fest gewählt existiert also δ >, so dass f(x, y) f(z, w) < ε für alle (x, y), (z, w) [a; b] B r (y) mit (x, y) (z, w) < δ. Wir finden nun N N mit 77
78 y n y < δ für alle n > N. Dann gilt auch (x, y n ) (x, y) < δ für alle n > N. Deswegen muss F n (x) F (x) = f(x, y n ) f(x, y) < ε für alle n > N und alle x [a; b]. Das zeigt die gleichmässige Konvergenz von F n F. Aus Analysis 1 (Satz 9.13) folgt, dass b lim n a F n (x)dx = und also, dass ϕ(y n ) ϕ(y). Damit ist ϕ stetig. b a F (x)dx Ist f nach y differenzierbar, so ist auch ϕ, definiert wie in (58), differenzierbar. Das ist der Inhalt vom nächsten Satz. Satz Seien a, b R, a < b, n, m N, U R n offen und f : [a; b] U R m stetig. Wir nehmen an, f/ y j (x, y) existiert und ist stetig auf [a; b] U für ein j {1,..., n}. Dann hat auch die Funktion ϕ(y) = b a f(x, y) dx eine stetige partielle Ableitung ϕ/ y j (y) auf U, gegeben aus ϕ y j (y) = b a dx f y j (x, y). Ist ferner f nach y 1,..., y n partiell differenzierbar und sind alle partiellen Ableitungen f/ y j (x, y) stetig auf [a, b] U, dann ist ϕ C 1 (U; R m ) mit Dϕ(y) = b a dx D y f(x, y) wobei D y f(x, y) die m n Matrix ist, deren Einträge aus f i / y j (x, y) gegeben sind. Beweis: O.B.d.A. betrachten wir den Fall m = 1 (sonst wiederholen wir das Argument für die m Komponenten von f = (f 1,..., f m )). Sei y U festgewählt. Wir finden ρ >, so dass y + te j U für alle t [ ρ, ρ]. Für beliebige t ρ haben wir ϕ(y + te j ) ϕ(y) t = b a dx f(x, y + te j) f(x, y) t Aus dem Mittelwertsatz existiert für jede t [ ρ; ρ] und x [a; b] ein s(t, x) mit s(t, x) t, so dass (59) f(x, y + te j ) f(x, y) t = f y j (x, y + s(t, x)e j ) Die Abbildung (x, λ) ( f/ y j )(x, y + λe j ) ist stetig und damit auf der kompakten Menge [a; b] [ ρ, ρ] gleichmässig stetig. Für ein beliebiges ε > gibt es also ein < δ < ρ, so dass f (x, y + λe j ) f (x, y) y j y j ε 78
79 für alle λ δ und alle x [a; b]. Damit gilt f(x, y + te j ) f(x, y) f (x, y) t y j = f (x, y + s(t, x)e j ) f (x, y) y j y j ε für alle t δ und x [a; b] (weil dann s(t, x) t δ) ist. Damit gilt f(x, y + te j ) f(x, y) t f y j (x, y) für t, gleichmässig in x. Aus Analysis 1 (Satz 9.13) folgt, dass lim t b a dx f(x, y + te j) f(x, y) t b a dx f y j (x, y). Aus (59) folgt, dass ϕ nach y j partiell differenzierbar ist, und dass ϕ y j (y) = b a dx f y j (x, y). Da f/ y j stetig ist, folgt die Stetigkeit von ϕ/ y j aus Satz 3.3. Die andere Behauptung folgt aus Proposition 3.5. Wir untersuchen nun Funktionen f(x, y) auf der Produktmenge [a; b] [c; d] R 2. Wir definieren das Doppelintegral von f. Definition Seien a < b R, c < d R. Sei f : [a; b] [c; d] R. Das Doppelintegral existiert, wenn folgendes gilt b d a c f(x, y)dydx i) Für jedes x [a; b] ist die Funktion y f(x, y) auf [c; d] integrierbar. ii) Die Funktion F : [a; b] R definiert durch ist integrierbar. F (x) = d c f(x, y)dy In diesem Fall setzt man b d a c f(x, y)dydx = b a F (x)dx = b a ( d c ) f(x, y)dy dx Das Doppelintegral wird analog definiert. d b c a f(x, y)dxdy 79
80 Ist f C([a; b] [c; d]) stetig, so spielt es keine Rolle, ob wir zunächst über x oder über y integrieren. Satz 3.33 (Fubini). Seien a, b, c, d R, mit a < b und c < d. Sei f C([a; b] [c; d]). Dann existieren beide Doppelintegrale und sind gleich. b d a c f(x, y)dydx, d b c a f(x, y)dxdy Beweis: Aus der Stetigkeit von f folgt die Existenz von F (x) = d c f(x, y)dy für alle x [a; b]. Aus Satz 3.3 folgt, dass F stetig und deswegen auf [a; b] integrierbar ist. Das zeigt die Existenz vom Doppelintegral b d a c f(x, y)dydx. Analog zeigt man die Existenz vom Doppelintegral d b c a f(x, y)dxdy. Um zu zeigen, dass die zwei Integrale gleich sind, definieren wir A : [a; b] [c; d] R durch A(x; y) = y c f(x, t)dt Aus Analysis 1 folgt, dass A partiell nach y differenzierbar ist, mit A (x, y) = f(x, y) y Wir behaupten nun, dass A stetig ist. Sei (x k ; y k ) eine Folge in R 2 mit (x k ; y k ) (x; y). Dann gilt Wir haben A(x k ; y k ) A(x; y) A(x k ; y k ) A(x k ; y) + A(x k ; y) A(x; y) y A(x k ; y k ) A(x k ; y) = f(x k ; t)dt C y k y y k als k, weil sup{f(x; y) : x [a; b], y [c; d]} < aus der Stetigkeit von f und aus der Kompaktheit von [a; b] [c; d]. Anderseits A(x k, y) A(x, y), für k, weil aus Satz 3.3 die Funktion A(x, y) stetig in x ist, für beliebig y [c; d]. Wir setzen also ϕ(y) = b a A(x, y)dx = 8 b y a c f(x, t)dtdx
81 Insbesondere ϕ(d) = b a ist, mit Das gibt und zeigt die Behauptung. d c f(x, y)dydx. Nach Satz 3.31 finden wir, dass ϕ differenzierbar ϕ (y) = b ϕ(d) = ϕ(c) + a A (x, y)dx = y d 3.8 Konservative Vektorfelder c ϕ (y)dy = Wir führen den Begriff vom Vektorfeld ein. b a d b c f(x, y)dx a f(x, y)dxdy Definition Ein Vektorfeld mit Definitionsbereich U R n ist eine Abbildung K : U R n. Ist U R n offen, so sagen wir die Abbildung K : U R n ist ein C k -Vektorfeld, falls K C k (U; R n ). Wir haben schon oft Abbildungen betrachtet, die eine Teilmenge von R n auf R n abbilden (zb. Diffeomorphismen). Die Interpretation von Vektorfeldern ist aber anders. Ein Vektorfeld wird interpretiert als eine Abbildung, die zu jedem Punkt im Raum einen Vektor in R n zuordnet. Typische Beispiele von Vektorfeldern sind Kraftfelder. Eine elektrische Ladung im Punkt x = erzeugt an der Stelle x R 3 die Kraft K(x) = c x x 3 für eine Konstante c R. K(x) ist ein Beispiel eines Vektorfelds. Ein anderes Beispiel von Vektorfeldern sind Geschwindigkeitsfelder. Die Strömung einer Flüssigkeit kann durch das Geschwindigkeitsfeld v(x) beschrieben werden, das die momentane Geschwindigkeit der Flüssigkeit an der Stelle x R n spezifiziert. Aus diesen Beispielen ist klar, dass Vektorfelder eine sehr wichtige Rolle in der Physik spielen (natürlich spielen in der Physik auch skalare Felder, wie zum Beispiel die Temperatur T (x) als Funktion vom Ort, eine wichtige Rolle, und manchmal ist es auch nützlich, Matrix-wertige Felder zu betrachten; hier untersuchen wir aber nur Vektorfelder). Feldlinien. Sei nun K : U R n ein Vektorfeld. Eine parametrisierte Kurve γ : I R n (wobei I R ein Intervall ist) heisst eine Feldlinie vom Vektorfeld K, falls der Tangentialvektor γ (t) für alle t I proportional zum Vektor K(γ(t)) ist. Man bemerke, der Begriff von Feldlinie ist von der Parametrisierung der Kurve γ unabhängig. In der Tat, falls ψ : Ĩ I eine monotone differenzierbare Funktion ist, so gilt d dt γ(ψ(t)) = γ (ψ(t))ψ (t) und deswegen ist (γ ψ) (t) immer proportional zu γ (ψ(t)). Eine natürliche Parametrisierung einer Feldlinie ist also durch die Gleichung γ (t) = K(γ(t)) 81
82 bestimmt. Diese Differentialgleichung für γ(t) gibt uns die Möglichkeit, Feldlinien eines Kraftfelds zu finden. Ist K ein C 1 -Vektorfeld auf U und ist x U, dann folgt aus der Theorie der gewöhnlichen Differentialgleichungen, siehe z.b. Satz 2.6, dass man immer mindestens ein Stück Feldlinie von K durch x finden kann, und dass diese lokale Feldlinie eindeutig bestimmt ist. Zentralfelder. Ein Vektorfeld K : U R n heisst ein Zentralfeld, falls K die Form K(x) = f( x )x hat, für eine Funktion f( x ) die nur von der Länge x von x abhängt. Das elektrische Feld K(x) = constx/ x 3, erzeugt auf R 3 \{} aus einer Ladung im Ursprung, ist ein Beispiel eines Zentralfelds. Gradientenfelder. Ein Vektorfeld K : U R n definiert auf U R n heisst ein Gradientenfeld, falls eine reel-wertige Funktion ϕ C 1 (U) existiert, mit K(x) = ϕ(x). Die Länge einer parametrisierten Kurve. Sei I = [a; b] R und γ C 1 (I; R n ) eine differenzierbare parametrisierte Kurve in R n. Wir möchten die Länge von γ definieren. Ist γ eine Gerade, so ist die Länge von γ durch γ(b) γ(a) gegeben. Falls γ keine Gerade ist, so können wir versuchen, die Länge zu definieren, indem wir γ in viele kleine Teile zerlegen. Für n N finden wir a = t < t 1 < t 2 < < t n = b. Eine erste Näherung für die Länge von γ ist aus γ(t j ) γ(t j 1 ) j=1 (t j t j 1 ) γ (t j 1 ) gegeben. Wir können nun die Länge von γ berechenen, indem wir den Limes dieses Ausdrucks für n betrachten (angenommen, die Folge der Teilungen ist so, dass sup j t j t j 1 ). Wir definieren also die Länge der parametrisierten differenzierbaren Kurve γ durch L(γ) = b a j=1 dt γ (t) (6) Aus der Annahme γ C 1 ([a; b]; R n ) folgt, dass γ (t) stetig von t abhängt. Deswegen ist die rechte Seite von (6) wohldefiniert und endlich. Man bemerke auch, dass die Definition (6) unabhängig von der Parametrisierung der Kurve ist. Sei nämlich ψ : [c; d] [a; b] eine monoton steigende injektive und differenzierbare Funktion. Wir definieren die parametrisierte Kurve γ : [c; d] R n durch γ(t) = γ(ψ(t)). Dann gilt Deswegen L( γ) = d c γ (t) = γ (ψ(t))ψ (t) dt γ (t) = d c dt ψ (t) γ (ψ(t)) wobei wir benutzt haben, dass ψ (t) (aus der Monotonie). Mit der Variablentransformation s = ψ(t) finden wir L( γ) = L(γ). D.h., wie behauptet, die Länge ist von der Parametrisierung unabhängig. Allgemeiner kann man die Länge einer stückweise stetig differenzierbaren parametrisierten Kurve definieren. 82
83 Definition Eine parametrisierte Kurve γ : [a; b] R n heisst stückweise stetig differenzierbar, falls sie stetig auf [a; b] ist, und falls eine endliche Teilung a = t < t 1 < < t n 1 < t n = b mit der Eigenschaft, dass γ C 1 ([t j 1 ; t j ]; R n ) für alle j = 1,..., n existiert (erinnere, dass γ C 1 ([t j 1 ; t j ]; R n ) genau dann, wenn γ C 1 ((t j 1 ; t j ); R n ) und γ und γ können auf dem abgeschlossenen Intervall [t j 1 ; t j ] stetig fortgesetzt werden). Für eine stückweise stetig differenzierbare Kurve γ : [a; b] R n, können wir dann die Länge durch tj L(γ) = dt γ (t) (61) t j 1 j=1 definieren, wobei die Teilung a = t < t 1 < < t n = b so gewählt wird, dass γ C 1 ([t j 1 ; t j ]; R n ) für alle j = 1,..., n. Linienintegrale. Sei nun γ : [a; b] R n eine parametrisierte Kurve und K : U R n ein Vektorfeld, mit γ(i) U. Wir interpretieren γ als die Bahn eines Teilchen und K(x) als die auf dem Teilchen im Punkt x wirkende Kraft. Ein wichtiger Begriff in der Physik ist die Arbeit, die das Teilchen leisten muss, um sich durch das Kraftfeld zu bewegen (oder die Arbeit, die das Kraftfeld auf dem Teilchen leistet). Ist γ eine Gerade und K(x) = K konstant auf der Geraden, so ist die Arbeit aus K (γ(b) γ(a)) gegeben. Allgemeiner können wir die Arbeit berechnen, indem wir das Intervall [a; b] in kleine Teilintervalle zerlegen. Seien a = t < t 1 < < t n = b. Dann können wir die Arbeit durch K(γ(t j 1 )) (γ(t j ) γ(t j 1) ) j=1 K(γ(t j 1 ))γ (t j 1 )(t j t j 1 ) approximieren. Nehmen wir das Limes n (mit sup j (t j t j 1 ) ), so konvergiert die linke Seite (angenommen z.b. das Vektorfeld K ist stetig) zum Integral b Das motiviert die folgende Definition. a j=1 K(γ(t)) γ (t) dt Definition Sei U R n offen, K : U R n ein stetiges Vektorfeld. Sei γ : [a; b] U eine stückweise stetig differenzierbare Kurve in U. Wir definieren dann das Linienintegral (oder Wegintegral) von K entlang γ durch γ K dx := j=1 tj t j 1 K(γ(t)) γ (t) dt wobei die Teilung a = t < t 1 < < t n = b so gewählt wurde, dass γ C 1 ([t j 1 ; t j ]; R n ) für alle j = 1,..., n. In der folgenden Proposition sammeln wir einige wichtige Eigenschaften von Linienintegralen. 83
84 Proposition Sei U R n offen, K ein stetiges Vektorfeld in U, γ : [a; b] U eine stückweise stetig differenzierbare Kurve in U. i) Sei M = sup{ K(x) : x γ([a; b])} (bemerke, dass M < wegen Stetigkeit von K und Kompaktheit von γ([a; b]). Dann gilt K dx ML(γ) wobei L(γ) die Länge von γ ist, wie in (61) definiert. γ ii) Sei ψ : [c; d] [a b] monoton steigend, mit ψ(c) = a und ψ(d) = b, und stückweise stetig differenzierbar (ψ is eine Parametertransformation). Wir definieren γ : [c; d] U durch γ(t) = γ(ψ(t)). Dann gilt K dx = K dx γ D.h. der Wert des Linienintegrales ist von der Parametrisierung der Kurve unabhängig. Beweis: i) Sei a = t < t 1 < < t n = b eine Teilung, so dass γ C 1 ([t j 1, t j ]; U) für alle j = 1,..., n. Dann gilt tj tj K(γ(t)) γ (t)dt t j 1 K(γ(t)) γ (t) dt t j 1 Also γ K dx = j=1 tj tj γ t j 1 K(γ(t)) γ (t) dt M K(γ(t)) γ (t)dtdt t j 1 M j=1 tj tj t j 1 γ (t) dt t j 1 γ (t) dt = ML(γ) ii) Sei c = t < t 1 < < t n = d eine Teilung von [c; d] mit der Eigenschaft, dass ψ C 1 ([t j 1 ; t j ]) und γ C 1 ([ψ(t j 1 ); ψ(t j )]; U) für alle j = 1,..., n. Dann gilt tj t j 1 K( γ(t)) γ (t)dt = = tj t j 1 K(γ(ψ(t))) γ (ψ(t))ψ (t)dt ψ(tj ) ψ(t j 1 ) K(γ(s)) γ (s)ds mit der Variablentransformation s = ψ(t). Also, da ψ monoton wachsend ist, finden wir tj K dx = K( γ(t)) γ (t)dt γ j=1 t j 1 ψ(tj ) = K(γ(s)) γ (s)ds = K dx j=1 ψ(t j 1 ) γ 84
85 Operationen mit Kurven. Für eine stückweise stetig differenzierbare Kurve γ : [a; b] R n, kann man die stückweise stetig differenzierbare Kurve γ : [a; b] R n durch γ(t) = γ(b + a t) definieren. Es ist einfach zu sehen, dass γ die selbe Kurve wie γ beschreibt, aber in umgekehrte Richtung parametriseirt. Sind γ 1 : [a; b] R n und γ 2 : [c; d] R n zwei stückweise stetig differenzierbare Kurven, so dass γ 1 (b) = γ 2 (c), so kann man die Kurve γ 3 = γ 1 + γ 2 : [a; b + d c] durch { γ1 (t) falls t [a; b] γ 3 (t) = γ 2 (t + c b) falls t [b; b + d c] definieren. Anschaulich, γ 3 ist die Vereinigung der zwei Kurven γ 1 und γ 2. Es ist einfach zu sehen, dass L( γ) = L(γ), und L(γ 1 +γ 2 ) = L(γ 1 )+L(γ 2 ). Für Linienintegrale finden wir K dx = K dx (62) und γ γ K dx = γ 1 +γ 2 K dx + γ 1 K dx. γ 2 (63) Um Gleichung 62 zu zeigen, sei γ : [a; b] R n und a = t < t 1 < < t n = b eine Teilung mit der Eigenschaft, dass γ C 1 ([t j 1 ; t j ]; U) für alle j = 1,..., n. Wir setzen t j = a + b t n j. Dann ist a = t < t 1 < < t n = b eine Teilung mit der Eigenschaft, dass γ C 1 ([ t j 1 ; t j ]; U) für alle j = 1,..., n. Erinnere hier, dass γ(t) = γ(a + b t). Wir finden γ K dx = j=1 = = t j t j 1 K( γ(t)) ( γ) (t)dt a+b tn j j=1 tn j j=1 = j=1 a+b t n j+1 K(γ(a + b t)) γ (a + b t)dt t n j+1 K(γ(s)) γ (s)ds tn j+1 t n j Die Gleichung (63) kann ähnlich bewiesen werden. K(γ(s)) γ (s)ds = K dx γ Konservative Vektorfelder. Falls das Vektorfeld K ein Gradientenfeld ist, dann ist die Berechnung seiner Linienintegralen besonders einfach. Satz Sei U R n offen, ϕ C 1 (U) und K = ϕ (dann ist K ein stetiges Vektorfeld auf U). Sei γ C 1 ([a; b]; U) eine stetig differenzierbare Kurve auf U. Dann gilt K dx = ϕ(γ(a)) ϕ(γ(b)) γ γ(a) heisst der Anfangspunkt der Kurve γ und γ(b) der Endpunkt. 85
86 Beweis: Wir bemerken, dass Deswegen finden wir γ K dx = d dt ϕ(γ(t)) = ϕ(γ(t)) γ (t) = b a b a ϕ(γ(t)) γ (t)dt d ϕ(γ(t))dt = ϕ(γ(a)) ϕ(γ(b)) dt Bemerkung: Die Aussage von Satz 3.38 gilt auch, falls die Kurve γ stückweise stetig differenzierbar ist. In diesem Fall finden wir eine Teilung a = t < t 1 <... t n = b mit der Eigenschaft, dass γ C 1 ([t j 1 ; t j ]; U) für alle j = 1,..., n. Dann gilt, ähnlich wie im Beweis des Satzes, tj für alle j = 1,..., n. Damit γ K dx = t j 1 ϕ(γ(t)) γ (t)dt = ϕ(γ(t j )) ϕ(γ(t j 1 )) (ϕ(γ(t j )) ϕ(γ(t j 1 ))) = ϕ(γ(b)) ϕ(γ(a)) j=1 Bemerkung: Es folgt aus dem Satz, dass Linienintegrale von Gradientenfeldern entlang einer Kurve γ nur vom Anfangspunkt und Endpunkt von γ abhängen, nicht von dem Weg dazwischen. Bemerkung: Eine parametrisierte Kurve γ : [a; b] R n heisst geschlossen, wenn γ(a) = γ(b), d.h. falls Anfangspunkt und Endpunkt der Kurve übereinstimmen. Es folgt aus Satz 3.38, dass das Linienintegral von einem Gradientenfeld entlang einer geschlossenen Kurve verschwindet. Definition Sei U R n. Ein Vektorfeld K : U R n heisst konservativ (oder manchmal exakt), falls das Linienintegral K dx γ nur vom Anfangs- und Endpunkt von γ abhängt, für jede Kurve γ in U. Mit anderen Worten, K ist konservativ, falls für alle zwei stückweise stetig differenzierbaren Kurven γ 1, γ 2 mit übereinstimmenden Anfangs- und Endpunkten, gilt K dx = K dx γ 1 γ 2 86
87 Es folgt aus Satz 3.38, dass Gradientenfelder konservativ sind. In der Physik spielen konservative Kraftfelder eine besonders wichtige Rolle. Ist K konservativ, dann ist die Arbeit, die ein Teilchen leistet, wenn es sich auf einer Bahn γ bewegt, nur vom Anfangsund Endpunkt der Bahn abhängig. Das impliziert, wie wir bald sehen werden, dass man für konservative Kraftfelder ein Potential einführen kann, so dass die geleistete Arbeit einfach die Differenz vom Potential im End- und im Anfangspunkt ist. D.h. man kann ein Potential einführen, so dass Energieerhaltung gilt. Proposition 3.4. Sei U R n offen und K : U R n ein stetiges Vektorfeld. Dann ist K genau dann konservativ, wenn K dx = für alle geschlossenen stückweise stetig differenzierbaren Kurve γ in U. γ Beweis: Sei zunächst K konservativ und γ : [a; b] U eine geschlossene stückweise stetig differenzierbare Kurve mit γ(a) = γ(b) =: x. Es bezeichne γ : [a; b] R n die konstante Kurve γ(t) = x für alle t [a; b]. Weil γ und γ die selben Anfangs- und Endpunkte haben, finden wir (siehe Prop. 3.37) K dx = K dx =. Nehmen wir nun an, dass γ γ γ K dx = für alle geschlossenen stückweise stetig differenzierbaren Kurven γ auf U. Seien γ 1 und γ 2 zwei beliebige stückweise stetig differenzierbare Kurven auf U, mit übereinstimmenden Anfangs- und Endpunkten. Wie oben bezeichnen wir mit γ 2 die Kurve γ 2, mit umgekehrter Richtung. Der Anfangspunkt von γ 2 ist dann der Endpunkt von γ 1 und analog der Anfangspunkt von γ 1 ist der Endpunkt von γ 2. Wir definieren auch die Kurve γ = γ 1 + ( γ 2 ), die parametrisierte Kurve gegeben aus der Vereinigung von γ 1 und γ 2. Genauer gesagt, falls γ 1 : [a; b] U und γ 2 : [c; d] U, so definieren wir γ : [a; b + d c] U durch γ(t) = γ 1 (t) falls t [a; b] und γ(t) = γ 2 (t b + c) falls t [b; b + d c]. Die Kurve γ ist dann offenbar eine geschlossene stückweise stetig differenzierbare Kurve, und deswegen = K dx = K dx + K dx = K dx K dx γ γ 1 γ 2 γ 1 γ 2 Das zeigt, dass Also ist K konservativ. K dx = K dx. γ 1 γ 2 Wir haben schon bemerkt, dass jedes Gradientfeld konservativ ist. Wir zeigen nun die Umkehrung dieser Aussage: Jedes konservative Vektorfeld ist ein Gradientenfeld. Dazu werden wir das folgende Hilfslemma anwenden. 87
88 Lemma Jede offene Teilmenge U R n lässt sich als Vereinigung einer disjukten Familie offener zusammenhängender Mengen darstellen (die Vereinigung braucht nicht endlich zu sein). Bemerkung. Diese Zerlegung ist eigentlich eindeutig; die offenen zusammenhängenden Teilmengen werden als Zusammenhangskomponenten bezeichnet. Beweis: Wir definieren eine Relation zwischen Punkten in U. Für x, y U schreiben wir x y genau dann, wenn x und y sich durch einen Streckenzug in U verbinden lassen. Offenbar definiert eine Äquivalenzrelation. Die Äquivalenzklassen sind offen. Sei nämlich x U beliebig. Wir zeigen die Äquivalenzklasse [x] ist offen. Dazu finden wir r >, so dass die offene Kugel B r (x) von Radius r um x in U enthalten ist. Dann ist x y, für alle y B r (x). Damit ist B r (x) [x], und [x] ist offen. Die Äquivalenzklassen sind offenbar zusammenhängend und paarweise disjukt. Wir können nun zeigen, dass jedes konservative Feld ein Gradientenfeld ist. Satz Sei U R n offen, K ein konservatives stetiges Vektorfeld auf U. Dann existiert ϕ : U R stetig differenzierbar, mit K = ϕ. Beweis: Wir betrachten zunächst den Fall, dass U zusammenhängend ist. Wir wählen x U fest. Für ein beliebiges x U finden wir eine stückweise stetig differenzierbare Kurve γ x in U mit Anfangspunkt x und Endpunkt x. Wir setzen ϕ(x) = K dx γ x Da K konservativ ist, ist die Definition unabhängig von der Wahl der Kurve γ x, natürlich unter der Annahme, dass der Endpunkt von γ x gerade x ist. Wir bemerken, dass ϕ(x ) =. Wir behaupten, dass ϕ(x) = K(x). Das würde den Satz für den Fall U zusammenhängend beweisen, weil K aus Annahme stetig ist. Um die Behauptung zu zeigen, bemerken wir, dass ϕ x i (x) = d dt ϕ(x + te i) t= und dass ϕ(x + te i ) = K dx = γ x+tei = K dx + γ x γ x+[x;x+te i ] [x;x+te i ] K dx K dx wobei [x; x + te i ] das Segment zwischen x und x + te i bezeichnet. Hier wählen wir t so klein, dass das Segment [x; x + te i ] in U enthalten ist (das ist natürlich möglich, weil U offen ist). Wir parametrisieren das Segment [x; x + te i ] durch die Kurve γ : [; t] U, definiert durch γ(s) = x + se i. Dann ist γ (s) = e i, und damit [x;x+te i ] K dx = t K(x + se i ) e i ds = 88 t K i (x + se i )ds
89 wobei K i die i-te Komponente vom Vektorfeld K bezeichnet. Nach dem Hauptsatz der Integralrechnung, finden wir d dt ϕ(x + te i) t= = d dt t K i (x + se i )ds = K i (x + te i ) t= = K i (x) t= Damit ist ϕ(x) = K(x), wie behauptet. Sei nun U nicht zusammenhängend. Aus Lemma 3.41 finden wir eine Familie U i von disjunkten zusammenhängenden offenen Mengen in R n, mit U = i U i. Für jede i können wir dann wie oben eine stetig differenzierbare Funktion ϕ i : U i R konstruieren, mit ϕ i (x) = K(x) für alle x U i. Da die Teilmengen disjunkt sind, könenn wir ϕ : U R durch ϕ(x) := ϕ i (x) für alle x U i definieren. Dann ist ϕ wohldefiniert, stetig differenzierbar, mit ϕ(x) = K(x) für alle x U. Satz 3.42 zeigt, zusammen mit Satz 3.38, dass für jedes konservative Vektorfeld K : U R n, eine Potentialfunktion ϕ : U R gefunden werden kann, mit K = ϕ und deswegen, mit K dx = ϕ(endpunkt) ϕ(anfangspunkt) γ Das bedeutet, für jedes konservative Vektorfeld kann man ein Potential einführen, so dass geleistete Arbeit = Unterschied im Potential (die Energie ist erhalten). Bemerke, dass die Potentialfunktion immer nur bis auf eine additive Konstante bestimmt ist. Charakterisierung von konservativen Vektorfeldern. Wir haben bis jetzt bewiesen, dass jedes konservative Vektorfeld ein Gradientenfeld ist. Die nächste natürliche Frage ist, wie könenn wir entscheiden, ob ein gegebenes Vektorfeld ein Gradientenfeld ist oder nicht. Es ist sehr einfach, notwendige Bedingungen zu finden. Ist K = ϕ, so muss gelten K i x j (x) = 2 ϕ x j x i (x) = 2 ϕ x i x j (x) = K j x i (x) (64) für alle 1 i < j n (die Bedingungen sind symmetrisch bzg. Änderung i j, j i). Hier bezeichnet K i die i-te Komponente vom Vektorfeld K. Ein Vektorfeld K mit der Eigenschaft (64) heisst rotationfrei (manchmal geschlossen). Im nächsten Satz beweisen wir, dass diese Bedingungen nicht nur notwendig, sondern auch hinreichend sind, falls das Vektorfeld auf einer konvexen offenen Menge definiert und differenzierbar ist. Satz Sei U R n offen und konvex (d.h. es gelte λx + (1 λ)y U, für alle x, y U und λ [; 1]). Sei K C 1 (U; R n ). Dann existiert ϕ C 1 (U) mit K = ϕ genau dann, wenn K i (x) = K j (x) (65) x j x i für alle 1 i < j n und alle x U. Das impliziert, K ist genau dann konservativ, wenn (65) erfüllt ist. 89
90 Beweis: O.B.d.A. nehmen wir an, U. Für jede x U ist dann das Segment [; x] = {tx : t [; 1]} in U enthalten (weil U konvex ist). Deswegen können wir eine Funktion ϕ : U R durch ϕ(x) = 1 K(tx) xdt definieren. Da K C 1 (U; R n ), folgt aus Satz 3.31, dass ϕ C 1 (U; R), mit ( ϕ 1 ) ( ) 1 K i (x) = K i (tx)x i dt = K j (tx) + tx i dt (66) x j x j x j i=1 Anderseits, bemerken wir, dass d dt (tk j(tx)) = K j (tx) + i=1 K j x i (tx)tx i = K j (tx) + i=1 i=1 K i x j (tx)tx i In der letzten Gleichung haben wir die Bedingung K j / x i = K i / x j benutzt. Vergleich mit (66) gibt ϕ 1 d (x) = x j dt (tk j(tx)) dt = K j (x). Beispiel: Sei K(x, y) = (y 2, 2xy + y 2 ). Wir suchen eine Funktion ϕ : R 2 R mit ϕ = K. Wir bemerken zunächst, dass K 1 y = 2y = K 2 x Das heisst, es existiert eine Potentialfunktion ϕ mit ϕ = K. Sie muss erfüllen, dass ϕ x = y2, und ϕ y = 2xy + y2 Die erste Gleichung impliziert, dass ϕ(x, y) xy 2 unabhängig von x sein soll. Damit können wir ϕ(x, y) = xy 2 + ψ(y) schreiben, für eine geeignete Funktion ψ. Durch Einsetzen in die Gleichung für ϕ/ y finden wir 2xy + ψ (y) = 2xy + y 2 Das ergibt ψ (y) = y 2 und damit ψ(y) = y 3 /3 + c für eine Konstante c R. Potentialfunktionen von K haben die Form ϕ(x, y) = xy 2 + y3 3 + c. Man bemerke, dass die Bedingung (65) nicht auf beliebigen Gebieten hinreichend ist (sie ist immer notwendig). Das zeigen wir mit dem folgenden Beispiel. Beispiel: Sei ( ) x2 x 1 K(x 1, x 2 ) = x ; x2 2 x x2 2 9
91 definiert auf der offenen Menge R 2 \{}. Dann gilt K 1 x 2 (x) = x2 1 + x2 2 (x x2 2 )2 = K 2 x 1 (x) für alle x R 2 \{}. Sei aber γ : [.2π] R 2 definiert durch γ(t) = (cos t, sin t) der Einheitskreis (eine geschlossene Kurve auf R 2 \{}. Dann ist γ K dx = 2π Also, K ist sicher nicht konservativ. Tatsächlich gilt die Äquivalenz K(cos t, sin t) ( sin t, cos t)dt = 2π K Gradientfeld K i x j = K j x i nicht nur auf konvexen, sondern allgemeiner auf sogenannten einfach zusammenhängenden Gebieten. Ein Gebiet G R n heisst einfach zusammenhängend, wenn jede geschlossene Kurve in G stetig zu einem Punkt deformiert werden kann (wir verzichten hier auf die genaue Definition dieses Begriffes). Das Gebiet R 2 \{} ist nicht einfach zusammenhängend, weil jede Kurve um den Ursprung nicht stetig innerhalb R 2 \{} zu einem Punkt deformiert werden kann (bemerke dagegen, dass R 3 \{} einfach zusammenhängend ist). 3.9 Holomorphe Funktionen In diesem Abschnitt betrachten wir Funktionen einer komplexen Variablen, mit Werten in C. Bemerke, dass diese Funktionen das Thema der Vorlesung Einführung in der komplexen Analysis sind (oft wird diese Vorlesung auch als Funktionentheorie genannt); hier geben wir nur eine kurze Einführung in dieses wichtige Gebiet der Analysis. Wir wissen, dass C mit R 2 identifiziert werden kann. Eine Funktion f : C C kann deswegen mit einer Funktion f : R 2 R 2 identifiziert werden, die durch f(x, y) = (Re f(x + iy), Im f(x + iy)) definiert wird. Wir werden aber sehen, der Begriff von Differenzierbarkeit einer Funktion auf C mit Werten auf C, ist nicht mit dem Begriff von Differenzierbarkeit von Funktionen auf R 2, mit Werten auf R 2 äquivalent. Definition Sei Ω C offen. Eine Funktion f : Ω C heisst komplex differenzierbar an der Stelle z Ω, wenn der Grenzwert f (z ) = lim z z f(z) f(z ) z z existiert. In diesem Fall heisst die Zahl f (z ) C die Ableitung von f an der Stelle z. Die Funktion f heisst auf Ω komplex differenzierbar, falls f an der Stelle z differenzierbar ist, für alle z Ω. Die Funktion f heisst holomorph in Ω, wenn sie auf Ω differenzierbar ist, und falls die Ableitung f (z) auf Ω stetig ist. Die Menge der holomorphen Funktionen auf Ω wird mit H(Ω) bezeichnet. 91
92 Bemerkung: Die Funktion f : Ω C ist genau dann an der Stelle z Ω komplex differenzierbar, wenn ein a C existiert, so dass f(z) f(z ) a(z z ) lim = z z z z Mit anderen Worten, f ist an der Stelle z komplex differenzierbar, falls f(z + h) f(z ) ah = o( h ) für h (hier ist h C). Die Abbildung L : C C definiert durch L(h) = ah ist ein Beispiel einer komplex linearen Abbildung auf C (weil L(h 1 + h 2 ) = L(h 1 ) + L(h 2 ) für alle h 1, h 2 C und L(αh) = αl(h) für alle α, h C. Es ist eigentlich einfach zu sehen, dass jede komplex lineare Abbildung auf C die Form L(h) = ah für ein a C hat. D.h. die Funktion f ist genau dann differenzierbar, wenn eine komplex lineare Abbildung L : C C existiert, mit der Eigenschaft, dass f(z + h) f(z ) L(h) = o( h ) für h. Das erklärt den Unterschied zum Begriff von Differenzierbarkeit in R 2. Versehen wir f als die Abbildung f(x, y) = (Re f(x + iy), Im f(x + iy)), definiert auf einer offenen Teilmenge von R 2 mit Werten in R 2, so ist f an der Stelle z = (x, y ) genau dann differenzierbar, wenn eine reell lineare Abbildung L : R 2 R 2 existiert, so dass f(z + h) f(z ) L(h) = o( h ) für h (hier ist h R 2 ). Während jede komplex lineare Abbildung reel linear ist, ist nicht jede reel lineare Abbildung komplex linear. Deswegen impliziert die komplexe Differenzierbarkeit einer Funktion f : Ω C immer die reelle Differenzierbarkeit von f(x, y) = (Re f(x + iy), Im f(x + iy)), aber die Umkehrung ist nicht wahr. Satz Sei Ω C offen. Die Funktion f : Ω C ist genau dann holomorph, wenn Re f, Im f als Funktionen zweier reeller Variablen auf Ω stetig differenzierbar sind, und x Re f(x + iy) = y Im f(x + iy) und Re f(x + iy) = Im f(x + iy) (67) y x In diesem Fall gilt f (z) = x Re f(z) + i x Im f(z) = y Im f(z) i y Re f(z) für alle z Ω. Diese zwei Bedingungen werden Cauchy-Riemann-Gleichungen genannt. Beweis: Die stetige Differenzierbarkeit von Re f, Im f impliziert, dass für alle z Ω, für h, mit der reel linearen Abbildung f(z + h) f(z) L(h) = o( h ) L(h 1 + ih 2 ) = ( x Re f(z)h 1 + y Re f(z)h 2 ) + i( x Im f(z)h 1 + y Im f(z)h 2 ) 92
93 Damit f komplex differenzierbar an der Stelle z ist, muss L komplex linear sein, d.h. es muss ein a = (a 1 + ia 2 ) C existieren, mit L(h 1 + ih 2 ) = (a 1 + ia 2 )(h 1 + ih 2 ) = (a 1 h 1 a 2 h 2 ) + i(a 1 h 2 + a 2 h 1 ) Koeffizientenvergleich ergibt a 1 = x Re f(z) = y Im f(z) a 2 = y Re f(z) = x Im f(z) Sind die Cauchy-Riemann-Gleichungen erfüllt, so ist f an der Stelle z komplex differenzierbar, mit Ableitung f (z) = x Re f(z) + i x Im f(z) = y Im f(z) i y Re f(z) Die Stetigkeit von Re f(z) und Im f(z) impliziert dann, dass f H(Ω). Die umgekehrte Implikation folgt einfach aus der Bemerkung, dass jede komplex lineare Abbildung auch reell linear ist. Damit ist jede komplex differenzierbare Funktion auch reell differenzierbar. Beispiel: Jedes Polynom f(z) = a n z n + + a 1 z + a in einer komplexen Variablen ist auf C holomorph. Wie bei Polynomen einer reellen Variablen findet man f (z) = na n z n 1 + (n 1)a n 1 z n a 1 Jede rationale Funktion P (z)/q(z), wobei P, Q Polynome sind, ist holomorph auf C\{z C : Q(z) = }. Die Exponentialfunktion f(z) = exp(z) ist auf C holomorph, mit f (z) = e z. Jede Potenzreihe f(z) = n= a n(z z ) n ist innerhalb ihres Konvergenzradius komplex differenzierbar. Das folgt, weil die Potenzreihe gleichmässig innerhalb des Konvergenzradius konvergiert. Das impliziert, aus Prop in Analysis 1, dass man die Ableitung und den Grenzwert vertauschen kann. Genauer gesagt, gilt Prop nur für die Ableitung nach einer reellen Variablen. Trotzdem, kann man Prop benutzten, um die partiellen Ableitungen von Re f, Im f nach x = Re z und y = Im z zu berechnen. Dann kann man leicht sehen, dass die partiellen Ableitungen stetig sind und dass sie die Cauchy-Riemann-Gleichungen erfüllen. Damit folgt auch, dass f komplex differenzierbar ist. Die Funktion f(z) = z 2 ist a.d.s. z C nicht differenzierbar, für alle z C\{}. In der Tat f(x + iy) = x 2 + y 2 = Re f(x + iy). Deswegen ist x Im f = y Im f während x Re f(x + iy) = 2x, und y Im f(x + iy) = 2y Die Cauchy-Riemann-Gleichungen sind nur an der Stelle x = y = erfüllt. Die Eigenschaften der komplexen Ableitung sind ähnlich denen der entsprechenden Eigenschaften der Ableitung auf R. Proposition Sei Ω C offen, f, g : Ω C an der Stelle z Ω komplex differenzierbar. Dann i) f + g und fg sind ebenfalls an der Stelle z komplex differenzierbar, mit (f + g) (z) = f (z) + g (z), und (fg) (z) = f (z)g(z) + f(z)g (z) 93
94 ii) Ist g(z), so ist auch f/g an der Stelle z komplex differenzierbar, mit (f/g) (z) = f (z)g(z) f(z)g (z) g 2 (z) iii) Sei U C offen und h : U C an der Stelle f(z) U komplex differenzierbar. Dann ist h f an der Stelle z komplex differenzierbar und (h f) (z) = h (f(z))f (z) Die Beweise sind den entsprechenden Beweisen in Analysis 1 sehr ähnlich. Wir definieren nun den Begriff von Linienintegralen einer Funktion f : C Ω C entlang einer stückweise stetig differenzierbaren Kurve γ. Definition Sei Ω C offen, f : Ω C stetig und γ eine stückweise stetig differenzierbare Kurve auf Ω (d.h. γ : [a; b] Ω ist stetig und es existiert eine endliche Teilung a = t < t 1 < < t n = b mit γ C 1 ([t j 1 ; t j ]; Ω) für alle j = 1,..., n). Dann definieren wir das Linien- oder Wegintegral von f entlang γ durch γ f(z)dz = j=1 tj t j 1 f(γ(t))γ (t)dt Bemerkung: Das Linienintegral einer stetigen komplexen Funktion f : C Ω C entlang einer stückweise stetig differenzierbaren Kurve γ : [a; b] Ω ist unabhängig von der Parametrisierung von γ. Sei nämlich ψ : [c; d] [a; b] stückweise stetig differenzierbar und γ : [c; d] Ω definiert durch γ(t) = γ(ψ(t)). Dann gilt f(z)dz = f(z)dz Das kann man ähnlich wie in Proposition 3.37 zeigen, weil tj t j 1 f(γ(ψ(t)))γ (ψ(t))ψ (t)dt = mit der Variablentransformation s = ψ(t). γ γ ψ(tj ) ψ(t j 1 ) f(γ(s))γ (s)ds Das Linienintegral von f entlang γ ist eine komplexe Zahl. Ausgedruckt durch Realund Imaginärteil von f und γ, ist es durch b [( Re f(γ(t))re γ (t) Im f(γ(t))im γ (t) ) a +i ( Re f(γ(t))im γ (t) + Im f(γ(t))re γ (t) )] dt gegeben (unter der Annahme, dass γ C 1 ([a; b]; Ω), sonst muss man das Intervall in eine geeignete Teilung zerlegen). Wir können f : C Ω C auch als Funktion f(x, y) = (Re f(x + iy), Im f(x + iy)) interpretieren. f ist ein Vektorfeld, definiert auf 94
95 einer Teilmenge von R 2. Wir haben das Linienintegral eines Vektorfeldes schon in Sektion 3.8 definiert. Das Linienintegral von f, versehen als Vektorfeld auf R 2, entlang γ ist aus b b f dx = f(γ(t)) γ (t)dt = Re f(γ(t))re γ (t) + Im f(γ(t))im γ (t)dt γ a a unter der Annahme, dass γ C 1 ([a; b]; Ω) ist, gegeben. Das Linienintegral vom Vektorfeld f ist also nicht dasselbe, wie das Linienintegral der komplexen Funktion f. Dagegen gilt Re f(z)dz = (Re f, Im f) dx γ γ Im f(z)dz = (Im f, Re f) dx γ γ Man bemerke, dass die Cauchy-Riemann-Gleichungen äquivalent mit der Tatsache sind, dass die zwei Vektorfelder (Re f, Im f) und (Im f, Re f) rotationsfrei sind. Aus dieser Bemerkung folgt: Ist f holomorph auf einem konvexen Ω C, und ist γ eine geschlossene stückweise stetig differenzierbare Kurve auf Ω, dann gilt γ f(z)dz =. Satz Sei Ω C offen, f H(Ω), a < b, γ, γ : [a; b] Ω geschlossene und stückweise stetig differenzierbare Kurven auf Ω, so dass s γ(t) + (1 s)γ(t) Ω für alle s [; 1] und t [a; b] (das ist sicher der Fall, wenn Ω konvex ist). Dann gilt f(z)dz = f(z)dz γ Beweis: Um den Beweis zu vereinfachen nehmen wir an γ, γ C 1 ([a; b]) (sonst muss man das Intervall [a; b] mit einer geeigneten Teilung zerlegen). Sei φ : [, 1] [a; b] Ω, definiert durch φ(s; t) = s γ(t) + (1 s)γ(t) γ Wir setzen g(s) := φ(s,.) f(z)dz = b a f(φ(s, t)) t φ(s, t)dt = b a ψ(s, t)dt mit ψ : [, 1] [a; b] C definiert durch ψ(s, t) = f(φ(s, t)) t φ(s, t) Dann gilt g() = γ f(z)dz, und g(1) = γ f(z)dz Wir möchten zeigen, dass g() = g(1). Wir bemerken, dass ψ stetig ist und dass s ψ(s, t) = f (φ(s, t))( γ(t) γ(t)) t φ(s, t) + f(φ(s, t)) t ( γ(t) γ(t)) = t [f(φ(s, t))( γ(t) γ(t))] 95
96 auch stetig ist. Deswegen können wir Satz 3.31 anwenden. Wir erhalten g (s) = b a s ψ(s, t)dt = b a t [f(φ(s, t))( γ(t) γ(t))] = f(φ(s, b))( γ(b) γ(b)) f(φ(s, a))( γ(a) γ(a)) = weil γ(a) = γ(b) und γ(a) = γ(b) und also auch φ(s, a) = φ(s, b) für alle s [, 1]. Falls im letzten Satz Ω C auch konvex ist, so wissen wir schon, dass f(z)dz = f(z)dz = γ Satz 3.48 ist aber wichtig, weil er auch für nicht konvexe Ω gilt. Als Anwendung dieses Satzes sei Ω C eine offene konvexe Menge und w Ω. Sei weiter f holomorph auf der nicht konvexen (und nicht einfach zusammenhängenden) Menge Ω\{w}. f kann aber in w eine Singularität haben. Deswegen ist das Linienintegral von f entlang einem geschlossenen Kreis um w im Allgemeinen nicht Null. Der Satz besagt aber, dass das Linienintegral entlang jedem Kreis (oder jede einfache gesclossene Kurve) um w (mit genügend kleinem Radius) immer denselben Wert hat. Diese Bemerkung benutzen wir im nächsten wichtigen Satz. Satz Sei Ω C offen, f H(Ω), x Ω und r (, ) so klein, dass B r (x) = {z C : z x r} Ω. Dann gilt, für alle w B r (x) = {z C : z x < r}, f(w) = 1 f(z) 2πi z w dz. Hier bezeichnet γ x,r : [, 2π] C die parametrisierte Kurve γ x,r (t) = x + re it (das ist der Kreis mit Radius r um x, parametrisiert im Gegenuhrzeigersinn). Beweis: Sei < ρ < r w x. Dann gilt B ρ (w) B r (x) Ähnlich wie für γ x,r, betrachten wir den Kreis γ w,ρ (t) = w + ρe it mit Radius ρ um w. Dann gilt, für alle s [; 1] und alle t [; 2π], γ γ x,r φ(s, t) = sγ x,r (t) + (1 s)γ w,ρ (t) B x,r \B w,ρ Ω\{w} Das folgt, weil B x,r konvex ist und weil Satz 3.48 impliziert also, dass f(z) z w dz = γ x,r φ(s, t) w = s(x + re it ) + (1 s)(w + ρe it ) w = = s(x w + (r ρ)e it ) + ρe it = ρ + s((x w)e it + (r ρ)) ρ + s(re (x w)e it + (r ρ)) > ρ γ w,ρ 2π f(z) z w dz f(w + ρe it ) ρe it iρe it dt = i 96 2π f(w + ρe it )
97 Deswegen 1 2πi γ x,t f(z) z w dz = 1 2π f(w + ρe it )dt 2π Da diese Formel für beliebige ρ > klein genug gilt, gilt sie auch im Limes ρ. Wir finden 1 f(z) 1 2π dz = lim f(w + ρe it )dt = f(w) 2πi γ x,t z w ρ 2π weil f(w + ρe it ) f(w) für ρ, gleichmässig in t [; 2π] (das kann z.b. durch Verwendung der Mittelwertabschätzung gezeigt werden). Satz 3.49 gibt eine Darstellung von f(w) durch ein Integral einer Funktion, die auf dem Kreis γ x,r stetig und differenzierbar ist. Das erlaubt uns, die Ableitung von f an der Stelle w zu berechnen, indem wir das Integrand nach w differenzieren. Satz 3.5. Sei Ω C offen, f H(Ω). Dann ist f auf Ω beliebig oft komplex differenzierbar. Falls w B r (x) und B r (x) Ω gilt f (n) (w) = n! f(z) dz 2πi (z w) n+1 γ x,r wobei γ x,r (t) = x + re it der Kreis mit Radius r um x, parametrisiert im Gegenuhrzeigersinn, ist. Beweis: Aus Satz 3.49 finden wir f(w) = 1 2πi γ x,r f(z) z w dz = 1 2π f(x + re it ) dt 2πi x w + reit Das Integrand ist nach w differenzierbar. Aus Satz 3.31 können wir Ableitung und Integral vertauschen. Wir bekommen f (w) = 1 f(z) 2πi (z w) 2 (68) Genauer gesagt, kann man Satz 3.31 nur für reelle Ableitungen anwenden. Man kann aber Satz 3.31 anwenden, um die partiellen Ableitungen w1 Re f(w 1 + iw 2 ), w2 Re f(w 1 + iw 2 ), w1 Im f(w 1 + iw 2 ) und w2 Im f(w 1 + iw 2 ) zu berechnen. Es ist dann einfach zu sehen, dass die Cauchy-Riemann-Gleichungen erfüllt sind, und dass f (w) in der Tat aus (68) gegeben ist (einfach weil die Funktion (w z) 1 auf γ x,r komplex differenzierbar ist, und Cauchy-Riemann-Gleichungen erfüllt). Aus (68) kann man dann analog die zweite Ableitung f (z) berechnen. Induktiv, findet man f (n) (w) = n! 2πi γ x,r γ x,r f(z) (z w) n dz. Es folgt aus dem letzten Satz, dass eine holomorphe Funktion automatisch beliebig oft komplex differenzierbar ist. Wir sehen, dass komplexe Differenzierbarkeit ein viel stärkerer Begriff, als reelle Differenzierbarkeit ist. Das hat viele wichtige Folgerungen und Anwendungen. 97
98 Proposition Sei Ω C offen und f : Ω C holomorph. Dann sind Re f, Im f harmonische Funktionen auf Ω, d.h. für alle z Ω. Re f(z) =, Im f(z) = Beweis: Es folgt aus Satz 3.5, dass Re f, Im f beliebig oft differenzierbar sind. Aus den Cauchy-Riemann-Gleichungen (67) folgt, dass 2 xre f(z) = x y Im f(z) = y x Imf(z) = 2 yre f(z) Deswegen gilt Re f(z) = 2 xre f(z) + 2 yim f(z) = Analog zeigt man, dass Im f =. Die letzte Proposition zeigt, dass Real- und Imaginärteil einer holomorphen Funktion immer harmonisch sind. Anderseits kann man zeigen, dass jede harmonische Funktion auf einer konvexen Teilmenge von R 2 der Realteil (oder der Imaginärteil) einer holomorphen Funktion ist. Proposition Sei Ω C offen und konvex, u C 2 (Ω) (hier wird Ω als Teilmenge von R 2 versehen) mit u =. Dann existiert v C 2 (Ω), so dass u + iv H(Ω). Beweis: Wir definieren das Vektorfeld g : Ω R 2 durch g(x, y) = ( y u(x, y), x u(x, y)). Dann gilt y g 1 (x, y) = 2 yu(x, y) = 2 xu(x, y) = x g 2 (x, y) weil u =. Damit ist g auf Ω rotationsfrei. Es folgt aus Satz 3.43, dass eine Potentialfunktion für g existiert. D.h. es existiert v C 1 (Ω) mit g(x, y) = ( x v(x, y), y v(x, y)). Dann ist es leicht zu sehen, dass f = u + iv die Cauchy-Riemann-Gleichungen erfüllt. Damit ist f holomorph und v harmonisch. Eine wichtige Folgerung dieser Charakterisierung von harmonischen Funktionen ist das folgende Korollar. Korollar Sei Ω R 2 offen und konvex (einfach zusammenhängend ist genug) und u C 2 (Ω) harmonisch (d.h. u = ). Dann ist u beliebig oft differenzierbar. Eine andere wichtige Anwendung von Satz 3.5 ist der Satz von Liouville Satz 3.54 (Liouville). Sei f H(C) beschränkt. Dann ist f konstant. Beweis: Sei M = sup z C f(z). Aus Satz 3.49 folgt, dass für alle r > w. Deswegen f (w) = 1 2πi γ,r f (w) M 2π f(z) (z w) 2 = 1 2π 2π 2π r re it w 2 98 f(re it ) re it w reit dt Mr (r w ) 2
99 Da r > w beliebig ist, finden wir f Mr (w) lim r (r w ) 2 = Also f (w) = für alle w C. Das impliziert, dass f konstant ist. Der Fundamentalsatz der Algebra folgt einfach aus dem Satz von Liouville. Satz 3.55 (Fundamentalsatz der Algebra). Jedes Polynom von Grad p 1 besitzt mindestens eine Nullstelle in C. Beweis: Sei P ein Polynom von Grad p 1, mit P (z) für alle z C. Dann ist 1/P (z) eine holomorphe Funktion auf C (man spricht von einer ganzen Funktion). Ferner, da für jede M >, R mit P (z) > M für alle z C mit z > R, existiert, schliessen wir, dass 1/P (z) beschränkt auf C ist. Aus Satz 3.54 folgt, dass 1/P (z) eine konstante Funktion ist. Das impliziert auch, dass P (z) konstant ist, in Wiederspruch zu der Annahme, dass P (z) ein Polynom von Grad p 1 ist. Tatsächlich sind holomorphe Funktionen auf einem offenen Gebiet Ω C nicht nur beliebig oft komplex differenzierbar, sondern sogar analytisch auf Ω. Der Begriff von analytischer Funktion ist hier genau wie für Funktionen auf R definiert. Definition Sei Ω C offen, f : Ω C. Die Funktion f ist an der Stelle z Ω analytisch, falls ein r > und eine Folge a n existieren, so dass f(z) = a n (z z ) n n= für alle z B r (z ) = {w C : z w < r}. f heisst analytisch auf Ω, wenn f analytisch an der Stelle z ist, für alle z Ω. Wie für reelle Funktionen zeigt man, dass analytische Funktionen beliebig oft differenzierbar sind. Das folgt aus der Tatsache, dass eine Potenzreihe n a n(z z ) n mit Konvergenzradius r, für alle r < r, auf B r (z ) = {z C : z z r } gleichmässig konvergent ist. Deswegen kann man Summe und Ableitung vertauschen; siehe Analysis 1, Proposition 8.29 (siehe auch das Argument in den Beispielen unter Satz 3.45 um Prop aus Analysis 1 für komplexe Ableitungen zu benuzten). Induktiv zeigt man, dass f beliebig oft differenzierbar ist. Die Umkehrung gilt für reelwertige Funktionen auf U R i.a. nicht. D.h. es existieren Funktionen f : R R, die unendlich oft differenzierbar sind, aber nicht analytisch. Das ist bei komplex differenzierbaren Funktionen nicht möglich. Jede holomorphe Funktion ist automatisch analytisch. Satz Sei Ω C, f H(Ω), z Ω. Sei r > so klein, dass B r (z ) = {z C : z z r} Ω. Dann gilt, für alle z B r (z ) = {z C : z z < r}, f(z) = Insbesondere ist f analytisch auf Ω. n= f (n) (z ) (z z ) n n! 99
100 Beweis: Für z B r (z ) schreiben wir f(z) = 1 2πi γ z,r f(w) w z dw wobei γ z,r(t) = z + re it, t [; 2π], der Kreis von Radius r um z ist, parametrisiert im Gegenuhrzeigersinne. Weiter, für w γ z,r([; 2π]) gilt Da z z < w z = r, finden wir 1 w z = 1 w z + z z = 1 1 w z 1 z z w z 1 w z = 1 w z n= (z z ) n (w z ) n = (z z ) n (w z ) n+1 wobei die Summe für w γ z,r gleichmässig konvergiert. Deswegen können wir Integral und Summe vertauschen und bekommen f(z) = 1 f(w) 2πi γ z w z dw = 1 f(w) 2πi,r γ z (w z,r ) n+1 (z z ) n Aus Satz 3.5 erhalten wir f(z) = n= n= n= f (n) (z ) (z z ) n. n! Wie wir schon bei der Untersuchung von analytischen Funktionen auf R diskutiert haben, hat die Analytizität wichtige Folgerungen. Z.B. gilt der folgende Identitätssatz. Satz 3.58 (Identitätssatz). Sei U C eine nichtleere offene und zusammenhängende Teilmenge von C und seien f, g holomorph auf U. Dann sind die folgenden Aussagen äquivalent. i) f(z) = g(z) für alle z U. ii) Die Menge {z U : f(z) = g(z)} enthält unendlich viele Punkte und besitzt einen Häufungspunkt in U. iii) Es gibt ein z U, so dass f (n) (z ) = g (n) (z ) für alle n. Beweis: Die Implikationen i) ii) und i) iii) sind trivial. Wir zeigen ii) iii) und iii) i). ii) iii): Sei h = f g und z U ein Häufungspunkt der Menge M = {z U : h(z) = }. Wir behaupten, dass h (n) (z ) = für alle n N. Nehmen wir an, es existiert m N mit h (m) (z ). Sei m der kleinste Index mit dieser Eigenschaft. Dann, aus Satz 3.57, gibt es eine Umgebung G von z und eine auf G holomorphe Funktion ϕ mit ϕ(z ) und h(z) = (z z ) m ϕ(z) 1
101 für alle z G. Aus Stetigkeit von ϕ gilt also ϕ(z) in einer Umgebung von z. Damit ist auch h(z) für alle z z in einer Umgebung von z. D.h. z ist kein Häufungspunkt von M, in Widerspruch zur Annahme. iii) i): Sei h = f g und S k = {z U : h (k) (z) = }. Da h (k) stetig ist, ist S k geschlossen, für alle k N. Damit ist auch S := k S k abgeschlossen. Wir behaupten nun, S ist auch offen, als Teilmenge von U. Für z S beliebig, können wir die holomorphe Funktion h in einer Potenzreihe um z entwicklen. Das zeigt, dass h(z) = in einer offenen Umgebung von z. Für jede z S existiert also ε >, so dass B ε (z ) S. Da U zusammenhängend ist, muss entweder S = U oder S = gelten. Die Annahme iii) impliziert, dass S = U. Bemerkung: Sei U C und I R ein Intervall mit I U. Sei f eine beliebige Funktion auf I. Dann gibt es höchstens eine auf U holomorphe Funktion, die auf I mit f übereinstimmt. Die komplexe Analysis ist manchmal nützlich, um gewisse bestimmte Integrale von Funktionen auf R zu berechnen. Wir betrachten zwei Beispiele. Besipiel: wir möchten das uneigentliche Integral sin x x dx berechnen. Wir wissen aus Analysis 1, dass das Integral konvergiert. Um den Wert des Integrales zu berechnen, betrachten wir die Funktion f(z) = e iz /z, die auf C\{} holomorph ist. Wir definieren weiter die stückweise stetig differenzierbare Kurve γ : [; 4] C durch r + (R r)t, falls t [; 1] Re γ(t) = iπ(t 1), falls t [1; 2] R + (R r)(t 2), falls t [2; 3] re iπ(4 t), falls t [3; 4] Dann gilt, mit Satz 3.48, γ f(z)dz = weil wir γ(t) = i für alle t können, und dann φ(s, t) = sγ(t) + (1 s) γ(t) C\{}, wo f holomorph ist (und natürlich ist γ f(z)dz = ). Es folgt, dass R r r π π f(x)dx + f(x)dx = f(re it )ire it dt + f(re it )ie it dt (69) R Auf der linke Seite, haben wir R r e ix e ix x R dx = 2i r sin x x dx 2i sin x x dx für r und R. Auf der rechten Seiten von (69) haben wir dagegen π f(re it )ire it dt = i 11 π e ireit dt iπ
102 für r, weil exp(ir exp(it)) 1 gleichmässig, da r (und deswegen dürfen wir Limes und Integral vertauschen). Anderseits betrachten wir Also π f(re it )ire it dt = i Für ein beliebiges ε >, gilt π f(re it )ire it ε dt e R sin t dt + Deswegen π e ireit dt π f(re it )ire it π dt e R sin t dt lim R für beliebiges ε >. Es folgt, dass lim R π π π ε ε π e R sin t + e R sin t R sin ε 2ε + πe π ε f(re it )ire it dt 2ε f(re it )ire it dt = und deswegen, aus (69), bekommen wir im Limes R, r, Das ergibt 2i sin x dx = iπ x sin x x = π 2. Beispiel: das Gausssche Integral. Wir möchten das Integral e x2 dx berechnen. Wir setzen a = π/2(1 + i) und betrachten das komplexe Linienintegral γr e z2 dz 1 + e 2az wobei, für R >, γ R das Parallelogramm ist, mit den Eckpunkten R, R, R+a, R+a. Wir zerlegen γ R = γ 1,R + γ 2,R + γ 3,R + γ 4,R, wobei γ 1,R = [ R; R], γ 2,R = [R; R + a], γ 3,R = [R + a; R + a] und γ 4,R = [ R + a; R] ist. Sei γ 2,R (t) = R + ta, t [; 1] eine Parametrisierung des Segmentes γ 2,R. Dann gilt γ2,r e z2 dz = 1 + e 2az 1 e (R+ta)2 adt (7) 1 + e 2a(R+ta) Bemerke, dass Re (R + ta) 2 = R 2 + 2πtR R 2 2πR 12
103 weil a 2 = iπ, und t [; 1]. Deswegen ist falls R gross genug ist. Anderseits und damit e (R+ta)2 = e Re (R+ta)2 e (R2 2πR) e R2 /2 1 + e 2a(R+ta) = 1 + e 2aR e 2πit = 1 + e 2πR e i(2πt+ 2πR) 1 + e 2a(R+ta) 2 = (1 + e 2πR cos(2πt 2πR)) 2 + e 2 2πR sin 2 (2πt 2πR) = 1 + e 2 2πR + 2e 2πR cos(2πt 2πR) (1 e 2πR ) 2 1/2 für R gross genug. Aus (7) finden wir also, dass e γ2,r z2 dz 1 + e 2az /2 Ce R2 für R. Analog kann man zeigen, dass 1 + e für R. Anderseits, γ1,r e z2 dz e 2az Wir erhalten, dass γ3,r e z2 γ4,r e z2 dz = 1 + e 2az = = 2az dz R R R R R R e t2 R dt 1 + e 2at R [ e t2 e t2 2at e 2at 1 + e 2at e t2 dt e e t2 dt = lim R γr z2 dz 1 + e 2az e (t+a)2 dt 2a(t+a) 1 + e ] Die Funktion f(z) = e z2 /(1 + e 2az ) ist überall holomorph, ausser in den Punkten z C mit e 2az = 1. Man findet, f ist auf C\{a(n + 1/2) : n Z} holomorph. Die einzige Singularität von f innerhalb der von γ R berandeten Menge ist im Punkt z = a/2. Deswegen, für r > klein genug, γr e z2 dz = 1 + e 2az γa/2,r e z2 dz 1 + e 2az 13
104 wobei γ a/2,r der Kreis von Radius r um a/2, parametrisiert im Gegenuhrzeigersinn, ist. Für r klein genug, können wir den Nenner in einer Taylorreihe um den Punkt a/2 entwickeln. Wir finden 1 + e 2az = 1 e 2a(z a/2) = ( 2a) n (z a/2) n n! n 1 = 2a(z a/2) 1 + ( 2a) n 1 (z a/2) n 1 n! n 2 =: 2a(z a/2)g(z) für eine analytische Funktion g, definiert in einer Umgebung von a/2, mit g(a/2) = 1. Da g(a/2) ist, ist auch h(z) = e z2 /g(z) eine analytische Funktion, mit h(a/2) = e iπ/4 = (1 i)/ 2. Also, aus Satz 3.49, finden wir, nach einer kleinen Rechnung, γr e z2 Wir haben damit bewiesen, dass dz = 1 + e 2az γa/2,r e z2 = 1 2a dz 1 + e 2az γ a/2,r = (2πi)h(a/2) 2a e x2 dx = π. h(z) z a/2 dz = π 14
Skript zur Vorlesung Analysis 3
Skript zur Vorlesung Analysis 3 Herbstsemester 204 Prof. Benjamin Schlein Inhaltsverzeichnis Gewöhnliche Differentialgleichungen 2. Differentialgleichungen erster Ordnung, elementare Lösungsmethoden..
Analysis II. 8. Klausur mit Lösungen
Fachbereich Mathematik/Informatik Prof. Dr. H. Brenner Analysis II 8. Klausur mit en 1 2 Aufgabe 1. Definiere die folgenden kursiv gedruckten) Begriffe. 1) Eine Metrik auf einer Menge M. 2) Die Kurvenlänge
Gewöhnliche Differentialgleichungen Woche 6. Existenz nach Picard-Lindelöf
d Gewöhnliche Differentialgleichungen Woche 6 Existenz nach Picard-Lindelöf 6.1 Vorbereitung für den Existenzsatz 6.1.1 Stetigkeit und Lipschitz-Stetigkeit Definition 6.1 Seien (V 1, 1 und (V 2, 2 zwei
Systeme von Differentialgleichungen. Beispiel 1: Chemische Reaktionssysteme. Beispiel 2. System aus n Differentialgleichungen 1. Ordnung: y 1.
Systeme von Differentialgleichungen Beispiel : Chemische Reaktionssysteme System aus n Differentialgleichungen Ordnung: y (x = f (x, y (x,, y n (x Kurzschreibweise: y y 2 (x = f 2(x, y (x,, y n (x y n(x
Musterlösung. Aufgabe 1 a) Die Aussage ist falsch. Ein Gegenbeispiel ist die Funktion f : [0, 1] R, die folgendermaßen definiert ist:
Musterlösung Aufgabe a) Die Aussage ist falsch. Ein Gegenbeispiel ist die Funktion f : [, ] R, die folgendermaßen definiert ist: f(x) := { für x R \ Q für x Q f ist offensichtlich beschränkt. Wir zeigen,
Mathematische Grundlagen für die Vorlesung. Differentialgeometrie
Mathematische Grundlagen für die Vorlesung Differentialgeometrie Dr. Gabriele Link 13.10.2010 In diesem Text sammeln wir die nötigen mathematischen Grundlagen, die wir in der Vorlesung Differentialgeometrie
Mathematik für Physiker, Informatiker und Ingenieure
Mathematik für Physiker, Informatiker und Ingenieure Folien zu Kapitel IV SS 2010 G. Dirr INSTITUT FÜR MATHEMATIK UNIVERSITÄT WÜRZBURG [email protected] http://www2.mathematik.uni-wuerzburg.de
Kurzskript zur Vorlesung Analysis 2
Kurzskript zur Vorlesung Analysis 2 Prof G Friesecke Zentrum Mathematik, TU München SS 2009 Abstract Dieses Kurzskript ersetzt weder die Teilnahme an, noch die Mitschrift aus, der Vorlesung Es enthält
Höhere Mathematik III für die Fachrichtung Physik Wintersemester 2016/17. Lösungsvorschlag zu Übungsblatt 5
Institut für Analysis Dr. Christoph Schmoeger M.Sc. Jonathan Wunderlich Höhere Mathematik III für die Fachrichtung Physik Wintersemester 6/7..7 Lösungsvorschlag zu Übungsblatt 5 Aufgabe 6: Zeigen Sie mit
3 Lineare Differentialgleichungen
3 Lineare Differentialgleichungen In diesem Kapitel behandeln wir die allgemeine Theorie linearer Differentialgleichungen Sie werden zahlreiche Parallelen zur Theorie linearer Gleichungssysteme feststellen,
12 Gewöhnliche Differentialgleichungen
2 2 Gewöhnliche Differentialgleichungen 2. Einleitung Sei f : D R wobei D R 2. Dann nennt man y = f(x, y) (5) eine (gewöhnliche) Differentialgleichung (DGL) erster Ordnung. Als Lösung von (5) akzeptiert
L 2 -Theorie und Plancherel-Theorem
L -Theorie und Plancherel-Theorem Seminar Grundideen der Harmonischen Analysis bei Porf Dr Michael Struwe HS 007 Vortrag von Manuela Dübendorfer 1 Wiederholung aus der L 1 -Theorie Um die Fourier-Transformation
Lösungsvorschlag zur Nachklausur zur Analysis
Prof Dr H Garcke, D Depner SS 09 NWF I - Mathematik 080009 Universität Regensburg Lösungsvorschlag zur Nachklausur zur Analysis Aufgabe Untersuchen Sie folgende Reihen auf Konvergenz und berechnen Sie
Topologie und Differentialrechnung mehrerer Veränderlicher, SS 2009 Modulprüfung/Abschlussklausur. Aufgabe Punkte
Universität München 22. Juli 29 Topologie und Differentialrechnung mehrerer Veränderlicher, SS 29 Modulprüfung/Abschlussklausur Name: Aufgabe 2 3 4 Punkte Gesamtpunktzahl: Gesamturteil: Schreiben Sie unbedingt
Analysis I & II Lösung zur Basisprüfung
FS 6 Aufgabe. [8 Punkte] (a) Bestimmen Sie den Grenzwert ( lim x x ). [ Punkte] log x (b) Beweisen Sie, dass folgende Reihe divergiert. n= + n + n + sin(n) n 3 + [ Punkte] (c) Finden Sie heraus, ob die
Probeklausur zu Funktionentheorie, Lebesguetheorie und gewöhnlichen Differentialgleichungen
MATHEMATISCHES INSTITUT SoSe 24 DER UNIVERSITÄT MÜNCHEN Probeklausur zu Funktionentheorie, Lebesguetheorie und gewöhnlichen Differentialgleichungen Musterlösung Prof. Dr. P. Pickl Aufgabe Zeigen Sie, dass
Institut für Analysis WS 2014/15 PD Dr. Peer Christian Kunstmann Dipl.-Math. Leonid Chaichenets
Institut für Analysis WS 4/5 PD Dr. Peer Christian Kunstmann 9..4 Dipl.-Math. Leonid Chaichenets Höhere Mathematik III für die Fachrichtung Physik Lösungsvorschläge zum 5. Übungsblatt Aufgabe : (a) Sei
1 Einführung, Terminologie und Einteilung
Zusammenfassung Kapitel V: Differentialgleichungen 1 Einführung, Terminologie und Einteilung Eine gewöhnliche Differentialgleichungen ist eine Bestimmungsgleichung um eine Funktion u(t) einer unabhängigen
Nachklausur zur Analysis 2, SoSe 2017
BERGISCHE UNIVERSITÄT WUPPERTAL 18.9.17 Fakultät 4 - Mathematik und Naturwissenschaften Prof. N. V. Shcherbina Dr. T. P. Pawlaschyk www.kana.uni-wuppertal.de Nachklausur zur Analysis 2, SoSe 217 Aufgabe
Zusammenfassung Analysis 2
Zusammenfassung Analysis 2 1.2 Metrische Räume Die Grundlage metrischer Räume bildet der Begriff des Abstandes (Metrik). Definition 1.1 Ein metrischer Raum ist ein Paar (X, d), bestehend aus einer Menge
22 KAPITEL 1. GRUNDLAGEN. Um zu zeigen, dass diese Folge nicht konvergent ist, betrachten wir den punktweisen Limes und erhalten die Funktion
KAPITEL 1. GRUNDLAGEN Um zu zeigen, dass diese Folge nicht konvergent ist, betrachten wir den punktweisen Limes und erhalten die Funktion 1 für 0 x < 1 g 0 (x) = 1 1 für < x 1. Natürlich gibt dies von
53 Die Parsevalsche Gleichung
53 Die Parsevalsche Gleichung 53 Die Parsevalsche Gleichung 5 53. Skalarprodukte auf Räumen quadratintegrierbarer Funktionen. a) Die Orthogonalitätsrelationen (5.5) legen die Interpretation des Ausdrucks
Übungen zu Differentialgleichungen (WiSe 12/13)
Übungen zu Differentialgleichungen WiSe 2/) Blatt 6 22 November 202 Gruppenübung Aufgabe G Sei f t, p) := p 5, t, p) R 2 Gegeben sei das Anfangswertproblem ẋ = f t,x), x0) = ) Bestimmen sie das maximale
D-MATH, D-PHYS, D-CHAB Analysis II FS 2017 Prof. Manfred Einsiedler. Übungsblatt 5 A := u = Au, u(0) = 1. 1
D-MATH, D-PHYS, D-CHAB Analysis II FS 2017 Prof. Manfred Einsiedler Übungsblatt 5 1. Gegeben sei die Matrix 1 1 0 A := 0 1 0 0 0 2 a) Bestimmen Sie ein Fundamentalsystem (das heisst eine Basis des Lösungsraums)
Lösung - Serie 25. D-MAVT/D-MATL Analysis II FS 2017 Dr. Andreas Steiger
D-MAVT/D-MATL Analysis II FS 2017 Dr. Andreas Steiger Lösung - Serie 25 1. Wie lautet die charakteristische Gleichung der Differentialgleichung y + 2y + y = 0? (a) λ 3 + 2λ + 1 = 0 (b) λ 3 + 2λ = 0 (c)
Serie 13: Online Test
D-ERDW, D-HEST, D-USYS Mathematik I HS 13 Dr. Ana Cannas Serie 13: Online Test Einsendeschluss: 31. Januar 214 Bei allen Aufgaben ist genau eine Antwort richtig. Lösens des Tests eine Formelsammlung verwenden.
ist ein n-dimensionaler, reeller Vektorraum (vgl. Lineare Algebra). Wir definieren auf diesem VR ein Skalarprodukt durch i y i i=1
24 14 Metrische Räume 14.1 R n als euklidischer Vektorraum Die Menge R n = {(x 1,..., x n ) x i R} versehen mit der Addition und der skalaren Multiplikation x + y = (x 1 + y 1,..., x n + y n ) λx = (λx
Stetigkeit, Konvergenz, Topologie
Ferienkurs Seite 1 Technische Universität München Ferienkurs Analysis 1 Hannah Schamoni Wintersemester 2011/12 Stetigkeit, Konvergenz, Topologie 21.03.2012 Inhaltsverzeichnis 1 Stetigkeit und Konvergenz
Analysis I. 6. Beispielklausur mit Lösungen
Fachbereich Mathematik/Informatik Prof. Dr. H. Brenner Analysis I 6. Beispielklausur mit en Aufgabe. Definiere die folgenden (kursiv gedruckten) Begriffe. () Eine Relation zwischen den Mengen X und Y.
Mathematik für Anwender I. Klausur
Fachbereich Mathematik/Informatik 27. März 2012 Prof. Dr. H. Brenner Mathematik für Anwender I Klausur Dauer: Zwei volle Stunden + 10 Minuten Orientierung, in denen noch nicht geschrieben werden darf.
Konvergenz im quadratischen Mittel und die Parsevelsche Gleichung
Konvergenz im quadratischen Mittel und die Parsevelsche Gleichung Skript zum Vortrag im Proseminar Analysis bei Dr. Gerhard Mülich Christian Maaß 6.Mai 8 Im letzten Vortrag haben wir gesehen, dass das
0 Grundbegriffe. Mengen, Teilmengen, Äquivalenzrelationen, Abbildungen, injektiv/bijektiv/surjektiv,
Die folgende Übersicht ist eine Zusammenstellung der Inhalte der Vorlesung. In der Prüfung wird nicht verlangt, Beweise für die namentlich erwähnten Sätze zu geben. Die Prüfungskandidat(inn)en können individuell
Fachbereich Mathematik/Informatik 16. Juni 2012 Prof. Dr. H. Brenner. Mathematik für Anwender II. Testklausur mit Lösungen
Fachbereich Mathematik/Informatik 6. Juni 0 Prof. Dr. H. Brenner Mathematik für Anwender II Testklausur mit Lösungen Aufgabe. Definiere die folgenden (kursiv gedruckten) Begriffe. () Ein Skalarprodukt
Analysis 2, Woche 9. Mehrdimensionale Differentialrechnung I. 9.1 Differenzierbarkeit
A Analysis, Woche 9 Mehrdimensionale Differentialrechnung I A 9. Differenzierbarkeit A3 =. (9.) Definition 9. Sei U R m offen, f : U R n eine Funktion und a R m. Die Funktion f heißt differenzierbar in
Analysis II. Aufgaben zum Stoff der Analysis I und II Lösungsvorschlag
Prof Dr H Garcke, D Depner SS 9 NWF I - Mathematik 1979 Universität Regensburg Aufgabe 1 Analysis II Aufgaben zum Stoff der Analysis I und II Lösungsvorschlag i Erinnern Sie sich an die Konvergenzkriterien
Bemerkung Als Folge von Satz 6.2 kann man jede ganze Funktion schreiben als Potenzreihe. α m z m. f(z) = m=0. 2πi. re it t [0,2π] 2πi
Funktionentheorie, Woche 7 Eigenschaften holomorpher Funktionen 7.1 Ganze Funktionen Definition 7.1 Eine Funktion f : C C, die holomorph ist auf C, nennt man eine ganze Funktion. Bemerkung 7.1.1 Als Folge
Seminar Gewöhnliche Differentialgleichungen
Seminar Gewöhnliche Differentialgleichungen Dynamische Systeme I 1 Einleitung 1.1 Nichtlineare Systeme In den vorigen Vorträgen haben wir uns mit linearen Differentialgleichungen beschäftigt. Nun werden
Lösungen der Übungsaufgaben von Kapitel 3
Analysis I Ein Lernbuch für den sanften Wechsel von der Schule zur Uni 1 Lösungen der Übungsaufgaben von Kapitel 3 zu 3.1 3.1.1 Bestimmen Sie den Abschluss, den offenen Kern und den Rand folgender Teilmengen
Wiederholungsklausur zur Analysis II
Wiederholungsklausur zur Analysis II Prof. Dr. C. Löh/M. Blank 11. April 2012 Name: Matrikelnummer: Vorname: Übungsleiter: Diese Klausur besteht aus 8 Seiten. Bitte überprüfen Sie, ob Sie alle Seiten erhalten
Merkblatt zur Funktionalanalysis
Merkblatt zur Funktionalanalysis Literatur: Hackbusch, W.: Theorie und Numerik elliptischer Differentialgleichungen. Teubner, 986. Knabner, P., Angermann, L.: Numerik partieller Differentialgleichungen.
8.1. DER RAUM R N ALS BANACHRAUM 17
8.1. DER RAUM R N ALS BANACHRAUM 17 Beweis. Natürlich ist d 0 und d(x, y) = 0 genau dann, wenn x = y. Wegen (N2) ist x = x und damit d(x, y) = d(y, x). Die letzte Eigenschaft einer Metrik schließt man
Klausur zu Analysis II - Lösungen
Mathematisches Institut der Heinrich-Heine-Universität Düsseldorf Dr. Axel Grünrock WS 1/11 11..11 Klausur zu Analysis II - Lösungen 1. Entscheiden Sie, ob die folgenden Aussagen richtig oder falsch sind.
Mathematik I für Studierende der Geophysik/Ozeanographie, Meteorologie und Physik Vorlesungsskript
Mathematik I für Studierende der Geophysik/Ozeanographie, Meteorologie und Physik Vorlesungsskript Janko Latschev Fachbereich Mathematik Universität Hamburg www.math.uni-hamburg.de/home/latschev Hamburg,
Probeklausur zur Analysis II
Probeklausur zur Analysis II Prof. Dr. C. Löh/M. Blank 3. Februar 2012 Name: Matrikelnummer: Vorname: Übungsleiter: Diese Klausur besteht aus 8 Seiten. Bitte überprüfen Sie, ob Sie alle Seiten erhalten
Umkehrfunktion. g (y) = f (x) 1, x = g(y), Umkehrfunktion 1-1
Umkehrfunktion Ist für eine stetig differenzierbare n-variate Funktion f : D R n die Jacobi-Matrix f (x ) für einen Punkt x im Innern des Definitionsbereiches D R n nicht singulär, so ist f lokal invertierbar,
Musterlösung Klausur zu Analysis II. Verständnisteil
Technische Universität Berlin SS 2009 Institut für Mathematik 20.07.2009 Prof. Dr. R. Schneider Fritz Krüger Sebastian Holtz Musterlösung Klausur zu Analysis II Verständnisteil 1. (a) Sei D R n konvex
Teil 6. Differentialrechnung mehrerer Veränderlicher
Teil 6 Differentialrechnung mehrerer Veränderlicher 95 96 6.1 Topologie von Mengen Umgebung ε-umgebung eines Punktes x R n : B ε (x) = {y : y x < ε} Umgebung U von x: Menge, die eine ε-umgebung von x enthält
Klausur Höhere Mathematik I für die Fachrichtung Physik
Karlsruher Institut für Technologie (KIT Institut für Analysis Prof. Dr. Tobias Lamm Dr. Patrick Breuning WS /3 4.3.3 Klausur Höhere Mathematik I für die Fachrichtung Physik Aufgabe ((4+3+3 Punkte a Welche
2. Dezember Lineare Algebra II. Christian Ebert & Fritz Hamm. Skalarprodukt, Norm, Metrik. Matrizen. Lineare Abbildungen
Algebra und Algebra 2. Dezember 2011 Übersicht Algebra und Algebra I Gruppen & Körper Vektorräume, Basis & Dimension Algebra Norm & Metrik Abbildung & Algebra I Eigenwerte, Eigenwertzerlegung Singulärwertzerlegung
Lösungsvorschläge zur ersten Klausur Gewöhnliche Differenzialgleichungen am um 10 Uhr. Bearbeitungszeit beträgt zwei Stunden.
Lösungsvorschläge zur ersten Klausur Gewöhnliche Differenzialgleichungen am 20.6.2015 um 10 Uhr. Bearbeitungszeit beträgt zwei Stunden. Prof. Dr. Wolfgang Arendt Manuel Bernhard Sommersemester 2015 Achten
Übungen zu Analysis, SS 2015
Übungen zu Analysis, SS 215 Ulisse Stefanelli 15. Juni 215 1 Wiederholung 1. Untersuchen Sie das Verhalten der folgenden Folgen a n = n 2 cosh(1/n), b n = ln(ln(n))/n, c n = (2 n n 2 )/n!, 2. Stellen Sie
4 Funktionenfolgen und normierte Räume
$Id: norm.tex,v 1.57 2018/06/08 16:27:08 hk Exp $ $Id: jordan.tex,v 1.34 2018/07/12 20:08:29 hk Exp $ 4 Funktionenfolgen und normierte Räume 4.7 Kompakte Mengen Am Ende der letzten Sitzung hatten wir zwei
Lösungsvorschlag zur Übungsklausur zur Analysis I
Prof. Dr. H. Garcke, Dr. H. Farshbaf-Shaker, D. Depner WS 8/9 NWF I - Mathematik 9..9 Universität Regensburg Lösungsvorschlag zur Übungsklausur zur Analysis I Frage 1 Vervollständigen Sie die folgenden
Vorlesung Mathematik 2 für Ingenieure (Sommersemester 2016)
1 Vorlesung Mathematik 2 für Ingenieure (Sommersemester 216) Kapitel 11: Potenzreihen und Fourier-Reihen Prof. Miles Simon Nach Folienvorlage von Prof. Dr. Volker Kaibel Otto-von-Guericke Universität Magdeburg.
Lösungen zur Analysis-Prüfung Sommer 2017
Lösungen zur Analysis-Prüfung Sommer 27. Teil: Rechnungen. a) [ Punkt] Berechnen Sie das Integral x dx. x 2 + Es gilt x x 2 + dx = = 2 arsinh(). x 2 + dx = [arsinh(x)] b) [ Punkt] Berechnen Sie das Integral
Staatsexamen Herbst 2017 Differential- und Integralrechnung, Thema I
Staatsexamen Herbst 17 Differential- und Integralrechnung, Thema I 1. a) Die Aussage ist wahr! Sei s R der Reihenwert der Reihe k=1 Da a n = s n s n 1 für n, ist also b) Die Aussage ist falsch! a k, also
Konversatorium zu Lineare Algebra und Analysis Analysis - Übungsbeispiele
Univ.-Prof. Dr. Radu Ioan Boţ, Axel Böhm Konversatorium zu Lineare Algebra und Analysis Analysis - Übungsbeispiele SS18 A1. Sei f : [, + ) R so, dass und dass ein M existiert mit Zeigen Sie, dass f(s +
Konvergenz im quadratischen Mittel - Hilberträume
CONTENTS CONTENTS Konvergenz im quadratischen Mittel - Hilberträume Contents 1 Ziel 2 1.1 Satz........................................ 2 2 Endlich dimensionale Vektorräume 2 2.1 Defintion: Eigenschaften
Konvergenz im quadratischen Mittel und Parsevalsche Gleichung
Konvergenz im quadratischen Mittel und Parsevalsche Gleichung Skript zum Vortrag im Proseminar Analysis bei Prof Dr Picard, gehalten von Helena Malinowski In vorhergehenden Vorträgen und dazugehörigen
Mathematik II für Studierende der Informatik (Analysis und lineare Algebra) im Sommersemester 2018
(Analysis und lineare Algebra) im Sommersemester 2018 15. April 2018 1/46 Die Dimension eines Vektorraums Satz 2.27 (Basisergänzungssatz) Sei V ein Vektorraum über einem Körper K. Weiter seien v 1,...,
Kommentierte Musterlösung zur Klausur HM II für Naturwissenschaftler
Kommentierte Musterlösung zur Klausur HM II für Naturwissenschaftler Sommersemester 7 (7.8.7). Gegeben ist die Matrix A 3 3 3 (a) Bestimmen Sie sämtliche Eigenwerte sowie die zugehörigen Eigenvektoren.
SS 2016 Höhere Mathematik für s Studium der Physik 21. Juli Probeklausur. Die Antworten zu den jeweiligen Fragen sind in blauer Farbe notiert.
SS 6 Höhere Mathematik für s Studium der Physik. Juli 6 Probeklausur Die Antworten zu den jeweiligen Fragen sind in blauer Farbe notiert. Fragen Sei (X, d) ein metrischer Raum. Beantworten Sie die nachfolgenden
Gewöhnliche Differentialgleichungen Woche 7. Globale Existenz einer Lösung
Gewöhnliche Differentialgleichungen Woche 7 Globale Existenz einer Lösung 7.1 Von lokal zu global Wir betrachten wiederum das Anfangswertproblem { y (x = f (x, y(x, y( = y 0. (7.1 Eine erste Erweiterung
Klausurenkurs zum Staatsexamen (WS 2015/16): Differential und Integralrechnung 3
Dr. Erwin Schörner Klausurenkurs zum Staatsexamen (WS 25/6): Differential und Integralrechnung 3 3. (Herbst 2, Thema 3, Aufgabe 2) Gegeben ist für m R die Funktion f m : ], 2π[ R; f m (x) = Folgende Tatsachen
Höhere Mathematik für Physiker II
Universität Heidelberg Sommersemester 2013 Wiederholungsblatt Übungen zur Vorlesung Höhere Mathematik für Physiker II Prof Dr Anna Marciniak-Czochra Dipl Math Alexandra Köthe Fragen Machen Sie sich bei
3 Metrische und normierte Räume
3 Metrische und normierte Räume 3.1 Metrische Räume Mit der metrischen Struktur wird der aus dem Ê n bekannte Abstandsbegriff abstrahiert. Wir können uns einen metrischen Raum als eine Punktmenge vorstellen,
Bestimmen Sie die Lösung des Anfangswertproblems. y (x) 4y (x) 5y(x) = 6e x. y(0) = y (0) = 0.
Aufgabe Bestimmen Sie die Lösung des Anfangswertproblems y (x) 4y (x) 5y(x) = 6e x y(0) = y (0) = 0. Zunächst bestimmen wir die Lösung der homogenen DGL. Das charakteristische Polynom der DGL ist λ 2 4λ
Analysis I. 1. Beispielklausur mit Lösungen
Fachbereich Mathematik/Informatik Prof. Dr. H. Brenner Analysis I. Beispielklausur mit en Aufgabe. Definiere die folgenden (kursiv gedruckten) Begriffe. () Das Bild einer Abbildung F: L M. (2) Eine Cauchy-Folge
Klausur Analysis II
WS 28/9 Prof. Dr. John M. Sullivan Kerstin Günther Technische Universität Berlin Fakultät II Institut für Mathematik Klausur Analysis II 6.2.28 Name: Vorname: Matr.-Nr.: Studiengang: Mit der Veröffentlichung
Der n-dimensionale Raum
Der n-dimensionale Raum Mittels R kann nur eine Größe beschrieben werden. Um den Ort eines Teilchens im Raum festzulegen, werden schon drei Größen benötigt. Interessiert man sich für den Bewegungszustand
Implizite Funktionen, der Umkehrsatz und Extrema unter Nebenbedingungen
Kapitel XII Implizite Funktionen, der Umkehrsatz und Extrema unter Nebenbedingungen 53 Implizite Funktionen und allgemeine partielle Differenzierbarkeit 54 Der Umkehrsatz 55 Lokale Extrema unter Nebenbedingungen,
ε δ Definition der Stetigkeit.
ε δ Definition der Stetigkeit. Beweis a) b): Annahme: ε > 0 : δ > 0 : x δ D : x δ x 0 < δ f (x δ f (x 0 ) ε Die Wahl δ = 1 n (n N) generiert eine Folge (x n) n N, x n D mit x n x 0 < 1 n f (x n ) f (x
VIII. Fourier - Reihen
VIII. Fourier - Reihen Dieses Kapitel enthält eine kurze Einführung in die mathematische Beschreibung von Schwingungen. Übersicht über den Inhalt von Kapitel VIII: 5. Der Satz von Fejér 53. Die Parsevalsche
Vollständigkeit. Andreas Schmitt. Ausarbeitung zum Proseminar zur Topologie im WS 2012/13
Vollständigkeit Andreas Schmitt Ausarbeitung zum Proseminar zur Topologie im WS 2012/13 1 Einleitung Bei der Konvergenz von Folgen im Raum der reellen Zahlen R trifft man schnell auf den Begriff der Cauchy-Folge.
Mathematik II für Studierende der Informatik (Analysis und lineare Algebra) im Sommersemester 2018
(Analysis und lineare Algebra) im Sommersemester 2018 2. Juli 2018 1/1 Wir geben einige wesentliche Sätze über bestimmte Integrale an, deren Beweise man in den Standardlehrbüchern der Analysis findet.
30 Metriken und Normen
31 Metriken und Normen 153 30 Metriken und Normen Lernziele: Konzepte: Metriken, Normen, Skalarprodukte, Konvergenz von Folgen Frage: Versuchen Sie, möglichst viele verschiedene Konvergenzbegriffe für
Universität Stuttgart Fakultät Mathematik und Physik Institut für Analysis, Dynamik und Modellierung. Lösungen zur Probeklausur 2.
Adµ Universität Stuttgart Fakultät Mathematik und Physik Institut für Analysis, Dynamik und Modellierung Blatt Probeklausur 2 Lösungen zur Probeklausur 2 Aufgabe 1 1. Formulieren Sie den Satz von Taylor
Karlsruher Institut für Technologie (KIT) SS 2013 Institut für Analysis Prof. Dr. Tobias Lamm Dr. Patrick Breuning
Karlsruher Institut für Technologie KIT SS 2013 Institut für Analysis 06.05.2013 Prof. Dr. Tobias Lamm Dr. Patrick Breuning Höhere Mathematik II für die Fachrichtung Physik 4. Übungsblatt Aufgabe 1 Bestimmen
ist reelles lineares Funktional. x(t) ϕ(t) dt ist reelles lineares Funktional für alle ϕ L 2 (0, 1).
Kapitel 4 Stetige lineare Funktionale 4.1 Der Satz von Hahn - Banach Definition 4.1. Sei X ein linearer normierter Raum über dem Körper K (R oder C). Ein linearer Operator f : X K heißt (reelles oder komplexes)
x, y 2 f(x)g(x) dµ(x). Es ist leicht nachzuprüfen, dass die x 2 setzen. Dann liefert (5.1) n=1 x ny n bzw. f, g = Ω
5. Hilberträume Definition 5.1. Sei H ein komplexer Vektorraum. Eine Abbildung, : H H C heißt Skalarprodukt (oder inneres Produkt) auf H, wenn für alle x, y, z H, α C 1) x, x 0 und x, x = 0 x = 0; ) x,
Kapitel L. Gewöhnliche Differentialgleichungen
Kapitel L Gewöhnliche Differentialgleichungen Inhalt dieses Kapitels L000 1 Erste Beispiele von Differentialgleichungen 2 Exakte Differentialgleichungen 3 Fazit: Existenz, Eindeutigkeit, Lösungsmethoden
Probeklausur zur Analysis 2, SoSe 2017
BERGISCHE UNIVERSITÄT WUPPERTAL 21717 Fakultät 4 - Mathematik und Naturwissenschaften Prof N V Shcherbina Dr T P Pawlaschyk wwwkanauni-wuppertalde Probeklausur zur Analysis 2, SoSe 217 Hinweis Die Lösungen
Partielle Differentialgleichungen Kapitel 7
Partielle Differentialgleichungen Kapitel 7 Intermezzo zu Distributionen Die Physik hat der Mathematik die Dirac-δ-Funktion gebracht. Diese δ-funktion soll folgende Eigenschaften haben: n δ (x ϕ (x dx
sign: R R, sign(x) := 0 falls x = 0 1 falls x < 0 Diese ist im Punkt x 0 = 0 nicht stetig, denn etwa zu ε = 1 finden wir kein δ > 0
ANALYSIS FÜR PHYSIK UND VERWANDTE FÄCHER I 81 3. Stetigkeit 3.1. Stetigkeit. Im Folgenden sei D R eine beliebige nichtleere Teilmenge. Typischerweise wird D ein allgemeines Intervall sein, siehe Abschnitt
Nachklausur Analysis 2
Nachklausur Analysis 2. a) Wie ist der Grenzwert einer Folge in einem metrischen Raum definiert? Antwort: Se (a n ) n N eine Folge in dem metrischen Raum (M, d). Diese Folge besitzt den Grenzwert g M,
C7 Differentgleichungen (DG) C7.1 Definition, Existenz, Eindeutigkeit von Lösungen Motivation: z.b. Newton 2. Gesetz: Ort: Geschwindigkeit:
C7 Differentgleichungen (DG) C7.1 Definition, Existenz, Eindeutigkeit von Lösungen Motivation: z.b. Newton 2. Gesetz: (enthalten Ableitungen der gesuchten Funktionen) [Stoffgliederung im Skript für Kapitel
Formelsammlung Analysis I & II
Formelsammlung Analysis I & II Wichtige eindimensionale Integrale: { x s dx = s+ xs+ + C falls s log x + C falls s = exp(x dx = exp(x + C cos(x dx = sin(x + C sin(x dx = cos(x + C sinh(x dx = cosh(x +
Klausurenkurs zum Staatsexamen (WS 2016/17): Differential und Integralrechnung 3
Dr. Erwin Schörner Klausurenkurs zum Staatsexamen (WS 206/7): Differential und Integralrechnung 3 3. (Herbst 20, Thema 3, Aufgabe 2) Gegeben ist für m R die Funktion f m : ], 2π[ R; f m (x) = Folgende
