1 Umkehrfunktionen und implizite Funktionen

Mathematik für Physiker III WS 2012/2013 Freitag 211 $Id: implizittexv 18 2012/11/01 20:18:36 hk Exp $ $Id: lagrangetexv 13 2012/11/01 1:24:3 hk Exp hk $ 1 Umkehrfunktionen und implizite Funktionen 13 Der Satz über implizite Funktionen Am Ende der letzten Sitzung haben wir die Methode des impliziten Differenzierens zur Berechnung der Ableitung impliziter Funktionen also von Funktionen die durch eine Gleichung definiert sind beschrieben Wir hatten auch gesehen das es keinesfalls immer möglich ist eine beliebige Gleichung zur Definition einer impliziten Funktion zu verwenden oft muss man die Definition in einem geeigneten Sinne lokal interpretieren und selbst dies ist nicht immer möglich Der heute behandelte Satz über implizite Funktionen wird uns ein Kriterium bereitstellen das erlaubt zu sagen wann eine lokale Auflösung der Gleichung möglich ist Wir gehen dabei über die bisher behandelten Beispiele hinaus indem wir nicht nur zwei Variablen x y sondern beliebig viele betrachten und nicht nur eine Gleichung verwenden sondern gleich mehrere Haben wir etwa m 1 viele Gleichungen f 1 x 1 x n y 1 y m = 0 f m x 1 x n y 1 y m = 0 so sollte im Idealfall jede der m Gleichungen eine der Variablen y i festlegen und wir hoffen daher das wir y 1 y m zumindest lokal als Funktionen y 1 = g 1 x 1 x n y m = g m x 1 x n schreiben können Dass die rechte Seite unserer Gleichungen immer Null ist ist dabei keine echte Einschränkung durch eine kleine Umformung können wir eine allgemeine Gleichung immer auf diese Form bringen Um die Notation zu vereinfachen schreiben wir dann x = x 1 x n y = y 1 y m und f = f 1 f m und unsere Gleichung nimmt die Form fx y = 0 an Die gesuchte lokale Auflösung hat dann die Gestalt y = gx Die linke Seite f dieser Gleichung ist dann eine Funktion f : U R m definiert auf einer offenen Menge U R n+m Nehmen wir weiter an das die Funktion f differenzierbar ist so haben wir in jedem Punkt x y U eine Jacobi-Matrix f x y = Dfx y Dies ist eine m n+m-matrix deren Spalten von den partiellen Ableitungen 4-1

Mathematik für Physiker III WS 2012/2013 Freitag 211 nach den n + m Variablen x 1 x n y 1 y m gebildet werden Es stellt sich als zweckmäßig heraus diese Matrix in einen m n- und einen m m-block aufzuteilen dh wir schreiben Dfx y = D x fx y D y fx y mit i i D x fx y := x y und D y fx y := x y x j 1 i m1 j n y j 1 ij m Damit sind wir bereit den Satz über implizite Funktionen zu behandeln wie wir sehen werden ist dieser im wesentlichen nur eine weitere Umformulierung des Satzes über Umkehrfunktionen Satz 18 Der Satz über implizite Funktionen Seien n m N q N { } mit n m q 1 U R n+m offen und f : U R m eine q-fach stetig differenzierbare Funktion Weiter sei a b U mit fa b = 0 und det D y fa b 0 Dann gibt es offene Mengen V R n W R m mit a V b W und V W U so dass es für jedes x V genau ein gx W mit fx gx = 0 gibt Weiter gilt ga = b und die Funktion g ist wieder q-fach stetig differenzierbar mit für alle x V g x = D y fx gx 1 D x fx gx Beweis: Wir betrachten die q-fach stetig differenzierbare Hilfsfunktion Für alle x y U ist dann F x y = F : U R n+m ; x y x fx y 1 0 D x fx y D y fx y und insbesondere ist det F a b = det D y fa b 0 dh F a b ist invertierbar Nach der C q -Version des Umkehrsatzes Korollar 6 gibt es offene Mengen V 1 W 1 R n+m mit a b V 1 U so dass F V 1 : V 1 W 1 bijektiv mit q-fach stetig differenzierbarer Umkehrfunktion G : W 1 V 1 ist Nach Satz gilt dabei G p = F Gp 1 für jedes p W 1 Es ist a 0 = a fa b = F a b F V 1 = W 1 also existiert eine offene Menge V 2 R n mit a V 2 und V 2 {0} W 1 Bezeichnet pr : R n+m R m ; x y y die Projektion auf die zweite Komponente so erhalten wir die q-fach stetig differenzierbare Funktion g : V 2 R m ; x prgx 0 Weiter gibt es wegen a b V 1 offene Mengen V 3 R n mit a V 3 und W R m mit b W so dass V 3 W V 1 gilt Schließlich ist ga = prga 0 = prgf a b = pra b = b W also gibt es auch eine offene Menge V R n mit a V V 2 V 3 4-2

Mathematik für Physiker III WS 2012/2013 Freitag 211 und gv W Somit ist auch V W V 3 W V 1 U und wir haben die q-fach stetig differenzierbare Abbildung g := g V : V W Sei x V Wegen x V 2 ist x 0 W 1 also haben wir x y := Gx 0 V 1 U und es gilt x 0 = F x y = x fx y Hieraus folgen x = x und fx y = fx y = 0 Weiter ist y = prgx 0 = gx und somit ist fx gx = fx y = 0 Nun sei umgekehrt y W mit fx y = 0 gegeben Dann sind x y V W V 1 x gx V W V 1 und F x y = x fx y = x 0 = x fx gx = F x gx dh es gilt y = gx Auserdem haben wir Gx 0 = x gx eingesehen Es verbleibt nur noch die Aussage über die Ableitung von g einzusehen Sei wieder x V Mit der Kettenregel II 8Satz 17 folgt für jedes u R n die Gleichung g xu = prg x 0u 0 Beachten wir weiter G x 0 = F Gx 0 1 = F x gx 1 = = 1 0 D x fx gx D y fx gx 1 1 0 D y fx gx 1 D x fx gx D y fx gx 1 so folgt für jedes u R n weiter g 1 0 xu = pr D y fx gx 1 D x fx gx D y fx gx 1 Damit ist der Satz vollständig bewiesen u 0 = D y fx gx 1 D x fx gxu Im speziellen Fall einer Gleichung in zwei Unbekannten also n = m = 1 wird die Bedingung des Satzes zu / ya b 0 und die Ableitung der Auflösungsfunktion y = gx berechnet sich zu x y g x = x y x y Schauen wir uns dies einmal in den beiden obigen Beispielen an Die Gleichung x 2 +y 2 = r 2 wird beschrieben durch fx y = x 2 + y 2 r 2 mit x = 2x y = 2y Die Determinantenbedingung ist also für y 0 erfüllt und die Ableitung von y nach x wird y x = 2x/2yx = x/yx wie wir schon oben gerechnet haben Für die Gleichung fx y := e 2x 3y + 3x y! = 0 4-3

Mathematik für Physiker III WS 2012/2013 Freitag 211 haben wir x = 2e2x 3y + 3 y = 3e2x 3y < 0 diese Gleichung ist also überall lokal nach y auflösbar Als Ableitung von y nach x ergibt sich erneut die schon oben berechnete Formel Zum Abschluß dieses Kapitels wollen wir uns auch noch ein Beispiel zum Satz über implizite Funktionen in mehreren Variablen anschauen In diesem Beispiel haben wir m = 2 Gleichungen in n + m = Unbekannten x 1 x 2 x 3 y 1 y 2 und wir wollen nach den Variablen y 1 und y 2 auflösen Das betrachtete Gleichungssystem ist e y 1 + y 2 x 1 sin x 2 + x 2 3 = 2 y 1 x 1 2 + y 2 x 2 2 e x 3 = 1 wir haben also die unendlich oft differenzierbare Funktion f : R R 2 e ; x 1 x 2 x 3 y 1 y 2 y 1 + y 2 x 1 sin x 2 + x 2 3 2 y 1 x 1 2 + y 2 x 2 2 e x 3 1 Eine Lösung ist im Punkt a b = 1 0 0 0 1 Als Ableitungen erhalten wir D x fx y = D y fx y = y 2 cos x 2 2x 3 2y 1 x 1 2y 2 x 2 e x 3 e y 1 x 1 2y 1 x 1 2y 2 x 2 und in der Lösung x y = a b haben wir speziell D x fa b = 1 1 0 2 2 1 und D y fa b = 1 1 2 2 also det D y fa b = 4 0 Nach dem Satz über implizite Funktionen Satz 8 gibt es damit offene Mengen U R 3 mit 1 0 0 U V R 2 mit 0 1 V so dass es für jedes x U genau ein y = gx V mit fx y = 0 gibt Weiter ist g unendlich oft differenzierbar mit der Ableitung g x = D y x gx 1 D x fx gx für alle x U Betrachten wir speziell x = a = 1 0 0 so ist gx = ga = b = 0 1 und wir haben die Ableitung 1 1 g 1 0 0 = 2 2 1 1 1 0 2 2 1 = 1 2 1 4 2 1 1 1 0 2 2 1 = 1 4 0 0 1 4 4 1 4-4

Mathematik für Physiker III WS 2012/2013 Freitag 211 2 Extrema unter Nebenbedingungen In diesem Kapitel wollen wir die Rechentechniken zur Bestimmung lokaler und globaler Extremalwerte einer reellwertigen Funktion weiter ausbauen Wir wiederholen erst einmal alles was wir zu diesem Thema bereits aus dem vorigen Semester wissen Sind M eine Menge und f : M R eine reelle Funktion auf M so nennen wir einen Punkt x 0 M ein globales Maximum der Funktion f wenn fx 0 fx für alle x M gilt dh wenn fx 0 = sup{fx x M} gilt und ein globales Minimum der Funktion f wenn fx 0 fx für alle x M gilt dh wenn fx 0 = inf{fx x M} gilt Schließlich heißt x 0 ein globales Extremum von f wenn f ein globales Maximum oder ein globales Minimum von f ist Ist M nicht nur irgendeine Menge sondern eine Teilmenge M E eines normierten Raums E so können wir auch von lokalen Maxima und Minima der Funktion f sprechen Wir nennen x 0 M ein lokales Maximum von f wenn es ein ɛ > 0 mit fx 0 fx für alle x M mit x x 0 < ɛ gibt dh wenn x 0 ein globales Maximum der Einschränkung f B ɛ x 0 M ist Entsprechend wird ein lokales Minimum von f definiert und schließlich heißt x 0 ein lokales Extremum von f wenn x 0 ein lokales Maximum oder ein lokales Minimum von f ist Offenbar ist ein globales Maximum auch ein lokales Maximum und ein globales Minimum auch ein lokales Minimum aber nicht umgekehrt Nun sei M = U R n konkret eine offene Teilmenge des R n und f : U R n sei eine differenzierbare Funktion Die Grundbeobachtung zur Bestimmung lokaler Extrema ist dann der II 8Satz 24 x 0 U ist lokales Extremum von f = grad fx 0 = 0 Dieser Satz konnte durch eine einfache Beobachtung auf den eindimensionalen Fall zurückgeführt werden Hat die Funktion f in x 0 etwa ein lokales Maximum und ist v R n ein Vektor so hat auch die Funktion f v t := fx 0 +tv in t 0 = 0 ein lokales Maximum und wie wir aus dem eindimensionalen Fall wissen folgt hieraus f v0 = 0 dies wurde im ersten Semester etwa als I 14Lemma 8 behandelt Verwenden wir jetzt den Zusammenhang zwischen Ableitungen und Richtungsableitungen II 8Lemma 13c so ergibt sich weiter f x 0 v = v fx 0 = f v0 = 0 Damit ist f x 0 = 0 wie behauptet Punkte in denen der Gradient von f verschwindet nennt man auch die kritischen Punkte der Funktion f allerdings ist im allgemeinen nicht jeder kritische Punkt auch ein lokales Extremum Wie in II 86 beschrieben erhalten wir aus dem eben wiederholten Satz eine Methode zur Berechnung globaler Maxima und analog auch globaler Minima Gegeben seien eine offene Menge U R n eine differenzierbare Funktion f : U R n und eine abgeschlossene Teilmenge M R n mit M U Wir nehmen an dass f M überhaupt ein globales Maximum besitzt dass es also ein x 0 M mit fx 0 = 4-

Mathematik für Physiker III WS 2012/2013 Freitag 211 sup{fx x M} gibt Dies ist nach II 8Lemma 1d beispielsweise garantiert wenn die Menge M kompakt ist Ist jetzt x 0 M ein innerer Punkt von M so hat die Funktion f in x 0 insbesondere ein lokales Maximum und somit muss grad fx 0 = 0 gelten Andernfalls liegt x 0 M\M = M auf dem Rand der Menge M Bestimmen wir also alle kritischen Punkte x 1 x 2 von f im Inneren von M und zusätzlich das Maximum von f auf dem Rand M so müssen wir nur die Funktionswerte fx 1 fx 2 sowie das Randmaximum miteinander vergleichen und der größte dabei auftretende Wert ist das globale Maximum von f auf M Als ein kleines Beispiel hierzu schauen wir uns die Funktion f : R 2 R; x y x 2 y y 2 + 2x 2 + y an und wollen das globale Maximum auf dem Kreis M := B 1 0 bestimmen Dazu benötigen wir erst einmal die kritischen Punkte und rechnen x = 2xy + 4x = 2xy + 2 =! 0 y = x 2 2y + 1 =! 0 Dier erste Gleichung ergibt x = 0 oder y = 2 Setzen wir x = 0 in die zweite Gleichung ein so wird diese zu 1 2y = 0 also y = 1/2 und wir haben den kritischen Punkt p = 0 1/2 Setzen wir dagegen y = 2 ein so wird die zweite Gleichung zu x 2 + = 0 dies liefert also keinen weiteren kritischen Punkt Wir haben also einen eindeutigen kritischen Punkt und dieser liegt im Inneren von M mit dem Funktionswert f0 1/2 = 1/4 Es verbleibt die Betrachtung des Randes M Die Punkte auf M können wir als x = cos φ y = sin φ mit 0 φ 2π schreiben Dabei ist fcos φ sin φ = sin φ cos 2 φ sin 2 φ + 2 cos 2 φ + sin φ = sin 3 φ + 3 sin 2 φ 2 sin φ 2 und schreiben wir s := sin φ so wird dies zu fcos φ sin φ = s 3 + 3s 2 2s 2 Dabei ist s 1 und zur Berechnung des maximalen auftretenden Wertes bestimmen wir d ds s3 + 3s 2 2s 2 = 3s 2 + 6s 2 = 3 s 2 + 2s 2 3 mit den Nullstellen in s = 1 ± 1 + 2 3 = 1 ± 3 Wegen s 1 kommt nur s = / 3 1 in Frage mit dem Funktionswert 3 2 1 + 3 1 2 1 2 = 10 2 23033 3 3 3 3 3 4-6

Mathematik für Physiker III WS 2012/2013 Freitag 211 Die Funktionswerte an den Endpunkten s = ±1 sind dagegen 2 und 0 und damit ist max fx y = 10 2 xy M 3 3 und dieser Wert wird angenommen für sin φ = s = / 3 1 02910 Wegen 0 φ 2π ergeben sich für φ die zwei möglichen Werte φ 1 = arcsin / 3 1 und φ 2 = π φ 1 Die zugehörigen Werte des Cosinus sind cos φ 1 = 1 sin 2 φ 1 = 2 3 3 = 2 1 3 0967 und cos φ 2 = cosπ φ 1 = cos φ 1 Das globales Maximum wird also in ± 2 1 /3 1 3/3 angenommen Das globale Minimum ist dagegen min fx y = 2 xy M angenommen für sin φ = s = 1 also in φ = 3π/2 mit cos φ = 0 also im eindeutigen Punkt 0 1 Für die Bestimmung des globalen Maximums oder Minimums ist es nicht nötig zu entscheiden welche kritischen Stellen lokale Extrema von welchen Typ sind Will man dies aus irgendwelchen Gründen doch tun so nehmen wir weiter an das f sogar zweifach stetig differenzierbar ist Ist dann x 0 U ein kritischer Punkt so bilden wir die Hesse-Matrix H := 2 f 2 f x x 2 0 1 x 1 x n x 0 2 f x n x 1 x 0 2 f x x 2 0 1 Nach dem Schwarzschen Lemma II 9Lemma 2 ist H eine symmetrische n n-matrix Unter günstigen Umständen kann man dann an den Eigenwerten der Hesse-Matrix sehen ob die Funktion f im Punkt x 0 ein lokales Extremum hat genauer gilt nach II 9Satz H positiv definit = x 0 ist lokales Minimum H negativ definit = x 0 ist lokales Maximum H indefinit = x 0 ist kein lokales Extremum Beachte das hierdurch keinesfalls alle möglichen Fälle abgedeckt sind wenn keiner dieser drei Fälle vorliegt so muss man sich den jeweiligen Einzelfall anschauen Wir wollen als ein Beispiel einmal den kritischen Punkt p = 0 1/2 der Funktion f : R 2 R; x y x 2 y y 2 + 2x 2 + y 4-7

Mathematik für Physiker III WS 2012/2013 Freitag 211 untersuchen Wegen 2 f x = 2y + 1 2 f = 2 und 2 2 y2 ist die Hesse-Matrix in p gegeben als H = 3 0 0 2 f x y = 2 f y x = 2x Die Hesse-Matrix ist hier also indefinit und damit liegt in p kein lokales Extremum vor 4-8