5.1. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer Teilmenge A des R n nach R hat im Punkt a ein (strenges) globales Maximum, falls f( x ) f( a ) (bzw. f( x ) < f( a )) für alle x aus A gilt, und ein (strenges) globales Minimum, falls diese Ungleichungen mit "größer" statt "kleiner" erfüllt sind. Bei (strengen) lokalen Maxima oder Minima werden die jeweiligen Ungleichungen nur in einer möglicherweise sehr kleinen Umgebung von a verlangt. Wir studieren jetzt ein Beispiel für den zweidimensionalen Fall ( n = ) und entwickeln parallel dazu die allgemeinen Extremalkriterien. Beispiel 1: Durch Berg und Tal Das folgende Funktionsgebirge hat zwei Berge und zwei Täler: f ( x, y) = ( x y ) e ( ) Stellensuche Wie findet man die Stellen, wo Extrema liegen? Sofern das Extremum nicht auf dem Rand liegt, muß bei einer total differenzierbaren Funktion f die Ableitung f ( a ), erst recht jede Richtungsableitung und insbesondere jede partielle Ableitung an einer Extremalstelle a verschwinden. Denn der Gradient weist sonst in Richtung des größten Anstiegs, und im Falle eines Maximums kann man nicht mehr höher steigen; im Falle eines Minimums geht es in keiner Richtung abwärts, und der Gradient muß ebenfalls Null sein. Eine notwendige Bedingung für ein lokales Extremum einer differenzierbaren Funktion f in zwei Variablen an der Stelle a = (, y ) ist also x f x ( x, y ) = und f y ( x, y ) =. Punkte, in denen der Gradient verschwindet, nennt man stationäre Punkte (weil dort "nichts fließt").
Beispiel 1a: Stationäre Punkte im Gebirge Betrachten wir wieder die Funktion Partielle Ableitungen: f ( x, y ) = ( x y ) e ( ) f x = x e ( x y ) ( x y ) x e ( ) f y = y e ( x y ) ( x y ) y e ( ) Die Gleichungen f x = und f y = reduzieren sich unter Beachtung der Tatsache, daß e ( ) nie Null wird, auf die Gleichungen x ( 1 x + y ) = y ( 1 + x y ) = Als Lösungen finden wir die folgenden 5 stationären Punkte: (, ), (, 1), (, 1), ( 1, ), ( 1, ) und die zugehörigen Funktionswerte f (, ) =, f (, 1 ) = e ( -1 ), f (, -1 ) = e ( -1 ), f ( 1, ) = e ( -1 ), f (-1, ) = e ( -1 ) Flach- und Sattelpunkte In stationären Punkten müssen aber keineswegs (lokale) Extrema vorliegen, es können auch entweder sogenannte Flachpunkte oder Sattelpunkte sein. Woran erkennt man das? An der zweiten Ableitung, also der Hessematrix ( a ) = f ( a )! Ist f ( a) =, so spricht man von einem Flachpunkt. Liegt bei einem stationären Punkt weder ein lokales Extremum noch ein Flachpunkt vor, so handelt es sich um einen Sattelpunkt. (Genauer gesagt ist der jeweilige Punkt ( a, f( a )) ein Extremalpunkt, Flachpunkt oder Sattelpunkt der durch f beschriebenen Kurve, Fläche oder Hyperfläche.) Extremalkriterium Die Funktion f sei zweimal stetig differenzierbar. Ist f ( a) = und < f ( a ) (bzw. f ( a) < ), so hat f ein isoliertes, insbesondere strenges lokales Minimum (bzw. Maximum) bei a. Umgekehrt muß bei einem lokalen Minimum (bzw. Maximum) f ( a) = und f ( a ) (bzw. f ( a) ) erfüllt sein. Dieses aus der eindimensionalen Analysis bekannte Kriterium behält bei richtiger Interpretation auch für Funktionen in mehreren Variablen seine Gültigkeit. Dazu machen wir eine Sprung in die lineare Algebra.
Definite Matrizen Folgende Sprech- und Schreibweisen sind üblich: Eine symmetrische Matrix A heißt positiv definit, symbolisiert durch < A, falls < x T A x negativ definit, symbolisiert durch A <, falls x T A x < für alle x aus R n mit Ausnahme von x = gilt. Man nennt A positiv bzw. negativ semidefinit und schreibt A bzw. A, falls die entsprechenden Ungleichungen mit "kleiner oder gleich" statt "kleiner" gelten. In allen anderen Fällen bezeichnet man die Matrix A als indefinit. Welcher Fall jeweils eintritt, erkennt man z.b. an den Eigenwerten. Denn die Hauptachsentransformation symmetrischer Matrizen (3.8) liefert die Eigenwert-Charakterisierung definiter Matrizen Eine symmetrische Matrix A ist genau dann positiv (bzw. negativ) definit, wenn alle Eigenwerte positiv (bzw. negativ) sind. Analog ist A genau dann positiv (bzw. negativ) semidefinit, wenn kein Eigenwert von A negativ (bzw. positiv) ist. Statt < A schreibt man auch A > usw. und hat dann wörtlich das gleiche Extremalkriterium wie im Eindimensionalen - nur daß f ( a ) jetzt eine Matrix ist und f ( a ) > positive Definitheit bedeutet. Die Taylorapproximation. Grades reduziert sich nämlich im Falle von f ( a) = auf ( x a ) T f ( u ) ( x a) f( x ) = f( a) +. Falls nun f ( a ) positiv definit und f stetig ist, gilt auch noch ( x a ) T f ( u ) ( x a) >, also f( x ) < f( a ) für alle x und u in einer geeigneten Umgebung von a. Analog für negativ definites f ( a ). Für den Fall n = können wir die Definitheit einer symmetrischen Matrix A = a 1 a 1 a sehr einfach charakterisieren: A ist genau dann positiv (bzw. negativ) definit, wenn d = det( A ) = a a 1 > und a11 > (bzw. < ) gilt. Somit ergibt eine gute Mischung aus Analysis und linearer Algebra den folgenden Extremaltest für zweimal stetig differenzierbare Funktionen f von einer offenen Teilmenge der Ebene R nach R: Man betrachtet in der Hessematrix den linken oberen Koeffizienten k := f xx
und die Determinante d := f xx f yy f xy f yx ( mit f xy = f yx!) beide in dem stationären Punkt a mit f ( a) =. Die Funktion f hat bei a im Falle < k und < d ein strenges lokales Minimum (konvex elliptischer Punkt) k < und < d ein strenges lokales Maximum (konkav elliptischer Punkt) d < einen Sattelpunkt (hyperbolischer Punkt) und d = ein lokales, nicht strenges Extremum (parabolischer Punkt) = einen Flachpunkt. Beispiele zu elliptischen, hyperbolischen und parabolischen Punkten findet man in Abschnitt 5.6A. Bei Flachpunkten ist die Sache komplizierter, dort können immer noch sowohl Extrema als auch Sattelpunkte vorliegen. Eventuell hat man dann mit höheren Ableitungen zu arbeiten. Wir behandeln ein spezielles Beispiel in Abschnitt 5.1A. Nicht vergessen: Randpunkte muß man gesondert behandeln! Extrema auf dem Rand werden durch das obige Verfahren nicht erfaßt! Wir testen unser Beispiel "durch Berg und Tal". f ( x, y) = ( x y ) e ( ) f x = 4 x e ( x y ) 4 ( x y ) x e ( x y ), f y = 4 y e ( x y ) 4 ( x y ) y e ( ) f xx = 4 e ( x y ) 16 x e ( x y ) 4 ( x y ) e ( x y ) + 8 ( x y ) x e ( ) f yy = 4 e ( x y ) 16 x e ( x y ) 4 ( x y ) e ( x y ) + 8 ( x y ) x e ( ) x y f xy = 8 ( x y ) y x e ( ), f yx = 8 ( x y ) y x e ( ) (, 1) (, -1) 4 (, ) = 4 = 8 e (-1 ), 8 e (-1 ) H ( ) = f 1, 8 e (-1 ) 8 e ( -1 ) = 8 e (-1 ), 8 e (-1 ) H ( ) = f -1, 8 e (-1 ) 8 e ( -1 ) a = (, ), f (, ) =, k = 4, d = -16 a 1 = (, 1 ), f (, 1 ) = e ( -1 ), k = 8 e (-1 ), d = 64 e ( - ) a = (, -1), f (, -1 ) = e ( -1 ), k = 8 e (-1 ), d = 64 e (- ) a 3 = ( 1, ), f ( 1, ) = e ( -1 ), k = 8 e (-1 ), d = 64 e ( - ) a 4 = ( -1, ), f (-1, ) = e ( -1 ), k = 8 e (-1 ), d = 64 e (- )
Unser Extremaltest sagt: Sattelpunkt bei a, strenge Minima bei a 1 und a, strenge Maxima bei a 3 und a 4. Da die Funktion nach außen gegen konvergiert, handelt es sich um globale Maxima und Minima. s1 := e ( -1 ) + 4 e (-1 ) x + 4 ( y 1) e ( -1 ) s := e ( -1 ) + 4 e (-1 ) x + 4 ( y + 1) e ( -1 ) s3 := e (-1 ) 4 e ( -1 ) ( x 1 ) 4 y e (-1 ) s4 := e (-1 ) 4 e ( -1 ) ( x + 1 ) 4 y e (-1 ) Beispiel : Flying Mantas Bei den folgenden Funktionen ist p ein Parameter (also eine dritte Variable). m ( x, y, p ) = x 3 + y 3 p ( x y + 5 p) Hier ist nicht so ohne Weiteres zu erkennen, wo lokale Extrema liegen (und ob es solche überhaupt gibt). Wir bilden die partiellen Ableitungen:
Das Gleichungssystem m x ( x, y, p ) = 3 x p y m y ( x, y, p ) = 3 y p x 3 x p y =, 3 y p x = erzwingt wegen p ( x y ) = die Gleichheit x = y und hat daher als Lösungen die stationären Punkte (, ) mit m (,, p) = 5 p und p (, 3 p 3 ) mit p p m,, 3 3 p = 7 5 p. Nun wieder der Extremaltest: p 3 Sattelpunkt bei (,)! k = 6 x d = 36 x y 5 a = (, ), m (,, p ) = -115, k =, d = -5 1 a 1 = ( 5, 5 ), m, =,, 3 p 1 3 p -15 k = 3 d = 675 p p Lokales Minimum bei (, 3 3 ), sofern < p, lokales Maximum, falls p <. Wir zeichnen die Fälle p = 15 und p = 15:
Manta, mit einer Kugel auf den relativen Extrema jonglierend
Die Bezeichnung "Sattelpunkt" wird in der Literatur nicht einheitlich gebraucht, manchmal wird auch bei Flachpunkten von Sattelpunkten gesprochen. Das ist nicht unvernünftig, wie das folgende kuriose Beispiel zeigt:: Beispiel 3: Der Affensattel wird durch den Imaginärteil (oder alternativ durch den Realteil) der komplexen Funktion z 3 beschrieben. Mit z = x + i y ist ( x + i y ) 3 = x 3 3 x y + i ( 3 x y y 3 ). Eine kurze Rechnung ergibt die zweite Ableitung f ( x, y ) = 6 y 6 x 6 x 6 y. Das Funktionsgebirge hat demnach im Nullpunkt einen Flachpunkt (also keinen Sattelpunkt im engeren Sinn!), während alle anderen Punkte hyperbolisch sind. Bei einer vollen Umdrehung durchläuft man drei Berge und drei Täler: Der Affensattel hat drei "Senken", zwei für die Beine und einen für den Schwanz.
Im Wesentlichen wie im Eindimensionalen gilt auch in höheren Dimensionen das Konvexitätskriterium Eine auf einer konvexen offenen Menge U zweimal stetig differenzierbare Funktion f ist genau dann konvex, wenn die zweite Ableitung positiv semidefinit ist. Ist sie sogar überall positiv definit, so liegt eine streng konvexe Funktion vor. Anhang: Satz über definite x-matrizen A ist genau dann positiv (bzw. negativ) definit, wenn d = det( A ) = Beweis 1: Durch Transformation mit der Matrix a a 1 > und a11 > (bzw. < ) gilt. ergibt sich die Matrix B = 1 a 1 a B A B T = 11 ( a 1 + a ) die genau dann positiv bzw. negativ definit ist, wenn das Entsprechende für A zutrifft (warum?). Die Diagonalelemente der Matrix B A B T haben aber genau dann beide das gleiche Vorzeichen wie, wenn d = a 1 > gilt. Beweis : Eine ganz andere Argumentation ist die folgende: Beide Eigenwerte von A sind genau dann positiv, wenn sowohl ihre Summe als auch ihr Produkt positiv ist. Nun ist die Summe aber bekanntermaßen die Spur + a und das Produkt ist die Determinante d = a a 1. Also folgt aus d > und >, daß beide Eigenwerte positiv sind, und umgekehrt (wäre so wäre a > wegen < + a, und dann d = a a 1 Die Aussage über negative Definitheit erhält man, indem man A durch A ersetzt. ).,