AM3: Differenzial- und Integralrechnung im R n. 1 Begriffe. 2 Norm, Konvergenz und Stetigkeit. x 1. x 2. f : x n. aus Platzgründen schreibt man:

AM3: Differenzial- und Integralrechnung im R n 1 Begriffe f : x 1 f 1 x 1, x 2,..., x n ) x 2... f 2 x 1, x 2,..., x n )... x n f m x 1, x 2,..., x n ) }{{}}{{} R n R m aus Platzgründen schreibt man: f j x 1, x 2,..., x n ) statt f j x 2... oder f jx 1,..., x n ) T ) x n x 1 Beispiel x 1 + 2x 2 fx 1, x 2 ) = x 2 1 1 + x 1 x 2 f : R 2 R 3 f 2 x 1, x 2 ) = x 2 1 Grundregel Eine vektorwertige Funktion Vektorfunktion) hat eine bestimmte Eigenschaft X, wenn alle ihre Komponenten diese Eigenschaft haben. 2 Norm, Konvergenz und Stetigkeit Norm Eine Norm auf R n ist eine Funktion : R n R + 0, die für alle x, y R n und alle λ R die folgenden Eigenschaften besitzt: a) x = 0 x = 0 b) λ x = λ x c) x + y x + y Dreiecksungleichung) 1

Beispiele von Normen x 2 def = 2 x 2 1 + + x 2 n x 1 def = x 1 + + x n x def = max{ x 1,..., x n } Einheitssphären S 2 = { x R n : x 2 = 1 } S 1 = { x R n : x 1 = 1 } S = { x R n : x = 1 } y x Bemerkung Die oben genannten Normen sind in einem bestimmten Sinne gleichwertig. Daher spielt es keine Rolle, welche man als Mass für die Länge der Vektoren verwendet. Falls nötig, verwenden wir die 2 -Norm. ε-umgebung Für ε > 0 und a R n ist die Menge U ε a) = { x R n : x a < ε} eine ε-umgebung von a. Offene Menge Eine Menge M R n heisst offen, wenn es für jedes a M eine ε-umgebung U ε a) gibt, die Teilmenge von M ist. Abgeschlossene Menge Eine Menge M R n heisst abgeschlossen, wenn M c = R \ M offen ist. 2

Rand einer Menge Ein Punkt a M R n heisst Randpunkt von M, wenn für jede ε-umgebung U ε a) die Schnittmenge mit M und M c nicht leer ist. Konvergenz Eine Folge x n ) in R n ist konvergent mit Grenzwert a, wenn lim x n a = 0 n Beispiel 1 + 1/n Die Folge x n ) mit x n = 3 1/n 2 e n 1 konvergiert im R 3 gegen a = 3. 0 Beweis: 1 + n 1 1 lim n 3 n 2 3 e n 0 = lim n 1 n n 2 e n = 0 0 0 = 0 Stetigkeit Eine vektorwertige Funktion f : R n R m heisst stetig an der Stelle a R n, wenn für jede Folge, x n, die in R n gegen a konvergiert, die Folge der Funktionswerte f x n ) gegen f a) konvergiert. oder: Folge x n ) mit x n a 0 folgt, dass f x n ) f a) 0 Ein Funktion ist auf ihrem Definitionsbereich D R n stetig, wenn sie an jeder Stelle x D stetig ist. [Bild] 3

Hilfssatz Für x, y R gilt: xy 1 2 x2 + y 2 ) Beweis: x y) 2 = x 2 2xy + y 2 2xy + x y) 2 = x 2 + y 2 2xy x 2 + y 2 1) x + y) 2 = y 2 + 2xy + x 2 x 2 + y 2 ) = 2xy x + y) 2 x 2 + y 2 ) 2xy 2) Aus 1) und 2) folgt: x 2 + y 2 ) 2xy x 2 + y 2 und daraus: 2 xy x 2 + y 2 bzw. xy 1 2 x2 + y 2 ) Beispiel Zeige, dass die reellwertige Funktion x 2 y für x, y) 0, 0) fx, y) = x 2 + y 2 0 für x, y) = 0, 0) auf ganz R 2 stetig ist. Beweis: Für x, y) 0, 0) ist f stetig, da alle Operationen in Ist x, y) eine Folge in R 2 mit x, y) 0, 0), so gilt: fx, y) f0, 0) = x 2 y x xy x 2 + y 2 = x 2 + y 2 x x2 + y 2 ) 2x 2 + y 2 ) x 2 0 Also konvergiert fx, y) gegen 0, 0) und ist somit dort stetig. x 2 y stetig sind. x 2 + y2 4

Beispiel Zeige, dass die reellwertige Funktion xy 2 für x, y) 0, 0) fx, y) = x 2 + y 4 0 für x, y) = 0, 0) in 0, 0) nicht stetig ist. Beweis: Mit der geschickt gewählten Folge 1 x, y) = n, 1 ) gilt: 2 n fx, y) f0, 0) = 1/n 2 1/n 2 1/n 4 + 1/n 0 4 = 1/n 4 2/n 4 = 1 2 Also gibt es eine Folge x, y) mit x, y) 0, 0), für die fx, y) nicht gegen f0, 0) = 0 konvergiert. 5

3 Differenzierbarkeit Generalvoraussetzungen M R n a M ist innerer Punkt. d. h. es existiert eine Umgebung U von a mit U M.) f : M R oder f : M R m 3.1 Partielle Differenzierbarkeit Definition f : M R ist in a = a 1, a 2,..., a n ) T nach der Variablen x i partiell differenzierbar, wenn die Funktion t fa 1,..., a i 1, t, a i+1,..., a n ) nach t differenzierbar ist. Die partielle Ableitung wird mit f x i oder D i f oder f xi bezeichnet. Gradient Der Zeilenvektor aller partieller Ableitungen grad f = D 1 f, D 2 f,..., D n f) wird Gradient von f genannt. Höhere partielle Ableitungen zweite partielle Ableitung: D j D i f = f = x j x i dritte partielle Ableitung: 2 f x j x i = f xi x j D k D j D i f = x k f = x j x i 3 f x k x j x i 6

Beispiel fx, y) = xy + x 2 y 2 f x = y + 2x f y = x 2y grad f = y + 2x, x 2y) f xy = 1 f yx = 1 f xx = 2 f yy = 2 geometrische Deutung Für M R 2, f : M R entspricht die partiellen Ableitung f x bzw. f y an der Stelle a M der Steigungen der Tangente in x-richtung bzw. y-richtung. 3.2 Totale Differenzierbarkeit Eine Funktion f : M R m ist total vollständig) differenzierbar in a, falls es eine Matrix A R m n und eine Funktion r : R n R m gibt mit wobei lim x a r x a) x a = 0. f x) = f a) + A x a) + r x a) 7

A wird dargestellt durch die Matrix der partiellen Ableitungen aller Komponenten von f und heisst Jacobimatrix oder Funktionalmatrix: f 1 f 1 f 1... x 1 x 2 x n grad f 1 f 2 f 2 f 2... Df = x 1 x 2 x n grad f 2 =..... f m f m f m grad f... m x 1 x 2 x n 3.3 Richtungsableitung Die Richtungsableitung einer Funktion f : R n R m im Punkt a in Richtung von v ist definiert durch f a + t v) f a) D v f a) = lim t 0 t falls dieser Grenzwert existiert. Ist v der i-te Koordianteneinheitsvektor e i, so ist die Richtigungsableitung die i-te partielle Ableitung. Bemerkung 3.1 Ist eine Funktion total differenzierbar, so ist sie auch partiell differenzierbar. Die Umkehrung gilt nur unter bestimmten Voraussetzungen: Ist f in einer Umgebung des Punktes a nach allen Variablen partiell differenzierbar und sind die partiellen Ableitungen stetig in a, so ist f in a total differenzierbar. Bemerkung 3.2 Für f : M R gibt der Gradient grad f a) die Richtung der grössten Steigung von f in a an. Beispiel: fx, y) = x 2 + y 2 + 2xy + 3; a = 1, 2) T grad f = 2x + 2y, 2y + 2x) grad f1, 2) = 6, 6) Bemerkung 3.3 Ist f differenzierbar, lässt sich die Richtungsableitung mit Hilfe der totalen Ableitung berechnen. Beispiel: Richungsableitung von fx, y) = x 2 y 2 in a = 1, 2) T in Richtung v = 3, 1) T grad f = 2x, 2y) D v = grad f v = 2x, 2y) D v 1, 2) = 6 1 2 2 = 2 ) 3 = 6x 2y 1 8

Alternative Darstellung der totalen Ableitung Eine Funktion f : M R m ist total vollständig) differenzierbar in x, falls es eine Matrix A R m n und eine Funktion r : R n R m gibt mit r v) wobei lim v 0 v = 0. f x + v) = f x) + A v + r v) 9

4 Verallgemeinerte Kettenregel Satz 4.1 Sind die Abbildungen g : R n R k im Punkt a R n und f : R k R m im Punkt ga) R k differenzierbar, so ist auch die Verkettung f g : R n R m im Punkt a differenzierbar, und es gilt D f g a) = D f ga)) D g a). Beispiel 4.1 fx, y, z) = x 2 y + 2yz [f : R 3 R] s gs, t) = s + t [g : R 2 R 3 ] t 2 f g)s, t) = s 2 s + t) + 2s + t)t 2 [f g): R 2 R] 10

5 Die Taylor-Formel im Mehrdimensionalen Zur Erinnerung Ist fx) eine Funktion in einer Veränderlichen mit stetigen Ableitungen f x), f x),..., f n) x), f n+1) x) in einem abgeschlossenen Intervall [α, β], dann lautet die Taylor-Formel für die Entwicklungsstelle a = 0: fx) = f0) + xf 0) + x2 2! f 0) + + xn n! f n) 0) + R n wobei R n = xn+1 n + 1)! f n+1) ξ) das Restglied an einer geeigneten Stelle 0 < ξ < x ist. Sei f : R d R eine reellwertige Funktion mit d Veränderlichen x = x 1,..., x d ) T. Ferner sei g die Funktion, die jeder reellen Zahl t R einen Punkt P R d auf der Geraden durch den Punkt A in der Richtung v zuordnet: a 1 + tv 1 x 1 t) gt) = r A + t v =. =.. a d + tv d x d t) Für die Verkettung F t) = f g)t) gilt: F : R R. Somit können wir den Satz von Taylor auf die Funktion F in einer Variablen anwenden: wobei R n = F t) = F 0) + tf 0) + t2 2! F 0) + + tn n! F n) 0) + R n 1) tn+1 n + 1)! F n+1) τ) mit 0 < τ < t. Berechnung von F j) : F 0) = F a + 0 v ) = F a ) Der Übersicht wegen beschränken wir uns auf d = 2. F t) = d F t) d t = d fgt)) d t f x) = + f x) ) d x 1 t) d t x 1 x 2 d x 2 t) d t f x) = + f x) ) ) v1 x 1 x 2 v 2 ) = v 1 + v 2 f x) x 1 x }{{ 2 } Operator = v 1 f x) x 1 11 + v 2 f x) x 2

F t) = d F t) = d ) f x) f x) v 1 + v 2 d t d t x 1 x 2 ) ) d f x) d f x) = v 1 + v 2 d t x 1 d t x 2 ) ) 2 f x) = v 1 + 2 f x) v1 x 1 x 1 x 2 x 1 v 2 ) ) 2 f x) + v 2 + 2 f x) v1 x 1 x 2 x 2 x 2 v 2 = v 1 v 1 2 f x) x 1 x 1 + v 1 v 2 2 f x) x 2 x 1 + v 2 v 1 2 f x) x 1 x 2 + v 2 v 2 2 f x) x 2 x 2 = v 1 v 1 2 f x) x 1 x 1 + 2v 1 v 2 2 f x) x 2 x 1 + v 2 v 2 2 f x) x 2 x 2 Der letzte Term lässt sich kürzer in der Operator-Schreibweise darstellen: ) F t) = v 2 2 2 1 v 1 + 2v 1 v 2 + v 2 v 2 f x) x 1 x 1 x 2 x 1 x 2 x 2 ) ) = v 1 + v 2 v 1 + v 2 f x) x 1 x 2 x 1 x 2 ) 2 = v 1 + v 2 f x) x 1 x 2 wobei das Quadrat das zweimalige Ausführen des Operators symbolisiert. Analog: F 3) t) = F 4) t) = usw. Beachte: v 1 v 1 ) 3 + v 2 f x) x 1 x 2 ) 4 + v 2 f x) x 1 x 2 Die Operator-Schreibweise kaschiert, dass für die Berechnung aller partiellen Ableitungen viel Arbeit nötig ist. Sind alle n-ten Ableitungen stetig, so besagt der Satz von Schwarz, dass die n-te partielle Ableitung unabhängig von der Ableitungsreihenfolge ist. Beispiel: f xxy = f xyx = f yxx 12

Einsetzen der Ableitungen von F t) für t = 0 in Gleichung 1): ) f a + t v) = f a) + t v 1 + + v d f x) x 1 x d + t2 2! +... + tn n! v 1 v 1 = tn+1 n + 1)! ) 2 + + v d f x) x 1 x d x= a x= a ) n + + v d f x) x 1 x d x= a ) n+1 v 1 + + v d f x) x 1 x d mit 0 < τ < 1. Für t = 1 folgt daraus: x= a+τ v Der Satz von Taylor Ist f : R n R eine n + 1)-mal stetig differenzierbare Funktion, so gilt für a, v R n : ) f a + v) = f a) + v 1 + + v d f x) x 1 x d + 1 2! +... + 1 n! + R n v 1 v 1 ) 2 + + v d f x) x 1 x d x= a ) n + + v d f x) x 1 x d x= a x= a mit dem Restglied ) n+1 1 R n = v 1 + + v d f x) n + 1)! x 1 x d x= a+τ v für 0 < τ < 1. 13

Beispiel 5.1 Stelle die Funktion fx, y) = e x2 y 2 vom Grad 2 dar. in einer Umgebung von 0, 0) als Taylorpolynom f x x, y) = 2xe x2 y 2 f y x, y) = 2ye x2 y 2 f xx x, y) = 2 + 4x 2 )e x2 y 2 f xy x, y) = 4xye x2 y 2 = f yx f yy x, y) = 2 + 4y 2 )e x2 y 2 Koeffizienten: f0, 0) = 1 f x 0, 0) = 0 f y 0, 0) = 0 f xx 0, 0) = 2 f xy 0, 0) = 0 f yy 0, 0) = 2 Sind x und y kleine Änderungen in x- bzw. y-richtung: 1 1/0! = 1 x y 1/1! = 1 x 2 2xy y 2 1/2! = 0.5 Also: e x2 y 2 1 x 2 y 2 14

6 Extremwerte Der Satz vom Minimum und Maximum Ist f : R n R stetig auf einer abgeschlossenen und beschränkten Menge D R n, dann hat f ein Maximum und ein Minimum; d. h. es gibt Punkte A und B in D, so dass fa) fp ) fb) für alle P D. Bemerkung: Im R n wird eine abgeschlossene und beschränkte Menge auch kompakt genannt. Beispiel 6.1 z = fx, y) = 4 x 2 y 2 2 2 2 z y 2 x 2 D = {x, y): x 2 + y 2 4} ist abgeschlossen und beschränkt. f ist stetig auf D. Also gibt es ein Minimum z = 0) und ein Maximum z = 2). Definition Es sei U eine Teilmenge des Definitionsbereichs einer Funktion f. f hat in x 0 U ein lokales Minimum, wenn für alle x U gilt: fx 0 ) fx) Der Punkt x 0, fx 0 )) heisst dann Tiefpunkt. f hat in x 0 U ein lokales Maximum, wenn für alle x U gilt: fx 0 ) fx) Der Punkt x 0, fx 0 )) heisst dann Hochpunkt. Definition a 1,..., a n ) ist kritischer Punkt von f : R n R, wenn grad fa 1,..., a n ) = 0. Ein kritischer Punkt ist entweder... ein lokales) Minimum oder ein lokales) Maximum oder ein Sattelpunkt 15

Beispiel 6.2 P 0, 0) ist kritischer Punkt der Funktion f mit fx, y): z = x 2 + y 2 + 1 z x y 0, 0, 1) ist Tiefpunkt f0, 0) = 1 ist globales) Minimum Beispiel 6.3 P 0, 0) ist kritischer Punkt der Funktion fx, y): z = 1 x 2 y 2 z x y 0, 0, 1) ist Hochpunkt f0, 0) = 1 ist globales) Maximum Beispiel 6.4 P 0, 0) ist kritischer Punkt der Funktion fx, y): z = 1 y 2 + x 2 z x y 0, 0, 1) ist Sattelpunkt 16

Beispiel 6.5 P 0, 0) ist kritischer Punkt der Funktion fx, y): z = 1 + y 2 z x y 0, 0, 1) ist degenerierter) Tiefpunkt f0, 0) = 1 ist degeneriertes) Minimum Vorsicht Die kritischen Punkte sind nicht die einzigen Punkte, die als Extrempunkte in Frage kommen. Extrema können auch auf willkürlich definierten) Rändern oder im Unendlichen auftreten. fx, y) = e x+2)2 y 2 + 0.6e x 2)2 y 2 z x y Beispiel 6.6 fx, y) = x 2 2xy + 3y 2 1 Lösung mit quadratischer Ergänzung: fx, y) = x 2 2xy + y 2 y 2 + 3y 2 1 = x y) 2 + 2y 2 1 }{{}}{{} 0 0 f hat das Minimum 1 für x, y) = 0, 0) 17

Beispiel 6.7 fx, y) = xy + 1 x + 1 y f x x, y) = y x 2 f y x, y) = x y 2 y x 2 = 0 x y 2 = 0 x2 y = 1 xy 2 = 1 x4 y 2 = 1 1) xy 2 = 1 2) 1)/2): x 3 = 1 x = 1, y = 1 kritischer Punkt: P 1, 1) zweite Ableitungen: f xx = = 2/x 3 f xy = 1 f yy = = 2/y 3 Taylor-Formel: fx, y) f1, 1) + f x 1, 1)x 1) + f y 1, 1)y 1) + 1 2 f xx1, 1)x 1) 2 + 1 2 f xy1, 1)x 1)y 1) + 1 2 f yx1, 1)y 1)x 1) + 1 2 f yy1, 1)y 1) 2 mit f xx 1, 1) = 2, f xy 1, 1) = 1, f yy 1, 1) = 2: fx, y) = 3 + 1 [ x 1) 2 + 2x 1)y 1) + y 1) 2] 2 Quadratische Formen Die oben auftretenden Polynome haben aufgrund der Taylor-Entwicklung die gleiche Struktur: ax 2 + 2bxy + y 2 für x, y) R 2 ax 2 + 2bxy + 2cxz + dy 2 + 2eyz + fz 2 für x, y, z) R 3 usw. Ein Polynom, dessen Monome alle den gleichen Grad haben, wird homogen genannt. 18

Ein homogenes Polynom vom Grad 2 heisst quadratische Form. Quadratische Formen lassen sich durch ein zweifaches Matrizenprodukt ausdrücken, wobei die zentrale quadratische Matrix H symmetrisch ist: ax 2 + 2bxy + y 2 = x y ) T ) a b b c }{{} H ) x y Die Matrix A enthält in unserem Fall die Werte der zweiten partiellen Ableitungen f xx a, b), f xy a, b), f yx a, b) und f yy a, b), wobei die die Identität der gemischten Ableitungen zur Symmetrie von H führt. Diese Matrix H wird Hesse-Matrix genannt. Um den Typ des kritischen Punktes zu bestimmen, wäre es hilfreich, wenn wir anhand der Hesse-Matrix H erkennen könnten, ob die quadratische Form für alle x, y) 0, 0) nur positive nur negative sowohl positive als auch negative Werte hat. Definition Eine n n)-matrix A heisst positiv definit, falls x T Ax > 0 x R n \ {0} positiv semidefinit, falls x T Ax 0 x R n \ {0} negativ definit, falls x T Ax < 0 x R n \ {0} negativ semidefinit, falls x T Ax 0 x R n \ {0} In allen anderen Fällen heisst A indefinit. Definitheit und Eigenwerte Der folgende Satz aus der linearen Algebra hilft uns etwas weiter: Eine n n)-matrix A ist positiv definit, wenn A nur Eigenwerte λ i > 0 hat, positiv semidefinit, wenn A nur Eigenwerte λ i 0 hat, negativ definit, wenn A nur Eigenwerte λ i < 0 hat, negativ semidefinit, wenn A nur Eigenwerte λ i 0 hat, 19

Der folgende Satz garantiert, dass wir keine komplexen Eigenwerte erhalten: Alle Eigenwerte einer symmetrischen n n)-matrix sind reell. Da die Berechnung von Eigenwerten aufwändig ist, verwenden wir das Hurwitz-Kriterium, mit dem wir die Definitheit der Matrix A anhand der Determinanten aller quadratischen Teilmatrizen bestimmen können. a 11 a 12 a 13... a 1n a 21 a 22 a 23... a 2n A = a 31 a 32 a 33... a 3n....... a n1 a n2 a n3... a nn ) Sind D 1 = deta 11 ), D 2 = det a 11 a 12 a 21 a 22,..., D n = det A die Determinanten aller quadratischen Untermatrizen von A, so gilt: positiv definit, wenn D i > 0 für alle 1 i n positiv semidefinit, wenn D i 0 für alle 1 i n negativ definit, wenn 1) k D i > 0 für alle 1 i n negativ semidefinit, wenn 1) k D i 0 für alle 1 i n Damit lässt sich Beispiel 6.7 fertig lösen: ) 2 1 Hesse-Matrix: H = 1 2 D 1 = det2) > 0 ) 2 1 D 2 = det = 2 2 1 1 = 3 > 0 1 2 H ist positiv definit die quadratische Form hat nur positive Werte f1, 1) = 3 ist ein Miniumum 20

Übersicht Minima positiv definit Maxima negativ definit positiv semidefinit positiv semidefinit negativ semidefinit negativ semidefinit indefinit Sattelpunkte Bemerkungen Ist die Hesse-Matrix die Nullmatrix, und irgend eine der dritten Ableitungen ungleich null, so liegt ein Sattelpunkt vor. Kann man mit diesen Kriterien keine Entscheidung über den Typ des kritischen Punktes herbeiführen, so muss man auf andere Methoden zurückgreifen. 21