Fakultät für Luft- und Raumfahrttechnik Institut für Mathematik und Rechneranwendung Universität der Bundeswehr München Höhere Mathematik II (Beilagen) Univ. Prof. Dr. sc. math. Kurt Marti 2 2 L A TEX-Satz des Manuskripts: Christian Pappert und Dennis Thielsen
2
Inhaltsverzeichnis I. Folgen und Reihen 7 1. Zahlenfolgen 9 1.1. Einfachste Eigenschaften von Zahlenfolgen.................... 9 1.2. Konvergente Zahlenfolgen............................. 11 1.3. Konvergenzkriterien................................. 12 1.4. Häufungspunkte................................... 12 1.5. Limes superior, inferior............................... 13 2. Unendliche Reihen 15 2.1. Elementare Eigenschaften von Reihen....................... 16 2.2. Konvergenzkriterien................................. 17 2.3. Reihen mit nichtnegativen Gliedern........................ 17 2.4. Quotienten- und Wurzelkriterium......................... 18 2.5. Das Integralkriterium................................ 19 2.6. Kriterium für alternierende Reihen........................ 20 2.7. Absolute Konvergenz................................ 20 2.8. Eigenschaften absolut konvergenter Reihen.................... 21 2.9. Multiplikation von Reihen............................. 22 3. Funktionenreihen 23 3.1. Eigenschaften gleichmäßig konvergenter Reihen................. 24 3
Inhaltsverzeichnis 4. Potenzreihen 27 4.1. Konvergenzverhalten von Potenzreihen...................... 27 4.2. Berechnung des Konvergenzradius r........................ 28 4.3. Eigenschaften von Potenzreihen.......................... 28 4.4. Folgerungen aus Kapitel 3............................. 29 4.5. Identitätssatz für Potenzreihen........................... 30 4.6. Rechnen mit Potenzreihen............................. 30 5. Taylorreihen 33 5.1. Praktische Bedeutung der Taylorentwicklung................... 34 5.2. Taylorentwicklung einiger Funktionen....................... 35 II. Differentialrechnung im R n 43 6. Definition, Beispiele 45 6.1. Graphische Darstellung von Funktionen 2er Variabler.............. 45 7. Grenzwerte von Funktionen mehrerer Variabler 47 7.1. Stetigkeit...................................... 48 8. Partielle Ableitungen 51 8.1. Partielle Ableitungen 1.Ordnung.......................... 51 8.1.1. Partielle Ableitungen im R 2........................ 51 8.1.2. Partielle Ableitungen im R n........................ 54 8.2. Partielle Ableitungen höherer Ordnung...................... 55 9. Die verallgemeinerte Kettenregel 57 10.Mittelwertsatz 59 10.1. Folgerungen aus dem MWS............................ 60 10.1.1. Anwendungen des totalen Differentials in der Fehlerrechnung...... 61 4
Inhaltsverzeichnis 11.Implizite Funktionen, implizite Differentiation 63 11.1. Implizite Funktionen zweier Variabler....................... 63 11.2. Implizite Funktionen mehrerer Variabler..................... 64 11.2.1. Auflösbarkeit................................ 65 11.2.2. Berechnung der ersten partiellen Ableitungen.............. 66 12.Die Richtungsableitung 69 12.1. Eine weitere Eigenschaft des Gradienten f................... 71 13.Satz von Taylor 75 13.1. Eigenschaften von F (t)............................... 75 13.2. Anwendung der Taylorformel für Funktionen einer Variablen auf die Funktion F 77 14.Extremwertaufgaben 81 14.1. Kriterien für lokale Extremalstellen........................ 82 14.1.1. Notwendige Bedingung........................... 82 14.1.2. Hinreichende Bedingung.......................... 82 15.Extremwertaufgaben mit Nebenbedingungen 85 15.1. Notwendige Optimalitätsbedingungen....................... 87 15.1.1. Verfahren von Lagrange.......................... 87 15.2. Hinreichende Optimalitätsbedingungen für (P ).................. 89 16.Parameterintegrale 93 5
Inhaltsverzeichnis 6
Teil I. Folgen und Reihen 7
1. Zahlenfolgen Definition 1.1 (Zahlenfolge) Eine Zahlenfolge (a n ) oder a n0, a n0 +1, a n0 +2,..., a n,... liegt dann vor, wenn jeder natürlichen Zahl n n 0 (häufig ist n 0 = 0 oder n 0 = 1) in 1 deutiger Weise eine Zahl a n R (auch b n, x n usw.) zugeordnet ist: n a n = f(n), a n R für n n 0 ; a n heißt n-tes Glied der Folge (a n ). Eine Zahlenfolge ist also eine Funktion f mit Definitionsbereich D f = {n N : n n 0 } für ein n 0 = 0, 1,.... Definition 1.2 (Teilfolge) Sei ν 0 < ν 1 < ν 2 <... < ν k < ν k+1 <... eine Folge natürlicher Zahlen. Dann heißt die Folge (b k ) eine Teilfolge von (a n ). b k := a νk, k = 0, 1,..., 1.1. Einfachste Eigenschaften von Zahlenfolgen Definition 1.3 (Monotonie) (a) Eine Zahlenfolge (a n ) heißt monoton wachsend bzw. monoton fallend, wenn a n a n+1 bzw. a n a n+1 für alle n n 0. (b) Eine Zahlenfolge (a n ) heißt streng monoton wachsend bzw. fallend, wenn a n < a n+1 bzw. a n > a n+1 für alle n n 0. Definition 1.4 (Alternierende Folge) Eine Zahlenfolge (a n ) heißt alternierend, wenn sgn a n+1 = sgn a n für alle n n 0. Satz 1.1 Sei q R. Die Folge a n = q n, n = 0, 1,..., also 1, q, q 2, q 3,..., ist (a) streng monoton wachsend für alle q > 1 9
1. Zahlenfolgen (b) streng monoton fallend für alle 0 < q < 1 (c) konstant für q = 0 (n 1) und q = 1 (d) alternierend für alle q < 0 Definition 1.5 (Beschränkte Folgen) Eine Zahlenfolge (a n ) heißt (a) beschränkt nach unten, wenn a n s für alle n n 0, (b) beschränkt nach oben, wenn a n S für alle n n 0, (c) beschränkt, wenn s a n S oder a n C für alle n n 0, wobei s, S, C, von n unabhängige Zahlen sind. Definition 1.6 (Grenzwert, Konvergenz, Divergenz) Sei (a n ) eine Zahlenfolge. a R heißt Grenzwert von (a n ), wenn zu jedem, auch beliebig kleinem ε > 0 eine Zahl N = N(ε) existiert, so dass a n a < ε für alle n > N(ε). Falls (a n ) einen Grenzwert a besitzt, dann heißt (a n ) auch konvergent (gegen a), und man schreibt lim n a n = a oder a n a, n. Eine nicht konvergente Zahlenfolge heißt divergent. Bemerkung: (a) Geometrische Bedeutung: Für hinreichend großes n liegen sämtliche Glieder der Folge in einer beliebig kleinen Umgebung U ε (a) = {x : a ε < x < a + ε} von a. (b) Der Grenzwert ist, falls er existiert, 1 deutig bestimmt. Satz 1.2 Für jedes q < 1 gilt lim n q n = 0. Definition 1.7 (Nullfolge) Eine Zahlenfolge mit Grenzwert 0 heißt Nullfolge (N.F.). Definition 1.8 (Bestimmte Divergenz) lim n a n = + (oder ) bedeutet: Zu jedem beliebig großen A gibt es ein N = N(A), so dass a n > A bzw. a n < A für alle n > N(A). 10
1.2. Konvergente Zahlenfolgen 1.2. Konvergente Zahlenfolgen Satz 1.3 Eine Folge hat höchstens einen Grenzwert. Satz 1.4 Jede konvergente Zahlenfolge ist beschränkt. Bemerkung: (a) Aus Satz 1.4 folgt: (a n ) unbeschränkt (a n ) divergent (evtl. bestimmt divergent). (b) (a n ) beschränkt i.a. (a n ) konvergent. Beispiel: a n = ( 1) n Satz 1.5 Jede Teilfolge einer konvergenten Folge a n a, n konvergiert gegen a. Satz 1.6 (Grenzwertsätze) ( ) Sei a n a, b n b für n. Dann sind auch die Folgen an (a n ± b n ), (a n b n ),, wenn b 0, und a n konvergent, und es gilt b n lim (a n ± b n ) = lim a n ± lim b n, n n n lim (a n b n ) = lim a n lim b n, n n n a n lim = n b n lim a n = n lim a n n lim b, wenn b 0, n n lim a n n Satz 1.7 Die Abänderung von (nur) endlich vielen Gliedern einer Folge ändert deren Konvergenzverhalten nicht. Satz 1.8 Ist a n 0, n und (b n ) eine beschränkte Folge, dann gilt lim a nb n = 0. n Satz 1.9 Ist a n a, b n b für n und a n b n für alle n, so folgt a b. 11
1. Zahlenfolgen 1.3. Konvergenzkriterien Satz 1.10 Ist eine Folge monoton wachsend und nach oben beschränkt bzw. monoton fallend und nach unten beschränkt, dann ist sie konvergent. Satz 1.11 Sei a n a, b n a, n. Ist a n c n b n für alle n n 0, dann gilt c n a, n. Satz 1.12 (Cauchysches Konvergenzkriterium) Die Zahlenfolge (a n ) ist genau dann konvergent, wenn zu jedem, auch beliebig kleinen ε > 0 ein N = N(ε) existiert, so dass a n a m < ε, wenn m, n > N(ε). Bemerkung: In diesem Konvergenzkriterium kommt der Grenzwert a nicht explizit vor! Satz 1.13 (Arithmetisches Mittel der Teilsummen) Sei a n a, n. Dann gilt b n = a 1 + a 2 + + a n n a, n 1.4. Häufungspunkte Divergente Folgen besitzen manchmal noch Häufungspunkte. Definition 1.9 (Häufungspunkt) Eine Zahl a heißt Häufungspunkt (H.P.) einer Folge (a n ), wenn zu jedem beliebig kleinen ε > 0 eine Indexfolge n 1 < n 2 <... existiert, so dass a nk a < ε für alle k = 1, 2,..., d.h., in jeder Umgebung eines H.P. von (a n ) liegen viele Glieder der Folge. Satz 1.14 Ist a ein H.P. von (a n ), dann gibt es eine Teilfolge (a nk ), so dass a = lim k a nk. Bemerkung: Aus Satz 1.14 folgt: H.P. sind die Grenzwerte konvergenter Teilfolgen! Satz 1.15 Jede beschränkte Folge hat mindestens einen H.P. und damit mindestens eine konvergente Teilfolge. 12
1.5. Limes superior, inferior 1.5. Limes superior, inferior Gegeben sei eine beschränkte Zahlenfolge (a n ), also a n C für alle n. Sei a H.P. von (a n ). Mit einer Teilfolge (a nk ) von (a n ) gilt dann nach Satz 1.14 und Satz 1.9 a = lim a nk = a k C. Somit ist die Menge aller H.P. von (a n ) beschränkt. Satz 1.16 Ist (a n ) eine beschränkte Zahlenfolge, dann hat (a n ) einen größten H.P. a und einen kleinsten H.P. a. Definition 1.10 (Limes inferior, Limes superior) Sei (a n ) eine beschränkte Zahlenfolge, dann heißen a =: lim a n =: lim sup a n limes superior (oberer Grenzwert) und n n a =: lim a n =: lim inf n n a n limes inferior (unterer Grenzwert). Bemerkung: (a) lim n a n ist der größte Grenzwert einer konvergenten Teilfolge. (b) lim n a n ist der kleinste Grenzwert einer konvergenten Teilfolge. Satz 1.17 Eine beschränkte Zahlenfolge ist genau dann konvergent, wenn a = a. 13
1. Zahlenfolgen 14
2. Unendliche Reihen Definition 2.1 (Reihe) Ist a 0, a 1,..., a k,... eine Zahlenfolge, dann heißt der rein formale Ausdruck a 0 + a 1 + a 2 + + a k + oder eine unendliche Reihe (kurz Reihe). Die Zahlen a k heißen Glieder oder Summanden der Reihe. a k Definition der Summe s der Reihe: Wir betrachten die sog. n-ten Partialsummen s n, n = 0, 1, 2,... : s 0 = a 0 s 1 = a 0 + a 1 s 2 = a 0 + a 1 + a 2. s n = a 0 + a 1 + a 2 +... + a n =. n a k Definition 2.2 (Summe,Konvergenz,Divergenz) Eine Reihe a k heißt konvergent bzw. divergent, wenn die Folge (s n ) ihrer n-ten Partialsummen konvergent bzw. divergent ist. Der Grenzwert s = lim n s n heißt Summe der Reihe, und man schreibt auch s = a k oder s = a 0 + a 1 + a 2 +.... Bemerkung: Das Zeichen a k bezeichnet sowohl die formale Reihe, als auch ihren Grenzwert s, falls dieser existiert. 15
2. Unendliche Reihen Satz 2.1 (a) Geometrische Reihe: 1 + q + q 2 + + q n + ist i) konvergent, wenn 1 < q < +1, wobei dann ii) divergent, wenn q 1. (b) Harmonische Reihe: 1 + 1 2 + 1 3 + + 1 k + also 1 k k=1 ist divergent. q k = 1 1 q, Definition 2.3 (Bestimmte Divergenz) a k heißt bestimmt divergent, wenn (s n ) bestimmt divergent ist. Man schreibt a k = ±, wenn lim s n = ±. n 2.1. Elementare Eigenschaften von Reihen Satz 2.2 Verändert man in einer Reihe a k nur endlich viele Glieder a k, so ändert sich deren Konvergenzverhalten nicht. Satz 2.3 (Grenzwertsätze) (a) Ist a k = s R, dann ist auch c a k konvergent für jedes c R, und es gilt c a k = c a k. (b) Sind a k = s, b k = t konvergente Reihen, dann konvergiert auch (a k + b k ), und es gilt (a k + b k ) = a k + b k. Bemerkung: a k = s, b k = t i.a. a k b k = s t (vgl. Satz 2.18). 16
2.2. Konvergenzkriterien 2.2. Konvergenzkriterien Satz 2.4 (Notwendiges Kriterium) Ist (a k ) ihrer Glieder ist also eine Nullfolge. a k konvergent, dann gilt lim k 0 a k = 0; die Folge Bemerkung: (a k ) Nullfolge i.a. a k konvergent. Satz 2.5 (Cauchysches Konvergenzkriterium) Die Reihe a k ist genau dann konvergent, wenn zu jedem ε > 0, auch beliebig klein, eine Zahl N = N(ε) existiert, so dass a n+1 + a n+2 + + a n+p < ε für alle n > N(ε) und jedes p = 1, 2,.... 2.3. Reihen mit nichtnegativen Gliedern Wir betrachten Reihen a k mit a k 0 für alle k = 0, 1, 2,.... Offensichtlich ist die Partialsummenfolge s n = n a k, n = 0, 1, 2,..., monoton wachsend. Satz 2.6 Eine Reihe mit nichtnegativen Gliedern ist genau dann konvergent, wenn (s n ) beschränkt ist. Satz 2.7 (Vergleichskriterium I) Eine Reihe mit nichtnegativen Gliedern ist kon- vergent, wenn eine Reihe b k existiert, so dass a k (a) b k ist als konvergent bekannt, (b) a k b k für alle k k 0, mit einem gewissen (festen) k 0. Bemerkung: b k heißt konvergente Majorante von a k. Das Vergleichskriterium I heißt daher auch Majorantenkriterium. 17
2. Unendliche Reihen Satz 2.8 (Vergleichskriterium II) Eine Reihe a k ist divergent, wenn eine Reihe existiert, so dass (a) b k ist als divergent bekannt, b k (b) a k b k 0 für alle k k 0 mit einem gewissen (festen) k 0. Bemerkung: b k heißt divergente Minorante von a k. Das Vergleichskriterium II heißt daher auch Minorantenkriterium. 2.4. Quotienten- und Wurzelkriterium Geg.: Reihe a k mit nichtnegativen Gliedern a k. Satz 2.9 (Quotientenkriterium) (a) Quotientenkriterium: i) Existiert ein festes 0 q < 1 und eine Zahl N 0, so dass a k > 0 für k N 0 und dann ist a k konvergent. ii) Gilt hingegen a k > 0, k N 0, und dann ist a k divergent. a k+1 a k q für alle k N 0, a k+1 a k 1 für alle k N 0, (b) Limesform des Quotientenkriteriums: Für die Reihe a k existiere der Grenzwert Q = lim Bemerkung: a k a k+1 k a k konvergent, wenn Q < 1 divergent, wenn Q > 1. Dann ist (a) Gilt a k+1 a k < 1 für alle k N 0 i.a. Konvergenz. 18
2.5. Das Integralkriterium (b) Ist Q = 1, dann ist sowohl Konvergenz als auch Divergenz möglich! Satz 2.10 (Wurzelkriterium) (a) Wurzelkriterium: i) Existiert ein 0 < q < 1 und eine Zahl N 0, so dass k ak q für alle k N 0, dann ist a k konvergent. ii) Gilt hingegen k ak 1 für alle k N 0, dann ist a k divergent. (b) Limesform des Wurzelkriteriums: Für a k existiere der Grenzwert W = lim k a k. Dann ist k a k konvergent, wenn W < 1 divergent, wenn W > 1 Bemerkung: W = 1 bringt keine Entscheidung über Konvergenz oder Divergenz. 2.5. Das Integralkriterium Satz 2.11 (Integralkriterium) Die Reihe a k mit nichtnegativen Gliedern a k sei definiert durch wobei k=1 a k = f(k), k = 1, 2,..., f : [1, + ) R eine monoton fallende, stetige Funktion ist. Dann ist a k genau dann konvergent, wenn der Grenzwert existiert. + 1 f(x) dx := k=1 A lim A + 1 f(x) dx 19
2. Unendliche Reihen 2.6. Kriterium für alternierende Reihen Satz 2.12 (Leibnizsches Konvergenzkriterium) Eine alternierende Reihe a k ist konvergent, wenn die Folge ( a k ) monoton fallend und eine Nullfolge ist. 2.7. Absolute Konvergenz Definition 2.4 (Absolute Konvergenz) Eine Reihe a k heißt absolut konvergent, wenn die Reihe a k konvergiert. Satz 2.13 Jede absolut konvergente Reihe ist konvergent. Bemerkung: (a) Konvergenz i.a. Absolute Konvergenz. (b) Eine konvergente Reihe mit nichtnegativen Gliedern a k 0 ist natürlich auch absolut konvergent. Satz 2.14 (Majoranten- und Minorantenkriterium) (a) Majorantenkriterium: a k ist absolut konvergent (und damit auch konvergent), wenn eine Reihe b k mit nichtnegativen Gliedern b k existiert, so dass i) b k konvergent ist und ii) a k b k für alle k N 0 (für eine Zahl N 0 ). (b) Minorantenkriterium: Gilt a k b k 0 für alle k N 0, wobei konvergent. b k divergent ist, dann ist a k nicht absolut Satz 2.15 (Quotientenkriterium) (a) Quotientenkriterium: i) Existiert ein 0 < q < 1 und eine Zahl N 0, so dass dann ist a k absolut konvergent. a k+1 a k q für alle k N 0, 20
2.8. Eigenschaften absolut konvergenter Reihen ii) Gilt hingegen so ist a k divergent. a k+1 a k 1 für alle k N 0, (b) Limesform des Quotientenkriteriums: Es existiere Q = lim k a k+1 a k. Wenn Q < 1 bzw. Q > 1, so ist a k absolut konvergent bzw. divergent. Bemerkung: Für Q = 1 ist kein Entscheid zwischen Konvergenz und Divergenz möglich. Satz 2.16 (Wurzelkriterium) (a) Wurzelkriterium: i) Existiert ein 0 < q < 1 und eine Zahl N 0, so daß k ak q für alle k N 0, dann ist a k absolut konvergent. ii) Gilt hingegen dann ist a k divergent. (b) Limesform des Wurzelkriteriums: Es existiere k ak 1 für alle k N 0, W = lim k k a k. Wenn W < 1 bzw. W > 1, dann ist a k absolut konvergent bzw. divergent. Bemerkung: Für W=1 ist kein Entscheid zwischen Konvergenz und Divergenz möglich! 2.8. Eigenschaften absolut konvergenter Reihen Satz 2.17 Ist a k eine absolut konvergente Reihe, so ist ihre Summe unabhängig von der Reihenfolge ihrer Glieder a k. Ist also k 0, k 1, k 2,... eine beliebige Umordnung der Folge 0, 1, 2,..., so gilt a k = a kj. (2.1) j=0 21
2. Unendliche Reihen Definition 2.5 (Bedingte Konvergenz) Reihen mit der Eigenschaft (2.1) heißen auch unbedingt konvergent. Andernfalls heißt die Reihe bedingt konvergent. Bemerkung: Ist eine Reihe bedingt konvergent, so lässt sich durch Umordnung der Glieder jede Zahl s als Summe der Reihe darstellen.. 2.9. Multiplikation von Reihen Geg.: Reihen a k, b k. b 0 b 1 b 2 b 3... a 0 a 0 b 0 a 0 b 1 a 0 b 2 a 0 b 3... c 0 = a 0 b 0 a 1 a 1 b 0 a 1 b 1 a 1 b 2 a 1 b 3... c 1 = a 0 b 1 + a 1 b 0 a 2 a 2 b 0 a 2 b 1 a 2 b 2 a 2 b 3... c 2 = a 0 b 2 + a 1 b 1 + a 2 b 0 a 3 a 3 b 0 a 3 b 1 a 3 b 2 a 3 b 3... c 3 = a 0 b 3 + a 1 b 2 + a 2 b 1 + a 3 b 0... Definition 2.6 (Cauchysche Produktreihe) Die Produktreihe c k ist definiert durch c k = k a j b k j, k = 0, 1,.... j=0 Satz 2.18 Sind a k, b k absolut konvergente Reihen mit Summen s bzw. t, dann ist auch c k absolut konvergent und hat die Summe s t. 22
3. Funktionenreihen Definition 3.1 (Funktionenfolge, Funktionenreihe) Eine Folge (f k ) bzw. eine Reihe f k, deren Glieder Funktionen f k = f k (x) einer reellen Variablen x aus dem Intervall I sind, heißt Funktionenfolge bzw. Funktionenreihe auf I. Definition 3.2 (Konvergenz, Konvergenzbereich, Summenfunktion) (a) Die Funktionenreihe f k heißt konvergent bzw. divergent in x 0 I, wenn die Zahlenreihe f k (x 0 ) konvergent bzw. divergent ist. (b) Die Menge M = {x I : f k ist konvergent} heißt Konvergenzbereich (oder Konvergenzmenge) der Funktionenreihe f k. (c) Die Funktion s(x) = f k (x), x M heißt Summenfunktion (oder Grenzfunktion) der Reihe f k. Problem: Welche Eigenschaften (Stetigkeit, Differenzierbarkeit, Integrierbarkeit) hat die Summenfunktion? Zur Behandlung dieses Problems benötigen wir noch den Begriff der gleichmäßigen Konvergenz einer Funktionenreihe. Sei s n (x) = f k (x). (a) Konvergenz von f k in x I: Zu jedem ε > 0 und jedem x I existiert eine Zahl N = N(ε, x), so dass s n (x) s(x) < ε für alle n N(ε, x). Bemerkung: Im allgemeinen ist N eine Funktion von ε > 0 und vom Punkt x. 23
3. Funktionenreihen (b) Gleichmäßige Konvergenz: Definition 3.3 (Gleichmäßige Konvergenz) Die Reihe f k heißt gleichmäßig konvergent in einem Intervall I mit der Summenfunktion s = s(x), wenn zu jedem ε > 0 eine von x unabhängige Zahl N = N(ε) existiert, so dass Bemerkung: s n (x) s(x) < ε für alle n N(ε) und jedes x I. (a) f k gleichmäßig konvergent in I f k konvergent in I, (b) f k konvergent in I i.a. (c) I kann auch ein Intervall sein. f k gleichmäßig konvergent in I, Satz 3.1 (Kriterium für gleichmäßige Konvergenz) Eine Funktionenreihe f k ist gleichmäßig konvergent in einem Intervall I, wenn eine konvergente Zahlenreihe a k, a k 0, existiert, so dass f k (x) a k für alle k = 0, 1, 2,... und jedes x I. 3.1. Eigenschaften gleichmäßig konvergenter Reihen Satz 3.2 (Stetigkeit der Summenfunktion) Ist f k gleichmäßig konvergent in einem Intervall I und sind die Glieder f k stetig auf I, dann ist auch die Summenfunktion s(x) stetig auf I. Satz 3.3 (Gliedweise Integration) Ist f k im Intervall I gleichmäßig konvergent gegen die Summenfunktion s(x), dann gilt für beliebige a, b I b a s(x) dx = b a ( ) f k (x) dx = b a f k (x) dx. Satz 3.4 (Gliedweise Differentiation) Die Reihe f k sei in I konvergent gegen die Summenfunktion s(x), die Glieder f k seien differenzierbar auf I, und die Reihe f k sei gleichmäßig 24
3.1. Eigenschaften gleichmäßig konvergenter Reihen konvergent auf I. Dann ist die Reihe f k gleichmäßig konvergent in I, ihre Summenfunktion s(x) ist differenzierbar in I, und es gilt ( s (x) = f k (x)) = f k(x) für alle x I. 25
3. Funktionenreihen 26
4. Potenzreihen Zur Entwicklung von Funktionen in Reihen braucht man den Begriff der Potenzreihe. Definition 4.1 (Potenzreihe) Eine Funktionenreihe der Form c k (x x 0 ) k heißt Potenzreihe mit Mittelpunkt x 0. Die Zahlen c k heißen Koeffizienten der Potenzreihe. Bemerkung: Mittelpunkt x 0 Substitution x x 0 = x x 0 = 0 4.1. Konvergenzverhalten von Potenzreihen Sei P x := c k (x x 0 ) k. (a) P x konvergiert sicher für x = x 0. (b) Satz 4.1 Ist c k (x x 0 ) k konvergent für ein x 1 x 0, so konvergiert die Reihe absolut für alle x {x : x x 0 < x 1 x 0 }. Ist hingegen c k (x x 0 ) k divergent für ein x = x 2, so divergiert sie auch für alle x {x : x x 0 > x 2 x 0 }. Daraus folgt: Satz 4.2 Zu jeder Potenzreihe c k (x x 0 ) k gibt es genau eine Zahl r 0 oder aber das Zeichen r = +, so dass (a) (b) P x ist konvergent für x = x 0 ist divergent für x x 0 } falls r = 0, P x ist absolut konvergent für alle x {x : x x 0 < r} ist divergent für alle x {x : x x 0 > r} } falls r > 0, 27
4. Potenzreihen (c) P x ist absolut konvergent für alle x R, falls r = +. Bemerkung: Die Zahl r 0 oder das Zeichen r = + heißt Konvergenzradius der Potenzreihe. 4.2. Berechnung des Konvergenzradius r Satz 4.3 (a) Existiert der Grenzwert µ = lim k k c k, so ist also r = 1, µ wenn µ > 0, r = +, wenn µ = 0, r = 0, wenn µ =, r = lim k (b) Existiert der Grenzwert ν = lim c k+1 k c k, so ist 1 ck. k r = 1 lim c k+1 c k k insbesondere r = +, wenn ν = 0. Bemerkung: Die allgemeine Formel für den Konvergenzradius r lautet r = 1 k lim sup ck. k 4.3. Eigenschaften von Potenzreihen Satz 4.4 (Gleichmäßige Konvergenz) Eine Potenzreihe konvergiert in jedem abgeschlossenen Teilintervall ihres Konvergenzintervalls (x 0 r, x 0 + r) absolut und gleichmäßig. 28
4.4. Folgerungen aus Kapitel 3 4.4. Folgerungen aus Kapitel 3 Aus Satz 3.2 folgt: Satz 4.5 (Stetigkeit der Summenfunktion) Die Summenfunktion s(x) einer Potenzreihe c k (x x 0 ) k ist im ganzen Konvergenzintervall (x 0 r, x 0 + r) stetig. Aus Satz 3.3 folgt: Satz 4.6 (Gliedweise Integration) Eine Potenzreihe c k (x x 0 ) k darf über jedes abgeschlossene Intervall [a, b] mit x 0 r < a, b < x 0 + r gliedweise integriert werden. also b a s(x) ds = = = b a ( ) c k (x x 0 ) k dx c k b a (x x 0 ) k dx c k k + 1 ((b x 0) k+1 (a x 0 ) k+1 ) für alle x 0 r < a, b < x 0 + r. Es gilt Bemerkung: Mit Hilfe dieses Satzes erkennt man, dass die gliedweise integrierte Potenzreihe c k k + 1 (x x 0) k+1 mindestens denselben Konvergenzradius hat. Aus Satz 3.4 folgt: Satz 4.7 (Gliedweise Differentiation) Sei c k (x x 0 ) k eine Potenzreihe mit Konver- genzradius r. Die durch gliedweise Differentiation entstehende Reihe k c k (x x 0 ) k 1 ist ebenfalls absolut konvergent im Intervall (x 0 r, x 0 + r), und es gilt k=1 ( ) c k (x x 0 ) k = k c k (x x 0 ) k 1 für alle x x 0 < r. k=1 Aus Satz 4.7 folgt: Satz 4.8 In ihrem Konvergenzintervall (x 0 r, x 0 + r) ist eine Potenzreihe c k (x x 0 ) k beliebig oft differenzierbar. Die Ableitungen s (k) (x) der Summenfunktion s(x) erhält man durch gliedweise Differentiation. 29
4. Potenzreihen Bemerkung: Es gilt also nach Satz 4.7 in x 0 r < x < x 0 + r: s(x) = c 0 + c 1 (x x 0 ) + c 2 (x x 0 ) 2 + + c k (x x 0 ) k s (x) = c 1 + 2c 2 (x x 0 ) + + kc k (x x 0 ) k 1 s (x) = 2c 2 + + k(k 1)c k (x x 0 ) k 2. Allgemein gilt s (j) (x) = c k k(k 1)... (k j + 1)(x x 0 ) k j, k=j und damit s (j) (x 0 ) = c j j(j 1)(j 2)... 2 1 = c j j! = j!c j. 4.5. Identitätssatz für Potenzreihen Satz 4.9 (Identitätssatz) Gegeben seien zwei Potenzreihen c k (x x 0 ) k und d k (x x 0 ) k, die im Intervall x 0 ρ < x < x 0 + ρ konvergieren und dort die gleiche Summenfunktion haben. Dann gilt c k = d k für alle k = 0, 1, 2,..., d.h., die beiden Reihen sind identisch. 4.6. Rechnen mit Potenzreihen (a) Addition, Subtraktion, λ-faches Gegeben: c k (x x 0 ) k mit Konvergenzradius r 1, d k (x x 0 ) k mit Konvergenzradius r 2, r := min(r 1, r 2 ). Satz 4.10 (Addition, Subtraktion, λ-faches) Für alle x {x : x x 0 < r} gilt i) c k (x x 0 ) k ± d k (x x 0 ) k = (c k ± d k )(x x 0 ) k, ii) λ c k (x x 0 ) k = λc k (x x 0 ) k für alle λ R. (b) Multiplikation Gegeben: c k (x x 0 ) k mit Konvergenzradius r 1, d k (x x 0 ) k mit Konvergenzradius r 2, r := min(r 1, r 2 ). Aus Satz 2.18 folgt: Satz 4.11 (Multiplikation) Für alle x {x : x x 0 < r} gilt ( ) ( ) ( k ) c k (x x 0 ) k d k (x x 0 ) k = c j d k j (x x 0 ) k. j=0 30
4.6. Rechnen mit Potenzreihen (c) Division Satz 4.12 (Division) Eine Potenzreihe c k (x x 0 ) k mit Konvergenzradius r habe die Summe s(x), und es sei c 0 0. Dann gibt es ein ρ > 0 und eine Potenzreihe d k (x x 0 ) k, so dass 1 s(x) = d k (x x 0 ) k für alle x x 0 < ρ. Bemerkung: Bestimmung der Koeffizienten d k nach der folgenden Rekursion: k c j d k j = α k, k = 0, 1, 2,... ; α 0 = 1, α 1 = α 2 =... = 0 j=0 k = 0 : c 0 d 0 = α 0 = 1 = d 0 = 1 c 0 = k = 1 : c 0 d 1 + c 1 d 0 = α 1 = 0 = d 1 = c 1 c 2 0 k = 2 : c 0 d 2 + c 1 d 1 + c 2 d 0 = 0 = d 2 = c2 1 c 0 c 2 c 3 0. Analog stellt man den Quotienten zweier Potenzreihen b k (x x 0 ) k wieder als Potenzreihe dar! c k (x x 0 ) k 31
4. Potenzreihen 32
5. Taylorreihen Aus Satz 4.8 folgt: Die Summenfunktion s(x) einer Potenzreihe ist im Konvergenzintervall beliebig oft differenzierbar, und es ist s (k) (x 0 ) k! = c k, k = 0, 1,.... Problem: Lässt sich umgekehrt eine oft differenzierbare Funktion durch eine Potenzreihe darstellen? Geg.: Offenes Intervall I; Funktion f, die unendlich oft differenzierbar ist; x 0 (fest) I. Definition 5.1 (Taylorreihe) Unter der Taylorreihe von f mit Entwicklungspunkt x 0 I versteht man die Potenzreihe T (x) := f (k) (x 0 ) (x x 0 ) k k! = f(x 0 ) + f (x 0 ) 1! (x x 0 ) + f (x 0 ) (x x 0 ) 2 +... 2! Aus Satz 4.2 folgt: Als Potenzreihe konvergiert T (x) in einem Intervall (x 0 r, x 0 + r). Problem: Zusammenhang zwischen T (x) und f(x), d.h. wo gilt T (x) = f(x)? Bemerkung: Sicher ist T (x) = f(x) für x = x 0. Betrachte das n-te Taylorpolynom: T n (x) = n f (k) (x 0 ) (x x 0 ) k, k! also T 0 (x) = f(x 0 ) T 1 (x) = f(x 0 ) + f (x 0 )(x x 0 ) T 2 (x) = f(x 0 ) + f (x 0 )(x x 0 ) + f (x 0 ) (x x 0 ) 2 2!. 33
5. Taylorreihen Satz 5.1 (Satz von Taylor) Ist f auf dem offenen Intervall I mindestens n + 1 mal differenzierbar und x 0 I eine feste Zahl, dann gilt mit und f(x) = T n (x) + R n (x) für alle x I (Taylorformel) T n (x) = n f (k) (x 0 ) (x x 0 ) k (n-tes Taylorpolynom) k! R n (x) = (x x 0) n+1 f (n+1) (x 0 + ϑ(x x 0 )) (Restglied nach Lagrange), (n + 1)! wobei ϑ = ϑ(x, x 0 ) zwischen 0 und 1 liegt. Bemerkung: Andere Restgliedformen: (a) R n (x) = (x x 0) n+1 (1 n! ϑ) n f (n+1) (x 0 + ϑ(x x 0 )), 0 < ϑ < 1 (Cauchy-Form) x (b) R n (x) = 1 f (n+1) (t)(x t) n dt (Integralform) n! x 0 Anwendung der Taylorformel: Voraussetzung: f sei oft differenzierbar auf dem offenen Intervall I. In diesem Fall gilt die Taylorformel für alle n = 0, 1, 2,..., d.h., es ist f(x) = T n (x) + R n (x), x I, für alle n = 0, 1, 2,.... Satz 5.2 Sei x I. Genau dann ist T (x) konvergent und T (x) = f(x), wenn lim n R n (x) = 0. = Die Entwicklung einer Funktion f(x) in eine Taylorreihe T (x) erfordert somit die Untersuchung, ob das Restglied R n (x) für n gegen Null konvergiert. 5.1. Praktische Bedeutung der Taylorentwicklung Voraussetzung: Für alle x I sei (R n (x)) eine Nullfolge. Aus Satz 5.2 folgt: Für alle x I ist f(x) = T (x) = f(x 0 ) + f (x 0 )(x x 0 ) + f (x 0 ) (x x 0 ) 2 +... = lim T n (x). 2! n 34
5.2. Taylorentwicklung einiger Funktionen Daraus folgt: (a) f(x) T n (x) = n f (k) (x 0 ) (x x 0 ) k, x I, für hinreichend großes n k! = Approximation von f durch ein Näherungspolynom, das Taylorpolynom T n (b) Approximationsfehler: e = e f (x, n) (Absolutfehler) e = f(x) T n (x) = R n (x) }{{} Restglied Kriterium für die Konvergenz des Lagrangeschen Restgliedes gegen Null: R n (x) = f (n+1) (ξ) (n + 1)! (x x 0) (n+1), ξ zwischen x und x 0, ξ = x 0 + ϑ(x x 0 ), 0 < ϑ < 1 = x x 0 n+1 f (n+1) (ξ) (n + 1)! Falls f (n+1) (ξ) C(x, x 0 ) < + und für alle ξ zwischen x und x 0, n = 0, 1, 2,... so folgt: R n (x) C x x 0 n+1 (n + 1)! 0, n. Satz 5.3 Falls f (n+1) (ξ) C für alle ξ zwischen x und x 0 und n = 1, 2,..., dann gilt R n (x) 0, n und damit f(x) = lim T n (x), also T (x) = f(x). n 5.2. Taylorentwicklung einiger Funktionen (a) f(x) = e x, x 0 = 0 f (k) (x) = e x, k = 0, 1,... f (k) (x 0 ) = 1, k = 0, 1,... Daraus folgt: T (x) = = f (k) (x 0 ) (x x 0 ) k k! x k k! Taylorreihe ist überall konvergent (Q.K.)! 35
5. Taylorreihen Restglied: R n (x) = f (n+1) (x 0 + ϑ(x x 0 )) (x x 0 ) (n+1) (Lagrange) (n + 1)! e ϑx = (n + 1)! xn+1 Wegen ϑx ϑ x x folgt: R n (x) e x x n+1 (n + 1)! }{{} Nullfolge Daraus folgt: x k k! ( ) x k konvergiert nach dem Q.K. absolut = k! muss eine Nullfolge sein! Aus Satz 5.2 folgt für alle x I = R: e x = T (x) = 1 + x + x2 2! + x3 3! + + xk k! + Aus Kapitel 5.1 folgt: e x 1 + x + x2 2! + + xn n! e f (x, n) e x mit dem absoluten Fehler x n+1 (n + 1)!. (b) f(x) = sin x, x 0 = 0 f (2ν) (0) = 0, ν = 0, 1, 2,... f (2ν+1) (0) = ( 1) ν, ν = 0, 1, 2,... Daraus folgt: T (x) = x x3 3! + x5 5! x7 7! ± + ( 1)k x 2k+1 (2k + 1)! +. Taylorreihe ist überall konvergent (Q.K.)! Restglied: R n (x) = f (n+1) (ξ) (n + 1)! (x x 0) n+1 (Lagrange) = sin(n+1) (ξ) x n+1. (n + 1)! 36
5.2. Taylorentwicklung einiger Funktionen Daraus folgt: da sin (n+1) (ξ) 1. Aus Satz 5.2 folgt: für alle x I = R. R n (x) x n+1, (n + 1)! }{{} N.F. sin x = T (x) = x x3 3! + x5 5! x7 7! ±... Aus Kapitel 5.1 folgt: sin x x x3 3! + x5 5! x7 7! ± x 2k+1 +( 1)k (2k + 1)! Fehler e f (x, n) x 2k+2 (2k + 2)!. mit dem absoluten (c) f(x) = cos x, x 0 = 0 Analog zu f(x) = sin x ergibt sich für alle x I = R: cos x = 1 x2 2! + x4 4! x6 x2k ± + ( 1)k 6! (2k)! +... mit dem absoluten Fehler (d) f(x) = ln(1 + x), x > 1, x 0 = 0 cos x 1 x2 2! + x4 4! x6 x2k ± + ( 1)k 6! (2k)! e f (x, n) f (k) k 1 (k 1)! (x) = ( 1), k = 1, 2,... (1 + x) k f (k) (x 0 ) = ( 1) k 1 (k 1)!, k = 1, 2,... f (0) (x 0 ) = 0 Daraus folgt: x 2k+1 (2k + 1)! T (x) = = k=1 ( 1) k 1 (k 1)! x k k! ( 1) k 1 k=1 k x k = x x2 2 + x3 3 x4 4 + + ( 1)k 1 x k + k 37
5. Taylorreihen Restglied: R n (x) = f (n+1) (ϑx) x n+1 mit 0 < ϑ < 1 (Lagrange) (n + 1)! = = ( 1) n n! (1 + ϑx) n+1 x n+1 (n + 1)! ( 1) n (1 + ϑx) n+1 x n+1 n + 1 Konvergenzradius r der Taylorreihe (Satz 4.3): ( r = lim c k+1 1 ( k c k ) = lim k Daraus folgt: konvergiert für x < 1, Taylorreihe für ln(1 + x) divergiert für x > 1. Gilt T (x) = ln(1 + x) für x < 1? i) Intervall 0 x < 1: Lagrange-Form des Restgliedes: R n (x) = Für 0 x 1 ist 1 + ϑx 1 und daher ) 1 k = 1 k + 1 ( 1) n xn+1 (1 + ϑx) n+1 n + 1, 0 < ϑ < 1. R n (x) 1 n + 1 Aus Satz 5.2 folgt für alle 0 x < 1: 0, n. ln(1 + x) = x x2 2 + x3 3 x4 4 + x5 5.... Da aber (R n (1)) ebenfalls eine Nullfolge ist, erhält man aus Satz 5.2 die Konvergenz von T (x) und T (x) = f(x) auch noch im rechten Randpunkt x = +1 des Konvergenzintervalls ] 1, +1[ von T (x). Es gilt also ln 2 = 1 1 2 + 1 3 1 4 + 1 5.... ii) Intervall 1 < x < 0: Hier ist die Lagrange-Form des Restgliedes ungeeignet. 38
5.2. Taylorentwicklung einiger Funktionen Cauchysche Form des Restgliedes: Ferner gilt: R n (x) = xn+1 (1 n! ϑ) n f (n+1) ( ϑx) mit 0 < ϑ < 1 R n (x) = = xn+1 (1 n! ϑ) n ( 1) n n! (1 + ϑx) = ( 1)n (1 ϑ) n n+1 (1 + ϑx) n+1 xn+1, ( 1 ϑ ) n 1 1 + ϑx xn+1 1 + ϑx. 1 < x < 0 0 < ϑ < 1 = 0 < 1 ϑ < 1 + ϑx 1 + ϑx > 1 + x > 0 = 0 < 1 ϑ 1 + ϑx < 1 1 1 + ϑx < 1 1 + x. Also R n (x) 1 1 + x x n+1 0, für n. Aus Satz 5.2 folgt: ln(1 + x) = x x2 2 + x3 3 x4 ±... für 1 < x < 0 und somit 4 ln(1 + x) = ( 1) k 1 x k 1 < x +1. k k=1 Bemerkung: T (x) divergiert für x = 1 T ( 1) = ( 1) k 1 ( 1) k k=1 k = k=1 1 k harmonische Reihe (e) f(x) = (1 + x) α, x > 1, α R beliebig, x 0 = 0 f (k) (x) = α(α 1)... (α k + 1) (1 + x) α k, k = 1, 2,... f (k) (0) = α(α 1)... (α k + 1), k = 1, 2,... f(0) = 1 Daraus folgt: T (x) = f (k) (x 0 ) (x x 0 ) k = k! ( ) ( ) α α x + x 2 + 1 2 = 1 + ( α k ) x 3 +... + ( α 3 ) x k Binomische Reihe ( ) α x k +... k 39
5. Taylorreihen Lagrange-Restglied: R n (x) = f (n+1) (ξ) (n + 1)! (x x 0) n+1 α(α 1)... (α n) = (1 + ϑx) α n 1 x n+1 (n + 1)! ( ) α = (1 + ϑx) α n 1 x n+1, 0 < ϑ < 1 n + 1 Cauchy-Restglied: R n (x) = xn+1 (1 n! ϑ) n f (n+1) ( ϑx) ( ) α = (n + 1) (1 n + 1 ϑ) n (1 + ϑx) α n 1 x n+1, 0 < ϑ < 1 Konvergenz der Taylorreihe: ( ) α c k = k c k+1 c k = α(α 1)(α 2)... (α k) 1 2 3... k 1 2 3... (k + 1) α(α 1)... (α k + 1) = α k k + 1 1, für k Aus Satz 4.3 folgt: Konvergenzradius r = 1, d.h. ( ) α konvergiert für x < 1 T (x) = x k k divergiert für x > 1 Gilt T (x) = (1 + x) α für alle x < 1? i) Intervall 0 x < 1: Es gilt 1 + ϑx 1, da 0 < ϑ < 1. Falls nun n > α 1 ( 0 > α n 1 (α ist fest!)) gilt (1 + ϑx) α n 1 = 1 1. (1 + ϑx) n+1 α Lagrange-Restgliedform: ( ) ( ) R n (x) = α x n+1 (1 + ϑx) α n 1 α n + 1 x n+1 für n > α 1. n + 1 ( ) α Dabei ist x n+1 das (n + 1)-te Glied der Taylorreihe T (x) von (1 + x) α. n + 1 ( ) α Also konvergiert T (x) für x < 1 = x n+1 0, für n. n + 1 40
5.2. Taylorentwicklung einiger Funktionen ii) Intervall 1 < x < 0: Cauchy-Restglied: ( ) α R n (x) = (n + 1) (1 n + 1 ϑ) n (1 + ϑx) α n 1 x n+1, 0 < ϑ < 1 ( ) α = (n + 1) ( 1 ϑ n + 1 1 + ϑx )n (1 + ϑx) α 1 x n+1 Ferner gilt Daraus folgt: 1 < x < 0 0 < ϑ < 1 = 0 < 1 ϑ < 1, 1 + ϑx (1 + ϑx) 1 < (1 + x) 1. ( ) R n (x) α (n + 1) (1 + n + 1 ϑx) α 1 x n+1. Sei α 1( 1 α 0). Dann gilt: 1 1 + ϑx < 1 1 + x = 1 (1 + ϑx) < 1 1 α (1 + x) = (1 + ϑx) α 1 < (1 + x) α 1 1 α Für α 1( α 1 0) hingegen gilt: α 1 (1 + ϑx) 1. }{{} <1 = (1 + ϑx) α 1 max {1, (1 + x) α 1 } =: γ(x) ( ) = R n (x) γ(x) α (n + 1) x n+1 n + 1 ( ) α Behauptung: a n+1 = (n + 1) x n+1 ist eine Nullfolge. n + 1 Beweis: a n+1 α(α 1)(α 2)... (α n) = (n + 1) a n 1 2 3... (n + 1) = α n x n = a n+1 a n x < 1 für n. Aus dem Quotientenkriterium folgt: x n+1 a k ist konvergent. 1 2... n n α(α 1)... (α n + 1) x n = a k 0 für k = R n (x) 0 für n und für 1 < x < 0. 41
5. Taylorreihen Aus i), ii) folgt schließlich: (1 + x) α = ( ) α x k für alle x < 1 und jedes α R. k Bemerkung: Taylorentwicklung von f(x) außerhalb x x 0 < r: (a) Entwicklung von ln z, z = 1 + x, im Intervall (0, 2]: ( 1) k 1 ln(1 + x) = x k, 1 < x 1, x 0 = 0. (5.1) k k=1 Betrachte nun a > 0 beliebig und f(x) = ln(a + x), a + x > 0 ( ( ln(a + x) = ln a 1 + x )) ( = ln a + ln 1 + x ). a a Aus (5.1) folgt somit: ln(a + x) = ( 1) k 1 ( x ) k x ln a +, 1 < k a a 1 k=1 = ( 1) k 1 ln a + x k, a < x +a. k a k }{{} f(0) k=1 }{{} f (k) (0) k! = Taylorentwicklung von f(x) = ln(a + x) in x 0 = 0 konvergiert im Intervall a < x +a. = Entwicklung von ln z im Intervall (0, 2a] für beliebiges a > 0. (b) Entwicklung von z α, z = 1 + x, im Intervall (0, 2): ( ) α (1 + x) α = x k, x < 1, α R, x 0 = 0. k Betrachte nun a > 0 beliebig und (a + x) α = a α ( 1 + x a) α = aα = a α a k ( ) α x k = k ( α k ( α a α k k ) (x ) k a ) x k, x a < 1. = Taylorentwicklung von f(x) = (a + x) α in x 0 = 0 konvergiert im Intervall a < x < +a. = Entwicklung von z α im Intervall (0, 2a) für beliebiges a > 0. 42
Teil II. Differentialrechnung im R n 43
6. Definition, Beispiele Definition 6.1 (Funktion) Sei D R n eine Teilmenge des R n. Eine Funktion von n (unabhängigen) Variablen x 1,..., x n ist eine Abbildung f : D R, die jedem Vektor x D 1-deutig eine Zahl z = f(x) = f(x 1, x 2,..., x n ) zuordnet; D ist dann der (Mindest-) Definitionsbereich von f., BN O O N N 4 Bemerkung: (a) Statt f(x 1, x 2 ) schreibt man oft z = f(x, y) für n = 2. (b) Statt f(x 1, x 2, x 3 ) schreibt man oft w = f(x, y, z) für n = 3. 6.1. Graphische Darstellung von Funktionen 2er Variabler Entsprechende Graphik-Software (2D, 3D) ist heute für alle Arten von Rechnern verfügbar. (a) (Perspektivische) Darstellung der Fläche Φ einer Funktion f = f(x, y): (b) Karte einer Funktion f = f(x, y): Φ = {(x, y, z) : z = f(x, y)} 45
6. Definition, Beispiele Definition 6.2 (Karte) Unter der Karte von f versteht man die Menge aller Niveaulinien von f, d.h. die Menge aller Kurven y = y(x; C), so dass f(x, y) C mit beliebigem C R. Praktische Anwendung: } Höhenlinien {{}, Isobaren, Isothermen }{{} Landkarten Wetterkarten 46
7. Grenzwerte von Funktionen mehrerer Variabler Definition 7.1 (Grenzwert) Die Zahl G heißt Grenzwert von f in a R n, wenn zu jedem, auch beliebig kleinen ε > 0, eine Zahl δ = δ(ε) > 0 existiert, so dass falls x D \ {a} und f(x 1,..., x n ) G < ε, x k a k < δ(ɛ) für alle 1 k n. (7.1) Man schreibt dann G = lim x a oder f(x) G für x a. 4 = @ = N = N 7 = @ BN / / A = @ = @ = N = @ / A Abbildung 7.1.: Grenzwertbegriff im R 2 47
7. Grenzwerte von Funktionen mehrerer Variabler Bemerkung: (a) Geometrische Interpretation für n = 2: (7.1) x a liegt im offenen Rechteck U δ (a) = {(x 1, x 2 ) : x i a i < δ, i = 1, 2} (U δ (a): offene δ-umgebung von a). Daraus folgt: Zu jedem ε > 0 existiert eine Umgebung U δ (a) mit δ = δ(ε) > 0, so dass für x U δ (a) \ {a} folgt f(x) U ε (G) =]G ε, G + ε[ (vgl. Abb. 7.1). (b) Äquivalente Grenzwertdefinition: Definition 7.2 (Konvergenz einer Punktfolge) Sei x j = (x 1j, x 2j,..., x nj ), j = 1, 2,.... Die Folge (x j ) heißt konvergent gegen den Punkt a R n, in Zeichen lim x j = a, wenn lim x j a = 0, d.h. wenn lim x kj = a k für alle k = 1,..., n. j j j Satz 7.1 Es gilt lim f(x) = G genau dann, wenn lim f(x j ) = G für jede Punktfolge (x j ) in x a j D \ {a}, so dass lim x j = a. j Satz 7.2 (Grenzwertsätze) Existieren die Grenzwerte lim f(x) und lim g(x) zweier Funktionen f, g in a, dann gilt x a x a auch lim(f(x) ± g(x)) = lim f(x) ± lim g(x), x a x a x a lim c f(x) = c lim f(x) für alle c R, x a x a lim f(x)g(x) = lim f(x) lim g(x), x a x a x a f(x) lim x a g(x) = lim f(x) x a lim x a g(x), falls lim x a g(x) 0. 7.1. Stetigkeit Definition 7.3 (Stetigkeit) Die Funktion f : D R, D R n, heißt stetig in x 0 D, wenn lim x x0 f(x) = f(x 0 ). Satz 7.3 Ist f stetig in x 0 und gilt f(x 0 ) > 0 bzw. f(x 0 ) < 0, dann gibt es eine δ Umgebung U δ (x 0 ) von x 0, δ > 0, so daß f(x) > 0 bzw. f(x) < 0 für alle x U δ (x 0 ). Satz 7.4 Seien f, g stetig in x 0. Dann sind auch f ± g, f g stetig in x 0, sowie f g, falls g(x 0 ) 0. 48
7.1. Stetigkeit Satz 7.5 Die Funktion f sei auf einer Menge M R n definiert. M sei kompakt, d.h. M sei abgeschlossen (jeder Randpunkt von M gehört zu M) und beschränkt (es gibt eine Konstante C > 0, so daß x C für alle x M). Ist f stetig auf M, dann besitzt f auf M ein absolutes Maximum und ein absolutes Minimum, d.h. es gibt Punkte a, b M, so daß f(a) f(x) f(b) für alle x M. Definition 7.4 (Gebiet) Eine Menge G R n heißt Gebiet, wenn (a) x G = U δ (x) G für ein δ = δ(x) > 0 und (b) je zwei Punkte von G lassen sich durch einen Streckenzug mit nur endlich vielen Ecken verbinden. Satz 7.6 (Zwischenwertsatz) Die Funktion f(x) sei auf einem Gebiet G definiert. Ferner sei f stetig auf G, und es gelte f(a) < 0 für ein a G und f(b) > 0 für ein b G. Dann gibt es ein x 0 G, so daß f(x 0 ) = 0. 49
7. Grenzwerte von Funktionen mehrerer Variabler 50
8. Partielle Ableitungen 8.1. Partielle Ableitungen 1.Ordnung 8.1.1. Partielle Ableitungen im R 2 Definition 8.1 (partielle Ableitung) (a) Die partielle Ableitung f x (x 0, y 0 ) von f = f(x, y) nach x im Punkt (x 0, y 0 ) ist definiert durch f x (x f(x 0 + h, y 0 ) f(x 0, y 0 ) 0, y 0 ) = lim h 0 h f(x, y 0 ) f(x 0, y 0 ) = lim x x0 x x 0 Statt f x (x 0, y 0 ) schreibt man auch f x (x 0, y 0 ). (b) Die partielle Ableitung f y (x 0, y 0 ) von f = f(x, y) nach y im Punkt (x 0, y 0 ) ist definiert durch f y (x f(x 0, y 0 + k) f(x 0, y 0 ) 0, y 0 ) = lim k 0 k f(x 0, y) f(x 0, y 0 ) = lim. y y0 y y 0 Statt f y (x 0, y 0 ) schreibt man auch f y (x 0, y 0 ). Bemerkung: (a) f x = f x (x, y), f y = f y (b) Praktische Berechnung von f x, f y : (x, y) sind wieder Funktionen 2er Variabler x und y. 51
8. Partielle Ableitungen Betrachte die Schnittfunktionen f 1 (x) = f(x, y 0 ) Schnitt von z = f(x, y) mit der Ebene y = y 0, f 2 (y) = f(x 0, y) Schnitt von z = f(x, y) mit der Ebene x = x 0. Nach Definition 8.1a gilt dann f x (x 0, y 0 ) = f 1(x 0 ) = f erhält man durch Differentiation von f nach x bei festem y. x Mit Definition 8.1b folgt f y (x 0, y 0 ) = f 2(y 0 ) = f erhält man durch Differentiation von f nach y bei festem x. y (c) Geometrische Deutung der partiellen Ableitungen (siehe Abb. 8.1): i) f x (x 0, y 0 ) = f 1(x 0 ): Steigung der Tangente an die Schnittkurve z = f 1 (x) := f(x, y 0 ) der Fläche Φ(z = f(x, y)) mit der Ebene y = y 0 im Punkt (x 0, y 0, z 0 ), z 0 = f(x 0, y 0 ). ii) f y (x 0, y 0 ) = f 2(y 0 ): Steigung der Tangente an die Schnittkurve z = f 2 (y) := f(x 0, y) der Fläche Φ mit der Ebene x = x 0 im Punkt (x 0, y 0, z 0 ). Gleichung der Tangentialebene: z = z 0 + f x (x 0, y 0 )(x x 0 ) + f y (x 0, y 0 )(y y 0 ) mit z 0 = f(x 0, y 0 ). 52
8.1. Partielle Ableitungen 1.Ordnung. BN O J B O N 6 O B N BN O - > A A O O N O t 1 =Tangente an f 1 in (x 0, y 0, z 0 ) mit Steigung f x (x 0, y 0 ) t 2 =Tangente an f 2 in (x 0, y 0, z 0 ) mit Steigung f y (x 0, y 0 ) Die beiden Tangenten t 1, t 2 an die Schnittkurven z = f 1 (x) bzw. z = f 2 (y) spannen die Tangentialebene T an die Fläche Φ(z = f(x, y)) im Punkt (x 0, y 0, z 0 ) auf. Abbildung 8.1.: Partielle Ableitungen im R 2 J 53
8. Partielle Ableitungen 8.1.2. Partielle Ableitungen im R n Definition 8.2 (Partielle Ableitung II) Die partielle Ableitung f (a) von f = f(x 1, x 2,..., x n ) nach x k im Punkt a ist definiert durch f f(a 1,..., a k 1, a k + h, a k+1,..., a n ) f(a 1,..., a k 1, a k, a k+1,..., a n ) (a) = lim h 0 h f(a 1,..., a k 1, x k, a k+1,..., a n ) f(a 1,..., a k 1, a k,..., a n ) = lim x k a k x k a k für k = 1, 2,..., n. Statt f schreibt man auch f xk. Bemerkung: Praktische Berechnung von f = f xk : (a) (b) f = f (x) sind wieder Funktionen von x = (x 1,..., x n ) f = f (x) erhält man durch Differentiation von f nach x k bei festen x 1,..., x k 1, x k+1,..., x n. Satz 8.1 (Ableitungsregeln) Seien f = f(x), g = g(x) Funktionen von n Variablen. Dann gilt für alle k = 1, 2,..., n: (f(x) ± g(x)) = f (x) ± g (x), (f(x) g(x)) = g(x) f (x) + f(x) g (x), (cf(x)) = c f (x) für alle c R, ( ) f(x) g(x) = g(x) f (x) f(x) g (x) [g(x)] 2. Bemerkung: (a) f ist partiell differenzierbar nach x k i.a. f xk stetig. (b) f ist nach allen Variablen partiell differenzierbar i.a. f stetig. 54
8.2. Partielle Ableitungen höherer Ordnung Für f = f(x, y) sind f x = f (x, y) x f y = f wieder Funktionen 2er Variablen x, y. (x, y) y = Für f x, f y 8.2. Partielle Ableitungen höherer Ordnung lassen sich wieder partielle Ableitungen nach x und y definieren. Definition 8.3 (Partielle Ableitungen 2.Ordnung) 2 f = f x 2 xx := ( ) f x x 2 f y x = f xy := y 2 f x y = f yx := x 2 f y 2 = f yy := y ( ) f x ( ) f y ( ) f y = x f x = y f x = x f y = y f y Bemerkung: Analog werden die partiellen Ableitungen 3., 4.,... Ordnung f xxx, f xxy,..., f xxxx, f xxxy,... definiert. Satz 8.2 (Schwarz) Wenn die partiellen Ableitungen f x, f ( ) y, 2 f 2 f bzw. vorhanden sind in einer Umgebung U δ (x 0, y 0 ) von (x 0, y 0 ) und 2 f 2 f ( x y ) y x bzw. stetig ist in ( ) x y y x (x 0, y 0 ), dann existiert auch 2 f 2 f bzw. in (x 0, y 0 ), und es gilt y x x y 2 f x y (x 0, y 0 ) = 2 f y x (x 0, y 0 ). 55
8. Partielle Ableitungen 56
9. Die verallgemeinerte Kettenregel Problem: (a) n = 1: f = f(x), x = x(t), F (t) := f(x(t)) zusammengesetzte Funktion. = F (t) = f (x(t)) x (t) (Kettenregel) (b) n = 2: f = f(x, y) x = x(t) y = y(t) = df dt =? = F (t) = f(x(t), y(t)) zusammengesetzte Funktion. Satz 9.1 (Verallgemeinerte Kettenregel) Die Funktion f = f(x, y) sei definiert auf einem offenen Rechteck a < x < b, c < y < d und besitze dort stetige partielle Ableitungen f x, f y. Für ein Intervall t 1 < t < t 2 gelte ferner a < x(t) < b und c < y(t) < d, wobei x(t), y(t) stetige Funktionen seien. Dann ist F auf t 1 < t < t 2 differenzierbar, und es gilt F (t) = f x (x(t), y(t)) x (t) + f y (x(t), y(t)) y (t), t 1 < t < t 2 oder F (t) = f dx x dt + f dy y dt = f x x + f y y. Bemerkung: Verallgemeinerung auf n 2: Mit den gegebenen Funktionen f = f(x 1, x 2,..., x n ), x k = x k (t), t 1 t t 2, k = 1, 2,..., n erhält man die zusammengesetzte Funktion F (t) = f(x 1 (t), x 2 (t),..., x n (t)). In diesem Fall gilt dann: df dt = n k=1 f dx k dt = f dx 1 x 1 dt + f dx 2 x 2 dt + + f dx n x n dt 57
9. Die verallgemeinerte Kettenregel Satz 9.2 (Erweiterte verallgemeinerte Kettenregel) f = f(x, y), x = x(u, v), y = y(u, v) = F (u, v) = f(x(u, v), y(u, v)). Unter analogen Voraussetzungen wie in Satz 9.1 gilt: F u = f x x u + f y y u, F v = f x x v + f y y v. 58
10. Der Mittelwertsatz für Funktionen mehrerer Variabler Bemerkung: Der Mittelwertsatz (MWS) in R: (a) f(x 0 + h) f(x 0 ) }{{} = f = hf (x 0 + ϑh), 0 < ϑ < 1 hf (x 0 ) = df, wenn h klein = f df, wenn h klein. (b) Statt h schreibt man auch h = x oder h = dx. Problem: Analoge Darstellung von f im R n, n > 1, wie im Fall n = 1. Gegeben sei eine Funktion f = f(x 1, x 2,..., x n ), beliebiger, aber fester Punkt x 0 = (x 01, x 02,..., x 0n ) und h = (h 1, h 2,..., h n ) R n. Bemerkung: Statt h schreibt man auch h = x = ( x 1, x 2,..., x n ) oder h = dx = (dx 1, dx 2,..., dx n ). Zu untersuchen ist f = f(x 01 + h 1, x 02 + h 2,..., x 0n + h n ) f(x 01, x 02,..., x 0n ). Zurückführung des Problems von n > 1 auf n = 1: Sei F (t) := f(x 0 + th) = f(x 01 + th 1, x 02 + th 2,..., x 0n + th n ). Dann gilt: F (0) = f(x 0 ) F (1) = f(x 0 + h) f = F (1) F (0). Mit x = x(t) = x 0 + th oder x k = x k (t) = x 0k + th k, k = 1,..., n, gilt dann nach der verallgemeinerten Kettenregel, Satz 9.1: F (t) = f dx 1 x 1 dt + f dx 2 x 2 dt + + f dx n x n dt = n k=1 f (x 0 + th)h k. 59
10. Mittelwertsatz Die Anwendung des MWS für Funktionen einer Variablen liefert schließlich f = F (1) F (0) = F (0 + ϑ(1 0))(1 0) = F (ϑ) mit 0 < ϑ < 1. Daraus folgt der Satz 10.1 (Verallgemeinerter MWS) Es gibt ein 0 < ϑ < 1, so dass f(x 0 + h) f(x 0 ) = n k=1 f (x 0 + ϑh) h k. Definition 10.1 (Gradient) f(x) := grad f (x) := f x 1 (x) f x 2 (x). f x n (x) Bemerkung: Damit lautet der MWS: f = f(x 0 + h) (f(x 0 ) = f(x 0 + ϑh) h =< f(x 0 + ϑh), h >, 0 < ϑ < 1. 10.1. Folgerungen aus dem MWS Voraussetzung: Die partiellen Ableitungen f (x), k = 1, 2,..., n, sind stetig. = f (x 0 + ϑh) f (x 0 ), wenn h klein. ( alle h k, k = 1,..., n, klein) = f = f(x 0 + h) f(x 0 ) = f(x 0 + ϑh) h f(x 0 ) h Satz 10.2 Ist h klein ( alle h k sind klein), dann gilt f = f(x + h) f(x) f(x) h = n k=1 f (x) h k. 60
10.1. Folgerungen aus dem MWS Definition 10.2 (Totales Differential) Bemerkung: df = df x,h := f(x) h = f(x) dx = f(x) x = n f n f (x)h k = (x)dx k = k=1 k=1 (a) Nach Satz 10.2 gilt für den totalen Zuwachs f von f: wenn h ( dx, x ) klein ist. (b) Es gilt auch f(x + h) f(x) + df. f = f(x + h) f(x) df n k=1 f (x) x k (c) Ist z = f(x), w = f(x) usw., dann schreibt man auch df = dz, df = dw usw. 10.1.1. Anwendungen des totalen Differentials in der Fehlerrechnung Problem: Abschätzung des Fehlers bei der Berechnung einer Größe z = f(x, y) aus Näherungswerten x, ỹ von x bzw. y: } { x x Näherungswerte von = z = f( x, ỹ) ist eine Approximation von z = f(x, y), ỹ y d.h. x = x + dx = ỹ }{{} Messwerte y }{{} exakte Werte + dy }{{} Messfehler Somit gilt für den Fehler z bei der Approximation: z = z z = f(x, y) f( x, ỹ) = f( x + dx, ỹ + dy) f( x, ỹ) dz, wenn die Messfehler dx, dy betragsmäßig klein sind. Daraus folgt Bemerkung: (a) Abschätzung des Absolutfehlers: z dz = f f ( x, ỹ)dx + ( x, ỹ)dy. x y z dz f ( x, ỹ) dx + f ( x, ỹ) dy. x y 61
10. Mittelwertsatz (b) Abschätzung des relativen Fehlers: z z = dz z 1 z ( f x ) f ( x, ỹ)dx + ( x, ỹ)dy. y 62
11. Implizite Funktionen, implizite Differentiation 11.1. Implizite Funktionen zweier Variabler Die Lösung eines technischen Problems sei beschreibbar durch eine Funktion y = y(x) = ϕ(x). In einigen Fällen erhält man die Lösungsfunktion y = y(x) = ϕ(x) nicht in expliziter Form, sondern in impliziter Form 0 f(x, y(x)) = f(x, ϕ(x)) (11.1) wobei f = f(x, y) eine (komplizierte) Funktion der Variablen x, y ist. Definition 11.1 (Implizite Funktion) Gilt (11.1), so heißt die Funktion y = y(x)(= ϕ(x)) implizit durch die Beziehung f(x, y) = 0 definiert. Problem: (a) Auflösbarkeit von f(x, y) = 0 nach y = y = y(x) = ϕ(x) (b) Formel für die Ableitung dy dx = ϕ (x) (implizite Differentiation) Satz 11.1 (Existenz von y = y(x)) Für einen Punkt (x 0, y 0 ) gelte: (a) f(x 0, y 0 ) = 0, (b) f y (x, y) existiere in einer Umgebung V (x 0, y 0 ) von (x 0, y 0 ) und sei dort auch stetig, (c) f y (x 0, y 0 ) 0. Dann gibt es in einer Umgebung U(x 0 ) genau eine Funktion y = y(x), so dass (a) y 0 = y(x 0 ), 63
11. Implizite Funktionen, implizite Differentiation (b) 0 = f(x, y(x)) für alle x U(x 0 ). Satz 11.2 (Implizite Differentiation) Zu den Voraussetzungen (a)-(c) von Satz(11.1) gelte noch (d) f x existiere in der Umgebung V (x 0, y 0 ) von (x 0, y 0 ) und sei dort stetig. Dann existiert dy dx = y (x) in einer Umgebung U 1 (x 0 ) von x 0, und es gilt dy dx = y (x) = f x(x, y(x)) (implizite Differentiation) f y (x, y(x)) = f (x, y) x f (x, y) y y=y(x) oder f(x,y)=0 = f x f y, y = y(x) Bemerkung: dy (a) Mit der Formel dx = f x, y = y(x), lässt sich die Ableitung dy f y dx = y (x) in jedem Kurvenpunkt (x, y), y = y(x) berechnen. (b) Analog lassen sich die höheren Ableitungen y (x), y (x),... implizit berechnen! 11.2. Implizite Funktionen mehrerer Variabler An der Stelle der einen Bedingung f(x, y) = 0 hat man oft das Gleichungssystem f 1 (x 1,..., x n, y 1,..., y m ) = 0 f 2 (x 1,..., x n, y 1,..., y m ) = 0. f(x, y) = 0 f m (x 1,..., x n, }{{} unabh. Variablen y 1,..., y m ) }{{} abh. Variablen = 0 64
11.2. Implizite Funktionen mehrerer Variabler zur impliziten Definition von Funktionen y 1 = y 1 (x 1, x 2,..., x n ) y 2 = y 2 (x 1, x 2,..., x n ).. y m = y m (x 1, x 2,..., x n ) y = y(x) Vektorfunktion. Problem: (a) Auflösbarkeit von f(x, y) nach y (b) Berechnung der partiellen Ableitungen y i, i = 1,..., m, k = 1,..., n 11.2.1. Auflösbarkeit Satz 11.3 Für ein System von Werten (x 0 ; y 0 ) = (x 10,..., x n0 ; y 10,..., y m0 ) gelte (a) f(x 0, y 0 ) = 0. (b) Die Funktionen f k = f k (x, y) seien in einer Umgebung des Punktes (x 0, y 0 ) nach allen Variablen x 1,..., x n, y 1,..., y m partiell differenzierbar und die partiellen Ableitungen seien stetig. (c) Die (m, m)-funktionalmatrix f 1 (x, y) y 1 f 2 (x, y) f y = y 1. f m (x, y) y 1 f 1 y 2 (x, y)... f 2 y 2 (x, y).... f m y 2 (x, y).... f 1 y m (x, y) f 2 y m (x, y) f m y m (x, y) = f (x, y) y ist im Punkt (x 0, y 0 ) nicht singulär. Dann gibt es in einer Umgebung U(x 0 ) genau ein System von Funktionen y 1 = y 1 (x), y 2 = y 2 (x),..., y m = y m (x), kurz y = y(x), so dass 65
11. Implizite Funktionen, implizite Differentiation (a) y 0 = y(x 0 ) (b) 0 = f(x, y(x)) für alle x U(x 0 ). Bemerkung: Die Funktionalmatrix f y ist in (x 0, y 0 ) genau dann nicht singulär, wenn dort det f y 0 ist. Definition 11.2 (Jacobideterminante) Die Determinante det f (x, y) der Funktionalmatrix heißt Funktionaldeterminante oder Jacobische Determinante von f in (x, y). Sie y wird auch mit bezeichnet. (f 1,..., f m ) (y 1,..., y m ) = det f y 11.2.2. Berechnung der ersten partiellen Ableitungen Es seien dieselben Voraussetzungen wie in Satz 11.3 erfüllt. Die Ableitungen y i existieren also in einer Umgebung von x 0. Die Funktionen erfüllen die Gleichungen: 0 = f i (x 1, x 2,..., x n, y 1 (x 1,..., x n ), y 2 (x 1,..., x n ),..., y m (x 1,..., x n )) für i = 1, 2,..., m und alle x in einer Umgebung von x 0. Sei 1 k n. Dann gilt nach der verallgemeinerte Kettenregel 0 = 0 = f i (x, y(x)) + m j=1 f i y j (x, y(x)) y j für alle i = 1, 2,..., m. Vektorielle Darstellung dieser m Gleichungen: f 1 (x, y(x)) f 1 (x, y(x))... y 1 (x) y m.. f m (x, y(x)) f m (x, y(x))... y 1 y }{{ m } f = (x, y(x)) y y 1 (x). y m (x) = f 1 (x, y(x)). f m (x, y(x)). 66
11.2. Implizite Funktionen mehrerer Variabler Da f y in (x 0, y 0 ), y 0 = y(x 0 ) nicht singulär ist, ist die Funktionalmatrix in einer ganzen Umgebung von (x 0, y 0 ) nicht singulär. Somit gilt der folgende Satz 11.4 (Implizite Differentiation, allgemeiner Fall) Die Voraussetzungen von Satz 11.3 seien erfüllt. Dann existieren in einer Umgebung U(x 0 ) partiell differenzierbare Funktionen y(x) = (y 1 (x),..., y m (x)), so dass f(x, y(x)) = 0 für alle x U(x 0 ), und ihre ersten partiellen Ableitungen sind gegeben durch y 1 (x). y m (x) ( f = (x, y(x)) y ) 1 f 1 (x, y(x))., k = 1,..., n für alle x U(x 0 ). f m (x, y(x)) Bemerkung: Dieses Resultat ist analog zu Satz 11.2 für y = y(x). 67
11. Implizite Funktionen, implizite Differentiation 68
12. Die Richtungsableitung Gegeben seien: (a) Funktion f = f(x) = f(x 1, x 2,..., x n ), (b) fester Punkt x 0 = (x 10, x 20,..., x n0 ), (c) Richtungsvektor h = (h 1, h 2,..., h n ), h = 1, (d) Gerade g durch x 0 in Richtung h. N N C N D I )? D I A N N Dann gilt: x g(= s-achse ) x = x(s) = x 0 + sh, s R, (d.h. das Argument x wird jetzt auf die s-achse eingeschränkt). 69
12. Die Richtungsableitung Problem: Gesucht (a) lokales Verhalten von f in x 0 längs der s-achse (b) Richtung der größten Zuwachs- oder Anstiegsrate (Zuwachs pro s-maßeinheit) von f in x 0 Betrachte hierzu die Funktion F = F (s): F (s) = f(x(s)) = f(x 0 + sh) = f(x 10 + sh 1, x 20 + sh 2,..., x n0 + sh n ) F (0) = f(x 0 ). (a) Lokales Verhalten von f in x 0 längs der s-achse Dieses wird beschrieben durch den Grenzwert = F (0) = lim s 0 F (s) F (0) s 0 F lim s 0 s = lim F (s) F (0) s 0 } s {{ 0 } relativer Zuwachs von f = F (0) ist die Zuwachsrate von f im Punkt x 0 in Richtung h. Definition 12.1 (Richtungsableitung) Der Grenzwert F (0) heißt Richtungsableitung von f im Punkt x 0 in Richtung h; diese wird mit f h (x f 0), s (x 0) oder f (x 0 ; h) bezeichnet, es gilt also Berechnung der Richtungsableitung: f s (x 0) = f h (x f(x 0) := lim 0 + sh) f(x 0 ). s 0 s 0 f s (x 0) = F (0) F (s) = f(x 0 + sh) T h. Satz 12.1 Es gilt f s (x 0) = f h (x 0) = f(x 0 ) h =< f(x 0 ), h > 70
12.1. Eine weitere Eigenschaft des Gradienten f (b) Bestimmung der Richtung h mit der maximalen Zuwachsrate (des maximalen relativen Zuwachses) von f in x 0 Aus (a) folgt für die Zuwachsrate (den relativer Zuwachs) von f in x 0 in Richtung h: f s (x 0) =< f(x 0 ), h >= f(x 0 ) h cos ( f(x }{{}}{{} 0 ), h) = f(x }{{} 0 ) cos ϕ. feste Zahl = 1 nur abhängig von h Offensichtlich ist cos ϕ und damit auch f s (x 0) maximal, wenn ϕ = 0, d.h., wenn h in Richtung von f(x 0 ) zeigt! BN D Satz 12.2 Der Gradient f(x 0 ) zeigt in Richtung des stärksten Anstiegs von f, also h max. Zuwachsrate in x0 = f(x 0) f(x 0 ). 12.1. Eine weitere Eigenschaft des Gradienten f Wir betrachten die Niveau-Flächen Φ im R n von f Φ = Φ C = {x R n : f(x) = f(x 1, x 2,..., x n )}. mit einer Konstanten C. In Kurzform setzt man auch Φ : f(x 1, x 2,..., x n ) = C. (12.1) Voraussetzung: (12.1) lässt sich nach mindestens einer der Variablen x 1, x 2,..., x n auflösen, also x n = ϕ(x 1, x 2,..., x n 1 ) mit einer Funktion ϕ der Variablen x 1,..., x n. Betrachte dann die Tangentialebene T an Φ in einem Punkt x 0 Φ, d.h. x n0 = ϕ(x 10, x 20,..., x n 1,0 ). Bemerkung: Für n = 3 hat T nach Kapitel 8 die Darstellung x 3 = x 30 + ϕ x1 (x 10, x 20 )(x 1 x 10 ) + ϕ x2 (x 10, x 20 )(x 2 x 20 ). Für beliebiges n 2 gilt der folgende 71
12. Die Richtungsableitung Satz 12.3 (Gleichung der Tangentialebene) Problem: ϕ =? Nach Definition von ϕ gilt x n = x n0 + n 1 k=1 ϕ (x 10, x 20,..., x n 1,0 )(x k x k0 ). C f(x 1, x 2,..., x n 1, ϕ(x 1, x 2,..., x n 1 )). }{{} C g(x 1, x 2,..., x n 1 ) Daraus folgt mit der verallgemeinerten Kettenregel: Für x = x 0 folgt dann 0 = C = g = f + f x n ϕ für alle 1 k n 1. 0 = f (x 0 ) + f x n ϕ (x 10,..., x n 1,0 ), k = 1, 2,..., n 1, Mit der hinreichenden Voraussetzung f 0 für die Auflösbarkeit von f(x 1,..., x n ) = C x n nach x n in einer Umgebung von x 0, folgt dann: Damit gilt für T auch die Darstellung: ϕ (x 10,..., x n 1,0 ) = x n = x n0 Dies ist genau dann der Fall, wenn n k=1 n 1 k=1 f (x x 0 ) k f (x x 0 ) n f (x x 0 ) k (x f k x k0 ). (x x 0 ) n f (x 0 )(x k x k0 ) = 0,. also < grad f(x 0 ), x x 0 >= 0 = f(x 0 ) (x x 0 ). 72
12.1. Eine weitere Eigenschaft des Gradienten f Satz 12.4 (Gleichung der Tangentialebene) Die Tangentialebene T an Φ: f(x 1, x 2,..., x n ) = C im Punkt x 0 hat die Darstellung < grad f(x 0 ), x x 0 >= 0 oder f(x 0 ) x = f(x 0 ) x 0. Bemerkung: Die Gleichung der Tangentialebene T bedeutet auch, dass d.h. der Gradient steht senkrecht auf T. Damit gilt: x T = x x 0 f(x 0 ), Korollar 12.1 Der Gradient f(x 0 ) steht senkrecht auf der Tangentialebene T an die Fläche Φ : f(x 1,..., x n ) = C im Punkt x 0 und weist in Richtung des stärksten Anstiegs von f (bzw. C). 73
12. Die Richtungsableitung 74
13. Der Satz von Taylor für Funktionen von mehreren Variablen Gegeben seien: (a) Funktion f = f(x) = f(x 1, x 2,..., x n ), (b) fester Punkt x 0 = (x 10, x 20,..., x n0 ), (c) Vektor x = dx = h = (h 1, h 2,..., h n ). Problem: Analog zum Fall n = 1 (eine Variable x 1 = x) finde man eine Entwicklung des Zuwachses f = f(x 0 + h) f(x 0 ) nach Potenzen von h 1, h 2,..., h n. Wie beim MWS für Funktionen von mehreren Variablen erfolgt die Zurückführen des Problems von n > 1 auf n = 1 durch Einführung einer geeigneten Funktion F = F (t) einer einzigen Variablen t. Definiere (wie beim verallgemeinerten MWS): F (t) := f(x 0 + th) = f(x 10 + th 1, x 20 + th 2,..., x n0 + th n ) Ferner sei vorausgesetzt: f ist hinreichend oft differenzierbar nach allen Variablen x 1, x 2,..., x n. 13.1. Eigenschaften von F (t) (a) F (t) = f(x 0 + th), 0 t 1, d.h. F (0) = f(x 0 ) F (1) = f(x 0 + h) = f = F (1) F (0) = F = F (t 0 + t) F (t 0 ) mit t 0 = 0, t = 1 (b) Alle Ableitungen F (t), F (t),..., F (M) (t) bis zu einer gewissen Ordnung M existieren und alle Ableitungen lassen sich mit der verallgemeinerten Kettenregel berechnen. 75
13. Satz von Taylor Aus Kapitel 10 folgt: F (t) = d dt f(x 0 + th) = < f(x 0 + th), h >= n k=1 f (x 0 + th)h k, F (t) = d dt F (t) = n d f h k (x dt x 0 + th). k k=1 Zur Vereinfachung sei n = 2: x(t) := (x 1 (t), x 2 (t)) = (x 10 + th 1, x 20 + th 2 ) = x 0 + th. Dann gilt nach der Kettenregel: F (t) = h 1 d dt f x 1 (x 0 + th) + h 2 d dt f x 2 (x 0 + th) = h 1 (f x1 x 1 (x 0 + th)h 1 + f x1 x 2 (x 0 + th)h 2 ) +h 2 (f x2 x 1 (x 0 + th)h 1 + f x2 x 2 (x 0 + th)h 2 ) = h 1 f x1 x 1 (x 0 + th)h 1 + h 1 f x1 x 2 (x 0 + th)h 2 +h 2 f x2 x 1 (x 0 + th)h 1 + h 2 f x2 x 2 (x 0 + th)h 2 = f x1 x 1 h 2 1 + 2f x1 x 2 h 1 h 2 + h 2 2f x2 x 2 (Satz von Schwarz) f x1 x 1 f x1 x 2 = (h 1, h 2 ) } f x2 x 1 f x2 x {{ 2 } 2 F (x 0 +th) ( h1 h 2 ) = h 2 fh Bemerkung: (a) 2 f(x 0 + th) ist die Matrix der 2. partiellen Ableitung und heißt auch Hessematrix. (b) Dieselbe Formel für F (t) gilt auch für ein beliebiges n 2. 76
13.2. Anwendung der Taylorformel für Funktionen einer Variablen auf die Funktion F Satz 13.1 Für F (t) = f(x 0 + th) gilt wobei 2 f definiert ist durch F (t) = h 2 f(x 0 + th)h, 2 f = 2 xf = f x1 x 1 f x1 x 2... f x1 x n f x2 x 1 f x2 x 2... f x2 x n... (Matrix der 2. partiellen Ableitungen). f xnx 1 f xnx 2... f xnx n Bemerkung: (a) Nach dem Satz von Schwarz (Satz 8.2) ist 2 f eine symmetrische Matrix. (b) Analog lassen sich die höheren Ableitungen F (t), F (4) (t),... mit Hilfe der verallgemeinerten Kettenregel berechnen. 13.2. Anwendung der Taylorformel für Funktionen einer Variablen auf die Funktion F Seien T m das m-te Taylorpolynom von F und R m das Restglied von F in Lagrange-Form. Dann gilt: allgemeines t 0, t Entwicklungspunkt t 0 = 0, t = 1 F (t) = T m (t) + R m (t) F (1) = T m (1) + R m (1) T m (t) = m F (k) (t 0 ) (t t 0 ) k T m (1) = k! m F (k) (0) k! wobei 0 < ϑ < 1. Also ist: R m (t) = F (m+1) (t 0 + ϑ(t t 0 )) (t t 0 ) m+1 R m (1) = F (m+1) (ϑ) (m + 1)! (m + 1)! F (1) = m F (k) (0) k! + F (m+1) (ϑ) (m + 1)! = F (0) + F (0) + 1 2! F (0) + + 1 m! F (m) (0) + F (m+1) (ϑ) (m + 1)! }{{} Restglied mit 0 < ϑ < 1. 77
13. Satz von Taylor Wegen F (1) = f(x 0 + h) F (0) = f(x 0 ) F (0) = < f(x 0 ), h >= df x0,h gilt der folgende Satz 13.2 (Taylorformel für Funktionen mehrerer Variabler) f(x 0 + h) f(x 0 ) = df x0,h + 1 2! F (0) + + 1 m! F (m) (0) + F (m+1) (ϑ) (m + 1)! mit 0 < ϑ < 1. Definition 13.1 (Differentiale höherer Ordnung) d (k) f = d (k) f x0,h := F (k) (0) heißt Differential k-ter Ordnung. Damit gilt auch f(x 0 + h) = f(x 0 ) + m k=1 1 1 k! d(k) f + (m + 1)! F (m+1) (ϑ) }{{} Restglied mit 0 < ϑ < 1. Spezialfälle: (a) m = 0 = f(x 0 + h) = f(x 0 ) + F (ϑ) = f(x 0 ) + f(x 0 + ϑh) h, 0 < ϑ < 1. Das ist der MWS für Funktionen mehrerer Variabler. (b) m = 1 f(x 0 + h) = f(x 0 ) + df x0,h + 1 2! F (ϑ) mit 0 < ϑ < 1 Für Vektoren h mit kleiner Norm erhält man (c) m = 2 = f(x 0 ) + df x0,h + 1 2 h 2 f(x 0 + ϑh) x 2 h. f(x 0 + h) f(x 0 ) + f(x 0 ) h + 1 2 h 2 f x 2 (x 0)h, f(x 0 + h) = f(x 0 ) + df x0,h + 1 2 d2 f x0,h + 1 3! F (ϑ), 0 < ϑ < 1. 78
13.2. Anwendung der Taylorformel für Funktionen einer Variablen auf die Funktion F Zur Vereinfachung sei n = 2. Dann gilt für F (t) = f(x 0 + th): F (t) = f x1 x 1 h 2 1 + 2f x1 x 2 h 1 h 2 + f x2 x 2 h 2 2 F (t) = f x1 x 1 x 1 h 3 1 + f x1 x 1 x 2 h 2 1h 2 + 2f x1 x 2 x 1 h 2 1h 2 + 2f x1 x 2 x 2 h 1 h 2 2 + f x2 x 2 x 1 h 2 2h 1 + f x2 x 2 x 2 h 3 2 = f x1 x 1 x 1 h 3 1 + 3f x1 x 1 x 2 h 2 1h 2 + 3f x1 x 2 x 2 h 1 h 2 2 + f x2 x 2 x 2 h 3 2 (Satz von Schwarz) 79
13. Satz von Taylor 80
14. Extremwertaufgaben: Maxima und Minima bei Funktionen mehrerer Variabler Sei f = f(x) = f(x 1, x 2,..., x n ) definiert auf G R n und x 0 = (x 10, x 20,..., x n0 ) T ein fester Punkt aus G. Definition 14.1 (Minima und Maxima) x 0 heißt lokale (oder relative) Minimal- bzw. Maximalstelle von f, wenn eine Umgebung U δ (x 0 ) G existiert mit δ > 0, so dass f(x) f(x 0 ) bzw. f(x) f(x 0 ) für alle x U δ (x 0 ) (14.1) f(x 0 ) heißt dann lokales Minimum bzw. Maximum. Gilt die Ungleichung (14.1) für alle x G, so heißt x 0 eine globale Minimal- bzw. Maximalstelle von f bez. G und f(x 0 ) heißt dann globales Minimum bzw. Maximum von f bez. G. Ein Minimal- oder Maximalpunkt heißt auch Extremalpunkt. N! BN N 6 BN N N N Bemerkung: Ein globaler Exremalpunkt, der im Inneren von G liegt, ist auch ein lokaler Extremalpunkt. 81
14. Extremwertaufgaben 14.1. Kriterien für lokale Extremalstellen 14.1.1. Notwendige Bedingung Satz 14.1 (Notwendige Optimalitätsbedingung) Sei x 0 eine lokale Extremalstelle (lok. Minimal- oder lok. Maximalstelle). Existieren die partiellen Ableitungen f (x 0 ), k = 1, 2,..., n, so ist Bemerkung: f(x 0 ) = 0, d.h. (a) f(x 0 ) = 0 i.a. x 0 = Extremalstelle f (x 0 ) = 0 für alle k = 1, 2,..., n. (b) Punkte x 0 mit f(x 0 ) = 0 sind wegen Satz 14.1 Kandidaten für lokale Extremalstellen, sie heißen deswegen auch kritische oder stationäre Punkte. 14.1.2. Hinreichende Bedingung Satz 14.2 (Hinreichende Optimalitätsbedingung) Die Funktion f besitze in x 0 partielle Ableitungen 2.Ordnung. stetige (a) Ist f(x 0 ) = 0 und 2 f x 2 (x 0) positiv definit, so ist x 0 eine lokale Minimalstelle. (b) Ist f(x 0 ) = 0 und 2 f x 2 (x 0) negativ definit, so ist x 0 eine lokale Maximalstelle. Diskussion der Definitheitsvoraussetzung in Satz 14.2: 2 f x positiv (negativ) definit Alle Eigenwerte von 2 f sind positiv (negativ). 2 x2 Spezialfall: n = 2, f = f(x, y) ( 2 fxx f f = xy Eigenwerte λ 1, λ 2 von 2 f x 2 : λ 1/2 = f xx + f yy 2 ± 1 2 f yx f yy (f xx f yy ) 2 + 4f 2 xy ), f xy = f yx. = f xx + f yy 2 ± 1 2 ((f xx + f yy ) 2 4(f xx f yy f 2 xy)) 1/2 = ( ) (( ) fxx + f yy fxx + f yy ± 2 2 ) 1 2 2 f D, D = det x = D(x) 2 82
2 f x 2 positiv (negativ) definit = f xx > 0, f yy > 0 (f xx < 0, f yy < 0) Daraus folgt: 14.1. Kriterien für lokale Extremalstellen Satz 14.3 Sei n = 2 und f habe stetige partielle Ableitungen in x = x 0. (a) Gilt (b) Gilt dann ist x 0 eine lokale Minimalstelle. dann ist x 0 eine lokale Maximalstelle. Bemerkung: f(x 0 ) = 0 f xx (x 0 ) > 0 ( f yy (x 0 ) > 0) D(x 0 ) > 0, f(x 0 ) = 0 f xx (x 0 ) < 0 ( f yy (x 0 ) < 0) D(x 0 ) > 0, (a) f(x 0 ) = 0, f xx (x 0 ) > 0 ( f yy (x 0 ) > 0), D(x 0 ) = 0 = x 0 ist eine schwache lokale Minimalstelle (d.h., f hat Minima längs einer Geraden). (b) f(x 0 ) = 0, D(x 0 ) < 0 2 f x 2 (x 0) ist indefinit = x 0 ist ein Sattelpunkt. 83
14. Extremwertaufgaben 84
15. Extremwertaufgaben mit Nebenbedingungen Bei vielen Problemen der Naturwissenschaften, Technik und Ökonomie treten Extremwertaufgaben auf, bei denen nicht einfach ein lokales Extremum einer Funktion f = f(x) = f(x 1, x 2,..., x n ) gesucht ist, sondern es müssen bei der Minimierung oder Maximierung von f noch gewisse gegebene Bedingungen (Restriktionen) der Art g 1 (x) = g 1 (x 1, x 2..., x n ) = 0 g 2 (x) = g 2 (x 1, x 2..., x n ) = 0... g m (x) = g m (x 1, x 2..., x n ) = 0 m(< n) Restriktionen beachtet werden, wobei g i = g i (x), i = 1,..., m, gegebene Funktionen sind. Man spricht hierbei auch von einem restringierten Problem. Problem:(P ) Man finde eine lokale Extremalstelle x 0 von f unter den Nebenbedingungen g i (x) = 0, i = 1, 2..., m, d.h. man finde ein x 0 R n, so dass für ein δ > 0 f(x 0 ) ( )f(x) für alle x U δ (x 0 ) mit g i (x) = 0, i = 1, 2..., m, gilt (U δ (x 0 ) = δ Umgebung von x 0 ). Bemerkung: Ist f(x 0 ) ( )f(x) für alle x R n mit g i (x) = 0, i = 1,..., m, so heißt x 0 eine globale Extremalstelle unter den Nebenbedingungen g i (x) = 0, i = 1,..., m. Hilfsmittel: Theorie impliziter Funktionen Restriktionen: g 1 (x 1, x 2,..., x n m, x n m+1,..., x n ) = 0 g 2 (x 1, x 2,..., x n m, x n m+1,..., x n ) = 0.. wobei m < n. g m (x 1, x 2,..., x n m }{{} = x, x n m+1,..., x n ) }{{} =y = 0, 85
15. Extremwertaufgaben mit Nebenbedingungen D.h. x enthält m n Variablen x 1,..., x n m x = x 1 x 2. x n m und y enthält m Variablen x n m+1,..., x n y = x n m+1 x n m+2 Die Restriktionen lassen sich dann schreiben als g(x) = g( x, y) = 0 (vgl. Kapitel 11). Voraussetzung: x 0 = ( x 0, y 0 ) sei eine lokale Extremalstelle von f unter den Restriktionen g(x) = g( x, y) = 0. Annahme:. x n (a) Die partiellen Ableitungen 1.Ordnung von f und g i, i = 1,..., m existieren und sind stetig.. (b) Die Funktionalmatrix g y (x 0), x 0 = ( x 0, y 0 ) ist regulär. Aus Satz 11.3 und Satz 11.4 folgt dann: Die Gleichung g(x) = g( x, y) = 0 lässt sich in einer Umgebung von x 0 nach y auflösen, und die partiellen Ableitungen von y = y( x) lassen sich mittels impliziter Differentiation berechnen. Es ist y( x 0 ) = y 0. Für die Restriktionen gilt somit: g(x) = g( x, y) = 0 y = y( x) in einer Umgebung von x 0. (P ) Problem m. Restr. Theorie impliziter Funktionen ( P ) Problem ohne Restr. hat Lösung x 0 hat Lösung x 0 min(max)f(x) bez. min(max)f( x, y) bez. min(max)f( x, y( x)) bez. g(x) = 0 g( x, y) = 0 }{{} x R n m x = y( x) Das heißt: Das Ausgangsproblem (P ) mit Restriktionen ist äquivalent zum unrestringierten Problem ( P ). Da x 0 eine lokale Extremalstelle von (P ) ist, folgt, dass auch x 0 eine lokale Extremalstelle von ( P ) ist. Die notwendigen und hinreichenden Optimalitätsbedingungen für x 0 folgen dann aus Satz 14.1 und Satz 14.2. 86
15.1. Notwendige Optimalitätsbedingungen 15.1. Notwendige Optimalitätsbedingungen Sei f( x) := f( x, y( x)). Aus Satz 14.1 folgt dann f( x0 ) = 0 als notwendige Bedingung für ein lokales Extremum. Zu berechnen ist somit ( f( x) = f,..., f ). x 1 x n m Für 1 k n m ist nach der verallgemeinerten Kettenregel und Satz 11.4 über implizite Funktionen f = f n f x i + x i = f + i=n m+1 m i=1 f y i y i = f ( x, y( x)) + y f( x, y( x)) y( x) = f ( x, y( x)) + y f( x, y( x)) ( g ( x, ) y( x)) 1 g(x, y( x)). y Somit gilt für x 0 die notwendige Optimalitätsbedingung (x 0 = ( x 0, y( x 0 ))) : 0 = f (x x 0 ) y f(x 0 ) g k y (x 0) 1 g(x x 0 ) für alle k = 1,..., n m, (15.1) k ( f wobei g(x 0 ) = 0 und y f =,..., f ) ( ) f f =,...,. x n m+1 x n y 1 y m 15.1.1. Verfahren von Lagrange Praktisches Verfahren zur Herleitung von (15.1). Definition 15.1 (Lagrangefunktion, Lagrange-Multiplikatoren) Die Funktion m L = L(x, λ) = L(x 1, x 2,..., x n, λ 1,..., λ m ) := f(x) + λ i g i (x) heißt Lagrangefunktion. Die Parameter λ 1, λ 2,..., λ m heißen Lagrange-Multiplikatoren Man betrachte nun das Gleichungssystem: 0 = L, k = 1, 2..., n 0 = L λ i, i = 1, 2,..., m (S) i=1 87
15. Extremwertaufgaben mit Nebenbedingungen oder explizit 0 = f + m i=1 λ i g i, k = 1,..., n 0 = g i (x), i = 1, 2,..., m. (S) (a) Wir untersuchen nun die Gleichungen k = n m+1,..., n von (S) mit x = x 0. Vektoriell geschrieben lauten sie: 0 = y f(x 0 ) + λ g y (x 0), y = (x n m+1,..., x n ). ( ) g 1 Die Lagrange-Multiplikatoren lassen sich somit darstellen durch λ = y f(x 0 ) y (x 0). (b) Einsetzen von λ in den restlichen Gleichungen k = 1,..., n m von (S) ergibt mit x = x 0 wobei g(x 0 ) = 0 0 = f (x x 0 ) + λ g(x k x 0 ) k = f (x 0 ) y f(x 0 ) ( ) g 1 y (x 0) g(x x 0 ), k Da dieses System genau mit dem System (15.1) übereinstimmt, ist folgender Satz bewiesen: Satz 15.1 (Verfahren von Lagrange) (a) Man definiere die Lagrange-Funktion L(x, λ) = f(x) + m λ i g i (x). i=1 (b) Man betrachte das Gleichungssystem 0 = L, k = 1, 2,..., n 0 = L λ i, i = 1, 2,..., m in den n + m Unbekannten x 1, x 2,..., x n, λ 1, λ 2,..., λ m. (c) Man eliminiere die Lagrangemultiplikatoren λ 1,..., λ m. Das resultierende Gleichungssystem in x = (x 1,..., x n ) stellt dann die notwendigen Optimalitätsbedingungen für eine lokale Extremalstelle x = x 0 des Ausgangsproblems (P ) dar. 88
15.2. Hinreichende Optimalitätsbedingungen für (P ) Bemerkung: Die Elimination von λ erfordert, dass ein Teilvektor y von x mit m Komponenten existiert, so dass die Funktionalmatrix g y in dem Punkt x 0 regulär ist! Rg g y (x 0) = m. 15.2. Hinreichende Optimalitätsbedingungen für (P ) Hinreichende Optimalitätsbedingungen für (P ) erhält man mit Hilfe des äquivalenten unrestringierten Problems ( P ). Untersuchung der Hessematrix 2 f( x0 ): Wie zu Beginn von Kapitel 15 setzen wir x 1 x 2. x s x =... mit s + m = n. y 1 y 2. y m Nach Abschnitt 15.1 gilt dann: f = f + m i=1 f y i y i, k = 1, 2,..., s, wobei die Ableitungen y i bestimmt sind durch die Gleichungen 0 = g j ( x, y( x)) = g j + Berechnung der 2.Ableitungen von f( x): 2 f x l = = 2 f x l + 2 f x l + + m i=1 m t=1 m i=1 m i=1 m i=1 2 f y i y i x l + 2 f y i y i x l + 2 f y i y t y i y t x l + g j y i y i, k = 1,..., s, j = 1,..., m. m i=1 m i=1 i=1 x l ( ) f y i + y i 2 f y i x l y i m f 2 y i y i x l i=1 m f 2 y i für k, l = 1,..., s. y i x l 89
15. Extremwertaufgaben mit Nebenbedingungen Gestalt von 2 f(x): Es ist 2 f(x) = f x1 x 1... f x1 x s f x1 y 1... f x1 y m.... f xsx1... f xsxs f xsy1... f xsym f y1 x 1... f y1 x s f y1 y 1... f y1 y m.... f ymx1... f ymxs f ymy1... f ymym = 2 f x x 2 f y x 2 f x y 2 f y y und y x = y 1 x 1.... y m x 1... y 1 x s. y m x s. Nach dieser Zerlegung von 2 f(x) gilt: 2 f( x) = 2 f x x + 2 f x y y x + = ( y ( ) y 2 f y m + x y y x + ( I x ) 2 f y x f 2 y i y i=1 i x x ( ) y ) 2 f(x) I m y f + x y x i=1 i 2 y i x x Zu berechnen bleibt: Es gilt: 2 y i x x. 0 = g j + m i=1 Durch Differentiation nach x l, l = 1,..., s, folgt g j y i y i, j = 1, 2,..., m, k = 1,..., s. 0 = 2 g j x l + + m i=1 m i=1 2 g j y i y i x l + m i=1 2 g j y i x l y i + m i=1 g j 2 y i, k, l = 1,..., s, j = 1,..., m. y i x l m t=1 2 g j y i y t y i y t x l 90
15.2. Hinreichende Optimalitätsbedingungen für (P ) Mit der obigen Zerlegung folgt dann: 0 = 2 g j x x + 2 g j y x y x + + m i=1 ( y x ) 2 g j y x + g j 2 y i, j = 1,..., m. y i x x ( y x ) 2 g j y y ( ) y Voraussetzung: Die Lagrange-Multiplikatoren λ = (λ 1,..., λ m ) seien nun nach dem Lagrange- Verfahren bestimmt, d.h. 0 = L (x 0, λ) = f + = λ = f ( ) g 1 y (x 0) y (x 0) für ein bestimmtes x 0. Multiplikation der Matrixgleichung mit λ j m x = x 0 und h := λ j g j : j=1 0 = 2 h x x + 2 h x y ( m m g j = λ j = i=1 } y j=1 i {{ } = f y i ( ( ) y ) I x ( y y x + x ) 2 y i x x 2 h(x 0, λ) x x m i=1 λ i g i, k = 1,..., n. x und Summation über j = 1,..., m liefert mit ) 2 h y x + I y x ( y i=1 x ) 2 h y y m f 2 y i y i x x. ( ) y x Damit gilt schließlich 2 f( x0 ) = = ( + ( I ( I ( ) y ) x ( x 0) 2 f(x 0 ) I ( ) y ) 2 x ( x 0) I y x ( x 0) m λ i g i ( x 0 ) x x i=1 ( ) y ) x ( x 0) 2 xl(x 0, λ) I y x ( x 0) I y x ( x 0). 91
15. Extremwertaufgaben mit Nebenbedingungen Satz 15.2 (Hinreichende Bedingungen) Für einen Punkt x 0 mit Rg g y (x 0) = m gelte 0 = L (x 0, λ), k = 1,..., n 0 = L λ i (x 0, λ), i = 1,..., m. (= notwendige Bedingungen für eine lokale Extremalstelle x 0 von (P ) sind erfüllt!) Dann gilt Ist die Matrix 2 f( x 0 ) = ( I ( ) y ) x ( x 0) 2 xl(x 0, λ) 2 L x x (x 0, λ) = 2 f(x 0 ) + I y x ( x 0) m λ i 2 g i (x 0 ) dann positiv bzw. negativ definit, so ist x 0 eine lokale Minimal- bzw. Maximalstelle. i=1. Bemerkung: Die Bedingung, dass 2 xl(x 0, λ) positiv bzw. negativ definit ist, lässt sich wie folgt abschwächen: 2 xl(x 0, λ) ist positiv bzw. negativ definit bezüglich dem Teilraum U = {u R n : g x (x 0)u = 0}. 92
16. Parameterintegrale: Integrale, die von einem Parameter abhängen Gegeben: (a) Eine Funktion f = f(x, y), wobei f und f stetig seien. x y = α(x) (b) Differenzierbare Funktionen in [a, b]. y = β(x) Man betrachte den damit definierten Bereich B: O > N * = N = N > N Spezialfall: α(x) α = konstant = B ist ein Rechteck β(x) β = konstant (c) f sei mindestens auf B definiert. Durch Integration über y bei festgehaltenem x wird folgende Funktion F = F (x) definiert: F (x) = β(x) f(x, y) dy, a x b. α(x) Zu beachten: Der Parameter x tritt sowohl im Integranden als auch in den Integrationsgrenzen auf. Problem: Differentiation von F. 93
16. Parameterintegrale Satz 16.1 (Leibniz-Regel) Unter den obigen Voraussetzungen gilt die Differentiationsformel F (x) = d dx β(x) α(x) f(x, y) dy = β(x) α(x) f (x, y) } x {{} Differentiation unter dem Integral dy + f(x, β(x))β (x) f(x, α(x))α (x) }{{} Beitrag der Grenzen Spezialfälle: (a) α(x) α, β(x) β (b) α(x) α, β(x) = x F (x) = F (x) = x α β α f (x, y) dy, x f (x, y) dy + f(x, y), x (c) f(x, y) = f(y) unabh. von x = f x = 0 F (x) = f(x, β(x))β (x) f(x, α(x))α (x). 94