7.2.1 Zweite partielle Ableitungen

72 72 Höhere Ableitungen 72 Höhere Ableitungen Vektorwertige Funktionen sind genau dann differenzierbar, wenn ihre Koordinatenfunktionen differenzierbar sind Es ist also keine wesentliche Einschränkung, wenn wir in diesem Abschnitt nur reellwertige Funktionen betrachten 721 Zweite partielle Ableitungen Sei G IR n offen, ξ G und f: G IR in G nach x k partiell differenzierbar Ist die partielle Ableitung D k f in ξ G nach x j differenzierbar, so heißt D j D k f(ξ) := D j (D k f) (ξ) eine zweite partielle Ableitung von f in ξ Andere Schreibweisen sind D j D k f(ξ) = f xk x j (ξ) = 2 f x j x k (ξ) = Für j = k schreibt man auch D 2 k f := D kd k f bzw 2 f x 2 k ( ) f x j x (ξ) k = ( ) f x k x k Im allgemeinen kommt es bei den zweiten Ableitungen auf die Reihenfolge an (Beispiel siehe Aufgabe 751A) Es gilt aber Satz von HASchwarz: Sei G IR n offen und f: G IR in G nach x k und x j differenzierbar f und die partiellen Ableitungen D j f und D k f seien in G stetig D j f sei in G nach x k differenzierbar und die zweite partielle Ableitung D k D j f sei in ξ G stetig Dann ist auch D k f in ξ nach x j differenzierbar und es gilt D k D j f (ξ) = D j D k f (ξ) bzw 2 f x k x (ξ) = 2 f j x j x (ξ) k Etwas schwächer ist die folgende Formulierung: Sind f und alle partiellen Ableitungen 1 und 2 Ordnung in G stetig, so darf die Reihenfolge der Differentiation vertauscht werden Die folgende Aussage benutzt die 2 (totale) Ableitung (723): Ist f: G IR in G einmal und an der Stelle ξ G zweimal differenzierbar, so sind die zweiten partiellen Ableitungen an der Stelle ξ unabhängig von der Reihenfolge (Beweis siehe [BF2, S 125f]) f: G IR besitze in ξ G sämtliche partiellen Ableitungen zweiter Ordnung Dann heißt H f (ξ) := D 1 D 1 f (ξ) D 1 D n f (ξ) D n D 1 f (ξ) D n D n f (ξ)

722 Höhere partielle Ableitungen 73 Hesse-Matrix von f an der Stelle ξ Sie ist symmetrisch, falls die zweiten partiellen Ableitungen unabhängig von der Reihenfolge sind 722 Höhere partielle Ableitungen Höhere partielle Ableitungen werden entsprechend definiert: ( ) k f x jk x (ξ) := k 1 f j1 x jk x jk 1 x (ξ) j1 D jk D j1 f (ξ) := D jk ( Djk 1 D j1 f ) (ξ) bzw Man sagt, f ist in G IR n k-mal stetig differenzierbar, bzw f gehört zur Klasse C k (G), wenn sämtliche partiellen Ableitungen von f bis zur k-ten Ordnung in G existieren und stetig sind In diesem Fall kommt es bei ihnen nicht auf die Reihenfolge an Man sagt, f gehört zur Klasse C (G), wenn f zur Klasse C k (G) für alle k IN gehört C 0 (G) := C(G) ist die Klasse der stetigen Funktionen auf G Multiindexschreibweise Es ist häufig zweckmäßig, mehrere Indizes α j IN 0 zu einem Multiindex α = (α 1,, α n ) IN n 0 zusammenzufassen und abkürzend b α := b α1,,α n zu schreiben In Abschnitt 637a hatten wir für Polynome von mehreren Variablen bereits die Schreibweise x α := x α1 1 xαn n eingeführt α := α 1 + + α n heißt Ordnung des Multiindex α IN n 0 Ferner setzt man ( ) α := α 1! α n! und := α! α = (α 1+ +α n )! α 1! α n! ( α ) α heißt auch Polynomialkoeffizient Für n = 2 sind dies die bekannten Binomialkoeffizienten (134) Sei α = (α 1,, α n ) ein Multiindex und A eine Menge mit α Elementen Dann gibt es ( ) α α verschiedene Abbildungen f: A {1,, n}, die genau α j Elemente von A auf j abbilden (j=1,,n) Außerdem gilt für x = (x 1,, x n ) IR n und p IN die sog Polynomialformel : (x 1 + + x n ) p = ( ) p x α = p! α α 1! α n! xα1 1 xαn n α =p α =p Für n = 2 ist dies die bekannte Binomialformel (1354) Für Funktionen f C α (G) werden die partiellen Ableitungen in der Form D α f := D α1 1 Dα2 2 Dαn n f := x α 1 1 α f xαn n = α 1 ++αn f x α 1 1 xαn n

74 72 Höhere Ableitungen geschrieben Nach dem Satz von HASchwarz kommt es dabei nicht auf die Reihenfolge der Ableitungen an Beispiel: Für Multiindizes α, β und das Monom x α = x α1 1 xαn n gilt { D β x α = D β1 1 Dβ2 2 Dβn n (x α1 1 xα2 2 xαn n ) = (α β)! xα β für β α 0 sonst Dabei wurde die durch β = (β 1,, β n ) α = (α 1,, α n ) : β j α j für j = 1,, n definierte Halbordnung zwischen den Multiindizes verwendet 723 Höhere Ableitungen Ist f: G IR in G differenzierbar, so ist die Ableitung f von f eine Abbildung f : G Hom (IR n, IR) von G in den Raum der Linearformen auf dem IR n Ihre Koordinatenfunktionen bzgl der kanonischen dualen Basis sind die partiellen Ableitungen D k f Die erste Ableitung f wiederum ist differenzierbar in einem Punkt ξ G, wenn sie (bzw ihre Koordinatenfunktionen) bei ξ linear approximierbar ist In diesem Fall schreibt man f (ξ) := (f ) (ξ) und nennt f (ξ) die zweite Ableitung von f im Punkt ξ f ist also in ξ genau dann zweimal (total) differenzierbar, wenn sie in einer Umgebung von ξ einmal (total) differenzierbar ist, und ihre partiellen Ableitungen in ξ noch mal (total) differenzierbar sind Ist f in G zweimal differenzierbar, so ist die zweite Ableitung f von f eine Abbildung f : G Hom (IR n, Hom (IR n, IR)) Der Raum Hom (IR n, Hom (IR n, IR)) wird durch die Zuordnung ϕ ϕ, ϕ(x, y) := ϕ(x)(y) isomorph auf den Raum Bil (IR n ) der Bilinearformen ϕ: IR n IR n IR abgebildet Man interpretiert daher die zweite Ableitung als Abbildung f : G Bil (IR n ) und schreibt übersichtlicher f (ξ, h, k) := f (ξ)(h, k) := (f (ξ)(h))(k) Es gilt: Ist f: G IR in G einmal und an der Stelle ξ G zweimal differenzierbar, so ist f (ξ) eine symmetrische Bilinearform (Beweis siehe [BF2, S 125f]) Bil (IR n ) ist wiederum auf kanonische Weise isomorph zum Raum IR n n der reellen (n n)-matrizen Bzgl der kanonischen Basen entspricht f (ξ) dabei die Hesse-Matrix H f (ξ) Es ist f (ξ, h, k) = f (ξ)(h, k) = h (H f (ξ)) k Höhere Ableitungen werden rekursiv analog wie die zweite definiert: Die k-te Ableitung von f ist eine Abbildung von G in den Raum der symmetrischen k-linearformen ϕ: (IR n ) k IR Diese Ableitung ist differenzierbar

724 Taylorformel 75 in ξ G, wenn sie bei ξ linear approximierbar ist In diesem Fall schreibt man f (k+1) (ξ) := (f (k) ) (ξ) und faßt f (k+1) (ξ) vermöge [ ] f (k+1) (ξ)(h 1,, h k+1 ) := f (k+1) (ξ)(h k+1 ) (h 1,, h k ) als (k + 1)-Linearform auf f ist genau dann in ξ (k + 1)-mal (total) differenzierbar, wenn f in einer Umgebung von ξ k-mal (total) differenzierbar ist, und ihre k-ten partiellen Ableitungen in ξ noch einmal (total) differenzierbar sind f heißt (k-mal) stetig differenzierbar auf G, wenn f auf G k-mal differenzierbar ist, und die k-te Ableitung f (k) als Funktion von G in den Raum der k- Linearformen stetig ist Dies ist genau dann der Fall, wenn alle ihre partiellen Ableitungen bis zur k-ten Ordnung auf G existieren und stetig sind Die Koordinaten der k-ten Ableitung bzgl der kanonischen Basis des Raums der k-linearformen sind die k-ten partiellen Ableitungen Anders ausgedrückt: Für Vektoren h (j) = (h (j) 1,, h(j) n ) IR n gilt n n f (k) (ξ)(h (1),, h (k) k f (ξ) ) = x j1 x h (1) j jk 1 h (k) j k j 1=1 j k =1 Sind alle Argumente gleich, etwa h = (h 1,, h n ) = h (1) = = h (k), so kann man wegen der Symmetrie der k-linearform f (k) (ξ) einige dieser n k Summanden zusammenfassen Für α = k liefern insgesamt α! k! = α 1! α n! Summanden denselben Beitrag D α1 1 Dαn n f(ξ)h α1 1 h αn n Unter Verwendung der Multiindexschreibweise erhält man daher 1 k! f (k) (ξ)(h,, h) = D α f(ξ) h α 724 Taylorformel α =k Die Schwierigkeiten der mehrdimensionalen Taylorformel liegen mehr in der Schreibweise, als im Inhalt Um zu einigermaßen übersichtlichen Formeln zu kommen, kann man mit der Multiindexschreibweise oder mit den höheren (totalen) Ableitungen arbeiten (723) Wir geben beide Varianten an a) Taylorpolynom Seien G IR n offen, x, ξ G, h := x ξ und f: G IR m-mal stetig differenzierbar Dann heißt das Polynom T m (x) = T m (ξ + h) = D α f(ξ) m (x ξ) α 1 = k! f (k) (ξ, h,, h) α m k=0 k mal

76 72 Höhere Ableitungen das m-te Taylor-Polynom von f mit Entwicklungspunkt ξ Die Differenz R m (x) := R f,ξ,m (x) := f(x) T m (x) heißt das m-te Restglied der Taylorentwicklung von f um ξ Das 0 Taylorpolynom T 0 (x) ist konstant gleich dem Funktionswert f(ξ) im Entwicklungspunkt Das 1 Taylorpolynom ist die lineare Näherung von f Es ist T 1 (x) := T 0 (x) + D α f(ξ) (x ξ) α = f(ξ) + grad f(ξ), (x ξ) α =1 = f(ξ) + [D 1 f(ξ)(x 1 ξ 1 ) + + D n f(ξ)(x n ξ n )] Das 2 Taylorpolynom ist die quadratische Näherung von f Es ist T 2 (x) := T 1 (x) + D α f(ξ) (x ξ) α = T 1 (x) + 1 2 α =2 n j,k=1 D j D k f(ξ)(x j ξ j )(x k ξ k ) = T 1 (x) + 1 2 (x ξ) H f (ξ) (x ξ) Dabei ist H f (ξ) die aus den zweiten partiellen Ableitungen gebildete (symmetrische) Hesse-Matrix von f an der Stelle ξ (siehe 721) Das 3 Taylorpolynom T 3 einer Funktion f: IR 2 IR mit dem Entwicklungspunkt ξ = 0 = (0, 0) ist zb ( x := (x, y), Funktionswert und Ableitungen (f x := D 1 f usw) sind jeweils an der Stelle 0 zu berechnen) : T 3 (x, y) = T 3 ( x) = f + grad f, x + 1 2 x H f x + D α f x α α =3 = f + f x x + f y y + 1 [ 2 fxx x 2 + f yy y 2] + f xy xy + 1 [ 6 fxxx x 3 + f yyy y 3] + 1 [ 2 fxxy x 2 y + f yyx y 2 x ] Das m-te Taylorpolynom ist dasjenige eindeutig bestimmte Polynom vom Grad m, das an der Stelle ξ mit f einschließlich aller partiellen Ableitungen bis f(x) T m (x) zur m-ten Ordnung übereinstimmt Es gilt lim x ξ x ξ m = 0 Interessant ist die Frage, ob die Taylorpolynome in irgendeinem Sinne die Ausgangsfunktion f approximieren Trivialerweise gilt (für f C (G) ) f(x) = lim T m(x) R m (x) 0 für m m Um das Restglied R m abzuschätzen braucht man sogenannte

724 Taylorformel 77 b) Restglieddarstellungen Seien G IR n offen, x, ξ G, h = x ξ und f: G IR (m + 1)-mal stetig differenzierbar, also aus der Klasse C m+1 (G) Außerdem liege die Strecke x, ξ in G Dann gilt für das m-te Restglied R m = f T f,ξ,m : 1) Restglieddarstellung von Lagrange: Es gibt ein ϑ ]0, 1[ mit R m (x) = R m (ξ + h) = 2) Integraldarstellung des Restglieds: R m (x) = R m (ξ + h) = (m + 1) = 1 m! c) Taylorreihe 1 0 = α =m+1 D α f(ξ+ϑh) 1 (m+1)! f (m+1) ( ξ + ϑh, h,, h ) (m+1)-mal 1 0 (1 t) m α =m+1 (1 t) m f (m+1) ( ξ + th, h,, h ) dt (m+1)-mal Ist f in G unendlich oft differenzierbar, so heißt h α D α f(ξ+th) h α dt T f (x) := T f (ξ + h) := α =0 D α f(ξ) (x ξ) α = 1 k! f (k) (ξ, h,, h) k=0 k mal die Taylorreihe von f um ξ Taylorreihen sind Potenzreihen in mehreren Variablen (siehe Abschnitt 637b) Wie bei einer Variablen ist das zentrale Problem: Wann konvergiert die Taylorreihe einer Funktion gegen diese Funktion? Die Antwort ist einfach, wenn die Funktion durch eine Potenzreihe beschrieben wird (wir setzen obda ξ := 0, h := x ξ = x) : Konvergiert zb die Potenzreihe f(x) := a α x α im offenen Würfel α IN n 0 Wr 0 :=] r, r[ n absolut, so ist die dargestellte Funktion f(x) dort beliebig oft stetig differenzierbar Ihre Ableitungen erhält man durch gliedweise Differentiation und die definierende Reihe ist die Taylorreihe von f um 0 Kurz: Jede konvergente Potenzreihe ist die Taylorreihe der dargestellten Funktion im Entwicklungspunkt

78 72 Höhere Ableitungen Manchmal kann man eine Potenzreihenentwicklung von f durch Umformungen und Zurückführen auf bekannte Reihen erhalten Daß diese dann die Taylorreihe von f ist, garantiert der obige Satz Achtung: Nicht jede unendlich oft differenzierbare Funktion wird durch ihre Taylorreihe dargestellt Ein Beispiel finden Sie in Abschnitt 443 Bei mehreren Variablen spielt evt auch noch die Reihenfolge der Summation eine Rolle Näheres zu diesem Thema siehe zb [WA2, S96] Beispiele finden Sie in Abschnitt 753