50 Partielle Ableitungen 217 50 Partielle Ableitungen 501 Beispiel Die Differenzierbarkeit von Funktionen von mehreren Veränderlichen kann nach jeder Variablen einzeln untersucht werden, wobei die anderen Variablen als Konstanten betrachtet werden Für f(x,y,z) := xsinyz 2 etwa gilt x f = sinyz 2, y f = xz 2 cosyz 2, z f = 2xyzcosyz 2 (1) 502 Partielle Ableitungen a) Es sei D R n offen Eine Funktion f : D R m heißt in a D partiell differenzierbar nach der j-ten Koordinatenrichtung, falls der Limes f(a+te j ) f j f := lim R m (2) t 0 t existiert;dabeiiste j = (δ jk ) k derj-teeinheitsvektor f heißtpartiell differenzierbar auf D R n, falls j f(x) für alle x D und j = 1,,n existiert b) Für f = (f 1,,f m ) : D R m existiert genau dann die partielle Ableitung j f, wenn alle j f i existieren, und in diesem Fall gilt j f = ( j f 1,, j f m ) (3) c) Die partielle Ableitung j f in (2) läßt sich als eindimensionale Ableitung interpretieren: Für alle k j wird die k-te Variable an der Stelle a k eingefroren und die nahe a j definierte partielle Funktion f [j] : ξ f(a 1,,a j 1,ξ,a j+1,,a n ) (4) der einen Variablen ξ betrachtet Offenbar ist dann f in a partiell differenzierbar in Richtung e j genau dann, wenn f [j] in a j differenzierbar ist, und in diesem Fall gilt j f = f [j] (a j) Daher gelten für partielle Ableitungen die für eindimensionale Ableitungen gültigen Rechenregeln f d) Für j f sind auch die Notationen xj f,, D j f oder D xj f üblich j 503 Rotationssymmetrische Funktionen a) Die Radiusfunktion r : R n R, r(x) = x 2 = x = x 2 1 ++x 2 n, (5) ist auf R n \{0} partiell differenzierbar In der Tat ist r [j] : ξ x 2 1 ++ξ 2 ++x 2 n für x 0 in x j differenzierbar, und es gilt j r(x) = r [j] (x j) = x j, x 0 (6) r(x) b) Ist f : (0, ) R differenzierbar, so ist die rotationssymmetrische Funktion f r : R n \{0} R partiell differenzierbar, und es gilt j (f r) = f (r) j r = f (r) x j r aufgrund der eindimensionalen Kettenregel, x 0, (7)
218 VII Differentialrechnung in mehreren Veränderlichen Aus der partiellen Differenzierbarkeit einer Funktion f : D R folgt nicht ihre Stetigkeit: { 2xy, (x,y) (0,0) x 504 Beispiel a) Die Funktion f : (x,y) 2 +y 2 ist offenbar auf R 2 \{(0,0)} partiell differenzierbar, und wegen f(x,0) = f(0,y) = 0 gilt 0, (x,y) = (0,0) 1 f(0,0) = 2 f(0,0) = 0 Trotzdem ist f im Nullpunkt unstetig; in der Tat gilt ( 1, 1) (0,0), aber j j f(1, 1) = 1 0 j j b) Analyse von f mittels Polarkoordinaten: Es ist (f Ψ)(r,ϕ) = 2r2 cosϕsinϕ r 2 = sin2ϕ Somit ist f vom Radius r unabhängig, die Höhenlinien sind vom Nullpunkt ausgehende Strahlen Auf jeder Kreislinie um 0 oszilliert f zweimal zwischen den Werten 1 und +1 Jeder Wert l [ 1,1] ist Limes einer geeigneten Folge (f(x j,y j )) mit (x j,y j ) (0,0); dazu wählt man einfach ϕ mit sin2ϕ = l und dann (x j,y j ) = Ψ( 1 j,ϕ) = 1 j (cosϕ,sinϕ) Für Folgen(x j,y j ), die spiralförmiggegen (0,0) streben, kann (f(x j,y j )) divergent sein; so gilt etwa für (x j,y j ) = 1 j (cosjπ 4,sinjπ 4 ) offenbar f(x j,y j ) = sinj π 2 505 Definition Es seien D R n offen und f = (f 1,,f m ) : D R m in a D partiell differenzierbar Die Matrix Df = f 2 f m f 2 f 2 f m f m heißt dann Funktionalmatrix von f in a M R (m,n) (8) Beweise zu diesem und dem nächsten Abschnitt findet man in [K2], Abschnitte 18 und 19 506 Satz Es seien D R n offen und f : D R m partiell differenzierbar a) Zu a D gebe es r > 0, so daß alle j f auf K r beschränkt sind Dann ist f in a D stetig b) Sind alle j f in a D sogar stetig, so gilt für kleine h f(a+h) = f+dfh+ρ(h), ρ(h) = o( h ) (9) 507 Totale Ableitungen a) Gilt (9), so wird in der Nähe von a der Zuwachs h f(a+h) f von f durch die lineare Abbildung f : h Dfh bis auf einen Fehler ρ(h) approximiert, der ρ(h) = o( h ) erfüllt, also für h 0 schneller als h gegen 0 geht Die Funktion f heißt dann total differenzierbar in a, die lineare Abbildung f L(R n,r m ) die Ableitung von f in a Ihre Matrix bzgl der Standardbasen von R n und R m ist die Funktionalmatrix Df Statt f schreibt man auch df, insbesondere im Fall m = 1
50 Partielle Ableitungen 219 b) Mit x := a+h ist (9) äquivalent zu f(x) = f+f (x a)+ρ(x), ρ(x) = o( x a ) (10) c) In (9) interpretiert man a+h und a als Punkte in D R n, f(a+h) und f als solche in R m ; die Differenzen h und f(a+h) f sind dann als in den Punkten a und f startende Vektoren aufzufassen Folglich operiert die lineare Abbildung f zwischen Räumen von (in a und f startenden) Vektoren d) Eine Funktion f : D R m heißt stetig (partiell) differenzierbar, falls alle partiellen Ableitungen j f auf D stetig sind Dies ist genau dann der Fall, falls f in jedem Punkt von D total differenzierbar ist und die Ableitung f : D L(R n,r m ) stetig ist Mit C 1 (D,R m ) wird der Raum aller stetig differenzierbaren Funktionen auf D mit Werten in R m bezeichnet 508 Kettenregel a) Es seien D 1 R n, D 2 R m offen, g C 1 (D 1,R m ) mit g(d 1 ) D 2 und f C 1 (D 2,R l ) Dann folgt f g C 1 (D 1,R l ) und (f g) (x) = f (g(x))g (x), x D 1 (11) b) Formel (11) ist zur eindimensionalen Kettenregel völlig analog; es handelt sich aber natürlich bei dem Produkt um die Komposition linearer Abbildungen Die entsprechende Formel für die Funktionalmatrizen lautet D(f g)(x) = Df(g(x))Dg(x) (12) c) Für l = 1 lautet (12) mit h := f g ausführlicher so: ( h,, h )(x) = ( f y 1,, dies ist äquivalent zu f )(g(x)) y m g 1 g 1 g 2 g 2 g 1 g 2 (x); h (x 1,,x n ) = m f (g 1 (x),,g m (x)) g i (x 1,,x n ) (13) j i=1 y i j für alle j = 1,,n c) Umgekehrt impliziert (13) wieder (12) und (11) d) Es seien f(x,y) = xy und Ψ : (r,ϕ) (x,y) = (rcosϕ,rsinϕ) die Transformation auf Polarkoordinaten Nach (13) gilt für h = f Ψ: h = f r h ϕ = f r + f y y r ϕ + f y = ycosϕ+xsinϕ = 2rsinϕcosϕ = rsin2ϕ, y ϕ = yrsinϕ+xrcosϕ = r2 cos2ϕ; aus h(r,ϕ) = 1 2 r2 sin2ϕ ergibt sich dies natürlich auch direkt
220 VII Differentialrechnung in mehreren Veränderlichen 509 Tangentenvektoren a) Ein Vektor t R d heißt Tangentenvektor an eine Menge M R d im Punkt q M, falls es δ > 0 und einen in 0 differenzierbaren Weg γ : ( δ,δ) R d gibt mit (γ) M, γ(0) = q und γ(0) = t (14) Die Menge T q (M) aller Tangentenvektoren heißt Tangentialkegel in q an M b) Nun seien D R n offen, f C 1 (D,R m ) und d := n+m Wir betrachten den Graphen M := Γ(f) = {(x,f(x)) x D} R d von f Für q = (a,f) Γ(f) ist dann T q (Γ(f)) = Γ(f ) = {(v,f (v)) v R n } (15) ein Vektorraum der Dimension n Er heißt Tangentialraum in q an Γ(f), der affine Unterraum E q (Γ(f)) := q +T q (Γ(f)) von R d heißt Tangentialebene in q an Γ(f) Man hat also T q (Γ(f)) = {(v,w) R n+m w = f (v)}, (16) E q (Γ(f)) = {(x,y) R n+m y f = f (x a)} (17) 5010 Richtungsableitungen a)esseiend R n offenundv R n mit v = 1 Eine Funktion f : D R m heißt in a D in Richtung v differenzierbar, falls v f := lim t 0 f(a+tv) f t R m (18) existiert; v f heißt dann Richtungsableitung von f in Richtung v b) Für v = e j sind die Richtungsableitungen ej f = j f genau die partiellen Ableitungen aus 502 Analog zu 502c) existiert v f genau dann, wenn die eindimensionale Funktion t f(a+tv) in t = 0 nach t differenzierbar ist c) Aufgrund der Kettenregel besitzen Funktionen f C 1 (D,R m ) Richtungsableitungen in jede Richtung des R n, und es gilt v f = Dfv für a D und v R n mit v = 1 (19) d) Nur aus der Existenz aller Richtungsableitungen folgt ia (19) nicht; weiter impliziert (19) ia nicht die Stetigkeit, und aus (19) und Stetigkeit folgt ia nicht die totale Differenzierbarkeit 5011 Gradienten a) Es sei D R n offen Für eine skalare Funktion f C 1 (D,R) heißt das Vektorfeld gradf : D R n, gradf := (Df) = ( 1 f,, n f), (20) Gradient oder Gradientenfeld von f b) Es ist also gradf(x) der Vektor im R n mit gradf(x),h = df(x)(h) für h R n (21) Gemäß Bemerkung 507c) ist hierbei h R n = T x (R n ) als ein in x D startender Vektor aufzufassen; dies gilt dann auch für gradf(x), und gradf ist in der Tat ein
50 Partielle Ableitungen 221 Vektorfeld c) Nach (19) und (21) gilt wegen v = 1 für eine Richtungsableitung v f(x) = df(x)(v) = gradf(x),v = gradf(x) cosα, wobei α [0,π] der Winkel zwischen gradf(x) und v ist Diese ist also im Fall gradf(x) 0 für cosα = 1, dh für v = gradf(x) maximal Der Gradient grad f(x) gradf(x) zeigt also in Richtung des stärksten Anstiegs von f d) Es seien nun t T a (S) ein Tangentenvektor an eine Niveaumenge S = N c (f) = {x D f(x) = c} von f und γ : ( δ,δ) R n ein Weg mit (γ) S, γ(0) = a und γ(0) = t Wegen f γ = c gilt dann aufgrund der Kettenregel gradf,t = df(t) = d (f γ)(0) = 0, dt dh der Gradientenvektor gradf T a (S) steht auf den Niveaumengen von f senkrecht In Satz?? wird gezeigt, daß im Fall gradf 0 die Menge T a (S) ein (n 1)-dimensionaler Unterraum von R n ist 5012 Mittelwertsatz Es seien D R n offen und x,y D, so daß die Strecke [x,y] ind liegtweiter seif : D R auf[x,y] stetigundauf(x,y) := [x,y]\{x,y} stetig differenzierbar Dann gibt es ξ (x, y) mit f(y) f(x) = f (ξ)(y x) = n j f(ξ)(y j x j ) (22) 5013 Bemerkung a) Der Mittelwertsatz gilt nicht für vektorwertige Funktionen, selbst im Fall n = 1 Für die Funktion E : R R 2, E(t) := (cost,sint), gilt j=1 (0,0) = E(2π) E(0) = (cos π,sin π 2 )(2π 0) Die hier explizit angebbaren Zwischenstellen müssen in beiden Komponenten verschieden gewählt werden; offenbar gibt es kein t R mit (0,0) = E(2π) E(0) = E (t)(2π 0) = 2π(cos t,sin t) = 2π( sint,cost) b) Dagegen gilt der Hauptsatz der Differential- und Integralrechnung auch für vektorwertige Funktionen Eine allgemeine Version lautet so: 5014 Satz Es seien D R n offen, x,y D und γ C 1 ([a,b],d) ein Weg mit γ = x und γ(b) = y Für f C 1 (D,R m ) gilt dann f(y) f(x) = b a f (γ(t))( γ(t))dt = b a gradf(γ(t)), γ(t) dt (23) 5015 Folgerung Es seien G R n ein Gebiet und f C 1 (G,R m ) mit f = 0 Dann ist f konstant