1 Umkehrfunktionen und implizite Funktionen

Größe: px
Ab Seite anzeigen:

Download "1 Umkehrfunktionen und implizite Funktionen"

Transkript

1 Inhaltsverzeichnis 1 Umkehrfunktionen und implizite Funktionen Extrema unter Nebenbedingungen Untermannigfaltigkeiten des R n Das Riemann-Integral im R n Die Transformationsformel Parametrisierte Integrale Kurvenintegrale Oberflächenintegrale Rotation und Divergenz Gewöhnliche Differentialgleichungen Der Satz von Picard-Lindelöf Der Separationsansatz $Id: implizit.tex,v /3/3 14:14:59 hk Exp $ Vorlesung 1, Dienstag Umkehrfunktionen und implizite Funktionen In diesem Kapitel wollen wir die Differentialrechnung etwas fortsetzen und zum Einstieg wiederholen wir einige der relevanten Tatsachen aus den vorigen beiden Semestern. Insbesondere wollen wir die in diesem Semester verwendeten Schreibweisen einführen, diese unterscheiden sich teilweise etwas von denen des vorigen Semesters. Da es uns in diesem Semester um Funktionen im R n geht beschränken wir uns auf diesen Fall, auch wenn man die Sätze dieses Kapitels leicht auf allgemeine Banachräume erweitern kann. Gegeben seien eine offene Menge U R n und eine Funktion f : U R m. Wir betrachten einen fixierten Punkt x U und approximieren die Funktion f bei x durch eine lineare Abbildung T : R n R m, d.h. wir schreiben für h R n mit x+h U f(x + h) = f(x) + T h + τ(h) wobei τ(h) R m für den Approximationsfehler steht. Da die Menge U offen ist, gibt es einen Radius r > mit B r (x) U, d.h. für alle h R n mit h < r ist stets x + h U. Dass die Funktion f im Punkt x differenzierbar mit der Ableitung T ist, 1

2 Mathematik für Physiker III, WS 212/213 Dienstag bedeutet zum einen das der Fehler τ(h) schlimmstenfalls proportional zu h wächst, es soll also τ(h) C h für alle h B r () gelten, wobei C eine geeignete Proportionalitätskonstante ist. Differenzierbarkeit bedeutet aber noch mehr, die Proportionalitätskonstante C kann beliebig klein gewählt werden solange man sich auf ausreichend kleine Störungen h beschränkt. Etwas genauer formuliert soll es also für jede positive Konstante ɛ >, die nun die Rolle des obigen C spielt, ein geeignetes δ > geben so, dass für alle h R n mit h δ stets x + h U und τ(h) ɛ h gilt. Da wir diese Bedingung für h auch als τ(h) / h ɛ schreiben können, ist die Funktion f also genau dann in x differenzierbar mit der Ableitung T wenn es eine Funktion τ : U x R m mit f(x + h) = f(x) + T h + τ(h) für alle h U x und lim h τ(h) h gibt. Wegen τ(h) = f(x + h) f(x) T h kann man diese Bedingung auch kürzer als f(x + h) f(x) T h lim h h schreiben. Die lineare Abbildung T ist dann eindeutig bestimmt und wird mit dem üblichen Symbol f (x), oder manchmal auch Df(x), notiert. Für x R n meint das Symbol x normalerweise die euklidische Norm des Vektors x, also die gewöhnliche elementargeometrische Länge ( n 1/2 x = xk) 2. k=1 Für die Differenzierbarkeit einer Funktion spielt dies aber keine Rolle, man kann auch jede andere Norm verwenden ohne das sich die Ableitung ändert. Dies ergibt sich sofort aus der bekannten Tatsache das alle Normen auf dem R n äquivalent sind, also auch dieselben Grenzwerte definieren. Dies wurde zum Beispiel in II. 8.Satz 6 und II. 8.Lemma 5 behandelt. Die Ableitung f (x) läßt sich oft mittels sogenannter Richtungsableitungen berechnen. Bei diesen geben wir uns einen Vektor v R n vor und schauen uns in die Funktion f in Richtung des Vektors v an, d.h. wir betrachten die Funktion f v : I R m ; t f(x + tv), wobei I R ein offenes Intervall mit I und x + I v U ist. Die Ableitung dieser Funktion in t = v f(x) := f v() R m bezeichnet man dann als die Richtungsableitung von f im Punkt x in Richtung von v. In Termen der totalen Ableitung f (x) ergibt sich die Richtungsableitung nach 2 = =

3 Mathematik für Physiker III, WS 212/213 Dienstag II. 8.Lemma 13.(c) als v f(x) = f (x)v. Diese Tatsache folgte direkt aus der Differenzierbarkeitsdefinition, zunächst haben wir lim τ(tv) t t = lim τ(tv) v =, t tv wobei wir den trivialen Randfall v = stillschweigend übergehen, und weiter folgt v f(x) = lim t f(x + tv) f(x) t f (x)(tv) + τ(tv) = lim t t = lim t ( f (x)v + τ(tv) ) = f (x)v. t Die Richtungsableitungen in Richtung der Standardbasisvektoren e 1,..., e n heißen die partiellen Ableitungen der Funktion f, geschrieben als f (x) := ei f(x) = d x i dt f(x 1,..., x i 1, x i + t, x i+1,..., x n ) t= für 1 i n, und die m n-matrix ( f Df(x) = (x),..., f ) (x) = x 1 x n f 1 f 1 x 1 (x) x n (x)..... f m f x 1 (x) m x n (x) deren Spalten die partiellen Ableitungen sind heißt die Jacobi-Matrix von f im Punkt x. Gemäß unserer Interpretation der Richtungsableitungen ist die Jacobi-Matrix gerade die Matrix der linearen Abbildung f (x) bezüglich der Standardbasen des R n und des R m. Meist werden wir zwischen der Jacobi-Matrix und der Ableitung f (x) keinen Unterschied machen. Während die Differenzierbarkeit in x die Existenz der Jacobi- Matrix in x garantiert folgt aus der Existenz aller partiellen Ableitungen umgekehrt nicht die Differenzierbarkeit von f in x, selbst die Existenz aller Richtungsableitungen reicht hierfür nicht aus. Es gibt aber sehr wohl ein Kriterium die Differenzierbarkeit der Funktion f mittels partieller Ableitungen nachzuweisen, existieren die partiellen Ableitungen f/ x 1,..., f/ x n auf ganz U und sind im Punkt x U stetig, so ist f im Punkt x auch differenzierbar, dies war zum Beispiel II. 8.Lemma 15. Die Abbildung f : U R m heißt differenzierbar wenn sie in jedem Punkt x U differenzierbar ist, und sie heißt stetig differenzierbar wenn zusätzlich die Ableitung f : U R m n stetig ist. Das erwähnte Lemma kann dann so gelesen werden das die Funktion f genau dann stetig differenzierbar ist wenn sie stetig partiell differenzierbar ist, wenn also alle partiellen Ableitungen von f auf U existieren und dort stetig sind. Diese Beschreibung kann man dann in einem weiteren Schritt auf höhere Ableitungen ausdehnen. Denken wir uns den Matrizenraum R m n als den R mn, so kann f : U R m n wieder differenziert werden und man erhält eine zweite Ableitung f : U R n2m. So fortfahrend wird dann q-fache Differenzierbarkeit für jedes q 1 definiert, und es 3

4 Mathematik für Physiker III, WS 212/213 Dienstag stellt sich heraus das f genau dann q-fach stetig differenzierbar ist wenn alle partiellen Ableitungen von f der Ordnung höchstens q existieren und auf U stetig sind, dies war II. 9.Lemma 1. Bei den höheren partiellen Ableitungen kam es unter geeigneten Voraussetzungen an die Funktion f nicht darauf an in welcher Reihenfolge die einzelnen partiellen Ableitungen durchgeführt wurden. Grundlegend war dabei das sogenannte Lemma von Schwarz II. 9.Satz 2, dass besagte das für eine differenzierbare Funktion f : U R die in einem Punkt x U sogar zweifach differenzierbar ist stets 2 f x i x j (x) = 2 f x j x i (x) für alle 1 i, j n gilt. Durch iterierte Anwendung des Schwarzschen Lemmas ergab sich dann in II. 9.Korollar 3 die allgemeine Vertauschbarkeit partieller Ableitungen, ist f : U R m eine q-fach stetig partiell differenzierbare Funktion, so gilt für alle 1 r q und alle 1 i 1,..., i r n sowie für jede Permutation π S r auf U die Gleichung r f x i1 x ir = r f x iπ(1) x iπ(r). Diese Tatsache ermöglichte es dann die höheren partiellen Ableitungen mittels sogenannter Multiindizes zu schreiben, so das in der Notation kaum noch Unterschiede zwischen dem eindimensionalen und dem höherdimensionalen Fall auftreten. Bevor wir uns allmählich neuen Themen zuwenden wollen wir noch eine weitere wichtige Tatsache wiederholen, den sogenannten Mittelwertsatz. Es gibt hiervon verschiedene Varianten je nachdem ob wir skalare Funktionen oder vektorwertige Funktionen betrachten. Beginnen wir mit der skalaren Version, seien also U R n eine offene Menge und f : U R eine stetig differenzierbare Funktion. Der Satz gilt dabei auch ohne die Stetigkeit der Ableitung vorauszusetzen, aber dies spielt für uns keine Rolle. Seien p, q U zwei Punkte und nehme an das auch das Intervall [p, q] U in U liegt. Dann existiert nach II. 8.Lemma 23 ein Punkt ξ [p, q] mit Dabei steht f(q) f(p) = grad f(ξ) q p. grad f(ξ) := f (ξ) t für die Jacobi-Matrix von f an der Stelle ξ aufgefasst als Spaltenvektor. Dies war der sogenannte Gradient der Funktion f und wie wir in II. 8.6 festgehalten hatten zeigt dieser Vektor in Richtung des stärksten Anstiegs der Funktion f und seine Länge gibt die Rate dieses Anstiegs an. Für vektorwertige Funktionen hat man keine solche Identität für die Differenz f(q) f(p), aber zumindest eine Mittelwertungleichung II. 8.Lemma 21. Sind wieder U R n offen, f : U R m eine stetig differenzierbare Funktion und p, q U mit [p, q] U, so gilt ( ) f(q) f(p) sup f (x) x [p,q] 4 q p.

5 Mathematik für Physiker III, WS 212/213 Dienstag Dabei können auf dem R n und auf dem R m völlig beliebige Normen verwendet werden, es muss sich nicht unbedingt um die euklidischen Normen handeln. Die Norm der linearen Abbildung T = f (x) ist dann die in II. 8.5 eingeführte Norm linearer Abbildungen, d.h. T ist die minimale Konstante C mit T u C u für alle u R n. 1.1 Der Umkehrsatz Wir kommen jetzt zu einem im vorigen Semester noch nicht behandelten Teil des Differentialkalküls, den sogenannten Umkehrsatz oder Satz über Umkehrfunktionen. Zum Einstieg schauen wir uns erst einmal den schon im ersten Semester betrachteten Fall n = 1 an. Gegeben seien ein offenes Intervall I R und eine stetig differenzierbare Funktion f : I R. Weiter sei x I ein Punkt mit f (x). Wir nehmen konkret f (x) > an, der andere Fall ist dann analog. Da f stetig ist, gibt es ein offenes Intervall J R mit x J I so, dass auch f (y) > für jedes y J gilt. Dann ist die Funktion f J nach I. 14.Korollar 11.(e) auf dem Intervall J streng monoton steigend. Da die Funktion f insbesondere stetig ist, ist das Bild f(j) R nach I. 13.Satz 15.(a) wieder ein offenes Intervall und f J : J f(j) ist bijektiv. Damit gibt es eine Umkehrfunktion g := (f J) 1 : f(j) J und diese ist nach I. 14.Satz 6 wieder differenzierbar mit der Ableitung g (y) = 1 f (g(y)) für alle y f(j). Insbesondere ist die Umkehrfunktion g also sogar stetig differenzierbar auf f(j). Für n = 1 folgt aus f (x) also das sich f in der Nähe von x invertieren läßt und das die entstehende Umkehrfunktion wieder stetig differenzierbar ist. Der allgemeine Satz über Umkehrfunktionen dehnt dies auf den höherdimensionalen Fall n > 1 aus. Für n > 1 muss allerdings die Voraussetzung an die Funktion f noch etwas modifiziert werden, ein einfaches f (x) reicht nicht aus. In der Tat, die lineare Funktion T : R 2 R 2 ; (x, y) (x, ) hat für jeden Punkt p R 2 die Ableitung T (p) = T, ist aber sicherlich auf keiner noch so kleinen Umgebung von p umkehrbar. Wir können uns leicht klarmachen wie die notwendige Bedingung an die Funktion f auszusehen hat. Nehme einmal an wir haben eine offene Menge U R n, eine stetig differenzierbare Funktion f : U R n und es gebe offene Mengen V, W R n mit x V U so, dass f V : V W bijektiv mit der in y := f(x) W differenzierbaren Umkehrfunktion g := (f V ) 1 : W V ist. Aus g (f V ) = id V folgt dann mit der Kettenregel II. 8.Satz 17 id R n = (g (f V )) (x) = g (y) f (x), 5

6 Mathematik für Physiker III, WS 212/213 Freitag d.h. die lineare Abbildung f (x) ist invertierbar mit f (x) 1 = g (y). Umgekehrt stellt sich diese Bedingung auch als hinreichend heraus, d.h. ist f (x) für ein x U invertierbar, so gibt es offene Mengen V, W R n mit x V U so, dass f V : V W bijektiv mit differenzierbarer Umkehrfunktion ist. Erinnern wir uns daran das die Ableitung f (x) die lineare Approximation der Funktion f nahe bei x ist, so ist diese Aussage zumindest plausibel, sie wirklich zu beweisen erfordert allerdings etwas Arbeit. Dass f V : V W bijektiv ist bedeutet das sich die Gleichung f(u) = y für jede rechte Seite y W eindeutig nach u V auflösen läßt, es handelt sich also um einen Satz über die Lösbarkeit von Gleichungen. Vorlesung 2, Freitag Am Ende der letzten Sitzung hatten wir uns vorgenommen den sogenannten Umkehrsatz zu beweisen, d.h. sind U R n offen, f : U R n eine stetig differenzierbare Abbildung und x U so, dass die Ableitung f (x ) invertierbar ist, so existieren offene Mengen V, W R n mit x V U für die die Einschränkung f V : V W bijektiv mit stetig differenzierbarer Umkehrfunktion (f V ) 1 ist. Dass f V : V W bijektiv ist bedeutet konkret das die Gleichung f(x) = y für jede rechte Seite y W eindeutig nach x V auflösbar ist, beim Umkehrsatz handelt es sich also im wesentlichen um einen Satz über die Lösbarkeit gewisser Gleichungen. Da wir die Funktion f nicht konkret kennen, brauchen wir als Hilfsmittel einen abstrakten Lösungssatz und hierfür werden wir den sogenannten Banachschen Fixpunktsatz verwenden. Unter einem Fixpunkt einer Funktion T : M M versteht man dabei einen Punkt x M mit T (x) = x und als Fixpunktsätze bezeichnet man Aussagen die unter geeigneten Voraussetzungen an die Abbildung T und die Menge M die Existenz solcher Fixpunkte garantieren. Unsere Gleichung f(x) = y ist zwar keine solche Fixpunktgleichung, läßt sich aber wegen f(x) = y y + x f(x) = x als Fixpunktgleichung für die Hilfsfunktion T (x) := y + x f(x) interpretieren. Ein Verfahren zur Konstruktion von Fixpunkten ist die sogenannte Fixpunktiteration, man startet mit einem beliebigen Element x M und wendet auf dieses immer wieder die Funktion T an, d.h. man bildet die Folge x := x, x 1 := T (x), x 2 := T (x 1 ) = T (T (x)), x 3 := T (x 2 ) = T (T (T (x))),..., x n := T (x n 1 ) = T (T (... T ( x)...)) =: T n (x) }{{} n mal und hofft das diese in irgendeinem Sinne gegen ein z M konvergiert. Dieser Grenzwert z hat dann gute Chancen ein Fixpunkt von T zu sein. Wir wollen uns hierfür erst einmal 6

7 Mathematik für Physiker III, WS 212/213 Freitag ein konkretes Beispiel anschauen. Wir wollen einen Fixpunkt des Cosinus bestimmen, d.h. wir suchen ein x R mit cos x = x. Für x π/3 ist < 1 2 = cos π 3 cos x 1 < π 3, also können wir den Cosinus als Funktion [ cos :, π ] 3 [, π ] 3 auffassen. Wir schauen uns einmal die mit x := startende Fixpunktiteration an x 1 = 1, x 2 = , x 3 = , x 4 = , x 5 = , x 6 = , x 7 = , x 8 = , x 9 = , x 1 = , x 11 = , x 12 = , x 13 = , x 14 = , x 15 = , x 16 = , x 17 = , x 18 = , x 19 = , x 2 = , x 21 = Die Fixpunktiteration (x n ) n N scheint also gegen einen Wert x.73 zu konvergieren. Wenn wir dies für den Moment einmal annehmen, so muss dieser Grenzwert x tatsächlich ein Fixpunkt der Cosinusfunktion sein, denn es gilt ( cos x = cos lim n x n ) = lim n cos(x n ) = lim n x n+1 = x. Dass die Folge (x n ) n N tatsächlich konvergiert ist jetzt eine Konsequenz des nun zu beweisenden Banachschen Fixpunktsatzes. Dieser wird uns zusätzlich auch eine A- priori Abschätzung für den Approximationsfehler liefern. Satz 1.1 (Banachscher Fixpunktsatz) Seien E ein Banachraum, M E eine abgeschlossene Teilmenge und T : M M eine Abbildung. Es gebe eine Konstante q < 1 mit T x T y q x y für alle x, y M. Dann existiert genau ein z M mit T z = z. Für jedes x M gilt dabei für alle n N. z = lim n T n x und T n x z qn T x x 1 q Beweis: Beachte das es höchstens einen Fixpunkt von T geben kann, denn sind z, z M mit T z = z und T z = z, so haben wir z z = T z T z q z z, also wegen q < 1 auch z z = und somit ist z = z. Es sind also nur die Existenz eines Fixpunkts und die angegebene Abschätzung zu beweisen. Zunächst beachte das durch iterierte Anwendung der Kontraktionsbedingung auch T n x T n y q n x y 7

8 Mathematik für Physiker III, WS 212/213 Freitag für alle x, y M, n N folgt. Sei nun x M gegeben. Für alle n N, m 1 haben wir dann m 1 T n+m x T n x = (T n+k+1 x T n+k x) k= m 1 k= Insbesondere gilt für alle n, m N mit m > n auch T m x T n x q n+k T x x = qn (1 q m ) T x x. 1 q qn T x x 1 q und wegen q < 1 ist (T n x) n N damit eine Cauchyfolge in M. Da E vollständig und M E abgeschlossen sind, existiert somit der Grenzwert Für jedes n N haben wir dabei z := lim n T n x M. T n x z = lim m T m x T n x qn T x x. 1 q Schließlich gilt T z = lim T n+1 x = lim T n x = z, n n d.h. z ist ein Fixpunkt von T. Da es nur einen Fixpunkt von T geben kann, ist z dabei auch unabhängig vom speziell gewählten Startwert x M. Wie schon erwähnt bezeichnet man die Voraussetzung (x, y M) : T x T y q x y mit q < 1 auch als Kontraktionsbedingung und T heißt entsprechend eine Kontraktion. Schauen wir uns dies einmal im Beispiel des Cosinus cos : [, π/3] [, π/3] an. Sind x < y π/3, so gibt es nach dem Mittelwertsatz I. 14.Satz 1 ein ξ (x, y) mit cos y cos x = sin(ξ) (y x) und wegen < sin(ξ) < sin(π/3) = 3/2 folgt cos y cos x = sin ξ y x < 3 y x. 2 Die Kontraktionsbedingung ist hier also mit q = 3/2 erfüllt. Für den Startwert x = konvergiert die durch x n+1 := cos(x n ) für n N definierte Fixpunktiteration also tatsächlich gegen das z [, π/3] mit cos z = z. Oben haben wir den 8

9 Mathematik für Physiker III, WS 212/213 Freitag Wert x 21 = berechnet und fragen uns nun wie gut diese Näherung an z eigentlich ist. Die a-priori Abschätzung des Banachschen Fixpunktsatzes ist direkt angewendet nicht besonders hilfreich und liefert nur eine nutzlose Fehlerschranke z x Wir können die Abschätzung aber auch geschickter anwenden, die weiteren Glieder der Fixpunktiteration sind genau diejenigen der mit dem Startwert x = x 21 startendenn Iteration, also gilt auch z x 21 cos(x 21) x 21 1 q = , d.h. wir haben im wesentlichen die ersten beiden Nachkommastellen von z bestimmt. Nun wollen wir mit dem Beweis des Umkehrsatzes beginnen und der Übersichtlichkeit halber teilen wir diesen in einige Lemmata auf. Es seien also eine stetig differenzierbare Funktion f : U R n definiert auf einer offenen Menge U R n und ein Punkt x U in dem f (x) invertierbar ist gegeben. Das erste unserer Lemmata ist dabei der technische Kern des ganzen Umkehrsatzes und behandelt einen leicht normierten Spezialfall. Wir nehmen an das unser Punkt x = ist und das f() = und f () = 1 gelten. Dabei ist mit 1 die Identität auf dem R n gemeint, wann immer an einer Stelle an der eine lineare Abbildung oder eine Matrix stehen müsste ein Skalar auftaucht, so ist mit diesem das entsprechende Vielfache der Identität oder der Einheitsmatrix gemeint. Auf dem R n verwenden wir eine beliebige Norm, es muss sich nicht unbedingt um die euklidische Norm handeln. Lemma 1.2 (Injektivität auf Kugeln, normierte Version) Seien n N mit n 1, U R n offen und f : U R n eine stetig differenzierbare Funktion. Es gelte U, f() = und f () = 1. Weiter seien < ɛ < 1 und r > mit B r () U gegeben und für jedes x B r () sei f (x) 1 ɛ. Dann gelten: (a) Die Einschränkung f B r () ist injektiv. (b) Es gilt B (1 ɛ)r () f(b r ()) B (1+ɛ)r (). (c) Die Umkehrfunktion g := (f B r ()) 1 B (1 ɛ)r () ist in differenzierbar mit der Ableitung g () = 1. Beweis: Wir betrachten die Hilfsfunktion h : U R n ; x f(x) x. Dann ist h stetig differenzierbar mit h() =, h () = und für jedes x B r () gelten f(x) = x + h(x) und h (x) = f (x) 1 ɛ. Da die Kugel B r () U konvex ist, folgt mit der Mittelwertungleichung II. 8.Lemma 21 auch ( ) h(y) h(x) sup h (ξ) ξ [x,y] 9 y x ɛ y x

10 Mathematik für Physiker III, WS 212/213 Freitag für alle x, y B r (). Für x, y B r () folgt hieraus weiter f(y) f(x) = y x + h(y) h(x) y x h(y) h(x) (1 ɛ) y x, und da 1 ɛ > ist, ist f B r () insbesondere injektiv. Für jedes x B r () ergeben sich wegen h() = weiter h(x) = h(x) h() ɛ x und f(x) x + h(x) (1 + ɛ) x (1 + ɛ)r, d.h. es ist f(x) B (1+ɛ)r (). Dies beweist die Inklusion f(b r ()) B (1+ɛ)r (). Der Nachweis der anderen Inklusion in (b) ist komplizierter und hier kommt der Banachsche Fixpunktsatz zum Tragen. Sei y B (1 ɛ)r () gegeben. Wir müssen zeigen das es dann ein x B r () mit f(x) = y gibt, und hierfür betrachten wir die Hilfsabbildung T : B r () R n ; x y + x f(x) = y h(x). Beachte das für x B r () genau dann f(x) = y gilt wenn T (x) = x ist, wir müssen also einsehen das die Abbildung T einen Fixpunkt hat. Für jedes x B r () gilt also auch T (x) y = h(x) ɛ x ɛr T (x) T (x) y + y ɛr + (1 ɛ)r = r, d.h. wir haben T (x) B r (). Damit ist T eine Abbildung T : B r () B r (). Weiter gilt für alle x, x B r () stets die Kontraktionsbedingung T (x) T (x ) = h(x ) h(x) ɛ x x. Wegen ɛ < 1 ist der Banachsche Fixpunktsatz Satz 1 anwendbar und liefert die Existenz eines x B r () mit T (x) = x, also mit f(x) = y. Damit haben wir B (1 ɛ)r () f(b r ()) eingesehen. Es verbleibt nur noch die Differenzierbarkeitsaussage über die Umkehrfunktion g zu beweisen. Zunächst beachte das die Abbildung g nach (a) und (b) überhaupt wohldefiniert ist. Sei y B (1 ɛ)r () und setze x := g(y) B r (). Dann ist y = f(x) = x + h(x) = g(y) + h(g(y)), also haben wir mit τ(y) := h(g(y)) auch g(y) = y h(g(y)) = g() + y + τ(y). Wir müssen einsehen das lim y τ(y) / y = gilt. Sei also α > gegeben. Wegen h() = und h () = gibt es dann ein β > so, dass für alle x U mit x < β stets h(x) (1 ɛ)α x gilt. Sei jetzt y B (1 ɛ)r () mit y < (1 ɛ)β und setze x := g(y) B r (). Dann gilt y = f(x) = f(x) f() (1 ɛ) x = (1 ɛ) g(y), 1

11 Mathematik für Physiker III, WS 212/213 Freitag also ist auch und somit folgt g(y) y 1 ɛ < β τ(y) = h(g(y)) (1 ɛ)α g(y) α y. Dies beweist das g in mit der Ableitung g () = 1 differenzierbar ist. Dieses Lemma ist bereits im wesentlichen der Umkehrsatz, die spezielle Situation f() =, f () = 1 läßt sich leicht durch eine affine Koordinatentransformation herstellen, wie wir nun einsehen wollen. Es ist hilfreich sich zuvor zwei kleine Eigenschaften der Norm linearer Abbildungen zu überlegen. Seien also E, F zwei normierte Räume und T : E F eine stetige lineare Abbildung. Wie schon erwähnt ist die Norm von T definiert als T = inf{c (u E) : T u C u }, d.h. es gilt T u T u für alle u E. Seien x E und r > gegeben. Für jedes u B r (x) gilt u x r, also ist auch T u T x = T (u x) T u x T r, d.h. T u B T r (T x). Diese Überlegung zeigt T (B r (x)) B T r (T x). Nehme jetzt weiter an das T bijektiv mit wieder stetiger Umkehrabbildung T 1 ist und das E gilt, also insbesondere T 1. Unsere eben angestellte Überlegung angewandt auf T 1 liefert dann ) T (B 1 r (T x) B r (x), also auch B T 1 r (T x) T (B r(x)). T 1 Im Fall T gelten diese beiden Aussagen mit demselben Beweis auch für offene Kugeln. Für die zweite Beobachtung seien G ein weiterer normierter Raum und S : F G eine stetige lineare Abbildung. Für jedes u E haben wir dann ST u S T u S T u, d.h. es ist ST S T. Damit sind wir jetzt in der Lage auf die Normierungen f() =, f () = 1 im Injektivitätslemma zu verzichten. Lemma 1.3 (Injektivität auf Kugeln, allgemeine Version) Seien n N mit n 1, U R n offen und f : U R n eine stetig differenzierbare Funktion. Weiter sei x U, die Ableitung T := f (x ) sei invertierbar und schließlich seien r, ɛ > mit ɛ < 1/ T 1, B r (x ) U und f (x) T ɛ für alle x B r (x ) gegeben. Dann gelten: (a) Die Einschränkung f B r () ist injektiv. (b) Es gilt B ( T 1 1 ɛ) r(f(x )) f(b r (x )) B T (1+ɛ T 1 ) r(f(x )). 11

12 Mathematik für Physiker III, WS 212/213 Freitag (c) Die Umkehrfunktion g := (f B r (x )) 1 B ( T 1 1 ɛ) r(f(x )) ist in f(x ) differenzierbar mit g (f(x )) = T 1. Beweis: Wir betrachten die stetig differenzierbare Hilfsfunktion h : U x R n ; x T 1 f(x + x ) T 1 f(x ) mit h (x) = T 1 f (x + x ) für alle x U x. Dann haben wir U x, B r () = B r (x ) x U x, h() = T 1 f(x ) T 1 f(x ) =, h () = T 1 f (x ) = 1 und für jedes x B r () ist x + x B r (x ) und somit h (x) 1 = T 1 f (x + x ) T 1 T T 1 f (x + x ) T T 1 ɛ < 1. Damit können wir auf h die normierte Form Lemma 2 des Injektivitätslemmas anwenden und erhalten das h B r () injektiv ist, das B (1 ɛ T 1 )r() h(b r ()) B (1+ɛ T 1 )r() gilt und das schließlich g := (h B r ()) 1 B (1 ɛ T 1 )r() in differenzierbar ist mit g () = 1. Für jedes x U gilt f(x) = T h(x x ) + f(x ), also ist auch f B r (x ) wegen B r (x ) = B r () + x injektiv und es gilt B ( T 1 1 ɛ) r(f(x )) T ( B (1 ɛ T 1 )r() ) + f(x ) T (h(b r ())) + f(x ) = f(b r (x )) T ( B (1+ɛ T 1 )r() ) + f(x ) B T (1+ɛ T 1 )r(f(x )). Schließlich behaupten wir das für alle y B ( T 1 1 ɛ)r(f(x )) stets g(y) = g(t 1 (y f(x ))) + x ist. Sei nämlich y B ( T 1 1 ɛ)r(f(x )) gegeben. Dann ist y f(x ) B ( T 1 1 ɛ)r() T (B (1 ɛ T 1 )r()), also haben wir auch T 1 (y f(x )) B (1 ɛ T 1 )r() und somit ist g(t 1 (y f(x ))) B r () wohldefiniert und es gilt h( g(t 1 (y f(x )))) = T 1 (y f(x )). Damit ist schließlich x := g(t 1 (y f(x ))) + x B r (x ) mit f(x) = T h( g(t 1 (y f(x )))) + f(x ) = T T 1 (y f(x )) + f(x ) = y, und dies bedeutet g(y) = x wie behauptet. Damit ist diese Hilfsbehauptung bewiesen und nach der Kettenregel II. 8.Satz 17 ist g in f(x ) differenzierbar mit der Ableitung g (f(x )) = g ()T 1 = T 1. Für den vollen Umkehrsatz fehlt aber noch eine wesentliche Zutat. Das Injektivitätslemma liefert uns direkt nur die Differenzierbarkeit der Umkehrfunktion in einem einzelnen Punkt, um auch die Differenzierbarkeit in anderen Punkten einzusehen benötigen 12

13 Mathematik für Physiker III, WS 212/213 Freitag wir das f (x) auch für alle x ausreichend nahe bei x invertierbar bleibt. Um zu sehen wie wir dieses Problem angehen können erinnern wir uns zunächst an eine wichtige Aussage des vorigen Semesters. Angenommen wir haben zwei normierte Räume E, F, eine offene Teilmenge U E von E und eine stetige Funktion f : U F. Dann ist für jede in F offene Menge V F auch das Urbild f 1 (V ) U in E offen. Dies hatten wir zum Beispiel in II. 4 als Beispiel 3 im Anschluß an die Definition offener Teilmengen eines normierten Raums eingesehen. Im gleich folgenden Lemma werden wir diese Beobachtung benutzen, um zu beweisen das die Menge GL n R aller invertierbaren n n-matrizen offen in der Menge R n n aller n n-matrizen ist. Wenn wir dies einmal eingesehen haben, können wir für unsere stetig differenzierbare Funktion f : U R n folgern das die Menge {x U f (x) ist invertierbar} = {x U f (x) GL n R} = (f ) 1 (GL n R) aller Punkte x U in denen f (x) invertierbar ist als Urbild der offenen Menge GL n R unter der stetigen Funktion f selbst wieder offen ist. Ist also f (x) für ein x U invertierbar, so trifft dies auch auf alle x U nahe bei x zu. Lemma 1.4 (Differenzierbarkeit der Matrixinversion) Sei n N mit n 1 gegeben. Dann gelten: (a) Die Menge GL n R := {A R n n A ist invertierbar} der invertierbaren reellen n n-matrizen ist offen in R n n. (b) Die Determinante det : R n n R ist eine unendlich oft differenzierbare Funktion. (c) Die Abbildung 1 : GL n R R n n ; A A 1 ist unendlich oft differenzierbar. Beweis: (b) Für jede Matrix A = (a ij ) 1 i,j n R n n besagt die sogenannte Leipnitzsche Determinantenformel aus der linearen Algebra das det A = π S n ( 1) π a 1π(1)... a nπ(n) gilt, in I. 1.2 hatten wir dies sogar als die Definition der Determinante verwendet. Die Determinante ist also ein Polynom von Grad n in den Einträgen der Matrix und insbesondere ist die Determinantenfunktion unendlich oft differenzierbar. (a) Eine n n-matrix A R n n ist nach I. 1.Korollar 1 genau dann invertierbar wenn det A gilt, d.h. wir haben GL n R = {A R n n det A } = det 1 (R\{}). 13

14 Mathematik für Physiker III, WS 212/213 Dienstag Da det : R n n R nach (b) insbesondere stetig ist, ist GL n R = det 1 (R\{}) damit offen in R n n. (c) Sind A R n n und 1 i, j n so bezeichne A ij die (n 1) (n 1)-Matrix die aus A durch Streichen der i-ten Zeile und der j-ten Spalte entsteht. Nach der Cramerschen Regel für die inverse Matrix I. 1.Korollar 1 ist für jede invertierbare Matrix A GL n R und alle 1 i, j n der (i, j)-te Eintrag der inversen Matrix A 1 gegeben als ( 1) i+j det A ji / det A und dies ist nach Teil (b) als Quotient zweier unendlich oft differenzierbarer Funktionen wieder unendlich oft differenzierbar. Vorlesung 3, Dienstag Am Ende der letzten Sitzung hatten wir alle Vorbereitungen zum Beweis des Umkehrsatzes abgeschlossen, und wollen jetzt mit diesem Beweis beginnen. Satz 1.5 (Satz über Umkehrfunktionen) Seien n N mit n 1 und U R n offen. Weiter sei f : U R n eine stetig differenzierbare Funktion und es sei x U ein Punkt so, dass die Ableitung f (x ) invertierbar ist. Dann existieren offene Mengen V, W R n mit x V U so, dass f V : V W bijektiv mit stetig differenzierbarer Umkehrfunktion (f V ) 1 : W V ist. Weiter ist f (x) für jedes x V invertierbar und es gilt für jedes x W stets ( (f V ) 1 ) (x) = f ((f V ) 1 (x)) 1. Beweis: Da f : U R n n stetig ist, ist U := {x U f (x) ist invertierbar} = (f ) 1 (GL n R) U nach Lemma 4.(a) wieder offen im R n mit x U. Wähle ein ɛ > mit ɛ < f (x ) 1 1. Wieder da f stetig ist, existiert dann weiter ein r > mit B r (x ) U so, dass f (x) f (x ) ɛ für alle x B r (x ) gilt. Wenden wir Lemma 3 einmal mit r und einmal mit r/2 an, so folgt das f B r (x ) injektiv ist und es eine Konstante δ > mit B δ (f(x )) f(b r/2 (x )) f(b r (x )) gibt. Wir erhalten die offene Menge W := B δ (f(x )) R n und da f insbesondere stetig ist, ist auch die Menge V := (f B r (x )) 1 (B δ (f(x ))) R n wieder offen mit x V U U, d.h. f (x) ist für jedes x V invertierbar. Weiter ist f V : V W bijektiv und wir müssen nur noch einsehen das die Umkehrabbildung 14

15 Mathematik für Physiker III, WS 212/213 Dienstag g := (f V ) 1 : W V stetig differenzierbar mit der in der Behauptung angegebenen Ableitung ist. Sei also y W = B δ (f(x )) f(b r (x )) und sei x B r (x ) mit y = f(x), also x = g(y) V. Wähle ein ɛ > mit ɛ < f (x) 1 1 und weiter wie oben ein s > mit B s (x) V B r (x ) und f (x ) f (x) ɛ für alle x B s (x). Erneut nach dem Injektivitätslemma Lemma 3 gibt es ein δ > so, dass B δ (f(x)) f(b s (x)) f(v ) = W gilt und das (f B s (x)) 1 B δ (f(x)) = g B δ (y) in y = f(x) differenzierbar ist mit g (y) = f (x) 1. Damit sind die Differenzierbarkeit von g sowie die Formel für die Ableitung von g bewiesen. Insbesondere ist g stetig, und damit ist g : W R n n nach Lemma 4.(c) als Hintereinanderausführung dreier stetiger Funktionen selbst stetig, d.h. g ist sogar stetig differenzierbar. Bevor wir zu einigen Beispielen kommen, wollen wir erst einmal einige unmittelbare Korollare des Umkehrsatzes festhalten. Der Umkehrsatz handelt zunächst nur von stetiger Differenzierbarkeit, mittels der expliziten Formel für die Ableitung der Umkehrfunktion läßt er sich aber leicht auf q-fache stetige Differenzierbarkeit ausdehnen. Korollar 1.6 (Höhere Differenzierbarkeit von Umkehrfunktionen) Seien n N, q N { } mit n, q 1 und U R n offen. Weiter sei f : U R n eine q-fach stetig differenzierbare Funktion und es sei x U ein Punkt so, dass die Ableitung f (x ) invertierbar ist. Dann existieren offene Mengen V, W R n mit x V U so, dass f V : V W bijektiv mit q-fach stetig differenzierbarer Umkehrfunktion (f V ) 1 : W R n ist. Beweis: Da q 1 ist gibt es nach dem Umkehrsatz Satz 5 zunächst offene Mengen V, W R n mit x V U so, dass f V : V W bijektiv mit der stetig differenzierbaren Umkehrfunktion g := (f V ) 1 : W V ist. Dabei gilt g = ν f g wobei ν : GL n R R n n die nach Lemma 4.(c) unendlich oft differenzierbare Invertierungsabbildung ist. Wir zeigen jetzt durch Induktion nach q das g stets q-fach stetig differenzierbar ist wenn f dies ist. Der Induktionsanfang q = 1 ist dabei klar. Sei nun q > 1 und unsere Behauptung sei für q 1 bereits eingesehen. Ist dann f als q-fach stetig differenzierbar vorausgesetzt, so ist f noch (q 1)-fach stetig differenzierbar und g ist nach unserer Induktionsannahme ebenfalls (q 1)-fach stetig differenzierbar, d.h. g = ν f g ist wieder (q 1)-fach stetig differenzierbar und somit ist g sogar q-fach stetig differenzierbar. Per vollständiger Induktion ist das Korollar damit im Fall q N eingesehen, und gilt folglich auch im Fall q =. Die in diesem Korollar nachgewiesene Eigenschaft der Einschränkung f V wird als C q - Diffeomorphie bezeichnet, ein C q -Diffeomorphismus ist eine Koordinatentransformation unter der r-fache Differenzierbarkeit für r q erhalten bleibt. Genauer definieren wir Definition 1.1: Seien n N mit n 1, U, V R n offen und q N { } mit q 1. 15

16 Mathematik für Physiker III, WS 212/213 Dienstag Ein C q -Diffeomorphismus f : U V ist eine bijektive, q-fach stetig differenzierbare Abbildung f : U V so, dass auch die Umkehrabbildung f 1 : V U wieder q-fach stetig differenzierbar ist. In Termen dieses Begriffs nimmt der Umkehrsatz die folgende Form an: Korollar 1.7 (Kriterium für C q -Diffeomorphismen) Seien n N, q N { } mit n, q 1, U R n offen und f : U R n eine q-fach stetig differenzierbare Abbildung. Schreibe V := f(u) R n. Dann gelten: (a) Ist f (x) für jedes x U invertierbar, so ist V offen im R n. (b) Genau dann ist V R n offen und f : U V ein C q -Diffeomorphismus wenn f injektiv ist und f (x) für jedes x U invertierbar ist. Beweis: Dies ist Aufgabe (4). 1.2 Die drei Standard-Koordinatentransformationen Einige Beispiele für die Anwendung des Umkehrsatzes in der Form des Korollar 7 finden sich in den Aufgaben (1), (3) und (5). In diesem Abschnitt wollen wir drei weitere solche Beispiele diskutieren. Wir beginnen mit den ebenen Polarkoordinaten, im Zusammenhang mit den komplexen Zahlen wurden diese bereits in I. 5.2 behandelt. Die Polarkoordinaten sind durch eine Einschränkung der unendlich oft differenzierbaren Abbildung ϕ : R 2 R 2 ; (r, φ) (r cos φ, r sin φ) gegeben. Als Ableitung ergibt sich für r, φ R ( ) cos φ r sin φ ϕ (r, φ) = mit det ϕ (r, φ) = r(cos 2 φ + sin 2 φ) = r, sin φ r cos φ im Fall r ist die Ableitung ϕ (r, φ) also invertierbar. Trotzdem ist die Einschränkung von ϕ auf R > R kein C -Diffeomorphismus, da sie wegen der Periodizität ϕ(r, φ + 2π) = ϕ(r, φ) sicherlich nicht injektiv ist. Um eine injektive Abbildung zu erhalten müssen wir die Winkel φ auf ein offenes Intervall der Länge 2π einschränken, etwa auf U := R > ( π, π). Da φ der Winkel von ϕ(r, φ) zur x-achse ist, ist das Bild dann C := ϕ(r > ( π, π)) = R 2 \{(x, ) x } = C\R, die sogenannte geschlitzte Ebene. Dass die Abbildung ϕ U : U C tatsächlich bijektiv ist, ist uns bereits aus dem ersten Semester bekannt, wir wollen den formalen 16

17 Mathematik für Physiker III, WS 212/213 Dienstag Beweis aber ruhig noch einmal wiederholen. Zunächst beachte das für (r, φ) U entweder φ und somit r sin φ ist oder φ = und r cos φ = r > ist, d.h. es ist überhaupt ϕ(r, φ) C. Sei nun ein Punkt (x, y) C gegeben, d.h. es ist y oder x >. Insbesondere ist r := x 2 + y 2 > und es gilt (x/r) 2 + (y/r) 2 = 1, also auch x/r 1. Dabei ist x/r 1 denn andernfalls wäre wegen (x/r) 2 + (y/r) 2 = 1 auch y/r = also x < und y = im Widerspruch zu (x, y) C. Damit ist genau dann y = wenn x/r = 1 ist, also erhalten wir einen eindeutigen Winkel φ ( π, π) mit cos φ = x/r und sign(φ) = sign(y). Es folgt weiter sin φ = sign(sin φ) sin 2 φ = sign(y) ( x ) 2 1 cos 2 φ = sign(y) 1 r (y ) 2 sign(y) y = sign(y) = = y r r r, d.h. es ist (r, φ) U mit ϕ(r, φ) = (x, y). Ist umgekehrt (s, ψ) U mit (x, y) = ϕ(s, ψ), so haben wir zunächst s 2 = s 2 (cos 2 ψ + sin 2 ψ) = x 2 + y 2 = r 2, also s = r da r, s > sind, und somit gelten auch cos ψ = x/s = x/r = cos φ und ebenso sin ψ = y/s = y/r = sin φ. Wegen φ, ψ ( π, π) folgt aus cos ψ = cos φ zunächst ψ = ±φ und somit auch sin φ = sin ψ = ± sin φ, d.h. wir müssen ψ = φ haben. Diese Überlegung beweist das ϕ : U C tatsächlich bijektiv ist, und nach Korollar 7 ist ϕ : U C damit ein C -Diffeomorphismus. Auch die geometrische Bedeutung der Polarkoordinaten ist uns schon aus I. 5.2 vertraut, sind r > und φ ( π, π), so ist der entsprechende Punkt (x, y) = ϕ(r, φ) in cartesischen Koordinaten gegeben als x = r cos φ, y = r sin φ, d.h. die erste Polarkoordinate r = x 2 + y 2 ist der Abstand des Punktes (x, y) zum Ursprung und die zweite Polarkoordinate φ ist der Winkel der durch (, ) und (x, y) gehenden Halbgerade zur positiven x- Achse, normiert auf Winkel φ < π. Man nennt φ = arg(x, y) = arg(x + iy) dann bekanntlich auch das Argument des Punktes (x, y) beziehungsweise der komplexen Zahl x + iy. Die Formel zur Berechnung von φ aus den cartesischen Koordinaten x, y unterscheidet sich je nachdem in welchen der vier Quadranten der Punkt (x, y) liegt, dies wurde ausführlich in I. 5.2 besprochen. In diesem Beispiel könnten wir natürlich die Differenzierbarkeit der Umkehrabbildung ϕ 1 auch direkt an diesen Formeln sehen, die Verwendung des Umkehrsatzes ist hier nur bequemer. Die Zylinderkoordinaten sind eine einfache Erweiterung der Polarkoordinaten auf den dreidimensionalen Fall, die dritte Koordinate wird identisch hinzugefügt. Als Abbildung haben wir also ϕ : U R C R; (r, φ, z) (r cos φ, r sin φ, z). r φ x (x,y) y 17

18 Mathematik für Physiker III, WS 212/213 Dienstag Da in den ersten beiden Komponenten die ebenen Polarkoordinaten stehen, sind auch die Zylinderkoordinaten ϕ eine bijektive Abbildung. Für alle (r, φ) U, z R gelten ϕ (r, φ, z) = cos φ r sin φ sin φ r cos φ 1 z φ z r y x sowie det ϕ (r, φ, z) = r und erneut nach Korollar 7 sind die Zylinderkoordinaten ein C -Diffeomorphismus. Die geometrische Interpretation ist analog zu der der Polarkoordinaten, die Zahl r = x 2 + y 2 ist der Abstand des Punktes (x, y, z) zur z- Achse, der Winkel φ = arg(x, y) ist der Winkel den die senkrechte durch (x, y, z) und den Nullpunkt gehende Ebene zur xz-ebene bildet, wieder normiert auf φ < π, und z ist schließlich die Höhe des Punktes (x, y, z) über der xy-ebene. Wir kommen jetzt zu den Kugelkoordinaten, diese sind in vielerlei Hinsicht die direkte Verallgemeinerung der Polarkoordinaten ins Dreidimensionale. Gegeben sei ein Punkt p = (x, y, z) im R 3 mit p. Als erste Koordinate nehmen wir wie bei den Polarkoordinaten den Abstand zum Nullpunkt, also r := x2 + y 2 + z 2 >. Teilen wir unseren Punkt durch r, so erhalten wir den Einheitsvektor p/r = (x/r, y/r, z/r). Die z- Koordinaten der Punkte auf der Kugel variieren zwischen 1 und 1, wir können also z = cos ψ = z = r cos ψ r z ψ δ φ φ z r p/r p z=cos ψ mit einem eindeutigen ψ π schreiben. Bilden wir das rechtwinklige Dreieck mit Ecken im, p/r und (,, z/r), so wird ψ der bei anliegende Winkel der z-achse gegen die Ursprungsgerade durch den Punkt p, denn die Hypothenuse in diesem Dreieck hat die Länge Eins und die Ankathete bei ψ hat die Länge z/r. In der Höhe z/r = cos ψ schneidet die Einheitskugel einen Kreis von Radius 1 cos2 ψ = sin 2 ψ = sin ψ 18

19 Mathematik für Physiker III, WS 212/213 Dienstag aus. Die Punkte auf diesem Kreis können wir somit durch eine Polarkoordinate φ beschreiben, also ( x r, y ) = (sin ψ cos φ, sin ψ sin φ). r Geometrisch ist φ dann der Winkel der x-achse zu (x/r, y/r, ), also zur Projektion des Punktes p in die (x, y)-ebene. Alternativ kann man auch sagen das φ der Winkel zwischen der vertikalen Ebene durch und p und der (x, z)-ebene ist. Insgesamt ist damit Wegen x = r cos φ sin ψ, y = r sin φ sin ψ, z = r cos ψ. x 2 + y 2 + z 2 = r 2 sin 2 ψ (sin 2 φ + cos 2 φ) + r 2 cos 2 ψ = r 2 (sin 2 ψ + cos 2 ψ) = r 2 ist r > durch diese Gleichungen umgekehrt auch eindeutig bestimmt. Durch die Normierung ψ π ist auch ψ eindeutig festgelegt und der Winkel φ muss erneut auf ein Intervall der Länge 2π normiert werden, also beispielsweise r >, ψ π, π φ < π. Es gibt noch eine zweite, leicht unterschiedliche Variante, die Kugelkoordinaten einzuführen. Anstelle von z/r = cos ψ kann man auch z/r = sin δ mit einem Winkel π/2 δ π/2 schreiben. Geometrisch ist δ dann der Winkel den die Ursprungsgerade durch p mit der (x, y)-ebene bildet. Der Winkel φ ändert sich nicht, und diese zweite Variante der Polarkoordinaten schreibt sich als x = r cos φ cos δ, y = r sin φ cos δ, z = r sin δ. Betrachten wir das im obenstehenden Bild eingezeichnete Rechteck, so sehen wir das sich die Winkel ψ und δ zu einem rechten Winkel ergänzen, sie hängen also über die einfache Gleichung δ = π 2 ψ zusammen. In der von uns verwendeten ersten Variante der Kugelkoordinaten entspricht ψ = auf der Kugel dem Nordpol, ψ = π ist der Südpol und ψ = π/2 der Äquator. In der zweiten Version ist dagegen δ = der Äquator, δ = π/2 der Nordpol und δ = π/2 der Südpol. Anders gesagt ist δ der Breitengrad von Punkten der Kugel, während φ der Längengrad ist. Um die Kugelkoordinaten als einen C -Diffeomorphismus zu interpretieren, müssen wir sie wieder auf eine geeignete offene Menge einschränken und hierzu verwenden wir ϕ : R > ( π, π) (, π) C R; (r, φ, ψ) (r cos φ sin ψ, r sin φ sin ψ, r cos ψ). 19

20 Mathematik für Physiker III, WS 212/213 Dienstag Wir wollen uns überlegen das hierdurch wirklich eine bijektive Abbildung definiert wird. Sind r >, π < φ < π und < ψ < π, so ist im Fall φ sofort r sin φ sin ψ während im Fall φ = stets r cos φ sin ψ = r sin ψ > ist, d.h. wir haben ϕ(r, φ, ψ) C R. Ist (x, y, z) C R, so gilt y oder x >. Definiere r > und ψ π wie oben. Wäre ψ = oder ψ = π, so hätten wir (z/r) 2 = cos 2 ψ = 1, also wegen (x/r) 2 + (y/r) 2 + (z/r) 2 = 1 auch x = y =, im Widerspruch zu (x, y) C. Also ist < ψ < π. Schließlich sei π φ < π mit (x/r, y/r) = (cos φ sin ψ, sin φ sin ψ). Wegen (x, y) C ist dann sogar π < φ < π, also ist (r, φ, ψ) R > ( π, π) (, π) mit (x, y, z) = ϕ(r, φ, ψ). Dass die drei Kugelkoordinaten unter der betrachteten Normierung auch eindeutig bestimmt sind, haben wir bereits eingesehen, d.h. unsere Abbildung ϕ ist bijektiv. Um zu zeigen, dass es sich um einen Diffeomorphismus handelt, überprüfen wir erneut die Invertierbarkeit der Ableitung. Die Jacobi Matrix der Transformation auf Kugelkoordinaten ist ϕ (r, φ, ψ) = cos φ sin ψ r sin φ sin ψ r cos φ cos ψ sin φ sin ψ r cos φ sin ψ r sin φ cos ψ cos ψ r sin ψ für alle r >, φ ( π, π), ψ (, π) mit der Determinante cos φ sin ψ r sin φ sin ψ r cos φ cos ψ sin φ sin ψ r cos φ sin ψ r sin φ cos ψ cos ψ r sin ψ = r 2 sin ψ ( cos ψ sin φ cos φ cos φ cos ψ sin φ cos ψ sin ψ cos φ sin ψ sin φ sin ψ, ) sin φ cos φ = r 2 sin ψ (cos 2 ψ + sin 2 ψ) = r 2 sin ψ <. Nach Korollar 7 handelt es sich bei den Kugelkoordinaten ϕ damit wieder um einen C -Diffeomorphismus. 1.3 Der Satz über implizite Funktionen In diesem Abschnitt wollen wir den sogenannten Satz über implizite Funktionen behandeln, dies ist der Satz der den theoretischen Unterbau für das implizite Differenzieren liefert. Wir wollen zunächst diese Rechentechnik einführen und beginnen mit dem üblichen Standardbeispiel. Wir betrachten für x, y R und eine Konstante r > die Gleichung x 2 + y 2 = r 2, geometrisch beschreibt diese den Kreis mit Radius r und Mittelpunkt in Null. Wir können diese Gleichung als die implizite Definition einer Funktion y von x, also y = y(x) auffassen. In anderen Worten wird die Gleichung nach y aufgelöst. Wir wollen die Ableitung y (x) von y nach x bestimmen. In diesem konkreten Beispiel können wir natürlich einfach explizit y = ± r 2 x 2 schreiben und wie üblich ableiten, wir wollen 2

21 Mathematik für Physiker III, WS 212/213 Freitag hier aber ein Verfahren beschreiben das diese explizite Berechnung von y vermeidet. Zu diesem Zweck leiten wir beide Seiten der Gleichung nach x ab, und erhalten = dr2 dx = d dx (x2 + y 2 ) = 2x + 2y dy dx beziehungsweise in Funktionsschreibweise y (x) = x y(x)., also dy dx = x y, Dieses implizite Differenzieren ist auch dann möglich wenn wir gar nicht in der Lage sind die betrachtete Gleichung tatsächlich aufzulösen, und für diese Situation schauen wir uns einmal das Beispiel e 2x 3y + 3x 5y = an. Eine Lösung ist x = 3, y = 2, und wir wollen y = y(x) schreiben und die Ableitung y (3) bestimmen. Leiten wir die Gleichung wieder auf beiden Seiten nach x ab, so ergibt sich ( 2 3 dy ) e 2x 3y dy dx dx = 2e2x 3y + 3 ( 3e 2x 3y + 5 ) dy! =, dx also dy dx = 2e2x 3y + 3 3e 2x 3y + 5. Setzen wir konkret den Punkt (x, y) = (3, 2) ein, so wird y (3) = 5/8. Um derartige Rechnungen in einen mathematischen Satz zu verwandeln, müssen wir noch auf ein Problem hinweisen. Wir haben bisher unterstellt das es überhaupt möglich ist die Variable y als Funktion y = y(x) in der anderen Variable x zu schreiben, dass sich also die Gleichung zumindest prinzipiell auflösen läßt. Das hier im Allgemeinen Probleme auftauchen sieht man schon am Eingangsbeispiel x 2 + y 2 = r 2. Zum einen ist die Funktion y mehrwertig, da es zu x eben zwei Lösungen gibt die sich durch das Vorzeichen von y voneinander unterscheiden. Dieses Problem kann man noch beheben indem man sich auf einen lokalen Standpunkt stellt, zu gegebener Lösung (x, y ) läßt sich y = y(x) auflösen solange (x, y) ausreichend nahe bei (x, y ) liegt. Aber selbst diese lokale Interpretation hat noch ihre Probleme, schauen wir uns die Lösung (x, y ) = (r, ) an, so läßt sich die Zweiwertigkeit von y nicht einmal lokal beheben. Der in der nächsten Sitzung behandelte Satz über implizite Funktionen wird uns ein Kriterium geben anhand dessen wir entscheiden können ob sich die betrachtete Gleichung zumindest lokal auflösen läßt. Vorlesung 4, Freitag Am Ende der letzten Sitzung haben wir die Methode des impliziten Differenzierens zur Berechnung der Ableitung impliziter Funktionen, also von Funktionen die durch 21

22 Mathematik für Physiker III, WS 212/213 Freitag eine Gleichung definiert sind, beschrieben. Wir hatten auch gesehen das es keinesfalls immer möglich ist eine beliebige Gleichung zur Definition einer impliziten Funktion zu verwenden, oft muss man die Definition in einem geeigneten Sinne lokal interpretieren und selbst dies ist nicht immer möglich. Der heute behandelte Satz über implizite Funktionen wird uns ein Kriterium bereitstellen, das erlaubt zu sagen wann eine lokale Auflösung der Gleichung möglich ist. Wir gehen dabei über die bisher behandelten Beispiele hinaus indem wir nicht nur zwei Variablen x, y sondern beliebig viele betrachten und nicht nur eine Gleichung verwenden sondern gleich mehrere. Haben wir etwa m 1 viele Gleichungen f 1 (x 1,..., x n, y 1,..., y m ) =. f m (x 1,..., x n, y 1,..., y m ) = so sollte im Idealfall jede der m Gleichungen eine der Variablen y i festlegen, und wir hoffen daher das wir y 1,..., y m zumindest lokal als Funktionen y 1 = g 1 (x 1,..., x n ). y m = g m (x 1,..., x n ) schreiben können. Dass die rechte Seite unserer Gleichungen immer Null ist, ist dabei keine echte Einschränkung, durch eine kleine Umformung können wir eine allgemeine Gleichung immer auf diese Form bringen. Um die Notation zu vereinfachen, schreiben wir dann x = (x 1,..., x n ), y = (y 1,..., y m ) und f = (f 1,..., f m ), und unsere Gleichung nimmt die Form f(x, y) = an. Die gesuchte lokale Auflösung hat dann die Gestalt y = g(x). Die linke Seite f dieser Gleichung ist eine Funktion f : U R m definiert auf einer offenen Menge U R n+m. Nehmen wir weiter an das die Funktion f differenzierbar ist, so haben wir in jedem Punkt (x, y) U eine Jacobi-Matrix f (x, y) = Df(x, y). Dies ist eine m (n + m)-matrix deren Spalten von den partiellen Ableitungen nach den n + m Variablen x 1,..., x n, y 1,..., y m gebildet werden. Es stellt sich als zweckmäßig heraus diese Matrix in einen m n- und einen m m-block aufzuteilen, d.h. wir schreiben Df(x, y) = (D x f(x, y) D y f(x, y)) mit D x f(x, y) := ( ) fi (x, y) x j 1 i m,1 j n. und D y f(x, y) :=. ( ) fi (x, y). y j 1 i,j m Damit sind wir bereit den Satz über implizite Funktionen zu behandeln, wie wir sehen werden ist dieser im wesentlichen nur eine weitere Umformulierung des Satzes über Umkehrfunktionen. In unseren Beispielen haben wir uns nur um die erste Ableitung gekümmert, den Satz werden wir allerdings gleich etwas allgemeiner für beliebige höhere Ableitungen formulieren. 22

23 Mathematik für Physiker III, WS 212/213 Freitag Satz 1.8 (Der Satz über implizite Funktionen) Seien n, m N, q N { } mit n, m, q 1, U R n+m offen und f : U R m eine q-fach stetig differenzierbare Funktion. Weiter sei (a, b) U mit f(a, b) = und det D y f(a, b). Dann gibt es offene Mengen V R n, W R m mit a V, b W und V W U so, dass es für jedes x V genau ein g(x) W mit f(x, g(x)) = gibt. Weiter gilt g(a) = b und die Funktion g ist wieder q-fach stetig differenzierbar mit für alle x V. g (x) = D y f(x, g(x)) 1 D x f(x, g(x)) Beweis: Wir betrachten die q-fach stetig differenzierbare Hilfsfunktion Für alle (x, y) U ist dann ( F (x, y) = F : U R n+m ; (x, y) (x, f(x, y)). 1 D x f(x, y) D y f(x, y) und insbesondere ist det F (a, b) = det D y f(a, b), d.h. F (a, b) ist invertierbar. Nach der C q -Version des Umkehrsatzes Korollar 6 gibt es offene Mengen V 1, W 1 R n+m mit (a, b) V 1 U so, dass F V 1 : V 1 W 1 bijektiv mit q-fach stetig differenzierbarer Umkehrfunktion G : W 1 V 1 ist. Nach Satz 5 gilt dabei G (p) = F (G(p)) 1 für jedes p W 1. Es ist (a, ) = (a, f(a, b)) = F (a, b) F (V 1 ) = W 1, also existiert eine offene Menge V 2 R n mit a V 2 und V 2 {} W 1. Bezeichnet pr : R n+m R m ; (x, y) y die Projektion auf die zweite Komponente, so erhalten wir die q-fach stetig differenzierbare Funktion g : V 2 R m ; x pr(g(x, )). Weiter gibt es wegen (a, b) V 1 offene Mengen V 3 R n mit a V 3 und W R m mit b W so, dass V 3 W V 1 gilt. Schließlich ist g(a) = pr(g(a, )) = pr(g(f (a, b))) = pr(a, b) = b W, also gibt es auch eine offene Menge V R n mit a V V 2 V 3 und g(v ) W. Somit ist auch V W V 3 W V 1 U und wir haben die q-fach stetig differenzierbare Abbildung g := g V : V W. Sei x V. Wegen x V 2 ist (x, ) W 1, also haben wir (x, y) := G(x, ) V 1 U und es gilt (x, ) = F (x, y) = (x, f(x, y)). Hieraus folgen x = x und f(x, y) = f(x, y) =. Weiter ist y = pr(g(x, )) = g(x) und somit ist f(x, g(x)) = f(x, y) =. Nun sei umgekehrt y W mit f(x, y ) = gegeben. Dann sind (x, y ) V W V 1, (x, g(x)) V W V 1 und F (x, y ) = (x, f(x, y )) = (x, ) = (x, f(x, g(x))) = F (x, g(x)), d.h. es gilt y = g(x). Auserdem haben wir G(x, ) = (x, g(x)) eingesehen. 23 ),

24 Mathematik für Physiker III, WS 212/213 Freitag Es verbleibt nur noch die Aussage über die Ableitung von g einzusehen. Sei wieder x V. Mit der Kettenregel II. 8.Satz 17 folgt für jedes u R n die Gleichung Beachten wir weiter g (x)u = pr(g (x, )(u, )). ( G (x, ) = F (G(x, )) 1 = F (x, g(x)) 1 = ( = so folgt für jedes u R n weiter (( g (x)u = pr 1 D x f(x, g(x)) D y f(x, g(x)) ) 1 1 D y f(x, g(x)) 1 D x f(x, g(x)) D y f(x, g(x)) 1 1 D y f(x, g(x)) 1 D x f(x, g(x)) D y f(x, g(x)) 1 Damit ist der Satz vollständig bewiesen. ) ( u )) ), = D y f(x, g(x)) 1 D x f(x, g(x))u. Im speziellen Fall einer Gleichung in zwei Unbekannten, also n = m = 1, wird die Bedingung des Satzes zu f/ y(a, b) und die Ableitung der Auflösungsfunktion y = g(x) berechnet sich zu f (x, y) g (x) = x f y (x, y). Schauen wir uns dies einmal in den beiden obigen Beispielen an. Die Gleichung x 2 +y 2 = r 2 wird beschrieben durch f(x, y) = x 2 + y 2 r 2 mit f x = 2x, f y = 2y. Die Determinantenbedingung ist also für y erfüllt, und die Ableitung von y nach x wird y (x) = 2x/(2y(x)) = x/y(x), wie wir schon oben gerechnet haben. Für die Gleichung f(x, y) := e 2x 3y + 3x 5y! = haben wir f x = 2e2x 3y + 3, f y = 3e2x 3y 5 <, diese Gleichung ist also überall lokal nach y auflösbar. Als Ableitung von y nach x ergibt sich erneut die schon oben berechnete Formel. Zum Abschluß dieses Kapitels wollen wir uns auch noch ein Beispiel zum Satz über implizite Funktionen in mehreren Variablen anschauen. In diesem Beispiel haben wir m = 2 Gleichungen in n + m = 5 24

25 Mathematik für Physiker III, WS 212/213 Freitag Unbekannten x 1, x 2, x 3, y 1, y 2 und wir wollen nach den Variablen y 1 und y 2 auflösen. Das betrachtete Gleichungssystem ist e y 1 + y 2 x 1 sin x 2 + x 2 3 = 2 (y 1 x 1 ) 2 + (y 2 x 2 ) 2 e x 3 = 1, wir haben also die unendlich oft differenzierbare Funktion ( f : R 5 R 2 e ; (x 1, x 2, x 3, y 1, y 2 ) y 1 + y 2 x 1 sin x 2 + x (y 1 x 1 ) 2 + (y 2 x 2 ) 2 e x 3 1 Eine Lösung ist im Punkt (a, b) = (1,,,, 1). Als Ableitungen erhalten wir ( ) y D x f(x, y) = 2 cos x 2 2x 3 2(y 1 x 1 ) 2(y 2 x 2 ) e x, 3 ( ) e D y f(x, y) = y 1 x 1, 2(y 1 x 1 ) 2(y 2 x 2 ) und in der Lösung (x, y) = (a, b) haben wir speziell ( ) 1 1 D x f(a, b) = und D y f(a, b) = ( also det D y f(a, b) = 4. Nach dem Satz über implizite Funktionen Satz 8 gibt es damit offene Mengen U R 3 mit (1,, ) U, V R 2 mit (, 1) V so, dass es für jedes x U genau ein y = g(x) V mit f(x, y) = gibt. Weiter ist g unendlich oft differenzierbar mit der Ableitung g (x) = D y (x, g(x)) 1 D x f(x, g(x)) für alle x U. Betrachten wir speziell x = a = (1,, ), so ist g(x) = g(a) = b = (, 1) und wir haben die Ableitung ( 1 1 g (1,, ) = 2 2 ) 1 ( ) = 1 ( ) ( ) = 1 4 ), ). ( ). $Id: lagrange.tex,v /3/8 6:29:22 hk Exp $ 2 Extrema unter Nebenbedingungen In diesem Kapitel wollen wir die Rechentechniken zur Bestimmung lokaler und globaler Extremalwerte einer reellwertigen Funktion weiter ausbauen. Wir wiederholen 25

26 Mathematik für Physiker III, WS 212/213 Freitag erst einmal alles was wir zu diesem Thema bereits aus dem vorigen Semester wissen. Sind M eine Menge und f : M R eine reelle Funktion auf M, so nennen wir einen Punkt x M ein globales Maximum der Funktion f wenn f(x ) f(x) für alle x M gilt, d.h. wenn f(x ) = sup{f(x) x M} ist, und ein globales Minimum der Funktion f wenn f(x ) f(x) für alle x M gilt, d.h. wenn f(x ) = inf{f(x) x M} ist. Schließlich heißt x ein globales Extremum von f wenn f ein globales Maximum oder ein globales Minimum von f ist. Ist M nicht nur irgendeine Menge sondern eine Teilmenge M E eines normierten Raums E, so können wir auch von lokalen Maxima und Minima der Funktion f sprechen. Wir nennen x M ein lokales Maximum von f wenn es ein ɛ > mit f(x ) f(x) für alle x M mit x x < ɛ gibt, d.h. wenn x ein globales Maximum der Einschränkung f B ɛ (x ) M ist. Entsprechend wird ein lokales Minimum von f definiert und schließlich heißt x ein lokales Extremum von f wenn x ein lokales Maximum oder ein lokales Minimum von f ist. Offenbar ist ein globales Maximum auch ein lokales Maximum und ein globales Minimum auch ein lokales Minimum, aber nicht umgekehrt. Nun sei M = U R n konkret eine offene Teilmenge des R n und f : U R n sei eine differenzierbare Funktion. Die Grundbeobachtung zur Bestimmung lokaler Extrema ist dann der II. 8.Satz 24 x U ist lokales Extremum von f = grad f(x ) =. Dieser Satz konnte durch eine einfache Beobachtung auf den eindimensionalen Fall zurückgeführt werden. Hat die Funktion f in x etwa ein lokales Maximum und ist v R n ein Vektor, so hat auch die Funktion f v (t) := f(x +tv) in t = ein lokales Maximum, und wie wir aus dem eindimensionalen Fall wissen folgt hieraus f v() =, dies wurde im ersten Semester etwa als I. 14.Lemma 8 behandelt. Verwenden wir jetzt den Zusammenhang zwischen Ableitungen und Richtungsableitungen II. 8.Lemma 13.(c), so ergibt sich weiter f (x )v = v f(x ) = f v() =. Damit ist f (x ) =, wie behauptet. Punkte in denen der Gradient von f verschwindet nennt man auch die kritischen Punkte der Funktion f, allerdings ist im allgemeinen nicht jeder kritische Punkt auch ein lokales Extremum. Wie in II. 8.6 beschrieben erhalten wir aus dem eben wiederholten Satz eine Methode zur Berechnung globaler Maxima, und analog auch globaler Minima. Gegeben seien eine offene Menge U R n, eine differenzierbare Funktion f : U R n und eine abgeschlossene Teilmenge M R n mit M U. Wir nehmen an, dass f M überhaupt ein globales Maximum besitzt, dass es also ein x M mit f(x ) = sup{f(x) x M} gibt. Dies ist nach II. 8.Lemma 1.(d) beispielsweise garantiert wenn die Menge M kompakt ist. Ist jetzt x M ein innerer Punkt von M, so hat die Funktion f in x insbesondere ein lokales Maximum, und somit muss grad f(x ) = gelten. Andernfalls liegt x M\M = M auf dem Rand der Menge M. Bestimmen wir also alle kritischen Punkte x 1, x 2,... von f im Inneren von M und zusätzlich das Maximum 26

27 Mathematik für Physiker III, WS 212/213 Freitag von f auf dem Rand M, so müssen wir nur die Funktionswerte f(x 1 ), f(x 2 ),... sowie das Randmaximum miteinander vergleichen, und der größte dabei auftretende Wert liefert das globale Maximum von f auf M. Als ein kleines Beispiel hierzu schauen wir uns die Funktion f : R 2 R; (x, y) x 2 y y 2 + 2x 2 + y an, und wollen das globale Maximum auf dem Kreis M := B 1 () bestimmen. Dazu benötigen wir erst einmal die kritischen Punkte, und rechnen f x = 2xy + 4x = 2x(y + 2) =!, f y = x 2 2y + 1 =!. Dier erste Gleichung ergibt x = oder y = 2. Setzen wir x = in die zweite Gleichung ein, so wird diese zu 1 2y =, also y = 1/2, und wir haben den kritischen Punkt p = (, 1/2). Setzen wir dagegen y = 2 ein, so wird die zweite Gleichung zu x =, dies liefert also keinen weiteren kritischen Punkt. Wir haben also einen eindeutigen kritischen Punkt und dieser liegt im Inneren von M mit dem Funktionswert f(, 1/2) = 1/4. Es verbleibt die Betrachtung des Randes M. Die Punkte auf M können wir als x = cos φ, y = sin φ mit φ 2π schreiben. Dabei ist f(cos φ, sin φ) = sin φ cos 2 φ sin 2 φ + 2 cos 2 φ + sin φ = (sin 3 φ + 3 sin 2 φ 2 sin φ 2), und schreiben wir s := sin φ so wird dies zu f(cos φ, sin φ) = (s 3 + 3s 2 2s 2). Dabei ist s 1 und zur Berechnung des maximalen auftretenden Wertes bestimmen wir ( d ds (s3 + 3s 2 2s 2) = 3s 2 + 6s 2 = 3 s 2 + 2s 2 ) 3 mit den Nullstellen in s = 1 ± = 1 ± 5 3. Wegen s 1 kommt nur s = 5/ 3 1 in Frage mit dem Funktionswert ( 3 ( 2 ( ) ) + 3 1) = Die Funktionswerte an den Endpunkten s = ±1 sind dagegen 2 und, und damit ist max (x,y) M f(x, y) =

28 Mathematik für Physiker III, WS 212/213 Freitag und dieser Wert wird angenommen für sin φ = s = 5/ Wegen φ 2π ergeben sich für φ die zwei möglichen Werte φ 1 = arcsin( 5/ 3 1) und φ 2 = π φ 1. Die zugehörigen Werte des Cosinus sind cos φ 1 = 1 sin 2 φ 1 = = und cos φ 2 = cos(π φ 1 ) = cos φ 1. Das globale Maximum wird also in (± (2 15 5)/3, ( 15 3)/3) angenommen. Das globale Minimum ist dagegen min f(x, y) = 2 (x,y) M angenommen für sin φ = s = 1, also in φ = 3π/2 mit cos φ =, d.h. im eindeutigen Punkt (, 1). Für die Bestimmung des globalen Maximums oder Minimums ist es nicht nötig zu entscheiden welche kritischen Stellen lokale Extrema von welchen Typ sind. Will man dies aus irgendwelchen Gründen doch tun, so nehmen wir weiter an das f sogar zweifach stetig differenzierbar ist. Ist dann x U ein kritischer Punkt, so bilden wir die Hesse-Matrix H := 2 f 2 f (x x 2 ) 1 x 1 x n (x ) f x n x 1 (x ) 2 f (x x 2 ) 1 Nach dem Schwarzschen Lemma II. 9.Lemma 2 ist H eine symmetrische n n-matrix. Unter günstigen Umständen kann man dann an den Eigenwerten der Hesse-Matrix sehen ob die Funktion f im Punkt x ein lokales Extremum hat, genauer gilt nach II. 9.Satz 5. H positiv definit = x ist lokales Minimum, H negativ definit = x ist lokales Maximum, H indefinit = x ist kein lokales Extremum. Beachte das hierdurch keinesfalls alle möglichen Fälle abgedeckt sind, wenn keiner dieser drei Fälle vorliegt so muss man sich den jeweiligen Einzelfall anschauen. Wir wollen als ein Beispiel einmal den kritischen Punkt p = (, 1/2) der Funktion untersuchen. Wegen f : R 2 R; (x, y) x 2 y y 2 + 2x 2 + y 2 f x = 2(y + 1), 2 f = 2 und 2 2 y2 28 f x y = 2 f y x = 2x

29 Mathematik für Physiker III, WS 212/213 Dienstag ist die Hesse-Matrix in p gegeben als H = ( 3 2 Die Hesse-Matrix ist hier also indefinit, und damit liegt in p kein lokales Extremum vor. ). 2.1 Restringierte Optimierungsaufgaben Vorlesung 5, Dienstag Nachdem wir jetzt die bereits bekannten Techniken zur Bestimmung der lokalen und globalen Maxima und Minima wiederholt haben, wollen wir nun zu einem neuen Problemtyp kommen, den restringierten Maximierungs- beziehungsweise Minimierungsaufgaben. Diese Aufgabenstellungen werden meist unter dem Titel Extrema unter Nebenbedingungen verbucht. Wir beschreiben erst einmal die abstrakte Situation. Gegeben seien eine Menge M und eine reelle Funktion f : M R auf M. Bei den restringierten Aufgaben ist aber nicht die ganze Menge M von Interesse, sondern nur eine vorgegebene Teilmenge S M, die sogenannte Restriktionsmenge, und wir wollen die globalen Maxima und Minima von f auf der Menge S bestimmen, d.h. wir behandeln das globale Optimierungsproblem für die Einschränkung f S. Liegt M E selbst in einem normierten Raum E, so kann man weiter auch lokale Maxima und Minima von f auf S untersuchen. Bei uns wird M = U R n eine offene Teilmenge eines R n sein und f : U R soll zumindest stetig differenzierbar sein. Die Restriktionsmenge S U darf eine erst mal beliebige abgeschlossene Teilmenge von U sein. Der Unterschied zur bereits behandelten Situation liegt darin das wir uns S als eine niederdimensionale Menge denken, dass also insbesondere S = S sein wird. Tatsächlich haben wir diese Situation bereits eingangs einmal gesehen, bei der Optimierung der Funktion f(x, y) = x 2 y y 2 + 2x 2 + y auf M = B 1 () hatten wir ja insbesondere die Maxima und Minima von f auf dem Rand S := B 1 () bestimmt, und diese Rechnung war bereits ein restringiertes Optimierungsproblem wobei die Restriktionsmenge der Kreis S war. Dieses Beispiel hat uns auch bereits die erste Methode zur Lösung derartiger Probleme gezeigt, wir haben die Punkte (x, y) der Restriktionsmenge S durch einen reellen Parameter φ als x = cos φ, y = sin φ geschrieben, und das Problem damit in ein gewöhnliches eindimensionales Optimierungsproblem verwandelt. Diesen Ansatz kann man allgemein verfolgen und kommt dann zur Parametrisierungsmethode zur Lösung restringierter Optimierungsprobleme: 29

30 Mathematik für Physiker III, WS 212/213 Dienstag Gegeben: Eine offene Menge U R n, eine stetig differenzierbare Funktion f : U R und eine abgeschlossene Restriktionsmenge S U. Die Funktion f besitze auf S ein Maximum. Gesucht: Der maximale Wert m := sup{f(x) x S} und eventuell ein oder alle x S mit f(x) = m. Verfahren: Bestimme zunächst eine Parametrisierung von S, finde also eine offene Menge V R k, eine stetig differenzierbare Funktion ϕ : V U und eine abgeschlossene Teilmenge M V mit S = ϕ(m), dabei ist k normalerweise die Dimension von S. Dann bilden wir die stetig differenzierbare Funktion F := f ϕ : V R n, und berechnen s := sup{f (x) x M}, sowie je nach Bedarf die Punkte x M mit F (x) = s. Dies geschieht mit den üblichen Methoden, also Gradient gleich Null setzen und Überprüfen des Randes von M. Ergebnis: Das gesuchte Maximum ist m = s und es wird in den Punkten ϕ(x) angenommen wobei x M die Punkte mit F (x) = s durchläuft. Entsprechend geht man für Minima vor. Zur Berechnung lokaler Extrema kann das Verfahren noch etwas modifiziert werden, ist in ϕ(x) ein lokales Extremum von f S, so hat F in x ein lokales Extremum desselben Typs, wir können also alle Kandidaten für lokale Extrema berechnen. Allerdings ist nicht umgekehrt jeder Wert ϕ(x) ein lokales Extremum von f S nur weil x eines von F ist, dies kommt auf die spezielle Situation an. Hier muss für jeden der ermittelten Kandidaten im Einzelfall bestimmt werden ob wirklich ein lokales Extremum vorliegt. Wir wollen jetzt drei kleine Beispiele rechnen und beginnen mit f : R 3 R; (x, y, z) z 2 xy 3x + 5y und als Restriktionsmenge verwenden wir die Ebene S := {(x, y, z) R 3 x + y + z = 1}. Hier ist es leicht eine Parametrisierung von S herzustellen, indem wir einfach die S definierende Gleichung nach einer der Variablen auflösen, schreiben wir etwa z = 1 x y, so ergibt sich die Parametrisierung ϕ : R 2 R 3 ; (x, y) (x, y, 1 x y). Für die Funktion F := f ϕ : R 2 R erhalten wir für alle x, y R F (x, y) = f(x, y, 1 x y) = (1 x y) 2 xy 3x + 5y = x 2 + y 2 + xy 5x + 3y + 1. Die kritischen Punkte von F ergeben sich als Lösungen des Gleichungssystems F x F y = 2x + y 5 =, = 2y + x + 3 =, 3

31 Mathematik für Physiker III, WS 212/213 Dienstag also y = 5 2x und 13 3x = und somit hat F einen eindeutigen kritischen Punkt in (13/3, 11/3). Um den Typ dieses kritischen Punkts zu bestimmen, berechnen wir die zweiten partiellen Ableitungen von F 2 F x 2 = 2, 2 F y 2 = 2, 2 F x y = 1, und erhalten die Hesse-Matrix H von F im kritischen Punkt als ( ) 2 1 H =, 1 2 und diese Matrix ist wegen det H = 3 > nach dem Hadamard-Kriterium II. 6.Satz 14 positiv definit. Damit hat F im kritischen Punkt ein lokales Minimum. Beachten wir das F eine quadratische Funktion ist und verwenden den Satz über die Hauptachsentransformation II. 6.Satz 1 so folgt das hier sogar das globale Minimum der Funktion F vorliegt. Wegen ϕ(13/3, 11/3) = (13/3, 11/3, 1/3) hat die Funktion f auf der Ebene S im Punkt (13/3, 11/3, 1/3) ihr globales Minimum und es gibt keine weiteren lokalen Extrema von f auf S. Als ein weiteres Beispiel wollen wir die Funktion f : R 3 R; (x, y, z) xy + z behandeln, wobei die Restriktionsmenge S := {x R 3 : p 2 = r} die Kugeloberfläche mit Mittelpunkt in und einem Radius r > ist. Zur Parametrisierung von S verwenden wir die in 1.2 besprochenen Kugelkoordinaten und schreiben x = r cos φ sin ψ, y = r sin φ sin ψ und z = r cos ψ mit φ 2π, ψ π. Die Funktion F wird zu F (φ, ψ) = r 2 sin φ cos φ sin 2 ψ + r cos ψ = r2 2 sin(2φ) sin2 ψ + r cos ψ und wir müssen diese auf der Menge M := [, 2π] [, π] maximieren beziehungsweise minimieren. Für φ, ψ R haben wir F φ = r2 cos(2φ) sin 2 ψ =!, F ψ = r2 sin(2φ) sin ψ cos ψ r sin ψ = r sin ψ (r sin(2φ) cos ψ 1) =!. Zur Bestimmung von Kandidaten für die lokalen Extrema machen wir eine Fallunterscheidung. Fall 1. Zunächst sei sin ψ =. Für die Berechnung der globalen Extrema kann man diesen Fall wegen (φ, ψ) / M ignorieren, für den lokalen Fall muss man ihn sich aber 31

32 Mathematik für Physiker III, WS 212/213 Dienstag anschauen. Aus Periodizitätsgründen können wir ψ = oder ψ = π annehmen, haben also die beiden Kandidatenpunkte p 1 := (,, r) und p 2 := (,, r), also Nord- und Südpol unserer Kugel. Schauen wir uns den Nordpol näher an. Umgebungen des Nordpols werden durch [, 2π] [, ɛ) mit ɛ > parametrisiert und für jedes ψ < ɛ haben wir Es sind m(ψ) := min F (φ, ψ) = r2 φ 2π 2 sin2 ψ + r cos ψ, r2 M(ψ) := max F (φ, ψ) = φ 2π 2 sin2 ψ + r cos ψ. m (ψ) = r 2 sin ψ cos ψ r sin ψ = r sin ψ (r cos ψ + 1) < für ausreichend kleine ψ und M (ψ) = r 2 sin ψ cos ψ r sin ψ = r sin ψ (r cos ψ 1). Damit kann im Nordpol kein lokales Minimum vorliegen. Ist r 1, so ist M (ψ) für ausreichend kleine ψ, also hat die Funktion f dann im Nordpol ein lokales Maximum auf S. Ist dagegen r > 1, so ist M (ψ) > für ausreichend kleine ψ, also hat f dann auch kein lokales Maximum im Nordpol, d.h. für r > 1 liegt im Nordpol kein lokales Extremum von f auf S vor. Analog hat f im Südpol für r 1 ein lokales Minimum aber für r > 1 hat f auch im Südpol kein lokales Extremum. Fall 2. Nun sei sin ψ, und dann können wir uns auf < ψ < π normieren. Wir erhalten cos(2φ) = und r sin(2φ) cos ψ = 1. Wegen cos(2φ) = können wir φ {π/4, 3π/4, 5π/4, 7π/4} annehmen, also φ = φ i für ein i {1, 2, 3, 4} mit φ 1 = π 4, φ 2 = 3π 4, φ 3 = 5π 4 und φ 4 = 7π 4. Es ist weiter also erhalten wir sin(2φ) = { 1, i {1, 3}, 1, i {2, 4}, cos ψ = ± 1 r. Wegen < ψ < π ist cos ψ < 1, also kann dieser Fall für r 1 gar nicht vorkommen. Nun nehmen wir r > 1 an, und dann ist sin ψ = 1 cos 2 ψ = r2 1 r 32

33 Mathematik für Physiker III, WS 212/213 Dienstag und ψ = { arccos(1/r), i {1, 3}, arccos( 1/r) = π arccos(1/r), i {2, 4}. Wir erhalten vier Kandidaten für lokale Extrema von f auf S ( ) r2 1 r2 1 p 3 :=,, 1, 2 2 ( ) r2 1 r2 1 p 4 :=,, 1, 2 2 ( ) r2 1 r2 1 p 5 :=,, 1, 2 2 ( ) r2 1 r2 1 p 6 :=,, Die Untersuchung des Typs dieser Punkte stellen wir noch etwas zurück. Die Funktionswerte in den bisher gefundenen Kandidaten sind f(p 1 ) = r, f(p 2 ) = r, f(p 3 ) = f(p 5 ) = r , f(p 4 ) = f(p 6 ) = r Schauen wir uns noch die Funktionswerte auf den Randpunkten (φ, ψ) M an, also für ψ π und F (, ψ) = F (2π, ψ) = r cos ψ F (φ, ) = r, F (φ, π) = r für φ 2π. Insgesamt haben damit eingesehen: 1. Ist r 1, so hat f auf S im Nordpol sein globales Maximum r und im Südpol sein globales Minimum r. Es gibt keine weiteren lokalen Extrema. 2. Ist r > 1 so ist (r 2 + 1)/2 > r, also nimmt f auf S in den beiden Punkten p 3 und p 5 sein globales Maximum (r 2 + 1)/2 und in den beiden Punkten p 4 und p 6 sein globales Minimum (r 2 + 1)/2 an. Es gibt keine weiteren lokalen Extrema. Insbesondere ist damit der Typ der Kandidatenpunkte im zweiten Fall geklärt. Wir kommen zu einem letzten Beispiel bei dem die Restriktionsmenge durch zwei Gleichungen gegeben ist. Wir betrachten die durch die beiden Gleichungen x 2 + y 2 = 1 2x + y z = 2 33

34 Mathematik für Physiker III, WS 212/213 Dienstag gegebene Teilmenge S R 3. Die Menge S ist der Schnitt eines Zylinders mit einer Ebene, also eine im Raum liegende Ellipse. Als zu optimierende Funktion verwenden wir f : R 3 R; (x, y, z) x 2 + 3xy + yz 2y. Wir müssen zunächst eine Parametrisierung der Ellipse S finden. Hierzu schreiben wir die durch die zweite Gleichung gegebene Ebene E als 1 E = p + v 1, v 2 mit p = 2, v 1 = 1, v 2 =. 1 2 Die Punkte von E haben also die Form p + tv 1 + sv 2 = s t 2 t + 2s mit t, s R. Setzen wir x = s, y = t 2 in die zweite Gleichung ein, so wird diese zu s 2 + (t 2) 2 = 1, in der Parameterebene haben wir also einen Kreis mit Mittelpunkt (2, ) und Radius 1. Diesen können wir für φ 2π parametrisieren mit t = 2 + cos φ, s = sin φ und wir erhalten die Parametrisierung der Restriktionsmenge S durch Für φ 2π ist weiter F (φ) := f(sin φ, cos φ, 2 + cos φ + 2 sin φ) ϕ(φ) = (sin φ, cos φ, 2 + cos φ + 2 sin φ). = sin 2 φ + 3 sin φ cos φ + 2 cos φ + cos 2 φ + 2 sin φ cos φ 2 cos φ = sin(2φ). Damit sind und max φ 2π F (φ) = 7 2 angenommen für φ = φ 1 = π 4, φ = φ 2 = 5π 4 min F (φ) = 3 φ 2π 2 angenommen für φ = φ 3 = 3π 4, φ = φ 4 = 7π 4. Wegen sin φ 1 = cos φ 1 = 1/ 2, sin φ 2 = cos φ 2 = 1/ 2, sin φ 3 = 1/ 2, cos φ 3 = 1/ 2, sin φ 4 = 1/ 2 und cos φ 4 = 1/ 2 nimmt f sein globales Maximum 7/2 auf S in den Punkten p 1 = ( 1 2, 1, ) 2 2 und p 2 = ( 1, 1, 2 3 ) an und das globale Minimum 3/2 auf S ist in den Punkten ( 1 p 3 = 2, 1, ) ( und p 4 = 1 1,, 2 1 ) Es gibt keine weiteren lokalen Extrema. 34

35 Mathematik für Physiker III, WS 212/213 Dienstag Lagrange-Multiplikatoren Wie wir im vorigen Abschnitt gesehen haben, erlaubt die Parametrisierungsmethode es uns weiterhin die aus dem letzten Semester gewohnten Methoden auch für restringierte Optimierungsaufgaben zu verwenden. Die Methode hat allerdings einen Nachteil, man muss erst einmal eine Parametrisierung der Restriktionsmenge S finden. In unseren Beispielen war dies immer leicht möglich da wir entweder die S definierende Gleichung nach einer ihrer Variablen auflösen konnten oder es sich bei S um ein vertrautes Objekt, wie Kreise, Ebenen, Zylinder, Kugeln und so weiter, handelte. In diesem Abschnitt wollen wir eine raffiniertere Methode zur Lösung von Optimierungsaufgaben mit Nebenbedingungen behandeln die auch funktioniert wenn wir für die Restriktionsmenge keine, oder zumindest keine gut handhabbare, Parametrisierung finden. Diese sogenannte Methode der Lagrange-Multiplikatoren kann auf zwei verschiedene Arten begründet werden, zum einen geometrisch und zum anderen optimierungstheoretisch. Den geometrischen Zugang stellen wir noch etwas zurück, und beginnen mit der zweiten Methode. Diese beruht auf dem sogenannten Lagrangeschen Ergänzungsansatz, den wir im nächsten Lemma explizit formulieren werden. In den folgenden Überlegungen gibt es immer zwei mögliche Varianten zu betrachten, eine für Maxima und eine für Minima. Um die Notation und die Formulierungen unserer Aussagen nicht zu überlasten, werden wir zumeist nur die Formulierung für Maxima angeben, für Minima ist dann alles analog und wir werden die Ergebnisse dieses Abschnitts auch ohne weiteren Kommentar entsprechend für Minima anwenden. Lemma 2.1 (Lagrangesche Ergänzungsmethode) Seien M eine Menge, S M eine Teilmenge und f : M R eine reelle Funktion auf M. Weiter sei λ : M R eine Funktion die auf S konstant ist und betrachte die Funktion Λ := f + λ : M R. Ist dann x S ein globales Maximum von Λ, also Λ(x ) = sup Λ(x), x M so ist x auch ein globales Maximum von f auf S, d.h. es gilt f(x ) = sup f(x). x S Beweis: Sei c R mit λ(x) = c für alle x M. Für jedes x M gilt nach unserer Annahme Λ(x ) Λ(x) und für jedes x S folgt damit auch f(x) = f(x) + c c = Λ(x) c Λ(x ) c = f(x ), d.h. f(x ) f(x) und somit ist x ein globales Maximum von f auf S. Die hier auftauchende Lagrange-Funktion λ ist eine reine Hilfsgröße, die im allgemeinen Fall keinerlei eigenständige Bedeutung besitzt. Sie muss unter den auf der Restriktionsmenge S konstanten Funktionen so gewählt werden, dass das globale Maximum 35

36 Mathematik für Physiker III, WS 212/213 Dienstag x M von Λ = f +λ in die Menge S gezwungen wird und damit x S erfüllt. Wie solch eine Lagrange-Funktion zu finden ist, bedarf in der Regel einer an die spezifische Situation angepassten Idee. Die Methode der Lagrange-Multiplikatoren ist jetzt ein standardisierter Spezialfall dieses allgemeinen Lagrangeschen Ergänzungsansatzes. Gegeben seien eine offene Menge U R n und eine stetig differenzierbare Funktion f : U R. Die Restriktionsmenge S U sei durch ein System aus r N vielen Gleichungen mit stetig differenzierbarer linker Seite gegeben, d.h. wir haben stetig differenzierbare Funktionen g 1,..., g r : U R und setzen S := {x U g 1 (x) = = g r (x) = } U. Wir wollen das Maximum beziehungsweise das Minimum der Funktion f auf S bestimmen, also das Optimierungsproblem für f unter den Nebenbedingungen g 1 (x) =,..., g r (x) = lösen. Dabei möchten wir den Lagrangeschen Ergänzungsansatz verwenden, und setzen die Lagrange-Funktion λ in der Form λ : U R; x r λ k g k (x) an, wobei λ 1,..., λ r R noch zu bestimmende reelle Parameter sind, die sogenannten Lagrange-Multiplikatoren. Da die Funktionen g 1,..., g r nach Definition der Menge S auf S identisch Null sind, ist auch die Linearkombination λ der g 1,..., g r auf S konstant gleich Null. Außerdem ist λ eine stetig differenzierbaren Funktion, bilden wir also die Funktion r Λ := f + λ : U R; x f(x) λ k g k (x) so ist auch Λ stetig differenzierbar. Wir benötigen einen Punkt x S in dem Λ ein globales Maximum hat. Insbesondere muss Λ in x dann nach II. 8.Satz 24 einen kritischen Punkt haben, d.h. für jedes 1 i n muss Λ x i (x) = f x i (x) r k=1 k=1 k=1 λ k g k x i (x) = gelten. Dies sind bereits n Gleichungen und beachten wir noch das x S die Gültigkeit der r Gleichungen g j (x ) = für 1 j r bedeutet, so haben wir insgesamt n + r Gleichungen für die n + r vielen Unbekannten x = (x 1,..., x n ), λ 1,..., λ r. Diese Überlegung führt uns auf eine Strategie zur Berechnung eines globalen Maximums von f auf S. Wir lösen die obigen n + r Gleichungen und erhalten einen Punkt x S sowie die Lagrange-Multiplikatoren λ 1,..., λ r. Können wir dann nachweisen das die obige Funktion Λ in x ein globales Maximum besitzt, so ist x nach Lemma 1 auch ein globales Maximum von f auf S. Dies funktioniert dann auch in der lokalen Situation, hat die Funktion Λ in x ein lokales Maximum, so existiert eine offene Menge 36

37 Mathematik für Physiker III, WS 212/213 Dienstag V R n mit x V U so, dass Λ V in x ein globales Maximum hat, und wie bereits gesehen hat f S V damit ebenfalls ein globales Maximum in x, d.h. x ist ein lokales Maximum von f auf S. Bevor wir zu theoretischen Überlegungen kommen, wollen wir uns erst einmal anschauen, wie dieses Rechnung in den drei Beispielen des vorigen Abschnitts aussieht. Wir beginnen mit der Funktion f : R 3 R definiert durch f(x, y, z) = z 2 xy 3x + 5y für alle x, y, z R und als Restriktionsmenge verwenden wir die Ebene S := {(x, y, z) R 3 x+y +z = 1}. Hier sind also n = 3, r = 1 und g 1 = g : R 3 R ist die Funktion mit g(x, y, z) = x + y + z 1 für alle x, y, z R. Wir haben einen Lagrange-Multiplikator λ 1 = λ und müssen das folgende aus vier Gleichungen bestehende System lösen: (1) y 3 λ =, (2) 5 x λ =, (3) 2z λ =, (4) x + y + z = 1. Dies ist ein lineares Gleichungssystem für die vier Unbekannten x, y, z, λ das wir wie üblich lösen und damit sind λ = 2 3, z = 2λ 1 = 1, y = λ 3 = , x = 5 λ = Dies ist tatsächlich genau das globale Minimum von f auf S das wir schon im vorigen Abschnitt gefunden haben. Nach Konstruktion liegt in p = (13/3, 11/3, 1/3) ein kritischer Punkt der ergänzten Funktion Λ(x, y, z) = f(x, y, z) 2 3 g(x, y, z) = z2 xy 11 3 x y 2 3 z + 2 3, deren Hesse-Matrix in p wegen Λ x 11 = y 3, Λ y = x , Λ z = 2z 2 3 gleich H =

38 Mathematik für Physiker III, WS 212/213 Freitag ist. Die Eigenwerte von H sind λ 1 = 1, λ 2 = 1 und λ 3 = 2, diese Matrix ist also indefinit und in p liegt kein lokales Extremum von Λ vor. Wir können hier also nicht das Lemma 1 verwenden um zu begründen das in p auch nur ein lokales Minimum von f in S liegt. In diesem Beispiel liefert die Methode der Lagrange-Multiplikatoren also den richtigen Punkt, kann aber nicht direkt entscheiden das es sich um ein globales Minimum handelt. Im zweiten Beispiel hatten wir die Funktion f : R 3 R mit f(x, y, z) = xy + z für alle x, y, z R auf der Restriktionsmenge S = {x R 3 : x 2 = r} mit r > untersucht. Mit den obigen Bezeichnungen ist also g(x, y, z) = x 2 + y 2 + z 2 r 2 und wir haben die Gleichungen (1) y 2λx =, (2) x 2λy =, (3) 1 2λz =, (4) x 2 + y 2 + z 2 = r 2. Die Gleichungen (1) und (2) sind ein homogenes lineares Gleichungssystem für x, y mit Determinante 2λ 1 1 2λ = 4λ2 1 = (2λ 1) (2λ + 1). Ist also λ ±1/2, so haben wir x = y = und (4) ergibt z = ±r, und wir haben wieder Nord- und Südpol unserer Kugel. Ist λ = 1/2, so bedeuten die Gleichungen (1) und (2) beide x = y und (3) liefert z = 1. Einsetzen in (4) ergibt schließlich 2x 2 = r 2 1, also r 1 und x = y = ± (r 2 1)/2. Im letzten Fall λ = 1/2 haben wir dagegen nach (1) und (2) diesmal y = x, nach (3) ist z = 1 und (4) wird zu 2x 2 = r 2 1 also wieder r 1 und x = ± (r 2 1)/2, y = (r 2 1)/2. Wir haben also erneut genau diejenigen Punkte erhalten die sich schon bei unserer Rechnung über die Parametrisierung durch Kugelkoordinaten ergeben hatten. Vorlesung 6, Freitag In der letzten Sitzung hatten wir begonnen die sogenannte Methode der Lagrange- Multiplikatoren zur Berechnung lokaler und globaler Extrema unter Nebenbedingungen zu besprechen. Gegeben waren eine auf einer offenen Menge U R n definierte, stetig differenzierbare Funktion f : U R und eine durch r Gleichungen beschriebene Restriktionsmenge S = {x U g 1 (x) = = g r (x) = }, wobei g 1,..., g r : U R stetig differenzierbare Funktionen auf U sind. Wir wollen lokale und globale Maxima und Minima der Funktion f auf der Restriktionsmenge 38

39 Mathematik für Physiker III, WS 212/213 Freitag S bestimmen. Die Lagrange-Multiplikatoren λ 1,..., λ r R sind dann r viele noch festzulegende reelle Parameter, die so gewählt werden sollen, dass die ergänzte Funktion Λ : U R; x f(x) r λ k g k (x) in einem Punkt x S der Restriktionsmenge einen kritischen Punkt hat. Konkret bedeutet dies das wir für die n + r Unbekannten x = (x 1,..., x n ), λ 1,..., λ r das aus n + r Gleichungen bestehende System f x i (x ) r k=1 k=1 λ k g k x i (x ) = (1 i n), g j (x ) = (1 j r) lösen müssen. Eine echte Bedeutung hat dabei nur der Punkt x S, die Lagrange- Multiplikatoren sind, wie schon letztes Mal erwähnt, reine Hilfsgrößen ohne eigenständigen inhaltlichen Wert. In einigen speziellen Situationen kann man dann auch den Lagrange-Multiplikatoren noch eine inhaltliche Rolle geben, aber nicht in der hier behandelten allgemeinen Situation. Aus dem Lagrangeschen Ergänzungsansatz Lemma 1 wissen wir { Λ hat in x S ein (lokales) Maximum = { f hat in x ein (lokales) Maximum in S. Konkret waren wir gerade damit beschäftigt die im vorigen Abschnitt mit der Parametrisierungsmethode gerechneten Beispiele auch einmal unter Verwendung der Lagrange- Multiplikatoren durchzurechnen. Die ersten beiden Beispiele haben wir dabei bereits fertiggestellt. Im dritten Beispiel f(x, y, z) = x 2 + 3xy + yz 2y war die Restriktionsmenge durch die beiden Gleichungen x 2 + y 2 = 1, 2x + y z = 2 gegeben. Hier haben wir also n = 3, r = 2, g 1 (x, y, z) = x 2 + y 2 1 und g 2 (x, y, z) = 2x + y z + 2. Damit haben wir gleich zwei Lagrange-Multiplikatoren λ = λ 1, µ = λ 2 und unsere fünf Gleichungen sind (1) 2x + 3y 2λx 2µ =, (2) 3x + z 2λy µ = 2, (3) y + µ =, (4) x 2 + y 2 = 1, (5) 2x + y z = 2. Wir benutzen Gleichung (3) um µ = y zu eliminieren und dann werden (1,2,5) zu einem linearen Gleichungssystem 2(1 λ)x + 5y = 3x + (1 2λ)y + z = 2 2x + y z = 2 39

40 Mathematik für Physiker III, WS 212/213 Freitag in dem λ als Parameter erscheint. Dieses System lösen wir per Gauß-Elimination wobei wir die Stufenform in der Variablenreihenfolge x, z, y bilden λ 1 2 2(1 λ) λ λ 1 λ 2(1 λ) λ λ 4λ2 5 Wäre jetzt λ 4λ 2, so hätten wir y =, z = 2 und x =, aber dann ist Gleichung (4) nicht erfüllt. Es muss also λ 2 2λ 21/4 = sein und wir erhalten λ = 1 ± = 1 ± 5 2. Wir unterscheiden die beiden möglichen Fälle. Fall 1. Zunächst sei λ = 3/2. Unser lineares Gleichungssystem wird dann zu und folglich sind 2x + y z = z 2 = 5 y = 2 z und x = 1 2 z 1 2 y 1 = z 2. Setzen wir diese Werte in Gleichung (4) ein, so wird diese zu Für y und z ergeben sich und wir haben zwei Kandidaten p 1 = x 2 + y 2 = 2(z 2) 2! = 1, also z = 2 ± 1 2. x = z 2 = ± 1 2, y = 2 z = 1 2, ( 1 2, 1, ), p 2 = 2 2 ( 1 2, 1, 2 1 ). 2 2 Fall 2. Nun sei λ = 7/2. Unser lineares Gleichungssystem wird dann zu 2x + y z = 2 15y 2 + 5z 2 = 5 und folglich sind y = z 2 3 und x = 1 2 z 1 2 y 1 = z = y.

41 Mathematik für Physiker III, WS 212/213 Freitag Setzen wir diese Werte in Gleichung (4) ein, so wird diese zu x 2 + y 2 = 2 9 (z 2)2! = 1, also z = 2 ± 3 2. Für y und z ergeben sich x = y = z 2 3 = ± 1 2, und wir haben weitere zwei Kandidaten ( 1 1 p 3 = 2,, ) (, p 4 = 1, 1, 2 3 ) Diese vier Punkte sind wieder genau die vier lokalen Extrema die wir auch schon mit der Parametrisierungsmethode gefunden haben. In allen diesen Beispielen finden wir also mittels der Lagrange-Multiplikatoren genau dieselben Punkte die sich auch über die Parametrisierungsmethode ergeben hatten, allerdings kennen wir bislang keinen rechten Grund warum dies so ist. Im ersten der drei Beispiele hatten wir gesehen das sogar in einem globalen Minimum des restringierten Problems kein lokales Extremum der ergänzten Funktion Λ vorliegen muss. Im folgenden Satz werden wir einsehen, dass sich für jedes lokale Extremum des restringierten Problems immer ein passender Satz von Lagrange-Multiplikatoren finden läßt solange eine gewisse geometrische Bedingung an die Nebenbedingungen g 1,..., g r erfüllt ist. Satz 2.2 (Hauptsatz über Lagrange-Multiplikatoren) Seien n, r N\{}, U R n offen und f, g 1,..., g r : U R n stetig differenzierbare Funktionen. Setze Dann gelten: S := {x U g 1 (x) = = g r (x) = } U. (a) Sind x S und λ 1,..., λ r R so, dass x ein globales (lokales) Maximum der Funktion r Λ : U R; x f(x) λ k g k (x) ist, so hat die Funktion f in x ein globales (lokales) Maximum auf S und für jedes 1 i n gilt die Gleichung f x i (x ) r k=1 k=1 λ k g k x i (x ) =. Die entsprechende Aussage gilt dann auch für lokale und globale Minima. 41

42 Mathematik für Physiker III, WS 212/213 Freitag (b) Sei x S so, dass f in x ein lokales Extremum auf S hat. Weiter seien die Vektoren grad g 1 (x ),..., grad g r (x ) linear unabhängig. Dann existieren λ 1,..., λ r R mit für alle 1 i n. f x i (x ) r k=1 λ k g k x i (x ) = Beweis: (a) Dies haben wir bereits mittels des Lagrangeschen Ergänzungsansatzes Lemma 1 eingesehen. (b) Wir betrachten die stetig differenzierbare Funktion g := (g 1,..., g r ) : U R r. Die Vektoren grad g 1 (x ),..., grad g r (x ) sind dann die Zeilen der Jacobi-Matrix Dg(x ) von g im Punkt x, und da diese als linear unabhängig vorausgesetzt sind hat die r n-matrix Dg(x ) nach I. 12.Satz 3.(c) den Rang r und es gibt auch r linear unabhängige Spalten von Dg(x ). Zur Vereinfachung der Notation können wir durch eventuelles Umsortieren der Argumente dann auch gleich annehmen, dass die hinteren r Spalten von Dg(x ) linear unabhängig sind. Schreiben wir dann die Punkte des R n als (x 1,..., x n ) = (x 1,..., x n r, y 1,..., y r ) = (x, y) mit x = (a, b), so besteht die r r-matrix g 1 g y 1 (x ) 1 g y r (x ) 1 g x n r+1 (x ) 1 x n (x ) D y g(x ) =..... =..... g r g y 1 (x ) r g y r (x ) r g x n r+1 (x ) r x n (x ) aus r linear unabhängigen Spalten, hat also wieder den vollen Rang r und ist somit invertierbar. Damit können wir den Satz über implizite Funktionen 1.Satz 8 auf die Funktion g anwenden, und erhalten offene Mengen V R n r, W R r mit a V, b W und V W U so, dass es für jedes x V genau ein ϕ(x) W mit g(x, ϕ(x)) =, also (x, ϕ(x)) S, gibt. Weiter ist ϕ nach diesem Satz stetig differenzierbar mit ϕ(a) = b und für jedes x V gilt ϕ (x) = D y g(x, ϕ(x)) 1 D x g(x, ϕ(x)). Wie im Satz über implizite Funktionen bezeichnet D y dabei die partiellen Ableitungen nach den Variablen y 1,..., y r und D x die nach x 1,..., x n r. Wir betrachten jetzt die stetig differenzierbare Funktion F : V R; x f(x, ϕ(x)), und behaupten das diese in a ein lokales Extremum hat. Da nämlich f in x = (a, b) ein lokales Extremum auf S hat, gibt es ɛ > so, dass f(x ) f(x) für alle x S mit x x < ɛ gilt oder dass f(x ) f(x) für alle x S mit x x < ɛ gilt. Da mit ϕ auch die Funktion ψ : V R n ; x (x, ϕ(x)) stetig ist und ψ(a) = (a, ϕ(a)) = (a, b) = x gilt, existiert ein δ > mit ψ(b δ (a)) B ɛ (x ). Für jedes 42

43 Mathematik für Physiker III, WS 212/213 Freitag x V mit x a < δ ist dann (x, ϕ(x)) = ψ(x) S B ɛ (x ) und somit F (x) = f(x, ϕ(x)) f(x ) = f(a, ϕ(a)) = F (a) wenn x ein lokales Maximum von f auf S ist beziehungsweise analog F (x) F (a) wenn f ein lokales Minimum von f auf S ist. Damit hat die Funktion F im Punkt a tatsächlich ein lokales Maximum oder ein lokales Minimum. Somit hat die Funktion F in a ein lokales Extremum und mit II. 8.Satz 24 ergibt sich F (a) =. Mit der Kettenregel II. 8.Satz 17 folgt weiter ( ) 1 = F (a) = f (a, b) ϕ (a) = ( ) ( D x f(a, b) D yf(a, b) 1 D y g(a, b) 1 D x g(a, b) = D x f(a, b) D y f(a, b) D y g(a, b) 1 D x g(a, b), und wir schreiben den Zeilenvektor D y f(a, b) D y g(a, b) 1 R r als λ = (λ 1,..., λ r ) := D y f(a, b) D y g(a, b) 1 R r. Die obige Gleichung nimmt damit die Form D x f(x ) λ D x g(x ) = an, und ausgeschrieben bedeutet dies f r g k (x ) λ k (x ) = x i x i k=1 für alle 1 i n r. Um auch die noch fehlenden x n r+i = y i für 1 i r zu behandeln, schreiben wir die Definition des Vektors λ um zu D y f(x ) λ D y g(x ) = und dies bedeutet r r für 1 i r. f x n r+i (x ) k=1 λ k g k (x ) = f (x ) x n r+i y i k=1 λ k g k y i (x ) = ) Dieser Satz zeigt uns, dass wir über die Gleichungen für die Lagrange-Multiplikatoren tatsächlich fast alle lokalen Extrema der Funktion f auf der Restriktionsmenge S finden. Eine potentielle Ausnahme sind nur diejenigen Punkte in denen die Gradienten der Nebenbedingungen linear abhängig sind, diese Punkte müssen noch gesondert untersucht werden. Was die lineare Unabhängigkeit der Gradienten geometrisch bedeutet werden wir im nächsten Kapitel behandeln, insbesondere werden wir dann sehen das dieser Fall bei ausreichend glatter Restriktionsmenge S nicht vorkommt. Wir fassen unsere bisherigen Erkenntnisse über die Lagrange-Multiplikatoren jetzt noch in einem Korollar zusammen, dieses bietet inhaltlich nichts Neues und dient nur organisatorischen Zwecken. Korollar 2.3 (Lokale Extrema unter Nebenbedingungen) Seien n, r N mit 1 r n, U R n offen und f, g 1,..., g r : U R stetig 43

44 Mathematik für Physiker III, WS 212/213 Freitag differenzierbare Funktionen. Setze S := {x U g 1 (x) = = g r (x) = } U und bilde die folgenden beiden Mengen { A := x S (λ 1,..., λ r R) (1 i n) : f (x) x i { B := x S Die Gradienten grad g } 1(x),...,. grad g r (x) sind linear abhängig r k=1 λ k g k x i (x) = Dann liegt jedes lokale Extremum von f auf der Restriktionsmenge S in A B. Besitzt f ein globales Maximum auf S, so gilt M := sup f(x) = max f(x) x S x A B und jedes globale Maximum von f auf S liegt in A B. Beweis: Ist x S ein lokales Extremum von f auf S, so sind entweder die Gradienten grad g 1 (x),..., grad g r (x) linear abhängig und wir haben x B, oder diese Gradienten sind linear unabhängig und dann gibt es nach dem Hauptsatz über die Lagrange- Multiplikatoren Satz 2 passende Lagrange-Multiplikatoren zu x und wir haben x A. Besitzt f schließlich ein globales Maximum auf S, so ist dieses insbesondere ein lokales Maximum von f auf S und liegt somit in A B, d.h. die Maxima von f auf S und auf A B stimmen überein. }, Wir wollen noch ein paar abschließende Anmerkungen zu diesem Thema machen. Wir übernehmen dabei die Bezeichnungen des Korollars. Beachte zunächst das die kompliziert aussehende Menge A einfach die Menge aller Lösungen der n + r Gleichungen für die Lagrange-Multiplikatoren ist, wobei die Multiplikatoren selbst nicht in A erscheinen. Die Ausnahmemenge B ist in den meisten Fällen leer, linear abhängige Gradienten treten auf S meist gar nicht auf. Weiter ist zwar jedes lokale Extremum des auf S restringierten Problems in A B, allerdings ist nicht umgekehrt jedes Element von A B, oder auch nur von A, ein lokales Extremum von f auf S. Bei welchen der Kandidatenpunkte x A B es sich wirklich um lokale Extrema auf S handelt muss immer im Einzelfall untersucht werden. Wir wollen uns jetzt noch kurz überlegen das die Menge B in unseren drei Beispielen tatsächlich immer leer ist, und gehen die drei Beispiele hierzu der Reihe nach durch. Dabei geben wir jeweils nur die Nebenbedingungen an, da die zu optimierende Funktion f für diese Überlegung keine Rolle spielt. 1. Im ersten Beispiel hatten wir eine Nebenbedingung g : R 3 R; (x, y, z) x + y + z 1, also S = {(x, y, z) R 3 x + y + z = 1}. Für alle x, y, z R ist dann grad g(x, y, z) = (1, 1, 1) und da ein einzelner von Null verschiedener Vektor linear unabhängig ist, ist in diesem Fall B =. 44

45 Mathematik für Physiker III, WS 212/213 Freitag Im zweiten Beispiel hatten wir wieder eine Nebenbedingung, diesmal g : R 3 R; (x, y, z) x 2 + y 2 + z 2 r 2, wobei r > eine Konstante ist. Es ist S = {(x, y, z) R 3 x 2 + y 2 + z 2 = r 2 } und für jedes (x, y, z) R 3 gilt grad g(x, y, z) = (2x, 2y, 2z). Wegen / S ist damit grad g(x) für alle x S, und somit haben wir wieder B =. 3. Im letzten Beispiel hatten wir zwei Nebenbedingungen g 1, g 2 : R 3 R, gegeben durch g 1 (x, y, z) = x 2 + y 2 1 und g 2 (x, y, z) = 2x + y z + 2 für alle x, y, z R. Für x, y, z R haben diese Funktionen die Gradienten grad g 1 (x, y, z) = (2x, 2y, ) und grad g 2 (x, y, z) = (2, 1, 1). Für (x, y, z) S ist stets (x, y) (, ), also sind diese beiden Gradienten in (x, y, z) linear unabhängig und wir haben auch in diesem Fall B = eingesehen. $Id: untermfg.tex,v /3/8 6:28: hk Exp $ 3 Untermannigfaltigkeiten des R n In diesem kurzen Kapitel wollen wir auf zwei durch die Entwicklungen des 2 aufgeworfene Fragen eingehen. Im Hauptsatz über die Lagrange-Multiplikatoren 2.Satz 2 hatten wir gesehen, dass es zu einem gegebenen lokalen Extremum x S einer stetig differenzierbaren Funktion f : U R auf S = {x U g 1 (x) = = g r (x) = } stets einen passenden Satz von Lagrange-Multiplikatoren gibt, ausser wenn die Gradienten der Nebenbedingungen im Punkt x, also grad g 1 (x),..., grad g r (x), linear abhängig sind. Im Beweis des Hauptsatzes hatten wir die lineare Unabhängigkeit dieser Gradienten benötigt um die Voraussetzungen des Satzes über implizite Funktionen herzustellen. Beachte das diese Bedingungen nur die Funktionen g 1,..., g r, also letztlich die Restriktionsmenge S, betreffen und von der betrachteten Funktion f völlig unabhängig sind. Damit stellt sich die Frage ob die lineare Unabhängigkeit der Gradienten nur eine rein technische Bedingung ist oder ob sie eine geometrische Bedeutung für die Menge S besitzt? Weiter stellt sich die Frage wie die Parametrisierungsmethode und die Methode der Lagrange-Multiplikatoren miteinander zusammenhängen? Jedes unserer Beispiele konnten wir mit beiden Methoden behandeln, aber zunächst wäre es denkbar das es Beispiele gibt die sich nur mit der einen Methode rechnen lassen aber nicht mit der 45

46 Mathematik für Physiker III, WS 212/213 Freitag anderen. Die Parametrisierungsmethode ist anwendbar wenn wir unsere Restriktionsmenge S parametrisieren können und die Methode der Lagrange-Multiplikatoren ist anwendbar wenn wir sie mittels Nebenbedingungen g 1 (x) = = g r (x) = beschreiben können. Wie wir sehen werden sind diese beiden Eigenschaften, unter gewissen Nebenbedingungen, zumindest lokal völlig gleichwertig. Die beiden Methoden erfassen also im wesentlichen dieselben Restriktionsmengen S, und es stellt sich die Frage welches diese Mengen sind? Es stellt sich heraus das all diese Fragestellungen auf denselben Begriff hinauslaufen, die Menge S muss in einem geeigneten Sinne glatt sein. Die nun folgende exakte Formulierung dieses Konzepts berücksichtigt sogar verschiedene Glattheitsstufen die durch den Grad der geforderten Differenzierbarkeit festgelegt sind. Definition 3.1: Seien n, m N und q N { } mit n, m, q 1 gegeben. Eine Teilmenge M R n heißt eine m-dimensionale C q -Untermannigfaltigkeit des R n wenn es für jedes x M stets eine offene Menge U R m, ein a U und eine q-fach stetig differenzierbare Funktion ϕ : U R n mit ϕ(a) = x und den folgenden drei Eigenschaften gibt: (a) Die Abbildung ϕ ist injektiv. (b) Für jede offene Menge V R m mit V U gibt es eine offene Menge W R n mit ϕ(v ) = W M. (c) Für jedes x U sind die m Vektoren linear unabhängig. ϕ ϕ (x),..., (x) x 1 x m Jede solche Funktion ϕ mit den drei genannten Eigenschaften (a,b,c) heißt dann eine C q -Parametrisierung von M. Die Forderungen (a) und (c) überlappen sich dabei etwas in ihrer inhaltlichen Bedeutung, sie sollen Doppelparametrisierungen und ähnliche unerwünschte Probleme ausschließen. Beispielsweise wird sowohl durch (c) als auch durch (a) verboten eine Gerade etwa durch zwei Parameter zu beschreiben. Die Bedingung (b) ist etwas diffiziler, auf ihre Bedeutung werden wir erst später eingehen. Tatsächlich gibt es eine Variante des Begriffs der Untermannigfaltigkeit bei der auf (b) verzichtet wird. Wie schon angekündigt ist die lokale Parametrisierbarkeit gleichwertig zur lokalen Beschreibbarkeit durch Nebenbedingungen, der Beweis des entsprechenden Satzes ist dabei eine Übungsaufgabe. Satz 3.1 (Kennzeichnung von Untermannigfaltigkeiten) Seien n, m N, q N { } mit n, m, q 1 und M R n eine Teilmenge des R n. Genau dann ist M R n eine m-dimensionale C q -Untermannigfaltigkeit des R n wenn 46

47 Mathematik für Physiker III, WS 212/213 Dienstag es für jedes x M stets eine offene Menge U R n mit x U und q-fach stetig differenzierbare Funktionen g 1,..., g n m : U R gibt so, dass M U = {x U g 1 (x) = = g n m (x) = } gilt und die Gradienten grad g 1 (x),..., grad g n m (x) für jedes x M U linear unabhängig sind. Beweis: = Dies ist klar nach Aufgabe (15). = Dies wird in der Implikation von (b) nach (a) in Aufgabe (15) bewiesen. Zum Abschluß der heutigen Sitzung wollen wir noch ein erstes Beispiel einer Untermannigfaltigkeit angeben. Erinnern wir uns an das erste Beispiel aus 2.1, so hatten wir gesehen das die einfachste Möglichkeit zur Herstellung einer Parametrisierung das Auflösen der betrachteten Gleichung nach einer der Variablen ist. Die durch solche Parametrisierungen beschriebenen Untermannigfaltigkeiten des R n sind gerade die Graphen q-fach stetig differenzierbarer Funktionen. Um dies genauer zu beschreiben, seien n, m N und q N { } mit n, m, q 1, eine offene Menge U R n und eine q-fach stetig differenzierbare Funktion f : U R m gegeben. Dann ist der Graph von f, also die Menge M := {(x, f(x)) x U} R n+m eine n-dimensionale Untermannigfaltigkeit des R n+m. Wir können nämlich für alle Punkte von M dieselbe Parametrisierung ϕ : U R n+m ; x (x, f(x)) verwenden. Dies ist eine injektive, q-fach stetig differenzierbare Funktion mit ϕ(u) = M und für jedes x U sind die Vektoren ( ) ϕ e1 (x) = f,..., ϕ ( ) en (x) = f x 1 x 1 (x) x n x n (x) im R n+m linear unabhängig. Außerdem haben wir für jede offene Menge U R n mit U U im R n+m die offene Menge V := U R m mit M V = ϕ(u ). Nehmen wir etwa konkret die Funktion f : R R; x x 2, so wird die Parabel M = {(x, x 2 ) x R} eine eindimensionale C -Untermannigfaltigkeit des R 2 und nehmen wir f : R 2 R; (x, y) x 2 + y 2 so wird das Rotationsparaboloid M = {(x, y, x 2 + y 2 ) x, y R} eine zweidimensionale C -Untermannigfaltigkeit des R 3. 47

48 Mathematik für Physiker III, WS 212/213 Dienstag Vorlesung 7, Dienstag In der letzten Sitzung haben wir Untermannigfaltigkeiten des R n und ihre Parametrisierungen definiert. Wir hatten auch schon festgehalten das dies sowohl die Mengen sind die sich gut durch Nebenbedingungen beschreiben lassen als auch die Mengen die sich vernünftig parametrisieren lassen. Als Beispiel kennen wir bisher nur die Graphen q-fach stetig differenzierbarer Funktionen, beispielsweise eine Parabel im R 2 oder ein Paraboloid im R x 2 Parabel y = x 2 Paraboloid z = x 2 + y 2 Weitere Beispiele lassen sich als durch Gleichungen definierte Untermannigfaltigkeiten konstruieren, und hierzu wollen wir den folgenden Konstruktionssatz verwenden: Korollar 3.2 (Satz vom regulären Urbild) Seien n, m N, q N { } mit n, q 1, 1 m < n, U R n offen und f : U R m eine q-fach stetig differenzierbare Funktion. Weiter sei a R m und setze M := f 1 (a) = {x U f(x) = a}. Für jedes x M habe die Ableitung f (x) R m n den Rang m. Dann ist M eine (n m)-dimensionale C q -Untermannigfaltigkeit des R n. Beweis: Für jedes 1 i m haben wir die q-fach stetig differenzierbare Funktion und es gilt g i : U R; x f i (x) a i M = M U = {x U (1 i n) : f i (x) = a i } = {x U g 1 (x) = = g m (x) = }. 48

49 Mathematik für Physiker III, WS 212/213 Dienstag Ist x M so sind die Gradienten grad g 1 (x),..., grad g m (x) genau die Zeilen der Jacobi- Matrix f (x), und da diese nach unserer Annahme den Rang m hat, sind die Gradienten nach I. 12.Satz 3.(c) linear unabhängig. Nach Satz 1 ist M eine (n m)-dimensionale C q -Untermannigfaltigkeit des R n. Man nennt einen Wert a R m so, dass f (x) für jedes x U mit f(x) = a stets den Rang m hat auch einen regulären Wert der Funktion f. Diese Situation kommt häufig vor, es gibt sogar einen allgemeinen, allerdings schon recht komplizierten, Satz der besagt das bei ausreichender häufiger Differenzierbarkeit fast alle Punkte a R m reguläre Werte von f sind. Diesen Satz wollen wir hier aber nicht behandeln und uns lieber zwei kleine Beispiele anschauen. Beachte dabei das die Bedingung rang f (x) = m im Fall m = 1 reellwertiger Funktionen einfach zu f (x) wird. Als erstes Beispeil nehmen wir n-dimensionale Sphäre, d.h. die Oberfläche der Einheitskugel S n := {x R n+1 : x 2 = 1} im R n+1 und behaupten das diese eine n-dimensionale C -Untermannigfaltigkeit des R n+1 ist. Hierzu müssen wir nur die unendlich oft differenzierbare Funktion f : R n+1 R; x x 2 2 = n k=1 x 2 k und den Wert a := 1 R betrachten. Dieser ist ein regulärer Wert von f, denn für jedes x S n = f 1 (a) ist f (x) = grad f(x) = 2x. Damit liefert der Satz vom regulären Urbild Korollar 2 das die Sphäre S n tatsächlich eine (n + 1) 1 = n-dimensionale C -Untermannigfaltigkeit des R n+1 ist. Als ein zweites Beispiel geben wir uns einen Parameter a R vor und betrachten die Menge M a := {(x, y) R 2 x 2 y 2 = a}, also M a = f 1 (a) mit f : R 2 R; (x, y) x 2 y 2. Wir wollen wissen für welche Werte von a es sich hierbei um eine Untermannigfaltigkeit handelt. Hierzu benötigen wir das a ein regulärer Wert von f ist. Nun ist f (x, y) = (2x, 2y) für alle x, y R, also ist genau dann f (x, y) = wenn x = y = gilt. Wegen f(, ) = ist damit der einzige nichtreguläre Wert von f, d.h. für a ist M a eine eindimensionale C -Untermannigfaltigkeit des R 2. Geometrisch ist M a dabei einfach eine Hyperbel. Für a = liegt tatsächlich keine Untermannigfaltigkeit vor, es ist M = {(x, y) R 2 x 2 = y 2 } = {(x, y) R 2 y = ±x} die Vereinigung zweier sich schneidender Geraden, und anschaulich ist klar das dies keine Untermannigfaltigkeit ist. Ein exakter formaler Beweis dieser Tatsache wird in Aufgabe (19) behandelt. 49

50 Mathematik für Physiker III, WS 212/213 Dienstag y y x x x a = 1 a = 1 a = Nach dem ersten Beispiel ist insbesondere beispielsweise der Einheitskreis S 1 eine eindimensionale C -Untermannigfaltigkeit des R 2. Am Einheitskreis können wir dann auch sehr schön ein weiteres allgemeines Phänomen sehen, lokal ist dieser überall, nach einer eventuell Umordnung der Koordinaten, der Graph einer unendlich oft differenzierbaren Funktion. Auf der oberen Halbebene U + = R R > ist S 1 U + der Graph von y = 1 x 2, auf der unteren Halbebene U := R R ist S 1 U entsprechend der Graph von y = 1 x 2, auf der rechten Halbebene V + := R > R wird S 1 V + der Graph von x = 1 y 2 und auf der linken Halbebene V := R < R wird S 1 V schließlich der Graph von x = 1 y 2. In diesem Beispiel läßt sich unsere Untermannigfaltigkeit also überall lokal als der Graph einer entsprechend häufig differenzierbaren Funktion darstellen, und wir wollen uns nun überlegen das dies immer der Fall ist. Seien also n, m 1 und M R n sei eine m-dimensionale C q -Untermannigfaltigkeit des R n wobei wieder q N { } mit q 1 ist. Sei x M ein Punkt von M. Nach Definition einer Untermannigfaltigkeit existieren eine offene Menge U R m, ein a U und eine injektive, q-fach stetig differenzierbare Funktion ϕ : U R n mit ϕ(a) = x so, dass die Ableitungen ϕ/ x i (x) für 1 i m für jedes x U linear unabhängig sind und es für jede offene Menge V R m mit V U stets eine offene Menge W R n mit ϕ(v ) = W M gibt. Da insbesondere die Matrix ϕ (a) dann linear unabhängige Spalten hat, hat sie nach I. 12.Satz 3.(c) auch m linear unabhängige Zeilen. Durch eventuelle Umbenennung der Koordinaten des R n können wir dann annehmen das die ersten m Zeilen von ϕ (a) linear unabhängig sind. Betrachten wir also die q-fach stetig differenzierbare Funktion ψ := (ϕ 1,..., ϕ m ), so besteht ψ (a) gerade aus den ersten m Zeilen von ϕ (a), hat also wieder nach I. 12.Satz 3.(c) den Rang m und ist damit invertierbar. Folglich können wir auf ψ die C q -Version des Satzes über Umkehrfunktionen 1.Korollar 6 anwenden und erhalten offene Mengen U, V R m mit a U U so, dass ψ U : U V bijektiv mit der q-fach stetig differenzierbaren Umkehrfunktion (ψ U ) 1 : V U ist. Weiter existiert eine offene Menge U R n mit ϕ(u ) = M U. Insbesondere ist dann x = ϕ(a) ϕ(u ) U. Nun können wir die q-fach stetig differenzierbare Funktion konstruieren, die den in U liegenden Teil von M als ihren Graphen hat. Wir definieren f : V R n m ; x ( ϕ m+1 ( (ψ U ) 1 (x) ),..., ϕ n ( (ψ U ) 1 (x) )), 5

51 Mathematik für Physiker III, WS 212/213 Dienstag und behaupten das M U = {(x, f(x)) x V } gilt. Sei zunächst x V gegeben und setze y := (ψ U ) 1 (x), d.h. es ist y U mit ψ(y) = x. Es folgt (x, f(x)) = (ψ(y), ϕ m+1 (y),..., ϕ n (y)) = ϕ(y) ϕ(u ) = M U, und die Inklusion der rechts stehenden in der links stehenden Menge ist bewiesen. Nun sei umgekehrt ein Punkt p M U = ϕ(u ) gegeben. Dann existiert ein y U mit ϕ(y) = p und wir erhalten den Punkt x := ψ(y) V mit also ist auch f(x) = (ϕ m+1 ((ψ U ) 1 (x)),..., ϕ n ((ψ U ) 1 (x))) = (ϕ m+1 (y),..., ϕ n (y)), p = ϕ(y) = (ψ(y), ϕ m+1 (y),..., ϕ n (y)) = (x, f(x)). Damit ist diese Behauptung bewiesen und da f auch q-fach stetig differenzierbar ist, haben wir damit die Untermannigfaltigkeit M lokal bei x als den Graphen einer q-fach stetig differenzierbaren Funktion geschrieben. Die eben bewiesene Tatsache das Untermannigfaltigkeiten sich lokal immer als Graphen schreiben lassen ist nicht nur von Interesse um die Bedeutung der Graphen zu klären, sie hat auch eine nützliche Anwendung die wir jetzt vorstellen wollen. In der Definition einer Parametrisierung ϕ : U R n einer Untermannigfaltigkeit M R n war eine der drei Forderungen das es für jede offene Menge V R m mit V U stets eine offene Menge W R n mit ϕ(v ) = W M geben soll. Gerade diese Bedingung ist in konkreten Beispielen rechnerisch oft nur schwierig nachzuweisen. Wenn man allerdings schon weiss das M eine Untermannigfaltigkeit ist, so kann man auf sie ersatzlos verzichten, d.h. sie folgt automatisch aus den beiden anderen Forderungen an eine Parametrisierung. Lemma 3.3 (Kennzeichnung von Parametrisierungen) Seien n, m N, q N { } mit n, m, q 1 und sei M R n eine m-dimensionale C q -Untermannigfaltigkeit des R n. Sind dann U R m offen und ϕ : U R n eine injektive, q-fach stetig differenzierbare Funktion mit ϕ(u) M so, dass die Vektoren ϕ ϕ (x),..., (x) x 1 x m für jedes x U linear unabhängig sind, so ist ϕ bereits eine Parametrisierung von M. Beweis: Wir müssen die noch fehlende Offenheitsbedingung nachweisen. Sei also V R m eine offene Menge mit V U. Sei a V. Dann ist ϕ(a) M und da wir M lokal als Graphen schreiben können gibt es nach eventueller Umbezeichnung der Koordinaten des R n eine offene Menge U R n mit ϕ(a) U, eine offene Menge V R m und eine q-fach stetig differenzierbare Funktion f : V R n m mit M U = {(x, f(x)) x V }. 51

52 Mathematik für Physiker III, WS 212/213 Dienstag Da ϕ insbesondere stetig ist, existiert eine offene Menge V R m mit a V V und ϕ(v ) U, also auch ϕ(v ) M U. Ist also pr : R n R m ; x (x 1,..., x m ) die Projektion, so ist ψ := pr (ϕ V ) : V V wieder q-fach stetig differenzierbar und für jedes x V gilt ϕ(x) = (ψ(x), f(ψ(x))). Wir behaupten jetzt das die m m-matrix ψ (a) invertierbar ist. Um dies einzusehen zeigen wir, dass die Spalten dieser Matrix linear unabhängig sind. Seien also λ 1,..., λ n R mit m ψ λ k (a) = x k k=1 gegeben. Für jedes 1 k m gilt nach der Kettenregel II. 8.Satz 17 ( ) ψ ϕ x (a) = k (a) x k f (ψ(a)) ψ, x k (a) und damit ist auch n k=1 ϕ λ k (a) = x k n ψ λ k x k (a) k=1( n f (ψ(a)) ψ λ k x k (a) k=1 ) =. Da die Vektoren ϕ/ x k (a) für 1 k m linear unabhängig sind, folgt damit λ 1 = = λ m =, und wir haben gezeigt das ψ (a) invertierbar ist. Wieder nach dem Satz über Umkehrfunktionen 1.Korollar 6 gibt es offene Mengen V a R m, U R m mit a V a V V und ψ(v a ) = U. Schließlich erhalten wir die offene Menge W a := (U R n m ) U R n und behaupten das ϕ(v a ) = M W a gilt. Zunächst ist nämlich ϕ(v a ) ϕ(v ) M U und andererseits gilt für jedes x V a auch ψ(x) U also ϕ(x) = (ψ(x), f(ψ(x))) U R n m und dies bedeutet ϕ(v a ) U R n m. Insgesamt ist damit ϕ(v a ) M U (U R n m ) = M W a. Nun sei umgekehrt y M W a gegeben. Wegen y M U existiert ein x V mit y = (x, f(x)) und wegen (x, f(x)) = y W a U R n m ist dann auch x U = ψ(v a ), d.h. es existiert ein z V a mit x = ψ(z). Damit ist schließlich y = (x, f(x)) = (ψ(z), f(ψ(z))) = ϕ(z) ϕ(v a ). Damit haben wir M W a ϕ(v a ) eingesehen, und es gilt folglich ϕ(v a ) = M W a. Nach II. 4.Lemma 17.(h) ist auch die Menge W := a V W a R n 52

53 Mathematik für Physiker III, WS 212/213 Dienstag im R n offen und wegen V = a V V a haben wir ϕ(v ) = ϕ(v a ) = (M W a ) = M W a = M W. a V a V a V Damit ist ϕ tatsächlich eine Parametrisierung von M. Unser Interesse am Begriff der Untermannigfaltigkeit stammte aus dem Versuch die Methoden zur Berechnung von Extrema unter Nebenbedingungen aus 2 begrifflich weiter einzuordnen. Dies haben wir jetzt weitgehend erreicht, zumindest lokal ist die Beschreibbarkeit durch Nebenbedingungen weitgehend dasselbe wie die Beschreibbarkeit durch eine Parametrisierung, dies war Satz 1. Zum Abschluß wollen wir noch eine weitere, diesmal geometrische, Interpretation der Lagrange-Multiplikatoren besprechen. Hierzu benötigen wir den Begriff des Tangentialraums an eine Untermannigfaltigkeit. Geometrisch ist dieser genau das was man sich unter diesem Wort vorstellt, der Tangentialraum in einem Punkt x an eine Kurve in der Ebene ist die gewöhnliche Tangente an die Kurve durch den Punkt x, der Tangentialraum an einem Punkt x an eine Fläche im Raum ist die gewöhnliche Tangentialebene an die Fläche durch diesen Punkt, und so weiter. In der allgemeinen Situation kann man den Begriff des Tangentialraums wie folgt einführen. Definition 3.2: Seien n, m N und q N { } mit n, m, q 1. Weiter seien M R n eine m-dimensionale C q -Untermannigfaltigkeit des R n und x M. Eine Vektor v R n heißt dann ein Tangentialvektor von M im Punkt x wenn es ein offenes Intervall I R mit I und eine stetig differenzierbare Kurve γ : I R n mit γ() = x, γ(i) M und γ () = v gibt. Weiter bezeichne T x M die Menge aller Tangentialvektoren von M in Punkt x, genannt der Tangentialraum von M in x. Beachte das der Tangentialraum T x M nur von der Menge M und dem Punkt x abhängt, nicht aber von m oder q. Wir werden jetzt zeigen das die Tangentialräume an eine m-dimensionale Untermannigfaltigkeit M immer m-dimensionale Untervektorräume des R n sind. Bei dieser Gelegenheit werden wir auch gleich beschreiben wie man den Tangentialraum in Termen einer Parametrisierung von M beziehungsweise in Termen einer Darstellung von M durch Nebenbedingungen berechnen kann. Bevor wir diesen Satz beweisen können, ist es nützlich sich ein wenig an einige Tatsachen aus der linearen Algebra zu erinnern. Sei U R n eine offene Menge. Ist dann f : U R eine in einem Punkt x U differenzierbare Funktion, so gilt für jeden Vektor u R n stets f (x)u = (grad f(x)) t u = grad f(x) u, und insbesondere ist genau dann u Kern f (x) wenn u senkrecht auf dem Gradienten grad f(x) steht. Haben wir gleich mehrere Funktionen f 1,..., f r : U R die alle in x differenzierbar sind, so liegt ein Vektor u R n genau dann im Kern aller f k (x) für alle 1 k r wenn er auf all diesen Gradienten senkrecht steht und dann steht u auch 53

54 Mathematik für Physiker III, WS 212/213 Dienstag auf allen Linearkombinationen dieser Gradienten senkrecht, also u r Kern f k(x) (1 k r) : u grad f k (x) k=1 u grad f 1 (x),..., grad f r (x). Nehme jetzt weiter an, dass die Gradienten grad f 1 (x),..., grad f r (x) linear unabhängig sind. Bilden wir dann die in x differenzierbare Funktion f := (f 1,..., f r ) : U R r, so sind die Gradienten grad f k (x) für 1 k r gerade die Zeilen der Jacobi-Matrix f (x), diese hat also linear unabhängige Zeilen und nach I. 12.Satz 3.(c) ist ihr Rang damit gleich r, also rang f (x) = r. Andererseits gilt für einen Vektor u R n stets also ist f (x)u = f 1(x)u. f r(x)u, r Kern f k(x) = Kern f (x). k=1 Anders gesagt ist dieser Durchschnitt genau der Lösungsraum des homogenen linearen Gleichungssystems f (x)u =, und dieser hat nach dem Hauptsatz über lineare Gleichungssysteme I. 12.Satz 4 die Dimension ( r ) dim Kern f k(x) = dim Kern f (x) = n rang f (x) = n r. k=1 Damit haben wir alle nötigen Hilfsmittel beisammen um den Satz über den Tangentialraum zu beweisen. Wir formulieren den Satz für C 1 -Untermannigfaltigkeiten, da jede C q -Untermannigfaltigkeit mit q 1 insbesondere eine C 1 -Untermannigfaltigkeit ist, ist dies bereits der allgemeine Fall. Satz 3.4 (Hauptsatz über den Tangentialraum) Seien n, m N mit n, m 1, M R n eine m-dimensionale C 1 -Untermannigfaltigkeit des R n und x M. (a) Die Menge T x M ist ein m-dimensionaler Untervektorraum des R n. (b) Sind ϕ : U M eine Parametrisierung von M definiert auf einer offenen Menge U R m und a U mit x = ϕ(a), so ist eine Basis von T x M. ϕ ϕ (a),..., (a) x 1 x m 54

55 Mathematik für Physiker III, WS 212/213 Dienstag (c) Sind U R n eine offene Menge mit x U und g 1,..., g n m : U R stetig differenzierbare Funktionen mit M U = {x U g 1 (x) = = g n m (x) = } für die die Vektoren grad g 1 (x),..., grad g n m (x) für jedes x M U linear unabhängig sind, so ist T x M = n m k=1 Kern g k(x ). Beweis: Seien U R m offen, ϕ : U M eine Parametrisierung von M und a U mit ϕ(a) = x sowie U R n offen mit x U und g 1,..., g n m : U R stetig differenzierbare Funktionen mit M U = {x U g 1 (x) = = g n m (x)} so, dass grad g 1 (x),..., grad g n m (x) für alle x M U linear unabhängig sind. Nach Satz 1 ist eine solche Wahl immer möglich. Wir betrachten die beiden Untervektorräume ϕ ϕ V 1 := (a),..., (a), x 1 x m V 2 := n m k=1 Kern g k(x ) des R n. Da die Vektoren ϕ/ x i (a) für 1 i m nach Definition einer Parametrisierung linear unabhängig sind, bilden diese eine Basis von V 1 und damit ist insbesondere dim V 1 = m. Nach unserer obigen Bemerkung ist weiter auch dim V 2 = n (n m) = m. Wir zeigen jetzt, dass die Inklusionen V 1 T x M V 2 bestehen. Sei also v V 1, d.h. es existieren λ 1,..., λ m R mit v = m k=1 λ k ϕ x k (a). Wir setzen λ := (λ 1,..., λ m ) R m. Da die Menge U offen ist, existiert ein r > mit B r (a) U und wir wählen weiter ein ɛ > mit λ 2 ɛ < r. Für jedes t R mit t < ɛ gilt dann (a 1 + λ 1 t,..., a m + λ m t) a 2 = tλ 2 = λ 2 t < λ 2 ɛ < r, also ist (a 1 + λ 1 t,..., a m + λ m t) B r (a) U. Wir erhalten die stetig differenzierbare Kurve γ : ( ɛ, ɛ) M; t ϕ(a 1 + λ 1 t,..., a m + λ m t) 55

56 Mathematik für Physiker III, WS 212/213 Dienstag mit γ() = ϕ(a) = x und γ(t) ϕ(u) M für alle t ( ɛ, ɛ). Als Ableitung in t = ergibt sich nach der Kettenregel II. 8.Satz 17 der Vektor λ 1 γ () = ϕ m ϕ (a). = λ k (a) = v. x k λ m Dies zeigt v T x M, und wir haben V 1 T x M eingesehen. Nun sei v T x M gegeben, d.h. es gibt ein offenes Intervall I R mit I und eine stetig differenzierbare Kurve γ : I M mit γ() = x und v = γ (). Weiter existiert ein offenes Intervall J R mit J I und γ(j) U. Sei 1 k n m. Dann ist für jedes t J stets γ(t) M U also g k (γ(t)) =. Es folgt wieder nach der Kettenregel k=1 g k(x )v = g k(γ())γ () = (g k γ) () =, also v Kern g k (x ). Dies zeigt v V 2 und wir haben T x M V 2 eingesehen. Insbesondere ist V 1 V 2 mit dim V 1 = dim V 2, also gilt nach I. 11.Lemma 11 sogar V 1 = V 2. Wegen V 1 T x M V 2 = V 1 ist damit auch T x M = V 1 = V 2 und alles ist bewiesen. Als ein Beispiel zu diesem Satz schauen wir uns einmal die Sphäre S n im R n+1 an. Mit der Funktion g : R n+1 R; x x ist dann S n = {x R n+1 g(x) = }, und für jedes x S n gilt grad g(x) = 2x also ist Teil (c) des Hauptsatzes anwendbar, und liefert für jedes x S n die Gleichung T x S n = Kern g (x) = {u R n+1 x u}, der Tangentialraum besteht hier also aus allen auf x senkrecht stehenden Vektoren und dies ist auch das anschaulich erwartete Ergebnis. Wie schon angekündigt wollen wir den Tangentialraum verwenden um eine weitere Interpretation der Lagrange-Multiplikatoren zu erhalten. In Teil (b) des Hauptsatzes über die Lagrange-Multiplikatoren 2.Satz 2 hatten wir eine offene Menge U R n und r stetig differenzierbare Funktionen g 1,..., g r : U R mit denen wir die Restriktionsmenge S := {x U g 1 (x) = = g r (x) = } definiert hatten. Weiter haben wir eine stetig differenzierbare Funktion f : U R die in einem Punkt x S ein lokales Extremum auf S hat und wir mussten voraussetzen das die Gradienten grad g 1 (x ),..., grad g r (x ) linear unabhängig sind. Wir behaupten das es dann eine offene Menge V R n mit x V U gibt so, dass grad g 1 (x),..., grad g r (x) sogar für alle x V linear unabhängig sind. Um dies einzusehen verwenden wir erneut die schon mehrfach benutzte Tatsache das die Gradienten grad g 1 (x ),..., grad g r (x ) die Zeilen der Jacobi-Matrix g (x ) für g := (g 1,..., g r ) 56

57 Mathematik für Physiker III, WS 212/213 Dienstag sind, und dass diese Matrix damit nach I. 12.Satz 3.(c) den Rang r und somit auch r linear unabhängige Spalten hat. Nach eventueller Umbenennung der Koordinaten des R n können wir annehmen das die ersten r Spalten von g (x ) linear unabhängig sind. Die stetige Abbildung h : U R r r ; x g 1 x 1 (x).... g r x 1 (x) g 1 x r (x). g r x r (x) erfüllt also nach I. 12.Satz 3.(c) die Bedingung h(x ) GL r R da die Spalten dieser Matrix linear unabhängig sind. Nach 1.Lemma 4.(a) ist die Menge GL r R R r r offen in R r r, d.h. V := h 1 (GL r R) R n ist eine offene Menge mit x V U. Für jedes x V sind dann die ersten r Spalten von g (x) linear unabhängig, und damit folgt wieder das die Zeilen von g (x), also die Gradienten grad g 1 (x),..., grad g r (x), linear unabhängig sind. Damit ist diese Zwischenbehauptung bewiesen und wir können jetzt Satz 1 anwenden und erhalten das S V eine C 1 -Untermannigfaltigkeit des R n ist. In der Situation des Hauptsatzes über die Lagrange-Multiplikatoren betrachten wir also ein Optimierungsproblem restringiert auf eine Untermannigfaltigkeit. Wir können den Hauptsatz über Lagrange-Multiplikatoren also auch als einen Satz über lokale Extrema auf einer Untermannigfaltigkeit interpretieren, und in dieser Deutung nimmt er die folgende Form an. Satz 3.5 (Geometrische Interpretation der Lagrange-Multiplikatoren) Seien n, m N mit n, m 1 und sei M R n eine m-dimensionale C 1 -Untermannigfaltigkeit des R n. Weiter seien U R n offen und f : U R eine stetig differenzierbare Funktion. Die Funktion f U M habe in x U M ein lokales Extremum auf M. Dann ist grad f(x ) T x M. Beweis: Sei v T x M, d.h. es existieren ein offenes Intervall I R mit I und eine stetig differenzierbare Kurve γ : I R n mit γ() = x, γ(i) M und γ () = v. Da f in x ein lokales Extremum auf M U hat, gibt es ein ɛ > mit f(x ) f(x) für alle x M U mit x x < ɛ oder f(x ) f(x) für alle x M U mit x x < ɛ. Da die Kurve γ insbesondere stetig ist, gibt es ein offenes Intervall J R mit J I, γ(j) U und γ(t) x < ɛ für alle t J. Damit ist aber h := f γ : J R eine stetig differenzierbare Funktion und es gilt h() = f(x ) f(γ(t)) = h(t) für alle t J oder h() = f(x ) f(γ(t)) = h(t) für alle t J, d.h. h hat in t = ein lokales Extremum. Mit I. 14.Lemma 8 folgt h () = also ist nach der Kettenregel II. 8.Satz 17 = h () = f (x )γ () = f (x )v, und wie oben festgehalten besagt dies grad f(x ) v. Damit steht grad f(x ) auf jedem Tangentialvektor von M in x senkrecht, und dies bedeutet grad f(x ) T x M. 57

58 Mathematik für Physiker III, WS 212/213 Dienstag Dieser Satz sieht zunächst völlig anders aus als unser 2.Satz 2, er besagt aber genau dasselbe. Um dies einzusehen, setzen wir unsere obige Diskussion fort. Wenden wir dann Satz 4.(c) auf die Untermannigfaltigkeit S V an und setzen E := grad g 1 (x ),..., grad g r (x ), so ergibt sich T x (S V ) = r Kern g k(x ) = {u R n u E}. k=1 Wir behaupten das hieraus grad f(x ) E folgt. Hierzu beachte das wir den Gradienten grad f(x ) R n nach II. 6.Satz 6 in einen Vektor aus E und einen auf E senkrechten Vektor zerlegen können, d.h. es existieren u E und v R n mit grad f(x ) = u + v und v E. Damit ist v T x (S V ) und nach Satz 5 ist grad f(x ) v, also grad f(x ) v =. Wegen u E ist auch u v =, d.h. wir haben = grad f(x ) v = u + v v = u v + v v = v 2 2, und es folgen v = und grad f(x ) = u E. Damit ist diese Behauptung bewiesen und somit gibt es λ 1,..., λ r R so, dass grad f(x ) eine Linearkombination grad f(x ) = r λ k grad g k (x ) k=1 ist. Schreiben wir dies in Komponenten aus, so ergibt sich die vertraute Gleichung f x i (x ) = r k=1 λ k g k x i (x ) für alle 1 i n. Wir schließen dieses Kapitel jetzt mit einem letzten Beispiel ab. In unserer Definition einer Parametrisierung ϕ einer Untermannigfaltigkeit M R n hatten wir drei Forderungen an ϕ gestellt. Zwei davon ließen sich rechnerisch gut behandeln, aber die Bedingung (b), dass es also für jede offene Menge V im Definitionsbereich von ϕ stets eine offene Menge W R n mit ϕ(v ) = M W gibt, kann in konkreten Beispielen schnell unhandlich werden. In Lemma 3 hatten wir uns dann überlegt das man Bedingung (b) gar nicht überprüfen muss solange bereits bekannt ist, dass es sich bei M um eine Untermannigfaltigkeit handelt. Damit wird es dann 2 2 naheliegend zu fragen, ob man die Offenheitsbedingung einer Parametrisierung nicht schon in der Definition von Untermannigfaltigkeiten weglassen 4 4 kann? Leider ist das im Allgemeinen nicht möglich, und wir wollen hier ein Beispiel konstruieren das fast eine Untermannigfaltigkeit ist und nur Forderung (b) verletzt. Wir geben uns zwei 58

59 Mathematik für Physiker III, WS 212/213 Dienstag reelle Zahlen R, r mit R > r > vor. In der xz-ebene bilden wir dann den Kreis C mit Radius r und Mittelpunkt in (R,, ), wegen R > r liegt dieser vollständig rechts von der z-achse. Dann lassen wir diesen Kreis um die z-achse rotieren und bilden die Vereinigung aller dabei entstehenden Kreise. Diese Vereinigung T ist dann ein sogenannter Torus und in Aufgabe (2) wird gezeigt das es sich hierbei um eine zweidimensionale C -Untermannigfaltigkeit des R 3 handelt. Es ist auch leicht Parametrisierungen des Torus zu finden. Die Punkte auf dem Kreis C können wir als x = R + r cos ψ, y =, z = r sin ψ mit ψ R parametrisieren. Aus II. 7.2 wissen wir das die Drehung um die z-achse mit dem Winkel φ R durch die Matrix D(φ) = cos φ sin φ sin φ cos φ 1 gegeben ist, die Punkte auf T haben also die Form R + r cos ψ ϕ(φ, ψ) := D(φ) r sin ψ = cos φ (R + r cos ψ) sin φ (R + r cos ψ) r sin ψ für ϕ, ψ R. Wir wählen jetzt weiter eine irrationale Zahl α R\Q und bilden die Kurve f : R T ; φ ϕ(φ, α φ). Da α irrational ist schließt sich diese Kurve nicht, und man kann sich überlegen das ihr Bild M := f(r) T dicht in T liegt, dass also T = M ist. Die Menge M ist jetzt beinahe eine eindimensionale C -Untermannigfaltigkeit des R 3, denn f : R C ist bijektiv und es läßt sich auch nachrechnen das f (φ) für jedes φ R gilt. Nur die Offenheitsbedingung ist verletzt. Da die Kurve C sich dicht um den Torus wickelt, schneidet C jede kleine offene Menge die T schneidet in unendlich vielen Intervallen. Dies wollen wir hier aber nicht mehr im Detail vorführen. $Id: nintegral.tex,v /4/6 16:1:6 hk Exp $ 4 Das Riemann-Integral im R n Der Integralbegriff für Funktionen in mehreren Variablen bedarf keiner großen Motivation, er ist zeitgleich mit der Differentialrechnung geboren worden und wurde schon von Newton verwendet. Wir wollen hier einmal die heuristische Standardherleitung vorführen mit der mehrdimensionale Integrale ganz natürlich auftauchen. Konkret wollen wir die kontinuierliche Form des Gravitationsgesetzes herleiten. Wir beginnen mit 59

60 Mathematik für Physiker III, WS 212/213 Dienstag zwei gegebenen Punktmassen, die eine im Punkt p R 3 der Masse M und die andere im Punkt q R 3 mit Masse m. Wir machen hier keine Physik, Punkte im Raum sind für uns der R 3, es werden keine Unterschiede zwischen Orts- und Richtungsvektoren gemacht, Einheiten werden ignoriert und so weiter. Das Gravitationsgesetz besagt das die Masse in p auf die Masse in q eine Kraft F in Richtung p q bewirkt, die proportional zum Produkt der beiden Massen ist und invers proportional zum Quadrat des Abstandes der beiden Punkte ist, d.h. mm F = γ p q p q 2 p q = γ mm (p q), p q 3 wobei wir x für die euklidische Norm eines Vektors x R 3 schreiben, und γ eine Konstante ist, die sogenannte Gravitationskonstante. Solange die räumliche Struktur der wirklich betrachteten physikalischen Körper keine Rolle spielt, ist diese diskrete Form des Gravitationsgesetzes völlig ausreichend, man kann mit ihr zum Beispiel die Keplerschen Gesetze herleiten. Durch diese werden die Bahnen der meisten Planeten in einer ersten Näherung vorhergesagt, hier nimmt man als den einen Massepunkt in p die Sonne und für den anderen in q den betrachteten Planeten. Man kann die Näherung dann verbessern indem auch noch die Anziehung der Planeten untereinander berücksichtigt wird. Dies wird dann schon etwas komplizierter, beispielsweise ist Laplace durch die Untersuchung der Bahnen des Systems aus Sonne, Jupiter und Saturn berühmt geworden. Aber selbst wenn man die Anziehung der Planeten untereinander einbezieht, reicht die obige Form des Gravitationsgesetzes nicht aus das Verhalten des Merkur vollständig zu erklären. Das liegt zum einen daran das hier bereits relativistische Effekte eine Rolle spielen, aber selbst wenn wir diese ignorieren könnten reicht das diskrete Gravitationsgesetz nicht mehr aus. Die Sonne ist keine perfekte Kugel, sondern an den Polen etwas eingedrückt, und dies führt dazu das es nicht mehr angemessen ist die Sonne als eine punktförmige Masse zu modellieren. Die auf den Merkur wirkende Anziehung hängt nicht nur vom Abstand der Schwerpunkte zueinander ab, da je nach Position des Merkurs unterschiedlich grosse Teile der Sonne unterschiedlich nahe zu ihm sind. Noch schlimmer wird die Lage wenn etwa die Bahnen von Satelliten um die Erde beschrieben werden sollen, hier macht sich die inhomogene Masseverteilung der Erde störend bemerkbar. Wir brauchen eine kontinuierliche Form des Gravitationsgesetzes, bei dem die Masse M nicht mehr als Punkt interpretiert wird sondern als eine Teilmenge P R 3. Die andere Masse m wollen wir uns dagegen weiter als Punktmasse denken, für das Merkur oder Satelliten Beispiel ist das auch angemessen. Zur Bestimmung der Gravitation in diesem Fall denken wir uns den Körper P in kleinere Teilkörper P 1,..., P n zerlegt, und für 1 i n bezeichne p i den Schwerpunkt von P i, M i die Masse von P i und V i das Volumen von P i, und weiter sei ϱ i := M i /V i die mittlere Dichte von P i. Ist P i ausreichend klein, so können wir uns dieses Stückchen als Punktmasse M i im Punkt p i denken, und die von diesem Teilstück auf m wirkende Kraft ist dann F i = γmm i / p i q 3 (p i q), also wird die gesamte Kraft F näherungsweise 6

61 Mathematik für Physiker III, WS 212/213 Freitag gleich F n mm i γ p i q (p 3 i q) = γm i=1 n i=1 ϱ i p i q 3 (p i q)v i. Führen wir dann einen Grenzübergang n mit dabei immer kleiner werdenden Teilstücken P i durch, so sollte aus F ein Integral über P werden. Wir können auch sagen was der Integrand sein sollte. Betrachte einen Punkt x P und jeweils das Teilstück P i = P i,n mit x P i. Die Schwerpunkte p i sollten dann gegen x konvergieren, und die mittleren Dichten ϱ i gegen die Dichte ϱ(x) von P im Punkt x, als kontinuierliche Form des Gravitationsgesetzes ergibt sich also F = γm P ϱ(x) (x q) dx. x q 3 Genau dieses Integral ist tatsächlich das Urbeispiel eines mehrdimensionalen Integrals. Die von uns zu entwickelnde Integrationstheorie sollte eine exakte Definition dieses Integrals erlauben und, unter geeigneten Regularitätsannahmen, wirklich beweisen können das die obigen Näherungen gegen das Integral konvergieren. Als Zugang zum Integralbegriff verwenden wir das sogenannte Riemann-Integral da dieses die obige Überlegung sehr direkt abbildet. 4.1 Das n-dimensionale Riemann-Integral Vorlesung 8, Freitag Die Konstruktion des Riemann-Integrals folgt der in der letzten Sitzung besprochenen Standardheuristik, der Definitionsbereich des Integranden wird zerteilt, das Integral wird approximiert indem die Funktion auf jedem dieser Stücke durch einen ihrer Werte ersetzt wird und dann wird der Grenzübergang für immer feinere Zerteilungen gebildet. Dies wirklich durchzuführen erfordert allerdings einen gewissen technischen Aufwand. Um das ganze überhaupt durchführbar zu machen, werden zunächst einige Normierungen vorgenommen. Wir betrachten als Integrationbereiche zunächst einmal nur achsenparallele Quader, erst in einem zweiten Schritt werden wir dann auch allgemeinere Körper zulassen. Auch unsere immer feiner werdenden Zerlegungen sollen dabei ganz aus achsenparallelen Quadern bestehen. Bevor wir irgendetwas sinnvolles tun können, brauchen wir erst einmal eine ganze Reihe technischer Definitionen, in denen Quader, die erlaubten Zerlegungen, die approximierten Integrale und so weiter definiert werden. Das macht den Start dieses Abschnitts leider recht definitionslastig, das läßt sich aber nicht vermeiden. Wir beginnen mit der Definition achsenparalleler Quader. Da wir keine anderen Quader 61

62 Mathematik für Physiker III, WS 212/213 Freitag betrachten werden, nennen wir diese verkürzend einfach Quader und lassen den Zusatz achsenparallel weg. Definition 4.1: Sei n N mit n 1. Eine Teilmenge Q R n heißt dann ein Quader wenn es Punkte a, b R n mit gibt. Ist dabei Q, so gilt Q = [a, b] := {x R n (1 i n) : a i x i b i } R n a i = min{x i x Q} und b i = max{x i x Q} für jedes 1 i n, die Punkte a, b sind dann also eindeutig durch die Menge Q festgelegt. Der Quader heißt nicht ausgeartet wenn Q und a i < b i für alle 1 i n gilt, andernfalls nennen wir den Quader ausgeartet. Schließlich heißt die Zahl vol(q) := n (b i a i ) i=1 im Fall Q das Volumen von Q. Das Volumen des leeren Quaders definieren wir als vol( ) :=. z (1,3,3) (1,2,3) (3,2,3) (3,3,3) y (2,5) (8,5) [(1,2,),(3,3,3)] [(2,1),(8,5)] y (1,3,) (3,3,) (2,1) (8,1) x (1,2,) (3,2,) Quader im R 2 Quader im R 3 Eigentlich verwenden wir das Symbol [, ] schon für die Verbindungsstrecke zweier Punkte im R n, da aber immer aus dem Kontext klar sein wird welche Bedeutung gerade gemeint ist, ist diese Doppelbelegung unproblematisch. Beachte das wir auch Dinge wie die leere Menge oder ein in einer waagerechten Ebene liegendes, achsenparalleles Rechteck im R 3 als Quader bezeichnen. Dies ist zwar ein gewisser Bezeichnungsmissbrauch, hat aber den Vorteil das der Durchschnitt je zweier Quader ohne Ausnahmefälle wieder ein Quader ist. In der Tat, sind Q, Q R n Quader, so ist Q Q im Fall Q Q = sofort ein Quader. Ist dagegen Q Q, so sind auch Q, Q und wir 62 x

63 Mathematik für Physiker III, WS 212/213 Freitag erhalten eindeutige a, a, b, b R n mit Q = [a, b] und Q = [a, b ], also insbesondere a i b i und a i b i für alle 1 i n. Setzen wir dann für jedes 1 i n c i := max{a i, a i} und d i := min{b i, b i}, so ist wegen Q Q wieder c i d i und es gilt Q Q = [c, d], d.h. Q Q ist auch in diesem Fall ein Quader. Weiter behaupten wir das ein Quader Q R n genau dann ausgeartet ist wenn vol(q) = gilt. Im Fall Q = ist dies klar, wir können also Q annehmen. Dann gibt es a, b R n mit Q = [a, b] und es gilt a i b i für alle 1 i n. Definitionsgemäß ist der Quader Q genau dann ausgeartet wenn es ein 1 i n mit a i = b i, also b i a i =, gibt und dies ist schließlich äquivalent zu vol(q) = n i=1 (b i a i ) =. Nachdem wir damit die Quader behandelt haben, kommen wir jetzt zu den Zerlegungen eines Quaders. Wir erinnern uns zunächst an den in II. 2 besprochenen eindimensionalen Fall, sind a, b R mit a < b, so hatten wir eine Zerlegung α des Intervalls [a, b] als ein Tupel α = (t,..., t r ) reeller Zahlen mit a = t < t 1 < < t r 1 < t r = b definiert. Die größte dabei auftretende Schrittweite δ(α) := max 1 i r (t i t i 1 ) hieß dann die Feinheit der Zerlegung α. Haben wir jetzt einen n-dimensionalen Quader, so definieren wir Zerlegungen dieses Quaders indem jede seiner Dimensionen einzeln zerlegt wird, wir haben also ein ganzes n-tupel eindimensionaler Zerlegungen. Dies führt uns auf die folgende technische Definition. Definition 4.2: Seien n N mit n 1 und Q R n ein nicht ausgearteter Quader, d.h. es gibt eindeutige a, b R n mit a i < b i für alle 1 i n und Q = [a, b]. Eine Zerlegung α des Quaders Q ist ein Tupel α = (α i ) 1 i n wobei α i für jedes 1 i n eine Zerlegung des Intervalls [a i, b i ] ist. Wir nennen die Zahl δ(α) := max 1 i n δ(α i) die Feinheit der Zerlegung α. Schreiben wir für jedes 1 i n die Zerlegung α i von [a i, b i ] als α i = (t i,,..., t i,ri ), so nennen wir die Menge I α := n {1,..., r i } die Indexmenge von α und für jedes j I α heißt der nicht ausgeartete Quader der j-te Teilquader der Zerlegung α. i=1 Q α,j = Q j := [(t i,ji 1) 1 i n, (t i,ji ) 1 i n ] Q 63

64 Mathematik für Physiker III, WS 212/213 Freitag t 23 Q 13 Q 23 Q 33 Q 43 t t Q Q Q Q Q Q Q Q t 2 t t t t t Zerlegung Keine Zerlegung Haben wir eine solche Zerlegung α eines nicht ausgearteten Quaders Q = [a, b] R n, so gelten einige einfache Grundeigenschaften: 1. Es ist Q = j I α Q α,j. Zunächst ist dabei wegen Q α,j Q für jedes j I α die rechts stehende Menge eine Teilmenge von Q. Ist umgekehrt x Q, so gilt für jedes 1 i n stets a i x i b i, also x i [a i, b i ] und somit existiert ein 1 j i r i mit t i,ji 1 x i t i,ji. Setzen wir also j := (j i ) 1 i n I α, so ist x Q α,j. Damit ist die Gleichheit dieser beiden Mengen bewiesen. 2. Sind j, k I α mit j k, so ist Q α,j Q α,k ein ausgearteter Quader. Wegen j k gibt es nämlich ein 1 i n mit j i k i, nach eventuellen Vertauschen von j und k, können wir etwa j i < k i annehmen. Dann ist [t i,ji 1, t i,ji ] [t i,ki 1, t i,ki ] = { {t i,ji }, k i = j i + 1,, j i + 1 < k i, also haben wir Q α,j Q α,k {x R n x i = t i,ji }, und damit ist dieser Durchschnitt ausgeartet. 3. Es gilt vol(q) = j I α vol(q α,j ). Dies laßt sich durch einfaches Ausmultiplizieren begründen, für jedes 1 i n gilt r i b i a i = (t ji t ji 1), j i =1 64

65 Mathematik für Physiker III, WS 212/213 Freitag also erhalten wir n vol(q) = (b i a i ) = i=1 n ( ri i=1 j i =1 ) (t i,ji t i,ji 1) = n (t i,ji t i,ji 1) = vol(q α,j ). j I α j I α i=1 Wie schon angekündigt wird das Riemann-Integral als ein Grenzwert über immer feiner werdende Zerlegungen definiert werden. Die dabei verwendeten Zerlegungen α haben wir jetzt definiert und wir haben ihnen auch eine Zahl δ(α) zugeordnet die die Feinheit der Zerlegung α mißt. Bei einem Grenzübergang nach feiner werdenden Zerlegungen treten dann gleich mehrere Zerlegungen auf, und um solche miteinander zu vergleichen wollen wir definieren was es bedeutet das eine Zerlegung eine Verfeinerung einer anderen Zerlegung ist. Im eindimensionalen Fall haben wir dies bereits getan, hatten wir zwei reelle Zahlen a, b R mit a < b und zwei Zerlegungen α = (t,..., t n ), β = (s,..., s m ) des Intervalls [a, b], so wurde β eine Verfeinerung von α genannt wenn {t,..., t n } {s,..., s m } gilt, wenn also einfach bei β nur mehr Zerteilungspunkte hinzukommen. Ist β eine Verfeinerung von α, so hatten wir dies symbolisch als α β notiert und jedes der Teilintervalle [t i 1, t i ] für 1 i n war eine Vereinigung von Teilintervallen der Zerlegung β. Außerdem war offenbar δ(β) δ(α). Hatten wir weiter zwei beliebige Zerlegungen α = (t,..., t n ), β = (s,..., s m ) unseres Intervalls [a, b], so gab es immer eine weitere Zerlegung γ von [a, b] mit γ α und γ β, d.h. eine gemeinsame Verfeinerung von α und β. Konkret konnten wir zum Beispiel die kleinste gemeinsame Verfeinerung α β := (r,..., r s ) definiert durch {r,..., r s } = {t,..., t n } {s,..., s m } verwenden. Diesen Verfeinerungsbegriff wollen wir jetzt auf den n-dimensionalen Fall übertragen. Definition 4.3: Seien n N mit n 1 und Q R n ein nicht ausgearteter Quader im R n. Weiter seien α = (α i ) 1 i n und β = (β i ) 1 i n zwei Zerlegungen von Q. Dann heißt β eine Verfeinerung von α, geschrieben als α β, wenn β i für jedes 1 i n eine Verfeinerung von α i ist. Durch die komponentenweise Definition übertragen sich die Grundeigenschaften eindimensionaler Verfeinerungen sofort auf den n-dimensionalen Fall. Sind α, β wie in der Definition mit α β, so ist für jedes 1 i n wegen α i β i auch δ(β i ) δ(α i ) und damit ist δ(β) = max δ(β i) max δ(α i) = δ(α). 1 i n 1 i n Weiter ist jeder Teilquader der Zerlegung α eine Vereinigung von Teilquadern der Zerlegung β. Sei nämlich ein j I α gegeben. Für jedes 1 i n ist β i dann eine Verfeinerung von α i, also können wir das j i -te Teilintervall der Zerlegung α i als eine 65

66 Mathematik für Physiker III, WS 212/213 Freitag Vereinigung von Teilintervallen der Zerlegung β i schreiben, und es bezeichne J i die Menge der Indizes dieser Teilintervalle von β i. Ist dann J := n i=1 J i I β, so ist Q α,j = k J Q β,k, und wir haben auch diese Behauptung eingesehen. Zu je zwei beliebigen Zerlegungen α, β von Q gibt es auch immer eine gemeinsame Verfeinerung, wir können zum Beispiel die Zerlegung α β := (α i β i ) 1 i n hierfür verwenden. Wir brauchen auch noch eine kleine Variante des Zerlegungsbegriffs. Wie schon erwähnt wollen wir das Integral einer Funktion f : Q R über einen Quader Q definieren, und hierzu wird der Quader Q zerlegt, die Funktion f auf jedem der entstehenden Teilquader durch einen ihrer Werte auf diesem Quader approximiert und anschließend der Grenzübergang nach immer feiner werdenden Zerlegungen durchgeführt. Wir müssen noch entscheiden welchen der Werte von f wir auf jeden der Teilquader verwenden wollen. Hierzu geben wir uns für jeden Teilquader Q j einen Punkt s j Q j vor, und werten die Funktion f in s j aus, d.h. f soll auf Q j durch f(s j ) approximiert werden. Eine Zerteilung ist jetzt eine Zerlegung zusammen mit einer Auswahl dieser Auswertungspunkte. Definition 4.4: Seien n N mit n 1 und Q R n ein nicht ausgearteter Quader. Eine Zerteilung ζ von Q ist ein Paar ζ = (α, s) bestehend aus einer Zerlegung α von Q und einem Tupel s = (s j ) j Iα mit s j Q α,j für jedes j I α. Die Feinheit der Zerteilung ζ wird als δ(ζ) := δ(α) definiert. Ist weiter f : Q R eine auf Q definierte Funktion, so heißt die Zahl R(f; ζ) := j I α f(s j ) vol(q α,j ) die zur Zerteilung ζ von Q gehörende Riemannsumme von f. Die Riemannsumme R(f; ζ) ist die angekündigte Approximation des Integrals von f über Q, welches wir als Grenzwert dieser Riemannsummen definieren wollen. Wie im in II. 2.1 vorgeführten eindimensionalen Fall stellt sich eine kleine Verfeinerung dieser Grundidee als technisch etwas geschickter heraus, wir benutzen nicht direkt die Riemannsummen zur Definition des Riemannintegrals, sondern die sogenannten Oberund Untersummen. Definition 4.5: Seien n N mit n 1, Q R n ein nicht ausgearteter Quader im R n und f : Q R eine beschränkte Funktion. Weiter sei α eine Zerlegung von Q. Für jedes j I α setzen wir dann m j := m α,j (f) := inf f(x) und M j := M α,j (f) := sup f(x) x Q α,j x Q α,j 66

67 Mathematik für Physiker III, WS 212/213 Freitag und definieren die Unter- beziehungsweise Obersumme von f zur Zerlegung α als S(f; α) := j I α m j vol(q α,j ) (Untersumme) S(f; α) := j I α M j vol(q α,j ) (Obersumme). Untersumme Obersumme Wir wollen uns ein einfaches explizites Beispiel zur Unter- und Obersumme anschauen. Sei also Q = [a, b] R n ein nicht ausgearteter Quader im R n. Weiter sei A Q eine Teilmenge. Als die charakteristische Funktion der Menge A bezeichnet man die Funktion { χ A : R n 1, x A, R; x, x / A. Sei weiter α eine Zerlegung von Q. Ist j I α, so können drei verschiedene Möglichkeiten vorliegen. Die erste Möglichkeit ist das Q j A gilt und dann ist χ A (x) = 1 für alle x Q j, also haben wir m j = M j = 1. Die zweite Möglichkeit ist A Q j =, also χ A (x) = für alle x Q j und wir haben m j = M j =. Es verbleibt dann nur noch die dritte Möglichkeit A Q j und Q j A, d.h. es gibt sowohl ein x Q j mit x A und somit χ A (x) = 1, als auch ein x Q j mit x / A, also χ A (x) =. Dann ist also m j = und M j = 1. Unter- und Obersummen ergeben sich damit als S(χ A ; α) = j I α Q j A S(χ A ; α) = j I α A Q j vol(q j ), vol(q j ). In Aufgabe (18) wird ein weiteres explizites Beispiel behandelt. Bevor wir fortfahren und schließlich zur angestrebten Integraldefinition kommen, wollen wir ein kleines 67

68 Mathematik für Physiker III, WS 212/213 Freitag Lemma über Unter-, Ober- und Riemannsummen festhalten. Zur Formulierung dieses Lemma benötigen wir noch einige kleine Definitionen. Definition 4.6: Seien n N mit n 1, Q R n ein Quader und f : Q R eine beschränkte Funktion. (a) Sei n > 1 und Q. Dann ist Q = [a, b] mit eindeutigen a, b R n und wir nennen Q i := [(a 1,..., â i,..., a n ), (b 1,..., b i,..., b n )] R n 1 für jedes 1 i n die i-te Seite von Q (dabei ist das Auslassungssymbol, d.h. der gekennzeichnete Teil der Auflistung wird weggelassen). Ist Q =, so setzen wir auch Q i := für jedes 1 i n. (b) Im Fall n > 1 schreiben wir s(q) := max 1 i n vol(q i) und für n = 1 setzen wir einfach s(q) := 1. (c) Ist Q nicht ausgeartet und ist α = (α i ) 1 i n eine Zerlegung von Q, wobei für 1 i n stets α i = (t i,..., t i,ni ) sei, so schreiben wir n(α) := n n i. i=1 (d) Im Fall Q setzen wir und für Q = sei (f; ) :=. (f; Q) := sup f(x) f(y) x,y Q Damit kommen wir zu unserem angekündigten Lemma, dieses verallgemeinert das entsprechende eindimensionale II. 2.Lemma 2 auf den höherdimensionalen Fall. Lemma 4.1: Seien n N mit n 1, Q R n ein nicht ausgearteter Quader und f : Q R eine beschränkte Funktion. (a) Sind α, β zwei Zerlegungen von Q mit α β, so gelten S(f; α) S(f; β) und S(f; α) S(f; β). (b) Sind α, β zwei Zerlegungen von Q, so gilt S(f; α) S(f; β). (c) Ist ζ eine Zerteilung von Q mit zugehöriger Zerlegung α, so ist S(f; α) R(f; ζ) S(f; α). 68

69 Mathematik für Physiker III, WS 212/213 Freitag (d) Seien α eine Zerlegung von Q und ɛ >. Dann existieren Zerteilungen ζ, ζ von Q mit zugehöriger Zerlegung α so, dass gelten. S(f; α) ɛ < R(f; ζ) S(f; α) und S(f; α) R(f; ζ ) < S(f; α) + ɛ (e) Seien α, β zwei Zerlegungen von Q und C mit f(x) C für alle x Q. Dann gelten und S(f; β) S(f; α β) S(f; β) + 2Cs(Q)(n(α) n)δ(β) S(f; β) S(f; α β) S(f; β) 2Cs(Q)(n(α) n)δ(β). (f) Für jede Zerlegung α von Q gilt S(f; α) S(f; α) = j I α (f; Q α,j ) vol(q α,j ). Beweis: (a,e) Im Fall n = 1 gelten beide Behauptungen nach II. 2.Lemma 2.(a,e), wir können im folgenden also n > 1 annehmen und werden beide Aussagen durch Rückführung auf den schon bekannten eindimensionalen Fall beweisen. Schreibe Q = [a, b] mit a, b R n und a i < b i für alle 1 i n. Weiter seien α, β zwei Zerlegungen von Q. Wir betrachten zunächst den Fall das α sich nur in einer einzigen Komponente von β unterscheidet, es gebe also ein 1 i n mit α j = β j für alle 1 j n mit j i. Durch eventuelles Umbezeichnen der Koordinaten des R n können wir dann i = n annehmen und schreiben γ := (α 1,..., α n 1 ) = (β 1,..., β n 1 ), d.h. γ ist eine Zerlegung der n-ten Seite Q n von Q. Fixiere ein j I γ und definiere die Funktionen F : [a n, b n ] R; t inf f(x, t) und F : [a n, b n ] R; t sup f(x, t). x Q n,γ,j x Q n,γ,j Für alle t [a n, b n ] gelten dann C F (t) F (t) C, also sind auch F und F beschränkt mit F (t) C und F (t) C für alle t [a n, b n ]. Ist η = (t,..., t m ) eine beliebige Zerlegung von [a n, b n ], so ist τ := (γ, η) eine Zerlegung von Q und für jedes 1 k m gelten d.h. es sind S(F ; η) vol(q n,γ,j ) = S(F ; η) vol(q n,γ,j ) = m k := inf F (t) = inf f(x) = m τ,(j,k) (f), t [t k 1,t k ] x Q τ,(j,k) M k := sup F (t) = sup f(x) = M τ,(j,k) (f), t [t k 1,t k ] x Q τ,(j,k) m m k (t k t k 1 ) vol(q n,γ,j ) = k=1 m M k (t k t k 1 ) vol(q n,γ,j ) = k=1 69 m m τ,(j,k) (f) vol(q τ,(j,k) ), k=1 m M τ,(j,k) (f) vol(q τ,(j,k) ). k=1

70 Mathematik für Physiker III, WS 212/213 Freitag Ist also α β, so haben wir α n β n und mit dem schon bekannten Fall n = 1 von (a) folgt n(α n) k=1 und analog m α,(j,k) (f) vol(q α,(j,k) ) = S(F ; α n ) vol(q n,γ,j ) S(F ; β n ) vol(q n,γ,j ) = n(β n) k=1 m β,(j,k) (f) vol(q β,(j,k) ) n(α n) k=1 M α,(j,k) (f) vol(q α,(j,k) ) n(β n) k=1 M β,(j,k) (f) vol(q β,(j,k) ). Beachten wir das auch α β = (γ, α n β n ) gilt, so folgen mit dem schon bekannten Fall n = 1 von (e) auch n(α n β n) k=1 und analog m α β,(j,k) vol(q α β,(j,k) ) = S(F ; α n β n ) vol(q n,γ,j ) S(F ; β n ) vol(q n,γ,j ) + 2C(n(α n ) 1)δ(β n ) vol(q n,γ,j ) = n(β n) k=1 m β,(j,k) (f) vol(q β,(j,k) ) + 2C(n(α n ) 1)δ(β n ) vol(q n,γ,j ) n(α n β n) k=1 M α β,(j,k) vol(q α β,(j,k) ) n(β n) k=1 M β,(j,k) (f) vol(q β,(j,k) ) 2C(n(α n ) 1)δ(β n ) vol(q n,γ,j ). Jetzt summieren wir diese Ungleichungen über j I γ und erhalten im Fall α β S(f; α) = n(α n) j I γ k=1 m α,(j,k) (f) vol(q α,(j,k) ) n(β n) j I γ k=1 m β,(j,k) (f) vol(q β,(j,k) ) = S(f; β) 7

71 Mathematik für Physiker III, WS 212/213 Freitag und analog S(f; α) S(f; β), während sich im allgemeinen Fall S(f; α β) = n(α n β m) j I γ und analog k=1 n(β m) j I γ k=1 m α β,(j,k) vol(q α β,(j,k) ) m β,(j,k) vol(q β,(j,k) ) + 2C(n(α n ) 1)δ(β n ) j I γ vol(q n,γ,j ) = S(f; β) + 2C(n(α n ) 1)δ(β n ) vol(q n ) S(f; β) + 2Cs(Q)(n(α n ) 1)δ(β) S(f; α β) S(f; β) 2Cs(Q)(n(α n ) 1)δ(β) ergeben. Damit haben wir den Spezialfall behandelt das sich α und β nur in einer einzigen Komponente unterscheiden. Den allgemeinen Fall wollen wir jetzt auf diesen Spezialfall zurückführen. Wir beginnen mit (a), nehme also α β an und definiere für jedes i n die Zerlegung β i von Q durch β i := (β 1,..., β i, α i+1,..., α n ). Dann sind β = α, β n = β und für jedes 1 i n unterscheidet sich β i von β i 1 nur in der i-ten Komponente. Wegen α β gilt für jedes 1 j n stets α j β j, also ist auch β i 1 β i für jedes 1 i n. Mit iterierter Anwendung der bereits bewiesenen Teilaussage folgt S(f; α) = S(f; β )) S(f; β 1 )... S(f; β n ) = S(f; β) und analog S(f; α) S(f; β). Damit ist Teil (a) des Lemmas vollständig bewiesen. Wir kommen jetzt zu Teil (e) und diesmal betrachten wir die folgenden Zerlegungen von Q γ i := (α 1 β 1,..., α i β i, β i+1,..., β n ) für i n, α i := (α 1 β 1,..., α i 1 β i 1, α i, β i+1,..., β n ) für 1 i n. Dann sind β γ i für alle i n, γ = β, γ n = α β und für jedes 1 i n ist γ i = α i γ i 1 und α i, γ i 1 unterscheiden sich nur in der i-ten Komponente. Mit der schon bewiesenen Teilaussage folgen somit S(f; γ i ) S(f; γ i 1 )+2Cs(Q)(n(α i ) 1)δ(γ i 1 ) S(f; γ i 1 )+2Cs(Q)(n(α i ) 1)δ(β) und analog S(f; γ i ) S(f; γ i 1 ) 2Cs(Q)(n(α i ) 1)δ(β) für alle 1 i n. Iterierte Anwendung dieser Ungleichungen liefert S(f; α β) = S(f; γ n ) S(f; γ ) + 2Cs(Q)δ(β) n (n(α i ) 1) i=1 = S(f; β) + 2Cs(Q)(n(α) n)δ(β) 71

72 Mathematik für Physiker III, WS 212/213 Freitag und analog S(f; α β) S(f; β) 2Cs(Q)(n(α) n)δ(β). Damit sind die beiden rechts stehenden Abschätzungen in (e) bewiesen, und die links stehenden folgen wegen β α β aus (a). (b) Wähle eine Zerlegung γ von Q mit γ α und γ β. Für jedes j I γ gilt dann also haben wir auch m j := inf f(x) sup f(x) =: M j, x Q γ,j x Q γ,j S(f; γ) = j I γ m j vol(q γ,j ) j I γ M j vol(q γ,j ) = S(f; γ). Mit (a) ergibt sich damit auch S(f; α) S(f; γ) S(f; γ) S(f; β). (c) Wir schreiben ζ = (α, s), also s j Q α,j für jedes j I α. Für jedes j I α haben wir dann auch m j := inf f(x) f(s j ) sup f(x) =: M j, x Q α,j x Q α,j und somit ergibt sich S(f; α) = j I α m j vol(q α,j ) j I α f(s j ) vol(q α,j ) j I α M j vol(q α,j ) = S(f; α). (d) Sei j I α und setze wieder Q j := Q α,j sowie Dann gibt es Punkte s j, s j Q α,j mit m j := inf x Q j f(x) und M j := sup x Q j f(x). f(s j ) > M j ɛ vol(q) und f(s j) < m j + ɛ vol(q). Wir erhalten die Zerteilungen ζ := (α, (s j ) j Iα ) und ζ := (α, (s j) j Iα ) von Q mit zugehöriger Zerlegung α. Für diese Zerteilungen haben wir R(f; ζ) = f(s j ) vol(q j ) > M j vol(q j ) ɛ vol(q j ) = S(f; α) ɛ, vol(q) j I α j I α j I α und analog R(f; ζ ) < S(f; α) + ɛ. Nach (c) gelten schließlich auch R(f; ζ) S(f; α) und R(f; ζ ) S(f; α). (f) Für jedes j I α setzen wir wieder m j := inf f(x) und M j := sup f(x) x Q α,j x Q α,j 72

73 Mathematik für Physiker III, WS 212/213 Freitag und erhalten mit den Rechenregeln für Supremum und Infimum (f; Q α,j ) = sup f(x) f(y) = sup (f(x) f(y)) x,y Q α,j x,y Q α,j = sup f(x) inf f(y) = M j m j. x Q α,j y Q α,j Damit haben wir auch (f; Q α,j ) vol(q α,j ) = M j vol(q α,j ) m j vol(q α,j ) = S(f; α) S(f; α). j I α j I α j I α Nach Teil (b) des Lemmas ist jede Untersumme von f kleiner als jede Obersumme von f, d.h. die Menge der Untersummen ist nach oben beschränkt und die Menge der Obersummen ist nach unten beschränkt. Damit können wir das Supremum der Untersummen und das Infimum der Obersummen bilden, und erhalten die folgende Definition. Definition 4.7 (Das n-dimensionale Riemann Integral) Seien n N mit n 1, Q R n ein nicht ausgearteter Quader und f : Q R eine beschränkte Funktion. Dann definieren wir das Riemannsche Unter- beziehungsweise Oberintegral von f durch f := sup {S(f; α) α ist Zerlegung von Q} (Unterintegral) Q Q f := inf { S(f; α) α ist Zerlegung von Q } (Oberintegral). Weiter heißt die Funktion f Riemann-integrierbar wenn ihr Unter- und ihr Oberintegral gleich sind und in diesem Fall heißt f := f = f das Riemann-Integral von f. Q Q Meist verwenden wir für das Integral die alternative Schreibweise f(x 1,..., x n ) d(x 1,..., x n ) := f(x) dx := f. Q Diese Definition des Riemann-Integrals ist nur zur theoretischen Begründung desselben gedacht, und nicht zu seiner Berechnung. Die Berechnung eines Riemann-Integrals alleine aus der Definition heraus ist nur selten möglich, und selbst dann meist unnötig aufwändig. Ein solches Beispiel ist Aufgabe (18) und an dieser Stelle wollen wir ein 73 Q Q Q

74 Mathematik für Physiker III, WS 212/213 Freitag weiteres Beispiel vorführen. Seien dazu ein n N mit n 1 und ein nicht ausgearteter Quader Q R n gegeben. Weiter sei A R n ein beliebiger Quader mit A Q. Wir wollen das Integral der charakteristischen Funktion χ A von A über Q berechnen, und insbesondere einsehen das dieses überhaupt existiert. Ist dabei A =, so ist χ A = und dann sind alle Untersummen und alle Obersummen von χ A = zu beliebiger Zerlegung von Q gleich Null, also sind auch Oberintegral und Unterintegral von χ A gleich Null und somit ist χ A dann Riemann-integrierbar mit Integral Null. Wir können also A annehmen. Schreiben wir Q = [a, b] mit a, b R n so ist a i < b i für alle 1 i n. Wegen A Q ist weiter A = [c, d] mit c, d R n und es gilt a i c i d i b i für alle 1 i n. Sei nun ein beliebiges ɛ > vorgegeben. Sei 1 i n. Dann definieren wir eine Zerlegung α i des Intervalls [a i, b i ] gemäß der folgenden Fallunterscheidung: 1. Im Hauptfall a i < c i < d i < b i setzen wir α i := (a i, u, c i, d i, v, b i ) wobei u, v mit a i < u < c i, d i < v < b i, u > c i ɛ und v < d i + ɛ gewählt sind. 2. Im Fall a i = c i < d i < b i setzen wir α i := (a i, d i, u, b i ) wobei d i < u < b i mit u < d i + ɛ gewählt sei. 3. Im Fall a i < c i < d i = b i setzen wir analog α := (a i, u, c i, b i ) wobei a i < u < c i mit u > c i ɛ gewählt sei. 4. Im Fall a i = c i < d i = b i setzen wir α i := (a i, b i ). 5. Im Fall a i < c i = d i < b i setzen wir α i := (a i, u, v, b i ) wobei a i < u < c i < v < b i mit v u < ɛ gewählt seien. 6. Im Fall a i = c i = d i < b i setze α i := (a i, u, b i ) wobei a i < u < b i mit u < a i + ɛ gewählt sei. 7. Im letzten Fall a i < c i = d i = b i setze schließlich α i := (a i, u, b i ) wobei a i < u < b i mit u > b i ɛ gewählt sei. In allen sieben Fällen ist [c i, d i ] in genau einem der Teilintervalle der Zerlegung α i enthalten und trifft außer diesem höchstens zwei weitere der Teilintervalle der Zerlegung α i die beide die Länge höchstens ɛ haben. Schließlich betrachten wir die Zerlegung α := (α i ) 1 i n von Q. In einem früheren Beispiel hatten wir bereits Unter- und Obersummen berechnet und erhalten vol(a) S(χ A ; α) S(χ A ; α) vol(a) + 2ns(Q)ɛ. Da ɛ > beliebig war, liefert dies schließlich Q χ A = Q χ A = vol(a), 74

75 Mathematik für Physiker III, WS 212/213 Freitag d.h. die charakteristische Funktion χ A ist Riemann-integrierbar mit χ Q A(x) dx = vol(a). Wir hatten unsere Überlegungen zum Riemann-Intergral mit der Standardheuristik begonnen, dass also das Integral entsteht indem der Definitionsbereich zerlegt wird, die Funktion auf jedem Teilstück durch eine Konstante approximiert wird und dann der Grenzübergang nach immere feineren Zerlegungen durchgeführt wird. Die dabei auftauchenden Approximationen des Integrals haben wir inzwischen als Riemannsummen R(f; ζ) bezeichnet. Unsere Erwartung ist also, dass wann immer wir eine Folge (ζ k ) k N von Zerteilungen unseres Quaders Q nehmen deren Feinheit gegen Null konvergiert, dass dann die zugehörigen Riemannsummen gegen das Integral konvergieren sollten, also f(x) dx = lim R(f; ζ k ) wenn lim δ(ζ k ) =. k k Q Tatsächlich ist genau dies die ursprüngliche von Riemann verwendete Definition des Integrals. Im folgenden Satz wollen wir unter anderem festhalten, dass die hier verwendete Integraldefinition über Unter- und Oberintegral wirklich genau gleichwertig zur Riemannschen Definition ist. Der Beweis beruht dabei auf unserem Lemma 1 über die Grundeigenschaften von Ober-, Unter- und Riemannsummen. Satz 4.2 (Charakterisierung Riemann-integrierbarer Funktionen) Seien n N mit n 1, Q R n ein nicht ausgearteter Quader und f : Q R eine beschränkte Funktion. Dann sind die folgenden Aussagen äquivalent: (a) Die Funktion f ist Riemann-integrierbar. (b) Für jedes ɛ > existiert eine Zerlegung α von Q mit S(f; α) S(f; α) < ɛ. (c) Für jedes ɛ > existiert ein δ > so, dass für alle Zerlegungen α, β von Q mit δ(α) < δ und δ(β) < δ stets gilt. S(f; α) S(f; β) < ɛ (d) Es gibt eine reelle Zahl A R so, dass es für jedes ɛ > stets ein δ > mit R(f; ζ) A < ɛ für jede Zerteilung ζ von Q mit δ(ζ) < δ gibt. (e) Für jedes ɛ > existiert ein δ > so, dass für alle Zerteilungen ζ, ξ von Q mit δ(ζ) < δ und δ(ξ) < δ stets R(f; ζ) R(f; ξ) < ɛ gilt. (f) Für jede Folge (ζ k ) k N von Zerteilungen von Q mit (δ(ζ k )) k N ist die Folge (R(f; ζ k )) k N konvergent. 75

76 Mathematik für Physiker III, WS 212/213 Freitag Ist f Riemann-integrierbar, so gilt in (d) stets A = f(x) dx und in (f) sind alle Q diese Folgen gegen f(x) dx konvergent. Q Beweis: (a)= (b). Sei ɛ > gegeben und setze A := f(x) dx. Da A das Unterintegral von f über Q ist, existiert eine Zerlegung β 1 von Q mit S(f; β 1 ) > A ɛ/2 und Q da A auch das Oberintegral von f über Q ist, existiert ebenso eine Zerlegung β 2 von Q mit S(f; β 2 ) < A + ɛ/2. Wähle eine Zerlegung α von Q mit α β 1, β 2. Nach Lemma 1.(a) gilt dann S(f; α) S(f; α) S(f; β 2 ) S(f; β 1 ) < A + ɛ ( 2 A ɛ ) = ɛ. 2 (b)= (c). Sei ɛ >. Dann existiert eine Zerlegung γ von Q mit S(f; γ) S(f; γ) < ɛ/2. Wähle ein C > mit f(x) C für alle x Q. Setze δ := ɛ/(8cs(q)n(γ)). Seien α, β zwei Zerlegungen von Q mit δ(α) < δ und δ(β) < δ. Nach Lemma 1.(a,e) gilt dann S(f; α) S(f; β) S(f; α γ) + 2Cs(Q)(n(γ) n)δ(α) (S(f; β γ) 2Cs(Q)(n(γ) n)δ(β)) S(f; γ) S(f; γ) + 4Cs(Q)n(γ)δ < ɛ 2 + ɛ 2 = ɛ. (c)= (e). Sei ɛ >. Dann existiert ein δ > mit S(f; α) S(f; β) < ɛ für alle Zerlegungen α, β von Q mit δ(α) < δ und δ(β) < β. Seien jetzt ζ, ξ zwei Zerteilungen von Q mit δ(ζ) < δ und δ(ξ) < δ. Bezeichne α die ζ unterliegende Zerlegung von Q und β die ξ unterliegende Zerlegung von Q. Dann gelten auch δ(α) = δ(ζ) < δ und δ(β) = δ(ξ) < δ. Mit Lemma 1.(c) folgen und analog auch R(f; ζ) R(f, ξ) S(f; α) S(f; β) < ɛ (R(f; ζ) R(f; ξ)) = R(f; ξ) R(f; ζ) < ɛ, d.h. es ist R(f; ζ) R(f; ξ) < ɛ. (e)= (f). Sei (ζ k ) k N eine Folge von Zerteilungen von Q mit (δ(ζ k )) k N. Wir zeigen, dass die Folge (R(f; ζ k )) k N eine Cauchyfolge ist. Sei also ɛ > gegeben. Dann existiert ein δ > mit R(f; ζ) R(f; ξ) < ɛ für alle Zerteilungen ζ, ξ von Q mit δ(ζ) < δ und δ(ξ) < δ. Weiter existiert ein k N mit δ(ζ k ) < δ für alle k k, d.h. für k, l k ist stets R(f; ζ k ) R(f; ζ l ) < ɛ. Damit ist (R(f; ζ k )) k N tatsächlich eine Cauchyfolge und nach I. 6.Satz 14 auch konvergent. (f)= (d). Wir zeigen zuerst, dass es ein A R gibt so, dass für jede Folge (ζ k ) k N von Zerteilungen von Q mit (δ(ζ k )) k N die Folge (R(f; ζ k )) k N gegen A konvergiert. Angenommen dies wäre nicht der Fall. Dann gibt es A, A R mit A A und Folgen (ζ k ) k N, (ζ k ) k N von Zerteilungen von Q mit (δ(ζ k)) k N, (δ(ζ k )) k N, (R(f; ζ k)) k N A und (R(f; ζ k )) k N A. 76

77 Mathematik für Physiker III, WS 212/213 Dienstag Durch ζ 2k := ζ k und ζ 2k+1 := ζ k für jedes k N erhalten wir eine weitere Folge von Zerteilungen von Q und es ist auch (δ(ζ k )) k N. Damit ist auch die Folge (R(f; ζ k )) k N konvergent und dies ergibt den Widerspruch A = A. Damit ist diese Zwischenbehauptung bewiesen. Wir behaupten jetzt, dass mit diesem Wert von A die Aussage in (d) erfüllt ist. Andernfalls existiert ein ɛ > so, dass für jedes δ > eine Zerteilung ζ von Q mit δ(ζ) < δ und R(f; ζ) A ɛ existiert. Insbesondere gibt es dann für jedes k 1 eine Zerteilung ζ k von Q mit δ(ζ k ) < 1/k und R(f; ζ k ) A ɛ. Insbesondere ist (δ(ζ k )) k N und es ergibt sich der Widerspruch (R(f; ζ k )) k N A. (d)= (a). Sei ɛ >. Dann existiert ein δ > mit R(f; ζ) A < ɛ/2 für jede Zerteilung ζ von Q mit δ(ζ) < δ. Wähle eine Zerlegung α von Q mit δ(α) < δ. Nach Lemma 1.(d) existieren Zerteilungen ζ, ζ von Q mit unterliegender Zerlegung α so, dass S(f; α) ɛ 2 < R(f; ζ) S(f; α) und S(f; α) R(f; ζ ) < S(f; α) + ɛ 2 gelten. Wegen δ(ζ) = δ(ζ ) = δ(α) < δ folgt A ɛ < R(f; ζ ) ɛ b 2 < S(f; α) f(x) dx Da dies für jedes ɛ > gilt, ist folglich b a a f(x) dx = b a b a f(x) dx = A, f(x) dx S(f; α) < R(f; ζ) + ɛ 2 < A + ɛ. d.h. f ist Riemann-integrierbar mit f(x) dx = A. Q Im Beweis der Implikation von (d) nach (a) haben wir insbesondere gezeigt, dass die Konstante A in (d) gleich dem Rieman-Integral f(x) dx ist. Außerdem wurde Q beim Beweis von (f) nach (d) bewiesen, dass jede der Folgen (R(f; ζ k )) k N aus (f) gegen das A aus (d), also gegen f(x) dx, konvergiert. Q Vorlesung 9, Dienstag In der letzten Sitzung hatten wir die Definition des n-dimensionalen Riemann-Integrals durchgeführt. Gegeben war eine auf einem Quader Q R n definierte, beschränkte 77

78 Mathematik für Physiker III, WS 212/213 Dienstag Funktion f : Q R. Zu jeder Zerlegung α des Quaders Q hatten wir dann Unter- und Obersummen S(f; α) = j I α m j vol(q j ), S(f; α) = j I α M j vol(q j ) eingeführt, wobei m j das Infimum von f auf Q j und M j das Supremum von f auf Q j sind. Jede Untersumme ist kleiner als jede Obersumme, ist also β eine Zerlegung von Q so konnten wir das Unterintegral als Supremum f = sup{s(f; α) α ist Zerlegung von Q} S(f; β) Q einführen, und dann das Oberintegral als Infimum f = inf{s(f; α) α ist Zerlegung von Q} Q definieren. Die Funktion f hieß dann integrierbar wenn Ober- und Unterintegral übereinstimmen, und dieser gemeinsame Wert ist dann das Riemann-Integral. Am Ende hatten wir dann noch eine ganze Reihe äquivalenter Formulierungen des Riemann- Integrals festgehalten. Zwei davon sind besonders wichtig. Zum einen ist die Funktion f genau dann Riemann-integrierbar wenn sich Unter- und Obersummen beliebig nahe kommen, wenn es also für jedes ɛ > stets eine Zerlegung α von Q mit S(f; α) S(f; α) < ɛ gibt. Nach Lemma 1.(f) kann man diese Differenz auch als S(f; α) S(f; α) = j I α (f; Q j ) vol(q j ) Q f schreiben, wobei (f; Q j ) = sup x,y Q j f(x) f(y) beschreibt wie stark sich f auf Q j ändert. In dieser Sichtweise bedeutet die Riemann- Integrierbarkeit von f also das die Funktion f nicht zu stark oszilliert. Ebenfalls gleichwertig zur Riemann-Integrierbarkeit war die Konvergenz der Riemannsummen, d.h. die Funktion f ist genau dann Riemann-integrierbar wenn für jede Folge (ζ k ) k N von Zerteilungen des Quaders Q deren Feinheiten eine Nullfolge bilden, die Folge der zugehörigen Riemannsummen (R(f; ζ k )) k N konvergiert. All diese Folgen konvergieren dann gegen das Integral von f, also lim δ(ζ k) = = lim R(f; ζ k ) = f(x) dx. k k 78 Q

79 Mathematik für Physiker III, WS 212/213 Dienstag Bisher kennen wir nur einen Beispieltyp Riemann-integrierbarer Funktionen, war A Q ein weiterer Quader so war die charakteristische Funktion χ A von A Riemannintegrierbar mit χ A (x) dx = vol(a). Q Der Beweis dieser Tatsache beruhte auf einer direkten Konstruktion geeigneter Zerlegungen von Q. Ist A nicht ausgeartet und ɛ >, so hatten wir uns überlegt das es eine Zerlegung α von Q gibt, die zum einen A als einen ihrer Teilquader enthält, also A = Q k für ein k I α, und zusätzlich k j I α A Q j vol(q j ) < ɛ erfüllt. Ist A ausgeartet und ɛ >, so konnten wir eine Zerlegung α von Q mit j I α A Q j vol(q j ) < ɛ finden. Es ist hilfreich sich klarzumachen das all diese Begriffe invariant unter beliebigen Vertauschungen der Koordinaten im R n sind, diese Tatsache erlaubt es dann bei Bedarf die Koordinaten x 1,..., x n passend anzuordnen. Sei nämlich π S n eine beliebige Permutation der Koordinaten des R n. Für alle a, b R n haben wir dann π([a, b]) = [π(a), π(b)] und somit auch vol(π([a, b]) = vol([a, b]), d.h. jeder Quader wird zu einem volumengleichen Quader umgeordnet. Sei nun Q R n ein nicht ausgearteter Quader. Ist α eine Zerlegung von Q, so ist π(α) := (α π 1 (k)) 1 k n eine Zerlegung von π(q) mit I π(α) = {π(j) j I α } = π(i α ) und für jedes j I α gilt Q π(α),π(j) = π(q α,j ). Ist weiter f : π(q) R eine beschränkte Funktion, so ist auch f π : Q R beschränkt und für jede Zerlegung α von Q gilt S(f; π(α)) = ( ) inf f(x) vol(q π(α),j ) x Q π(α),j j I π(α) = ( ) inf f(π(x)) vol(q α,j ) x Q α,j j I α = S(f π; α) und analog S(f; π(α)) = S(f π; α). Da alle Zerlegungen von π(q) diese Form haben folgt weiter auch f = f π und f = f π, π(q) Q 79 π(q) Q

80 Mathematik für Physiker III, WS 212/213 Dienstag d.h. f ist genau dann Riemann-integrierbar wenn f π Riemann-integrierbar ist, und in diesem Fall gilt f = f π, oder in Koordinaten ausgeschrieben π(q) Q f(x 1,..., x n ) d(x 1,..., x n ) = f(x π 1 (1),..., x π 1 (n)) d(x 1,..., x n ). π(q) Q Als nächsten Schritt wollen wir uns jetzt einen größeren Vorrat Riemann-integrierbarer Funktionen verschaffen und einsehen das jede stetige Funktion definiert auf einem nicht ausgearteten Quader auch Riemann-integrierbar ist. Der Beweis dieser Tatsache ist analog zum eindimensionalen Fall in II. 2.Satz 8 und wir beginnen mit einer Verallgemeinerung des Lemmas über die gleichmäßige Stetigkeit stetiger Funktionen auf Intervallen II. 2.Lemma 7. Lemma 4.3: Seien E, F zwei normierte Räume, C E kompakt und f : C F eine stetige Funktion. Dann gibt es zu jedem ɛ > ein δ > so, dass für alle x, y C mit x y < δ stets auch f(x) f(y) < ɛ ist. Beweis: Sei ɛ > gegeben. Sei x C. Da f in x stetig ist, existiert ein δ x > so, dass für jedes y C mit y x < δ x stets f(y) f(x) < ɛ/2 gilt. Wegen C x C B δ x (x) existieren nach II. 8.Satz 2 endlich viele Punkte x 1,..., x n C mit C n k=1 B δ xk /2(x k ). Setze nun δ := 1 2 min 1 k n δ x k, was wir im Fall n = etwa als δ = 1 interpretieren. Seien jetzt x, y C mit x y < δ gegeben. Wegen C n k=1 B δ xk /2(x k ) existiert dann ein 1 k n mit x x k < δ xk /2 < δ xk, also ist auch f(x) f(x k ) < ɛ/2. Weiter ist y x k y x + x x k < δ + δ xk /2 δ xk, also ist auch f(y) f(x k ) < ɛ/2. Insgesamt ist damit f(x) f(y) f(x) f(x k ) + f(y) f(x k ) < ɛ. Man bezeichnet die im Lemma nachgewiesene Eigenschaft (ɛ > ) (δ > ) (x, y C) : x y < δ = f(y) f(x) < ɛ auch als die gleichmäßige Stetigkeit der Funktion f. Ein Quader Q R n ist abgeschlossen und beschränkt, also nach dem Satz von Heine Borel II. 8.Satz 4 auch kompakt. Damit ist jede stetige Funktion auf einem Quader im R n auch gleichmäßig stetig, und dies erlaubt uns die Oszillation einer stetigen Funktion auf den Teilquadern ausreichend feiner Zerlegungen zu kontrollieren. Es ist hierzu technisch bequem auf dem R n die in II. 4.5 eingeführte Maximumsnorm x = max 1 i n x i (x R n ) zu verwenden, diese hat unter anderem den Vorteil das ihre abgeschlossenen Normkugeln Würfel, also spezielle nicht ausgeartete Quader, sind. Einen Würfel der Kantenlänge l > definieren wir dabei als einen nicht ausgearteten Quader W R n der 8

81 Mathematik für Physiker III, WS 212/213 Dienstag die Form W = [a, b] mit a, b R n und b i a i = l für alle 1 i n hat. Das Volumen eines solchen Würfels ist dann vol(w ) = n (b i a i ) = l n. i=1 Sind jetzt z R n und r > gegeben, so ist die abgeschlossene Normkugel bezüglich der Maximumsnorm gegeben als B r (z) = {x R n : x z r} = {x R n (1 i n) : x i z i r} n = {x R n (1 i n) : x i [z i r, z i + r]} = [z i r, z i + r], es handelt sich also um einen Würfel der Kantenlänge 2r. Damit kommen wir nun zu unserem angekündigten Satz über die Integrierbarkeit stetiger Funktionen. Satz 4.4 (Stetige Funktionen sind Riemann-integrierbar) Seien n N mit n 1 und Q R n ein nicht ausgearteter Quader. Dann ist jede stetige Funktion f : Q R auch Riemann-integrierbar. Beweis: Sei f : Q R n eine stetige Funktion. Sei ɛ >. Nach Lemma 3 existiert dann ein δ > so, dass für alle x, y Q mit x y < δ stets f(x) f(y) < ɛ/ vol(q) gilt. Wähle eine Zerlegung α von Q mit δ(α) < δ. Sei j I α. Schreiben wir dann Q j = [a, b] mit a, b R n, so gilt für alle 1 k n stets a k < b k und b k a k δ(α k ) δ(α), also ist für alle x, y Q j auch x k y k b k a k δ(α). Für x, y Q j folgt somit x y = max 1 k n x k y k δ(α) < δ, und somit ist f(x) f(y) < ɛ/ vol(q). Dies zeigt (f; Q j ) < ɛ/ vol(q j ). Insgesamt folgt mit Lemma 1.(f) S(f; α) S(f; α) = j I α (f; Q j ) vol(q j ) Nach Satz 2 ist f Riemann-integrierbar. ( j I α vol(q j ) ) i=1 ɛ vol(q) = ɛ. Damit steht uns bereits ein recht große Menge Riemann-integrierbarer Funktionen zur Verfügung und wir wollen jetzt beginnen die einfachen Eigenschaften des Riemann- Integrals zu besprechen. Die Untersuchung der etwas komplizierteren Eigenschaften des n-dimensionalen Riemann-Integrals beginnt dann im nächsten Abschnitt, wo wir insbesondere sehen werden wie man solche Integrale berechnen kann. Wir teilen die Grundeigenschaften des Riemann-Integrals in zwei Gruppen ein, einmal die algebraischen Eigenschaften die sich auf den Integranden beziehen und zum anderen die geometrischen Eigenschaften die sich auf den Integrationsbereich beziehen. Die Aussagen der ersten Gruppe sind völlig analog zum eindimensionalen Fall und werden im folgenden Lemma zusammengestellt. 81

82 Mathematik für Physiker III, WS 212/213 Dienstag Lemma 4.5 (Algebraische Grundeigenschaften des Rieman-Integrals) Seien n N mit n 1, Q R n ein nicht ausgearteter Quader und f, g : Q R zwei Riemann-integrierbare Funktionen. (a) Die Funktion f + g ist Riemann-integrierbar mit (f(x) + g(x)) dx = f(x) dx + Q (b) Die Funktion f g ist Riemann-integrierbar. Q Q g(x) dx. (c) Für jedes c R ist die Funktion cf : Q R Riemann-integrierbar mit cf(x) dx = c f(x) dx. (d) Gilt f(x) g(x) für alle x Q, so ist auch f(x) dx Q Q Q Q g(x) dx. (e) Der Betrag f ist wieder Riemann-integrierbar mit f(x) dx f(x) dx. Q Q Beweis: (a) Für jede Zerteilung ζ = (α, s) von Q haben wir R(f + g; ζ) = j I α (f(s j ) + g(s j )) vol(q j ) = j I α f(s j ) vol(q j ) + j I α g(s j ) vol(q j ) = R(f; ζ) + R(g; ζ). Ist also (ζ k ) k N eine Folge von Zerteilungen von Q mit (δ(ζ k )) k N so folgt mit Satz 2 angewandt auf f und g lim R(f + g; ζ k) = lim R(f; ζ k ) + lim R(g; ζ k ) = f + g. k k k Nach Satz 2 angewandt auf die beschränkte Funktion f + g ist f + g damit Riemannintegrierbar mit (f + g) = f + g. Q 82 Q Q Q Q

83 Mathematik für Physiker III, WS 212/213 Dienstag (c) Für jede Zerteilung ζ = (α, s) von Q haben wir R(cf; ζ) = j I α cf(s j ) vol(q j ) = c j I α f(s j ) vol(q j ) = cr(f; ζ). Ist also (ζ k ) k N eine Folge von Zerteilungen von Q mit (δ(ζ k )) k N so folgt mit Satz 2 angewandt auf f lim R(cf; ζ k) = c lim R(f; ζ k ) = c f. k k Nach Satz 2 diesmal angewandt auf die beschränkte Funktion cf ist cf damit Riemannintegrierbar mit cf = c f. (d) Für jede Zerteilung ζ = (α, s) von Q gilt Q R(f; ζ) = j I α f(s j ) vol(q j ) j I α g(s j ) vol(q j ) = R(g; ζ). Q Q Ist also (ζ k ) k N eine Folge von Zerteilungen von Q mit (δ(ζ k )) k N so folgt mit Satz 2 f = lim R(f; ζ k ) lim R(g; ζ k ) = g. k k Q (b) Da f und g beschränkt sind existieren A, B > mit f(x) A und g(x) B für alle x Q. Wieder nach Satz 2 gibt es Zerlegungen α, β von Q mit S(f; α) S(f; α) < ɛ und S(g; β) S(g; β) < ɛ 2B 2A. Wähle eine gemeinsame Verfeinerung γ von α und β, also eine Zerlegung γ von Q mit α, β γ. Sei j I γ. Für alle x, y Q γ,j gilt dann f(x)g(x) f(y)g(y) f(x) f(y) g(x) + f(y) g(x) g(y) und dies bedeutet (fg; Q γ,j ) = Q (f; Q γ,j ) B + A (g; Q γ,j ), sup f(x)g(x) f(y)g(y) (f; Q γ,j ) B + A (g; Q γ,j ). x,y Q γ,j Durch Summation dieser Ungleichungen folgt mit Lemma 1.(a,f) S(fg; γ) S(fg; γ) = j I γ (fg; Q γ,j ) vol(q γ,j ) B (f; Q γ,j ) vol(q γ,j ) + A (g; Q γ,j ) vol(q γ,j ) j I γ j I γ = A (S(f; γ) S(f; γ)) + B (S(g; γ) S(g; γ)) A (S(f; α) S(f; α)) + B (S(g; β) S(g; β)) < ɛ, 83

84 Mathematik für Physiker III, WS 212/213 Dienstag also ist f g nach Satz 2 Riemann-integrierbar. (e) Sei ɛ > gegeben. Nach Satz 2 und Lemma 1.(f) gibt es eine Zerlegung α von Q mit j I α (f; Q j ) vol(q j ) < ɛ. Ist j I α, so gilt für alle x, y Q j f(x) f(y) f(x) f(y) (f; Q j ) also ( f ; Q j ) = sup x,y Q j f(x) f(y) (f; Q j ), und Summation dieser Ungleichungen liefert wieder nach Lemma 1.(f) S( f ; α) S( f ; α) = j I α ( f ; Q j ) vol(q j ) j I α (f; Q j ) vol(q j ) < ɛ. Nach Satz 2 ist f Riemann-integrierbar. Für jede Zerteilung ζ = (α, s) von Q gilt weiter R(f; ζ) = f(s j ) vol(q j ) f(s j ) vol(q j ) = R( f ; ζ), j I α j I α wählen wir also eine Folge (ζ k ) k N von Zerteilungen von Q mit (δ(ζ k )) k N so ergibt Satz 2 f(x) dx = lim R(f; ζ k ) = lim R(f; ζ k ) lim R( f ; ζ k ) = f(x) dx. k k k Q Q Die Aussagen (a) und (c) des Lemmas können wir auch so zusammenfassen das die Menge R(Q) aller Riemann-integrierbaren Funktionen f : Q R einen reellen Vektorraum bildet und das die Integration : R(Q) R eine lineare Abbildung ist. Q Die Ungleichung in (e) wird oftmals auch als die Dreiecksungleichung für Integrale bezeichnet. Damit haben wir die algebraischen Grundeigenschaften behandelt und kommen nun zu den geometrischen Aussagen über das n-dimensionale Riemann-Integral. Hauptsächlich wollen wir die aus dem eindimensionalen Fall bekannte Additivität im Integrationsbereich, also b a f(x) dx + c b f(x) dx = c a f(x) dx verallgemeinern. Diese wird im n-dimensionalen Fall etwas komplizierter da Quader komplizierter zueinander liegen können als Intervalle. Es stellt sich als technisch günstig 84

85 Mathematik für Physiker III, WS 212/213 Dienstag heraus dieses Problem mit einer anderen Fragestellung zu vermischen. Im eindimensionalen Fall änderte sich das Integral nicht wenn der Integrand in endlich vielen Punkten willkürlich abgeändert wurde. Etwas entsprechendes gilt auch in n Dimensionen, nur das wir die Funktion auch auf gewissen unendlichen Mengen abändern können. Unterscheiden sich zwei Funktionen im R 2 beispielsweise nur in den Punkten auf einer Geraden, so sind ihre Integrale bereits gleich. Solche Punktmengen die auf das Riemann-Integral keinen Einfluss haben wollen wir Nullmengen nennen, oder etwas spezifischer Jordansche Nullmengen. Als exakte Definition dieses Begriffs verwenden wir: Definition 4.8: Sei n N mit n 1. Eine beschränkte Teilmenge N R n heißt eine Jordansche Nullmenge wenn es für jedes ɛ > stets endlich viele Quader Q 1,..., Q r R n mit r r N Q k und vol(q k ) < ɛ gibt. k=1 In der Definition einer Jordanschen Nullmenge können die überdeckenden Quader völlig beliebig sein, sie dürfen ausgeartet sein und sie können sich in inneren Punkten schneiden. Damit ist beispielsweise jeder ausgeartete Quader N R n eine Jordansche Nullmenge, da wir ihn mit sich selbst überdecken können. Im folgenden Lemma werden wir unter anderem einsehen das man die überdeckenden Quader bei Bedarf alle als nicht ausgeartet mit paarweise ausgearteten Durchschnitt wählen kann, liegt unsere Menge N in einem nicht ausgearteten Quader Q, so kann sogar erreicht werden das alle überdeckenden Quader zu einer Zerlegung von Q gehören. Es ist hilfreich diesem Lemma zwei kleine, und auch recht offensichtliche, Hilfsbeobachtungen vorauszuschicken. Angenommen wir haben einen nicht ausgearteten Quader Q R n und einen weiteren in Q enthaltenen Quader Q Q. Wir wollen einsehen das vol(q ) vol(q) ist. Im Fall Q = ist dies klar, wir können also Q annehmen. Schreiben wir Q = [a, b] und Q = [c, d] mit a, b, c, d R n, so ist für jedes 1 i n stets k=1 [c i, d i ] = {x i x Q } {x i x Q} = [a i, b i ], also gilt auch a i c i d i b i, und insbesondere ist d i c i b i a i. Hiermit folgt vol(q ) = n (d i c i ) i=1 n (b i a i ) = vol(q). i=1 Für die zweite Hilfsaussage betrachten wir zwei Quader Q R n und Q R m. Dann gibt es also a, b R n und a, b R m mit Q = [a, b ] und Q = [a, b ]. Für das cartesische Produkt der beiden Mengen Q und Q folgt mit a := (a, a ) 85

86 Mathematik für Physiker III, WS 212/213 Dienstag R n+m und b := (b, b ) R n+m { Q := Q Q = (x, y) R n R m (1 k n) : a k x k b k, } (1 k m) : a k y k b k = {x R n+m (1 k n + m) : a k x k b k } = [a, b], d.h. Q R n+m ist wieder ein Quader. Sind dabei Q, Q, so ist auch Q und wir haben n+m n m vol(q) = (b k a k ) = (b k a k) (b k a k) = vol(q ) vol(q ), k=1 k=1 und im Fall Q = oder Q = gilt diese Gleichung ebenfalls. Insbesondere ist Q genau dann nicht ausgeartet wenn Q und Q beide nicht ausgeartet sind. Nach diesen Vorarbeiten kommen wir zu den Eigenschaften Jordanscher Nullmengen, die uns dann auch die Behandlung weiterer Beispiele erlauben werden. Lemma 4.6 (Grundeigenschaften Jordanscher Nullmengen) Sei n N mit n 1 gegeben. (a) Ist N R n eine Jordansche Nullmenge, so ist auch jede Teilmenge von N eine Jordansche Nullmenge. (b) Sind N 1,..., N r R n Jordansche Nullmengen so ist auch r k=1 N k eine Jordansche Nullmenge. (c) Seien Q R n ein nicht ausgearteter Quader und N Q eine Teilmenge. Dann sind die folgenden Aussagen äquivalent: k=1 1. Die Menge N ist eine Jordansche Nullmenge. 2. Für jedes ɛ > gibt es eine Zerlegung α von Q so, dass für jede Zerlegung β von Q mit β α stets vol(q β,j ) < ɛ gilt. j I β Q β,j N 3. Für jedes ɛ > gibt es eine Zerlegung α von Q und eine Teilmenge J I α mit N Q α,j und vol(q α,j ) < ɛ. j J j J (d) Seien Q R n ein nicht ausgearteter Quader, N R n eine Jordansche Nullmenge und f, g : Q R zwei beschränkte Funktionen mit f Q\N = g Q\N. Dann ist f genau dann Riemann-integrierbar wenn g Riemann-integrierbar ist und in diesem Fall gilt Q f = Q g. 86

87 Mathematik für Physiker III, WS 212/213 Dienstag (e) Sind m N mit m 1, Q R n ein nicht ausgearteter Quader und f : Q R m eine stetige Funktion, so ist der Graph N := {(x, f(x)) x Q} eine Jordansche Nullmenge im R n+m. (f) Sind 1 m < n und M R n eine m-dimensionale C 1 -Untermannigfaltigkeit des R n, so ist jede kompakte Teilmenge N M eine Jordansche Nullmenge. Beweis: (a,b) Klar. (c) (1)= (2). Sei ɛ > gegeben. Da N eine Jordansche Nullmenge ist gibt es endlich viele Quader Q 1,..., Q r R n mit N r k=1 Q k und r k=1 vol(q k) < ɛ/2. Sei 1 k r. Dann ist auch Q Q k Q ein Quader im R n und wie wir bereits früher gezeigt haben existiert somit eine Zerlegung α k von Q mit j I αk Q Q k Q αk,j vol(q αk,j) < vol(q Q k ) + ɛ 2r. Wähle eine Zerlegung α von Q mit α k α für alle 1 k r. Schreibe J := {j I α Q α,j N }. Sei j J. Wegen Q α,j N können wir dann ein x N Q α,j wählen und wegen x N r k=1 Q k existiert weiter ein 1 k(j) r mit x Q k(j). Da α k(j) α gilt existiert weiter ein φ(j) I αk(j) mit Q α,j Q αk(j),φ(j). Wegen x N Q k(j) Q α,j Q Q k(j) Q αk,φ(j) ist dabei auch Q Q k(j) Q αk,φ(j). Wir erhalten j I α Q α,j N r k=1 vol(q α,j ) = i I αk Q Q k Q αk,i r k=1 i I αk Q Q k Q αk,i vol(q αk,i) < j J k(j)=k φ(j)=i r k=1 vol(q α,j ) ( vol(q Q k ) + ɛ 2r ) r vol(q k ) + ɛ 2 < ɛ. k=1 Ist β schließlich eine Zerlegung von Q mit β α, so haben wir auch vol(q β,j ) vol(q α,j ) < ɛ. j I α Q α,j N j I β Q β,j N (2)= (3). Klar. (3)= (1). Klar. (d) Wir zeigen zunächst das f g gilt. Hierzu wähle eine Konstante A > mit Q Q f(x) A und g(x) A für alle x Q. Für jedes x Q gilt dann auch g(x) = f(x) (f(x) g(x)) f(x) 2A. 87

88 Mathematik für Physiker III, WS 212/213 Dienstag Sei ɛ >. Nach (c) existiert eine Zerlegung α von Q mit vol(q β,j ) < ɛ 4A j I β Q β,j N für jede Zerlegung β von Q mit β α. Weiter gibt es nach Definition des Unterintegrals eine Zerlegung β von Q mit S(f; β) > Qf ɛ 2 und wir wählen eine weitere Zerlegung γ von Q mit γ α, β. Nach Lemma 1.(a) ist dann S(f; γ) S(f; β) > f ɛ 2. Sei j I γ. Dann können zwei mögliche Fälle auftreten. Entweder ist N Q γ,j =, und dann gilt f(x) = g(x) für alle x Q γ,j, also ist auch m γ,j (f) = inf f(x) = inf g(x) = m γ,j (g). x Q γ,j x Q γ,j Andernfalls ist N Q γ,j und dann gilt für alle x Q γ,j Q zumindest g(x) f(x) 2A m γ,j (f) 2A also auch Wir erhalten m γ,j (g) = S(g; γ) = j I γ m γ,j (g) vol(q γ,j ) inf g(x) m γ,j (f) 2A. x Q γ,j Q m γ,j (f) vol(q γ,j ) + j I γ N Q γ,j = j I γ N Q γ,j (m γ,j (f) 2A) vol(q γ,j ) Es folgt = m γ,j (f) vol(q γ,j ) 2A j I γ j I γ = S(f; γ) 2A j I γ N Q γ,j vol(q γ,j ) > N Q γ,j Q g S(g; γ) > Q vol(q γ,j ) Q f ɛ. f ɛ 2 2A ɛ 4A = Q f ɛ. Da dies für jedes ɛ > gilt ist damit g f und diese Zwischenbehauptung ist Q Q bewiesen. Wenden wir dies mit vertauschten Rollen von f und g an, so folgt auch 88

89 Mathematik für Physiker III, WS 212/213 Dienstag Q f Q g und insgesamt ist damit Q f = Q g. Analog ergibt sich auch Q f = Q g, und damit ist genau dann f = f wenn g = g gilt, d.h. f ist genau dann Q Q Q Q Riemann-integrierbar wenn g dies ist. Weiter haben wir in diesem Fall auch f(x) dx = f = g = g(x) dx. Q Q (e) Sei ɛ > gegeben. Nach Lemma 3 existiert ein δ > so, dass für alle x, y Q mit x y < δ stets f(x) f(y) < 1 ɛ 2 m vol(q) =: θ ist. Wähle eine Zerlegung α von Q mit δ(α) < δ. Sei j I α und wähle ein z j Q j. Ist dann x Q j so gilt für alle 1 k n stets x k (z j ) k δ(α k ) δ(α), also ist auch x z j δ(α) < δ und somit haben wir f(x) f(z j ) < θ. Folglich ist f(q j ) B θ (f(z j )) und da B θ (f(z j )) ein Würfel der Kantenlänge 2θ im R m ist, ist ein Quader mit A j := Q j B θ (f(z j )) R n+m vol(a j ) = (2θ) m vol(q j ) = Q Q ɛ vol(q) vol(q j) und {(x, f(x)) x Q j } Q j f(q j ) A j. Schließlich gelten N = {(x, f(x)) x Q j } A j j I α j I α und j I α vol(a j ) = ɛ vol(q j ) = ɛ. vol(q) j I α Damit ist N eine Jordansche Nullmenge im R n+m. (f) Sei N M eine kompakte Teilmenge. Sei p N. Wie in 3 gezeigt lassen sich C 1 -Untermannigfaltigkeiten lokal als Graphen stetig differenzierbarer Funktionen schreiben, also existieren offene Mengen U R m, V R n, eine stetig differenzierbare Funktion f : U R n m und eine Permutation π S n mit p V und M V = π({(x, f(x)) x U}). Insbesondere existiert ein q U mit p = π(q, f(q)). Wähle einen nicht ausgearteten Quader Q R m mit q Q Q U. Mit 3.Lemma 3 folgt das es eine offene Menge W p R n mit M W p = π({(x, f(x)) x Q }) gibt und nach (e) ist N p := π({(x, f(x)) x Q}) R n eine Jordansche Nullmenge mit M W p N p. Wegen q Q ist p = π(q, f(q)) W p. Da N kompakt ist, existieren p 1,..., p r N mit N r k=1 W p k. Damit ist auch N r (M W pk ) k=1 89 r k=1 N pk

90 Mathematik für Physiker III, WS 212/213 Dienstag und nach (a,b) ist N eine Jordansche Nullmenge. Wir hatten schon gesehen das jeder ausgeartete Quader N R n eine Jordansche Nullmenge ist. Ist nun Q R n ein nicht ausgearteter Quader, etwa Q = [a, b] mit a, b R n, so ist der Rand von Q Q = Q\Q = n [a 1, b 1 ] [a k 1, b k 1 ] {a k, b k } [a k+1, b k+1 ] [a n, b n ] k=1 die Vereinigung von 2n ausgearteten Quadern, also eine Jordansche Nullmenge. Weiter ist jede affine Hyperebene eine (n 1)-dimensionale C 1 -Untermannigfaltigkeit des R n und damit ist jede kompakte Teilmenge einer solchen Hyperebene eine Jordansche Nullmenge. Weiter sind Sphären nach einem Beispiel aus 3 ebenfalls (n 1)-dimensionale C 1 -Untermannigfaltigkeiten des R n und da Sphären zusätzlich kompakt sind, sind sie somit ebenfalls Jordansche Nullmengen. Damit kommen wir schließlich zu den schon vor einiger Zeit angekündigten geometrischen Eigenschaften des n-dimensionalen Riemann- Integrals, und wollen auch hierfür eine kleine Hilfsbeobachtung vorausschicken. Gegeben seien zwei nicht ausgeartete Quader Q, Q R n mit Q Q. Schreiben wir dann Q = [a, b] und Q = [c, d] mit a, b, c, d R n so haben wir bereits früher gesehen das a k c k < d k b k für jedes 1 k n gilt. Weiter sei eine Zerlegung α von Q gegeben. Sei 1 k n und schreibe α k = (t k,..., t k,rk ). Dann definieren wir eine Zerlegung αk des Intervalls [a k, b k ] wie folgt: 1. Ist a k < c k < d k < b k, so sei α k := (a k, t k,..., t k,rk, b k ) und für 1 j r k setzen wir φ k (j) := j + 1. Ist dann α k = (t k,..., t k,r k +2 ), so gilt [t k,j 1, t kj ] = [t k,φ k (j) 1, t k,φ k (j) ] für jedes 1 j r k. 2. Ist a k = c k < d k < b k, so sei α k := (t k,..., t k,rk, b k ) und für 1 j r k setzen wir φ k (j) := j. Dann erfüllt φ k wieder die im ersten Fall beschriebene Eigenschaft. 3. Ist a k < c k < d k = b k, so sei α k := (a k, t k,..., t k,rk ) und für 1 j r k setzen wir φ k (j) := j +1. Dann erfüllt φ k erneut die im ersten Fall beschriebene Eigenschaft. 4. Ist a k = c k < d k = b k, so sei α k := α k und für 1 j r k setzen wir φ k (j) := j. Dann erfüllt φ k ein weiteres Mal die im ersten Fall beschriebene Eigenschaft. Diese Konstruktion definiert uns eine Zerlegung α := (α k ) 1 k n von Q und eine injektive Abbildung φ : I α I α ; j (φ k (j k )) 1 k n mit Q α,j = Q α,φ(j) für jedes j I α. Für j I α \φ(i α ) ist dagegen Q α,j Q Q ein ausgearteter Quader. In diesem Sinne können wir jede Zerlegung von Q zu einer Zerlegung von Q ergänzen. Es gilt auch eine gewisse Umkehrung dieser Tatsache. Angenommen wir haben eine beliebige Zerlegung α von Q und Q ist eine Vereinigung von Teilquadern dieser 9

91 Mathematik für Physiker III, WS 212/213 Dienstag Zerlegung, d.h. es gibt eine Menge J I α mit Q = j J Q α,j. Für jedes j I α \J ist dann Q α,j Q Q, denn andernfalls würde Q α,j einen der Quader Q α,k mit k J in einem inneren Punkt schneiden. Weiter definieren die Quader Q α,j mit j J eine Zerlegung α Q von Q für die es eine bijektive Abbildung φ : I α Q J mit Q α Q,j = Q α,φ(j) für jedes j I α Q gibt. Damit können wir jetzt die geometrischen Grundeigenschaften des Riemann-Integrals herleiten. Lemma 4.7 (Geometrische Grundeigenschaften des Riemann-Integrals) Seien n N mit n 1, Q R n ein nicht ausgearteter Quader und f : Q R eine beschränkte Funktion. (a) Ist Q Q ein weiterer nicht-ausgearteter Quader und gilt f(x) = für alle x Q\Q, so ist f genau dann Riemann-integrierbar wenn f Q Riemann-integrierbar ist und in diesem Fall gilt Q f = Q (f Q ). (b) Ist f Riemann-integrierbar und ist Q Q ein weiterer nicht-ausgearteter Quader, so ist auch f Q Riemann-integrierbar. (c) Sind Q 1, Q 2 Q zwei nicht ausgeartete Quader mit Q = Q 1 Q 2 und ist Q 1 Q 2 ausgeartet, so ist f genau dann Riemann-integrierbar wenn f Q 1 und f Q 2 beide Riemann-integrierbar sind. In diesem Fall gilt f = Q (f Q 1 ) + Q 1 (f Q 2 ). Q 2 Beweis: (a) Wir haben bereits gesehen das der Rand N := Q eine Jordansche Nullmenge ist. Da f auf N von Null verschieden sein kann, führen wir die wieder beschränkte Hilfsfunktion { f(x), x / N, g : Q R; x, x N ein. Dann ist g(x) = für alle x Q\(Q ). Sei α eine Zerlegung von Q und definiere die Zerlegung α von Q und die Abbildung φ : I α I α wie oben. Für jedes j I α \φ(i α ) gilt dann Q α,j (Q ) =, also g(x) = für alle x Q α,j, und somit sind auch m α,j(g) = M α,j(g) =. Für jedes j I α haben wir dagegen m α,j (g Q ) = inf g(x) = inf g(x) = m α x Q x Q,φ(j)(g) α,j α,φ(j) und analog M α,j (g Q ) = M α,φ(j)(g). Für die zugehörigen Unter- und Obersummen folgt S(g; α ) = j I α m α,j(g) vol(q α,j) = j I α m α,j (g Q ) vol(q α,j) = S(g Q ; α) 91

92 Mathematik für Physiker III, WS 212/213 Dienstag und analog S(g; α ) = S(g Q ). Damit haben wir S(g Q ; α) = S(g; α ) g und S(g Q ; α) = S(g; α ) Da dies für jede Zerlegung α von Q gilt, sind somit (g Q ) g und (g Q ) Q Q Q Q Sei nun umgekehrt α eine Zerlegung von Q. Wir haben bereits früher eingesehen, dass es eine Zerlegung β von Q mit Q = Q β,i für ein i I β gibt, und schließlich wählen wir eine gemeinsame Verfeinerung γ von α und β, also eine Zerlegung γ von Q mit γ α und γ β. Nach Lemma 1.(a) gelten dann S(g; α) S(g; γ) und S(g; α) S(g; γ). Da Q = Q β,i wegen β γ eine Vereinigung von Teilquadern der Zerlegung γ ist, haben wir wie eingangs gesehen eine Zerlegung γ Q von Q und eine Bijektion φ : I γ Q J mit Q γ Q,j = Q γ,φ(j) für jedes j I γ Q. Außerdem gilt für alle j I γ \J stets Q γ,j Q N. Genau wie in der obigen Überlegung folgen hieraus S(g; γ) = S(g Q ; γ Q ) (g Q ) und S(g; γ) = S(g Q ; γ Q ) Q (g Q ) Q also insgesamt S(g; α) S(g; γ) (g Q ) und S(g; α) S(g; γ) Q (g Q ). Q Da dies für jede Zerlegung α von Q gilt, haben wir somit g (g Q ) und g (g Q ), Q Q Q Q also zusammengenommen mit den oben bewiesenen Abschätzungen g = (g Q ) und g = (g Q ). Q Q Q Q Damit ergibt Lemma 6.(d) die Äquivalenzen f ist Riemann-integrierbar g ist Riemann-integrierbar g = g 92 Q Q Q g. (g Q ) = (g Q ) Q Q Q g. g Q ist Riemann-integrierbar f Q ist Riemann-integrierbar

93 Mathematik für Physiker III, WS 212/213 Dienstag und in diesem Fall gilt Q f = Q g = (g Q ) = Q (f Q ). Q (b) Wir wissen bereits das die charakteristische Funktion χ Q : Q R Riemannintegrierbar ist, also ist nach Lemma 5.(b) auch f χ Q Riemann-integrierbar. Da für alle x Q\Q stets f(x)χ Q (x) = gilt, ergibt (a) jetzt auch die Riemann-Integrierbarkeit von f Q = (fχ Q ) Q. (c) Ist f Riemann-integrierbar, so sind auch f Q 1 und f Q 2 nach (b) beide Riemannintegrierbar. Nun setze umgekehrt voraus das f Q 1 und f Q 2 Riemann-integrierbar sind. Sei k {1, 2} und betrachte die Funktion f k := fχ Qk : Q R. Für x Q\Q k ist dann f k (x) = f(x)χ Qk (x) = und f k Q k = f Q k ist Riemann-integrierbar, d.h. nach (a) ist auch f k Riemann-integrierbar mit f k = (f k Q k ) = (f Q k ). Q Q k Q k Nach Lemma 5.(a) ist jetzt auch f 1 + f 2 Riemann-integrierbar mit (f 1 + f 2 ) = f 1 + f 2 = (f Q 1 ) + (f Q 2 ). Q Q Q Q 1 Q 2 Da N := Q 1 Q 2 ausgeartet ist, ist N eine Jordansche Nullmenge und für alle x Q\N ist f(x) = f 1 (x) + f 2 (x), also ist nach Lemma 6.(d) auch die Funktion f Riemannintegrierbar mit f = (f 1 + f 2 ) = (f Q 1 ) + (f Q 2 ). Q Q Q 1 Q Der Satz von Fubini Im vorigen Abschnitt haben wir das n-dimensionale Riemann-Integral definiert und eine ganze Reihe seiner grundlegenden Eigenschaften bewiesen. Bisher konnten wir aber nur ein einziges Beispiel wirklich berechnen, hatten wir einen nicht ausgearteten Quader Q R n und einen weiteren Quader A Q, so hatten wir gesehen das die charakteristische Funktion χ A : Q R Riemann-integrierbar ist mit χ A (x) dx = vol(a). Q Im diesen Abschnitt wollen wir jetzt eine Methode zur Berechnung n-dimensionaler Riemann-Integrale entwickeln. Bevor wir dabei den allgemeinen Satz aussprechen wollen wir zwei kleine Beispiele behandeln, um die Methode einmal zu demonstrieren. 93

94 Mathematik für Physiker III, WS 212/213 Freitag Angenommen wir haben einen nicht ausgearteten Quader Q = [a, b] R n und eine stetige Funktion f : Q R. Der allgemeine Satz wird auch auf etwas allgemeinere Funktionen anwendbar sein, für unsere Beispiele reichen uns aber stetige Integranden. Nach Satz 4 ist die Funktion f Riemann-integrierbar, es gibt also ein Integral f(x) dx. Es stellt sich heraus, dass man dieses durch koordinatenweises Ausintegrieren bestimmen kann. Die Formel Q ist Q f(x 1,..., x n ) d(x 1,..., x n ) = b1 b2 a 1 a 2 bn a n f(x 1,..., x n ) dx n... dx 2 dx 1, das n-dimensionale Integral wird also auf n sukzessive zu berechnende eindimensionale Integrale zurückgeführt. Nehmen wir als konkretes Beispiel Q = [, 2] [2, 3] und f(x, y) = x 2 + 2xy 2. Wir rechnen Q (x 2 + 2xy 2 ) d(x, y) = (x 2 + 2xy 2 ) dx dy = 3 2 ( ) y2 dy = ( ) = 84 3 = 28. Behandeln wir noch ein zweites, etwas komplizierteres, Beispiel nämlich f(x, y) = cos(xy) auf Q = [, π] 2. Es ist [,π] 2 cos(xy) d(x, y) = π π cos(xy) dx dy = = π π sin(πy) y sin(xy) y dy = π dy π 2 wobei Si den in II. 2.5 eingeführten Integralsinus bezeichnet, also Si(x) = x sin t t dt = n= ( 1) n (2n + 1) 2 (2n)! x2n+1. sin t t dt = Si(π 2 ), Vorlesung 1, Freitag Am Ende der letzten Sitzung hatten wir endlich eine erste Methode zur Berechnung n- dimensionaler Riemann-Integrale eingeführt, man konnte diese koordinatenweise ausintegrieren, also zum Beispiel mit Q := [, π] [, π/2] [, 1] Q (z cos y + y sin(x + z)) d(x, y, z) = π π/ (z cos y + y sin(x + z)) dz dy dx.

95 Mathematik für Physiker III, WS 212/213 Freitag Dieses Integral wird dann dimensionsweise ausgewertet, zuerst wird z ausintegriert 1 (z cos y + y sin(x + z)) dz = cos y 1 2 z2 y cos(x + z) = 1 cos y + y cos x y cos(x + 1) 2 also eingesetzt (z cos y +y sin(x+z)) d(x, y, z) = Q π π/2 Im nächsten Schritt führen wir die Integration nach y durch π/2 ( ) 1 cos y + y cos x y cos(x + 1) dy 2 = 1 2 sin y + cos x 2 y2 also (z cos y + y sin(x + z)) d(x, y, z) = Q ( ) 1 cos y + y cos x y cos(x + 1) dy dx. 2 cos(x + 1) π/2 y 2 = π2 π2 cos x cos(x + 1) 8 8 π ( ) π2 π2 cos x cos(x + 1) dx, 8 8 und schließlich kommen wir zur letzten Dimension x π ( 1 (z cos y + y sin(x + z)) d(x, y, z) = Q 2 + π2 π2 cos x 8 8 = π ( 2 + π2 π) sin x sin(x + 1) 8 = ) cos(x + 1) dx π2 + π2 4 sin(1). Tatsächlich kann man dieses Beispiel noch etwas schneller berechnen. Oftmals ist der Integrand in separierter Form, d.h. er ist ein Produkt von Funktionen die jeweils nur von einer der Variablen abhängen f(x 1,..., x n ) = f 1 (x 1 )... f n (x n ) mit, sagen wir, stetigen Funktionen f 1,..., f n. In jeder der dann auszuführenden Integrationen ist nur einer der Terme wirklich zu integrieren und die restlichen können als Konstanten aufgefasst werden, d.h. ( b1 ) ( bn ) f(x 1,..., x n ) d(x 1,..., x n ) = f 1 (x) dx... f n (x) dx. [a,b] a n Dabei schreiben wir die Integrationsvariablen auf der rechten Seite alle als x statt x 1,..., x n, die Integrationsvariable hat ja eine rein symbolische Bedeutung und kann völlig willkürlich umbenannt werden. Zum Beispiel ist damit ( π 2 π ( ) π 2 2 xy sin z d(x, y, z) = x dx) sin x dx = 2 = π4 [,π] a 1

96 Mathematik für Physiker III, WS 212/213 Freitag Kombiniert man diese Beobachtung mit der Linearität des Integrals, so kann man auch Summen separierter Ausdrücke auf diese Weise behandeln, beispielsweise unser schon in der letzten Sitzung gerechnetes Beispiel (x 2 + 2xy 2 ) d(x, y) = x 2 d(x, y) + 2xy 2 d(x, y) [,2] [2,3] = 2 [,2] [2,3] ( 2 x 2 dx + 2 ) x dx [,2] [2,3] ( 3 ) x 2 dx 2 = = 28. Gelegentlich kann der Integrand auch zunächst in separierte Form umgeformt werden, zum Beispiel ist z cos y + y sin(x + z) = z cos y + y sin x cos z + y cos x sin z, also wieder mit Q = [, π] [, π/2] [, 1] ( ) π/2 ( 1 (z cos y + y sin(x + z)) d(x, y, z) = π cos x dx Q ( ) π/2 (( π + x dx ) ( 1 sin x dx cos x dx ) x dx ) ( π ) ( 1 + cos x dx )) sin x dx = π 2 + π2 4 sin(1). Das π im ersten Summanden entsteht dabei durch die Integration nach x, man muss sich z cos y als 1 cos y z denken wobei 1 für die Funktion konstant 1 in x steht. Dies ist erneut dasselbe Ergebnis wie in unserer ersten Berechnung dieses Integrals. Zum Abschluß dieses Abschnitts wollen wir jetzt beweisen, dass dieses koordinatenweise Ausintegrieren tatsächlich das Integral berechnet. Der hierfür zuständige Satz ist der Satz von Fubini für das Riemann-Integral. Der originale Satz von Fubini bezieht sich eigentlich auf das sogenannte Lebesgue-Integral, das wir in dieser Vorlesung nicht behandeln wollen. Es hat sich aber eingebürgert sämtliche Fubini-artigen Sätze als Satz von Fubini für den jeweiligen Integraltyp zu bezeichnen. Der volle Satz von Fubini ist etwas allgemeiner als unsere bisherigen Beispiele, zum einen muss die zu integrierende Funktion nicht unbedingt stetig sein und zum anderen können die einzelnen Variablen auch gruppenweise ausintegriert werden, es gelten also zum Beispiel, unter geeigneten Voraussetzungen, Formeln wie b ( ) f(x, y, z) d(x, y, z) = f(x, y, z) d(y, z) dx a Q [a,b] Q oder gar f(x, y, u, v) d(x, y, u, v) = Q 1 Q 2 Q 1 96 ( ) f(x, y, u, v) d(u, v) d(x, y). Q 2

97 Mathematik für Physiker III, WS 212/213 Freitag Wie schon so häufig beginnen wir mit einer kleinen Vorbemerkung. Angenommen wir haben zwei nicht ausgeartete Quader Q R n und Q R m. Schon im vorigen Abschnitt haben wir gesehen, dass dann das cartesische Produkt Q := Q Q R n+m wieder ein nicht ausgearteter Quader ist. Nehme weiter an wir hätten eine Zerlegung α von Q und eine Zerlegung α von Q. Wir behaupten dass dann α := α α := (α, α ) eine Zerlegung von Q ist. Hierzu schreiben wir Q = [a, b ] mit a, b R n und Q = [a, b ] mit a, b R m. Dann ist Q = [a, b] mit a := (a, a ) R n+m und b := (b, b ) R n+m. Für jedes 1 k n ist α k = α k = (t k,..., t k,r eine Zerlegung k) des Intervalls [a k, b k ] = [a k, b k ] und für jedes n + 1 k n + m ist auch α k = α k n = (t k n,,..., t k n,r ) eine Zerlegung des Intervalls [a k n n k, b n k ] = [a k, b k ], d.h. α ist tatsächlich eine Zerlegung von Q. Die Feinheit von α ist dabei gegeben als δ(α) = { } max δ(α k) = max max 1 k n+m 1 k n δ(α k), max 1 k m δ(α k) = max{δ(α ), δ(α )}. Die Indexmenge der Zerlegung α ist weiter gegeben als I α = n {1,..., r k} k=1 m {1,..., r k} = I α I α k=1 und für alle j = (j, j ) I α I α = I α gilt [( ) ( )] Q α,j = (t j i 1) 1 i n, (t j i 1 i m, (t j ) 1 i n, (t i j i 1 i m = [(t j i 1) 1 i n, (t j ) 1 i n] [(t i j i 1 i m, (t j 1 i m] i = Q α,j Q α,j. Diese Konstruktion kann man dann weiter auf Zerteilungen ausdehnen. Angenommen wir haben eine Zerteilung ζ = (α, s ) von Q und eine Zerteilung ζ = (α, s ) von Q. Wir setzen wieder α := α α. Für jedes j = (j, j ) I α I α = I α ist dann s j := (s j, s j ) Q α,j Q α,j = Q α,j, und somit ist eine Zerteilung von Q mit ζ := ζ ζ := (α, (s j ) j Iα ) δ(ζ) = δ(α) = max{δ(α ), δ(α )} = max{δ(ζ ), δ(ζ )}. Nach diesem Vorbemerkungen können wir nun zum Satz von Fubini kommen. 97

98 Mathematik für Physiker III, WS 212/213 Freitag Satz 4.8 (Der Satz von Fubini für das Riemann-Integral) Seien n, m N mit n, m 1 und seien Q R n und Q R m nicht ausgeartete Quader. Weiter sei Q := Q Q R n+m und sei f : Q R eine Riemann-integrierbare Funktion. Für jedes y Q sei die Funktion f y : Q R; x f(x, y) Riemann-integrierbar. Dann ist auch die Funktion F : Q R; y f y = Q f(x, y) dx Q Riemann-integrierbar und es gilt f(x, y) d(x, y) = Q F (y) dy = Q Q Q f(x, y) dx dy. Beweis: Wir setzen A := f(x, y) d(x, y). Um zu zeigen, dass F Riemann-integrierbar Q mit F = f = A ist, ist nach Satz 2 zu zeigen, dass es für jedes ɛ > stets ein Q Q δ > mit R(F ; ζ ) A < ɛ für jede Zerteilung ζ von Q mit δ(ζ ) < δ gibt. Sei also ɛ > gegeben. Da die Funktion f als Riemann-integrierbar vorausgesetzt ist, gibt es nach Satz 2 ein δ > so, dass für jede Zerteilung ζ von Q mit δ(ζ) < δ stets R(f; ζ) A < ɛ/2 gilt. Sei jetzt eine Zerteilung ζ = (α, s ) von Q mit δ(ζ ) < δ gegeben. Sei j I α. Dann ist die Funktion f s Riemann-integrierbar mit j F (s j ) = Q f s j, also gibt es erneut nach Satz 2 ein δ j > mit R(f s j ; ζ ) F (s j ) < ɛ 2 vol(q ) für jede Zerteilung ζ von Q mit δ(ζ ) < δ j. Wähle jetzt eine Zerlegung α von Q mit δ(α ) < min ({δ} {δ j j I α }). Weiter wähle für jedes j I α ein s j Q α,j. Dann erhalten wir eine Zerteilung ζ := (α, (s j ) j I α ) von Q mit δ(ζ ) = δ(α ). Für jedes j I α gilt dann δ(ζ ) < δ j und wir haben j I α f(s j, s j ) vol(q α,j ) F (s j ) = 98 j I α f s j (s j ) vol(q α,j ) F (s = R(f s j ; ζ ) F (s j ) < j ) ɛ 2 vol(q ).

99 Mathematik für Physiker III, WS 212/213 Freitag Schließlich bilden wir noch die Zerteilung ζ := ζ ζ von Q. Dann ist auch δ(ζ) = max{δ(ζ ), δ(ζ )} < δ. Nach Wahl von δ haben wir also R(f; ζ) A < ɛ/2. Diese Riemannsumme berechnet sich zu R(f; ζ) = j I α,j I α f(s j, s j ) vol(q α,j Q α,j ) = j I α j I α f(s j, s j ) vol(q α,j ) vol(q α,j ) und vergleichen wir diese mit der entsprechenden Riemannsumme der Funktion F, so erhalten wir R(f; ζ) R(F ; ζ ) = f(s j, s j ) vol(q α,j ) vol(q α,j ) F (s j ) vol(q α,j ) j I α j I α j I α f(s j, s j j I α ) vol(q α,j ) F (s j ) j I α vol(q α,j ) ɛ < 2 vol(q ) vol(q α,j ) = ɛ 2. Insgesamt ist damit j I α R(F ; ζ ) A R(f; ζ) A + R(f; ζ) R(F ; ζ ) < ɛ 2 + ɛ 2 = ɛ. Wie schon eingangs festgestellt ergibt Satz 2 jetzt die Behauptung des Satzes. In der Formulierung des Satzes wird zwar nur der Fall erfasst das zuerst nach den vorderen n Variablen und dann nach den hinteren m Variablen integriert wird, dies ist aber keine echte Einschränkung. Schon im vorigen Abschnitt hatten wir bemerkt das die Integrationsvariablen umgeordnet werden können, und damit ist auch die Aufteilung der Integration in zwei beliebige Variablengruppen möglich. Um auch mehrfach geschachtelte Integrale zu erfassen, wenden wir den Satz von Fubini iteriert an, so ergibt sich die Gültigkeit der in den Beispielen verwendeten Rechentechnik. Wollen wir dabei nicht die Stetigkeit des Integranden voraussetzen, so reicht es zu fordern das die gesamte Funktion Riemann-integrierbar ist und das alle (n 1) inneren Integrale existieren. Die Existenz des äußersten Integrals folgt dann. Zum Abschluß dieses Themas wollen wir nur noch anmerken dass die Riemann- Integrierbarkeit der Funktionen f y für y Q im Satz von Fubini tatsächlich vorausgesetzt werden muss und nicht etwa aus der Riemann-Integrierbarkeit von f folgt. 99

100 Mathematik für Physiker III, WS 212/213 Freitag Nach Lemma 6.(d) kann eine Riemann-integrierbare Funktion auf einer Jordanschen Nullmenge beliebig verändert werden ohne ihre Riemann-Integrierbarkeit zu verlieren. Wählen wir also irgendeine nicht Riemann-integrierbare, beschränkte Funktion h : [, 1] R, etwa h = χ Q, so ist { h(x), y =, f : [, 1] [, 1] R; (x, y), y eine Riemann-integrierbare Funktion, aber f = h ist nicht mehr Riemann-integrierbar. 4.3 Jordan-meßbare Mengen Zu Beginn dieses Kapitels hatten wir bereits angemerkt das wir das n-dimensionale Riemann-Integral in zwei Schritten konstruieren wollen, zunächst betrachten wir die Integration über nicht ausgeartete Quader und in einem zweiten Schritt wird dies dann zur Integration über allgemeinere Mengen ausgedehnt. Die Integration über Quader haben wir in den vorigen beiden Abschnitten recht vollständig behandelt, nun kommen wir zu allgemeineren Integrationsbereichen. Ganz beliebige Mengen können wir allerdings nicht verwenden, was wir brauchen sind die sogenannten Jordan-meßbaren Teilmengen des R n. Wir führen diesen Begriff auf den bereits etablierten Integralbegriff zurück. Definition 4.9: Seien n N mit n 1 und eine beschränkte Menge M R n gegeben. Die Menge M heißt dann Jordan-meßbar wenn es einen nicht ausgearteten Quader Q R n mit M Q gibt so, dass die charakteristische Funktion { 1, x M, χ M : Q R; x, x / M Riemann-integrierbar ist. In diesem Fall definieren wir das Volumen der Menge M als vol(m) := χ M. Q Ist M R n selbst ein nicht ausgearteter Quader, so können wir Q = M verwenden und nach einem schon früher behandelten Beispiel ist M Jordan-meßbar und das hier definierte Volumen von M stimmt mit unserer Volumendefinition für Quader überein. Bevor wir weiter auf die Jordan-meßbaren Mengen eingehen, wollen wir uns zunächst einmal davon überzeugen das diese ihren Zweck erfüllen, sich also als Integrationsbereiche verwenden lassen. Wir müssen uns also eine Jordan-meßbare Mengen M R n und eine beschränkte Funktion f : M R vorgeben und dann definieren was die Riemann-Integrierbarkeit von f bedeutet und bei vorliegender Integrierbarkeit müssen wir auch noch sagen was dann das Integral f ist. Die hierbei verwendete Idee ist M einfach, wir wählen einen M umfassenden, nicht ausgearteten, Quader Q und setzen 1

101 Mathematik für Physiker III, WS 212/213 Freitag die Funktion f durch Null zu einer auf ganz Q definierten Funktion fort. Wir müssen uns anschließend dann natürlich überlegen das alles vom speziell gewählten Quader Q unabhängig ist, aber dies wird keine große Schwierigkeit sein. Definition 4.1: Seien n N mit n 1, M R n eine Jordan-meßbare Menge und f : M R eine beschränkte Funktion. Wähle einen nicht ausgearteten Quader Q R n mit M Q und definiere die fortgesetzte Funktion f : Q R; x { f(x), x M,, x / M. Dann heißt f Riemann-integrierbar wenn die Funktion f Riemann-integrierbar ist, und in diesem Fall definieren wir das Integral von f über M als M f := Q f. Zu dieser Definition sind einige Anmerkungen notwendig. Wir schauen zunächst das die eben eingeführten Begriffe vom speziell gewählten Quader Q unabhängig sind. Wir geben uns also eine Jordan-meßbare Menge M R n und zwei nicht ausgeartete Quader Q 1, Q 2 R n mit M Q 1 und M Q 2 vor. Weiter sei f : M R eine beschränkte Funktion. Für k = 1, 2 haben wir dann die auf Q k fortgesetzte Funktion f k : Q k R und wir nehmen weiter an, dass f 1 Riemann-integrierbar ist. Wir wollen uns überlegen das dies dann auch auf Q 2 zutrifft. Hierzu wählen wir einen dritten nicht ausgearteten Quader Q R n mit Q 1, Q 2 Q und betrachten auch die auf Q fortgesetzte Funktion f : Q R. Sind k {1, 2} und x Q\Q k, so ist wegen M Q k auch x / M und somit f(x) =. Damit können wir Lemma 7.(a) anwenden und erhalten wegen f Q 1 = f 1 das auch f auf Q Riemann-integrierbar ist mit Q f = f1. Q Da andererseits auch f Q 2 = f 2 gilt ist wieder nach Lemma 7.(a) auch f 2 Riemannintegrierbar mit Q Q Q f2 = f = f1. 11

102 Mathematik für Physiker III, WS 212/213 Freitag Damit haben wir eingesehen das unsere Definition tatsächlich vom speziell gewählten Quader Q unabhängig ist, und somit überhaupt sinnvoll ist. Wie im Quaderfall schreiben wir das Integral über M alternativ auch in der Form f = f(x) dx = f(x 1,..., x n ) d(x 1,..., x n ). M M M Wir wollen uns jetzt weiter den Zusammenhang zwischen unserer Integraldefinition und dem Volumen klarmachen. Sei also M R n wieder eine Jordan-meßbare Menge und wähle einen nicht ausgearteten Quader Q R n mit M Q für den die charakteristische Funktion χ M : Q R Riemann-integrierbar ist. Betrachten wir dann auf M die Funktion konstant 1, so setzt sich diese zur charakteristischen Funktion 1 = χ M : Q R fort, d.h. die Funktion konstant 1 ist auf M Riemann-integrierbar mit dx = χ M = vol(q). M Q Insbesondere folgen damit das auch die Definition der Jordan-meßbaren Mengen M und ihres Volumens vom speziell gewählten nicht ausgearteten Quader Q R n mit M Q unabhängig sind. Oftmals ist die zu integrierende Funktion f nicht nur auf dem Integrationsbereich M definiert sondern auf eine Obermenge U M. Wir nennen f dann über M Riemannintegrierbar wenn die Einschränkung f M Riemann-integrierbar ist und schreiben dann M f := M (f M). Das nächste Lemma stellt jetzt zwei wichtige Eigenschaften dieses Begriffs zusammen. Lemma 4.9 (Riemann-Integrierbarkeit über eine Teilmenge) Seien n N mit n 1, Q R n ein nicht ausgearteter Quader, M Q eine Jordanmeßbare Menge und f : Q R eine beschränkte Funktion. : Q R Riemann- (a) Genau dann ist f über M Riemann-integrierbar wenn fχ M integrierbar ist und in diesem Fall gilt f(x) dx = f(x)χ M (x) dx. M Q (b) Ist f Riemann-integrierbar so ist f auch über M Riemann-integrierbar. Beweis: Für alle x Q ist im Fall x M stets f M(x) = f(x) = f(x)χ M (x) und im Fall x / M haben wir ebenfalls f M(x) = = f(x)χ M (x). Folglich gilt f M = fχ M. 12

103 Mathematik für Physiker III, WS 212/213 Freitag (a) Nach unseren Definition ist f genau dann über M Riemann-integrierbar wenn f M Riemann-integrierbar ist, also wenn f M = fχ M Riemann-integrierbar ist, und in diesem Fall gilt f = (f M) = f M = fχ M. M M (b) Da M eine Jordan-meßbare Menge ist, ist χ M : Q R Riemann-integrierbar und nach Lemma 5.(b) ist damit auch fχ M Riemann-integrierbar, d.h. nach (a) ist f über M Riemann-integrierbar. Q Q Bevor wir zur Theorie Jordan-meßbarer Mengen kommen wollen wir uns ein Paar Beispiele anschauen. Das einzige Problem hierzu ist, dass wir bisher außer den Quadern keine Beispiele Jordan-meßbarer Mengen kennen, wir wissen beispielsweise noch nicht einmal das Kugeln Jordan-meßbar sind. Diesem Zustand wollen wir jetzt abhelfen. Angenommen wir haben eine beschränkte Menge M R n und einen nicht ausgearteten Quader Q R n mit M Q. Wir brauchen ein möglichst gut handhabbares, hinreichendes Kriterium für die Riemann-Integrierbarkeit der charakteristischen Funktion χ M : Q R. Unser einziger allgemeiner Satz die Integrierbarkeit einer Funktion festzustellen ist Satz 4 über die Integrierbarkeit stetiger Funktionen. Leider ist die Funktion χ M für M niemals stetig. Sie ist aber auch nicht allzu unstetig, wir können uns genau überlegen in welchen Punkten sie nicht stetig ist. Wir benötigen hierzu den Begriff ds Randes einer Menge aus II Dieser war definiert als M := M\M, also gilt für x R n x M (ɛ > ) : B ɛ (x) M B ɛ (x) M. Nach II. 4.Lemma 18.(c) ist der R n dann die disjunkte Vereinigung R n = M (R n \M) ( M) und verwenden wir weiter das nach II. 4.Lemma 17.(a) auch R n \M = (R n \M) gilt, so ist jeder Punkt x R n des R n also entweder ein innerer Punkt von M, ein innerer Punkt des Komplements von M oder ein Randpunkt von M. Ist dabei x ein innerer Punkt von M oder ein innerer Punkt von R n \M, so ist die charakteristische Funktion χ M auf einer Umgebung von x konstant, d.h. χ M ist im Punkt x stetig. Ist dagegen x M, so enthält jede Umgebung U von x sowohl Punkte y M als auch Punkte y / M, d.h. χ M nimmt auf U beide Werte und 1 an. Damit kann χ M in x nicht stetig sein. Dies zeigt χ M ist nicht stetig in x x M. Unseren Satz über die Riemann-Integrierbarkeit stetiger Funktionen können wir jetzt ausdehnen auf Funktionen die in allen Punkten außerhalb einer Jordanschen Nullmenge stetig sind. Lemma 4.1 (Fast überall stetige Funktionen sind Riemann-integrierbar) Seien n N mit n 1, Q R n ein nicht ausgearteter Quader und N R n eine 13

104 Mathematik für Physiker III, WS 212/213 Freitag Jordansche Nullmenge. Ist dann f : Q R eine beschränkte Funktion die in jedem Punkt x Q\N stetig ist, so ist f auch Riemann-integrierbar. Beweis: Sei ɛ > gegeben. Da f beschränkt ist, gibt es eine Konstante A > mit f(x) A für jedes x Q. Nach Lemma 6.(a) ist auch Q N eine Jordansche Nullmenge also gibt es nach Lemma 6.(c) eine Zerlegung α von Q mit j I α Q α,j N vol(q α,j ) = j I α Q α,j Q N vol(q α,j ) < Setzen wir J := {j I α Q α,j N }, so ist die Menge C := j I α\j Q α,j ɛ 4A. als endliche Vereinigung kompakter Mengen selbst kompakt. Für jedes x I α \J ist Q α,j N = also ist C Q\N und insbesondere ist f in jedem Punkt von C stetig. Nach Lemma 3 existiert ein δ > so, dass für alle x, y C mit x y < δ stets f(x) f(y) < ɛ/(2 vol(q)) gilt. Wähle jetzt eine Zerlegung β von Q mit β α sowie δ(β) < δ und setze J := {j I β (k J ) : Q β,j Q α,k }. Sei jetzt j I β \J. Wegen β α existiert dann ein k I α \J mit Q β,j Q α,k C. Sind x, y Q β,j, so liegen x i, y i für jedes 1 i n in einem der Teilintervalle der Zerlegung β i, also ist x i y i δ(β i ) δ(β) und somit haben wir x y δ(β) < δ also auch f(x) f(y) < ɛ/(2 vol(q)). Dies zeigt (f; Q β,j ) = Addition all dieser Ungleichungen liefert (f; Q β,j ) vol(q β,j ) j I β \J sup f(x) f(y) x,y Q β,j ɛ 2 vol(q) j I β \J ɛ 2 vol(q). vol(q β,j ) ɛ 2. Ist dagegen j J, so haben wir f(x) f(y) 2A für alle x, y Q β,j, also ist (f; Q β,j ) 2A und somit wieder wegen β α vol(q β,j ) = 2A vol(q α,j ) < ɛ 2. j J j J (f; Q β,j ) vol(q β,j ) 2A j J Nach Lemma 1.(f) ist damit insgesamt S(f; β) S(f; β) = j I β (f; Q β,j ) vol(q β,j ) = j I β \J (f; Q β,j ) vol(q β,j ) + j J (f; Q β,j ) vol(q β,j ) < ɛ. 14

105 Mathematik für Physiker III, WS 212/213 Freitag Nach Satz 2 ist f Riemann-integrierbar. Damit können wir jetzt das Beispiel der Kugeln behandeln. Seien also z R n der Mittelpunkt unserer Kugel und r > ihr Radius. Wir behaupten das die euklidische Kugel B := B r (z) R n Jordan-meßbar ist. Um dies einzusehen definieren wir zunächst den nicht ausgearteten Quader Q := n [z k r, z k + r] k=1 mit B Q. Dann ist die charakteristische Funktion χ B in jedem Punkt x Q\ B stetig und der Rand B ist eine euklidische Sphäre von der wir bereits wissen das sie eine Jordansche Nullmenge ist. Nach Lemma 1 ist χ B : Q R damit Riemannintegrierbar, d.h. B ist eine Jordan-meßbare Menge. Wir betrachten jetzt konkret den zweidimensionalen Fall n = 2 und schreiben z = (a, b). Wir wollen einmal die Fläche vol(b r (z)) = χ B (x, y) d(x, y) berechnen. Rechnen wir dies mit dem Satz von Fubini, so wird vol(b r (z)) = b+r a+r b r a r Q b+r χ B (x, y) dx dy = 2 r2 (y b) 2 dy. b r Substituieren wir wie üblich y = b + r sin φ mit π/2 φ π/2, so wird und somit b+r b r π/2 = r 2 dy dφ r2 (y b) 2 dy = r 2 π/2 π/2 also insgesamt cos 2 φ dφ = r2 2 π/2 = r cos φ = dy = r cos φ dφ π/2 π/2 1 sin 2 φ cos φ dφ (1 + cos(2φ)) dφ = r2 2 vol(b r (z)) = πr 2, ( π + sin(2φ) 2 π/2 π/2 ) = πr2 2, wie natürlich zu erwarten war. Das Volumen der dreidimensionalen Kugel könnten wir jetzt analog berechnen, in der nächsten Sitzung werden wir aber einen besser handhabbaren Rechenweg hierfür kennenlernen. Tatsächlich kann man auch das Volumen einer n-dimensionalen Kugel für eine allgemeine Dimension n N ausrechnen, wir wollen 15

106 Mathematik für Physiker III, WS 212/213 Dienstag uns aber auf die beiden kleinen Dimensionen n = 2 und n = 3 beschränken. In Aufgabe (23) wird dann auch noch der vierdimensionale Fall n = 4 behandelt. Vorlesung 11, Dienstag In der letzten Sitzung hatten wir schließlich das n-dimensionale Riemann-Integral auch auf die Integration von Funktionen f : M R die auf einer Jordan-meßbaren Teilmenge M R n definiert sind ausgedehnt. Hierzu hatten wir diese Integrale durch Multiplikation mit der charakteristischen Funktion des Integrationsbereichs auf die Integration über einen umfassenden, nicht ausgearteten Quader zurückgeführt. Insbesondere konnten wir damit das Volumen Jordan-meßbarer Mengen M definieren, dieses war gleich dem Integral vol(m) = dx, und als ein Beispiel hatten wir bereits M nachgerechnet das die Fläche eines Kreises genau der erwartete elementargeometrische Wert ist. Der Begriff einer Jordan-meßbaren Menge hängt eng mit den schon früher eingeführten Jordanschen Nullmengen zusammen, dies hatte sich bereits bei der Besprechung der Kugeln im R n angedeutet, und wir werden diesen Zusammenhang bald vollständig klären können. Zum Einstieg wollen wir ein weiteres Beispiel rechnen. Seien r > und z = (a, b) R 2 gegeben. Wir haben bereits eingesehen das der Kreis B := B r (z) eine Jordan-meßbare Menge ist und wir wollen jetzt das Integral r x 2 d(x, y) b B berechnen. Zunächst ist B Q := [a r, a+r] [b r, b+r] und da die stetige Funktion (x, y) x 2 nach Satz 4 auf Q Riemann-integrierbar ist, ist diese nach Lemma 9 auch über B Riemann-integrierbar mit x 2 d(x, y) = x 2 χ B (x, y) d(x, y). B Q Auf dieses Integral wollen wir jetzt den Satz von Fubini Satz 8 anwenden. Denken wir uns zunächst einmal x [a r, a + r] fixiert. Für y [b r, b + r] ist dann χ B (x, y) = 1 wenn (x, y) B, also (x a) 2 + (y b) 2 r 2, ist und χ B (x, y) = sonst. Nun ist (x a) 2 + (y b) 2 r 2 x a B gleichwertig zu beziehungsweise (y b) 2 r 2 (x a) 2 y b r 2 (x a) 2 16

107 Mathematik für Physiker III, WS 212/213 Dienstag für jedes y [b r, b + r], also wird x 2 χ B (x, y) = x 2 χ [b r 2 (x a) 2,b+ r (y). 2 (x a) 2 ] Dies ist eine Treppenfunktion und damit Riemann-integrierbar mit b b x 2 χ B (x, y) dy = b b x 2 χ [b r 2 (x a) 2,b+ r (y) dy = 2x2 r 2 (x a) 2. 2 (x a) 2 ] Damit können wir jetzt den Satz von Fubini Satz 8 anwenden und erhalten a+r b+r a+r x 2 d(x, y) = x 2 χ B (x, y) dy dx = 2x 2 r 2 (x a) 2 dx. B a r b r Substituieren wir x = a+r sin t mit t π/2, so wird dx/dt = r cos t also dx = r cos t dt und somit π/2 x 2 d(x, y) = 2r 2 (a + r sin t) 2 cos 2 t dt. Nun sind π/2 π/2 π/2 π/2 π/2 also ist insgesamt B π/2 a r π/2 cos cos(2t) t dt = dt = π π/2 π/ sin(2t) 4 sin t cos 2 t dt = cos3 π/2 t 3 = und sin 2 t cos 2 t dt = 1 4 π/2 π/2 π/2 sin 2 (2t) dt = 1 4 π/2 π/2 π/2 π/2 1 cos(4t) 2 = π 2, dt = π 8, π/2 π/2 und somit 2r 2 (a + r sin t) 2 cos 2 t dt π/2 π/2 π/2 = 2r 2 a 2 cos 2 t dt + 4ar 3 sin t cos 2 t dt + 2r 4 sin 2 t cos 2 t dt π/2 B π/2 ( ) x 2 d(x, y) = πr 2 a 2 + r2. 4 π/2 = a 2 r 2 π + π 4 r4 Als letzes Beispiel wollen wir dann auch das Volumen einer dreidimensionalen Kugel berechnen. Seien also r > und z = (a, b, c) R 3 gegeben. Wir wollen das Volumen der Kugel B r (z) bestimmen, und verwenden hierfür die folgende Spezialisierung des Satzes von Fubini. 17

108 Mathematik für Physiker III, WS 212/213 Dienstag Satz 4.11 (Das Cavalieri Prinzip) Seien n, m N mit n, m 1, Q R m ein nicht ausgearteter Quader und M R n+m eine Jordan-meßbare Menge mit M R n Q. Für jedes y Q sei der Querschnitt M y := {x R n (x, y) M} R n eine Jordan-meßbare Teilmenge des R n. Dann ist die Funktion f : Q R; y vol(m y ) Riemann-integrierbar und es gilt vol(m) = Q f(y) dy. Beweis: Da die Menge M R n+m insbesondere beschränkt ist, existiert ein nicht ausgearteter Quader Q R n mit M Q Q. Da M Jordan-meßbar ist, ist die charakteristische Funktion χ M : Q Q R Riemann-integrierbar. Für jedes y Q ist M y Q und für alle x Q gilt (χ M ) y (x) = χ M (x, y) = χ My (x), d.h. (χ M ) y = χ My : Q R ist Riemann-integrierbar da M y R n nach unserer Annahme Jordan-meßbar ist. Nach dem Satz von Fubini Satz 8 ist die Funktion f : Q R; y (χ M ) y = Q χ My = vol(m y ) Q Riemann-integrierbar und es gilt vol(m) = Q Q χ M = Q f. Wie der Beweis gezeigt hat ist dies kein wirklich neuer Satz sondern nur ein ausformulierter Spezialfall des Satzes von Fubini. Insbesondere folgt das zwei Jordan-meßbare Mengen die Querschnitte gleichen Volumens haben selbst auch gleiches Volumen haben, traditionell wird diese Aussage als das Cavalieri-Prinzip bezeichnet. Wir bevorzugen es aber die im Satz formulierte quantitative Form das Cavalieri-Prinzip zu nennen. Wie angekündigt wenden wir das Cavalieri Prinzip auf unsere dreidimensionale Kugel B = B r (z) R 2 [c r, c + r] an. Für jedes z [c r, c + r] ist B z R 2 die Menge aller (x, y) R 2 mit (x a) 2 + (y b) 2 + (z c) 2 r 2 (x a) 2 + (y b) 2 r 2 (z c) 2, 18

109 Mathematik für Physiker III, WS 212/213 Dienstag d.h. B z ist ein Kreis im R 2 mit Mittelpunkt (a, b) und Radius r 2 (z c) 2. Insbesondere ist B z Jordan-meßbar mit vol(b z ) = π (r 2 (z c) 2 ). Das Cavalieri Prinzip Satz 11 liefert damit c+r ( vol(b) = π(r 2 (z c) 2 ) dz = π 2r 3 c r r r ) z 2 dz = π (2r 3 23 ) r3 = 4 3 πr3, und dies ist die wohlbekannte elementargeometrische Formel für das Kugelvolumen. Wir wollen uns jetzt einige allgemeine Tatsachen über Jordan-meßbare Mengen und den Volumenbegriff klarmachen. Da charakteristische Funktionen keine negativen Werte annehmen ist das Volumen vol(m) einer Jordan-meßbaren Menge M R n nach Lemma 5.(d) immer nichtnegativ, also vol(m). Es kann durchaus vorkommen, dass das Volumen einer nicht leeren Menge gleich Null ist, zum Beispiel tritt dies für ausgeartete Quader auf. Das folgende Lemma zeigt uns das die Jordan-meßbaren Mengen mit Volumen Null genau die schon früher eingeführten Jordanschen Nullmengen sind. Lemma 4.12 (Charakterisierung Jordanscher Nullmengen) Seien n N mit n 1 und N R n eine beschränkte Menge. Dann ist N genau dann eine Jordansche Nullmenge wenn N Jordan-meßbar mit vol(n) = ist. Beweis: Wähle einen nicht ausgearteten Quader Q R n mit N Q. = Für jedes x Q\N gilt χ N (x) =, also ist χ N nach Lemma 6.(d) Riemannintegrierbar, d.h. die Menge N ist Jordan-meßbar, mit vol(n) = χ Q N = =. Q = Sei ɛ > gegeben. Wegen χ N = χ N = vol(n) = Q Q existiert eine Zerlegung α von Q mit S(χ N ; α) < ɛ. Nach einem Beispiel des ersten Abschnitts haben wir damit auch vol(q j ) = S(χ N ; α) < ɛ. j I α N Q j Andererseits ist auch N Q j, j I α N Q j und damit ist N eine Jordansche Nullmenge. Unser Volumenbegriff erfüllt die üblichen elementargeometrischen Eigenschaften die man von einem solchen Begriff erwartet. Diese ergeben sich alle durch kleine Rechnungen mit charakteristischen Funktionen. Angenommen wir haben zwei Teilmengen 19

110 Mathematik für Physiker III, WS 212/213 Dienstag A, B R n. Für x R n ist dann entweder x A B und wir haben χ A (x) = χ B (x) = 1 und somit χ A (x) χ B (x) = 1, oder x / A B also x / A oder x / B, d.h, χ A (x) = oder χ B (x) = und in beiden Fällen ist damit χ A (x) χ B (x) =. Diese Überlegung zeigt χ A (x) χ B (x) = χ A B (x) für jedes x R n, also χ A χ B = χ A B. Insbesondere ist χ A χ B = wenn A B = ist. Weiter behaupten wir das auch χ A B + χ A B = χ A + χ B gilt. Sei hierzu x R n gegeben. Wir müssen dann vier verschiedene Fälle unterscheiden. Im Fall x / A B ist χ A B (x) = χ A B (x) = χ A (x) = χ B (x) = und unsere Behauptung ist klar. Nun nehmen wir x A B, also χ A B (x) = 1 an. Ist sogar x A B, so haben wir auch χ A B (x) = χ A (x) = χ B (x) = 1, und unsere Behauptung ist wieder klar. Nehme schließlich x / A B, also χ A B (x) = beziehungsweise χ A B (x)+χ A B (x) = 1 an. Dann gilt entweder x A, x / B oder x / A, x B, d.h. χ A (x) = 1, χ B (x) = oder χ A (x) =, χ B (x) = 1. In beiden Fällen ist χ A (x)+χ B (x) = 1 und die Behauptung ist auch in diesem Fall bewiesen. Ist schließlich B A, so ist A die disjunkte Vereinigung A = B (A\B), also χ B + χ A\B = χ A, und dies bedeutet χ A\B = χ A χ B. Damit kommen wir zu unserem Lemma über das Volumen. Lemma 4.13 (Grundeigenschaften des Volumens) Sei n N mit n 1 und seien A, B R n zwei Jordan-meßbare Mengen. (a) Ist A B so gilt vol(a) vol(b). (b) Die Mengen A B und A B sind wieder Jordan-meßbar und es gilt vol(a B) + vol(a B) = vol(a) + vol(b). (c) Ist A B eine Jordansche Nullmenge, so gilt vol(a B) = vol(a) + vol(b). (d) Ist B A, so ist auch A\B eine Jordan-meßbare Menge und es gilt vol(a\b) = vol(a) vol(b). Beweis: Wähle einen nicht ausgearteten Quader Q R n mit A B Q. (a) Wegen χ A (x) χ B (x) für alle x Q gilt nach Lemma 5.(d) auch vol(a) = χ A χ B = vol(b). Q Q 11

111 Mathematik für Physiker III, WS 212/213 Dienstag (b) Zunächst ist χ A B = χ A χ B nach Lemma 5.(b) wieder Riemann-integrierbar, d.h. A B ist eine Jordan-meßbare Menge. Weiter ist χ A B = χ A + χ B χ A B nach Lemma 5.(a,c) wieder Riemann-integrierbar, d.h. auch A B ist Jordan-meßbar, und nach Lemma 5.(a) gilt vol(a B) + vol(a B) = χ A B + χ A B = (χ A B + χ A B ) Q Q Q = (χ A + χ B ) = χ A + χ B = vol(a) + vol(b). Q (c) Nach Lemma 12 ist vol(a B) =, also ergibt (b) auch vol(a B) = vol(a)+vol(b). (d) Wegen χ A\B = χ A χ B ist χ A\B nach Lemma 5.(a,c) Riemann-integrierbar, d.h. A\B ist Jordan-meßbar, und nach (c) gilt schließlich auch vol(a) = vol(b)+vol(a\b), also vol(a\b) = vol(a) vol(b). Q Q Wir schauen uns einige kleine Beispiele an. Seien n N mit n 1 und z R n. Sei weiter r >. Dann wissen wir bereits das B r (z) eine Jordan-meßbare Menge ist und das S := {x R n : x z 2 = r} eine Jordansche Nullmenge ist. Nach Lemma 13.(d) ist damit auch die offene Kugel B r (z) = B r (z)\s Jordan-meßbar und es gilt vol(b r (z)) = vol(b r (z)) vol(s) = vol(b r (z)). Sind weiter etwa < r < s gegeben, so können wir die Kugelschale B r,s (z) := {x R n r x 2 s} betrachten. Wegen B r,s (z) = B s (z)\b r (z) ist B r,s (z) nach Lemma 13.(d) eine Jordanmeßbare Menge mit vol(b r,s (z)) = vol(b s (z)) vol(b r (z)) = vol(b s (z)) vol(b r (z)). Für den ebenen Fall n = 2 ergibt sich beispielsweise die Fläche des Kreisrings B r,s (z) als vol(b r,s (z)) = π(s 2 r 2 ). Als nächstes Beispiel wollen wir uns überlegen das auch Halbkugeln Jordan-meßbare Mengen sind. Wir nehmen beispielsweise die obere Halbkugel Bilden wir den nicht ausgearteten Quader B + r (z) := {x B r (z) x n z n }. n 1 Q := [z k r, z k + r] [z n, z n + r] R n, k=1 111

112 Mathematik für Physiker III, WS 212/213 Dienstag so sind Q und B r (z) zwei Jordan-meßbare Mengen und nach Lemma 13.(b) ist auch B + r (z) = B r (z) Q eine Jordan-meßbare Menge. Das Volumen der Halbkugel B + r (z) wird genau das halbe Volumen der ganzen Kugel B r (z) sein, einen Beweis hierfür werden wir aber erst im nächsten Abschnitt behandeln. Hier wollen wir dies im ebenen Fall n = 2 einmal direkt nachrechnen. Schreiben wir wiedet z = (a, b), so wird B + r (z) = {(x, y) R 2 (x a) 2 + (y b) 2 r 2, y b}, also ist analog zur früheren Berechnung der Kreisfläche auch vol(b + r (z)) = a+r b+ r 2 (x a) 2 a r b dy dx = a+r a r r2 (x a) 2 dx = π 2 r2. Das letztere Integral hatten wir dabei schon am Ende der letzten Sitzung berechnet. Als letztes Beispiel schauen wir uns jetzt eine zusammengesetzte Menge an. Sei r > gegeben. Dann bilden wir im R 2 das Quadrat Q := [, 2r] [, 2r] der Kantenlänge 2r und den Halbkreis B + := B + r (r, 2r) mit Radius r und Mittelpunkt B + (r, 2r). Die Vereinigung M := Q B + dieser beiden Mengen ist dann ein Quadrat mit aufgesetztem Halbkreis, wie im nebenstehenden Bild gezeigt. Da wir bereits wissen dass das Quadrat Q und der Halbkreis B + beide Jordan-meßbar sind, ist nach Lemma 13.(b) auch die Vereinigung M der beiden eine Jordanmeßbare Menge. Da Q B + = [, 2r] {2r} ein ausgearteter Q M Quader und somit eine Jordansche Nullmenge ist, haben wir nach Lemma 13.(c) auch vol(m) = vol(q) + vol(b + ) = (2r) 2 + π ( 2 r2 = 4 + π ) r 2. 2 Nach diesen Beispielen wollen wir jetzt unsere theoretischen Überlegungen etwas fortsetzen. Wir haben bereits eingesehen das Jordansche Nullmengen immer auch Jordanmeßbar sind. Tatsächlich zeigt uns der nächste Satz das der Zusammenhang zwischen diesen beiden Begriffen noch sehr viel enger ist. Satz 4.14 (Charakterisierung der Jordan-meßbaren Mengen) Seien n N mit n 1 und M R n eine beschränkte Teilmenge. Dann ist M genau dann Jordan-meßbar wenn der Rand M von M eine Jordansche Nullmenge ist. Beweis: Wähle einen nicht ausgearteten Quader Q R n mit M Q. Dann ist weiter auch M M Q. = Sei ɛ > gegeben. Da die charakteristische Funktion χ M : Q R Riemannintegrierbar ist, gibt es nach Satz 2 eine Zerlegung α von Q mit S(χ M ; α) S(χ M ; α) < ɛ

113 Mathematik für Physiker III, WS 212/213 Dienstag Wegen ist damit S(χ M ; α) = j I α Q α,j M vol(q α,j) und S(χ M ; α) = j I α M Q α,j vol(q α,j ) = S(χ M ; α) S(χ M ; α) < ɛ 2. vol(q α,j ) j I α M Q α,j Q α,j M Für jedes j I α ist der Rand Q α,j nach einem früheren Beispiel eine Jordansche Nullmenge, also ist nach Lemma 6.(b) auch N := j I α ( Q α,j ) R n eine Jordansche Nullmenge. Damit existieren Quader Q 1,..., Q r R n mit r N Q k und k=1 r vol(q k ) < ɛ 2. k=1 Insgesamt ist also T := {Q 1,..., Q r } {Q α,j j I α, M Q α,j, Q α,j M} eine endliche Menge von Quadern im R n mit vol(p ) < ɛ 2 + ɛ 2 = ɛ. P T Nun zeigen wir das auch M T gilt. Sei also x M Q. Dann existiert ein j I α mit x Q α,j. Ist x Q α,j N, so gibt es ein 1 k r mit x Q k T, also auch x T. Nun sei x / Q α,j, also x Q α,j. Wegen x M M ist damit auch M Q α,j, also M Q α,j. Wäre jetzt Q α,j M, so hätten wir nach II. 4.Lemma 17.(c) auch x Q α,j M, im Widerspruch zu x M. Also ist Q α,j M, d.h. es ist x Q α,j T und wir haben auch in diesem Fall x T eingesehen. Damit ist der Rand M eine Jordansche Nullmenge. = Da die charakteristische Funktion χ M in jedem Punkt x Q\ M stetig ist, ist χ M : Q R nach Lemma 1 Riemann-integrierbar, d.h. M ist Jordan-meßbar. Der Satz hat einige wichtige Korollare, die wir jetzt besprechen wollen. Unser Integrierbarkeitskriterium Lemma 1 behandelt nur die Integration über einen nicht ausgearteten Quader, und wir haben noch kein Kriterium für die Integrierbarkeit von Funktionen die auf einer allgemeinen Jordan-meßbaren Menge definiert sind. Ein solches können wir jetzt aber leicht herleiten. Korollar 4.15: Seien n N mit n 1, M R n eine Jordan-meßbare Menge, N R n eine Jordansche Nullmenge und f : M R eine beschränkte Funktion. Die Funktion f sei in jedem Punkt x M \N stetig. Dann ist f über M Riemann-integrierbar. 113

114 Mathematik für Physiker III, WS 212/213 Dienstag Beweis: Wähle einen nicht ausgearteten Quader Q R n mit M Q und betrachte die fortgesetzte Funktion f : Q R; x { f(x), x M,, x / M. Nach Satz 14 ist der Rand M eine Jordansche Nullmenge, also ist nach Lemma 6.(b) auch N := N M eine Jordansche Nullmenge. Sei x Q\N. Ist dann x / M, so ist U := R n \M nach II. 4.Lemma 16.(a) und II. 4.Lemma 17.(d) eine offene Menge mit x U und f(y) = für alle y Q U, also ist f in x stetig. Nun nehmen wir x M an. Wegen x / M ist dann x M \N und somit ist f in x stetig. Da M M nach II. 4.Lemma 17.(b) eine offene Menge mit x M und f M = f M ist, ist damit auch f in x stetig. Damit ist f in jedem Punkt x Q\N stetig und nach Lemma 1 ist f Riemann-integrierbar, d.h. die Funktion f ist Riemann-integrierbar. Unsere nächsten beiden Anwendungen des Satz 14 betreffen die Konstruktion weiterer Beispielklassen Jordan-meßbarer Mengen. Wir beginnen dabei mit Mengen die durch eine Ungleichung eines geeigneten Typs definiert sind. Korollar 4.16 (Durch Ungleichungen definierte Jordan-meßbare Mengen) Seien n N mit n 1, U R n eine offene Menge, f : U R eine stetig differenzierbare Funktion und a R. Die Menge M := {x U f(x) a} R n sei kompakt und für jedes x U mit f(x) = a sei grad f(x). Dann ist M = {x U f(x) = a} und M ist eine Jordan-meßbare Menge. Beweis: Nach II. 8.Lemma 1.(a) ist M R n abgeschlossen und beschränkt, also ist nach II. 4.Lemma 18.(b) auch M = M\M. Wir behaupten jetzt, dass M = {x U f(x) < a} gilt. Zunächst ist die Menge {x U f(x) < a} = f 1 ((, a)) offen im R n, also gilt nach II. 4.Lemma 17.(c) auch {x U f(x) < a} M. Nun sei umgekehrt x M mit f(x) = a gegeben. Wäre dann x M, so wäre M nach II. 4.Lemma 17.(b) eine offene Menge mit f(x) = a f(y) für alle y M, d.h. x ist ein lokales Maximum von f und mit II. 8.Satz 24 folgt der Widerspruch grad f(x) =. Dies zeigt M = {x U f(x) < a} und somit ist auch M = {x U f(x) = a}. Nach dem Satz vom regulären Urbild 3.Korollar 2 ist M eine (n 1)-dimensionale C 1 -Untermannigfaltigkeit des R n und nach Lemma 6.(f) ist M eine Jordansche Nullmenge. Nach Satz 14 ist M schließlich Jordan-meßbar. Als zweiten Beispieltyp wollen wir die sogenannten Normalbereiche vorstellen. Diese sind hauptsächlich von rechnerischer und nicht so sehr von theoretischer Bedeutung, und daher beschränken wir uns auf die beiden in expliziten Rechnungen zumeist vorkommenden kleinen Dimensionen n = 2 und n = 3. Beginnen wir mit den zweidimensionalen Normalbereichen. Ein Urbeispiel für diese sind die schon früher betrachteten 114

115 Mathematik für Physiker III, WS 212/213 Dienstag Kreisscheiben B = B r (z) mit r > und z = (a, b) R 2. In x- und y-koordinaten aufgelöst konnten wir die Menge B schreiben als B = {(x, y) x [a r, a + r], y [b r 2 (x a) 2, b + r 2 (x a) 2 }, d.h. die x-koordinaten durchlaufen ein fixiertes Intervall I = [a r, a+r] und für jedes x I liegen die passenden y-werte in einem Intervall I x = [b r 2 (x a) 2, b + r2 (x a) 2 ] dessen Randpunkte von x abhängen, und sich als stetige Funktionen in x schreiben lassen. Zweidimensionale Normalbereiche sind eine Verallgemeinerung dieses Beispiels. Gegeben seien a, b R mit a < b und zwei stetige Funktionen ϕ, ψ : [a, b] R mit ϕ(x) ψ(x) für alle x [a, b]. Der durch ϕ, ψ gegebene Normalbereich ist dann die Menge M := {(x, y) R 2 a x b, ϕ(x) y ψ(x)} R 2. Unsere obige Kreisscheibe ist dann ein Normalbereich, wobei [a r, a + r] das Intervall für die x-koordinaten ist und die untere und obere y-grenze durch die stetigen Funktionen ϕ(x) = b r 2 (x a) 2 und ψ(x) = b + r 2 (x a) 2 gegeben sind. y y ψ (x) b M M ϕ (x) a b x Normalbereich bezüglich x a ϕ (y) ψ (y) Normalbereich bezüglich y x Analog kann man auch Normalbereiche mit vertauschten Rollen von x und y definieren, diese sind im folgenden immer implizit mit gemeint. Wir wollen uns jetzt überlegen das unser obiger Normalbereich eine Jordan-meßbare Teilmenge des R 2 ist. Um dies einzusehen, betrachten wir die Graphen der Funktionen ϕ und ψ, also F 1 := {(x, ϕ(x)) x [a, b]} und F 2 := {(x, ψ(x)) x [a, b]} und behaupten das der Rand von M genau die Menge M = ({a} [ϕ(a), ψ(a)]) ({b} [ϕ(b), ψ(b)]) F 1 F 2 ist. Hierzu beachte zunächst das M abgeschlossen ist während die Menge M := {(x, y) R 2 a < x < b, ϕ(x) < y < ψ(x)} offen ist. Nach II. 4.Lemma 17.(b) und II. 4.Lemma 18.(b) sind damit M M und M = M\M M\M. Nun seien umgekehrt (x, y) M\M und ɛ > gegeben. Dann 115

116 Mathematik für Physiker III, WS 212/213 Dienstag gibt es vier mögliche Fälle. Ist x = a, so ist (a ɛ/2, y) B ɛ (x, y) und (a ɛ/2, y) / M. Ist x = b so haben wir analog (b + ɛ/2, y) B ɛ (x, y) mit (b + ɛ/2, y) / M. Ist a < x < b und y = ϕ(x), so haben wir (x, ϕ(x) ɛ/2) B ɛ (x, y) mit (x, ϕ(x) ɛ/2) / M und im verbleibenden Fall a < x < b, y = ψ(x) ist (x, ψ(x) + ɛ/2) B ɛ (x, y) mit (x, ψ(x) + ɛ/2) / M. In allen vier Fällen ist damit B ɛ (x, y) M und wir haben (x, y) M gezeigt, also ist M\M M. Insgesamt ist damit M = M\M genau die angegebene Menge. Hieraus folgt weiter das der Rand M eine Jordansche Nullmenge ist, denn die beiden Mengen {a} [ϕ(a), ψ(a)] und {b} [ϕ(b), ψ(b)] sind ausgeartete Quader und somit Jordansche Nullmengen und F 1, F 2 sind nach Lemma 6.(e) Jordansche Nullmengen, d.h. nach Lemma 6.(b) ist auch die Vereinigung M dieser vier Mengen eine Jordansche Nullmenge. Nach Satz 14 ist damit M eine Jordanmeßbare Menge. Auch den Satz von Fubini Satz 8 können wir für Normalbereiche noch weiter auswerten. Wir betrachten weiterhin den obigen Normalbereich M R 2 und haben weiter eine Riemann-integrierbare Funktion f : M R. Für jedes x [a, b] nehmen wir außerdem an, dass die Funktion f x : [ϕ(x), ψ(x)] R; y f(x, y) stets Riemann-integrierbar ist. Wähle dann c, d R mit c < d und c φ(x) ψ(x) d für alle x [a, b], dies ist immer möglich da die beiden stetigen Funktionen ϕ, ψ nach I. 13.Satz 13 beide beschränkt sind. Weiter bezeichne f : [a, b] [c, d] R wieder die durch f(x, y) = f(x, y) für (x, y) M und f(x, y) = für (x, y) ([a, b] [c, d])\m definierte fortgesetzte Funktion. Dann ist auch f Riemann-integrierbar und für jedes x [a, b] ist f x : [c, d] R; y f(x, y) nach II. 2.Lemma 2.(a,c) wieder eine Riemannintegrierbare Funktion mit d c f x (y) dy = ψ(x) ϕ(x) f(x, y) dy. Damit ist der Satz von Fubini Satz 8 anwendbar und liefert das die Funktion F : [a, b] R; x Riemann-integrierbar ist mit f(x, y) d(x, y) = M [a,b] [c,d] d c f(x, y) d(x, y) = f(x, y) dy = b d a c ψ(x) ϕ(x) f(x, y) dy dx = f(x, y) dy b ψ(x) a ϕ(x) f(x, y) dy dx. Nach Korollar 15 und II. 2.Satz 8 sind all unsere Voraussetzungen an die Funktion f erfüllt wenn f stetig ist. Als ein kleines Beispiel wollen wir uns die Menge M := {(x, y) R 2 x 1, x y 1 + x 2 } R 2 116

117 Mathematik für Physiker III, WS 212/213 Dienstag anschauen und die beiden Integrale von x und y über M berechnen. Die Menge M ist ein zweidimensionaler Normalbereich bezüglich der beiden stetigen Funktionen ϕ, ψ : [, 1] R definiert durch ϕ(x) = x und ψ(x) = 1 + x 2 für alle x [, 1]. Die obige Integrationsformel liefert damit und M M x d(x, y) = y d(x, y) = 1 1+x 2 x 1 1+x 2 x x dy dx = y dy dx = 1 2 = x (x 2 x + 1) dx = = 5 12 ((1 + x 2 ) 2 x 2 ) dx Als ein zweites Beispiel sei D die von den Kurven (x 4 + x 2 + 1) dx = 1 2 ( ) = y = 1, y = 4x und y = 1 x im R 2 begrenzte Fläche, wie im nebenstehenden Bild gezeigt. Die Fläche D ist ein Normalbereich bezüglich der y-achse. Der größtmögliche y Wert ist im Schnittpunkt der Kurven y = 4x und y = 1/x, also 4x = 1/x beziehungsweise x 2 = 1/4 und somit x = 1/2, y = 2 da ja x > ist. Die linke und rechte Begrenzung von D ist für 1 y 2 durch ϕ(y) = 1 4 y und ψ(y) = 1 y gegeben, also { D = (x, y) R 2 1 y 2, und somit wird vol(d) = D d(x, y) = 2 1/y 1 y/4 1 4 y x 1 } y dx dy = = ln y y ( 1 y y ) dy 4 = ln = ln 2 3 8, Dreidimensionale Normalbereiche sind analog definiert, die x-variable läuft in einem Intervall, die y-variable in einem von x abhängigen Intervall und die z-variable schließlich in einem von x und y abhängigen Intervall. Etwas formaler sind also a, b R 117

118 Mathematik für Physiker III, WS 212/213 Freitag mit a < b, zwei stetige Funktionen ϕ, ψ : [a, b] R mit ϕ(x) ψ(x) für alle x [a, b] und zwei weitere stetige Funktionen α, β : D R definiert auf dem zweidimensionalen Normalbereich D := {(x, y) R 2 a x b, ϕ(x) y ψ(x)} mit α(x, y) β(x, y) für alle (x, y) D gegeben, und wir definieren den zugehörigen dreidimensionalen Normalbereich M durch M := {(x, y, z) R 3 a x b, ϕ(x) y ψ(x), α(x, y) z β(x, y)} = {(x, y, z) R 3 (x, y) D, α(x, y) z β(x, y)}. Wir wollen jetzt auch einsehen das jeder dreidimensionale Normalbereich eine Jordanmeßbare Menge ist. Schon bei der Bestimmung des Randes zweidimensionaler Normalbereiche hatten wir festgehalten das diese kompakt sind, also ist D kompakt und nach II. 8.Lemma 1.(d) sind damit die beiden stetigen Funktionen α, β : D R beschränkt, d.h. der Normalbereich M R 3 ist zumindest beschränkt. Der Rand von M kann genau wie im zweidimensionalen Fall berechnet werden, nur ist diesmal das Ergebnis dieser Rechnung etwas komplizierter. In der Definition von M haben wir diesmal gleich sechs Ungleichungen und damit setzt sich M aus sechs Teilmengen zusammen, nämlich M = A 1 A 2 B 1 B 2 C 1 C 2 mit A 1 := {(a, y, z) ϕ(a) y ψ(a), α(a, y) z β(a, y)}, A 2 := {(b, y, z) ϕ(b) y ψ(b), α(b, y) z β(b, y)}, B 1 := {(x, ϕ(x), z) a x b, α(x, ϕ(x)) z β(x, ϕ(x))}, B 2 := {(x, ψ(x), z) a x b, α(x, ψ(x)) z β(x, ψ(x))}, C 1 := {(x, y, α(x, y)) a x b, ϕ(x) z ψ(x)}, C 2 := {(x, y, β(x, y)) a x b, ϕ(x) z ψ(x)}. Verwenden wir unsere im zweidimensionalen Fall hergeleitete Beschreibung von D, so können wir den Rand von M etwas übersichtlicher auch in der Form M = {(x, y, z) R 3 (x, y) D, α(x, y) z β(x, y)} C 1 C 2 schreiben. Wir müssen uns jetzt überlegen das diese Menge eine Jordansche Nullmenge ist, und dies werden wir in der nächsten Sitzung durchführen. Vorlesung 12, Freitag Wir beschäftigen uns gerade mit den dreidimensionalen Normalbereichen. Wir hatten uns zunächst zwei reelle Zahlen a, b R mit a < b und zwei stetige Funktionen 118

119 Mathematik für Physiker III, WS 212/213 Freitag ϕ, ψ : [a, b] R mit ϕ(x) ψ(x) für alle x [a, b] vorgegeben und mit diesen den zweidimensionalen Normalbereich D := {(x, y) R 2 a x b, ϕ(x) y ψ(x)} gebildet. Weiter waren dann zwei auf D definierte stetige Funktionen α, β : D R mit α(x, y) β(x, y) für alle (x, y) D gegeben und wir hatten schließlich den dreidimensionalen Normalbereich M := {(x, y, z) R 3 a x b, ϕ(x) y ψ(x), α(x, y) z β(x, y)} definiert. Wir wollen einsehen das M eine Jordan-meßbare Menge ist. Wir hatten bereits gesehen das α, β beschränkt sind, es gibt also Konstanten c, d R mit c α(x, y) β(x, y) d für alle (x, y) D und somit ist M D [c, d], d.h. M ist beschränkt. Nach Satz 14 müssen wir einsehen das der Rand M von M eine Jordansche Nullmenge ist. Diesen Rand hatten wir bereits als M = {(x, y, z) R 3 (x, y) D, α(x, y) z β(x, y)} C 1 C 2 bestimmt, wobei C 1 := {(x, y, α(x, y)) (x, y) D} und C 2 := {(x, y, β(x, y)) (x, y) D} die Graphen von α und β sind. Die erste dieser drei Mengen erfüllt dabei {(x, y, z) R 3 (x, y) D, α(x, y) z β(x, y)} D [c, d], wir haben also M D [c, d] C 1 C 2 und wollen uns überlegen dass diese drei Mengen allesamt Jordansche Nullmengen sind. Fangen wir mit den beiden Graphen C 1 und C 2 an. Leider ist unser Lemma 6.(e) nicht anwendbar da diese Aussage für stetige Funktionen definiert auf nicht ausgearteten Quadern formuliert ist. Wir erweitern das Lemma jetzt auf unseren Fall und lassen auch stetige Funktionen zu die auf einer Jordan-meßbaren Menge definiert sind. Lemma 4.17 (Konstruktion Jordanscher Nullmengen) Sei n, m N mit n, m 1 gegeben. Dann gelten: (a) Sind N R n eine Jordansche Nullmenge und A R m eine beschränkte Menge, so ist auch die Menge N A R n+m eine Jordansche Nullmenge. (b) Sind M R n eine Jordan-meßbare Menge und f : M R m eine beschränkte Funktion die in jedem inneren Punkt x M von M stetig ist, so ist der Graph {(x, f(x)) x M} R n+m eine Jordansche Nullmenge. Beweis: (a) Sei ɛ > gegeben. Wähle einen nicht ausgearteten Quader Q R m mit A Q und endlich viele Quader Q 1,..., Q r R n mit r N Q k und k=1 r vol(q k) < k=1 ɛ vol(q ). 119

120 Mathematik für Physiker III, WS 212/213 Freitag Für jedes 1 k r ist dann Q k := Q k Q ein Quader im R n+m mit vol(q k ) = vol(q k ) vol(q ) und es gelten ( r ) r r N A Q = Q k Q = und k=1 Q k k=1 k=1 ( r r ) vol(q k ) = vol(q k) vol(q ) < ɛ. k=1 k=1 Damit ist N A eine Jordansche Nullmenge im R n+m. (b) Sei ɛ > gegeben. Wähle einen nicht ausgearteten Quader Q R n mit M Q, also auch M M Q. Da f beschränkt ist existiert ein nicht ausgearteter Quader Q R m mit f(m) Q. Nach Satz 12 ist der Rand M eine Jordansche Nullmenge also gibt es nach Lemma 6.(c) eine Zerlegung α von Q mit vol(q j I α Q α,j M α,j) < Wir betrachten jetzt die beiden Indexmengen ɛ 2 vol(q ). J 1 := {j I α Q α,j ( M) }, J 2 := {j I α \J 1 Q α,j M }. Dann ist M j J 1 J 2 Q α,j und wir behaupten jetzt das für jedes j J 2 stets Q α,j M gilt. Sei nämlich j J 2 gegeben. Dann ist Q α,j M und wegen j / J 1 ist andererseits Q α,j ( M) =. Nach II. 4.Lemma 18.(c) ist der R n die disjunkte Vereinigung R n = M ( M) (R n \M), und nach II. 4.Lemma 16.(a), II. 4.Lemma 17.(b,d) sind die Mengen U := M und V := R n \M beide offen. Wegen Q α,j R n = U V ( M) und Q α,j ( M) = ist damit Q α,j U V und U V Q α,j =. Der Quader Q α,j ist konvex also nach II. 8.Lemma 1.(a) auch zusammenhängend, d.h. es gilt Q α,j U = oder Q α V =. Wegen Q α,j M kann nicht Q α,j V gelten, es muss also Q α,j U sein. Folglich sind Q α,j V = und Q α,j U = M wie behauptet. Damit ist diese Zwischenbehauptung bewiesen. Sei j J 2. Wegen Q α,j M ist die Einschränkung f Q α,j stetig, also ist der Graph F j := {(x, f(x)) x Q α,j} von f Q α,j nach Lemma 6.(e) eine Jordansche Nullmenge. Folglich existieren endlich viele Quader Q j1,..., Q jrj R n+m mit Q k F j r j k=1 Q jk und r j k=1 vol(q jk ) < ɛ 2 J

121 Mathematik für Physiker III, WS 212/213 Freitag Wir behaupten jetzt das {(x, f(x)) x M} r j j J 2 k=1 Q jk j J 1 (Q α,j Q ) gilt. Sei x M gegeben. Dann existiert ein j J 1 J 2 mit x Q α,j. Im Fall j J 2 ist (x, f(x)) F j, also (x, f(x)) Q jk für ein 1 k r j. Andernfalls haben wir j J 1 und es ist (x, f(x)) Q α,j f(m) Q α,j Q. Damit ist diese Zwischenbehauptung bewiesen und der Graph von f als Teilmenge einer endlichen Vereinigung von Quadern geschrieben. Dabei gilt r j vol(q jk ) + ( ) vol(q α,j Q ɛ ) < J 2 2 J vol(q α,j) vol(q ) < ɛ. j J 1 j J 1 j J 2 k=1 Dies zeigt das der Graph von f tatsächlich eine Jordansche Nullmenge ist. Damit können wir schließlich wieder zu unserem dreidimensionalen Normalbereich zurückkommen. Wir hatten a, b R mit a < b, zwei stetige Funktionen ϕ, ψ : [a, b] R mit ϕ(x) ψ(x) für alle x [a, b] und betrachten den zweidimensionalen Normalbereich D = {(x, y) R 2 a x b, ϕ(x) y ψ(x)}. Weiter haben wir noch zwei stetige Funktionen α, β : D R mit α(x, y) β(x, y) für alle (x, y) D und bilden den dreidimensionalen Normalbereich M = {(x, y, z) R 3 a x b, ϕ(x) y ψ(x), α(x, y) z β(x, y)}. Wir haben uns bereits überlegt das wir M ( D) [c, d] C 1 C 2 mit geeigneten c, d R schreiben können, wobei C 1, C 2 die Graphen von α beziehungsweise β sind. Wir wissen bereits das D R 2 eine Jordansche Nullmenge ist und nach Lemma 17 sind damit auch ( D) [c, d] und C 1, C 2 Jordansche Nullmengen. Nach Lemma 6.(a,b) ist damit auch der Rand M eine Jordansche Nullmenge, d.h. nach Satz 14 ist der Normalbereich M eine Jordan-meßbare Menge. Damit ist auch die Integration über den dreidimensionalen Normalbereich M definiert, und zur Berechnung dieser Integrale kann wieder der Satz von Fubini Satz 8 verwendet werden. Auch dies wollen wir uns einmal im Detail überlegen. Gegeben sei also eine Riemann-integrierbare Funktion f : M R. Wählen wir also Konstanten a, a, b, b R mit a ϕ(x) ψ(x) b für alle x [a, b] und a α(x, y) β(x, y) b für alle (x, y) D, so ist M Q := [a, b] [a, b ] [a, b ] und damit ist die durch Null fortgesetzte Funktion f : Q R Riemann-integrierbar. Für jedes (x, y) D sei die Funktion f xy : [α(x, y), β(x, y)] R; z f(x, y, z) 121

122 Mathematik für Physiker III, WS 212/213 Freitag Riemann-integrierbar, und nach II. 2.Lemma 2.(a,c) ist auch die Funktion Riemann-integrierbar mit b f xy : [a, b ] R; z f(x, y, z) a fxy (z) dz = β(x,y) α(x,y) f(x, y, z) dz, da diese ja gleich f xy = f xy ist. Für (x, y) Q := [a, b] [a, b ] mit (x, y) / D ist f(x, y, z) = für alle z [a, b ], d.h. auch in diesem Fall ist f xy = Riemannintegrierbar. Nach dem Satz von Fubini Satz 8 ist die Funktion F : Q R; (x, y) Riemann-integrierbar mit f(x, y, z) d(x, y, z) = M Q b a f(x, y, z) dz f(x, y, z) d(x, y, z) = Q F (x, y) d(x, y). Für (x, y) Q \D ist dabei f xy =, also F (x, y) = während für (x, y) D F (x, y) = β(x,y) α(x,y) f(x, y, z) dz gilt. Damit ist F := F D : D R Riemann-integrierbar mit F (x, y) d(x, y) = F (x, y) d(x, y) = f(x, y, z) d(x, y, z). D Q Weiter setzen wir voraus, dass die Funktion F x : [ϕ(x), ψ(x)] R; y F (x, y) = M β(x,y) α(x,y) f(x, y, z) dz Riemann-integrierbar ist. Wie wir bei der Besprechung zweidimensionaler Normalbereiche gesehen haben, ist damit auch die Funktion G : [a, b] R; x ψ(x) ϕ(x) Riemann-integrierbar mit dem Integral b ψ(x) β(x,y) a ϕ(x) α(x,y) F (x, y) dy = b ψ(x) β(x,y) ϕ(x) α(x,y) f(x, y, z) dz dy dx = G(x) dx a = F (x, y) d(x, y) = D f(x, y, z) dz dy M f(x, y, z) d(x, y, z). 122

123 Mathematik für Physiker III, WS 212/213 Freitag Die Formel für die Integration über dreidimensionale Normalbereiche ist also M f(x, y, z) d(x, y, z) = b ψ(x) β(x,y) a ϕ(x) α(x,y) f(x, y, z) dz dy dx, wobei die Existenz des links stehenden Integrals sowie der beiden inneren iterierten Integrale auf der rechten Seite vorausgesetzt werden muss, und die Existenz des äußeren Integrals auf der rechten Seite folgt. Wie unsere obige Überlegung gezeigt hat, ist auch diese Aussage nur ein Spezialfall des Satzes von Fubini Satz 8. In Beispielen sind diese Voraussetzungen völlig unproblematisch, sie sind zum Beispiel erfüllt wenn f stetig ist. In der obigen Formulierung ist dies aber nicht sofort zu sehen, aus der Stetigkeit von f folgen zwar nach Korollar 15 und II. 2.Satz 8 die Integrierbarkeit von f über M sowie die Existenz des innersten Integrals auf der rechten Seite, für die Existenz des zweiten Integrals auf der rechten Seite müssten wir dann allerdings wissen, dass auch die Funktion F x stetig ist. Um dies einzusehen fehlt uns aber noch ein passender Satz. Es gibt eine kleine Umformulierung unserer Voraussetzungen mittels derer wir dieses Problem umgehen können. Wir setzen weiterhin voraus, dass die beschränkte Funktion f : M R Riemann-integrierbar ist und dass das innerste Integral auf der rechten Seite existiert, dass also die Funktion f xy für jedes (x, y) D stets Riemann-integrierbar ist. Die dritte Voraussetzung ändern wir jetzt ab. Für jedes x [a, b] mit ϕ(x) < ψ(x) haben wir den zweidimensionalen Normalbereich M x := {(y, z) R 2 (x, y, z) M} und verlangen, dass auch die Funktion = {(y, z) R 2 ϕ(x) y ψ(x), α(x, y) z β(x, y)} f x : M x R; (y, z) f(x, y, z) Riemann-integrierbar ist. Unsere frühere Formel für die Integrierbarkeit über zweidimensionale Normalbereiche ergibt dann, dass auch die Funktion F x wieder Riemann-integrierbar ist. Ist dagegen x [a, b] mit ϕ(x) = ψ(x), so ist F x trivialerweise Riemann-integrierbar. Damit implizieren diese modifizierten Voraussetzungen auch die zuerst formulierten Voraussetzungen an f und es gilt erneut die Formel für die Integration über dreidimensionale Normalbereiche. In der neuen Formulierung ist nun klar das alle Voraussetzungen an f für eine stetige Funktion f : M R erfüllt sind, denn für jedes x [a, b] mit ϕ(x) < ψ(x) ist auch f x stetig und wir können Korollar 15 anwenden. Als ein Beispiel dreidimensionaler Normalbereiche wollen wir den rechts oben gezeigten Zylinder mit oben und unten aufgesetzten Halbkugeln behandeln. Dabei soll der Zylinder Radius 1 und Höhe 4 haben und symmetrisch zur (x, y)-ebene liegen. Die Halbkugeln unten und oben müssen dann auch den Radius 123

124 Mathematik für Physiker III, WS 212/213 Freitag haben und ihre Mittelpunkte liegen in (,, ±2), d.h. die vertikale Achse soll durch den Nullpunkt gehen. Als Formel geschrieben ist dies die Menge { } P := (x, y, z) R 3 x 2 + y 2 1, z x 2 y 2 Dies ist ein dreidimensionaler Normalbereich, die Punkte (x, y, z) P sind gegeben durch die Bedingungen 1 y 1, 1 y 2 x 1 y 2 und (2 + 1 x 2 y 2 ) z x 2 y 2, in unserer oben verwendeten Notation sind also a = 1, b = 1, ϕ(y) = 1 y 2, ψ(y) = 1 y 2, jeweils für y [ 1, 1], der zweidimensionale Normalbereich D ist der Kreis D = {(x, y) R 2 1 y 1, 1 y 2 x 1 y 2 } = B 1 () und die stetigen Funktionen α, β : D R sind gegeben durch α(x, y) = 2 1 x 2 y 2, β(x, y) = x 2 y 2 für alle (x, y) D. Warum wir hier die Koordinaten in der Reihenfolge y, x, z verwenden werden wir erst während der Berechnung der iterierten Integrale sehen, dass es uns frei steht die Koordinaten beliebig zu sortieren hatten wir schon früher angemerkt. Wir wollen das Integral x d(x, y, z) P berechnen. Für unseren dreidimensionalen Normalbereich P hat die Integralformel für dreidimensionale Normalbereiche die Gestalt 1 1 y 2 β(x,y) x d(x, y, z) = x dz dx dy. Für (x, y) D haben wir also wird β(x,y) α(x,y) P P 1 1 y 2 α(x,y) x dz = x (β(x, y) α(x, y)) = 2 x (2 + 1 x 2 y 2 ), 1 1 y 2 x d(x, y, z) = 2 x (2 + ) 1 x 1 1 y 2 y 2 dx dy. 2 Fixiere ein 1 y 1. Als Funktion von x ist der Integrand dann eine gerade Funktion, also haben wir 1 y2 1 y2 1 y 2 x (2 + ) 1 x 2 y 2 dx = 2 = 2x (1 x2 y 2 ) 3/2 1 y x (2 + ) 1 x 2 y 2 dx = 2 2y (1 y2 ) 3/2.

125 Mathematik für Physiker III, WS 212/213 Freitag Dies ergibt y 2 x 1 y 2 (2 + ) 1 x 2 y 2 dx dy = = y (2 2y ) (1 y2 ) 3/2 dy 1(1 y 2 ) 3/2 dy = Das hintere Integral berechnen wir über die Substitution y = sin t, π 2 t π 2, dy dt also 1 (1 y 2 ) 3/2 dy = 1 π/2 π/2 1 = cos t = dy = cos t dt (1 sin 2 t) 3/2 cos t dt = π/2 π/2 Verwenden wir das aus II. 2.3 bekannte unbestimmte Integral cos 4 x dx = 3 ( 1 8 x + sin x cos x 4 cos2 x + 3 ) 8 so wird also y 2 1(1 y 2 ) 3/2 dy = 3 8 y + sin y cos y ( 1 4 cos2 y x 1 y 2 Insgesamt ist damit P (2 + ) 1 x 2 y 2 dx dy = ) π/2 π/2 1 (1 y 2 ) 3/2 dy. cos 4 t dt. = 3 8 π, (1 y 2 ) 3/2 dy = π y 2 x d(x, y, z) = 2 x (2 + ) 1 x 1 1 y 2 y 2 dx dy = π 2. 2 Zum Abschluß dieses Abschnitts wollen wir noch einige weitere oftmals nützliche Aussagen festhalten. Wir beginnen mit den Grundeigenschaften des Riemann-Integrals auf Jordan-meßbaren Mengen, bisher haben wir solche Grundeigenschaften ja nur für Riemann-Integrale auf Quadern hergeleitet. Der zugehörige Beweis ist recht unkompliziert, wir führen alle einzusehenden Aussagen auf die entsprechenden Aussagen über Quader zurück. Lemma 4.18 (Grundeigenschaften des Riemann-Integrals) Seien n N mit n 1, M R n eine Jordan-meßbare Menge und f, g : M R zwei beschränkte Funktionen. 125

126 Mathematik für Physiker III, WS 212/213 Freitag (a) Sind f und g beide Riemann-integrierbar, so sind auch die Funktionen f + g, f g und c f für jedes c R Riemann-integrierbar. Dabei gelten f(x) + g(x) dx = f(x) dx + g(x) dx und cf(x) dx = c f(x) dx. M M M (b) Sind f und g beide Riemann-integrierbar mit f(x) g(x) für alle x M, so ist auch f(x) dx g(x) dx. M (c) Ist f Riemann-integrierbar und sind a, b R zwei Konstanten mit a f(x) b für alle x M, so ist auch der Betrag f von f Riemann-integrierbar und es gelten f(x) dx f(x) dx und a vol(m) f(x) dx b vol(m). M M (d) Ist N R n eine Jordansche Nullmenge mit f(x) = g(x) für alle x M\N, so ist f genau dann Riemann-integrierbar wenn g dies ist und in diesem Fall stimmen die Integrale von f und g überein. (e) Ist f Riemann-integrierbar, so ist f auch über jede Jordan-meßbare Teilmenge A M Riemann-integrierbar. (f) Sind M 1, M 2 R n zwei Jordan-meßbare Mengen mit M := M 1 M 2, so ist f genau dann Riemann-integrierbar wenn f M 1 und f M 2 beide Riemann-integrierbar sind. In diesem Fall gilt f(x) dx + M 1 M 2 f(x) dx = M 1 M 2 f(x) dx + M 1 f(x) dx. M 2 Ist weiter M 1 M 2 eine Jordansche Nullmenge, so ist sogar f(x) dx = M f(x) dx + M 1 f(x) dx. M 2 M M M M Beweis: Wähle einen nicht ausgearteten Quader Q R n mit M Q und definiere die fortgesetzten Funktionen { { f(x), x M, g(x), x M, f : Q R; x ĝ : Q R; x, x / M,, x / M. (a) Sei c R. Die Funktionen f und ĝ sind beide Riemann-integrierbar, also sind nach Lemma 5.(a,b,c) auch f + ĝ, f ĝ und c f Riemann-integrierbar. Da diese Funktionen 126

127 Mathematik für Physiker III, WS 212/213 Freitag aber die Fortsetzungen von f + g, f g und c f durch Null sind, sind damit auch f + g, f g und c f alle Riemann-integrierbar. Nach Lemma 5.(a) ist M (f(x) + g(x)) dx = Q ( f(x) + ĝ(x)) dx = f(x) dx + Q Q ĝ(x) dx = M f(x) dx + M g(x) dx, und nach Lemma 5.(c) ist auch cf(x) dx = c f(x) dx = c M Q Q f(x) dx = c f(x) dx. M (b) Da auch f(x) ĝ(x) für alle x Q gilt, ist nach Lemma 5.(d) f(x) dx = f(x) dx ĝ(x) dx = g(x) dx. M Q (c) Zunächst ist nach Lemma 5.(e) auch der Betrag f Riemann-integrierbar, und da f die Fortsetzung von f durch Null ist, ist damit auch f Riemann-integrierbar. Nach Lemma 5.(e) gilt weiter auch f(x) dx = f(x) dx f(x) dx = f(x) dx. M Q Weiter haben wir für alle x Q stets aχ M (x) f(x) bχ M (x), also ist nach Lemma 5.(c,d) auch a vol(m) = aχ M (x) dx f(x) dx = f(x) dx bχ M (x) dx = b vol(m). Q Q (d) Es gilt auch f(x) = ĝ(x) für alle x Q\N, also ist f nach Lemma 6.(d) genau dann Riemann-integrierbar wenn ĝ dies ist, und in diesem Fall stimmen die Integrale der beiden überein. Damit ist auch f genau dann Riemann-integrierbar wenn g dies ist und in diesem Fall ist f(x) dx = f(x) dx = ĝ(x) dx = g(x) dx. M Q Q M (e) Sei A R n eine Jordan-meßbare Menge mit A M Q. Dann ist f χ A : Q R die Fortsetzung von f A auf Q durch Null, und da f und χ A beide Riemann-integrierbar sind, ist nach Lemma 5.(b) auch f χ A eine Riemann-integrierbare Funktion, d.h. f ist auch über A Riemann-integrierbar. (f) Ist f Riemann-integrierbar, so sind auch f M 1 und f M 2 nach (e) beide Riemannintegrierbar. Nun nehme umgekehrt an, dass f über M 1 und über M 2 Riemannintegrierbar ist. Nach Lemma 13.(b) ist auch N := M 1 M 2 eine Jordan-meßbare Menge und f ist wegen N M 1 nach (e) auch über N Riemann-integrierbar. Die drei Funktionen f χ M1, f χ M2 und f χ N sind die Fortsetzungen von f M 1, f M 2 und f N 127 Q Q M M Q M

128 Mathematik für Physiker III, WS 212/213 Freitag auf ganz Q durch den Wert Null, d.h. alle drei Funktionen sind Riemann-integrierbar. Nach Lemma 5.(a,c) ist damit auch f = f χ M = f (χ M1 + χ M2 χ N ) = f χ M1 + f χ M2 f χ N Riemann-integrierbar mit f(x) dx = f(x)χ M1 (x) dx + Q Q Q f(x)χ M2 (x) dx f(x)χ N (x) dx Q = f(x) dx + f(x) dx M 1 M 2 Damit ist f über M Riemann-integrierbar und es gilt f(x) dx = f(x) dx = f(x) dx + f(x) dx M Q M 1 M 2 N N f(x) dx. f(x) dx. Ist zusätzlich N = M 1 M 2 als eine Jordansche Nullmenge vorausgesetzt, so ist nach Lemma 6.(d) auch f(x) dx = f(x)χ N Q N (x) dx =, also haben wir dann f(x) dx = M f(x) dx + M 1 f(x) dx, M 2 wie behauptet. Auch der Satz von Fubini läßt sich auf die Integration über Jordan-meßbare Mengen übertragen. Dies geht im allgemeinen Fall genauso wie wir es schon im Spezialfall der Normalbereiche vorgeführt haben. Satz 4.19 (Satz von Fubini für Jordan-meßbare Mengen) Seien n, m N mit n, m 1 und M R n+m, A R m Jordan-meßbare Mengen mit M R n A. Weiter sei f : M R eine Riemann-integrierbare Funktion und für jedes y A sei die Menge Jordan-meßbar und M y := {x R n (x, y) M} R n f y : M y R; x f(x, y) sei Riemann-integrierbar. Dann ist auch die Funktion F : A R; y f(x, y) dx M y Riemann-integrierbar mit f(x, y) d(x, y) = M A F (y) dy = 128 A M y f(x, y) dx dy.

129 Mathematik für Physiker III, WS 212/213 Freitag Beweis: Wähle einen nicht ausgearteten Quader Q R m mit A Q. Da M R n A R n Q beschränkt ist, gibt es weiter einen nicht ausgearteten Quader Q R n mit M Q := Q Q. Da die Funktion f Riemann-integrierbar ist, ist auch die fortgesetzte Funktion { f(x, y), (x, y) M, f : Q R; (x, y), (x, y) / M Riemann-integrierbar mit f = f. Sei y Q M Q. Dann können zwei verschiedene Fälle auftreten. Zunächst sei y A. Dann ist M y Q und für jedes x Q gilt { { f y (x) = f(x, f(x, y), (x, y) M, y) =, (x, y) / M = f y (x), x M y,, x / M y,, d.h. f y ist die durch Null auf ganz Q fortgesetzte Funktion f y. Damit ist f y Riemannintegrierbar mit F (y) := f(x, y) dx = f(x, y) dx = F (y). Q M y Im anderen Fall ist y / A. Wegen M R n A ist dann für jedes x Q stets (x, y) / M und somit f(x, y) =, d.h. auch in diesem Fall ist f y Riemann-integrierbar mit F (y) := f(x, Q y) dx =. Nach dem Satz von Fubini Satz 8 ist die Funktion F : Q R Riemann-integrierbar mit Q Q F (y) dy = f(x, y) d(x, y) = f(x, y) d(x, y). Da F auch die durch Null auf ganz Q fortgesetzte Funktion F ist, ist F : A R ebenfalls Riemann-integrierbar mit F (y) dy = F (y) dy = f(x, y) d(x, y). A Q M Damit ist der Satz vollständig bewiesen. M Als letzten Punkt dieses Abschnitts wollen wir noch die cartesischen Produkte Jordanmeßbarer Mengen behandeln. Als eine Vorbereitung hierzu benötigen wir ein weiteres Lemma über die Integrierbarkeit separierter Funktionen. Lemma 4.2 (Riemann-Integrierbarkeit separierter Funktionen) Seien n, m N mit n, m 1, Q R n, Q R m nicht ausgeartete Quader und 129

130 Mathematik für Physiker III, WS 212/213 Freitag betrachte den nicht ausgearteten Quader Q := Q Q. Weiter seien f : Q R und g : Q R zwei Riemann-integrierbare Funktionen. Dann ist auch die Funktion h : Q R; (x, y) f(x) g(y) Riemann-integrierbar und es gilt ( ) ( ) h(x, y) d(x, y) = Q f(x) dx Q g(y) dy Q. Beweis: Zunächst betrachten wir den Fall das g(y) = 1 für alle y Q gilt und setzen f : Q R; (x, y) f(x). Sei ɛ >. Nach Satz 2 existiert eine Zerlegung α von Q mit S(f; α ) S(f; α ) < ɛ vol(q ). Schreiben wir Q = [a, b] mit a, b R m, so haben wir für jedes 1 k m die Zerlegung α k := (a k, b k ) von [a k, b k ] und erhalten eine Zerlegung α := α α von Q. Es ist I α = {l} mit l = (1,..., 1) und Q α,l = Q. Weiter haben wir I α = I α {l} und für jedes j I α gelten also sind auch Q α,(j,l) = Q α,j Q α,l = Q α,j Q, vol(q α,(j,l) ) = vol(q α,j Q ) = vol(q α,j) vol(q ), m α,(j,l) ( f) = inf f(x) = inf f(x) = m α (x,y) Q α Q x Q,j(f),,j α,j M α,(j,l) ( f) = sup f(x) = sup f(x) = M α,j(f), (x,y) Q α,j Q x Q α,j S( f; α) = m α,(j,l) ( f) vol(q α,(j,l) ) j I α = m α,j(f) vol(q α,j) vol(q ) = S(f; α ) vol(q ) j I α und analog Folglich ist S( f; α) = S(f; α ) vol(q ). S( f; α) S( f; α) = ( S(f; α ) S(f; α ) ) vol(q ) < ɛ. 13

131 Mathematik für Physiker III, WS 212/213 Freitag Nach Satz 2 ist f Riemann-integrierbar. Analog ist auch g : Q R; (x, y) g(y) Riemann-integrierbar und nach Lemma 5.(b) ist damit auch h = f g Riemannintegrierbar. Für jedes y Q ist h y = g(y) f nach Lemma 5.(c) Riemann-integrierbar mit h Q y = g(y) Q f, also ergeben der Satz von Fubini Satz 8 und eine weitere Anwendung von Lemma 5.(c) schließlich ( ) ( ) ( ) h(x, y) d(x, y) = g(y) f(x) dx dy = f(x) dx g(y) dy. Q Q Q Q Q Da die charakteristische Funktion eines cartesischen Produkts im Sinne des Lemmas separiert ist, folgt schließlich auch: Korollar 4.21 (Cartesische Produkte Jordan-meßbarer Mengen) Seien n, m N mit n, m 1 und seien M R n und M R m zwei Jordan-meßbare Mengen. Dann ist auch die Menge M := M M R n+m Jordan-meßbar und es gilt vol(m) = vol(m ) vol(m ). Beweis: Wähle nicht ausgeartete Quader Q R n und Q R m mit M Q und M Q. Dann ist auch Q := Q Q R n+m ein nicht ausgearteter Quader mit M Q. Für jedes (x, y) Q gilt χ M (x, y) = 1 (x, y) M x M y M d.h. es ist χ M (x) = 1 χ M (y) = 1 χ M (x) χ M (y) = 1, χ M (x, y) = χ M (x) χ M (y). Nach Lemma 2 ist χ M Riemann-integrierbar mit ( ) ( ) χ M (x, y) d(x, y) = χ M (x) dx χ M (y) dy = vol(m ) vol(m ). Q Q Q Damit ist M eine Jordan-meßbare Menge und es gilt vol(m) = χ M (x, y) d(x, y) = vol(m ) vol(m ). Q 131

132 Mathematik für Physiker III, WS 212/213 Freitag Schwerpunkte In diesem kurzen Abschnitt wollen wir die sogenannten Schwerpunkte Jordan-meßbaren Mengen einführen, und um dieses zu tun benötigen wir eine vektorwertige Version des Riemann-Integrals, die wir komponentenweise definieren. Definition 4.11: Seien n, m N mit n, m 1, M R n eine Jordan-meßbare Menge und f : M R m eine Funktion. Dann heißt die Funktion f Riemann-integrierbar wenn die Komponentenfunktionen f k : M R für jedes 1 k m alle Riemannintegrierbar sind. In diesem Fall definieren wir das Integral ( ) f(x) dx := f k (x) dx R m. M M 1 k m In diesem Fall sind die Komponentenfunktionen f k als Riemann-integrierbare Funktionen alle beschränkt, und damit ist auch die Funktion f selbst beschränkt. Die Ergebnisse des vorigen Abschnitts übertragen sich soweit sinnvoll durch Betrachtung der einzelnen Komponenten auf das vektorwertige Riemann-Integral. Wie gesagt wollen wir den Schwerpunkt einer Jordan-meßbaren Menge M R n definieren, und wir machen zunächst eine kleine heuristische Vorüberlegung um die anstehende Definition zu motivieren. Angenommen wir haben einen physikalischen Körper K im R 3. Der Körper habe die Gesamtmasse M. Zerlegen wir den Körper M in kleine Teilkörper K 1,..., K n und bezeichnen für 1 i n die Masse des Teilstücks K i mit M i und das Volumen dieses Teilstücks mit V i, so ist ϱ i := M i /V i die relative Dichte von K i. Die Masse M schreibt sich dann als n M = ϱ i V i. i=1 Dann führen wir den Grenzübergang nach immer feiner werdenden Zerlegungen von K durch. Ist x K ein Punkt, so konvergieren die x enthaltenden Stückchen M i gegen {x}, also sollten ihre relativen Dichten ϱ i gegen die Dichte ϱ(x) von K im Punkt x konvergieren. Interpretieren wir die obigen Summen n i=1 ϱ iv i als Riemannsummen, so erwarten wir die Konvergenz dieser Riemannsummen gegen das Integral ϱ(x) dx. K Da die Riemannsummen andererseits konstant gleich M sind, wird M = ϱ(x) dx. K Das ist natürlich alles keine Mathematik, um es zu welcher zu machen drehen wir die Lage um und interpretieren diese Gleichung als Definition der Masse M von K bei gegebener Dichte ϱ. Soviel zur Masse, kommen wir jetzt zum Schwerpunkt. Haben wir endlich viele Massepunkte p 1,..., p n R 3 mit Massen M 1,..., M n und Gesamtmasse M = M M n, so ist der Schwerpunkt s dieser Massepunkte im gewichteten Mittel s = n i=1 132 M i M p i.

133 Mathematik für Physiker III, WS 212/213 Freitag Wir wollen diese diskrete Schwerpunktformel in eine kontinuierliche Form bringen, wir nehmen uns also wieder unseren obigen Körper K R 3 mit Gesamtmasse M und Dichtefunktion ϱ. Denken wir uns K wie oben als K = K 1... K n zerlegt, so wird der Schwerpunkt s(k) von K näherungsweise zu s(k) n i=1 M i M p i = 1 M n ϱ i p i V i, wobei p i den Schwerpunkt von M i bezeichnet. Führen wie wieder den Grenzübergang nach immer feiner werdenden Zerlegungen durch, so konvergieren die einen Punkt x K enthaltenden Teilstückchen M i gegen {x}, ihre Schwerpunkte p i konvergieren gegen x und ihre relativen Dichten ϱ i konvergieren gegen ϱ(x). In der obigen Näherung von s(k) steht in jeder Komponente 1 k n eine Riemannsumme des Integrals ϱ(x)x K k dx, diese Riemannsummen werden also gegen das komponentenweise definierte Integral ϱ(x)x dx konvergieren. Da sie andererseits auch gegen den Schwerpunkt K s(k) konvergieren ergibt sich s(k) = 1 ϱ(x)x dx. M Um eine mathematische Definition zu erhalten, definieren wir den Schwerpunkt dann durch die rechte Seite dieser Gleichung. Definition 4.12: Seien n N mit n 1 und M R n eine Jordan-meßsbare Menge. Eine Dichte auf M ist eine Riemann-integrierbare Funktion ϱ : M R mit ϱ(x) für alle x M. Die Gesamtmasse von M bezüglich der Dichte ϱ definieren wir als vol ϱ (M) := ϱ(x) dx. Ist vol ϱ (M) >, so heißt s ϱ (M) := M K i=1 1 ϱ(x)x dx R n vol ϱ (M) M der Schwerpunkt von M bezüglich der Dichte ϱ. Ist speziell ϱ(x) = 1 für alle x M, so nennen wir s(m) := s ϱ (M) den Schwerpunkt von M. Für die mathematische Definition wird die Bedingung ϱ(x) für alle x R nicht benötigt, wir setzen sie hier nur voraus da das Wort Schwerpunkt bei negativen Dichten etwas unglücklich wäre. In unseren Beispielen betrachten wir nur den Fall der Dichte ϱ = 1. Als ein erstes Beispiel nehmen wir den schon im vorigen Abschnitt verwendeten Normalbereich M := {(x, y) R 2 x 1, x y 1 + x 2 } R 2. Wir hatten bereits die beiden Integrale x dx(x, y) = 5 12 und M 133 M y d(x, y) = 23 3

134 Mathematik für Physiker III, WS 212/213 Dienstag berechnet, schreiben wir also p = (x, y), so ist p dp = M ( 5 12, 23 3 Zum Bestimmung des Schwerpunkt benötigen wir noch die Fläche von M, und diese berechnet sich als vol(m) = 1 Der Schwerpunkt von M ist damit s(m) = ). (x 2 x + 1) dx = = vol(m) M p dp = ( 1 2, 23 ). 25 Vorlesung 13, Dienstag In der letzten Sitzung hatten wir den Schwerpunkt s(m) einer Jordan-meßbaren Menge M R n von positiven Volumen vol(m) > durch die Formel 1 s(m) = x dx vol(m) definiert. Etwas allgemeiner hatten wir sogar den Schwerpunkt von M bezüglich einer auf M definierten Dichtefunktion ϱ eingeführt, aber diese Verallgemeinerung spielt erst einmal keine Rolle. Zum Einstieg wollen wir zunächst ein paar Beispiele rechnen. Wir beginnen dabei mit dem Schwerpunkt eines nicht ausgearteten Quaders. Sei also Q R n ein nicht ausgearteter Quader und schreibe Q = [a, b] mit a, b R n. In jeder Komponente 1 k n des den Schwerpunkt definierenden Integrals steht dann ein Integrand in separierter Form und es ergibt sich Q x k dx = also ist insgesamt 1 i n i k (b i a i ) s(q) = bk a k 1 x dx = vol(q) Q M x dx = vol(q) b2 k a2 k b k a k 2 ( ) ak + b k 2 1 k n = 1 2 vol(q) (a k + b k ), = a + b 2. Dieses Ergebnis haben wir natürlich auch erwartet und im nächsten Abschnitt werden wir sehen, dass man diesen Schwerpunkt auch ohne die Berechnung eines Integrals 134

135 Mathematik für Physiker III, WS 212/213 Dienstag bestimmen kann. Wir kommen zum nächsten Beispiel, dem Schwerpunkt einer Kugel. Seien also ein Mittelpunkt p R n sowie ein Radius r > gegeben und setze B := B r (p) R n. Das allgemeine Ergebnis im n-dimensionalen Fall werden wir im nächsten Abschnitt behandeln, an dieser Stelle schauen wir uns nur die beiden kleinen Dimensionen n = 2 und n = 3 an. Im zweidimensionalen Fall schreibe p = (a, b) und rechne mit der im vorigen Abschnitt behandelten Formel zur Integration über zweidimensionale Normalbereiche b+r a+ r 2 (y b) 2 x d(x, y) = x dx dy B b r a r 2 (y b) 2 = 1 b+r [(a + r 2 2 (y b) 2 ) 2 (a ] r 2 (y b) 2 ) 2 dy = 2a b r b+r b r r2 (y b) 2 dy = a vol(b). Mit vertauschten Rollen von x und y ergibt sich ebenso y d(x, y) = b vol(b), also ist insgesamt s(b) = (a, b) = p, d.h. der Schwerpunkt von B ist, wie zu erwarten war, genau der Mittelpunkt von B. Wir schauen uns jetzt auch noch die dreidimensionale Kugel an, also n = 3 und schreibe den Mittelpunkt als p = (a, b, c). Die Formel für die Integration über dreidimensionale Normalbereiche nimmt hier die Form c+r b+ r 2 (z c) 2 a+ r 2 (y b) 2 (z c) 2 x d(x, y, z) = x dx dy dz B c r a r 2 (y b) 2 (z c) 2 b r 2 (z c) 2 an. Fixiere ein z (c r, c + r). Ist dann s(z) := r 2 (z c) 2 >, so haben wir für jedes y [b s(z), b + s(z)] stets s(z) 2 (y b) 2 = r 2 (y b) 2 (z c) 2, d.h. es ist b+ r 2 (z c) 2 a+ r 2 (y b) 2 (z c) 2 a+ s(z) 2 (y b) 2 b r 2 (z c) 2 x dx dy = a r 2 (y b) 2 (z c) 2 b+s(z) b s(z) x dx dy a s(z) 2 (y b) 2 genau das schon oben berechnete Integral für den zweidimensionalen Kreis mit Mittelpunkt (a, b) und Radius s(z). Einsetzen unseres schon berechneten Integrals liefert damit b+ r 2 (z c) 2 a+ r 2 (y b) 2 (z c) 2 b r 2 (z c) 2 x dx dy a r 2 (y b) 2 (z c) 2 Unser Gesamtintegral wird zu c+r x d(x, y, z) = πa (r 2 (z c) 2 ) dz B c r ( ( = πa 2r 3 (z c) 3 3 = a vol(b s(z) (a, b)) = πas(z) 2 = πa(r 2 (z c) 2 ). c+r c r )) = 4 3 πar3 = a vol(b). 135

136 Mathematik für Physiker III, WS 212/213 Dienstag Ebenso ergibt sich für die anderen beiden Koordinaten y d(x, y, z) = b vol(b) und z d(x, y, z) = c vol(b), B und der Schwerpunkt s(b) = (a, b, c) = p ist erneut der Mittelpunkt der Kugel. Für das nächste Beispiel kehren wir zum zweidimensionalen Fall n = 2 zurück und berechnen den Schwerpunkt eines Halbkreises H = B + r (p) mit p = (a, b). Die Fläche von H haben wir bereits früher als vol(h) = πr 2 /2 bestimmt. Die Berechnung des Integrals über x können wir auf ein schon behandeltes Integral zurückführen. Setzen wir B := B r (p), so ergibt die Formel zur Integration über zweidimensionale Normalbereiche H x d(x, y) = = 1 2 a+r b+ r 2 (x a) 2 a r b a+r b+ r 2 (x a) 2 a r x dy dx x dy dx = 1 b r 2 (x a) 2 2 B B x d(x, y) = a vol(b) = a vol(h). 2 Dass die x-koordinate des Schwerpunkts von H bei x = a liegt ist wieder einmal das von uns erwartete Ergebnis. Was allerdings die y-koordinate sein wird ist nicht so leicht zu sehen, also rechnen wir sie einmal aus H y d(x, y) = = 2b b+r a+ r 2 (y b) 2 b b+r b y dx dy = 2 a r 2 (y b) 2 b+r r2 (y b) 2 dy + b+r b y r 2 (y b) 2 dy 2(y b) r 2 (y b) 2 dy b ( = b vol(h) 2 ) b+r (r 2 (y b) 2 ) 3/2 = b vol(h) r3. b Der Schwerpunkt ist damit s(h) = ( a, b + 4 ) 3π r. Dabei ist 4/(3π) Zur Behandlung zweier weiterer Beispiele wollen wir zunächst ein kleines Lemma bereitstellen. In unseren Vorüberlegungen zur Definition des Schwerpunkts sind wir von der diskreten Situation endlich vieler Punktmassen ausgegangen, und wir wollen uns jetzt klarmachen das unser Schwerpunktbegriff diese diskrete Formel zurückliefert, dass wir also den Schwerpunkt einer zusammengesetzten Menge als gewichtetes Mittel der Schwerpunkte der Einzelteile erhalten. Lemma 4.22 (Schwerpunkte zusammengesetzer Körper) Seien n, r N mit n, r 1, M, M 1,..., M r R n Jordan-meßbare Mengen mit M = 136

137 M 2 M 3 M Mathematik für Physiker III, WS 212/213 Dienstag M 1... M r und ϱ eine Dichte auf M. Es gelte vol ϱ (M i ) > für jedes 1 i r und für alle 1 i < j r sei M i M j eine Jordansche Nullmenge. Dann ist s ϱ (M) = r i=1 vol ϱ (M i ) vol ϱ (M) s ϱ(m i ). Beweis: Dies ist ein Teil von Aufgabe (28). Wir wollen uns noch zwei letzte Beispiele anschauen. y y a M 1 r t z a z a a Drei Teilquadrate x Halbkreis und Quadrat x Im ersten Beispiel haben wir die links oben gezeigte Menge M. Die linke untere Ecke sei im Punkt z = (x, y) R 2. Dann bilden wir die drei Quadrate M 1 := [x, x+a] [y+a, y+2a], M 2 := [x, x+a] [y, y+a], M 3 := [x+a, x+2a] [y, y+a], jeweils der Kantenlänge a > und setzen M := M 1 M 2 M 3. Wir wissen bereits das M i für i = 1, 2, 3 eine Jordan-meßbare Menge mit vol(m i ) = a 2 ist und die Schwerpunkte dieser Mengen liegen in s(m 1 ) = (x + 12 a, y + 32 a ), s(m 2 ) = (x + 12 a, y + 12 ) a, s(m 3 ) = (x + 32 a, y + 12 ) a. Nach Lemma 13.(b) ist auch M := M 1 M 2 M 3 eine Jordan-meßbare Menge und da M 1 M 2, M 1 M 3 und M 2 M 3 allesamt ausgeartete Quader also insbesondere Jordansche Nullmengen sind, ergibt Lemma 13.(c) auch vol(m) = 3a 2. Mit Lemma 22 folgt s(m) = 1 3 (( x a y a ) + ( x a y a ) + ( x a y a )) = z a ( 1 1 Für das letzte Beispiel seien wie im rechten obigen Bild gezeigt ein Punkt z = (x, y) R 2 ein Radius r > und zwei weitere reelle Zahlen t, a > mit t + a < r gegeben. 137 ).

138 Mathematik für Physiker III, WS 212/213 Dienstag Dann sind der obere Halbkreis H = B + r (z) und das Quadrat Q der Kantenlänge a mit rechter oberer Ecke in z + te 1 beides Jordan-meßbare Mengen mit ( vol(h) = π 2 r2, s(h) = z + 4 t + 1 3π re 2, vol(q) = a 2 2 und s(q) = z + a ) 1a. 2 Der Durchschnitt H Q ist ein ausgearteter Quader also insbesondere eine Jordansche Nullmenge, also ist M := H Q nach Lemma 13.(b,c) eine Jordan-meßbare Menge mit vol(m) = a 2 + πr 2 /2. Nach Lemma 22 ist der Schwerpunkt von M gleich s(m) = z + πr 2 2a 2 + πr 4r ( 2 3π 1 ) Lineare Transformationen ( 2a 2 t + 1 a 2a 2 + πr 2 2 1a 2 = z + ) ( 1 a 2 (2t + a) 2a 2 + πr r3 a 3 In diesem Abschnitt wollen wir das Verhalten des Volumens unter linearen und affinen Transformationen untersuchen. Eine affine Abbildung ist dabei eine Kombination aus einer linearen Abbildung und einer Translation, also eine Funktion der Form ϕ : R n R n ; x T x + u wobei T R n n eine n n-matrix und u R n ein Vektor sind. Beachte das T und u umgekehrt eindeutig durch die affine Abbildung ϕ festgelegt sind, wir nennen u den Translationsanteil und T den linearen Anteil von ϕ. Eine solche Abbildung ist genau dann bijektiv wenn die Matrix T invertierbar. Ein spezieller Typ affiner Abbildungen sind die in II. 7 eingeführten Bewegungen, in der hier eingeführten Sprechweise sind dies genau die affinen Abbildungen deren linearer Anteil eine orthogonale Matrix ist. Diese Bewegungen erhalten den Abstand von Punkten, denn ist T in der obigen Situation orthogonal so gilt für alle x, y R n stets ϕ(x) ϕ(y) = (T x + u) (T y + u) = T (x y) = x y, wobei mit hier die euklidische Norm gemeint ist. Für uns besonders wichtig sind die Spiegelungen an affinen Hyperebenen. Angenommen wir haben eine affine Hyperebene H R n. Wie in I beschrieben können wir H in Hessescher Normalform als H = {x R n u x = c} schreiben, wobei u R n ein Normalenvektor auf H und c R sind. Nach II. 7.2 führen wir dann die Spiegelungsmatrix S := 1 2uu t ein, und die Spiegelung σ H an H ist dann die affine Abbildung mit linearen Anteil S und Translationsanteil 2cu, also explizit σ H (x) = Sx + 2cu 138 ).

139 Mathematik für Physiker III, WS 212/213 Dienstag für alle x R n. Da Spiegelungsmatrizen orthogonal sind, ist σ H eine Bewegung. Für jedes x R n haben wir σ H (x) = x = Sx x + 2cu = 2cu 2uu t x = 2(c u x )u u x = c x H, d.h. σ H fixiert genau die Punkte der affinen Hyperebene H. Eine weitere spezielle Klasse affiner Abbildungen haben wir bereits in Aufgabe (25) untersucht, nämlich diejenigen deren linearer Anteil nur eine Umskalierung der Koordinatenachsen ist. Die Matrix T habe also die Form T = D(c 1,..., c n ) := c 1... mit c 1,..., c n R\{}. Die affine Abbildung ϕ ist dann c n ϕ : R n R n ; x (c 1 x 1 + u 1,..., c n x n + u n ) und in Aufgabe (25) wurde gezeigt das für jeden nicht ausgearteten Quader Q R n auch das Bild Q := ϕ(q) ein nicht ausgearteter Quader ist und das für beschränkte Funktionen f : Q R die Riemann-Integrierbarkeit von f und von f ϕ gleichwertig sind, und das bei vorliegender Integrierbarkeit die Transformationsformel Q f(ϕ(x)) dx = 1 c 1... c n Q f(x) dx gilt. Nehme jetzt weiter an, dass M R n eine Jordan-meßbare Menge ist. Dann wählen wir einen nicht ausgearteten Quader Q R n mit M Q und haben dann auch ϕ(m) ϕ(q) = Q. Für jedes x Q ist weiter { { 1, ϕ(x) ϕ(m), χ ϕ(m) (ϕ(x)) =, ϕ(x) / ϕ(m) = 1, x M,, x / M = χ M(x), d.h. es ist χ ϕ(m) ϕ = χ M. Da χ M : Q R Riemann-integrierbar ist, ist somit auch χ ϕ(m) : Q R Riemann-integrierbar, d.h. ϕ(m) ist eine Jordan-meßbare Menge und es gilt vol(ϕ(m)) = χ ϕ(m) (x) dx = c 1... c n χ M (x) dx = c 1... c n vol(m). Q Q Diese Beobachtung ist insbesondere auf Spiegelungen an Koordinatenhyperebenen anwendbar. Seien nämlich 1 i n und c R gegeben. Die durch die Gleichung x i = c gegebene affine Hyperebene H ist in Hessescher Normalform gegeben als e i x = c, wir haben also den Normalenvektor u = e i und die Spiegelungsmatrix S i = 1 2e i e t i = D(1,..., 1, }{{} 1, 1,..., 1), i 139

140 Mathematik für Physiker III, WS 212/213 Dienstag also ist die Spiegelung an H gegeben durch σ H (x) = (x 1,..., x i 1, 2c x i, x i+1,..., x n ) und für jede Jordan-meßbare Menge M R n ist auch σ H (M) R n Jordan-meßbar mit vol(σ H (M)) = vol(m). Diese simple Beobachtung hat schon einige nützliche Konsequenzen. Im letzten Abschnitt hatten wir zum Beispiel das Volumen einer Halbkugel B = B + r (z) im R n für n = 2 ausgerechnet und das erwartete Ergebnis erhalten. Wir wollen jetzt einsehen, dass man das Volumen einer solchen Halbkugel tatsächlich ohne jede Rechnung herleiten kann. Hierzu betrachten wir die Spiegelung σ an der durch x n = z n gegebenen Hyperebene, d.h. die Funktion σ : R n R n ; x (x 1,..., x n 1, 2z n x n ). Da σ eine Bewegung mit σ(z) = z ist, gilt auch σ(b r (z)) = B r (z), denn für jedes x R n haben wir σ(x) z = σ(x) σ(z) = x z. Da für jedes x R n auch 2z n x n = σ(x) n z n gleichwertig zu x n z n ist, haben wir σ(b r (z)) = B + r (z). Weiter ist B + r (z) B r (z) R n 1 {z n } eine kompakte Teilmenge einer Hyperebene, also nach Lemma 6.(f) eine Jordansche Nullmenge. Mit Lemma 13.(c) ergibt sich somit vol(b r (z)) = vol(b + r (z)) + vol(b r (z)) = vol(b + r (z)) + vol(σ(b r (z))) = 2 vol(b + r (z)), d.h. wir haben vol(b + r (z)) = 1 2 vol(b r(z)). Speziell für n = 2 ergibt sich die Fläche eines Halbkreises erneut als πr 2 /2. Eine ähnliche Überlegung ist für den Schwerpunkt möglich. Wir betrachten wieder unsere affine Abbildung ϕ : R n R n ; x (c 1 x 1 + u 1,..., c n x n + u n ) und sei M R n eine Jordan-meßbare Menge mit vol(m) >. Dann wissen wir bereits das auch ϕ(m) eine Jordan-meßbare Menge mit vol(ϕ(m)) = c 1... c n vol(m) > ist. Wir wählen wieder einen nicht-ausgearteten Quader Q R n mit M Q. Für jedes 1 k n gilt dann nach Lemma 9.(a) x k dx = x k χ ϕ(m) (x) dx = c 1... c n (u k + c k x k )χ M (x) dx ϕ(m) ϕ(q) (( ) ) = c 1... c n χ M (x) dx u k + c k x k χ M (x) dx Q Q = c 1... c n (vol(m)u k + c k 14 Q M ) x k dx.

141 Mathematik für Physiker III, WS 212/213 Dienstag Dies bedeutet ϕ(m) ( x dx = vol(ϕ(m))u + c 1... c n T M ) x dx, wobei wir wieder T := D(c 1,..., c n ) schreiben. Es folgt s(ϕ(m)) = 1 x dx = u+t vol(ϕ(m)) ϕ(m) ( 1 x dx vol(m) M ) = u+t s(m) = ϕ(s(m)). Wie wir später sehen werden, gilt dies tatsächlich für überhaupt jede affine Abbildung mit invertierbaren linearen Anteil. Hiermit können wir jetzt beispielsweise ohne Rechnung begründen das der Schwerpunkt einer n-dimensionalen Kugel ihr Mittelpunkt ist. Seien nämlich z R n und r > gegeben und setze B := B r (z). Für jedes 1 k n erfüllt die Spiegelung σ k an der Hyperebene x k = z k dann wie oben σ k (B) = B, also ist auch s(b) = s(σ k (B)) = σ k (s(b)), d.h. der Schwerpunkt s(b) liegt auf der Hyperebene x k = z k. Da dies für alle 1 k n gilt, liegt s(b) auf jeder dieser Hyperebenen, d.h. es gilt s(b) k = z k für alle 1 k n und somit s(b) = z. Analog kann man so auch einsehen das der Schwerpunkt eines nicht ausgearteten Quaders sein Mittelpunkt ist, man betrachtet wieder die Spiegelungen an affinen Koordinatenhyperebenen durch diesen Mittelpunkt. Wir wollen die Transformationsformeln jetzt auf beliebige affine Abbildungen ausdehnen. Dabei behandeln wir in diesem Kapitel nur noch die Volumentransformation, die Transformationsformel für Integrale wird dann im nächsten Kapitel gleich in einem allgemeineren Rahmen hergeleitet. Leider ist auch die Volumentransformation komplizierter als es in Aufgabe (25) war. Die bisher behandelten affinen Abbildungen haben den Vorteil das sie achsenparallele Quader wieder auf achsenparallele Quader abbilden, daher konnten wir einfach schrittweise die Stufen unserer Integraldefinition durchgehen. Für allgemeine affine Transformationen ist dies nicht mehr der Fall, selbst eine Drehung bildet achsenparallele Quader zwar wieder auf Quader aber eben nicht auf achsenparallele Quader ab. Daher werden wir zwei Hilfsmittel benötigen, die wir jetzt erst einmal besprechen wollen. Wir beginnen mit dem sogenannten Exhaustionsprinzip. Das Urbeispiel für dieses ist die Berechnung von π. Die Zahl π ist die Fläche des Einheitskreises B, und um π anzunähern bilden wir ein in B eingeschriebenes n-eck C und ein B umfassendes n-eck C. Wegen C B C ist dann vol(c) vol(b) = π vol(c ), und da die Flächen von gleichmäßigen n-ecken sich leicht berechnen lassen, erhält man so eine obere und eine untere Schranke für π. Wählt man n ausreichend groß so ergeben sich auf diese Weise beliebig gute Näherungen. Wir wollen dassselbe Grundprinzip verfolgen, also eine gegebene Jordan-meßbare Menge M durch einfache Mengen von innen 141

142 Mathematik für Physiker III, WS 212/213 Dienstag und außen annähern. Für unsere Zwecke sind n-ecke nicht so günstig, und wir verwenden anstelle dessen aus endlich vielen achsenparallelen Quadern zusammengesetzte Mengen, sogenannte Quaderfiguren. Zur Vorbereitung des nächsten Kapitels werden wir dies gleich hier noch etwas weiter verfeinern, wir lassen keine beliebigen Quader zu, sondern nur noch Würfel und von diesen verlangen wir auch noch das die Koordinaten all ihrer Ecken die Form k/2 n mit k Z, n N haben. Derartige Zahlen werden gerne dyadisch genannt, und dies führt uns auf die folgende Definition dyadischer Würfel. Definition 4.13: Eine reelle Zahl x R heißt dyadisch, beziehungsweise dyadisch der Stufe m N, wenn es ein k Z mit x = k/2 m gibt. Weiter sei n N mit n 1 gegeben. Dann heißt ein Vektor x R n dyadisch, beziehungsweise dyadisch der Stufe m N, wenn jede Komponente von x dyadisch, beziehungsweise dyadisch der Stufe m ist. Schließlich heißt eine Teilmenge W R n ein dyadischer Würfel, beziehungsweise ein dyadischer Würfel der Stufe m N, wenn W ein Würfel ist und es dyadische Vektoren, beziehungsweise dyadische Vektoren der Stufe m, a, b R n mit W = [a, b] gibt. Summen und Differenzen dyadischer Zahlen der Stufe m N sind wieder solche, und außerdem ist jede dyadische Zahl x R der Stufe m N auch dyadisch von jeder Stufe m m, ist nämlich x = k/2 m mit k Z, so ist auch x = 2 m m k/2 m. Ein dyadischer Würfel der Stufe m N hat explizit die Form W = [ k1 2, k ] 1 + l m 2 m [ kn 2, k ] n + l m 2 m mit k Z n und l N\{}. Das Volumen von W ist dann vol(w ) = l n /2 nm. Speziell mit l = 1 erhalten wir für k Z n, m N die Standardwürfel [ k1 W m,k := 2, k ] [ kn m 2 m 2, k ] n + 1 m 2 m der Stufe m. Sei nun m N gegeben. Dann können wir R als eine disjunkte Vereinigung R = [ k 2, k + 1 ) m 2 m k Z schreiben, und da für x R genau dann x k/2 m gilt wenn k 2 m ist, ist der Index k Z mit x [k/2 m, (k + 1)/2 m ) gegeben als k = [2 m x]. Damit folgt weiter das sich der R n als eine Vereinigung von Standardwürfeln der Stufe m schreiben läßt, nämlich R n = k Z W n m,k. Sind dabei k, l Z n mit k l, so ist W m,k W m,l ein ausgearteter Quader. Damit können wir jetzt unsere für das Exhaustionsprinzip gedachten einfachen Mengen einführen. Definition 4.14: Sei n N mit n 1 gegeben. Eine Teilmenge M R n heißt eine Quaderfigur wenn es endlich viele nicht ausgeartetet Quader Q 1,..., Q r R n mit M = r k=1 Q k gibt. Weiter heißt M eine dyadische Würfelfigur, beziehungsweise eine 142

143 Mathematik für Physiker III, WS 212/213 Dienstag dyadische Würfelfigur der Stufe m N, wenn alle Q i als dyadische Würfel, beziehungsweise als dyadische Würfel der Stufe m, gewählt werden können. Wir wollen uns eine Kleinigkeit über Quaderfiguren überlegen. Seien M R n eine Quaderfigur und Q R n ein nicht ausgearteter Quader mit M Q. Dann gibt es nicht ausgeartete Quader Q 1,..., Q r R n mit M = r k=1 Q k, also auch Q k Q für jedes 1 k r. Nach Lemma 13.(b) ist M eine Jordan-meßbare Menge. Wie wir schon früher eingesehen haben, gibt es für jedes 1 k r eine Zerlegung α k von Q. die Q k als einen ihrer Teilquader enthält. Ist dann α eine gemeinsame Verfeinerung von α 1,..., α r, so ist jedes Q k für 1 k r eine Vereinigung von Teilquadern der Zerlegung α, also ist auch ganz M eine solche Vereinigung. Wir können also immer annehmen, dass alle Q 1,..., Q r zu einer Zerlegung von Q gehören. Sind Q 1,..., Q r mit dieser Eigenschaft gewählt, so ist für alle 1 i, j r mit i j der Durchschnitt Q i Q j stets eine Teilmenge einer affinen Hyperebene, also nach Lemma 6.(f) insbesondere eine Jordansche Nullmenge. Nach Lemma 13.(c) ist damit auch vol(m) = r vol(q k ). k=1 Wir können diese Aussage noch etwas weiter verschärfen. Sei hierzu zusätzlich eine Konstante ɛ > vorgegeben. Wie wir uns bereits früher einmal überlegt hatten, existiert für jedes 1 k r erneut eine Zerlegung β k von Q die Q k als einen ihrer Teilquader enthält und zusätzlich die Bedingung j I βk Q k Q βk,j vol(q βk,j) < vol(q k ) + ɛ r + 1 erfüllt. Sei dann schließlich β eine gemeinsame Verfeinerung der Zerlegungen β 1,..., β r. Ist dann j I β mit M Q β,j, so existiert ein 1 k r mit Q k Q β,j und wegen β β k gibt es weiter ein j I βk mit Q β,j Q βk,j und damit gilt auch Q k Q βk,j. Also ist jeder der Quader Q k für 1 k r eine Vereinigung von Teilquadern der Zerlegung β, d.h. auch M ist eine solche Vereinigung, und zusätzlich liegt jeder M schneidende Teilquader der Zerlegung für ein 1 k r auch in einem der Teilquader der Zerlegung β k die Q k schneiden. Hieraus folgt j I β M Q β,j vol(q β,j ) r k=1 j I βk Q βk,j Q k vol(q βk,j) r k=1 ( vol(q k ) + ɛ ) < vol(m) + ɛ. r + 1 Damit können wir zu unserer Form des Exhaustionsprinzips kommen. Lemma 4.23 (Exhaustionsprinzip für Jordan-meßbare Mengen) Seien n N mit n 1 und M R n eine beschränkte Teilmenge. (a) Die folgenden drei Aussagen sind äquivalent: 143

144 Mathematik für Physiker III, WS 212/213 Dienstag Die Menge M ist Jordan-meßbar. 2. Für jedes ɛ > existieren zwei Quaderfiguren M, M + R n mit M M M + und vol(m + ) vol(m ) < ɛ. 3. Für jedes ɛ > existieren Jordan-meßbare Mengen M, M + R n mit M M M + und vol(m + ) vol(m ) < ɛ. (b) Ist M Jordan-meßbar, so gibt es für jedes ɛ > stets dyadische Würfelfiguren M, M + R n mit M M M + und vol(m) ɛ < vol(m ) vol(m) vol(m + ) < vol(m)+ɛ. Beweis: (b) Sei ɛ > und wähle a, b Z n mit a k < b k für alle 1 k n so, dass M Q := [a, b] gilt. Da M Jordan-meßbar ist, ist die charakteristische Funktion χ M : Q R Riemann-integrierbar, also gibt es nach Satz 2 ein δ > so, dass für jede Zerlegung α von Q mit δ(α) < δ stets S(χ M ; α) S(χ M ; α) < ɛ gilt. Wähle weiter ein m N mit 1/2 m < δ. Für jedes 1 k n ist dann ( α k := a k + j ) 2 m j 2 m (b k a k ) eine Zerlegung von [a k, b k ] mit δ(α k ) = 1/2 m und insgesamt ist α := (α k ) 1 k n eine Zerlegung von Q mit δ(α) = 1/2 m < δ. Für jedes j I α ist W j = Q α,j dabei ein dyadischer Würfel der Stufe m. Wegen vol(m) = χ M = χ M = gelten auch S(χ M ; α) = S(χ M ; α) + (S(χ M ; α) S(χ M ; α)) < und S(χ M ; α) = S(χ M ; α) (S(χ M ; α) S(χ M ; α)) > Wir erhalten die dyadischen Würfelfiguren M := W j und M + := Q Q χ M Q Q Q χ M + ɛ = vol(m) + ɛ χ M ɛ = vol(m) ɛ. W j j I α W j M j I α M W j mit M M M + und vol(m ) = j I α W j M vol(w j ) = S(χ M ; α) > vol(m) ɛ 144

145 Mathematik für Physiker III, WS 212/213 Dienstag und vol(m + ) = j I α M W j vol(w j ) = S(χ M ; α) < vol(m) + ɛ. (a) (1)= (3). Klar mit M = M + = M. (3)= (2). Sei ɛ > gegeben. Dann existieren Jordan-meßbare Mengen M, M + R n mit M M M + und vol(m + ) vol(m ) < ɛ/3. Nach (b) gibt es weiter Quaderfiguren Q 1, Q 2, Q + 1, Q + 2 R n mit Q 1 M Q 2, Q + 1 M + Q + 2 so, dass vol(q 2 ) vol(q 1 ) < ɛ/3 und vol(q + 2 ) vol(q + 1 ) < ɛ/3 gelten. Damit ist auch Q 1 M M M + Q + 2. Wegen Q + 1 M + und M Q 2 gelten nach Lemma 13.(a) auch vol(q + 1 ) vol(m + ) und vol(m ) vol(q 2 ), d.h. wir haben vol(q + 2 ) vol(q 1 ) vol(q + 2 ) vol(q + 1 )+vol(m + ) vol(m )+vol(q 2 ) vol(q 1 ) < ɛ. (2)= (1). Wähle einen nicht ausgearteten Quader Q R n mit M Q. Sei ɛ >. Dann gibt es Quaderfiguren M, M + R n mit M M M + und vol(m + ) vol(m ) < ɛ/2. Insbesondere ist M M Q. Weiter gibt es nicht ausgeartete Quader Q 1,..., Q r R n mit M + = r k=1 Q k. Setzen wir J := {1 k r M Q k } und M := k J Q k, so ist auch M M M +. Für jedes k J ist wegen M Q k Q Q k auch Q Q k, d.h. Q k := Q Q k ist wieder ein nicht ausgearteter Quader mit Q k Q. Wegen M Q gilt für die Menge M := k J Q k Q auch M M M M M + und somit ist nach Lemma 13.(a) auch vol(m ) vol(m ) vol(m + ) vol(m ) < ɛ 2. Wie eingangs festgestellt gibt es eine Zerlegung α von Q so, dass M eine Vereinigung von Teilquadern der Zerlegung α ist und weiter existiert dann auch eine Zerlegung β α von Q so, dass M eine Vereinigung von Teilquadern der Zerlegung β ist und zusätzlich vol(q β,j ) < vol(m ) + ɛ 2 j I β M Q β,j gilt. Wegen β α ist dann auch M eine Vereinigung von Teilquadern der Zerlegung 145

146 Mathematik für Physiker III, WS 212/213 Dienstag β. Es folgt S(χ M ; β) S(χ M ; β) = j I β vol(q β,j ) vol(q β,j ) M Q β,j j I β M Q β,j j I β Q β,j M vol(q β,j ) vol(m ) < vol(m ) vol(m ) + ɛ 2 < ɛ. Nach Satz 2 ist χ M : Q R Riemann-integrierbar, d.h. M ist eine Jordan-meßbare Menge. Damit haben wir die geometrische Vorarbeit erledigt, und wir benötigen jetzt nur noch ein kleines matrizentheoretisches Hilfsmittel. Angenommen es ist n N und wir haben eine invertierbare n n-matrix A GL n R. Nach I. 9.Satz 5 hat das homogene lineare Gleichungssystem Ax = dann nur die triviale Lösung führen wir also das in I. 8 beschriebene Gaußsche Eliminationsverfahren mit der Koeffizientenmatrix A durch, so entstehen während dieser Rechnung keine langen Stufen. Wir haben also Zwischenmatrizen A = A und A 1,..., A r R n n wobei A i für jedes 1 i r aus A i 1 durch Addition eines Vielfachen einer Zeile zu einer anderen Zeile entsteht und die letzte Matrix A r = b 11 b 1n.... b nn obere Dreiecksgestalt hat. Nach I. 1.Lemma 3.(e) ist det A i = det A i 1 für jedes 1 i r, also haben wir auch b b nn = det A r = det A = det A. Führen wir jetzt wie beim Berechnen der inversen Matrix weitere Zeilenoperationen durch um A r auf Diagonalgestalt zu bringen, so erhalten wir Matrizen A r+1,..., A r+s R n n so, dass A i auch für jedes r+1 i r+s aus A i 1 durch Addition eines Vielfachen einer Zeile zu einer anderen Zeile hervorgeht und schließlich A r+s = b b nn eine Diagonalmatrix ist. Sei jetzt 1 k r + s. Dann gibt es 1 i, j n mit i j und λ R so, dass A k aus A k 1 durch Addition des λ-fachen der j-ten Zeilen zur i-ten 146

147 Mathematik für Physiker III, WS 212/213 Dienstag Zeile entsteht. Bilden wir dann die sogenannte Elementarmatrix 1... E k := E ij (λ) :=... λ,... 1 wobei der Eintrag λ in der i-ten Zeile und der j-ten Spalte steht, so ist A k = E k A k 1. Setzen wir all diese Gleichungen ein, so ist A r+s = E r+s A r+s 1 = E r+s E r+s 1 A r+s 2 = = E r+s... E 1 A = E r+s... E 1 A. Für alle 1 i, j n mit i j und alle λ R entsteht E ij ( λ)e ij (λ) aus E ij (λ) durh Subtraktion des λ-fachen der j-ten Zeile zur i-ten Zeile, d.h. es ist E ij ( λ)e ij (λ) = 1, d.h. E ij (λ) ist invertierbar und E ij (λ) 1 = E ij ( λ) ist wieder eine Elementarmatrix. Definieren wir also für 1 k r + s =: m die Elementarmatrix F k := E 1 k, so ist A = F 1... F m T mit der Diagonalmatrix T := A m. Damit kann die Matrix A als ein Produkt von Elementarmatrizen und einer Diagonalmatrix T mit det T = b b nn = det A geschrieben werden. Weiter haben wir für jedes λ R die Matrixgleichung ( ) ( ) ( ) 1 λ 1 λ 1 = wobei ( 1 λ 1 ) 2 ( 1 = 1 ) 2 = 1 sind. Für jedes 1 k m können wir also F k = B k C k mit zwei Matrizen B k, C k R n n schreiben, wobei det B k = det C k = 1 und Bk 2 = C2 k = 1 sind. Damit haben wir auch die Matrix A als ein Produkt A = B 1 C 1... B m C m T geschrieben in dem die ersten 2m Faktoren Determinante 1 und die Einheitsmatrix als ihr Quadrat haben und die letzte Matrix T eine Diagonalmatrix mit det T = det A ist. Damit sind alle Vorbereitungen getroffen und wir kommen zum Beweis der affinen Transformationsformel. Satz 4.24 (Affine Transformationen Jordan-meßbarer Mengen) Seien n N mit n 1, u R n und T R n n eine n n-matrix. Ist dann ϕ die affine Abbildung ϕ : R n R n ; x T x + u, 147

148 Mathematik für Physiker III, WS 212/213 Dienstag so ist für jede Jordan-meßbare Menge M R n auch das Bild ϕ(m) R n Jordanmeßbar und es gilt vol(ϕ(m)) = det T vol(m). Beweis: Zunächst sei T GL n R eine invertierbare reelle n n-matrix und wir betrachten die affine Abbildung ϕ : R n R n ; x T x. Wir beginnen mit einigen Vorbemerkungen. Sei M R n eine beliebige Teilmenge. Nach II. 4.Lemma 16.(a) und II. 4.Lemma 17.(b) sind ϕ(m) R n eine abgeschlossene Menge mit ϕ(m) und ϕ(m) R n eine offene Menge mit ϕ(m) ϕ(m). Da ϕ insbesondere stetig ist, sind damit auch ϕ 1 (ϕ(m)) R n abgeschlossen mit M ϕ 1 (ϕ(m)) und ϕ 1 (ϕ(m) ) R n offen mit ϕ 1 (ϕ(m) ) ϕ 1 (ϕ(m)) = M. Weiter sind nach II. 4.Lemma 16.(b) und II. 4.Lemma 17.(c) sind damit weiter auch M ϕ 1 (ϕ(m)), also ϕ(m) ϕ(m) und ϕ 1 (ϕ(m) ) M, also ϕ(m) ϕ(m ). Dies ergibt ϕ( M) = ϕ(m\m ) = ϕ(m)\ϕ(m ) ϕ(m)\ϕ(m) = ϕ(m). Andererseits ist auch die Umkehrabbildung ϕ 1 die zur Matrix T 1 GL n R gehörende affine Abbildung, wenden wir die eben hergeleitete Inklusion also auf ϕ 1 und die Menge ϕ(m) an, so ergeben sich auch M = ϕ 1 (ϕ(m)) ϕ 1 (ϕ(m) ), also ϕ(m ) ϕ(m), und ϕ 1 ( ϕ(m)) ϕ 1 (ϕ(m)) = M, also ϕ(m) ϕ( M), und insgesamt haben wir ϕ(m) = ϕ(m ) und ϕ( M) = ϕ(m) eingesehen. Für den nächsten Schritt sei Q R n ein ausgearteter Quader. Dann existiert eine affine Hyperebene H R n mit Q R n und somit ist auch ϕ(q) ϕ(h). Da ϕ eine invertierbare lineare Abbildung ist, ist aber auch ϕ(h) eine affine Hyperebene und nach Lemma 6.(f) ist ϕ(q) eine Jordansche Nullmenge. Nun sei Q R n ein nicht ausgearteter Quader. Dann ist der Rand ϕq die Vereinigung von 2n ausgearteten Quadern, also Q = Q 1... Q 2n mit ausgearteten Quadern Q 1,..., Q 2n R n und somit ist auch ϕ(q) = ϕ( Q) = ϕ(q 1 )... ϕ(q 2n ) eine Vereinigung von 2n Jordanschen Nullmengen und somit nach Lemma 6.(b) selbst eine Jordansche Nullmenge. Da ϕ(q) auch beschränkt ist, ist ϕ(q) R n nach Satz 14 eine Jordan-meßbare Menge. Dabei ist ϕ(q) = ϕ(q ), also ist nach Aufgabe (3) auch vol(ϕ(q)) >. Damit können wir jetzt den ersten Hauptschritt in diesem Beweis durchführen. Wir betrachten den nicht ausgearteten Quader W := [, 1] n und wissen dann bereits das ϕ(w ) R n Jordan-meßbar ist mit (T ) := vol(ϕ(w )) >. Sei jetzt Q R n ein beliebiger nicht ausgearteter Würfel. Dann gibt es ein a R n und eine Kantenlänge c > mit Q = [a, b] wobei b := (a k +c) 1 k n ist. Dann ist Q = a+cw und die Linearität von ϕ liefert ϕ(q) = ϕ(a + cw ) = ϕ(a) + c ϕ(w ). 148

149 Mathematik für Physiker III, WS 212/213 Dienstag Nach unseren Beobachtungen zu Beginn dieses Abschnitts ist damit auch ϕ(q) R n eine Jordan-meßbare Menge mit vol(ϕ(q)) = c n vol(ϕ(w )) = c n (T ) = (T ) vol(q). Jetzt sei M R n eine dyadische Würfelfigur. Wähle dann ein m N so, dass M eine dyadische Würfelfigur von Stufe m ist. Dann kann man M als eine endliche Vereinigung M = Q 1... Q r schreiben, wobei Q 1,..., Q r R n dyadische Standardwürfel der Stufe m sind. Für alle 1 i, j r mit i j ist Q i Q j dann ein ausgearteter Quader, also ist ϕ(q i ) ϕ(q j ) = ϕ(q i Q j ) eine Jordansche Nullmenge. Nach Lemma 13.(b,c) ist ϕ(m) = ϕ(q 1 )... ϕ(q r ) R n eine Jordan-meßbare Menge mit vol(ϕ(m)) = r r vol(ϕ(q k )) = (T ) vol(q k ) = (T ) vol(m). k=1 k=1 Im nächsten Schritt sei M R n eine beliebige Jordan-meßbare Menge. Da M insbesondere beschränkt ist, ist dann auch ϕ(m) R n beschränkt. Sei ɛ >. Nach Lemma 23.(b) gibt es dann dyadische Würfelfiguren M, M + R n mit M M M + und vol(m) ɛ 2 (T ) < vol(m ) vol(m) vol(m + ) < vol(m) + ɛ 2 (T ). Wie bereits gezeigt sind die beiden Mengen ϕ(m ), ϕ(m + ) R n Jordan-meßbar mit ϕ(m ) ϕ(m) ϕ(m + ) und vol(ϕ(m + )) vol(ϕ(m )) = (T ) (vol(m + ) vol(m )) < (T ) ɛ (T ) = ɛ. Nach Lemma 23.(a) ist ϕ(m) damit eine Jordan-meßbare Menge. Ist wieder ɛ > so gibt es erneut nach Lemma 23.(a) zwei dyadische Würfelfiguren M, M + R n mit M M M + und vol(m) also ist nach Lemma 13.(a) auch und ɛ (T ) < vol(m ) vol(m) vol(m + ) < vol(m) + ɛ (T ), vol(ϕ(m)) vol(ϕ(m )) = (T ) vol(m ) > (T ) vol(m) ɛ vol(ϕ(m)) vol(ϕ(m + )) = (T ) vol(m + ) < (T ) vol(m) + ɛ. Dies zeigt vol(ϕ(m)) (T ) vol(m) < ɛ, und da ɛ > beliebig war ist somit vol(ϕ(m)) = (T ) vol(m). Soweit haben wir eine einzelne lineare Abbildung betrachtet. Nun seien S, T GL n R gegeben. Dann ist S(W ) R n eine Jordan-meßbare Menge, also haben wir auch (T S) = vol(t (S(W ))) = (T ) vol(s(w )) = (T ) (S). 149

150 Mathematik für Physiker III, WS 212/213 Freitag Ist weiter T GL n R eine Diagonalmatrix, etwa T = D(c 1,..., c n ) mit c 1,..., c n R\{}, so wissen wir bereits aus den Überlegungen zu Beginn dieses Abschnitts das (T ) = vol(t (W )) = c 1... c n vol(w ) = det T gilt. Einen weiteren speziellen Fall können wir ebenfalls behandeln. Angenommen T GL n R ist eine Matrix mit det T = 1 und T 2 = 1. Dann haben wir und wegen (T ) > folgt 1 = (1) = (T T ) = (T ) (T ) = (T ) 2, (T ) = 1 = det T. Schließlich kommen wir zu einer allgemeinen invertierbaren Matrix T GL n R. Wir haben uns bereits überlegt, dass es eine Digaonalmatrix D GL n R und Matrizen S 1,..., S r GL n R mit det S i = 1 und S 2 i = 1 für alle 1 i r gibt so, dass dett = det D und T = S 1... S r D gilt. Mit dem Determinantenmultiplikationssatz I. 1.Satz 5 folgt (T ) = (S 1 )... (S r ) (D) = det S 1... det S r det D = det(s 1... S r D) = det T. Für jede invertierbare Matrix T GL n R und jede Jordan-meßbare Menge M R n ist damit auch T (M) R n Jordan-meßbar mit vol(t (M)) = (T ) vol(m) = det T vol(m). Sind jetzt T R n n eine nicht invertierbare Matrix und M R n eine Jordan-meßbare Menge, so ist der Rang rang T < n, d.h. das Bild T (R n ) von T ist ein echter Untervektorraum des R n. Da T (M) T (R n ) beschränkt ist, ist T (M) nach Lemma 6.(a,f) eine Jordansche Nullmenge, also ist nach Lemma 12 die Menge T (M) R n auch Jordan-meßbar mit vol(t (M)) = = det T vol(m). Schließlich seien T R n n eine beliebige reelle n n-matrix, u R n und betrachte die affine Abbildung ϕ : R n R n ; x T x + u. Sei M R n eine Jordan-meßbare Menge. Wie bereits gezeigt ist dann auch T (M) R n Jordan-meßbar mit vol(t (M)) = det T vol(m). Da wir Translationen schon zu Beginn dieses Abschnitts behandelt haben, ist damit auch die Menge ϕ(m) = T (M) + u R n Jordan-meßbar mit vol(ϕ(m)) = vol(t (M) + u) = vol(t (M)) = det T vol(m). 15

151 Mathematik für Physiker III, WS 212/213 Freitag Vorlesung 14, Freitag Am Ende der letzten Sitzung hatten wir den Beweis der affinen Transformationsformel durchgeführt, dass also für eine affine Abbildung ϕ : R n R n mit linearen Anteil T und jede Jordan-meßbare Menge M R n auch das Bild ϕ(m) R n Jordan-meßbar ist mit vol(ϕ(m)) = det T vol(m). Wir wollen uns jetzt einige kleine Beispiele zur Anwendung dieser Formel anschauen. Sei im folgenden ein n N mit n 1 gegeben. Seien weiter v 1,..., v n R n Vektoren im R n und bezeichne P das sogenannte von diesen Vektoren aufgespannte Parallelepiped P := {t 1 v + + t n v n t 1,..., t n [, 1]}. Im Fall n = 2 ist dies ein Parallelogram das von den beiden Vektoren v 1, v 2 aufgespannt wird, also die Ecken, v 1, v 2 und v 1 + v 2 hat und für n = 3 haben wir den sogenannten von v 1, v 2, v 3 aufgespannten Spat. Weiter betrachten wir den Einheitswürfel W := [, 1] n mit vol(w ) = 1. Ist jetzt T die Matrix mit den Spalten v 1,..., v n ein, so ist für jedes x W stets T x = x 1 v x n v n, d.h. P = T (W ). Nach Satz 24 ist P damit eine Jordan-meßbare Menge und es gilt vol(p ) = vol(t (W )) = det T vol(w ) = det T. Diese Formel ist die geometrische Interpretation der Determinante als das Volumen des von ihren Spalten aufgespannten Parallelepipeds, die schon in I. 1 angedeutet wurde. Begründet hatten wir diesen Zusammenhang bisher erst in den beiden kleinen Dimensionen, für n = 2 in I und für n = 3 in I Das Vorzeichen der Determinante beschreibt die sogenannte Orientierung der Vektoren v 1,..., v n, darauf wollen wir jetzt aber nicht eingehen. Als ein zweites Beispiel betrachten wir die Menge M := {x R n x 1 x 2 x n 1} aller nach Größe ihrer Komponenten sortierten Vektoren zwischen Null ein Eins. Die Menge M ist abgeschlossen und beschränkt, also haben wir nach II. 4.Lemma 18.(b) auch M = M\M. Da die Menge M := {x R n < x 1 < x 2 < < x n < 1} R n offen mit M M ist, gilt nach II. 4.Lemma 17.(c) auch M M. Tatsächlich ist sogar M = M. Ist nämlich x M mit x / M, so existiert ein i n mit 151

152 Mathematik für Physiker III, WS 212/213 Freitag x i = x i+1 wobei zusätzlich x := und x n+1 := 1 gesetzt seien. Ist dann ɛ > beliebig, so setzen wir y := ( ɛ/2, x 2,..., x n ). Dann ist x y = ɛ/2 < ɛ aber y / M, d.h. es ist B ɛ (x) M. Damit ist x kein innerer Punkt von M und wir haben x / M gezeigt. Dies beweist M M und insgesamt ist M = M. Damit ist auch M = M\M = {x M x 1 = x n = 1 (1 i < n) : x i = x i+1 }. Nun sind H := {x R n x 1 = }, H n := {x R n x n = 1} und H i := {x R n x i = x i+1 } für 1 i < n alles affine Hyperebenen, und damit ist M H i nach Lemma 6.(f) für jedes i n eine Jordansche Nullmenge. Somit ist auch M = n (M H i ) i= nach Lemma 6.(b) eine Jordansche Nullmenge und nach Satz 14 ist M Jordan-meßbar. Wir wollen das Volumen vol(m) berechnen. Hierzu betrachten wir für jede Permutation π S n der Indexmenge {1,..., n} die lineare Abbildung T π : R n R n ; x (x π 1 (1),..., x π 1 (n)). Die zu T π gehörende Matrix hat dann die Spalten e π(1),..., e π(n) und nach I. 1.Lemma 3.(c) ist det T π = ( 1) π das Vorzeichen der Permutation π, also ist die Bildmenge M π := T π (M) = {x R n x π(1) x π(2) x π(n) 1} R n nach Satz 24 wieder Jordan-meßbar mit vol(m π ) = vol(m). Sind dabei π, η S n mit π η zwei verschiedene Permutationen, so sind die Komponenten jedes Punktes x M π M η sowohl bezüglich der durch π als auch bezüglich der durch η gegebenen Reihenfolge angeordnet, und da π η ist, ist dies nur möglich wenn zwei dieser Komponenten gleich sind, es gibt also 1 i < j n mit x i = x j. Nun ist H ij := {x R n x i = x j } für alle 1 i < j n eine affine Hyperebene und nach Lemma 6.(f) ist W H ij damit eine Jordansche Nullmenge. Nach Lemma 6.(a,b) ist damit auch die Menge M π M η (W H ij ) 1 i<j n eine Jordansche Nullmenge. Ist schließlich x W = [, 1] n ein beliebiger Punkt des Einheitswürfels, so ordnen wir die Komponenten von x ihrer Größe nach an und erhalten ein π S n mit x π(1) x π(n), d.h. mit x M π. Diese Überlegung zeigt uns W = π S n M π. Da es nach I. 1.Lemma 1 genau n! viele Permutationen von {1,..., n} gibt, ergibt sich jetzt mit Lemma 13.(c) die Gleichung 1 = vol(w ) = vol ( π S n M π ) = π S n vol(m π ) = S n vol(m) = n! vol(m), 152

153 Mathematik für Physiker III, WS 212/213 Freitag und dies bedeutet vol(m) = 1 n!. Für ein weiteres Beispiel wollen wir uns das sogenannte n-dimensionale Standardsimplex n := {x R n x 1,..., x n, x x n 1} anschauen. Dieses hängt eng mit der eben behandelten Menge M zusammen. Schreiben wir für ein x n i y i := für 1 i n, so haben wir y 1 y 2 y n = x x n = 1, es ist also y M. Umgekehrt entsteht jedes y M auf diese Weise, ist nämlich y M, so sind x 1 := y 1 und für 1 < i n ist auch x i := y i y i 1. Für jedes 1 i n haben wir dann i x j = y 1 + (y 2 y 1 ) + + (y i y i 1 ) = y i, j=1 und insbesondere ist x x n = y n 1, es gilt also x n. Betrachten wir also die lineare Abbildung j=1 T : R n R n ; x (x 1, x 2 x 1,..., x n x n 1 ) so ist n = T (M). Die Matrix von T ist dabei gegeben als T =......, 1 1 x j also ist auch det T = 1. Nach Satz 24 ist das Standardsimplex n Jordan-meßbar und es gilt = T (M) damit vol( n ) = vol(m) = 1 n!. Für das letzte Beispiel erinnern wir uns an den in II. 8.3 eingeführten Begriff einer konvexen Teilmenge C E eines reellen Vektorraums E. Konvexität bedeutete dabei das für je zwei Punkte x, y C auch die Verbindungsstreck [x, y] C von x und y ganz in C liegt, dass also (1 λ)x + λy C für alle λ 1 gilt. Dann liegen auch alle Konvexkombinationen von beliebig vielen Punkten aus C wieder in C, d.h. sind x 1,..., x n C und λ 1,..., λ n mit λ λ n = 1, so ist auch die sogenannte Konvexkombination n k=1 λ kx k C wieder in C. Dies kann man etwa durch Induktion nach der Punkteanzahl n beweisen. Für n = 1 haben wir λ 1 = 1 und die Konvexkombination ist λ 1 x 1 = x 1 C. Ist dann n > 1 und nehmen wir an, dass die 153

154 Mathematik für Physiker III, WS 212/213 Freitag Konvexkombinationen von n 1 vielen Punkten aus C stets wieder in C liegen, so müssen wir uns überlegen das selbiges auch für alle Konvexkombinationen aus n Punkten gilt. Seien also x 1,..., x n C und λ 1,..., λ n mit λ λ n = 1 gegeben. Im Fall λ n = 1 sind λ 1 = = λ n 1 = und wir sind wegen n k=1 λ kx k = x n C sofort fertig. Anderfalls ist λ n < 1. Für jedes 1 k < n haben wir dann die Zahl und es gilt n 1 k=1 µ k = 1 n 1 1 λ n µ k := λ k 1 λ n k=1 λ k = 1 1 λ n (1 λ n ) = 1. Nach unserer Induktionsannahme ist x := n 1 k=1 µ kx k C. Da C konvex ist, ist somit auch n n 1 λ k x k = (1 λ n ) µ k x k + λ n x n = (1 λ n )x + λ n x n C. k=1 k=1 Per vollständiger Induktion ist diese Behauptung damit bewiesen. Seien jetzt endlich viele Punkt v,..., v n E gegeben. Als die konvexe Hülle dieser Punkte bezeichnet man dann die Menge { n } n C := co(v,..., v n ) := λ k v k λ,..., λ n, λ k = 1 k= aller Konvexkombinationen dieser Punkte. Diese Menge enthält alle Punkte v,..., v n denn für jedes k n können wir v k = n l= λ lv l schreiben wobei λ k := 1 und λ l := für alle l n mit l k gesetzt ist. Weiter ist die Menge C konvex, sind nämlich p, q C und t 1 gegeben, so existieren λ,..., λ n und µ,..., µ n mit n k= λ k = n k= µ k = 1 so, dass p = n k= λ kv k und q = n k= µ kv k sind, also haben wir auch n (1 t)p + tq = ((1 t)λ k + tµ k )v k C denn für jedes k n ist stets (1 t)λ k + tµ k und es gilt k= n ((1 t)λ k + tµ k ) = (1 t) k= n λ k + t k= k= n µ k = 1 t + t = 1. Weiter ist C sogar die kleinste alle Punkte v,..., v n enthaltende konvexe Menge, denn ist C E eine beliebige konvexe Menge mit v,..., v n C, so liegt wie oben gesehen auch jede Konvexkombination der Punkte v,..., v n in C, es gilt also C C. Kommen wir nun konkret zum Fall E = R n und seien n Vektoren v,..., v n R n gegeben. Dann bilden wir die konvexe Hülle C := co(v,..., v n ) R n dieser Punkte, und wir wollen uns überlegen das diese eine Jordan-meßbare Menge ist. Weiter soll 154 k=

155 Mathematik für Physiker III, WS 212/213 Freitag dann anschließend das Volumen von C berechnet werden. Sind λ,..., λ n mit n k= λ k = 1 gegeben, so haben wir auch n k=1 λ k = 1 λ 1, d.h. (λ 1,..., λ n ) n liegt in unserem oben eingeführten n-dimensionalen Standardsimplex. Setzen wir dann λ = 1 n k=1 λ k in unsere allgemeine Konvexkombination ein, so ergibt sich ( ) n n n n λ k v k = 1 λ k v + λ k v k = v + λ k (v k v ). k= k=1 Ist umgekehrt ein Punkt (λ 1,..., λ n ) n gegeben, so können wir λ := 1 n k=1 λ k definieren und dann ist n k= λ k = 1, es kommt also jeder Punkt des Standardsimplex in einer passenden Konvexkombination vor. Diese Überlegung zeigt uns { } n C = v + λ k (v k v ) λ n. k=1 Bezeichnet schließlich T R n n die Matrix mit den Spalten v 1 v,..., v n v und ϕ die affine Abbildung ϕ : R n R n ; x T x + v, so haben wir C = ϕ( n ). Nach Satz 24 ist C folglich eine Jordan-meßbare Menge mit vol(c) = det T vol( n ) = 1 n! det T = 1 n! det(v 1 v,..., v n v. Beachten wir Sind also p, p 1,..., p n R n und ist { n C := λ k p k λ 1,..., λ n, } k = n λ k = 1 k= die konvexe Hülle dieser Punkte, so folgt k=1 k=1 vol(c) = 1 n! det(v 1 v,..., v n v ). Schauen wir uns das ganze noch einmal konkret im ebenen Fall n = 2 an. Dann haben wir drei Punkte v, v 1, v 2 R 2 und die konvexe Hülle := co(v, v 1, v 2 ) ist das Dreieck mit den drei Ecken v, v 1, v 2. Die Fläche dieses Dreicks ist dann als vol( ) = 1 2 det(v 1 v, v 2 v ) gegeben. Nehmen wir einmal an unser Dreieck habe die drei Seitenlängen a, b, c >. Wir numerieren die Punkte v, v 1, v 2 so, dass b = v 1 v, a = v 2 v und c = v 2 v 1 gelten. Da sich die Fläche eines Dreicks nach Satz 24 unter Translationen nicht ändert, können wir v in den Nullpunkt verschieben, also v = annehmen. Ebenfalls nach 155

156 Mathematik für Physiker III, WS 212/213 Freitag Satz 24 ändert sich die Fläche des Dreiecks auch unter Drehungen nicht, wir können v 1 also auf die positive x-achse drehen. Dann ist v 1 = (b, ). Wiederum nach Satz 24 ändert sich die Dreiecksfläche auch unter einer Spiegelung an der x-achse nicht, wir können schließlich also auch v 2 = (x, y) mit y > annehmen. Dann sind a 2 = v 2 v 2 = x 2 + y 2 und c 2 = v 2 v 1 2 = (x b) 2 + y 2 = x 2 + y 2 + b 2 2bx = a 2 + b 2 2bx, also ist und für y erhalten wir x = a2 + b 2 c 2 2b y 2 = a 2 x 2 = a 2 (a2 + b 2 c 2 ) 2 d.h. 2ab a 2 + b 2 c 2 und y = 4b 2 = 4a2 b 2 (a 2 + b 2 c 2 ) 2 4b 2, 4a2 b 2 (a 2 + b 2 c 2 ) 2 2b >. Mit unserer Flächenformel ergibt sich vol( ) = 1 2 b x y = 1 2 by = 4a2 b 2 (a 2 + b 2 c 2 ) 2. 4 Dies ist die sogenannte Heronsche Flächenformel, die die Fläche eines Dreiecks durch die drei Seitenlängen ausdrückt. Oftmals wird diese Formel auch in einer symmetrisierten Form angegeben. Schreiben wir 4a 2 b 2 (a 2 + b 2 c 2 ) 2 = (2ab + (a 2 + b 2 c 2 )) (2ab (a 2 + b 2 c 2 )) = ((a + b) 2 c 2 ) (c 2 (a b) 2 ) = (a + b + c)(a + b c)(a b + c)(b + c a), so wird vol( ) = 1 4 (a + b + c)(a + b c)(a + c b)(b + c a). Führt man dann noch die Hilfsgröße t = (a + b + c)/2 ein, so sind also ist t a = b + c a, t b = a + c b 2 2 vol( ) = t(t a)(t b)(t c). und t c = a + b c, 2 $Id: transform.tex,v /12/14 14:35:3 hk Exp $ 156

157 Mathematik für Physiker III, WS 212/213 Freitag Die Transformationsformel In diesem Kapitel wollen wir die sogenannte Transformationsformel besprechen, diese ist die Verallgemeinerung der Substitutionsregel auf n-dimensionale Integrale. Gegeben sind zwei offene Mengen U, V R n und ein C 1 -Diffeomorphismus ϕ : U V. Weiter haben wir kompakte Jordan-meßbare Mengen A U und B V, die sich unter der Transformation ϕ entsprechen, also B = ϕ(a), und eine zu integrierende stetige Funktion f : B R. Die Transformationsformel überführt das Integral f(x) dx über B die Menge B durch Substitution mit dem C 1 -Diffeomorphismus ϕ in ein Integral über A. Wir führen erst einmal die übliche heuristische Überlegung durch was herauskommen sollte, das ist zwar noch kein Beweis, läst sich aber später zu einem Beweis ausbauen, und ist genug um erst einmal Beispiele rechnen zu können. Wir denken uns die Menge A = r k=1 A k in r viele ausreichend kleine Teilstücke A 1,..., A r zerlegt, die sich nur in ihren Rändern schneiden. Für jedes 1 k r sei x k A k der Schwerpunkt von A k. Dann wird B = ϕ(a) = r k=1 ϕ(a k) und näherungsweise sollte das Integral B gleich der durch diese Zerlegung gegebenen Riemannsumme sein B f(x) dx r f(ϕ(x k )) vol(ϕ(a k )). k=1 f(x) dx Sei 1 k r. Dann ist die Ableitung ϕ (x k ) die lineare Näherung erster Ordnung von ϕ, ist also A k klein genug, so ist näherungsweise ϕ(a k ) ϕ(x k ) + ϕ (x k )(A k x k ), also ergibt 4.Satz 24 vol(ϕ(a k )) vol(ϕ(x k ) + ϕ (x k )(A k x k )) = det ϕ (x k ) vol(a k ), und setzen wir diese Näherungen in unsere Riemannsumme ein, so wird r f(x) dx f(ϕ(x k )) det ϕ (x k ) vol(a k ). B Dies ist aber wieder eine Riemannsumme, diesmal für die durch k=1 A R; x f(ϕ(x)) det ϕ (x) auf A gegebene stetige Funktion. Nehmen wir nun eine Folge immer kleiner werdender Zerlegungen, so sollte die rechte Seite der obigen Nährung gegen das Integral f(x) dx = f(ϕ(x)) det ϕ (x) dx B A konvergieren. Dies ist dann die sogenannte Transformationsformel. In Substitutionstermen können wir uns diese Formel auch so denken, dass im Integral f(y) dy B zunächst y = ϕ(x) mit x A substituiert wird und dann die durch ϕ bewirkte Volumenverzerrung durch den Betrag det ϕ (x) berücksichtigt wird. 157

158 Mathematik für Physiker III, WS 212/213 Freitag Wie schon bemerkt ist diese Transformationsformel die n-dimensionale Version der Substitutionsregel, daher ist man zunächst etwas verwundert das in der Transformationsformel ein Betrag vorkommt, aber in der Substitutionsregel nicht. Dies ist allerdings eine Täuschung, auch in der Substitutionsregel kommt ein Betrag vor, er ist nur etwas versteckt. Die Substitutionsregel besagt ja ϕ(b) ϕ(a) f(x) dx = b a f(ϕ(x)) ϕ (x) dx, wobei wir hier die Substitution ϕ als umkehrbar annehmen. Dann ist ϕ monoton steigend oder monoton fallend, also auch ϕ (x) für x [a, b] oder ϕ (x) für x [a, b]. Im ersteren Fall ist ϕ (x) = ϕ (x) für x [a, b]. Im zweiten Fall ist zwar ϕ (x) = ϕ (x) für x [a, b], aber da ϕ monoton fallend ist, ist auch ϕ(a) ϕ(b), die Integralgrenzen auf der linken Seite der Substitutionsregel sind also verkehrt herum angeordnet, und werden sie dann vertauscht so erhalten wir auch auf der linken Seite der Substututionsregel ein Minuszeichen. Der Betrag wird hier also statt über ein explizites ϕ (x) indirekt über das Vertauschen der Integrationsgrenzen hereingebracht. Die formale Formulierung der Transformationsformel und ihren Beweis wollen wir erst einmal zurückstellen. Wir wollen uns jetzt lieber um einige Beispiele und die in diesem Kontext verwendeten Rechentechniken kümmern. Wir beginnen damit ein schon früher einmal gerechnetes Beispiel mittels Transformationsformel noch einmal, und diesmal einfacher, zu behandeln. Im vorigen Abschnitt hatten wir für z = (a, b) R 2 und s > das Integral ( ) x 2 d(x, y) = πs 2 a 2 + s2 4 B bestimmt, wobei B := B s (z) der Kreis mit Mittelpunkt z und Radius r ist. Wir schauen uns dies zunächst einmal für den Mittelpunkt z = an. Als unsere Substitution ϕ verwenden wir die Polarkoordinaten. Schon in 1.2 hatten wir festgehalten das diese sogar ein C -Diffeomorphismus sind. Streng genommen müssten wir dabei auf die verwendeten Definitionsbereiche aufpassen, dies stellt sich aber als ein unwesentliches Detail heraus das wir zunächst einmal ignorieren. Für r >, φ R haben wir ( ) cos φ r sin φ ϕ (r, φ) =, sin φ r cos φ also wir die Determinante der Ableitung von ϕ zu det ϕ (r, φ) = cos φ r sin φ sin φ r cos φ = r (cos2 φ + sin 2 φ) = r, die Transformationsformel für Polarkoordinaten nimmt also die konkrete Form f(x, y) d(x, y) = r f(r cos φ, r sin φ) d(r, φ) ϕ(a) A 158

159 Mathematik für Physiker III, WS 212/213 Freitag an. In unserem Beispiel B = B s () wird wegen ϕ(r, φ) = r die Menge A zu A = [, s] [ π, π], die erste Polarkoordinate ist der Abstand zum Ursprung, läuft also von bis zum Radius s des Kreises B und die zweite Polarkoordinate φ ist der Winkel zur x-achse läuft also einmal von 18 bis zu 18, d.h. von π bis π. Alternativ könnte man φ natürlich auch von bis 2π laufen lassen. Unser Integrand f(x, y) = x 2 wird wegen x = r cos φ, y = r sin φ zu f(ϕ(r, φ)) = r 2 cos 2 φ. Mittels der Transformationsformel auf Polarkoordinaten wird somit ( s ) ( π ) x 2 d(x, y) = r 3 cos 2 φ d(r, φ) = r 3 dr cos 2 φ dφ = 1 4 πs4, B [,s] [ π,π] und dies stimmt mit unserem früher berechneten Ergebnis überein. Um auch den Fall eines allgemeinen Zentrums zu behandeln gibt es zwei verschiedene Möglichkeiten. Zum einen können wir bei z zentrierte Polarkoordinaten verwenden, also x = a + r cos φ, y = b + r sin φ = x 2 = a 2 + 2ar cos φ + r 2 cos 2 φ und da sich die Ableitung der Transformation hierdurch nicht ändert, wird B x 2 d(x, y) = [,s] [ π,π] (a 2 + 2ar cos φ + r 2 cos 2 φ)r d(r, φ) = πa 2 s as3 π π π cos φ dφ + 1 ( ) 4 πs4 = πs 2 a 2 + s2 4 was wiederum mit dem bereits gerechneten Ergebnis übereinstimmt. Die zweite Methode ist es weiter die normalen Polarkoordinaten zu benutzen aber zuvor das Integral linear zu transformieren. Verwenden wir in der Transformationsformel speziell eine affine Transformation ϕ : R n R n ; x T x + u mit einer invertierbaren n n-matrix T und einem u R n, so ist ϕ (x) = T für jedes x R n, die Transformationsformel nimmt also die Form f(x) dx = det T f(t x + u) dx A ϕ(a) an. Wenden wir dies speziell auf die Translation um z an, also T = 1 und u = z, so wird x 2 d(x, y) = (x + a) 2 d(x, y) B B r() und das rechts stehende Integral kann mit den normalen Polarkoordinaten ausgerechnet werden. Einige weitere Beispiele werden in Aufgabe (31) behandelt. 159

160 Mathematik für Physiker III, WS 212/213 Freitag Wir wollen uns jetzt auch noch die Formel zur Transformation auf Zylinderkoordinaten anschauen. Wie in 1.2 diskutiert sind die Zylinderkoordinaten durch die Funktion ϕ : R > ( π, π) R R 3 ; (r, φ, z) (r cos φ, r sin φ, z) gegeben und die Determinante der Ableitung ist det ϕ (r, φ, z) = r. Die Transformationsformel angewandt auf Zylinderkoordinaten nimmt damit die Form f(x, y, z) d(x, y, z) = r f(r cos φ, r sin φ, z) d(r, φ, z) ϕ(a) an. Als ein Beispiel wollen wir das Integral ln(x 2 + y 2 + z) d(x, y, z) mit A := B R () [1, 2], R > A A rechnen. In Zylinderkoordinaten ist A gegeben durch r R und 1 z 2 und der Integrand ist ln(x 2 + y 2 + z) = ln(r 2 + z), also wird = π ln(x 2 + y 2 + z) d(x, y, z) = A R π 1 R π r ln(r 2 + z) dφ dr dz 2 (r 2 + z) ln(r 2 + z) r 2 z dz = π ((R 2 + z) ln(r 2 + z) z ln z R 2 ) dz 1 ( 1 = π 2 (R2 + z) 2 ln(r 2 + z) 1 4 (R2 + z) z2 ln z + 1 ) 2 4 z2 R 2 z 1 = π ( (R 2 + 2) 2 ln(r 2 + 2) (R 2 + 1) 2 ln(r 2 + 1) 3R 2 4 ln 2 ) 2 wobei wir ln x dx = x ln x x und x ln x dx = 1 2 x2 ln x 1 2 x dx = 1 2 x2 ln x 1 4 x2 verwendet haben. Weitere Beispiele zur Integration in Zylinderkoordinaten finden Sie in den Aufgaben (32) und (34). Als nächstes kommen wir zu den ebenfalls in 1.2 behandelten Kugelkoordinaten. Diese waren die Transformation gegeben durch ϕ : R > ( π, π) (, π) R 3 ; (r, φ, ψ) (r cos φ sin ψ, r sin φ sin ψ, r cos ψ), und als Determinante der Ableitung hatten wir det ϕ (r, φ, ψ) = r 2 sin ψ berechnet. Die Transformationsformel auf Kugelkoordinaten ist damit f(x, y, z) d(x, y, z) = r 2 f(r cos φ sin ψ, r sin φ sin ψ, r cos ψ) sin ψ d(r, φ, ψ). ϕ(a) A 16

161 Mathematik für Physiker III, WS 212/213 Freitag Auch zur Integration in Kugelkoordinaten wollen wir uns ein Beispiel anschauen. Sei B := {(x, y, z) R 3 x 2 + y 2 + z 2 R 2, z } die obere Halbkugel von Radius R > versehen mit der Massendichte ϱ(x, y, z) = x 2 z. Dann ist { B = ϕ(d) mit D := (r, φ, ψ) r R, φ π, ψ π 2 und die Dichte schreibt sich in Kugelkoordinaten als ϱ(ϕ(r, φ, ψ)) = r 3 cos 2 φ sin 2 ψ cos ψ. Wir wollen den Schwerpunkt s ϱ (B) von B bezüglich dieser Dichte bestimmen. Für die Masse von B ergibt sich zunächst vol ϱ (B) = B ϱ(x, y, z) d(x, y, z) = ( R = D ) ( π r 5 dr cos 2 φ dφ π wobei wir das schon früher berechnete Integral π π cos 2 φ dφ = r 5 cos 2 φ sin 3 ψ cos ψ d(r, φ, ψ) ) ( ) π/2 sin 3 ψ cos ψ dψ π π ( = R6 π 4 sin4 ψ 1 + cos(2φ) 2 dφ = π π/2 }, ) = 1 24 πr6 verwenden. Zur Bestimmung des Schwerpunkts benötigen wir jetzt noch die Integrale der folgenden drei Funktionen von (x, y, z) = ϕ(r, φ, ψ) über B xϱ(x, y, z) = r 4 cos 3 φ sin 3 ψ cos ψ, yϱ(x, y, z) = r 4 sin φ cos 2 φ sin 3 ψ cos ψ, zϱ(x, y, z) = r 4 cos 2 φ sin 2 ψ cos 2 ψ. Integrieren wir diese in Zylinderkoordinaten, so liegt wieder in allen drei Fällen ein Integrand in separierter Form vor, und beachten wir π π cos 3 φ dφ = π π (cos φ sin 2 φ cos φ) dφ = sin φ 1 3 sin3 φ π π = sowie π π sin φ cos 2 φ dφ = 1 3 cos3 φ 161 π π =

162 Mathematik für Physiker III, WS 212/213 Dienstag und schließlich π/2 π/2 sin 4 ψ cos 2 ψ dψ = 1 sin 2 (2φ) (1 + cos(2φ)) dφ 8 = 1 π/2 [ ] 1 cos(4φ) + sin 2 (2φ) cos(2φ) dφ 8 2 ( = 1 φ 8 2 sin(4φ) + 1 ) π/2 8 6 sin3 (2φ)a = π 32, so sind insgesamt xϱ(x, y, z) d(x, y, z) = B yϱ(x, y, z) d(x, y, z) = B zϱ(x, y, z) d(x, y, z) = B = r 6 cos 3 φ sin 4 ψ cos ψ d(r, φ, ψ) =, D r 6 sin φ cos 2 φ sin 4 ψ cos ψ d(r, φ, ψ) =, D r 6 cos 2 φ sin 4 ψ cos 2 ψ d(r, φ, ψ) D ( R ) ( π ) ( ) π/2 r 6 dr cos 2 φ dφ sin 4 ψ cos 2 ψ dψ π Der Schwerpunkt ist damit in s ϱ (B) = = π2 224 R7. 1 x dx = 24 vol ϱ (B) B πr 6 π 2 R = 3 28 πr. Vorlesung 15, Dienstag In der letzten Sitzung haben wir die Transformationsformel als n-dimensionale Erweiterung der bekannten Substitutionsregel eingeführt. Insbesondere konnten wir diese auf die drei Standard-Transformationen des 1.2 anwenden und erhielten damit die Transformationsformeln zur Integration in Polar-, Zylinder- und Kugelkoordinaten. Zum Einstieg in die heutige Sitzung wollen wir noch ein weiteres Beispiel in Kugelkoordinaten rechnen, und bei der Gelegenheit gleich eine bequeme, wenn auch etwas unsaubere, Notation einführen. 162

163 Mathematik für Physiker III, WS 212/213 Dienstag Wir betrachten den Kegel C := {(x, y, z) R 3 x 2 + y 2 z 2, z } R und die Kugelschale B := {(x, y, z) R 3 1 x 2 + y 2 + z 2 4} R Als Integrationsbereich wollen wir dann den Durchschnitt D := B C verwenden, und wir drücken diesen erst einmal in Kugelkoordinaten ϕ aus. Schreiben wir (x, y, z) = ϕ(r, φ, ψ) mit r, φ π, ψ π, so bedeutet (x, y, z) B einfach r [1, 2]. Weiter haben wir x 2 + y 2 = r 2 (cos 2 φ + sin 2 φ) sin 2 ψ = r 2 sin 2 ψ und z = r cos ψ. Damit ist z gleichwertig zu ψ [, π/2] und da in diesem Fall auch cos ψ ist, wird die Bedingung x 2 + y 2 z 2 äquivalent zu sin ψ cos ψ. Dies können wir weiter zu ψ < π/2 und tan ψ 1 = tan(π/4) umformen, also muss ψ [, π/4] sein. Für die z-koordinaten folgt z = r cos ψ cos(π/4) = 1/ 2. Setzen wir also [ A := [1, 2] [ π, π], π ] R 3, 4 so ist D = ϕ(a). Die Menge A ist ein Quader, also insbesondere kompakt und Jordanmeßbar. Nun überlegen wir uns das auch die Menge D Jordan-meßbar ist. Dabei wissen wir bereits aus 4.3 das die Kugelschale B = B 1,2 () Jordan-meßbar ist. Weiter ist die Menge C := C (R 2 [1/ 2, 2]) abgeschlossen und C := {(x, y, z) R 3 x 2 + y 2 < z 2, 1/ 2 < z < 2} ist offen mit C C C und D = B C. Insbesondere ist jeder Punkt von C ein innerer Punkt von C, und wir zeigen jetzt das umgekehrt jeder innere Punkt von C in C liegt. Sei also p = (x, y, z) C ein innerer Punkt von C. Dann existiert ein < ɛ < 2 mit B ɛ (p) C. Insbesondere sind (x, y, z ɛ/2), (x, y, z + ɛ/2) B ɛ (p) C also z > z ɛ/2 1/ 2, z < z + ɛ/2 < 2 und x 2 + y 2 (z ɛ/2) 2 < z 2, d.h. es ist p = (x, y, z) C. Damit ist C die Menge der inneren Punkte von C, also C = (C ) und nach II. 4.Lemma 18.(b) gilt C = C \C = C 1 C 2 C 3 mit C 1 := C 2 := {( ) 1 x, y, R 3 x, y R, x 2 + y 2 1 }, 2 2 { } (x, y, z) R z 2, x 2 + y 2 = z 2, C 3 := {(x, y, 2) x, y R 2, x 2 + y 2 4}. Ist f : R 3 R die durch f(x, y, z) = x 2 + y 2 z 2 für alle x, y, z R definierte Funktion, so ist für alle x, y, z R mit z > stets grad f(x, y, z) = (2x, 2y, 2z), d.h. die Menge M := {(x, y, z) R 3 z >, x 2 + y 2 = z 2 } ist nach dem Satz vom regulären Urbild 3.Korollar 2 eine zweidimensionale C -Untermannigfaltigkeit 163

164 Mathematik für Physiker III, WS 212/213 Dienstag von R 3 und damit sind die drei Mengen C 1, C 2, C 3 nach 4.Lemma 6.(f) Jordansche Nullmengen, d.h. nach 4.Lemma 6.(b) ist auch C eine Jordansche Nullmenge. Da C außerdem beschränkt ist, ist C damit nach 4.Satz 14 Jordan-meßbar. Damit ist schließlich auch D = B C nach 4.Lemma 13.(b) Jordan-meßbar. Wir wollen jetzt das Integral x 2 + y 2 d(x, y, z) D z durch Integration in Kugelkoordinaten berechnen. Der Integrand ist also die stetige Funktion f : R R R > R; (x, y, z) x2 + y 2. z In Kugelkoordinaten hatten wir schon oben x 2 + y 2 = r 2 sin 2 ψ ausgerechnet, also f(r, φ, ψ) = r2 sin 2 ψ r cos ψ = r sin2 ψ cos ψ. Beachte das dies eigentlich falsch ist, hier steht nicht f(r, φ, ψ) sondern f(ϕ(r, φ, ψ)). Bei konkreten Rechnungen wird aber häufig einfach auch für die Funktion f ϕ wieder f geschrieben, man unterscheidet die beiden Funktionen dann nicht an ihren Namen sondern an den Bezeichnungen ihrer Argumente. Diese Notation ist auf der einen Seite bequem, auf der anderen Seite erfordert sie aber etwas Aufmerksamkeit da zwei verschiedene Dinge gleichzeitig mit demselben Symbol bezeichnet werden. Bei der Gelegenheit notiert man die Transformationsformel auf Kugelkoordinaten dann auch gerne in der symbolischen Schreibweise d(x, y, z) = r 2 sin ψ d(r, φ, ψ). Dies ist aber keine echte Gleichung da beide Seiten dieser Identität ja undefiniert sind, wir fassen es als reine Merkregel entsprechend zum, ja inhaltlich ebenfalls sinnlosen, dx dy Gerechne bei der Substitutionsregel auf. Damit kommen wir zum Rechnen, der Integrand in Kugelkoordinaten ist in separierter Form, also x 2 + y 2 d(x, y, z) = r 3 sin3 ψ d(r, φ, ψ) D z A cos ψ ( 2 ) ( ) π/4 = 2π r 3 sin 3 ψ dr 1 cos ψ dψ = 15 π/4 2 π sin 3 ψ cos ψ dψ. Das verbleibende eindimensionale Integral ist eine rationale Funktion in den trigonometrischen Funktionen und damit elementar integrierbar. Schreiben wir für ψ π/4 so wird π/4 ( sin 3 ψ cos ψ dψ = sin 3 ψ cos ψ = (1 cos2 ψ) sin ψ cos ψ ln(cos ψ) sin2 ψ 164 = tan ψ sin ψ cos ψ, π/4 ) ( = ln ) = ln ,

165 Mathematik für Physiker III, WS 212/213 Dienstag und es ist insgesamt D x 2 + y 2 z d(x, y, z) = 15 ( 4 π ln 2 1 ). 2 Als nächstes Beispiel wollen wir eine Anwendung der Transformationsformel auf die Berechnung eindimensionaler uneigentlicher Riemann-Integrale vorführen, konkret wollen wir das sogenannte Gaußsche Fehlerintegral e x2 dx berechnen. Da für alle x R mit x 1 stets e x2 e x gilt und die Funktion f : [, ) R; x e x nach einem Beispiel in II. 3 uneigentlich Riemann-integrierbar ist, ist nach dem Majorantenkriterium für die uneigentliche Riemann-integrierbarkeit II. 3.Satz 6 auch die Funktion g : R R; x e x2 über [, ) uneigentlich Riemannintegrierbar. Da die Funktion g gerade ist, ist g dann auch über (, ] uneigentlich Riemann-integrierbar, d.h. g ist insgesamt uneigentlich Riemann-integrierbar. Wie am Ende von II. 3 bemerkt, ist damit insbesondere s e x2 dx = lim e t2 dt. s s Schon in II. 2.5 hatten wir festgehalten, dass sich die Stammfunktion von e x2 nicht als eine explizite Formel in Termen der Grundfunktionen schreiben läßt. Wir hatten dann zwar in II. 2.5 die sogenannte Fehlerfunktion erf : R R; x 2 x π e t2 dt = 1 π x x e t2 dt eingeführt, aber über diese wissen wir nicht genug um ihren Grenzwert für x zu berechnen. Der Weg zur Berechnung des Gaußschen Fehlerintegrals führt über einen kleinen Umweg in die Ebene. Wir berechnen zunächst für jedes s > das Integral s e x2 y 2 d(x, y) = re r2 dr = 2π re r2 dr B s() [,s] [ π,π] s = πe r2 = π (1 e s2) durch Transformation auf Polarkoordinaten. Insbesondere ergibt sich damit e x2 y 2 d(x, y) = π. lim s B s() Andererseits haben wir für alle s > auch B s () [ s, s] [ s, s] B 2s (), 165

166 Mathematik für Physiker III, WS 212/213 Dienstag also B s() e x2 y 2 d(x, y) x2 y2 e [ s,s] 2 d(x, y) x2 y2 e B 2s () d(x, y), und da die linke und rechte Seite dieser Ungleichung beide gegen π konvergieren, ist damit auch d(x, y) = π. lim s x2 y2 e [ s,s] 2 Dieses Integral können wir aber auch direkt berechnen, wegen e x2 y 2 = e x2 e y2 für alle x, y R haben wir hier ein Integral über einen Quader mit Integrand in separierter Form, d.h. für jedes s > ist explizit ( s 2 x2 y2 e d(x, y) = e dt) t2. [ s,s] 2 s Der Grenzwert dieses Ausdrucks für s ist π, also haben wir auch s e x2 dx = lim e t2 dt = π. s s Damit ist das Gaußsche Fehlerintegral berechnet, und insbesondere ergibt sich die in II. 2.5 angekündigte Gleichung lim erf(x) = 1. x Jetzt wollen wir auch noch zwei Beispiele rechnen bei denen eine an das konkrete Problem angepasste Substitution verwendet wird. Die drei bisher behandelten Koordinatentransformationen, also Polarkoordinaten, Zylinderkoordinaten und Kugelkoordinaten, kommen zwar in solchen Rechnungen recht häufig vor, aber sie sind keinesfalls die einzigen Möglichkeiten. Wie bei der Substitutionsregel für eindimensionale Integrale kann man auch speziell an die Form des Integranden angepasste Koordinaten verwenden. Als Neuerung im Vergleich zur Substitutionsregel muss man sich zusätzlich auch noch um die Anpassung der Koordinaten an den Integrationsbereich kümmern. Wie schon bei der Substitutionsregel gibt es für die Wahl einer geeigneten Koordinatentransformation zwar einige Faustregeln aber keinen allgemeinen, von Hand benutzbaren, Algorithmus. Insbesondere gibt es keinen Standardrechenweg sondern man muss sich eventuell etwas einfallen lassen. Als ein Beispiel betrachten wir die Menge { M := (x, y) R 2 > < y x 2 + y 2 < 1 die etwas weiter unten abgebildet ist, und wollen das Integral x + y d(x, y) (x 2 + y 2 ) 3 M 166 x x 2 + y < 1 }, 2 2

167 Mathematik für Physiker III, WS 212/213 Dienstag berechnen. Bei der Wahl einer Koordinatentransformation orientieren wir uns hier am Integrationsbereich M, und betrachten die neuen Koordinaten u = v = x x 2 + y, 2 y x 2 + y. 2 C 1 -Diffeomorphismen sind bijektive Abbildungen zwischen offenen Teilen des R n, wir müssen also schauen das unser u, v tatsächlich auf einer geeigneten Menge bijektiv ist. Rechnerisch führt man dies meist durch, indem versucht wird umgekehrt x, y in Termen von u und v auszudrücken, wir müssen also die u, v definierenden Gleichungen nach x, y auflösen. Zunächst haben wir also weiter x = u 2 + v 2 = x2 + y 2 (x 2 + y 2 ) 2 = 1 x 2 + y 2, x x 2 + y 2 (x2 + y 2 ) = u (x 2 + y 2 ) = u u 2 + v 2, und analog können wir für y rechnen, und erhalten y = v/(u 2 + v 2 ). Die cartesischen Koordinaten ergeben sich also aus u, v mittels genau derselben Formeln die auch u, v definieren, nur mit x, y und u, v ausgetauscht. Damit können wir den folgenden C 1 - Diffeomorphismus verwenden ϕ : R 2 \{} R 2 \{}; (u, v) ( u u 2 + v 2, ) v. u 2 + v 2 Bei der Wahl von ϕ hatten wir uns an den M definierenden Bedingungen orientiert, und entsprechend nimmt die Menge M in den neuen Koordinaten u, v eine vergleichsweise einfache Form an. Es wird M = ϕ(d) mit { D := (u, v) R 2 > < v < 1 u < 1 } 2 Die Menge M Das Dreieck D 167

168 Mathematik für Physiker III, WS 212/213 Dienstag Als nächsten Schritt müssen wir die Funktionaldeterminante, also die Determinante der Jacobimatrix, von ϕ berechnen, und bestimmen dazu zunächst die relavanten partiellen Ableitungen: x u = u2 v 2 (u 2 + v 2 ), x 2 v = 2uv (u 2 + v 2 ), y 2 u = 2uv (u 2 + v 2 ), y 2 v = u2 v 2 (u 2 + v 2 ). 2 Als Determinante ergibt sich (x, y) (u, v) := u2 v 2 2uv 2uv (u 2 +v 2 ) 2 (u 2 +v 2 ) 2 u 2 v 2 (u 2 +v 2 ) 2 (u 2 +v 2 ) 2 = v 2 ) 2 + 4u 2 v 2 (u2 (u 2 + v 2 ) 4 = u4 + 2u 2 v 2 + v 4 1 = (u 2 + v 2 ) 4 (u 2 + v 2 ), 2 und die Transformationsformel ergibt wegen die Gleichung M x + y = u + v u 2 + v 2 und x2 + y 2 = u2 + v 2 (u 2 + v 2 ) 2 = 1 u 2 + v 2 1 v x + y 1/2 d(x, y) = (u + v) d(u, v) = (u + v) du dv (x 2 + y 2 ) 3 D 1/2 1/2 1 v 1 1/2 = 2 u2 + uv 1 dv = 2 (1 v)2 + v(1 v) v dv 1/2 = 1/ v 1 2 v2 dv = = Die Schreibweise (x, y)/ (u, v) für die Funktionaldeterminante wird gerne verwendet, da sie erlaubt die Transformationsformel symbolisch als (x, y) d(x, y) = d(u, v) beziehungsweise d(x, y) = (x, y) (u, v) (u, v) d(u, v) zu schreiben. Wenn man will kann man (x, y)/ (u, v) auch gleich als den Betrag der Funktionaldeterminante lesen, an welcher Stelle der Rechnung das Vorzeichen der Determinante entfernt wird spielt ja keine Rolle. Als ein letztes Beispiel wollen wir noch eine Anwendung der Transformationsformel rechnen bei der man sich eher an der Form des Integranden orientiert. Wir betrachten Q := [, 1] [, 1] und xy(x 2 + y 2 ) cos(x 2 y 2 ) d(x, y). Q Hier ist der Cosinusterm im Integranden unangenehm, daher ist es naheliegend das Argument des Cosinus etwa durch u = x 2 y 2 zu substituieren. Dann brauchen wir 168

169 Mathematik für Physiker III, WS 212/213 Dienstag noch eine passende zweite Koordinate v. Nun ist (x 2 + y 2 ) 2 = x 4 + 2x 2 y 2 + y 4 = (x 2 y 2 ) 2 + 4x 2 y 2 = (x 2 y 2 ) 2 + (2xy) 2 und der Faktor xy kommt noch ein weiteres mal im Integranden vor. Diese Überlegung führt dazu es mit der folgenden Koordinatentransformation zu versuchen: u = x 2 y 2, v = 2xy. Dies ist tatsächlich eine Koordinatentransformation R 2 R 2, und um dies zu sehen müssen wir wie im vorigen Beispiel schauen das wir x und y durch u und v ausdrücken können. Es ist y = v/(2x) und also u = x 2 y 2 = x 2 v2 4x 2 = x4 ux 2 v2 4 =, x 2 = u u 2 ± v2 4 = u ± u2 + v 2 2 und wegen u 2 + v 2 u 2 = u ist damit u + u x = 2 + v 2, y = 2 v 2(u +. u 2 + v 2 ) Damit liegt tatsächlich eine Koordinatentransformation vor, und die Funktionaldeterminante berechnet sich zu (u, v) (x, y) = 2x 2y 2y 2x = 4(x2 + y 2 ). Der Integrand wird damit zu xy(x 2 + y 2 ) cos(x 2 y 2 ) = 1 v) v cos(u) (u, 8 (x, y). Erinnern wir uns an die Formulierung der Transformationsformel als so erhalten wir d(u, v) = (u, v) d(x, y), (x, y) Q xy(x 2 + y 2 ) cos(x 2 y 2 ) d(x, y) = 1 8 B v cos u d(u, v) wobei B := ϕ(q) ist. An dieser Stelle konnte man gut sehen warum die Schreibweise (u, v)/ (x, y) hilfreich ist, da man so nur die formale Rechnung xy(x 2 + y 2 ) cos(x 2 y 2 ) d(x, y) = 1 v) v cos(u) (u, 8 (x, y) d(x, y) = 1 v cos(u) d(u, v) 8 169

170 Mathematik für Physiker III, WS 212/213 Dienstag durchführen muss. Wie bei der Substitutionsregel ist dies aber eine reine Merkhilfe, und keine wirliche Rechnung. Der Integrand ist jetzt vergleichsweise einfach geworden, es bleibt aber das Problem die Bildmenge B = ϕ(q) zu berechnen. Hier gehen wir etwas indirekt vor, und schauen uns anstelle dessen erst einmal an, wie die Koordinatentransformation ϕ den Rand von M abbildet. Das Quadrat Q B = ϕ(q) Der Rand des Quadrats Q setzt sich aus vier Teilstrecken zusammen, deren Bilder wir jeweils einzeln berechnen. ϕ(x, ) = (x 2, ), ϕ(1, y) = (1 y 2, 2y), ϕ(x, 1) = (x 2 1, 2x), ϕ(, y) = ( y 2, ). Die Punkt ϕ(x, ) und ϕ( y 2, ) durchlaufen zusammen das Intervall [ 1, 1] auf der u-achse. Die Bildpunkte ϕ(1, y) sind durch die Gleichung u = 1 v 2 /4 gegeben und die Bildpunkt ϕ(x, 1) durch die Gleichung u = v 2 /4 1. Das Bild B = ϕ(x) wird also von den Kurven v =, u = 1 v 2 /4 und u = v 2 /4 1 begrenzt. Insbesondere hat B die im obigen Bild gezeigte Form, und wir können das Integral über B berechnen B v cos u d(u, v) = Insgesamt ist damit 2 = 2 1 v2 4 v v cos u du dv = 2 v sin Q xy(x 2 + y 2 ) cos(x 2 y 2 ) d(x, y) = [ ) ( )] v sin (1 v2 v 2 sin dv ) ) (1 v2 dv = 4 cos (1 v2 2 = 4(1 cos(1)). 4 4 B v cos u d(u, v) = 1 (1 cos(1)). 2 Die Bestimmung des Bildes ϕ(q) über die Betrachtung der berandenden Kurven dient hier nur der Bequemlichkeit, wir könnten diese auch leicht rechnerisch durchführen. 17

171 Mathematik für Physiker III, WS 212/213 Dienstag Daher wollen wir auf eine genaue Begründung dieses Verfahrens an dieser Stelle auch verzichten. Das soll an Beispielen erst einmal genügen, und wir wollen jetzt zur exakten Formulierung und zum Beweis der Transformationsformel kommen. Dieses Vorhaben erfordert noch einige kleine Vorarbeiten, mit denen wir nun beginnen wollen. Wir starten mit einer kleinen Hilfaussage über kompakte Mengen im R n. Lemma 5.1 (Aufdicken kompakter Mengen) Seien n N mit n 1, eine Norm auf dem R n, U R n eine offene Menge und C R n eine kompakte Menge mit C U. Dann existiert ein ɛ > mit B ɛ (C) := {x R n (y C) : x y ɛ} = x C B ɛ (x) U. Weiter sind B ɛ (C) kompakt und B ɛ (C) := x C B ɛ (x) offen mit C B ɛ (C) B ɛ (C). Beweis: Im Fall C = sind alle Aussagen klar, wir können also C annehmen. Da U offen ist, gibt es für jedes x C ein r x > mit B rx (x) U. Da C kompakt ist, gibt es nach II. 8.Satz 2 endlich viele Punkte x 1,..., x m C mit C m k=1 B r xk /2(x k ) und wir setzen ɛ := 1 2 min r x k >. 1 k m Sei x B ɛ (C). Dann existiert ein y C mit y x ɛ und weiter gibt es ein 1 k m mit y x k < r xk /2. Damit ist auch x x k x y + y x k < ɛ r x k 2 r x k, also x B rxk (x k ) U. Dies beweist B ɛ (C) U. Als nächstes beweisen wir das die Menge B ɛ (C) kompakt ist. Sei also (x k ) k N eine Folge in B ɛ (C). Für jedes k N gibt es ein y k C mit y k x k ɛ, also ist u k := x k y k B ɛ () mit x k = y k + u k. Da die Menge C kompakt ist, gibt es eine Teilfolge (y kl ) l N und ein y C mit (y nkl ) l N y. Da nach dem Satz von Heine Borel II. 8.Satz 4 auch die Kugel B ɛ () kompakt ist, gibt es eine weitere Teilfolge (u klp ) p N und ein u B ɛ () mit (u klp ) p N u. Damit ist x := y + u B ɛ (y) B ɛ (C) und es gilt lim p x k lp = lim p (y klp + u klp ) = lim l y kl + lim p u klp = y + u = x. Dies beweist das die Menge B ɛ (C) kompakt ist. Weiter ist die Vereinigungsmenge B ɛ (C) = x C B ɛ(x) nach II. 4.Lemma 17.(h) offen. Die Inklusionen C B ɛ (C) B ɛ (C) sind klar. 171

172 Mathematik für Physiker III, WS 212/213 Dienstag Als nächsten Schritt führen wir den Begriff des Durchmessers einer beschränkten Teilmenge eines normierten Raums ein. Definition 5.1: Seien E ein normierter Raum und M E eine beschränkte Teilmenge. Ist M, so definieren wir den Durchmesser von M als das Supremum und ist M =, so setzen wir d(m) :=. d(m) := sup{ x y : x, y M}, Beachte das der Durchmesser immer endlich ist, denn da M beschränkt ist gibt es nämlich eine Konstante C mit x C für alle x M und somit ist auch x y x + y 2C für alle x, y M, d.h. d(m) 2C <. Wenn man will kann man den Durchmesser einer unbeschränkten Menge als definieren, aber diese Erweiterung benötigen wir hier nicht. Für Kugeln stimmt der Durchmesser mit dem gewöhnlichen Durchmesser überein, d.h. sind E ein normierter Raum, z E und r >, so ist d(b r (z)) = d(b r (z)) = 2r. Dies ist leicht zu sehen. Zunächst gilt für alle x, y B r (z) stets x y x z + z y 2r, also ist d(b r (z)) d(b r (z)) 2r. Wegen E gibt es weiter einen Vektor u E mit u = 1 und für jedes t < r ist dann (z ±tu) z = t < r, also sind z +tu B r (z) und z tu B r (z), es gilt also d(b r (z)) z + tu (z tu) = 2t. Es folgt d(b r (z)) d(b r (z)) 2r, und insgesamt haben wir unsere Behauptung eingesehen. Ist umgekehrt M E eine beschränkte Menge mit d(m) r und ist x M, so gilt für jedes y M stets y x d(m) r, also y B r (x), und wir haben M B r (x) eingesehen. Eine weitere einfache Beobachtung ist nützlich. Angenommen wir haben eine Teilmenge U E und eine auf U definierte Funktion f : U F in einen weiteren normierten Raum F. Es gebe eine Konstante C mit f(y) f(x) C y x für alle x, y U. Sei M U eine nicht leere, beschränkte Teilmenge. Für alle x, y M ist dann f(y) f(x) C y x Cd(M), d.h. zum einen ist das Bild f(m) F beschränkt und zum anderen gilt d(f(m)) Cd(M). Wir kommen nun zum normierten Raum E = R n und verwenden auf dem R n wieder die Maximumsnorm. Sei Q R n ein nicht ausgearteter Quader und schreibe Q = [a, b] mit a, b R n. Sind x, y Q, so gilt für alle 1 k n stets a k x k, y k b k, also y k x k b k a k und somit haben wir y x max 1 k n (b k a k ) = b a. Dies zeigt d(q) b a und da a, b Q sind, ist auch d(q) b a, d.h. der Durchmesser des Quaders Q ergibt sich als d(q) = b a = max 1 k n (b k a k ). Insbesondere läßt sich damit das Volumen des Quaders Q mittels seines Durchmessers abschätzen, wir haben n vol(q) = (b k a k ) d(q) n. k=1 172

173 Mathematik für Physiker III, WS 212/213 Dienstag Besonders gut verhalten sich hierbei die Würfel, ist W R n ein Würfel der Kantenlänge a >, so ist d(w ) = a und vol(w ) = a n = d(w ) n. Weiterhin brauchen wir eine kleine Verallgemeinerung des Vereinigungslemmas 4.Lemma 13.(c). Sind M 1,..., M r R n Jordan-meßbare Mengen, so ist auch die Vereinigung r k=1 M k Jordan-meßbar und es gilt ( r ) r vol M k vol(w k ). k=1 Dies können wir leicht durch Induktion nach r einsehen. Für r = 1 ist die Behauptung klar. Nehmen wir die Behauptung dann für ein r 1 an und haben r + 1 viele Jordan-meßbare Mengen M 1,..., M r+1 R n, so ist direkt nach der Induktionsannahme auch die Menge M := r k=1 M k Jordan-meßbar mit vol(m) r k=1 vol(m k). Nach 4.Lemma 13.(b) ist damit auch r+1 k=1 k=1 M k = M M r+1 Jordan-meßbar mit ( r+1 ) vol M k = vol(m M r+1 ) = vol(m) + vol(m r+1 ) vol(m M r+1 ) k=1 r+1 vol(m) + vol(m r+1 ) vol(m k ). Per vollständiger Induktion ist damit auch diese Vorbemerkung bewiesen. Damit kommen wir zum nächsten vorbereitenden Lemma für die Transformationsformel, dieses untersucht das Verhalten Jordanscher Nullmengen und Jordan-meßbarer Mengen unter stetig differenzierbaren Abbildungen. Lemma 5.2 (Differenzierbare Transformationen Jordan-meßbarer Mengen) Seien n N mit n 1, U R n eine offene Menge und ϕ : U R n eine stetig differenzierbare Funktionen. (a) Sind A U eine dyadische Würfelfigur und M > mit ϕ (x) M für alle x A, so existieren Würfel W 1,..., W r R n mit r r ϕ(a) W k und vol(w k ) M n vol(a). k=1 (b) Sind A R n kompakt und Jordan-meßbar mit A U und M, ɛ > mit ϕ (x) M für alle x A, so existieren Würfel W 1,..., W r R n mit r r ϕ(a) W k und vol(w k ) M n vol(a) + ɛ. k=1 k=1 k=1 173 k=1

174 Mathematik für Physiker III, WS 212/213 Dienstag (c) Ist N R n eine Jordansche Nullmenge mit N U, so ist auch das Bild ϕ(n) R n eine Jordansche Nullmenge. (d) Sei A U kompakt und Jordan-meßbar und für jedes x A sei die Ableitung ϕ (x) invertierbar. Dann ist auch das Bild B := ϕ(a) kompakt und Jordan-meßbar mit B ϕ( A) und ( ) n vol(b) sup ϕ (x) vol(a). x A Beweis: Wir verwenden auf dem R n die Maximumsnorm. (a) Es gibt ein m N und paarweise verschiedene dyadische Würfel W 1,..., W r R n der Stufe m mit A = r k=1 W k. Insbesondere ist W i W j für alle 1 i < j r eine Jordansche Nullmenge und nach 4.Lemma 13.(c) gilt vol(a) = r k=1 vol(w k). Sei 1 k r gegeben und bezeichne z k W k den Mittelpunkt des Würfels W k. Für jedes x W k gilt dann x z k d(w k )/2. Ist also x W k, so liefert die Konvexität des Würfels W k auch [z k, x] W k A und mit der Mittelwertungleichung II. 8.Lemma 21 folgt ϕ(x) ϕ(z k ) M x z k Md(W k). 2 Setzen wir also z k := ϕ(z k) R n und definieren den Würfel W k := B Md(W k )/2(z k ) Rn mit Durchmesser d(w k ) = Md(W k), so gilt ϕ(w k ) W k. Es folgen ( r ) r r ϕ(a) = ϕ W k = ϕ(w k ) und k=1 k=1 k=1 W k r vol(w k) = k=1 r r r d(w k) n = M n d(w k ) n = M n vol(w k ) = M n vol(a). k=1 k=1 k=1 (b) Nach Lemma 1 gibt es ein α > so, dass C := B α (A) U kompakt ist. Weiter wählen wir ein ɛ 1 > mit (M + ɛ 1 ) n vol(a) < M n vol(a) + ɛ. Dann gibt es nach 4.Lemma 3 ein δ > so, dass für alle x, y C mit x y < δ stets ϕ (x) ϕ (y) < ɛ 1 ist. Schließlich gibt es auch ein ɛ 2 > mit (M + ɛ 1 ) n (vol(a) + ɛ 2 ) < M n vol(a)+ɛ. Nach 4.Lemma 23.(b) gibt es eine dyadische Würfelfigur W + mit A W + und vol(w + ) < vol(a) + ɛ 2. Durch weiteres Unterteilen können wir dabei annehmen das W + von einer Stufe m N mit 2 m < min{α, δ} ist, und durch Fortlassen überflüssiger Würfel können wir sogar annehmen, dass W + die Form W + = r k=1 W k hat, wobei W k für jedes 1 k r ein dyadischer Würfel der Stufe m mit W k A ist. Sei x W +. Dann existiert ein 1 k r mit x W k. Wegen W k A existiert weiter ein y W k A, also ist auch x y d(w k ) = 2 m < min{α, δ}. Damit gilt 174

175 Mathematik für Physiker III, WS 212/213 Dienstag zum einen x B α (y) B α (A) = C U und zum anderen ist wegen y x < δ auch ϕ (x) ϕ (y) < ɛ 1 und somit ϕ (x) ϕ (x) ϕ (y) + ϕ (y) < M + ɛ 1. Dies zeigt W + U und ϕ (x) M + ɛ 1 für alle x W +. Nach (a) existieren Würfel W 1,..., W m R n mit und ϕ(a) ϕ(w + ) m vol(w k) (M + ɛ 1 ) n vol(w + ) (M + ɛ 1 ) n (vol(a) + ɛ 2 ) < M n vol(a) + ɛ. k=1 (c) Da N beschränkt ist, ist auch C := N R n abgeschlossen und beschränkt, also nach dem Satz von Heine-Borel II. 8.Satz 4 kompakt. Weiter ist auch N eine Jordansche Nullmenge, denn für jedes ɛ > gibt es Quader Q 1,..., Q r R n mit N r k=1 Q k und r k=1 vol(q k) < ɛ und da r k=1 Q k nach II. 4.Lemma 16.(f) abgeschlossen ist, ist nach II. 4.Lemma 16.(b) auch N r k=1 Q k. Nach 4.Lemma 12 ist N Jordan-meßbar mit vol(n) = und nach II. 8.Lemma 1.(d) ist die stetige Funktion ϕ auf der kompakten Menge N beschränkt, es gibt also ein M > mit ϕ (x) M für alle x N. Nach (b) gibt es damit für jedes ɛ > endlich viele Würfel W 1,..., W r R n mit ϕ(n) ϕ(n) r W k und k=1 m k=1 W k r vol(w k ) M n vol(n) + ɛ = ɛ. k=1 Damit ist ϕ(n) eine Jordansche Nullmenge. (d) Zunächst ist nach II. 8.Lemma 1.(e) auch die Menge B R n kompakt, und nach II. 8.Lemma 1.(a) sind die Mengen A und B insbesondere abgeschlossen und beschränkt. Nach II. 4.Lemma 18.(b) gelten somit A = A\A und B = B\B. Nach II. 4.Lemma 17.(b) ist A R n offen und nach 1.Korollar 7.(a) ist damit auch das Bild ϕ(a ) offen im R n. Nach II. 4.Lemma 17.(c) ist damit ϕ(a ) B und dies bedeutet B = B\B ϕ(a)\ϕ(a ) ϕ(a\a ) = ϕ( A). Nach 4.Satz 14 ist A eine Jordansche Nullmenge, also ist nach (c) auch ϕ( A) eine Jordansche Nullmenge und nach 4.Lemma 6.(a) ist schließlich auch B eine Jordansche Nullmenge. Erneut nach 4.Satz 14 ist B Jordan-meßbar. Wir kommen zum Beweis der Ungleichung und setzen M := sup x A ϕ (x) und da A kompakt ist, ist nach II. 8.Lemma 1.(d) auch M <. Ist ɛ >, so gibt es nach (b) endlich viele Würfel W 1,..., W r R n mit B = ϕ(a) r k=1 W k und r k=1 vol(w k) M n vol(a) + ɛ, also haben wir nach 4.Lemma 13.(a) auch ( r ) r vol(b) vol W k vol(w k ) M n vol(a) + ɛ. k=1 k=1 175

176 Mathematik für Physiker III, WS 212/213 Freitag Da dies für jedes ɛ > gilt, ist somit vol(b) M n vol(a) wie behauptet. Vorlesung 16, Freitag Wir sind gerade dabei den Beweis der Transformationsformel anzugehen, und behandeln hierzu einige vorbereitende Lemmata. Insbesondere haben wir bereits das Transformationsverhalten Jordan-meßbarer Mengen unter stetig differenzierbaren Abbildungungen ϕ : U R n definiert auf einer offenen Menge U R n untersucht, und dabei die folgenden Aussagen bewiesen: 1. Ist A U kompakt und Jordan-meßbar und ist M mit ϕ (x) M für alle x A, so können wir für jedes ɛ > endlich viele Würfel W 1,..., W r R n mit ϕ(a) W 1... W r und r k=1 vol(w k) M n vol(a) + ɛ finden. Beachte dabei das es eine solche Zahl M immer gibt, da die Funktion ϕ auf der kompakten Menge A stetig ist besagt II. 8.Lemma 1.(d) das ϕ auf A auch beschränkt ist, und dies bedeutet das es ein M mit ϕ (x) M für alle x A gibt. 2. Nehmen wir zusätzlich an, dass ϕ (x) für jedes x A stets invertierbar ist, so ist das Bild ϕ(a) wieder Jordan-meßbar und es gilt vol(ϕ(a)) M n vol(a). Die Invertierbarkeitsbedingung werden wir bald im Satz über die Transformationsformel noch etwas weiter abschwächen. 3. Für jede Jordansche Nullmenge N U deren Abschluß N U noch immer in U enthalten ist, ist auch das Bild ϕ(n) ein Jordansche Nullmenge. In der ersten Aussage ist es in Wahrheit gar nicht wichtig zu fordern das A kompakt ist, es reicht aus wie in der dritten Aussage A U zu verlangen. Da wir das Lemma oftmals in dieser erweiterten Form anwenden werden, wollen wir uns dies kurz einmal überlegen. Zunächst ist A als Jordan-meßbare Menge insbesondere beschränkt, und damit ist der Abschluß A abgeschlossen und beschränkt im R n also nach dem Satz von Heine-Borel II. 8.Satz 4 auch kompakt. Weiter gilt auch ϕ (x) M für alle x A. Wir müssen also nur noch wissen das mit A auch der Abschluß A Jordan-meßbar ist und dasselbe Volumen wie A hat. Dies ist aber leicht zu sehen, nach 4.Satz 14 ist der Rand A eine Jordansche Nullmenge, also nach 4.Lemma 12 auch Jordan-meßbar mit vol( A) =. Nach 4.Lemma 13.(a,b) ist damit auch A = A ( A) Jordan-meßbar mit vol(a) vol(a) = vol(a A) vol(a) + vol( A) = vol(a), d.h. vol(a) = vol(a). Im nächsten Lemma kümmern wir uns um verallgemeinerte Riemannsummen. Die in 4 vorgestellte Standardheuristik und auch unsere vorläufige Begründung der 176

177 Mathematik für Physiker III, WS 212/213 Freitag Transformationsformel zu Beginn dieses Kapitels verwenden immer feiner werdende Zerlegungen des Integrationsbereichs und approximieren das Integral indem auf jedem dieser Stückchen ein spezieller Funktionswert herausgegriffen wird und die Funktion dann auf diesem Stückchen durch diesen konstanten Wert angenähert wird. In der formalen Definition des Riemann-integrals und auch in allen Beweisen der zugehörigen Sätze haben wir dann stets wesentlich speziellere Zerlegungen verwendet, alle Stückchen mussten achsenparallele Quader sein, die auch in allen Koordinatenachsen dieselben Unterteilungspunkte verwenden. In diesem Kapitel geraten wir jetzt das erste Mal an eine Stelle wo diese Zerlegungen in achsenparallele Quader nicht mehr ausreichen. Wir haben ja eine stetig differenzierbare Funktion ϕ zu betrachen, und zerlegen wir dann einen Quader Q im Definitionsbereich von ϕ wie gewohnt mit einer Zerlegung α von Q, so überträgt sich diese Zerlegung unter ϕ in eine Zerlegung ϕ(q) = j I α ϕ(q α,j ) des Bildes ϕ(q), aber die Teilstückchen ϕ(q α,j ) sind im Allgemeinen keine Quader mehr. Das folgende Lemma besagt das auch diese verallgemeinerten Zerlegungen und ihre zugehörigen Riemannsummen noch funktionieren, zumindest solange der Integrand nicht zu kompliziert ist. Wir werden das Lemma für Integranden beweisen die in allen Punkten außerhalb einer Jordanschen Nullmenge stetig sind. Für den Beweis der Transformationsformel brauchen wir die Aussage eigentlich nur für stetige Funktionen und in der Vorlesung haben wir den Beweis auch nur für diese vorgeführt, hier wollen wir aber ruhig die allgemeine Form herleiten. Bevor wir das Lemma über die verallgemeinerten Riemannsummen angehen, wollen wir eine kleine Vorbermerkung behandeln. Seien n N mit n 1 und eine Jordansche Nullmenge N R n gegeben. Weiter sei ɛ >. Direkt nach Definition einer Jordanschen Nullmenge gibt es dann endlich viele Quader Q 1,..., Q r R n mit N r k=1 Q k und r k=1 vol(q k) < ɛ. Dabei können wir Q k für jedes 1 k r annehmen. Wähle weiter ein δ > mit r vol(q k ) + rδ < ɛ. k=1 Sei 1 k r und schreibe Q k = [a, b] mit a, b R n. Wegen vol(q k ) = n i=1 (b i a i ) existiert dann ein γ > mit n (b i a i + 2γ) < vol(q k ) + δ, i=1 definieren wir also den vergrößerten Quader Q k := [(a i γ) 1 i n, (b i + γ) 1 i n ] R n, so sind Q k = [a, b] Q k und vol( Q n k ) = (b i a i + 2γ) < vol(q k ) + δ. Da der Rand Q k als Vereinigung von 2n ausgearteten Quadern eine Jordansche Nullmenge, und nach 4.Lemma 12 auch Jordan-meßbar mit vol( Q k ) = ist, ist nach 4.Lemma 13.(d) auch Q k = Q k \( Q k ) eine Jordan-meßbare Menge mit vol( Q k ) = i=1 177

178 Mathematik für Physiker III, WS 212/213 Freitag vol( Q k ) < vol(q k ) + δ. Insgesamt ist damit U := r Q k=1 k nach II. 4.Lemma 17.(h) und 4.Lemma 13.(b) eine Jordan-meßbare und offene Menge mit und vol(u) = vol ( r k=1 N Q k ) r Q k k=1 r k=1 Q k = U r vol( Q k) k=1 r vol(q k ) + rδ < ɛ. Damit können wir zu unseren Lemma über die verallgemeinerten Riemannsummen kommen. Lemma 5.3 (Verallgemeinerte Riemannsummen) Seien n N mit n 1, M R n eine kompakte Jordan-meßbare Menge, N R n eine Jordansche Nullmenge und f : M R eine beschränkte Funktion, die in jedem Punkt x M \N stetig ist. Dann gibt es für jedes ɛ > ein δ > so, dass für alle Jordan-meßbaren Mengen B 1,..., B r R n mit 1. es ist M = B 1... B r, 2. für alle 1 i < j r ist B i B j eine Jordansche Nullmenge, 3. für jedes 1 i r ist d(b i ) δ, und alle Punkte ξ i B i für 1 i r stets r f(x) dx f(ξ i ) vol(b i ) < ɛ gilt. M i=1 Beweis: Da der Rand M nach 4.Satz 14 eine Jordansche Nullmenge ist, können wir N durch N ( M) ersetzen und dies ist nach 4.Lemma 6.(b) noch immer eine Jordansche Nullmenge. Folglich können wir M N annehmen und dann ist M\N M \N, d.h. die Funktion f ist in jedem Punkt x M\N stetig. Weiter ist N wie bereits im Beweis von Lemma 2.(c) gezeigt eine kompakte Jordansche Nullmenge, durch Ersetzen von N durch N können wir also auch annehmen das N kompakt ist. Da die Funktion f beschränkt ist, gibt es eine Konstante C > mit f(x) C für alle x M. Sei jetzt ein ɛ > gegeben. Nach unserer Vorbemerkung gibt es eine offene, Jordanmeßbare Menge U R n mit N U und vol(u) < ɛ 4C. Nach 4.Lemma 13.(a,b) ist auch der Durchschnitt V := M U Jordan-meßbar und es gilt vol(v ) vol(u) < ɛ 4C. 178 k=1

179 Mathematik für Physiker III, WS 212/213 Freitag Nach dem Aufdickungslemma Lemma 1 gibt es eine Konstante α > mit B α (N) U und die Menge B α/2 (N) R n ist offen. Dabei verwenden wir auf dem R n wieder die Maximumsnorm. Nach II. 4.Lemma 17.(d) ist das Komplement R n \B α/2 (N) abgeschlossen und da nach II. 8.Lemma 1.(a) auch M abgeschlossen ist, ist der Durchschnitt M := M\B α/2 (N) = M (R n \B α/2 (N)) nach II. 4.Lemma 16.(g) ebenfalls abgeschlossen. Folglich ist M eine abgeschlossene Teilmenge einer kompakten Menge und somit nach II. 8.Lemma 1.(c) ebenfalls kompakt. Wegen M M\N ist f M stetig, also gibt es nach 4.Lemma 3 ein η > so, dass für alle x, y M mit x y < η stets f(x) f(y) < ɛ/(2 vol(m) + 1) gilt. Damit können wir jetzt das gesuchte δ als δ := 1 min {α, η} 2 definieren. Wir behaupten das mit dieser Wahl von δ die Aussage des Lemmas zutrifft. Seien also B 1,..., B r R n Jordan-meßbare Mengen mit d(b i ) δ für alle 1 i r und M = B 1... B r so, dass B i B j für alle 1 i < j r stets eine Jordansche Nullmenge ist. Weiter sei für jedes 1 i r ein Punkt ξ i B i gegeben. Wir müssen einsehen, dass dann n f(x) dx f(ξ i ) vol(b i ) < ɛ M i=1 gilt. Wähle einen nicht ausgearteten Quader Q R n mit M Q. Für jedes 1 i r ist dann auch B i M Q, also ist die charakteristische Funktion χ Q B i : Q R direkt nach Definition einer Jordan-meßbaren Menge Riemann-integrierbar und damit ist nach 4.Lemma 9.(b) auch die charakteristische Funktion χ Bi : M R als Einschränkung χ Bi = χ Q B i M wieder Riemann-integrierbar. Nach 4.Lemma 18.(a) ist auch die Funktion r g : M R; x f(ξ i ) χ Bi (x) Riemann-integrierbar mit M Weiter ist die Menge g(x) dx = r i=1 i=1 f(ξ i ) χ Bi (x) dx = M S := 1 i<j r (B i B j ) r f(ξ i ) vol(b i ). nach 4.Lemma 6.(b) eine Jordansche Nullmenge, d.h. nach 4.Lemma 6.(d) ist auch die Funktion { g(x), x / S, h : M R; x f(x), x S 179 i=1

180 Mathematik für Physiker III, WS 212/213 Freitag Riemann-integrierbar mit h(x) dx = g(x) dx = M M r f(ξ i ) vol(b i ). i=1 Wir benötigen noch eine weitere Hilfsfunktion. Die Menge V M ist wie bereits gezeigt ebenfalls Jordan-meßbar, also erhalten wir wie oben das die charakteristische Funktion χ V : M R Riemann-integrierbar ist, und wieder nach 4.Lemma 18.(a) ist damit auch ɛ H : M R; x 2 vol(m) Cχ V (x) Riemann-integrierbar mit H(x) dx = M ɛ 2 vol(m) + 1 vol(m) + 2C vol(v ) < ɛ 2 + ɛ 2 = ɛ. Wir zeigen jetzt, dass für alle x M stets f(x) h(x) H(x) gilt. Sei also x M gegeben. Ist x S, so haben wir f(x) h(x) = H(x). Ist dagegen x / S, so existiert genau ein 1 i r mit x B i und es folgt h(x) = g(x) = f(ξ i ). Wir unterscheiden zwei verschiedene Fälle. Im ersten Fall ist B i B α/2 (N), es gibt also Punkte y B i und z N mit y z < α/2, also haben wir auch x z x y + y z d(b i ) + α 2 δ + α 2 α, und dies bedeutet x B α (N) U. Damit ist x M U = V und somit wird f(x) h(x) = f(x) f(ξ i ) f(x) + f(ξ i ) 2C H(x). Im zweiten Fall ist dagegen B i B α/2 (N) =, also B i M\B α/2 (N) = M. Insbesondere sind x, ξ i B i M und wegen x ξ i d(b i ) δ < η ist damit auch in diesem Fall ɛ f(x) h(x) < 2 vol(m) + 1 H(x). Mit 4.Lemma 18.(b,c) folgt schließlich M f(x) dx n f(ξ i ) vol(b i ) = i=1 Damit ist das Lemma vollständig bewiesen. M (f(x) h(x)) dx f(x) h(x) dx M M H(x) dx < ɛ. 18

181 Mathematik für Physiker III, WS 212/213 Freitag Wir bezeichnen ein Tupel (B, ξ) = (B i, ξ i ) 1 i r mit den im Lemma genannten drei Eigenschaften auch als eine verallgemeinerte Zerteilung von M der Feinheit höchstens δ. Die Summe r R(f; B, ξ) := f(ξ i ) vol(b i ) i=1 ist dann die zu dieser verallgemeinerten Zerteilung gehörige Riemannsumme. Mit dieser Sprechweise können wir das eben bewiesene Lemma dann als eine direkte Verallgemeinerung der Kennzeichnung 4.Satz 2.(d) Riemann-integrierbarer Funktionen interpretieren. Bevor wir schließlich zum Beweis der Transformationsformel kommen, haben wir noch ein letztes der vorbereitenden Lemmata zu behandeln. Dieses wird die Stelle sein an der die Determinante der stetig differenzierbaren Transformation ϕ ins Spiel kommt. Der Beweis des Lemmas ist eine Kombination des schon zum Beweis des Satzes über Umkehrfunktionen verwendeten Injektivitätslemmas 1.Lemma 2 mit der affinen Transformationsformel 4.Satz 24 für das Volumen. Lemma 5.4: Seien n N mit n 1, U R n offen und ϕ : U R n eine stetig differenzierbare Funktion. Sei A U kompakt und für jedes x A sei ϕ (x) invertierbar. Dann existiert für jedes ɛ > ein δ > so, dass für jeden Würfel W R n mit W A und d(w ) δ und jedes ξ W stets vol(ϕ(w )) det ϕ (ξ) vol(w ) ɛ vol(w ) gilt. Beweis: Wir verwenden auf dem R n wieder die Maximumsnorm. Nach 1.Lemma 4.(c) ist die Funktion f 1 : A R; x ϕ (x) 1 stetig, also gibt es nach II. 8.Lemma 1.(d) eine Konstante M > mit ϕ (x) 1 M für alle x A. Weiter ist nach 1.Lemma 4.(b) auch die Funktion f 2 : A R; x det ϕ (x) stetig, es gibt also wieder nach II. 8.Lemma 1.(d) eine weitere Konstante M > mit det ϕ (x) M für alle x A. Sei jetzt ein ɛ > gegeben. Da die Funktion g : [, 1] R ; t (1 + t) n (1 t) n stetig mit g() = ist, gibt es ein < θ < 1 mit (1 + θ) n (1 θ) n < ɛ 2M. Wenden wir jetzt 4.Lemma 3 auf die Funktionen f 1 und f 2 an, so erhalten wir weitere Konstanten δ 1 >, δ 2 > so, dass für alle x, y A stets x y < δ 1 = ϕ (x) ϕ (y) < θ M und x y < δ 2 = det ϕ (x) det ϕ (y) < ɛ 2 181

182 Mathematik für Physiker III, WS 212/213 Freitag gelten. Schließlich setzen wir δ := min{δ 1, δ 2 } >. Wir zeigen nun, dass mit dieser Wahl von δ die Aussage des Lemmas erfüllt ist. Seien also W A ein Würfel mit a := d(w ) δ und ξ W ein Punkt in W. Beachte zunächst, dass das Bild ϕ(w ) R n nach Lemma 2.(d) überhaupt Jordanmeßbar ist, das das Volumen von ϕ(w ) also definiert ist. Bezeichnet z den Mittelpunkt von W, so ist W = B a/2 (z). Wir schreiben T := ϕ (z) und betrachten die offene Menge V := U z R n mit V sowie die wieder stetig differenzierbare Hilfsfunktion h : V R n ; x T 1 ϕ(x + z) T 1 ϕ(z) mit h() = und h () = T 1 ϕ (z) = 1. Dann haben wir B a/2 () = W z V und für jedes x B a/2 () ist x + z W A mit (x + z) z = x a/2 < δ δ 1, also haben wir auch h (x) 1 = T 1 ϕ (x + z) T 1 T T 1 ϕ (x + z) ϕ (z) M ϕ (x + z) ϕ θ (z) < M M = θ. Nach 1.Lemma 2.(b) ist damit Addition mit T 1 ϕ(z) liefert weiter B (1 θ) a 2 () h(b a/2()) B (1+θ) a 2 (). B (1 θ) a 2 (T 1 ϕ(z)) T 1 (ϕ(b a/2 (z))) B (1+θ) a 2 (T 1 ϕ(z)) und wenden wir auf diese Inklusion auch noch T an, so ergibt sich schließlich T ( ) ( ) B (1 θ) a (T 1 ϕ(z)) ϕ(b 2 a/2 (z)) = ϕ(w ) T B (1+θ) a (T 1 ϕ(z)). 2 Mit 4.Lemma 13.(a) und der affinen Transformationsformel für Jordan-meßbare Mengen 4.Satz 24 folgt hieraus ( ) ( ) ( ( )) n (1 θ)a det T = det T vol B (1 θ) a (T 1 ϕ(z)) = vol T B 2 (1 θ) a (T 1 ϕ(z)) 2 ( ( )) vol(ϕ(w )) vol T B (1+θ) a (T 1 ϕ(z)) 2 ( ) = det T vol B (1+θ) a (T 1 ϕ(z)) = ( (1 + θ)a ) n 2 det T. Damit liegt vol(ϕ(w )) im Intervall [((1 θ)a) n det T, ((1 + θ)a) n det T ], und andererseits haben wir auch ((1 θ)a) n det T a n det T ((1 + θ)a) n det T 182

183 Mathematik für Physiker III, WS 212/213 Freitag und somit liegt auch det T vol(w ) = a n det T in diesem Intervall. Folglich ist vol(ϕ(w )) det T vol(w ) ((1 + θ) n (1 θ) n ) det T a n M ((1 + θ) n (1 θ) n ) vol(w ) < M ɛ 2M vol(w ) = ɛ vol(w ). 2 Weiter sind auch z, ξ W A mit ξ z a/2 < δ δ 2, und somit gilt det ϕ (ξ) det T = det ϕ (ξ) det ϕ (z) det ϕ (ξ) det ϕ (z) < ɛ 2, und wir haben insgesamt vol(ϕ(w )) det ϕ (ξ) vol(w ) vol(ϕ(w )) det T vol(w ) + det T det ϕ (ξ) vol(w ) < ɛ vol(w ). Damit ist das Lemma vollständig bewiesen. Damit sind alle Vorbereitungen abgeschlossen und wir kommen zum Beweis der Transformationsformel. Die in folgenden Satz angegebene Version dieser Formel ist etwas allgemeiner als die zu Beginn dieses Kapitels angesprochene Fassung, wir brauchen nicht das die Funktion ϕ ein C 1 -Diffeomorphismus, sondern es reicht dies auf der Menge zu fordern über die integriert wird. Dabei darf sogar eine Menge von Ausnahmepunkten auftreten in denen die Transformation ϕ keine invertierbare Ableitung hat, diese Menge muss dann aber eine Jordansche Nullmenge sein. Die Jordan-Meßbarkeit des Bildbereichs muss nicht vorausgesetzt werden sondern wird als eine Erweiterung von Lemma 2.(d) bewiesen. Außerdem lassen wir noch zu das der Integrand f nicht überall stetig sein muss. Satz 5.5 (Transformationsformel für das Riemann-Integral) Seien n N mit n 1, U R n offen und ϕ : U R n stetig differenzierbar. Weiter sei A R n eine kompakte Jordan-meßbare Menge mit A U und es gebe eine Jordansche Nullmenge N R n so, dass ϕ A\N injektiv ist und ϕ (x) für jedes x A\N invertierbar ist. Dann ist auch B := ϕ(a) Jordan-meßbar und für jede beschränkte Funktion f : B R die in jedem Punkt x ϕ(a\n) stetig ist gilt die Transformationsformel f(x) dx = f(ϕ(x)) det ϕ (x) dx. B A Beweis: Nach 4.Lemma 6.(a) ist auch N A eine Jordansche Nullmenge, durch Übergang zu diesem Durchschnitt können wir also annehmen das N A ist. Da die Funktion 183

184 Mathematik für Physiker III, WS 212/213 Freitag A R; x ϕ (x) stetig ist, gibt es nach II. 8.Lemma 1.(d) eine Konstante M > mit ϕ (x) M für alle x A. Weiter ist auch die Funktion A R; x det ϕ (x) nach 1.Lemma 4.(b) stetig, es gibt also wieder nach II. 8.Lemma 1.(d) eine Konstante M > mit det ϕ (x) M für alle x A. Nach 4.Lemma 12 ist N Jordan-meßbar mit vol(n) =, also ist nach 4.Lemma 13.(d) auch A := A\N Jordan-meßbar mit vol(a ) = vol(a). Wir zeigen zunächst das B Jordan-meßbar ist. Da B nach II. 8.Lemma 1.(f) kompakt ist, ist B nach II. 8.Lemma 1.(a) zumindest beschränkt. Sei ɛ >. Wie bereits gezeigt gibt es eine offene, Jordan-meßbare Menge V R n mit N V und vol(v ) ɛ/(2m n ). Nach II. 4.Lemma 17.(d) ist R n \V abgeschlossen im R n, also ist die Menge A\V = A (R n \V ) nach II. 4.Lemma 16.(g) abgeschlossen im R n und nach II. 8.Lemma 1.(c) ist A\V sogar kompakt. Weiter ist A\V = A\(A V ) nach 4.Lemma 13.(b,d) auch Jordan-meßbar. Wegen A\V A\N ist ϕ (x) für jedes x A\V invertierbar, also ist B := ϕ(a\v ) R n nach Lemma 2.(d) Jordanmeßbar mit B ϕ(a) = B. Nach 4.Lemma 13.(a,b) ist A V Jordan-meßbar mit vol(a V ) vol(v ) ɛ/(2m n ), und wegen A V A U ergibt Lemma 2.(b) in der eingangs besprochenen erweiterten Form das es endlich viele Würfel W 1,..., W r R n mit ϕ(a V ) r W k und k=1 r vol(w k ) M n vol(v A) + ɛ 2 M n ɛ 2M + ɛ n 2 = ɛ. k=1 Mit 4.Lemma 13.(b) erhalten wir die Jordan-meßbare Menge und B + := B r W k mit B = ϕ(a) = ϕ(a\v ) ϕ(a V ) B k=1 vol(b + ) vol(b ) r vol(w k ) ɛ. k=1 r W k = B + Nach 4.Lemma 23.(a) ist B damit eine Jordan-meßbare Menge. Damit ist die Meßbarkeitsaussage bewiesen und wir kommen zur eigentlichen Transformationsformel. Sei also f : B R eine beschränkte Funktion, die in jedem Punkt x ϕ(a\n) stetig ist. Wähle eine Konstante M > mit f(x) M für jedes x B. Nach Lemma 2.(c) ist ϕ(n) R n eine Jordansche Nullmenge und wegen B\ϕ(N) ϕ(a\n) ist f nach 4.Korollar 15 überhaupt Riemann-integrierbar. Weiter ist auch die Funktion (f ϕ) det ϕ : A R in jedem Punkt x A\N stetig und für alle x A gilt f(ϕ(x)) det ϕ (x) M M, die Funktion ist also auch beschränkt und somit wieder nach 4.Korollar 15 Riemann-integrierbar. Damit sind beide Seiten der Transformationsformel zumindest definiert. Sei jetzt ein ɛ > gegeben und setze { θ := min ɛ 3M M, 184 ɛ }. 6M n M k=1

185 Mathematik für Physiker III, WS 212/213 Freitag Nach dem Exhaustionsprinzip 4.Lemma 23.(b) gibt es dann eine dyadische Würfelfigur W R n mit W A und vol(w ) > vol(a ) θ = vol(a) θ. Nach 4.Lemma 13.(d) ist auch A\W Jordan-meßbar mit vol(a\w ) = vol(a) vol(w ) < θ und nach 4.Lemma 18.(c,f) haben wir weiter C 1 := f(ϕ(x)) det ϕ (x) dx f(ϕ(x)) det ϕ (x) dx A W = f(ϕ(x)) det ϕ (x) dx f(ϕ(x)) det ϕ (x) dx A\W A\W M M vol(a\w ) < ɛ 3. Wegen A\W A U ergibt Lemma 2.(b) das es endlich viele Würfel W 1,..., W s R n mit ϕ(a\w ) r k=1 vol( W k ) und s vol( W k ) M n vol(a\w ) + k=1 ɛ 6M M n ɛ 6M n M + ɛ 6M = ɛ 3M gibt. Für jedes x W A ist ϕ (x) invertierbar, also ist ϕ(w ) nach Lemma 2.(d) Jordan-meßbar. Nach 4.Lemma 13.(d) ist damit auch B\ϕ(W ) Jordan-meßbar und wegen s B\ϕ(W ) ϕ(a\w ) W k haben wir nach 4.Lemma 13.(a,b) auch k=1 vol(b\ϕ(w )) s vol( W k ) k=1 ɛ 3M. Mit 4.Lemma 18.(c,f) ergibt sich damit wieder C 2 := B f(x) dx ϕ(w ) f(x) dx = B\ϕ(W ) B\ϕ(W ) f(x) dx f(x) dx M vol(b\ϕ(w )) ɛ 3. Wegen W A = A\N ist (f ϕ) det ϕ in jedem Punkt x W stetig und wegen ϕ(w ) ϕ(a\n) ist f in jedem Punkt x ϕ(w ) stetig. Nach dem Lemma über 185

186 Mathematik für Physiker III, WS 212/213 Freitag verallgemeinerte Riemannsummen Lemma 3 gibt es eine Konstante δ 1 > so, dass für alle verallgemeinerten Zerteilungen (B i, ξ) 1 i r der Feinheit höchstens δ 1 von W stets r f(ϕ(x)) det ϕ (x) dx f(ϕ(ξ i )) det ϕ (ξ i ) vol(b i ) < ɛ 9 W i=1 gilt und eine weitere Konstante δ 2 > so, dass für alle verallgemeinerten Zerteilungen (B i, ξ) 1 i r der Feinheit höchstens δ 2 von ϕ(w ) stets r f(x) dx f(ξ i ) vol(b i ) < ɛ 9 ϕ(w ) i=1 gilt. Weiter gibt es nach Lemma 4 auch ein δ 3 > so, dass für jeden Würfel W R n und alle ξ W mit W W und d(w ) δ 3 stets vol(ϕ(w )) det ϕ (ξ) vol(w ) ɛ 9M (vol(w ) + 1) vol(w ) gilt. Wähle nun ein m N mit { 2 m < min δ 1, δ } 2 M, δ 3 so, dass W eine dyadische Würfelfigur der Stufe m ist. Dann gibt es dyadische Würfel W 1,..., W r der Stufe m mit W = r i=1 W i. Für jedes 1 i r sei z i der Mittelpunkt von W i. Für alle 1 i < j r ist W i W j eine Jordansche Nullmenge und es gilt d(w i ) = 2 m < δ 1 für alle 1 i r, wir haben also r B 1 := f(ϕ(x)) det ϕ (x) dx f(ϕ(z i )) det ϕ (z i ) vol(w i ) < ɛ 9. W Für jedes 1 i r ist wegen d(w i ) = 2 m < δ 3 auch vol(ϕ(w i)) det ϕ (z i ) vol(w i ) ɛ 9M (vol(w ) + 1) vol(w i). i=1 Weiter ist ϕ(w i ) für jedes 1 i r nach Lemma 2.(d) eine Jordan-meßbare Menge und es gilt ϕ(w ) = r i=1 ϕ(w i). Sind 1 i < j r, so haben wir W i, W j W A\N und da ϕ A\N injektiv ist, ist auch ϕ(w i ) ϕ(w j ) = ϕ(w i W j ) nach Lemma 2.(c) eine Jordansche Nullmenge. Sei 1 i r. Nach der Mittelwertungleichung II. 8.Lemma 21 gilt für alle x, y W i stets ϕ(x) ϕ(y) M x y, es ist also d(ϕ(w i )) Md(W i ) = M2 m < δ 2. Folglich ist auch r B 2 := f(x) dx f(ϕ(z i )) vol(ϕ(w i )) < ɛ 9. ϕ(w ) i=1 186

187 Mathematik für Physiker III, WS 212/213 Freitag Wir erhalten mit 4.Lemma 13.(c) C 3 := W f(x) det ϕ (x) dx f(x) dx ϕ(w ) r B 1 + B 2 + f(ϕ(z i )) (vol(ϕ(w i )) det ϕ (z i ) vol(w i )) i=1 2 r 9 ɛ + M vol(ϕ(w i)) det ϕ (z i ) vol(w i ) 2 9 ɛ + Insgesamt ist damit A i=1 ɛ 9(vol(W ) + 1) r vol(w i ) = 2 9 ɛ + ɛ 9(vol(W ) + 1) vol(w ) < ɛ 3. i=1 f(ϕ(x)) det ϕ (x) dx B f(x) dx C 1 + C 2 + C 3 < ɛ. Da diese Ungleichung für jedes ɛ > gilt, folgt schließlich die Transformationsformel. Beispiele zur Transformationsformel haben wir bereits ausgiebig behandelt, an dieser Stelle wollen wir nur eine kleine theoretische Folgungerung aus der Transformationsformel angeben. In 4.5 hatten wir festgestellt das sich die Schwerpunkte Jordan-meßbarer Mengen unter Translationen und unter Umskalierungen der Koordinatenachsen entsprechend mitbewegen. Dies wurde (27.b) zur Berechnung der Schwerpunkte von Ellipsoiden und Halbellipsoiden verwendet. Das folgende Korollar dehnt diese Transformationseigenschaft von Schwerpunkten auf beliebige umkehrbare, affine Transformationen aus. Korollar 5.6 (Affine Transformationen von Schwerpunkten) Seien n N mit n 1, M R n eine Jordan-meßbare Menge mit vol(m) > und ϕ : R n R n eine bijektive affine Abbildung. Dann gilt s(ϕ(m)) = ϕ(s(m)). Beweis: Dies ist Aufgabe (4.b). $Id: param.tex,v /12/16 17:3:4 hk Exp $ 187

188 Mathematik für Physiker III, WS 212/213 Freitag Parametrisierte Integrale In diesem kurzen Kapitel wollen wir sogenannte parametrisierte Integrale behandeln, dies sind Integrale bei denen der Integrand zusätzlich zu den Integrationsvariablen auch noch von einem oder mehreren Parametern abhängt. Wir wollen wissen wie sich das entstehende Integral dann als Funktion der Parameter verhält. Insbesondere wollen wir einsehen das sich Integration und Differentation unter geeigneten Annahmen miteinander vertauschen lassen, dass sich also Ableitungen nach Parametern in das Integral reinziehen lassen. Wir werden alle Aussagen auf einen grundlegenden Satz über die Integration gleichmäßig konvergenter Folgen von Riemann-integrierbaren Funktionen zurückführen. Den Begriff der gleichmäßigen Konvergenz von Funktionenfolgen hatten wir bereits in II. 4.2 eingeführt und wir hatten auch bereits einen Satz über gleichmäßig konvergente Folgen von Riemann-integrierbaren Funktionen in einer Variable behandelt, dies war II. 4.Satz 6. Der Beweis im n-dimensionalen Fall ist nahezu identisch zum Beweis im eindimensionalen Fall, soll hier zum Einstieg aber ruhig noch einmal wiederholt werden. Satz 6.1 (Gleichmäßige Konvergenz Riemann-integrierbarer Funktionen) Seien n N mit n 1, M R n eine Jordan-meßbare Menge und (f k ) k N eine Folge Riemann-integrierbarer Funktionen f k : M R für jedes k N, die gleichmäßig gegen eine Funktion f : M R konvergiert. Dann ist auch f Riemann-integrierbar und es gilt f(x) dx = lim f k (x) dx. M k M Beweis: Zunächst ist f : M R nach II. 4.Lemma 3 überhaupt beschränkt. Wir zeigen zuerst das die Funktion f Riemann-integrierbar ist, und beginnen mit dem Spezialfall das M = Q ein nicht ausgearteter Quader ist. Sei ein ɛ > gegeben. Dann existiert ein k N mit ɛ f k (x) f(x) < 3 vol(q) für alle k k, x Q. Da f k Rieman-integrierbar ist, gibt es nach 4.Satz 2 eine Zerlegung α von Q mit S(f k ; α) S(f k ; α) < ɛ/3. Für jedes j I α setzen wir und haben dann M j := sup x Q α,j f k (x) und M j := sup x Q α,j f(x) S(f k ; α) = j I α Mj vol(q α,j ) und S(f; α) = j I α M j vol(q α,j ). 188

189 Mathematik für Physiker III, WS 212/213 Freitag Sei j I α. Für jedes x Q α,j ist dann ɛ f(x) = f k (x) + f(x) f k (x) f k (x) + f k (x) f(x) < f k (x) + 3 vol(q) M ɛ j + 3 vol(q), d.h. es gilt M j M j + ɛ/(3 vol(q)). Daraus folgt S(f; α) = M j vol(q α,j ) ) ɛ ( M j + vol(q α,j ) 3 vol(q) j I α j I α = ɛ Mj vol(q α,j ) + vol(q α,j ) = S(f k ; α) + ɛ 3 vol(q) 3. j I α j I α Analog ergibt sich auch S(f; α) S(f k ; α) ɛ/3 und insgesamt ist S(f; α) S(f; α) S(f k ; α) + ɛ 3 S(f k ; α) + ɛ 3 < ɛ 3 + ɛ 3 + ɛ 3 = ɛ. Wieder nach 4.Satz 2 ist f Rieman-integrierbar. Im nächsten Schritt behandeln wir nun den Fall das M eine allgemeine Jordanmeßbare Menge ist. Wähle dann einen nicht ausgearteten Quader Q R n mit M Q. Für jedes k N ist die Funktion { f k (x), x M, f k : Q R; x, x / M dann Riemann-integrierbar. Weiter betrachten wir die Funktion { f(x), x M, f : Q R; x, x / M, und behaupten das die Funktionenfolge ( f k ) k N auf Q gleichmäßig gegen f konvergiert. Sei hierzu ein ɛ > gegeben. Da (f k ) k N auf M gleichmäßig gegen f konvergiert gibt es dann ein k N mit f k (x) f(x) < ɛ für alle x M und alle k k. Sind also k k und x Q gegeben, so ist im Fall x / M sofort f k (x) f(x) = < ɛ, und im Fall x M haben wir ebenfalls f k (x) f(x) = f k (x) f(x) < ɛ. Dies beweist die gleichmäßige Konvergenz der Funktionenfolge ( f k ) k N gegen f, und nach der bereits bewiesenen Teilaussage ist f Riemann-integrierbar. Dies bedeutet aber genau das die Funktion f Riemann-integrierbar ist. Damit ist die Integrierbarkeitsaussage vollständig bewiesen. Wir kommen jetzt zur verbleibenden Aussage über die Konvergenz der Integrale. Sei wieder ɛ > gegeben. Dann existiert ein k N mit f k (x) f(x) < ɛ/(vol(m)+1) 189

190 Mathematik für Physiker III, WS 212/213 Freitag für alle k k und alle x M. Sei k N mit k k. Dann haben wir nach 4.Lemma 18.(c) M f k (x) dx M f(x) dx = M (f k (x) f(x)) dx M f k (x) f(x) dx ɛ vol(m) < ɛ. vol(m) + 1 Damit ist auch die Konvergenz von ( f M k(x) dx) k N gegen f(x) dx bewiesen. M Dieser Konvergenzsatz war bereits der Kern des gesamten Kapitels, alle unsere Aussagen über parametrisierte Integrale können wir als eine mit diesem Satz startende Kette direkter Folgerungen beweisen. Wir beginnen mit der stetigen Abhängigkeit des Integrals von Parametern. Hier ist es am bequemsten die Definition der Stetigkeit als Folgenstetigkeit zu verwenden. Korollar 6.2 (Stetige Abhängigkeit von Parametern) Seien n, m N mit n, m 1, M R n eine kompakte, Jordan-meßbare Menge und A R m eine beliebige Teilmenge. Weiter sei f : M A R eine stetige Funktion. Dann ist auch die Funktion F : A R; y f(x, y) dx wieder stetig. Beweis: Zunächst einmal ist die Funktion F nach II. 8.Lemma 1.(d) und 4.Korollar 15 überhaupt wohldefiniert, d.h. für jedes y A ist die Funktion f y : M R; x f(x, y) Riemann-integrierbar. Sei (y k ) k N eine Folge in A, die gegen ein y A konvergiert, also lim k y k = y. Wir behaupten, dass dann die Funktionenfolge (f yk ) k N auf M gleichmäßig gegen f y konvergiert. Sei also ein ɛ > gegeben. Sei x M. Da die Funktion f in (x, y) stetig ist, existiert ein δ(x) > so, dass für alle x M mit x x < δ(x) und alle y A mit y y < δ(x) stets f(x, y ) f(x, y) < ɛ/2 gilt. Da die Folge (y k ) k N gegen y konvergiert, gibt es weiter ein k(x) N mit y k y < δ(x) für alle k N mit k k(x), d.h. für alle k k(x) und alle x M mit x x < δ(x) gilt f yk (x ) f y (x ) = f(x, y k ) f(x, y) M f(x, y k ) f(x, y) + f(x, y) f(x, y) < ɛ 2 + ɛ 2 = ɛ. Da die Menge M kompakt ist, gibt es nach II. 8.Satz 2 endlich viele Punkte x 1,..., x r M mit r M B δ(xi )(x i ). i=1 19

191 Mathematik für Physiker III, WS 212/213 Freitag Wähle schließlich ein k N mit k k(x i ) für alle 1 i r. Wir behaupten das dann f yk (x) f y (x) < ɛ für alle k k und alle x M gilt. Seien also k N mit k k und x M gegeben. Dann existiert ein 1 i r mit x B δ(xi )(x i ), also ist x x i < δ(x i ). Da weiter auch k k k(x i ) gilt, haben wir damit tatsächlich f yk (x) f y (x) < ɛ, und diese Zwischenbehauptung ist bewiesen. Also konvergiert die Funktionenfolge (f yk ) k N auf der Menge M gleichmäßig gegen f y, und Satz 1 liefert F (y) = M f(x, y) dx = Damit ist die Funktion F stetig. M f y (x) dx = lim f yk (x) dx k M = lim f(x, y k ) dx = lim F (y k ). k M k Wenden wir das eben bewiesene Korollar über die stetige Abhängigkeit des Riemann- Integrals von Parametern jetzt auf Differenzenquotienten an, so ergibt sich die Vertauschbarkeit von Differentation und Integration. Dabei werden wir im Beweis eine kleine Hilfsaussage brauchen, sind A R n und B R m kompakte Teilmengen, so ist auch das Produkt A B eine kompakte Teilmenge des R n+m. Dies folgt zum Beispiel sofort aus dem Satz von Heine-Borel II. 8.Satz 4 da A B abgeschlossen und beschränkt im R n+m ist. Man kann sich die entsprechende Aussage auch leicht für kompakte Teilmengen normierter Räume E und F überlegen, dann müssten wir aber spezifizieren welche Norm auf E F verwendet werden soll, und dies wollen wir an dieser Stelle nicht behandeln. Korollar 6.3 (Ableitungen nach Parametern) Seien n N mit n 1, M R n eine kompakte Jordan-meßbare Menge und I R ein Intervall mit I > 1. Weiter sei f : M I R eine stetige Funktion die nach dem letzten Argument stetig partiell differenzierbar ist. Dann ist auch die Funktion F : I R; t f(x, t) dx M stetig differenzierbar mit für jedes t I. F (t) = M f (x, t) dx t Beweis: Nach Korollar 2 ist F : I R zumindest eine wohldefinierte stetige Funktion. Sei t I gegeben. Wir betrachten dann die Hilfsfunktion h : M I R; (x, t) 191 { f(x,t) f(x,t ) t t, t t, f t ), t = t,

192 Mathematik für Physiker III, WS 212/213 Freitag und behaupten das auch h stetig ist. Seien also x M und t I gegeben. Im Fall t t ist h nach den Grundeigenschaften stetiger Funktion in (x, t) stetig, wir müssen also nur noch den Fall t = t betrachten. Hier ist es am günstigsten die ɛ δ Kennzeichnung der Stetigkeit zu verwenden. Sei also ein ɛ > gegeben. Wir wählen dann ein kompaktes Intervall J I und ein δ 1 > mit I (t δ 1, t + δ 1 ) J, also insbesondere t J. Dann ist die Funktion f/ t auf der kompakten Menge M I stetig, also existiert nach 4.Lemma 3 ein δ 2 > so, dass für alle x, x M mit x x < δ 2 und alle s, s J mit s s < δ 2 stets f t (x, s ) f t (x, s ) < ɛ 2 gilt. Schließlich setzen wir δ := min{δ 1, δ 2 }. Seien jetzt x M und s I mit x x < δ und s t = s t < δ gegeben. Wegen s I (t δ, t +δ) I (t δ 1, t +δ 1 ) J ist dann insbesondere s J. Dann haben wir zunächst wegen x x < δ δ 2 auch f t (x, t ) f t (x, t ) < ɛ 2. Ist also s = t, so gilt sofort h(x, s) h(x, t) = f t (x, t ) f t (x, t ) < ɛ 2 < ɛ. Nun nehmen wir s t an. Dann existiert nach dem Mittelwertsatz I. 14.Satz 1.(a) ein ξ R zwischen s und t, also insbesondere mit ξ J und ξ t < δ δ 2, so dass f(x, s) f(x, t ) s t = f t (x, ξ) gilt. Damit erhalten wir auch in diesem Fall h(x, s) h(x, t) = f(x, s) f(x, t ) f s t t (x, t ) = f t (x, ξ) f t (x, t ) f t (x, ξ) f t (x, t ) + f t (x, t ) f t (x, t ) < ɛ 2 + ɛ 2 = ɛ. Somit ist die Stetigkeit von h auch im Fall (x, t) = (x, t ) bewiesen, und die Funktion h ist insgesamt stetig. Nach Korollar 2 ist auch die Funktion H : I R; t h(x, t) dt stetig. Für jedes t I mit t t gilt jetzt F (t) F (t ) = 1 ( f(x, t) dx t t t t M = M M M ) f(x, t ) dx f(x, t) f(x, t ) t t dx = 192 M h(x, t) dx = H(t),

193 Mathematik für Physiker III, WS 212/213 Freitag und folglich ergibt die Stetigkeit von H auch die Existenz der Ableitung F F (t) F (t ) f (t ) = lim = lim H(t) = H(t ) = t t t t t t t (x, t ) dx. Damit haben wir die Differenzierbarkeit von F und die Formel für die Ableitung von F bewiesen. Nach Korollar 2 ist F auch eine stetige Funktion, d.h. F ist sogar stetig differenzierbar. M Man kann das Vertauschen von Integration und Differentation sogar dazu verwenden Integrale auszurechnen. Wir wollen dies am Beispiel des Integrals 1 t 1 ln t dt vorführen. Beachte das der Integrand hier stetig ist, es gilt ja lim t (t 1)/ ln(t) = und mit der Potenzreihe von ln(1 + x) aus II. 1.3 ist auch ln t t 1 = ln(1 + (t 1)) t 1 also lim t 1 ln(t)/(t 1) = 1 und somit auch Um das Integral 1 t 1 lim t 1 ln t = 1 t 1 2 = 1. + (t 1)2 3 + (t 1)/ ln(t) dt zu berechnen, betrachten wir die Hilfsfunktion F : [, 1] R; x 1 t x 1 ln t dt, mit 1 t 1 ln t dt = F (1). Zur Berechnung von F ermitteln wir die Ableitung mit Korollar 3 für jedes x [, 1] als 1 F t x 1 1 (x) = dt = t x dt = tx+1 1 x ln t x + 1 = 1 x + 1. Die unbekannte Funktion F ist also eine Stammfunktion von 1/(x+1). Wir kennen aber auch eine weitere Stammfunktion, nämlich ln(x + 1). Da sich je zwei Stammfunktionen einer gegebenen Funktion nur um eine additive Konstante unterscheiden, muss es also eine reelle Zahl C R mit F (x) = ln(x + 1) + C für alle x 1 geben. Setzen wir hier x = ein, so wird C = F () = dt =,

194 Mathematik für Physiker III, WS 212/213 Dienstag also 1 t x 1 ln t für alle x 1. Somit wird mit x = 1 1 t 1 ln t dt = F (x) = ln(x + 1) dt = F (1) = ln 2. Vorlesung 17, Dienstag In der letzten Sitzung hatten wir parametrisierte Integrale besprochen, gegeben war eine Funktion f : M A R die neben den Integrationsvariablen x M noch von Parametern y A abhängt. Integrieren wir dann die Variablen x M aus, so erhalten wir eine Funktion des Parameters F (y) = f(x, y) dx M und wir hatten Eigenschaften dieser Funktion untersucht. Ist insbesondere A = I ein reelles Intervall, und ist die Funktion f nach diesem Parameter t I stetig partiell differenzierbar, so konnten wir Ableiten und Integrieren miteinander vertauschen, es gilt also d f(x, t) dx = dt M M f (x, t) dx. t Ein Beispiel hierzu haben wir bereits gerechnet, und weitere Beispiele finden sich in den Aufgaben (38) und (42). Durch itertierte Anwendung dieser Ableitungsregel ergeben sich entsprechende Regeln für höhere Ableitungen. Auch partielle Ableitungen lassen sich so behandeln, bei diesen werden ja alle Variablen bis auf eine festgehalten, und dann nach dieser Variablen normal abgeleitet, es liegt also effektiv die Situation des Korollar 3 vor. Damit erhalten wir das letzte Korollar dieses Kapitels. Korollar 6.4 (Partielle Differenzierbarkeit nach Parametern) Seien n, m N, q N { } mit n, m, q 1, M R n eine kompakte Jordan-meßbare Menge, U R m eine offene Menge und f : M U R eine stetige Funktion die nach den hinteren m Variablen q-fach stetig partiell differenzierbar ist. Dann ist auch die Funktion F : U R; y f(x, y) dx q-fach stetig partiell differenzierbar und für alle y U und alle Multiindizes α N m mit α q gilt α F y (y) = α f f(x, y) dx. α M yα 194 M

195 Mathematik für Physiker III, WS 212/213 Dienstag Beweis: Folgt durch iterierte Anwendung von Korollar 3. $Id: kurven.tex,v /4/6 16:8:42 hk Exp $ 7 Kurvenintegrale In diesem Kapitel wollen wir uns mit Kurvenintegralen beschäftigen, bei diesen ist der Integrationsbereich nicht mehr n-dimensional sondern nur eine Kurve im R n. Je nach Art des Integranden gibt es zwei verschiedene Arten von Kurvenintegralen, wird eine reellwertige Funktion integriert so haben wir ein Kurvenintegral erster Art, ist der Integrand dagegen ein Vektorfeld, also eine Funktion mit Werten im R n, so sprechen wir von einem Kurvenintegral zweiter Art. Den Begriff einer Kurve hatten wir schon in II. 8.4 eingeführt, Kurven sind Abbildungen γ : I R n definiert auf einem Intervall I R n. Zunächst einmal stellen wir eine ganze Reihe grundlegender Begriffe zusammen. 7.1 Kurven im R n Wie schon bemerkt wird es in diesem Abschnitt hauptsächlich um eine ganze Reihe von Definitionen gehen. Grundlegend für alles folgende sind die Kurven im R n. Wie schon oben gesagt sind Kurven einfach Abbildungen von Intervallen in den R n, wir müssen allerdings entscheiden welche Regularitätsbedingungen wir fordern wollen. Die stetige Differenzierbarkeit ist eine etwas zu starke Bedingung, wir wollen auch Kurven zulassen die scharf abbiegen können, wie beispielsweise der Rand eines Quadrates. Beim Quadrat läßt sich der Rand aus vier stetig differenzierbaren Teilen zusammensetzen, und allgemein werden wir fordern das sich unsere Kurven in endlich viele solche Stücke zerlegen lassen. Dies führt uns auf die folgende Definition. Definition 7.1: Seien n N mit n 1 und U R n eine offene Menge. (a) Eine stückweise C 1 -Kurve in U ist eine stetige Abbildung γ : [a, b] U, wobei a, b R mit a < b sind, für die es eine Zerlegung (t,..., t r ) des Intervalls [a, b] gibt bei der γ [t i 1, t i ] für jedes 1 i r stetig differenzierbar ist. Jede solche Zerlegung heißt eine C 1 -Zerlegung von γ. Wir nennen γ := γ(a) den Startpunkt und γ + := γ(b) den Endpunkt von γ. Die Kurve γ heißt geschlossen wenn γ + = γ ist. 195

196 Mathematik für Physiker III, WS 212/213 Dienstag (b) Ist γ i : [a i, b i ] U für i = 1, 2 eine stückweise C 1 -Kurve in U mit γ 1+ = γ 2, so nennen wir die Abbildung { γ 1 (t), t [a 1, b 1 ], γ 1 + γ 2 : [a 1, b 1 + b 2 a 2 ]; t γ 2 (t + a 2 b 1 ), t [b 1, b 1 + b 2 a 2 ] die Summe von γ 1 und γ 2. Dann ist γ 1 + γ 2 wieder eine stückweise C 1 -Kurve, denn wählen wir für i = 1, 2 eine C 1 -Zerlegung (t i,..., t iri ) von γ i, so ist (t 1,..., t 1r1, b 1 + t 21 a 2,..., b 1 + t 2r2 a 2 ) eine C 1 -Zerlegung von γ 1 + γ 2. Dabei ist γ 1 der Startpunkt von γ 1 + γ 2 und γ 2+ der Endpunkt von γ 1 + γ 2, d.h. (γ 1 + γ 2 ) = γ 1, (γ 1 + γ 2 ) + = γ 2+. Gilt γ 1+ = γ 2, so nennen wir γ 1 und γ 2 auch zusammensetzbar. (c) Ist γ : [a, b] U eine stückweise C 1 -Kurve in U, so nennen wir die Abbildung γ : [a, b] U; t γ(a + b t) die zu γ entgegengesetzte Kurve. Ist (t,..., t r ) eine C 1 -Zerlegung von γ, so ist (a + b t r,..., a + b t ) eine C 1 -Zerlegung von γ. Damit ist auch γ eine stückweise C 1 -Kurve in U mit Startpunkt γ + und Endpunkt γ, d.h. γ = γ +, γ + = γ. Wir können also jede stückweise C 1 -Kurve γ : [a, b] R n im R n als eine Summe γ = γ γ r zusammensetzbarer Kurven schreiben, wobei jede der Kurven γ i für 1 i r sogar stetig differenzierbar ist. Dies ist klar, ist (t,..., t r ) eine C 1 -Zerlegung von γ, so müssen wir nur γ i := γ [t i 1, t i ] für jedes 1 i r setzen. Für jedes t [a, b]\{t 1,..., t r 1 } ist γ in t differenzierbar mit γ (t) = γ i(t) R n, wobei 1 i r durch t [t i 1, t i ] definiert ist, wir nennen γ (t) dann auch den Tangentialvektor an die Kurve γ im Punkt γ(t). Für jedes 1 i r ist γ i stetig, also ist auch γ i eine stetige Funktion auf [t i 1, t i ], und somit ist die Funktion { γ (t), γ ist in t differenzierbar, s : [a, b] R ; t, sonst zum Beispiel nach II. 2.Lemma 4.(a,c) Riemann-integrierbar. Dabei bezeichnet hier, wie auch in diesem ganzen Kapitel, die euklidische Norm im R n. Beachte das es nur endlich viele t [a, b] gibt in denen γ nicht differenzierbar ist. Als nächsten Schritt wollen wir jetzt die Länge l(γ) einer stückweisen C 1 -Kurve γ definieren. Wir behandeln zunächst einmal den Fall das γ : [a, b] R n eine stetig differenzierbare Kurve ist. 196

197 Mathematik für Physiker III, WS 212/213 Dienstag Angenommen wir haben eine Zerlegung α = (t,..., t m ) des Intervalls [a, b]. Ist diese Zerlegung ausreichend fein, so sollte die Länge des Teilstücks der Kurve zwischen t = t i 1 und t = t i für 1 i m näherungsweise die Länge der Verbindungsstrecke dieser beiden Punkte sein, also l(γ [t i 1, t i ]) γ(t i ) γ(t i 1 ). Ist die Zerlegung α ausreichend fein, so liegt t i nahe bei t i 1, also ist und somit wird γ(t i ) γ(t i 1 ) γ (t i 1 ) (t i t i 1 ), l(γ [t i 1, t i ]) γ (t i 1 ) (t i t i 1 ). Summieren wir diese Näherungen auf, so ergibt sich eine Näherung für die Gesamtlänge der Kurve γ m m l(γ) = l(γ [t i 1, t i ]) γ (t i 1 ) (t i t i 1 ). i=1 Die rechte Seite dieser Gleichung ist eine Riemannsumme des Integrals b a γ (t) dt, bei immer feiner werdenden Zerlegungen α wird unsere Näherung im Grenzwert also zu diesem Integral. Haben wir eine allgemeine stückweise C 1 -Kurve, so können wir diese aus endlich vielen stetig differenzierbaren Kurven zusammensetzen, und da sich dabei sowohl die Länge als auch die obigen Integrale addieren trifft die Integralbeschreibung der Länge auch auf die zusammengesetzte Kurve γ zu. Damit ist es naheliegend die Länge einer Kurve genau durch dieses Integral zu definieren. Definition 7.2: Seien n N mit n 1 und γ : [a, b] R n eine stückweise C 1 -Kurve im R n. Dann heißt die Zahl die Länge der Kurve γ. l(γ) := b a i=1 γ (t) dt Dabei ist dieses Integral so zu verstehen, dass an den endlich vielen Stellen t in denen γ nicht differenzierbar ist für γ (t) irgendein willkürlich Wert verwendet wird, etwa Null, genauer steht hier also das Integral über die oben eingeführte Funktion s : [a, b] R. Sind γ, δ zwei zusammensetzbare, stückweise C 1 -Kurven Kurven im R n, so gelten l(γ ) = l(γ) und l(γ + δ) = l(γ) + l(δ). Dies ist leicht einzusehen. Sei etwa γ eine stückweise C 1 -Kurve γ : [a, b] R n. Dann ist γ gegeben durch γ : [a, b] R n ; t γ(a + b t) und somit ist γ genau dann in t [a, b] differenzierbar wenn γ in a + b t differenzierbar ist und in diesem Fall gilt (γ ) (t) = γ (a + b t). Wir erhalten l(γ ) = b a (γ ) (t) dt = b a γ (a + b t) dt = 197 b a γ (t) dt = l(γ).

198 Mathematik für Physiker III, WS 212/213 Dienstag Zur Behandlung zusammengesetzer Kurven sei eine weitere stückweise C 1 -Kurve δ : [c, d] R n mit γ + = δ gegeben. Dann ist die zusammengesetzte Kurve gegeben als { γ + δ : [a, b + d c] R n γ(t), t [a, b], ; t δ(t + c b), t [b, b + d c], also ist γ + δ differenzierbar in jedem Punkt t [a, b) in dem γ differenzierbar ist und in jedem Punkt t (b, b + d c] für den δ in t + c b differenzierbar ist, im ersten Fall gilt dabei (γ + δ) (t) = γ (t) und im zweiten Fall haben wir (γ + δ) (t) = δ (t + c b). Für die Länge von γ + δ erhalten wir damit l(γ + δ) = b a γ (t) dt + b+d c b δ (t + c b) dt = b a γ (t) dt + Wir wollen einige Beispiele von Kurven und ihren Längen durchgehen. 1. Sind p, q R n so heißt d τ pq : [, 1] R n ; t (1 t)p + tq c δ (t) dt = l(γ) + l(δ). die Verbindungsstrecke von p und q. Diese hat den Startpunkt p, den Endpunkt q und die Länge l(τ pq ) = 1 q p dt = q p. 2. Ein Beispiel für geschlossene Kurven sind die Kreise. Sind p R 2 und r >, so ist der Kreis mit Mittelpunkt p und Radius r die Kurve ( ) κ p,r : [, 2π] R 2 p1 + r cos t ; t. p 2 + r sin t Die Kurve κ p,r ist geschlossen und für jedes t [, 2π] gilt ( ) r sin t γ (t) =, also auch γ (t) = r, r cos t und somit ist wie erwartet l(κ p,r ) = 2π r dt = 2πr. 3. Als letztes Beispiel wollen wir die sogenannten Schraubenlinie oder Helix betrachten. Seien hierzu p R 2, r, c > und a, b R mit a < b gegeben und definiere die Kurve p 1 + r cos t γ : [a, b] R 3 ; t (κ p,r (t), ct) = p 2 + r sin t. ct 198

199 Mathematik für Physiker III, WS 212/213 Dienstag Der Tangentenvektor zum Punkt t R ist hier r sin t γ (t) = r cos t c mit der Länge γ (t) = r 2 + c 2. Die Länge der Kurve ist also l(γ) = r 2 + c 2 (b a). 4. Wir wollen uns auch noch ein etwas komplizierteres Beispiel anschauen, und betrachten diesmal eine Kurve γ in der Ebene, die eine Ellipse mit den Halbachsen a b > durchläuft. Konkret ist also γ : [, 2π] R 2 ; t ( a cos t b sin t Die Rechnung sieht zunächst ähnlich wie beim Kreis aus, für alle t [, 2π] sind ( ) a sin t γ (t) = b cos t und die euklidische Norm des Tangentenvektors wird zu γ (t) = a 2 sin 2 t + b 2 cos 2 t = a 2 (a 2 b 2 ) cos 2 t. Für die Länge der Kurve ergibt sich l(γ) = 2π ). a2 (a 2 b 2 ) cos 2 t dt. Führt man jetzt noch die sogenannte numerische Exzentrität k := a 2 b 2 /a ein, so können wir die Länge der Ellipse in der traditionellen Form 2π π l(γ) = a 1 k2 cos 2 t dt = 4a 1 k2 cos 2 t dt π/2 = 4a π/2 1 k 2 sin 2 t dt schreiben. Das hierbei auftauchende Integral ist ein sogenanntes vollständiges elliptisches Integral zweiter Art, das sich nicht in Termen der üblichen Grundfunktionen ausdrücken läßt. Das Beispiel der Ellipse läßt einen bereits ahnen das die explizite Berechnung der Länge einer Kurve aufgrund der durch die euklidische Norm in Integranden auftauchenden Wurzel schon bei einfachen Kurven recht mühsam werden kann. Stückweise C 1 -Kurven 199

200 Mathematik für Physiker III, WS 212/213 Dienstag sind definitionsgemäß Funktionen von einem Intervall in den R n, es kommt aber für die meisten Zwecke nicht auf die konkrete Funktion sondern eher auf ihr Bild an. Zum Beispiel könnten wir den Kreis auch durch κ p,r : [, 1] R 2 ; t (p 1 + r cos(2πt), p 2 + r sin(2πt)) beschreiben, das ist zwar eine ganz andere Funktion als unser κ p.r, aber irgendwie doch dieselbe Kurve. Man bezeichnet κ p,r als eine Umparametrisierung von κ p,r, schreiben wir s = 2πt, so wird ja κ p,r (t) = κ p,r (s), die Kurve wird also nur anders durchlaufen. Dies führt auf die folgende formale Definition der Umparametrisierungen von Kurven. Definition 7.3: Sei n N mit n 1 und sei γ : [a, b] R n eine stetig differenzierbare Kurve im R n. Wir nennen eine Kurve δ : [c, d] R n eine Umparametrisierung von γ wenn es eine stetige, bijektive, auf (a, b) stetig differenzierbare Funktion ϕ : [a, b] [c, d] mit γ = δ ϕ und ϕ (t) > für alle t (a, b) gibt. Die Abbildung ϕ heißt dann eine Umparametrisierung von γ nach δ. Ist γ eine stückweise C 1 -Kurve im R n, so nennen wir eine stückweise C 1 -Kurve δ im R n eine Umparametrisierung von γ, wenn es ein r N und stetig differenzierbare Kurven γ i, δ i im R n für 1 i r gibt so, dass γ = γ γ r, δ = δ δ r sind und δ i für jedes 1 i r eine Umparametrisierung von γ i ist. Seien γ : [a, b] R n und δ : [c, d] R n zwei stetig differenzierbare Kurven im R n und sei ϕ : [a, b] [c, d] eine Umparametrisierung von γ nach δ. Da ϕ nach I. 14.Korollar 11.(e) insbesondere streng monoton steigend ist, ist auch ϕ(a) = c und ϕ(b) = d, d.h. die Kurven γ und δ haben dieselben Start- und Endpunkte. Die Umkehrabbildung ϕ 1 : [c, d] [a, b] ist wieder bijektiv, nach I. 13.Satz 15.(c) stetig und nach I. 14.Satz 6 auf (c, d) stetig differenzierbar mit (ϕ 1 ) (t) = 1/ϕ (ϕ 1 (t)) > für alle t (c, d), d.h. ϕ 1 ist eine Umparametrisierung von δ nach γ. Weiter behaupten wir das auch δ eine Umparametrisierung von γ ist, denn auch ψ : [a, b] [c, d]; t c + d ϕ(a + b t) ist bijektiv, stetig und auf (a, b) differenzierbar mit ψ (t) = ϕ (a + b t) > für alle t (a.b) und δ (ψ(t)) = δ(c + d ψ(t)) = δ(ϕ(a + b t)) = γ(a + b t) = γ (t) für alle t [a, b]. Als nächsten Schritt wollen wir uns überlegen das sich die Länge einer Kurve unter Umparametrisierungen nicht ändert. Dies ergibt sich im wesentlichen aus der Substitutionsregel II. 2.Satz 13 für das eindimensionale Riemann-Integral, allerdings wurde in dieser Form der Substitutionsregel die stetige Differenzierbarkeit der Substitution auf dem gesamten Intervall gefordert aber unsere Umparametrisierungen müssen in den Randpunkten nicht differenzierbar sein. Das folgende Lemma zeigt uns das dieses Detail unproblematisch ist. Lemma 7.1 (Erweiterte Substitutionsregel für Umparametrisierungen) Seien a, b, c, d R mit a < b, c < d und sei ϕ : [a, b] [c, d] eine bijektive, stetige, auf (a, b) stetig differenzierbare Funktion mit ϕ (t) > für alle t (a, b). Weiter seien g : [a, b] R, f : [c, d] R zwei stetige Funktionen mit g(t) = f(ϕ(t))ϕ (t) für alle 2

201 Mathematik für Physiker III, WS 212/213 Dienstag t (a, b). Dann ist auch d f(t) dt = b c a g(t) dt. Beweis: Da g stetig ist, gibt es nach I. 13.Satz 13 ein M mit g(t) M für alle t [a, b]. Mit II. 2.Lemma 4.(c) und II. 2.Lemma 5.(d) folgt für jedes < ɛ < (b a)/2 b a und dies ergibt g(t) dt b ɛ a+ɛ a+ɛ g(t) dt g(t) dt + b a a g(t) dt = lim ɛ b ɛ a+ɛ b g(t) dt. Für jedes < ɛ < (b a)/2 haben wir jetzt nach II. 2.Satz 13 stets also gilt b ɛ a+ɛ g(t) dt = b a b ɛ a+ɛ f(ϕ(t)) ϕ (t) dt = g(t) dt = lim ϕ(b ɛ) ɛ ϕ(a+ɛ) b ɛ f(t) dt. ϕ(b ɛ) ϕ(a+ɛ) g(t) dt 2Mɛ, f(t) dt, Wieder nach I. 13.Satz 13 gibt es auch ein M mit f(t) M für alle t [c, d], und analog zur obigen Rechnung folgt für jedes < ɛ < (b a)/2 auch b ϕ(b ɛ) f(t) dt f(t) dt M ((ϕ(a + ɛ) c) + (d ϕ(b ɛ))). a ϕ(a+ɛ) Da ϕ stetig ist, sind damit auch c = ϕ(a) = lim ɛ ϕ(a + ɛ), d = ϕ(b) = lim ɛ ϕ(b ɛ), und dies liefert d c f(t) dt = lim ϕ(b ɛ) ɛ ϕ(a+ɛ) f(t) dt = b a g(t) dt. Damit können wir schließlich zur Invarianz der Länge unter Umparametrisierungen kommen. Seien wieder γ : [a, b] R n und δ : [c, d] R n zwei stetig differenzierbare Kurven und ϕ : [a, b] [c, d] eine Umparametrisierung von γ nach δ. Für jedes t (a, b) ist dann γ (t) = ϕ (t) δ (ϕ(t)), 21

202 Mathematik für Physiker III, WS 212/213 Dienstag also wegen ϕ (t) > auch γ (t) = ϕ (t) δ (ϕ(t)). Für die Länge dieser Kurven folgt damit mit Lemma 1 l(γ) = b a γ (t) dt = d c δ (t) dt = l(δ). Sind allgemeiner γ, δ zwei stückweise C 1 -Kurven im R n und ist δ eine Umparametrisierung von γ, so können wir γ = γ γ r und δ = δ δ r schreiben wobei γ i, δ i für jedes 1 i r zwei stetig differenzierbare Kurven im R n sind und δ i eine Umparametrisierung von γ i ist. Wenden wir die bereits bewiesenen Aussagen für stetig differenzierbare Kurven an, so folgen das auch γ und δ denselben Start- und Endpunkt haben, γ auch eine Umparametrisierung von δ ist, δ = δ r + + δ 1 eine Umparametrisierung von γ = γ r + + γ 1 ist und das auch l(γ) = r l(γ i ) = i=1 r l(δ i ) = l(δ) i=1 gilt, die Länge einer Kurve bleibt also unter Umparametrisierungen erhalten. Diese Beobachtung bildet die Grundlage zur Einführung einer natürlichen Parametrisierung allgemeiner Kurven. Ist die betrachtete Kurve aus irgendeiner Anwendungssituation heraus gegeben, so ist sie häufig schon mit einer natürlichen Parametrisierung versehen, t kann zum Beispiel für die Zeit stehen. Bei einer allgemeinen, abstrakt gegebenen, Kurve ist dagegen zunächst keine Parametrisierung besonders ausgezeichnet. Trotzdem haben auch die meisten uns interessierenden allgemeinen Kurven eine besonders ausgezeichnete Parametrisierung, die sogenannte Parametrisierung durch Bogenlänge. Bei dieser wird die Kurve durch die Länge ihrer Teilabschnitte parametrisiert. Dieser Ansatz wird durch die folgende Definition erfasst. Definition 7.4: Seien n N mit n 1, a, b R mit a < b und γ : [a, b] R eine stückweise C 1 -Kurve. Dann heißt γ nach Bogenlänge parametrisiert wenn für alle t [a, b] stets gilt. l(γ [a, t]) = t a γ (s) ds = t a Insbesondere muss bei einer nach Bogenlänge parametrisierten Kurve γ : [a, b] R also l(γ) = b a sein. Meist beginnt man die Parametrisierung dann auch bei a =. Haben wir beliebige t, s [a, b] mit s < t und ist die Kurve nach Bogenlänge parametrisiert, so gilt auch l(γ [s, t]) = t s γ (r) dr = t a γ (r) 2 dr 22 s a γ (r) dr = (t a) (s a) = t s,

203 Mathematik für Physiker III, WS 212/213 Dienstag die Länge beliebiger Teilabschnitte einer nach Bogenlänge parametrisierten Kurve ist also stets gleich der Länge ihrer entsprechenden Parameterintervalle. Wir wollen uns überlegen wann man eine gegebene stückweise C 1 -Kurve γ : [a, b] R n nach Bogenlänge umparametrisieren kann und wie man eine solche Umparametrisierung dann berechnen kann. Hierzu geben wir uns eine C 1 -Zerlegung α = (t,..., t r ) der Kurve γ vor. Wir betrachten die Längenfunktion l : [a, b] R ; t l(γ [a, t]) = t a γ (x) dx. Wir behaupten das auch diese Funktion stetig und stückweise stetig differenzierbar ist, und zwar ebenfalls bezüglich der für γ gewählten C 1 -Zerlegung α. Sei 1 i r gegeben und schreibe γ i für das stetig differenzierbare Teilstück γ i := γ [t i 1, t i ] von γ. Für jedes t [t i 1, t i ] haben wir dann l(t) = t a γ (x) dx = ti 1 a γ (x) dx + t t i 1 γ (x) dx = l(t i 1 ) + t t i 1 γ i(x) dx, und nach dem Hauptsatz der Differential- und Integralrechnung II. 2.Satz 9 ist die Einschränkung l [t i 1, t i ] damit stetig differenzierbar mit (l [t i 1, t i ]) (t) = γ i(t) für alle t [t i 1, t i ]. Weiter ist l : [a, b] R etwa nach I. 13.Lemma 11.(d) auch eine stetige Funktion. Damit ist gezeigt das l tatsächlich eine stetige und stückweise stetig differenzierbare Funktion ist, und zwar bezüglich derselben C 1 -Zerlegung α die auch für γ verwendet wird. Nehmen wir jetzt einmal, dass wir γ nach Bogenlänge umparametrisieren können. Dann gibt es also eine nach Bogenlänge parametrisierte, stückweise C 1 -Kurve δ : [c, d] R n, die eine Umparametrisierung von γ ist, d.h. wir können in der obigen Notation annehmen das es auch eine C 1 -Zerlegung (s,..., s r ) von [c, d] und für jedes 1 i r eine Umparametrisierung ϕ i : [t i 1, t i ] [s i 1, s i ] von γ [t i 1, t i ] nach δ [s i 1, s i ] gibt. Für alle 1 i r ist ϕ i also eine stetige, bijektive und auf (t i 1, t i ) stetig differenzierbare Funktion mit γ i = δ i ϕ i und ϕ i(t) > für alle t (t i 1, t i ), wobei wir auch δ i := δ [s i 1, s i ] schreiben. Für jedes 1 i r und alle t [t i 1, t i ] gilt dann nach Lemma 1 l(γ [t i 1, t]) = t t i 1 γ i(t) dt = t t i 1 δ i(ϕ i (t)) ϕ i(t) dt = ϕi (t) s i 1 δ i(t) dt = l(δ [s i 1, ϕ i (t)]) = ϕ i (t) s i 1, da δ nach Bogenlänge parametrisiert ist. Definiere die stetige Funktion ϕ : [a, b] [c, d] durch ϕ [t i 1, t i ] = ϕ i für 1 i r. Sei t [a, b] und wähle ein 1 i r mit t [t i 1, t i ]. Dann haben wir l(t) = l(γ [a, t]) = l(γ [t j 1, t j ]) + l(γ [t i 1, t]) 1 j<i = (s j s j 1 ) + ϕ i (t) s i 1 = ϕ(t) c, 1 j<i 23

204 Mathematik für Physiker III, WS 212/213 Dienstag d.h. es ist ϕ(t) = l(t) + c. Bis auf die Wahl des Startparameters c sind die Umparametrisierung ϕ, und damit die Kurve δ, also eindeutig festgelegt. Weiter muss für alle 1 i r, t (t i 1, t i ) auch γ (t) = l (t) = ϕ i(t) > gelten, es ist also auch notwendig für die Existenz einer Umparametrisierung nach Bogenlänge das γ (t) für alle t [a, b]\{t,..., t r } gilt. Dieser Eigenschaft von Kurven geben wir jetzt einen Namen. Definition 7.5: Seien n N mit n 1, a, b R mit a < b und γ : [a, b] R n eine stückweise C 1 -Kurve. Dann heißt γ regulär wenn es eine C 1 -Zerlegung (t,..., t r ) von γ gibt so, dass für alle 1 i r und alle t (t i 1, t i ) stets γ (t) gilt. Für stetig differenzierbare Kurven versteht man unter Regularität meist die etwas stärkere Bedingung das sogar γ (t) für alle t im Inneren des Definitionsintervalls von γ gilt, für unsere Zwecke ist die hier gegebene Definition aber etwas praktischer. Unsere obige Überlegung gibt uns eine explizite Methode eine Umparametrisierung nach Bogenlänge auch zu berechnen. Gegeben: Eine stückweise C 1 -Kurve γ : [a, b] R n die sich nach Bogenlänge umparametrisieren läßt und ein gewünschter Startwert c R einer solchen Parametrisierung. Meist nimmt man einfach c =. Gesucht: Eine Umparametrisierung δ : [c, c + l(γ)] R n nach Bogenlänge. Methode: Führe die folgenden Schritte durch: 1. Berechne die Funktion l(t) = l(γ [a, t]) = t a γ (x) dx. 2. Bilde ϕ(t) := c + l(t) und berechne die Umkehrfunktion ϕ 1 von ϕ. 3. Die gesuchte Umparametrisierung ist jetzt δ(s) := γ(ϕ 1 (s)). Erneut sehen wir hier die Notwendigkeit der Regularität von γ, damit ϕ überhaupt umkehrbar ist, muss ϕ streng monoton steigend sein, und wegen ϕ (t) = γ (t) darf die Kurve γ keine konstanten Teilstrecken enthalten. Wie gesehen läßt sich eine nicht reguläre stückweise C 1 -Kurve definitiv nicht nach Bogenlänge umparametrisieren, und man fragt sich ob dieser Fall überhaupt vorkommen kann. Wir wollen daher jetzt ein Beispiel einer nicht regulären Kurve konstruieren. Ein besonders brachiales Beispiel wäre eine konstante Kurve γ(t) = p R n, wir wollen hier aber eine Kurve die zwei verschiedene Punkte p, q R n verbindet. Alles was wir hierzu tun müssen ist einen konstanten Teilabschnitt in die Verbindungsstrecke τ pq einzufügen. Definiere beispielsweise die stetig differenzierbare Funktion 3t 9 2 t2, t 1, 3 1 f : [, 1] [, 1]; t 2, 1 t 2, t t2 2, t 1 3 mit f() = und f(1) = 1. Dann ist γ : [, 1] R n ; t τ pq (f(t)) = (1 f(t))p + f(t)q 24

205 Mathematik für Physiker III, WS 212/213 Dienstag eine stetige differenzierbare Kurve von p nach q mit γ(t) = (p + q)/2 für alle t [1/3, 2/3], und insbesondere ist γ nicht regulär. Bevor wir zu zwei Beispielen kommen wollen wir unsere bisherigen Überlegungen in einem Satz zusammenfassen. Satz 7.2 (Umparametrisierung nach Bogenlänge) Seien n N mit n 1, a, b R mit a < b und γ : [a, b] R eine stückweise C 1 -Kurve der Länge L = l(γ). Dann gelten: (a) Die folgenden Aussagen sind äquivalent: 1. Die Kurve γ ist nach Bogenlänge parametrisiert. 2. Es gibt eine C 1 -Zerlegung (t,..., t r ) von γ so, dass für alle 1 i r und alle t (t i 1, t i ) stets γ (t) = 1 gilt. 3. Für jedes t [a, b] in dem γ differenzierbar ist gilt γ (t) = 1. (b) Genau dann läßt sich γ nach Bogenlänge umparametrisieren, d.h. es gibt eine nach Bogenlänge parametrisierte stückweise C 1 -Kurve δ die eine Umparametrisierung von γ ist, wenn γ regulär ist. In diesem Fall gibt es für jedes c R genau eine nach Bogenlänge parametrisierte, stückweise C 1 -Kurve δ : [c, c + L] R n die eine Umparametrisierung von γ ist. Beweis: (a) (1)= (2). Wähle eine C 1 -Zerlegung α = (t,..., t r ) von γ. Wir haben bereits gezeigt, dass die Funktion l : [a, b] R; t l(γ [a, t]) stetig und bezüglich der Zerlegung α stückweise stetig differenzierbar ist und das für alle 1 i r und alle t (t i 1, t i ) stets l (t) = γ (t) gilt. Da γ nach Bogenlänge parametrisiert ist, gilt l(t) = t a für alle t [a, b] und somit ist für alle 1 i r und alle t (t i 1, t i ) auch γ (t) = l (t) = 1. (2)= (3). Wähle eine C 1 -Zerlegung (t,..., t r ) von γ so, dass γ (t) = 1 für alle 1 i r und alle t (t i 1, t i ) gilt. Sei t [a, b] so, dass γ in t differenzierbar ist. Ist t / {t,..., t r }, so haben wir t (t i 1, t i ) für ein 1 i r und es gilt sofort γ (t) = 1. Nun sei t = t i für ein i r. Dann ist die Einschränkung γ i := γ [t i 1, t i ] stetig differenzierbar und für alle s (t i 1, t i ) gilt γ i(s) = γ (s) = 1. Folglich ist auch (3)= (1). Für jedes t [a, b] gilt γ (t) = γ i(t) = lim s ti γ i(s) = lim s t γ i(s) = 1. l(γ [a, t]) = t a γ (x) dx = t a dx = t a da γ nur an endlich vielen Stellen nicht differenzierbar ist. Damit ist γ nach Bogenlänge parametrisiert. 25

206 Mathematik für Physiker III, WS 212/213 Dienstag (b) Wir haben bereits gezeigt das aus der Existenz einer Umparametrisierung von γ nach Bogenlänge auch die Regularität von γ folgt. Nun nehme an das γ regulär ist, es gibt also eine C 1 -Zerlegung α = (t,..., t r ) so, dass für alle 1 i r und alle t (t i 1, t i ) stets γ (t) gilt. Weiter sei ein c R gegeben. Wir wissen bereits das die Funktion l : [a, b] R; t l(γ [a, t]) stetig und bezüglich der Zerlegung α stückweise stetig differenzierbar ist und das für alle 1 i r und alle t (t i 1, t i ) stets l (t) = γ (t) > gilt. Dabei ist l(b) = l(γ) = L. Somit ist auch die Funktion ϕ : [a, b] R; t l(t) + c stetig und bezüglich der Zerlegung α stückweise stetig differenzierbar mit ϕ() = c und ϕ(b) = c + L und für alle 1 i r, t (t i 1, t i ) gilt ϕ (t) = l (t) >. Nach I. 14.Korollar 11.(e) ist ϕ streng monoton steigend und nach I. 13.Satz 15 ist ϕ : [a, b] [c, c + L] bijektiv mit stetiger Umkehrabbildung ϕ 1 : [c, c + L] [a, b]. Für jedes 1 i r und alle t (t i 1, t i ) ist ϕ 1 nach I. 14.Satz 6 in ϕ(t) differenzierbar mit (ϕ 1 ) (ϕ(t)) = 1 ϕ (t) = 1 γ (t). Definieren wir also die Zerlegung β = (s,..., s r ) von [c, c + L] durch s i := ϕ(t i ) für i r, so ist ϕ 1 für alle 1 i r und alle s (s i 1, s i ) in s differenzierbar. Wir erhalten die bezüglich der Zerlegung β stückweise C 1 -Kurve δ := γ ϕ 1. Dann ist δ eine Umparametrisierung von γ und für alle s [c, c + L] ist auch δ [c, s] eine Umparametrisierung von γ [a, ϕ 1 (s)], also haben wir l(δ [c, s]) = l(γ [a, ϕ 1 (s)]) = l(ϕ 1 (s)) = ϕ(ϕ 1 (s)) c = s c, d.h. δ ist nach Bogenlänge parametrisiert. Dies zeigt die Existenz einer Umparametrisierung von γ auf Bogenlänge zum Startwert c, und die Eindeutig haben wir bereits eingesehen. Wir wollen uns zwei kleine Beispiele zur Parametrisierung nach Bogenlänge anschauen. Wir beginnen mit einem Kreis. Seien also p R 2 und ein Radius r > gegeben. Wir wollen die Kurve κ p,r : [, 2π] R nach Bogenlänge parametrisieren. Wir gehen wir oben beschrieben vor, und berechnen l(t) = t κ p,r(s) ds = rt, und erhalten als Paramatrisierung in Bogenlänge ( κ p,r : [, 2πr] R 2 ; t γ(ϕ 1 p1 + r cos ( ) t (t)) = r p 2 + r sin ( ) t r ). 26

207 Mathematik für Physiker III, WS 212/213 Freitag Als ein etwas komplizierteres Beispiel wollen wir die Kurve [ γ :, π ] ( ) cos R 2 ; t 3 t 2 sin 3 t nach Bogenlänge parametrisieren. Für t π/2 haben wir γ (t) = 9 sin 2 t cos 4 t + 9 sin 4 t cos 2 t = 3 sin t cos t = 3 2 sin(2t), die Länge der Kurve von s = nach s = t ist also l(t) = t γ (s) ds = 3 4 cos(2s) t = 3 (1 cos(2t)). 4 Zur Bestimmung des Bogenlängenparameters s müssen wir also die Gleichung 3 (1 cos(2t)) = s 4 für s l(γ) = 3/2 nach t auflösen, und dies geschieht durch t = 1 ( 2 arccos 1 4 ) 3 s was wegen 1 (4/3)s [ 1, 1] sinnvoll ist. Die Umparametrisierung nach Bogenlänge ist also [ l 1 :, 3 ] [, π ] ; s 1 ( arccos 1 4 ) 3 s. Für t π gelten sin(t/2), cos(t/2) und ( ) ( ) t t 1 + cos t cos t = 2 cos 2 1 = cos = sowie sin ( ) ( ) t t = 1 cos 2 2 = cos t cos t =, 2 also ist für jedes s 3/2 auch δ(s) := γ(l 1 (s)) = ( 12 (cos (1 3 arccos 43 )) ( ( 1 s, sin 3 2 arccos 1 4 ))) 3 s ( ) = ( ) s, 3 s = 3 3((3 2s) 3/2, (2s) 3/2 ). 27

208 Mathematik für Physiker III, WS 212/213 Freitag Skalare Kurvenintegrale Vorlesung 18, Freitag In der letzten Sitzung haben wir die Theorie der Kurvenintegrale begonnen und uns erst einmal mit Kurven im R n, ihren Parametrisierungen und ihrer Länge beschäftigt. Nun wollen wir über diese Kurven integrieren. Dabei treten zwei verschiedene Fälle auf, je nachdem was für eine Art Objekt wir längs der Kurve integrieren wollen. Bei den Kurvenintegralen erster Art wird eine reellwertige Funktion integriert und bei den Kurvenintegralen zweiter Art wird eine vektorwertige Funktion die in den R n abbildet integriert. In beiden Fällen ist das Ergebnis eine Zahl. Dieser Abschnitt handelt von den Kurvenintegralen erster Art. Wie gesagt wird bei diesen eine reellwertige Funktion längs einer Kurve integriert, daher spricht man auch vom skalaren Kurvenintegral, und der Integrand wird entsprechend oft auch ein Skalarfeld genannt. Das ist nur ein Synonym für reellwertige Funktion und kein neuer Begriff. Angenommen wir haben eine auf einer offenen Menge U R n definierte stetige Funktion f : U R. Weiter sei eine stückweise C 1 -Kurve Kurve γ : [a, b] U gegeben. Wir wollen sagen was das Integral von f längs dieser Kurve ist und beginnen mit einer kleinen heuristischen Vorüberlegung. Diese wird uns zeigen wie wir das skalare Kurvenintegral zu definieren haben. Wir betrachten erst einmal den einfachsten Fall das unsere Kurve die Verbindungsstrecke zweier Punkte p und q ist und das Skalarenfeld gleich einer Konstanten c ist. Auf jedem Punkt zwischen p und q haben wir dann den Wert c, und wenn wir diese Konstante längs dieser Verbindungsstrecke integrieren sollte insgesamt als Integral c Länge der Verbindungsstrecke = c q p sein. Geometrisch ist dies die Fläche des Rechtecks mit Höhe c über der Strecke von p nach q. Dabei denken wir uns das Rechteck im Fall c < als unterhalb der xy-ebene gelegen und zählen es wie beim Riemann-Integral negativ. Zur Bestimmung des skalaren Kurvenintegrals im allgemeinen Fall stellen wir wieder unsere übliche Näherungsüberlegung an. Wir denken uns eine ausreichend feine Zerlegung α = (t,..., t r ) des Intervalls [a, b] gegeben. Das Kurvenstück von t = t i 1 bis t = t i nähern wir dann durch die Verbindungsstrecke von γ(t i 1 ) nach γ(t i ) an, und diese Strecke wird durch den Vektor γ(t i ) γ(t i 1 ) als Richtungsvektor beschrieben. Da das zu integrierende Skalarenfeld f als stetig angenommen wird können wir Werte f(q) für Punkte q nahe bei γ(t i 1 ) durch den Wert f(γ(t i 1 )) annähern. Ist die Zerlegung α ausreichend fein, so liegt das Teilstück der Kurve γ von t = t i 1 bis t = t i ganz in einer beliebig kleinen Kugel um γ(t i 1 ), wir können f also auf diesem Teilstück durch die Konstante f(γ(t i 1 )) ersetzen. Wenden wir den bereits behandelten Spezialfall an, 28

209 Mathematik für Physiker III, WS 212/213 Freitag so ergibt sich die Näherung γ [t i 1,t i ] f(t) dt f(γ(t i 1 )) γ(t i ) γ(t i 1 ). Die hierbeit auftretende Norm haben wir schon bei der Behandlung der Länge einer Kurve als γ(t i ) γ(t i 1 ) γ (t i 1 ) (t i t i 1 ) angenähert, wir erhalten also f(t) dt f(γ(t i 1 )) γ (t i 1 ) (t i t i 1 ). γ [t i 1,t i ] Summieren wir all diese Teilergebnisse auf, so ergibt sich als Näherung des gesamten Kurvenintegrals die Summe γ f(t) dt r f(γ(t i 1 )) γ (t i 1 ) (t i t i 1 ), i=1 und dies ist eine Riemannsumme des Integrals b a f(γ(t)) γ (t) dt. Lassen wir die Zerlegung immer feiner werden, so soll im Grenzwert das Kurvenintegral erster Art herauskommen, dieses wird also gleich dem gewöhnlichen eindimensionalen Integral der Hilfsfunktion g : [a, b] R; t f(γ(t)) γ (t) sein. Dementsprechend werden wir das skalare Kurvenintegral durch das gewöhnliche Integral γ f(t) dt = b a f(γ(t)) γ (t) dt definieren, wobei [a, b der Definitionsbereich der Kurve γ ist. Wie bereits bemerkt spricht man hier auch von einem Kurvenintegral erster Art. Am anschaulichsten wird dies wenn wir uns eine Fläche über der Kurve denken, deren Höhe über dem Punkt p = γ(t) der Kurve gerade gleich f(p) ist. Dabei sollen negative Werte von f(p) für unterhalb der Kurve liegende Flächenstücke stehen und positive Werte für Flächenstücke oberhalb der Kurve. Unser gesuchtes Integral, also das Kurvenintegral erster Art, stellen wir uns dann als die Fläche dieses vertikal über der Kurve liegenden Flächenstücks vor. Dabei werden Vorzeichen wie beim eindimensionalen Integral behandelt, d.h. oberhalb der Kurve liegende Flächteile werden positiv gezählt 29

210 Mathematik für Physiker III, WS 212/213 Freitag und unterhalb der Kurve liegende Teile werden negativ gewertet. In diesem Bild ist das skalare Kurvenintegral die Fläche eines Zauns mit der Kurve als Grundlinie. Definition 7.6: Seien n N mit n 1, U R n offen, f : U R eine stetige Funktion und γ : [a, b] U eine stückweise C 1 -Kurve in U. Das skalare Kurvenintegral von f längs γ ist dann definiert als b f(t) dt := f(γ(t)) γ (t) dt. γ a Wie bei der Definition der Länge können wir dabei für γ (t) an den endlich vielen Stellen t in denen γ nicht differenzierbar ist einen willkürlichen Wert einsetzen. Das Integral ist auch wohldefiniert, d.h. die Hilfsfunktion g ist Riemann-integrierbar. Um dies einzusehen, kann man sich eine C 1 -Zerlegung (t,..., t r ) von γ wählen und hat für jedes 1 i r das stetig differenzierbare Teilstück γ i := γ [t i 1, t i ] von γ. Da die Funktion f als stetig vorausgesetzt ist, ist für jedes 1 i r auch die Funktion g i : [t i 1, t i ] R; t f(γ i (t)) γ i(t) stetig, also nach II. 2.Satz 8 auch Riemann-integrierbar. Nach II. 2.Lemma 4.(a,c) ist damit auch die Funktion g Riemann-integrierbar, wie behauptet. Dabei besagt II. 2.Lemma 4.(c) auch b r ti r f(t) dt = g(t) dt = f(γ i (t)) γ i(t) dt = f(t) dt, t i 1 γ i γ a i=1 für theoretische Überlegungen kann man sich also in der Regel auf die Behandlung stetig differenzierbarer Kurven beschränken. Beachte das das t in f(t) bei der Schreibweise f(t) dt für einen Punkt auf der γ Kurve, also für ein Element des R n, steht. Oftmals läßt man t und dt auch einfach weg und schreibt f := f(t) dt γ für das skalare Kurvenintegral. Ist die Kurve γ nach Bogenlänge parametrisiert, so wird das skalare Kurvenintegral einfach zu b f(s) ds = f(γ(s)) ds, γ wobei bei Parametrisierung nach Bogenlänge traditionell meist der Buchstabe s für den Parameter verwendet wird. Wir wollen uns zwei kleine Beispiele anschauen. Sei γ : [, 2πn] R; t (cos t, sin t, t) mit n N die Schraubenlinie mit n N Umdrehungen. Als Skalarfeld betrachten wir f(x, y, z) := x 2 + y 2 + z 2. Dann haben wir γ (t) = sin t cos t 1 γ a = γ (t) = 21 i=1 sin 2 t + cos 2 t + 1 = 2,

211 Mathematik für Physiker III, WS 212/213 Freitag und also ist γ f ds = 2πn f(γ(t)) = cos 2 t + sin 2 t + t 2 = t 2 + 1, (t 2 + 1) 2 dt = ( 2 t + t3 3 2πn ) = 2 2π n(3 + 4π 2 n 2 ). 3 Als ein zweites Beispiel betrachten wir die Kurve [ γ :, π ] R 2 ; t (3 cos 3 t, 3 sin 3 t) und f(x, y) := 1 + y 2 3. Dann erhalten wir γ (t) = 9 2 cos 4 sin 2 t sin 4 t cos 2 = 9 sin 2 t cos 2 t = 9 sin t cos t da wegen t π/2 stets sin t und cos t ist. Das Kurvenintegral ergibt sich als ( π/2 ) π/2 f ds = 9(1 + 1 sin 3 1 t) sin t cos t dt = 9 2 sin2 t + 2 sin 5 t = 225. γ Mit dem skalaren Kurvenintegral wollen wir uns jetzt nicht näher beschäftigen, zum Abschluß gehen wir nur noch die Grundeigenschaften dieses Integraltyps durch. Diese ergeben sich alle ziemlich direkt durch Einsetzen der Definition und Anwenden der entsprechenden Eigenschaft des eindimensionalen Riemannintegrals. Lemma 7.3 (Grundeigenschaften des skalaren Kurvenintegrals) Seien n N mit n 1, U R n offen, a, b R mit a < b, γ : [a, b] U eine stückweise C 1 -Kurve und f : U R eine stetige Funktion. (a) Ist g : U R eine weitere stetige Funktion, so gilt (f(t) + g(t)) dt = f(t) dt + (b) Für jede Konstante c R gilt γ γ γ cf(t) dt = c γ f(t) dt. γ g(t) dt. (c) Sei δ eine weitere stückweise C 1 -Kurve in U deren Startpunkt gleich dem Endpunkt von γ ist. Dann gilt f(t) dt = f(t) dt + f(t) dt. γ+δ γ 211 δ

212 Mathematik für Physiker III, WS 212/213 Freitag (d) Es ist f(t) dt = γ γ f(t) dt. (e) Ist δ eine Umparametrisierung von γ, so gilt auch f(t) dt = f(t) dt. γ δ (f) Es gilt γ f(t) dt sup f(γ(t)) l(γ). a t b Beweis: Wähle eine C 1 -Zerlegung (t,..., t r ) von [a, b] und für jedes 1 i r bezeichne γ i die stetig differenzierbare Kurve γ i := γ [t i 1, t i ]. (a) Nach II. 2.Lemma 5.(a) gilt γ (f(t) + g(t)) dt = = b a b a (f(γ(t)) + g(γ(t))) γ (t) dt f(γ(t)) γ (t) dt + b a g(γ(t)) γ (t) dt = γ f(t) dt + γ g(t) dt. (b) Analog mit II. 2.Lemma 5.(b). (c) Sei δ : [c, d] U eine stückweise C 1 -Kurve in U mit δ(c) = γ(b) und wähle eine C 1 -Zerlegung (s,..., s m ) von δ. Für 1 i m schreibe δ i := δ [s i 1, s i ]. Dann ist η := γ + δ : [a, b + d c] U die stückweise C 1 -Kurve definiert durch η(t) = { γ(t), a t b, δ(t + c b), b t b + d c für alle t [a, b + d c] und wir hatten uns bereits früher überlegt das (t,..., t r, b + s 1 c,..., b + s m c) eine C 1 -Zerlegung von η ist. Für jedes 1 i r ist dabei η i := η [t i 1, t i ] = γ i und für jedes r + 1 i r + m ist η i := η [b + s i 1 c, b + s i c] gegeben durch η i (t) = δ i (t + c b) für alle t [b + s i 1 c, b + s i c]. Für jedes 1 i m haben wir damit nach der Substitutionsregel II. 2.Satz 13 η r+i f(t) dt = b+si c b+s i 1 c f(η i (t)) η i(t) dt = 212 = si f(η i (b + t c)) η i(b + t c) dt s i 1 f(δ i (t)) δ i(t) dt = f(t) dt. s i 1 δ i si

213 Mathematik für Physiker III, WS 212/213 Freitag Insgesamt ergibt sich damit r f(t) dt = f(t) dt + η η i i=1 = m f(t) dt i=1 η r+i r m f(t) dt + f(t) dt = γ i δ i i=1 i=1 γ f(t) dt + δ f(t) dt. (d) Wir wissen bereits das (a + b t r,..., a + b t ) eine C 1 -Zerlegung von δ := γ ist und für jedes 1 i r ist δ i := δ [a + b t r i+1, a + b t r i ] gegeben durch δ i (t) = γ r i+1 (a + b t) für alle t [a + b t r i+1, a + b t r i ]. Für 1 i r ergibt die Substitutionsregel II. 2.Satz 13 damit a+b tr i tr i+1 f(t) dt = f(δ i (t)) δ i(t) dt = f(γ(t)) γ (t) dt = f(t) dt, δ i a+b t r i+1 t r i γ r i+1 und insgesamt haben wir f(t) dt = δ r i=1 δ i f(t) dt = r f(t) dt = γ i i=1 γ f(t) dt. (e) Zunächst nehmen wir an, dass γ und δ : [c, d] U beide stetig differenzierbar sind, und das es eine stetige, bijektive, auf (a, b) stetig differenzierbare Funktion ϕ : [a, b] [c, d] mit γ = δ ϕ und ϕ (t) > für alle t (a, b) gibt. Für alle t (a, b) dann f(γ(t)) γ (t) = f(δ(ϕ(t))) δ (ϕ(t)) ϕ (t), also ist nach der Substitutionsregel für Umparametrisierungen Lemma 1 auch b d f(t) dt = f(γ(t)) γ (t) dt = f(δ(t)) δ (t) dt = f(t) dt. γ a Nun kommen wir zum allgemeinen Fall. Wir können δ = δ δ r annehmen, wobei δ i für jedes 1 i r eine stetig differenzierbare Umparametrisierung von γ i ist. Mit dem schon erledigten Fall haben wir damit γ i f(t) dt = δ i f(t) dt für alle 1 i r, und somit ist auch r r f(t) dt = f(t) dt = f(t) dt = f(t) dt. γ γ i δ i δ i=1 (f) Wir schreiben M := sup{ f(γ(t)) : t [a, b]}, und für jedes t [a, b] gilt dann f(γ(t)) γ (t) M γ (t). Mit II. 2.Lemma 5.(b,c,d) folgt dann b f(t) dt = b f(γ(t)) γ (t) dt f(γ(t)) γ (t) dt γ a a c i=1 M b a δ γ (t) dt = Ml(γ). 213

214 Mathematik für Physiker III, WS 212/213 Freitag Vektorielle Kurvenintegrale Wir kommen jetzt zu den sogenannten Kurvenintegralen zweiter Art, bei diesen wird ein Vektorfeld längs einer Kurve integriert. Alternativ bezeichnet man derartige Integrale auch als vektorielle Kurvenintegrale oder auch als Linienintegrale. Definition 7.7: Seien n N mit n 1 und U R n eine offene Menge. Ein Vektorfeld auf U ist eine Funktion X : U R n. Das Wort Vektorfeld ist in diesem Rahmen also eher ein Synonym als eine echte Definition. Die mit einem Vektorfeld verbundene Anschauung ist allerdings eine andere als bei einer Funktion. Für jedes p U denken wir uns den Vektor X p := X(p) als einen an den Punkt p angehefteten Vektor. Weiter verwenden wir für ein Vektorfeld X = (φ 1,..., φ n ) oft die Schreibweise n X = φ i = φ φ n. x i x 1 x n Beispielsweise ist also F (x, y, z) = yz sin(x) x + z i=1 dasselbe wie F = yz x + sin x y + (x + z) z, wir schreiben also / x i für den i-ten kanonischen Basisvektor. Der Sinn dieser Notation wird erst etwas später in diesem Kapitel bei der Behandlung von Koordinatentransformationen deutlich werden. 2 2 y 1 y x x Streckung F = x x + y y 2 Drehung F = y x x y Bei einem Linienintegral wird ein solches Vektorfeld F längs einer Kurve integriert, und das Ergebnis ist eine Zahl. Das Urbeispiel für ein Kurvenintegral ist der Begriff der Arbeit, in etwas verkürzter Form ist die Arbeit W als Kraft mal Weg definiert. Damit ist das folgende gemeint. 214

215 Mathematik für Physiker III, WS 212/213 Freitag Zunächst denken wir uns einen Massepunkt der sich geradlinig auf einer durch den Vektor r R 3 gegebenen Strecke bewegt. Länge dieser Strecke wirke die konstante Kraft F R 3. Die von der Kraft F geleistete Arbeit W ist dann das Produkt aus Strecke und parallel zur Strecke wirkender Kraft P, der zu r senkrechte Anteil von F liefert keinen Beitrag zur Arbeit. Mit Hilfe des Skalarprodukts können wir dieses Produkt, wie in I beschrieben, als W = F r schreiben. Im allgemeinen Fall bewegt sich unser Massepunkt längs einer Kurve γ : [a, b] R 3 und die wirkende Kraft ist nicht mehr konstant sondern zu jedem Zeitpunkt t [a, b] als F (t) R 3 gegeben. Dann führen wir wieder einmal unsere Standardnäherung durch. Ist (t,..., t r ) eine ausreichend feine Zerlegung des Intervalls [a, b], so können wir für jedes 1 i r die Kraft F (t) für t [t i 1, t i ] näherungsweise als F (t i 1 ) annehmen, und weiter ist γ(t i ) γ (t i 1 ) (t i t i 1 ), also P γ (t) γ (t) F(t) W r F (t i 1 ) γ (t i 1 ) (t i t i 1 ) = i=1 r F (t i 1 ) γ (t i 1 ) (t i t i 1 ), i=1 und hier steht auf der rechten Seite wieder eine Riemannsumme. Der Grenzübergang nach immer feiner werdenden Zerlegungen ergibt dann W = b a F (t) γ (t) dt. In der für uns interessanten Situation hängt die Kraft F (t) nur vom Punkt γ(t) ab, also F (t) = G(γ(t)), wobei das Vektorfeld G jedem Punkt des R 3 eine in diesem Punkt wirkende Kraft G zuordnet. Die Arbeit wird zu W = b a G(γ(t)) γ (t) dt, und dieses Integral verwenden wir nun als die Definition des Kurvenintegrals. Definition 7.8: Seien n N mit n 1 und eine offene Menge U R n gegeben. Weiter seien γ : [a, b] U eine stückweise C 1 -Kurve in U und F : U R n ein stetiges Vektorfeld auf U. Dann heißt die Zahl b F (t) dt := F (γ(t)) γ (t) dt das Kurvenintegral von F längs der Kurve γ. γ a Für die höchstens endlich vielen Stellen t [a, b] in denen γ nicht differenzierbar ist, wird dabei γ (t) = interpretiert. Beachte das diese Definition auch sinnvoll ist, ist 215

216 Mathematik für Physiker III, WS 212/213 Freitag nämlich (t,..., t r ) eine C 1 -Zerlegung von γ, so ist γ i := γ [t i 1, t i ] für jedes 1 i r stetig differenzierbar, und damit ist auch die Funktion stetig. Damit wird F γ i γ i : [t i 1, t i ] R; t F (γ i (t)) γ i(t) γ F = r i=1 ti t i 1 F (γ i (t)) γ i(t) dt ein Riemann-Integral. Das t in F (t) ist wie bei skalaren Kurvenintegral ein Punkt auf der Kurve, und man hat auch wieder die alternative Schreibweise F := F (t) dt γ ohne t. Es gibt noch eine weitere häufig verwendete Schreibweise für vektorielle Kurvenintegrale. Wenn wir die Komponenten der Kurve γ als x 1,..., x n schreiben, also γ(t) = (x 1 (t),..., x n (t), so wird F (γ(t)) γ (t) = F 1 (γ(t))x 1(t) + + F n (γ(t))x n(t). Schreiben wir diesen Ausdruck dann symbolisch als γ so wird F (γ(t)) γ (t) = F 1 (x 1,..., x n ) dx 1 dt + + F n(x 1,..., x n ) dx n dt, F (γ(t)) γ (t) dt = F 1 (x 1,..., x n ) dx F n (x 1,..., x n ) dx n, und dies führt zu der Schreibweise F 1 (x 1,..., x n ) dx F n (x 1,..., x n ) dx n := γ γ F (t) dt für das Linienintegral. Wir wollen uns zwei kleine Beispiele in Dimension n = 2 anschauen. Im ersten Beispiel betrachten wir das konstante Vektorfeld F := g y für eine Konstante g >. Wir können uns F etwa als das Schwerefeld der Erde in der Nähe der Erdoberfläche vorstellen, wobei y die Höhe ist und wir der Einfachheit halber nur eine waagerechte Koordinate x betrachten. Die Konstante g ist dann die Erdbeschleunigung. Sei γ : [a, b] R 2 eine stückweise C 1 -Kurve mit Startpunkt p und Endpunkt q, und bezeichne γ i : [t i 1, t i ] R 2 für 1 i r wieder die stetig differenzierbaren Kurvenstücke mit γ = γ γ r. Für 1 i r, t [t i 1, t i ] haben wir F (γ i (t)) (γ i ) (t) = g(γ i 2) (t), 216

217 Mathematik für Physiker III, WS 212/213 Freitag also wird ti t i 1 F (γ i (t)) (γ i ) (t) dt = g und insgesamt ist damit ti t i 1 (γ i 2) (t) dt = g(γ 2 (t i ) γ 2 (t i 1 )), g dy = F (t) dt = g(q 2 p 2 ). γ γ Hier hängt das Kurvenintegral also nur von den beiden Endpunkten der Kurve γ ab. Erinnern wir uns an die Diskussion der Arbeit zu Beginn dieses Abschnitts, so ist dieses Ergebnis auch nicht überraschend, die geleistete Arbeit hängt nur von der zurückgelegten Höhendifferenz ab, und ist gleich dem Produkt dieser mit der Erdbeschleunigung. Das Minuszeichen entsteht da wir die vom Schwerefeld geleistete Arbeit betrachten. Als ein zweites Beispiel betrachten wir diesmal das auf U = R 2 \{} definierte Vektorfeld F := x x 2 + y 2 y y x 2 + y 2 und als Kurve nehmen wir einen Kreis κ,r mit einem Radius r >. Es sind für jedes t [, 2π] ( sin t κ,r(t) = r cos t und somit haben wir ), F (κ,r (t)) = 1 ( sin t r cos t κ,r F (t) dt = 2π. x, ), also ist F (κ,r (t)) κ,r(t) = 1 Wie beim skalaren Kurvenintegral ergeben sich durch Einsetzen der Definition und Anwendung der entsprechenden Eigenschaften des eindimensionalen Riemannintegrals sofort auch die Grundeigenschaften des Linienintegrals. Lemma 7.4 (Grundeigenschaften des Kurvenintegrals) Seien n N mit n 1, U R n eine offene Menge, F : U R n ein stetiges Vektorfeld auf U und γ : [a, b] U, δ : [c, d] U zwei stückweise C 1 -Kurven in U. (a) Sind γ und δ zusammensetzbar, so gilt F (t) dt = γ+δ (b) Es ist F (t) dt = F (t) dt. γ γ γ F + (c) Ist δ eine Umparametrisierung von γ, so gilt F (t) dt = F (t) dt. γ δ 217 δ F.

218 Mathematik für Physiker III, WS 212/213 Freitag (d) Es gilt die Dreiecksungleichung F (t) dt sup F (x) l(γ) x γ([a,b]) γ Beweis: Sei (t,..., t r ) eine C 1 -Zerlegung von γ und setze γ i := γ [t i 1, t i ] für 1 i r. (a) Ist (t,..., t r ) eine C1 -Zerlegung von δ und setzen wir δ i := δ [t i 1, t i] für 1 i r, und setzen wir weiter t r+i := b + t i c für i r, so ist (t,..., t r+r ) eine C 1 - Zerlegung von γ + δ und es gilt (γ + δ) [t i 1, t i ] = γ i für 1 i r. Ist weiter 1 i r und γ r+i := (γ + δ) [t r+i 1, t r+i ], so ist γ r+i (t) = δ i (t + c b) und γ r+i(t) = δ i(t + c b) für alle t [t r+i 1, t r+i ], also ist nach der Substitutionsregel II. 2.Satz 13 auch tr+i t r+i 1 F (γ r+i (t)) γ r+i(t) dt = Insgesamt ist damit γ+δ r+r F = i=1 = ti tr+i t i 1 F (γ i (t)) γ i(t) dt r i=1 ti r F (γ i (t)) γ i(t) dt + t i 1 t r+i 1 F (δ i (t + c b)) δ i(t + c b) dt i=1 t i t i 1 = t i t i 1 F (δ i (t)) δ i(t) dt = F (δ i (t)) δ i(t) dt. γ F + (b) Setzen wir t i := a + b t r i für i r, so ist (t,..., t r) eine C 1 -Zerlegung von γ. Für 1 i r sei weiter γ i := γ [t i 1, t i], also γ i (t) = γ r+1 i(a + b t) und (γ i ) (t) = γ r+1 i(a + b t) für t [t i 1, t i] und dies ergibt mit einer erneuten Anwendung der Substitutionsregel II. 2.Satz 13 δ F. t i t i 1 t F (γ i i (t)) (γ i ) (t) dt = = tr i Damit ist insgesamt γ F = t i 1 t r+1 i F (γ r+1 i (t)) γ r+1 i(t) dt = r i=1 t i t i 1 F (γ i (t)) (γ i ) (t) dt = F (γ r+1 i (a + b t) γ r+1 i(a + b t) dt tr+1 i r i=1 = t (r+1 i) 1 F (γ r+1 i (t)) γ r+1 i(t) dt. tr+1 i F (γ r+1 i (t)) γ r+1 i(t) dt t (r+1 i) 1 r ti F (γ i (t)) γ i(t) dt = F. t i 1 i=1 γ 218

219 Mathematik für Physiker III, WS 212/213 Freitag (c) Zunächst seien γ und δ beide stetig differenzierbar und sei ϕ : [a, b] [c, d] eine Umparametrisierung von γ nach δ, also eine stetige, bijektive auf (a, b) stetig differenzierbare Funktion mit γ = δ ϕ und ϕ (t) > für alle t (a, b). Für jedes t (a, b) gilt dann F (γ(t)) γ (t) = F (δ(ϕ(t))) δ (ϕ(t)) ϕ (t), also ist nach der Substitutionsregel für Umparametrisierungen Lemma 1 auch γ F = b a F (γ(t)) γ (t) dt = d c F (δ(t)) δ (t) dt = Im allgemeinen Fall gibt es stetig differenzierbare Kurven γ 1,..., γ r und δ 1,..., δ r in U mit γ = γ γ r und δ = δ δ r so, dass δ i für jedes 1 i r eine Umparametrisierung von γ i ist. Mit (a) und der bereits bewiesenen Aussage folgt γ F = r i=1 γ i F = r F = δ i (d) Setze M := sup{ F (x) : x γ([a, b])}. Ist 1 i r, so gilt für jedes t [t i 1, t i ] nach der Cauchy-Schwartz Ungleichung II. 6.Satz 1 stets i=1 F (γ i (t)) γ i(t) F (γ i (t)) γ i(t) M γ i(t), also ist nach II. 2.Lemma 5.(b,c,d) auch ti ti F (γ i (t)) γ i(t) dt F (γ i (t)) γ i(t) dt M t i 1 t i 1 δ F. ti δ F. t i 1 γ i(t) dt = Ml(γ i ). Insgesamt ist damit γ F = r i=1 F (γ i (t)) γ i(t) dt t i 1 ti r i=1 F (γ i (t)) γ i(t) dt t i 1 r M l(γ i ) = Ml(γ). ti i=1 7.4 Konservative Vektorfelder und Potentiale Im letzten Abschnitt hatten wir gesehen das das Vektorfeld F = g / y auf dem R 2 für jede stückweise C 1 -Kurve γ mit Startpunkt p R 2 und Endpunkt q R 2 die Gleichung F = g(q 2 p 2 ) γ 219

220 Mathematik für Physiker III, WS 212/213 Freitag erfüllt, und insbesondere hängen diese Kurvenintegrale nur von Start- und Endpunkt der Kurve γ ab. Dies ist keinesfalls bei jedem Vektorfeld der Fall, nehmen wir beispielsweise das Vektorfeld F := y x wieder auf dem R 2 und betrachten die beiden Punkte p := (1, ) und q := ( 1, ) im R 2, so sind γ := τ pq und δ := κ,1 [, π] zwei stetig differenzierbare Kurven im R 2 mit Startpunkt p und Endpunkt q mit und γ δ F = 1 F (1 2t, ) q p dt = π F = sin 2 t dt = π 2 F. γ Hier laufen wir also auf zwei verschiedenen Wegen von p nach q und erhalten dabei zwei unterschiedliche Kurvenintegrale. Vektorfelder wie F = g / y bei denen dies nicht vorkommt sind eine besonders wichtige Klasse von Vektorfeldern die wir in diesem Abschnitt untersuchen wollen. Wir geben jetzt denjenigen Vektorfeldern deren Kurvenintegrale nur von Start- und Endpunkt der Kurve abhängen, einen eigenen Namen. Definition 7.9 (Konservative Vektorfelder) Seien n N mit n 1 und U R n offen und zusammenhängend. Ein stetiges Vektorfeld F auf U heißt konservativ, wenn für alle stückweisen C 1 -Kurven γ, δ in U mit γ = δ und γ + = δ + stets auch F = F ist. Ist F ein konservatives Vektorfeld γ δ auf U und sind p, q U, so gibt es nach II. 8.Lemma 1.(b) eine stückweise C 1 -Kurve γ in U mit γ = p und γ + = q und wir können definieren q F := F. p γ Dieses Integral erfüllt die üblichen formalen Regeln, sind p, q, r U so wählen wir stückweise C 1 -Kurven γ, δ in U mit γ = p, γ + = δ = q und δ + = r, und haben dann auch die stückweise C 1 -Kurve γ + δ in U mit Startpunkt p und Endpunkt r, also ist r q r F = F = F + F = F + F p γ+δ γ nach Lemma 4.(a). Weiter ist γ eine stückweise C 1 -Kurve in U mit Startpunkt q und Endpunkt p, also ist nach Lemma 4.(b) p q F = F = F = F. γ γ p q 22 δ p q

221 Mathematik für Physiker III, WS 212/213 Freitag Schließlich ist auch noch p p F = F =. τ pp Unser obiges Beispiel F = g / y können wir dann auch als q p F = g(q 2 p 2 ) für alle p, q R 2 schreiben. Ist F ein konservatives Vektorfeld auf U R n und γ eine geschlossene, stückweise C 1 -Kurve in U, etwa mit p := γ = γ +, so ist p F = F =, γ p Kurvenintegrale eines konservativen Vektorfelds längs geschlossener Kurven sind also immer Null. Umgekehrt impliziert diese Bedingung bereits das F konservativ ist. Sind dann nämlich p, q U und γ, δ zwei stückweise C 1 -Kurven in U mit γ = δ = p und γ + = δ + = q, so ist γ + δ eine geschlossene Kurve in U und mit unserer Annahme und Lemma 4.(a,b) folgt = F = F + F = F F, also F = F. γ+δ γ δ γ δ γ δ Kommen wir noch einmal zum Beispiel des konservativen Vektorfelds F = g / y auf dem R 2 zurück. Führen wir das sogenannte Potential ϕ : R 2 R; (x, y) gy ein, so haben wir für alle p, q R 2 die Gleichung q p F = g(q 2 p 2 ) = ϕ(q) ϕ(p). An diesem Beispiel sehen wir auch warum wir von einem Potential sprechen, bis auf das Vorzeichen handelt es sich gerade um die potentielle Energie. Um auch das Vorzeichen richtig zu kriegen, finden sie in der Literatur oftmals auch eine alternative Definition von Potential in der das Vorzeichen umgekehrt wird. Dieses Beispiel führt uns jetzt weiter zur allgemeinen Definition eines Potentials. Definition 7.1 (Potentiale von Vektorfeldern) Seien n N mit n 1, U R n offen und zusammenhängend und F ein stetiges Vektorfeld auf U. Eine Funktion ϕ : U R heißt ein Potential von F wenn F = ϕ(γ + ) ϕ(γ ) γ für jede stückweise C 1 -Kurve γ in U gilt. Wir sagen das das Vektorfeld F ein Potential hat wenn es ein Potential ϕ von F gibt. 221

222 Mathematik für Physiker III, WS 212/213 Freitag Es reicht die Bedingung in der Definition eines Potentials für jede stetig differenzierbare Kurve γ in U zu fordern. Ist dann nämlich γ eine beliebige stückweise C 1 -Kurve in U, so können wir γ = γ γ r mit stetig differenzierbaren Kurven γ 1,..., γ r in U schreiben, und erhalten mit Lemma 4.(a) auch r r F = F = (ϕ(γ i+ ) ϕ(γ i )) = ϕ(γ + ) ϕ(γ ). γ i γ i=1 i=1 Wir zeigen jetzt das ein stetiges Vektorfeld genau dann konservativ ist wenn es ein Potential hat, und dies ist weiter genau dann der Fall wenn F der Gradient einer stetig differenzierbaren Funktion ist. Satz 7.5 (Charakterisierung der konservativen Vektorfelder) Seien n N mit n 1 und U R n offen und zusammenhängend. (a) Seien F ein stetiges Vektorfeld auf U und ϕ ein Potential von F. Dann ist F konservativ und für alle p, q U gilt q F = ϕ(q) ϕ(p). Weiter ist ϕ stetig p differenzierbar mit F = grad ϕ. (b) Ist ϕ : U R eine stetig differenzierbare Funktion, so ist F := grad ϕ ein konservatives Vektorfeld mit Potential ϕ. (c) Sind F ein stetiges Vektorfeld auf U und ϕ, ψ zwei Potentiale von F, so existiert genau ein c R mit ψ(x) = ϕ(x) + c für alle x U. (d) Sei F ein stetiges Vektorfeld auf U. Dann sind die folgenden Aussagen äquivalent: 1. Das Vektorfeld F ist konservativ. 2. Das Vektorfeld F hat ein Potential. 3. Es gibt eine stetig differenzierbare Funktion ϕ : U R mit F = grad ϕ. Beweis: (a) Dass F konservativ mit q F = ϕ(q) ϕ(p) für alle p, q U ist, ist klar. p Sei nun p U gegeben. Sei 1 i n. Wähle ein ɛ > mit B ɛ (p) U und betrachte die Funktion h : ( ɛ, ɛ) R; t ϕ(p + te i ). Für jedes t R mit t < ɛ gilt dann nach der Substitutionsregel II. 2.Satz 13 h(t) h() = ϕ(p + te i ) ϕ(p) = F = τ p,p+tei also ist h(t) = h() + = t F (p + ste i ) te i ds tf i (p + ste i ) ds = F i (p + se i ) ds. t F i (p + se i ) ds,

223 Mathematik für Physiker III, WS 212/213 Freitag Da F i stetig ist, ist h nach dem Hauptsatz der Differential und Integralrechnung II. 2.Satz 9 differenzierbar mit ϕ x i (p) = h () = F i (p). Damit ist ϕ auf U partiell nach der i-ten Variablen differenzierbar mit ϕ/ x i = F i. Da F stetig ist, ist ϕ damit auf U stetig partiell differenzierbar, und somit nach II. 8.Lemma 15 auch stetig differenzierbar. Schließlich ist für alle p U auch ( ) ϕ grad ϕ(p) = (p) = (F i (p)) 1 i n = F (p), x i 1 i n d.h. grad ϕ = F. (b) Sei γ : [a, b] U eine stetig differenzierbare Kurve und setze p := γ = γ(a), q := γ + = γ(b). Für jedes t [a, b] gilt (ϕ γ) (t) = ϕ (γ(t))γ (t) = grad ϕ(γ(t)) γ (t) und damit folgt weiter b F = grad ϕ(γ(t)) γ (t) dt = ϕ(γ(b)) ϕ(γ(a)) = ϕ(q) ϕ(p). γ a Dies zeigt das ϕ ein Potential von F ist, und nach (a) ist F auch konservativ. (c) Die Eindeutigkeit von c ist klar. Um die Existenz einzusehen, wähle ein p U und setze c := ψ(p) ϕ(p) R. Nach (a) ist F konservativ und für jedes q U gilt ψ(q) = ψ(p) + q (d) (1)= (2). Wähle ein p U und definiere Sind dann q, r U, so haben wir r q F = p q F + d.h. ϕ ist ein Potential von F. (2)= (3). Klar nach (a). (3)= (1). Klar nach (b). p F = ψ(p) + ϕ(q) ϕ(p) = ϕ(q) + c. ϕ : U R; q r p F = r p F q p q p F. F = ϕ(r) ϕ(q), Die konservativen Vektorfelder sind also genau die Vektorfelder die ein Potential besitzen und auch genau diejenigen Vektorfelder die als Gradientenfeld einer stetig differenzierbaren Funktion auftreten, also die sogenannten Gradientenfelder. Als ein einfaches 223

224 Mathematik für Physiker III, WS 212/213 Freitag Korollar dieser Tatsache können wir jetzt eine gut zu überprüfende, notwendige Bedingung für die Existenz eines Potentials herleiten, das sogenannte Potentialkriterium. Korollar 7.6 (Potentialkriterium) Seien n N mit n 1 und = U R n offen und zusammenhängend. Weiter sei F ein stetig differenzierbares Vektorfeld auf U und F besitze ein Potential. Dann gilt F j x i = F i x j für alle 1 i < j n. Beweis: Nach Satz 5.(a) existiert eine stetig differenzierbare Funktion ϕ : U R mit F = grad ϕ. Da F als stetig differenzierbar vorausgesetzt ist, ist ϕ sogar zweimal stetig differenzierbar, und somit folgt für alle 1 i < j n nach dem Lemma von Schwarz II. 9.Lemma 2 auch F j x i = 2 ϕ x i x j = 2 ϕ x j x i = F i x j. Damit haben wir die Gültigkeit des Potentialkriteriums nachgewiesen. In Dimension n = 2 ist das Potentialkriterium für ein Vektorfeld eine einzige Bedingung Potentialkriterium für F = f x + g y : f y = g x und in Dimension n = 3 haben wir drei Bedingungen Potentialkriterium für F = f x + g y + h z : f y = g x, f z = h x, g z = h y. Wir schauen uns einmal die bisher behandelten Beispiele von Vektorfeldern daraufhin an ob sie das Potentialkriterium erfüllen. 1. Das Vektorfeld F = g / y, also F 1 (x, y) =, F 2 (x, y) = g erfüllt das Potentialkriterium da alle partiellen Ableitungen der Komponenten von F gleich Null sind. Tatsächlich wissen wir auch schon das F konservativ ist. 2. Vom Vektorfeld F = y / x hatten wir bereits gesehen das es nicht konservativ ist. Es sind ( ) y F (x, y) =, F 1 (x, y) = y, F 2 (x, y) = also F 1 y = 1, F 2 x =, das Potentialkriterium ist hier also nicht erfüllt. 224

225 Mathematik für Physiker III, WS 212/213 Dienstag Als letztes Beispiel schauen wir uns das Vektorfeld F := x x 2 + y 2 y y x 2 + y 2 auf U = R 2 \{} an. Wir wissen bereits das dieses kein Potential besitzt da zum Beispiel κ,1 F = 2π ist. Zum Überprüfen des Potentialkriteriums rechnen wir ( y ) = x2 y 2 y x 2 + y 2 (x 2 + y 2 ) und x 2 x x 2 + y = y2 x 2 2 (x 2 + y 2 ), 2 das Potentialkriterium ist hier also erfüllt obwohl das Vektorfeld kein Potential besitzt. Das letzte Beispiel zeigt, dass das Potentialkriterium eine notwendige, aber keinesfalls eine hinreichende, Bedingung für die Existenz eines Potentials ist. Auf dieses Problem werden wir am Ende dieses Abschnitts noch einmal kurz eingehen. x Vorlesung 19, Dienstag In der letzten Sitzung haben wir uns mit dem vektoriellen Kurvenintegral oder Linienintegral beschäftigt. Konkret sind wir gerade an denjenigen Vektorfeldern interessiert deren Kurvenintegrale nur von Anfangs- und Endpunkt des Integrationswegs abhängen, derartige Felder hatten wir konservativ genannt. Wir hatten bewiesen das ein stetiges Vektorfeld F auf einer offenen, zusammenhängenden Teilmenge U R n genau dann konservativ ist wenn es ein Potential ϕ : U R besitzt, also eine Funktion mit F (t) dt = ϕ(γ + ) ϕ(γ ) γ für jede stückweise C 1 -Kurve γ in U. Solch ein Potential ist dann bis auf eine additive Konstante eindeutig festgelegt. Die definierende Eigenschaft eines Potentials läßt sich rechnerisch natürlich nur schlecht überprüfen, zu diesen Zweck hatten wir bereits eingesehen das ϕ genau dann ein Potential von F ist wenn ϕ stetig differenzierbar mit Gradient grad ϕ = F ist. Insgesamt sind damit konservative Vektorfelder, Potentialfelder und Gradientenfelder alles dasselbe. Für stetig differenzierbare Vektorfelder F ergab sich hieraus ein notwendiges Kriterium für die Existenz eines Potentials, das sogenannte Potentialkriterium F j x i = F i x j (1 i < j n). Das Potentialkriterium ist im allgemeinen nicht hinreichend für die Existenz eines Potentials, dies hatten wir am Beispiel des Vektorfelds F = x x 2 + y 2 y 225 y x 2 + y 2 x

226 Mathematik für Physiker III, WS 212/213 Dienstag auf U = R 2 \{} gesehen. Bevor wir zur Berechnung von Potentialen kommen, wollen wir noch eine geometrische Eigenschaft des Potentials ϕ : U R von F = grad ϕ erwähnen. Sei c R und betrachte die Niveaumenge M c := {x U ϕ(x) = c}, in diesem Zusammenhang spricht man gelegentlich auch von Äquipotentialflächen. Seien γ : I M c eine in der Niveaumenge M c liegende stetig differenzierbare Kurve. Für jedes t I gilt dann ϕ(γ(t)) = c, also ergibt sich mit der Kettenregel auch = d dt ϕ(γ(t)) = ϕ (γ(t))γ (t) = grad ϕ(γ(t)) γ (t) = F (γ(t)) γ (t), der Tangentialvektor γ (t) an die Kurve γ steht also zu jedem Zeitpunkt t I senkrecht auf dem Vektorfeld F im Punkt γ(t). Man sagt auch das das Vektorfeld F senkrecht auf den Äquipotentialflächen steht. Ist insbesondere F längs der Niveaumenge M c nullstellenfrei, also F (x) für alle x M c, so ist M c nach dem Satz vom regulären Urbild 3.Korollar 2 eine (n 1)-dimensionale Untermannigfaltigkeit des R n, und unsere Beobachtung über die Kurven in M c besagt, dass das Vektorfeld F (x) für jedes x M c senkrecht auf dem Tangentialraum T x M c steht, also F (x) T x M c. Wenn man will kann man dies etwas künstlich auch als eine Konsequenz der geometrischen Interpretation der Lagrange-Multiplikatoren 3.Satz 5 ansehen. Wir wollen jetzt auf das Problem der konkreten Berechnung von Potentialen eines konservativen Vektorfelds eingehen. Angenommen wir haben ein stetiges Vektorfeld F auf einer offenen, zusammenhängenden Menge U R n und wollen wissen ob dieses ein Potential besitzt, und wenn dies der Fall sein sollte so wollen wir auch ein solches berechnen. Ist das Vektorfeld sogar stetig differenzierbar, so kann man zuerst das Potentialkriterium überprüfen, ist dieses nicht erfüllt so gibt es definitiv kein Potential. Nehmen wir einmal an F könnte zumindest ein Potential haben. Es gibt im wesentlichen zwei Methoden wie man jetzt rechnen kann. Die erste Methode ist immer anwendbar, man wählt irgendeinen Ursprung p U, und für jedes q U wählt man dann eine stückweise C 1 -Kurve γ von p nach q und berechnet das Kurvenintegral ϕ(q) := F (t) dt. Wenn es überhaupt ein Potential gibt, so muss ϕ ein solches sein, γ wir müssen also nur den Gradienten grad ϕ berechnen, und wenn dieser existiert und gleich F ist, so hat F das Potential ϕ und andernfalls kann es kein Potential von F geben. Wir führen dies einmal an den beiden auf U = R 2 definierten Vektorfeldern F := y x + (y x) y und G := y x + (x y) y durch. Als Ursprung wählen wir p = und ist q = (x, y) R 2 gegeben, so verwenden wir die Verbindungsstrecke τ pq als Kurve von p nach q. Die potentiellen Potentiale von F und G ergeben sich als ϕ(x, y) = F (t) dt = τ pq 1 ( ty t(y x) 226 ) ( x y ) dt = 1 ty 2 dt = 1 2 y2

227 Mathematik für Physiker III, WS 212/213 Dienstag für F beziehungsweise ψ(x, y) = G(t) dt = τ pq 1 ( ty t(x y) ) ( x y ) dt = 1 (2xyt y 2 t) dt = xy 1 2 y2 für G. Dass hier beidesmal ein Ergebnis herauskommt hat nichts zu sagen, man muss den Gradienten berechnen und schauen ob das richtige Vektorfeld entsteht. Es sind grad ϕ = y y F und grad ψ = y x + (x y) y = G, also hat F kein Potential aber G hat das Potential ψ. Insbesondere sehen wir hier das es nichts zu sagen hat wenn wir erfolgreich ein Kandidatenpotential berechnen können, dieses muss noch lange kein Potential sein. Nur wenn wir aus anderen Gründen schon wissen das unser Vektorfeld konservativ ist, so muss die berechnete Funktion ein Potential sein, aber selbst dann empfiehlt es sich meist zur Kontrolle auf Rechenfehler noch einmal den Gradienten zu überprüfen. In unseren beiden Beispielen können wir auch geometrisch sehen das ψ ein Potential von G ist, aber ϕ kein Potential von F ist. Beim ersten Vektorfeld F ist das Vektorfeld nicht senkrecht auf den Niveaukurven von ϕ, also kann ϕ von vornherein kein Potential von F sein, während das Vektorfeld G im zweiten Beispiel stets senkrecht auf den Niveaukurven von ψ ist. 4 4 y 2 y x x F (x, y) und Niveaumengen y 2 = 2c 4 G(x, y) senkrecht auf ψ(x, y) = c 227

228 Mathematik für Physiker III, WS 212/213 Dienstag Tatsächlich erfüllt F wegen (y x) = 1, x y y = 1 nicht das Potentialkriterium. Beachte das das Überprüfen des Potentialkriteriums für die Durchführung der eigentlichen Rechnung nicht notwendig ist, es kann einem nur einige Arbeit ersparen wenn es überhaupt kein Potential gibt. Die zweite Rechenmethode zur Berechnung des Potentials eines konservativen Vektorfelds ist das Verfahren der sogenannten unbestimmten Integration, das wir uns jetzt an einigen Beispielen anschauen wollen. Wir beschränken uns hier auf die Situation das die offene Menge U ein Produkt von offenen Intervallen ist und beginnen mit dem Beispiel des schon oben behandelten Vektorfelds G. Das Verfahren der unbestimmten Integration geht nicht von Kurvenintegralen aus, sondern wir starten mit der Gradientenbedingung, gesucht ist eine Funktion ϕ auf U = R 2 mit ϕ ϕ (x, y) = y und x y = x y. Die erste Bedingung können wir so lesen, dass ϕ bei fixierten y eine Stammfunktion von y bezüglich x ist. Bis auf eine additive Konstante h(y) muss also ϕ(x, y) = h(y) + y dx = xy + h(y) sein. Hiermit gehen wir jetzt in die zweite Bedingung ϕ y (x, y) = x + h (y) =! x y, also h(y) = y dy = 1 2 y2. Setzen wir dies in die Formel für ϕ ein, so wird ϕ(x, y) = xy + h(y) = xy 1 2 y2, und wir haben wieder unser Potential erhalten. Genau wie bei der ersten Methode hat es nichts zu sagen das wir hier ein Ergebnis erhalten, man muss testen ob tatsächlich grad ϕ = G gilt, was wir in diesem Beispiel aber schon getan haben. Wenn das betrachtete Vektorfeld konservativ ist, so liefert die Methode der unbestimmten Integration immer ein Potential des Vektorfelds, auf die Überprüfung des Gradienten kann also verzichtet werden wenn wir schon wissen das unser Vektorfeld wirklich konservativ ist. Zum Vergleich schauen wir uns einmal an was passiert wenn wir die Methode auf das nicht konservative Vektorfeld F anwenden. Die Rechnung beginnt diesmal wieder mit ϕ(x, y) = h(y) + y dx = xy + h(y), 228

229 Mathematik für Physiker III, WS 212/213 Dienstag und Einsetzen in die zweite Bedingung liefert jetzt ϕ y (x, y) = x + h (y) =! y x = h(y) = (y 2x) dy = 1 2 y2 2xy, also insgesamt ϕ(x, y) = xy + h(y) = 1 2 y2 xy. Wie schon gesagt hat es nichts zu bedeuten das ein Ergebnis herauskommt, wir müssen den Gradienten berechnen ϕ x = y, ϕ y = y x also grad ϕ = (y x) y y x F, und sehen erneut das F kein Potential hat. Wir wollen uns auch noch ein dreidimensionales Beispiel anschauen, das auf ganz R 3 definierte Vektorfeld F (x, y, z) = (z 2 y sin x) x + (cos x 2z) y + (2xz 2y + z) z. Wir gehen analog zum zweidimensionalen Fall vor, nur das wir diesmal gleich drei Bedingungen ϕ x = z2 y sin x, ϕ y = cos x 2z und ϕ z = 2xz 2y + z haben. Die erste Bedingung können wir wieder so lesen, dass ϕ als Funktion von x, bei fixierten y und z, eine Stammfunktion von z 2 y sin x ist, also ϕ(x, y, z) = (z 2 y sin x) dx + h(y, z) = z 2 x + y cos x + h(y, z) mit einer nur von y und z abhängigen Integrationskonstanten h(y, z). Damit ist also ϕ y = cos x + h y (y, z)! = cos x 2z h y = 2z und eine weitere unbestimmte Integration bei fixierten z ergibt analog zur obigen Überlegung h(y, z) = 2z dy + g(z) = 2yz + g(z) = ϕ(x, y, z) = z 2 x + y cos x 2yz + g(z), 229

230 Mathematik für Physiker III, WS 212/213 Dienstag diesmal mit einer nur noch von z abhängigen Integrationskonstanten g(z). Die dritte Bedingung an ϕ wird somit zu Somit ist g(z) = ϕ z = 2xz 2y + g (z)! = 2xz 2y + z = g (z) = z. z dz = 1 2 z2 = ϕ(x, y, z) = z 2 x + y cos x 2yz z2. Als abschließender Test ist wieder der Gradient zu berechnen grad ϕ(x, y, z) = (z 2 y sin x) x + (cos x 2z) y + (2xz 2y + z) z, also F = grad ϕ und wir haben ein Potential gefunden. Wir hatten schon festgehalten, dass das Potentialkriterium eine notwendige aber keine hinreichende Bedingung für die Existenz eines Potentials ist. Es ist naheliegend zu fragen, welche zusätzliche Bedingung nötig ist damit das Potentialkriterium die Existenz eines Potentials impliziert. Es stellt sich heraus das wir keine weitere Bedingung an das Vektorfeld benötigen sondern eine geometrische Bedingung für die offene, zusammenhängende Menge U. Man kann zeigen das genau dann jedes stetig differenzierbare Vektorfeld auf U das das Potentialkriterium erfüllt auch ein Potential hat, wenn die sogenannte erste Betti-Zahl von U gleich Null ist. Eine spezielle Klasse derartiger Mengen sind die offenen, sternförmigen Mengen, die wie folgt definiert sind. Definition 7.11: Sei E ein reeller oder ein komplexer Vektorraum. Eine Teilmenge S E heißt sternförmig wenn es einen Punkt z S mit (1 t)z + tx S für alle x S, t [, 1] gibt, d.h. für jeden Punkt x S soll die Verbindungsstrecke [z, x] ganz in S liegen. Einen Punkt z S mit dieser Eigenschaft nennt man dann auch ein Zentrum von S. Beispielsweise ist jede nicht leere, konvexe Teilmenge S eines reellen oder komplexen Vektorraums auch sternförmig, wobei wir jeden Punkt z S als Zentrum verwenden können. Wie angekündigt können wir jetzt einsehen, dass das Potentialkriterium auf sternförmigen offenen Mengen auch hinreichend für die Existenz eines Potentials ist. Satz 7.7 (Das Potenzialkriterium auf sternförmigen Gebieten) Seien n N mit n 1, U R n eine offene, sternförmige Menge und F : U R n ein stetig differenzierbares Vektorfeld auf U das das Potentialkriterium erfüllt. Dann besitzt F ein Potential auf U. Beweis: Wähle ein Zentrum z U von U. Für alle x U, t 1 ist (1 t)z+tx U, also ist die Funktion f : [, 1] U R; (t, x) F ((1 t)z + tx) x z 23

231 Mathematik für Physiker III, WS 212/213 Dienstag wohldefiniert, stetig und nach den hinteren n Variablen stetig partiell differenzierbar mit den Ableitungen f x i (t, x) = x i (t,x) j=1 n (x j z j )F j ((1 t)z + tx) = F i ((1 t)z + tx) + t(x i z i ) F i ((1 t)z + tx) + t(x j z j ) F j ((1 t)z + tx) x i x i j i n = F i ((1 t)z + tx) + t(x j z j ) F j ((1 t)z + tx) x i für alle 1 i n, t [, 1], x U. Nach 6.Korollar 4 ist die Funktion ϕ : U R; x 1 j=1 f(t, x) dt stetig differenzierbar und für 1 i n, x U gilt ( ) ϕ 1 n (x) = F i ((1 t)z + tx) + t(x j z j ) F j ((1 t)z + tx) x i x j=1 i ( ) = 1 F i ((1 t)z + tx) + = tf i ((1 t)z + tx) = F i (x). n j=1 t(x j z j ) F i x j ((1 t)z + tx) Dies zeigt grad ϕ = F und nach Satz 5.(b) ist ϕ ein Potential von F. 1 dt dt Ausgestattet mit diesem Satz kehren wir noch einmal zum Vektorfeld F = x x 2 + y 2 y y x 2 + y 2 auf U = R 2 \{} zurück. Dieses erfüllt das Potentialkriterium hat aber kein Potential. Das ist auch kein Widerspruch zum eben bewiesenen Satz da U nicht sternförmig ist. Wenn wir F allerdings auf eine sternförmige offene Teilmenge V von U einschränken, so muss es auf dieser kleineren offenen Menge V ein Potential von F geben. Wir können für V beispielsweise die geschlitzte komplexe Ebene C = C\R verwenden, diese ist sternförmig mit dem Zentrum z = (1, ), es muss also auf C ein Potential von F geben. Dieses werden wir im nächsten Abschnitt auch berechnen. Hier wollen wir die etwas besser zu behandelnde Wahl V = R > R, also die rechte Halbebene, diskutieren. 231 x

232 Mathematik für Physiker III, WS 212/213 Dienstag Verwenden wir die Methode der unbestimmten Integration und starten diesmal mit der Ableitung nach y, so ist x ϕ(x, y) = h(x) + x 2 + y dy = h(x) + arctan y 2 x, also ϕ x = h (x) y x y2 x 2 = h (x) wir brauchen also h (x) = und können h(x) =, also y x 2 + y 2! = y x 2 + y 2, ϕ(x, y) = arctan y x verwenden. Dann ist auf V tatsächlich grad ϕ = F, und somit haben wir auf der rechten Halbebene V ein Potential von F gefunden. 7.5 Koordinatentransformationen In diesem Abschnitt wollen wir die Auswirkungen von Koordinatentransformationen auf Kurvenintegrale untersuchen, und zwar sowohl im skalaren als auch im vektoriellen Fall. Bei Kurvenintegralen gibt es gleich zwei mögliche Arten von zu betrachtenden Koordinatentransformationen, zum einen können wir den längs der Kurve laufenden Parameter transformieren, und zum anderen können wir die Koordinaten auf dem umgebenden R n ändern. Transformationen des Kurvenparameters haben wir dabei bereits behandelt, dies waren die Umparametrisierungen der Kurve und wir wissen bereits das Kurvenintegrale erster und zweiter Art nach Lemma 3.(e) beziehungsweise nach Lemma 4.(c) beide unter Umparametrisierungen des Integrationswegs erhalten bleiben. In diesem Abschnitt wollen wir uns anschauen was passiert wenn wir die Koordinaten im R n ändern. Als Beispiel nehmen wir einmal den Kreis κ R, mit Radius R > und Mittelpunkt in der Ebene, diesen hatten wir als definiert. Bezeichnet κ R, : [, 2π] R 2 ; t (R cos t, R sin t) ϕ : R 2 R 2 ; (r, φ) (r cos φ, r sin φ) die Polarkoordinaten, so können wir den Kreis in Polarkoordinaten einfacher als γ : [, 2π] R 2 ; t (R, t) schreiben, dies meint das κ R, = ϕ γ gilt. Dies ist vor allem bequem wenn wir in Komponenten rechnen, die erste Beschreibung des Kreises ist dann x(t) = R cos t, y(t) = R sin t in cartesischen Koordinaten und r(t) = R, φ(t) = t in Polarkoordinaten, jeweils für t 2π. Häufig lässt man das Argument auch noch weg, und schreibt 232

233 Mathematik für Physiker III, WS 212/213 Dienstag einfach x = R cos t, y = R sin t für t 2π in cartesischen Koordinaten beziehungsweise r = R für φ 2π in Polarkoordinaten. Da die Formeln in Polarkoordinaten einfacher als die cartesische Version sind, ist es wünschenswert die beiden Arten von Kurvenintegralen, und insbesondere die Länge, ganz in Polarkoordinaten berechnen zu können. Allerdings gelten die Formeln zur Berechnung der Länge und der verschiedenen Kurvenintegrale nur in der cartesischen Beschreibung, beispielsweise ist die Länge einer Kurve γ(t) = (x(t), y(t)), a t b, in Komponenten ausgeschrieben als l(γ) = b a (dx ) 2 + dt ( dy dt ) 2 b dt = (dx)2 + (dy) 2 gegeben, wobei die letzte Darstellung rein symbolisch und nicht wirklich ernst gemeint ist. Aber im Beispiel des Kreises in Polarkoordinaten r = R, φ 2π ist 2π ( ) 2 ( ) 2 dr dφ 2π + dφ = dt = 2π dφ dφ unabhängig vom Radius R, es kommt also für R 1 nicht die richtige Länge der Kurve heraus. Man kann also nicht einfach eine Kurve in Polarkoordinaten angeben und dann die bisher eingeführten Formeln weiterverwenden, diese sind so nur in den cartesischen Standardkoordinaten gültig. Das ist auch nicht verwunderlich, die obige Längenformel berechnet die Länge von γ, wir brauchen aber diejenige der eigentlich gemeinten Kurve ϕ γ. Wir wollen uns jetzt die korrekten Formeln zur Berechnung von Länge und Kurvenintegralen in Polarkoordinaten und in allgemeinen Koordinatensystemen überlegen. Angenommen wir haben zwei offene Mengen U, V R n und als allgemeine Koordinatentransformation einen C 1 -Diffeomorphismus ϕ : U V. Wir interpretieren diesen so, dass dem Punkt y = (y 1,..., y n ) in ϕ-koordinaten der Punkt (x 1,..., x n ) = x = ϕ(y) in cartesischen Koordinaten entspricht. Ist γ : [a, b] U eine stetig differenzierbare Kurve in ϕ-koordinaten, so bezeichne γ := ϕ γ die entsprechende Kurve in cartesischen Koordinaten. Die Umrechnung der Tangentialvektoren ergibt sich dann über die Kettenregel, für jedes t [a, b] haben wir γ (t) = (ϕ γ) (t) = ϕ (γ(t)) γ (t). Schreiben wir die Komponenten von γ und γ als γ = (y 1,..., y n ) und γ = (x 1,..., x n ), so bedeutet diese Formel in Komponenten ausgeschrieben dx i dt = x i(t) = n j=1 ϕ i y j (γ(t)) y j(t) = a n j=1 ϕ i (γ(t)) dy j y j dt für alle t [a, b]. Für konkrete Rechnungen ist ein weiterer Wechsel der Notation hilfreich. Schreiben wir die Standardbasis des R n wie bei Vektorfeldern als / x i für 233

234 Mathematik für Physiker III, WS 212/213 Freitag i n, so wird die obige Formel für jedes t [a, b] zu ( n n ) ( γ ϕ i (t) = (γ(t)) dy j n n ) dy j = y j dt x i dt ϕ i (γ(t)), y j x i i=1 j=1 Definieren wir also für jeden Punkt p U und jedes 1 j n den Vektor n ϕ i y j := (p) R n, p y j x i so wird γ (t) = i=1 n j=1 dy j dt j=1 y j. γ(t) In anderen Worten ist / y j p die j-te Spalte der Jacobimatrix ϕ (p). Da ϕ ein C 1 - Diffeomorphismus ist, ist ϕ (p) nach 1.Korollar 7.(b) für jedes p U invertierbar, d.h. die Vektoren / y j p, 1 j n bilden eine Basis des R n. Schreiben wir dann einen Vektor v R n als Linearkombination v = n j=1 v j / y j p bezüglich dieser Basis, so nennt man v 1,..., v n auch die ϕ-koordinaten des Vektors v im Punkt q = ϕ(p). In diesem Sinne ist die obige Formel für γ (t) dann die Beschreibung der Tangentialvektoren der Kurve γ in ϕ-koordinaten. Ist der Punkt p U aus dem Kontext heraus vorgegeben, so läßt man ihn häufig einfach weg und schreibt die obige Formel verkürzt als γ (t) = n j=1 dy j dt. y j Man kann also die Tangentialvektoren von γ berechnen indem man diejenigen von γ normal durch komponentenweises Ableiten ermittelt und die ϕ-koordinatenvektoren / y j anstelle der Standardbasis des R n einsetzt. i=1 Vorlesung 2, Freitag Wir untersuchen gerade die Auswirkungen von Koordinatentransformationen im R n auf Kurvenintegrale beider Arten. Als allgemeine Koordinatentransformation verwenden wir dabei einen C 1 -Diffeomorphismus ϕ : U V mit offenen Mengen U, V R n. Dabei interpretieren wir den Argumentbereich U der Transformation ϕ als die ϕ-koordinaten und schreiben Punkte aus U als (y 1,..., y n ) und die Werte von ϕ werden als cartesische Koordinaten interpretiert und als (x 1,..., x n ) geschrieben. Im konkreten Beispiel der Polarkoordinaten können wir nach 1.2 die offenen Mengen U = R > ( π, π), V = C verwenden, und die Polarkoordinaten sind dann der Diffeomorphismus ϕ : U V ; (r, φ) (r cos φ, r sin φ). 234

235 Mathematik für Physiker III, WS 212/213 Freitag Die Koordinaten in U sind die Polarkoordinaten (y 1, y 2 ) = (r, φ) und die Koordinaten in V sind die cartesischen Koordinaten (x 1, x 2 ) = (x, y). Der Diffeomorphismus ϕ ordnet dabei dem Punkt (r, φ) U in Polarkoordinaten den entsprechenden Punkt (x, y) = ϕ(r, φ) in cartesischen Koordinaten zu. Zur Behandlung von Kurvenintegralen brauchen wir weiter eine Kurve γ : [a, b] U, die wir hier als stetig differenzierbar annehmen. All unsere Aussagen werden entsprechend auch für stückweise C 1 -Kurven gelten, da sich diese immer aus endlich vielen stetig differenzierbaren Kurven zusammensetzen lassen. Die Kurve γ ist dann eine Kurve in ϕ-koordinaten und durch Anwendung der Koordinatentransformation ϕ entsteht die zugehörige Kurve γ := ϕ γ in cartesischen Koordinaten. In einem rechnerischen Kontext schreibt man oft einfach weiter γ statt γ, da es uns hier aber gerade um die Untersuchung von Koordinatentransformationen geht ist es sinnvoller γ und γ auseinanderzuhalten. Haben wir beispielsweise den ebenen Kreis mit Mittelpunkt (, ) und einem Radius R >, so können wir diesen in Polarkoordinaten als γ : [, 2π] U; t (R, t) schreiben und die zugehörige Kurve in cartesischen Koordinaten ist dann γ = ϕ γ = κ,r. Wir hatten uns bereits überlegt wie sich die Tangentialvektoren in ϕ- und in cartesischen Koordinaten ineinander übertragen. Hierzu schreiben wir die Komponenten von γ als γ = (y 1,..., y n ) und diejenigen von γ als γ = (x 1,..., x n ). Führt man dann für jeden Punkt p U die Vektoren n ϕ i y j := (p) R n (1 j n) p y j x i ein, so wird γ (t) = i=1 n y j(t) y j = γ(t) j=1 n j=1 dy j dt für alle t [a, b], wobei die zweite Schreibweise eine Kurzform ist, in der der Punkt in dem / y j gebildet wird aus dem Kontext abgelesen wird. Die ϕ-tangentenvektoren / y j p für 1 j n sind gerade die Spalten der Jacobi-Matrix ϕ (p) und bilden eine Basis des R n, schreibt man Vektoren des R n bezüglich dieser Basen, so spricht man davon v in ϕ-koordinaten darzustellen. Die Verwendung dieser ϕ-koordinaten für den Tangentenvektor γ (t) hat den Vorteil das man zur Berechnung wie gewohnt nur die Kurve γ komponentenweise ableiten muss. Wie schon bemerkt sind die ϕ- Koordinatenvektoren im Punkt q = ϕ(p) genau die Spalten der Jacobi-Matrix ϕ (p), gemäß I ist die Jacobi-Matrix ϕ (p) also genau die Transformationsmatrix von der Basis / y j p (1 j n) des R n zur Standardbasis des R n. Häufig wird diese Tatsache auch in Termen der sogenannten Nabla-Vektoren in cartesischen und ϕ in ϕ-koordinaten eingeführt. Dies meint die beiden Vektoren die als := x 1. x n beziehungsweise ϕ := 235 y j y 1. y n

236 Mathematik für Physiker III, WS 212/213 Freitag definiert sind. Für uns sind dies rein symbolische Rechenhilfen, man kann diesen aber durchaus auch eine echte inhaltliche Bedeutung geben. Die Definition der / y j können wir jetzt auch in der Form ϕ = (Dϕ) t schreiben. Schauen wir uns das einmal konkret für die Polarkoordinaten an. Dann ist ϕ(r, φ) = (r cos φ, r sin φ), also ( ) ( ) cos φ r sin φ cos φ sin φ ϕ (r, φ) = = ϕ =, sin φ r cos φ r sin φ r cos φ und ausgeschrieben bedeutet dies für (r, φ) R 2 \{} und (x, y) = ϕ(r, φ) r = cos φ x + sin φ y = x x2 + y 2 x + φ = r cos φ y r sin φ x = x y y x. y x2 + y 2 y, Um zu sehen wie man mit diesen Formeln rechnet gehen wir auch noch einige Beispielkurven durch: 1. Der Kreis mit Radius R > ist in Polarkoordinaten als γ(t) = (R, t), t 2π gegeben, also r(t) = R, φ(t) = t. Hier ist es naheliegend den Kurvenparameter auch φ zu nennen, und dann schreibt sich diese Kurve als r(φ) = R, φ 2π. Die zugehörige cartesische Kurve ist γ = ϕ γ = κ R,. Für φ 2π ist der Tangentialvektor gleich γ (φ) = dr dφ r + dφ dφ φ = φ = φ. (R,φ) Ganz rechts haben wir explizit geschrieben in welchen Punkt / φ zu bilden ist, meist liest man dies aber aus dem Kontext ab, hier ist eben der entsprechende Punkt auf der Kurve gemeint. Wollen wir dies in cartesischen Koordinaten ausdrücken, so wird γ(φ) = (x(φ), y(φ)) mit x(φ) = R cos φ, y(φ) = R sin φ für φ 2π und setzen wir die Formeln für / r und / φ ein, so ist für φ 2π, x = x(φ), y = y(φ) γ (φ) = φ = x y y x = ( R sin φ R cos φ der schon früher berechnete Tangentialvektor am Kreis. 2. Als zweites Beispiel nehmen wir eine Spirale, die in Polarkoordinaten durch r(φ) = cφ, φ α mit α, c > gegeben ist. In cartesischen Koordinaten ist dies die Kurve ( ) cφ cos φ γ(φ) = cφ sin φ 236 )

237 Mathematik für Physiker III, WS 212/213 Freitag für φ α. Als Tangentenvektor ergibt sich in Polarkoordinaten γ (φ) = dr dφ r + dφ dφ φ = c r + φ, und in cartesischen Koordinaten wird dies für φ α zu ( ) γ x (φ) = c x2 + y 2 x + y +x x2 + y 2 y y y ( ) c cos φ cφ sin φ x =. c sin φ + cφ cos φ 3. Als letztes Beispiel nehmen wir die Kurve aus Aufgabe 9 der Übungsklausur. In Polarkoordinaten ist diese r(φ) = a(1 + sin φ), φ π/2, wobei a > ein Parameter ist. Die Tangentialvektoren in Polarkoordinaten sind dann γ (φ) = dr dφ r + dφ dφ φ = a cos φ r + φ. Auf die kompliziertere Beschreibung in cartesischen Koordinaten verzichten wir diesmal da diese schon in der Übungsklausur berechnet wurde. Kommen wir wieder zur allgemeinen Situation zurück und wir wollen jetzt die Länge unserer Kurve γ : [a, b] U in ϕ-koordinaten berechnen. Wir übernehmen die obigen Bezeichnungen, d.h. γ = (y 1,..., y n ) ist stetig differenzierbar, ϕ : U V die Koordinatentransformation und (x 1,..., x n ) = γ := ϕ γ. Für jedes t [a, b] haben wir n γ (t) 2 = γ (t) γ (t) = y j(t) n y i=1 i y j(t) γ(t) y i=1 i γ(t) = y i(t)y j(t) y i γ(t) y j, γ(t) 1 i,j n führen wir also für 1 i, j n die Funktionen g ij : U R; p y i p y j p ein, so ist γ (t) = ( 1 i,j n g ij (γ(t))y i(t)y j(t)) 1/2 = ( 1 i,j n g ij dy i dt für jedes t [a, b]. Die Länge unserer Kurve γ in ϕ-koordinaten ist damit l ϕ (γ) := l( γ) = b a ( 1 i,j n g ij (γ(t))y i(t)y j(t)) 1/2 dt = 237 b a ( 1 i,j n dy j dt ) 1/2 g ij dy i dy j ) 1/2,

238 Mathematik für Physiker III, WS 212/213 Freitag wobei die letztere Formel wieder eine nur symbolisch gemeinte Schreibweise ist. Setzen wir die Definition der Vektoren / y i ein, so kann man den sogenannten metrischen Tensor g ij für 1 i, j n, p U als n g ij (p) = k=1 ϕ k (p) y i x k n k=1 ϕ k (p) = y j x k n k=1 ϕ k y i (p) ϕ k y j (p) schreiben. Führen wir noch die sogenannte Gramsche Matrix G(p) := (g ij (p)) 1 i,j n ein, so schreibt sich diese Formel in Matrixform als G(p) = ϕ (p) t ϕ (p). Schauen wir uns all das wieder konkret bei den Polarkoordinaten an. Die Gramsche Matrix ist ( ) ( ) ( ) cos φ sin φ cos φ r sin φ 1 G(r, φ) = = r sin φ r cos φ sin φ r cos φ r 2, d.h. der metrische Tensor ist g 11 = 1, g 12 = g 21 =, g 22 = r 2, und die Formel für die Länge einer Kurve in Polarkoordinaten ergibt sich in den verschiedenen anzutreffenden Schreibweisen als b b (dr ) 2 ( ) 2 dφ l ϕ (γ) = l( γ) = r (t) 2 + r(t) 2 φ (t) 2 dt = + r a a dt 2 dt dt b = (dr)2 + r 2 (dφ) 2. Für die obigen drei Beispielkurven ergeben sich damit die folgenden Längen. 1. Beim Kreis r(φ) = R, φ 2π haben wir l( γ) = 2π R2 dφ = 2πR, es kommt also diesmal das korrekte Ergebnis heraus. 2. Sind c, α > und betrachten wir die Spirale r(φ) = cφ, so wird mit der Substitution φ = sinh t, also dφ = cosh t dt l( γ) = = c α arsinh α c2 + c 2 φ 2 dφ = c cosh 2 t dt = c arsinh α t + sinh t cosh t sinh 2 t cosh t dt arsinh α = c 2 a ( α ) 1 + α 2 + arsinh α.

239 Mathematik für Physiker III, WS 212/213 Freitag Für die Kurve r(φ) = a(1 + sin φ), φ π/2 der Übungsklausur ist l( γ) = π/2 a2 cos 2 φ + a 2 (1 + sin φ) 2 dφ = π/2 2a 1 + sin φ dφ, und die Berechnung dieses Integrals wurde in der Übungsklausur durchgeführt. Damit haben wir die Berechnung der Länge in einem allgemeinen Koordinatensystem behandelt, kommen wir nun zu den Kurvenintegralen erster Art. Wie oben sei ϕ : U V weiterhin ein C 1 -Diffeomorphismus. Weiter sei eine stetige Funktion f : V R in cartesischen Koordinaten gegeben. Die entsprechende Funktion in ϕ-koordinaten ist dann f := f ϕ : U R, beziehungsweise f = f ϕ 1. Weiter sei wie oben eine stetig differenzierbare Kurve γ : [a, b] U in ϕ-koordinaten gegeben, und sei γ := ϕ γ die Kurve in cartesischen Koordinaten. Das skalare Kurvenintegral in cartesischen Koordinaten hatten wir durch das Integral eγ f(t) dt = b a f( γ(t)) γ (t) dt definiert. Wegen f γ = f ϕ γ = f γ, erhalten wir das skalare Kurvenintegral in ϕ-koordinaten als eγ f(t) dt = b ( 1/2 f(γ(t)) g ij (γ(t))y i(t)y j(t)) dt. a 1 i,j n Betrachten wir wieder speziell die Polarkoordinaten, so wird diese Formel zu beziehungsweise f(t) dt = b eγ a f(r(t), φ(t)) r (t) 2 + r(t) 2 φ (t) 2 dt, eγ f(t) dt = b a f(r, φ) (dr dt ) 2 ( ) 2 dφ + r 2 dt dt in verkürzter Schreibweise. Als ein Beispiel sei die Funktion f in Polarkoordinaten als ( f : R > π 2, π ) R; (r, φ) r 2 tan φ 2 gegeben. Schreiben wir x = r cos φ, y = r sin φ, so wird r 2 tan φ = r 2 r sin φ r cos φ = (x2 + y 2 ) y x 239 = xy + y3 x,

240 Mathematik für Physiker III, WS 212/213 Freitag in cartesischen Koordinaten ist unsere Funktion also f : R > R R; (x, y) xy + y3 x. Wir wollen diese Funktion über den Kreisbogen [ γ :, π ] ( R > π 4 2, π ) ; φ (R, φ) 2 integrieren. Unsere Formel besagt eγ f(t) dt = π/4 R 2 tan φ R 2 dφ = R 3 ln(cos φ) π/4 = R 3 ln 1 = R3 ln Als ein zweites Beispiel schauen wir uns erneut die Kurve γ aus Aufgabe 9 der Übungsklausur an, diese war gegeben durch r(φ) = a(1 + sin φ), φ π/2 in Polarkoordinaten, wobei a > eine Konstante ist. Wir wollen das skalare Kurvenintegral von x längs dieser Kurve berechnen. Es ist x = r cos φ, und oben haben wir schon γ (t) = 2a 1 + sin φ gerechnet. Damit ist eγ x = π/2 2a 2 cos φ(1 + sin φ) 1 + sin φ dφ = π/2 2a 2 cos φ(1 + sin φ) 3/2 dφ = a2 (1 + sin φ) 5/2 π/2 = a2 (2 5/2 1) = a2 5 (16 2 2). Schließlich kommen wir zum Kurvenintegral zweiter Art, und wir beginnen wieder mit der Behandlung einer allgemeinen Koordinatentransformation. Die Bezeichnungen seien weiterhin wie oben und es sei jetzt zusätzlich ein stetiges Vektorfeld F : V R n in cartesischen Koordinaten gegeben. Wir müssen zunächst einmal sagen, was das dem Vektorfeld n F = F i x i i=1 entsprechende Vektorfeld in ϕ-koordinaten sein soll. Angenommen es ist p U. Der entsprechende Punkt in cartesischen Koordinaten ist q := ϕ(p) V, und diesem wird ein Vektor F (q) R n zugeordnet. Diesen Vektor wollen wir jetzt in ϕ-koordinaten ausdrücken. Wir wissen bereits das die Transformationsmatrix von der ϕ-basis / y j p (1 j n) des R n zur Standardbasis des R n durch die Jacobi-Matrix ϕ (p) gegeben ist, und nach I. 11.Satz 8 ist die Transformationsmatrix von der Standardbasis zur ϕ- Basis des R n damit gleich der inversen Jacobi-Matrix ϕ (p) 1. Wollen wir den Vektor F (q) also in ϕ-koordinaten ausdrücken, so müssen wir nur mit ϕ (p) 1 multiplizieren, das Vektorfeld F wird in ϕ-koordinaten also zu F (p) := (ϕ (p)) 1 ( F (ϕ(p)). 24

241 Mathematik für Physiker III, WS 212/213 Freitag Da das Invertieren von Matrizen nach 1.Lemma 4.(c) stetig ist, definiert uns dies ein stetiges Vektorfeld F : U R n, und dieses bezeichnen wir als das Vektorfeld F in ϕ-koordinaten. Zur rechnerischen Auswertung dieser Formel erinnert man sich am besten an die Formel ϕ = (Dϕ) t, und schreibt diese um zu = (Dϕ) t ϕ = (Dϕ 1 ) t ϕ. Man muss also in F (q) das Argument q = ϕ(p) in ϕ-koordinaten umschreiben und die obige Formel für / x i einsetzen. Der umgekehrte Rechenweg ist dann analog, beginnen wir mit einem stetigen Vektorfeld F : U R n in ϕ-koordinaten, geschrieben als F = n i=1 F i, y i so entsteht das zugehörige Vektorfeld in cartesischen Koordinaten durch Umkehren der obigen Rechnung, d.h. zu q V bildet man p := ϕ 1 (q) U, berechnet den Vektor F (p) = F (ϕ 1 (q)) und transformiert diesen auf cartesische Koordinaten, also F (q) := ϕ (ϕ 1 (q)) F (ϕ 1 (q)). Rechnerisch geschieht auch dies wieder durch Umschreiben der Koeffizienten F i auf cartesische Koordinaten und Einsetzen der Formeln für die / y i. Kommen wir wieder speziell zu den Polarkoordinaten. Dann ist ( cos φ sin φ = r sin φ r cos φ und ausgeschrieben bedeutet dies Ein Vektorfeld ) 1 ϕ = 1 r x = cos φ r sin φ r φ, = sin φ y r + cos φ r φ. ( r cos φ sin φ r sin φ cos φ F (x, y) = f(x, y) x + g(x, y) y ) ϕ, in cartesischen Koordinaten ist auf Polarkoordinaten transformiert damit gleich ( f(r cos φ, r sin φ) cos φ r sin φ ) ( + g(r cos φ, r sin φ) sin φ r φ r + cos φ ) r φ also F (r, φ) = f(r, φ) r g(r, φ) φ

242 Mathematik für Physiker III, WS 212/213 Freitag mit f(r, φ) = f(r cos φ, r sin φ) cos φ + g(r cos φ, r sin φ) sin φ, g(r, φ) = g(r cos φ, r sin φ) cos φ g(r cos φ, r sin φ) sin φ r r. Wir schauen uns zwei kleine Beispiele an. Angenommen wir haben das Vektorfeld F = x x + y y in cartesischen Koordinaten. Zum Umrechnung auf Polarkoordinaten müssen wir die Formeln für x, y, / x und / y einsetzen, also ist das zugehörige Vektorfeld F in Polarkoordinaten gleich ( F = r cos φ cos φ r sin φ r ) ( + r sin φ φ Als ein zweites Beispiel betrachten wir das Vektorfeld F = y x x (x2 + y 2 ) y sin φ r + cos φ r ) = r φ r. definiert etwa auf R 2 >. Das entsprechende Vektorfeld F in Polarkoordinaten ist dann auf R > (, π/2) definiert und ist gegeben als ( F = tan φ cos φ r sin φ r ) ( r 2 φ sin φ r + cos φ r ) φ = (1 r 2 ) sin φ r cos φ (r 2 + tan 2 φ) r φ Die Transformation in die andere Richtung, also bei gegebener Darstellung in Polarkoordinaten das Vektorfeld in cartesische Koordinaten umzuschreiben verläuft analog. Ist das Vektorfeld in Polarkoordinaten gleich F (r, φ) = f(r, φ) r + g(r, φ) φ, so setzen wir die Formeln für r, φ, / r und / φ ein, und F (r, φ) wird zu also F (x, y) = f( x 2 + y 2, arg(x, y)) ( x x2 + y 2 x + ) y x2 + y 2 y + g( x 2 + y 2, arg(x, y)) F (x, y) = f(x, y) x + g(x, y) y 242 ( x y y ), x

243 Mathematik für Physiker III, WS 212/213 Freitag mit f(x, y) = xf( x 2 + y 2, arg(x, y)) y x 2 + y 2 g( x 2 + y 2, arg(x, y)) x2 + y 2, g(x, y) = yf( x 2 + y 2, arg(x, y)) + x x 2 + y 2 g( x 2 + y 2, arg(x, y)) x2 + y 2. Als ein Beispiel betrachten wir das Vektorfeld F = r 2 r r tan φ φ in Polarkoordinaten. In cartesischen Koordinaten wird dieses zu ( ) F = (x 2 + y 2 x ) x2 + y 2 x + y y x2 + y x2 + y 2 y x 2 ( x y y ) x = (x2 + y 2 ) 3/2 x Damit haben wir die Transformation von Vektorfeldern behandelt und kommen schließlich zur Berechnung des Linienintegrals in einem allgemeinen Koordinatensystem. Wie oben sei ϕ : U V wieder ein C 1 -Diffeomorphismus und wir übernehmen wieder unsere obigen Bezeichnungen. Gegeben sei ein zu integrierendes stetiges Vektorfeld F in ϕ-koordinaten und F sei das zugehörige Vektorfeld in cartesischen Koordinaten. Die Definition des vektoriellen Kurvenintegrals in cartesischen Koordinaten ist b F (t) dt = F ( γ(t)) γ (t) dt. eγ Um diesen Term weiter auszuwerten, rechnen wir für jedes t [a, b] zunächst a γ (t) = ϕ (γ(t)) γ (t) und F ( γ(t)) = F (ϕ(γ(t))) = ϕ (γ(t))f (γ(t)) x. und haben damit auch F ( γ(t)) γ (t) = ϕ (γ(t))f (γ(t)) ϕ (γ(t))γ (t) = ϕ (γ(t)) t ϕ (γ(t))f (γ(t)) γ (t) = G(γ(t))F (γ(t)) γ (t), wobei G für die Gramsche Matrix stand. Damit haben wir unseren Integranden in Termen der ϕ-koordinaten ausgedrückt und in Komponenten ausgeschrieben ist weiter G(γ(t))F (γ(t)) γ (t) = n (G(γ(t))F (γ(t))) i y i(t) = g ij (γ(t))f j (γ(t))y j(t), i=1 1 i,j n 243

244 Mathematik für Physiker III, WS 212/213 Freitag also ist die Formel für das Linienintegral in ϕ-koordinaten eγ F (t) dt = b a 1 i,j n g ij (γ(t))f j (γ(t))y j(t) dt. Setzen wir in dieser Formel speziell die Polarkoordinaten ein, also g 11 = 1, g 12 = g 21 =, g 22 = r 2, so ergibt sich die Formel für Linienintegrale eine Vektorfelds F (r, φ) = f(r, φ) r + g(r, φ) φ in Polarkoordinaten als F = eγ b a f(r(t), φ(t))r (t) + r(t) 2 g(r(t), φ(t))φ (t) dt. Als ein Beispiel wollen wir einmal das Linienintegral x dx + y dy eγ aus Aufgabe (9.c) der Übungsklausur in Polarkoordinaten rechnen. Die Kurve γ war dabei in Polarkoordinaten als r(φ) = a(1+sin φ) für φ π/2 mit einer Konstanten a > gegeben. Das Vektorfeld x / x + y / y haben wir bereits in einem der obigen Beispiele auf Polarkoordinaten transformiert und hatten dabei r / r erhalten. Damit wird eγ x dx + y dy = π/2 a 2 (1 + sin φ) cos φ dφ = a 2 ( sin φ + sin2 φ 2 π/2 ) = 3 2 a2. Als letzte Fragestellung in diesem Rahmen wollen wir nun die Berechnung von Potentialen in einem allgemeinen Koordinatensystem behandeln. Bei unserer ersten Methode zur Berechnung eines Potentials eines stetigen Vektorfelds F wählten wir irgendeinen Startpunkt p in dem unser gesuchtes Potential den Wert Null haben soll, und für jeden anderen Punkt q wählte man sich eine stückweise C 1 -Kurve γ von p nach q und definierte das Potential als das Kurvenintegral Φ(q) := F (t) dt. Im zweiten Schritt γ mussten wir dann die Bedingung grad Φ = F überprüfen, wenn diese zutrifft so hat F das Potential Φ und andernfalls gibt es kein Potential. Der erste Schritt dieses Verfahrens erfordert nur die Berechnung von vektoriellen Kurvenintegralen und diese können wir bereits in allgemeinen Koordinaten durchführen. Den zweiten Schritt, dass also der Gradient der berechneten Funktion Φ wirklich das gegebene Vektorfeld ist, können wir dagegen zur Zeit nur in cartesischen Koordinaten durchführen, da wir nicht wissen wir der Gradient in einem allgemeinen Koordinatensystem aussieht. Daher ist es unser nächstes Ziel die Formel für den Gradienten herzuleiten. Dies werden wir wieder im Rahmen einer allgemeinen Koordinatentransformation ϕ : U 244

245 Mathematik für Physiker III, WS 212/213 Dienstag V tun. Angenommen wir haben eine stetig differenzierbare Funktion f : U R in ϕ- Koordinaten. Die zugehörige Funktion in cartesischen Koordinaten ist dann f = f ϕ 1. Sei p U und schreibe q := ϕ(p) V. Die Kettenregel ergibt dann f (q) = (f ϕ 1 ) (q) = f (p) (ϕ 1 ) (q) = f (p) ϕ (p) 1. und durch Transposition ergibt sich grad f(q) = ( f (p) ϕ (p) 1) t = ϕ (p) t grad f(p). Dies ist aber noch nicht der gesuchte Gradient in ϕ-koordinaten, da grad f(q) bezüglich der Standardbasis des R n dargestellt ist. Als den Gradient grad ϕ f der Funktion f in ϕ-koordinaten bezeichnen wir das zu grad f gehörende Vektorfeld in ϕ-koordinaten. Dieses ist für p U gegeben als grad ϕ f(p) := (ϕ (p)) 1 (grad f(ϕ(p))) = ϕ (p) 1 ϕ (p) t grad f(p) = (ϕ (p) t ϕ (p)) 1 grad f(p) = G(p) 1 grad f(p), wobei G die Gramsche Matrix ist. Damit haben wir die allgemeine Formel für Gradienten in ϕ-koordinaten erhalten. Speziell für die Polarkoordinaten bedeutet diese Formel grad ϕ f(r, φ) = ( 1 r 2 ) ( 1 f ) (r, φ) r = f r (r, φ) r + 1 f r 2 φ f (r, φ) φ und in der verkürzten Form wird diese Formel oft auch als geschrieben. grad ϕ f = f r r + 1 f r 2 φ φ (r, φ) φ, Vorlesung 21, Dienstag In der letzten Sitzung haben wir die Transformationsformeln für die Länge, die beiden Arten von Kurvenintegralen und den Gradienten unter einer allgemeinen Koordinatentransformation hergeleitet. Insbesondere haben wir gesehen dass man nur die Jacobi-Matrix der Transformation kennen muss und aus dieser lassen sich alle anderen Größen rein mechanisch berechnen. Für die Polarkoordinaten haben wir dies explizit vorgeführt und die entsprechenden Rechnungen für die Kugelkoordinaten sind Aufgabe (46). Damit verbleiben nur noch die Zylinderkoordinaten als die dritte der Standardkoordinatentransformationen aus 1.2. Da bei diesen aber nur die dritte Koordinate 245

246 Mathematik für Physiker III, WS 212/213 Dienstag z zu den Polarkoordinaten hinzugefügt wird, ist hier nicht viel zu tun, die für die Polarkoordinaten gültigen Formeln r = x x2 + y 2 x + x = cos φ r sin φ r φ, y x2 + y 2 y, φ = x y y x, y = sin φ r + cos φ r bleiben für die Zylinderkoordinaten ungeändert bestehen und / z ist in Zylinderkoordinaten dasselbe wie in cartesischen Koordinaten, also konstant der dritte Standardbasisvektor des R 3. Gramsche Matrix und metrischer Tensor der Zylinderkoordinaten sind 1 G(r, φ, z) = r 2, g 11 = g 33 = 1, g 22 = r 2, g ij = (i j), 1 φ ist also γ : [a, b] U eine stetig differenzierbare Kurve in Zylinderkoordinaten, geschrieben als γ(t) = (r(t), φ(t), z(t)) mit zugehöriger Kurve γ in cartesischen Koordinaten, so haben wir l ϕ (γ) = b a b r (t) 2 + r(t) 2 φ (t) 2 + z (t) 2 dt = (dr)2 + r 2 (dφ) 2 + (dz) 2. Für eine stetige Funktion f : U R in Zylinderkoordinaten mit zugehöriger Funktion f : V R in cartesischen Koordinaten ist das skalare Kurvenintegral gegeben als b f(t) dt = f(r(t), φ(t), z(t)) r (t) 2 + r(t) 2 φ (t) 2 + z (t) 2 dt eγ a und für ein stetiges Vektorfeld F = f / r + g / φ + h / z in Zylinderkoordinaten mit zugehörigen Vektorfeld F in cartesischen Koordinaten berechnet sich das vektorielle Kurvenintegral als eγ F (t) dt = b a f(γ(t))r (t) + r(t) 2 g(γ(t))φ (t) + h(γ(t))z (t) dt = b a a f(r, φ, z) dr + r 2 g(r, φ, z) dφ + h(r, φ, z) dz. Der Gradient einer stetig differenzierbaren Funktion f : U R in Zylinderkoordinaten ergibt sich schließlich als grad ϕ f = f r r + 1 f r 2 φ φ + f z Als ein letztes Beispiel in Polarkoordinaten schauen wir uns noch einmal das Vektorfeld F (x, y) := x x 2 + y 2 y 246 y x 2 + y 2 z. x

247 Mathematik für Physiker III, WS 212/213 Dienstag auf R 2 \{} an. Dieses Vektorfeld erfüllte das Potentialkriterium hatte aber trotzdem kein Potential auf R 2 \{}. Schon am Ende des letzten Abschnitts hatten wir angemerkt das F auf der geschlitzten Ebene C ein Potential haben muss, hatten aber noch kein solches berechnet. Dies wollen wir jetzt nachholen, in Polarkoordinaten läßt sich dies recht bequem durchführen. Wir transformieren das Vektorfeld erst einmal in Polarkoordinaten auf U = (, ) ( π, π), und schreiben hierzu also haben wir x x 2 + y 2 y y x 2 + y 2 x = 1 x 2 + y 2 F (r, φ) = 1 r 2 ( x y y x φ. ) = 1 r 2 φ, Wir wollen ein Potential Φ von F in Polarkoordinaten, und hierzu gehen wir entsprechend der ersten Methode des vorigen Abschnitts vor. Als Startpunkt wählen wir den Punkt z = (1, ) in dem Φ(1, ) = werden soll. Sei p = (r, φ) U ein beliebiger Punkt. Wir benötigen eine stückweise C 1 -Kurve mit Startpunkt z und Endpunkt p, und hierfür verwenden wir γ = γ 1 + γ 2 mit γ 1 (t) = (1 + t(r 1), ), γ 2 (t) = (r, tφ) jeweils definiert für t 1. In cartesischen Koordinaten laufen wir also zuerst auf der positiven x-achse von (1, ) nach (r, ) und dann auf einem Kreisbogen von diesem Punkt zum Endpunkt. Die Kurvenintegrale von F längs dieser beiden Teilstücke ergeben sich gemäß der Formel für Linienintegrale in Polarkoordinaten als F (t) dt = eγ 1 F (t) dt = eγ (1 + t(r 1)) 2 1 dt =, (1 + t(r 1)) 2 r 2 1 φ dt = φ, r2 der einzige Kandidat für ein Potential ist also in Polarkoordinaten durch Φ(r, φ) = F (t) dt = φ eγ gegeben. Diese Funktion ist tatsächlich ein Potential unseres Vektorfeldes, wir haben nämlich grad ϕ Φ = Φ r r + 1 Φ r 2 φ φ = 1 r 2 φ = F. In cartesischen Koordinaten ist das Potential Φ von F auf der geschlitzten Ebene C also die in I. 5.2 eingeführte Argumentfunktion Φ(z) = arg z. Zum Abschluß dieses Themas wollen wir noch zwei weitere kleine Tatsachen vorstellen. Angenommen wir haben eine allgemeine Koordinatentransformation, also einen 247

248 Mathematik für Physiker III, WS 212/213 Dienstag C 1 -Diffeomorphismus ϕ : U V zwischen offenen Teilmengen U, V R n. Wie immer in diesem Abschnitt denken wir uns die Punkte p = (y 1,..., y n ) U als die ϕ-koordinaten und die zugehörigen q = ϕ(p) = (x 1,..., x n ) als die zugehörigen cartesischen Koordinaten. Für jeden Punkt p U hatten wir die Vektoren / y j p als die Spalten der Jacobi-Matrix ϕ (p) eingeführt, diese bildeten eine Basis des R n und die Jacobi-Matrix liefert Formeln die Basis / y j in die Standardbasis / x j umzurechnen. Diese Formeln haben noch eine zweite Interpretation. Angenommen wir haben eine stetig differenzierbare Funktion f : U R in ϕ-koordinaten mit zugehöriger Funktion f = f ϕ 1 : V R in cartesischen Koordinaten. Wenn wir dann sagen, dass wir die Funktion f nach einer der cartesischen Koordinaten x j ableiten, so ist gemeint das f/ x j gebildet wird und das Ergebnis in ϕ-koordinaten transformiert wird, d.h. man setzt f := f ϕ, x j x j für alle 1 j n. Typischerweise kommt so etwas vor wenn man zwar einerseits in ϕ-koordinaten rechnen will, andererseits aber Formeln benutzen muss die nur in cartesischen Koordinaten formuliert sind. Wir schauen uns das einmal in einem Beispiel an. In Polarkoordinaten sei die Funktion ( f : R > π 2, π ) R; (r, φ) r 2 tan φ, 2 also kurz f(r, φ) = r 2 tan φ, gegeben. Bereits in einem früheren Beispiel hatten wir gesehen das diese in cartesischen Koordinaten zu f = f ϕ 1 : R > R R wird, wobei f(x, y) = xy + y3 x für alle x >, y R ist. Hier können wir die partiellen Ableitungen bilden f y3 (x, y) = y x x f und 2 y und erhalten schließlich in Polarkoordinaten (x, y) = x + 3y2 x, f x (r, φ) = r sin φ r sin3 φ cos 2 φ = r sin φ(1 tan2 φ), f y (r, φ) = r cos φ + 3r sin2 φ cos φ = r(1 + 2 sin2 φ) cos φ Diese Methode funktioniert zwar ist aber durch dieses zweimalige Transformieren etwas umständlich, und wir wollen jetzt ein anderes Verfahren beschreiben bei dem kein explizites Transformieren der Funktion mehr nötig ist. Hierzu setzen wir in unserem Beispiel die Formeln x = cos φ r sin φ r φ und y = sin φ r + cos φ r φ 248

249 Mathematik für Physiker III, WS 212/213 Dienstag ein, und rechnen dann ganz direkt ( f (r, φ) = cos φ x r sin φ r und f (r, φ) = y ( sin φ r + cos φ r φ ) r 2 tan φ = 2r cos φ tan φ r sin φ(1 + tan 2 φ) = r sin φ(1 tan 2 φ) φ ) r 2 tan φ = 2r sin φ tan φ + r cos φ(1 + tan 2 φ) = r(1 + 2 sin2 φ). cos φ Hier kommt das richtige Ergebnis heraus, und wir wollen uns überlegen weshalb dies so ist. Die Begründung wird wieder einmal die Kettenregel sein, und wir schauen uns dies gleich bei unserer obigen allgemeinen Koordinatentransformation an. Die Transformation von der cartesischen Basis zur ϕ-basis ist durch die Formel = (Dϕ) t φ gegeben, d.h. für alle 1 j n und alle p U ist x j = n i=1 ϕ 1 i x j ϕ(p) y i, p also wird f/ x j (p) berechnet durch Einsetzen der Formel für / x j zu f x j (p) = n i=1 ϕ 1 i x j f ϕ(p) y i. p Wir müssen uns also überzeugen das dies tatsächlich die Ableitung ist. Hierzu werten wir die Definition von f/ x j aus, und erhalten mit der Kettenregel ebenfalls f (p) = f x j x j = ϕ(p) f ϕ 1 x j = f (p) ϕ 1 ϕ(p) x j = ϕ(p) n f ϕ 1 i y i p x j, ϕ(p) i=1 und dies ist wieder das obige Ergebnis. Als zweite abschließende Bemerkung wollen wir auch noch eine alternative Form des Rechnens in Polarkoordinaten, und entsprechend in beliebigen Koordinatensystemen, erwähnen. Wir schreiben Tangentialvektoren und Vektorfelder in Termen der Basis / r, / φ, verwenden also die Jacobi-Matrix der Koordinatentransformation als die Transformationsmatrix zur Umrechnung der Basisdarstellung von Vektoren. Diese Basis ist keine Orthonormalbasis und dies führt zum Auftauchen des metrischen Tensors (g ij ) 1 i,j n in unseren Formeln. Dies kann vermieden werden indem die Basis / r, eφ e r φ r 249

250 Mathematik für Physiker III, WS 212/213 Dienstag / φ durch eine Orthonormalbasis ersetzt wird. Im Fall einer allgemeinen Transformation muss hierzu auf die Basis / y j, 1 j n noch das Gram-Schmidtsche Orthonormalisierungsverfahren aus II. 6.1 angewendet werden, dies ist bei den Polarkoordinaten besonders einfach da die beiden Vektoren / r und / φ zumindest senkrecht aufeinander stehen. Wir müssen die beiden also nur noch auf Einheitslänge normieren und erhalten die Orthonormalbasis e r (r, φ) := e φ (r, φ) := (r, φ) r = (r, φ) r (r, φ) φ = (r, φ) φ r = (r,φ) 1 r φ = (r,φ) ( cos φ sin φ ), ( sin φ cos φ Insbesondere ist re r (r, φ) damit der entsprechende Punkt in cartesischen Koordinaten, man sagt hierzu auch das re r der Ortsvektor ist. Eine Kurve in Polarkoordinaten γ in Polarkoordinaten wird dann als γ(t) = r(t)e r geschrieben, wobei die Komponente φ(t) in e t versteckt ist und nicht explizit notiert wird. Da e r eine Funktion von t ist, wird zum Ableiten die Produktregel verwendet und ergibt also auch γ (t) = r (t)e r + r(t)φ (t)e φ, γ (t) = r(t) 2 + r(t) 2 φ (t) 2. Dies ist dieselbe Formel die wir bereits oben erhalten hatten, nur etwas anders interpretiert. Ob man die Normierung auf e r, e φ oder die Basis / r, / φ bevorzugt ist eine Geschmacksfrage, unsere Wahl hat den Vorteil gut mit Ableitungen nach x, y zusammenzupassen. $Id: flaechen.tex,v /1/2 19:59:2 hk Exp hk $ ). 8 Oberflächenintegrale In diesem Kapitel wollen wir einen weiteren Integraltyp einführen, der bisher noch nicht behandelt wurde. Als ein Beispiel denken wir uns etwa eine sehr dünne, gebogene, geladene Platte im Raum. Zur Beschreibung einer solchen Platte kann es praktisch sein diese als ein zweidimensionales Gebilde P im R 3 aufzufassen, beispielsweise als eine durch eine Parametrisierung ϕ gegebene zweidimensionale Untermannigfaltigkeit des R 3. Die Ladungsverteilung auf der Platte können wir dann durch eine Ladungsdichte ϱ : P R beschreiben, und der Einfachheit halber nehmen wir diese als zeitlich 25

251 Mathematik für Physiker III, WS 212/213 Dienstag konstant an. Unsere Platte bewirkt auf einen anderen geladenen Körper im Punkt x R 3 mit Ladung q eine Kraft F die wir gerne berechnen würden. Können wir die Platte P einfach als Punktladung p in einem Punkt y auffassen, so besagt das Coulombsche Gesetz das die Kraft F gleich F = 1 pq (y x) 4πɛ y x 3 ist. Im allgemeinen Fall wird dagegen die genaue geometrische Form der Platte P und der Ladungsverteilung ϱ wichtig sein, und wir brauchen eine kontinuierliche Form des Coulombschen Gesetzes. Um diese zu erhalten, gehen wir wie bei unserem zu Beginn des 4 erläuterten heuristischen Standardargument vor und machen eine Näherungsüberlegung. Wir denken uns die Platte in viele kleine Teile P 1,..., P r zerlegt, wobei P i für 1 i r die Fläche A i habe und die Ladung p i trage, die relative Ladungsdichte des Stückchens P i sei also ϱ i = p i /A i. Die Teilplatten seien so klein, dass wir sie als Punktladungen in einem Punkt y i P i interpretieren können, und die von P i auf den Körper in x bewirkte Kraft F i wird nach dem Coulombschen Gesetz näherungsweise zu F i 1 p i q 4πɛ y i x (y 3 i x) = q 4πɛ ϱ i y i x 3 (y i x)a i. Summation dieser Teilstückchen liefert als Näherung für die gesamte bewirkte Kraft F F q 4πɛ r i=1 ϱ i y i x 3 (y i x)a i. Führt man dann den Grenzübergang nach immer feiner werdenden Zerlegungen von P durch, so konvergieren die Riemannsummen auf der rechten Seite der Näherung gegen ein Flächenintegral F = q 4πɛ P ϱ(y) (y x) dy. y x 3 Hier liegt allerdings keines der in 4 behandelten Riemannintegrale vor, bei letzteren hatten wir den Integrationsbereich in dreidimensionale Teile zerlegt und Riemannsummen gebildet, hier wird dagegen eine zweidimensionale Menge in zweidimensionale Teile zerlegt. Im Sinne des 4 sind diese niederdimensionalen Mengen dann Jordansche Nullmengen und Integrale über sie haben stets den Wert. Das ist natürlich nicht das was wir wollen, hier liegt kein Riemannintegral im Sinne von 4 vor, sondern ein anderer bisher noch nicht definierter Integraltyp. Wir verwenden die Parametrisierung ϕ um unser Flächenintegral auf den schon bekannten Fall eines gewöhnlichen zweidimensionalen Riemannintegrals zu reduzieren, allerdings erfordert dies eine Überlegung welche zweidimensionale Funktion als Integrand zu verwenden ist. Wir können nicht einfach y = ϕ(u) einsetzen und über u integrieren, denn bei den dabei entstehenden Riemannsummen wird die Fläche A i unserer Teilstücke durch die Fläche des 251

252 Mathematik für Physiker III, WS 212/213 Dienstag entsprechenden Parameterbereichs ersetzt, und diese ist im Allgemeinen verschieden von A i da das Stück P i im Raum gebogen sein kann. Was hier genau zu tun ist, werden wir uns im zweiten Abschnitt dieses Kapitels überlegen. Etwas allgemeiner kann man auch so etwas wie eine Integration über k-dimensionale Teilmengen des R n für alle k n definieren. Die Theorie des 4 deckt dann sozusagen den Fall k = n ab und die Kurvenintegrale des 7 sind der Fall k = 1 eindimensionaler Mengen. Für allgemeines k kommt man allerdings nicht mehr mit Funktionen oder Vektorfeldern als Integranten aus, sondern integriert über sogenannte Differentialformen, genauer über k-formen. Da wir diesen Begriff in diesem Semester nicht einführen wollen, beschränken wir uns ganz auf den Fall k = 2, n = 3, hier kann man anstelle von Differentialformen weiterhin Funktionen und Vektorfelder benutzen. Wie schon bemerkt sprechen wir von Flächenintegralen oder auch Oberflächenintegralen, und wie bei Kurvenintegralen gibt es wieder zwei Arten solcher Integrale. Bei den Flächenintegralen erster Art wird eine reellwertige Funktion integriert und bei den Flächenintegralen zweiter Art wird ein Vektorfeld integriert. Beim als Eingangsbeispiel verwendeten kontinuierlichen Coulomb-Gesetz liegt ein Flächenintegral erster Art vor, hier wird zwar ein Vektorfeld integriert, dieses Integral ist aber komponentenweise und nicht als Flächenintegral zweiter Art gemeint. 8.1 Flächen im R 3 Wir wollen jetzt beginnen die in diesem Kapitel untersuchten Flächenintegrale wirklich zu definieren. Wir werden uns dabei auf rechnerische Aspekte konzentrieren, und alle Definitionen werden entsprechend so gehalten das sich mit ihnen die üblichen Beispiele einfach behandeln lassen. Als ersten Schritt müssen wir in diesem Abschnitt erst einmal spezifizieren welche zweidimensionalen Teilmengen des R 3 wir als Integrationsbereiche zulassen wollen. Zum Aufbau einer systematischen Theorie wäre es günstig zweidimensionale C 1 -Untermannigfaltigkeiten des R 3, beziehungsweise Jordanmeßbare Teilmengen solcher Untermannigfaltigkeiten, zu verwenden. Das macht die Theorie zwar schön einfach, hat aber den Nachteil das sich viele wichtige Beispieltypen, wie etwa der Rand eines Würfels, nicht direkt behandeln lassen. Um auch diese zu erfassen, muss dann noch ein weiterer Näherungsschritt durchgeführt werden. Wir werden dieses Problem umgehen indem wir erst Flächenstücke definieren, das sind im wesentlichen Teilmengen zweidimensionaler Untermannigfaltigkeiten, und allgemeine Flächen dann aus endlich vielen solchen Flächenstücken zusammensetzen. Wir werden also zuerst Flächenstücke definieren. Ein jedes solches Flächenstück soll sich durch eine einzelne Parametrisierung beschreiben lassen. Dabei ist es allerdings ungünstig einfach den Parametrisierungsbegriff des 3 zu verwenden, da wir zum Beispiel eine Kugeloberfläche nicht mit einer einzelnen Parametrisierung erfassen können. In 3 mussten Parametrisierungen ja immer auf einer offenen Menge definiert und dort injektiv sein, wir könnten also für die Oberfläche der Einheitskugel im R 3 etwa die Parametrisierung ϕ(φ, ψ) = (cos φ sin ψ, sin φ sin ψ, cos ψ) 252

253 Mathematik für Physiker III, WS 212/213 Dienstag durch Kugelkoordinaten verwenden, diese wäre dann aber auf (, 2π) (, π) definiert und erfasst damit nicht alle Punkte auf der Oberfläche, es fehlt der Teil der Oberfläche in der Halbebene R {} R. Um mit einer Parametrisierung auszukommen, werden wir daher nur verlangen das im Inneren des Definitionsbereichs eine Parametrisierung einer Untermannigfaltigkeit vorliegt. Damit können wir die Funktion ϕ im Kugelbeispiel auf [, 2π] [, π] definieren und erreichen damit alle Punkte auf der Kugeloberfläche. Nun tritt aber ein weiteres technisches Problem auf, wir wollen verlangen das Parametrisierungen stetig differenzierbar sind, aber Differenzierbarkeit wurde in II. 8 nur für Funktionen definiert die auf offenen Teilmengen eines R n definiert sind. Um auch dieses Problem zu beseitigen, fordern wir das ϕ auf einer offenen Obermenge von [, 2π] [, π] definiert und dort stetig differenzierbar ist. Dies führt uns schließlich auf die folgende Definition. Definition 8.1: Sei F R 3 eine Teilmenge. Weiter seien U R 2 offen, ϕ : U R 3 stetig differenzierbar und U R 2 offen und Jordan-meßbar mit U U. Wir nennen F ein Flächenstück mit Parametrisierung ϕ U wenn F = ϕ(u) gilt und ϕ U eine Parametrisierung einer zweidimensionalen C 1 -Untermannigfaltigkeit F des R 3 ist. Insbesondere sind die Mengen U und F = ϕ(u) dann kompakt und F = F. Die Definition sieht zwar recht kompliziert aus, und ist für theoretische Fragestellungen auch etwas unhandlich, sie hat aber den Vorteil alle üblichen Beispiele von Flächen mit einer einzigen Parametrisierung abzudecken. Wir schauen uns jetzt einige dieser Beispiele an. 1. Als erstes Beispiel betrachten wir die Oberfläche F einer Kugel mit Radius r > und Mittelpunkt z R 3. Um diese zu parametrisieren verwenden wir die stetig differenzierbare Abbildung ϕ : R 2 R 3 ; (φ, ψ) z 1 + r cos φ sin ψ z 2 + r sin φ sin ψ z 3 + r cos ψ also U = R 2 in der Notation der Definition und weiter sei U := (, 2π) (, π). Dann wird F zu einem Flächenstück mit der Parametrisierung ϕ [, 2π] [, π]. Dass die Einschränkung ϕ U eine Parametrisierung einer zweidimensionalen C 1 -Untermannigfaltigkeit des R 3 ist, folgt zum Beispiel aus 3.Lemma 3 da wir bereits wissen das die ganze Kugeloberfläche eine zweidimensionale C - Untermannigfaltigkeit des R 3 ist und die beiden partiellen Ableitungen von ϕ auf U nach 1.2 überall linear unabhängig sind. 2. Nun betrachten wir die Mantelfäche F eines Zylinders mit Radius r > und der z-achse als Symmetrieachse. Da wir eine kompakte Menge benötigen beschränken wir die z-koordinaten auf ein kompaktes Intervall, also, F = {(x, y, z) R 3 x 2 + y 2 = r 2, a z b}. 253

254 Mathematik für Physiker III, WS 212/213 Dienstag Als Parametrisierung können wir ϕ : [, 2π] [a, b] R 3 ; (φ, z) verwenden, wie beispielsweise aus Aufgabe (17) folgt. r cos φ r sin φ z 3. Etwas allgemeiner können wir Rotationsflächen im R 3 betrachten. Gegeben sei sei eine stetig differenzierbare Funktion f : [a, b] R mit f(x) > für a < x < b. Dann betrachten wir die Rotationsfläche mit der Parametrisierung R f := {(x, y, z) R 3 a z b, x 2 + y 2 = f(z) 2 } ϕ : [, 2π] [a, b] R 3 ; (φ, z) f(z) cos φ f(z) sin φ z Dass hier wirklich eine Parametrisierung vorliegt folgt dabei wieder mit Aufgabe (17). 4. Als letztes Beispiel betrachten wir Funktionsgraphen. Seien hierzu V R 2 offen, f : V R stetig differenzierbar und U R 2 offen und Jordan-meßbar mit U V. Dann ist F := {(x, y, f(x, y)) (x, y) U} ein Flächenstück mit der Parametrisierung ϕ : U R 3 ; (x, y) x y f(x, y) Um zu zeigen das auch hier eine Parametrisierung vorliegt verwendet man das in 3 behandelte Beispiel von Funktionsgraphen als Untermannigfaltigkeiten. Allgemeine Flächen entstehen durch Zusammensetzen endlich vieler Flächenstücke. Dabei müssen wir fordern das sich die einzelnen Flächenstücke nur in ihren Rändern scheiden. Da wir den Begriff des Rands eines Flächenstücks jetzt nicht einführen wollen, formulieren wir diese Bedingung in Termen Jordanscher Nullmengen. Definition 8.2: Eine Teilmenge F R 3 heißt eine Fläche wenn es endlich viele Flächenstücke F 1,..., F r R 3 mit Parametrisierungen ϕ i von F i für 1 i r gibt so, dass F = F 1... F r gilt und für alle 1 i, j r mit i j die Menge ϕ 1 i (F j ) eine Jordansche Nullmenge ist. Ein Beispiel für eine Fläche ist der Rand eines Würfels im R 3, diesen können wir als die Vereinigung von sechs Flächenstücken, nämlich seinen sechs Seitenflächen, schreiben. Rein formal wären auch Objekte wie zwei sich im Inneren schneidende Rechtecke Flächen im Sinne der obigen Definition, an derartigen Objekten werden wir aber nicht interessiert sein

255 Mathematik für Physiker III, WS 212/213 Dienstag Flächenintegrale erster Art Damit haben wir die als Integrationsbereiche verwendeten Flächen definiert und kommen nun zum skalaren Flächenintegral. Wir werden dieses zunächst für Flächenstücke und anschließend für allgemeine Flächen definieren. Die Flächenintegrale erster Art sind die direkte Verallgemeinerung der Kurvenintegrale erster Art auf den zweidimensionalen Fall, also auf Flächen. Um diese einzuführen setzen wir unsere Überlegung zu Beginn dieses Kapitels fort. Gegeben sei also eine dünne Platte P im R 3, die wir uns jetzt als ein Flächenstück mit einer Parametrisierung ϕ : B R 3 denken. Weiter sei ϱ eine Ladungsdichte auf P. Der Einfachheit halber nehmen wir an, dass der Definitionsbereich B unserer Parametrisierung ϕ ein Rechteck ist. Dieses zerteilen wir dann in Teilrechtecke B 1,..., B r und zerlegen das Flächenstück.8.7 P entsprechend in die Bilder P i = ϕ(b i ). Wir hatten uns überlegt, dass die von P auf eine Ladung.6 q im Punkt x R 3 bewirkte Kraft näherungsweise.5 gleich F q 4πɛ r i=1 ϱ i y i x 3 (y i x)a i ist. Wir können annehmen das y i = ϕ(u i ) das Bild der linken unteren Ecke u i von B i ist. Die Seitenlängen des Rechtecks B i seien mit a, b > bezeichnet bv v b B i ϕ u au u i a y i P i Approximiere jetzt ϕ auf dem Rechteck B i durch die Ableitung von ϕ in u i, also ( ( )) t ϕ u i + y s i + t ϕ x (u i) + s ϕ y (u i), wobei wir das Rechteck B i mit t a, s b durchlaufen. Schreiben wir u := ϕ/ x(u i ), v := ϕ/ y(u i ) für die beiden Tangentialvektoren, so wird dies zu 255

256 Mathematik für Physiker III, WS 212/213 Dienstag ϕ(u i + (t, s)) y i + tu + sv. Somit ist das Flächenstück P i = ϕ(b i ) = { ( ( t ϕ u i + s )) t a, s b} {y i + tu + sv t a, s b}, und die rechte Seite ist hier gerade das von den Vektoren a u und b v bei y i aufgespannte Parallelogram. Damit wird auch der Flächeninhalt von A i näherungsweise gleich dem Flächeninhalt dieses Parallelograms. Wie wir schon in I bei der Einführung des Vektorprodukts gesehen hatten, ist die Fläche unseres Parallelograms gleich der Länge des Vektorprodukts der beiden linear unabhängigen Vektoren au und bv, also A i (au) (bv) = ab u v = ϕ x (u i) ϕ y (u i) vol(b i) da ab ja auch die Fläche des Rechtecks B i ist. Der Beitrag von P i zur Kraft F ist also im wesentlichen gleich dieser Zahl mal unser Integrand, und summieren wir alle Teile unserer Zerlegung P 1,..., P r von P auf, so wird F q 4πɛ r ϱ i y i x (y 3 i x) ϕ x (u i) ϕ y (u i) vol(b i). i=1 Auf der rechten Seite steht hier jetzt aber eine Riemannsumme des Integrals ϱ(ϕ(u)) (ϕ(u) x) ϕ ϕ ϕ(u) x 3 (u) x y (u) du, B und lassen wir die Zerlegung von B in B 1,..., B r immer feiner werden, so sollten die Riemannsummen auf der rechten Seite gegen das eben hingeschriebene Integral konvergieren. Das Flächenintegral erster Art muss also wie folgt definiert werden: Definition 8.3: Seien F R 3 ein durch ϕ : A R 3 parametrisiertes Flächenstück und f : F R eine stetige Funktion. Das skalare Flächenintegral von f über F ist dann f(x) dx := f(ϕ(x, y)) ϕ ϕ (x, y) (x, y) x y d(x, y). Weiter nennen wir die Zahl F die Fläche von F. A A(F ) := Als kontinuierliche Form des Coulombschen Gesetzes erhalten wir damit F = q ϱ(y) (y x) dy, 4πɛ y x 3 P 256 F dx

257 Mathematik für Physiker III, WS 212/213 Freitag wobei dieses Integral ein komponentenweise interpretiertes skalares Flächenintegral ist. Wir wollen einige Beispiele rechnen und beginnen mit der Kugeloberfläche F mit Radius R > und Mittelpunkt in z = (a, b, c), und verwenden erneut die Parametrisierung ϕ(φ, ψ) = (a + R cos φ sin ψ, b + R sin φ sin ψ, c + R cos ψ) mit φ 2π, ψ π. Die Tangentenvektoren ergeben sich als ϕ φ =, ϕ ψ = R sin φ sin ψ R cos φ sin ψ R cos φ cos ψ R sin φ cos ψ R sin ψ und als ihr Vektorprodukt erhalten wir ϕ φ ϕ ψ = R 2 cos φ sin 2 ψ R 2 sin φ sin 2 ψ R 2 sin ψ cos ψ = R 2 sin ψ cos φ sin ψ sin φ sin ψ cos ψ mit der Länge ϕ φ ϕ ψ = R2 sin ψ. Aufgrund des Minuszeichens zeigen diese Vektoren in Richtung des Kugelmittelpunkts. Das skalare Flächenintegral einer Funktion f über die Kugeloberfläche F hat also die explizite Form f(p) dσ(p) = R 2 f(ϕ(φ, ψ)) sin ψ d(φ, ψ). F [,2π] [,π] Verwenden wir f = 1, so erhalten wir die Fläche von F als π A(F ) = 2πR 2 sin ψ dψ = 4πR 2, und dies ist genau die bekannte Formel für die Kugeloberfläche. Vorlesung 22, Freitag In der letzten Sitzung hatten wir die Flächenintegrale erster Art eingeführt, gegeben ist bei diesen ein Flächenstück F R 3 mit einer Parametrisierung ϕ : A R 3 wobei A R 2 eine kompakte, Jordan-meßbare Teilmenge des R 2 ist. Etwas genauer war A = U mit einer offenen Jordan-meßbaren Menge U R 2 und ϕ U ist die Parametrisierung 257

258 Mathematik für Physiker III, WS 212/213 Freitag einer zweidimensionalen C 1 -Untermannigfaltigkeit des R 3. Ist dann weiter f : F R eine stetige Funktion, so hatten wir das skalare Flächenintegral von f über F als f(x) dx := f(ϕ(u)) ϕ ϕ (u) x y (u) du F A definiert. Da auf der rechten Seite eine stetige Funktion über eine Jordan-meßbare Menge integriert wird ist dieses Integral nach 4.Korollar 15 dabei überhaupt definiert. Verwenden wir für f die Funktion konstant gleich Eins, so ergibt das skalare Flächenintegral gerade die Fläche des Flächenstücks F. Wie am Ende der letzten Sitzung rechnen wir jetzt ein Beispiel bei dem das Flächenstück F die Oberfläche der Kugel mit Radius R > und Mittelpunkt z R 3 ist. Für dieses Flächenstück hatten wir die Parametrisierung ϕ : [, 2π] [, π] R 3 ; (φ, ψ) z 1 + R cos φ sin ψ z 2 + R sin φ sin ψ z 3 + R cos ψ verwendet und hatten bereits die Formeln ϕ φ ϕ cos φ sin ψ ψ = R2 sin ψ sin φ sin ψ cos ψ und ϕ φ ϕ ψ = R2 sin ψ für alle φ [, 2π], ψ [, π] festgehalten. Beachte das die beiden Tangentenvektoren ϕ/ x, /ϕ/ y für ψ = und ψ = π linear abhängig werden und das Vektorprodukt Null ist, unsere Definition einer Parametrisierung haben wir genau so eingerichtet das so etwas noch erlaubt ist. Nur in der offenen Mengen (, 2π) (, π) liegt die Parametrisierung einer C 1 -Untermannigfaltigkeit vor. Wir wollen jetzt auch einmal ein Beispiel eines skalaren Flächenintegrals behandeln bei dem eine nicht konstante Funktion integriert wird. Konkret wollen wir die Funktion f(x, y, z) = x 2 +y 2 +z 2 über unsere Kugeloberfläche F integrieren. Für alle φ 2π, ψ π haben wir f z 1 + R cos φ sin ψ z 2 + R sin φ sin ψ z 3 + R cos ψ = R 2 +z 2 1 +z 2 2 +z R(z 1 cos φ sin ψ+z 2 sin φ sin ψ+z 3 cos ψ), und wegen 2π sin φ dφ = 2π cos φ dφ = und π sin ψ cos ψ dψ = folgt F π f(x) dx = 2πR 2 (R 2 + z1 2 + z2 2 + z3) 2 sin ψ dψ = 4πR 2 (R 2 + z1 2 + z2 2 + z3) 2 = 4πR 2 (R 2 + z 2 ). 258

259 Mathematik für Physiker III, WS 212/213 Freitag Als nächstes Beispiel wollen wir uns skalare Flächenintegrale über Rotationsflächen anschauen. Gegeben seien also a, b R mit a < b und eine stetig differenzierbare Funktion f : [a, b] R mit f(x) > für a < x < b. Dann betrachten wir die zugehörige Rotationsfläche R f und hatten bereits in der letzten Sitzung die Parametrisierung ϕ : [, 2π] [a, b] R 3 ; (φ, z) (f(z) cos φ, f(z) sin φ, z) von R f angegeben. Als Tangentialvektoren erhalten wir für alle φ 2π, a z b ϕ φ =, ϕ z = f(z) sin φ f(z) cos φ und deren Vektorprodukt ergibt sich als ϕ φ ϕ f(z) cos φ z = f(z) sin φ f(z)f (z) = f(z) f (z) cos φ f (z) sin φ 1 cos φ sin φ f (z) Dieser Vektor zeigt übrigens von der z-achse weg. Die Länge des Vektors ist ϕ φ ϕ z = f(z) 1 + f (z) 2, und die Formel für Flächenintegrale über R f ergibt sich für jede stetige Funktion g : R f R als g(x) dx = g(f(z) cos φ, f(z) sin φ, z)f(z) 1 + f (z) 2 d(φ, z). R f [,2π] [a,b] Setzen wir speziell die Funktion g konstant Eins ein, so erhalten wir die Flächenformel A(R f ) = 2π b a f(z) 1 + f (z) 2 dz. Als konkretes Beispiel nehmen wir das Paraboloid P gegeben durch die Gleichung z = x 2 + y 2, etwa für z h. Dieses ist eine Rotationsfläche P = R f bezüglich der Funktion f(z) = z und da für alle z h stets f(z) 1 + f (z) 2 = z z = 1 + 4z gilt wird die Formel für Flächenintegrale erster Art über dieses Paraboloid zu g(x) dx = 1 g( z cos φ, z sin φ, z) 1 + 4z d(φ, z). 2 P [,2π] [,h]

260 Mathematik für Physiker III, WS 212/213 Freitag Somit ergibt sich die Fläche h π A(P ) = π 1 + 4z dz = (1 + 4z)3/2 6 h = π 6 ((1 + 4h)3/2 1), und als ein Beispiel für einen nicht konstanten Integranden verwenden wir die Funktion f(x, y, z) = x 2 z, deren Flächenintegral über das Paraboloid sich als P x z d(x, y, z) = 1 2 = π h 1 [,2π] [,h] z 2 cos 2 φ 1 + 4z d(φ, z) = π 2 u 1/2 2u 3/2 + u 5/2 du = h z z dz π ( (1 + 4h) 3/2 (3h 2 6h + 1) 1 ) 84 ergibt. Als ein ein weiteres Beispiel schauen wir uns Funktionsgraphen an. Gegeben seien also offene Mengen U, V R 2 mit A := U V und eine stetig differenzierbare Funktion f : V R, wobei die Menge U Jordan-meßbar sei. Dann ist der Graph F := {(x, y, f(x, y)) (x, y) A} eine Fläche mit der Parametrisierung ϕ : A R 3 ; (x, y) (x, y, f(x, y)). Für alle (x, y) A haben wir ϕ (x, y) = x f x 1, (x, y) ϕ (x, y) = y und als Vektorprodukt ergibt sich ϕ x ϕ f (x, y) y = x f (x, y) mit ϕ y x ϕ y = A f y 1, (x, y) Die Fläche solch eines Graphen ist also gegeben als ( ) 2 ( ) 2 f f A(F ) = d(x, y). x y ( ) 2 f + x ( ) 2 f. y Schauen wir uns beispielsweise noch einmal das Paraboloid P des obigen Beispiels an. Ist A := B h (), so können wir P auch als den Graphen der Funktion f(x, y) = x2 +y 2 auf A interpretieren. Verwenden wir diese Darstellung, so ergibt sich die Fläche von P durch Transformation auf Polarkoordinaten gemäß 5 als A(P ) = 1 + 4x2 + 4y 2 d(x, y) B h () = r 1 + 4r 2 d(r, φ) = π h 6 (1 + 4r2 ) 3/2 = π 6 ((1 + 4h)3/2 1), [, h] [,2π] 26

261 Mathematik für Physiker III, WS 212/213 Freitag also dasselbe Ergebnis das sich auch über die Darstellung als Rotationsfläche ergeben hatte. Dies ist eine gute Gelegenheit auf ein bisher unterschlagenes Detail hinzuweisen. Wir sprechen vom Flächenintegral erster Art über das Flächenstück F, in der Definition dieses Integrals geht dann allerdings die spezielle Parametrisierung ϕ dieses Flächenstücks ein. Streng genommen müssten wir uns überlegen das das Ergebnis von der speziell gewählten Parametrisierung unabhängig ist. Eine solche Unabhängigkeitsaussage wird in Aufgabe (52) bewiesen, diese Aufgabe erfasst allerdings nicht alle möglichen Parametrisierungen. Tatsächlich ist unsere Definition der Parametrisierung von Flächenstücken für solche theoretischen Fragen etwas unhandlich, wir hatten ja schon früher angemerkt das die gewählte Definition hauptsächlich rechnerischen Zwecken dient. Für eine exakte Behandlung der Flächenintegrale ist es unter Verwendung unserer Definition am geschicktesten, die Flächenstücke nicht als Teilmengen F des R 3 zu interpretieren, sondern wie bei den Kurvenintegralen die Parametrisierung selbst als Flächenstück zu bezeichnen. Da wir in diesem Kapitel aber nicht an der Theorie interessiert sind, wollen wir derartige Fragen im folgenden ignorieren. Wir kommen lieber zum nächsten Schritt unserer Definition von Flächenintegralen und dehnen diese jetzt auf den Fall einer allgemeinen, aus mehreren Flächenstücken zusammengesetzten, Fläche aus. Definition 8.4: Sei F R 3 eine Fläche und schreibe F als eine Vereinigung F = F 1... F r endlich vieler Flächenstücke F i mit Parametrisierung ϕ i für 1 i r so, dass ϕ 1 i (F j ) für alle 1 i, j r mit j i stets eine Jordansche Nullmenge ist. Ist dann f : F R eine stetige Funktion, so definiere das skalare Flächenintegral von f über F als r f(x) dx := f(x) dx. F F i i=1 Die Bedingung an die Parametrisierungen ist nötig, andernfalls könnten sich zwei verschiedene z der Flächenstücke F i und F j mit 1 i < j r so schneiden, dass F i F j bezüglich der Parametrisierungen von F i und von F j positives Volumen C y hat, dann würde das Integral von f über F h i F j in beiden Summanden F i f(x) dx und F j f(x) dx auftauchen und damit doppelt, oder gar noch häufiger, gezählt werden. Streng genommen müssten wir uns hier auch überlegen ob unser Integral von gewählten Zerlegung der Fläche F unabhängig ist, aber dieses Problem wollen wir, wie schon bei den Flächenstücken, ignorieren. Wir wollen jetzt ein Beispiel mit einer solchen zusammengesetzten r x Fläche rechnen. Hierzu betrachten wir erst einmal einen Kegel C der Höhe h >, des- 261

262 Mathematik für Physiker III, WS 212/213 Freitag sen Grundfläche ein Kreis mit r > und Mittelpunkt in (, ) ist. Die Fläche F soll der Rand F = C von C sein. Der Rand F setzt sich hier aus zwei Flächenstücken zusammen, einmal die untere Kreisscheibe F 1 in der (x, y)-ebene, die wir beispielsweise durch sich selbst parametrisieren können, also ϕ 1 : A 1 := {(x, y) R 2 x 2 + y 2 r 2 } R 3 definiert als x ϕ 1 (x, y) = y mit ϕ 1 x = e 1, ϕ 1 y = e 2, ϕ 1 x ϕ 1 y = e 3. Das zweite Flächenstück F 2 ist die Mantelfläche des Kegels. Diese können wir als Rotationsfläche F 2 = R f der Funktion ( f : [, h] R ; z r 1 z ) h beschreiben. Integrieren wollen wir die Funktion ϱ(x, y, z) := x 2 + z. Nach Definition ist ϱ(p) dp = F ϱ(p) dp + F 1 ϱ(p) dp. F 2 Das erste Teilintegral ist einfach ein ganz normales ebenes Riemannintegral über unseren Kreis F 1 in der (x, y)-ebene, und ergibt sich als ϱ(x, y, z) d(x, y, z) = F 1 x 2 d(x, y) = A 1 s 3 cos 2 φ d(s, φ) [,r] [ π,π] ( r ) ( π = s 3 ds π ) cos 2 φ dφ = 1 4 πr4. Dies ist übrigens ein allgemeines Phänomon, liegt unser Flächenstück in der xy-ebene, so ist das skalare Flächenintegral über das Flächenstück ein ganz normales ebenes Riemanintegral über das dasselbe Flächenstück. Entsprechendes gilt dann auch für Flächenstücke in der xz- oder der yz-ebene. Das Integral über die Mantelfläche des Kegels C berechnet sich als ϱ(p) dp = ϱ(f(z) cos φ, f(z) sin φ, z)f(z) 1 + f (z) 2 d(φ, z) F 2 = = [,2π] [,h] 1 + r2 h 2 [,2π] [,h] ( r2 + h [πr 2 3 h h 4 = πr r 2 + h 2 [ r h 3 [f(z) 3 cos 2 φ + zf(z)] d(φ, z) ( 1 z h ]. 262 ) ) 4 h + 2π ( r 2 z2 h r 3h z3 )] h

263 Mathematik für Physiker III, WS 212/213 Freitag Insgesamt ist damit F ( r 3 ϱ(p) dp = πr 4 + r2 r2 + h h ) r2 + h Flächenintegrale zweiter Art Wir kommen jetzt zu den vektoriellen Flächenintegralen oder Flächintegralen zweiter Art. Wie bei den skalaren Flächenintegralen wollen wir erst einmal eine typische Situation besprechen in der solche Integrale auftreten. Gegeben sei ein stetiges Vektorfeld G etwa definiert auf einer offenen Menge U R 3. Wir denken uns G als das Geschwindigkeitsfeld einer die Menge U ausfüllenden Flüssigkeit, d.h. der Vektor G(p) in einem Punkt p U sei der Geschwindigkeitsvektor der Flüssigkeit im Punkt p zu einem im folgenden fixierten Zeitpunkt. Weiter betrachten wir ein Flächenstück F U. Das vektorielle Flächenintegral G(x) dx soll dann der Fluß von G durch das Flächenstück F F zu unserem gegebenen Zeitpunkt sein. Um zu sehen wie dieser Fluß zu berechnen ist, sei ϕ : V R 3 eine Parametrisierung von F und betrachte erst einmal einen einzelnen Punkt p F, wobei F = ϕ(v ) ist. Da G stetig ist, können wir G nahe bei p als näherungsweise konstant gleich G(p) annehmen. Ist weiter E die Tangentialebene an F im Punkt p, so können wir die Fläche F nahe bei p durch die Ebene E approximieren. Dann ist die in einem kleinen Zeitintervall durch diese kleine Umgebung von p in F fließende Flüssigkeitsmenge näherungsweise das Skalarprodukt von G(p) mit dem Normalenvektor n(p) auf E im Punkt p multipliziert mit der Dauer des Zeitintervalls und der Fläche des kleinen Flächenstücks bei p. Der Fluß durch den Punkt p wird damit zu G(p) n(p). Um dann den Fluß durch die gesamte Fläche F zu erhalten müssen wir diese Größe über F integrieren, also das skalare Flächenintegral Fluß durch F = F G(p) n(p) dp bilden. Beachte das der Normalenvektor n(p) nicht ganz eindeutig festliegt, es gibt für diesen zwei Möglichkeiten die sich durch ein Vorzeichen unterscheiden. Einer dieser beiden wird von uns als n(p) ausgewählt, für den Fluß durch die Fläche F bedeutet dies das wir vorgeben müssen welche Flußrichtung wir positiv zählen wollen und welche negativ. Wird der Punkt p variiert, so müssen die gewählten Normalenvektoren n(p) zusammenpassen, wir wollen das n(p) eine stetige Funktion von p ist. Die getroffene Auswahl der Normalenvektoren n(p) nennt man eine Orientierung des Flächenstücks F. Wir können unsere obige Formel für den Fluß durch F noch weiter auswerten und uns dabei auch die Gestalt der möglichen Orientierungen von F überlegen. Sei wieder 263 n(p) p Tp

264 Mathematik für Physiker III, WS 212/213 Freitag p F. Die Tangentialebene E von F in p ist nach 3.Satz 4.(b) als ϕ ϕ E = p + (q), x y (q) gegeben, wobei q V mit p = ϕ(q) der dem Punkt p entsprechende Parameter sei. Der Normalenvektor n(p) in p muss also senkrecht auf den beiden Tangentialvektoren ϕ/ x und ϕ/ y sein, und damit ist n(p) wie in I besprochen ein Vielfaches des Vektorprodukts dieser beiden Vektoren. Wegen q V sind die beiden Tangentenvektoren dabei linear unabhängig und ihr Vektorprodukt ist somit von Null verschieden. Folglich ist n(p) bis auf das Vorzeichen gleich dem auf Länge 1 normierten Vektorprodukt der beiden Tangentenvektoren. Dass n(p) stetig von p abhängt bedeutet dann das dieses Vorzeichen ebenfalls stetig in p ist, also entweder durchgehend Minus oder durchgehend Plus ist. Dabei nehmen wir stillscheigend an, dass der Parameterbereich V zusammenhängend ist, andernfalls könnte auf verschiedenen Komponenten von V ein unterschiedliches Vorzeichen vorkommen. In diesem zusammenhängenden Fall ist die Wahl einer Orientierung von F also gleichwertig zur Wahl eines Vorzeichens, und dies führt uns auf die folgende Definition orientierter Flächenstücke. Definition 8.5: Sei F R 3 ein Flächenstück versehen mit einer Parametrisierung ϕ : U R 3. Für jedes p U definieren wir den Normalenvektor von F bezüglich ϕ in ϕ(p) als ϕ ϕ (p) x y n ϕ (ϕ(p)) := (p) ϕ ϕ. (p) (p) x y Weiter nennen wir F ein orientiertes Flächenstück wenn für jeden Punkt p ϕ(u) ein Vektor n(p) R 3, genannt der Normalenvektor des orientierten Flächenstücks F in p, gegeben ist so, dass entweder n(p) = n ϕ (p) für alle p ϕ(u) oder n(p) = n ϕ (p) für alle p ϕ(u) gilt. Im ersten Fall nennen wir die Parametrisierung ϕ positiv und im zweiten Fall nennen wir sie negativ. Ausgestattet mit diesem Begriff können wir jetzt unsere Diskussion zur Berechnung des Flusses des Vektorfelds G durch das Flächenstück F fortsetzen. Dabei wird F als orientiert mit den Normalenvektoren n(p) für p F angenommen. Bezeichnet ϕ : A F weiterhin die Parametrisierung von F, und setzen wir in das Flußintegral G(p) n(p) dp sowohl die Beschreibung des Normalenvektors n(p) als n(p) = ±n F ϕ(p) als auch die Definition des skalaren Flächenintegrals ein, so ergibt sich Fluß durch F = G(p) n(p) dp F ϕ ϕ (x, y) (x, y) x y = ± G(ϕ(x, y)) A ϕ ϕ (x, y) (x, y) ϕ ϕ (x, y) (x, y) x y d(x, y) x y = ± G(ϕ(x, y)) ϕ ϕ (x, y) (x, y) d(x, y), x y A 264

265 Mathematik für Physiker III, WS 212/213 Freitag wobei das Vorzeichen bei einer positiven Parametrisierung ϕ Plus und bei einer negativen Parametrisierung ϕ Minus ist. Streng genommen müsste im mittleren Integral dabei über das Innere V von A integriert werden, da die beiden Tangentenvektoren auf dem Rand von A ja linear abhängig werden können, da A aber nach 4.Satz 14 eine Jordansche Nullmenge ist spielt dies keine Rolle. Im Endergebnis tritt dieses Problem dann nicht mehr auf, da sowieso keine Division durch die Länge des Vektorprodukts mehr stattfindet. Dieses Endergebnis verwenden wir jetzt als unsere Definition des Flächenintegrals zweiter Art. Definition 8.6: Seien F R 3 ein orientiertes Flächenstück mit einer Parametrisierung ϕ : A F und G : F R 3 ein stetiges Vektorfeld. Das Flächenintegral zweiter Art von G über F ist dann definiert als G(x) dx := G(ϕ(u)) ϕ ϕ (u) x y (u) du F F wenn die Parametrisierung ϕ von F positiv ist und G(x) dx := G(ϕ(u)) ϕ ϕ (u) x y (u) du wenn die Orientierung ϕ von F negativ ist. A A Wir wollen zwei kleine Beispiele zum Flächenintegral zweiter Art rechnen. Als orientierte Fläche verwenden wir in beiden Beispielen die Oberfläche F einer Kugel mit Radius R > und Mittelpunkt in, wobei die Normalenvektoren auf F vom Nullpunkt wegzeigend orientiert sein sollen. Wie schon in unseren Beispielen zu den Flächenintegralen erster Art verwenden wir die Parametrisierung ϕ(φ, ψ) = (R cos φ sin ψ, R sin φ sin ψ, R cos ψ) definiert auf A = [, 2π] [, π], und das Vektorprodukt der Tangentenvektoren dieser Parametrisierung hatten wir bereits als ϕ φ ϕ cos φ sin ψ ψ = R2 sin ψ sin φ sin ψ cos ψ berechnet. Diese Vektoren zeigen aber gerade zum Nullpunkt hin, d.h. die Parametrisierung ϕ ist negativ. Als ein erstes Beispiel wollen wir einmal das Vektorfeld G(x, y, z) := y x + x y + z z über die Kugeloberfläche F integrieren. Dann haben wir G(φ, ψ) ϕ φ ϕ R sin φ sin ψ = R 2 sin ψ R cos φ sin ψ ψ R cos ψ cos φ sin ψ sin φ sin ψ cos ψ = R 3 (sin(2φ) sin 3 ψ + sin ψ cos 2 ψ) 265

266 Mathematik für Physiker III, WS 212/213 Freitag für alle (φ, ψ) A, also wird der Fluß von G durch die Kugeloberbläche F zu F y x z d(x, y, z) = R 3 [,2π] [,π] (sin(2φ) sin 3 ψ + sin ψ cos 2 ψ) d(φ, ψ) ( = 2πR 3 cos3 π) ψ 3 = 4 3 πr3 da 2π sin(2φ) dφ = ist. Das Vorzeichen wurde dabei entfernt da unsere Parametrisierung ϕ von F negativ ist. Als ein zweites Beispiel nehmen wir das Vektorfeld Der Integrand ergibt sich diesmal als G(x, y, z) := x x + 2y y z z. G(φ, ψ) ϕ φ ϕ = R 3 ((cos 2 φ + 2 sin 2 φ) sin 3 ψ cos 2 ψ sin ψ) ψ = R 3 ((1 + sin 2 φ) sin 3 ψ cos 2 ψ sin ψ) und wegen 2π π (1 + sin 2 φ) dφ = 2π + π π ( φ sin φ cos φ 2 2π ) = 3π, sin 3 ψ dψ = sin ψ sin ψ cos 2 ψ dψ = cos3 ψ 3 cos 2 ψ sin ψ dψ = cos3 π ψ 3 = 2 3 wird das vektorielle Flächenintegral insgesamt zu x 2y d(x, y, z) = 8 F 3 πr3. z cos ψ π = 4 3, Wie schon im vorigen Abschnitt beim Flächenintegral erster Art dehnen wir jetzt auch die Definition des vektoriellen Flächenintegrals auf beliebige, also aus mehreren Flächenstücken zusammengesetzte, Flächen aus. Der einzige Unterschied zum skalaren Fall ist, dass wir in der vektoriellen Version orientierte Flächenstücke zusammensetzen müssen. Definition 8.7: Eine orientierte Fläche F R 3 ist ist eine Vereinigung F = F 1... F r endlich vieler orientierter Flächenstücke F i mit Parametrisierung ϕ i für 1 i r so, dass ϕ 1 i (F j ) für alle 1 i, j r mit i j stets eine Jordansche Nullmenge ist. Ist 266

267 Mathematik für Physiker III, WS 212/213 Freitag G : F R 3 dann ein stetiges Vektorfeld, so wird das Flächenintegral zweiter Art von G über F als r G(x) dx := G(x) dx F i definiert. F Es gibt einen besonders wichtigen Spezialfall der vorigen Definition, der nun auch noch einen eigenen Namen erhält. Dieser liegt vor wenn die orientierte Fläche F der Rand eines Körpers A im R 3 ist. Anschaulich ist dann klar, dass für jeden Punkt p F = A in dem F einen Tangentialraum hat, einer der beiden Normalenvektoren auf F in p aus dem Körper A herauszeigt und der andere nach A hineinzeigt. Die Fläche F soll dann so orientiert sein, dass für jeden solchen Punkt p F als n(p) gerade der aus A herauszeigende Normalenvektor gewählt wird. Streng genommen ist dies eigentlich keine mathematische Definition, da man hierzu wirklich beweisen müsste das stets einer der Normalenvektoren nach A hinein und der andere aus A heraus zeigt. Schlimmer noch man müsste erst einmal definieren was nach A hineinzeigen beziehungsweise aus A heraus zeigen überhaupt bedeutet. Da wir, wie schon mehrfach erwähnt, hier hauptsächlich an rechnerischen Fragen interessiert sind, wollen wir auf derartige Probleme nicht eingehen, in allen Beispielsituation wird immer völlig klar sein welcher der aus dem Körper herauszeigende Normalenvektor ist. Definition 8.8: Wir nennen eine kompakte, Jordan-meßbare Teilmenge B R 3 einen Standardkörper wenn B = U für eine offene, zusammenhängende Menge U R 3 gilt und der Rand B von B eine Fläche im R 3 ist. Dann können wir B als eine orientierte Fläche auffassen indem jedes der einzelnen Flächenstücke in B mit aus B herauszeigenden Normalenvektor orientiert wird. Ist weiter G : B R 3 ein stetiges Vektorfeld, so definieren wir das Oberflächenintegral von G über den Rand von B als G(x) dx := G(x) dx. B i=1 B Beachte das hier kein wirklich neuer Integraltyp definiert wird, das Symbol soll nur explizit darauf hinweisen das die betrachtete Fläche geschlossen, also Rand eines Standardkörpers, ist. Unsere beiden obigen Beispiele können wir dann auch als Oberflächenintegrale für die Kugel B = B R () schreiben, also y x + x y + z z d(x, y, z) = 4 3 πr3 und B B x x + 2y y z z d(x, y, z) = 8 3 πr3. $Id: rot.tex,v /1/22 15:5:22 hk Exp $ 267

268 Mathematik für Physiker III, WS 212/213 Freitag Rotation und Divergenz In diesem Kapitel wollen wir die verschiedenen klassischen Integralsätze, also den Gaußschen Divergenzsatz im R 2 und im R 3, den Satz von Stokes und die Greensche Formel im R 2 besprechen. All diese Sätze stellen Zusammenhänge zwischen Riemannintegralen im R 2 und im R 3 und zwischen vektoriellen Kurvenintegralen und vektoriellen Flächenintegralen her. Wir werden keine vollständigen Beweise dieser Sätze angeben, sondern uns auf Plausibilitätsbetrachtungen und den Beweis von gut handhabbaren Spezialfällen beschränken. Dies liegt zum einen daran das die Beweise dieser Sätze technisch etwas unangenehm werden wenn man auch etwas irreguläre Flächen mit Kanten erfassen will, wie zum Beispiel den Rand eines Würfels, und zum anderen daran das wir im vorigen Kapitel teilweise beweistechnisch etwas unpraktische Definitionen und für das Oberflächenintegral sogar eine nicht wirklich exakte Definition gegeben haben. Es wird in diesem Kapitel sogar noch eine weitere Definition dieser Art hinzukommen. Auf Grundlage derartiger Definitionen ist damit sowieso kein exakter Beweis möglich. Für das Verständnis der Integralsätze ist all das unproblematisch, da die anschauliche Bedeutung auch der nicht exakt definierten Begriffe klar ist. Wenn man den schon im vorigen Kapitel erwähnten allgemeineren Zugang über die Integration von Differentialformen verwendet, so stellt sich heraus das alle unsere Integralsätze tatsächlich Spezialfälle eines einzigen allgemeinen Satzes sind. Insofern wäre ein Beweis der Einzelsätze auch noch etwa unökonomisch. 9.1 Die Greensche Formel Wir beginnen mit der sogenannten Greenschen Formel im R 2. Diese handelt von der sogenannten Rotation von stetig differenzierbaren Vektorfeldern im R 2, und wir müssen zunächst einmal klären was die Rotation eines Vektorfelds sein soll. Dabei wollen wir nicht gleich mit der exakten Definition beginnen, sondern zunächst einmal ihre geometrische Bedeutung behandeln. Es sei also ein stetig differenzierbares Vektorfeld F = f x + g y auf einer offenen, zusammenhängenden Menge U R 2 gegeben. Weiter betrachten wir erst einmal einen einzelnen Punkt p U und wollen die einführen was die Rotation des Vektorfelds F um den Punkt p ist. Wir betrachten dann eine stückweise C 1 -Kurve γ in U, die ihr Inneres A R 2 einmal im Gegenuhrzeigersinn umläuft. Wir nehmen dabei an, dass p A A U ist, denn ist γ ausreichend nahe bei p, so liegen auch alle von γ umlaufenen Punkte innerhalb der offenen Menge U. Die Zirkulation C(A) des Vektorfelds F um die Menge A beschreibt wie F sich um den Rand von A, also die Kurve γ, herumdreht. Dabei wird Zirkulation im Gegenuhrzeigersinn als positiv und Zirkulatiom im Uhrzeigersinn als negativ gezählt. 268

269 Mathematik für Physiker III, WS 212/213 Dienstag A A C(A) > C(A) < Um diese Zirkulation zu ermitteln, bestimmen wir in jedem Punkt p = γ(t) auf dem Rand von A die Stärke des Vektorfelds F (p) in p tangential zur Kurve γ, d.h. wir bilden das Skalarprodukt G(p) γ (t) = F (γ(t)) γ (t). Dieses Skalarprodukt gibt uns den Beitrag zur Zirkulation im Punkt p und durch Integration längs der gesamten Kurve erhalten wir die Zirkulation C(A) von F um A. Andererseits ist unser Skalarprodukt auch gerade der Integrand aus der Definition des Kurvenintegrals F (t) dt in 7.3, wir γ können die Zirkulation C(A) also als das vektorielle Kurvenintegral C(A) := F (t) dt definieren. Setzen wir die Zirkulation C(A) nun in Relation zur Fläche von A, bilden also den Quotienten C(A)/ vol(a), so ergibt sich die relative Dichte der Zirkulation von F in der Menge A. Die Rotation von F im Punkt p soll dann die Zirkulationsdichte von F in p sein, also der Grenzwert C(A) rotf (p) = lim A p vol(a), wobei der Grenzwert über sich auf den Punkt p zusammenziehende Mengen A gebildet wird. Dies ist natürlich noch keine formale Definition, solch einen Grenzwert haben wir bisher weder definiert noch seine Existenz eingesehen. Diese Beschreibung soll uns nur die geometrische Bedeutung der Rotation rotf (p) geben, es handelt sich um die Zirkulationsdichte von F im Punkt p. Als nächsten Schritt werden wir uns überlegen wie sich dieser Grenzwert berechnen läßt, das Ergebnis wird ein recht einfacher Ausdruck in den Komponenten f und g von F sein, den wir dann als die formale Definition der Rotation verwenden werden. γ Vorlesung 23, Dienstag

270 Mathematik für Physiker III, WS 212/213 Dienstag In diesem Kapitel wollen wir die verschiedenen zwei- und dreidimensionalen Integralsätze behandeln und die für diese notwendigen Begriffe einführen. Dabei haben wir bereits mit der Untersuchung der Rotation eines Vektorfelds im zweidimensionalen Fall begonnen. Die Rotation eines solchen Vektorfelds soll die Zirkulationsdichte, oder auch Wirbeldichte, dieses Vektorfelds sein. Um zu sagen was dies ist, hatten wir erst einmal die Zirkulation C(A) des stetig differenzierbaren Vektorfelds F um eine Teilmenge A R 2 definiert. Setzt man diese in Relation zur Fläche, so ergibt sich die relative Wirbeldichte C(A)/ vol(a). Haben wir dann einen Punkt p R 2, so bilden wir den Grenzwert rot F (p) = lim A p C(A) vol(a) der relativen Wirbeldichte, wobei der Grenzwert über sich auf den Punkt p zusammenziehende Mengen A gebildet wird. Da die Zirkulation im Gegenuhrzeigersinn gezählt wird, wird auch bei der Rotation die Zirkulation im Gegenuhrzeigersinn als positiv gewertet. Dies alles ist allerdings noch keine Definition, sondern soll erst einmal nur die anschauliche Bedeutung der Rotation vermitteln. Um dies genauer zu untersuchen, geben wir den hier betrachteten Mengen A erst einmal einen Namen. Definition 9.1: Eine Teilmenge A R 2 heißt ein einfaches Flächenstück wenn sie die folgenden drei Eigenschaften besitzt: (a) Die Menge A ist kompakt und Jordan-meßbar. (b) Es gibt a, b R mit a < b und eine stückweise C 1 -Kurve γ : [a, b] R 2 mit γ(a) = γ(b) und A = {γ(t) a t b} so, dass γ [a, b) injektiv ist. (c) Jeder Punkt im Inneren von γ liegt in A und γ umläuft A im Gegenuhrzeigersinn. Sind dann f : A R eine stetige Funktion beziehungsweise F : A R 2 ein stetiges Vektorfeld, so schreiben wir f(t) dt := f(t) dt und F (t) dt := F (t) dt. A γ A γ Auch diese Definition ist streng genommen noch etwas lückenhaft, da wir nicht definiert haben was es bedeutet die Punkte von A im Gegenuhrzeigersinn zu umlaufen beziehungsweise was die Punkte im Inneren von γ sind. Da diese Begriffe aber anschaulich unproblematisch sind, und eine genaue Einführung für unsere Zwecke zu aufwändig ist, wollen wir auf eine genauere Definition verzichten. Das die am Ende der Definition eingeführte Schreibweise sinnvoll, also unabhängig von der speziell gewählten Kurve γ ist, folgt aus der Invarianz des skalaren und vektoriellen Kurvenintegrals unter Umparametrisierungen 7.Lemma 3.(e) beziehungsweise 7.Lemma 4.(c). Mit diesen Bezeichnungen wird die Zirkulation des Vektorfelds F um ein einfaches Flächenstück A zu C(A) = F (t) dt. A 27

271 Mathematik für Physiker III, WS 212/213 Dienstag Wir wollen jetzt den Grenzwert der relativen Wirbeldichte untersuchen, und der Einfachheit halber betrachten wir nur Kreise anstelle allgemeiner einfacher Flächenstücke. Gegeben seien also eine offene Menge U R 2, ein stetig differenzierbares Vektorfeld F : U R 2 F = f x + g y auf U und ein Punkt p U. Da U offen ist, können wir ein ɛ > mit B ɛ () U wählen. Für jedes < r ɛ betrachten wir dann den Kreis B r := B r (p) U, und parametrisieren seinen Rand durch die Kurve κ p,r. Als die Zirkulation von F um die Kreisscheibe B r ergibt sich dann C(B r ) := F (t) dt und somit C(B r) κ p,r vol(b r ) = 1 F (t) dt. πr 2 κ p,r Wir wollen den Grenzwert dieses Ausdrucks für r berechnen. F F B r r B r r p p C(B r ) > C(B r ) < Für jedes < r ɛ schreiben wir die Definition des Linienintegrals aus, und erhalten C(B r ) vol(b r ) = 1 πr 2 = 1 πr 2 2π = 1 π κ p,r F (t) dt [rg(p 1 + r cos t, p 2 + r sin t) cos t rf(p 1 + r cos t, p 2 + r sin t) sin t] dt 2π g(p 1 + r cos t, p 2 + r sin t) cos t f(p 1 + r cos t, p 2 + r sin t) sin t r Der Konvergenzsatz für Riemannintegrale ist hier nicht anwendbar, da der Integrand für r überhaupt nicht konvergieren muss. Glücklicherweise können wir das Integral 271 dt.

272 Mathematik für Physiker III, WS 212/213 Dienstag aber noch etwas umformen indem wir einmal partiell integrieren 1 π 2π = 1 π g(p 1 + r cos t, p 2 + r sin t) cos t f(p 1 + r cos t, p 2 + r sin t) sin t dt r [ g x (p 1 + r cos t, p 2 + r sin t) sin 2 t g 2π y (p 1 + r cos t, p 2 + r sin t) sin t cos t + f x (p 1 + r cos t, p 2 + r sin t) sin t cos t f ] y (p 1 + r cos t, p 2 + r sin t) cos 2 t dt. Jetzt existiert der Grenzwert des Integranden für r, wir behaupten das unser Integrand für r gleichmäßig gegen ( ) g f x (p) g sin2 t + (p) x y (p) sin t cos t f y (p) cos2 t konvergiert. Dies leicht zu sehen. Angenommen wir geben uns ein δ > vor. Da die Funktion g/ x stetig ist, gibt es nach 4.Lemma 3 ein α > so, dass für alle u, v B ɛ (p) mit u v < α stets g/ x(u) g/ x(v) < δ ist. Für alle r R mit < r < α und alle t 2π gilt dann (p 1 + r cos t, p 2 + r sin t) p = r < α, also auch g x (p 1 + r cos t, p 2 + r sin t) sin 2 t g x (p) sin2 t δ sin2 t δ. Dies beweist die gleichmäßige Konvergenz des ersten Summanden unseres Integranden, und die anderen drei Terme können analog behandelt werden. Mit 6.Satz 1 folgt jetzt C(B r ) lim r vol(b r ) = 1 2π ( ) g f π x (p) g sin2 t + (p) x y (p) sin t cos t f y (p) cos2 t dt, und verwenden wir die schon früher berechneten Integrale 2π so erhalten wir schließlich sin t cos t dt =, lim r 2π C(B r ) vol(b r ) = g x sin 2 t dt = 2π (p) f y (p). cos 2 t dt = π, Da dieses Ergebnis einfacher als die oben gegebene Definition über den Grenzwert der relativen Wirbeldichte ist, verwenden wir es jetzt als unsere exakte Definition. Definition 9.2 (Rotation eines ebenen Vektorfelds) Seien U R 2 eine offene Menge und F ein stetig differenzierbares Vektorfeld auf U. Die Rotation von F ist dann die stetige Funktion rot F := F 2 x F 1 y. Das Potentialkriterium für F können wir dann auch als rot F = schreiben. 272

273 Mathematik für Physiker III, WS 212/213 Dienstag Ist jetzt A R 2 ein einfaches Flächenstück, so sollte sich durch Integration der Wirbeldichte von F über A die Zirkulation von F um die Menge A ergeben, wir erwarten also die Gültigkeit der Formel ( F2 x F ) 1 d(x, y) = F (t) dt. y A A Dies ist eine der diversen Greenschen Formeln. Auf einen exakten Beweis werden wir verzichten, schon weil wir für einen solchen erst einmal eine exaktere Definition eines einfachen Flächenstücks benötigten. Wir werden uns mit dem Beweis eines Spezialfalls begnügen bei dem die Menge A sternförmig zu einem Punkt z A ist, und sich in der Form A = { z + t ( cos φ sin φ ) φ 2π, t b(φ)} schreiben läßt, wobei b : [, 2π] R eine stückweise stetig differenzierbare Funktion mit b(φ) > für alle φ [, 2π] ist. Die Randkurve γ von A kann man dann als γ(φ) = z + b(φ) (cos φ, sin φ) b(φ ) schreiben. Man kann das Zentrum z nach z = verschieben und dann bietet es sich an die Formel in Polarkoordinaten nachzurechnen. Dazu muss φ z zunächst einmal berechnet werden, wie die Rotation eines Vektorfelds in Polarkoordinaten aussieht. A Seien also V R 2 offen mit / V und bezeichne ϕ : R 2 R 2 die Transformation durch Polarkoordinaten. Weiter sei U R 2 offen mit ϕ(u) V. Sei F ein stetig differenzierbares Vektorfeld auf V. Wie in 7.5 gesehen, ist das entsprechende Vektorfeld F in Polarkoordinaten gegeben als F = G 1 r + G 2 φ mit G 1 (r, φ) = F 1 (r, φ) cos φ + F 2 (r, φ) sin φ, G 2 (r, φ) = cos φ F 2 (r, φ) sin φ r r F 1(r, φ) wobei F i := F i (ϕ U) für i = 1, 2 definiert ist. Es ist ( (rot F ) (ϕ U) = F 2 x F ) 1 (ϕ U) = cos φ F 2 y r sin φ r und wegen r G 2 r 1 G 1 r φ = cos φ F 2 + cos φ F 2 r F 1 = sin φ r F 1 + cos φ r 273 A F 2 φ sin φ F 1 r + sin φ r F 1 sin φ F 1 r, φ + cos φ F 2 + sin φ F 2 r r φ γ r cos φ r F 1 φ,

274 Mathematik für Physiker III, WS 212/213 Dienstag ist r G 2 r 1 G 1 r φ = cos φ F 2 r sin φ r F 2 φ sin φ F 1 r cos φ r also erhalten wir als Rotation von F in Polarkoordinaten als rot ϕ F = r G 2 r 1 G 1 r φ + 2G 2. Damit kommen wir zur Greenschen Formel. ( F 1 cos φ φ 2 F 2 sin φ ) r r F 1 = (rot F ) (ϕ U) 2G 2, Satz 9.1 (Greensche Formel) Sei A R 2 ein einfaches Flächenstück Weiter seien U R 2 offen mit A U und F : U R 2 ein stetig differenzierbares Vektorfeld auf U. Dann gilt die Greensche Formel ( F2 x F ) 1 d(x, y) = F (x) dx. y A Wie schon bemerkt wollen wir dies nur im oben beschriebenen sternförmigen Spezialfall beweisen. Seien also {( ) r cos φ A = φ 2π, r b(φ)} r sin φ und γ : [, 2π] R 2 ; φ A ( b(φ) cos φ b(φ) sin φ mit einer stetigen, stückweise stetig differenzierbaren Funktion b : [, 2π] R. Weiter transformiere F in Polarkoordinaten zu G = ϕ r + ψ φ. Da der Integrand gerade die Rotation des Vektorfelds F ist, ergibt die Transformation auf Polarkoordinaten ( F2 x F ) 2π b(φ) ( 1 d(x, y) = r 2 ψ ) ϕ (r, φ) (r, φ) + 2rψ(r, φ) dr dφ. y r φ A Mit partieller Integration ergibt sich für jedes φ [, 2π] b(φ) r 2 ψ r (r, φ) dr = r2 ψ(r, φ) 274 b(φ) b(φ) ) 2rψ(r, φ) dr,

275 Mathematik für Physiker III, WS 212/213 Dienstag also haben wir b(φ) ( r 2 ψ ) (r, φ) + 2rψ(r, φ) r dr = b(φ) 2 ψ(b(φ), φ). Wir führen jetzt eine weitere Hilfsfunktion ein, nämlich Φ : [, 2π] R; φ b(φ) ϕ(s, φ) ds. Da die Funktion b als stückweise stetig differenzierbar vorausgesetzt ist, gibt es eine Zerlegung (φ,..., φ r ) von [, 2π] so, dass b [φ i 1, φ i ] für jedes 1 i r stetig differenzierbar ist. Damit ist auch die Funktion Φ [φ i 1, φ i ] für jedes 1 i r nach stetig differenzierbar mit Φ (φ) = b(φ) für alle φ [φ i 1, φ i ]. Wir erhalten ϕ φ (s, φ) ds + ϕ(b(φ), φ) b (φ) 2π b(φ) ϕ 2π (r, φ) dr dφ + φ r φi = i=1 φ i 1 Φ (φ) dφ = ϕ(b(φ), φ)b (φ) dφ r (Φ(φ i ) Φ(φ i 1 )) = Φ(2π) Φ() =, i=1 und insgesamt ergibt sich mit der Formel für das Kurvenintegral in Polarkoordinaten A ( F2 x F ) 1 d(x, y) = y = 2π γ F. (b(φ) 2 ψ(b(φ), φ) + ϕ(b(φ), φ)b (φ)) dφ Damit haben wir die Greensche Formel in diesem Spezialfall nachgerechnet. Als ein kleines Beispiel wollen wir einmal die sogenannte Leipnitzsche Flächenformel herleiten. Betrachte das Vektorfeld F (x, y) := x y y x Die Greensche Formel wird dann zu vol(a) = d(x, y) = 1 A 2 mit rot F (x, y) = 2. A x dy y dx. 275

276 Mathematik für Physiker III, WS 212/213 Dienstag Man kann den Satz von Green auch auf etwas allgemeinere Flächenstücke A anwenden. Dies wollen wir hier nicht systematisch durchführen, sondern nur ein Beispiel besprechen. Man nennt ein Flächenstück A glatt berandet, wenn sein Rand A sich als Vereinigung endlicher vieler disjunkter Teile C 1,..., C r schreiben läßt, die jeweils von einer Kurve einfach durchlaufen werden können. Im nebenstehend abgebildeten Flächenstück A zerfällt der Rand beispielsweise in r = 3 Kurven. Dabei lassen wir die äußere Randkurve γ im Gegenuhrzeigersinn um A laufen, und die beiden innen gelegenen Randkurven α und β sollen im Uhrzeigersinn durchlaufen werden. In anderen Worten wird jede Randkomponente so durchlaufen, das die Menge A in Bewegungsrichtung immer zur linken Seite liegt. Wir nennen die beiden inneren Kreise B und B, und dann ist D := A B B die ganz ausgefüllte Ellipse. Sind f, g weiter zwei stetig differenzierbare Funktionen, so erhalten wir mit dreifacher Anwendung der Greenschen Formel ( g x f ) d(x, y) y A = D ( g x f y ) ( g d(x, y) B x f ) ( g d(x, y) y B x f ) d(x, y) y = f dx + g dy + f dx + g dy + f dx + g dy γ wobei die Minuszeichen verschwunden sind da wir α und β im Uhrzeigersinn durchlaufen. Mit solchen Überlegungen kann man dann ganz allgemein auch noch eine Greensche Formel für glatt berandete Flächenstücke herleiten, aber dies wollen wir hier nicht mehr durchführen. 9.2 Der Satz von Stokes Im vorigen Abschnitt hatten wir die Rotation eines Vektorfelds im R 2 eingeführt. Haben wir ein stetig differenzierbares Vektorfeld F in R 2 und einen Punkt p in dem es definiert ist, so war die Rotation oder Wirbeldichte rot F (p) von F in p eine Zahl, die die Wirbeldichte von F im Punkt p mißt. Dabei wurden Drehungen im Gegenuhrzeigersinn positiv gezählt und im Uhrzeigersinn negativ. Als heuristische Definition konnten wir beispielsweise den Grenzwert 1 rot F (p) = lim A p vol(a) A α F (t) dt verwenden, wobei der Grenzübergang nach sich auf den Punkt p zusammenziehenden, einfachen Flächenstücken A durchgeführt wurde. Wir wollen den Begriff der Rotation eines Vektorfelds jetzt auch im dreidimensionalen Fall einführen. Hier stellt sich 276 β

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 9.. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83 Die Grundfrage bei der Anwendung des Satzes über implizite Funktionen betrifft immer die folgende Situation: Wir haben eine Funktion f : V W und eine Stelle x

Mehr

Vorlesung. Funktionen/Abbildungen 1

Vorlesung. Funktionen/Abbildungen 1 Vorlesung Funktionen/Abbildungen 1 1 Grundlagen Hinweis: In dieser Vorlesung werden Funktionen und Abbildungen synonym verwendet. In der Schule wird eine Funktion häufig als eindeutige Zuordnung definiert.

Mehr

Lösungen zum 3. Aufgabenblatt

Lösungen zum 3. Aufgabenblatt SS, Lineare Algebra Die Lösungen wurden erstellt von: Isabel Voigt, Vanessa Lamm und Matthias Rehder Hinweis: Eine Liste der zur Bearbeitung verwendeten Literatur ist unter www.mathematiwelt.com aufrufbar.

Mehr

Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009

Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009 Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt 10 21.12.2009 Aufgabe 35: Thema: Singulärwertzerlegung und assoziierte Unterräume Sei A eine m n Matrix mit Rang r und A = UDV T ihre Singulärwertzerlegung.

Mehr

Optimalitätskriterien

Optimalitätskriterien Kapitel 4 Optimalitätskriterien Als Optimalitätskriterien bezeichnet man notwendige oder hinreichende Bedingungen dafür, dass ein x 0 Ω R n Lösung eines Optimierungsproblems ist. Diese Kriterien besitzen

Mehr

Modulabschlussklausur Analysis II

Modulabschlussklausur Analysis II Modulabschlussklausur Analysis II. Juli 015 Bearbeitungszeit: 150 min Aufgabe 1 [5/10 Punkte] Es sei a R und f a : R 3 R mit f a (x, y, z) = x cos(y) + z 3 sin(y) + a 3 + (z + ay a y) cos(x) a) Bestimmen

Mehr

6 Symmetrische Matrizen und quadratische Formen

6 Symmetrische Matrizen und quadratische Formen Mathematik für Ingenieure II, SS 9 Freitag. $Id: quadrat.tex,v.5 9//5 ::59 hk Exp $ $Id: orthogonal.tex,v.4 9// ::54 hk Exp $ $Id: fourier.tex,v. 9// :: hk Exp $ Symmetrische Matrizen und quadratische

Mehr

Beispiel 11.2. Wenn p ein Polynom vom Grad größer gleich 1 ist, ist q : C Ĉ definiert durch q (z) =

Beispiel 11.2. Wenn p ein Polynom vom Grad größer gleich 1 ist, ist q : C Ĉ definiert durch q (z) = Funktionentheorie, Woche Funktionen und Polstellen. Meromorphe Funktionen Definition.. Sei U C offen und sei f : U gilt, nennt man f meromorph auf U: Ĉ eine Funktion. Wenn folgendes. P := f hat keine Häufungspunkte;.

Mehr

Kommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler

Kommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler Kommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler Wintersemester 3/4 (.3.4). (a) Für z = + i und z = 3 4i berechne man z z und z z. Die Ergebnisse sind in kartesischer Form anzugeben.

Mehr

Mathematik 1 für Wirtschaftsinformatik

Mathematik 1 für Wirtschaftsinformatik Mathematik 1 für Wirtschaftsinformatik Wintersemester 2012/13 Hochschule Augsburg : Gliederung 7 Folgen und Reihen 8 Finanzmathematik 9 Reelle Funktionen 10 Differenzieren 1 11 Differenzieren 2 12 Integration

Mehr

2 3 x3 17. x k dx = x k x k+1 k +1. Mit jeder weiteren partiellen Integration reduziert sich der Grad des Faktors x n, induktiv erhalten wir also

2 3 x3 17. x k dx = x k x k+1 k +1. Mit jeder weiteren partiellen Integration reduziert sich der Grad des Faktors x n, induktiv erhalten wir also Universität Konstanz Fachbereich Mathematik und Statistik Repetitorium Analysis 0 Dr DK Huynh Blatt 8 Aufgabe 6 Bestimmen Sie (a) (x + x 7x+)dx (c) (f) x n exp(x)dx (n N fest) sin (x)dx (g) (b) (d) ln(x)dx

Mehr

Definition 3.1: Ein Differentialgleichungssystem 1. Ordnung

Definition 3.1: Ein Differentialgleichungssystem 1. Ordnung Kapitel 3 Dynamische Systeme Definition 31: Ein Differentialgleichungssystem 1 Ordnung = f(t, y) ; y R N ; f : R R N R N heißt namisches System auf dem Phasenraum R N Der Parameter t wird die Zeit genannt

Mehr

TECHNISCHE UNIVERSITÄT MÜNCHEN. Abzählbarkeit, Injektivität, Sürjektivität und Bijektivität

TECHNISCHE UNIVERSITÄT MÜNCHEN. Abzählbarkeit, Injektivität, Sürjektivität und Bijektivität TECHNISCHE UNIVERSITÄT MÜNCHEN Zentrum Mathematik Prof. Dr. Friedrich Roesler Ralf Franken, PhD Max Lein Lineare Algebra 1 WS 26/7 en Blatt 4 13.11.26 Abzählbarkeit, Injektivität, Sürjektivität und Bijektivität

Mehr

11. Primfaktorzerlegungen

11. Primfaktorzerlegungen 78 Andreas Gathmann 11 Primfaktorzerlegungen Euch ist sicher aus der Schule bekannt, dass sich jede positive ganze Zahl a als Produkt a = p 1 p n von Primzahlen schreiben lässt, und dass diese Darstellung

Mehr

ax 2 + bx + c = 0, (4.1)

ax 2 + bx + c = 0, (4.1) Kapitel 4 Komplexe Zahlen Wenn wir uns auf die reellen Zahlen beschränken, ist die Operation des Wurzelziehens (also die Umkehrung der Potenzierung) nicht immer möglich. Zum Beispiel können wir nicht die

Mehr

u + v = v + u. u + (v + w) = (u + v) + w. 0 V + v = v + 0 V = v v + u = u + v = 0 V. t (u + v) = t u + t v, (t + s) u = t u + s u.

u + v = v + u. u + (v + w) = (u + v) + w. 0 V + v = v + 0 V = v v + u = u + v = 0 V. t (u + v) = t u + t v, (t + s) u = t u + s u. Universität Stuttgart Fachbereich Mathematik Prof. Dr. C. Hesse PD Dr. P. H. Lesky Dipl. Math. D. Zimmermann Msc. J. Köllner FAQ 3 Höhere Mathematik I 4..03 el, kyb, mecha, phys Vektorräume Vektorräume

Mehr

Ergänzungen zur Analysis I

Ergänzungen zur Analysis I 537. Ergänzungsstunde Logik, Mengen Ergänzungen zur Analysis I Die Behauptungen in Satz 0.2 über die Verknüpfung von Mengen werden auf die entsprechenden Regelnfür die Verknüpfung von Aussagen zurückgeführt.

Mehr

klar. Um die zweite Bedingung zu zeigen, betrachte u i U i mit u i = 0. Das mittlere -Zeichen liefert s

klar. Um die zweite Bedingung zu zeigen, betrachte u i U i mit u i = 0. Das mittlere -Zeichen liefert s Nachtrag zur allgemeinen Vektorraum-Theorie. 1.5.15. Direkte Summen. Sei V ein Vektorraum, seien U 1,..., U t Unterräume, wir schreiben V = U 1 U 2 U t = t i=1 U i falls die folgenden beiden Bedingungen

Mehr

Erinnerung/Zusammenfassung zu Abbildungsmatrizen

Erinnerung/Zusammenfassung zu Abbildungsmatrizen Erinnerung/Zusammenfassung zu Abbildungsmatrizen Thomas Coutandin (cthomas@student.ethz.ch) 7. November 2 Abbildungsmatrizen Im Folgenden betrachten wir stets endlich dimensionale K-Vektorräume (K irgend

Mehr

Matrizennorm. Definition 1. Sei A M r,s (R). Dann heißt A := sup die Matrixnorm. Wir wissen zunächst nicht, ob A eine reelle Zahl ist.

Matrizennorm. Definition 1. Sei A M r,s (R). Dann heißt A := sup die Matrixnorm. Wir wissen zunächst nicht, ob A eine reelle Zahl ist. Matrizennorm Es seien r,s N Mit M r,s (R bezeichnen wir die Menge der reellen r s- Matrizen (also der linearen Abbildungen R s R r, und setze M s (R := M s,s (R (also die Menge der linearen Abbildungen

Mehr

Einführung in die Algebra

Einführung in die Algebra Prof. Dr. H. Brenner Osnabrück SS 2009 Einführung in die Algebra Vorlesung 13 Einheiten Definition 13.1. Ein Element u in einem Ring R heißt Einheit, wenn es ein Element v R gibt mit uv = vu = 1. DasElementv

Mehr

Geometrische Mannigfaltigkeiten

Geometrische Mannigfaltigkeiten Geometrische Mannigfaltigkeiten Thilo Kuessner Abstract Kurzfassung der Vorlesung: Definitionen, Beispiele und Sätze, keine Beweise. Definition 1. Ein topologischer Raum ist eine Menge X mit einer Familie

Mehr

Elemente der Analysis II

Elemente der Analysis II Elemente der Analysis II Kapitel 3: Lineare Abbildungen und Gleichungssysteme Informationen zur Vorlesung: http://www.mathematik.uni-trier.de/ wengenroth/ J. Wengenroth () 15. Mai 2009 1 / 35 3.1 Beispiel

Mehr

Leitfaden Lineare Algebra: Determinanten

Leitfaden Lineare Algebra: Determinanten Leitfaden Lineare Algebra: Determinanten Die symmetrische Gruppe S n. Eine Permutation σ der Menge S ist eine bijektive Abbildung σ : S S. Ist S eine endliche Menge, so reicht es zu verlangen, dass σ injektiv

Mehr

Frohe Weihnachten und ein gutes neues Jahr!

Frohe Weihnachten und ein gutes neues Jahr! Frohe Weihnachten und ein gutes neues Jahr! Die mit dem Stern * gekennzeichneten Übungen sind nicht verpflichtend, aber sie liefern zusätzliche Punkte. Unten wird immer mit I das reelle Intervall [0, 1]

Mehr

Skalare Differentialgleichungen

Skalare Differentialgleichungen Kapitel 2 Skalare Differentialgleichungen 2.1 Skalare lineare Differentialgleichungen 2.2 Bernoulli und Riccati Differentialgleichungen 2.3 Differentialgleichungen mit getrennten Variablen 2.4 Exakte Differentialgleichungen

Mehr

Wirtschaftsmathematik für International Management (BA) und Betriebswirtschaft (BA)

Wirtschaftsmathematik für International Management (BA) und Betriebswirtschaft (BA) Wirtschaftsmathematik für International Management (BA) und Betriebswirtschaft (BA) Wintersemester 2013/14 Hochschule Augsburg : Gliederung 1 Aussagenlogik 2 Lineare Algebra 3 Lineare Programme 4 Folgen

Mehr

Bestimmung einer ersten

Bestimmung einer ersten Kapitel 6 Bestimmung einer ersten zulässigen Basislösung Ein Problem, was man für die Durchführung der Simplexmethode lösen muss, ist die Bestimmung einer ersten zulässigen Basislösung. Wie gut das geht,

Mehr

2.12 Potenzreihen. 1. Definitionen. 2. Berechnung 2.12. POTENZREIHEN 207. Der wichtigste Spezialfall von Funktionenreihen sind Potenzreihen.

2.12 Potenzreihen. 1. Definitionen. 2. Berechnung 2.12. POTENZREIHEN 207. Der wichtigste Spezialfall von Funktionenreihen sind Potenzreihen. 2.2. POTENZREIHEN 207 2.2 Potenzreihen. Definitionen Der wichtigste Spezialfall von Funktionenreihen sind Potenzreihen. Eine Potenzreihe mit Entwicklungspunkt x 0 ist eine Reihe a n x x 0 n. Es gilt: es

Mehr

Codierungstheorie Rudolf Scharlau, SoSe 2006 9

Codierungstheorie Rudolf Scharlau, SoSe 2006 9 Codierungstheorie Rudolf Scharlau, SoSe 2006 9 2 Optimale Codes Optimalität bezieht sich auf eine gegebene Quelle, d.h. eine Wahrscheinlichkeitsverteilung auf den Symbolen s 1,..., s q des Quellalphabets

Mehr

Lineare Algebra - alles was man wissen muß

Lineare Algebra - alles was man wissen muß Statistik für Bioinformatiker SoSe 3 Rainer Spang Lineare Algebra - alles was man wissen muß Der Titel ist natürlich gelogen, aber was wir hier zusammengetragen haben ist zumindest ein Anfang. Weniger

Mehr

Seminararbeit für das SE Reine Mathematik- Graphentheorie

Seminararbeit für das SE Reine Mathematik- Graphentheorie Seminararbeit für das SE Reine Mathematik- Graphentheorie Der binäre Rang, der symplektische Graph, die Spektralzerlegung und rationale Funktionen Vortrag am 24.01.2012 Heike Farkas 0410052 Inhaltsverzeichnis

Mehr

7 Die Determinante einer Matrix

7 Die Determinante einer Matrix 7 Die Determinante einer Matrix ( ) a11 a Die Determinante einer 2 2 Matrix A = 12 ist erklärt als a 21 a 22 det A := a 11 a 22 a 12 a 21 Es ist S 2 = { id, τ}, τ = (1, 2) und sign (id) = 1, sign (τ) =

Mehr

Höhere Mathematik 3. Apl. Prof. Dr. Norbert Knarr. Wintersemester 2015/16. FB Mathematik

Höhere Mathematik 3. Apl. Prof. Dr. Norbert Knarr. Wintersemester 2015/16. FB Mathematik Höhere Mathematik 3 Apl. Prof. Dr. Norbert Knarr FB Mathematik Wintersemester 2015/16 4. Homogene lineare Dierentialgleichungen 4.1. Grundbegrie 4.1.1. Denition. Es sei J R ein Intervall und a 0 ; : :

Mehr

Z = 60! 29!31! 1,1 1017.

Z = 60! 29!31! 1,1 1017. Aufgabe : Eine Hochzeitsgesellschaft besteht aus 60 Personen. a Wieviele verschiedene Möglichkeiten für Sitzordnungen gibt es? b Nehmen Sie nun an, dass 9 Gäste aus dem Familien- und Freundeskreis der

Mehr

Übungen zum Ferienkurs Lineare Algebra WS 14/15

Übungen zum Ferienkurs Lineare Algebra WS 14/15 Übungen zum Ferienkurs Lineare Algebra WS 14/15 Linearkombinationen, Basen, Lineare Abbildungen 2.1 Lineare Unabhängigkeit Sind die folgenden Vektoren linear unabhängig? (a) 1, 2, 3 im Q Vektorraum R (b)

Mehr

Absolute Stetigkeit von Maßen

Absolute Stetigkeit von Maßen Absolute Stetigkeit von Maßen Definition. Seien µ und ν Maße auf (X, Ω). Dann heißt ν absolut stetig bezüglich µ (kurz ν µ ), wenn für alle A Ω mit µ(a) = 0 auch gilt dass ν(a) = 0. Lemma. Sei ν ein endliches

Mehr

3.3 Eigenwerte und Eigenräume, Diagonalisierung

3.3 Eigenwerte und Eigenräume, Diagonalisierung 3.3 Eigenwerte und Eigenräume, Diagonalisierung Definition und Lemma 3.3.1. Sei V ein K-Vektorraum, φ End K (V ), λ K. Wir defnieren den zu λ gehörigen Eigenraum von φ als Dies ist ein Unterraum von V.

Mehr

ERGÄNZUNGEN ZUR ANALYSIS II MITTELWERTSATZ UND ANWENDUNGEN

ERGÄNZUNGEN ZUR ANALYSIS II MITTELWERTSATZ UND ANWENDUNGEN ERGÄNZUNGEN ZUR ANALYSIS II MITTELWERTSATZ UND ANWENDUNGEN CHRISTIAN HARTFELDT. Zweiter Mittelwertsatz Der Mittelwertsatz Satz VI.3.4) lässt sich verallgemeinern zu Satz.. Seien f, g : [a, b] R auf [a,

Mehr

x 2 2x + = 3 + Es gibt genau ein x R mit ax + b = 0, denn es gilt

x 2 2x + = 3 + Es gibt genau ein x R mit ax + b = 0, denn es gilt - 17 - Die Frage ist hier also: Für welche x R gilt x = x + 1? Das ist eine quadratische Gleichung für x. Es gilt x = x + 1 x x 3 = 0, und man kann quadratische Ergänzung machen:... ( ) ( ) x x + = 3 +

Mehr

Einführung in die Vektor- und Matrizenrechnung. Matrizen

Einführung in die Vektor- und Matrizenrechnung. Matrizen Einführung in die Vektor- und Matrizenrechnung Matrizen Definition einer Matrix Unter einer (reellen) m x n Matrix A versteht man ein rechteckiges Schema aus reellen Zahlen, die wie folgt angeordnet sind:

Mehr

Kapitel 4. Euklidische Ringe und die Jordansche Normalform. 4.1 Euklidische Ringe

Kapitel 4. Euklidische Ringe und die Jordansche Normalform. 4.1 Euklidische Ringe Kapitel 4 Euklidische Ringe und die Jordansche Normalform 4.1 Euklidische Ringe Die Ringe der ganzen Zahlen, Z, sowie Polynomringe über Körpern, K[X], wobei K ein Körper ist, haben die folgenden Gemeinsamheiten:

Mehr

Nichtlineare Optimierung ohne Nebenbedingungen

Nichtlineare Optimierung ohne Nebenbedingungen Kapitel 2 Nichtlineare Optimierung ohne Nebenbedingungen In diesem Abschnitt sollen im wesentlichen Verfahren zur Bestimmung des Minimums von nichtglatten Funktionen in einer Variablen im Detail vorgestellt

Mehr

7 Rechnen mit Polynomen

7 Rechnen mit Polynomen 7 Rechnen mit Polynomen Zu Polynomfunktionen Satz. Zwei Polynomfunktionen und f : R R, x a n x n + a n 1 x n 1 + a 1 x + a 0 g : R R, x b n x n + b n 1 x n 1 + b 1 x + b 0 sind genau dann gleich, wenn

Mehr

Kevin Caldwell. 18.April 2012

Kevin Caldwell. 18.April 2012 im Rahmen des Proseminars Numerische Lineare Algebra von Prof.Dr.Sven Beuchler 18.April 2012 Gliederung 1 2 3 Mathematische Beschreibung von naturwissenschaftlich-technischen Problemstellungen führt häufig

Mehr

2 Die Darstellung linearer Abbildungen durch Matrizen

2 Die Darstellung linearer Abbildungen durch Matrizen 2 Die Darstellung linearer Abbildungen durch Matrizen V und V seien Vektorräume über einem Körper K. Hom K (V, V ) bezeichnet die Menge der K linearen Abbildungen von V nach V. Wir machen Hom K (V, V )

Mehr

3. Zusammenhang. 22 Andreas Gathmann

3. Zusammenhang. 22 Andreas Gathmann 22 Andreas Gathmann 3. Zusammenhang Eine der anschaulichsten Eigenschaften eines topologischen Raumes ist wahrscheinlich, ob er zusammenhängend ist oder aus mehreren Teilen besteht. Wir wollen dieses Konzept

Mehr

Klausur Analysis II (SS 2005)

Klausur Analysis II (SS 2005) Klausur Analysis II (SS 5) Prof. Dr. J. Franke Abschlußklausur vom. Juli 5 Name, Vorname: Matrikelnummer: Gruppe, Tutor: Pseudonym: ir wünschen Ihnen viel Erfolg! Mit 5 Punkten oder mehr von 5 ist die

Mehr

Division Für diesen Abschnitt setzen wir voraus, dass der Koeffizientenring ein Körper ist. Betrachte das Schema

Division Für diesen Abschnitt setzen wir voraus, dass der Koeffizientenring ein Körper ist. Betrachte das Schema Division Für diesen Abschnitt setzen wir voraus, dass der Koeffizientenring ein Körper ist. Betrachte das Schema 2x 4 + x 3 + x + 3 div x 2 + x 1 = 2x 2 x + 3 (2x 4 + 2x 3 2x 2 ) x 3 + 2x 2 + x + 3 ( x

Mehr

Mathematik 1. Lösungsvorschläge zum 2. Übungsblatt

Mathematik 1. Lösungsvorschläge zum 2. Übungsblatt Hochschule Regensburg Fakultät Informatik/Mathematik Christoph Böhm Wintersemester 0/0 Wirtschaftsinformatik Bachelor IW Informatik Bachelor IN Vorlesung Mathematik Mathematik Lösungsvorschläge zum Übungsblatt

Mehr

Teil II. Nichtlineare Optimierung

Teil II. Nichtlineare Optimierung Teil II Nichtlineare Optimierung 60 Kapitel 1 Einleitung In diesem Abschnitt wird die Optimierung von Funktionen min {f(x)} x Ω betrachtet, wobei Ω R n eine abgeschlossene Menge und f : Ω R eine gegebene

Mehr

Vorlesung. Komplexe Zahlen

Vorlesung. Komplexe Zahlen Vorlesung Komplexe Zahlen Motivation Am Anfang der Entwicklung der komplexen Zahlen stand ein algebraisches Problem: die Bestimmung der Lösung der Gleichung x 2 + 1 = 0. 1 Mit der Lösung dieses Problems

Mehr

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen Austausch- bzw. Übergangsrozesse und Gleichgewichtsverteilungen Wir betrachten ein System mit verschiedenen Zuständen, zwischen denen ein Austausch stattfinden kann. Etwa soziale Schichten in einer Gesellschaft:

Mehr

BONUS MALUS SYSTEME UND MARKOV KETTEN

BONUS MALUS SYSTEME UND MARKOV KETTEN Fakultät Mathematik und Naturwissenschaften, Fachrichtung Mathematik, Institut für Mathematische Stochastik BONUS MALUS SYSTEME UND MARKOV KETTEN Klaus D. Schmidt Ringvorlesung TU Dresden Fakultät MN,

Mehr

Für die Parameter t und ϕ sind das im angegebenen Bereich Funktionen, d.h. zu jedem Parameterwert gehört genau ein Punkt.

Für die Parameter t und ϕ sind das im angegebenen Bereich Funktionen, d.h. zu jedem Parameterwert gehört genau ein Punkt. PARAMETERFUNKTIONEN Zwei Beispiele: gsave currentpoint translate 21 4 div setlin 1 1 x = 2t 2 1 y = t < t

Mehr

TEILWEISE ASYNCHRONE ALGORITHMEN

TEILWEISE ASYNCHRONE ALGORITHMEN TEILWEISE ASYNCHRONE ALGORITHMEN FRANK LANGBEIN Literatur: D. Berseas, J. Tsitsilis: Parallel and distributed computatoin, pp. 48 489 URI: http://www.langbein.org/research/parallel/ Modell teilweiser asynchroner

Mehr

Die Weierstraßsche Funktion

Die Weierstraßsche Funktion Die Weierstraßsche Funktion Nicolas Weisskopf 7. September 0 Zusammenfassung In dieser Arbeit führen wir die Weierstraßsche Funktion ein und untersuchen einige ihrer Eigenschaften. Wir zeigen, dass jede

Mehr

Mathematik für Informatiker II. Beispiellösungen zur Probeklausur. Aufgabe 1. Aufgabe 2 (5+5 Punkte) Christoph Eisinger Sommersemester 2011

Mathematik für Informatiker II. Beispiellösungen zur Probeklausur. Aufgabe 1. Aufgabe 2 (5+5 Punkte) Christoph Eisinger Sommersemester 2011 Mathematik für Informatiker II Christoph Eisinger Sommersemester 211 Beispiellösungen zur Probeklausur Aufgabe 1 Gegeben sind die Polynome f, g, h K[x]. Zu zeigen: Es gibt genau dann Polynome h 1 und h

Mehr

34 5. FINANZMATHEMATIK

34 5. FINANZMATHEMATIK 34 5. FINANZMATHEMATIK 5. Finanzmathematik 5.1. Ein einführendes Beispiel Betrachten wir eine ganz einfache Situation. Wir haben einen Markt, wo es nur erlaubt ist, heute und in einem Monat zu handeln.

Mehr

Minimale Darstellungen, Kommutator- und Fixräume, projektive Geometrie

Minimale Darstellungen, Kommutator- und Fixräume, projektive Geometrie Notation Die in dieser Arbeit verwendete Notation ist im Wesentlichen Standard, so wie sie beispielsweise in [As] zu nden ist. Einige Abweichungen hiervon, Klarstellungen und zusätzliche Notationen (sofern

Mehr

Vorlesung 12 22. bzw. 23. Januar 2014. Determinanten 1. Cramersche Regel

Vorlesung 12 22. bzw. 23. Januar 2014. Determinanten 1. Cramersche Regel Vorlesung 2 22 bzw 23 Januar 204 Lineares Gleichungssystem a a 2 b b 2 = F a a 2 a 3 b b 2 b 3 c c 2 c 3 = V V =< a, b c > c b a b a F V Seite 70 a x + a 2 x 2 + a 3 x 3 b = 0 < a x + a 2 x 2 + a 3 x 3

Mehr

3. Die Eigenschaften der reellen Zahlen II: Geordnete Körper

3. Die Eigenschaften der reellen Zahlen II: Geordnete Körper 32 Andreas Gathmann 3. Die Eigenschaften der reellen Zahlen II: Geordnete Körper Wir haben bisher von den reellen Zahlen nur die Körpereigenschaften, also die Eigenschaften der vier Grundrechenarten ausgenutzt

Mehr

Algebra. Patrik Hubschmid. 8. Oktober 2013

Algebra. Patrik Hubschmid. 8. Oktober 2013 Algebra Patrik Hubschmid 8. Oktober 2013 Inhaltsverzeichnis 1 Fortführung der Gruppentheorie 7 1.1 Sylowsätze.................................... 7 3 Vorwort Dieses Skript zur Vorlesung Algebra im Wintersemester

Mehr

Gleichungen - Aufgabenstellung und Lösungsstrategien

Gleichungen - Aufgabenstellung und Lösungsstrategien Gleichungen - Aufgabenstellung und Lösungsstrategien Franz Pauer Institut für Mathematik, Universität Innsbruck, Technikerstr. 25, A-6020 Innsbruck, Österreich. Franz.Pauer@uibk.ac.at 18. Juli 2006 1 Einleitung

Mehr

DIFFERENTIALGLEICHUNGEN

DIFFERENTIALGLEICHUNGEN DIFFERENTIALGLEICHUNGEN GRUNDBEGRIFFE Differentialgleichung Eine Gleichung, in der Ableitungen einer unbekannten Funktion y = y(x) bis zur n-ten Ordnung auftreten, heisst gewöhnliche Differentialgleichung

Mehr

Approximation durch Taylorpolynome

Approximation durch Taylorpolynome TU Berlin Fakultät II - Mathematik und Naturwissenschaften Sekretariat MA 4-1 Straße des 17. Juni 10623 Berlin Hochschultag Approximation durch Taylorpolynome Im Rahmen der Schülerinnen- und Schüler-Uni

Mehr

Aufgaben des MSG-Zirkels 10b Schuljahr 2007/2008

Aufgaben des MSG-Zirkels 10b Schuljahr 2007/2008 Aufgaben des MSG-Zirkels 10b Schuljahr 2007/2008 Alexander Bobenko und Ivan Izmestiev Technische Universität Berlin 1 Hausaufgaben vom 12.09.2007 Zahlentheorie 1 Aufgabe 1.1 Berechne die (quadratischen)

Mehr

Induktive Limiten. Arpad Pinter, Tobias Wöhrer. 30. Jänner 2010

Induktive Limiten. Arpad Pinter, Tobias Wöhrer. 30. Jänner 2010 Induktive Limiten Arpad Pinter, Tobias Wöhrer 30. Jänner 2010 1 Inhaltsverzeichnis 1 Induktiver Limes von Mengen 2 2 Induktiver Limes von Vektorräumen 4 3 Lokalkonvexe topologische Vektorräumen 7 4 Induktiver

Mehr

a n := ( 1) n 3n2 + 5 2n 2. a n := 5n4 + 2n 2 2n 3 + 3 10n + 1. a n := 1 3 + 1 2n 5n 2 n 2 + 7n + 8 b n := ( 1) n

a n := ( 1) n 3n2 + 5 2n 2. a n := 5n4 + 2n 2 2n 3 + 3 10n + 1. a n := 1 3 + 1 2n 5n 2 n 2 + 7n + 8 b n := ( 1) n Folgen und Reihen. Beweisen Sie die Beschränktheit der Folge (a n ) n N mit 2. Berechnen Sie den Grenzwert der Folge (a n ) n N mit a n := ( ) n 3n2 + 5 2n 2. a n := 5n4 + 2n 2 2n 3 + 3 n +. 4 3. Untersuchen

Mehr

Diskrete Strukturen und Logik WiSe 2007/08 in Trier. Henning Fernau Universität Trier fernau@uni-trier.de

Diskrete Strukturen und Logik WiSe 2007/08 in Trier. Henning Fernau Universität Trier fernau@uni-trier.de Diskrete Strukturen und Logik WiSe 2007/08 in Trier Henning Fernau Universität Trier fernau@uni-trier.de 1 Diskrete Strukturen und Logik Gesamtübersicht Organisatorisches Einführung Logik & Mengenlehre

Mehr

6 Allgemeine Theorie des elektromagnetischen Feldes im Vakuum

6 Allgemeine Theorie des elektromagnetischen Feldes im Vakuum 6 ALLGEMEINE THEORIE DES ELEKTROMAGNETISCHEN FELDES IM VAKUUM 25 Vorlesung 060503 6 Allgemeine Theorie des elektromagnetischen Feldes im Vakuum 6.1 Grundaufgabe der Elektrodynamik Gegeben: Ladungsdichte

Mehr

Extrema von Funktionen in zwei Variablen

Extrema von Funktionen in zwei Variablen Wirtschaftswissenschaftliches Zentrum Universität Basel Mathematik für Ökonomen 1 Dr. Thomas Zehrt Extrema von Funktionen in zwei Variablen Literatur: Gauglhofer, M. und Müller, H.: Mathematik für Ökonomen,

Mehr

Hauptprüfung Abiturprüfung 2014 (ohne CAS) Baden-Württemberg

Hauptprüfung Abiturprüfung 2014 (ohne CAS) Baden-Württemberg Baden-Württemberg: Abitur 04 Pflichtteil www.mathe-aufgaben.com Hauptprüfung Abiturprüfung 04 (ohne CAS) Baden-Württemberg Pflichtteil Hilfsmittel: keine allgemeinbildende Gymnasien Alexander Schwarz www.mathe-aufgaben.com

Mehr

Kapitel 15. Lösung linearer Gleichungssysteme

Kapitel 15. Lösung linearer Gleichungssysteme Kapitel 15. Lösung linearer Gleichungssysteme Lineare Gleichungssysteme Wir befassen uns nun mit der Lösung im allgemeinen nichthomogener linearer Gleichungssysteme in zweifacher Hinsicht. Wir studieren

Mehr

Mathematik I Internationales Wirtschaftsingenieurwesen

Mathematik I Internationales Wirtschaftsingenieurwesen Mathematik I Internationales Wirtschaftsingenieurwesen Integralrechnung 03.12.08 Das unbestimmte Integral/Stammfunktion Das bestimmte Integral/Flächenberechnung Integral als Umkehrung der Ableitung Idee:

Mehr

Bitte unbedingt beachten: a) Gewertet werden alle acht gestellten Aufgaben.

Bitte unbedingt beachten: a) Gewertet werden alle acht gestellten Aufgaben. Mathematik I für Wirtschaftswissenschaftler Klausur für alle gemeldeten Fachrichtungen außer Immobilientechnik und Immobilienwirtschaft am 9..9, 9... Bitte unbedingt beachten: a) Gewertet werden alle acht

Mehr

( ) als den Punkt mit der gleichen x-koordinate wie A und der

( ) als den Punkt mit der gleichen x-koordinate wie A und der ETH-Aufnahmeprüfung Herbst 05 Mathematik I (Analysis) Aufgabe [6 Punkte] Bestimmen Sie den Schnittwinkel α zwischen den Graphen der Funktionen f(x) x 4x + x + 5 und g(x) x x + 5 im Schnittpunkt mit der

Mehr

Theoretische Informatik

Theoretische Informatik Theoretische Informatik Einheit 1 Mathematische Methodik 1. Problemlösen 2. Beweistechniken 3. Wichtige Grundbegriffe Methodik des Problemlösens Klärung der Voraussetzungen Welche Begriffe sind zum Verständnis

Mehr

Vorlesung Analysis I / Lehramt

Vorlesung Analysis I / Lehramt Vorlesung Analysis I / Lehramt TU Dortmund, Wintersemester 2012/ 13 Winfried Kaballo Die Vorlesung Analysis I für Lehramtsstudiengänge im Wintersemester 2012/13 an der TU Dortmund basiert auf meinem Buch

Mehr

Serie 13: Online Test

Serie 13: Online Test D-ERDW, D-HEST, D-USYS Mathematik I HS 3 Dr. Ana Cannas Serie 3: Online Test Einsendeschluss: 3. Januar 4 Bei allen Aufgaben ist genau eine Antwort richtig. Lösens des Tests eine Formelsammlung verwenden.

Mehr

3.1. Die komplexen Zahlen

3.1. Die komplexen Zahlen 3.1. Die komplexen Zahlen Es gibt viele Wege, um komplexe Zahlen einzuführen. Wir gehen hier den wohl einfachsten, indem wir C R als komplexe Zahlenebene und die Punkte dieser Ebene als komplexe Zahlen

Mehr

Gegeben ist die Funktion f durch. Ihr Schaubild sei K.

Gegeben ist die Funktion f durch. Ihr Schaubild sei K. Aufgabe I 1 Gegeben ist die Funktion f durch. Ihr Schaubild sei K. a) Geben Sie die maximale Definitionsmenge D f an. Untersuchen Sie K auf gemeinsame Punkte mit der x-achse. Bestimmen Sie die Intervalle,

Mehr

Einführung. Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Vorlesungen zur Komplexitätstheorie. K-Vollständigkeit (1/5)

Einführung. Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Vorlesungen zur Komplexitätstheorie. K-Vollständigkeit (1/5) Einführung 3 Vorlesungen zur Komplexitätstheorie: Reduktion und Vollständigkeit (3) Univ.-Prof. Dr. Christoph Meinel Hasso-Plattner-Institut Universität Potsdam, Deutschland Hatten den Reduktionsbegriff

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik auf der

Mehr

Kapitel 15: Differentialgleichungen

Kapitel 15: Differentialgleichungen FernUNI Hagen WS 00/03 Kapitel 15: Differentialgleichungen Differentialgleichungen = Gleichungen die Beziehungen zwischen einer Funktion und mindestens einer ihrer Ableitungen herstellen. Kommen bei vielen

Mehr

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung.

Die Gleichung A x = a hat für A 0 die eindeutig bestimmte Lösung. Für A=0 und a 0 existiert keine Lösung. Lineare Gleichungen mit einer Unbekannten Die Grundform der linearen Gleichung mit einer Unbekannten x lautet A x = a Dabei sind A, a reelle Zahlen. Die Gleichung lösen heißt, alle reellen Zahlen anzugeben,

Mehr

Optimierung für Wirtschaftsinformatiker: Analytische Optimierung ohne Nebenbedingungen

Optimierung für Wirtschaftsinformatiker: Analytische Optimierung ohne Nebenbedingungen Optimierung für Wirtschaftsinformatiker: Analytische Optimierung ohne Nebenbedingungen Dr. Nico Düvelmeyer Freitag, 1. Juli 2011 1: 1 [1,1] Inhaltsübersicht für heute 1 Einführung und Wiederholung Beispiel

Mehr

Fraktale Geometrie: Julia Mengen

Fraktale Geometrie: Julia Mengen Fraktale Geometrie: Julia Mengen Gunnar Völkel 1. Februar 007 Zusammenfassung Diese Ausarbeitung ist als Stoffsammlung für das Seminar Fraktale Geometrie im Wintersemester 006/007 an der Universität Ulm

Mehr

2.1 Codes: einige Grundbegriffe

2.1 Codes: einige Grundbegriffe Gitter und Codes c Rudolf Scharlau 2. Mai 2009 51 2.1 Codes: einige Grundbegriffe Wir stellen die wichtigsten Grundbegriffe für Codes über dem Alphabet F q, also über einem endlichen Körper mit q Elementen

Mehr

Fixpunktsemantik logischer Programme Pascal Hitzler Juli 1997 Kurzuberblick im Rahmen der Vorlesung Einfuhrung in Prolog von T. Cornell im Sommersemester 1997 an der Universitat Tubingen. Beweise sind

Mehr

WS 2008/09. Diskrete Strukturen

WS 2008/09. Diskrete Strukturen WS 2008/09 Diskrete Strukturen Prof. Dr. J. Esparza Lehrstuhl für Grundlagen der Softwarezuverlässigkeit und theoretische Informatik Fakultät für Informatik Technische Universität München http://www7.in.tum.de/um/courses/ds/ws0809

Mehr

Lineare Gleichungssysteme

Lineare Gleichungssysteme Lineare Gleichungssysteme Sei K ein Körper, a ij K für 1 i m, 1 j n. Weiters seien b 1,..., b m K. Dann heißt a 11 x 1 + a 12 x 2 +... + a 1n x n = b 1 a 21 x 1 + a 22 x 2 +... + a 2n x n = b 2... a m1

Mehr

Mengensysteme, Wahrscheinlichkeitsmaße

Mengensysteme, Wahrscheinlichkeitsmaße Kapitel 1 Mengensysteme, Wahrscheinlichkeitsmaße Der Großteil der folgenden fundamentalen Begriffe sind schon aus der Vorlesung Stochastische Modellbildung bekannt: Definition 1.1 Eine Familie A von Teilmengen

Mehr

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen

11.3 Komplexe Potenzreihen und weitere komplexe Funktionen .3 Komplexe Potenzreihen und weitere komplexe Funktionen Definition.) komplexe Folgen: z n = x n + j. y n mit zwei reellen Folgen x n und y n.) Konvergenz: Eine komplexe Folge z n = x n + j. y n heißt

Mehr

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage:

1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Zählen und Zahlbereiche Übungsblatt 1 1. Man schreibe die folgenden Aussagen jeweils in einen normalen Satz um. Zum Beispiel kann man die Aussage: Für alle m, n N gilt m + n = n + m. in den Satz umschreiben:

Mehr

Vorkurs Mathematik Übungen zu Differentialgleichungen

Vorkurs Mathematik Übungen zu Differentialgleichungen Vorkurs Mathematik Übungen zu Differentialgleichungen Als bekannt setzen wir die folgenden Umformungen voraus: e ln(f(x)) = f(x) e f(x)+c = e f(x) e c e ln(f(x)) +c = f(x) e c = f(x) c f ( g(x) ) g (x)

Mehr

Die reellen Lösungen der kubischen Gleichung

Die reellen Lösungen der kubischen Gleichung Die reellen Lösungen der kubischen Gleichung Klaus-R. Löffler Inhaltsverzeichnis 1 Einfach zu behandelnde Sonderfälle 1 2 Die ganzrationale Funktion dritten Grades 2 2.1 Reduktion...........................................

Mehr

Einführung in die Tensorrechnung

Einführung in die Tensorrechnung 1. Definition eines Tensors Tensoren sind Grössen, mit deren Hilfe man Skalare, Vektoren und weitere Grössen analoger Struktur in ein einheitliches Schema zur Beschreibung mathematischer und physikalischer

Mehr

6.2 Scan-Konvertierung (Scan Conversion)

6.2 Scan-Konvertierung (Scan Conversion) 6.2 Scan-Konvertierung (Scan Conversion) Scan-Konvertierung ist die Rasterung von einfachen Objekten (Geraden, Kreisen, Kurven). Als Ausgabemedium dient meist der Bildschirm, der aus einem Pixelraster

Mehr

Grundbegriffe der Informatik

Grundbegriffe der Informatik Grundbegriffe der Informatik Einheit 8: kontextfreie Grammatiken Thomas Worsch Karlsruher Institut für Technologie, Fakultät für Informatik Wintersemester 2009/2010 1/37 Überblick Kontextfreie Grammatiken

Mehr