Mathematik II. Vorlesung 46. Der Gradient

Ähnliche Dokumente
Übungen zur Ingenieur-Mathematik III WS 2009/10 Blatt

Lösungsvorschläge zu ausgewählten Übungsaufgaben aus Storch/Wiebe: Lehrbuch der Mathematik Band 2, 2.Aufl. (Version 2010), Kapitel 5

klar. Um die zweite Bedingung zu zeigen, betrachte u i U i mit u i = 0. Das mittlere -Zeichen liefert s

Mathematik 1 für Wirtschaftsinformatik

Einführung in die Algebra

Übungen zum Ferienkurs Lineare Algebra WS 14/15

Definition 27 Affiner Raum über Vektorraum V

Matrizennorm. Definition 1. Sei A M r,s (R). Dann heißt A := sup die Matrixnorm. Wir wissen zunächst nicht, ob A eine reelle Zahl ist.

Lösungen zum 3. Aufgabenblatt

Optimalitätskriterien

Optimierung für Wirtschaftsinformatiker: Analytische Optimierung ohne Nebenbedingungen

3.3 Eigenwerte und Eigenräume, Diagonalisierung

Erinnerung/Zusammenfassung zu Abbildungsmatrizen

6 Symmetrische Matrizen und quadratische Formen

TECHNISCHE UNIVERSITÄT MÜNCHEN. Abzählbarkeit, Injektivität, Sürjektivität und Bijektivität

11 Normalformen von Matrizen

9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN 83

Lineare Gleichungssysteme

u + v = v + u. u + (v + w) = (u + v) + w. 0 V + v = v + 0 V = v v + u = u + v = 0 V. t (u + v) = t u + t v, (t + s) u = t u + s u.

Eigenwerte und Eigenvektoren von Matrizen

Basis und Dimension. Als nächstes wollen wir die wichtigen Begriffe Erzeugendensystem und Basis eines Vektorraums definieren.

Einführung in die Vektor- und Matrizenrechnung. Matrizen

Geometrische Mannigfaltigkeiten

A Matrix-Algebra. A.1 Definition und elementare Operationen

2 Die Darstellung linearer Abbildungen durch Matrizen

Lineare Algebra - alles was man wissen muß

Algebraische Kurven. Vorlesung 26. Die Schnittmultiplizität

Leitfaden Lineare Algebra: Determinanten

Ausgewählte Aufgaben zum Grundbereich des Staatsexamens in Mathematik. Lineare Algebra. zusammengestellt von

Mathematik für Informatiker II. Beispiellösungen zur Probeklausur. Aufgabe 1. Aufgabe 2 (5+5 Punkte) Christoph Eisinger Sommersemester 2011

Induktive Limiten. Arpad Pinter, Tobias Wöhrer. 30. Jänner 2010

Bestimmung einer ersten

LINEARE ALGEBRA Ferienkurs. Hanna Schäfer Philipp Gadow

Wirtschaftsmathematik für International Management (BA) und Betriebswirtschaft (BA)

3. Zusammenhang. 22 Andreas Gathmann

Vorlesung. Funktionen/Abbildungen 1

Invariantentheorie. Vorlesung 5. Invariantenringe zu Untergruppen

ARBEITSUNTERLAGEN ZUR VORLESUNG UND ÜBUNG AN DER UNIVERSITÄT DES SAARLANDES LINEARE OPTIMIERUNG

Kommentierte Musterlösung zur Klausur HM I für Naturwissenschaftler

0, v 6 = , v 4 = span(v 1, v 5, v 6 ) = span(v 1, v 2, v 3, v 4, v 5, v 6 ) 4. span(v 1, v 2, v 4 ) = span(v 2, v 3, v 5, v 6 )

Beispiel Wenn p ein Polynom vom Grad größer gleich 1 ist, ist q : C Ĉ definiert durch q (z) =

Lineare Algebra und analytische Geometrie II (Unterrichtsfach)

4. Übungsblatt Matrikelnr.:

Extrema von Funktionen in zwei Variablen

Lineare Algebra und Lösung linearer zeitinvarianter Differentialgleichungssysteme

Division Für diesen Abschnitt setzen wir voraus, dass der Koeffizientenring ein Körper ist. Betrachte das Schema

Kevin Caldwell. 18.April 2012

Projektive Moduln. Lemma/Definition 1.1. Folgende Aussagen für einen R-Modul P sind äquivalent: (i) P erfüllt folgende Liftungseigenschaft:

Ergänzungen zur Analysis I

Elemente der Analysis II

Einführung in die Funktionalanalysis

Minimale Darstellungen, Kommutator- und Fixräume, projektive Geometrie

Übungsklausur. Bitte wählen Sie fünf Aufgaben aus! Aufgabe 1. Übungsklausur zu Mathematik I für BWL und VWL (WS 2008/09) PD Dr.

Quelle/Referenz für dieses Kapitel: Springborn [2, Lectures 28/29] hx a,vi

Lineare Gleichungssysteme

Reelle Analysis. Vorlesungsskript. Enno Lenzmann, Universität Basel. 7. November 2013

Lineare Algebra für Informatiker TUM Sommersemester 2011 Dozent: Christian Pötzsche

KAPITEL 4. Lineare Ausgleichsrechnung Beispiel 4.1. Das Ohmsche Gesetz: U = RI. Eine Meßreihe von Daten:

Gleichungen - Aufgabenstellung und Lösungsstrategien

x 2 2x + = 3 + Es gibt genau ein x R mit ax + b = 0, denn es gilt

Definition und Eigenschaften Finiter Elemente

34 5. FINANZMATHEMATIK

Kernel, Perceptron, Regression. Erich Schubert, Arthur Zimek KDD Übung

Mathematik 1. Lösungsvorschläge zum 2. Übungsblatt

Grundlagen der Mathematik II

2.1 Codes: einige Grundbegriffe

Seminararbeit für das SE Reine Mathematik- Graphentheorie

Kapitel 4. Euklidische Ringe und die Jordansche Normalform. 4.1 Euklidische Ringe

Lineare Algebra und Computer Grafik

Quantenautomaten und das Cut-Point-Theorem für beschränkte erkennbare Potenzreihen

Beispiel zur Lösung eines Gleichungssystems : 6 y + z = x + 3 y 3 z = x 3 y =

Algebra. Patrik Hubschmid. 8. Oktober 2013

Übungsaufgaben LAAG I. für Lehramtsstudenten GS, MS, BS

7 Die Determinante einer Matrix

Optimierung. Florian Jarre Josef Stoer. Springer

ERGÄNZUNGEN ZUR ANALYSIS II MITTELWERTSATZ UND ANWENDUNGEN

3. Die Eigenschaften der reellen Zahlen II: Geordnete Körper

Euklidischer Algorithmus, Restklassenring und seine Struktur, Chinesischer Restklassensatz

Der Golay-Code und das Leech-Gitter

Die reellen Lösungen der kubischen Gleichung

Entscheidungsbäume. Definition Entscheidungsbaum. Frage: Gibt es einen Sortieralgorithmus mit o(n log n) Vergleichen?

Höhere Mathematik 3. Apl. Prof. Dr. Norbert Knarr. Wintersemester 2015/16. FB Mathematik

Modulabschlussklausur Analysis II

Mathematik III für Ingenieure

KAPITEL 0. Einführung

Codierungstheorie, Vorlesungsskript

Absolute Stetigkeit von Maßen

Mathematik für Bioinformatik und Systembiologie. - Kapitel Einführung in die Optimierung - Roland Herzog und Dirk Lebiedz

Mathematik II für Studierende der Informatik Kapitel. Kodierungstheorie

Galerkin-Diskretisierung von Eigenwertproblemen für partielle Differentialgleichungen

Optimierung für Nichtmathematiker

Statische Optimierung unter Gleichungsrestriktionen (Lagrange)

11. Primfaktorzerlegungen

Mathematik für Studierende der Biologie und des Lehramtes Chemie Wintersemester 2013/14. Auswahl vorausgesetzter Vorkenntnisse

Matrixalgebra. mit einer Einführung in lineare Modelle. Stefan Lang Institut für Statistik Ludwigstrasse 33

Vorlesung Wirtschaftsmathematik II SS 2015, 3/2 SWS. Prof. Dr. M. Voigt

Kapitel 15: Differentialgleichungen

Die Verbindung von Linearer Programmierung und Graphentheorie

Austausch- bzw. Übergangsprozesse und Gleichgewichtsverteilungen

Transkript:

Prof. Dr. H. Brenner Osnabrück SS 2010 Mathematik II Vorlesung 46 Der Gradient Lemma 46.1. Es sei K ein Körper und V ein K-Vektorraum, der mit einer Bilinearform, versehen sei. Dann gelten folgende Aussagen (1) Für jeden Vektor u V sind die Zuordnungen und K-linear. (2) Die Zuordnung V K, v u,v, V K, v v,u, V V, u u,, ist K-linear. (3) Wenn, nicht ausgeartet ist, so ist die Zuordnung in (2) injektiv. Ist V zusätzlich endlichdimensional, so ist diese Zuordnung bijektiv. Beweis. (1) folgt unmittelbar aus der Bilinearität. (2). Seien u 1,u 2 V und a 1,a 2 K. Dann ist für jeden Vektor v V a 1 u 1 +a 2 u 2,v = a 1 u 1,v +a 2 u 2,v, und dies bedeutet gerade die Linearität der Zuordnung. Da die Zuordnung nach (2) linear ist, müssen wir zeigen, dass der Kern davon trivial ist. Sei also u V so, dass u, die Nullabbildung ist. D.h. u,v = 0 für alle v V. Dann muss aber nach der Definition von nicht ausgeartet u = 0 sein. Wenn V endliche Dimension hat, so liegt eine injektive lineare Abbildung zwischen Vektorräumen der gleichen Dimension vor, und eine solche ist nach Korollar 12.10 bijektiv. Wenn es also in einem endlichdimensionalen Vektorraum eine nicht ausgeartete Bilinearform gibt, bspw. ein Skalarprodukt, so gibt es zu jeder Linearform einen eindeutig bestimmten Vektor, mit dem diese Linearform beschrieben wird. Wendet man dies auf die Linearform an, die durch das totale Differential zu einer differenzierbaren Funktion f :V R gegeben ist, so gelangt man zum Begriff des Gradienten. 1

2 Definition 46.2. Sei (V,, ) ein euklidischer Vektorraum, G V offen und eine in P G differenzierbare Funktion. Dann nennt man den eindeutig bestimmten Vektor u V mit (Dϕ) P (v) = u,v für alle v V den Gradienten von f in P. Er wird mit bezeichnet. grad f(p) Man beachte, dass wir durchgehend die endlichdimensionalen Vektorräume mit einem Skalarprodukt versehen, um topologische Grundbegriffe wie Konvergenz und Stetigkeit zur Verfügung zu haben, dass diese Begriffe aber nicht von dem gewählten Skalarprodukt abhängen. Dem entgegen hängt aber der Gradient von dem gewählten Skalarprodukt ab. Bei V = R n, versehen mit dem Standardskalarprodukt, ist der Gradient einfach gleich grad f(p) = f x 1. f x n. Satz 46.3. Sei (V,, ) ein euklidischer Vektorraum, sei G V offen und sei eine in P G differenzierbare Funktion. Dann gelten folgende Aussagen. (1) Für jeden Vektor v V ist (Df) P (v) v grad f(p). (2) Dabei gilt Gleichheit genau dann, wenn v linear abhängig zum Gradienten ist. (3) Sei grad f(p) 0. Unter allen Vektoren v V mit v = 1 ist die Richtungsableitung in Richtung des normierten Gradienten maximal, und zwar gleich der Norm des Gradienten. Beweis. (1) folgt wegen (Df) P (v) = v,grad f(p) direkt aus der Abschätzung von Cauchy-Schwarz. (2) ergibt sich aus den Zusätzen zur Cauchy Schwarz, siehe Aufgabe 46.14. (3). Aus (1) und (2) folgt, dass grad f(p) grad f(p),± grad f(p) = (Df) grad f(p) P(± grad f(p) )

= grad f(p) gilt, und dass diese beiden Vektoren die einzigen Vektoren der Norm 1 sind, für die diese Gleichung gilt. Wenn man links die Betragstriche weglässt, so grad f(p) gilt die Gleichheit für nach wie vor, da das Skalarprodukt positiv grad f(p) definit ist. Der Gradient gibt demnach die Richtung an, in die die Funktion den stärksten Anstieg hat. In die entgegengesetze Richtung liegt entsprechend der steilste Abstieg vor. Lokale Extrema von Funktionen in mehreren Variablen Wir wollen mit den Mitteln der Differentialrechnung Kriterien erarbeiten, in welchen Punkten eine Funktion ein lokales Minimum oder ein lokales Maximum annimmt. Wenn man sich den Graph einer solchen Funktion als ein Gebirge über der Grundmenge G vorstellt, so geht es also um die Gipfel und die Senken des Gebirges. Der folgende Satz liefert ein notwendiges Kriterium für die Existenz eines lokalen Extremums, das das entsprechende Kriterium in einer Variablen verallgemeinert. Satz 46.4. Sei V ein endlichdimensionaler reeller Vektorraum und G V eine offene Teilmenge. Es sei eine Funktion, die im Punkt P G ein lokales Extremum besitzt. Dann gelten folgende Aussagen. (1) Wenn f in P in Richtung v V differenzierbar ist, so ist (D v f)(p) = 0. (2) Wenn f in P total differenzierbar ist, so verschwindet das totale Differential, also (Df) P = 0. Beweis. (1) Zu v V betrachten wir die Funktion h :I R, t h(t) = f(p +tv), wobei I ein geeignetes reelles Intervall ist. Da die Funktion f in P ein lokales Extremum besitzt, besitzt die Funktion h in t = 0 ein lokales Extremum. Nach Voraussetzung ist h differenzierbar und nach Satz 28.1 ist h (0) = 0. Diese Ableitung stimmt aber mit der Richtungsableitung überein, also ist (D v f)(p) = h (0) = 0. (2) folgt aus (1) aufgrund von Proposition 45.1. 3

4 Ein lokales Extremum kann also nur in einem sogenannten kritischen Punkt einer Funktion auftreten. Definition 46.5. Sei V ein endlichdimensionaler reeller Vektorraum, G V offen und eine differenzierbare Funktion. Dann heißt P G ein kritischer Punkt von f (oder ein stationärer Punkt), wenn (Df) P = 0 ist. Anderfalls spricht man von einem regulären Punkt. Wir sind natürlich auch an hinreichenden Kriterien für das Vorliegen von lokalen Extrema interessiert. Wie schon im eindimensionalen Fall muss man sich die zweiten Ableitungen anschauen, wobei die Situation natürlich dadurch wesentlich verkompliziert wird, dass es zu je zwei Richtungsvektoren v und w eine zweite Richtungsableitung D vw = D v D w gibt. Die zweite Richtungsableitung wird dadurch handhabbar, dass man sie in die sogenannte Hesse-Form bzw. Hesse-Matrix zusammenfasst. Als solche ist sie eine symmetrische Bilinearform, die mit Methoden der linearen Algebra analysiert werden kann. Diese Methoden werden wir im Folgenden entwickeln und insbesondere auf die Hesse-Form anwenden, um schließlich hinreichende Kriterien für die Existenz von lokalen Extrema zu erhalten. Definition 46.6. Es sei V ein endlichdimensionaler reeller Vektorraum, G V eine offene Menge und eine zweimal stetig differenzierbare Funktion. Zu P G heißt die Abbildung Hess P f :V V R, (u,v) D u D v f(p), die Hesse-Form im Punkt P G. Definition 46.7. Es sei V ein endlichdimensionaler reeller Vektorraum, G V eine offene Menge und einezweimalstetigdifferenzierbarefunktion.esseieinebasisv i,i = 1,...,n, von V gegeben mit den zugehörigen Richtungsableitungen D i = D vi, i = 1,...,n. Zu P G heißt dann die Matrix D 1 D 1 f(p) D 1 D n f(p)..... D n D 1 f(p) D n D n f(p) die Hesse-Matrix zu f im Punkt P bzgl. der gegebenen Basis. Die Hesse-Matrix ist beispielsweise die Gramsche Matrix der Hesse-Form bzgl. der Standardbasis im R n.

5 Eigenschaften von Bilinearformen Definition 46.8. Es sei K ein Körper, V ein endlichdimensionaler K- Vektorraum und, eine Bilinearform. Es sei v 1,...,v n eine Basis von V. Dann heißt die n n-matrix v i,v j 1 i,j n die Gramsche Matrix von, bzgl. der Basis. Lemma 46.9. Es sei K ein Körper, V ein endlichdimensionaler K-Vektorraum und, eine Bilinearform. Es seien v = v 1,...,v n und w = w 1,..., w n zwei Basen von V und es seien G bzw. H die Gramschen Matrizen von, bzgl. diesen Basen. Zwischen den Basiselementen gelten die Beziehungen n w i = a ij v j, j=1 die wir durch die Übergangsmatrix A = (a ij ) i,j ausdrücken. Dann besteht zwischen den Gramschen Matrizen die Beziehung Beweis. Es ist w r,w s = H = AGA t. n a rj v j, j=1 = 1 j,k n = 1 j n n a sk v k k=1 a rj a sk v j,v k a rj ( 1 k n = (A G A t ) rs. a sk v j,v k ) Definition 46.10. Es sei K ein Körper, V ein K-Vektorraum und, eine Bilinearform. Die Bilinearform heißt symmetrisch, wenn für alle v,w V gilt. v,w = w,v Definition 46.11. Es sei V ein reeller Vektorraum mit einer symmetrischen Bilinearform,. Diese Bilinearfrom heißt (1) positiv definit, wenn v,v > 0 ist für alle v V, v 0. (2) negativ definit, wenn v,v < 0 ist für alle v V, v 0. (3) positiv semidefinit, wenn v,v 0 ist für alle v V. (4) negativ semidefinit, wenn v,v 0 ist für alle v V. (5) indefinit, wenn, weder positiv semidefinit noch negativ semidefinit ist.

6 Positiv definite symmetrische Bilinearformen nennt man auch Skalarprodukte.EineBilinearformaufV kannmanaufeinenuntervektorraumu V einschränken, wodurch sich eine Bilinearform auf U ergibt. Wenn die ursprüngliche Form positiv definit ist, so überträgt sich dies auf die Einschränkung. Allerdings kann eine indefinite Form eingeschränkt auf gewisse Unterräume positiv definit werden und auf andere negativ definit. Dies führt zu folgender Definition. Definition 46.12. Es sei V ein endlichdimensionaler reeller Vektorraum mit einer symmetrischen Bilinearform,. Man sagt, dass eine solche Bilinearform den Typ (p,q) besitzt, wobei und ist. p = max(dim R (U),U V,, U positiv definit) q = max(dim R (W),W V,, W negativ definit) James Joseph Sylvester (1814-1897 Wie für Skalarprodukte nennt man zwei Vektoren v,w V orthogonal bzgl. einerbilinearform,wenn v,w = 0ist,undwieimFalleinesSkalarproduktes kann man zeigen, dass es Orthogonalbasen gibt. Die folgende Aussage nennt man den Trägheitssatz von Sylvester. Satz 46.13. Es sei V ein endlichdimensionaler reeller Vektorraum mit einer symmetrischen Bilinearform, vom Typ (p, q). Dann ist die Gramsche Matrix von, bzgl. einer jeden Orthogonalbasis eine Diagonalmatrix mit p positiven und q negativen Einträgen. Beweis. Bzgl. einer Orthogonalbasis u 1,...,u n hat die Gramsche Matrix natürlich Diagonalgestalt. Es sei p die Anzahl der positiven Diagonaleinträge und q die Anzahl der negativen Diagonaleinträge. Die Basis sei so

geordnet, dass die ersten p Diagonaleinträge positiv, die folgenden q Diagonaleinträge negativ und die übrigen 0 seien. Auf dem p -dimensionalen Unterraum U = u 1,...,u p ist die eingeschränkte Bilinearform positiv definit, so dass p p gilt. Sei W = u p +1,...,u n, auf diesem Unterraum ist die Bilinearform negativ semidefinit. Dabei ist V = U W, und diese beiden Räume sind orthogonal zueinander. Angenommen, es gebe einen Unterraum U, auf dem die Bilinearform positiv definit ist, und dessen Dimension größer als p ist. Dann ist U U. Wir können annehmen, dass U U ist, da man eine Orthogonalbasis von U zu einer Orthogonalbasis von U +U ergänzen kann, und dabei die positive Definitheit erhalten bleibt. Es gibt dann ein u U, u U, das orthogonal zu U ist. Daher ist u W. Dann ist aber zugleich u,u positiv und nicht positiv, ein Widerspruch. 7

Abbildungsverzeichnis Quelle = James Joseph Sylvester.jpg, Autor = nicht bekannt, Lizenz = PD 6 9