5 Lagrangeformalismus

Ähnliche Dokumente
Musterlösung. Aufgabe 1 a) Die Aussage ist falsch. Ein Gegenbeispiel ist die Funktion f : [0, 1] R, die folgendermaßen definiert ist:

Optimalitätskriterien

Analysis II 14. Übungsblatt

55 Lokale Extrema unter Nebenbedingungen

18.2 Implizit definierte Funktionen

Rückblick auf die letzte Vorlesung. Bemerkung

Optimale Steuerung, Prof.Dr. L. Blank 1. II Linear-quadratische elliptische Steuerungsprobleme

Dualitätssätze der linearen Optimierung

Musterlösung zu Blatt 1

8 Extremwerte reellwertiger Funktionen

Modulabschlussklausur Analysis II

Stetige Funktionen. Definition. Seien (X, d) und (Y, D) metrische Räume und f : X Y eine Abbildung. i) f heißt stetig in x 0 (x 0 D(f)), wenn

Musterlösung. TECHNISCHE UNIVERSITÄT MÜNCHEN Fakultät für Mathematik. Klausur Mathematik für Physiker 3 (Analysis 2) I... II...

5 Stetigkeit und Differenzierbarkeit

6 Extremwerte mit Nebenbedingungen: Die Lagrange-Multiplikatoren-Methode

ist reelles lineares Funktional. x(t) ϕ(t) dt ist reelles lineares Funktional für alle ϕ L 2 (0, 1).

Konvexe Menge. Eine Menge D R n heißt konvex, wenn für zwei beliebige Punkte x, y D auch die Verbindungsstrecke dieser Punkte in D liegt, d.h.

Extremwerte von Funktionen mehrerer reeller Variabler

Analysis I. Guofang Wang Universität Freiburg

11 Untermannigfaltigkeiten des R n und lokale Extrema mit Nebenbedingungen

Lösungen der Übungsaufgaben von Kapitel 3

Reelle Zufallsvariablen

Definition 3.1. Sei A X. Unter einer offenen Überdeckung von A versteht man eine Familie (U i ) i I offener Mengen U i X mit U i

2. Stetige lineare Funktionale

Wenn man den Kreis mit Radius 1 um (0, 0) beschreiben möchte, dann ist. (x, y) ; x 2 + y 2 = 1 }

Lösungen zu den Hausaufgaben zur Analysis II

Karlsruher Institut für Technologie Institut für Analysis Dr. Andreas Müller-Rettkowski Dr. Vu Hoang. Sommersemester

Dualität bei konvexer Optimierung

3. Mai Zusammenfassung. g x. x i (x).

Zusammenfassung Analysis 2

18 Höhere Ableitungen und Taylorformel

Operations Research. Konvexe Funktionen. konvexe Funktionen. konvexe Funktionen. Rainer Schrader. 4. Juni Gliederung

Rückblick auf die letzte Vorlesung

Outline. 1 Funktionen von mehreren Veränderlichen. 2 Grenzwert und Stetigkeit. 3 Partielle Ableitungen. 4 Die verallgemeinerte Kettenregel

Anwendungen der Differentialrechnung

Übungsblatt 2 - Analysis 2, Prof. G. Hemion

5 Lineare Algebra (Teil 3): Skalarprodukt

Serie 3. z = f(x, y) = 9 (x 2) 2 (y 3) 2 z 2 = 9 (x 2) 2 (y 3) 2, z 0 9 = (x 2) 2 + (y 3) 2 + z 2, z 0.

Der n-dimensionale Raum

2.6 Der Satz von Fubini

(c) (a) X ist abgeschlossen. X = A,wobeiderDurchschnittüberalleabgeschlossenenMengengebildet wird, die X enthalten. (d) (e)

Der Begriff der konvexen Menge ist bereits aus Definition 1.4, Teil I, bekannt.

Extrema von Funktionen mit zwei Variablen

(x, x + y 2, x y 2 + z 3. = e x sin y. sin y. Nach dem Umkehrsatz besitzt f dann genau auf der Menge

1.6 Implizite Funktionen

2. Dezember Lineare Algebra II. Christian Ebert & Fritz Hamm. Skalarprodukt, Norm, Metrik. Matrizen. Lineare Abbildungen

Das Lagrange-duale Problem

Cauchy-Folgen und Kompaktheit. 1 Cauchy-Folgen und Beschränktheit

Der metrische Raum (X, d) ist gegeben. Zeigen Sie, dass auch

1.3 Differenzierbarkeit

ÜBUNGSBLATT 11 LÖSUNGEN MAT121/MAT131 ANALYSIS II FRÜHJAHRSSEMESTER 2011 PROF. DR. CAMILLO DE LELLIS

Serie 4. Analysis D-BAUG Dr. Cornelia Busch FS 2015

3 Optimierung mehrdimensionaler Funktionen f : R n R

3 Anwendungen der Differentialrechnung. (x 1, x 2,..., x n 1, x n ) f xn (x 1, x 2,..., x n 1, x n ), 1 i n 1. y + cos z

Folgerungen aus dem Auflösungsatz

10 Extremwerte mit Nebenbedingungen

Funktionen mehrerer Variabler

Topologie und Differentialrechnung mehrerer Veränderlicher, SS 2009 Modulprüfung/Abschlussklausur. Aufgabe Punkte

Dierentialrechnung mit einer Veränderlichen

1. EINFÜHRUNG INS STATE-PRICING 1

Mathematik II für Studierende der Informatik. Wirtschaftsinformatik (Analysis und lineare Algebra) im Sommersemester 2016

Thema14 Der Satz über inverse Funktionen und der Satz über implizite Funktionen

Lösungen zu Mathematik I/II

Zahlen und metrische Räume

ist ein n-dimensionaler, reeller Vektorraum (vgl. Lineare Algebra). Wir definieren auf diesem VR ein Skalarprodukt durch i y i i=1

Kapitel 2. Mathematik für Mikroökonomie

Kuhn-Tucker-Bedingung

f f(x ɛξ) f(x) 0, d.h. f (x)ξ = 0 für alle ξ B 1 (0). Also f (x) = 0. In Koordinaten bedeutet dies gerade, dass in Extremstellen gilt: f(x) = 0.

Vollständigkeit. 1 Konstruktion der reellen Zahlen

16. FUNKTIONEN VON MEHREREN VARIABLEN

Tangentialebene. Sei f eine stetig differenzierbare Funktion und p = (p 1,..., p n ) die Koordinaten eines Punktes P auf der durch

1 Umkehrfunktionen und implizite Funktionen

Vorlesung: Nicht-kooperative Spieltheorie. Teil 4: 2-Personen-Nullsummenspiele

f(x) f(x 0 ) lokales Maximum x U : gilt, so heißt x 0 isoliertes lokales Minimum lokales Minimum Ferner nennen wir x 0 Extremum.

12 Extremwerte und Monotonie

FK WMS: Wirtschaftsmathematik 2, Einheit 7/8

Ferienkurs Analysis 3. Ari Wugalter März 2011

Geometrische Deutung linearer Abbildungen

Analyis I -Metrische Räume - eine Einführung in die Topologie

Universität Ulm Abgabe: Mittwoch,

9 Optimierung mehrdimensionaler reeller Funktionen f : R n R

Zahlen und metrische Räume

Lineare Algebra. Mathematik II für Chemiker. Daniel Gerth

Lösungen zu Übungsblatt 9

Eigenschaften kompakter Operatoren

Monotonie, Konkavität und Extrema

ε δ Definition der Stetigkeit.

35 Stetige lineare Abbildungen

TECHNISCHE UNIVERSITÄT MÜNCHEN

Übungsaufgaben zu Partielle Differentialgleichungen Blatt III vom

Proseminar Analysis Vollständigkeit der reellen Zahlen

Klausur zu Analysis II - Lösungen

Meßbare Funktionen. bilden die Grundlage der Integrationstheorie. Definition 24.1 :

2 Extrema unter Nebenbedingungen

3.1. Existenzsatz und Struktur der Lösungsmenge

Konvexe Mengen und Funktionen

Finite Elemente Methode für elliptische Differentialgleichungen

Mikroökonomik Prof. Dr. Stefan Klonner SoSe Übungsblatt 1

Kapitel 1:»Rechnen« c 3 c 4 c) b 5 c 4. c 2 ) d) (2x + 3) 2 e) (2x + 0,01)(2x 0,01) f) (19,87) 2

Anwendungen der Differentialrechnung

Transkript:

63 5 Lagrangeformalismus 5.1 Lagrange und Sattelfunktionen Eine typische Aufgabe ist, daß eine Funktion zweier Veränderlicher L(x, y) gegeben ist und diese Funktion bezüglich einer Variabler (hier x) maximiert und bezüglich der anderen Variablen (hier y) minimiert wird. Dazu kann man die beiden Varianten s = inf sup y Y x X L(x, y), s = sup inf L(x, y) x X y Y betrachten und die Frage stellen, wie sich beide Größen s und s zueinander verhalten. Es stellt sich heraus, daß stets s s (genannt: schwaches Dualitätsprinzip) und unter speziellen Bedingungen s = s (genannt: starkes Dualitätsprinzip) gilt. Beide Aufgaben inf-sup und sup-inf sind physikalisch verschiedene Aufgaben. Im Fall s < s haben beide Aufgaben nichts miteinander zu tun. Der Fall s = s beschreibt den Zusammenhang dieser beiden Aufgaben und ist daher von besonderem Interesse. Eine zentrale Aufgabe in der Physik ist es, zu einem Problem eine Funktion L(x, y) zu finden, für die s = s gilt. Die beiden Funktionen f(x) = inf y Y L(x, y), g(y) = sup L(x, y) x X spielen dann die Rolle von zueinander dualen Funktionen, von denen die eine maximiert und die andere minimiert wird. Im einführenden Beispiel, der Suche nach den Gleichgewichtslagen eines Graphen, gebildet aus massiven Kugeln und Federn, bestanden die beiden zueinander dualen Aufgaben in der Minimierung zweier potentieller Energien Q(y) und P(x). Der Zusammenhang mit den eben eingeführten Funktionen ist f(y) = Q(y) und g(x) = P(x). Der Minimierung von P(x) entspricht die Maximierung von g(x) = P(x). Definition: Es seien X und Y beliebige Mengen und L : X Y Ê eine beliebige Funktion. L heißt Lagrangefunktion oder Lagrangian, falls s = s gilt. Man sagt auch, daß eine Lagrangefunktion ein Minimax-Theorem erfüllt oder daß für L das starke Dualitätsprinzip gilt. Für uns werden in erster Linie Banachräume X und Y interessant sein. Es stellt sich heraus, daß schon das Finden von Lagrangefunktion nicht einfach ist. Das führt dazu, daß jede gefundene Lagrangefunktion interessante physikalische Interpretationen zuläßt. Heute wird eine neue Idee in der theoretischen Physik eigentlich nur dann akzeptiert, wenn ihr eine Lagrangefunktion zugrunde liegt. Viele Artikel in physikalischen Journalen, insbesondere zur Quantenfeldtheorie, beginnen mit dem Satz: Wir postulieren folgenden Lagrangian. Wir werden in diesem Kurs untersuchen, welche Informationen man aus einer Lagrangefunktion ziehen kann. Definition: Man sagt, eine Funktion L hat einen Sattelpunkt (x 0, y 0 ), falls L(x 0, y) L(x 0, y 0 ) L(x, y 0 ), (x, y) X Y gilt. L(x 0, y 0 ) ist der Sattelwert. Eine Funktion L, die einen Sattelpunkt hat, wird Sattelfunktion genannt.

64 5 LAGRANGEFORMALISMUS Im weiteren wird sich herausstellen, daß Lagrangefunktionen und Sattelfunktionen weitgehend Synonyme und damit auch äquivalent zu den Begriffen Minimax-Theorem oder starkes Dualitätsprinzip sind. Es wird der Begriff verwendet, der die Eigenschaf vervorhebt, die gerade im Vordergrund steht. Das klassische Beispiel für eine solche Funktion ist L(x, y) = y 2 x 2 Der Punkt (x 0, y 0 ) = (0, 0) ist ein Sattelpunkt mit dem Sattelwert L(0, 0) = 0 wegen y 2 y 2 x 2 x 2 und außerdem gilt offensichtlich. inf sup y Y x X L(x, y) = 0 = sup inf L(x, y) x X y Y Eine Sattelfunktion kann mehrere Sattelpunkte haben. Es gilt aber der Satz: Eine Sattelfunktion hat genau einen Sattelwert. Beweis: Angenommen es sei (x 1, y 1 ) ein weiterer Sattelpunkt. Dann gelten nach Definition für alle (x, y) X Y die beiden Ungleichungen L(x 0, y) L(x 0, y 0 ) L(x, y 0 ) L(x 1, y) L(x 1, y 1 ) L(x, y 1 ) Sei jetzt o.b.d.a. L(x 0, y 0 ) < L(x 1, y 1 ), dann können wir in der ersten Ungleichung x = x 1 und in der zweiten y = y 0 setzen und erhalten den Widerspruch L(x 0, y 0 ) L(x 1, y 0 ) L(x 1, y 1 ). 5.1.1 Schwaches Dualitätsprinzip Satz: Es seien X und Y beliebige Mengen und L : X Y Ê eine beliebige Funktion. dann gilt sup inf L(x, y) inf x X y Y Beweis: Es seien f(x) = inf y Y dann gilt offensichtlich sup y Y x X L(x, y) L(x, y), g(y) = sup L(x, y) x X f(x) L(x, y) g(y), (x, y) X Y Aus f(x) g(y) folgt natürlich auch sup f(x) inf g(y) x X y Y oder sup x X inf y Y L(x, y) inf y Y sup x X L(x, y) Bemerkung: Entscheident für das Relationszeichen ist die innere Extremwertbildung: Wenn man von einer Größe min und max bildet ist natürlich min max. Die äußere Extremwertbildung verändert diese Eigenschaft dann nicht mehr.

5.1 Lagrange und Sattelfunktionen 65 5.1.2 Äquivalenz von Sattelfunktionen und Lagrangefunktionen Satz: L ist eine Sattelfunktion mit Sattelpunkt (x 0, y 0 ) und Sattelwert L(x 0, y 0 ) genau dann, wenn gilt L(x 0, y 0 ) = max x X inf y Y L(x, y) = min y Y sup x X L(x, y) Beweis: Wir setzen g(y) = sup x X L(x, y) f(x) = inf y Y L(x, y) = Es sei L eine Sattelfunktion. Dann gilt L(x 0, y) L(x 0, y 0 ) L(x, y 0 ), x, y. Wir beweisen, daß L ein Minimax-Theorem erfüllt. Da es Punkte x 0 und y 0 gibt, gilt inf y Y L(x 0, y) = L(x 0, y 0 ) = sup x X L(x, y 0 ) Außerdem ist inf y Y sup x X L(x, y) sup x X L(x, y 0 ) = L(x 0, y 0 ) da das Infimum nicht größer als ein spezieller Wert sein kann. Analog gilt L(x 0, y 0 ) = inf y Y L(x 0, y) sup x X inf y Y L(x, y) Wegen der schwachen Dualität gilt Gleichheit und damit die Gleichheit aller Größen die dazwischen liegen. Außerdem ist wegen der Definition von f und g inf y Y L(x 0, y) = f(x 0 ) und sup x X L(x, y 0 ) = g(y 0 ). Das ergibt folgende Gleichungskette: L(x 0, y 0 ) = inf y Y L(x 0, y) = sup x X inf y Y L(x, y) = sup x X f(x) = f(x 0 ) = = sup x X L(x, y 0 ) = inf y Y sup x X L(x, y) = inf y Y g(y) = g(y 0 ) Diese Gleichungskette enthält die Gleichungen sup x X f(x) = f(x 0 ) und inf y Y g(y) = g(y 0 ) die bedeuten, daß die Extremwerte der Funktionen f und g in den Punkten x 0 bzw. y 0 angenommen werden, also max x X f(x) = f(x 0 ) und min y Y g(y) = g(y 0 ) gilt. Damit erhält man abschließend aus der Definition von f und g L(x 0, y 0 ) = f(x 0 ) = max x X f(x) = max x X inf y Y L(x, y) = = g(y 0 ) = min y Y g(y) = min y Y sup x X L(x, y) = Es sei max x X inf y Y L(x, y) = min y Y sup x X L(x, y). Die Gleichheit bedeutet, daß es Punkte x 0 und y 0 gibt mit L = f(x 0 ) = max x X f(x) = g(y 0 ) = min y Y g(y) Wir beweisen, daß (x 0, y 0 ) Sattelpunkt von L(x, y) ist und L(x 0, y 0 ) = L gilt. Welchen Wert hat L(x 0, y 0 )? Es gilt L = f(x 0 ) = inf y Y L(x 0, y) L(x 0, y 0 ) L = g(y 0 ) = sup x X L(x, y 0 ) L(x 0, y 0 ) Da Gleichheit gilt, gilt L = L(x 0, y 0 ) und inf y Y L(x 0, y) = L(x 0, y 0 ) = sup x X L(x, y 0 ) und damit L(x 0, y) L(x 0, y 0 ) L(x, y 0 ), x, y.

66 5 LAGRANGEFORMALISMUS 5.2 Beispiele für Lagrangefunktionen Beispiel 1: Die Funktionen F(x) und G(y) haben globale Minima in x 0 bzw. y 0. Dann ist L(x, y) = G(y) F(x) Lagrangefunktion mit dem Sattelpunkt (x 0, y 0 ). Es gilt F(x 0 ) G(y) F(x 0 ) G(y 0 ) F(x) G(y 0 ) Das ist der typische Fall in der Physik, wenn F kinetische und G potentielle Energie sind. Beispiel 2: Es sei A(y) B(x, y) C(x) mit den Eigenschaften, daß ein Punkt (x 0, y 0 ) existiert, für den A(y 0 ) A(y) B(x 0, y 0 ) B(x 0, y) C(x) C(x 0 ) B(x, y 0 ) B(x 0, y 0 ) gilt. Dann ist L(x, y) = A(y) + C(x) B(x, y) Lagrangefunktion mit dem Sattelpunkt (x 0, y 0 ) denn es gilt L(x, y 0 ) L(x 0, y 0 ) = A(y 0 ) + C(x) B(x, y 0 ) ( A(y 0 ) + C(x 0 ) B(x 0, y 0 ) ) = und analog L(x 0, y) L(x 0, y 0 ). = C(x) C(x 0 ) + B(x 0, y 0 ) B(x, y 0 ) 0 Beispiel 3: Es sei L 0 (x, y) Lagrangefunktion mit dem Sattelpunkt (x 0, y 0 ) und f(x) und g(y) definiert wie oben. Dann ist L(x, y) = f(x) + g(y) L 0 (x, y) = = sup y Y L 0 (x, y) + inf x X L 0 (x, y) L 0 (x, y) ebenfalls Lagrangefunktion mit dem Sattelpunkt (x 0, y 0 ) denn es gilt g(y) L(x 0, y) und L(x, y 0 ) f(x), woraus g(y 0 ) g(y) L(x 0, y 0 ) L(x 0, y) f(x) f(x 0 ) L(x, y 0 ) L(x 0, y 0 ) folgt. Damit ist dieses Beispiel auf Beispiel 2 zurückgeführt. Im allgemeinen gilt L(x, y) L 0 (x, y). Gleichheit gilt nur für L(x, y) = 1 2 f(x) + 1 2 g(y). Beispiel 4: Es seien F(x) und G(y) stetige Funktionen mit Wertebereich Ê. Dann ist L(x, y) = F(x) G(y) eine Lagrangefunktion. Beweis: Wir beweisen das minimax-theorem. Es ist sup F(x) G(y) = χ F 1 (0) y inf sup F(x) G(y) = inf χ F x x 1 (0) = 0 sup y y inf x F(x) G(y) = χ G 1 (0) inf x F(x) G(y) = sup y ( χ G 1 (0)) = inf χ G y 1 (0) = 0

5.2 Beispiele für Lagrangefunktionen 67 Für die Sattelpunkte gilt (x 0, y 0 ) F 1 (0) G 1 (0) Beispiel 5: Für festes x 0 ist die Funktion L : X X Ê definiert durch L(x, x) = F(x) + x 0 x, x genau dann Lagrangefunktion, wenn F konvex und unterhalbstetig ist. Beweis: Es ist ) F (x 0 ) = sup x inf x (F(x) + x 0 x, x ( ) F(x 0 ) = inf x sup x F(x) + x 0 x, x Es gilt F(x 0 ) = F (x 0 ) für alle x 0, falls F konvex und unterhalbstetig ist. Beispiel 6: ÜA Es seien a, b, p, q : Ê Ê stetige Funktionen mit inf y b(y) >, sup x a(x) < und p(x) > 0, q(y) > 0. Dann ist L(x, y) = a(x) + b(y) p(x) + q(y) eine Sattelfunktion.

68 5 LAGRANGEFORMALISMUS 5.3 Spieltheorie 5.3.1 Lagrangefunktionen in der Spieltheorie Besonders deutlich wird die Rolle von Lagrangefunktionen in der Spieltheorie. Hier treffen zwei ähnlich wie in vielen ökonomischen Problemen zwei Parteien mit unterschiedlichen Interessen aufeinander. In der Physik ist das genauso, nur kann sich der Mensch das Wirken unterschiedlicher Interessen schlecht vorstellen. Aber hier gilt wie immer in der Naturwissenschaft: Wir sehen die Natur nicht wie sie ist sondern wie wir sie wahrnehmen. Es sei X = {1,..., n} und Y = {1,..., m}. Dann läßt sich eine allgemeine Funktion L : X Y Ê als Matrix A = (a ij ), i = 1,..., m, j = 1,..., n darstellen. Gegeben sei eine Matrix A = (a ij ), i = 1,..., m, j = 1,..., n, die die möglichen Züge zweier Spieler beschreibt. Spieler A kann einen Wert in der i-ten Zeile bestimmen, Spieler B einen Wert in der j-ten Spalte. Die auf diese Weise festgelegte Zahl a ij beschreibt den Betrag, den A an B zahlen muß. a 11 a 12 a 13 a 14 a 1n a 21 a 22 a 23 a 24 a 2n a 31 a 32 a 33 a 34 a 3n........ a m1 a m2 a m3 a m4 a mn 1) Angenommen A beginnt: Wenn er ein i festlegt, wird B in dieser Zeile das Maximum wählen, also max j a ij. Da A das ahnt, wird es also jenes i wählen, bei dem max j a ij minimal wird. Das ist J A = min i max a ij. j 2) Angenommen B beginnt: Wenn er ein j festlegt, wird A in dieser Spalte das Minimum wählen, also min i a ij. Da B das ahnt, wird es also jenes j wählen, bei dem min i a ij maximal wird. Das ist J B = max min a ij. j i Übersichtlich dargestellt, werden folgende Operationen ausgeführt: a 11 a 12 a 13 a 14 a 1n M 1 a 21 a 22 a 23 a 24 a 2n M 2 a 31 a 32 a 33 a 34 a 3n max = M 3........ a m1 a m2 a m3 a m4 a mn min ( ) max m1 m 2 m 3 m 4 m n = J B. M m min = J A Wie verhalten sich J A und J B zueinander? Das hängt von der Matrix A ab. Es kann sein, daß egal ist, wer anfängt, dann ist J A = J B und die Matrix A erfüllt ein starkes Dualitätsprinzip. So

5.3 Spieltheorie 69 ein Spiel wird fair genannt. Der damit zusammenhängende Sattelwert heißt Nash-Gleichgewicht (nach John Nash, Nobel- und Abelpreisträger). Ein typisches unfaires Spiel ist das Spiel Schere, Stein, Papier. Hier verliert der, der anfängt. Deshalb fangen in der Realität auch beide Spieler gleichzeitig an. Es sei X = Y = {1, 2}. Dann läßt sich eine allgemeine Funktion L : X Y Ê als Matrix L = ( a b c d) darstellen. Wir vergleichen ( ) ( ) a b a b max min min max Spalte Zeile c d Zeile Spalte c d ÜA: Beweise: L ist Lagrangefunktion einer der folgenden Fälle erfüllt ist: max{a, c} min{b, d} max{b, d} min{a, c} max{a, b} min{c, d} max{c, d} min{a, b} ÜA: Ist folgende Aussage richtig? Es sei L eine n m Matrix mit Einträgen aus [0, 1]. Der Anteil der Matrizen, die das Minimax-Theorem erfüllen ist m!n!/(n + m 1)!. 5.3.2 Gemischte Spielstrategien (stochastisches Spiel) Gegeben sei wieder eine Matrix A = (a ij ), i = 1,..., m, j = 1,..., n, die die möglichen Züge zweier Spieler beschreibt. Diesmal muß aber Spieler A nicht einen definierten Wert in der i-ten Zeile bestimmen, sondern kann eine konvexe Kombination (= zufällige Verteilung) der Werte der i-ten Zeile bestimmen. Spieler A muß also nicht einen Index i bestimmen, sondern einen Vektor (x 1,..., x m ) aus dem Simplex P m Ê m. Das gleiche gilt für Spieler B und der j-ten Spalte. Er muß einen Vektor (y 1,..., y n ) aus dem Simplex P n Ê n bestimmen. Auf diese Weise wird ein Wert m,n a ij x i y j festgelegt. Das ist der Betrag, den A an B zahlen muß. Das führt auf i,j=1 die beiden Ergebnisse (in Abhängigkeit davon, wer anfängt) J A = min x P m max J B = max y P n min m,n y P n i,j=1 m,n x P m i,j=1 a ij x i y j = min x P(Y) y P(X) max Tx, Ay a ij x i y j = max y P(X) min x P(Y) Tx,Ay Hier ist T der Transponierungsoperator. Interessanterweise gilt stets J A = J B. Die Funktion L(x, y) = Tx, Ay enthält stets einen Sattelpunkt. Das ist der klassische Satz von vonneumann. Umgekehrt ist das deterministische Spiel ein Spezialfall eines stochastischen Spiels. Es gilt min x ep n max Tx,Ay = min y ep m i max j Te i,ae j = min i max j e i,ae j = min i max a ij j Die Möglichkeit, nicht nur reine Zustände, sondern auch gemischte Zustände auszuwählen, regularisiert das Spiel. ÜA: Finde für Schere, Stein, Papier eine gemischte Strategie.

70 5 LAGRANGEFORMALISMUS 5.4 Existenzbedingungen für Sattelpunkte und Extremwerte Wie immer ist die Existenz eines Extremwertes eine viel schächere Bedingung als die Existenz eines Punktes in dem der Extremwert angenommen wird. Man will vom Verhalten eines Funktionals auf die Existenz von Punkten schließen. Wir werden im weiteren voraussetzen, daß für eine uns interessierende Lagrangefunktion ein Sattelpunkt existiert, falls wir ihn brauchen. Der Vollständigkeit halber führen wir hier ohne Beweis einige solcher Existenzsätze an. Die Idee der Beweise besteht im allgemeinen im folgenden: Man konstruiert eine Folge, die gegen den Extremwert konvergiert. Hier reicht meist die schwache Konvergenz. Die konvergente Folge wird aus einer beschränkten Folge konstruiert. Hierzu ist Kompaktheit und Reflexivität Voraussetzung. 5.4.1 Existenzsätze für Extremalaufgaben Im Allgemeinen nehmen stetige Funktionen auf nicht-kompakten Mengen kein Minimum oder Maximum an. Da wir hier häufig Funktionen auf Banachräumen (die natürlich nicht kompakt sind) betrachten, sind Aussagen sinnvoll, die die Existenz von Extremwerten in nicht kompakten Situationen implizieren. Intuitiv ist klar, daß man für die Existenz eines Minimums die Nicht- Kompaktheit durch schnelles Wachstum außerhalb kompakter Mengen kompensieren kann. Dazu dient folgende Definition: Eine Funktion F : X Ê heißt koerzitiv, falls für jede Folge x n mit lim n x n = gilt: lim n F(x n ) =. Dazu gelten folgende Sätze: Satz: Es sei X reflexiv und F : X Ê stetig, konvex und koerzitiv. Dann nimmt F auf X sein Minimum an. Satz: Es sei X reflexiv und F : X Ê schwach unterhalbstetig und koerzitiv. Dann nimmt F auf X sein Minimum an. Hier heißt schwach unterhalbstetig, daß für alle schwach konvergenten Folgen x n x lim inf n f(x n ) f(x) gilt. 5.4.2 Existenzsätze für Sattelpunkte Die grundlegenden Voraussetzungen für eine Funktion L Sattelfunktion zu sein sind folgende: Es seien X und Y reflexive Banachräume, A X und B Y Teilmengen und L : A B Ê. Im weiteren gelten folgende Voraussetzungen: A nichtleer, konvex, abgeschlossen B nichtleer, konvex, abgeschlossen Für feste y B sei L(, y) konvex und unterhalbstetig Für feste x A sei L(x, ) konvex und unterhalbstetig Satz: Es seien A und B beschränkt. Dann besitzt L einen Sattelpunkt.

5.4 Existenzbedingungen für Sattelpunkte und Extremwerte 71 Satz: Es sei L als Funktion jeder Veränderlicher koerzitiv. Dann besitzt L einen Sattelpunkt. Der klassische Satz zur Existenz von Sattelpunkten ist der folgende Satz (vonneumann): Es seien X und Y reflexive Banachräume, A X und B Y abgeschlossen, beschränkt und konvex. Es sei x L(x, y) konkav und stetig y B y L(x, y) konvex und stetig x A dann existiert ein Punkt (x 0, y 0 ) mit sup x A inf y B L(x, y) = inf y B sup x A L(x, y) = L(x 0, y 0 ) Die Bedingungen an die Räume und die Funktion L lassen sich weiter abschwächen. Hierzu gibt es viele alternative Sätze. 5.4.3 Differenzierbare Sattelfunktionen Es sei L für feste Variable als Funktion der anderen Variablen differenzierbar (es existiere die Gateauxableitung). Satz: Ein Punkt (x 0, y 0 ) ist Sattelpunkt von L genau dann, wenn x L(x 0, y 0 ), x x 0 0, x A y L(x 0, y 0 ), y y 0 0, y B 5.4.4 Notwendige Sattelbedingungen Analog zum Verschwinden der Ableitungen läßt sich zeigen, daß eine notwendige Bedingung für einen Sattelpunkt das Verschwinden beider Ableitungen x L(x, y 0) = 0, x=x0 y L(x 0, y) = 0 y=y0 ist. Diese Eigenschaft beschreibt eine horizontale Tangentialebene. Es ist natürlich nur eine notwendige Bedingung, denn eine Funktion zweier Varabler hat eine horizontale Tangentialebene auch in einem Maximum oder Minimum. Es folgt eine Übersicht über Minima, Maxima und Sattelpunkte. Es sei x X, y Y global lokal d Maximum g(y) g(y 0 ) g(y) y=y0 = 0 dy d Minimum f(x 0 ) f(x) f(x) dx x=x0 = 0 Sattelpunkt L(x 0, y) L(x 0, y 0 ) L(x, y 0 ) L(x, y x 0) x=x0 = 0, L(x y 0, y) = 0 y=y0

72 5 LAGRANGEFORMALISMUS 5.5 Bedingte Extremalaufgaben 5.5.1 Lagrangefunktionen und Extremalaufgaben Aus der Analysis ist gut bekannt, daß man bedingte Extremalaufgaben mit der Lagrangemethode der Einführung von Lagrange-Multiplikatoren lösen kann. Wir beweisen hier diese Methode mit Mitteln der konvexen Analysis für allgemeine nicht-glatte Funktionen. Die Idee der Lagrangemethode besteht darin, anstelle eines Extremalproblems auf einer Teilmenge, ein spezielles Sattelproblem auf dem ganzen Raum zu betrachten. Wir betrachten zwei stetige Funktionen F : Y Ê und G : Y Ê und suchen das Minimum von F(y) unter der Nebenbedingung G(y) = 0. Es sei M = {y Y G(y) = 0} diese Menge, die oft zulässige Menge genannt wird. Dazu betrachten wir eine weitere Funktion L(x, y) = F(y) xg(y). Der Einfachheithalber setzen wir inf y F(y) > und sup y + voraus. Wir beweisen folgenden Satz: Der Punkt (x 0, y 0 ) ist ein Sattelpunkt von L genau dann, wenn y 0 M und F(y 0 ) das Minimum von F(y) auf M bildet. Beweis = : Es sei (x 0, y 0 ) Sattelpunkt der Funktion L(x, y). Dann gilt nach Definition des Sattelpunktes L(x 0, y) 1 L(x 0, y 0 ) 2 L(x, y 0 ) F(y) x 0 G(y) 1 F(y 0 ) x 0 G(y 0 ) 2 F(y 0 ) xg(y 0 ) Ungleichung 2 gilt für alle x also auch für x = x 0 x. Das heißt, es gilt für alle x die Ungleichung x G(y 0 ) 0. Aber das ist nur für G(y 0 ) = 0 möglich, d.h. der linke Anteil des Sattelpunktes gehört zur zulässigen Menge y 0 M. Mit G(y 0 ) = 0 folgt aus Ungleichung 1 F(y 0 ) F(y) x 0 G(y) also für alle y M die Ungleichung F(y 0 ) F(y), y M Aber das bedeutet gerade, daß y 0 das Minimum von F(y) auf M bildet. Beweis =: Hier ist zu zeigen, daß unter der Annahme, daß F(y) in y 0 ein Minimum auf M hat, es ein x 0 gibt, sodaß (x 0, y 0 ) ein Sattelpunkt auf Ê Y ist. Das heißt, aus einer Ungleichung auf M folgt eine Ungleichung auf Y. Wir zeigen, daß die Funktion L(x, y) ein minimax-theorem erfüllt. 1): Die Funktion g(y) = sup x ( F(y) xg(y) ) ist überall + außer für die y mit G(y) = 0. Dort ist g(y) = F(y). Das heißt, ( ) F(y 0 ) = min F(y) = min g(y) = min sup F(y) xg(y). y M y M y x

5.5 Bedingte Extremalaufgaben 73 2) Wir zeigen jetzt, daß ( ) F(y 0 ) max inf F(y) xg(y) x y gilt. Es sei f(x) = inf y ( F(y) xg(y) ) Diese Funktion ist als Infimum affiner Funktionen konkav und oberhalbstetig. Den Fall f(x) schließen wir aus. Das ist gerade der Fall, wenn F(y) = oder G(y) = für gewisse y. Z.B., wenn F(y) schneller nach geht als G(y) nach für wachsende y. Wir untersuchen, wie sich f(x) für x ± verhält. Die Funktion G(x) ist außerhalb der Menge M positiv oder negativ. Für x + sind die positiven Werte von G(y) die dominierenden in F(y) xg(y), für x die negativen Werte von G(y). In beiden Fällen geht also f(x). Damit ist f(x) konvex, koerzitiv und unterhalbstetig. f(x) nimmt ihr Maximum im Inneren von Ê an. Dieser Punkt sei x 0. Es gilt also f(x 0 ) = max x f(x) = max inf x y ( F(y) xg(y) ) Wir zeigen f(x 0 ) F(y 0 ). Damit wäre zusammen mit der stets geltenden schwachen Dualität f(x 0 ) = F(y 0 ) gezeigt. Angenommen, f(x 0 ) < F(y 0 ), d.h., es gilt inf y ( F(y) x0 G(y) ) < F(y 0 ) = inf y M F(y) dann kann das Infimum links nicht auf M angenommen werden. Dann gibt es eine Folge (y n ) M mit F(y n ) x 0 G(y n ) < F(y 0 ) und G(y n ) > 0 (oder G(y n ) < 0). Jetzt läßt sich x 0 verkleinern (vergrößern) und daß Supremum in sup x f(x) wird größer. Das ist ein Widerspruch dazu, daß f(x 0 ) das Supremum war. Bemerkung 1: Es sei G(x) = G 0. Dann ist L(x, y) = F(y) x(g(y) G 0 ) zu wählen. Wenn L glattist, dann ist G 0 L = x und x läßt sich interpretieren als die Größe, die die Änderung von L in Abhängigkeit von G 0 angibt. Bemerkung 2: Die Idee hinter der Methode besteht darin, daß man außerhalb der Menge M den Ausdruck xg(y) durch Wahl des x beliebig groß oder klein machen kann, da dort G(y) 0. D.h., eigentlich betrachtet man eine Funktion, die außerhalb von M den Wert annimmt. Bemerkung 3: Ein bedingtes Extremalproblem ist eigentlich ein Sattelproblem für eine Funktion, die in einer Variablen zu einer linearen Funktion entartet ist.

74 5 LAGRANGEFORMALISMUS 5.5.2 Der allgemeine Fall. Die Euler-Lagrange-Gleichung Wir betrachten jetzt ein Minimumproblem für ein Funktional F : Y Ê mit einer allgemeinen Nebenbedingung. Es sei G : Y X eine Abbildung, x 0 X und M = {y Y G(y) = x 0 } die zulässige Menge. Wir betrachten das Minimumproblem F(y 0 ) = min y M F(y) Dazu stellen wir folgende Lagrangefunktion auf: L(x, y) = F(y) x, G(y) x 0. Unter allgemeinen Bedingungen an F und G gilt folgender Satz: Der Punkt (x 0, y 0) ist ein Sattelpunkt von L genau dann, wenn y 0 M und F(y 0 ) das Minimum von F(y) auf M bildet. Angenommen F und G sind ausreichend glatt, dann erfüllt der Sattelpunkt (x 0, y 0) die notwendige Bedingung L = 0 und L = 0. Die erste Gleichung ist einfach die Nebenbedingung. x y Die zweite Gleichung ist formal soetwas wie F (y) x, G (y) = 0. Um diesen Ausdruck zu verstehen, führen wir folgende Definition ein: Definition: Eine Abbildung G : Y X heißt im Punkt y Frechet-differenzierbar, wenn ein linearer Operator G (y) : Y X existiert und für alle h Y gilt G(y + h) = G(y) + G (y)h + ω(x, h) mit ω X 0 für h Y 0. Definition: Ein Punkt y M heißt regulärer Punkt der Menge M, falls G in diesem Punkt Frechet-differenzierbar ist und R(G (y)) = X. Eine notwendige Bedingung für das genannte Minimumproblem gibt folgender Satz: Es sei y 0 Lösung des Minimumproblems F(y 0 ) = min y M F(y). F sei Gateauxdifferenzierbar, G Frechet-differenzierbar in y 0 und y 0 regulärer Punkt von M, dann existiert ein Funktional x X, sodaß gilt h, F (y 0 ) G (y 0 )h, x = 0, h Y Diese Gleichung heißt vage Euler-Lagrange-Gleichung des Minimumproblems und x heißt Lagrangemultiplikator. Fall G (y 0 ) darüber hinaus dicht definiert ist, existiert sein adjungierter [G (y 0 )] und x erfüllt die starke Euler-Lagrange-Gleichung F (y 0 ) [G (y 0 )] x = 0 Zusammen mit der Gleichung der Nebenbedingung kann auf diese Weise der Sattelpunkt (x, y 0 ) berechnet werden.

5.5 Bedingte Extremalaufgaben 75 5.5.3 Beispiel: Quadratisches Funktional und lineare Nebenbedingung Wir betrachten das Minimumproblem 1 min y M 2 y,ay mit M = {y : y, y = c}. Das führt auf die Lagrangefunktion L(y, λ) = 1 2 y,ay λ( y, y c) und die Euler-Lagrange-Gleichung 0 = L(y, λ) = Ay λy y mit der Lösung y = λa 1 y. Das, eingesetzt in die Nebenbedingung, ergibt c = y, y = λ y,a 1 y Damit erhält man als Lösung y = c y,a 1 y A 1 y 5.5.4 Berechnung der Höhe des Simplex im Ê n Der Simplex im Ê n ist gegeben durch den Schnitt einer Ebene mit den Koordinatenachsen. Seine Höhe ist der kürzeste Abstand dieser Ebene zum Koordinatenursprung. Die Ebene sei gegeben durch die Achsenabschnittsgleichung x 1 a 1 + x 2 a 2 +... + x n a n = 1 mit gegebenen Achsenabschnitten a 1, a 2,..., a n. Nach der Lagrangemethode (damit λ eine Länge ist, wählen wir als Multiplier 2λ 2 ) kann das gesuchte Minimum mit der Sattelfunktion ( n n ) L(x, λ) = x 2 i x i 2λ2 1 a i=1 i=1 i berechnet werden. Das ergibt x j L(x, λ) = 2x j 2λ 2 1 a j = 0 = Aus der Nebenbedingung folgt 1 = n i=1 x i a i = λ 2 n i=1 1 a 2 i = 1 λ 2 = n Das Minimum wird angenommen bei x j = λ2 a j = 1 a j n 1 a 2 i=1 i i=1 λ 2 = x j a j 1 a 2 i

76 5 LAGRANGEFORMALISMUS und beträgt h 2 = ( n n x 2 i = j=1 i=1 Wir erhalten 1 n h = 1 2 i=1 a 2 i ) ( n ) 2 ( n ) 1 1 1 1 = = λ 2 a 2 j i=1 a 2 i i=1 den Satz des Pythagoras für die Kehrwerte. Wie bekannt, ist das Volumen des Simplex der n-te Teil des Produktes aus Grundfläche und Höhe. Wir können dieses Volumen auf (n + 1) Weise berechnen: nv = h A = a 1 a 2 a n = a i A i mit dem Flächeninhalt A der Grundfläche und den Flächeninhalten A i der Flächen, senkrecht zur i-ten Achse. Wir multiplizieren Gleichung (15) mit n 2 V 2 und erhalten A 2 = A 2 1 + A2 2 +... + A2 n Damit erhalten wir zusammen mit der bekannten Formel für die Länge der Diagonale d im Quader folgende n-dimensionale Verallgemeinerungen des Satzes des Pythagoras: 1 h 2 = 1 a 2 1 + 1 a 2 2 +... + 1 a 2 n d 2 A 2 = a 2 1 + a 2 2 +... + a 2 n = A 2 1 + A2 2 +... + A2 n 5.5.5 Beispiel: Quadratisches Funktional und quadratische Nebenbedingung Es seien zwei lineare Operatoren A,B : Y Y gegeben. Wir betrachten das Minimumproblem 1 min y M 2 y,ay mit M = {y : 1 y,by = c}. Das führt auf die Lagrangefunktion 2 L(y, λ) = 1 ( ) 1 2 y,ay λ 2 y,by c und die entsprechende Euler-Lagrange-Gleichung 0 = L(y, λ) = Ay λby y Diese Gleichung heißt zusammen mit der Nebenbedingung y, By = 1 verallgemeinertes Eigenwertproblem. Der Fall B = I enspricht der Erzeugung eines Hilbertraumes aus Y. Wir erhalten das klassische Eigenwertproblem. Bemerkung: Quadratische Funktionale mit linearen oder quadratischen Nebenbedingungen sind die einfachsten bedingten Minimumproblem. Daß auch diese im allgemeinen nicht leicht zu lösen sind, zeigt wie schwer es für allgemeine Sattelprobleme ist, eine Lösung zu finden. a 2 i (15)

5.5 Bedingte Extremalaufgaben 77 5.5.6 Zusatzbedingungen als Ungleichungen Die Lagrangemethode läßt sich auf Nebenbedingungen in Ungleichungsform verallgemeinern. Zu beachten ist hierbei, daß das entsprechende Problem fü den Lagrangemultiplikator nicht im ganzen Raum betrachtet werden darf sondern nur dort (z.b. im positiven Kegel), daß die Nebenbedingung wie im Fall einer Gleichung als Nebenbedingung in eine charakteristische Funktion übergeht. Es ist und sup x, x = χ {0} (x ) x sup x, x = x A Wir betrachten den allgemeineren Fall mehrerer Zusatzbedingungen, die durch eine Ungleichung gegeben seien. Es seien F : G : x X Y Ê Y X Wir betrachten das bedingte Minimumproblem F(y 0 ) = inf y Y F(y) M = {y Y G(y) 0} Zu diesem Problem betrachten wir die Funktion L(y, x ) = F(y) + G(y), x, (y, x ) Y X + Es gilt folgender Satz: (x 0, y 0) ist genau dann ein Sattelpunkt von L(y, x ) mit y Minimum unter der angegebenen Nebenbedingung annimmt. Beweis: Da L Lagrangefunktion mit Sattelpunkt (x 0, y0 ) ist, gilt Y +. wenn F in y 0 ein L(x 0, y ) L(x 0, y 0 ) L(x, y 0 ), x X, y 0 Y + F(x 0 ) + G(x 0 ), y 1 F(x 0 ) + G(x 0 ), y 0 2 F(x) + G(x), y 0, x X, y 0 Y + Ungleichung 1 gilt für beliebige y 0, also auch für beliebige y = y 0+h mit h 0. Daraus folgt G(x 0 ), y 0 + h 1 G(x 0 ), y 0 also G(x 0), h 0 für beliebige h 0. Also G(x 0 ) 0. Setzt man in Ungleichung 1 y = 0 erhält man 0 G(x 0 ), y 0. Da G(x 0 ), y 0 für alle y 0 gilt, folgt G(x 0 ), y 0 = 0. Damit folgt aus Ungleichung 2 F(x 0 ) 2 F(x) + G(x), y 0. Das heißt, für alle x X, also die x mit G(x) 0 gilt F(x 0 ) F(x). Satz: Es sei (x 0, y 0 ) ein Sattelpunkt von L(x, y ) mit y Y. Dann ist x 0 Lösungspunkt der Aufgabe F(x 0 ) = inf x X F(x) X = {x X G(x) = 0}

78 5 LAGRANGEFORMALISMUS Der Unterschied zum Satz eben besteht darin, daß im aktuellen Fall die Sattelpunktbedingung für alle y Y gelten muß. Entsprechend kleiner ist die Menge X der zulässigen x. Beweis: Da L Lagrangefunktion mit Sattelpunkt (x 0, y0 ) ist, gilt L(x 0, y ) L(x 0, y 0 ) L(x, y 0 ), x X, y Y F(x 0 ) + G(x 0 ), y 1 F(x 0 ) + G(x 0 ), y 0 2 F(x) + G(x), y 0, x X, y Y Ungleichung 1 gilt für beliebige y, also auch für beliebige y = y 0 + h mit beliebigem h. Daraus folgt G(x 0 ), y 0 + h 1 G(x 0 ), y 0 also G(x 0 ), h 0 für beliebige h. Das ist nur für G(x 0 ) = 0 möglich. Damit folgt aus Ungleichung 2 F(x 0 ) 2 F(x) + G(x), y 0. Das heißt, für alle x X gilt F(x 0 ) F(x).