Lagrange-Formalismus

KAPITEL II Lagrange-Formalismus Die im letzten Kapitel dargelegte Formulierung der Mechanik nach Newton ist zwar sehr intuitiv: man zählt alle auf das zu studierende System wirkenden Kräfte auf, schreibt ihre Resultierende auf die rechte Seite des zweiten Newton schen Gesetzes (I.2) auf, und löst die sich daraus ergebende Differentialgleichung möglicherweise anhand eines numerischen Verfahrens. In der Praxis kann der hier skizzierte Vorgang sich als nicht so direkt herausstellen. Zum einen können die Kräfte nicht einfach formulierbar sein, insbesondere wenn es sich um eine Zwangskraft handelt, welche die Bewegung des Systems einschränkt, von dem Bewegungszustand aber abhängt. Dies passiert z.b. im Fall eines Pendels, in welchem die Stange eine Zwangskraft auf die Masse am Ende des Pendels übt, die von der Position und Geschwindigkeit der Masse abhängt. Zum anderen können die natürlichen Variablen der Newton schen Beschreibung, d.h. die zeitabhängigen Koordinaten von Ortsvektoren, nicht die geeignetsten sein. Zur Beseitigung der besagten Schwierigkeiten kann man zunächst die Newton schen Bewegungsgleichungen (I.2) verallgemeinern, um Zwangskräfte in einer geeigneten Form zu berücksichtigen: diese erste Erweiterung des Formalismus führt zu den sog. Lagrange (i) -Gleichungen erster Art. In einem zweiten Schritt werden verallgemeinerte Koordinaten eingeführt und die Lagrange-Gleichungen erster Art so manipulieren, dass die Zwangskräfte in den resultierenden Gleichungen nicht mehr auftreten. Somit erhält man die Lagrange-Gleichungen zweiter Art. Anstatt dieser Vorgehensweise zu folgen, (8) kann man die Lagrange-Gleichungen zweiter Art aus einem neu postulierten Prinzip folgern, dem Hamilton (j) -Prinzip. Um dieses mathematisch formulieren zu können, ist es notwendig, ein Ergebnis aus der Variationsrechnung einzuführen (Abschn. II.1). Abschnitt II.2 befasst sich zuerst mit den Definitionen der verallgemeinerten Koordinaten und einiger anderen Größen, die eine zentrale Rolle im Hamilton-Prinzip spielen. Dann wird das letztere formuliert und die daraus folgenden Lagrange-Gleichungen zweiter Art hergeleitet, die in diesem Rahmen öfter als Euler Lagrange-Gleichungen bezeichnet werden. II.1 Ein Resultat aus der Variationsrechnung In diesem Abschnitt wird zunächst die Definition eines Funktionals, d.h. einer Funktion von Funktionen, gegeben ( II.1.1). Dann wird ein nützliches Ergebnis dargelegt, um die Funktionen, die eine bestimmte Funktional extremal machen, zu charakterisieren ( II.1.2). II.1.1 Funktional Im mathematischen Sinne ist eine Funktion oder Abbildung f eine Beziehung, die jedem Element x einer (Definitions-)Menge genau ein Element f(x) einer anderen Menge (Zielmenge) zuordnet. Im physikalischen Kontext ist die Definitionsmenge oft eine Untermenge ein Gebiet eines endlichdimensionalen (Vektor)Raums V, insbesondere R, C, R n, oder C n, wobei n N. Das gleiche gilt für die Zielmenge V. (8) Die interessierte Leserin kann diesen Zugang z.b. in Fließbach [1], Kap. 7 9 finden. (i) J.-L. Lagrange, 1736 1813 (j) W. R. Hamilton, 1805 1865

40 Lagrange-Formalismus Als Funktional bezeichnen Physiker eine Abbildung F, deren Definitionsmenge V ein unendlichdimensionaler Funktionenraum ist, während die Zielmenge V entweder R oder C ist. Der Wert eines Funktionals F für eine Funktion f V wird mit F [f], oder manchmal mit F [f(x)], bezeichnet. Im Folgenden wird die Zielmenge von Funktionalen immer R sein. Wiederum werden die Funktionen f der Definitionsmenge bestimmte Eigenschaften besitzen: meistens sind das (mindestens einmal) stetig differenzierbare Funktionen. Beispiel 1: In diesem und den folgenden Beispielen ist die Definitionsmenge der jeweiligen Funktionale der Raum der stetig differenzierbaren Funktionen f : R R, die automatisch stetig und integrierbar auf jedem endlichen Intervall sind. Seien zwei reelle Zahlen < x 2 ; die Integration über das Intervall [, x 2 ] definiert ein Funktional: (9) F [f] f(x) dx. Beispiel 2: Sei x 0 R. Die Abbildung, die jeder Funktion f ihren Wert im Punkt x 0 zuordnet, ist ein Funktional: F [f] = f(x 0 ) = δ(x x 0 )f(x) dx, wobei in der zweiten Gleichung das Dirac (k) -Delta eingeführt wurde. Beispiel 3: Eine reelle Funktion x y(x) lässt sich günstig als Kurve in der (x, y)-ebene darstellen. Wenn < x 2 zwei reelle Zahlen sind, dann ist die Länge l[y] der Kurve y(x) zwischen den Punkten P 1 = (, y( ) ) und P 2 = ( x 2, y(x 2 ) ) ein Funktional P2 P2 l[y] = dl = (dx) 2 + (dy) 2 = 1 + [ y (x) ] 2 dx (II.1) P 1 P 1 wobei y die Ableitung von y nach x bezeichnet. Beispiel 4: Sei Φ eine reelle Funktion von drei reellen Argumenten und < x 2 zwei reelle Zahlen. Dann definiert die Formel F [f] = Φ ( x, f(x), f (x) ) dx ein Funktional, das wir im nächsten Paragraphen wieder diskutieren werden. II.1.2 Extremierung eines Funktionals II.1.2 a Euler-Gleichung Sei Φ eine stetig differenzierbare Funktion von drei reellen Variablen und < x 2 gegebene reelle Zahlen. Wir betrachten das Funktional F [f] = Φ ( x, f(x), f (x) ) dx mit f einer stetig differenzierbaren reellen Funktion auf dem Intervall [, x 2 ] und f deren Ableitung, wobei die Werte an den Grenzen gegeben sind: f( ) = y 1 und f(x 2 ) = y 2. Hiernach werden die partiellen Ableitungen von Φ mit / x, / f und / f bezeichnet. Wir wollen eine notwendige Bedingung dafür herleiten, dass das Funktional ein Extremum Minimum oder Maximum für eine Funktion f 0 hat. Das heißt, für alle Funktionen f(x), die f( ) = y 1 und f(x 2 ) = y 2 erfüllen, gilt F [f] F [f 0 ] (falls F minimal für f 0 ) bzw. F [f] F [f 0 ] (Maximum für f 0 ). (9) Mathematisch wird eher das Integral als Funktional mit bestimmten Eigenschaften (wie Linearität) definiert... (k) P. A. M. Dirac, 1902 1984

II.1 Ein Resultat aus der Variationsrechnung 41 Sei δf eine beliebige stetig differenzierbare Funktion [, x 2 ] R, mit δf( ) = δf(x 2 ) = 0. Dann ist λ F [f 0 + λ δf] eine Funktion von R nach R. Damit F extremal in f 0 sei, muss die Ableitung dieser Funktion nach λ Null für λ = 0 sein: df [f 0 +λ δf] dλ = 0. λ=0 Mit dem Einsetzen des Ausdrucks von F [f 0 +λ δf] als Integral und dem Austausch von der Ableitung nach λ und der Integration über x ergibt sich df [f 0 +λ δf] = d [ Φ ( x, f 0 (x)+λ δf(x), f dλ dλ 0(x)+λ δf (x) ) ] [ ] dx = δf(x) + f f δf (x) dx, wobei die partiellen Ableitungen im Punkt ( x, f 0 (x)+λ δf(x), f 0 (x)+λ δf (x) ) zu berechnen sind. Der zweite Summand im Integranden des letzten Terms lässt sich mithilfe einer partiellen Integration umschreiben: f δf (x) dx = [ ] x2 f δf(x) d dx ( ) f δf(x) dx. Dank der Bedingung δf( ) = δf(x 2 ) = 0 verschwindet der integrierte Term auf der rechten Seite. Somit gilt df [f 0 +λ δf] x2 [ = dλ f d ( )] dx f δf(x) dx. Dies muss für λ = 0 verschwinden, d.h. wenn die partiellen Ableitungen im Punkt ( f 0 (x), f 0 (x), x) genommen sind. Da die Wahl der Variation δf bis auf ihren Werten an den Rändern beliebig ist, findet man einfach, dass die Differenz in den eckigen Klammern selbst identisch verschwinden muss, (10) d.h. ( x, f 0 (x), f 0 (x)) d ( ( x, f0 (x), f 0 (x)) ) f dx f = 0 x [, x 2 ]. Somit haben wir bewiesen das Theorem: Sei Φ eine in allen ihren drei reellen Variablen stetig differenzierbare Funktion und, x 2, y 1, y 2 gegebene reelle Zahlen mit < x 2. Für stetig differenzierbare Funktionen f : [, x 2 ] R, die f( ) = y 1 und f(x 2 ) = y 2 erfüllen, wird das Funktional F [f] = Φ ( x, f(x), f (x) ) dx (II.2a) definiert. Wenn F ein Extremum für eine Funktion f 0 hat, dann erfüllt f 0 die Euler-Gleichung ( x, f(x), f (x) ) = d ( ( x, f(x), f (x) ) ) f dx f x [, x 2 ]. (II.2b) Bemerkungen: Bei gegebener Φ ist die zugehörige Euler-Gleichung eine gewöhnliche Differentialgleichung zweiter Ordnung in f. Wenn die Funktion Φ bestimmte Bedingungen erfüllt, kann man auch zeigen, dass eine Lösung der Euler-Gleichung (II.2b) auch Lösung des Extremierunsproblems für F ist. Die Anwesenheit eines Extremum für das Funktional F wird (durch Physiker) oft mit der kurzen Schreibweise δf [f] = 0 bezeichnet. (10) Dies bildet das Fundamentallemma der Variationsrechnung.

42 Lagrange-Formalismus Das obige Theorem lässt sich auf den Fall eines Funktionals F [f 1,..., f N ] = Φ ( x, f 1 (x), f 1(x),..., f N (x), f N(x) ) dx (II.3a) von N Funktionen f a, a = 1,..., N verallgemeinern, wobei Φ jetzt eine stetig differenzierbare Funktion von 2N + 1 reellen Variablen ist. Wenn ein Satz (f 1,..., f N ) das Funktional F minimiert oder maximiert, dann genügen die zugehörigen Funktionen den N Euler-Gleichungen = d ( ) f a dx f a x [, x 2 ] (II.3b) für jedes a {1,..., N}. Das Theorem kann auch verallgemeinert werden, um den Fall eines Funktionals zu berücksichtigen, dessen Argumente Funktionen mehrerer Variablen,..., x p sind: ( F [f] = Φ,..., x p, f(,..., x p ), f(,..., x p ),..., f(x ) 1,..., x p ) d... dx p, (II.4a) D x p mit D einem p-dimensionalen Integrationsgebiet. Dabei ist Φ jetzt eine stetig differenzierbare Funktion von 2p+1 reellen Variablen. Wenn eine Funktion f das Funktional F minimiert oder maximiert, dann erfüllt sie die Euler-Gleichung p ( ) f = x D (II.4b) x j ( f/ x j ) j=1 Schließlich lässt sich auch die Extremierung von Funktionalen von N Funktionen von p Variablen behandeln, indem die zwei obigen Verallgemeinerungen kombiniert werden. II.1.2 b Beispiel Als Anwendung der Euler-Gleichung können wir den (bekannten!) kürzesten Weg zwischen zwei Punkten (, y 1 ) und (x 2, y 2 ) in der Ebene suchen. Das heißt, wir möchten die Kurve f(x) finden, die f( ) = y 1 und f(x 2 ) = y 2 erfüllt und das Funktional l[f] = 1 + [ f (x) ] 2 dx (II.1) minimiert. Dieses Funktional ist der Form (II.2a) mit Φ ( x, f(x), f (x) ) = 1 + [f (x)] 2. Die zugehörigen partiellen Ableitungen sind x = 0, f = 0, f (x) f = 1 + [f (x)]. 2 Leitet man die letztere nach x ab, so ergibt sich ( ) d f (x) dx f = ( 1 + [f (x)] 2) 3/2 mit f der zweiten Ableitung von f. Die Euler-Gleichung (II.2b) lautet dann f = d ( ) f (x) dx f 0 = ( 1 + [f (x)] 2) 3/2. Dies gibt sofort f (x) = 0: nach doppelter Integration unter Berücksichtigung der Randbedingungen in und x 2 kommt f(x) = y 1 + y 2 y 1 x 2 (x ), d.h. die Gleichung der Gerade zwischen den zwei Endpunkten, was zu erwarten war. Bemerkung: Zur Berechnung der totalen Ableitung nach x von / f kann man entweder den Ausdruck der partiellen Ableitung direkt ableiten, oder die Kettenregel anwenden und dafür die drei zweiten Ableitungen 2 Φ/ x f, 2 Φ/ f f und 2 Φ/ f 2 berechnen und mit jeweils x = 1, f (x) und f (x) multiplizieren. Natürlich führen beide Wege zum gleichen Ergebnis.

II.2 Hamilton-Prinzip 43 II.2 Hamilton-Prinzip Was machen wir in diesem Abschnitt? II.2.1 Definitionen II.2.1 a Verallgemeinerte Koordinaten Sei ein System Σ aus N Massenpunkten. Die N Ortsvektoren x a (t) mit a {1,..., N} sind äquivalent zu 3N Koordinaten. Wenn die Massenpunkte sich unabhängig voneinander bewegen können, dann besitzt das System genau s = 3N Freiheitsgrade. In der Praxis untersucht man oft aber Probleme, in denen es (feste) Zusammenhänge zwischen den 3N Koordinaten gibt: z.b. ist der Abstand zwischen zwei Massenpunkten festgelegt, oder die Massenpunkte müssen auf irgendeiner Fläche bleiben. In solchen Fällen sind die 3N Koordinaten der Positionen nicht unabhängig von einander, d.h. die Anzahl s der Freiheitsgrade des Systems ist kleiner als 3N. Es ist daher sinnvoll, mit nur s Größen zu arbeiten, anstatt mit N. Somit führt man zur Charakterisierung eines mechanischen Systems s verallgemeinerte bzw. generalisierte Koordinaten q 1 (t), q 2 (t),..., q s (t) ein, welche die folgenden Bedingungen erfüllen: i. Sie legen den Zustand des Systems eindeutig fest, d.h. jede Position x a (t) mit a {1,..., N} lässt sich als eine bestimmte Funktion die auch mit x a bezeichnet wird der Zeit und der s verallgemeinerten Koordinaten schreiben: x a (t) = x a ( t, q1 (t),..., q s (t) ) a {1,..., N} (II.5) ii. Sie sind alle voneinander unabhängig, d.h. es existiert keine Funktion f von s+1 Argumenten, für die f ( t, q 1 (t),..., q s (t) ) = 0 für jede Zeit t gilt. Die Newton schen Bewegungsgleichungen sind Differentialgleichungen zweiter Ordnung, so dass man neben den Positionen x a (t) noch die N Geschwindigkeiten x a (t) betrachten muss, um die Zeitentwicklung für t > t zu bestimmen. Laut Gl. (II.5) sind diese Geschwindigkeiten Funktion von der Zeit t, den verallgemeinerten Koordinaten q i (t) für i {1,..., s}, und von deren Zeitableitungen. Dementsprechend muss man auch die verallgemeinerten Geschwindigkeiten q i (t) in Betracht ziehen. Genau wie die Geschwindigkeiten x a (t) im Allgemeinen unabhängig von den Positionen x a (t), gilt dies auch für die verallgemeinerten Geschwindigkeiten und Koordinaten. Der Kürze halber werden die s generalisierten Koordinaten q i (t) bzw. Geschwindigkeiten q i (t) kollektiv als ein s-dimensionaler Vektor q(t) bzw. q(t) bezeichnet. Bemerkungen: Während die Anzahl s der Freiheitsgrade für ein bestimmtes Problem eindeutig festgelegt ist, gilt das im Allgemeinen nicht für die verallgemeinerten Koordinaten q i (t), entsprechend z.b. der Freiheit bei der Wahl von Koordinaten. Genau wie es schon der Fall bei üblichen Koordinaten ist, haben verallgemeinerte Koordinaten nicht unbedingt die Dimension einer Länge. II.2.1 b Lagrange-Funktion. Wirkung Jedem System aus s Freiheitsgraden kann eine reelle Funktion von 2s + 1 (reellen) Variablen zugeordnet werden, die Lagrange-Funktion L, welche die Bewegung des Systems völlig bestimmt, und die (physikalische) Dimension einer Energie hat. Dabei nimmt die Funktion als Argumente die Zeit t, die s verallgemeinerten Koordinaten q i (t) und s verallgemeinerten Geschwindigkeiten q i (t): L ( t, q(t), q(t) ). (II.6) Somit ergibt sich eigentlich eine Funktion der Zeit t alleine.

44 Lagrange-Formalismus Die Form der Lagrange-Funktion wird später angegeben, nachdem ihre Rolle in der Bestimmung der Bewegungsgleichungen eines Systems genauer präzisiert worden ist (vgl. II.2.3). Es sei aber schon hier erwähnt, dass diese Form nicht eindeutig festgelegt ist, auch wenn die verallgemeinerten Koordinaten gewählt wurden. Seien jetzt zwei Zeitpunkte t 1 < t 2. Das Integral der Funktion (II.6) über das Zeitintervall [t 1, t 2 ] definiert die Wirkung, die auch Wirkungsintegral genannt wird: S[q] t2 t 1 L ( t, q(t), q(t) ) dt. (II.7) In der Schreibweise wurde schon berücksichtigt, dass die Wirkung von den verallgemeinerten Koordinaten und Geschwindigkeiten q i (t), q i (t) abhängt, so dass es sich um ein Funktional handelt weshalb S[q] auch als Wirkungsfunktional bezeichnet wird. Die Wirkung hat die Dimension des Produkts von Energie und Zeit, d.h. die zugehörige Einheit im SI-System ist das J s = kg m 2 s 1. II.2.2 Hamilton-Prinzip. Euler Lagrange-Gleichungen Es seien t 1 < t 2. Bei dem Hamilton-Prinzip handelt es sich um ein Extremalprinzip, laut dem die Zeitentwicklung eines Systems im Intervall [t 1, t 2 ] so erfolgt, dass die physikalisch realisierten verallgemeinerten Koordinaten q(t) und Geschwindigkeiten q(t) das Wirkungsfunktional (II.7) extremal (oder stationär ) machen. Dies wird oft kurz als Hamilton-Prinzip: δs[q] = 0 (II.8) ausgedrückt. Gemäß dem in II.1.2 a angegebenen Theorem genügt dann das Integrand des Wirkungsintegrals, d.h. die Lagrange-Funktion L, den Euler-Gleichungen (II.3b), die in diesem Kontext als Euler Lagrange-Gleichungen bezeichnet werden: L ( t, q(t), q(t) ) q i ( ( )) L t, q(t), q(t) = d dt q i i {1,..., s}. (II.9) Diese s Differentialgleichungen zweiter Ordnung für die s verallgemeinerten Koordinaten stellen die Bewegungsgleichungen des Systems dar. Bemerkungen: Das Hamilton-Prinzip wird auch als das Wirkungsprinzip, das Prinzip der stationären Wirkung oder, fehlerhaft, das Prinzip der kleinsten Wirkung bezeichnet. Wiederum werden die Euler Lagrange-Gleichungen (II.9) noch Lagrange-Gleichungen zweiter Art genannt. Die Lagrange-Funktion für ein gegebenes System ist nicht eindeutig: wenn L ( t, q(t), q(t) ) eine mögliche Lagrange-Funktion bezeichnet, dann ist L ( t, q(t), q(t) ) L ( t, q(t), q(t) ) + d dt M( t, q(t) ) (II.10) eine äquivalente Lagrange-Funktion, die zu denselben Euler Lagrange-Gleichungen führt, wobei M eine beliebige stetig differenzierbare Funktion der Zeit und der generalisierten Koordinaten ist.

II.2 Hamilton-Prinzip 45 Beweis: das mit L berechnete Wirkungsintegral lautet t2 S [q] L ( t, q(t), q(t) ) t2 ( ) dm t, q(t) dt = S[q] + dt = S[q] + M ( t 2, q(t 2 ) ) M ( t 1, q(t 1 ) ). t 1 dt t 1 Unter Variationen q q + δq, mit δq(t 1 ) = δq(t 2 ) = 0 bleiben die zwei letzten Terme unverändert, d.h. sie haben keinen Einfluss auf die Position des Extremums bzw. auf die Euler Lagrange- Gleichungen. Alternativ kann man die totale Ableitung nach der Zeit dm ( t, q(t) ) /dt durch die partiellen Ableitungen (nach t und nach den q i ) ausdrücken. Dann findet man, dass der zusätzliche Term in der Lagrange-Funktion Beiträge zu den beiden Seiten der Euler Lagrange-Gleichungen liefert, die sich gegenseitig kompensieren. Die Invarianz der Bewegungsgleichungen unter Transformationen (II.10) wird manchmal als Eichinvarianz bezeichnet, und eine derartige Transformation als Eichtransformation. Die Euler Lagrange-Gleichungen (II.9) sind Form-invariant oder kovariant unter den gleichzeitigen Transformationen q a (t) q a(t) = q a ( ) t, q(t) (II.11a) L ( t, q(t), q(t) ) L ( t, q (t), q (t) ) ( L t, q ( t, q (t) ), q ( t, q (t) )), (II.11b) entsprechend einem Koordinatenwechsel. Beweis: ohne Schwierigkeit. Definition: Der verallgemeinerte Impuls wird definiert als p i ( t, q(t), q(t) ) L ( t, q(t), q(t) ) q i (II.12) Falls die Lagrange-Funktion nicht explizit von einer verallgemeinerten Koordinaten q i abhängt, dann folgt sofort aus der entsprechenden Euler Lagrange-Gleichung, dass der zugehörige generalisierte Impuls p i eine Erhaltungsgröße ist.