Reelle Analysis. Vorlesungsskript. Enno Lenzmann, Universität Basel. 7. November 2013

Reelle Analysis Vorlesungsskript Enno Lenzmann, Universität Basel 7. November 2013 6 L p -Räume Mit Hilfe der Masstheorie können wir nun die sog. L p -Räume einführen. Diese Räume sind wichtig in vielen Bereichen der reinen und angewandten Mathematik (wie z. B. der Theorie der partiellen Differentialgleichungen, Fourier-Analysis, Differentialgeometrie, Stochastik, Numerik, Bild- und Signalverabeitung etc.) Als eine zentrale Eigenschaft der L p -Räume werden wir die Vollständigkeit zeigen. Dass jede Cauchy-Folge konvergent ist, hat für die Existenz von Lösungen von Gleichungen bei iterativen Verfahren eine entscheidende Rolle. Der Riemannsche Integralbegriff stösst hier an seine Grenzen und das Lebesgue-Integral zeigt seine analytischen Vorzüge. 6.1 Defintionen, Höldersche und Minkowskische Ungleichung Sei (, A, µ) ein Massraum. Sei 0 < p < + eine reelle Zahl. Für eine messbare Funktion f : R setzen wir ( 1/p f L p := f dµ) p R +. Beachte, dass f L p wohldefiniert ist, aber auch den Wert + annehmen kann. Entsprechend definieren wir den Raum: L p (, µ) := { f : R : f ist messbar und f L p < + } Mit Satz 4.10 schliessen wir, dass f < + fast überall, fallls f L p (, µ) gilt. Wir halten drei elementare Eigenschaften fest: (i) cf L p = c f L p für alle c R. 1

(ii) f L p = 0 genau dann, wenn f = 0 fast überall. (iii) Falls f, g L p (, µ) und α, β R, dann αf + βg L p (, µ). Eigenschaft (iii) besagt also, dass L p (, µ) ein Vektorraum ist. Wegen (i) genügt es (iii) für α = β = 1 zu zeigen. Sei f, g L p (, µ), dann folgt f + g L p (, µ) aus der elemenatren Ungleichung f(x) + g(x) p 2 p 1 ( f(x) p + g(x) p ) falls p 1, sowie f(x) + g(x) p f(x) p + g(x) p für 0 < p 1. Allerdings werden wir später sehen, dass der Fall 0 < p < 1 nicht interessant sein wird, da die Dreiecksungleichung (Minkowskische Ungleichung) für solche p nicht gilt! Ein anschauliches Beispiel für L p (, µ) bilden die Folgenräume: Sei = N und µ : P(N) R + das zählende Mass, d. h. wir haben µ(a) = A (Anzahl der Elemente) für endliche Teilmengen A N und µ(a) = + sonst. Jede Funktion f : N R ist messbar und es gilt (mit f k = f(k) für k N) die Identität N f p dµ = f k p. Also sind f L p (N, µ) genau, die reellen Folge, welche p-summierbar sind: k=0 L p (N, µ) = {f : f = (f k ) k N ist reelle Folge mit k=0 f k p < + }. Wir schreiben auch l p (N) = L p (N, µ). Wir kommen nun zu einer wichtigen Abschätzung, die auf Otto Hölder (1859 1937) zuück geht. Die Nützlichkeit dieser Ungleichung kann kaum überschätzt werden; insbesondere verallgemeinert sie die Cauchy-Schwarzschen Ungleichung (siehe unten). Satz 6.1 (Höldersche Ungleichung). Sei 1 < p, q < + mit 1/p + 1/q = 1. Dann gilt für alle f L p (, µ) und g L q (, µ) die Ungleichung fg L 1 f L p g L q. Bemerkung und Beispiele 1) Erfüllen p und q die Gleichung 1/p + 1/q = 1, so sagt man auch, dass p und q zueinander dual zueinander sind. 2) Betrachte die endliche Menge = {1,..., n} mit dem zählenden Mass µ : P() R + mit µ(a) = A (Anzahl der Elemente) von A. Jede Abbildung f, g : R sind messbar und wir können f = (f 1,..., f n ) R n und g = (g 1,..., g n ) R n als 2

n-dimensionale reelle Vektor auffassen. Die Höldersche Ungleichung besagt in diesem Fall ( n n ) 1/p ( n ) 1/q f i g i f i p g i q, i=1 i=1 für jedes Paar 1 < p, q < + mit 1/p + 1/q = 1. Insbesondere erhalten wir für p = q = 2 die Cauchy-Schwarzsche Ungleichung. 3) Wir können als 2) auch Folgen erweitern: Sei 1 < p, q < mit 1/p + 1/q = 1. Für zwei Folgen f l p (N) und g l q (N) (siehe oben) gilt i=1 ( ) 1/p ( ) 1/q f k g k f k p g k q, k=0 k=0 4) Ist µ() < +, gilt die Inklusion L p (, µ) L 1 (, µ). Denn wir für f L p (, µ) haben wir ( 1/q f L 1 = f 1 L 1 f L p 1 L q f L q 1 dµ) < f L p µ() 1/q < +, Achtung: Falls µ() = +, haben wir i. Allg. L p (, µ) L 1 (, µ) für p > 1: z. B. für (, A, µ) = (R n, B(R n ), λ). Beweis von Satz 6.1. Gilt entweder f L p = 0 oder g L q = 0, so folgt fg = 0 fast überall und damit fg L 1 = 0, was die gewünschte Behauptung ist. Wir setzen nun voraus, dass f L p > 0 und g L q > 0 gilt. O.B.d.A. können wir annehmen, dass f 0 und g 0 nicht-negative Funktionen sind. Wir definieren die nicht-negative messbaren Funktionen: Damit haben wir ϕ := k=0 f p f p L p, ψ := ψq g q L q. ϕ dµ = ψ dµ = 1. Nun benutzen wir Youngsche Ungleichung: Für beliebige reelle Zahlen a, b 0 gilt a 1/p b 1/q a p + b q. (Y) Für den Beweis von (Y), bemerken wir zunächst, dass die Aussage trivial ist, falls a = 0 oder b = 0. Sei a > 0 und b > 0. Da x log x eine konkave Funktion ist für x > 0, folgt log(λx + (1 λ)y) λ log x + (1 λ) log y für alle x, y > 0 und λ [0, 1]. Sei a = x und b = y und λ = 1/p. (Beachte, dass 1/p [0, 1] und 1 λ = 1/q). Dann gilt log(a/p + b/q) 1/p log a + 1/q log b = log(a 1/p ) + log(b 1/q ). 3

Bilden wir exp auf beiden Seiten der Ungleichung, so folgt (Y). Wir benutzen nun (Y) und schliessen: fg f L p g L q 1 p ϕ + 1 q ψ. Durch Integration erhalten wir: 1 fg dµ 1 ϕ dµ + 1 f L p g L q p q was die gewünschte Behauptung zeigt. ψ dµ = 1 p + 1 q = 1, Satz 6.2 (Minkowskische Ungleichung). Sei p 1. Für alle f, g L p (, µ) gilt f + g L p f L p + g L p. Bemerkungen 1) Dies zeigt, dass L p die Dreicksungleichung für eine Norm erfüllt, falls p 1 gilt. Man kann zeigen, dass für 0 < p < 1, eine solche Ungleichung im Allgemeinen nicht gilt. Daher ist der Bereich p 1 natürlich. 2) Da f < + und g < + fast überall, falls f, g L p (, µ), ist die Summe f + g wohldefiniert. (An Stellen, wo f und g beide unendlich sind (was eine Borelsche Nullmenge ist), definieren wir f + g gleich 0.) Beweis von Satz 6.2. Im Fall p = 1 folgt die Ungleichung aus f(x) + g(x) f(x) + g(x) und Integration. Sei p > 1 und wähle q > 1, so dass 1/p + 1/q = 1. Es sei h : R + die messbare nicht-negative Funktion Dann gilt Zudem gilt h := f + g p 1. h q = f + g q(p 1) = f + q p, also h L q = f + g p/q L p. f + g p = f + g h fh + gh. Wir wenden nun die Höldersche Ungleichung (Satz 6.1) an und schliessen f + g p L = f + g p dµ fh p L 1 + gh L 1 Da p (p/q) = 1, folgt die Behauptung. ( f L p + g L p) h L q = ( f L p + g L p) f + g p/q L p. 4

6.2 Vollständigkeit von L p Wir erinneren, dass f L p = 0 nur impliziert, dass f = 0 fast überall. Um eine Norm zu haben, bilden wir die folgende Äquivalenzrelation (analog zu Abschnitt 5.1): Für zwei messbare Funktionen f, g : R schreiben wir f g, falls f = g fast überall. Wir betrachten nun den Quotientenraum L p (, µ) := L p (, µ)/. Da f g genau dann, wenn f g 0 (d. h. f = g fast überall genau dann, wenn f g = 0 fast überall), können wir dies auch als L p (, µ) = L p (, µ)/n, wobei N = {f L p (, µ) : f = 0 fast überall} ist. Korrekterweise werden die Element von L p (, µ) mit [f] bezeichnet (Restklassen von Funktionen). D. h. streng genommen sind die Elemente von L p (, µ) im Allgemeinen keine Funktionen. Zum Beispiel ist der Satz Sei f eine Funktion in L p (, µ) nicht korrekt. Dennoch: Wir folgen der üblichen Konvention und sagen z. B. Sei f eine Funktion in L p (, µ) etc. Insbesondere gilt nun für f L p (, µ), dass f L p = 0 genau dann, wenn f = 0 ist. Wir halten fest: Für jedes reelle p 1 ist L p (, µ) ein normierter Vektorraum mit Norm L p. Wir möchten nun die Vollständigkeit von L p bzgl. der induzierten Metrik d(f, g) = f g L p beweisen. Wir benötigen zunächst den folgenden Hilssatz (der auch von unabhängigen Interesses ist). Satz 6.3 (Dominierte Konvergenz in L p ). Sei p 1 eine reelle Zahl und f k L p (, µ), k 1, eine Funktionenfolge mit den Eigenschaften: (i) Es gebe eine Funktion f : R, so dass lim f k(x) = f(x) k (ii) Es gebe eine Funktion F L p (, µ), so dass µ-fast überall. f k F für alle k 1. Dann gehört f (nach evtl. Abänderung auf einer Nullmenge) zu L p (, µ) und es gilt lim f k f L p = 0. k 5

Beweis. Da f k fast überall gegen f konvergiert, ist f (nach evtl. Abänderung auf einer Nullmenge) messbar. Nach Voraussetzungen (i) und (ii) gilt lim k f k(x) p = f(x) p und f(x) p F (x) p fast überall. Da f k p L 1 (, µ) und F p L 1 (, µ), können wir mit Satz 5.3 (Dominierte Konvergenz) schliessen, dass lim f k p dµ = f p dµ, k was zeigt, dass lim k f k L p = f L p. Da ferner f k L p F L p für alle k 1, gilt auch f L p F L p < + und somit f L p (, µ). Ausserdem gilt f k f p ( f k + f ) p 2 p F p. Da f k f p 0 fast überall, können wir den Satz der Dominierten Konvergenz (Satz 5.3) nocheinmal anwenden und finden f k f p dµ = 0, lim k was gleichbedeutend mit lim k f k f L p = 0 ist. Für den Beweis der Vollständigkeit von L p benötigen wir noch den folgenden Hilfssatz. Hilfssatz 6.1. Sei p 1 eine reelle Zahl und g k L p (, µ), k 1, eine Funktionenfolge mit g k L p =: M < +. Dann konvergiert die Folge der Partialsummen ( m g k) m 1 fast überall gegen eine Funktion g L p (, µ = und es gilt lim m m g g L k p = 0. Beweis. Setze m G m := g k, G := g k. Nach Voraussetzung gilt G m L p (, µ), also G p m L 1 (, µ) und ( m p G p m dµ = G m p L g p k L p) M p für alle m 1. 6

Da G p m G p, schliessen wir Satz 5.1 (Monotone Konvergenz), dass G p L 1 (, µ) mit Nach Satz 4.10 gilt somit, dass G p L 1 = G p L p < +. G(x) < + für alle x \ N, mit einer gewissen (messbaren) Nullmenge N. Für alle x ω \ N existiert daher der Limes g(x) := g k (x) bei absoluter Konvergenz. Setzen wir nun g(x) := 0 für x N, so gilt für die Partialsummen die Majorisierung m g k G m G, also folgt die Behauptung aus Satz 6.3. Wir kommen nun zum Hauptsatz dieses Abschnitts. Satz 6.4 (Vollständigkeit von L p, Satz von Riesz). Für jede reelle Zahl p 1 und f m L p (, µ), m 1, eine Cauchy-Folge in L p (, µ). (D. h. für jedes ε > 0 gibt es N 1 mit f m f n L p < ε für alle m, n N). Dann gibt es ein f L p (, µ) mit folgenden Eigenschaften: (i) lim m f m f L p = 0. (ii) Es gibt es eine Teilfolge (f mk ) k 1 mit lim k f mk (x) = f(x) fast überall. Bemerkungen 1) Der Grenzwert f L p (, µ) ist eindeutig, da d(f, g) = f g L p eine Metrik ist. 2) Dass in (ii) im Allgemeinen die punktweise Konvergenz (fast überall) nur für eine Teilfolge gilt, kann man leicht mit einem Gegenbeispiel einer Funktionenfolge f m : [0, 1] R sehen, so dass lim m f m L p = 0, aber f m (x) konvergiert für kein x [0, 1]. (Wandernder Buckel; siehe Vorlesung). Wir können den obigen Satz auch so ausdrücken: Für jede reelle Zahl p 1 gilt L p (, µ) ist ein Banachraum, d. h. ein vollständiger normierter Vektorraum. 7

Beweis. Sei (f m ) eine Cauchy-Folge in L p (, µ). Um die Existenz des Grenzwertes f L p (, µ) zu zeigen, genügt es eine konvergente Teilfolge von (f m ) zu finden. Denn nehme an, es gelte lim k f mk f L p = 0 für eine Teilfolge (f mk ). Dann muss auch lim k f k f L p = 0 gelten. Das sieht man so: Sei ε > 0. Dann gibt es N 1 1 mit f mk f L p < ε/2 für alle k N 1. Da (f k ) eine Cauchy-Folge ist, gibt es N 2 1 mit f m f l L p < ε/2 für alle k, l N 2. Mit N = max{n 1, N 2 } folgt aus der Dreicksungleichung, dass f m f L p f m f mk L p + f mk f L p ε 2 + ε 2 = ε, für alle m, m k N. Also gilt lim k f k f L p = 0. Es bleibt also zu zeigen, dass eine konvergent Teilfolge (f mk ) k 1 existiert. Da (f m ) Cauchy-Folge ist, können wir eine Zahl m 1 1 finden, so dass f m1 f m < 1/2 für m m 1. Wähle nun m 2 > m 1, so dass f m2 f m < 1/4 für alle m m 2 usw. Wir können also eine Teilfolge (f mk ) m 1 konstruieren mit Auf die Reihe f mk f mk+1 L p < 2 k für k = 1, 2, 3,.... f m1 + (f mk+1 f mk ) mit den Partialsummen f ml können wir Hilfssatz 6.1 anwenden. Folglich gibt es eine Funktion f L p (, µ) mit f mk f fast überall und lim f m k f L p = 0. k Erinneren wir uns an den Beginn bes Beweises, so zeigt dies die gewünschte Behauptung. L -Raum Sei (, A, µ) ein Massraum. Für eine messbare Funktion f : R definieren wir Entsprechend definieren wir f L := inf{k [0, + ] : f K µ-fast überall}. L (, µ) := {f : R : f messbar und f L < + }. (6.1) sowie den Quotientenraum 8

L (, µ) := L (, µ)/ (6.2), wobei (wie üblich) f g genau dann, wenn f = g fast überall. Gilt f L < +, so heisst die Funktion f wesentlich beschränkt (d.h., f ist beschränkt bis auf eine Nullmenge.) Beispiele auf R n 1) f(x) = 1 auf R n ist in L (R n ). 2) Sei (r n ) n 1 eine abzählende Folge von Q und definiere f : R R durch { n für x = rn Q, f(x) = 1 für x R \ Q. Da Q eine Lebesguesche Nullmenge ist, gilt f 1 fast überall auf R. Insbesondere gilt f L (R). (Beachte, dass f nicht beschränkt ist, sondern nur wesentlich beschränkt ist.) Folgenraum l (N) Betrachte wir = N mit den zählenden Mass µ : P(N) R +, so bezeichnen wir l (N) = L (N, µ), was nichts anderes ist als der Raum aller beschränkten reellen Folgen. (Beachte, dass für das zählende Mass µ die Begriffe wesentlich beschränkt und beschränkt gleichwertig sind, da µ(a) = 0 nur dann wenn A = ist.) Satz 6.5 (Hölder revisited). Sei 1 p, q + und 1 p + 1 q = 1 (mit der Konvention 1 = 0). Dann gilt für alle f Lp (, µ) und g L q (, µ) die Ungleichung fg L 1 f L p g L q. Beweis. Es ist nur noch der Fall p = 1 und q = + zu zeigen. Sei also f L 1 (, µ) und g L (, µ). Dann gilt f(x)g(x) f(x) g L für fast alle x. Integration liefert, dass fg dµ f L 1 g L. Wir halten fest L vollständig ist. ist eine Norm auf dem Vektorraum L (, µ), der ebenfalls Satz 6.6 (Vollständigkeit von L ). Sei f m : R, m 1, eine Cauchy- Folge in L (, µ). Dann gibt es f L (, µ) mit lim m f m f L = 0 und lim m f m (x) = f(x) fast überall. 9

Bemerkungen 1) Wiederum gilt, dass der Grenzwert f L (, µ) eindeutig ist, dass d(f, g) = f g L eine Metrik ist. 2) Die Aussage lim m f m f L = 0 ist gleichbedeutend mit der Aussage, dass f m f gleichmässig konvergent ist auf \ N mit einer gewissen Nullmenge N. Siehe auch den Beweis unten. 3) Beachte, dass die punktweise Konvergenz bereits für (f m ) gilt und nicht für eine gewisse Teilfolge. Beweis. Für k, l, m 1 definiere die Mengen N m = {x : f m (x) > f m L }, B k,l = {x : f l (x) f l (x) > f k f l L }. Wir haben µ(n m ) = µ(b k,l ) = 0 für alle k, l, m 1. Sei E = k,l,m 1 N m B k,l. Da E ein abzählbare Vereinigung von (messbaren) Nullmengen ist, gilt µ(e) = 0. Da (f m ) eine Cauchy-Folge in L (, µ) ist, gilt auf dem Komplement E c = \ E, dass für jedes ε > 0 ein N 1 existiert mit f m (x) f n (x) < ε für alle x E c und n, m N. Insbesondere ist für jedes x E c die Folge (f m (x)) m 1 eine Cauchy-Folge in R und somit konvergent in R. Das heisst, wir haben lim m f m (x) = f(x) für alle x E c mit einer gewissen Funktion f : E c R. (Es gilt sogar, dass f m f gleichmässig auf E c.) Ausserdem ist f beschränkt auf E c. Das sieht man so: Da (f m ) eine Cauchy-Folge in L (, µ) ist, muss (f m ) beschränkt sein in L (, µ). Es gibt also eine Konstante 0 M < + mit f n (x) M für alle x E c. Für x E c wähle nun N 1, so dass f(x) f N (x) < 1. Dann gilt f(x) f(x) f N (x) + f N (x) < 1 + M. Dies zeigt f M für alle x E c. Schiesslich setzen wir f(x) := 0 für x E. Die Funktion f : R ist messbar mit f L (, µ) und hat die gewünschten Eigenschaften. 6.3 L 2 -Raum Sei (, A, µ) ein Massraum. Eine Besonderheit des Banachraumes L 2 (, µ) ist, dass er sogar ein sog. Hilbertraum ist. Das heisst, die Norm f L 2 = f, f 1/2 stammt von dem Skalarprodukt, gegeben durch 10

f, g = fg dµ, (6.3) wobei wir auch komplex-wertige Funktionen f, g : C betrachten. Dass f, g tatsächlich ein Skalarprodukt ist Zentrale Beispiele sind: L 2 () mit messbaren R n (wobei wir das Lebesgue-Mass λ als Mass auf R n nehmen) mit f, g = f(x)g(x) dλ l 2 (N) der Raum der quadrat-summierbaren (komplex-wertigen) Folgen mit dem Skalarprodukt a, b = a k b k. C n = L 2 ({1,..., n}, µ) mit dem zählenden Mass µ und dem Skalarprodukt x, y = k=0 n x i y i, Wir hatten bereits in Kapitel 1 die sog. Konvergenz im quadratischen Mittel (was der Konvergenz im Sinne von L 2 entspricht) für (Riemann-)integrierbare Funktionen f : [a, b] C kennengelernt. Der Punkt ist nun, dass mit dem neuen masstheoretischen Integrationsbegriffs (insb. mit dem Lebesgue-Integral) der Raum L 2 vollständig ist. D. h., jede Cauchy-Folge (f m ) m 1 in L 2 (, µ) hat einen (eindeutigen) Grenzwert f L 2 (, µ). Wir machen noch ein abschliessende Bemerkung zu Hilberträumen. Ein Hilbertraum H heisst separabel, wenn es eine dichte abzählbare Teilmenge X H gibt. Das heisst für jedes u H und ε > 0 gibt es ein v X mit Hier einige Beispiele u v H = u v, u v 1/2 < ε. L 2 (R n ) ist separabel. Eine abzählbare dichte Teilmengen X L 2 (R n ) bilden z. B. die Treppenfunktionen g : R n C, welche nur verschieden von Null auf Quadern mit rationalen Eckpunkten sind und dort nur rationale Werte (d. h. g(x) Q + iq) annehmmen. l 2 (N) hat z. B. die abzählbare dichte Teilmenge X, welche aus den quadratsummierbaren Folgen besteht, die nur Werte in Q + iq annehmen. C n hat z. B. die abzählbare dichte Teilmenge X = Q n + iq n. 11

Es gibt aber auch nicht-separabele Hilberträume. In den meisten Anwendungen in der Physik (Quantenmechanik) und Analysis, kommen aber stets separable Hilberträume vor. Ein erstaunliches Resultat (dessen Beweis nicht schwierig ist) lautet wie folgt. Satz. Jeder unendlich-dimensionale separable H Hilbertraum ist isometrisch isomorph zu dem Folgenraum l 2 (N), was wir als H l 2 (N) schreiben. Das heisst, es gibt eine lineare bijektive Abbildung ι : H l 2 (N) mit x H = ι(x) l 2 für alle x H. Beispiel aus der Fourier-Analysis Der Hilbertraum L 2 ([0, 2π]) ist unendlich-dimensional und separabel. Nach obigem Satz gibt es also eine isometrischen Isomorphism ι : L 2 ([0, 2π]) l 2 (N). In der Tat können wir einen solchen Isomorphismus explizit mit Hilfe der Fourier-Anaylsis angeben. Sei T : L 2 ([0, 2π]) l 2 (Z), f 1 ( f(k)) k Z, 2π wobei f(k) = 1 2π [0,2π] f(x)e ikx dx mit k Z die Fourier-Koeffizienten von f bezeichnet. Nach der Hölderschen Ungleichung ist die f(k) wohldefiniert, denn f(k) [0,2π] ( 1/2 f(x) dx f L 2 1 dx) = 2π f L 2 < +. [0,2π] Ausserdem gilt ( f(k)) l 2 (Z), da + k= f(k) 2 = 1 2π [0,2π] f(x) 2 dx < + nach der Parsevalschen Identität. Das heisst wir haben T f L 2 = ( f(k)) l 2 (Z). Offenbar ist T linear und auch injektiv, da T f = 0 impliziert, dass f = 0. Ferner ist T surjektiv, da für eine gegeben Folge a = (a k ) l 2 (Z) die Funktion f = k a ke ikx in L 2 ([0, 2π]) liegt und T f = a gilt. Somit ist T ein isometrischer Isomorphismus von L 2 ([0, 2π]) nach l 2 (Z). Ausserdem haben wir den isometrischen Isomorphismus R : l 2 (N) l 2 (Z), (x n ) n N (x τ(n) ) mit der Bijektion τ : N Z mit 0 τ 0 = 0, 1 τ 1 = 1, 2 τ 2 = 1,.... Somit ist ein isometrischer Isomorphismus. ι = R 1 T : L 2 ([0, 2π]) l 2 (N) 12

6.4 Jensensche Ungleichung Wir schliessen diese Kapitel ab mit einer sehr nützlichen Ungleichung, die auf den dänische Mathematiker Jensen (1859-1925) zurückgeht. Wir geben eine masstheortische Formulierung. Satz 6.7 (Jensensche Ungleichung). Sei a < b + und ϕ : (a, b) R eine konvexe Funktion. Sei (, A, µ) ein Massraum mit µ() = 1. Dann gilt für jedes f L 1 (, µ) mit a < f(x) < b die Ungleichung ( ) ϕ f dµ (ϕ f) dµ, wobei die rechte Seite auch den Wert + annehmen kann. Bemerkungen und Beispiele 1) Ist (, A, µ) ein Massraum und E ein messbare Menge mit 0 < µ(e) < +, so können wir die Jensensche Ungleichung auch schreiben als ( ) ϕ f dµ (ϕ f) dµ, E E wobei ffl f dµ = 1 µ(e) f dµ der Mittelwert von f über E bezüglich µ ist. Dass die obige E Ungleichung aus der Jensensche Ungleichung folgt, sieht man in dem den Massraum (E, A E, µ E ) mit dem normierten Mass µ(a) = µ(a) µ(e) 1 betrachtet. 2) Sei = {ω 1,..., ω n } und µ({ω k }) = α k mit α k [0, 1] und n α k = 1. Also gilt µ() = 1. Aus der Jensenschen Ungleichung folgt exp( f dµ) exp(f) dµ, da x exp(x) konvex ist. Sei f : R + mit f(ω k ) = x k > 0. In unserem Fall heisst dies exp(α 1 x 1 +... + α n x n ) α 1 exp(x 1 ) +... + α n exp(x n ). Setzen wir y k = e x k > 0 für k = 1,..., n, so folgt y α1 1 yα2 2... yαn n (α 1 y 1 + α 2 y 2 +... + α n y n ) Die spezielle Wahl α k = 1/n ergibt die nützliche Ungleichung (zwischen geomterischen und arithmetischen Mittel) n y1 y 2... y n 1 n (y 1 + y 2 +... + y n ) für beliebige positive Zahlen y 1,..., y n > 0. 13

Beweis von Satz 6.7. Sei t = f dµ. Da Da a < f(x) < b, gilt a < t < b. Aus der Konvexität von ϕ : (a, b) R folgt, dass es ein β R gibt mit ϕ(s) ϕ(t) + β(t s) für alle s (a, b). (6.4) (Dies schliesst man aus der Definition der Konvexität. Da ϕ konvex ist, existieren stets die rechts- und linkseitige Ableitung ϕ (t) bzw. ϕ +(t). Wir können dann jedes β [ϕ (t), ϕ + (t)] wählen. Ist ϕ differenzierbar an der Stelle t, dann gilt β = ϕ (t).) Da eine konvexe Funktion auf einem offenen Intervall stetig ist (und somit messbar), ist ϕ f : R ebenfalls messbar (als Verkettung messbarer Funktionen). Aus (6.4) mit s = f(x) folgt, dass für den Negativteil (ϕ f) gilt: (ϕ f) (x) ϕ(t) + β t + β f(x) für alle x. Integration zeigt also, dass (ϕ f) dµ < +, da f L 1 (, µ) und dµ = 1 < +. Das heisst, das Integral (ϕ f)dµ ist wohldefiniert, wobei der Wert + auftreten kann. Wir benutzen nun (6.4) wieder mit s = f(x) und integrieren über x : ( ) ( ) (ϕ f) dµ ϕ f dµ dµ + β( f dµ f dµ) = ϕ f dµ, wobei wir wiederum dµ = µ() = 1 benutzt haben. 14