Matthias Dehmer Die analytische Theorie der Polynome Nullstellenschranken für komplexwertige Polynome
Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.ddb.de abrufbar. Gedruckt auf holz- und säurefreiem Papier, 100 % chlorfrei gebleicht. Weißensee Verlag, Berlin 2004 Kreuzbergstraße 30, 10965 Berlin Tel. 0 30 / 91 20 7-100 www.weissensee-verlag.de e-mail: mail@weissensee-verlag.de Alle Rechte vorbehalten Printed in Germany ISBN 3-89998-043-3
Vorwort Über viele Jahrzehnte hinweg hat die analytische Theorie der Polynome Mathematiker in ihren Bann gezogen. Als Ergebnis dieser Untersuchungen sind unzählige Forschungsarbeiten und Monographien entstanden. Allein in dem Teilgebiet der analytischen Theorie der Polynome, Schranken für die Beträge der Nullstellen eines komplexwertigen Polynoms anzugeben, sind im Zeitraum von 1900 bis heute eine nicht überschaubare Anzahl von Arbeiten publiziert worden. Mit diesem interessanten mathematischen Teilgebiet, das mich selbst seit Mitte der neunziger Jahre fasziniert, befasst sich das vorliegende Buch. Es ist mir ein besonderes Anliegen, die inhaltliche Problematik und die Beweise sehr verständlich und umfassend darzustellen und alle mathematischen Hilfsmittel bereitzustellen. Deshalb eignet sich das Buch nicht nur für Mathematiker, Physiker und Informatiker, die auf diesem Gebiet forschen oder praktische Probleme lösen, sondern auch für den interessierten Studenten der oben genannten Fachdisziplinen. Für den Leser, der keine Grundkenntnisse in der Analysis und der Funktionentheorie mitbringt, wird es am Anfang nicht einfach sein, dieses Buch durchzuarbeiten. Das Studium des Buches wird aber mehr und mehr Freude und Begeisterung mit sich bringen, je mehr der Leser erkennt, welche Vielfalt und mathematische Ästhetik der behandelten Problematik zu Grunde liegt. Für wertvolle fachliche Diskussionen, Anregungen und konstruktive Kritik bei der Abfassung des Textes danke ich Herrn Michael Martin (Siegen) und Herrn Oliver Glier (Darmstadt). Für Korrekturarbeiten und für die tatkräftige Hilfe bei der Erstellung des Literaturverzeichnises möchte ich mich auf diesem Wege bei Herrn Steve Hinske (Darmstadt) und Herrn Rüdiger Gleim (Darmstadt) bedanken. Leser die mir Anregungen oder Kritik mitteilen möchten, seien ermutigt dies zu tun. Darmstadt, im Juli 2004 Matthias Dehmer I
Inhaltsverzeichnis Einleitung 1 1 Grundlagen 3 2 Schrankensätze 11 2.1 Schranken als Funktionen aller Koeffizienten............................. 11 2.2 Schranken für p Nullstellen als Funktionen von p + 1 Koeffizienten 31 2.3 Neue Schrankensätze......................... 40 3 Weiterführende Schrankensätze 47 3.1 Das Abschätzungsprinzip von Heigl................ 47 3.2 Eine Verallgemeinerung des Abschätzungsprinzips von Heigl.. 61 4 Die Lage der Nullstellen von Lückenpolynomen 67 4.1 Die Sätze von Landau und Fejér................. 67 4.2 Das Landau-Montel Problem................... 77 Satzverzeichnis Fundamentalsatz der Algebra....................... 4 Satz von Rouché.............................. 4 Stetigkeitssatz................................ 6 Satz von Descartes............................. 9 II
Erster Satz von Cauchy.......................... 11 Zweiter Satz von Cauchy.......................... 12 Satz von Fujiwara.............................. 16 Satz von Kuniyeda............................. 17 Satz von Eneström-Kakeya......................... 21 Satz von Pellet............................... 27 Satz von Walsh............................... 58 Satz von Gauss-Lucas........................... 71 III
Einleitung Die Theorie der algebraischen Gleichungen zählte noch zu Anfang des 19. Jahrhunderts zur klassischen Algebra. Die Hauptaufgabe der Algebra war es, algebraische Gleichungen und Systeme solcher Gleichungen aufzulösen, wobei die Gleichung a n z n + a n 1 z n 1 + + a 0 = 0 eine allgemeine algebraische Gleichung n-ten Grades darstellt. Durch den Strukturwandel, der sich in der Algebra im 19. und 20. Jahrhundert abzeichnete, ist die Theorie der algebraischen Gleichungen in zwei getrennte Teilbereiche aufgespaltet worden. Der erste Teilbereich ist stark durch die Galoistheorie geprägt worden und beschäftigt sich mit algebraischen Gleichungen unter dem Aspekt der modernen Algebra. Der zweite Teilbereich, der aus heutiger Sicht der Funktionentheorie zuzuordnen ist, wird als die analytische Theorie der Polynome bezeichnet. Diese Theorie befaßt sich mit den Eigenschaften von komplexen Polynomen, die als besondere analytische (holomorphe) Funktionen aufgefasst werden. Sie wird auch als die Geometrie der Polynome bezeichnet, da das Problem, geometrische Beziehungen zwischen den Nullstellen und den Koeffizienten eines Polynoms zu untersuchen, einen großen Raum in dieser Theorie einnimmt. Dieses Buch beschäftigt sich mit einem wichtigen Teilbereich der analytischen Theorie der Polynome, welcher die Aufgabe hat, Kreisbereiche in der komplexen Zahlenebene zu bestimmen in denen entweder alle oder eine Mindestanzahl von Nullstellen eines komplexen Polynoms liegen. Diese Aufgabe findet besonders in der angewandten Mathematik Verwendung. Da nämlich ein algebraisches Polynom f vom Grad n 5 in Form der Gleichung f(z) = a n z n + a n 1 z n 1 + + a 0 = 0 im Allgemeinen nicht geschlossen auflösbar ist, ist eine obere oder untere Abschätzung der Nullstellen sehr nützlich. Sollen nun die Nullstellen eines Polynoms mit einem numerischen Verfahren bestimmt werden, kann vorher mit einer oberen oder unteren Nullstellenschranke die ungefähre Lage der Nullstellen vorhergesagt werden. Somit kann man günstige Startwerte bestimmen, um eine schnelle Konvergenz des Verfahrens zu gewährleisten. 1
Das erste Kapitel stellt fundamentale Definitionen und Ergebnisse von algebraischen Polynomen vor, die in den weiteren Kapiteln benötigt werden. Im zweiten Kapitel werden grundlegende und neue Schrankensätze für komplexe Polynome angegeben, wobei diese auch in der Praxis der nichtlinearen Gleichungen Verwendung finden. Anhand von Beispielen wird darauf aufmerksam gemacht, dass die Güte einer Nullstellenschranke stark vom gerade betrachteten Polynom abhängen kann. Das dritte Kapitel stellt Schrankensätze vor, die aus zwei Abschätzungsprinzipien von Heigl gewonnen werden. Während die meisten Beweise der Sätze aus dem zweiten Kapitel zum Ziel haben, eine Abschätzung der Form f(z) > 0 zu berechnen, um dann schließen zu können, dass die Nullstellen in einem bestimmten Kreisbereich liegen (der vom Gültigkeitsbereich der obigen Ungleichung abhängt) liegt den Sätzen aus diesem Kapitel ein anderes Beweisprinzip zu Grunde. Kapitel 4 beschäftigt sich mit Schrankensätzen von Lückenpolynomen und dem Landau-Montel-Problem. Dieses Buch enthält eine ausführliche Bibliographie. Bei einigen Autoren (z.b. Dieudonné, Marden, Montel, Specht und Walsh), die in der analytischen Theorie der Polynome sehr große und wichtige Beiträge geleistet haben, wurden auch diejenigen Beiträge in das Literaturverzeichnis aufgenommen, die sich mit allgemeineren Fragestellungen in der analytischen Theorie der Polynome befassen. 2
Kapitel 1 Grundlagen In diesem Kapitel werden wichtige Eigenschaften und funktionentheoretische Grundlagen algebraischer Polynome bereitgestellt, die für die analytische Theorie der Polynome von Bedeutung sind. Definition 1.1.1 Es sei für n IN n n = {f : C C f(z) = a nz n + a n 1 z n 1 + + a 0, a i C, i = 0, 1,, n}. ist die Menge der algebraischen Polynome vom Grad kleiner gleich n. Bemerkung: n ist ein Vektorraum über C und es gilt dim( n ) = n + 1. Definition 1.1.2 Es sei z 0 C und r IR +. K(z 0, r) := {z C z z 0 r} heißt Kreisbereich mit Mittelpunkt z 0 und Radius r. K(z 0, r) := {z C z z 0 < r} heißt Kreisgebiet mit Mittelpunkt z 0 und Radius r. E := {z C z = 1} heißt Einheitskreis. Das Hauptproblem in der analytischen Theorie der Polynome ist die Untersuchung der Werteverteilung komplexer Polynome. Für jedes z 0 C nimmt ein Polynom f n einen eindeutig bestimmten Wert c C an, wobei man z 0 3
c-stelle von f nennt. Die Aufgabe, alle c-stellen von f zu bestimmen, also die Untersuchung der Werteverteilung, lässt sich durch Betrachtung der Gleichung f(z) c = 0 in das Problem der Nullstellenverteilung überführen. Historisch gesehen ist der Fundamentalsatz der Algebra ein erstes wichtiges Ergebnis in diesem Problemkreis. Aus ihm lässt sich die Aussage ableiten, dass ein komplexes Polynom n-ten Grades jeden Wert an höchstens n verschiedenen Stellen annimmt. Über die Lokalisierung der Nullstellen in der komplexen Ebene gibt er jedoch keine Auskunft. Satz 1.1.3 (Fundamentalsatz der Algebra) Jedes komplexe Polynom n-ten Grades der Form f(z) = a n z n + a n 1 z n 1 + + a 0, a n 0, a k C, k = 0, 1,, n besitzt genau n Nullstellen. Bemerkung: Es ist bekannt, dass sich ein komplexes Polynom n-ten Grades vollständig in Linearfaktoren zerlegen lässt. Es gilt die Darstellung f(z) = a n (z z 1 )(z z 2 ) (z z n ), a n 0, wobei z 1, z 2,, z n C die Nullstellen von f sind. Kommt eine Nullstelle in der Reihe z 1, z 2,, z n genau k-mal vor, so nennt man diese Nullstelle eine k-fache Nullstelle von f. Diese Variante des Fundamentalsatzes kann man leicht zeigen, indem man zuerst nachweist, dass f mindestens eine Nullstelle in C besitzt. Durch einen Induktionsschluss erhält man dann die obige Linearfaktorzerlegung von f. Der Beweis des Fundamentalsatzes, der hier geführt werden soll, ist von funktionentheoretischer Natur und benötigt den Satz von Rouché. Satz 1.1.4 (Rouché) Seien f und g holomorph in einem Gebiet G C, einschließlich des Randes Γ von G. Weiter sei f(z) 0 auf Γ und es gelte g(z) < f(z) z Γ. Dann besitzt die Funktion h := f + g genauso viele Nullstellen wie f im Inneren von G. 4
Beweis: Da nach Voraussetzung f, g in G und auf Γ holomorph sind, besitzen sie dort keine Polstellen. Es ist bekannt, dass für das Kurvenintegral über das logarithmische Residuum einer bis auf endlich viele Polstellen holomorphen Funktion p gilt: 1 2πi Γ p (z) dz = N P. p(z) Dieses Integral gibt die Windungszahl der Bildkurve von p bezüglich dem Nullpunkt an. Dabei bezeichnet Γ den Rand des vorgelegten Integrationsgebietes, N ist die Anzahl der Nullstellen, P die Anzahl der Polstellen von p in G, gezählt mit ihren Vielfachheiten. Wenn jetzt N h die Anzahl der Nullstellen von h = f + g und N f die Anzahl der Nullstellen von f bezeichnet, folgt N h N f = 1 2πi = 1 2πi = 1 2πi = 1 2πi Γ Γ Γ Γ = 1 2πi = 1 2πi Γ Γ f (z) + g (z) f(z) + g(z) dz 1 2πi Γ ( f (z) + g (z) f(z) + g(z) f (z) f(z) g (z)f(z) f (z)g(z) dz (f(z) + g(z))f(z) f (z) f(z) dz ) dz (f (z)+g (z))f(z) f (z)(f(z)+g(z)) f 2 (z) f(z)+g(z) f(z) ( ) 1 + g(z) f(z) ( ) dz 1 + g(z) f(z) [ log ( 1 + g(z) f(z) )] dz. Durchläuft jetzt der Punkt z die geschlossene Kurve Γ, so durchläuft w := 1+ g(z) f(z) ebenfalls eine geschlossene Bildkurve in der w-ebene. Da nach Voraussetzung < 1 gilt, liegt die Bildkurve ganz im Kreisgebiet w 1 < 1. g(z) f(z) Der Logarithmus ist aber in diesem Gebiet eindeutig. Daraus folgt, dass das letzte Integral verschwindet. Also gilt Das war die Behauptung. N h = N f. dz 5
Beweis von Satz 1.1.3: Um den Satz 1.1.4 auf Γ : z = r > 1 anzuwenden, setzt man in f(z) = a n z n + a n 1 z n 1 + + a 0 : h 1 (z) = a n z n, h 2 (z) = a n 1 z n 1 + a n 2 z n 2 + + a 0. h 1 (z), h 2 (z) sind somit eindeutig und holomorph in und auf Γ. Mit z = r, folgt mit der Dreiecksungleichung h 2 (z) = a 0 + + a n 2 z n 2 + a n 1 z n 1 falls r > a 0 + + a n 2 + a n 1 a n. a 0 + + a n 2 z n 2 + a n 1 z n 1 ( a 0 + + a n 2 + a n 1 )r n 1 < a n r n = h 1 (z), Nach Satz 1.1.4 hat f(z) = h 1 (z) + h 2 (z) die gleiche Anzahl von Nullstellen wie h 1 (z) im Inneren von z = r. h 1 (z) besitzt aber eine n-fache Nullstelle in z = 0. Damit ist der Fundamentalsatz der Algebra bewiesen. Eine für die Anwendung wichtige Eigenschaft komplexer Polynome ist, dass die Nullstellen eines komplexen Polynoms stetige Funktionen bezüglich der Koeffizienten sind. Dies bedeutet, dass sich die n Nullstellen eines Polynoms f bei stetiger Änderung der Koeffizienten gleichfalls stetig ändern. Satz 1.1.5 (Stetigkeitssatz) Gegeben seien f(z) = a 0 + a 1 z + + a n z n m = a n (z z j ) k j, a n 0, a i C, i = 0, 1,, n, j=1 f(z) = (a 0 + ε 0 ) + (a 1 + ε 1 )z + + (a n 1 + ε n 1 )z n 1 + a n z n. Weiter sei K i der Kreisbereich mit Mittelpunkt z i und Radius R i, und es gelte 0 < R i < min j z i z j für j = 1, 2,, i 1, i + 1,, m. (1) Es existiert ein ε > 0 so dass, falls ε s ε für s = 0, 1,, n 1 gilt, dann das (geänderte) Polynom f(z) genau k i Nullstellen in K i besitzt. Beweis: Betrachte zunächst die Gleichung H(z) = ε 0 + ε 1 z + + ε n 1 z n 1. 6
Für den Betrag von H(z) auf K i erhält man mit der Dreiecksungleichung die Abschätzung Also insgesamt H(z) = ε 0 + ε 1 z + + ε n 1 z n 1 ε 0 + ε 1 z + + ε n 1 z n 1 ε(1 + z + + z n 1 ) = ε(1 + (z z i ) + z i + + (z z i ) + z i n 1 ) ε(1 + (R i + z i ) + + (R i + z i ) n 1 ) n 1 = ε (R i + z i ) j. j=0 n 1 H(z) ε (R i + z i ) j. Dagegen gilt für den Betrag von f(z) auf K i die Abschätzung j=0 f(z) = a 0 + a 1 z + + a n z n m = a n (z z j ) k j = a n j=1 m z z j k j j=1 = a n z z i k i m z z j k j j=1 j i m k = a n R i i z z j k j j=1 j i m k a n R i i ( z i z j R i ) k j }{{} >0 j=1 j i =: ω i > 0, da z z j z i z j R i gilt. Wird jetzt ε < gewählt, so erhält man die Relation n 1 H(z) ε (R i + z i ) j < j=0 ω i n 1 j=0 (R i + z i ) j ω i n 1 j=0 (R i + z i ) j 7 n 1 (R i + z i ) j = ω i f(z). j=0
Also ist insbesondere H(z) < f(z) auf K i. Damit folgt nach Satz 1.1.4, dass im Inneren von K i die Anzahl der Nullstellen von f(z) = f(z) + H(z) und f(z) übereinstimmt. Die Ungleichung (1) besagt aber, dass z i die einzige Nullstelle (mit der Vielfachheit k i ) in K i ist. Also besitzt f(z) genau k i Nullstellen in K i. In den nächsten Kapiteln wird ein Satz bezüglich reeller Polynome benötigt, der eine obere Schranke für die Anzahl der positiven Nullstellen des gegebenen Polynoms angibt. Diese Schranke hängt von der Anzahl der Vorzeichenwechsel in der Koeffizientenfolge ab. Der Beweis des entsprechenden Ergebnisses baut auf dem Lemma von Segner auf. Lemma 1.1.6 (Segner) Es sei das reelle Polynom f(x) = a n x n + a n 1 x n 1 + + a 0, a i IR, i = 0, 1,, n gegeben. Die Koeffizientenfolge (a n, a n 1,, a 0 ) besitze k Vorzeichenwechsel. Wird f(x) mit dem Linearfaktor x c (c > 0) multipliziert, so erhält man ein Polynom, dessen Koeffizientenfolge k + 2r + 1 (r IN) Vorzeichenwechsel besitzt. Beweis: Betrachte das betreffende Polynom in der Darstellung f(x) = a n x n + + a m+1 x m+1 a m x m a j+1 x j+1 + a j x j + + a p+1 x p+1 a p x p e. (2) f(x) sei nach fallenden Potenzen von x geordnet, und es gelte a n > 0,, a m+1 > 0, a m 0,, a j+2 0, a j+1 > 0, a j 0,, a p+2 0, a p+1 > 0, a p 0, a p 1 0,, e > 0. Sei k die Anzahl der Vorzeichenwechsel in der Koeffizientenfolge von (2). Zunächst folgt, dass k ungerade ist, da a n e < 0. Betrachte weiter f(x)(x c) = a n x n+1 ± (a m + a m+1 c)x m+1 ± +(a j + a j+1 c)x j+1 ± (a p + a p+1 c)x p+1 ± + ec. (3) Stellt man jetzt die Anzahl der Vorzeichenwechsel von Gleichung (2) und (3) gegenüber, so folgt: 8
1. Es sei nach Voraussetzung e < 0. In der Koeffizientenfolge von Gleichung (3) ereignet sich zwischen a n und (a m +a m+1 c) wenigstens ein Vorzeichenwechsel. Genauso zwischen (a m + a m+1 c) und (a j + a j+1 c), als auch bei (a j + a j+1 c) und (a p + a p+1 c). Die Vorzeichenwechsel der Koeffizientenfolge von Gleichung (2) ereignen sich zwischen a n und a m, a m und a j sowie a j und e. Wenn es in (2) zwischen a n und a m ein Vorzeichenwechsel gibt, so gibt es in (3) zwischen a n und (a m +a m+1 c) mindestens einen. Dies gilt ebenso für die übrigen Zeichenwechsel in (2). In Gleichung (3) kommt jedoch zwischen (a p + a p+1 c) und ec ein Vorzeichenwechsel dazu. Wenn jetzt k 1 die Anzahl der Vorzeichenwechsel der Koeffizientenfolge von (3) bezeichnet, so erhält man mit diesen Überlegungen k 1 k + 1. Da in (3) a n ec > 0 gilt, muss k 1 gerade sein. Also folgt für die Differenz k 1 k = 2r + 1, r IN. Das ist die Behauptung des Lemmas. 2. Sei e > 0. Man hat nur zu beachten, dass k gerade ist, da ea n > 0. Ansonsten verläuft der Beweis völlig analog. 3. Sei e = 0. Dann ist f(x) darstellbar als f(x) = xf 1 (x). Jetzt kann angenommen werden, dass das Absolutglied von f 1 (x) ungleich Null ist (sonst lässt sich x mehrfach ausklammern). Die Anwendung des Lemmas auf f 1 (x)(x c) ergibt, dass in seiner Koeffizientenfolge mindestens k + 1 Vorzeichenwechsel enthalten sind. Die Koeffizientenfolgen von f 1 (x) und f(x) besitzen aber die gleiche Anzahl von Vorzeichenwechseln. Daraus folgt auch in diesem Fall die Behauptung des Lemmas. Satz 1.1.7 (Descartes) Die Anzahl der positiven Wurzeln der Gleichung f(x) = a n x n + a n 1 x n 1 + + a 0 = 0, a i IR, i = 0, 1,, n ist gleich der Anzahl der Vorzeichenwechsel in der Koeffizientenfolge von f(x) oder um eine gerade Zahl kleiner. Beweis: Es seien σ 1, σ 2,, σ j (1 j n) die positiven Wurzeln von f(x) = a n x n + a n 1 x n 1 + + a 0 = 0. 9
Also ist f(x) darstellbar als f(x) = (x σ 1 )(x σ 2 ) (x σ j )f 1 (x), f 1 (σ i ) 0, i = 1, 2,, j. Die Faktoren treten dabei so oft auf, wie die Vielfachheiten der entsprechenden Nullstellen angeben. Die sukzessive Anwendung des Lemmas 1.1.6 auf die Polynome (x σ 1 )f 1 (x),, (x σ 1 ) (x σ j )f 1 (x) liefert dann k k 1 + j, falls k bzw. k 1 die Anzahl der Vorzeichenwechsel in der Koeffizientenfolge von f(x) bzw. f 1 (x) bezeichnet. Das heißt insbesondere, dass die Anzahl der Vorzeichenwechsel von f(x) nie kleiner als die Anzahl der positiven Nullstellen von f(x) ist. Aus sign{f(0)} = sign{a 0 } sign{f(+ )} = sign{a n } folgt, dass die Anzahl j der positiven Nullstellen von f(x) gerade bzw. ungerade ist, falls sign{a n a 0 } > 0 bzw. sign{a n a 0 } < 0. Denn allgemein gilt, dass ein reelles Polynom zwischen zwei Punkten a, b (a < b) eine gerade bzw. ungerade Anzahl von Nullstellen besitzt, wenn f(x) an a, b ein gleiches bzw. ungleiches Vorzeichen hat. Auf der anderen Seite ist die Anzahl k der Vorzeichenwechsel in der Koeffizientenfolge von f(x) ebenfalls gerade bzw. ungerade, falls sign{a n a 0 }> 0 bzw. sign{a n a 0 }< 0. Diese Tatsache wurde auch schon mehrmals im Beweis von Lemma 1.1.6 ausgenutzt. Damit folgt jetzt ingesamt was zu beweisen war. Im Fall a 0 = 0 stelle man f(x) als k j = 2m (m IN), f(x) = x p f(x), f(0) 0, 1 p < n dar. Wendet man das eben Gesagte auf f(x) an, so folgt wiederum die Behauptung. 10