Warum konvergieren Genetische Algorithmen gegen ein Optimum?

Ähnliche Dokumente
Einführung in die Methoden der Künstlichen Intelligenz. Evolutionäre Algorithmen

Computational Intelligence

Genetische Algorithmen

Genetische Algorithmen. Uwe Reichel IPS, LMU München 8. Juli 2008

b) Nennen Sie vier hinreichende Bedingungen für Evolution. b) Anzahl fortlaufender Einsen von rechts. c) Sind in a) oder b) Plateaus enthalten?

Optimale Produktliniengestaltung mit Genetischen Algorithmen

Genetische und Evolutionäre Algorithmen (Vol. 1)

Synthese Eingebetteter Systeme. Übung 6

10. Vorlesung Stochastische Optimierung

Anwendung genetischer Algorithmen zur Lösung des n Dame Problems und zur Optimierung von Autoprofilen

Genetische Algorithmen

Populationsbasierte Suche. Evolutionäre Algorithmen (1)

Proseminarvortrag. Markov-Ketten in der Biologie (Anwendungen)

Proseminar Genetische und Evolutionäre Algorithmen

4 Genetische Algorithmen

Survival of the Fittest Optimierung mittels Genetischer Algorithmen

Optimierung auf rekonfigurierbaren Rechensystemen

Definition 77 Sei n N. Der Median (das mittlere Element) einer total geordneten Menge von n Elementen ist deren i-kleinstes Element, wobei n i =.

Computational Intelligence 1 / 28. Computational Intelligence Evolutionsstrategien 3 / 28

Adaptive Systeme. Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff

Genetische Programmierung

Adaptive Systeme. Prof. Dr.-Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff

Diskrete dynamische Systeme in der Populationsgenetik Hofbauer J., und Sigmund K.: Evolutionary Games and Population Dynamics, Cambridge

Kapitel 13. Evolutionäre Spieltheorie. Einleitung. Evolutionäre Biologie. Übersicht 2. Alternative: Biologische Evolutionstheorie

Dieses Quiz soll Ihnen helfen, Kapitel besser zu verstehen.

Evolution und Algorithmen

Hauptseminar Repräsentationen für Optimierungsalgorithmen

2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X

P (A B) P (B) = P ({3}) P ({1, 3, 5}) = 1 3.

Allgemeine Betriebswirtschaftslehre Planungs- und Entscheidungstechniken

Probleme bei reinen Strategien. Nash Gleichgewichte in gemischten Strategien Kopf 1, 1 1, 1 Zahl 1, 1 1, 1. Gemischte Strategien

Kapitel 4. Reihen 4.1. Definition und Beispiele

Hochschule Regensburg. Übung 12_3 Genetische Algorithmen 1. Spezielle Algorithmen (SAL) Lehrbeauftragter: Prof. Sauer

Statistische Tests. Kapitel Grundbegriffe. Wir betrachten wieder ein parametrisches Modell {P θ : θ Θ} und eine zugehörige Zufallsstichprobe

Kapitel 13. Evolutionäre Spieltheorie. Einleitung. Evolutionäre Biologie. Übersicht 2. Alternative: Biologische Evolutionstheorie

Seminararbeit zum Thema Genetische Algorithmen

Können Gene Depressionen haben?

Das Lebesgue-Maß im R p

5 Binomial- und Poissonverteilung

InformatiCup 2009 EvolutionConsole

1.5 Erwartungswert und Varianz

4 Diskrete Wahrscheinlichkeitsverteilungen

1.5 Erwartungswert und Varianz

7.5 Erwartungswert, Varianz

1 Grundlagen. 1.1 Erste Grundbegriffe 1.2 Kryptographische Systeme 1.3 Informationstheoretische Grundlagen

Ü b u n g s b l a t t 10

Klassifikation von Signifikanztests

5. Lokale Suchverfahren. Beispiel TSP: k-change Nachbarschaft. Nachbarschaft. k-opt Algorithmus

Statistische Tests (Signifikanztests)

Teil A hilfsmittelfreier Teil

K4 Bedingte Wahrscheinlichkeiten. 4.1 Definition Die bedingte Wahrscheinlichkeit von A bei gegebenem B:

Der Hilbert-Kalkül für die Aussagenlogik (Notizen zur Vorlesung Logik im Wintersemester 2003/04 an der Universität Stuttgart)

Unabhängigkeit KAPITEL 4

Genetische Algorithmen

Mathematik: LehrerInnenteam Arbeitsblatt Semester ARBEITSBLATT 12. Erwartungswert, Varianz und Standardabweichung

Die Evolutionsstabilität von Verhaltensstrategien

4. ggt und kgv. Chr.Nelius: Zahlentheorie (SS 2007) 9

Genetische Algorithmen

Evolutionäre Robotik

2 Aufgaben aus [Teschl, Band 2]

Weitere Eigenschaften von Punktschätzern

1. Inhaltsverzeichnis

Einführung in die Theoretische Informatik

13 Mehrdimensionale Zufallsvariablen Zufallsvektoren

1.5.4 Quantile und Modi. Bem [Quantil, Modus]

Lösungen zu Übungsblatt 10 Höhere Mathematik Master KI Diskrete Zufallsgrößen/Markov-Ketten

Dieser Foliensatz darf frei verwendet werden unter der Bedingung, dass diese Titelfolie nicht entfernt wird.

Hauptklausur zur Stochastik für Lehramt

3 Bedingte Wahrscheinlichkeit, Unabhängigkeit

Kapitel 5 Stochastische Unabhängigkeit

Klassifikation von Signifikanztests

5. Numerische Differentiation. und Integration

7 Die Sätze von Fermat, Euler und Wilson

Genetische Algorithmen

6. Wachstumsformen. Definitionen: durchschnittliche Wachstumsrate im y Zeitintervall t: t geometrisch. Sekantensteigung, abhängig von t

Kapitel GWBS:III. III. Regeln mit Konfidenzen. Einführung. Verrechnung von Konfidenzen. Probleme des Ansatzes. Beispiel für ein Diagnosesystem

Motivation. Benötigtes Schulwissen. Übungsaufgaben. Wirtschaftswissenschaftliches Zentrum 10 Universität Basel. Statistik

Genetische Algorithmen

Hackenbusch und Spieltheorie

1.3 Wiederholung der Konvergenzkonzepte

6. Vorlesung. Rechnen mit Matrizen.

10 Der Satz über implizite Funktionen und Umkehrfunktionen

Kapitel 2. Kombinatorische Schaltungen. Codierer und Decodierer

Statistik-Klausur vom

Donnerstag, 11. Dezember 03 Satz 2.2 Der Name Unterraum ist gerechtfertigt, denn jeder Unterraum U von V ist bzgl.

Computational Intelligence

Datenbanken. Schemaerweiterung zur Abbildung von Imperfekten Daten. Andreas Merkel

2 Zufallsvariable und Verteilungsfunktionen

Ferienkurs Quantenmechanik I WKB-Näherung und Störungstheorie

11 Unabhängige Ereignisse

Beurteilung der biometrischen Verhältnisse in einem Bestand. Dr. Richard Herrmann, Köln

Einwegfunktionen. Problemseminar. Komplexitätstheorie und Kryptographie. Martin Huschenbett. 30. Oktober 2008

Aufgabenblatt 5: Abgabe am vor der Vorlesung

DWT 2.3 Ankunftswahrscheinlichkeiten und Übergangszeiten 400/467 Ernst W. Mayr

[5], [0] v 4 = + λ 3

Statistik III. Walter Zucchini Fred Böker Andreas Stadie

Kardinalzahlen. Bemerkung. Eine unendliche Kardinalzahl α muss eine Limesordinalzahl sein. (Beweis zur Übung)

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Computational Intelligence 1 / 20. Computational Intelligence Künstliche Neuronale Netze Perzeptron 3 / 20

Diskrete Verteilungen

Transkript:

1 / 21 Gliederung 1 Das Schematheorem Motivation Begriffe Herleitung Ergebnis Das Schematheorem Das Schematheorem Motivation 3 / 21 Warum konvergieren Genetische Algorithmen gegen ein Optimum? Theoretische Untersuchung von Holland (1975): Untersuche die Entwicklung von partiell definierten Chromosomen (sog. Chromosomenschemata) über die Generationen Wie entwickelt sich die Anzahl der Chromosomen, die zu einem Schema passen? Ziel: Leite grobe statistische Aussage ab Führe dazu folgende Vereinfachungen ein Repräsentation ist Bitstring mit fester Länge l Fitnessproportionale Selektion Standardmutation Ein-Punkt-Crossover

Definitionen Das Schematheorem Begriffe 4 / 21 Schema Ein Schema ist ein partiell definierter Bitstring der Länge l Erweitere dazu den Grundbereich um ein Jokerzeichen Für das Schema h gilt dann: h {0, 1, } l Offensichtlich gibt es 2 l Chromosomen und 3 l Schemata der Länge l Passung Ein Chromosom c {0, 1} l passt zu einem Schema h {0, 1, } l falls es an dessen definierten Stellen mit ihm übereinstimmt, notiert als c h Stellen an denen im Schema ein Jokerzeichen steht werden nicht beachtet Schema Beispiel Das Schematheorem Begriffe 5 / 21 Gegeben sein ein Schema h = 101 11 0 {0, 1, } 10 sowie die Chromosomen c i {0, 1} 10 mit x 1 = 0110010010 x 2 = 0101011110 x 3 = 0001001100 x 4 = 1101101110 Offensichtlich gilt: Chromosom c 2 und c 4 passen zum Schema h, d.h. c 2 h, c 4 h Chromosom c 1 und c 3 passen nicht zum Schema h, d.h. c 1 h, c 3 h

Das Schematheorem Begriffe 6 / 21 Interpretation des Schemas als Hyperebene Ein Schema beschreibt einen Unterraum des gesamten Suchraums Fasst man den Suchraum als Hypereinheitswürfel auf, beschreibt ein Schema achsenparallele Hyperebenen Beispiel 0 0 entspricht der Kante von 000 nach 010 1 entspricht der rechten Würfelfläche entspricht dem gesamten Würfel 010 0*0 000 011 001 *0* *11 110 100 1** 10* 111 101 Das Schematheorem Begriffe 7 / 21 Eigenschaften eines Schemas Definition: Ordnung Die Ordnung eines Schemas h ist die Anzahl seiner definierten Positionen, d.h. die Anzahl der Nullen und Einsen ord(h) = count 0 (h) + count 1 (h) = length(h) count (h) Beispiel: ord( 101 11 0) = 6 Definition: Definierende Länge Die definierende Länge eines Schemas h ist die Länge seines definierten Bereichs, d.h. die Differenz der Positionsnummern der letzten und der ersten 0/1 in h dl(h) = max(i h i {0, 1}) max(i h i {0, 1}), i {1,..., l} Beispiel: dl( 101 11 0) = 10 2 = 8

Das Schematheorem Herleitung 8 / 21 Herleitung des Schematatheorems Frage Wie entwickelt sich die Anzahl der Chromosomen, die zu einem Schema passen, über die Generationen? Ansatz Um Aussagen über die Ausbreitung von zu einem Schema passenden Chromosomen machen zu können, müssen die Auswirkungen der Selektion und der genetischen Operatoren untersucht werden Selektion Welche Fitness haben Chromosomen, die zum Schema passen? Genetische Operatoren (Mutation und Crossover) Mit welcher Wahrscheinlichkeit geht die Passung zu einem Schema verloren bzw. bleibt sie erhalten? Das Schematheorem Herleitung 9 / 21 Einfluss der Selektion Welche Fitness haben Chromosomen, die zum Schema h passen? Ansatz Mittlere Fitness der passenden Chromosomen Mittlere Fitness Die mittlere Fitness der Chromosomen der Generation t, die zum Schema h passen, ist c pop(t),c h f rel (h) = f rel(c) size({c pop(t) c h}) Durchschnittlich erzeugt ein zum Schema h passendes Chromosom f rel (h) popsize Nachkommen Die zu erwartende Zahl von Chromosomen die nach der Selektion zum Schema h passen ist abhängig von der Zahl der vorher passenden Chromosomen: size({c pop(t 1) c h}) f rel (h) popsize

Einfluss der Selektion Das Schematheorem Herleitung 10 / 21 Die Formel für die von einem zum Schema h passenden Chromosom durchschnittlich erzeugten Nachkommen kann umgeformt werden zu c pop(t),c h f rel (h) popsize = f rel(c) size({c pop(t) c h}) popsize (h) = = c pop(t),c h f (c) c pop(t) f (c ) size({c pop(t) c h}) popsize c pop(t),c h f (c) size({c pop(t) c h}) c pop(t) f (c ) popsize = (h) mittlere Fitness der zum Schema h passenden Chromosomen der Generation t mittlere Fitness aller Chromosomen der Generation t Enspricht somit dem Verhältnis der mittleren Fitness des Schemas zur mittleren Gesamtfitness Einfluss des Crossover Das Schematheorem Herleitung 11 / 21 Mit welcher Wahrscheinlichkeit geht die Passung zu einem Schema durch das Crossover verloren bzw. bleibt sie erhalten? Beispiel Bei einem Chromosoms der Länge l gibt es beim Ein-Punkt-Crossover l 1 gleichwahrscheinliche Schnittpositionen dl(h) dieser Positionen liegen so, dass festgelegte Gene des Schemas getrennt würden, wodurch die Passung verloren gehen könnte Somit gilt p c (h) = dl(h) l 1 Bemerkung: Die Passung kann verloren gehen, was aber nicht immer der Fall sein muss

Einfluss der Mutation Das Schematheorem Herleitung 12 / 21 Mit welcher Wahrscheinlichkeit geht die Passung zu einem Schema durch die Mutation verloren bzw. bleibt sie erhalten? Beispiel Wird jedes Gen des Chromosoms der Länge l mit gleicher Wahrscheinlichkeit für die Mutation gewählt, so geht die Passung zum Schema h mit folgenden Wahrscheinlichkeiten verloren p m (h) = ord(h), falls das Bit gekippt wird l p m (h) = ord(h), falls das Bit zufällig neu bestimmt wird 2l Definitionen Das Schematheorem Herleitung 13 / 21 Im Folgenden werden die Definitionen einiger Erwartungswerte benötigt: Erwartungswert passender Chromosmen E (t) (h) ist die im mittel erwartete Anzahl von Chromosomen, die in der t-ten Generation zum Schema h passen Erwartungswert nach der Selektion E (t) s (h) ist die im mittel erwartete Anzahl von Chromosomen, die in der t-ten Generation nach der Selektion zum Schema h passen Erwartungswert nach dem Crossover E (t) s,c(h) ist die im mittel erwartete Anzahl von Chromosomen, die in der t-ten Generation nach Selektion und Crossover zum Schema h passen Erwartungswert nach der Mutation E (t) s,c,m(h) ist die im mittel erwartete Anzahl von Chromosomen, die in der t-ten Generation nach Selektion, Crossover und Mutation zum Schema h passen. Folglich gilt E (t) s,c,m(h) = E (t+1) (h)

Das Schematheorem Herleitung 14 / 21 Herleitung des Schematatheorems Ziel Finde (näherungsweise) den Zusammenhang zwischen E (t) (h) und E (t+1) (h) Vorgehensweise Betrachte schrittweise die Auswirkungen der Selektion, des Crossover und der Mutation. Hilfsmittel Nutze hierzu die mittlere Fitness, die Ordnung und die definierende Länge eines Schemas. Selektion Das Schematheorem Herleitung 15 / 21 Die Auswirkung der Selektion wird durch die mittlere Fitness beschrieben E (t) s (h) = E (t) (h) f rel (h) popsize E (t) (h) f rel (h) f rel (h) popsize Wahrscheinlichkeit, dass ein zum Schema h passendes Chromosom ausgewählt wird Mittlere Anzahl Nachkommen eines zum Schema h passenden Chromosoms Hinweis: Da die Anzahl der zum Schema h passenden Chromosomen über den Erwartungswert geschätzt wird, kann die relative Fitness f rel (h) nicht exakt bestimmt werden

Das Schematheorem Herleitung 16 / 21 Crossover Die Auswirkung des Crossover wird beschrieben durch s,c(h) = (1 p c ) E (t) s (h) + p c E (t) s (h) (1 p loss ) +C }{{}}{{} A B E (t) p c p loss A B C Wahrscheinlichkeit des Crossover Wahrscheinlichkeit, dass durch das Ein-Punkt-Crossover die Passung des Chromosoms zum Schema h verloren geht Mittlere Anzahl der Chromosomen, die zum Schema h passen und nicht am Crossover teilnehmen Mittlere Anzahl der Chromosomen, die am Crossover teilnehmen und deren Passung zum Schema h nicht verletzt wird Gewinn an Chromosomen, die zum Schema h passen Beispiel Das Schematheorem Herleitung 17 / 21 Mutation Die Auswirkung der Mutation wird durch die Ordnung des Schemas beschrieben Ansatz E (t+1) (h) = E (t) s,c,m(h) = E (t) s,c(h) (1 p m ) ord(h) p m Mutationswahrscheinlichkeit eines Bits, d.h. jedes Bit wird mit Wahrscheinlichkeit p m mutiert (gekippt) und mit Wahrscheinlichkeit (1 p m ) nicht mutiert Damit die Passung nicht verletzt wird, darf offensichtlich keines der ord(h) Gene, die das Schema definieren, verändert werden Alternative Mutiere genau ein Gen des Chromosoms E (t+1) (h) = E (t) s,c,m(h) = E (t) s,c(h) ord(h) l ord(h) l Wahrscheinlichkeit mit der ein das Schema definierendes Bit gekippt wird

Schematheorem Das Schematheorem Ergebnis 18 / 21 Insgesamt folgt (mit dem ersten Mutationsmodell) E (t+1) (h) = f rel (h) popsize (1 p m ) ord(h) E (t) (h) ( ) dl(h) 1 p c l 1 (1 E(t) (h) f rel (h)) Einsetzten der Fitnesswahrscheinlichkeit liefert schließlich das Schematheorem E (t+1) (h) = (h) ( 1 p c dl(h) l 1 (1 p m ) ord(h) E (t) (h) ( 1 E(t) (h) popsize )) (h) Das Schematheorem Ergebnis 19 / 21 Analyse des Schematheorems E (t+1) (h) = (h) ( 1 p c dl(h) l 1 (1 p m ) ord(h) E (t) (h) ( 1 E(t) (h) popsize )) (h) Besonders stark vermehren sich Schemata, mit überdurchschnittlicher Bewertung kurzer definierender Länge geringer Ordnung

Baustein-Hypothese Das Schematheorem Ergebnis 20 / 21 Interpretation Das Schematheorem besagt, dass Schemata mit überdurchschnittlicher Bewertung, kurzer definierender Länge und geringer Ordnung sich stark vermehren Das bedeutet aber, dass der Suchraum besonders intensiv in den durch die beschriebenen Schemata definierten Hyperebenen (d.h. Regionen) durchsucht wird Schemata mit o.g. Eigenschaften werden auch als Bausteine ( building blocks ) bezeichnet, obige Aussage deshalb auch als Baustein-Hypothese Hinweis: Die Baustein-Hypothese gilt in dieser Form nur für Kodierungen durch Bitstrings, fitnessproportionale Selektion, Standardmutation und Ein-Punkt-Crossover Kritik Das Schematheorem Ergebnis 21 / 21 Genau genommen gilt das Schematheorem nur für unendlich große Populationen In der Herleitung wurden Erwartungswerte genutzt, deren Werte erheblich von den Werten für konkrete Populationen abweichen können Das Phänomen der Epistase wurde vernachlässigt Implizit wurde unterstellt, dass die Wechselwirkungen zwischen den Genen gering sind; die Fitness von zu einem Schema passenden Chromosomen somit ähnlich ist Implizite Annahme der Nachbarschaft zusammengehöriger Gene Interagierende Gene bilden so kleine Bausteine. Kritik trifft im Grunde jedoch nicht die Genetische Algorithmen an sich und lässt sich durch den Wechsel vom Ein-Punkt-Crossover auf andere Operatoren bzw. geänderte Definitionen für die definierende Länge entkräften