Vorlesung Evolutionäre Algorithmen Dr. Nicole Drechsler, AG Rechnerarchitektur Raum 3480, Tel. 7391, nd@tzi.de Vorschlag für Prüfungskriterien: Bearbeitung einer praktischen (Programmier-) Aufgabe Fachgespräch einzeln (15 min) bzw. Modulprüfung (30 min) 1
Literatur K. Weicker: Evolutionäre Algorithmen, Teubner Verlag, 2002 W. Kinnebrock: Optimierung mit Genetischen und Selektiven Algorithmen, Oldenbourg Verlag, 1994 Sekundärliteratur: Originalarbeiten Bücher von J. Holland (1975), D. Goldberg (1989), J. Koza (1992), Z. Michalewicz (1994), E. Schöneburg (1994) T. Bäck et. al.: Handbook of Evolutionary Computation, Oxford University Press, 1997 2
Gliederung Kapitel 1: Einführung in Evolution und Optimierung Kapitel 2: Evolution als Optimierungsprinzip Kapitel 3: Prinzipien Evolutionärer Algorithmen Kapitel 4: Evolutionäre Standardalgorithmen Genetische Algorithmen Evolutionstrategien Evolutionäre Programmierung Genetische Programmierung Kapitel 5: Problemspezifische Verfahren Kapitel 6: Aktuelle Entwicklungen und Erweiterungen 3
Optimierungsverfahren treten in fast allen technischen, naturwissenschaftlichen, wirtschafts- und gesellschaftswissenschaftlichen Anwendungen auf Effiziente und robuste Optimierungsverfahren sind von großer praktischer Bedeutung Exakte mathematische Optimierungsverfahren existieren für eingeschränkte Modellklassen, z.b. Lineare Probleme (Simplexverfahren) Branch&Bound... 4
Notation Evolutionäre Algorithmen (EAs) Oberbegriff von Genetischen Algorithmen (Holland) Evolutionsstrategien (Rechenberg/Schwefel) Evolutionärer Programmierung (Fogel) Genetischer Programmierung (Koza) hybriden Verfahren... Unabhängig entwickelt seit 60er Jahren 5
Viele reale Probleme sind nicht exakt optimierbar! Heuristiken (griech. heureka) Numerische Verfahren (mit und ohne Kenntnis der Ableitungen), z.b. Gradientenverfahren Probabilistische Verfahren Die Ansätze garantieren nicht, dass ein globales Optimum gefunden wird! Evolutionäre Algorithmen gehören zur Klasse der probabilistischen Verfahren, die um die Ideen aus der Evolution erweitert werden. Selektion von Lösungen und deren Veränderungen sind zufallsgesteuert. 6
Das steigende Interesse an naturanalogen Verfahren ist bedingt durch den erfolgreichen Einsatz der Verfahren in vielen realen Anwendungen die einfache Umsetzung vieler naturanaloger Verfahren Aber: Naturanaloge Verfahren sind kein Allheilmittel d.h. sie sind kein Black-Box Optimierungsverfahren genaue Analyse der Problemstellung ist notwendig Aussagen über die Qualität der Lösung sind idr nicht möglich Kenntnisse über Mathematik und Stochastik sind notwendig 7
Optimierung Finden eines Minimums Schwierige Probleme polynomielle bzw. schnelle Algorithmen nicht bekannt 8
Zufälliges Bestimmen Raten einer Lösung Einfache Methode schnell häufig schlechte Ergebnisse 9
Greedy-Verfahren Lokales Verbessern einer Startlösung Schnelle Methode Erreichen eines lokalen Minimums Abhängig von Startpunkt 10
1. Einführung in die Evolution und Optimierung Optimierungsverfahren Idee: Betrachte mehrere Lösungen Motivation durch Beobachtungen in der Natur Lösungen sind Individuen einer Population Erzeugen neuer Individuen Selektion der besser angepassten Lösungen Anpassung wird durch Bewertung der Individuen gemessen Weiterentwicklung erfolgt durch einen simulierten Evolutionsprozess survival of the fittest 11
Prinzipien der biologischen Evolution Die Beschreibung der Evolutionsmechanismen erfolgt stark vereinfacht, wie sie für das Verständnis Evolutionärer Algorithmen erforderlich ist. Die realen Abläufe sind deutlich komplexer und nur teilweise bekannt. Die Mechanismen der natürlichen Evolution sind selbst Resultat der Evolution. Biologische Evolution ist die Veränderung des Lebens durch Selektion und Variation des genetischen Materials. 12
Biologischer Hintergrund Erste Erkenntnisse der Evolution basieren auf den Arbeiten von Charles Darwin (1859): Natürliche Selektion bevorzugt Spezies, die besser an ihre Umgebung angepasst sind Spezies unterliegen zufälligen Modifikationen (Mutationen) Nachkommen entstehen durch Fortpflanzung unter Mischen der Erbinformationen 13
Evolution und Genetik Spezies bzw. Individuen sind durch ihre genetische Information definiert in den Genen kodiert Vollständige genetische Information wird als Genotyp bezeichnet, einzelne Individuen als Phänotyp. Die Evolution bzw. die Selektion findet auf Ebene der Phänotypen statt. 14
Bauplan eines Organismus In der DNA kodiert (desoxyribonucleic acid) String-artiges Molekül bestehend aus Nukleotiden mit den Basen Adenin (A) Cytosin (C) Guanin (G) Thymin (T) 15
Bauplan eines Organismus (Cont) Basenpaare bilden die Verbindungen zwischen den Strängen Alle Verbindungen sind vom Typ T-A oder G-C ein Strang ist aus dem anderen ableitbar Redundanz und Fehlertoleranz Während der Zellteilung werden die Stränge aufgespalten, so dass die Information repliziert werden kann (Selbstreplikation der DNA). 16
Vom Genotyp zum Phänotyp DNA ist Informationsträger Aufbau des Organismus (Phänotyp) aus dem Bauplan (Genotyp) Auf Zellebene besteht dieser Schritt aus der Proteinbiosynthese Proteine sind Ketten von Aminosäuren 20 unterschiedliche Aminosäuren bilden die Buchstaben, aus denen Wörter (Proteine) gebildet werden Ein Gen ist Teil der DNA, der Informationen zur Synthese eines Proteins enthält. Wert eines Gens nennt man Allel 17
Schritte der Proteinsynthese DNA (m)rna Protein RNA (engl. ribonucleic acid) ist ein einstrangiges Molekül, das mit Enzymen interagieren kann und aus der DNA entsteht Übersetzungstabelle DNA RNA Basenpaar der DNA G-C T-A C-G A-T RNA G U C A Uracil(U) ersetzt in der RNA das Thymin (T) der DNA 18
RNA-Information ist gemäß des sog. Genetischen Codes in der mrna gespeichert Jeweils 3 Nukleotide bestimmen eine Aminosäure in der Aminosäuresequenz eines Proteins Mit 3 Nukleotiden und 4 Basen können 4 3 = 64 Aminosäuren kodiert werden gute Fehlerredundanz Jede Aminosäuresequenz beginnt mit einem Start- und endet mit einem von drei Stopp-Zeichen 19
20 Genetischer Code U C A G Cys Cys (stop) Trp Tyr Tyr (stop) (stop) Ser Phe Phe Leu Leu U U C A G Ser Ser Arg Arg Asn Asn Lys Lys Thr Ile Ile Ile Met (start) A Val Leu U Zweites Nukleotid Ala Pra C Asp Asp Glu Glu His His Gln Gln A U C A G Gly G U C A G Arg C G Drittes Nukleotid Erstes Nukleotid
Schematischer Ablauf der Proteinbiosynthese Struktur der DNA Aufspalten der DNA durch Enzyme (RNA-Polymerase) Selbstreplikation durch Ergänzung der einzelnen Stränge unter Mitwirkung von Enzymen (Bildung der m-rna) 21
Proteinbiosynthese (Cont) m-rna wandert aus dem Zellkern in das Zellplasma Ribosomen lagern sich an die m-rna An jedem Ribosom entsteht eine Polypeptidkette (Protein) aus der Verknüpfung einzelner Aminosäuren (Zuordnungsvorschrift des genetischen Codes) Die Aminosäuren werden von spezifischen t-rnas herangeschafft 22
Evolution auf Zellebene Fehlerrate bei Zellteilung liegt bei 10-10 bis 10-11 Stabile Erhaltung der Informationen Wichtig für Erhaltung von Eigenschaften Weniger Spielraum für Evolution Wichtig für Erreichen von Verbesserungen 23
Evolution auf Zellebene (2) Selektionsvorteile durch Sexualität als evolutionsbeschleunigender Mechanismus? Rekombination des Erbguts der Eltern Keimzellen der Eltern Kinderorganismus Keimzellen der Kinder 24
Evolutionsprinzip Evolution findet in einer Population von Individuen statt Änderung der Häufigkeiten von Allelen durch Selektionsvorteile Elternselektion Umweltselektion Fehler bei der Reproduktion der DNA Mutation Neukombination des genetischen Materials der Eltern Rekombination 25
Evolutionsprinzip Evolution findet in einer Population von Individuen statt Änderung der Häufigkeiten von Allelen durch Selektionsvorteile Elternselektion Umweltselektion Fehler bei der Reproduktion der DNA Mutation Neukombination des genetischen Materials der Eltern Rekombination 26
Mutation Fehler bei der Reproduktion der DNA Mutationswahrscheinlichkeiten Mensch Wahrscheinlichkeit einer Mutation 10-10 Genom mit etwa 10 5 Genen und 10 4 Bausteine je Gen Ergibt Mutationswahrscheinlichkeit von 10-1 pro Zellteilung Viele Veränderungen haben keine Auswirkungen oder sind rezessiv Mutationen sind Grundlage für Modifikationen im Evolutionsprozess Einzelne Veränderungen sind sehr klein Große Veränderungen sind Summe vieler kleiner Veränderungen Große Veränderungen in einem Schritt sind idr schlecht Wechselwirkungen zwischen den Komponenten 27
Evolutionsprinzip Evolution findet in einer Population von Individuen statt Änderung der Häufigkeiten von Allelen durch Selektionsvorteile Elternselektion Umweltselektion Fehler bei der Reproduktion der DNA Mutation Neukombination des genetischen Materials der Eltern Rekombination 28
Rekombination Neu-Kombination des genetischen Materials der Eltern (kein Evolutionsfaktor aus Sicht der klassischen Evolutionslehre) Es entsteht keine neue Information bzw. Eigenschaften, die vorhandene Information wird neu gemischt Neuere Forschungen lassen vermuten, dass durch Rekombination erzeugte Allele für den Evolutionsprozess wichtiger sind als die durch Mutationen erzeugten 29
Selektion und Fitness Veränderung der Häufigkeit von Allelen durch unterschiedlich viele Nachkommen der einzelnen Allele Ursachen: Unterschiedliche Überlebenschancen Unterschiedliche Fortpflanzungsrate Unterschiedlicher Erfolg bei der Partnersuche Unterschiedliche Länge der Generationsdauer Selektionsmaß ist gegeben durch Fitnesswerte der Genotypen Relative Fitness eines Genotyps G ist definiert über Anzahl der überlebenden Nachkommen in einer Population Fitness(G) = #Nachkommen(G)/#Nachkommen(G ) mit G bester Genotyp in Population 30
Selektion ist kein reiner Auswahlprozess, der jeweils nur die vorteilhafteste Form auswählt Mögliche Gründe: Polymorphismus nur geringfügige Selektionsunterschiede der Phänotypen oder unterschiedliche Selektionsvorteile bei wechselnden Umweltbedingungen Rezessive Allele: A dominant, a rezessiv Aa und AA haben den gleichen Phänotypen Aa kann Vorteile gegenüber AA haben, so dass aa immer wieder entstehen kann Räuber-Beute Systeme (Selektionsvorteile von Minderheitsphänotypen) Polymorphe Population hat mehr Potential zur Anpassung bessere Überlebenschance 31
Genfluss Genhäufigkeiten ändern sich durch Zu- und Abwandern von Individuen in einer Population Teilpopulationen Durch Austausch von Individuen zwischen den (isolierten) Teilpopulationen entsteht ein Genfluss Getrennte Population können sich auseinander entwickeln Entstehung neuer Arten ohne Genfluss Geographische oder zeitliche Trennungen 32
Gendrift Alle Allele einzelner Gene sterben durch Zufallseffekte aus Bewirkt Reduktion der Vielfalt in einer Population Vor allem in kleinen Populationen (<1000) ist Gendrift ein wesentlicher Evolutionsfaktor Evolutionsbeschleunigung durch Gendrift und Genfluss? Keine Relevanz in großen Populationen 33
Nischenbildung Aufteilung der Umwelt an verschiedene Arten Jeder nutzt die vorhandenen Ressourcen auf eigene Art und Weise für Wachstum und Ernährung Bei Überschneidung der Nischen werden Selektionsmechanismen aktiv und stellen Gleichgewicht wieder her Genfluss/Gendrift Nischenbildung Evolution ökologischer Beziehungen Wechselwirkungen zwischen Änderungen der unterschiedlichen Arten Koevolution 34
Selektionsvorteil durch Lernen? (Widerlegte) Theorie von Lamarck (1809): Genotyp 1 Genotyp 2 bestimmt Phänotyp 1 Lernen Phänotyp 2 bestimmt Baldwin-Effekt: Vererbung von spezifischen Lernfähigkeiten durch Selektionsvorteile (1896): Genotyp 1 Evolution Genotyp 2 bestimmt Baldwin-Effekt bestimmt Phänotyp 1 Lernen Phänotyp 1 Phänotyp 2 Lernen Phänotyp 2 35
Evolution und Optimierung Evolutionsprozess: lässt angepasste Individuen entstehen und passt sie dynamisch geänderten Umweltbedingungen an erhält Diversität im Genpool Mechanismen der Evolution sind zufallsgesteuert (Mutation, Selektion, Rekombination) Evolution optimiert die Entwicklung von Spezies Können die erfolgreichen Konzepte der Evolution auch im Zusammenhang mit mathematischen Optimierungsproblemen genutzt werden? 36