Gerhard Keller Mathematik in den Life Siences Grundlagen der Modellbildung und Statistik mit einer Einführung in die Statistik-Software R 49 Abbildungen Verlag Eugen Ulmer Stuttgart
Inhaltsverzeichnis 1 1.1 1.2 2 2.1 2.2 2.3 2.3.1 2.3.2 2.3.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2 3.3 3.4 3.5 4 4.1 4.2 4.3 4.3.1 4.3.2 4.3.3 4.4 4.5 4.6 4.7 5 5.1 5.2 5.2.1 5.2.2 Einführung.... Warum Mathematik?.......... Vorbereitende und ergänzende Literatur Mathematische Grundbegriffe. Zahlen.... Rechenregeln.... Zahlen als Messergebnisse Messgenauigkeit, Runden. Maßeinheiten....... Mol und Molekulargewicht Vektoren, Matrizen.. Matrizenmultiplikation Zahlenfolgen...... Funktionen.... Bemerkungen zum Rechnen mit Logarithmen Fragen und Aufgaben... Differenzieren, Ableitung Ableitung von Funktionen einer Variablen Ableitungsregeln.... Integral und Stammfunktion Partielle Ableitungen.... Fragen und Aufgaben.... Grafische Darstellung von Daten und beschreibende Statistik. Datenvektoren und Datenmatrizen... Beschreibende Statistik - Grundbegriffe Eindimensionale Stichproben. Nominale Merkmale.. Metrische Merkmale...... Statistische Kennzahlen.... Zweidimensionale Stichproben Lineare Regression Allometrie...... Fragen und Aufgaben Wachstumsmodelle: unbeschränktes Wachstum. Lineares Wachstum.... Exponentielles Wachstum - diskrete Zeit. Modellwahl........ Quadratische Abweichung.... 11 11 13 15 15 16 17 17 18 18 19 21 22 23 25 25 27 27 29 32 33 34 35 35 37 38 38 39 41 43 45 48 51 53 53 54 58 59
6 Inhaltsverzeichnis 5.3 5.3.1 5.3.2 5.3.3 5.304 5.3.5 5.3.6 5.3.7 5.4 6 6.1 6.1.1 6.1.2 6.1.3 6.104 6.2 6.3 6.3.1 6.3.2 6.4 6.5 6.6 7 7.1 7.2 7.3 7.4 8 8.1 8.2 8.3 9 9.1 9.1.1 9.1.2 9.2 9.2.1 9.2.2 9.3 9.4 9.5 9.5.1 Exponentielles Wachstum - stetige Zeit.... Von diskreter zu stetiger Zeit....................... Die Differenzialgleichung für exponentielles Wachstum in stetiger Zeit. Kommentar aus der Sicht der Mathematik..... Lineare Regression bei exponentiellem Wachstum. Zusammenfassung zum exponentiellen Wachstum: Exponentielles Aussterben.,. Verdopplungs zeit, Halbwertzeit. Fragen und Aufgaben...... Wachstumsmodelle: beschränktes Wachstum Logistisches Wachstum............. Ein paar grundsätzliche Bemerkungen zum Begriff der Differenzialgleichung.............. Bemerkungen zum numerischen Lösen einer Differenzialgleichung Anpassung des logistischen Modells an Daten........... Ein Residuenplot.... Stabilisierung bei konstantem Zufluss und exponentiellem Abbau Variationen ZUm logistischen Wachstum.. Ein logistisches Modell mit "Bejagung".... Ein Modell mit zwei stabilen Gleichgewichten Zeitverzögerungen.... Zwei Modelle der chemischen Reaktionskinetik Fragen und AUfgaben...... Modelle der Populationsgenetik Das Hardy-Weinberg-Modell Inzucht.... Selektion.... Fragen und Aufgaben Wachstumsmodelle: zwei Populationen. Das Räuber-Beute-Modell von Lotka und Volterra Ein einfaches Epidemiemodell Fragen und AUfgaben..... Wahrscheinlichkeitsrechnung Zufallsvariablen........ Diskrete Zufallsvariablen... Kontinuierliche Zufallsvariablen Unabhängigkeit diskreter Zufallsvariablen Bedingte Wahrscheinlichkeit und Unabhängigkeit. Die Binomialverteilung.............. Unabhängigkeit kontinuierlicher Zufallsvariablen Histogramm unabhängiger Beobachtungen '" Erwartungswert und Varianz........... Erwartungswert und Varianz diskreter Zufallsvariablen 60 60 61 62 63 64 64 65 66 67 67 71 72 73 74 75 76 76 79 80 81 85 87 87 91 92 97 98 98 103 105 106 106 107 108 109 110 110 112 112 113 113
Inhaltsverzeichnis 7 9.5.2 9.6 9.6.1 9.6.2 9.6.3 9.7 10 10.1 10.1.1 10.1.2 10.1.3 10.2 10.3 11 11.1 11.2 11.2.1 11.2.2 11.3 Erwartungswert und Varianz kontinuierlicher Zufallsvariablen Normal- und Poisson-Approximation der Binomialverteilung Verteilungsfunktionen binomialverteilter Zufallsvariablen Normalapproximation der Binomialverteilung. Poisson-Approximation der Binomialverteilung Fragen und Aufgaben..... Beurteilende Statistik: Testen Der Binomialtest........ Formulierung des Testproblems. Durchführung des Tests..... Unabhängigkeit der Beobachtungen Chi-Quadrat-Tests.. Fragen und Aufgaben....... Beurteilende Statistik: Schätzen. Schätzen von Erfolgswahrscheinlichkeiten Konfidenzintervall für den Erwartungswert Konfidenzintervall bei normalverteilten Beobachtungen. Der Ein-Stichproben-t-Test Fragen und Aufgaben................. 115 116 116 117 118 119 120 120 120 121 122 123 129 131 131 134 135 136 137 12 12.1 12.2 12.3 12.4 13 13.1 13.1.1 13.1.2 13.2 13.3 13.3.1 13.3.2 13.3.3 13.3.4 13.4 13.5 R R1 R1.1 R1.2 Beurteilende Statistik: Korrelation und Regression. Ist der Korrelationskoeffizient signifikant von Null verschieden? Die statistische Beurteilung der geschätzten Regressionskoeffizienten Vorsicht bei linearer Regression. Fragen und Aufgaben.......... Einführung in das Sequenz-Alignment Scoring-Modelle zur Bewertung von Alignments. Scoring bei DNA-Alignments...... Scoring bei Proteinsequenz-Alignments Scores und Wahrscheinlichkeiten.... Der Needleman-Wunsch-Algorithmus Die Grundidee des Needleman-Wunsch-Algorithmus Eine Realisierung des Needleman-Wunsch-Algorithmus für den Vergleich zweier DNA-Sequenzen in R Beispiele zum Needleman-Wunsch-Algorithmus Der Smith-Waterman-Algorithmus Clustering...... Fragen und Aufgaben Einführung in R... Erste Schritte... R als Taschenrechner Eine erste Grafik... 138 138 140 142 142 143 143 143 144 146 148 149 151 152 153 154 156 157 158 158 161
8 Inhaltsverzeichnis R2 R2.1 R2.2 R2.3 R3 R3.1 R3.2 R3.3 R3.4 R4 R4.1 R4.2 R5 R5.1 R5.2 R6 R6.1 R6.2 R6.3 R7 R7.1 R7.2 R7.3 R7.4 R8 R8.1 R8.2 R9 R9.1 R9.2 R9.3 RlO RI0.1 RI0.2 RlO.3 RU RU.l Rl1.2 RU.3 Rl1.4 Grundlegende Begriffe Variablen.... Folgen.... Die erzeugten Objekte. Funktionen, Nullstellen, Maxima, Minima, R-Hilfe. Funktionen.... Funktionsgraphen......... Hilfe in der Dokumentation.... Nullstellen, Maxima und Minima. Funktionen mehrerer Variablen, der Workspace von R. Funktionen mehrerer Variablen... Wie funktioniert R im Hintergrund? Vektoren, Matrizen, der Dateneditor Vektoren.... Matrizen.... Matrizenmultiplikation, Dotplots. Matrizenmultiplikation...... Der Befehl outer ().... Eine Vergleichstabelle für Sequenzvergleiche und ein Dotplot Datensätze, R Commander, beschreibende Statistik Der R Commander............. Datensätze................. Speichern von Programmen und Objekten Lineare Regression und Korrelation ". Datenim- und -expon, Grafikexpon ". Erstellen und Einlesen eigener Datensätze Grafik-Export.... Exponentielles Wachstum und Abklingen Zinseszins mit R als Taschenrechner ". Exponentielles Wachstum - US-Bevölkerungsdaten Exponentieller Abbau - Medikamentenabbau im Körper Nichtlineare Regression.... Logistisches Wachstum - US-Bevölkerungsdaten. Biexponentielles Abklingen......... Michaelis-Menten-Funktion......... Binomial-, Normal- und Poisson-Veneilung Die Binomialverteilung Die Norrnalveneilung............ Die Poisson-Veneilung.... Plotten Von Dichten und Veneilungsfunktionen 162 162 163 165 166 166 167 168 169 171 171 172 174 174 176 180 180 182 183 185 185 186 189 190 193 193 195 197 197 197 198 200 201 201 202 203 203 204 205 205
Inhaltsverzeichnis 9 R12 R12.1 R12.2 R13 R13.1 R13.2 R13.3 R13.4 RH R14.1 R14.2 R14.3 R14.4 Binomialtest und Chi-Quadrat-Tests... Die Binomialverteilung und der Binomialtest x 2 -Tests..... Schätzen und Testen bei normalverteilten Beobachtungen Konfidenzintervalle bei normalverteilten Beobachtungen Ein-Stichproben-t-Test................. Zwei-Stichproben-t-Test - verbundene Strichproben. Statistik zur linearen Regression Sequence Alignment........... Die Datenbank Genbank.... Die Bereitstellung von Sequenzen für R. Needleman-Wunsch-Algorithmus für Protein-Sequenzen Gleichzeitiger Vergleich mehrerer Sequenzen 206 206 208 209 209 211 212 213 214 214 215 216 217 Verzeichnisse.............. R-Codes zu ausgewählten Abbildungen Literatur.... Sachregister.... Index der R-Befehle 219 219 225 227 231