QSAR, QSPR, Statistik, Korrelation, Similarität & Deskriptoren

Größe: px
Ab Seite anzeigen:

Download "QSAR, QSPR, Statistik, Korrelation, Similarität & Deskriptoren"

Transkript

1 QSAR, QSPR, Statistik, Korrelation, Similarität & Deskriptoren Das Handwerkszeug des rational drug designs am Computer, vor allem dann, wenn keine Strukturinformation über das target (Enzym) vorhanden ist. QSAR-Gleichungen stellen einen quantitativen Zusammenhang zwischen chemischer Struktur und (biologischer) Aktivität her. log(/ C) = k P + k P + K+ k n P n Erfordert das Vorhandensein von experimentellen Meßdaten für eine Reihe von bekannten Verbindungen, z.b. aus High Throughput Screening 5. Vorlesung Modern Methods in Drug Discovery WS5/6

2 Begriffsdefinitionen QSAR: quantitative structure-activity relationsship QSRP: quantitative structure-property relationship Activity und Property sind z.b: log(/k i ) Bindungskonstante log(/ic 5 ) Konzentration bei der 5% Wirkung eintritt Physikalische Größen, wie Siedepunkt, Löslichkeit, Ziel: Voraussage von Moleküleigenschaften anhand ihrer Struktur, ohne eine expt. Meßung durchführen zu müßen. > in silico anstatt in vitro oder in vivo Vorteil: Einsparung von Zeit und Resourcen 5. Vorlesung Modern Methods in Drug Discovery WS5/6

3 Zeitliche Entwicklung von QSAR Methoden (I) 868 A.C.Brown, T.Fraser: Physiologische Aktivität ist eine Funktion der chemischen Konstitution (Zusammensetzung) Aber: Eine direkte Beziehung ist nicht gegeben, sodern immer nur über die Unterschiede. Zur Erinnerung: 865 Strukturvorschlag für Benzol von A. Kekulé Die chemische Struktur der meisten organischen Verbindungen ist noch unbekannt! 893 H.H.Meyer, C.E.Overton Toxizität von organischen Verbindungen steht im Verhältnis zu deren Verteilung zwischen wäßrigem und lipophilen biologischem Medium 5. Vorlesung Modern Methods in Drug Discovery WS5/6 3

4 Zeitliche Entwicklung von QSAR Methoden (II) 868 E.Fischer Schlüssel-Schloß Prinzip bei Enzymen Widerum keinerlei strukturelle Information über Enzyme vorhanden! 93-4 Hammet Gleichung: Reaktivität physikalisch, organische, theoretische Chemie 964 C.Hansch, J.W.Wilson, S.M.Free, F.Fujita Geburtsstunde der modernen QSAR-Methoden Hansch-Analyse bzw. Free-Wilson-Analyse log(/ C) Koeffizienten (konstant) = k P + k P + K+ k n P n linear free energy-related approach Deskriptoren oder Variablen 5. Vorlesung Modern Methods in Drug Discovery WS5/6 4

5 Deskriptoren Ansätze eine mathematische Beziehung zwischen numerischen Eigenschaften (Deskriptoren P i ) und physikochemischen Eigenschaften der Verbindung (z.b. biologische Aktivität log(/c) ) herzustellen, werden als QSAR, bzw QSPR bezeichnet. log(/ C) = k P + k P + K+ k n P n Daneben werden Deskriptoren auch zur Beschreibung von Molekülen in der Diversitäts Analyse und in Kombinatorischen Bibliotheken eingesetzt. Prinzipiell kann jede molekulare Eigenschaft als Deskriptor verwendet werden. Mehr zu Deskriptoren unter 5. Vorlesung Modern Methods in Drug Discovery WS5/6 5

6 Informationsfluß in einer drug discovery pipeline 5. Vorlesung Modern Methods in Drug Discovery WS5/6 6

7 Komponentenauswahl Zunehmende Information Wieviel Information ist über das target vorhanden? X-Ray mit Wirkstoff Docking HTS X-Ray des Proteins Reihe von wirksamen Verbindungen Wenige hits aus HTS active site Kenntnis der Enzymfunktion (z.b. Kinase, GPCR) QSAR, Pharmacophor erstellen combi chem eadme Filter Erstellen einer virtuellen Bibliothek 5. Vorlesung Modern Methods in Drug Discovery WS5/6 7

8 Molekülbasierte Deskriptoren zur Voraussage der ADME Eigenschaften logp Wasser/Octanol Verteilungskoeffizient Lipinski s rule Topologische Indices Polar surface area Similarität / Dissimilarität QSAR quantitative structure activity relationship QSPR quantitative structure property rel. 5. Vorlesung Modern Methods in Drug Discovery WS5/6 8

9 D Deskriptoren (I) Für einige Deskriptoren benötigt man nur Kenntnisse die sich bereits aus der Summenformel der Verbindung erhält. Bsp.: Molmasse, Gesamtladung, Anzahl von Halogenatomen Weitere solcher eindimensionaler Deskriptoren ergeben sich additiv aus atomaren Beiträgen. Bsp.: Summe der atomaren Polarisierbarkeiten Refraktivität (Brechungsindex n, molar refractivity, M R ) M R = (n ) MW / (n +) d mit Dichte d, Molekülgewicht MW Ist abhängig von der Polarisierbarkeit und enthält außerdem das Molekülvolumen (MW / d) 5. Vorlesung Modern Methods in Drug Discovery WS5/6 9

10 logp (I) Der Wasser/n-Octanol Verteilungskoeffizient bzw. der logarithmierte Wert wird als logp bezeichnet. Wird oft zur Abschätzung der Membrangängigkeit und der Bioverfügbarkeit einer Verbindung eingesetzt, da ein oral applizierter Wirkstoff lipophil genug sein muß um durch die Lipidschicht der Membrane zu gelangen, andererseits wasserlöslich sein muß um in Blut und Lymphe transportiert zu werden hydrophil 4. < logp < +8. lipophil Zitronensäure.7 Iodbenzol +3.5 Typische Wirkstoffe < Vorlesung Modern Methods in Drug Discovery WS5/6

11 logp (II) Zur Vorhersage des logp wurde eine Reihe von Methoden entwickelt: basierend auf Molekülfragmenten (Gruppen und Reste) ClogP Leo, Hansch et al. J.Med.Chem. 8 (975) 865. Problem: Aufreten von nicht parametrisierten Fragmenten (bis zu 5% in Substanzbibliotheken) basierend auf Atomtypen SlogP S.A. Wildman & G.M.Crippen J.Chem.Inf.Comput.Sci. 39 (999) 868. AlogP, MlogP, XlogP... Jeweils mittels einer mathematischen Fitprozedur (Regressionanalyse, Neuronales Netz) erstellt. 5. Vorlesung Modern Methods in Drug Discovery WS5/6

12 logp (III) Neuere Methoden zur Vorhersage des logp verwenden zunehmend Eigenschaften des kompletten Moleküls, wie etwa Moleküloberfläche (polare/unpolare, bzw.deren elektrostatische Eigenschaften) Dipolmoment und Polarisierbarkeit Volumen / Oberfläche (Globularität) Bsp: mit Hilfe quantenmechanischer Daten trainiertes Neuronales Netz logp T. Clark et al. J.Mol.Model. 3 (997) Vorlesung Modern Methods in Drug Discovery WS5/6

13 D Deskriptoren (II) Weitere atomare Deskriptoren benutzen Information basierend auf empirischen Atomtypen wie in einem Kraftfeld. Bsp.: Anzahl von Halogenen Anzahl von sp 3 substituierten Kohlenstoffatomen Anzahl von H-Brücken Akzeptoren (N, O, S) Anzahl von H-Brücken Donoren (OH, NH, SH) Anzahl aromatischer Ringe Anzahl von COOH Gruppen... Anzahl frei drehbarer Bindungen 5. Vorlesung Modern Methods in Drug Discovery WS5/6 3

14 fingerprints Binärer fingerprint eines Moleküls 5. Vorlesung Modern Methods in Drug Discovery WS5/6 4

15 Lipinski s Rule of 5 Kombination von Deskriptoren zur Abschätzung der intestinalen Absorption. Schlechte Aufnahme der Verbindung, wenn Molekülmasse > 5 logp > 5. > 5 H-Brücken Donoren (OH und NH) > H-Brücken Akzeptoren (N und O) Schlechte Diffusion Zu lipophil Zuviele H-Brücken mit den Kopfgruppen der Membran C.A. Lipinski et al. Adv. Drug. Delivery Reviews 3 (997) Vorlesung Modern Methods in Drug Discovery WS5/6 5

16 5. Vorlesung Modern Methods in Drug Discovery WS5/6 6 D Deskriptoren (I) Bei Deskriptoren die sich aus der Molekülkonfiguration (kovalente Verknüpfung der Atome) ableiten, spricht man von D Deskriptoren. Da keine Atomkoordinaten verwendet werden sind D Deskriptoren generell konformationsunabhängig obwohl sie topologische Information über das Molekül enthalten. Vgl. Darstellung mittels SMILES C C 5 H H 3 H 4 O 7 H distance matrix D adjacency matrix M O H C H H H C

17 D Deskriptoren (II) Die wesentlichsten topologischen Eigenschaften eines Moleküls sind der Verzeigungsgrad und die molekulare Form. H 4 O 7 C C 5 H 6 Für Kohlenstoff stehen 4 Valenzen zur Verfügung. H H 3 Das Verhältnis der tatsächlichen Verzweigung zur theoretisch möglichen Verzeigung läßt sich deshalb als Deskriptor verwenden. 5. Vorlesung Modern Methods in Drug Discovery WS5/6 7

18 Allgemeine Definitionen: D Deskriptoren (III) Z i Ordnungszahl (H=, C=6, LP=) h i Anzahl H-Atome die an Atom i gebunden sind d i Anzahl schwerer Atome die an Atom i gebunden sind Deskriptoren für den Verzweigungsgrad und die Flexibilität eines Moleküls: Kier & Hall Connectivity Indices p i Anzahl der s und p Valenzelektronen an Atom i v i = (p i h i ) / (Z i p i ) für alle schweren Atome 5. Vorlesung Modern Methods in Drug Discovery WS5/6 8

19 Kier und Hall Connectivity Indices Z i Ordnungszahl (H=, C=6, LP=) d i Anzahl schwerer Atome die an Atom i gebunden sind p i Anzahl der s und p Valenzelektronen an Atom i v i = (p i h i ) / (Z i p i ) für alle schweren Atome Chi. Ordnung = für alle Schweratome mit di > i d i Chi. Ordnung = i j> i d i d j für alle Schweratome wenn i an j gebunden ist Chiv Valenzindex v = für alle Schweratome mit vi > v i i 5. Vorlesung Modern Methods in Drug Discovery WS5/6 9

20 Kier und Hall Shape Indices (I) n Anzahl schwerer Atome (Nicht-Wasserstoffatome) m Anzahl aller Bindungen zwischen den schweren Atomen p Anzahl der Pfade mit Länge p 3 Anzahl der Pfade mit Länge 3 aus der Distanzmatrix D Kappa n( n ) = m ( n )( n Kappa = p ) Kappa3 Kappa3 3 3 = = ( n )( n 3) p 3 ( n 3)( n ) p 3 für ungerade n für gerade n 5. Vorlesung Modern Methods in Drug Discovery WS5/6

21 KappaA Kier und Hall Shape Indices (II) Setzt man die Atome in Relation zu sp 3 -hybridisierten C-Atomen so erhält man die Kappa alpha Indices n ri = r i c r i Kovalenzradius von Atom i r c Kovalenzradius eines sp 3 Kohlenstoffatoms s( s ) = mit s = n + ( m + ) Element Vorlesung Modern Methods in Drug Discovery WS5/6 C C C N N N O P S Cl Hybridisierung sp 3 sp sp sp 3 sp sp sp 3 sp 3 sp 3

22 Balaban, Wiener und Zagreb Indices n Anzahl schwerer Atome (Nicht-Wasserstoffatome) m Anzahl aller Bindungen zwischen den schweren Atomen d i Anzahl schwerer Atome die an Atom i gebunden sind w = i D ij i j Summe der nichtdiagonalen Matrixelemente von Atom i in der Distanzmatrix D BalabanJ m m m n + w w i j WienerJ (Pfad Nummer) n i w i Korreliert mit den Siedepunkten von Alkanen WienerPolarität w i wenn Dij 3 Zagreb i d i n i für alle schweren Atome i 5. Vorlesung Modern Methods in Drug Discovery WS5/6

23 Was sagen die topologischen Indices aus? Topologische Indices sind assoziert mit Verzweigunsgrad des Moleküls Größe und räumliche Ausdehnung des Moleküls Strukturelle Flexibilität In der Regel läßt sich eine chemische Eigenschaft nicht direkt mit einem einzigen Index korrellieren. Topologische Indices kodieren prinzipiell dieselben Eigenschaften wie fingerprints, jedoch weniger einleuchtend, aber numerisch einfacher aufzustellen. 5. Vorlesung Modern Methods in Drug Discovery WS5/6 3

24 3D Deskriptoren Bei Deskriptoren die Atomkoordinaten des Moleküls verwenden spricht man von 3D Deskriptoren. Diese sind deshalb in der Regel konformationsabhängig. Beispiele: Van der Waals Volumen, Molekulare Oberfläche, Polare Oberfläche, Elektrostatisches Potential (ESP) 5. Vorlesung Modern Methods in Drug Discovery WS5/6 4

25 Quantenmechanische Deskriptoren (Auswahl) Atomladungen (partial atomic charges) Keine Observablen! Mulliken Populationsanalyse Electrostatic potential (ESP) derived charges Dipolmoment Polarisierbarkeit HOMO / LUMO Energien (ev) der Grenzorbitale WienerJ (Pfad Nummer) E HOMO LUMO Covalent hydrogen bond acidity/basicity Donor Differenz der HOMO/LUMO Energien zu Wasser Akzeptor Lit: M. Karelson et al. Chem.Rev. 96 (996) 7 5. Vorlesung Modern Methods in Drug Discovery WS5/6 5

26 DRAGON Programm zur Erzeugung von >4 Deskriptoren BalabanJ WienerJ (Pfad Nummer) WienerPolarität Roberto Todeschini Zagreb Siehe: 5. Vorlesung Modern Methods in Drug Discovery WS5/6 6

27 Weiterführende Information zu Deskriptoren BalabanJ Roberto Todeschini, Viviana Consonni Handbook of Molecular Descriptors, Wiley-VCH, () 667 Seiten (ca. 7 ) WienerJ (Pfad Nummer) CODESSA WienerPolarität Zagreb Alan R. Katritzky, Mati Karelson et al. MOLGEN C. Rücker et al Vorlesung Modern Methods in Drug Discovery WS5/6 7

28 A Smilaritätsdeskriptoren und Indices (I) erfüllte Eigenschaft von Molekül A A B Schnittmenge gemeinsamer Eigenschaften von A und B A B Vereinigunsmenge der Eigenschaften von A und B Euklidische Distanz Manhattan Distanz B B A A Formel Definition D D A, B = = N ( xia xib ) i= A, B A B A B A, B A B A B D D A, B = = N i= x ia x ib Bereich Andere Namen Y bis Y bis City-Block, Hamming 5. Vorlesung Modern Methods in Drug Discovery WS5/6 8

29 D Smilaritätsdeskriptoren und Indices (II) Soergel Distanz Tanimoto Index N N A, B = xia xib max( xia, xib ) i= i= = x + ia xib xia xib x i= i= i= i= N N N N / ( ) ( ) S A, B / ia x ib D = / A, B A B A B A B A, B A B A B S = / bis.333 bis + (kontinuierliche Werte) bis + (binäre on/off Werte) Jaccard Koeffizient Bei binären (dichotomen) Werten sind Soergel Distanz und Tanimoto Index zueinander komplementär 5. Vorlesung Modern Methods in Drug Discovery WS5/6 9

30 Smilaritätsdeskriptoren und Indices (III) S Dice Koeffizient N N = x ia xib ia i= i= i= A, B / N ( x ) + ( x ) ib S Cosinus Koeffizient N A, B = xia xib / i= N i= N ( x ) + ( x ) ia i= ib S ( ) = / + A, B A B A B S A, B = A B / A B bis + bis + (kontinuierliche Werte) bis + bis + (binäre on/off Werte) Hodgkin Index Czekanowski Koeffizient Sørensen Koeffizient Monoton mit dem Tanimoto Index Carbo Index Ochiai Koeffizient Hoch korreliert mit dem Tanimoto Index 5. Vorlesung Modern Methods in Drug Discovery WS5/6 3

31 Korrelation der Deskriptoren (I) Ebenso wie konkrete Moleküleigenschaften sind auch die Deskriptoren n oft miteinander korreliert. ( x x)( y y) y Korrelation nach Pearson r = n i= [...] n i i i= i= i ( x x) ( y y) i x hoher Korrelationsgrad r >.84 geringer Korrelationsgrad < r <.84 r <.5 anti-korreliert Auftragung zweier Variablen x und y im Craig-Plot Um aus der Vielzahl der Deskriptoren eine möglichst aussagekräftige Kombination zu erhalten, müssen multivariante Methoden der Statistik angewandt werden. 5. Vorlesung Modern Methods in Drug Discovery WS5/6 3

32 Korrelation der Deskriptoren (II) Im allgemeinen hat steht man vor dem Problem aus der Vielzahl vorhandener Deskriptoren die statistisch relevanten (und damit die aussagekräftigsten) für die jeweilige QSAR- Gleichung zu finden. Pro Deskriptor sollten 5 Moleküle (Datenpunkte) vorhanden sein, sonst ist die Gefahr einer zufälligen Korrelation zu hoch Lösungsansatz: Ermittlung der unkorrelierten Variablen mittels einer principal component analysis (PCA) siehe unten oder Anwendung der partial least square (PLS) Technik 5. Vorlesung Modern Methods in Drug Discovery WS5/6 3

33 Partial least square (PLS) Die Aktivität y wird als spezielle Linearkombination der Variablen bzw. Moleküleigenschaften x i ausgedrückt wobei y = b t + b t + b t + K+ b t 3 3 m m t t M t m = c = c = c M x m x x + c + c + c M x x m x + K+ c 5. Vorlesung Modern Methods in Drug Discovery WS5/6 33 n + K+ c M n + K+ c Die latenten Variablen t i werden so konstruiert, daß sie zueinander orthogonal, also unkorreliert sind. > Statistikprogramme D.h. durch Kombination der ursprünglichen Moleküleigenschaften werden neue Komponenten erzeugt, die unkorreliert zueinander sind. x n x mn n x n

34 Principal Component Analysis PCA (I) Problem: Welche sind die entscheidenden Deskriptoren im Datensatz? Die Hauptkomponentenanalyse erzeugt eine Serie unkorrelierter Variablen aus einem Satz korrelierter Variablen. Dazu wird eine Koordinatentransformation der Datenmatrix durchgeführt, sodaß die erste Hauptachse (pc) die größte Streuung (Varianz) der Datenpunkte aufweist. Die zweite (pc) und folgende Hauptachsen stehen orthogonal zueinander und deren Komponenten sind unkorreliert zueinander. Lit: E.C. Pielou: The Interpretation of Ecological Data, Wiley, New York, Vorlesung Modern Methods in Drug Discovery WS5/6 34

35 Principal Component Analysis PCA (II) Die erste Hauptachse (pc) weißt die größte Streuung (Varianz) der Datenpunkte auf, während die zweite (pc) und folgende Hauptachsen orthogonal dazu stehen. 5. Vorlesung Modern Methods in Drug Discovery WS5/6 35

36 Principal Component Analysis PCA (III) Die signifikanten Hauptkomponenten haben meistens einen Eigenwert > (Kaiser-Guttman Kriterium). Zusätzlich tritt meistens ein Knick zu den weniger relevanten auf (Scree-Test) 5. Vorlesung Modern Methods in Drug Discovery WS5/6 36

37 Principal Component Analysis PCA (IV) Durch die so ermittelten relevanten Hauptkomponenten sollte sich mehr als 8% der gesamten Varianz erfassen lassen 5. Vorlesung Modern Methods in Drug Discovery WS5/6 37

38 Principal Component Analysis (V) Bsp: Durch welche Deskriptoren wird der logp bestimmt? Eigenschaft pc pc pc3 Dipolmoment.353 Polarisierbarkeit.54 Mittel des +ESP Mittel des ESP Variance des ESP Minimales ESP Maximales ESP.4.7 Molekülvolumen.56.6 Oberfläche.59.5 Anteil an der Gesamtvariance 8% % % Lit: T.Clark et al. J.Mol.Model. 3 (997) 4 5. Vorlesung Modern Methods in Drug Discovery WS5/6 38

39 QSAR-Gleichungen (I) Hat man nun möglichst viele unkorrelierte Eigenschaften, müßen nun noch die Koeffizienten k i bestimmt werden. Dies geschieht durch multiple lineare Regressionsanalyse (least square fit der besten Kombination der Koeffizienten) > Statistikprogramme Meistens kann man nicht die beste Kombination aller möglichen Kombinationen von Deskriptoren berechnen. (exponentielle Laufzeit) In der Regel fängt man deshalb mit dem Deskriptor an der die höchste Einzelkorrelation zeigt und nimmt schrittweise weitere Deskriptoren hinzu (forward regression). Oder man fängt mit allen Deskriptoren an und entfernt sukzessive diejenigen die die Korrelation am wenigsten verschlechtern (backward regression). 5. Vorlesung Modern Methods in Drug Discovery WS5/6 39

40 QSAR-Gleichungen (II) Die wichtigsten Statistischen Größen zur Beurteilung einer QSAR-Gleichung sind: Korrelationskoeffizient (quadriert als r ) Standartabweichung (standard deviation, se, möglichst klein, se<.4 Einheiten) Fisher value F (Maß für die Übertragbarkeit der QSAR- Gleichung auf einen anderen Datensatz, sollte möglichst hoch sein, wird aber mit zunehmender Anzahl der Variablen kleiner) Probability value p einer einzelner Variablen (Maß für zufällige Korrelation, p<.5 = 95% Sicherheit) 5. Vorlesung Modern Methods in Drug Discovery WS5/6 4

41 QSAR-Gleichungen (III) Zur Überprüfung der Aussagekraft der QSAR-Gleichung werden vor allem zwei gebräuchliche Möglichkeiten verwendet: a) willkürliche Vertauschung der tatsächlichen Aktivitäten (falscher Datensatz) sollte die Voraussagefähigkeit (Standardabweichung) der Gleichung zusammenbrechen lassen. b) Cross-validation Es werden verschiedene Gleichungen aufgestellt, wobei jeweils eine Klasse von Eigenschaften (Physicochemisch, biologisch, elektronisch, sterisch) weggelassen wird (leave-one-out) und das Ergebnis mit dem vollständigen Modell verglichen wird. Die erhaltene Standardabweichung wird als PRESS (predictive residual sum of squares) bezeichnet. 5. Vorlesung Modern Methods in Drug Discovery WS5/6 4

42 QSAR-Gleichungen (IV) Cross-validation Der Korrelationskoeffizient q der aus der cross-validation erhalten wird ist kleiner als der ursprüngliche Wert r, aber entsprechend aussagekräftiger. Einer der besten Tests ist jedoch die Überprüfung mit einem externen Datensatz. 5. Vorlesung Modern Methods in Drug Discovery WS5/6 4

43 Interpretation von QSAR-Gleichungen (I) Die Art der enthaltenden Variablen bzw. Deskriptoren sollte Rückschlüße auf die zugrunde liegenden physiko-chemischen Vorgänge zulassen und so das Design neuer Moleküle durch Interpolation ermöglichen Die mathematische Form der QSAR-Gleichung kann Aufschluß über den biologischen Wirkungsmechanismus geben: Eine Abhängigkeit der Aktivität von (log P) deutet auf einen Transportvorgang des Wirkstoffes zum Rezeptor hin. Vorsicht ist bei der Extrapolation über die Grenzen des erfaßten Datenbereiches angebracht. Hier können keine zuverlässigen Vorhersagen gemacht werden. 5. Vorlesung Modern Methods in Drug Discovery WS5/6 43

44 Interpretation von QSAR-Gleichungen (II) Zwischen den verwendeten Deskriptoren und der Meßgröße sollte ein schlüssiger Zusammenhang stehen. Hierzu ein Gegenbeispiel: H. Sies Nature 33 (988) 495. Wissenschaftlicher Beweis, daß der Storch die Babies bringt amount storks babies year Die Daten hierzu finden sie unter /home/stud/mihu4/qsar/storks.spc 5. Vorlesung Modern Methods in Drug Discovery WS5/6 44

QSAR, QSAR, Statistik, Korrelation, Similarität & Deskriptoren

QSAR, QSAR, Statistik, Korrelation, Similarität & Deskriptoren QSAR, QSAR, Statistik, Korrelation, Similarität & Deskriptoren Das Handwerkszeug des rational drug designs am Computer Erfordert das Vorhandensein einer Anzahl von Leitstrukturen, z.b. aus dem High Throughput

Mehr

Molekulare Deskriptoren

Molekulare Deskriptoren MM..03 Molekulare Deskriptoren Vorlesung XI Allgemeines Definition Daten die die Eigenschaften von Molekülen charakterisieren Grundsätzlich kann jede molekulare Eigenschaft als Deskriptor betrachtet werden

Mehr

Klassifikation und Ähnlichkeitssuche

Klassifikation und Ähnlichkeitssuche Klassifikation und Ähnlichkeitssuche Vorlesung XIII Allgemeines Ziel Rationale Zusammenfassung von Molekülen in Gruppen auf der Basis bestimmter Eigenschaften Auswahl von repräsentativen Molekülen Strukturell

Mehr

Informationsfluß in einer drug discovery pipeline

Informationsfluß in einer drug discovery pipeline Informationsfluß in einer drug discovery pipeline 1 eadmet Prediction early Absorption Distribution Metabolism Elimination Toxicology Pharmacokinetic Bioavailability 2 ADME Modelle (I) Folgende Modelle

Mehr

Kombinatorische Chemie und drug design

Kombinatorische Chemie und drug design Kombinatorische Chemie und drug design Combinatorial chemistry is generally defined as the synthesis of compounds containing all possible combinations of reagents. S O R4 R1 N R2 N H H + Cl H R4 R3 R2

Mehr

Aufbau von Substanzbibliotheken für das High thoughput screening (I)

Aufbau von Substanzbibliotheken für das High thoughput screening (I) Aufbau von Substanzbibliotheken für das High thoughput screening (I) Automatisierter Test von >1000 Verbindungen am target Erfordert die Synthese von entsprechend vielen Verbindungen und die Handhabung

Mehr

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T 9 Faktorenanalyse Ziel der Faktorenanalyse ist es, die Anzahl der Variablen auf wenige voneinander unabhängige Faktoren zu reduzieren und dabei möglichst viel an Information zu erhalten. Hier wird davon

Mehr

insara: Hierarchische Netzwerke zur Analyse, Visualisierung und Vorhersage von Struktur-Aktivitäts-Beziehungen

insara: Hierarchische Netzwerke zur Analyse, Visualisierung und Vorhersage von Struktur-Aktivitäts-Beziehungen insara: Hierarchische Netzwerke zur Analyse, Visualisierung und Vorhersage von Struktur-Aktivitäts-Beziehungen Von der Fakultät für Lebenswissenschaften der Technischen Universität Carolo-Wilhelmina zu

Mehr

Atom-, Molekül- und Festkörperphysik

Atom-, Molekül- und Festkörperphysik Atom-, Molekül- und Festkörperphysik für LAK, SS 2014 Peter Puschnig basierend auf Unterlagen von Prof. Ulrich Hohenester 4. Vorlesung, 27. 3. 2014 Molekülbindung, H2+ - Molekülion, Hybridisierung, Kohlenstoffverbindungen

Mehr

Inhaltsverzeichnis. Vorwort. 1 Einführung in die multivariate Datenanalyse 1

Inhaltsverzeichnis. Vorwort. 1 Einführung in die multivariate Datenanalyse 1 V Inhaltsverzeichnis Vorwort XI 1 Einführung in die multivariate Datenanalyse 1 1.1 Was ist multivariate Datenanalyse? 1 1.2 Datensätze in der multivariaten Datenanalyse 4 1.3 Ziele der multivariaten Datenanalyse

Mehr

Einführung in das Molecular Modelling

Einführung in das Molecular Modelling Einführung in das Molecular Modelling Darstellung und Bearbeitung dreidimensionaler Molekülstrukturen Berechnung der physikochemischen Eigenschaften Ziel: Einsicht in die molekularen Mechanismen der Arzneistoffwirkung

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Teil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller

Teil XII. Einfache Lineare Regression. Woche 10: Lineare Regression. Lernziele. Zusammenfassung. Patric Müller Woche 10: Lineare Regression Patric Müller Teil XII Einfache Lineare Regression ETHZ WBL 17/19, 03.07.2017 Wahrscheinlichkeit und Statistik Patric Müller WBL 2017 Wahrscheinlichkeit

Mehr

Multiple Regressionsanalyse - Kurzabriss

Multiple Regressionsanalyse - Kurzabriss Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Explorative Faktorenanalyse

Explorative Faktorenanalyse Explorative Faktorenanalyse 1 Einsatz der Faktorenanalyse Verfahren zur Datenreduktion Analyse von Datenstrukturen 2 -Ich finde es langweilig, mich immer mit den selben Leuten zu treffen -In der Beziehung

Mehr

10. Innere Koordinaten/Kraftfelder

10. Innere Koordinaten/Kraftfelder Computeranwendung in der Chemie Informatik für Chemiker(innen) 10. Innere Koordinaten/Kraftfelder Jens Döbler 2004 "Computer in der Chemie", WS 2003-04, Humboldt-Universität VL10 Folie 1 Dr. Jens Döbler

Mehr

Die Funktion f wird als Regressionsfunktion bezeichnet.

Die Funktion f wird als Regressionsfunktion bezeichnet. Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht

Mehr

Nichtmetrische multidimensionale Skalierung (NMDS) Dr. Heike Culmsee Vegetationsanalyse & Phytodiversität

Nichtmetrische multidimensionale Skalierung (NMDS) Dr. Heike Culmsee Vegetationsanalyse & Phytodiversität Nichtmetrische multidimensionale Skalierung (NMDS) Dr. Heike Culmsee Vegetationsanalyse & Phytodiversität Übersicht Ordinationsverfahren Linear methods Weighted averaging Multidimensional scaling Unconstrained

Mehr

Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse)

Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse) Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse) Seminar für Statistik Markus Kalisch 25.11.2014 1 Unsupervised Learning Supervised Learning: Erkläre Zielgrösse durch erklärende Variablen

Mehr

11. Quantenchemische Methoden

11. Quantenchemische Methoden Computeranwendung in der Chemie Informatik für Chemiker(innen) 11. Quantenchemische Methoden Jens Döbler 2004 "Computer in der Chemie", WS 2003-04, Humboldt-Universität VL11 Folie 1 Grundlagen Moleküle

Mehr

Pharmakokinetik und Bioverfügbarkeit. Quantitative Auseinandersetzung des Organismus mit einem einverleibten Pharmakon

Pharmakokinetik und Bioverfügbarkeit. Quantitative Auseinandersetzung des Organismus mit einem einverleibten Pharmakon Pharmakokinetik und Bioverfügbarkeit Quantitative Auseinandersetzung des Organismus mit einem einverleibten Pharmakon 1 Warum ist die Voraussage der ADME Parameter so wichtig? Gründe die zum Fehlschlag

Mehr

Datenanalyse. eine Einführung. Klaus Diepold. Lehrstuhl für Datenverarbeitung Technische Universität München

Datenanalyse. eine Einführung. Klaus Diepold. Lehrstuhl für Datenverarbeitung Technische Universität München Datenanalyse eine Einführung Klaus Diepold Lehrstuhl für Datenverarbeitung Technische Universität München Datenanalyse: Für wen?! für die Wissenschaftlerin Auffinden von Zusammenhängen und Strukturen in

Mehr

Beschreibende Statistik Zweidimensionale (bivariate) Daten

Beschreibende Statistik Zweidimensionale (bivariate) Daten Mathematik II für Biologen Beschreibende Statistik Zweidimensionale (bivariate) Daten 26. April 2013 Prolog Lineare Regression Transformationen Produktmomenten-Korrelation Rangkorrelation Warnung Artensterben

Mehr

Teil XIII. Multiple lineare Regression. Woche 11: Multiple lineare Regression. Zusammenfassung Einfache lineare Regression.

Teil XIII. Multiple lineare Regression. Woche 11: Multiple lineare Regression. Zusammenfassung Einfache lineare Regression. Woche 11: Multiple lineare Regression Patric Müller Teil XIII Multiple lineare Regression ETHZ WBL 17/19, 10.07.017 Wahrscheinlichkeit und Statistik Patric Müller WBL

Mehr

Grundlagen der Medizinischen Chemie Sommersemester 2016

Grundlagen der Medizinischen Chemie Sommersemester 2016 Grundlagen der Medizinischen Chemie Sommersemester 2016 Prof. Dr. Franz Paintner Dienstag, 9 15-11 00 Uhr, Buchner-Hörsaal Mittwoch, 8 15-9 00 Uhr, Buchner-Hörsaal Aktuelle Informationen zur Vorlesung

Mehr

Numerische Methoden und Algorithmen in der Physik

Numerische Methoden und Algorithmen in der Physik Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 15.01.2009 Numerische Methoden und Algorithmen in der Physik Christian Autermann 1/ 47 Methode der kleinsten Quadrate

Mehr

Thomas Zöller (Autor) Verbesserung des Auflösungsverhaltens von schwer löslichen schwachen Säuren durch feste Lösungen und Cyclodextrin- Komplexe

Thomas Zöller (Autor) Verbesserung des Auflösungsverhaltens von schwer löslichen schwachen Säuren durch feste Lösungen und Cyclodextrin- Komplexe Thomas Zöller (Autor) Verbesserung des Auflösungsverhaltens von schwer löslichen schwachen Säuren durch feste Lösungen und Cyclodextrin- Komplexe https://cuvillier.de/de/shop/publications/334 Copyright:

Mehr

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21

Mehr

Hauptkomponenten-basierte Klassifikationsverfahren (PCA)

Hauptkomponenten-basierte Klassifikationsverfahren (PCA) Hauptkomponenten-basierte Klassifikationsverfahren (PCA) Projektseminar: Wetterlagen und Feinstaub - Übung Dozent: Claudia Weitnauer Referent: Esther Oßwald, Julian Dare Datum: 30.05.2011 Übersicht 1 Einleitung

Mehr

6. Faktorenanalyse (FA) von Tests

6. Faktorenanalyse (FA) von Tests 6. Faktorenanalyse (FA) von Tests 1 6. Faktorenanalyse (FA) von Tests 1 6.1. Grundzüge der FA nach der Haupkomponentenmethode (PCA) mit anschliessender VARIMAX-Rotation:... 2 6.2. Die Matrizen der FA...

Mehr

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg Prof. Markus Schumacher, Dr. Stan Lai Physikalisches Institut Westbau 2 OG Markus.Schumacher@physik.uni-freiburg.de

Mehr

Konzepte II. Netzwerkanalyse für Politikwissenschaftler

Konzepte II. Netzwerkanalyse für Politikwissenschaftler Konzepte II Netzwerkanalyse für Politikwissenschaftler Wiederholung Räumliche Distanzen und MDS Hauptkomponenten Neuere Entwicklungen Netzwerkanalyse für Politikwissenschaftler Konzepte II (1/20) Worum

Mehr

Inhalt. Mathematik für Chemiker II Lineare Algebra. Vorlesung im Sommersemester Kurt Frischmuth. Rostock, April Juli 2015

Inhalt. Mathematik für Chemiker II Lineare Algebra. Vorlesung im Sommersemester Kurt Frischmuth. Rostock, April Juli 2015 Inhalt Mathematik für Chemiker II Lineare Algebra Vorlesung im Sommersemester 5 Rostock, April Juli 5 Vektoren und Matrizen Abbildungen 3 Gleichungssysteme 4 Eigenwerte 5 Funktionen mehrerer Variabler

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

σ 2 (x) = σ 2 (τ) + σ 2 (ε) ( x) ( ) ( x) ( ) ( ) σ =σ τ +σ ε σ τ σ σ ε ( ) ( x) Varianzzerlegung Varianzzerlegung und Definition der Reliabilität

σ 2 (x) = σ 2 (τ) + σ 2 (ε) ( x) ( ) ( x) ( ) ( ) σ =σ τ +σ ε σ τ σ σ ε ( ) ( x) Varianzzerlegung Varianzzerlegung und Definition der Reliabilität Varianzzerlegung Die Varianz der beobachteten Testwerte x v : setzt sich zusammen aus zerlegen wahrer Varianz und Fehlervarianz: σ (x) = σ (τ) + σ (ε) Varianzzerlegung und Definition der Reliabilität (

Mehr

Inhaltsverzeichnis. Vorwort

Inhaltsverzeichnis. Vorwort V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6

Mehr

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Übungen zur Vorlesung Physikalische Chemie II Lösungsvorschlag zu Blatt 5

Übungen zur Vorlesung Physikalische Chemie II Lösungsvorschlag zu Blatt 5 Wintersemester 006 / 007 04.1.006 1. Aufgabe Die Wellenfunktionen unterscheiden sich gar nicht. Während der Lösung der elektronischen Schrödingergleichung werden die Kerne als ruhend betrachtet. Es kommt

Mehr

Name Vorname Matrikelnummer Unterschrift

Name Vorname Matrikelnummer Unterschrift Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden Klausur Statistik II (Sozialwissenschaft, Nach- und Wiederholer) am 26.10.2007 Gruppe

Mehr

Angewandte Statistik mit R

Angewandte Statistik mit R Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 2., überarbeitete Auflage B 374545 GABLER Inhaltsverzeichnis Vorwort zur zweiten Auflage Tabellenverzeichnis

Mehr

Simulation von Brownscher Dynamik und Assoziationsraten von PP-Komplexen. Alexander Baldauf Montag

Simulation von Brownscher Dynamik und Assoziationsraten von PP-Komplexen. Alexander Baldauf Montag Simulation von Brownscher Dynamik und Assoziationsraten von PP-Komplexen Alexander Baldauf Montag 25.04.2005 Motivation Typen von Interaktionen Verschiedene Methoden zur Vorhersage Wie kommen die beiden

Mehr

Kategorielle Zielgrössen

Kategorielle Zielgrössen Kategorielle Zielgrössen 27.11.2017 Motivation Bisher gesehen: Regressionsmodelle für diverse Arten von Zielgrössen Y. kontinuierliche Zielgrösse Lineare Regression Binäre/binomiale Zielgrösse Logistische

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 5. Juli 2011 Zunächst: PCA (Hauptkomponentenanalyse) ist eine mathematische Prozedur, die eine Anzahl von (möglicherweise korrelierten) Variablen

Mehr

Statistische Messdatenauswertung

Statistische Messdatenauswertung Roland Looser Statistische Messdatenauswertung Praktische Einführung in die Auswertung von Messdaten mit Excel und spezifischer Statistik-Software für naturwissenschaftlich und technisch orientierte Anwender

Mehr

Statistische Methoden in der Wirtschaftsund Sozialgeographie

Statistische Methoden in der Wirtschaftsund Sozialgeographie Statistische Methoden in der Wirtschaftsund Sozialgeographie Ort: Zeit: Multimediapool Rechenzentrum Mittwoch 0.5--45 Uhr Material: http://www.geomodellierung.de Thema: Beschreibung und Analyse Wirtschafts-

Mehr

Statistische Datenanalyse

Statistische Datenanalyse Werner A. Stahel Statistische Datenanalyse Eine Einführung für Naturwissenschaftler 3., durchgesehene Auflage vieweg VII 1 Einleitung 1 1.1 Was ist Statistische Datenanalyse? 1 1.2 Ziele 6 1.3 Hinweise

Mehr

Multivariate Statistische Methoden und ihre Anwendung

Multivariate Statistische Methoden und ihre Anwendung Multivariate Statistische Methoden und ihre Anwendung in den Wirtschafts- und Sozialwissenschaften Von Prof. Dr. Hans Peter Litz Carl von Ossietzky Universität Oldenburg R. Oldenbourg Verlag München Wien

Mehr

Statistik. Ronald Balestra CH St. Peter

Statistik. Ronald Balestra CH St. Peter Statistik Ronald Balestra CH - 7028 St. Peter www.ronaldbalestra.ch 17. Januar 2010 Inhaltsverzeichnis 1 Statistik 1 1.1 Beschreibende Statistik....................... 1 1.2 Charakterisierung von Häufigkeitsverteilungen...........

Mehr

Wiederholung Grundlagen OC

Wiederholung Grundlagen OC Wiederholung Grundlagen C 28.04.2017 Auswertung Stichprobe Frage 1: Die oben abgebildete Strukturformel zeigt 25 20 15 10 5 0 Ether Ester Acetal Keton Ester+Weiteres Frage 2: Die absolute Konfiguration

Mehr

Ziel der linearen Regression

Ziel der linearen Regression Regression 1 Ziel der linearen Regression Bei der linearen Regression wird untersucht, in welcher Weise eine abhängige metrische Variable durch eine oder mehrere unabhängige metrische Variablen durch eine

Mehr

Entstehung der Erde und Lebewesen Entwicklung der Zellforschung Kennzeichen des Lebens Grundbaupläne

Entstehung der Erde und Lebewesen Entwicklung der Zellforschung Kennzeichen des Lebens Grundbaupläne Entstehung der Erde und Lebewesen Entwicklung der Zellforschung Kennzeichen des Lebens Grundbaupläne Kennzeichen einer lebenden Zelle Zellen entstehen aus Zellen jede Zelle hat einen kompletten Satz Erbanlagen

Mehr

Besetzung der Orbitale

Besetzung der Orbitale Frage Beim Wiederholen des Stoffes bin ich auf die Rechnung zur Energie gestoßen. Warum und zu welchem Zweck haben wir das gemacht? Was kann man daran jetzt erkennen? Was beschreibt die Formel zu E(n),

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

2.2 Intermolekulare Wechselwirkungen

2.2 Intermolekulare Wechselwirkungen 2.2 Intermolekulare Wechselwirkungen -15-2.2 Intermolekulare Wechselwirkungen Die Bildung der hier vorgestellten molekularen Aggregate beruht auf schwachen Wechselwirkungen zwischen Atomen oder Molekülen.

Mehr

Statistisches Lernen

Statistisches Lernen Statistisches Lernen Einheit 12: Modellwahl und Regularisierung Dr. rer. nat. Christine Pausch Institut für Medizinische Informatik, Statistik und Epidemiologie Universität Leipzig WS 2014/2015 1 / 28

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist

Mehr

(a) Lösen Sie die Differentialgleichung unter Verwendung der Mathematica-Funktion DSolve.

(a) Lösen Sie die Differentialgleichung unter Verwendung der Mathematica-Funktion DSolve. Institut für Physikalische Chemie Methodenkurs Anwendungen von Mathematica und Matlab in der Physikalischen Chemie im WS 205/206 Prof Dr Stefan Weber, Dr Till Biskup Aufgabenblatt zum Teil (Mathematica)

Mehr

Multivariate Statistische Methoden

Multivariate Statistische Methoden Multivariate Statistische Methoden und ihre Anwendung in den Wirtschafts- und Sozialwissenschaften Von Prof. Dr. Hans Peter Litz Carl von Ossietzky Universität Oldenburg v..v.-'... ':,. -X V R.Oldenbourg

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen

Mehr

LEE2: 2. Messung der Molrefraktion der Flüssigkeiten für die Bestimmung der Qualität des Rohmaterials

LEE2: 2. Messung der Molrefraktion der Flüssigkeiten für die Bestimmung der Qualität des Rohmaterials ŠPŠCH Brno Erarbeitung berufspädagogischer Konzepte für die beruflichen Handlungsfelder Arbeiten im Chemielabor und Operator Angewandte Chemie und Lebensmittelanalyse LEE2: 2. Messung der Molrefraktion

Mehr

Recommender Systeme mit Collaborative Filtering

Recommender Systeme mit Collaborative Filtering Fakultät für Informatik Technische Universität München Email: rene.romen@tum.de 6. Juni 2017 Recommender Systeme Definition Ziel eines Recommender Systems ist es Benutzern Items vorzuschlagen die diesem

Mehr

4. Empirische Momente von ZR. 4. Empirische Momente von ZR. 4. Empirische Momente von ZR. 4. Empirische Momente von ZR

4. Empirische Momente von ZR. 4. Empirische Momente von ZR. 4. Empirische Momente von ZR. 4. Empirische Momente von ZR Im Allgemeinen wird sich das Verhalten einer ZR über die Zeit ändern, z.b. Trend, saisonales Verhalten, sich verändernde Variabilität. Eine ZR wird als stationär bezeichnet, wenn sich ihr Verhalten über

Mehr

Das multiple lineare Regressionsmodell

Das multiple lineare Regressionsmodell Das multiple lineare Regressionsmodell Worum geht es in diesem Lernmodul? Das Modell Schätzen der Koeffizienten Interpretation der Koeffizienten Testen der Koeffizienten Worum geht es in diesem Lernmodul?

Mehr

Die Bearbeitung erfolgt mit Textausschnitten des Buches Chemie Teil 2 (Diesterweg Verlag)

Die Bearbeitung erfolgt mit Textausschnitten des Buches Chemie Teil 2 (Diesterweg Verlag) Pharmazeutische Chemie Seite 1 Die Bearbeitung erfolgt mit Textausschnitten des Buches Chemie Teil 2 (Diesterweg Verlag) Fragen zu der sp³ Hybridisierung (S. 124-128): 1.) Notieren Sie die Elektronenverteilung

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

Kräfte. Florian Bansemer Nanostrukturphysik I Universität des Saarlandes

Kräfte. Florian Bansemer Nanostrukturphysik I Universität des Saarlandes Kräfte Florian Bansemer Nanostrukturphysik I Universität des Saarlandes 29.01.2013 Übersicht 1. Grundlagen und Begrifflichkeiten 2. Reichweite und Hierarchie 3. Van der Waals-Kräfte i. Quantenfeldtheoretische

Mehr

Organische Chemie. Kapitel 1. Organic Chemistry 4 th Edition Paula Yurkanis Bruice. Organische Verbindungen enthalten Kohlenstoff

Organische Chemie. Kapitel 1. Organic Chemistry 4 th Edition Paula Yurkanis Bruice. Organische Verbindungen enthalten Kohlenstoff rganic Chemistry 4 th Edition Paula Yurkanis Bruice Kapitel 1 Elektronische Struktur und Bindung Säuren und Basen rganische Chemie rganische Verbindungen enthalten Kohlenstoff Kohlenstoff ist weder ein

Mehr

Skript zum Kurz-Referat:

Skript zum Kurz-Referat: Prof. Dr. Klaus-Jürgen Tillmann/ Michael Lenz WS 2001/02 Fakultät für Pädagogik (AG 4) der Universität Bielefeld Seminar: Anlage und : Der pädagogische Streit seit den 50er-Jahren 7. Sitzung: Die Erblichkeit

Mehr

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen. Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte

Mehr

Virtuelle Bibliotheken

Virtuelle Bibliotheken Virtuelle Bibliotheken Vorlesung XIV PubChem Information zur biologischen Aktivität kleiner Moleküle PubChem Substance PubChem Compound PubChem Bioassay Substanzinformation von externen elektronischen

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

Stichwortverzeichnis. Ausgleichsgerade 177 Ausreißer 13, 40

Stichwortverzeichnis. Ausgleichsgerade 177 Ausreißer 13, 40 283 Stichwortverzeichnis a Alpha-Wert 76, 91 Alter 256 Alternativhypothese 68, 70 ANOVA siehe einfache Varianzanalyse, zweifache Varianzanalyse Anpassung 178 Anpassungstest siehe Chi-Quadrat-Anpassungstest

Mehr

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand

Mehr

Empirische Forschungsmethoden

Empirische Forschungsmethoden Winfried Stier Empirische Forschungsmethoden Zweite, verbesserte Auflage Mit 22 Abbildungen und 53 Tabellen Springer L Inhaltsverzeichnis I. Grundlagen 1 1.1. Methoden, Methodologie, Empirie 1 1.2. Einige

Mehr

Kapitel 5. Prognose. Zeitreihenanalyse wird aus drei Gründen betrieben: Beschreibung des Verlaufs von Zeitreihen.

Kapitel 5. Prognose. Zeitreihenanalyse wird aus drei Gründen betrieben: Beschreibung des Verlaufs von Zeitreihen. Kapitel 5 Prognose Josef Leydold c 2006 Mathematische Methoden V Prognose 1 / 14 Lernziele Aufgabe der Prognose Problemtypen Ablauf einer Prognoseaufgabe Zeitreihe Josef Leydold c 2006 Mathematische Methoden

Mehr

Logistische Regression

Logistische Regression Logistische Regression Markus Kalisch 30.09.2014 1 Big Picture: Statistisches Lernen Supervised Learning (X,Y) Unsupervised Learning X VL 7, 11, 12 Regression Y kontinuierlich VL 1, 2, 4, 5, 6 Klassifikation

Mehr

Systemwissenschaften, Mathematik und Statistik

Systemwissenschaften, Mathematik und Statistik Systemwissenschaften, Mathematik und Statistik Systemwissenschaften: 1 WS: Systemwissenschaften 1, VO 2std 2 SS: Systemwissenschaften 2, VO 2std Übung zu Systemwissenschaften, UE 2std 3 WS: Systemwissenschaften

Mehr

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse

Mehr

Kapitel 2.1: Die stochastische Sicht auf Signale Georg Dorffner 67

Kapitel 2.1: Die stochastische Sicht auf Signale Georg Dorffner 67 Kapitel 2.1: Die stochastische Sicht auf Signale 215 Georg Dorffner 67 Stochastische Prozesse Stochastische Prozesse sind von Zufall geprägte Zeitreihen x n f x, n 1 xn2,... n vorhersagbarer Teil, Signal

Mehr

Präzision in der Analytik Ein unentbehrlicher Teil der Methodenvalidierung

Präzision in der Analytik Ein unentbehrlicher Teil der Methodenvalidierung Abacus Validation Systems Präzision in der Analytik Ein unentbehrlicher Teil der Methodenvalidierung Joachim Pum, MMed (Univ. Pretoria) 2008 Definition Präzision ist das Maß für die Streuung von Analysenergebnissen

Mehr

If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra

If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra If you torture your data long enough, they will tell you whatever you want to hear. James L. Mills Warum Biostatistik?

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Oliver Muthmann 31. Mai 2007 Gliederung 1 Einführung 2 Varianzanalyse (MANOVA) 3 Regressionsanalyse 4 Faktorenanalyse Hauptkomponentenanalyse 5 Clusteranalyse 6 Zusammenfassung Komplexe

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun http://blog.ruediger-braun.net Heinrich-Heine-Universität Düsseldorf 10. Dezember 2014 1 Datenpaare Korrelation 2 Lineare Regression Problemstellung Beispiel

Mehr

ANalysis Of VAriance (ANOVA) 1/2

ANalysis Of VAriance (ANOVA) 1/2 ANalysis Of VAriance (ANOVA) 1/2 Markus Kalisch 16.10.2014 1 ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich)?

Mehr

Inhaltsverzeichnis. Vorwort. Abbildungsverzeichnis. Tabellenverzeichnis. 1 Einleitung Gegenstand Aufbau 4

Inhaltsverzeichnis. Vorwort. Abbildungsverzeichnis. Tabellenverzeichnis. 1 Einleitung Gegenstand Aufbau 4 Inhaltsverzeichnis Vorwort Abbildungsverzeichnis Tabellenverzeichnis v xv xvii 1 Einleitung 1 1.1 Gegenstand 1 1.2 Aufbau 4 2 Datenerhebung - ganz praktisch 7 2.1 Einleitung 7 2.2 Erhebungsplan 7 2.2.1

Mehr

Kalmanfiter (1) Typische Situation für den Einsatz von Kalman-Filtern

Kalmanfiter (1) Typische Situation für den Einsatz von Kalman-Filtern Kalmanfiter (1) Typische Situation für den Einsatz von Kalman-Filtern Vorlesung Robotik SS 016 Kalmanfiter () Kalman-Filter: optimaler rekursiver Datenverarbeitungsalgorithmus optimal hängt vom gewählten

Mehr

Aktuelle Beispiele aus der Forschung

Aktuelle Beispiele aus der Forschung Vorlesung: Allgemeine Chemie Organische Chemie 05.12.; 08.12.; Prof. Dr. C. Meier Eine Einführung in die Organische Chemie Themen: Elektronenstruktur, kovalente Bindung, Säure-Basen-Eigenschaften in Abhängigkeit

Mehr

5. Übung Zusammenhänge zweier Merkmale

5. Übung Zusammenhänge zweier Merkmale Querschnittsbereich 1: Epidemiologie, Medizinische Biometrie und Medizinische Informatik - Übungsmaterial - Erstellt von Mitarbeitern des IMISE und des ZKS Leipzig. Übung Zusammenhänge zweier Merkmale

Mehr

Einführung in die biologische Datenanalyse mit Matlab SS 2009 Tag8

Einführung in die biologische Datenanalyse mit Matlab SS 2009 Tag8 Tag 8: Modellbildung A) Kurvenanpassung B) Variation von Modellparametern C) Hausaufgaben A) Kurvenanpassung Kurvenanpassung dient dazu, Messdaten durch eine Kurve - also einen mathematisch beschreibbare

Mehr

Demokurs. Modul Vertiefung der Wirtschaftsmathematik Vertiefung der Statistik

Demokurs. Modul Vertiefung der Wirtschaftsmathematik Vertiefung der Statistik Demokurs Modul 3741 Vertiefung der Wirtschaftsmathematik und Statistik Kurs 41 Vertiefung der Statistik 15. Juli 010 Seite: 14 KAPITEL 4. ZUSAMMENHANGSANALYSE gegeben, wobei die Stichproben(ko)varianzen

Mehr

Übungen Mi 8:15-9:45, Raum 24B, W. Francke Mi 8:15-9:45, Raum 520, S.S. Do 9:30-11:00, Raum 24B, V. Vill Di 9:30-11:00, Raum 325, M.

Übungen Mi 8:15-9:45, Raum 24B, W. Francke Mi 8:15-9:45, Raum 520, S.S. Do 9:30-11:00, Raum 24B, V. Vill Di 9:30-11:00, Raum 325, M. 0. Vorbemerkungen 0.0 Einteilung der Gruppen, Termine Vorlesung Di 11-12 Hörsaal A, Beginn 03.04.2001 Do 11-13 Hörsaal A, Ende 12.07.2001 Übungen Hauptfach I: Hauptfach II: Nebenfach I: Nebenfach II: Mi

Mehr

Klausur zur Vorlesung "Grundzüge der Chemie" für Studierende des Maschinenbaus BITTE AUSFÜLLEN BITTE HALTEN SIE IHREN STUDENTAUSWEIS BEREIT

Klausur zur Vorlesung Grundzüge der Chemie für Studierende des Maschinenbaus BITTE AUSFÜLLEN BITTE HALTEN SIE IHREN STUDENTAUSWEIS BEREIT 1 PUNKTZAL NTE Klausur zur Vorlesung "Grundzüge der hemie" für Studierende des Maschinenbaus Termin: 17. Juni 2003 rt: Z 10 Zeit: 9.30-11.30 Uhr Dauer: 120 Minuten BITTE AUSFÜLLEN BITTE ALTEN SIE IREN

Mehr

Mathematik für Biologen

Mathematik für Biologen Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 05. Dezember 2012 1 Datenpaare Korrelation 2 Lineare Regression Problemstellung Beispiel Bleibelastung 3 Regression

Mehr

Thematische Aufgliederung der Prüfungsfragen

Thematische Aufgliederung der Prüfungsfragen Seite 1 Thematische Aufgliederung der Prüfungsfragen (gemäss Abschlussprüfungen im Fach Chemie der Eidgenössischen Berufsmaturitätsprüfung Technischer Richtung) 1. Heterogene Mischungen; Trennmethoden

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr