QSAR, QSAR, Statistik, Korrelation, Similarität & Deskriptoren

Größe: px
Ab Seite anzeigen:

Download "QSAR, QSAR, Statistik, Korrelation, Similarität & Deskriptoren"

Transkript

1 QSAR, QSAR, Statistik, Korrelation, Similarität & Deskriptoren Das Handwerkszeug des rational drug designs am Computer Erfordert das Vorhandensein einer Anzahl von Leitstrukturen, z.b. aus dem High Throughput Screening

2 Informationsfluß in einer drug discovery pipeline

3 Substanzauswahl für das HTS (I) Verschiedene Substanzbibliotheken: general z.b. gegen ganzes Zellassay focused bestimmte Familie von Enzymen targeted ein bestimmtes Enzym Diversität von Substanzbibliotheken Vermeidung von redundanten Verbindungen Verbesserte Trefferwahrscheinlichkeit im HTS 3

4 Typische Targets Anteil am menschlichen Genom und Pharmaka am Markt 4

5 Komponentenauswahl Wieviel Information ist über das target vorhanden? Zunehmende Information X-Ray mit Wirkstoff X-Ray des Proteins Reihe von wirksamen Verbindungen Wenige hits aus HTS Kenntnis der Enzymfunktion (z.b. Kinase, GPCR) active site combi chem Docking QSAR, Pharmacophor erstellen HTS eadme Filter Erstellen einer virtuellen Bibliothek 5

6 eadme Filter für das High Throughput Screening (HTS) R R N R3 Typischer eadme Filter 6

7 Aufbau von Substanzbibliotheken für das High thoughput screening Erzeugung einer virtuellen Bibliothek ausgehend von der Leitstruktur Systematische Variation der Leitstruktur: Gerüst Seitenketten Bioisostere 7

8 Molekülbasierte Deskriptoren zur Voraussage der ADME Eigenschaften logp Wasser/Octanol Verteilungskoeffizient Lipinski s rule Topologische Indices Polar surface area Similarität / Dissimilarität QSAR quantitative structure activity relationship QSPR quantitative structure property rel. 8

9 Deskriptoren Ansätze eine mathematische Beziehung zwischen numerischen Eigenschaften (Deskriptoren P i ) und physikochemischen Eigenschaften der Verbindung (z.b. biologische Aktivität log(/c) ) herzustellen, werden als QSAR, bzw QSPR bezeichnet. log(/ C) = k P + k P + + k n P n Daneben werden Deskriptoren auch zur Beschreibung von Molekülen in der Diversitäts Analyse und in Kombinatorischen Bibliotheken eingesetzt. Prinzipiell kann jede molekulare Eigenschaft als Deskriptor verwendet werden. Mehr zu Deskriptoren unter 9

10 D Deskriptoren (I) Für einige Deskriptoren benötigt man nur Kenntnisse die sich bereits aus der Summenformel der Verbindung erhält. Bsp.: Molmasse, Gesamtladung, Anzahl von Halogenatomen Weitere solcher eindimensionaler Deskriptoren ergeben sich additiv aus atomaren Beiträgen. Bsp.: Summe der atomaren Polarisierbarkeiten Refraktivität (Brechungsindex n, molar refractivity, M R ) M R = (n ) MW / (n +) d mit Dichte d, Molekülgewicht MW Ist abhängig von der Polarisierbarkeit und enthält außerdem das Molekülvolumen (MW / d)

11 logp (I) Der Wasser/n-Octanol Verteilungskoeffizient bzw. der logaritmierte Wert wird als logp bezeichnet. Wird oft zur Abschätzung der Membrangängigkeit und der Bioverfügbarkeit einer Verbindung eingesetzt, da ein oral applizierter Wirkstoff lipophil genug sein muß um durch die Lipidschicht der Membrane zu gelangen, andererseits wasserlöslich sein muß um in Blut und Lymphe transportiert zu werden hydrophil 4. < logp < +8. lipophil Zitronensäure.7 Iodbenzol +3.5 Typische Wirkstoffe < 5.

12 logp (II) Zur Vorhersage des logp wurde eine Reihe von Methoden entwickelt: basierend auf Molekülfragmenten (Gruppen und Reste) ClogP Leo, Hansch et al. J.Med.Chem. 8 (975) 865. Problem: Aufreten von nicht parametrisierten Fragmenten (bis zu 5% in Substanzbibliotheken) basierend auf Atomtypen SlogP S.A. Wildman & G.M.Crippen J.Chem.Inf.Comput.Sci. 39 (999) 868. AlogP, MlogP, XlogP... Jeweils mittels einer mathematischen Fitprozedur (Regressionanalyse, Neuronales Netz) erstellt.

13 logp (III) Neuere Methoden zur Vorhersage des logp verwenden zunehmend Eigenschaften des kompletten Moleküls, wie etwa Moleküloberfläche (polare/unpolare, bzw.deren elektrostatische Eigenschaften) Dipolmoment und Polarisierbarkeit Volumen / Oberfläche (Globularität) Bsp: mit Hilfe quantenmechanischer Daten trainiertes Neuronales Netz logp T. Clark et al. J.Mol.Model. 3 (997) 4. 3

14 D Deskriptoren (II) Weitere atomare Deskriptoren benutzen Information basierend auf empirischen Atomtypen wie in einem Kraftfeld. Bsp.: Anzahl von H-Brücken Akzeptoren (N, O, S) Anzahl von H-Brücken Donoren (OH, NH, SH) Anzahl aromatischer Ringe 4

15 Lipinski s Rule of 5 Kombination von Deskriptoren zur Abschätzung der intestinalen Absorption. Schlechte Aufnahme der Verbindung, wenn Molekülmasse > 5 logp > 5. > 5 H-Brücken Donoren (OH und NH) > H-Brücken Akzeptoren (N und O) Schlechte Diffusion Zu lipophil Zuviele H-Brücken mit den Kopfgruppen der Membran C.A. Lipinski et al. Adv. Drug. Delivery Reviews 3 (997) 3. 5

16 6 D Deskriptoren (I) Bei Deskriptoren die sich aus der Molekülkonfiguration (kovalente Verknüpfung der Atome) ableiten, spricht man von D Deskriptoren. Da keine Atomkoordinaten verwendet werden sind D Deskriptoren generell konformationsunabhängig obwohl sie topologische Information über das Molekül enthalten. Vgl. Darstellung mittels SMILES C C 5 H H 3 H 4 O 7 H distance matrix D adjacency matrix M O H C H H H C

17 D Deskriptoren (II) Die wesentlichsten topologischen Eigenschaften eines Moleküls sind der Verzeigungsgrad und die molekulare Form. H 4 O 7 C C 5 H 6 Für Kohlenstoff stehen 4 Valenzen zur Verfügung. H H 3 Das Verhältnis der tatsächlichen Verzweigung zur theoretisch möglichen Verzeigung läßt sich deshalb als Deskriptor verwenden. 7

18 Allgemeine Definitionen: D Deskriptoren (III) Z i Ordnungszahl (H=, C=6, LP=) h i Anzahl H-Atome die an Atom i gebunden sind d i Anzahl schwerer Atome die an Atom i gebunden sind Deskriptoren für den Verzweigungsgrad und die Flexibilität eines Moleküls: Kier & Hall Connectivity Indices p i Anzahl der s und p Valenzelektronen an Atom i v i = (p i h i ) / (Z i p i ) für alle schweren Atome 8

19 Kier und Hall Connectivity Indices Z i Ordnungszahl (H=, C=6, LP=) d i Anzahl schwerer Atome die an Atom i gebunden sind p i Anzahl der s und p Valenzelektronen an Atom i v i = (p i h i ) / (Z i p i ) für alle schweren Atome Chi. Ordnung χ = für alle Schweratome mit di d > i i Chi. Ordnung χ = i j> i d i d j für alle Schweratome wenn i an j gebunden ist Chiv Valenzindex χ = für alleschweratome mit vi v v > i i 9

20 Kier und Hall Shape Indices (I) n Anzahl schwerer Atome (Nicht-Wasserstoffatome) m Anzahl aller Bindungen zwischen den schweren Atomen p Anzahl der Pfade mit Länge p 3 Anzahl der Pfade mit Länge 3 aus der Distanzmatrix D Kappa κ n( n ) = m ( n )( n Kappa κ = p ) Kappa3 Kappa3 κ κ 3 3 = = ( n )( n 3) p 3 ( n 3)( n ) p 3 für ungerade n für gerade n

21 KappaA Kier und Hall Shape Indices (II) Setzt man die Atome in Relation zu sp 3 -hybridisierten C-Atomen so erhält man die Kappa alpha Indices n ri α = r i c r i Kovalenzradius von Atom i r c Kovalenzradius eines sp 3 Kohlenstoffatoms s( s ) κ α = mit s = n + α ( m + α) Element C C C N N N O P S Cl Hybridisierung sp 3 sp sp sp 3 sp sp sp 3 sp 3 sp 3 α

22 Balaban, Wiener und Zagreb Indices n Anzahl schwerer Atome (Nicht-Wasserstoffatome) m Anzahl aller Bindungen zwischen den schweren Atomen d i Anzahl schwerer Atome die an Atom i gebunden sind w = i D ij i j Summe der nichtdiagonalen Matrixelemente von Atom i in der Distanzmatrix D BalabanJ m m m n + w w i j WienerJ (Pfad Nummer) n i w i Korreliert mit den Siedepunkten von Alkanen WienerPolarität wenn 3 w i Dij n i Zagreb i d i für alle schweren Atome i

23 fingerprints Wie kodiert man die Eigenschaften eines Moleküls zur Speicherung/Verarbeitung in einer Datenbank? Binärer fingerprint eines Moleküls 3

24 Was sagen die topologischen Indices aus? Topologische Indices sind assoziert mit Verzweigunsgrad des Moleküls Größe und räumliche Ausdehnung des Moleküls Strukturelle Flexibilität In der Regel läßt sich eine chemische Eigenschaft nicht direkt mit einem einzigen Index korrellieren. Topologische Indices kodieren prinzipiell dieselben Eigenschaften wie fingerprints, jedoch weniger einleuchtend aber numerisch einfacher aufzustellen 4

25 3D Deskriptoren Bei Deskriptoren die Atomkoordinaten des Moleküls verwenden spricht man von 3D Deskriptoren. Diese sind deshalb in der Regel konformationsabhängig. Beispiele: Van der Waals Volumen, Molekulare Oberfläche, Polare Oberfläche, Elektrostatisches Potential (ESP) 5

26 Quantenmechanische Deskriptoren (Auswahl) Atomladungen (partial atomic charges) Keine Observablen! Mulliken Populationsanalyse Electrostatic potential (ESP) derived charges Dipolmoment Polarisierbarkeit HOMO / LUMO Energien (ev) der Grenzorbitale WienerJ (Pfad Nummer) E HOMO LUMO Covalent hydrogen bond acidity/basicity Donor Differenz der HOMO/LUMO Energien zu Wasser Akzeptor Lit: M. Karelson et al. Chem.Rev. 96 (996) 7 6

27 DRAGON Programm zur Erzeugung von >4 Deskriptoren BalabanJ WienerJ (Pfad Nummer) WienerPolarität Roberto Todeschini Zagreb Siehe: 7

28 Weiterführende Literatur Roberto Todeschini, Viviana Consonni Handbook of Molecular Descriptors, Wiley-VCH, () 667 Seiten (ca. 7 ¼ BalabanJ WienerJ (Pfad Nummer) WienerPolarität Zagreb 8

29 χ A Smilaritätsdeskriptoren und Indices (I) erfüllte Eigenschaft von Molekül A χ A χ B Schnittmenge gemeinsamer Eigenschaften von A und B χ A χ B Vereinigunsmenge der Eigenschaften von A und B Euklidische Distanz Manhattan Distanz B B A A Formel Definition D D A, B = = χ N ( xia xib ) i= χ χ χ A, B A B A B A, B A B A B D D A, B = = χ N i= x χ ia x ib χ χ Bereich Andere Namen ELV ELV - City-Block, Hamming 9

30 D Smilaritätsdeskriptoren und Indices (II) Soergel Distanz Tanimoto Index N N A, B = xia xib max( xia, xib ) i= i= N N N N / ( ) ( ) S = x + iaxib xia xib x i= i= i= i= A, B / ia x ib D = χ χ χ χ / χ χ A, B A B A B A B A, B A B A B S = χ χ / χ χ bis bis + (kontinuierliche Werte) bis + (binäre on/off Werte) - Jaccard Koeffizient Bei binären (dichotomen) Werten sind Soergel Distanz und Tanimoto Index zueinander komplementär 3

31 Smilaritätsdeskriptoren und Indices (III) S Dice Koeffizient N N = x iaxib ia i= i= i= A, B / N ( x ) + ( x ) ib S Cosinus Koeffizient N A, B = xiaxib / i= N i= N ( x ) + ( x ) ia i= ib S ( χ χ ) = χ χ / + A, B A B A B S A, B = A χ B χ A χ B χ / - bis + bis + (kontinuierliche Werte) bis + bis + (binäre on/off Werte) Hodgkin Index Czekanowski Koeffizient Sørensen Koeffizient Monoton mit dem Tanimoto Index Carbo Index Ochiai Koeffizient Hoch korreliert mit dem Tanimoto Index 3

32 Korrelation der Deskriptoren (I) Ebenso wie konkrete Moleküleigenschaften sind auch die Deskriptoren n oft miteinander korreliert. ( x x)( y y) y Korrelation nach Pearson r = n i= i i i= [ n i i i= ( x x) ( y y)...] x hoher Korrelationsgrad r >.84 geringer Korrelationsgrad < r <.84 r <.5 anti-korreliert Auftragung zweier Variablen x und y im Craig-Plot Um aus der Vielzahl der Deskriptoren eine möglichst aussagekräftige Kombination zu erhalten, müssen multivariante Methoden der Statistik angewandt werden. 3

33 Korrelation der Deskriptoren (II) Im allgemeinen hat steht man vor dem Problem aus der Vielzahl vorhandener Deskriptoren die statistisch relevanten (und damit die aussagekräftigsten) für die jeweilige QSAR- Gleichung zu finden. Pro Deskriptor sollten 5 Moleküle (Datenpunkte) vorhanden sein, sonst ist die Gefahr einer zufälligen Korrelation zu hoch Lösungsansatz: Ermittlung der unkorrelierten Variablen mittels einer principal component analysis (PCA) siehe unten oder Anwendung der partial least square (PLS) Technik 33

34 Partial least square (PLS) Die Aktivität y wird als spezielle Linearkombination der Variablen bzw. Moleküleigenschaften x i ausgedrückt wobei y = b t + b t + b t + + b t 3 3 m m t t t m = c = c = c x m x x + c + c + c x x m x + + c n + + c n + + c Die latenten Variablen t i werden so konstruiert, daß sie zueinander orthogonal, also unkorreliert sind. :6WDWLVWLNSURJUDPPH D.h. durch Kombination der ursprünglichen Moleküleigenschaften werden neue Komponenten erzeugt, die unkorreliert zueinander sind. x n x mn n x n 34

35 Principal Component Analysis PCA (I) Problem: Welche sind die entscheidenden Deskriptoren im Datensatz? Die Hauptkomponentenanalyse erzeugt eine Serie unkorrelierter Variablen aus einem Satz korrelierter Variablen. Dazu wird eine Koordinatentransformation der Datenmatrix durchgeführt, sodaß die erste Hauptachse (pc) die größte Streuung (Varianz) der Datenpunkte aufweist. Die zweite (pc) und folgende Hauptachsen stehen orthogonal zueinander und deren Komponenten sind unkorreliert zueinander. Lit: E.C. Pielou: The Interpretation of Ecological Data, Wiley, New York,

36 Principal Component Analysis PCA (II) Die erste Hauptachse (pc) weißt die größte Streuung (Varianz) der Datenpunkte auf, während die zweite (pc) und folgende Hauptachsen orthogonal dazu stehen. 36

37 Principal Component Analysis PCA (III) Die signifikanten Hauptkomponenten haben meistens einen Eigenwert > (Kaiser-Guttman Kriterium). Zusätzlich tritt meistens ein Knick zu den weniger relevanten auf (Scree-Test) 37

38 Principal Component Analysis PCA (IV) Durch die so ermittelten relevanten Hauptkomponenten sollte sich mehr als 8% der gesamten Varianz erfassen lassen 38

39 Principal Component Analysis (V) Bsp: Durch welche Deskriptoren wird der logp bestimmt? Eigenschaft pc pc pc3 Dipolmoment.353 Polarisierbarkeit.54 Mittel des +ESP Mittel des ESP Variance des ESP Minimales ESP Maximales ESP.4.7 Molekülvolumen.56.6 Oberfläche.59.5 Anteil an der Gesamtvariance 8% % % Lit: T.Clark et al. J.Mol.Model. 3 (997) 4 39

40 QSAR-Gleichungen (I) Hat man nun möglichst viele unkorrelierte Eigenschaften, müßen nun noch die Koeffizienten k i bestimmt werden. Dies geschieht durch multiple lineare Regressionsanalyse (least square fit der besten Kombination der Koeffizienten) :6WDWLVWLNSURJUDPPH Meistens kann man nicht die beste Kombination aller möglichen Kombinationen von Deskriptoren berechnen. (exponentielle Laufzeit) In der Regel fängt man deshalb mit dem Deskriptor an der die höchste Einzelkorrelation zeigt und nimmt schrittweise weitere Deskriptoren hinzu (forward regression). Oder man fängt mit allen Deskriptoren an und entfernt sukzessive diejenigen die die Korrelation am wenigsten verschlechtern (backward regression). 4

41 QSAR-Gleichungen (II) Die wichtigsten Statistischen Größen zur Beurteilung einer QSAR-Gleichung sind: Korrelationskoeffizient (quadriert als r ) Standartabweichung (standard deviation, se, möglichst klein, se<.4 Einheiten) Fisher value F (Maß für die Übertragbarkeit der QSAR- Gleichung auf einen anderen Datensatz, sollte möglichst hoch sein, wird aber mit zunehmender Anzahl der Variablen kleiner) Probability value p einer einzelner Variablen (Maß für zufällige Korrelation, p<.5 = 95% Sicherheit) 4

42 QSAR-Gleichungen (III) Zur Überprüfung der Aussagekraft der QSAR-Gleichung werden vor allem zwei gebräuchliche Möglichkeiten verwendet: a) willkürliche Vertauschung der tatsächlichen Aktivitäten (falscher Datensatz) sollte die Voraussagefähigkeit (Standardabweichung) der Gleichung zusammenbrechen lassen. b) Cross-validation Es werden verschiedene Gleichungen aufgestellt, wobei jeweils eine Klasse von Eigenschaften (Physicochemisch, biologisch, elektronisch, sterisch) weggelassen wird (leave-one-out) und das Ergebnis mit dem vollständigen Modell verglichen wird. Die erhaltene Standardabweichung wird als PRESS (predictive residual sum of squares) bezeichnet. 4

43 QSAR-Gleichungen (IV) Cross-validation Der Korrelationskoeffizient q der aus der cross-validation erhalten wird ist kleiner als der ursprüngliche Wert r, aber entsprechend aussagekräftiger. Einer der besten Tests ist jedoch die Überprüfung mit einem externen Datensatz. 43

44 Interpretation von QSAR-Gleichungen Die Art der enthaltenden Variablen bzw. Deskriptoren sollte Rückschlüße auf die zugrunde liegenden physiko-chemischen Vorgänge zulassen und so das Design neuer Moleküle durch Interpolation ermöglichen Die mathematische Form der QSAR-Gleichung kann Aufschluß über den biologischen Wirkungsmechanismus geben: Eine Abhängigkeit der Aktivität von (log P) deutet auf einen Transportvorgang des Wirkstoffes zum Rezeptor hin. Vorsicht ist bei der Extrapolation über die Grenzen des erfaßten Datenbereiches angebracht. Hier können keine zuverlässigen Vorhersagen gemacht werden. 44

QSAR, QSPR, Statistik, Korrelation, Similarität & Deskriptoren

QSAR, QSPR, Statistik, Korrelation, Similarität & Deskriptoren QSAR, QSPR, Statistik, Korrelation, Similarität & Deskriptoren Das Handwerkszeug des rational drug designs am Computer, vor allem dann, wenn keine Strukturinformation über das target (Enzym) vorhanden

Mehr

Molekulare Deskriptoren

Molekulare Deskriptoren MM..03 Molekulare Deskriptoren Vorlesung XI Allgemeines Definition Daten die die Eigenschaften von Molekülen charakterisieren Grundsätzlich kann jede molekulare Eigenschaft als Deskriptor betrachtet werden

Mehr

Klassifikation und Ähnlichkeitssuche

Klassifikation und Ähnlichkeitssuche Klassifikation und Ähnlichkeitssuche Vorlesung XIII Allgemeines Ziel Rationale Zusammenfassung von Molekülen in Gruppen auf der Basis bestimmter Eigenschaften Auswahl von repräsentativen Molekülen Strukturell

Mehr

Aufbau von Substanzbibliotheken für das High thoughput screening (I)

Aufbau von Substanzbibliotheken für das High thoughput screening (I) Aufbau von Substanzbibliotheken für das High thoughput screening (I) Automatisierter Test von >1000 Verbindungen am target Erfordert die Synthese von entsprechend vielen Verbindungen und die Handhabung

Mehr

Kombinatorische Chemie und drug design

Kombinatorische Chemie und drug design Kombinatorische Chemie und drug design Combinatorial chemistry is generally defined as the synthesis of compounds containing all possible combinations of reagents. S O R4 R1 N R2 N H H + Cl H R4 R3 R2

Mehr

Informationsfluß in einer drug discovery pipeline

Informationsfluß in einer drug discovery pipeline Informationsfluß in einer drug discovery pipeline 1 eadmet Prediction early Absorption Distribution Metabolism Elimination Toxicology Pharmacokinetic Bioavailability 2 ADME Modelle (I) Folgende Modelle

Mehr

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T

9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T 9 Faktorenanalyse Ziel der Faktorenanalyse ist es, die Anzahl der Variablen auf wenige voneinander unabhängige Faktoren zu reduzieren und dabei möglichst viel an Information zu erhalten. Hier wird davon

Mehr

Inhaltsverzeichnis. Vorwort. 1 Einführung in die multivariate Datenanalyse 1

Inhaltsverzeichnis. Vorwort. 1 Einführung in die multivariate Datenanalyse 1 V Inhaltsverzeichnis Vorwort XI 1 Einführung in die multivariate Datenanalyse 1 1.1 Was ist multivariate Datenanalyse? 1 1.2 Datensätze in der multivariaten Datenanalyse 4 1.3 Ziele der multivariaten Datenanalyse

Mehr

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien

Deskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische

Mehr

Explorative Faktorenanalyse

Explorative Faktorenanalyse Explorative Faktorenanalyse 1 Einsatz der Faktorenanalyse Verfahren zur Datenreduktion Analyse von Datenstrukturen 2 -Ich finde es langweilig, mich immer mit den selben Leuten zu treffen -In der Beziehung

Mehr

Nichtmetrische multidimensionale Skalierung (NMDS) Dr. Heike Culmsee Vegetationsanalyse & Phytodiversität

Nichtmetrische multidimensionale Skalierung (NMDS) Dr. Heike Culmsee Vegetationsanalyse & Phytodiversität Nichtmetrische multidimensionale Skalierung (NMDS) Dr. Heike Culmsee Vegetationsanalyse & Phytodiversität Übersicht Ordinationsverfahren Linear methods Weighted averaging Multidimensional scaling Unconstrained

Mehr

Einführung in das Molecular Modelling

Einführung in das Molecular Modelling Einführung in das Molecular Modelling Darstellung und Bearbeitung dreidimensionaler Molekülstrukturen Berechnung der physikochemischen Eigenschaften Ziel: Einsicht in die molekularen Mechanismen der Arzneistoffwirkung

Mehr

Multiple Regressionsanalyse - Kurzabriss

Multiple Regressionsanalyse - Kurzabriss Multiple Regressionsanalyse - Kurzabriss Ziele: Schätzung eines Kriteriums aus einer Linearkombination von Prädiktoren Meist zu Screening-Untersuchungen, um den Einfluß von vermuteten Ursachenvariablen

Mehr

Die Funktion f wird als Regressionsfunktion bezeichnet.

Die Funktion f wird als Regressionsfunktion bezeichnet. Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht

Mehr

10. Innere Koordinaten/Kraftfelder

10. Innere Koordinaten/Kraftfelder Computeranwendung in der Chemie Informatik für Chemiker(innen) 10. Innere Koordinaten/Kraftfelder Jens Döbler 2004 "Computer in der Chemie", WS 2003-04, Humboldt-Universität VL10 Folie 1 Dr. Jens Döbler

Mehr

Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse)

Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse) Principal Component Analysis (PCA) (aka Hauptkomponentenanalyse) Seminar für Statistik Markus Kalisch 25.11.2014 1 Unsupervised Learning Supervised Learning: Erkläre Zielgrösse durch erklärende Variablen

Mehr

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp Dr. Maike M. Burda Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 8.-10. Januar 2010 BOOTDATA.GDT: 250 Beobachtungen für die Variablen... cm:

Mehr

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Experiment zur Vererbungstiefe Softwaretechnik: die Vererbungstiefe ist kein guter Schätzer für den Wartungsaufwand

Mehr

Atom-, Molekül- und Festkörperphysik

Atom-, Molekül- und Festkörperphysik Atom-, Molekül- und Festkörperphysik für LAK, SS 2014 Peter Puschnig basierend auf Unterlagen von Prof. Ulrich Hohenester 4. Vorlesung, 27. 3. 2014 Molekülbindung, H2+ - Molekülion, Hybridisierung, Kohlenstoffverbindungen

Mehr

Name Vorname Matrikelnummer Unterschrift

Name Vorname Matrikelnummer Unterschrift Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden Klausur Statistik II (Sozialwissenschaft, Nach- und Wiederholer) am 26.10.2007 Gruppe

Mehr

6. Faktorenanalyse (FA) von Tests

6. Faktorenanalyse (FA) von Tests 6. Faktorenanalyse (FA) von Tests 1 6. Faktorenanalyse (FA) von Tests 1 6.1. Grundzüge der FA nach der Haupkomponentenmethode (PCA) mit anschliessender VARIMAX-Rotation:... 2 6.2. Die Matrizen der FA...

Mehr

Übungen zur Vorlesung Physikalische Chemie II Lösungsvorschlag zu Blatt 5

Übungen zur Vorlesung Physikalische Chemie II Lösungsvorschlag zu Blatt 5 Wintersemester 006 / 007 04.1.006 1. Aufgabe Die Wellenfunktionen unterscheiden sich gar nicht. Während der Lösung der elektronischen Schrödingergleichung werden die Kerne als ruhend betrachtet. Es kommt

Mehr

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II

Statistik II. Lineare Regressionsrechnung. Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II Statistik II Lineare Regressionsrechnung Wiederholung Skript 2.8 und Ergänzungen (Schira: Kapitel 4) Statistik II - 09.06.2006 1 Mit der Kovarianz und dem Korrelationskoeffizienten können wir den statistischen

Mehr

Beschreibende Statistik Zweidimensionale (bivariate) Daten

Beschreibende Statistik Zweidimensionale (bivariate) Daten Mathematik II für Biologen Beschreibende Statistik Zweidimensionale (bivariate) Daten 26. April 2013 Prolog Lineare Regression Transformationen Produktmomenten-Korrelation Rangkorrelation Warnung Artensterben

Mehr

Hauptkomponenten-basierte Klassifikationsverfahren (PCA)

Hauptkomponenten-basierte Klassifikationsverfahren (PCA) Hauptkomponenten-basierte Klassifikationsverfahren (PCA) Projektseminar: Wetterlagen und Feinstaub - Übung Dozent: Claudia Weitnauer Referent: Esther Oßwald, Julian Dare Datum: 30.05.2011 Übersicht 1 Einleitung

Mehr

Grundlagen der Statistik

Grundlagen der Statistik Grundlagen der Statistik Übung 6 2009 FernUniversität in Hagen Alle Rechte vorbehalten Fakultät für Wirtschaftswissenschaft Übersicht über die mit den insendeaufgaben geprüften Lehrzielgruppen Lehrzielgruppe:

Mehr

Numerische Methoden und Algorithmen in der Physik

Numerische Methoden und Algorithmen in der Physik Numerische Methoden und Algorithmen in der Physik Hartmut Stadie, Christian Autermann 15.01.2009 Numerische Methoden und Algorithmen in der Physik Christian Autermann 1/ 47 Methode der kleinsten Quadrate

Mehr

Demokurs. Modul Vertiefung der Wirtschaftsmathematik Vertiefung der Statistik

Demokurs. Modul Vertiefung der Wirtschaftsmathematik Vertiefung der Statistik Demokurs Modul 3741 Vertiefung der Wirtschaftsmathematik und Statistik Kurs 41 Vertiefung der Statistik 15. Juli 010 Seite: 14 KAPITEL 4. ZUSAMMENHANGSANALYSE gegeben, wobei die Stichproben(ko)varianzen

Mehr

Statistik, Datenanalyse und Simulation

Statistik, Datenanalyse und Simulation Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 5. Juli 2011 Zunächst: PCA (Hauptkomponentenanalyse) ist eine mathematische Prozedur, die eine Anzahl von (möglicherweise korrelierten) Variablen

Mehr

Inhaltsverzeichnis. Vorwort

Inhaltsverzeichnis. Vorwort V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6

Mehr

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20

Statistik II. II. Univariates lineares Regressionsmodell. Martin Huber 1 / 20 Statistik II II. Univariates lineares Regressionsmodell Martin Huber 1 / 20 Übersicht Definitionen (Wooldridge 2.1) Schätzmethode - Kleinste Quadrate Schätzer / Ordinary Least Squares (Wooldridge 2.2)

Mehr

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS

Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Statistik III Regressionsanalyse, Varianzanalyse und Verfahren bei Messwiederholung mit SPSS Verena Hofmann Dr. phil. des. Departement für Sonderpädagogik Universität Freiburg Petrus-Kanisius-Gasse 21

Mehr

Stichwortverzeichnis. Ausgleichsgerade 177 Ausreißer 13, 40

Stichwortverzeichnis. Ausgleichsgerade 177 Ausreißer 13, 40 283 Stichwortverzeichnis a Alpha-Wert 76, 91 Alter 256 Alternativhypothese 68, 70 ANOVA siehe einfache Varianzanalyse, zweifache Varianzanalyse Anpassung 178 Anpassungstest siehe Chi-Quadrat-Anpassungstest

Mehr

Kapitel 5. Prognose. Zeitreihenanalyse wird aus drei Gründen betrieben: Beschreibung des Verlaufs von Zeitreihen.

Kapitel 5. Prognose. Zeitreihenanalyse wird aus drei Gründen betrieben: Beschreibung des Verlaufs von Zeitreihen. Kapitel 5 Prognose Josef Leydold c 2006 Mathematische Methoden V Prognose 1 / 14 Lernziele Aufgabe der Prognose Problemtypen Ablauf einer Prognoseaufgabe Zeitreihe Josef Leydold c 2006 Mathematische Methoden

Mehr

Statistische Methoden in den Umweltwissenschaften

Statistische Methoden in den Umweltwissenschaften Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau

Mehr

Statistik. Ronald Balestra CH St. Peter

Statistik. Ronald Balestra CH St. Peter Statistik Ronald Balestra CH - 7028 St. Peter www.ronaldbalestra.ch 17. Januar 2010 Inhaltsverzeichnis 1 Statistik 1 1.1 Beschreibende Statistik....................... 1 1.2 Charakterisierung von Häufigkeitsverteilungen...........

Mehr

Zusammenhänge zwischen metrischen Merkmalen

Zusammenhänge zwischen metrischen Merkmalen Zusammenhänge zwischen metrischen Merkmalen Darstellung des Zusammenhangs, Korrelation und Regression Daten liegen zu zwei metrischen Merkmalen vor: Datenpaare (x i, y i ), i = 1,..., n Beispiel: x: Anzahl

Mehr

Forschungsstatistik I

Forschungsstatistik I Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/

Mehr

Statistisches Lernen

Statistisches Lernen Statistisches Lernen Einheit 12: Modellwahl und Regularisierung Dr. rer. nat. Christine Pausch Institut für Medizinische Informatik, Statistik und Epidemiologie Universität Leipzig WS 2014/2015 1 / 28

Mehr

Ziel der linearen Regression

Ziel der linearen Regression Regression 1 Ziel der linearen Regression Bei der linearen Regression wird untersucht, in welcher Weise eine abhängige metrische Variable durch eine oder mehrere unabhängige metrische Variablen durch eine

Mehr

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen.

Kapitel 3 Schließende lineare Regression Einführung. induktiv. Fragestellungen. Modell. Matrixschreibweise. Annahmen. Kapitel 3 Schließende lineare Regression 3.1. Einführung induktiv Fragestellungen Modell Statistisch bewerten, der vorher beschriebenen Zusammenhänge auf der Basis vorliegender Daten, ob die ermittelte

Mehr

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduktion. Interpretation des SPSS-Output s

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduktion. Interpretation des SPSS-Output s Explorative Faktorenanalyse als Instrument der Dimensionsreduktion Beispiel: Welche Dimensionen charakterisieren die Beurteilung des sozialen Klimas in der Nachbarschaft? Variablen: q27a bis q27g im Datensatz

Mehr

MM Proteinmodelling. Michael Meyer. Vorlesung XVII

MM Proteinmodelling. Michael Meyer. Vorlesung XVII Proteinmodelling Vorlesung XVII Proteinstrukturen Es besteht ein sehr großer Bedarf an Proteinstrukturen: Die Kenntnis der 3D-Struktur hat große Vorteile für das Design neuer Wirkstoffe. Experimentelle

Mehr

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s

Faktorenanalysen mit SPSS. Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung. Interpretation des SPSS-Output s Explorative Faktorenanalyse als Instrument der Dimensionsreduzierung Beispiel: Welche Dimensionen charakterisieren die Beurteilung des sozialen Klimas in der Nachbarschaft? Variablen: q27a bis q27g im

Mehr

Teil: lineare Regression

Teil: lineare Regression Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge

Mehr

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...

Inhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik... Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven

Mehr

2.2 Intermolekulare Wechselwirkungen

2.2 Intermolekulare Wechselwirkungen 2.2 Intermolekulare Wechselwirkungen -15-2.2 Intermolekulare Wechselwirkungen Die Bildung der hier vorgestellten molekularen Aggregate beruht auf schwachen Wechselwirkungen zwischen Atomen oder Molekülen.

Mehr

Comperative Protein Structure Modelling of Genes and Genomes

Comperative Protein Structure Modelling of Genes and Genomes Comperative Protein Structure Modelling of Genes and Genomes Satisfaction of Spatial Restraints / Loop Modelling Nikolas Gross und Maximilian Miller Ludwig-Maximilians-Universität 29.11.2007 1 von 31 Table

Mehr

Diagnostik von Regressionsmodellen (1)

Diagnostik von Regressionsmodellen (1) Diagnostik von Regressionsmodellen (1) Bei Regressionsanalysen sollte immer geprüft werden, ob das Modell angemessen ist und ob die Voraussetzungen eines Regressionsmodells erfüllt sind. Das Modell einer

Mehr

11. Quantenchemische Methoden

11. Quantenchemische Methoden Computeranwendung in der Chemie Informatik für Chemiker(innen) 11. Quantenchemische Methoden Jens Döbler 2004 "Computer in der Chemie", WS 2003-04, Humboldt-Universität VL11 Folie 1 Grundlagen Moleküle

Mehr

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate

Regression ein kleiner Rückblick. Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate Regression ein kleiner Rückblick Methodenseminar Dozent: Uwe Altmann Alexandra Kuhn, Melanie Spate 05.11.2009 Gliederung 1. Stochastische Abhängigkeit 2. Definition Zufallsvariable 3. Kennwerte 3.1 für

Mehr

Statistische Datenanalyse

Statistische Datenanalyse Werner A. Stahel Statistische Datenanalyse Eine Einführung für Naturwissenschaftler 3., durchgesehene Auflage vieweg VII 1 Einleitung 1 1.1 Was ist Statistische Datenanalyse? 1 1.2 Ziele 6 1.3 Hinweise

Mehr

Die Rücktransformation: Z = A t (Y µ) = Y = AZ + µ

Die Rücktransformation: Z = A t (Y µ) = Y = AZ + µ Die Rücktransformation: Z = A t (Y µ) = Y = AZ + µ Kleine Eigenwerte oder Eigenwerte gleich Null: k Eigenwerte Null = Rang(Σ) = m k Eigenwerte fast Null = Hauptkomponenten beinahe konstant Beschränkung

Mehr

ANalysis Of VAriance (ANOVA) 1/2

ANalysis Of VAriance (ANOVA) 1/2 ANalysis Of VAriance (ANOVA) 1/2 Markus Kalisch 16.10.2014 1 ANOVA - Idee ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und Placebo (Faktor). Gibt es einen sign. Unterschied in der Wirkung (kontinuierlich)?

Mehr

Hypothesentests mit SPSS

Hypothesentests mit SPSS Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen

Mehr

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem

Kapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem

Mehr

4. Empirische Momente von ZR. 4. Empirische Momente von ZR. 4. Empirische Momente von ZR. 4. Empirische Momente von ZR

4. Empirische Momente von ZR. 4. Empirische Momente von ZR. 4. Empirische Momente von ZR. 4. Empirische Momente von ZR Im Allgemeinen wird sich das Verhalten einer ZR über die Zeit ändern, z.b. Trend, saisonales Verhalten, sich verändernde Variabilität. Eine ZR wird als stationär bezeichnet, wenn sich ihr Verhalten über

Mehr

Recommender Systeme mit Collaborative Filtering

Recommender Systeme mit Collaborative Filtering Fakultät für Informatik Technische Universität München Email: rene.romen@tum.de 6. Juni 2017 Recommender Systeme Definition Ziel eines Recommender Systems ist es Benutzern Items vorzuschlagen die diesem

Mehr

13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017

13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017 13. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017 1. Aufgabe: Für 25 der größten Flughäfen wurde die Anzahl der abgefertigten Passagiere in den Jahren 2009 und 2012 erfasst. Aus den Daten (Anzahl

Mehr

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler

Philipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung

Mehr

Datenanalyse. eine Einführung. Klaus Diepold. Lehrstuhl für Datenverarbeitung Technische Universität München

Datenanalyse. eine Einführung. Klaus Diepold. Lehrstuhl für Datenverarbeitung Technische Universität München Datenanalyse eine Einführung Klaus Diepold Lehrstuhl für Datenverarbeitung Technische Universität München Datenanalyse: Für wen?! für die Wissenschaftlerin Auffinden von Zusammenhängen und Strukturen in

Mehr

Modul: Allgemeine Chemie

Modul: Allgemeine Chemie Modul: Allgemeine Chemie 5. Grundlagen der chemischen Bindung Ionenbindung Eigenschaften, Ionengitter, Kugelpackung Strukturtypen, Kreisprozesse Kovalente Bindung Lewis Formeln, Oktettregel, Formalladungen

Mehr

Threading - Algorithmen

Threading - Algorithmen Threading - Algorithmen Florian Lindemann 22.11.2007 Florian Lindemann () Threading - Algorithmen 22.11.2007 1 / 25 Gliederung 1 Prospect Scoring Function Algorithmus Weitere Eigenschaften Komplexität

Mehr

Hauptkomponentenanalyse PCA

Hauptkomponentenanalyse PCA Hauptkoponentenanalyse PCA Die Hauptkoponentenanalyse (Principal Coponent Analysis, PCA) ist eine Methode zur linearen Transforation der Variablen, so dass: öglichst wenige neue Variablen die relevante

Mehr

Multivariate Statistische Methoden und ihre Anwendung

Multivariate Statistische Methoden und ihre Anwendung Multivariate Statistische Methoden und ihre Anwendung in den Wirtschafts- und Sozialwissenschaften Von Prof. Dr. Hans Peter Litz Carl von Ossietzky Universität Oldenburg R. Oldenbourg Verlag München Wien

Mehr

Einfaktorielle Varianzanalyse

Einfaktorielle Varianzanalyse Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel

Mehr

Präzision in der Analytik Ein unentbehrlicher Teil der Methodenvalidierung

Präzision in der Analytik Ein unentbehrlicher Teil der Methodenvalidierung Abacus Validation Systems Präzision in der Analytik Ein unentbehrlicher Teil der Methodenvalidierung Joachim Pum, MMed (Univ. Pretoria) 2008 Definition Präzision ist das Maß für die Streuung von Analysenergebnissen

Mehr

Angewandte Statistik mit R

Angewandte Statistik mit R Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 2., überarbeitete Auflage B 374545 GABLER Inhaltsverzeichnis Vorwort zur zweiten Auflage Tabellenverzeichnis

Mehr

Das multiple lineare Regressionsmodell

Das multiple lineare Regressionsmodell Das multiple lineare Regressionsmodell Worum geht es in diesem Lernmodul? Das Modell Schätzen der Koeffizienten Interpretation der Koeffizienten Testen der Koeffizienten Worum geht es in diesem Lernmodul?

Mehr

Mathematische und statistische Methoden I

Mathematische und statistische Methoden I Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de

Mehr

Zeitreihenanalyse. Zerlegung von Zeitreihen Saisonindex, saisonbereinigte Zeitreihe Trend und zyklische Komponente Prognose Autokorrelation

Zeitreihenanalyse. Zerlegung von Zeitreihen Saisonindex, saisonbereinigte Zeitreihe Trend und zyklische Komponente Prognose Autokorrelation Zeitreihenanalyse Zerlegung von Zeitreihen Saisonindex, saisonbereinigte Zeitreihe Trend und zyklische Komponente Prognose Autokorrelation Beispiel für Zeitreihe Andere Anwendungen Inventarmanagment Produktionsplanung

Mehr

Einer Reihe von Merkmalen zugrunde liegende, gemeinsame Faktoren ermitteln.

Einer Reihe von Merkmalen zugrunde liegende, gemeinsame Faktoren ermitteln. Faktoranalysen Aufbau 1. Sinn und Zweck 2. Eigenschaften der Merkmale 3. Extraktion der Faktoren 4. Anzahl der Faktoren 5. Rotation der Faktoren 6. Interpretation der Faktoren Sinn und Zweck Einer Reihe

Mehr

Die Faktorenanalyse. Anwendung dann, wenn zwischen beobachtbaren und nicht direkt beobachtbaren Variablen ein kausales Verhältnis vermutet wird

Die Faktorenanalyse. Anwendung dann, wenn zwischen beobachtbaren und nicht direkt beobachtbaren Variablen ein kausales Verhältnis vermutet wird Die Faktorenanalyse Zielsetzung Datenreduktion: eine größere Anzahl von Variablen auf eine kleinere Anzahl unabhängiger Einflussgrößen zurückführen Grundlegende Idee Direkt beobachtbare Variablen spiegeln

Mehr

High thoughput screening (HTS)

High thoughput screening (HTS) igh thoughput screening (TS) Urspüngliche Idee: Automatisierter Test von >1000 Verbindungen am target Erfordert die Synthese von entsprechend vielen Verbindungen und die andhabung der Ergebnisse. 1 Substanzauswahl

Mehr

Simulation von Brownscher Dynamik und Assoziationsraten von PP-Komplexen. Alexander Baldauf Montag

Simulation von Brownscher Dynamik und Assoziationsraten von PP-Komplexen. Alexander Baldauf Montag Simulation von Brownscher Dynamik und Assoziationsraten von PP-Komplexen Alexander Baldauf Montag 25.04.2005 Motivation Typen von Interaktionen Verschiedene Methoden zur Vorhersage Wie kommen die beiden

Mehr

Lage- und Streuungsparameter

Lage- und Streuungsparameter Lage- und Streuungsparameter Beziehen sich auf die Verteilung der Ausprägungen von intervall- und ratio-skalierten Variablen Versuchen, diese Verteilung durch Zahlen zu beschreiben, statt sie graphisch

Mehr

Multivariate Verfahren

Multivariate Verfahren Multivariate Verfahren Oliver Muthmann 31. Mai 2007 Gliederung 1 Einführung 2 Varianzanalyse (MANOVA) 3 Regressionsanalyse 4 Faktorenanalyse Hauptkomponentenanalyse 5 Clusteranalyse 6 Zusammenfassung Komplexe

Mehr

Multivariate Statistische Methoden

Multivariate Statistische Methoden Multivariate Statistische Methoden und ihre Anwendung in den Wirtschafts- und Sozialwissenschaften Von Prof. Dr. Hans Peter Litz Carl von Ossietzky Universität Oldenburg v..v.-'... ':,. -X V R.Oldenbourg

Mehr

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17

7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17 7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17 1. Aufgabe: a) Grundgesamtheit sind alle Reifen aus der Produktion von Langstone aus dem Monat März der entsprechenden Reifentypen.

Mehr

Statistische Methoden in der Wirtschaftsund Sozialgeographie

Statistische Methoden in der Wirtschaftsund Sozialgeographie Statistische Methoden in der Wirtschaftsund Sozialgeographie Ort: Zeit: Multimediapool Rechenzentrum Mittwoch 0.5--45 Uhr Material: http://www.geomodellierung.de Thema: Beschreibung und Analyse Wirtschafts-

Mehr

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n

1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... n x n y n 3.2. Bivariate Verteilungen zwei Variablen X, Y werden gemeinsam betrachtet (an jedem Objekt werden gleichzeitig zwei Merkmale beobachtet) Beobachtungswerte sind Paare von Merkmalsausprägungen (x, y) Beispiele:

Mehr

Skalenniveaus =,!=, >, <, +, -

Skalenniveaus =,!=, >, <, +, - ZUSAMMENHANGSMAßE Skalenniveaus Nominalskala Ordinalskala Intervallskala Verhältnisskala =,!= =,!=, >, < =,!=, >, ,

Mehr

1 Beispiel zur Methode der kleinsten Quadrate

1 Beispiel zur Methode der kleinsten Quadrate 1 Beispiel zur Methode der kleinsten Quadrate 1.1 Daten des Beispiels t x y x*y x 2 ŷ ˆɛ ˆɛ 2 1 1 3 3 1 2 1 1 2 2 3 6 4 3.5-0.5 0.25 3 3 4 12 9 5-1 1 4 4 6 24 16 6.5-0.5 0.25 5 5 9 45 25 8 1 1 Σ 15 25

Mehr

Statistik II. IV. Hypothesentests. Martin Huber

Statistik II. IV. Hypothesentests. Martin Huber Statistik II IV. Hypothesentests Martin Huber 1 / 41 Übersicht Struktur eines Hypothesentests Stichprobenverteilung t-test: Einzelner-Parameter-Test F-Test: Multiple lineare Restriktionen 2 / 41 Struktur

Mehr

Bivariate Regressionsanalyse

Bivariate Regressionsanalyse Universität Bielefeld 15. März 2005 Kovarianz, Korrelation und Regression Kovarianz, Korrelation und Regression Ausgangspunkt ist folgende Datenmatrix: Variablen 1 2... NI 1 x 11 x 12... x 1k 2 x 21 x

Mehr

Vergleich zweier Stichproben

Vergleich zweier Stichproben zurück zum Inhaltsverzeichnis Die Werte sind verbunden, abhängig oder korreliert. Beispiel: Eine Probe wird mit zwei Messgeräten bestimmt. Es gibt eine paarweise Zuordnung. Die Werte sind unabhängig also

Mehr

Skript zum Kurz-Referat:

Skript zum Kurz-Referat: Prof. Dr. Klaus-Jürgen Tillmann/ Michael Lenz WS 2001/02 Fakultät für Pädagogik (AG 4) der Universität Bielefeld Seminar: Anlage und : Der pädagogische Streit seit den 50er-Jahren 7. Sitzung: Die Erblichkeit

Mehr

Analyse 2: Hypothesentests

Analyse 2: Hypothesentests Analyse 2: Hypothesentests Ashkan Taassob Andreas Reisch Inhalt Motivation Statistischer Hintergrund Hypothese Nullhypothesen Alternativhypothesen Fehler beim Hypothesentesten Signifikanz-LEVEL und P-value

Mehr

Stichwortverzeichnis. Symbole

Stichwortverzeichnis. Symbole Stichwortverzeichnis Symbole 50ste Perzentil 119 A Absichern, Ergebnisse 203 Abzählbar unendliche Zufallsvariable 146 Alternativhypothese 237 238 formulieren 248 Anekdote 340 Annäherung 171, 191 Antwortquote

Mehr

Kapitel 2.1: Die stochastische Sicht auf Signale Georg Dorffner 67

Kapitel 2.1: Die stochastische Sicht auf Signale Georg Dorffner 67 Kapitel 2.1: Die stochastische Sicht auf Signale 215 Georg Dorffner 67 Stochastische Prozesse Stochastische Prozesse sind von Zufall geprägte Zeitreihen x n f x, n 1 xn2,... n vorhersagbarer Teil, Signal

Mehr

Übung V Lineares Regressionsmodell

Übung V Lineares Regressionsmodell Universität Ulm 89069 Ulm Germany Dipl.-WiWi Michael Alpert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2007 Übung

Mehr

Vorlesung: Multivariate Statistik für Psychologen

Vorlesung: Multivariate Statistik für Psychologen Vorlesung: Multivariate Statistik für Psychologen 6. Vorlesung: 28.04.2003 Organisatorisches Terminverlegung Übungsgruppen Gruppe 5 alter Termin: Donnerstag, 01.05.03, 12 14 Uhr, IfP SR 9 neuer Termin:

Mehr

Empirische Forschungsmethoden

Empirische Forschungsmethoden Winfried Stier Empirische Forschungsmethoden Zweite, verbesserte Auflage Mit 22 Abbildungen und 53 Tabellen Springer L Inhaltsverzeichnis I. Grundlagen 1 1.1. Methoden, Methodologie, Empirie 1 1.2. Einige

Mehr

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist

Mehr

Kointegration. Kapitel 19. Angewandte Ökonometrie / Ökonometrie III Michael Hauser

Kointegration. Kapitel 19. Angewandte Ökonometrie / Ökonometrie III Michael Hauser 1 / 28 Kointegration Kapitel 19 Angewandte Ökonometrie / Ökonometrie III Michael Hauser 2 / 28 Inhalt I(d), Trends, Beispiele Spurious Regression Kointegration, common trends Fehlerkorrektur-Modell Test

Mehr

Mathematik in den Life Siences

Mathematik in den Life Siences Gerhard Keller Mathematik in den Life Siences Grundlagen der Modellbildung und Statistik mit einer Einführung in die Statistik-Software R 49 Abbildungen Verlag Eugen Ulmer Stuttgart Inhaltsverzeichnis

Mehr

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19

Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19 Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist

Mehr

Einige Grundbegriffe der Statistik

Einige Grundbegriffe der Statistik Einige Grundbegriffe der Statistik Philipp Mitteröcker Basic terms Statistik (statistics) stammt vom lateinischen statisticum ( den Staat betreffend ) und dem italienischen statista ( Staatsmann" oder

Mehr

Klassifikation von Signifikanztests

Klassifikation von Signifikanztests Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen

Mehr

3 Systeme linearer Gleichungen

3 Systeme linearer Gleichungen 3 Systeme linearer Gleichungen Wir wenden uns nun dem Problem der Lösung linearer Gleichungssysteme zu. Beispiel 3.1: Wir betrachten etwa das folgende System linearer Gleichungen: y + 2z = 1 (1) x 2y +

Mehr