Comperative Protein Structure Modelling of Genes and Genomes
|
|
- Linus Schneider
- vor 6 Jahren
- Abrufe
Transkript
1 Comperative Protein Structure Modelling of Genes and Genomes Satisfaction of Spatial Restraints / Loop Modelling Nikolas Gross und Maximilian Miller Ludwig-Maximilians-Universität von 31
2 Table of Contents Idee und Grundlagen Berechnung Datenbank Protein Eigenschaften Satisfaction of Spatial Restraints 2 von 31
3 Idee Optimieren des 3D Modells durch aus dem Alignment gewonnenen Informationen über räumlichen Beschränkungen/Einschränkungen probability density functions (pdfs) für verschiedene Eigenschaften C α - C α Distanzen, Hauptkette N-O Distanzen, Seitenketten Winkel,... molecular pdf Kombination aus verschiednenen pdfs Optimierungsvorgang 3 von 31
4 Grundsätzlicher Ansatz 1. Alignment der unbekannten Sequenz mit verwandten Protein Strukturen/Segmenten 2. Benutzen des Alignments um räumlichen Einschränkungen zuzuweisen 3. Satisfaction of restraints um zum 3D Modell zu kommen 4 von 31
5 5 von 31
6 Grundlage von pdfs und räumliche Eigenschaften statistische Analyse der Beziehungen zwischen verschiedenen Eigenschaften der Proteinstruktur Datenbank aus Alignments zwischen Proteinfamilien um Beziehung zu quantifizieren Beziehungen werden als pdfs für die zu vorhersagende Eigenschaft bezeichnet WS für verschiedene Werte der Hauptkettenwinkel Typ des Rests Hauptkettenkonformation eines entsprechenden Restes Sequenzähnlichkeut der zwei Proteine 6 von 31
7 Derivation of Spatial Restraints I restraint definiert als probability density function p(x), wobei x die Eigenschaft ist die eingeschränkt wird Kann von jeder Art sein, einzige Einschränkungen: nicht-negativ Integral = 1 für alle möglichen x p(x 1 x < x 2 ) = x 2 x 1 p(x) dx mehr Informationsgehalt durch Darstellung eines restraints in Form einer pdf 7 von 31
8 pdf Darstellung 8 von 31
9 Derivation of Spatial Restraints II Berechnung von pdfs: Analytisch durch Statistische und klassische Verfahren Empirisch mit Datenbank bekannter Proteine pdf für bestimmte Eigenschaft x: p(x a, b,..., c) pdf für Vorhersage des Seitenkettenwinkels χ 1 für einen Rest mit Hauptkettenwinkeln Φ und Ψ p(χ 1 residuetype, Φ, Ψ) 9 von 31
10 Derivation of Spatial Restraints III Real nur Näherungsweise Bestimmung von p(x a, b,..., c) möglich: = p(x a, b,..., c) W x,a,b,...,c f (x, a, b,..., c, q) W : beobachtete relative Häufigkeiten von x gegeben a,b,...,c f : analytische Funktion angepasst an beobachtetes W params q : Methode der kleinsten Quadrate W berechnet aus den absoluten Häufigkeiten W 10 von 31
11 Datenbank - Aufbau Familien verwandter Proteine (früher Brookhaven Protein Datenbank PDB) Überarbeitung (deletion of records of non-protein atoms, duplications,...) Multiple Alignments mit COMPARER Erstellung von pdfs durch MDT Fitting der pdfs f durch LSQ 11 von 31
12 Datenbank - Zusammensetzung Alle 4 Strukturklassen: α, β, α + β, α/β 12 von 31
13 13 von 31
14 Protein Eigenschaften Auszüge aus Protein Eigenschaften r : Aminosäure t : Sekundärstruktur Klasse M : Hauptkettenkonformation r : Löslichkeit/Zugänglichkeit d : C α - C α Distanzen R : X-Ray Auflösung 14 von 31
15 Details zu Proteineigenschaften Stückweise Sequenzidentität zwischen Proteinen Anzahl der Paare identischer Reste im Alignment Länge der kürzeren Proteinsequenz Löslichkeit/Zugänglichkeit Contact-Areas für Haupt- oder Seitenkette oder ganzen Rest können verwendet werden Berechnung durch PSA Fractional Contact Area durch Standardisieren mit entsprechender Gly-X-Gly Contact Area 15 von 31
16 Problem bei kleinem Datenset Berechnung der Wahrscheinlichkeiten W aus Häufigkeiten W setzen hohe Häufigkeiten vorraus Problem: Datenbankgröße limitiert sparse Matrix W Heute: Datenbanken enthalten genug Informationen nicht mehr relevant! 16 von 31
17 Signifikanz / Assoziation zweier Eigenschaften Signifikant basierend auf vielen Daten Stärke gemessen an Entropie der bedingten pdf Weiterhin unterscheidung zwischen Präzision und Genauigkeit von Vorhersagen Präzise Unterschiede zwischen Realisationen einer Vorhersage gering falls im Mittel weit weg von realer Struktur trotzdem ungenau 17 von 31
18 Was ist die beste pdf? beste pdf beste Vorhersage für unbekannte Eigenschaft Gegeben ein großes, repräsentatives Datenset: präzisestes pdf allgemein auch genauestes pdf Suche nach denjenigen Eigenschaften, die die Entropie S einer dazugehörigen bedingten pdf minimieren 18 von 31
19 Details: Distanz zwischen zwei C α Atomen Berechnung der Verteilung der Differenz der Abstände aus Datenbank (MDT): d (bekannt) - d (unbekannt) 4 Variablen: d C α - C α Distanz der bekannten Struktur i Sequenzidendität der alignierten Sequenzen a average solvent accessibility der umgebenden Reste g durchschnittliche Distanz umgebender Reste einer Lücke p d ( ( d/g, i, a, d ) 1 = (d/g,i,a,d ) x exp[ 1 2π 2 d d σ(g,i,a,d ) ) 2 ] 19 von 31
20 Details: Distanz zwischen zwei C α Atomen 20 von 31
21 Details: Hauptkettenkonformation eines Rests Jede der 6 Konformationsklassen A, B, P, G, L, E kann Verteilung der Hauptkettenwinkel durch Gauss Verteilung approximiert werden w i = WS, das der einzuschränkende Rest zur Konformationsklasse i gehört pdfs für Φ und Ψ als gewichtete Summe der 6 Gauss Verteilungen mit Gewichtung w i Bestimmung von w i durch Datenbank und MDT 21 von 31
22 Details: Hauptkettenkonformation eines Rests 22 von 31
23 Satisfaction of Spatial Restraints Bisher: Erstellung von pdfs durch stereochemische Überlegungen Jetzt: Kombination der einzelnen pdfs zur Vorhersage eines 3D-Modells Optimierung der molecular pdf Verstöße gegen gegebene Einschränkungen werden minimiert 23 von 31
24 Satisfaction of Spatial Restraints - feature pdf feature: beliebiges Maß in Zusammenhang mit einem bestimmten set aus Atomen Distanz zwischen Atomen i,j Winkel zwischen i,j,k feature pdf : kombiniert Informationen über alle möglichen Werte von f ein feature durch mehrere pdfs eingeschränkt sein molecular pdf wird aus feature pdfs aufgebaut 24 von 31
25 Satisfaction of Spatial Restraints - Beispiel Beispiel: feature pdf für bestimmte C α - C α Distanz in einer gegebenen Sequenz zwei bekannte Sequenzen zwei zusammenhängende pdfs weiter engeschränkt durch v.d.w.-kriterium somit Kombinierung dreier basis pdfs in ein feature pdf 25 von 31
26 Satisfaction of Spatial Restraints - Beispiel In der Praxis Kombination zusammenhängender pdfs durch gewichtete Summierung Gewichtung durch Average residue neighbourhood difference weitere Information (z.b. v.d.w.-kriterium) wird hineinmultipliziert Unterschied bei Haupt- und Nebenkettenkonformation: residue neighbourhood difference 26 von 31
27 Satisfaction of Spatial Restraints - Beispiel molecular pdf: Produkt der feature PDFs P = i=1 pf (f i ) also: bestes 3D-Modell durch Maximierung von P (mit Standardverfahren) 27 von 31
28 Modelling von Trypsin Modelling von Trypsin durch zwei Serinproteasen Elastase Tonin 39 Modelle durch 39 verschiendene Anfangskonformationen Auswahl von 11 Modellen mit niedrigen Werten einer objective function Modell mit niedrigstem Wert repräsentatives Modell 28 von 31
29 Modelling von Trypsin Bestes Modell verglichen mit realer Struktur von Trypsin 29 von 31
30 Spatial Restraints in MODELLER restraints.make() features.distance(*atom ids) features.angle(*atom ids) features.minimal distance(*atom ids) features.solvent access(*atom ids) 30 von 31
31 Quellen Comparative Protein Modelling by Satisfaction of Spatial Restraints (Andrej Sali and Tom L. Blundell) J. Mol. Biol. (1993) 234, MODELLER: 31 von 31
Threading - Algorithmen
Threading - Algorithmen Florian Lindemann 22.11.2007 Florian Lindemann () Threading - Algorithmen 22.11.2007 1 / 25 Gliederung 1 Prospect Scoring Function Algorithmus Weitere Eigenschaften Komplexität
MehrMM Proteinmodelling. Michael Meyer. Vorlesung XVII
Proteinmodelling Vorlesung XVII Proteinstrukturen Es besteht ein sehr großer Bedarf an Proteinstrukturen: Die Kenntnis der 3D-Struktur hat große Vorteile für das Design neuer Wirkstoffe. Experimentelle
MehrBioinformatik. Substitutionsmatrizen BLAST. Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Substitutionsmatrizen BLAST Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Substitutionsmatrizen: PAM und BLOSSUM Suche in Datenbanken: Basic Local Alignment Search
MehrÜbung 1: Wiederholung Wahrscheinlichkeitstheorie
Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable
Mehr15.5 Stetige Zufallsvariablen
5.5 Stetige Zufallsvariablen Es gibt auch Zufallsvariable, bei denen jedes Elementarereignis die Wahrscheinlich keit hat. Beispiel: Lebensdauer eines radioaktiven Atoms Die Lebensdauer eines radioaktiven
MehrBivariate Kreuztabellen
Bivariate Kreuztabellen Kühnel, Krebs 2001 S. 307-342 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/33 Häufigkeit in Zelle y 1 x 1 Kreuztabellen Randverteilung x 1... x j... x J Σ
MehrBioinformatik. Lokale Alignierung Gapkosten. Silke Trißl / Ulf Leser Wissensmanagement in der. Bioinformatik
Bioinformatik Lokale Alignierung Gapkosten Silke Trißl / Ulf Leser Wissensmanagement in der Bioinformatik Inhalt dieser Vorlesung Ähnlichkeit Lokales und globales Alignment Gapped Alignment Silke Trißl:
MehrStatistische Tests für unbekannte Parameter
Konfidenzintervall Intervall, das den unbekannten Parameter der Verteilung mit vorgegebener Sicherheit überdeckt ('Genauigkeitsaussage' bzw. Zuverlässigkeit einer Punktschätzung) Statistischer Test Ja-Nein-Entscheidung
MehrBivariate Analyse: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt.
Bivariate Analyse: Tabellarische Darstellung: Gemeinsame (bivariate) Häufigkeitstabelle. Sie wird auch Kontingenz-, Assoziations- oder Korrelationstabelle (f b )genannt. Beispiel: Häufigkeitsverteilung
MehrHomologie und Sequenzähnlichkeit. Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de
Homologie und Sequenzähnlichkeit Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de Homologie Verwandtschaft aufgrund gleicher Abstammung basiert auf Speziation (Artbildung): aus einer
MehrIhre Namen: Gruppe: Öffnen Sie die Fasta-Dateien nur mit einem Texteditor, z.b. Wordpad oder Notepad, nicht mit Microsoft Word oder Libre Office.
Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2016/2017: Bioinformatik - Übung 1 Erstellen Sie vor Beginn der Übung einen Ordner auf dem Desktop, in dem Sie alle benötigten Dateien speichern kö nnen (z.b.
MehrAnpassungstests VORGEHENSWEISE
Anpassungstests Anpassungstests prüfen, wie sehr sich ein bestimmter Datensatz einer erwarteten Verteilung anpasst bzw. von dieser abweicht. Nach der Erläuterung der Funktionsweise sind je ein Beispiel
MehrBivariate Zusammenhänge
Bivariate Zusammenhänge Tabellenanalyse: Kreuztabellierung und Kontingenzanalyse Philosophische Fakultät Institut für Soziologie Berufsverläufe und Berufserfolg von Hochschulabsolventen Dozent: Mike Kühne
MehrWas sind Zusammenhangsmaße?
Was sind Zusammenhangsmaße? Zusammenhangsmaße beschreiben einen Zusammenhang zwischen zwei Variablen Beispiele für Zusammenhänge: Arbeiter wählen häufiger die SPD als andere Gruppen Hochgebildete vertreten
MehrInhaltsverzeichnis. Vorwort
V Vorwort XI 1 Zum Gebrauch dieses Buches 1 1.1 Einführung 1 1.2 Der Text in den Kapiteln 1 1.3 Was Sie bei auftretenden Problemen tun sollten 2 1.4 Wichtig zu wissen 3 1.5 Zahlenbeispiele im Text 3 1.6
MehrEinführung in die Induktive Statistik: Testen von Hypothesen
Einführung in die Induktive Statistik: Testen von Hypothesen Jan Gertheiss LMU München Sommersemester 2011 Vielen Dank an Christian Heumann für das Überlassen von TEX-Code! Testen: Einführung und Konzepte
MehrZufallsgröße. Würfelwurf mit fairem Würfel. Wahrscheinlichkeitsverteilung einer diskreten
Zufallsgrößen Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt 0 Einführung Wahrscheinlichkeitsrechnung 2 Zufallsvariablen und ihre Verteilung 3 Statistische Inferenz 4 Hypothesentests
MehrMathematische und statistische Hilfsmittel für Pharmazeuten
Mathematische und statistische Hilfsmittel für Pharmazeuten Dr. Helga Lohöfer Fachbereich Mathematik und Informatik der Philipps-Universität Marburg Fassung vom September 2003 Inhaltsverzeichnis I Elementare
MehrStatistik für Punktprozesse. Seminar Stochastische Geometrie und ihre Anwendungen WS 2009/2010
Statistik für Punktprozesse Seminar Stochastische Geometrie und ihre Anwendungen WS 009/00 Inhalt I. Fragestellung / Problematik II. Ansätze für a) die Schätzung der Intensität b) ein Testverfahren auf
MehrÜbung zu Empirische Ökonomie für Fortgeschrittene SS 2009
Übung zu Empirische Ökonomie für Fortgeschrittene Steen Elstner, Klaus Wohlrabe, Steen Henzel SS 9 1 Wichtige Verteilungen Die Normalverteilung Eine stetige Zufallsvariable mit der Wahrscheinlichkeitsdichte
MehrVS PLUS
VS PLUS Zusatzinformationen zu Medien des VS Verlags Statistik II Inferenzstatistik 2010 Übungsaufgaben und Lösungen Inferenzstatistik 2 [Übungsaufgaben und Lösungenn - Inferenzstatistik 2] ÜBUNGSAUFGABEN
MehrKorrespondenzanalyse
Seite 1 von 5 Korrespondenzanalyse Ziel der Korrespondenzanalyse... 1 Anforderungen an die Daten (Stärke des Verfahrens)... 1 Einordnung in die multivariaten Verfahren... 1 Normierung der Daten... 1 Festlegung
MehrStatistik II. Statistische Tests. Statistik II
Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). Teile diese Stichprobe in zwei Teilmengen
MehrMethoden der Werkstoffprüfung Kapitel II Statistische Verfahren I. WS 2009/2010 Kapitel 2.0
Methoden der Werkstoffprüfung Kapitel II Statistische Verfahren I WS 009/010 Kapitel.0 Schritt 1: Bestimmen der relevanten Kenngrößen Kennwerte Einflussgrößen Typ A/Typ B einzeln im ersten Schritt werden
MehrAufgaben zu Kapitel 9
Aufgaben zu Kapitel 9 Aufgabe 1 Für diese Aufgabe benötigen Sie den Datensatz Nominaldaten.sav. a) Sie arbeiten für eine Marktforschungsfirma und sollen überprüfen, ob die in diesem Datensatz untersuchte
MehrLineare Algebra und Numerische Mathematik für D-BAUG
P. Grohs T. Welti F. Weber Herbstsemester 5 Lineare Algebra und Numerische Mathematik für D-BAUG ETH Zürich D-MATH Beispiellösung für Serie Aufgabe. Skalarprodukt und Orthogonalität.a) Bezüglich des euklidischen
MehrKorrelation und Regression
FB 1 W. Ludwig-Mayerhofer und 1 und FB 1 W. Ludwig-Mayerhofer und 2 Mit s- und sanalyse werden Zusammenhänge zwischen zwei metrischen Variablen analysiert. Wenn man nur einen Zusammenhang quantifizieren
MehrTest auf den Erwartungswert
Test auf den Erwartungswert Wir interessieren uns für den Erwartungswert µ einer metrischen Zufallsgröße. Beispiele: Alter, Einkommen, Körpergröße, Scorewert... Wir können einseitige oder zweiseitige Hypothesen
MehrAllgemeines zu Tests. Statistische Hypothesentests
Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer
MehrChi-Quadrat-Verteilung
Chi-Quadrat-Verteilung Die Verteilung einer Summe X +X +...+X n, wobei X,..., X n unabhängige standardnormalverteilte Zufallsvariablen sind, heißt χ -Verteilung mit n Freiheitsgraden. Eine N(, )-verteilte
MehrChi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrWahrscheinlichkeiten
Wahrscheinlichkeiten August, 2013 1 von 21 Wahrscheinlichkeiten Outline 1 Wahrscheinlichkeiten 2 von 21 Wahrscheinlichkeiten Zufallsexperimente Die möglichen Ergebnisse (outcome) i eines Zufallsexperimentes
MehrZufallsvariablen [random variable]
Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden
Mehr4. Kopplung. Konzepte: Gekoppelte Vererbung. Genkarten. Doppel-Crossover. Interferenz. Statistik
4. Kopplung Konzepte: Gekoppelte Vererbung Genkarten Doppel-Crossover Interferenz Statistik 1. Sie analysieren die Kopplungsverhältnisse von 3 Mutationen in Drosophila melanogaster (scute [sc; keine Thoraxborsten],
Mehr3. Übungsblatt Aufgaben mit Lösungen
. Übungsblatt Aufgaben mit Lösungen Aufgabe : Gegeben sind zwei Teilmengen von R : E := {x R : x x = }, und F ist eine Ebene durch die Punkte A = ( ), B = ( ) und C = ( ). (a) Stellen Sie diese Mengen
MehrEinige grundsätzliche Überlegungen:
Einige grundsätzliche Überlegungen: 1) Die Wahl der Unbekannten, x, y, z, oder a, b, c oder α, β, γ oder m, n, o. etc. richten sich nach den Beispielen und sind so zu wählen, dass sie am besten zu jenen
MehrLösungsvorschläge zum 14. Übungsblatt.
Übung zur Analysis III WS / Lösungsvorschläge zum 4. Übungsblatt. Aufgabe 54 Sei a R\{}. Ziel ist die Berechnung des Reihenwertes k a + k. Definiere dazu f : [ π, π] R, x coshax. Wir entwickeln f in eine
MehrSTETIGE VERTEILUNGEN
STETIGE VERTEILUNGEN. Die Näherungsformel von Moivre Laplace Betrachtet man die Binomialverteilungen Bnp für wachsendes n bei konstantem p, so werden die Histogramme einer binomialverteilten Zufallsvariablen
MehrLösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK
Institut für Stochastik Dr. Steffen Winter Lösungen zur Klausur GRUNDLAGEN DER WAHRSCHEINLICHKEITSTHEORIE UND STATISTIK für Studierende der INFORMATIK vom 17. Juli 01 (Dauer: 90 Minuten) Übersicht über
MehrAusarbeitung Prüfung Statistik und Wahrscheinlichkeitstheorie (Universität Wien)
Ausarbeitung Prüfung Statistik und Wahrscheinlichkeitstheorie (Universität Wien) Prüfung 28.0.03 Ausgearbeitet von Murmel (Murmel.vienna@gmx.at) Beispiel : Theorie Welche grafischen Darstellungsformen
MehrMOL.504 Analyse von DNA- und Proteinsequenzen
MOL.504 Analyse von DNA- und Proteinsequenzen Kurs 1 Monika Oberer, Karl Gruber MOL.504 Modul-Übersicht Einführung, Datenbanken BLAST-Suche, Sequenzalignment Proteinstrukturen Virtuelles Klonieren Abschlusstest
Mehr6. Statistische Schätzung von ARIMA Modellen
6. Statistische Schätzung von ARIMA Modellen Vorschau: ARIMA Modelle Modellidentifikation verschiedene Schätzverfahren Modelldiagnostik Fallstudien Zeitreihenanalyse 1 6.1 ARIMA Modelle Bisher: ARMA(p,q)-Modelle:
Mehr3 Evaluation als Beschreibung von Zuständen
Evaluation als Beschreibung von Zuständen 1 Sind die folgenden Aussagen richtig oder falsch? 1.1 In einer Klumpenstichprobe werden systematisch anfallende Cluster von Personen vollständig untersucht. Die
MehrLineare Regression II
Lineare Regression II Varianzanalyse als multiple Regession auf Designvariablen Das lineare Regressionsmodell setzt implizit voraus, dass nicht nur die abhängige, sondern auch die erklärenden Variablen
MehrWichtige Themen aus der Vorlesung Bioinformatik II SS 2016
Universität des Saarlandes FR 6.2 Informatik Prof. Dr. Hans-Peter Lenhof M. Sc. Daniel Stöckel M. Sc. Lara Schneider M. Sc. Tim Kehl I Wichtige Themen aus der Vorlesung Bioinformatik II SS 2016 Hinweis:
MehrInhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
MehrÜbungen zur Vorlesung MATHEMATIK II
Fachbereich Mathematik und Informatik der Philipps-Universität Marburg Übungen zur Vorlesung MATHEMATIK II Prof. Dr. C. Portenier unter Mitarbeit von Michael Koch Marburg, Sommersemester 2005 Fassung vom
Mehr1 Vektoren, Vektorräume, Abstände: 2D
Vektoren, Vektorräume, Astände: D Definition: Die Menge aller (geordneten Paare reeller Zahlen (oder allgemeiner: Elemente eines elieigen Körpers, als Spalten geschrieen, ezeichnen wir als Vektoren: R
MehrHypothesenprüfung. Darüber hinaus existieren zahlreiche andere Testverfahren, die alle auf der gleichen Logik basieren
Hypothesenprüfung Teil der Inferenzstatistik Befaßt sich mit der Frage, wie Hypothesen über eine (in der Regel unbekannte) Grundgesamtheit an einer Stichprobe überprüft werden können Behandelt werden drei
MehrStatistics, Data Analysis, and Simulation SS 2015
Mainz, May 12, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler
MehrGrundkompetenzen (Mathematik Oberstufe)
Grundkompetenzen (Mathematik Oberstufe) AG: Algebra und Geometrie (14 Deskriptoren) FA: Funktionale Abhängigkeiten (35 Deskriptoren) AN: Analysis (11 Deskriptoren) WS: Wahrscheinlichkeit und Statistik
Mehr1/10. Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1
Ihre Namen: Gruppe: Evolutionsbiologie 2, WS2015/2016: Bioinformatik - Übung 1 Erstellen Sie bitte vor Beginn der Übung einen Ordner auf dem Desktop, in dem Sie alle benötigten Dateien speichern können
MehrStatistik, Datenanalyse und Simulation
Dr. Michael O. Distler distler@kph.uni-mainz.de Mainz, 31. Mai 2011 4. Methode der kleinsten Quadrate Geschichte: Von Legendre, Gauß und Laplace zu Beginn des 19. Jahrhunderts eingeführt. Die Methode der
MehrBioinformatik. Methoden zur Vorhersage vo n RNA- und Proteinstrukture n. Gerhard Steger
Bioinformatik Methoden zur Vorhersage vo n RNA- und Proteinstrukture n Gerhard Steger Vorwort ix Strukturvorhersage von Nukleinsäuren 1 Struktur und Funktion von RNA 3 1.1 RNA-Struktur fl 1.2 Thermodynamik
MehrEntscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 4.1 4. Statistische Entscheidungsverfahren Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Beispiel:
MehrBivariater Zusammenhang in der Mehrfeldertafel PEΣO
Bivariater Zusammenhang in der Mehrfeldertafel PEΣO 9. November 2001 Bivariate Häufigkeitsverteilungen in Mehrfeldertabellen In der Mehrfeldertabelle werden im Gegensatz zur Vierfeldertabelle keine dichotomen
MehrFelix-Nicolai Müller. Seminar Fragebogenmethodik - WS2009/2010 - Universität Trier Dr. Dirk Kranz 24.11.2009
Cohen s Kappa Felix-Nicolai Müller Seminar Fragebogenmethodik - WS2009/2010 - Universität Trier Dr. Dirk Kranz 24.11.2009 Felix-Nicolai Müller Cohen s Kappa 24.11.2009 1 / 21 Inhaltsverzeichnis 1 2 3 4
MehrBerechnung von Formfaktoren
Berechnung von Formfaktoren Oliver Deussen Formfaktorberechnung 1 Formfaktor ist eine Funktion in Abhängigkeit der Geometrie ist unabhängig von reflektierenden oder emittierenden Eigenschaften (ρ) der
MehrEine einfache Methode zur Bestimmung des Bahnradius eines Planetoiden
Eine einfache Methode zur Bestimmung des Bahnradius eines Planetoiden Von Eckhardt Schön Erfurt Mit 1 Abbildung Die Bewegung der Planeten und Kleinkörper des Sonnensystems verläuft scheinbar zweidimensional
MehrQuantitative Methoden (Vertretung für Prof. Th. Pechmann)
Quantitative Methoden (Vertretung für Prof. Th. Pechmann) Inferenzstatistik I: Zusammenhänge (Korrelationen) Logik inferenzstatistischer Verfahren Andreas Opitz Universität Leipzig Institut für Linguistik
MehrDie wichtigsten Bioinformatikdatenbanken. SwissProt, PDB, Scop, CATH, FSSP, PROSITE, Pfam
Die wichtigsten Bioinformatikdatenbanken SwissProt, PDB, Scop, CATH, FSSP, PROSITE, Pfam Übersicht Nucleotidsequenzen: GenBank, EMBL Proteindatenbank SwissProt Proteinstrukturen: Brookhavens PDB Proteinklassifizierung:
MehrE. AUSBAU DER INFINITESIMALRECHNUNG 17. UMKEHRFUNKTIONEN (INVERSE FUNCTION)
160 Dieses Skript ist ein Auszug mit Lücken aus Einführung in die mathematische Behandlung der Naturwissenschaften I von Hans Heiner Storrer, Birkhäuser Skripten. Als StudentIn sollten Sie das Buch auch
MehrShape Gradient for Image and Video Segmentation
Shape Gradient for Image and Video Segmentation [1] S. Jehan-Besson, A. Herbulot, M. Barlaud und G. Aubert 23. Mai 2007 Martin Schröttner und Michael Schneeberger Mat Vis-Gra SS07 1 Überblick Aktive Konturen
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 19. Januar 2011 1 Nichtparametrische Tests Ordinalskalierte Daten 2 Test für ein Merkmal mit nur zwei Ausprägungen
MehrZwei kategoriale Merkmale. Homogenität Unabhängigkeit
121 Zwei kategoriale Merkmale Homogenität Unabhängigkeit 122 Beispiel Gründe für die Beliebtheit bei Klassenkameraden 478 neun- bis zwölfjährige Schulkinder in Michigan, USA Grund für Beliebtheit weiblich
MehrÜbung zur Empirischen Wirtschaftsforschung V. Das Lineare Regressionsmodell
Universität Ulm 89069 Ulm Germany Dipl.-WiWi Christian Peukert Institut für Wirtschaftspolitik Fakultät für Mathematik und Wirtschaftswissenschaften Ludwig-Erhard-Stiftungsprofessur Sommersemester 2010
Mehr4 Statistik der Extremwertverteilungen
In diesem Kapitel beschäftigen wir uns mit statistischen Anwendungen der Extremwerttheorie. Wir werden zwei verschiedene Zugänge zur Modellierung von Extremwerten betrachten. Der erste Zugang basiert auf
MehrÜberblick Hypothesentests bei Binomialverteilungen (Ac)
Überblick Hypothesentests bei Binomialverteilungen (Ac) Beim Testen will man mit einer Stichprobe vom Umfang n eine Hypothese H o (z.b.p o =70%) widerlegen! Man geht dabei aus von einer Binomialverteilung
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
Mehr8. Konfidenzintervalle und Hypothesentests
8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars
Mehr3 Häufigkeitsverteilungen
3 Häufigkeitsverteilungen 3.1 Absolute und relative Häufigkeiten 3.2 Klassierung von Daten 3.3 Verteilungsverläufe 3.1 Absolute und relative Häufigkeiten Datenaggregation: Bildung von Häufigkeiten X nominal
MehrLuke Alphey. DNA-Sequenzierung. Aus dem Englischen übersetzt von Kurt Beginnen. Spektrum Akademischer Verlag
Luke Alphey DNA-Sequenzierung Aus dem Englischen übersetzt von Kurt Beginnen Spektrum Akademischer Verlag Inhalt Abkürzungen 11 Vorwort 15 Danksagung 16 Teil 1: Grundprinzipien und Methoden 1. 1.1 1.2
MehrNormalengleichungen. Für eine beliebige m n Matrix A erfüllt jede Lösung x des Ausgleichsproblems Ax b min die Normalengleichungen A t Ax = A t b,
Normalengleichungen Für eine beliebige m n Matrix A erfüllt jede Lösung x des Ausgleichsproblems Ax b min die Normalengleichungen A t Ax = A t b, Normalengleichungen 1-1 Normalengleichungen Für eine beliebige
MehrStatistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
Mehrl p h (x) δw(x) dx für alle δw(x).
1.3 Potentielle Energie 5 In der modernen Statik benutzen wir statt dessen einen schwächeren Gleichheitsbegriff. Wir verlangen nur, dass die beiden Streckenlasten bei jeder virtuellen Verrückung dieselbe
Mehr9 Die Normalverteilung
9 Die Normalverteilung Dichte: f(x) = 1 2πσ e (x µ)2 /2σ 2, µ R,σ > 0 9.1 Standard-Normalverteilung µ = 0, σ 2 = 1 ϕ(x) = 1 2π e x2 /2 Dichte Φ(x) = 1 x 2π e t2 /2 dt Verteilungsfunktion 331 W.Kössler,
Mehr2.4 Stoßprozesse. entweder nicht interessiert o- der keine Möglichkeit hat, sie zu untersuchen oder zu beeinflussen.
- 52-2.4 Stoßprozesse 2.4.1 Definition und Motivation Unter einem Stoß versteht man eine zeitlich begrenzte Wechselwirkung zwischen zwei oder mehr Systemen, wobei man sich für die Einzelheiten der Wechselwirkung
Mehr2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:
2.4.1 Grundprinzipien statistischer Hypothesentests Hypothese: Behauptung einer Tatsache, deren Überprüfung noch aussteht (Leutner in: Endruweit, Trommsdorff: Wörterbuch der Soziologie, 1989). Statistischer
MehrFit in Mathe. Juni Klassenstufe 10. Trigonometrie mit Sinus- und Kosinussatz
Thema Musterlösungen 1 Trigonometrie mit Sinus- und Kosinussatz Vorbemerkungen Für Winkelangaben wird hier, wenn nicht anders angegeben, das Bogenmaß verwendet. Es gilt 1 rad = 360 π 57, bezeichnet das
MehrWas ist Physik? Modell der Natur universell es war schon immer so
Was ist Physik? Modell der Natur universell es war schon immer so Kultur Aus was sind wir gemacht? Ursprung und Aufbau der Materie Von wo/was kommen wir? Ursprung und Aufbau von Raum und Zeit Wirtschaft
MehrRandwertbedingungen und Ghost Cells
Randwertbedingungen und Ghost Cells Olaf Kern Universität Trier 16.Dezember 2010 Olaf Kern (Universität Trier) Seminar Numerik 1/23 16.Dezember 2010 1 / 23 Inhaltsverzeichnis 1 Einführung 2 Periodische
Mehr10. Die Normalverteilungsannahme
10. Die Normalverteilungsannahme Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Bisher haben wir vorausgesetzt, daß die Beobachtungswerte normalverteilt sind. In diesem Fall kann man
MehrBioinformatik I (Einführung)
Kay Diederichs, Sommersemester 2015 Bioinformatik I (Einführung) Algorithmen Sequenzen Strukturen PDFs unter http://strucbio.biologie.unikonstanz.de/~dikay/bioinformatik/ Klausur: Fr 17.7. 10:00-11:00
MehrBLAST. Datenbanksuche mit BLAST. Genomische Datenanalyse 10. Kapitel
Datenbanksuche mit BLAST BLAST Genomische Datenanalyse 10. Kapitel http://www.ncbi.nlm.nih.gov/blast/ Statistische Fragen Datenbanksuche Query Kann die globale Sequenzähnlichkeit eine Zufallsfluktuation
MehrModerne Portfoliotheorie
ortfoliooptimierung nach Markowitz Moderne ortfoliotheorie Carlos Nasher Universität Hamburg Hamburg, 12. Mai 2009 ortfoliooptimierung nach Markowitz Moderne ortfoliotheorie 1. Theoretische Grundlagen
MehrAnalytische Geometrie Seite 1 von 6. Die Addition von Vektoren kann veranschaulicht werden durch das Aneinanderhängen von Pfeilen.
Analytische Geometrie Seite 1 von 6 1. Wichtige Formeln AB bezeichnet den Vektor, der die Verschiebung beschreibt, durch die der Punkt A auf den Punkt B verschoben wird. Der Vektor, durch den die Verschiebung
MehrAngewandte Statistik 3. Semester
Angewandte Statistik 3. Semester Übung 5 Grundlagen der Statistik Übersicht Semester 1 Einführung ins SPSS Auswertung im SPSS anhand eines Beispieles Häufigkeitsauswertungen Grafiken Statistische Grundlagen
MehrKapitel 7. Crossvalidation
Kapitel 7 Crossvalidation Wie im Kapitel 5 erwähnt wurde, ist die Crossvalidation die beste Technik, womit man die Genauigkeit der verschiedenen Interpolationsmethoden überprüft. In diesem Kapitel wurde
MehrModellieren in der Angewandten Geologie II. Sebastian Bauer
Modellieren in der Angewandten Geologie II Geohydromodellierung Institut für Geowissenschaften Christian-Albrechts-Universität zu Kiel CAU 3-1 Die Finite Elemente Method (FEM) ist eine sehr allgemeine
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Pantelis Christodoulides & Karin Waldherr 4. Juni 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden 1/35 Ein- und Zweiseitige Hypothesen H 0 : p =
MehrZusammenhangsanalyse in Kontingenztabellen
Zusammenhangsanalyse in Kontingenztabellen Bisher: Tabellarische / graphische Präsentation Jetzt: Maßzahlen für Stärke des Zusammenhangs zwischen X und Y. Chancen und relative Chancen Zunächst 2 2 - Kontingenztafel
MehrLösungen zu den Übungsaufgaben in Kapitel 10
Lösungen zu den Übungsaufgaben in Kapitel 10 (1) In einer Stichprobe mit n = 10 Personen werden für X folgende Werte beobachtet: {9; 96; 96; 106; 11; 114; 114; 118; 13; 14}. Sie gehen davon aus, dass Mittelwert
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
MehrVermessungskunde für Bauingenieure und Geodäten
Vermessungskunde für Bauingenieure und Geodäten Übung 6: statistische Auswertung ungleichgenauer Messungen Milo Hirsch Hendrik Hellmers Florian Schill Institut für Geodäsie Fachbereich 13 Inhaltsverzeichnis
MehrRegulär variierende Funktionen
KAPITEL 4 Regulär variierende Funktionen Unser nächstes Ziel ist es, die Max-Anziehungsbereiche der Extremwertverteilungen zu beschreiben. Dies wird im nächsten Kapitel geschehen. Wir haben bereits gesehen,
MehrBivariate lineare Regression. Statistik für SozialwissenschaftlerInnen II p.154
Bivariate lineare Regression Statistik für SozialwissenschaftlerInnen II p.154 Grundidee und Typen der Regression Die Regressionsanalyse dient zur Quantifizierung des Zusammenhangs und der statistisch
MehrDas von Neumannsche Theorem. von Martin Fiedler
Das von eumannsche Theorem von Martin Fiedler Einleitung In der Mitte des letzten Jahrhunderts beschäftigten sich viele Physiker mit der Frage nach der Vollständigkeit der Quantentheorie. Einige Physiker,
MehrEvolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de
Evolution & Genetik (Beispiel Hämoglobin) Prof. Dr. Antje Krause FH Bingen 06721 / 409 253 akrause@fh-bingen.de DNA (Desoxyribonukleinsäure) 5 3 CGATGTACATCG GCTACATGTAGC 3 5 Doppelhelix Basen: Adenin,
Mehr13. Übungswoche. Kapitel 12: Varianzanalyse (Fortsetzung)
1 13. Übungswoche Kapitel 12: Varianzanalyse (Fortsetzung) [ 3 ] Im Vorkurs Mathematik für Wirtschafstwissenschaftler vor Beginn des Sommersemesters 2009 wurde am Anfang und am Ende ein Test geschrieben,
MehrLokale Sequenzähnlichkeit. Genomische Datenanalyse 9. Kapitel
Lokale Sequenzähnlichkeit Genomische Datenanalyse 9. Kapitel Globale Sequenzähnlichkeit: Zwei Cytochrome C Sequenzen: Eine vom Menschen und eine aus der Maus. Die Sequenzen sind gleich lang, man kann sie
Mehr