Softwarewerkzeuge der Bioinformatik

Ähnliche Dokumente
Softwarewerkzeuge der Bioinformatik

Vorlesung Biophysik I - Molekulare Biophysik Kalbitzer/Kremer/Ziegler

15. Aminosäuren, Peptide und Proteine

Softwarewerkzeuge der. Bioinformatik

Aufgabe 2: (Aminosäuren)

Proteinogene Aminosäuren. Unpolare, aliphatische Seitenketten Monoaminomonocarbonsäuren

Aminosäuren - Proteine

BIOINF1110 Einführung in die Bioinforma7k. 5. Molekulare Maschinen Proteinstrukturen und ihre Funk/on

MM Biopolymere. Michael Meyer. Vorlesung XV

Einführung in die Angewandte Bioinformatik: Proteinsequenz-Datenbanken

Campherchinon (teuer)

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus:

Pharmazeutische Biologie Grundlagen der Biochemie

Peptide Proteine. 1. Aminosäuren. Alle optisch aktiven proteinogenen Aminosäuren gehören der L-Reihe an: 1.1 Struktur der Aminosäuren

Bioinformatik: Schnittstelle zwischen Informatik und Life-Science

Aliphatische Aminosäuren. Aromatische Aminosäuren

MOL.504 Analyse von DNA- und Proteinsequenzen

Modul 8: Bioinformatik A. Von der DNA zum Protein Proteinsynthese in silicio

Cell Biology Gravitational Biology

Mathematik und Naturwissenschaften, Biologie, Biochemie. Biochemie II - Tutorium

MOL.504 Analyse von DNA- und Proteinsequenzen. Datenbanken & Informationssysteme

Aminosäuren. Die Mischung macht's. Die Proteinfabrik. ANKUBERO GmbH. Verschiedene Aminosäuren und Proteine

Ausprägungsfach Bioinformatik im Rahmen des Bachelor-Studiengangs Informatik. CIBIV Center for Integrative Bioinformatics Vienna

Erratum zur Diplomarbeit von Andreas Bender. Korrekturverzeichnis: Kapitel 3.2.2, Seiten 39-46

Nach Terpenen und Kohlenhydraten nun eine weitere große Klasse an Naturstoffen

Aminosäurenanalytik. Probenvorbereitung Eiweißfällung, Oxidation und Hydrolyse Karl-Heinz Jansen SYKAM CHROMATOGRAPHIE

Klausur Bioinformatik für Biotechnologen

Die hierarchische Organisation biologischer Strukturen

Zentrum für Bioinformatik. Übung 4: Revision. Beispielfragen zur Klausur im Modul Angewandte Bioinformatik (erste Semesterhälfte)

Application Notes. Aracus

Algorithmische Bioinformatik

Alternativen zu Fischmehl für die Fütterung in der nachhaltigen Aquakultur

2. Zeichnen Sie die Betain-Struktur und schätzen Sie die pi-werte der Peptide:

Primärstruktur. Wintersemester 2011/12. Peter Güntert

Foliensatz; Arbeitsblatt; Internet. Je nach chemischem Wissen können die Proteine noch detaillierter besprochen werden.

Was ist der Promotor? Antwort: Eine spezielle Nucleotidsequenz auf der DNA, an der die RNA-Polymerase bindet um die Transkription zu starten.

10 BIOGENE-AMINE 4 NICHT-PROTEINOGENE- AS. 20 PROTEINOGENE AS glucoplastisch/ketoplastisch 8 ESSENTIELLE AS

Linearität und Nachweisgrenzen

Gleichheit, Ähnlichkeit, Homologie

Kapitel 2: Modellierung. Programmieren in Haskell 1

Aminosäuren und Peptide

Aufgabenkultur SINUS Bayern

Dendrogramm der Primaten

(einsatz (2/1) (transponiere 12 endlos)) (einsatz (4/1) endlos) :+: (einsatz (6/1) endlos )))

9. Übung zur Einführung in die Informatik (HaF) (Abschnitt IV: Rechnerstrukturen und Betriebssysteme) Musterlösung

AF. Bioinformatik im Bachelor-Studiengang Informatik. CIBIV Center for Integrative Bioinformatics Vienna. Bioinformatik eine Definition

Protein-Protein Bindungsstellen. Lennart Heinzerling

Bildungs- und Wissenszentrum Boxberg Einsatzmöglichkeiten von Körnerleguminosen in der Schweinefütterung

15. Aminosäuren, Peptide und Proteine

MM Proteinmodelling. Michael Meyer. Vorlesung XVII

2 Abkürzungsverzeichnis/Definitionen

Mathematik und Naturwissenschaften, Biologie, Biochemie. Biochemie II - Tutorium

Attached! Proseminar Netzwerkanalyse SS 2004 Thema: Biologie

Übung 7: Die Proteindatenbank (PDB) und Vergleiche von Proteinstrukturen

Verfahren zu Strukturvorhersagen in vereinfachten Modellen. Tobias Voigt Sommerakademie 2002 St. Johann

Organisch-Chemisches Institut Fakultät für Chemie und Geowissenschaften Universität Heidelberg 07. September 2009

pk S der α-carbonsäure = 1,88; pk S der β-carbonsäure = 3,65 Die beiden Carbonsäuregruppen unterscheiden sich auch in ihrer chemischen Reaktivität

Einführung in die Bioinformatik

Multiple Alignments. Vorlesung Einführung in die Angewandte Bioinformatik Prof. Dr. Sven Rahmann. Webseite zur Vorlesung

Funktionelle Gruppen Amine

Aminosäurenverdaulichkeit von Getreide bei Legehennen

Einführung in die Bioinformatik

ORGANISCHE CHEMIE. Aminosäuren und Proteine

Einleitung. Heimische Eiweißträger und sonstige Alternativen zur Reduzierung der Eiweißlücke Karl Schedle. Universität für Bodenkultur, Wien

1 Block 1: Das erste Perl Programm Datenausgabe auf dem Bildschirm

C R H H O H H O. Peptide

Kapitel 1: Einführung und biologische Grundlagen

FACHINFORMATIONEN. Vertrieb in Deutschland: OTC SIEBENHANDL GmbH, Lämmerweg 29, D Ulm,

Naturstoffe. Theoretische Grundlagen und Einführung in das Naturstoffisolationspräparat in den Laborübungen Organische Chemie.

Lösungsblatt zu Aufbau von Aminosäuren

Neue Aspekte des Energiemetabolismus beim Karpfen (Cyprinus carpio)

Vorlesungsskript. Softwarewerkzeuge der Bioinformatik

Grundlagen der Zellulären Biochemie

6 Proteinstrukturen und die dritte Dimension

Bioinformatik auch ein Thema für Informationsfachleute?

von Dipl. Math. (FH) Klaus Lange Primzahlen im Aufbau der DNS

Molekularbiologische Datenbanken

Organische Chemie der biologischen Stoffwechselwege

Vorlesungsskript. Softwarewerkzeuge der Bioinformatik

Aminosäure Seitenkette pks. 20 Aminosäuren im genetischen Code verankert. α -Aminosäuren R. Fischer-projektion. COOH H 2 N H R D-Aminosäuren

Nanotechnologie der Biomoleküle. Aminosäuren und Proteine: Bausteine der Biologie und der Bionanotechnologie. Aufbau Struktur Funktion

VORANSICHT II/B3. Retinopathia pigmentosa eine Genmutation verdunkelt langsam die Welt. Der Beitrag im Überblick. Retinopathia pigmentosa Reihe 2 S 1

Biochemie (für Bioinformatiker) WS 2010/2011, 1. Klausur (50 Punkte)

Datenbanken in der Molekularbiologie

Transkript:

Softwarewerkzeuge der Bioinformatik Inhalt dieser Veranstaltung: Softwarewerkzeuge kennenlernen für I II III Sequenzanalyse Analyse von Proteinstruktur und Ligandenbindung Zell- bzw. etzwerksimulationen www.cellzome.com www.accelrys.com 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 1

Lernziele Lerne aktuelle und bewährte Programme und Datenbanken der Bioinformatik kennen und erfolgreich einzusetzen um - ands-n mit Web-Tools arbeiten, mit denen man bioinformatische Fragen bearbeiten kann - zu wissen, was auf dem Markt ist ( das Rad nicht zweimal erfinden ) - ein Gefühl dafür zu bekommen, wie erfolgreiche Softwareprodukte aussehen (sollen) - 3 Mini-Forschungsprojekte zu bearbeiten (Bioinformatiker/Biotechnologen) 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik

rganisatorisches Uhr Jede Woche Vorlesung Donnerstag 10.15 1.00 Seminarraum 007, Geb. E 1 Dozent: Prof. elms Die Teilnahme an der Vorlesung ist nicht obligatorisch, jedoch die Teilnahme an der Übung. Übungen hands-on Beginn heute am 3.10: Donnerstag, 14:00 Uhr 16:00 Uhr, CIP-Pool E 1 CIP. Verantwortliche Betreuer der Übungen Sequenz-Analyse Kerstin Reuter Proteinstruktur Dr. Michael utter Zellsimulationen Christian Spaniol 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 3

rganisatorisches Jeder Teilnehmer an den Übungen benötigt einen Rechneraccount für den CIP-Pool. Biotechnologen: bitte in Liste eintragen 4. Pflichten der Benutzer Der Benutzer verpflichtet sich, a) die bereitgestellten Betriebsmittel sorgfältig zu benutzen; b) das Passwort des ihm zugeteilten Benutzerkennzeichens geheim zu halten...;... d) alles zu unterlassen, was den ordnungsgemäßen Ablauf der Anlage stört; e) in den Arbeitsräumen sich so zu verhalten, dass andere Benutzer nicht gestört werden; f) Störungen... zu melden und diese nicht auszunutzen; g) in den Räumen... sowie bei Inanspruchnahme seiner Geräte... den Weisungen des Personals des Anlagenbetreibers Folge zu leisten;... l) lizensierte Software nur nach Absprache mit dem jeweiligen BfR einzuspielen und zu verwenden; m) von der Fak6 oder der Universität des Saarlandes bereitgestellte Software, Dokumentationen oder Daten weder zu kopieren noch an Dritte weiterzugeben, sofern dies nicht ausdrücklich erlaubt ist, noch zu anderen als den erlaubten Zwecken zu verwenden, Zugang zum CIP-Pool während der Übungsstunden. 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 4

rganisatorisches: Scheinvergabe B.Sc. Bioinformatik und Biotechnologie M.Sc. - Bewertung: Vorlesung zählt V + P = 9 Leistungspunkte - Curriculum: Pflichtvorlesung für die Vertiefung Bioinformatics - kann natürlich auch für CMB-Bachelor eingebracht werden - Wahlfach Pharmazie/Diplom - Pflichtvorlesung für bestimmte Studenten des M.Sc. Biotechnologie Drei Mini-Projekte werden etwa alle 4 Wochen ausgegeben. Diese sind innerhalb von Wochen in Teams mit -3 Studenten zu bearbeiten und durch einen mindestens 5-seitigen Praktikumsbericht zu dokumentieren. Jeder Student muss mindestens zwei der drei Mini-Projekte mit einer ote von 4 und besser bestehen. 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 5

rganisatorisches: Scheinvergabe B.Sc. Bioinformatik und Biotechnologie M.Sc. Voraussetzung für die Teilnahme an der Abschlussklausur ist das Erreichen von mindestens 50 % der maximalen Punkte aus den drei Praktikumsberichten. Die Veranstaltung gilt als bestanden, wenn in der abschließenden 10-minütigen Klausur über die Inhalte der Vorlesung, der Übungen und der Minipraktika mindestens die ote 4 erreicht wurde. Für die ote des Scheins zählt das bessere Ergebnis entweder ausschließlich aus der abschließenden Klausur oder der Kombination des Durchschnitts der benoteten Praktika und der ote der Abschlussklausur, die jeweils zu 50 % gewichtet werden. Bei ichtbestehen der Klausur besteht die Möglichkeit einer schriftlichen oder mündlichen achprüfung. Diese findet im allgemeinen zu Beginn des darauffolgenden Semesters statt. 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 6

Literatur David Mount Bioinformatics 70 Zu empfehlen ist ebenfalls: Vorlesungsskript aus 010 (176 Seiten) Marketa Zvelebil & Jeremil. Baum Understanding bioinformatics, 96 kann von http://gepard.bioinformatik.uni-saarland.de/teaching/ss-011/swwbioinformatik/script/sw10-skript.pdf heruntergeladen werden. Vorlesungsfolien ebenfalls auf http://gepard.bioinformatik.uni-saarland.de/teaching/ws-14-15/sww-bioinformatik-ws1415 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 7

Übersicht über Vorlesungsinhalt I Sequenz III Zellsimulationen/etzwerke 1 Einführung, Datenbanken 6 Genexpression Microarrays Paarweises Sequenzalignment 3 Multiples Sequenzalignments; Phylogenie 4 Genvorhersage, Motivsuche 7 Funktionsannotation (Gene ntology) 8 Systembiologie: metabolische Pfade; Protein-Interaktion, Genregulationsnetzwerke 9 Enzymkinetik einfache II Proteinstruktur 5. Proteinstruktur; Sekundärstruktur 6. omologie-modellierung Differentialgleichungen 10 Diffusionssysteme - Virtual Cell 11 Stochastische Effekte 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 8

istorische Entwicklung der Bioinformatik 1960 er Jahre: Entwicklung phylogenetischer Methoden 1960 er Jahre: Methoden zum Vergleich von DA- und Proteinsequenzen 1976: erste MD-Simulation eines Proteins 1981: Smith-Waterman Algorithmus dynamische Programmierung 199: Sekundärstrukturvorhersage mit euronalen etzwerken (PD) machine learning 1996: Vergleich von Proteinstrukturen mit DALI 000: Durchbruch bei Sequenz-Assemblierung aus Shotgun-Daten (E. Myers) 01: ECDE-Projekt 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 9

Die Struktur von Genen www.wikipedia.org 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 10

UCSC Genome Browser Es gibt verschiedene Assemblies hg17, hg18, hg19 für das humane Genom http://genome.ucsc.edu/cgi-bin/hggateway 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 11

Die vier ukleotidbasen 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 1 Zvelebil (008)

Codonsonne 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 13 Zvelebil (008)

Eigenschaften der Aminosäuren Aminosäuren unterscheiden sich in ihren physikochemischen Eigenschaften. Q: müssen Bioinformatiker die Eigenschaften von Aminosäuren kennen? 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 14

Einleitung: Aminosäuren Aminosäuren sind die Bausteine von Proteinen: Aminogruppe R Carboxylsäure Aminosäuren unterscheiden sich hinsichtlich ihrer - Größe - elektrischen Ladung - Polarität - Form und Steifigkeit 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 15

Einleitung: hydrophobe Aminosäuren Proteine sind aus 0 verschiedenen natürlichen Aminosäuren aufgebaut 5 sind hydrophob. Sie sind vor allem Im Proteininneren. Glycine C 3 Alanine C C 3 C Valine 3 C C 3 C Leucine 3 C C C C 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 16 3 3 Isoleucine

Einleitung: aromatische Aminosäuren Es gibt drei voluminöse aromatische Aminosäuren. Tyrosin und Tryptophan liegen bei Membranproteinen vor allem in der Interface-region. C C C C Phenylalanin Tyrosin Tryptophan 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 17

Einleitung: Aminosäuren Es gibt Schwefel enthaltende Aminosäuren und das ungewöhnliche Prolin. Cysteine können Disulfidbrücken bilden. Prolin ist ein elixbrecher. C S Cystein C S C C3 Methionin C C C Prolin 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 18

Einleitung: Aminosäuren Es gibt zwei Aminosäuren mit terminalen polaren ydroxlgruppen: C C C C C 3 Serin Threonin 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 19

Einleitung: Aminosäuren Es gibt 3 positiv geladene Aminosäuren. Sie liegen vor allem auf der Proteinoberflächen und in aktiven Zentren. Thermophile rganismen besitzen besonders viele Ionenpaare auf den Proteinoberflächen. C C C C + 3 Lysin C C C Arginin + + C istidin 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 0

Einleitung: Aminosäuren Es gibt negativ geladene Aminosäuren und ihre zwei neutralen Analoga. Asp und Glu haben pk a Werte von.8. Das heisst, erst unterhalb von p=.8 werden ihre Carboxylgruppe protoniert. C - C C Asparaginsäure Glutaminsäure - C C C Asparagin Glutamin 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 1

Buchstaben-Code der Aminosäuren Ein- und Drei-Buchstaben-Codes der Aminosäuren G Glycin Gly P Prolin Pro A Alanin Ala V Valin Val L Leucin Leu I Isoleucin Ile M Methionin Met C Cystein Cys F Phenylalanin Phe Y Tyrosin Tyr W Tryptophan Trp istidin is K Lysin Lys R Arginin Arg Q Glutamin Gln Asparagin Asn E Glutaminsäure Glu D Asparaginsäure Asp S Serin Ser T Threonin Thr Zusätzliche Codes B Asn/Asp Z Gln/Glu X Irgendeine Aminosäure Die Kenntnis dieser Abkürzungen ist essentiell für Sequenzalignments und für Proteinstrukturanalyse! 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik

Datenbanktypen primär sekundär DA-/ ukleotid- Sequenzen Protein-/ Aminosäure- Sequenzen Protein-, DA- Strukturen Protein-/ Aminosäure- Sequenzen Protein- Strukturen GenBank CBI Protein Database Swiss Prot (Uniprot) PDB PRSITE Prints Pfam SCP CAT - Sequenzinformationen - zugehörige Annotationen - Kreuzreferenzen zu anderen Datenbanken - Analysen auf Basis der primären Datenbanken - Klassifizierungen nach Ähnlichkeit 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 3

Sequenzdaten ~174 Mio. ukleotidsequenzen (Quelle: GenBank http://www.ncbi.nlm.nih.gov/ GenBank/index.html) ~189 Mio. WGS-ukleotidsequenzen 10.70 3D-Strukturen von biologischen Makromolekülen (Proteine, DA, RA, ) (Quelle: RCSB-PDB http://www.rcsb.org, 5.08.014) Einträge sind teilweise redundant, d.h. es gibt mehrere Versionen derselben Sequenz/Struktur 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 4

CBI DA-Datenbank GenBank (http://www.ncbi.nlm.nih.gov/genbank/) öffentliche ukleotid-sequenzdatenbank ~174 Mio. Sequenzeinträge fast jeder kann Sequenzen einreichen Mindestlänge der eingereichten Sequenzen: 50 bp jeder Eintrag bekommt eine eindeutige Accession umber wird alle 4h gegen EMBL-Bank (EMBL ucleotid Sequence Database, http://www.ebi.ac.uk/) und DDBJ (DA DataBank of Japan, http://www.ddbj.nig.ac.jp) synchronisiert redundant 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 5

CBI Protein-Datenbank CBI Protein Database (http://www.ncbi.nlm.nih.gov/) öffentliche, primäre Protein-Sequenzdatenbank Zusammenstellung aus den folgenden Protein-Sequenzdatenbanken: UniProtKB PIR (Protein Identification Resources) PDB (Protein Data Bank, Strukturen) Proteintranslationen der GenBank-Datenbank und weiteren redundant Vorteil: Links zu riginal-datenbanken 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 6

(http://www.expasy.org/sprot/) Universal Protein Resource Knowledge Base öffentliche, primäre Proteinsequenz-Datenbank nur 546.000 Einträge (Juli 014) wichtigste Sammlung von Proteinsequenzen: Daten stammen aus der Datenbank TrEMBL (translated EMBL) manuell überpüft; manuelle Annotationen von Experten nicht redundant UniProtKB/Swiss-Prot Querverweise zu Funktionsbeschreibung, Domänenstruktur, posttranslationalen Modifikationen und ~60 anderen Datenbanken UniProtKB/TrEMBL enthält Einträge, die noch nicht in UniProtKB/Swiss-Prot aufgenommen wurden 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 7

Webinterface: Entrez Datenbank wählen Stichwort, hier ame des Proteins 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 8

Detaillierte Suche bei Entrez Suche nach dem Protein Melibiase in genau diesem rganismus weitere nützliche Beschränkungen: [ACC]: Accession umber [KYWD]: Stichwort zur Funktion etc. X:Y [SLE]: Sequenzlänge zwischen X und Y [TITL]: Wort muß im Titel des Eintrags stehen [AUT]: ame des Autors bei Suche nach einer Publikation in PubMed (elektronische Zeitschriftenbibliothek) logische Verknüpfungen mit T, R AD als automatische Voreinstellung 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 9

Eintrag bei CBI Protein Database 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 30

Fasta-Format Umstellung der Anzeige, Beschränkung auf bestimmten Abschnitt der Sequenz,... >DA-Sequenz-Bezeichnung ACGT... >Protein-Sequenz-Bezeichnung ACDEFGIKLMPQRSTVWY... 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 31

PRITS (http://bioinf.man.ac.uk/dbbrowser/prits/) sekundäre Protein-Datenbank.156 Einträge und 1.444 Motive (in 01) Fingerabdruck (fingerprint): Gruppe von konservierten Motiven mehrere funktionelle Bereiche (Faltung, Ligandenbindung, Komplexbildung, ) -> mehrere Sequenzmotive für ein Protein Motive aus kurzen lokalen Alignments Abstände zwischen Motiven und Reihenfolge spielen keine Rolle spezifisch für individuelle Proteine keine Zusammenfassung zu gemeinsamem Motiv 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 3

Finger-PRITS 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 33

PRITS - Example Illustration of a hierarchical PRITS diagnosis. The UniProtKB/TrEMBL entry Q9SV5_UMA was annotated as putative uncharacterized protein DKFZp434D030; the family- and domaindatabase crossreferences suggested membership of the major intrinsic protein (MIP) superfamily, but provided no specific family affiliation. The FingerPRITScan result (inset) diagnoses the sequence both as a member of the MIP superfamily and as an aquaporin 6 subtype. Attwood et al. Database (01) 01 : bas019 doi: 10.1093/database/bas019 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 34

Pfam Protein-Familien-Datenbank (http://pfam.sanger.ac.uk/) sekundäre Protein-Datenbank 74% aller Proteinsequenzen haben mindestens einen Pfam-Eintrag Profile = funktionell interessante Domänen Profil: Auftrittswahrscheinlichkeiten bestimmter Aminosäuren an bestimmten Positionen in Form einer Matrix Pfam-A: genau untersuchte Profile aus multiplen Alignments, teilweise manuelle Alignments, >8000 Familien Pfam-B: automatisch generierte Profile: mehr Sequenzen, aber weniger präzise 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 35

GE Gene Expression mnibus (http://www.ncbi.nlm.nih.gov/geo/) Genexpressions-Datensätze entweder mit Microarrays oder GS gemessen 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 36

GE Gene Expression mnibus Ist die im Arbeitskreis Kiemer in Mäusen mit Leberkrebs (CC) beobachtete Runterregulation von Elovl6 auch im Mensch relevant? Ja, dies konnten wir anhand von öffentlich zugänglichen GE-Daten zeigen. 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 37

TCGA The Cancer Genome Atlas 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 38

TCGA The Cancer Genome Atlas ben bekannte Brustkrebsgene sind wenig methyliert. Daten müssen bereinigt/gefiltert werden: ben hohe Korrelation durch einen (zufälligen oder fehlerhaften) Ausreißer. Unten statistisch signifikant angereicherte biochemische Pfade, die ko-methylierte Gene enthalten Unten hohe Korrelation, aber insgesamt geringe Variabilität der Werte 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 39

Übungen heute achmittag Ausblick Bioinformatik-Software muss man hands-on kennenlernen. Im Tutorial zeigen wir Ihnen den Umgang mit weit verbreiteter Bioinformatik- Software. Das Tutorial ist genauso wichtig wie die Vorlesung! In wenigen Wochen sollen Sie mit diesen Tools in einer kleinen Gruppe ein Mini-Forschungsprojekt bearbeiten. Also passen Sie bitte gut auf... Gute Statistik-Kenntnisse sind essentiell für das Design von Experimenten, für das Aufstellen von Arbeitshypothesen und für die Arbeit mit Datenmengen. Wichtig ist zudem das Verständnis, wie die Daten gewonnen wurden und welche Fehlerquellen auftreten können. 1. Vorlesung WS 014/15 Software-Werkzeuge der Bioinformatik 40