Kapitel 1: Einführung, Normalisierung, Differentielle Gene, Multiples Testen. Kapitel 2: Clustering und Klassifikation



Ähnliche Dokumente
Was sind MICROARRAYS? Microarrays sind Technologieplattformen zur Messung der Aktivität einer großen Anzahl von Genen.

Statistische Analyse von hochdimensionalen Daten in der Bioinformatik

Bioinformatik Statistik und Analyse mit R

Statistische Analyse von hochdimensionalen Daten in der Bioinformatik

Einführung in die Bioinformatik

Transcriptomics: Analysis of Microarrays

Testing in Microarray Experiments, StatisticalScience(18), Seiten

Einführung in die Angewandte Bioinformatik: Analyse und Design von DNA Microarrays

Molekularbiologische Datenbanken

AlgoBio WS 16/17 Differenzielle Genexpression. Annalisa Marsico

Medizinische Fakultät Auswertestrategien von Microarrays Einführung

Eine Einführung in R: Hochdimensionale Daten: n << p

Grundlagen der Bioinformatik Übung 5: Microarray Analysis. Yvonne Lichtblau

AlgoBio WS 16/17 Genexpressionanalyse. Annalisa Marsico

Inhalt Genexpression Microarrays E-Northern

Einführung in die Bioinformatik

Grundlagen der Bioinformatik Übung 6: Microarray Analysis. Yvonne Lichtblau

Die Varianzanalyse ohne Messwiederholung. Jonathan Harrington. Bi8e noch einmal datasets.zip laden

Einführung in die Angewandte Bioinformatik: Analyse und Design von DNA Microarrays

Versuchsplanung SoSe 2015 R - Lösung zu Übung 1 am Autor: Ludwig Bothmann

Vorlesung: Biostatistische Methoden

BioChip-Microarrays: Grundlagenforschung und Chancen für die Krankheitsdiagnostik

Datenauswertung von Microarrays Genexpressionsanalyse

Trennungsverfahren Techniken (in der Biologie)

Wichtige Themen aus der Vorlesung Bioinformatik II SS 2014

Lösung zu Kapitel 11: Beispiel 1

Leistungskatalog. Core Facilities. Juli Seite 1 von 6

BioChip-Microarrays: Grundlagenforschung und Chancen für die Krankheitsdiagnostik

(Repeated-measures ANOVA) path = "Verzeichnis wo Sie anova1 gespeichert haben" attach(paste(path, "anova1", sep="/"))

Methoden & Tools für die Expressionsdatenanalyse. Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse U. Scholz & M.

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Abkürzungsverzeichnis. 1. Einleitung Material und Methoden 8

Genexpressionsregulation

Statistische Verfahren für Hochdurchsatztechniken am Beispiel von Microarrays

Motivation. Wilcoxon-Rangsummentest oder Mann-Whitney U-Test. Wilcoxon Rangsummen-Test Voraussetzungen. Bemerkungen

Eine wunderbare Reise durch die Laborwelten.

Hypothesentests mit R Ashkan Taassob Andreas Reisch

Einführung in die Bioinformatik

Statistische Auswertung der Daten von Blatt 13

Umgang mit und Ersetzen von fehlenden Werten bei multivariaten Analysen

FRAGESTUNDE WS 2016/17 QM 2. Dr. Christian Schwarz 1

Neue DNA Sequenzierungstechnologien im Überblick

Eine Einführung in R: Statistische Tests

Die Paten)erbarkeit von Gensequenzen - von Biomarkern. Prof. Dr. iur. Dr. rer. pol. Jürgen Ensthaler, TU Berlin

Protokoll Praktikum für Humanbiologie Studenten

Syntax. Ausgabe *Ü12. *1. corr it25 with alter li_re kontakt.

Affymetrix Evaluierung

R-WORKSHOP II. Inferenzstatistik. Johannes Pfeffer

Auswertung mit dem Statistikprogramm SPSS:

Clustering. Clustering:

Center for Biotechnology, Bielefeld

Biologie I/B: Klassische und molekulare Genetik, molekulare Grundlagen der Entwicklung Theoretische Übungen SS 2014

Sequenziertechnologien

Biometrische und Ökonometrische Methoden II Lösungen 2

Statistics, Data Analysis, and Simulation SS 2015

Dr. A. Yassouridis Max-Planck-Institut für Psychiatrie AG: Statistik

1 Einleitung Glucoserepression Zielsetzung Material und Methoden... 25

Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2008/2009. Aufgabe 1

Statistische Inferenz

ANalysis Of VAriance (ANOVA) 1/2

Varianzanalyse mit Messwiederholungen (Repeated- measures (ANOVA) BiFe noch einmal datasets.zip laden

Workflow- basiertes Data Mining in der Bioinformatik

Varianzanalyse * (1) Varianzanalyse (2)

Etablierung einer. Homemade - PCR

Medizinische Informatik Homepage:

Modellierung biologischer. Christian Maidorfer Thomas Zwifl (Seminar aus Informatik)

Teil XI. Hypothesentests für zwei Stichproben. Woche 9: Hypothesentests für zwei Stichproben. Lernziele. Beispiel: Monoaminooxidase und Schizophrenie

Proportions Tests. Proportions Test können in zwei Fällen benutzt werden. Vergleich von beobachteten vs. erwarteten Proportionen

Molekularbiologische Datenbanken

Milenia Hybridetect. Detection of DNA and Protein

Statistik II Wahrscheinlichkeitsrechnung und induktive Statistik Erste Klausur zum Sommersemester Juli 2005

PD Dr. med. Christian Meisel Site Leader Oncology & Head Translational Medicine Roche Pharma Research and Early Development, Penzberg

1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest.

Inhaltsverzeichnis. 1 Einleitung... 1

Molekulare Systeme 2 Zellulärer Metabolismus

9. Schätzen und Testen bei unbekannter Varianz

Untersuchung der differentiellen Genexpression mit DNA-Microarrays bei Akuter Lymphoblastischer Leukämie im Vergleich mit normalen B-Lymphozyten

X =, y In welcher Annahme unterscheidet sich die einfache KQ Methode von der ML Methode?

Rekonstruktion biologischer Netzwerke (mit probabilistischen Methoden) Einführung

Inhalt. 3 Das Werkzeug Restriktionsenzyme Gele Agarosegele... 58

Einführung in die Genexpressionsplattform des IVM

Entwicklung und Validierung von multiplex real-time RT-PCR assays in der Virusdiagnostik

Vorlesung Einführung in die Bioinformatik

Multiple Regression Mais-NP Zweidimensionale lineare Regression Data Display Dreidimensionale lineare Regression Multiple Regression

Statistische Auswertung:

# Befehl für den Lilliefors-Test

Abkürzungsverzeichnis Inhaltsverzeichnis Abbildungsverzeichnis Einleitung Proteomik Proteom...

Verbesserte Basenpaarung bei DNA-Analysen

Lineare Modelle in R: Einweg-Varianzanalyse

Probeklausur EW II. Für jede der folgenden Antworten können je 2 Punkte erzielt werden!

Messunsicherheiten in der vektoriellen Netzwerkanalyse

Expressionsdatenanalyse. Vorlesung Einführung in die Bioinformatik - Expressionsdatenanalyse

DNA-Chip. Seminar Bioanalytik WS 2011/12 Lisa Kaiser

Formelsammlung für das Modul. Statistik 2. Bachelor. Sven Garbade

Einfluss von Hypoxie auf die Interaktion von Leukämieblasten mit Knochenmark-Stromazellen

Grundlagen der Klonierung. Analytische Methoden der Biologie SS09 7 Klonierung und Gentechnik. Modul

Eine computergestützte Einführung mit

Transgene Organismen

Überblick über die Tests

Fragestellungen. Ist das Gewicht von Männern und Frauen signifikant unterschiedlich? (2-sample test)

Transkript:

Vorlesung MicroarrayDatenanalyse Kapitel1:Einführung,Normalisierung, DifferentielleGene,MultiplesTesten Kapitel2:ClusteringundKlassifikation

WassindDNA Microarrays? mrna Protein DNA

WassindDNA Microarrays? MicroarrayssindTechnologieplattformenzur MessungderAktivitäteinergroßenAnzahlvon Genen. DabeiwerdenihreProdukte(meistmRNA) quantifiziert. HierzuwerdenDNASequenzenverwendet,dieauf eineroberfläche(jenachplattformverschiedene) immobilisiertwerden. Vorlesung:MicroarrayDatenanalyse Kapitel1

WassindDNA Microarrays?...Microarrays...MessungderAktivitätvonGenen (...mrna). WelcheanderenMethodenkennenSie,die dieseszielverfolgen? Vorlesung:MicroarrayDatenanalyse Kapitel1

NorthernBlot RNA RNA RNA RNA Vorlesung:MicroarrayDatenanalyse Kapitel1

RT PCR 5 3 5 3 RNA cdna 5 RNA 3 cdna dsdna Vorlesung:MicroarrayDatenanalyse DaRNAdurchPCRnicht direktamplifiziertwerden kann,mußsiezunächstin cdnaumgeschrieben werden(revers transkribiert,rt) ZurQuantifizierungsind zweiansätzemöglich: 1Internerendogener Standard(zB Housekeepinggene) 2KompetitiveRTPCR: ZugabevonsogMimic Fragmenten,dieder Reaktionzugegeben werdenundzusammen mitdereigentlichen Zielsequenzamplifiziert werden Kapitel1

SAGE=SerialAnalysisofGeneExpression Zellenisolieren mrnaisolierenundcdnasynthetisieren TranskriptmitAnchorEnzymschneiden Taggen LigierenderTags Sequenzierung Quantifizierung Vorlesung:MicroarrayDatenanalyse Kapitel1

WOZU? klassischesbeispiel: krankgesund Tumor(Niere) NormaleNiere RNA Präparation MESSUNG?! wasunterscheidet Tumor von Normal? Vorlesung:MicroarrayDatenanalyse Kapitel1

WOMIT? Plattformen Filter Vorlesung:MicroarrayDatenanalyse Glas chips Affymetrix Kapitel1

Plattformen Filter 1991 Lennon&Lehrach,1991 Vorlesung:MicroarrayDatenanalyse Glas chips 1995 StanfordUniversity, Schenaetal,1995 Affymetrix 1996 Lockhardtetal,1996 Kapitel2

Plattformen NylonFilter eineprobe radioaktivessignal vielespotsmöglich großefläche/lokaleeffekte Überstrahlen nureineprobeprohybri disierungsvorgang Vorlesung:MicroarrayDatenanalyse GlasTräger roteundgrüneprobe FloureszenzSignal bis~20000spotsmöglich gleichzeitigeshybridisieren vonprobeundkontrolle (rot/grün) Chip eineprobebestehendaus 16 20Wdh.undzugehörigen Mismatches kommerziellerchip gutereproduzierbaredaten nureineprobeprohybri disierungsvorgang Kapitel1

Grundprinzip u q Se 1 z en e u q e S 2 z n q e S n z n e u RNA cdnas oder Oligos Vorlesung:MicroarrayDatenanalyse Probe1 Probe2 Kapitel1

Grundprinzip Filter Vorlesung:MicroarrayDatenanalyse Glas chips Affymetrix Kapitel2 Kapitel1

Grundannahme DasgemesseneSignalspiegelt(nachgeeigneter Aufreinigung )grundsätzlichdiemengernainder Probewider Vorlesung:MicroarrayDatenanalyse Kapitel2 Kapitel1

VerarbeitungvonMicroarrayDaten: Biologie Diagnostik Therapie...? Experiment Design Experiment (Microarray)! Bildverarbeitung Rohe Intensitätswerte Biologische Verifikation Normalisierung ExpressionsLevel Analyse:Clustering;ClassDiscovery;Klassifikation;DifferentielleGene;... Vorlesung:MicroarrayDatenanalyse Kapitel1

WelcheNormalisierungsMethodengibtes? BenutzerdefinierteSets GesamterDatensatz Housekeeping(?!) InterneKontrollenetc Nützlichbei MostGenesUnchanged Settings Nützlichbei MostGenesChanged Settings Skalierungs methoden Mean Median Shorth Zscore Vorlesung:MicroarrayDatenanalyse Regressions methoden Transformations methoden gesamt linear/polynomial local linear/polynomial qspline Varianz Stabilisierung AnalysisofVariance/ MLbasedmethods Verteilungs basiert ANOVA Quantil Normalisierung Kapitel1

Beobachtung VarianzdergemessenenIntensitäthängtvonder absolutenintensitätab FuerjedenSpotk, wurdedievarianz(rk Gk)²/2gegendasMittel (Rk+Gk)/2geplottet. DieroteLiniezeigtden movingaverage Vorlesung:MicroarrayDatenanalyse Kapitel1

FehlerModellNotation i=1,...,dproben i k k=1, ngene............... Vorlesung:MicroarrayDatenanalyse......... Kapitel1

FehlerModell Vorlesung:MicroarrayDatenanalyse Kapitel1

i

i Yik = (ai + ε ik ) + (bi bk exp(ηik )) xik Yik ai ε ik + bi bk exp(ηik ) xik = bi bi Yik ai = (ε ik / bi ) + (bk xik ) exp(ηik ) bi ν ik mik

Beispiel:Fehler Modell RockeandDurbin(J.Comput.Biol.2001): η Yk = α + β k e + ν Yk:GemesseneIntensitätdesGensk k:wahresexpressionslevelvongenk :offset η,ν:multiplikativer/additiverfehler, Unabhängig,normalverteilt BeigrossenExpressionswertenbkistdermultiplikative Fehlerbesondersdominant. Fuerkleineb kistderadditivefehlerdominant.

ηki : N (0, σ ) 2 η Yik ai = ν ki + mki exp(ηik ) bi ν ki : N (0, σ 2ν ) E (Yik ) = ai + bi mik E (exp(ηki )) Var (Yik ) = Var (ν ki bi ) + Var (bi mki exp(ηki )) = c' b m +b σ 2 η 2 i 2 ki 2 i c ' = Var (exp(ηki )) 2 η 2 ν = c ( E (Yki ) ai ) + b σ 2 η 2 cη2 = c 'η2 / E 2 (exp(ηik )) 2 i 2 ν

Darausergibtsich var( E (Yik )) = c ( E (Yik ) a ) + b 2 2 NuntransformieredieDaten,sodassman konstantevarianzerhält,dienichtvommittelwert abhängt 2

Varianz StabilisierendeTransformation SeiYudieFamilievonzufälligenVariablenmit: EYu=u,VarYu=v(u).DefinieredieTransformation x h (x ) = 1 v(u ) du Varh(Yu) unabhängigvonu

Varianz StabilisierendeTransformation ar sinh( x) = log( x + x 2 + 1)

Die verallgemeinertelog Transformation f(x)=log(x) hs(x)=arsinh(x/s) 200 0 200 400 600 800 1000 intensity ( arsinh(x ) = log x + x2 + 1 ) W.Huberetal., ISMB2002 D.Rocke&B. Durbin,ISMB2002

Variancestabilizingtransform ations x f (x ) = 1 v(u ) v (u ) u 2 f log u 1.)constantCV( m ultiplicative ) 2.)offset du v (u ) (u + u0 )2 3.)additiveandm ultiplicative f log(u + u0 ) u + u0 v (u ) (u + u0 ) + s f arsinh s 2 2

RobusteParam eterschätzung Yki ai arsinh = µ k + ε ki, bi ε ki : N (0,c 2 ) Robustem axim um likelihoodschätzung M= { { a }, { b }, c, { µ } } i i k

VerarbeitungvonMicroarrayDaten: Biologie Diagnostik Therapie...? Experiment Design Experiment (Microarray)! Bildverarbeitung Rohe Intensitätswerte Biologische Verifikation Normalisierung ExpressionsLevel Analyse:Clustering;ClassDiscovery;Klassifikation;DifferentielleGene;... Vorlesung:MicroarrayDatenanalyse Kapitel1

DifferentielleGenefinden Patients,Samples,Timepoints... Genes Twocell/tissue/diseasetypes: wild type/mutant control/treated diseasea/diseaseb responding/nonresponding etc.etc... Foreverysample(cellline/patient)wehavethe expressionlevelsofthousandsofgenesand theinformationwhetheritisaorb

Logratio Isathree foldinducedgenemoretrust worthythanatwo foldinducedgene? Productintensity(logscale)

A B Conclusion:Inadditiontothe differencesingeneexpressionyou alsohaveavitalinterestinits variability...thisinformationis neededtoobtainmeaningfullists ofgenes A B

StandardDeviationandStandard Error StandardDeviation(SD):Variabilityofthe measurement StandardError(SE):Variabilityofthemeanof severalmeasurements nreplications NormalDistributedData:

Questions: Whichgenesaredifferentiallyexpressed? >Ranking Aretheseresults significant? >StatisticalAnalysis Thatmeans:Istheprobabilitysufficiently smallthattheresultis bychance?

Ranking: Problem:Produceanorderedlistof differentiallyexpressedgenesstarting withthemostupregulatedgeneand endingwiththemostdownregulated gene Rankingmeansfindingtherightgenes drawingourattentiontothem Inmanyapplicationsitisthemost importantstep

RankingisnotTesting Ranking:Findingtherightgenes Testing:Decidingwhethergenesare significant Thereismorethenonewaytorank Thereismorethenonewaytotest Thecriteriaforwhichrankingisbestis differentfromthecriteriawhichtestis best powerisoftennoargument

Ranking:OrderGenesduetoamountoffold change/score >maybesomethatarenotdifferential inreality(falsepositive) Genecandidate1 Genecandidate2 Genecandidate3 Genecandidate4 Genecandidate5 Genecandidate6 Genecandidate7 Genecandidate8 Genecandidate9 Gene... Orderduetosomescore, Intuitively:Foldchange 1st:mostdifferential, 2nd:secondmostdiff...

Testing:FindGenesduetoamountoffold change/scorewhicharesignificants.t.thereareless than5%falsepositives >maybeyoumisssome (FalseNegatives) Genecandidate1 Genecandidate2 Genecandidate3 Genecandidate4 Genecandidate5 Genecandidate6 Genecandidate7 Genecandidate8 Genecandidate9 Gene... Orderduetosomescore, Intuitively:Foldchange 1st:mostdifferential, 2nd:secondmostdiff...

Whichgeneismoredifferentially expressed?

RankingisScoring Youneedtoscoredifferential geneexpression Differentscoresleadtodifferent rankings Whatscoresarethere?

T Score Idea:Takevariancesintoaccount Change:lowChange:highChange:high Variance:highVariance:lowVariance:high

Change: HIGH Variance: SMALL Change: SMALL Variance: HIGH Thuge T~0

Change: HIGH Variance: HIGH Change: SMALL Variance: SMALL T? T?

TScore Ttest Pvalue BerechneTScoresfürein zufälligesexperiment ErstelleeinHistogrammderTscores undmarkieredie5%höchstenund niedrigsten(rot) BerechneTScorefürGenxund zeichnediesenein(grün) WiegroßistdieWahrscheinlichkeit,mindestenssoextremwiedergrüne Pfeilzusein?

T TestPROBLEMS Therearemanygenes( >tests)butonly fewrepetitions isusing s asestimategood? ifmeasuredvarianceissmallt becomeseasilyverylarge Therefore:formicroarrayitisreasonable touseamodfiedversionofthettest

FudgeFactors: Youneedtoestimatethevariancefromdata Youmightunderestimateaalreadysmallvariance (constantlyexpressedgenes) ThedenominatorinTbecomesreallysmall Constantlyexpressedgenesshowupontopofthelist Correction:Addaconstantfudgefactors0 RegularizedT score >Limma >SAM >Twilight

SAM:SignificanceAnalysisforMicroarrays X1 X 2 d (i ) = s (i ) + s0 s (i ) = a( ( xm (i ) X 1 ) + ( xn (i ) X 2 ) 2 m n 1/ n1 + 1/ n2 a= n1 + n2 2 2

MoreScores: WilcoxonScore(robust) PAUcScore(separation) pairedt Score(pairedData) F Score(morethen2conditions) Correlationtoareferencegene etcetc

Differentscoresgivedifferent rankings Krankheit1vsKrankheit2 (Golubetal.)

WhichScoreisthebest one? Thatdependsonyour problem...

NextQuestion: Ok,Ichoseascoreandfoundasetof candidategenes CanItrusttheobservedexpression differences? StatisticalAnalysis

P Values Everyoneknowsthatthep valuemust bebelow0.05 0.05isaholynumberbothinmedicine andbiology...whatelseshouldyouknowaboutp values

Rumors Ifthegeneisnotdifferentially expressedthep valueishigh Ifthegeneisdifferentiallyexpressed thep valuesislow Boththesestatementsarewrong!

Reminder:TypeIandTypeIIERROR H1 Alternative Hypothesis: NOTH0 H0 NullHypothesis: GeneNOT differential Positive: Negative: rejectedh0(differentialgene) acceptedh0

Reminder:TypeIandTypeIIERROR H0H1

ThebasicIdeabehindp values: WeobserveascoreS=1.27 Canthisbejustarandomfluctuation? Assume:Itisarandomfluctuation =Thegeneisnotdifferentially expressed =Thenullhypothesisholds Theorygivesusthedistributionofthe scoreunderthisassumption P Value:Probabilitythatarandom scoreisequalorhighertos=1.27 inabsolutevalue(twosidedtest)

Permutationsandempiricalp values

Ifageneisnotdifferentiallyexpressed: Thep valueisarandomnumberbetween0and 1! Itisunlikelythatsuchanumberis below0.05(5%probability)

Ifageneisdifferentiallyexpressed: Thep valuehasnomeaning,sinceitwas computedundertheassumptionthatthegeneis notdifferentiallyexpressed. Wehopethatitissmallsincethescore ishigh,butthereisabsolutelyno theoreticalsupportforthis

Testingonlyonegene: Ifthegeneisnotdifferentially expressedasmallp valueisunlikely, henceweshouldbesurprisedbythis observation. Ifwemakeitarulethatwediscardthegeneif thep valuesisabove0.05,itisunlikelythata randomscorewillpassthisfilter

Multipletestingwithonlynon inducedgenes 1gene 10genes 30,000genes

TheMultipleTestingProblem P valuesarerandomnumbersbetween0and1.foronlyone suchnumberitisunlikelytofallinthissmallinterval,butifwe have30.000suchnumbersmanywillbeinthere.

Wetestmhypotheses truehypotheses rejectedhypotheses H0H1 TRUE FALSE Acctepted Rejected Error=falsepositive Error=falsenegative Error=falsepositive Error=falsenegative

FWER=Family wiseerrorrate: ProbabilityofatleastoneType1 error(falsepositive)among theaccepted(significant)genes H0H1 FALSE TRUE Accepted Rejected

FDR=FalseDiscoveryRate ExpectednumberofType1 errors(falsepositives)amongrejected hypotheses H0H1 FALSE TRUE Accepted Rejected with if if

Controllingthefamilywiseerrorrate (FWER) Ifwewanttoavoidrandomnumbersinthisinterval weneedtomakeitsmaller.themorenumbers,the smaller.for30.000numbersverysmall. Thisstrategyiscalled:Controllingthefamilywise errorrate

HowtocontroltheFWER? Note,thatadjustingtheintervalbordercanalsobe donebyadjustingthep valuesandleavingthecutoff at0.05. Therearemanywaystoadjustp valuesformultiple testing: Bonferroni: Better:WestfallandYoung

Inmicroarraystudiescontrollingthe FWERisnotagoodidea...Itistoo conservative. Adifferenttypeoferrormeasure becamemorepopular TheFalseDiscoveryRate Whatistheidea?

TheFDR Scoregenesandrankthem Chooseacutoff Looselyspeaking:TheFDRisthe bestguessforthenumberof falsepositivegenesthatscore abovethecutoff

Theconfusingliterature: Therearemanydifferentdefinitionsofthefalse discoveryrateintheliterature: Original:Benjamini Hochberg PositiveFDR ConditionalFDR LocalFDR Thereisalsoafundamentaldifferencebetween controllingandestimatingafdr

Inmicroarrayanalysisitbecame populartouseestimatedfdrs Differencestop values: TheFDRreferstoalistofgenes.Thep value referstoasinglegene. Thep valueisbasedontheassumptionthatthe geneisnotdifferentiallyexpressed,thefdr makesnosuchassumption. P valuesneedtobecorrectedformultiplicity, FDRsnot!

Anotherdifferenceinconcept: Ifa4xchangehasasmallp value,thismeansthat4xchange istoohightoberandomfluctuation Conclusion:4xchangeissignificant Ifalistof150geneswith4xchangeormorehasasmall estimatedfdrthismeansthatwehavemoregenesonthis levelthanwouldbeexpectedbychance. Conclusion:4xchangecanbenoise,but150genesonthat levelaretoomanytobeexplainedjustbyrandomfluctuation. InFWERAnalysisthefoldchange4xissignificant,inFDR Analysisitisthenumber150thatissignificant.

Histogramsofthep valuesofall genesonthearray

FWER:Verticalcutoff FDR:Horizontalcutoff