Aspekte der Gültigkeit G Ergebnisse eines Experiments
|
|
- Johanna Winkler
- vor 6 Jahren
- Abrufe
Transkript
1 Aspekte der Gültigkeit G der Ergebnisse eines Experiments und deren Bedrohungen von Philipp Kleybolte und Deniz Bakirtan
2 Gliederung Einordnung der Validierungen Die 4 Arten von Gültigkeiten Schlussfolgerungs-Gültigkeit (Conclusion Validity) Interne Gültigkeit (Internal Validity) Konstruktions-Gültigkeit (Construct Validity) Externe Gültigkeit (External Validity) Bedrohungen zu den Gültigkeitsarten Mögliche Priorisierungen Zusammenfassung Threats to Validity
3 Einordnung der Validierungen Abbildung entnommen aus [C. Wohlin, P. Runeson, M. Höst, M. C. Ohlsson, B. Regnell, A. Wesslén (2000). Experimentation in software engineering: an introduction. Kluwer Academic Publishers] 1) Schlussfolgerungs-Gültigkeit 2) Interne Gültigkeit 3) Konstruktions-Gültigkeit 4) Externe Gültigkeit Threats to Validity
4 Schlussfolgerungs-Gültigkeit ltigkeit Es muss sichergestellt sein, dass die Schlussfolgerung gilt und nicht nur auf Zufallsergebnissen beruht Statistisch relevanter Ausschlag der Messgrößen Bestätigung der Ergebnisse durch andere Experimente Threats to Validity
5 Interne GültigkeitG Das Ergebnis ist durch eine kausale Beziehung mit den Faktoren entstanden Das Ergebnis ist nicht zurückzuführen auf Eingangsgrößen, die nicht gemessen oder nicht kontrollierbar sind Threats to Validity
6 Konstruktions-Gültigkeit Ausprägungen der Faktoren müssen geeignet gewählt werden, um die Theorie eindeutig zu bestätigen oder zu widerlegen Genaue Definition der Fragestellung nötig Threats to Validity
7 Externe GültigkeitG Das Ergebnis kann verallgemeinert bzw. auf andere Szenarien übertragen werden Kann das Ergebnis eines studentischen Projekts auf die Wirtschaft übertragen werden? Kann das Ergebnis aus Firma A auf Firma B übertragen werden? Threats to Validity
8 Bedrohungen für f r die Schlussfolgerungs-Gültigkeit ltigkeit Niedrige Statistische Aussagekraft Das Ergebnis eines Experiments kann Zufall sein. Bestätigung durch weitere Experimente mit gleichen Faktoren Geringer Ausschlag der Messwerte. Verbesserung nur um 2% hat wenig Aussagekraft Falsche Grundannahmen Suche nach Bestätigung Unterbewusst wird nur nach Bestätigungen der Theorie gesucht, und Widersprüche übersehen Bsp. Durch eine neue Methode werden viel mehr Fehler gefunden, es wird aber übersehen, dass viele Fehler erst durch die neue Methode entstehen Threats to Validity
9 Bedrohungen für f r die Schlussfolgerungs-Gültigkeit ltigkeit Fehlende Verlässlichkeit der Messwerte Eindeutigkeit. Wird ein Zustand zweimal gemessen, so muss das Ergebnis gleich sein Objektivität: Lines of Code statt subjektiver Beurteilung der Mächtigkeit einer Funktion Fehlende Korrektheit der Ausprägungen Soll eine Ausprägung gemessen werde, so muss überprüft werden, dass sie korrekt ausgeführt wird. Personal muss geschult werden um eine Praktik korrekt anzuwenden, bevor man die Auswirkungen davon messen kann Bsp. Die Auswirkungen von Test-First sollen getestet werden, doch es wird nicht angewendet, weil es nicht kontrolliert wird Threats to Validity
10 Bedrohungen für f r die Schlussfolgerungs-Gültigkeit ltigkeit Abhängigkeit von äußeren Einflüssen Bsp. Instabile Versionsverwaltung verzögert das Projekt Unterbrechungen des Experiments Heterogenität der Subjekte (Personal) Ist das Personal in den Gruppen zu unterschiedlich, lassen die Ergebnisse des Experiments keine Schlussfolgerungen zu Bsp. Erfahrene Entwickler in der Kontroll-Gruppe und Anfänger in der Test-Gruppe für eine neue Methode Threats to Validity
11 Bedrohungen für f r die Interne GültigkeitG Drei Arten von Bedrohungen für die interne Gültigkeit Bedrohungen für einzelne Gruppen Treten für jede Gruppe einzeln auf Bedrohungen für mehrere Gruppe Entstehen nur, wenn mehrere Gruppen getestet werden Soziale Bedrohungen Entstehen durch soziale Reaktionen der getesteten Personen Zwischen mehreren Gruppen Threats to Validity
12 Bedrohungen für f r einzelne Gruppen Reife Das Personal wird durch Lernen besser Das Personal kann durch Müdigkeit oder Demotivation schlechter werden Bsp. Eine Gruppe testet ständig neue Entwicklungsmethoden, erzeugt aber kaum funktionsfähige Software sinkende Motivation und Produktivität Extremfall: Eine Softwarekomponente wird nacheinander auf zwei Arten entwickelt Das zweite Experiment wird schneller und besser verlaufen Threats to Validity
13 Bedrohungen für f r einzelne Gruppen Testen Werden Tests wiederholt ausgeführt, lernen die Teilnehmer den Test besser zu bestehen Bsp. Fragebogen: Wer das System hinter der Auswertung versteht, wird deutlich bessere Ergebnisse erzielen Ergebnisse dürfen daher auf keinen Fall an die Teilnehmer zurückgeführt werden, wenn der Test erneut mit ihnen durchgeführt werden soll Geschichte Werden Experimente zu unterschiedlichen Zeitpunkten durchgeführt, können unterschiedliche Umstände das Ergebnis verfälschen Bsp. Der Tag nach den Betriebsferien ist deutlich produktiver als der Tag nach der Weihnachtsfeier Threats to Validity
14 Bedrohungen für f r einzelne Gruppen Ungewissheit über Richtung der Abhängigkeiten A B oder B A oder sogar X A, B Aus der Komplexität des Codes folgt die Fehlerrate? Aus der Fehlerrate folgt die Komplexität des Codes? Aus Komplexität des mit Software zu lösenden Problems folgen sowohl die Komplexität des Codes als auch die Fehlerrate Threats to Validity
15 Bedrohungen für f r mehrere Gruppen Gruppen reagieren unterschiedliche auf äußere Einflüsse Bsp. Baulärm setzt die Produktivität einer Gruppe stark herab, während die andere sich nicht gestört fühlt Vergleich: Bedrohung Geschichte Gruppen lernen unterschiedlich schnell Vergleich: Bedrohung Reife Threats to Validity
16 Soziale Bedrohungen Beispiel: Eine neue Entwicklungsmethode soll getestet werden Rivalität Die Gruppen wollen besser sein als die jeweils andere Kontrollgruppe will zeigen, dass alte Methoden konkurrenzfähig sind Mehr Einsatz und verbessertes Ergebnis durch die zusätzliche Motivation Threats to Validity
17 Soziale Bedrohungen Demotivation Kontrollgruppe ist demoralisiert, weil sie die langweilige alte Methode verwenden, während die andere die spannende neue Methode lernt Testgruppe lehnt neu Methode ab Imitation Die Arbeitsweise der Kontrollgruppe wird durch die der Experimentiergruppe beeinflusst Neue Praktiken werden durch die Kontrollgruppe übernommen um das eigene Ergebnis zu verbessern Threats to Validity
18 Bedrohungen für f r die Konstruktions-Gültigkeit Die Konstruktions-Gültigkeit setzt sich mit der Validierung der Resultate des Experiments bzgl. des dahinter stehenden Konzepts (Theorie: cause/effect construct) auseinander Bedrohungen für die Konstruktions-Gültigkeit beziehen sich auf: 1. den Entwurf (Design) des Experimentes Abbildung der Theorie auf geeignete Ausprägungen der Faktoren (treatments) 2. Soziale Bedrohungen Verhalten von Subjekten Threats to Validity
19 Entwurfs-Bedrohungen in der Konstruktions-Gültigkeit Unangemessene Definition des Problems die Theorie ist nicht genau genug formuliert -> Ableiten von Metriken zum Messen und die Ausprägung der Faktoren werden unzureichend beeinflusst Bsp. Zwei Methoden zur Inspektion werden verglichen Man möchte herausfinden welche Methode besser ist! Es ist noch zu klären, was dies genau bedeutet: Fehler insgesamt? Fehler pro Stunde? Threats to Validity
20 Entwurfs-Bedrohungen in der Konstruktions-Gültigkeit Mono Operations-Beeinflussung Verwenden von nur einer einzigen unabhängigen Variable Folge: Repräsentation der Theorie nicht gewährleistet Bsp. Ein Inspektionsexperiment wird nur mit einem Dokument als Objekt durchgeführt -> nicht aussagekräftig genug Threats to Validity
21 Entwurfs-Bedrohungen in der Konstruktions-Gültigkeit Mono Methoden-Verzerrung Wird nur eine Messvariante verwendet, so wird das Risiko des Fehlschlagens des Experimentes erhöht Bsp. Gemessen wird die Anzahl an Fehlern in einem Inspektionsexperiment, wobei die Klassifizierung des Fehlers subjektiv beurteilt wird Folge: Beziehung zw. Ursache und Wirkung wird nicht klar Benutzt man stattdessen unterschiedliche Messarten, so kann man diese Gegeneinander gewichten (crosschecking) -> bessere Aussagekraft Threats to Validity
22 Entwurfs-Bedrohungen in der Konstruktions-Gültigkeit Wechselwirkung von verschiedenen Ausprägungen Ist ein Subjekt in mehr als nur eine Studie involviert, so kann es dazu führen, dass sich die Ausprägungen der Faktoren gegenseitig beeinflussen Wechselwirkung zw. dem Testen und der Ausprägung der Faktoren Beim Testen selbst, sprich der Anwendung der Ausprägungen, sind die Subjekte möglicherweise empfänglicher für diese, da so das Testen für sich genommen ein Teil der Ausprägungen ausmacht Bsp. Messen von Bugs im Code -> Subjekte sind aufmerksamer und Reduzierungsbewusster beim eigenen Programmieren Threats to Validity
23 Soziale Bedrohungen in der Konstruktions-Gültigkeit Annahmen raten Subjekte (Personen) versuchen zumal das Experiment auf das Ziel hin zu hinterfragen und stützen sich dann auf Ihre Vermutung in Ihrem Handeln Dadurch beeinflussen diese dann das Experiment, je nach der persönlichen Einstellung zu der Hypothese Evaluierungsangst Subjekte neigen dazu sich bei einer Evaluierung besser darzustellen und weisen dabei einen großen Abweichungsgrad auf -> Outcome wird verfälscht Threats to Validity
24 Soziale Bedrohungen in der Konstruktions-Gültigkeit Experimentatoren Erwartungen die Subjekte die das Experiment durchführen können dessen Ergebnisse bewusst oder unbewusst beeinflussen Reduzierung dieser Gefahr, durch einbinden von Subjekten mit geringen oder am besten keinen Erwartungen an das Experiment Bsp. Fragen können in unterschiedlichen Variationen erstellt werden, so dass man die gewünschten Antworten erhält Threats to Validity
25 Bedrohung für f r die Externe GültigkeitG Idee Externe Gültigkeit: Ist die untersuchte kausale Beziehung zwischen cause und effect auf andere Szenarien/ Projekte verallgemeinerbar? Wechselwirkung von Selektion und Ausprägung Auswirkung von Auswahl von nicht repräsentativen Subjekten, die eine Verallgemeinerung behindern Bsp. In einem Experiment werden nur Programmierer ausgewählt um einige Dokumente zu inspizieren, anstatt weitere Subjekte verschiedener Domänen hinzu zu nehmen (z.b. Tester) Threats to Validity
26 Bedrohung für f r die Externe GültigkeitG Wechselwirkung von Experimentierumgebung und Ausprägungen Fehlen der neuesten Mittel (z.b. HW) bzw. der Umgebung, die z.b. in der Industrie Anwendung finden -> daher bedingte Übertragung auf andere Szenarien Wechselwirkung von Zeit und Ausprägungen der Zeitpunkt eines Experiments wirkt sich entsprechend auf die Resultate aus Bsp. Wird ein Fragebogen zu einem sicherheitskritischem System ein paar Tage nach einem Absturz ausgefüllt, wären die Antworten sicherlich unterschiedlich, als wie zu einem anderen Zeitpunkt vor oder Monate nach dem Ereignis Threats to Validity
27 Wichtigkeit der GültigkeitsartenG Jede der vier Formen von Gültigkeit in hohem Maß zu erreichen ist schwer Mit Studenten positiv : Große und viele Gruppen möglich Homogene Fähigkeiten Ausprägung lässt sich präzise lehren und dann testen Daher hohe Sicherheit für Schlussfolgerungen und interne Gültigkeit Aber man kann nicht gut von Studenten auf Software-Firmen schließen Threats to Validity
28 Wichtigkeit der GültigkeitsartenG Viele Messungen erhöhen die Konstruktions-Gültigkeit aber sie kosten Zeit und halten Personal von der Arbeit die gemessen wird ab Die Gültigkeit der Schlussfolgerung sinkt Threats to Validity
29 Priorisieren der GültigkeitenG Für unterschiedliche Anwendungen sind die Gültigkeiten unterschiedlich wichtig Um eine Theorie zu bestätigen ist es wichtig, dass die Ergebnisse von den Faktoren abhängen und nicht von Störungen (interne) und die Messergebnisse korrekt sind (Konstruktion) Die externe Gültigkeit ist vernachlässigbar Intern > Konstruktion > Schlussfolgerung > extern Threats to Validity
30 Priorisieren der GültigkeitenG Auch für Firmen ist es wichtig das die Ergebnisse von den Faktoren abhängen und nicht von Störungen (interne) Die Ergebnisse sollen auf andere Abteilungen übertragbar sein (externe) Von welchem Faktor genau das Ergebnis abhängt ist nicht so wichtig (Konstruktion) Statistische Relevanz ist beinah vernachlässigbar (Schlussfolgerung) intern > extern > Konstruktion > Schlussfolgerung Threats to Validity
31 Zusammenfassung Schlussfolgerungs-Gültigkeit Signifikanter Ausschlag der Messgrößen Interne Gültigkeit kausaler Zusammenhang zwischen abhängigen und unabhängigen Variabeln Konstruktions-Gültigkeit Stimmt Theorie mit dem Beobachteten überein Externe Gültigkeit Übertragbarkeit der Resultate Es geht nicht alles gleichzeitig Unterschiedliche Prioritäten für Firmen und Forschung Threats to Validity
Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend
Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend oder eindeutig, wenn keine alternativen Interpretationsmöglichkeiten
MehrEinführung in Techniken wissenschaftlichen Arbeitens
Einführung in Techniken wissenschaftlichen Arbeitens Hypothesen und Versuchspläne Julia Rodriguez Buritica Wissenschaftliche Mitarbeiterin AG Emotionspsychologie und affektive Neurowissenschaften Berlin
MehrDas Experiment als Teil quantitativer Datenerhebung Eine Einführung in die quantitative Erhebungspraxis
Das Experiment als Teil quantitativer Datenerhebung Eine Einführung in die quantitative Erhebungspraxis 1. Organisation und Einführung 2009 Dozent: Jürgen Leibold 1 Übersicht Ziele der Veranstaltung Literatur
MehrDie Goal-Question-Metric-Methode (GQM)
Die Goal-Question-Metric-Methode (GQM) von Christian El Boustani in der Lehrveranstaltung: Software Engineering Experiment mit XP-Labor 07.04.2009 Inhalt Einleitung und Motivation Einordnung von GQM in
MehrEmpirische Softwaretechnik
Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 1 Zweiter Teil (Fortsetzung) Wichtige empirische Forschungsmethoden im Überblick 2 Empirische Forschungsmethoden
MehrComputerübung 5. Empirische Wirtschaftsforschung. Willi Mutschler. Ökonometrie und Wirtschaftsstatistik Uni Münster. 26.
Computerübung 5 Empirische Wirtschaftsforschung Willi Mutschler Ökonometrie und Wirtschaftsstatistik Uni Münster 26. November 2010 Willi Mutschler (Uni Münster) Computerübung 5 26. November 2010 1 / 11
MehrBis heute: Überblick Einheit Literatur lesen. 2. Introspektion. 3. Thema definieren und eingrenzen. Untersuchungsproblem.
Bis heute: 1. Literatur lesen 2. Introspektion 3. Thema definieren und eingrenzen 1 Seite (pro Gruppe) zusammenfassen und abgeben Folie 1 Überblick Einheit 2 Untersuchungsproblem Problemstellung Fragestellungen
MehrComparison of Software Products using Software Engineering Metrics
Comparison of Software Products using Software Engineering Metrics Alexander Bätz Fakultät EIM Universität Paderborn 23. Juli 2009 1 / 28 Motivation Qualitätsbewertung von Software Vergleichbarkeit von
MehrUntersuchungsarten im quantitativen Paradigma
Untersuchungsarten im quantitativen Paradigma Erkundungsstudien / Explorationsstudien, z.b.: Erfassung der Geschlechterrollenvorstellungen von Jugendlichen Populationsbeschreibende Untersuchungen, z.b.:
MehrTesttheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität
Testtheorie und Gütekriterien von Messinstrumenten Objektivität Reliabilität Validität Genauigkeit von Messungen Jede Messung zielt darauf ab, möglichst exakte und fehlerfreie Messwerte zu erheben. Dennoch
MehrMethodenlehre. Vorlesung 5. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg
Methodenlehre Vorlesung 5 Prof. Dr., Cognitive Biopsychology and Methods University of Fribourg 1 Methodenlehre I Woche Datum Thema 1 FQ 20.2.13 Einführung, Verteilung der Termine 1 25.9.13 Psychologie
MehrTEIL 4: FORSCHUNGSDESIGNS UND UNTERSUCHUNGSFORMEN
TEIL 4: FORSCHUNGSDESIGNS UND UNTERSUCHUNGSFORMEN GLIEDERUNG Forschungsdesign Charakterisierung Grundbegriffe Verfahrensmöglichkeit Störfaktoren Graphische Darstellung Arten von Störfaktoren Techniken
MehrFragenkatalog 2 CAF-Gütesiegel - Fragenkatalog für den CAF-Aktionsplan (Verbesserungsplan)
Fragenkatalog 2 CAF-Gütesiegel - Fragenkatalog für den CAF-Aktionsplan (Verbesserungsplan) Der Fragenkatalog deckt die Schritte sieben bis neun ab, die in den Leitlinien zur Verbesserung von Organisationen
MehrInterne und externe Modellvalidität
Interne und externe Modellvalidität Interne Modellvalidität ist gegeben, o wenn statistische Inferenz bzgl. der untersuchten Grundgesamtheit zulässig ist o KQ-Schätzer der Modellparameter u. Varianzschätzer
MehrEinführung in die Fragebogenerstellung. Jasmin Hügi Herbstschule 2012
Einführung in die Fragebogenerstellung Jasmin Hügi Herbstschule 2012 Übersicht Zeit 09h00 09h10 09h10 09h40 09h40 10h30 10h30 11h00 11h00 11h20 11h20 12h15 12h15 13h30 13h30 14h00 14h00 15h00 15h00 15h30
MehrForschungsdesigns und Untersuchungsformen
Forschungsdesigns und Untersuchungsformen Ziel: Überprüfung von Hypothesen Experimentelle Anordnung: Überprüfung von Hypothesen kann als Experiment verstanden werden Verfahrensmöglichkeit zur Überprüfung
MehrKapitel VIII - Tests zum Niveau α
Institut für Volkswirtschaftslehre (ECON) Lehrstuhl für Ökonometrie und Statistik Kapitel VIII - Tests zum Niveau α Induktive Statistik Prof. Dr. W.-D. Heller Hartwig Senska Carlo Siebenschuh Testsituationen
MehrForschungsmethoden: Definition
Forschungsmethoden: Definition Unter Forschungsmethoden versteht man die generelle Vorgehensweise beim Aufstellen der Fragestellung, bei der Planung, der Durchführung und der Auswertung einer Untersuchung.
MehrFehler- und Ausgleichsrechnung
Fehler- und Ausgleichsrechnung Daniel Gerth Daniel Gerth (JKU) Fehler- und Ausgleichsrechnung 1 / 12 Überblick Fehler- und Ausgleichsrechnung Dieses Kapitel erklärt: Wie man Ausgleichsrechnung betreibt
MehrInhalt Software-Metriken Software-Metriken mit Together FindBugs. Software-Metriken. Raimar Lill Matthias Meitner David Föhrweiser Marc Spisländer
Lill, Meitner, Föhrweiser, Spisländer FAU Erlangen-Nürnberg Software-Metriken 1 / 24 Software-Metriken Raimar Lill Matthias Meitner David Föhrweiser Marc Spisländer Lehrstuhl für Software Engineering Friedrich-Alexander-Universität
MehrEinführung ins Experimentieren. Methodenpropädeutikum II Allgemeine Psychologie. Hypothesen. Fragestellung. Adrian Schwaninger & Stefan Michel
Methodenpropädeutikum II Allgemeine Psychologie Adrian Schwaninger & Stefan Michel Einführung ins Experimentieren 1. Fragestellung und Hypothesen 2. Variablen und Operationalisierung und Weitere Variablen
MehrInhaltsverzeichnis. Teil I Grundlagen 1
xv Teil I Grundlagen 1 1 Modelle und Modellierung 3 1.1 Modelle, die uns umgeben.................................. 3 1.2 Modelltheorie........................................... 5 1.3 Ziele beim Einsatz
Mehr1. Wissenschaftstheoretische Grundlagen Soziologische Theorie als erfahrungswissenschaftliche
1. Wissenschaftstheoretische Grundlagen 1.1. Soziologische Theorie als erfahrungswissenschaftliche Theorie 1.1.1. Was sind keine erfahrungswissenschaftlichen Theorien? Aussagen der Logik und der Mathematik
MehrGLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Konstruierte Skalen in den Sozialwissenschaften
TEIL 3: MESSEN UND SKALIEREN GLIEDERUNG Das Messen eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Objektivität Reliabilität Validität Konstruierte Skalen in den Sozialwissenschaften
MehrQUANTITATIVE VS QUALITATIVE STUDIEN
1 QUANTITATIVE VS QUALITATIVE STUDIEN Q UA N T I TAT I V E ST U D I E (lat. quantitas: Größe, Menge) Q UA L I TAT I V E ST U D I E (lat.: qualitas = Beschaffenheit, Merkmal, Eigenschaft, Zustand) 2 QUANTITATIVES
MehrWas ist ein Test? Grundlagen psychologisch- diagnostischer Verfahren. Rorschach-Test
Was ist ein Test? Ein Test ist ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage
MehrAufgaben und Ziele der Wissenschaften
Aufgaben und Ziele der Wissenschaften Beschreibung: Der Otto sitzt immer nur still da und sagt nichts. Erklärung:Weil er wegen der Kündigung so bedrückt ist. Vorhersage: Wenn das so weitergeht, zieht er
MehrKühlt der Kühlschrank schlechter, wenn die Sonne auf die Lüftungsgitter scheint?
Kühlt der Kühlschrank schlechter, wenn die Sonne auf die Lüftungsgitter scheint? Diese Untersuchung wurde an einem Kühlschrank durchgeführt, an dem ein Lüfter zur Verbesserung der Kühlwirkung eingebaut
MehrCognitive Consequences of forced Compliance
1 Cognitive Consequences of forced Compliance Leon Festinger und James M. Carlsmith Stanfort University 2 Was passiert mit der persönlichen Meinung einer Person, wenn er/sie dazu gezwungen wird, etwas
MehrEmpirisches Software Engineering Methoden und Relevanz
Empirisches Software Engineering Methoden und Relevanz Stefan Wagner Technische Universität München Dr. Stefan Wagner 31.10.2007 Fakultät für Informatik Lehrstuhl für Software & Systems Engineering Definition
MehrBivariate Zusammenhänge
Bivariate Zusammenhänge 40 60 80 Bivariater Zusammenhang: Zusammenhang zwischen zwei Variablen weight (kg) Gibt es einen Zusammenhang zwischen Größe & Gewicht? (am Beispieldatensatz) Offensichtlich positiver
Mehr10 Der statistische Test
10 Der statistische Test 10.1 Was soll ein statistischer Test? 10.2 Nullhypothese und Alternativen 10.3 Fehler 1. und 2. Art 10.4 Parametrische und nichtparametrische Tests 10.1 Was soll ein statistischer
MehrKapitel 7. Crossvalidation
Kapitel 7 Crossvalidation Wie im Kapitel 5 erwähnt wurde, ist die Crossvalidation die beste Technik, womit man die Genauigkeit der verschiedenen Interpolationsmethoden überprüft. In diesem Kapitel wurde
MehrMotivation. Intensität und Ausdauer, mit der bestimmte Zustände angestrebt oder gemieden werden.
Motivation Intensität und Ausdauer, mit der bestimmte Zustände angestrebt oder gemieden werden. Beeinflusst durch: Interne Variablen: Bedürfnisse / Motive des Handelnden: - Physiologisch (Hunger, Durst,
MehrBeurteilung der Gebrauchstauglichkeit von Software
Beurteilung der Gebrauchstauglichkeit von Software - eine Untersuchung der Zufriedenstellung mit unterschiedlichen Nutzergruppen am Beispiel eines Programms zur Arbeitszeitgestaltung (BASS 4) Alexandra
Mehr1 Kommunikation aus psychologischer Sicht
Jeder von Ihnen wird schon einmal mit der Aussage konfrontiert worden sein, dass wir in einem besonderen Zeitalter leben, dem Kommunikationszeitalter. Damit wird üblicherweise abgehoben auf den sich ständig
MehrIshikawa Ursache - Wirkungsdiagramm Definition
Ishikawa Ursache - Wirkungsdiagramm Definition by Andre Kapust - Donnerstag, Januar 01, 1970 https://www.quality.de/ishikawa-ursache-wirkungsdiagramm-definition/ Überblick Ursache-Wirkungs-Diagramm Ein
MehrPsycholinguistik. Definition: Psycholinguistik (synonym: Sprachpsychologie) erforscht das kognitive (mentale) System, das den Sprachgebrauch erlaubt.
Psycholinguistik Definition: Psycholinguistik (synonym: Sprachpsychologie) erforscht das kognitive (mentale) System, das den Sprachgebrauch erlaubt. Teilgebiete der Psycholinguistik Können danach klassifiziert
MehrEmpirische Softwaretechnik
Empirische Softwaretechnik Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006 Zwei Experimente zum Vergleich von Paarprogrammierung und Durchsichten 2 Literatur Müller. Should we use programmer
MehrDIN EN 16247-1. Disclaimer (Optional location for any required disclaimer copy. To set disclaimer, or delete, go to View Master Slide Master)
Ganzheitliche Effizienzberatung für Unternehmen DIN EN 16247-1 Außeneinsatz Analyse Bericht REOptima GmbH Mollenbachstraße 19 info@energieaudit-din16247.de Tel. +49 711 230030-29 71229 Copyright Leonberg
MehrEntlohnung im Experiment Annette Kirstein
Entlohnung im Experiment Annette Kirstein Ökonomische Anreize in Unternehmen und Märkten vom 20. Januar 2009 Eine der wichtigsten Annahmen in der Ökonomik ist: Finanzielle Anreize verbessern die Leistung.
MehrFragebogen: Abschlussbefragung
Fragebogen: Abschlussbefragung Vielen Dank, dass Sie die Ameise - Schulung durchgeführt haben. Abschließend möchten wir Ihnen noch einige Fragen zu Ihrer subjektiven Einschätzung unseres Simulationssystems,
MehrEinführung in Quantitative Methoden
Einführung in Quantitative Methoden Pantelis Christodoulides & Karin Waldherr 4. Juni 2014 Christodoulides / Waldherr Einführung in Quantitative Methoden 1/35 Ein- und Zweiseitige Hypothesen H 0 : p =
MehrSoftware Engineering in der Praxis
Software Engineering in der Praxis Praktische Übungen Adersberger, Spisländer FAU Erlangen-Nürnberg Software-Metriken 1 / 26 Software-Metriken Josef Adersberger Marc Spisländer Lehrstuhl für Software Engineering
MehrInternetkurse für die Klausur. 1. Psychologie 2. Methoden 3. Lernen 4. Problemlösen 5. Piaget 6. Personenwahrnehmung
Internetkurse für die Klausur 1. Psychologie 2. Methoden 3. Lernen 4. Problemlösen 5. Piaget 6. Personenwahrnehmung Sozialpsychologie (3.7.) Definition Sozialpsychologie Abgrenzung der Sozialpsychologie
MehrVersuchsplanung und Versuchsdesign. Prof. Dr.-Ing. Sebastian Möller
Versuchsplanung und Versuchsdesign Angelika Modrzejewska Robin Henniges Usability SS2013 Prof. Dr.-Ing. Sebastian Möller Übersicht Ziel der Messung Spezifikation des Messobjektes Definition der Messgrößen
MehrEntwicklungsmethoden
Slide 5.1 Entwicklungsmethoden Prof. Dr. Josef M. Joller jjoller@hsr.ch Development Methodologies Prof. Dr. Josef M. Joller 1 Session 5 Slide 5.2 TOOLS Development Methodologies Prof. Dr. Josef M. Joller
MehrZusammenfassung Ergebnisse des Fragebogens Gesundheitskommunikation
Institut für Umweltentscheidungen (IED) Consumer Behavior Zusammenfassung Ergebnisse des Fragebogens Gesundheitskommunikation Zuerst einmal nochmals vielen Dank, dass Sie unseren Fragebogen ausgefüllt
MehrQuerschnittsbereich Nr. 1: Epidemiologie, Med. Biometrie und Med. Informatik
Prävalenz Die Prävalenz ist eine Maßzahl für die Häufigkeit eines Zustandes zu einem bestimmten Zeitpunkt, z. B. der Anteil der Bevölkerung, der zu einem bestimmten Zeitpunkt übergewichtig ist oder der
MehrBeobachtungs- und Beurteilungsfehler. Fortbildung Z-INA und plötzlich prüfe ich
Beobachtungs- und Beurteilungsfehler Fortbildung Z-INA und plötzlich prüfe ich Rita Gübeli Mai / Juni 2012 Beobachtungs- und Beurteilungsfehler Die Beobachtung von Studierenden erfordert von beurteilenden
MehrDesign 1. Protokoll. Stefan Krulj, Markus Schütz,
Design 1 Protokoll Stefan Krulj, 0826564 Markus Schütz, 0725043 Advanced Digital Design Design 1, Stefan Krulj, Markus Schütz Anmerkung Aufgrund diverser Probleme mit dem Development-Board DN8000K10PSX
MehrSystematische Optimierungsverfahren verbessern mit geringem Aufwand Prozesse und Produkte
Systematische Optimierungsverfahren verbessern mit geringem Aufwand Prozesse und Produkte - Eine phänomenologische Darstellung der statistischen Versuchsplanung - Sie kennen das Problem: Ihr komplexer
MehrErster Bug: eine Motte
SOFTWAREFEHLER Der erste Bug Erster Bug: eine Motte Der Begriff Bug (deutsch: Motte) stammt aus dem Jahre 1945, als Ingenieure in einem Schaltrelais eines Computers (Harvard Mark II-System) eine Motte
MehrFaculty of Computer Science. Kontrollierte Experimente
Faculty of Computer Science Kontrollierte Experimente 1 Qualitativ---Quantitativ Einordnung Mensch-Computer---Technisch 2 Kontrollierte Experimente mit Probanden Zeitreihen analysen 4 Perform ance 1 Fragebög
MehrGewichtung in der Umfragepraxis. Von Tobias Hentze
Gewichtung in der Umfragepraxis Von Tobias Hentze Gliederung 1. Einführung 2. Gewichtungsarten 1. Designgewichtung 2. Non-Response-Gewichtung 3. Zellgewichtung 3. Fazit Gewichtung Definition: Ein Gewicht
MehrProjekt Bewegte Klasse Analyse der koordinativen Fähigkeiten
Projekt Bewegte Klasse Analyse der koordinativen Fähigkeiten Fachhochschule Technikum Wien Institut für Sports Engineering & Biomechanics Ablauf In der Studie Bewegte Klasse die von der FH Technikum Wien
Mehrstartfaq BAG Beobachtungsstudie Bias
Hier finden Sie die Erläuterung zu Fachbegriffen, welche in wissenschaftlichen Studien verwendet werden. Sollten Begriffe nicht aufgeführt sein, geben Sie uns doch ein Feedback, damit wir diese ergänzen
MehrPaul Watzlawick. Fünf kommunikationspsychologische Axiome
Paul Watzlawick Fünf kommunikationspsychologische Axiome Grundannahmen über Kommunikation: 5 Axiome Die Grundannahmen (Axiome) sind Formulierungen über das Gelingen und über Störungen in der Kommunikation,
MehrRequirements Engineering im SPL-Umfeld
Requirements Engineering im SPL-Umfeld Manuel Wörmann 16.02.2015 Requirements Engineering im SPL-Umfeld Inhalt 1. Definition 2. Ziele 3. Domain Requirements Engineering 4. Application Requirements Engineering
MehrProbeklausur für den Studiengang B-BPG-01-a, B-PV-01-1-a. Einführung in die Pflegewissenschaft
Probeklausur für den Studiengang B-BPG-01-a, B-PV-01-1-a Einführung in die Pflegewissenschaft für Dienstag, den 18.01.11 Sehr geehrte Studierende, wie vereinbart hier die Probeklausur zum Abschluss des
MehrPflichtlektüre hierzu: Kosten und Nutzen von UML in der Wartung. Kontrolliertes Experiment zu UML. Warum UML?
Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Kosten und Nutzen von UML in der Wartung Prof. Walter F. Tichy Pflichtlektüre hierzu: Dzidek, Arisholm, Briand, A Realistic Empirical Evaluation
MehrLiteratur. Aussagen über Paarprogrammierung. Motivation. Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825
Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Literatur Effektivität der Paarprogrammierung bei Berücksichtigung von Systemkomplexität und Kompetenz der Programmierer Andreas Höfer Walter
MehrBevor man an einem Analysengerät Patientenproben messen kann muss das Gerät kalibriert und eine QK bestimmt werden wie oft kalibriert und
Bevor man an einem Analysengerät Patientenproben messen kann muss das Gerät kalibriert und eine QK bestimmt werden wie oft kalibriert und kontrolliert wird hängt vom Gerät, vom Test und vom Labor ab. 1.
Mehr5. Untersuchungsdesigns
Dr. habil. Rüdiger Jacob Methoden und Techniken der empirischen Sozialforschung Vorlesung mit Diskussion 5. Untersuchungsdesigns Experimente als Instrument zur Prüfung von Kausalität Kohortenstudien, Fall-Kontroll-Studien,
Mehr2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:
2.4.1 Grundprinzipien statistischer Hypothesentests Hypothese: Behauptung einer Tatsache, deren Überprüfung noch aussteht (Leutner in: Endruweit, Trommsdorff: Wörterbuch der Soziologie, 1989). Statistischer
MehrAttribution. Unterschied zwischen Akteur und Beobachter
Attribution Unterschied zwischen Akteur und Beobachter Christine Faist & Carina Gottwald Seminar: Soziale Kognition 2.Fachsemester Datum: 25.04.2012, 10.00 12.00 Überblick Hypothese Nisbett und Jones Watson
MehrOnline Intelligence Solutions TESTABLAUF. 7 Schritte für ein erfolgreiches Testing.
Online Intelligence Solutions TESTABLAUF 7 Schritte für ein erfolgreiches Testing. SCHRITT1 DAS PROBLEM IDENTIFIZIEREN UND BESCHREIBEN Ein Problem, das auftritt, identifizieren Wenn es kein Problem gibt,
MehrEinführung ins Experimentieren. Methodenpropädeutikum II Allgemeine Psychologie. Überlegungen zum exp. Design. Adrian Schwaninger & Stefan Michel
Methodenpropädeutikum II Allgemeine Psychologie Adrian Schwaninger & Stefan Michel Einführung ins Experimentieren 1. Fragestellung und Hypothesen 2. Variablen und Operationalisierung UV und Störvariablen
MehrMethoden der Werkstoffprüfung Kapitel I Grundlagen. WS 2009/2010 Kapitel 1.0
Methoden der Werkstoffprüfung Kapitel I Grundlagen WS 2009/2010 Kapitel 1.0 Grundlagen Probenmittelwerte ohne MU Akzeptanzbereich Probe 1 und 2 liegen im Akzeptanzbereich Sie sind damit akzeptiert! Probe
MehrBei näherer Betrachtung des Diagramms Nr. 3 fällt folgendes auf:
18 3 Ergebnisse In diesem Kapitel werden nun zunächst die Ergebnisse der Korrelationen dargelegt und anschließend die Bedingungen der Gruppenbildung sowie die Ergebnisse der weiteren Analysen. 3.1 Ergebnisse
MehrEs können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.
Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird
MehrSoftware Engineering
Software Engineering Besprechung zur Uebung 6 WS 06/07 Agenda Besprechung der Uebung 6. Besprechung der Musterklausur in Software Engineering (Bachelor). 1 Testen (1) a.) White Box Test 100% Anweisungsüberdeckung
MehrKonkretes Durchführen einer Inferenzstatistik
Konkretes Durchführen einer Inferenzstatistik Die Frage ist, welche inferenzstatistischen Schlüsse bei einer kontinuierlichen Variablen - Beispiel: Reaktionszeit gemessen in ms - von der Stichprobe auf
MehrWas heißt messen? Konzeptspezifikation Operationalisierung Qualität der Messung
Was heißt messen? Ganz allgemein: Eine Eigenschaft eines Objektes wird ermittelt, z.b. die Wahlabsicht eines Bürgers, das Bruttosozialprodukt eines Landes, die Häufigkeit von Konflikten im internationalen
Mehr11. Sozial-kognitive Persönlichkeitstheorien. Rotter und Bandura. Teil 11.b: Bandura
10. Theorien der Persönlichkeit GHF im WiSe 2008 / 2009 an der HS MD- SDL(FH) im Studiengang Rehabilitationspsychologie, B.Sc., 1. Semester Persönlichkeitstheorien Rotter und Bandura Teil 11.b: Bandura
MehrItems Einstellungen sportliches Engagement der Freundinnen und Freunde Frauen keinen Wenige / niemand meiner Freundinnen und Freunde sind der Meinung,
9 Ergebnisse: Soziales Umfeld Freundinnen und Freunde 117 9 Freundinnen und Freunde Im folgenden Kapitel wird herausgearbeitet, wie die Schülerinnen und Studentinnen die Einstellungen und das Sportverhalten
MehrDer Gaußsche Algorithmus
Der Gaußsche Algorithmus Der Gaußsche Algorithmus beinhaltet das Vertauschen der Zeilen der erweiterten Koeffizientenmatrix (A, b) und das Additionsverfahren. Ziel ist es, möglichst viele Nullen unterhalb
MehrRTLOpen - Eine Methode zur interdisziplinären Entwicklung von software-intensiven Echtzeit-Systemen
RTLOpen - Eine Methode zur interdisziplinären Entwicklung von software-intensiven Echtzeit-Systemen Thorsten Keuler (thorsten.keuler@iese.fraunhofer.de) IESE Fraunhofer Institut Experimentelles Software
MehrTesten von Hypothesen, Beurteilende Statistik
Testen von Hypothesen, Beurteilende Statistik Was ist ein Test? Ein Test ist ein Verfahren, mit dem man anhand von Beobachtungen eine begründete Entscheidung über die Gültigkeit oder Ungültigkeit einer
MehrC. Oertel, F. Ossiander und A. Seibold. Vergleichseffekte bei der Lohnbildung Vortrag im Fach Experimentelle Wirtschaftsforschung am
C. Oertel, F. Ossiander und A. Seibold Vergleichseffekte bei der Lohnbildung Vortrag im Fach Experimentelle Wirtschaftsforschung am Mehr Bescheidenheit stünde manchem Topmanager gut zu Gesicht. Ich kann
MehrTheorien der Persönlichkeit. Wintersemester 2008/2009 Gabriele Helga Franke
Theorien der Persönlichkeit Wintersemester 2008/2009 Gabriele Helga Franke 10. Theorien der Persönlichkeit GHF im WiSe 2008 / 2009 an der HS MD- SDL(FH) im Studiengang Rehabilitationspsychologie, B.Sc.,
MehrTäuschung und Manipulation mit Zahlen Teil 1
Täuschung und Manipulation mit Zahlen Teil 1 Kleines Statistikseminar zum kritischen Umgang mit Zahlen 23.3.2011 Dr. med. H.-J. Koubenec Mammasprechstunde im Immanuel Krankenhaus Berlin Folien: Mammographie-Screening.de
MehrUntersuchung zur Beschleunigung von Prüfungen der. physikalischen Dauergebrauchseigenschaften von Schuhen. und Schuhkomponenten.
Untersuchung zur Beschleunigung von Prüfungen der physikalischen Dauergebrauchseigenschaften von Schuhen und Schuhkomponenten. (Veröffentlichung) Firma AIF-Forschungsprojekt 13804 N Das Projekt wurde aus
MehrBiometrie im neuen Antragsverfahren
8. Fortbildungsveranstaltung der GV-SOLAS für Tierschutzbeauftragte und Behördenvertreter Warum biometrische Planung? Einfachste Antwort: Weil es im Genehmigungsantrag so vorgesehen ist. 2 Warum biometrische
MehrDesign, Durchführung und Präsentation von Experimenten in der Softwaretechnik
Design, Durchführung und Präsentation von Experimenten in der Softwaretechnik Inhalt 1. Zusammenfassung der Papers 2. Fehler in Design, Durchführung und Präsentation 3. Richtlinien für saubere Experimente
MehrMögliche Fehler beim Testen
Mögliche Fehler beim Testen Fehler. Art (Irrtumswahrscheinlichkeit α), Zusammenfassung: Die Nullhypothese wird verworfen, obwohl sie zutrifft. Wir haben uns blamiert, weil wir etwas Wahres abgelehnt haben.
MehrFrage 8.3. Wozu dienen Beweise im Rahmen einer mathematischen (Lehramts-)Ausbildung?
8 Grundsätzliches zu Beweisen Frage 8.3. Wozu dienen Beweise im Rahmen einer mathematischen (Lehramts-)Ausbildung? ˆ Mathematik besteht nicht (nur) aus dem Anwenden auswendig gelernter Schemata. Stattdessen
MehrEvaluationsprojekt der Klasse 3a zur vollständigen und sorgfältigen Erledigung der Hausaufgaben (2012/2013)
Evaluationsprojekt der Klasse a zur vollständigen und sorgfältigen Erledigung der Hausaufgaben (/) Gründe für die Wahl dieses Themas Die Klasse a besteht zurzeit aus Schülern. Vier dieser Schüler nehmen
Mehr03407 Einführung I, Kapitel 1
03407 Einführung I, Kapitel 1 Kapitelzusammenfassung Die Sozialpsychologie erforscht die Effekte personaler und situativer Faktoren sowie deren Wechselwirkungen darauf, wie Menschen einander in sozialen
MehrBeurteilende Statistik
Beurteilende Statistik Wahrscheinlichkeitsrechnung und Beurteilende Statistik was ist der Unterschied zwischen den beiden Bereichen? In der Wahrscheinlichkeitstheorie werden aus gegebenen Wahrscheinlichkeiten
MehrEvaluation (10.7.) Definition Beschreibungsmerkmale von Evaluation Zu den Hausaufgaben Methodische Aspekte der (summativen) Evaluation
Evaluation (10.7.) Definition Beschreibungsmerkmale von Evaluation Zu den Hausaufgaben Methodische Aspekte der (summativen) Evaluation Was ist Evaluation? Evaluation ist die systematische Anwendung sozialwissenschaftlicher
MehrUmfrage, eine Methode für die Maturaarbeit. GM.my in Zusammenarbeit mit der Kantonsschule Olten
Umfrage, eine Methode für die Maturaarbeit GM.my in Zusammenarbeit mit der Kantonsschule Olten 1 Aufbau 1. Umfrage, eine Methode für die MA 2. Wie frage ich? 3. Wen frage ich? 4. Wie werte ich die Antworten
Mehr4.Wie gut haben Sie im letzten Jahr(1997) Ihre Ziele bezüglich der Neukundengewinnung erreicht? 1 = gar nicht erreicht 7 = voll erreicht
2.2.4.1. Antwortprofil Anhand einer siebenstufigen Ratingskala 1 konnten die Unternehmen den Zielerreichungsgrad bezüglich der einzelnen vorgegebenen Ziele ankreuzen. Abbildung 33 zeigt das Antwortprofil
MehrBIOL, HST HS 2014 Dr. M. Kalisch. MC-Quiz 1. Einsendeschluss: Dienstag, der :59 Uhr
BIOL, HST HS 2014 Dr. M. Kalisch MC-Quiz 1 Einsendeschluss: Dienstag, der 23.09.2014 23:59 Uhr Dieses Quiz soll Ihnen helfen, die Regression mit Faktoren und Wechselwirkungen besser zu verstehen. Zum Teil
Mehr- Selbstkonzept und Selbstwirksamkeit bei arbeitslosen AkademikerInnen -
- Selbstkonzept und Selbstwirksamkeit bei arbeitslosen AkademikerInnen - Eine Evaluierungsstudie zum Einfluss der Trainingsmaßnahme Job-Coaching auf personale Variablen von arbeitssuchenden AkademikerInnen
MehrRequirements Engineering
Ident-Nr styp (z.b. Performance, GUI,..) Titel der Beschreibung identifizieren Messkriterien zur Erfüllbarkeit Komplexität in der Realisierung/Abnahme Aufwand bewerten Priorität (hoch, mittel, klein) Realisierungstermin
Mehr2. Datenvorverarbeitung
Kurzreferat Das Ziel beim Clustering ist es möglichst gleich Datensätze zu finden und diese in Gruppen, sogenannte Cluster zu untergliedern. In dieser Dokumentation werden die Methoden k-means und Fuzzy
MehrVerwandte Begriffe Maxwell-Gleichungen, elektrisches Wirbelfeld, Magnetfeld von Spulen, magnetischer Fluss, induzierte Spannung.
Verwandte Begriffe Maxwell-Gleichungen, elektrisches Wirbelfeld, Magnetfeld von Spulen, magnetischer Fluss, induzierte Spannung. Prinzip In einer langen Spule wird ein Magnetfeld mit variabler Frequenz
MehrKapitel 10. Stichproben
Kapitel 10 n In der deskriptiven Statistik werden die Charakteristika eines Datensatzes durch Grafiken verdeutlicht und durch Maßzahlen zusammengefasst. In der Regel ist man aber nicht nur an der Verteilung
MehrVon Smart-Meter-Daten zum Netzlastgang. 10. Internationale Energiewirtschaftstagung Wien,
Von Smart-Meter-Daten zum Netzlastgang 10. Internationale Energiewirtschaftstagung Wien, 15.02.2017 1 Agenda 1 Motivation 2 Methodik 3 Exemplarische Ergebnisse 4 Schlussfolgerungen 2 SIMULATION Motivation:
Mehr