Grundlagen empirischer Forschung Statistik mit R Heike Zinsmeister WS 2010/11

Ähnliche Dokumente
Auswertung mit dem Statistikprogramm SPSS:

Florian Frötscher und Demet Özçetin

Empirische Wirtschaftsforschung und Ökonometrie III

0 Einführung: Was ist Statistik

Skalenniveau Grundlegende Konzepte

Syntax Verb-Zweit. Modul Syntax und Semantik. Universität Leipzig heck. Institut für Linguistik

Grundlagen der Datenanalyse am Beispiel von SPSS

Grundbegriffe (1) Grundbegriffe (2)

Linguistik für Kognitionswissenschaften

Einführung in die Computerlinguistik

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. Excel Edition. ^ Springer Spektrum

1. GEGENSTAND UND GRUNDBEGRIFFE DER STATISTIK

Skript zur Übung: Grundlagen der empirischen Sozialforschung - Datenanalyse

1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,17 1,17 1,18

Empirische Methoden PM-EMP-P

Einführung in die Statistik mit EXCEL und SPSS

Data Mining (ehem. Entscheidungsunterstützungssysteme)

Von der Untersuchungsfrage zu statistischen Hypothesen, und wie war das nochmal mit dem α- und

Studiendesign/ Evaluierungsdesign

Statistische Datenauswertung. Andreas Stoll Kantonsschule Olten

5. Wie wird im Experiment die interessierende, vom Versuchsleiter gemessene Variable bezeichnet?

90-minütige Klausur Statistik für Studierende der Kommunikationswissenschaft

Prinzipien der Fragebogenkonstruktion. Allgemeine Bestandteile. Richtlinien zur Formulierung. Die 10 Gebote der Frageformulierung (II)

Messung. Mariem Ben Rehouma

Einführung in die statistische Datenanalyse I

Dr. habil. Rüdiger Jacob Methoden und Techniken der empirischen Sozialforschung Vorlesung mit Diskussion

Ein bisschen Statistik

Willkommen zur Vorlesung Statistik

Vorlesung: Statistik für Kommunikationswissenschaftler

Teil I Beschreibende Statistik 29

Syntaktische Typologie

Analytische Statistik I. Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2009/10

Grundlagen der Inferenzstatistik

John Dewey (Art as Experience, 1935, S.50)

Physica-Lehrbuch. Ein anwendungsorientiertes Lehr- und Arbeitsbuch. von Christine Duller

. Syntaktische und semantische Annotation frühneuhochdeutscher Hexenverhörprotokolle. Fabian Barteld

Commercial Banking Übung 1 Kreditscoring

Conjoint Analyse. Ordnen Sie bitte die Objekte Ihren Präferenzen entsprechend in eine Rangreihe.

SFB 833 Bedeutungskonstitution. Kompaktkurs. Datenanalyse. Projekt Z2 Tübingen, Mittwoch, 18. und 20. März 2015

Clusteranalyse. Clusteranalyse. Fragestellung und Aufgaben. Abgrenzung Clusteranalyse - Diskriminanzanalyse. Rohdatenmatrix und Distanzmatrix

A Medial Topic Position for German W. Frey 2004

Einführung in statistische Testmethoden

Einführung in die Computerlinguistik

Fortgeschrittene Statistik SPSS Einführung

Sozialwissenschaftliche Methoden I

Grundlagen Statistik Angewandte Statistik 3. Semester

DAS THEMA: INFERENZSTATISTIK II. Standardfehler Konfidenzintervalle Signifikanztests. Standardfehler

2. Deskriptive Statistik 2.1. Häufigkeitstabellen, Histogramme, empirische Verteilungsfunktionen

Java Einführung VARIABLEN und DATENTYPEN Kapitel 2

Grundlagen der Datenanalyse

Stichprobenauslegung. für stetige und binäre Datentypen

Qualitative und Quantitative Forschungsmethoden

Fremdsprachenlernen. Vorschulalter: Ein Kinderspiel? Andreas Rohde, Universität zu Köln

2. Eindimensionale (univariate) Datenanalyse

1. Einführung und statistische Grundbegriffe. Grundsätzlich unterscheidet man zwei Bedeutungen des Begriffs Statistik:

Personalpronomen und das Verb to be

Statistik im Bachelor-Studium der BWL und VWL

Feedback der Veranstaltungsevaluation - WS 2014/15. Softwarepraktikum Enterprise Ressource Planning. Prof. Dr. Stefan Strohmeier, Friedrich Röhrs

Forschungsmethoden in der Sozialen Arbeit

Academic Skills - Befragung und Auswertung

Datenerfassung und Datenmanagement

Bachelorabschlussseminar Dipl.-Kfm. Daniel Cracau

Einführung ins Experimentieren. Methodenpropädeutikum II Allgemeine Psychologie. Überlegungen zum exp. Design. Adrian Schwaninger & Stefan Michel

METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER

Rationale Zahlen. Vergleichen und Ordnen rationaler Zahlen

Einführung in die Computerlinguistik Statistische Grundlagen

Feedback der Veranstaltungsevaluation - WS 2014/15. Managementinformationssysteme 1: Data Warehousing (V)

fh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik

5. MESSUNG & DATENERHEBUNG IN DEN SOWI

Java Einführung Operatoren Kapitel 2 und 3

Analyse alt- und mittelpaläolithischer Steinartefaktinventare mittels Parallelkoordinatenplots

Psychologische Methodenlehre und Statistik I

5. bis 10. Klasse. Textaufgaben. Alle Themen Typische Aufgaben

Einfache Varianzanalyse für abhängige

Methoden Quantitative Datenanalyse

FernUniversität in Hagen März 2015 Fakultät für Wirtschaftswissenschaft

Felix-Nicolai Müller. Seminar Fragebogenmethodik - WS2009/ Universität Trier Dr. Dirk Kranz

Analog zu Aufgabe 16.1 werden die Daten durch folgenden Befehl eingelesen: > kredit<-read.table("c:\\compaufg\\kredit.

Hypothesenentwicklung und Fragebogengestaltung

Auswertung Qualitäts- Reporting Kanton Zürich. Nachweis der Qualitäts- und Leistungsfähigkeit für die Leistungserbringer der stationären Pflege

Inhaltsverzeichnis. Vorwort und Danksagung Einleitung Aktueller Stand der Forschung... 23

Statistik im Versicherungs- und Finanzwesen

Die deutschen und lettischen Konstruktionsglossare und deren Verwendung bei der Textproduktion. Agnese Dubova Hochschule Ventspils

Biostatistik, WS 2015/2016 Der zwei-stichproben-t-test

Einführung. 2. Sie entstehen erst durch Beobachtung, Erhebung, Befragung, Experiment

Grundwissen Rationale Zahlen

Teil II: Einführung in die Statistik

Auswertung und Darstellung wissenschaftlicher Daten (1)

Springer Fachmedien Wiesbaden 2015 J. Roth et al. (Hrsg.), Übergänge konstruktiv gestalten, Konzepte und Studien zur Hochschuldidaktik und

Willkommen zur Vorlesung Statistik (Master)

Diana Lange. Generative Gestaltung Operatoren

Modul G.1 WS 07/08: Statistik Die Korrelation ist ein standardisiertes Maß für den linearen Zusammenhangzwischen zwei Variablen.

Marktforschung und Datenanalyse

Analysen politikwissenschaftlicher Datensätze mit Stata

Einführung in die Computerlinguistik

Aufgabe 1 10 ECTS. y i x j gering mittel hoch n i Hausrat KFZ Unfall Reiserücktritt n j

Transkript:

Grundlagen empirischer Forschung 27.10.2011 Statistik mit R Heike Zinsmeister WS 2010/11

Übersicht Grundlagen Beispiel für Übung 4 Operationalisierung Skalenniveaus Hypothesen Ur-Datensets 1

Grundlagen Vorbereitung einer empirischen Studie Allgemeine Beschreibung des zu untersuchenden Phänomens Literaturstudien Erkundigungen (z.b. Gespräche mit Kollegen) Beobachtungen, um induktiv auf allgemeine Regularitäten zu schließen Deduktive Schlussfolgerungen (nach Gries 2008: 15) 2

Beispiel: L2-Erwerb des Vorfelds Phänomen Deutsch ist eine Verbzweit-Sprache Auf dieser Reise haben wir viel gelernt. Vorfeld finites Verb Mittelfeld Verbalkomplex Vorfeld linke Satzklam mer Mittelfeld rechte Satzklammer L2-Erwerb Wenig fortgeschrittene Lernende (L2-Lernende): Kanonisch (Subjekt-erst) oder Verbdritt Fortgeschrittene L2-Lernende: Verbzweit-Struktur ok, Verwendung des Vorfelds? Nachfeld 3

Verwendung des Vorfelds Alpha Presse Frankfurt zeigt Leuchtbücher und serielle Objekte. Die Arbeiten des ehemaligen Aktionskünstlers Wol Müller stehen im Zentrum. Das Material selbst interessiert ihn vor allem [..]. Alpha Presse Frankfurt zeigt Leuchtbücher und serielle Objekte. Im Zentrum stehen die Arbeiten des ehemaligen Aktionskünstlers Wol Müller. Ihn interessiert vor allem das Material selbst [..]. (nach TüBa-D/Z, 4, s13515ff.) 4

Verwendung des Vorfelds Kanonische Abfolge Subjekt finites Verb restlicher Satz Alpha Presse Frankfurt zeigt Leuchtbücher und serielle Objekte. Die Arbeiten des ehemaligen Aktionskünstlers Wol Müller stehen im Zentrum. Das Material selbst interessiert ihn vor allem [..]. Alpha Presse Frankfurt zeigt Leuchtbücher und serielle Objekte. Im Zentrum stehen die Arbeiten des ehemaligen Aktionskünstlers Wol Müller. Ihn interessiert vor allem das Material selbst [..]. Vorfeld - Verb-Zweit Beliebige Konstituente finites Verb restlicher Satz 11.11.2010 5

Verwendung des Vorfelds Die Wahl des Satzanfanges (=des Vorfeldelements) Nicht grammatisch determiniert Ausgangspunkt, Basis, von der her sich die (neue) Mitteilung der Einzeläußerung aufrollt Bindeglied zur vorhergegangenen Mitteilung, also ein wesentlicher Faktor der Satzverknüpfung. Thema -Funktion Subtiler Einfluss auf den Textfluss These Lernende von Deutsch als Fremdsprache (L2-Lernende) verwenden das Vorfeld anders als deutsche Muttersprachler (L1-Sprecher). 6

Operationalisierung L2-Lernende verwenden das Vorfeld anders als L1-Sprecher. Funktion: Subjekt, Objekt,... Kategorie: Nominalphrase, Adverbphrase,.. Gewicht Wortanzahl Buchstabenanzahl Morphemanzahl Silbenanzahl Vokalanzahl? Verhältnis Vorfeld / restlicher Satz 7

Operationalisierung Festlegung, an welchen beobachtbaren Ereignissen die Variablenausprägungen gemessen werden sollen. Beispiel.: Länge von Subjekt vs. Objekt (The younger bachelors) ate (the nice little parrot). Anzahl der Morpheme: 5 vs. 4 Anzahl Wörter: 3 vs. 4 Anzahl Buchstaben: 19 vs. 19 (nach Gries 2008:24) 8

Operationalisierung Beispiel: Informationsstatus von referenziellen Ausdrücken Hörer-alt Evoked (Referent ist im Text bereits eingeführt) Pronomen, vorerwähnte Eigennamen: er, S. Gries Unused (Allg. bekannte, aber) nicht-vorerwähnte Eigennamen Hörer-neu Brand-new Eigennamen, die von Relativsatz oder Apposition begleitet werden: Peter Jackson, der Regisseur von Herr der Ringe,... (vereinfacht nach Strube&Hahn 1999, basierend auf der Familiarity-Skala von Prince 1981, 92) 9

Ergebnis der Operationalisierung: Variablen Merkmal (Variable) ein Symbol für eine Menge von Merkmalsausprägungen kann in mindestens zwei Abstufungen vorkommen Bsp.: Kategorie Merkmalsausprägung (Wertelabel, Level) Bsp: Nominalphrase (NP), Adverbphrase (AdvP), Präpositionalphrase (PP), Satz (S),... Ausprägungen werden in R numerisch erfasst Wie gut sie in Zahlen erfasst werden können, liegt am Typ der Variable 10

Typen von Variablen: Skalenniveaus Skala Merkmal Beispiel Nichtmetrische Skala Metrische Skalen Nominal- / Kategorialskala Ordinalskala Intervallskala Ratioskala (Verhältnisskala) Rangwert mit Ordinalzahlen Skala mit gleich großen Abschnitten, ohne Nullpunkt Skala mit gleich großen Abschnitten, mit Nullpunkt Kategorie: NP, AdvP, PP, S qualitative Eigenschaftsausprägungen Vokabelschwierigkeit: leicht, mittel, schwer Celsius-Skala: -273..0..17,3... Kontoguthaben...-500..0..100,34.. Rechnerische Handhabung Bildung von Häufigkeiten Median, Quantile Subtraktion, Mittelwert Summe, Division, Multiplikation Häufigkeiten eines Wortes in Wertebereich einer verschiedenen Ratioskala: Subkorpora eines ganze Zahlen / Korpus: 0,...70... rationale Zahlen,... Minimum 11.11.2010 / Maximum (frei nach Backhaus et al. 2006: 6) 11

Übersicht Grundlagen Beispiel für Übung 4 Operationalisierung Skalenniveaus Hypothesen Ur-Datensets 12

Konditionale Hypothesen Kriterien Die Aussage ist allgemeingültig (All-Satz) der Aussage liegt die Formalstruktur eines Konditionalsatzes zu Grunde ( wenn-dann-satz oder je-desto-satz ) Der Konditionalsatz muss potenziell falsifizierbar sein. 13

Konditionale Hypothesen Aussagen über die Beziehung von zwei oder mehr Variablen Wenn/je U, dann/desto A Aus U folgt A : U A U: unabhängige Variable (independent variable) A: abhängige Variable (dependent variable) Beispiel Je kürzer eine Nominalphrase, desto häufiger wird sie als Subjekt verwendet. 14

Nicht-konditionale Hypothesen Aussage über die Ausprägungen oder Werte einer Variablen Werte verhalten sich wie eine bekannte mathematische Funktion Variable ist abhängig Keine unabhängige Variable Beispiel Die Häufigkeiten der Merkmalsausprägungen von Planungspausen (äh, ähm, Stille) in einer bestimmten Stichprobe sind nicht identisch; die Variation in der Stichprobe ist nicht zufällig. Falsifizierbarkeit 15

Hypothesen allgemein Aussagen oder Behauptungen über eine Variable Die Beziehung(en) zwischen zwei oder mehr Variablen in einem bestimmten Kontext Nullhypothese H 0 (Normalerweise) zu falsifizieren Alternativhypothese H 1 (Normalerweise) die Hypothese, für die man Evidenz sucht 16

Ungerichtete Alternativhypothese Nullhypothese H 0 : die Länge des Objekts (gemessen in Morphemen) unterscheidet sich nicht von der Länge des Subjekts. l objekt = l subjekt Ungerichtete Alternativhypothese H 1 : die Länge des Objekts (gemessen in Morphemen) unterscheidet sich von der Länge des Subjekts. l objekt l subjekt 17

Gerichtete Alternativhypothese Nullhypothese H 0 : die Länge des Objekts (gemessen in Morphemen) unterscheidet sich nicht von der Länge des Subjekts. l objekt = l subjekt Gerichtete Alternativhypothese H 1 : die Länge des Objekts (gemessen in Morphemen) ist länger als die Länge des Subjekts. l objekt > l subjekt 18

Übersicht Grundlagen Beispiel für Übung 4 Operationalisierung Skalenniveaus Hypothesen Ur-Datensets 19

Datensets Beispiel: Erhebung der Länge von Subjekten und Objekten (in Morphemen) H 1 : die Länge des Objekts (gemessen in Morphemen) ist länger als die Länge des Subjekts. Fragen 1. Was sind die Variablen (deren Ausprägungen)? 2. Gibt es unabhängige Variablen? 3. Gibt es abhängige Variablen? 20

Datensets Beispiel: Erhebung der Länge von Subjekten und Objekten (in Morphemen) Länge: 1 Länge: 2 Länge: 3 Länge: 4 Funktion: Subjekt Funktion: Objekt 21

Datensets Beispiel: Erhebung der Länge von Subjekten und Objekten (in Morphemen) Länge: 1 Länge: 2 Länge: 3 Länge: 4 Funktion: Subjekt Funktion: Objekt 22

Datensets Beispiel: Erhebung der Länge von Subjekten und Objekten (in Morphemen) Fall Funktion Länge 1 Subjekt 1 2 Objekt 3 3 Subjekt 2 4 Subjekt 1 5 Objekt 1 6 Subjekt 2 23

Datensets Beispiel: Erhebung der Länge von Subjekten und Objekten (in Morphemen) Fall Satz-ID Funktion Länge 1 1 Subjekt 1 2 1 Objekt 3 3 2 Subjekt 2 4 3 Subjekt 1 5 3 Objekt 1 6 4 Subjekt 2 24

Referenzen Stefan Th. Gries. 2008. Statistik für Sprachwissenschaftler. Vandenhoeck & Ruprecht. Kapitel 1 und 3. Andere: K. Backhaus, W. Plinke und B. Erichson. 2006. Multivariate Analysemethoden Eine anwendungsorientierte Einführung, Berlin: Springer. Ellen F. Prince. 1981. Toward a taxonomy of given-new information. In Peter Cole (Hrsg.) Radical Pragmatics. New York: Academic Press. 223 255. Ellen F. Prince. 1999. How not to mark topics: Topicalization in English and Yiddish. 8 Texas Linguistics Forum. Lothar Sachs und Jürgen Hedderich. 2009. Angewandte Statistik, Berlin: Springer. 1-2 Michael Strube und Udo Hahn. 1999. Functional Centering Grounding Referential Coherence in Information Structure. Computational Linguistics, Volume 25, Number 3, September 1999. 309-344. 25