Proseminarvortrag: Kollokationen. Kollokationen. Referat von Marin Puhr-Westerheide am
|
|
- Eugen Walter
- vor 6 Jahren
- Abrufe
Transkript
1 Proseminarvortrag: Kollokationen Kollokationen Referat von Marin Puhr-Westerheide am
2 Proseminarvortrag: Kollokationen -The t Inhalt Einführung Frequency Mean and Hypothesis The t Hypothesis chi-square Likelihood Notion
3 Proseminarvortrag: Kollokationen Einführung -The t Kollokation: ein Ausdruck bestehend aus zwei oder mehr Wörtern, der im üblichen Sprachgebrauch so verwendet wird Nominalphrasen, z.b. strong tea phrasale Verben, z.b. make up stehende Wendungen, z.b. the rich and powerful aber auch Ausnahmen und subtile Regeln, z.b. stiff breeze aber nicht stiff wind Anwendungsbereiche: Generierung natürlicher Sprache computergestützte Lexikographie parsing Sprachuntersuchungen an Korpora 3
4 Proseminarvortrag: Kollokationen -The t Frequency Häufigkeit des Auftretens von Wortfolgen einfache Suche nach beliebigen Wortpaaren ergibt keine guten Ergebnisse 5 w w w C( w ) C(<>) ist die Häufigkeit eines Bigramms im Korpus 8087 the ein Wort in New the York w x keine Kollokationen erster Treffer! 4
5 Proseminarvortrag: Kollokationen -The t Besser: eine sehr einfache Heuristik nach Justeson und Katz wird auf die Ergebnisse angewandt Schablone A N N N A A N A N N N A N N N N N P N Beispiel linear function regression coefficients Gaussian random variable cumulative distribution function mean squared error class probability function degrees freedom A = Adjektiv P = Präposition N = Nomen Diese einfache Schema-Einschränkung ergibt schon wesentlich bessere Ergebnisse: 5
6 Proseminarvortrag: Kollokationen -The t 6 C( w ) New United last hier auf Bigramme beschränkt! Fazit: w w w York States week Schema A N A N A N Solche einfachen Häufigkeitsbetrachtungen ergeben schon brauchbare Ergebnisse für feste Kollokationen. richtige Treffer erster Fehler 6
7 Proseminarvortrag: Kollokationen Mean and -The t viele Kollokationen kommen ohne festen Abstand vor z.b. das Verb knock und das Nomen door: she knocked on his door they knocked at the door he knocked on the metal front door a woman knocked on Donaldson s door zur Erkennung verwendet man eine Routine, die einen Bereich rund um ein Wort untersucht, z.b. einen drei-wort-bereich: Satz she knocked she knocked on she on his she his door Bigramme knocked on knocked his on his knocked door on door his door 7
8 Proseminarvortrag: Kollokationen -The t Zur Untersuchung der Beziehung zwischen Wörtern berechnen wir: den Stichprobenerwartungswert d n d die Stichprobenvarianz s n i = = = n i = i ( d n i d ) Abstand für Auftreten i Anzahl des Auftretens der Paarung Hier wird die Stichprobenabweichung betrachtet. s = s 8
9 Proseminarvortrag: Kollokationen -The t frequenzy strong frequenzy strong position strong with respect to opposition ( d =,5; s = 0,67) position strong with respect to for ( d =,; s =.5) 9
10 Proseminarvortrag: Kollokationen -The t Erwartungswert und Stichprobenabweichung charakterisieren die Verteilung des Abstandes zweier Wörter: geringe Abweichung bedeutet immer ähnliche Abstände hohe Abweichung mit einer Normalverteilung der Abstände lassen auf zufällige Paarung schließen Erwartungswerte um und kleine Abweichung sind Kollokationen, die man auch über Frequenzanalysen findet Fazit: Mit dieser Methode kann man Kollokationen finden, die in variablen Abständen und mit unterschiedlichem umschlossenem Text vorkommen. 0
11 Proseminarvortrag: Kollokationen -The t Hypothesis hohe Frequenz und geringe Varianz könnten zufällig auftreten, ob Ereignisse häufiger als wahrscheinlichkeitsbedingt zusammen auftreten Betrachten einer Stichprobe von n unabhängigen Stichprobenvariablen X, die die selbe Verteilung wie,...,x n die Zufallsvariable X besitzen Annnahme einer Nullhypothese H 0 Überprüfung der Hypothese (Ablehnungsbereich z.b. p < 0,05; 0,0; 0,005; 0,00)
12 Proseminarvortrag: Kollokationen -The t The t Nullhypothese: Normalverteilung mit Erwartungswert der vergleicht den Erwartungswert der Messung mit der Nullhypothese: t ein = x Beispiel s N µ ist der Erwartungswert ist die Varianz, näherungsweise die Strichprobenvarianz ist die Kardinalität der untersuchten Menge µ
13 Proseminarvortrag: Kollokationen -The t Anwendung auf Bigramme z.b. new companies Anzahl von new im Korpus: 5.88 Anzahl von companies im Korpus: Gesamtgröße des Korpus: Wahrscheinlichkeit des Auftretens von new: P( new) =, Wahrscheinlichkeit des Auftretens von companies: P( companies) = 3, Nullhypothese (new und companies sind unabhängig): P( newcompanies) = P( new) P( companies) 3, Vorkommen des Bigramms: x = ,
14 Proseminarvortrag: Kollokationen -The t 7 7 5, , t 0, , ist <, 5758 (der kritische Wert für 0,5% Fehlerrate), damit müssen wir die Hypothese annehmen new companies ist damit keine mögliche Kollokation, da die beiden Wörter rein zufallsbedingt zusammen auftreten Fazit: der eignet sich um festzustellen, ob Wortpaare Kollokationen sein können es können nur Bigramme verglichen werden, die gleich t auftreten nahezu alle Bigramme werden in die Kategorie Kollokationen eingeordnet, da Sprache im Allgemeinen ziemlich regulär ist im Vergleich zu Zufallsgenerierungen eignet sich, eine Reihenfolge der möglichen Kollokationen zu bilden 4
15 Proseminarvortrag: Kollokationen Hypothesis der t- kann auch erweitert werden, um eine möglichst gute Unterscheidung zwischen zwei Wörtern zu finden im Bereich computergestützte Lexikographie interessant z.b. strong und powerful -The t 3,6,884,4494 7,070 6,357 4,6904 t C (w) C ( strong, w) C( powerful, w) Wort computers computer symbol support enough safety 5
16 Proseminarvortrag: Kollokationen -The t aus diesen Tabellen kann man nach Church und Hanks Unterschiede ableiten wie intrinsische Faktoren z.b. strong support einer demographischen Gruppe bedeutet, dass sie aufopferungsvoll in einer Sache agiert extrinsische Faktoren z.b. ein powerful supporter ist jemand, der wirklich Kraft hat Dinge zu bewegen dieser Methode sind schnell Grenzen gesetzt, die Regeln sind komplexer und Teils von kulturellen Aspekten geprägt z.b. strong tea und powerful drugs 6
17 Proseminarvortrag: Kollokationen -The t Pearson s chi-square t- arbeitet mit gleichverteilten Wahrscheinlichkeiten, was im Allgemeinen nicht zutrifft, besser ist der dieser vergleicht die beobachteten mit den bei Unabhängigkeit erwarteten Häufigkeiten; wenn der Unterschied groß ist, wird die Nullhypothese zurückgewiesen z.b. new companies mit w w = companies companies w = χ new 8 (new companies) 580 (z.b. new machines) w new 4667 (z.b. old companies) 4878 (z.b. old machines) 7
18 Proseminarvortrag: Kollokationen -The t Damit berechnen wir N ( OO X = ( O + O )( O + O (8 +,55 O )( O O) + O )( O ( ) 4667 )( )( )( ) aus einer geeigneten Tabelle entnehmen wir den passenden kritischen Wert χ = 3,84, damit müssen wir die Nullhypothese annehmen und new companies ist keine Kollokation Fazit: Dieser leistet ähnliches wie der t (z.b. sind jeweils die 0 Bigramme mit den höchsten Wertungen bei beiden gleich). Allerdings ist er für große Wahrscheinlichkeiten besser geeignet. + O ) = 8
19 Proseminarvortrag: Kollokationen für die Werte bildet man Maximum- Schätzwerte mit Anzahl der Vorkommen von -The t Likelihood ratios geeignet auch für kleine Datenmengen besser interpretierbare Ergebnisse Anwendung bei Kollokationensuche Aufstellen zweier Hypothesen:.. P( w P( w w w ) ) = = p p = P( w # sagt Unabhängigkeit aus, # sagt Abhängigkeit aus es wird eine Binominalverteilung angenommen p, p, p c x p w ) = P( w w ) w x 9
20 Proseminarvortrag: Kollokationen -The t c P ( w w P( w w von Bigrammen sind. c ) von Bigrammen sind c c die L-Werte sind damit:. Hypothese:. Hypothese: und der L-R-Wert: ) w w w w N c b L L H H c p = N c p = N p c p = c c c = N c b c ; c, ) b c ; c, ) ( p ( c p ( p c ; N c, ) b c c ; N c, ) ( p ( ( p H) = b( c; c, p) b( c c; N c, p) H ) = b( c ; c, p ) b( c c ; N c, ) λ = log L ( H L ( H ) ) 0
21 Proseminarvortrag: Kollokationen -The t mit L( k, n, x) k n k = x ( x) der log λ -Wert ist näherungsweise -verteilt, wir nehmen H als Nullhypothese und H als Alternative, um den Hypothesentest durchzuführen angewendet auf Bigramme mit powerful: # log λ C ( w ) C w ) w w ) 9,4 5,05 50,83 34, ( χ C( w w most powerful less powerful powerful magnet powerful cudgels
22 Proseminarvortrag: Kollokationen -The t Fazit: einzeln interpretierbare Ergebnisse, t und chi-square können nur mit Tabellen verglichen werden Verbesserung zum chi-square, weil die Annäherung an die χ -Verteilung bei kleinen Häufigkeiten genauer ist als bei Pearson
23 Proseminarvortrag: Kollokationen The Notion Collocation -The t Drei Kriterien sind für Kollokationen entscheidend: nicht zusammensetzbar: die Bedeutung kann nicht durch Aneinanderfügen der Einzelaussagen erschlossen werden, d.h. es ergibt sich aus der Kombination eine zusätzliche Bedeutungsinformation z.b. kick the bucket (= sterben) nicht ersetzbar: Einzelwörter können nicht durch bedeutungsgleiche Wörter ersetzt werden z.b. white wine, nicht yellow wine nicht modifizierbar: t kann die Wortfolge nicht erweitert werden, das gilt insbesondere für stehende Wendungen z.b. people as poor as chuch mice 3
24 Proseminarvortrag: Kollokationen Weiteres Kriterium: durch Übersetzungsversuch: wenn eine Wendung nicht Wort für Wort übersetzt werden kann, ist das ein Hinweis, dass es sich um eine Kollokation handelt -The t Abgrenzung zu Wortfeldern und gemeinsamen Auftreten Wörter wie nurse doctor oder plane airport sind verknüpft, ohne eine grammatikalische Einheit mit vorgegebenen Regeln zu bilden diese Verallgemeinerung ist nicht mehr im Begriff der Kollokation enthalten Typische Kollokationen: Hilfsverben in Wendungen z.b. make a decision, do a favor Verben und ihre Partikel z.b. to tell f, to go down 4
25 Proseminarvortrag: Kollokationen -The t Eigennamen z.b. New York terminologische Wendungen, Fachsprache Wendungen z.b. hydraulic oil filter sollten, obwohl sie nicht unbedingt Kollokationen sein müssen, in einem Kontext gleich behandelt oder übersetzt werden, um sicherzugehen, dass ein Leser das richtige Objekt damit assoziiert 5
26 Proseminarvortrag: Kollokationen -The t Vielen Dank für ihre Aufmerksamkeit! 6
27 Proseminarvortrag: Kollokationen Beispiel zum t Die Menschen einer Population sind durchschnittlich 58 cm groß. Es soll nun festgestellt werden, ob eine Menge von 00 Menschen mit einem Erwartungswert von 69 cm und einer Varianz ( s ) von 600 aus dieser Population stammt, der Fehler soll hierbei maximal 0,5% betragen. In die Formel eingesetzt ergibt sich Verglichen mit dem Wert aus der t-verteilung (siehe Steger DS II, Seite 4; Zeilenwert von 00 (schließt 00 mit ein); Spaltenwert 0,995): t = ,05 >,659 Der t-wert ist zu groß, damit muss die Hypothese, dass die untersuchte Menge der Population mit 99,5% Sicherheit entstammt, abgelehnt werden. Zurück 7
Klassifikation von Signifikanztests
Klassifikation von Signifikanztests nach Verteilungsannahmen: verteilungsabhängige = parametrische Tests verteilungsunabhängige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen
MehrStatistisches Testen
Statistisches Testen Grundlegendes Prinzip Erwartungswert Bekannte Varianz Unbekannte Varianz Differenzen Anteilswert Chi-Quadrat Tests Gleichheit von Varianzen Prinzip des Statistischen Tests Konfidenzintervall
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
Mehr73 Hypothesentests Motivation Parametertest am Beispiel eines Münzexperiments
73 Hypothesentests 73.1 Motivation Bei Hypothesentests will man eine gewisse Annahme über eine Zufallsvariable darauf hin überprüfen, ob sie korrekt ist. Beispiele: ( Ist eine Münze fair p = 1 )? 2 Sind
Mehr3. Übung zur Vorlesung NLP Analyse des Wissensrohstoffes Text im Sommersemester 2008 mit Musterlösungen
3. Übung zur Vorlesung NLP Analyse des Wissensrohstoffes Text im Sommersemester 2008 mit Musterlösungen Dr. Andreas Hotho, Dipl.-Inform. Dominik Benz, Wi.-Inf. Beate Krause 14. Mai 2008 1 Kollokationen
Mehrk np g(n, p) = Pr p [T K] = Pr p [T k] Φ. np(1 p) DWT 4.1 Einführung 359/467 Ernst W. Mayr
Die so genannte Gütefunktion g gibt allgemein die Wahrscheinlichkeit an, mit der ein Test die Nullhypothese verwirft. Für unser hier entworfenes Testverfahren gilt ( ) k np g(n, p) = Pr p [T K] = Pr p
MehrTutorial:Unabhängigkeitstest
Tutorial:Unabhängigkeitstest Mit Daten aus einer Befragung zur Einstellung gegenüber der wissenschaftlich-technischen Entwicklungen untersucht eine Soziologin den Zusammenhang zwischen der Einstellung
MehrKlassifikation von Signifikanztests
Klassifikation von Signifikanztests Nach Verteilungsannahmen: verteilungsabhängig: parametrischer [parametric] Test verteilungsunabhängig: nichtparametrischer [non-parametric] Test Bei parametrischen Tests
MehrMaschinelle Sprachverarbeitung: KollokaKonen (Teil 2: Modelle von Wortsequenzen)
basierend auf H Schmid snlp 4 KollokaKonen Maschinelle Sprachverarbeitung: KollokaKonen (Teil 2: Modelle von Wortsequenzen) Basierend auf Kap 3 McEnery & Wilson (2001) & H Schmid snlp Vorlesungsskript
MehrKünstliche Intelligenz Text Mining
Künstliche Intelligenz Text Mining Stephan Schwiebert Sommersemester 2010 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Data Mining Sammelbegriff für die Extraktion von
MehrDWT 2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen 330/467 Ernst W. Mayr
2.1 Maximum-Likelihood-Prinzip zur Konstruktion von Schätzvariablen Wir betrachten nun ein Verfahren zur Konstruktion von Schätzvariablen für Parameter von Verteilungen. Sei X = (X 1,..., X n ). Bei X
MehrStatistics, Data Analysis, and Simulation SS 2015
Mainz, June 11, 2015 Statistics, Data Analysis, and Simulation SS 2015 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler Dr. Michael O. Distler
Mehr4. Lösung weitere Übungsaufgaben Statistik II WiSe 2016/2017
4. Lösung weitere Übungsaufgaben Statistik II WiSe 016/017 1. Aufgabe: Eine sächsische Molkerei füllt Milch in Tetrapacks ab. Es wird vermutet, dass die Füllmenge normalverteilt ist mit einem Erwartungswert
Mehr2. Formulieren von Hypothesen. Nullhypothese: H 0 : µ = 0 Gerät exakt geeicht
43 Signifikanztests Beispiel zum Gauß-Test Bei einer Serienfertigung eines bestimmten Typs von Messgeräten werden vor der Auslieferung eines jeden Gerätes 10 Kontrollmessungen durchgeführt um festzustellen,
MehrDie Familie der χ 2 (n)-verteilungen
Die Familie der χ (n)-verteilungen Sind Z 1,..., Z m für m 1 unabhängig identisch standardnormalverteilte Zufallsvariablen, so genügt die Summe der quadrierten Zufallsvariablen χ := m Z i = Z 1 +... +
MehrZufallsvariablen [random variable]
Zufallsvariablen [random variable] Eine Zufallsvariable (Zufallsgröße) X beschreibt (kodiert) die Versuchsausgänge ω Ω mit Hilfe von Zahlen, d.h. X ist eine Funktion X : Ω R ω X(ω) Zufallsvariablen werden
MehrWichtige Definitionen und Aussagen
Wichtige Definitionen und Aussagen Zufallsexperiment, Ergebnis, Ereignis: Unter einem Zufallsexperiment verstehen wir einen Vorgang, dessen Ausgänge sich nicht vorhersagen lassen Die möglichen Ausgänge
Mehr4.1. Nullhypothese, Gegenhypothese und Entscheidung
rof. Dr. Roland Füss Statistik II SS 8 4. Testtheorie 4.. Nullhypothese, Gegenhypothese und Entscheidung ypothesen Annahmen über die Verteilung oder über einzelne arameter der Verteilung eines Merkmals
MehrBivariater Zusammenhang in der Vierfeldertafel PEΣO
Bivariater Zusammenhang in der Vierfeldertafel PEΣO 12. Oktober 2001 Zusammenhang zweier Variablen und bivariate Häufigkeitsverteilung Die Bivariate Häufigkeitsverteilung gibt Auskunft darüber, wie zwei
Mehr1. Einführung in die induktive Statistik
Wichtige Begriffe 1. Einführung in die induktive Statistik Grundgesamtheit: Statistische Masse, die zu untersuchen ist, bzw. über die Aussagen getroffen werden soll Stichprobe: Teil einer statistischen
MehrBiomathematik für Mediziner, Klausur WS 1999/2000 Seite 1
Biomathematik für Mediziner, Klausur WS 1999/2000 Seite 1 Aufgabe 1: Wieviele der folgenden Variablen sind quantitativ stetig? Schulnoten, Familienstand, Religion, Steuerklasse, Alter, Reaktionszeit, Fahrzeit,
Mehr5. Spezielle stetige Verteilungen
5. Spezielle stetige Verteilungen 5.1 Stetige Gleichverteilung Eine Zufallsvariable X folgt einer stetigen Gleichverteilung mit den Parametern a und b, wenn für die Dichtefunktion von X gilt: f x = 1 für
MehrPrüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002
Prüfung aus Wahrscheinlichkeitstheorie und Statistik MASCHINENBAU 2002 1. Ein Chemiestudent hat ein Set von 10 Gefäßen vor sich stehen, von denen vier mit Salpetersäure Stoff A), vier mit Glyzerin Stoff
MehrQuantitative Auswertung II. Korpuslinguistik Heike Zinsmeister
Quantitative Auswertung II Korpuslinguistik Heike Zinsmeister 16.12.2011 Unterschiedstest Fall 1: unabhängige Stichproben Daten eine unabhängige Variable auf Nominal- oder Kategorialniveau eine abhängige
MehrDie ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist.
.3. Stochastik Grundlagen Die ABSOLUTE HÄUFIGKEIT einer Merkmalsausprägung gibt an, wie oft diese in der Erhebung eingetreten ist. Die RELATIVE HÄUFIGKEIT einer Merkmalsausprägung gibt an mit welchem Anteil
MehrChi-Quadrat Verfahren
Chi-Quadrat Verfahren Chi-Quadrat Verfahren werden bei nominalskalierten Daten verwendet. Die einzige Information, die wir bei Nominalskalenniveau zur Verfügung haben, sind Häufigkeiten. Die Quintessenz
MehrEinführung in die Statistik
Einführung in die Statistik 1. Deskriptive Statistik 2. Induktive Statistik 1. Deskriptive Statistik 1.0 Grundbegriffe 1.1 Skalenniveaus 1.2 Empirische Verteilungen 1.3 Mittelwerte 1.4 Streuungsmaße 1.0
MehrDynamische Systeme und Zeitreihenanalyse // Multivariate Normalverteilung und ML Schätzung 11 p.2/38
Dynamische Systeme und Zeitreihenanalyse Multivariate Normalverteilung und ML Schätzung Kapitel 11 Statistik und Mathematik WU Wien Michael Hauser Dynamische Systeme und Zeitreihenanalyse // Multivariate
MehrMathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007
Mathematik IV für Maschinenbau und Informatik Stochastik Universität Rostock, Institut für Mathematik Sommersemester 007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie Termin: 9. Juni 007 Aufgabe 3 Punkte
MehrWahrscheinlichkeitstheorie 2
Wahrscheinlichkeitstheorie 2 Caroline Sporleder Computational Linguistics Universität des Saarlandes Sommersemester 2011 19.05.2011 Caroline Sporleder Wahrscheinlichkeitstheorie 2 (1) Wiederholung (1):
MehrZeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: n (2k 1) = n 2.
Aufgabe 1. (5 Punkte) Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: n k=1 (2k 1) = n 2. Aufgabe 2. (7 Punkte) Gegeben sei das lineare Gleichungssystem x + 2z = 0 ay
MehrKlausur zur Vorlesung
Institut für Mathematische Stochastik WS 2006/2007 Universität Karlsruhe 12. Februar 2007 Priv.-Doz. Dr. D. Kadelka Dipl.-Math. W. Lao Aufgabe 1 (15 Punkte) Klausur zur Vorlesung Statistik für Biologen
Mehr8. Konfidenzintervalle und Hypothesentests
8. Konfidenzintervalle und Hypothesentests Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Beispiel. Sie wollen den durchschnittlichen Fruchtsaftgehalt eines bestimmten Orangennektars
MehrKapitel 7. Regression und Korrelation. 7.1 Das Regressionsproblem
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandelt die Verteilung einer Variablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrChi-Quadrat-Verteilung
Chi-Quadrat-Verteilung Wikipedia http://de.wikipedia.org/wiki/chi-quadrat-verteilung 1 von 7 6/18/2009 6:13 PM Chi-Quadrat-Verteilung aus Wikipedia, der freien Enzyklopädie Die Chi-Quadrat-Verteilung ist
MehrRegression und Korrelation
Kapitel 7 Regression und Korrelation Ein Regressionsproblem behandeltdie VerteilungeinerVariablen, wenn mindestens eine andere gewisse Werte in nicht zufälliger Art annimmt. Ein Korrelationsproblem dagegen
MehrHypothesentests mit SPSS. Beispiel für einen t-test
Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle
MehrStatistik Testverfahren. Heinz Holling Günther Gediga. Bachelorstudium Psychologie. hogrefe.de
rbu leh ch s plu psych Heinz Holling Günther Gediga hogrefe.de Bachelorstudium Psychologie Statistik Testverfahren 18 Kapitel 2 i.i.d.-annahme dem unabhängig. Es gilt also die i.i.d.-annahme (i.i.d = independent
Mehr0 sonst. a) Wie lautet die Randwahrscheinlichkeitsfunktion von Y? 0.5 y = 1
Aufgabe 1 (2 + 2 + 2 + 1 Punkte) Gegeben sei folgende gemeinsame Wahrscheinlichkeitsfunktion f(x, y) = P (X = x, Y = y) der Zufallsvariablen X und Y : 0.2 x = 1, y = 1 0.3 x = 2, y = 1 f(x, y) = 0.45 x
Mehr7.5 Erwartungswert, Varianz
7.5 Erwartungswert, Varianz Def. 7.5.: a) X sei eine diskrete ZV, die bei unendl. vielen Werten x k folgende Zusatzbedingung erfüllt: x k p k
MehrGrundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2
Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2 Dr. Jan-Peter Brückner jpbrueckner@email.uni-kiel.de R.216 Tel. 880 4717 Statistischer Schluss Voraussetzungen z.b. bzgl. Skalenniveau und
MehrTHEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ
WEBINAR@LUNCHTIME THEMA: "STATISTIK IN DER PRAXIS TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ EINLEITENDES BEISPIEL SAT: Standardisierter Test, der von Studienplatzbewerbern an amerikanischen Unis gefordert
MehrAufgabe 1 (8= Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten:
Aufgabe 1 (8=2+2+2+2 Punkte) 13 Studenten haben die folgenden Noten (ganze Zahl) in der Statistikklausur erhalten: Die Zufallsvariable X bezeichne die Note. 1443533523253. a) Wie groß ist h(x 5)? Kreuzen
MehrKlausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne
MehrDWT 334/460 csusanne Albers
Die Wahrscheinlichkeit fur den Fehler 1. Art wird mit bezeichnet, und man spricht deshalb gelegentlich vom -Fehler. heit auch Signikanzniveau des Tests. In der Praxis ist es ublich, sich ein Signikanzniveau
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 25. Januar 2013 1 Der χ 2 -Anpassungstest 2 Exakter Test nach Fisher Mendelsche Erbregeln als Beispiel für mehr
MehrKlausur zu Statistik II
Goethe-Universität Frankfurt Prof. Dr. Uwe Hassler FB Wirtschaftswissenschaften Sommersemester 2005 Klausur zu Statistik II Version B Bitte tragen Sie hier und auf den Lösungsblättern (oben links) Ihre
MehrAbiturvorbereitung Alkoholsünder, bedingte Wahrscheinlichkeit, Hypothesentest Aufgabenblatt
R. Brinkmann http://brinkmann-du.de Seite 2.05.2009 Abiturvorbereitung Alkoholsünder, bedingte Wahrscheinlichkeit, Hypothesentest Aufgabenblatt Aufgabe 0 0. In einer bestimmten Stadt an einer bestimmten
Mehr3 Grundlagen statistischer Tests (Kap. 8 IS)
3 Grundlagen statistischer Tests (Kap. 8 IS) 3.1 Beispiel zum Hypothesentest Beispiel: Betrachtet wird eine Abfüllanlage für Mineralwasser mit dem Sollgewicht µ 0 = 1000g und bekannter Standardabweichung
MehrZeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: k = n (n + 1) 2
Aufgabe 1. (5 Punkte) Zeigen Sie mittles vollständiger Induktion, dass für jede natürliche Zahl n 1 gilt: n k = k=1 n (n + 1). 2 Aufgabe 2. (5 Punkte) Bestimmen Sie das folgende Integral mithilfe partieller
MehrRechnernutzung in der Physik Teil 3 Statistische Methoden der Datenanalyse
Rechnernutzung in der Physik Teil 3 Statistische Methoden der Datenanalyse Karlsruher Institut für Technologie Ulrich Husemann Institut für Experimentelle Kernphysik, Karlsruher Institut für Technologie
MehrKlausur Statistik Lösungshinweise
Klausur Statistik Lösungshinweise Prüfungsdatum: 21. Januar 2016 Prüfer: Etschberger, Heiden, Jansen Studiengang: IM und BW Punkte: 15, 15, 12, 14, 16, 18 ; Summe der Punkte: 90 Aufgabe 1 15 Punkte Bei
MehrBereiche der Statistik
Bereiche der Statistik Deskriptive / Exploratorische Statistik Schließende Statistik Schließende Statistik Inferenz-Statistik (analytische, schließende oder konfirmatorische Statistik) baut auf der beschreibenden
Mehrerwartete Häufigkeit n=80 davon 50% Frauen fe=40 davon 50% Männer fe=40 Abweichung der beobachteten von den erwarteten Häufigkeiten:
Verfahren zur Analyse von Nominaldaten Chi-Quadrat-Tests Vier-Felder Kontingenztafel Mehrfach gestufte Merkmale Cramers V, Kontingenzkoeffizient, Phi-Koeffizient Muster aller Chi-Quadrat-Verfahren eine
MehrEinfaktorielle Varianzanalyse
Kapitel 16 Einfaktorielle Varianzanalyse Im Zweistichprobenproblem vergleichen wir zwei Verfahren miteinander. Nun wollen wir mehr als zwei Verfahren betrachten, wobei wir unverbunden vorgehen. Beispiel
MehrVerteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen. Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung
Verteilungen eindimensionaler stetiger Zufallsvariablen Stetige Verteilungen Chi-Quadrat-Verteilung Studentverteilung Fisher-Verteilung Typisierung der stetigen theoretischen Verteilungen Bibliografie:
Mehr5. Seminar Statistik
Sandra Schlick Seite 1 5. Seminar 5. Seminar Statistik 30 Kurztest 4 45 Testen von Hypothesen inkl. Übungen 45 Test- und Prüfverfahren inkl. Übungen 45 Repetitorium und Prüfungsvorbereitung 15 Kursevaluation
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrEinführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management
Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Hochschule Augsburg Lageparameter: Erwartungswert d) Erwartungswert
MehrDie Maximum-Likelihood-Methode
Vorlesung: Computergestützte Datenauswertung Die Maximum-Likelihood-Methode Günter Quast Fakultät für Physik Institut für Experimentelle Kernphysik SS '17 KIT Die Forschungsuniversität in der Helmholtz-Gemeinschaft
MehrKonkretes Durchführen einer Inferenzstatistik
Konkretes Durchführen einer Inferenzstatistik Die Frage ist, welche inferenzstatistischen Schlüsse bei einer kontinuierlichen Variablen - Beispiel: Reaktionszeit gemessen in ms - von der Stichprobe auf
MehrHypothesen: Fehler 1. und 2. Art, Power eines statistischen Tests
ue biostatistik: hypothesen, fehler 1. und. art, power 1/8 h. lettner / physik Hypothesen: Fehler 1. und. Art, Power eines statistischen Tests Die äußerst wichtige Tabelle über die Zusammenhänge zwischen
MehrWiederholung. Statistik I. Sommersemester 2009
Statistik I Sommersemester 2009 Statistik I (1/21) Daten/graphische Darstellungen Lage- und Streuungsmaße Zusammenhangsmaße Lineare Regression Wahrscheinlichkeitsrechnung Zentraler Grenzwertsatz Konfidenzintervalle
MehrStatistik. Sommersemester Prof. Dr. Stefan Etschberger HSA. für Betriebswirtschaft und International Management
Statistik für Betriebswirtschaft und International Management Sommersemester 2014 Prof. Dr. Stefan Etschberger HSA Streuungsparameter Varianz Var(X) bzw. σ 2 : [x i E(X)] 2 f(x i ), wenn X diskret Var(X)
MehrAnalyse von Querschnittsdaten. Signifikanztests I Basics
Analyse von Querschnittsdaten Signifikanztests I Basics Warum geht es in den folgenden Sitzungen? Kontinuierliche Variablen Generalisierung kategoriale Variablen Datum 13.10.2004 20.10.2004 27.10.2004
MehrEinführung in die computergestützte Datenanalyse
Karlheinz Zwerenz Statistik Einführung in die computergestützte Datenanalyse 6., überarbeitete Auflage DE GRUYTER OLDENBOURG Vorwort Hinweise zu EXCEL und SPSS Hinweise zum Master-Projekt XI XII XII TEIL
Mehr4.1 Stichproben, Verteilungen und Schätzwerte. N(t) = N 0 e λt, (4.1)
Kapitel 4 Stichproben und Schätzungen 4.1 Stichproben, Verteilungen und Schätzwerte Eine physikalische Messung ist eine endliche Stichprobe aus einer Grundgesamtheit, die endlich oder unendlich sein kann.
MehrPhilipp Sibbertsen Hartmut Lehne. Statistik. Einführung für Wirtschafts- und. Sozialwissenschaftler. 2., überarbeitete Auflage. 4^ Springer Gabler
Philipp Sibbertsen Hartmut Lehne Statistik Einführung für Wirtschafts- und Sozialwissenschaftler 2., überarbeitete Auflage 4^ Springer Gabler Inhaltsverzeichnis Teil I Deskriptive Statistik 1 Einführung
MehrMultivariate Verfahren
Selbstkontrollarbeit 1 Multivariate Verfahren Musterlösung Aufgabe 1 (40 Punkte) Auf der dem Kurs beigelegten CD finden Sie im Unterverzeichnis Daten/Excel/ die Datei zahlen.xlsx. Alternativ können Sie
MehrTutorial: Anpassungstest
Tutorial: Anpassungstest An einem Institut gibt es vier UniversitätslehrerInnen, die auch Diplomarbeiten betreuen. Natürlich erfordert die Betreuung einer Diplomarbeit einiges an Arbeit und Zeit und vom
MehrComputergestützte Datenanalyse in der Kern- und Teilchenphysik
Computergestützte Datenanalysein der Kern- und Teilchenphysik p. 1/?? Computergestützte Datenanalyse in der Kern- und Teilchenphysik Vorlesung 4 Jan Friedrich Computergestützte Datenanalysein der Kern-
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung Dr. Jochen Köhler 1 Inhalt der heutigen Vorlesung Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der vorherigen Vorlesung Übersicht über Schätzung und
MehrÜbungsscheinklausur,
Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 27 Prof. Dr. F. Liese Übungsscheinklausur, 3.7.27 Dipl.-Math. M. Helwich Name:...
MehrBiomathematik für Mediziner
Institut für Medizinische Biometrie, Informatik und Epidemiologie der Universität Bonn (Direktor: Prof. Dr. Max P. Baur) Biomathematik für Mediziner Klausur SS 2003 Aufgabe 1: Welche der unten angegebenen
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn
MehrPopulation und Stichprobe Wahrscheinlichkeitstheorie II
Population und Stichprobe Wahrscheinlichkeitstheorie II 5. Sitzung 1 S. Peter Schmidt 2003 1 Stichprobenziehung als Zufallsexperiment Definition Stichprobe: Teilmenge der Elemente der Grundgesamtheit bzw.
MehrBiomathematik für Mediziner
Institut für Medizinische Biometrie, Informatik und Epidemiologie der Universität Bonn (Direktor: Prof. Dr. Max P. Baur) Biomathematik für Mediziner Klausur WS 2002/2003 Aufgabe 1: Man gehe davon aus,
MehrEin- und Zweistichprobentests
(c) Projekt Neue Statistik 2003 - Lernmodul: Ein- Zweistichprobentests Ein- Zweistichprobentests Worum geht es in diesem Modul? Wiederholung: allgemeines Ablaufschema eines Tests Allgemeine Voraussetzungen
MehrMusterlösung zur Klausur im Fach Fortgeschrittene Statistik am Gesamtpunktzahl: 60
WESTFÄLISCHE WILHELMS - UNIVERSITÄT MÜNSTER Wirtschaftswissenschaftliche Faktultät Prof. Dr. Bernd Wilfling Professur für VWL, insbesondere Empirische Wirtschaftsforschung Musterlösung zur Klausur im Fach
MehrParametrische und nichtparametrische Tests
XIII. Nichtparametrische Tests Seite 1 Parametrische und nichtparametrische Tests Parametrische Tests: Hier wird eine bestimmte Verteilung vorausgesetzt, und getestet, ob die gewählten Parameter passen.
MehrStatistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
MehrDer χ 2 -Test (Chiquadrat-Test)
Der χ 2 -Test (Chiquadrat-Test) Der Grundgedanke Mit den χ 2 -Methoden kann überprüft werden, ob sich die empirischen (im Experiment beobachteten) Häufigkeiten einer nominalen Variable systematisch von
MehrHypothesentests für Erwartungswert und Median. für D-UWIS, D-ERDW, D-USYS und D-HEST SS15
Hypothesentests für Erwartungswert und Median für D-UWIS, D-ERDW, D-USYS und D-HEST SS15 Normalverteilung X N(μ, σ 2 ) : «X ist normalverteilt mit Erwartungswert μ und Varianz σ 2» pdf: f x = 1 2 x μ exp
MehrMathematische Statistik Aufgaben zum Üben. Schätzer
Prof. Dr. Z. Kabluchko Wintersemester 2016/17 Philipp Godland 14. November 2016 Mathematische Statistik Aufgaben zum Üben Keine Abgabe Aufgabe 1 Schätzer Es seien X 1,..., X n unabhängige und identisch
MehrEinführung in die Maximum Likelihood Methodik
in die Maximum Likelihood Methodik Thushyanthan Baskaran thushyanthan.baskaran@awi.uni-heidelberg.de Alfred Weber Institut Ruprecht Karls Universität Heidelberg Gliederung 1 2 3 4 2 / 31 Maximum Likelihood
MehrWillkommen zur Vorlesung Statistik (Master)
Willkommen zur Vorlesung Statistik (Master) Thema dieser Vorlesung: Verteilungen stetiger Zufallsvariablen Prof. Dr. Wolfgang Ludwig-Mayerhofer Universität Siegen Philosophische Fakultät, Seminar für Sozialwissenschaften
MehrKlausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2011/12. Aufgabe 1
Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Wintersemester 2011/12 Aufgabe 1 Übungsleiter
MehrMathematik für Biologen
Mathematik für Biologen Prof. Dr. Rüdiger W. Braun Heinrich-Heine-Universität Düsseldorf 19. Januar 2011 1 Nichtparametrische Tests Ordinalskalierte Daten 2 Test für ein Merkmal mit nur zwei Ausprägungen
Mehr2.4 Hypothesentests Grundprinzipien statistischer Hypothesentests. Hypothese:
2.4.1 Grundprinzipien statistischer Hypothesentests Hypothese: Behauptung einer Tatsache, deren Überprüfung noch aussteht (Leutner in: Endruweit, Trommsdorff: Wörterbuch der Soziologie, 1989). Statistischer
Mehr2 Wiederholung statistischer Grundlagen Schließende Statistik empirischen Information aus Stichprobenrealisation x von X
Hypothesentests Bisher betrachtet: Punkt- bzw. Intervallschätzung des unbekannten Mittelwerts Hierzu: Verwendung der 1 theoretischen Information über Verteilung von X empirischen Information aus Stichprobenrealisation
MehrStochastik für die Naturwissenschaften
Stochastik für die Naturwissenschaften Dr. C.J. Luchsinger 4. Zufallsgrösse X Literatur Kapitel 4 * Storrer: Kapitel (37.2)-(37.8), (38.2)-(38.3), (38.5), (40.2)-(40.5) * Stahel: Kapitel 4, 5 und 6 (ohne
MehrStatistische Grundlagen
Statistische Grundlagen 2 2.1 Motivation Dieses Kapitel gibt eine kurze Übersicht über die im weiteren Verlauf des Buches benötigten mathematischen und statistischen Grundlagen. Zu Beginn wird der Begriff
MehrEntscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten
Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 4.1 4. Statistische Entscheidungsverfahren Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten Beispiel:
Mehrfh management, communication & it Constantin von Craushaar fh-management, communication & it Statistik Angewandte Statistik
fh management, communication & it Folie 1 Überblick Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse... Folie 2 Überblick... Varianzanalyse
MehrAllgemeines zu Tests. Statistische Hypothesentests
Statistische Hypothesentests Allgemeines zu Tests Allgemeines Tests in normalverteilten Grundgesamtheiten Asymptotische Tests Statistischer Test: Verfahren Entscheidungsregel), mit dem auf Basis einer
MehrZweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz
Grundlage: Zweiseitiger Test für den unbekannten Mittelwert µ einer Normalverteilung bei unbekannter Varianz Die Testvariable T = X µ 0 S/ n genügt der t-verteilung mit n 1 Freiheitsgraden. Auf der Basis
Mehr