Analytics Grundlagen Variablen und Skalenniveaus : Photo Credit: Unsplash, Roman Mager Statistik
Was ist eigentlich eine Variable? Variable In der Datenanalyse wird häufig die Bezeichnung Variable verwendet. Der Begriff Variable bedeutet dasselbe wie Merkmal.
Was ist ein Merkmal? Merkmal Merkmale sind bestimmte Informationen (z.b. Alter, Interessen, ) über Personen, die Teil einer Personengruppe (Grundgesamtheit) sind, über die man mehr erfahren möchte. Unter Grundgesamtheit versteht man die Gesamtmenge aller Personen, über die eine Aussage getroffen werden soll (also die gesamte Zielgruppe).
Grundgesamtheit Tools zur Bestimmung der Grundgesamtheit Verbraucheranalyse (VA) https://online.mds6.de/mdso6/b4p.php Facebook Werbeplaner (enthält nur Personen, die bei FB sind) https://www.facebook.com/business/products/ads Gruner und Jahr Zählservice guj.zaehlservice.de/perl/index.pl Übersicht über verschiedene Zielgruppenmodelle www.verbraucheranalyse.de/publikationen/zielgruppenmodelle
Was bedeutet Ausprägung? Merkmalsausprägung Photo Credit: Unsplash, Helloquence Bei einer Befragung ist ein Merkmal einfach eine gestellte Frage in einem Fragebogen (z.b. Alter, Geschlecht, Nutzung digitaler Medien, )..
Was bedeutet Ausprägung? Merkmalsausprägung Photo Credit: Unsplash, Helloquence Merkmale haben unterschiedliche Ausprägungen. Das Merkmal Haarfarbe kann beispielsweise die Ausprägungen braun, brünett, haben.
Variablen haben Skalenniveaus Skalenniveau Welche Berechnungen mit Variablen durchgeführt werden können, hängt von deren Skalenniveau ab. Jede Variable hat ein sogenanntes Skalenniveau. Üblicherweise unterscheidet man zwischen 4 verschiedene Skalenniveaus: 1. Nominal 2. Ordinal 3. Intervall 4. Verhältnis
Skalenniveaus: Beispielhafte Fragen Nominal
Skalenniveaus Nominal Eine Variable ist nominalskaliert, wenn die möglichen Ausprägungen nur benannt werden können (sie haben eine Identität ). sind die Ausprägungen gleich oder unterschiedlich?
Skalenniveaus Nominal Es ist nicht möglich, die Werte in einer Rangfolge zu bringen. D.h. die Ausprägungen können nicht sortiert werden (z.b. von klein nach groß). sind die Ausprägungen gleich oder unterschiedlich?
Skalenniveaus Nominal Mit nominalskalierten Daten lassen sich keine Rechenoperationen (Addition, usw.) durchführen, sondern nur Aussagen über Häufigkeiten machen (z.b. wie viele Personen sind weiblich oder männlich?). Beispiele: Geschlecht, Haarfarbe, Augenfarbe, Nationalität, Geburtstort, Telefonnummer,
Skalenniveaus: Beispielhafte Fragen Ordinal
Skalenniveaus Ordinal Eine Variable ist ordinalskaliert, wenn die möglichen Ausprägungen in eine Rangfolge gebracht werden können. ist eine Ausprägung gleich, kleiner oder größer als eine andere?
Skalenniveaus Ordinal Die Abstände zwischen den Werten sind jedoch ohne Aussagekraft. D.h. es kann nicht bestimmt werden, wieviel besser/schlechter eine Ausprägung im Vergleich zu einer anderen ist. ist eine Ausprägung gleich, kleiner oder größer als eine andere?
Skalenniveaus Ordinal Werte können sortiert werden. Es können keine Rechenoperationen durchgeführt werden (z.b. Addition und Subtraktion). Beispiele: Schulnoten, Markenpräferenzen, Einstellungen,
Skalenniveaus Intervall Eine Intervallskala ist eine sinnvolle Rangordnung von Ausprägungen mit gleichen Abständen zwischen den Werten. wie groß ist die Differenz zwischen Ausprägungen?
Skalenniveaus Intervall Es gibt jedoch keinen natürlichen" Nullpunkt. D.h. der Nullpunkt ist willkürlich gesetzt (oftmals gibt es auch negative Werte). wie groß ist die Differenz zwischen Ausprägungen?
Skalenniveaus Intervall Es können zwar Angaben zur Größe von Unterschieden gemacht werden (zwischen 10 und 20 Grad Celsius beträgt der Unterschied 10 Grad), nicht jedoch zu Verhältnissen: 20 Grad Celsius ist nicht (physikalisch) doppelt so warm wie 10 Grad. Beispiele: Geburtsjahr, Raumtemperatur in Celsius
Skalenniveaus Verhältnis Eine Verhältnisskala ist eine sinnvolle Ordnung von Messwerten mit gleichen Abständen. wie ist das Verhältnis zwischen Ausprägungen?
Skalenniveaus Verhältnis Der Nullpunkt ist natürlich. Eine Ausprägung von 0 bedeutet daher, dass der Messwert nicht vorhanden ist. Es existieren keine negativen Werte. wie ist das Verhältnis zwischen Ausprägungen?
Skalenniveaus Verhältnis Es können Aussagen über Verhältnisse getroffen werden. Beispielsweise ist eine 20 Jahre alte Person doppelt so alt wie eine 10 jährige Person. Beispiele: Alter, Körpergröße, Mediennutzung in Minuten.
Übersicht über die Skalenniveaus Skalenniveau Skalenniveau Operationen Interpretation Beispiele Nominalskala =/ gleich oder ungleich Geschlecht (Mann/Frau) Ordinalskala =/ ; </> kleiner, gleich oder größer Schulnoten (sehr gut, gut, ) Intervallskala =/ ; </>; +/ Bildung von Differenzen Temperatur (Celsius) Verhältnisskala =/ ; </>; +/ ; / Aussagen zu Verhältnissen Alter (Jahre), Körpergröße (cm)
Informationsgehalt Nicht metrische Daten Metrische Daten Messniveau Nominalniveau Ordinalniveau Intervallniveau Verhältnis-/ Relationsniveau Beschreibung der Messwerteigenschaften Bestimmung von Gleichheit und Ungleichheit (z.b: A B) Zusätzlich: Bestimmung einer Rangfolge (z.b. A<B) Zusätzlich: Gleiche Intervalle zwischen den Messwerten und willkürlicher Nullpunkt (z.b. (10-5) (15-10)) Zusätzlich: Bestimmung von Verhältnissen und natürlicher Nullpunkt (z.b. (A B) (A=2B) Identität Rang Abstand Verhältnis x x x x x x x x x x Beispiele für Variablen Geschlecht, Wochentag, Schulnoten, Präferenzen, Temperatur, Kalenderzeit, Gewicht, Alter, Umsatz,
Beispiel Skalenniveaus In einer Umfrage wurden 15 Personen nach ihrem Familienstand befragt Photo Credit: Unsplash, Helloquence Variable bzw. Merkmal = Familienstand Ausprägung = ledig, verheiratet, geschieden, verwitwet.
Frage: Skalenniveau Welches Skalenniveau hat die Variable Familienstand? Photo Credit: Unsplash, Roman Mager Folgende Informationen haben wir durch die Befragung erhalten: Ausprägung = 8 ledig, 4 verheiratet, 2 geschieden, 1 verwitwet.
Frage: Skalenniveau Antwort: Skalenniveau = Nominal. Merkmalsausprägung Häufigkeit Verheiratet 4 Ledig 8 Geschieden 2 Verwitwet 1
Wiederholungsfragen l In einem Fragebogen wurden die unten aufgeführten Merkmale erhoben. Bitte geben Sie jeweils das entsprechende Skalenniveau pro Merkmal an: 1. Körpergröße : _ 2. Alter: _ 3. Geschlecht: _ 4. Note in dem Fach Sport: _ 5. Punkte (0-100) in der letzten Deutsch-Prüfung: _ 6. Nationalität: _ 7. Telefonnummer: _ 8. Studiengang: _ 9. monatliche Miete in Euro: _ 10. Entfernung zwischen Wohnung und Arbeitsstätte (in Meter): _ 28