1 Keine Angst vor Daten



Ähnliche Dokumente
Import und Export von Übergängern

Historical Viewer. zu ETC5000 Benutzerhandbuch 312/15

Bedienungsanleitung Anlassteilnehmer (Vereinslisten)

AutoCAD Dienstprogramm zur Lizenzübertragung

SCHRITT 1: Öffnen des Bildes und Auswahl der Option»Drucken«im Menü»Datei«...2. SCHRITT 2: Angeben des Papierformat im Dialog»Drucklayout«...

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Handbuch Fischertechnik-Einzelteiltabelle V3.7.3

MdtTax Programm. Programm Dokumentation. Datenbank Schnittstelle. Das Hauptmenü. Die Bedienung des Programms geht über das Hauptmenü.

P&P Software - Adressexport an Outlook 05/29/16 14:44:26

Outlook. sysplus.ch outlook - mail-grundlagen Seite 1/8. Mail-Grundlagen. Posteingang

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

In diesem Thema lernen wir die Grundlagen der Datenbanken kennen und werden diese lernen einzusetzen. Access. Die Grundlagen der Datenbanken.

Antolin-Titel jetzt automatisch in WinBIAP kennzeichnen

Arbeiten mit UMLed und Delphi

Der neue persönliche Bereich/die CommSy-Leiste

Erstellen von x-y-diagrammen in OpenOffice.calc

Professionelle Seminare im Bereich MS-Office

Kommunikations-Management

teamsync Kurzanleitung

Anleitung über den Umgang mit Schildern

An-/Abwesenheitsplaner Überstunden verwalten

ACDSee Pro 2. ACDSee Pro 2 Tutorials: Übertragung von Fotos (+ Datenbank) auf einen anderen Computer. Über Metadaten und die Datenbank

Abamsoft Finos im Zusammenspiel mit shop to date von DATA BECKER

Anleitung zur Erstellung von Serienbriefen (Word 2003) unter Berücksichtigung von Titeln (wie Dr., Dr. med. usw.)

Monatstreff für Menschen ab 50 Temporäre Dateien / Browserverlauf löschen / Cookies

Datenexport aus JS - Software

Umwandeln und Exportieren von Adobe-Illustrator-Dateien in Illustrator für Artcut

Daten-Synchronisation zwischen dem ZDV-Webmailer und Outlook ( ) Zentrum für Datenverarbeitung der Universität Tübingen

Anleitung für die Formularbearbeitung

Matrix42. Use Case - Sicherung und Rücksicherung persönlicher Einstellungen über Personal Backup. Version September

Elexis-BlueEvidence-Connector

Programm GArtenlisten. Computerhinweise

Wie Sie mit Mastern arbeiten

Handbuch ECDL 2003 Basic Modul 7 Abschnitt 1: Information Kopieren aus dem Browser

Anton Ochsenkühn. amac BUCH VERLAG. Ecxel für Mac. amac-buch Verlag

SJ OFFICE - Update 3.0

Stammdatenanlage über den Einrichtungsassistenten

1. Schritt: Export Datei im Fidelio erstellen

ecall sms & fax-portal

Erstellen der Barcode-Etiketten:

Browsereinstellungen für moneycheck24 in Explorer unter Windows

1 Einleitung. Lernziele. Symbolleiste für den Schnellzugriff anpassen. Notizenseiten drucken. eine Präsentation abwärtskompatibel speichern

M A I L I N G. Michèle Kissling Check-In Data AG

Anleitung für den Elektronischen Lesesaal der Martin-Opitz Bibliothek

Treppensoftware Programme. Hilfe - 3D Plus Online. konstruieren/präsentieren

Einstellen der Makrosicherheit in Microsoft Word

GalBIB. TSB - Titelstamm Bibliographie. Mit dieser Erweiterung können:

CodeSaver. Vorwort. Seite 1 von 6

Mit dem sogenannten Seriendruck können Etiketten und Briefe mit einer Adressdatei (z. B. Excel) verknüpft werden.

1 Die Bado Schleswig-Holstein

Installation von Druckern auf dem ZOVAS-Notebook. 1. Der Drucker ist direkt mit dem Notebook verbunden

Anleitung, WebRecherche

etoken mit Thunderbird verwenden

Schnelleinstieg. Datenimport für die EXPOSÉ - Familie. Import von Adress / Objektdaten aus MS Excel. = Datenintegration aus anderen Lösungen

Kurzanleitung fu r Clubbeauftragte zur Pflege der Mitgliederdaten im Mitgliederbereich

E Mail Versand mit der Schild NRW Formularverwaltung

104 WebUntis -Dokumentation

Wie man Registrationen und Styles von Style/Registration Floppy Disketten auf die TYROS-Festplatte kopieren kann.

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Folgeanleitung für Fachlehrer

Standard-Formatvorlagen in WORD und WRITER

A. Ersetzung einer veralteten Govello-ID ( Absenderadresse )

Anleitung für den Zugriff auf Mitgliederdateien der AG-KiM

Anbindung des eibport an das Internet

Export von Kontaktdaten aus FDISK und Import in Outlook

Stundenerfassung Version 1.8 Anleitung Arbeiten mit Replikaten

Microsoft PowerPoint 2013 Folien gemeinsam nutzen

Datensicherung und Wiederherstellung

Updatehinweise für die Version forma 5.5.5

Microsoft Access 2010 Navigationsformular (Musterlösung)

mobilepoi 0.91 Demo Version Anleitung Das Software Studio Christian Efinger Erstellt am 21. Oktober 2005

Windows 7 Winbuilder USB Stick

1. Aktionen-Palette durch "Fenster /Aktionen ALT+F9" öffnen. 2. Anlegen eines neuen Set über "Neues Set..." (über das kleine Dreieck zu erreichen)

Anwendertreffen 20./21. Juni

Übernahme von Daten aus einem bestehenden Outlook-Profil bzw. einem anderen Exchange Server

In diesem Tutorial lernen Sie, wie Sie einen Termin erfassen und verschiedene Einstellungen zu einem Termin vornehmen können.

Installation von Updates

Installation der Eicon Diva PCI Karte unter Windows XP

L10N-Manager 3. Netzwerktreffen der Hochschulübersetzer/i nnen Mannheim 10. Mai 2016

Stellen Sie bitte den Cursor in die Spalte B2 und rufen die Funktion Sverweis auf. Es öffnet sich folgendes Dialogfenster

Einrichtung des Cisco VPN Clients (IPSEC) in Windows7

1. Einführung. 2. Vorbereiten der Excel-Datei

COMPUTERIA VOM SERIENBRIEFE UND ETIKETTENDRUCK

Er musste so eingerichtet werden, dass das D-Laufwerk auf das E-Laufwerk gespiegelt

Klicken Sie auf Weiter und es erscheint folgender Dialog

Primzahlen und RSA-Verschlüsselung

Datenbanken Kapitel 2

Anwendungsbeispiele Beispielszenario:

Die Beschreibung bezieht sich auf die Version Dreamweaver 4.0. In der Version MX ist die Sitedefinition leicht geändert worden.

So gehts Schritt-für-Schritt-Anleitung

Tutorial: Gnumeric installieren und Jahres-Kostenübersicht erstellen mit Diagramm

Dokumentation FileZilla. Servermanager

Einzel- s und unpersönliche Massen-Mails versenden

Datenaufbereitung in SPSS. Daten zusammenfügen

Anwendungsbeispiele Buchhaltung

3a Open BIM Workflow - Import und Weiterbearbeitung

Erstellen einer Collage. Zuerst ein leeres Dokument erzeugen, auf dem alle anderen Bilder zusammengefügt werden sollen (über [Datei] > [Neu])

Zur drittletzten Zeile scrollen

Dokumentation zur Versendung der Statistik Daten

euro-bis Import von Bestellungen aus Buch- und Aboauskunft Stand

Transkript:

1 Keine Angst vor Daten In der Statistik hat man mit Daten zu tun. Wir werden in diesem Abschnitt zunächst klären, welches Format statistische Daten üblicherweise besitzen und wie mit diesen Daten gearbeitet wird. Da statistische Daten oft sehr umfangreich sein können, ist es sinnvoll, derartige Daten in eigenen Files abzulegen. Wir werden in diesem Abschnitt zeigen, wie solche Files in einen eigenen Datenordner abgespeichert und von dort wieder aufgerufen werden können. In vielen Fällen werden statistische Daten mit anderen Computerprogrammen erstellt bzw sollen anschließend mit anderen Computerprogrammen weiter verarbeitet werden. Wir werden in diesem Abschnitt zeigen, wie statistische Daten von Mathematica in MS-Excel exportiert bzw statistische Daten aus MS-Excel in Mathematica importiert werden. 1.1 Statistische Daten Wir beginnen mit einer für die Statistik wichtigen Begriffsbildung, an die wir uns im folgenden streng halten: 1.1.1 Begriffsbildung: Statistische Daten werden stets in Form einer Matrix (Datenmatrix) angegeben. Eine Datenmatrix hat dabei stets die folgende Form: In der ersten Zeile der Datenmatrix stehen die Namen der beobachteten Merkmale. Jede weitere Zeile der Datenmatrix enthält die an einem einzelnen Objekt - man spricht von einem Fall - ermittelten Werte dieser Merkmale. Jede Spalte der Datenmatrix nennt man eine Variable. Die einzelnen Variablen entsprechen somit den beobachteten Merkmalen. Neben dem Namen des jeweiligen Merkmals enthält eine Variable jeweils die an den einzelnen Objekten ermittelten Werte dieses Merkmals - man nennt die Liste dieser Werte die zu diesem Merkmal gehörende Stichprobe. Handelt es sich bei den Werten eines Merkmals um Zahlen (mit denen sich sinnvoll rechnen lässt), so spricht man von einem quantitativen Merkmal; handelt es sich bei diesen Werten hingegen um Strings (Zahlen, mit denen nicht sinnvoll gerechnet werden kann, fasst man dabei ebenfalls als Strings auf), so spricht man von einem qualitativen Merkmal. Fehlende Einträge werden in Mathematica mit "Null" gekennzeichnet. Im folgenden Beispiel wird für einige ausgewählte Regionen des Staates Georgia das Pro-Kopf Einkommen, die Arbeitlosenrate, die Art der Region und die Anzahl der Einwohner in Form einer Datenmatrix angegeben:

2 01_Keine_Angst_vor_Daten.nb Region Einkommen Arbeitslosenrate Art Einwohner Bryan 10 826 4.8 Land 15 438 Bulloch 12 767 4.0 Land 43 125 Jenkins 11 920 6.0 Land 8247 Liberty 11 470 Null Land 52 745 Montgomery 13 357 7.0 Stadt 7163 Treutlen 11 684 Null Land 5994 Wheeler 12 144 4.6 Land 4903 Abgesehen von der ersten Zeile mit den Namen der beobachteten Merkmale, entsprechen die Zeilen den ausgewählten Regionen. Bei den Merkmalen Region und Art handelt es sich um qualitative Merkmale; bei den Merkmalen Einkommen, Arbeitslosenrate und Einwohner handelt es sich um quantitative Merkmale. Für die Regionen Liberty und Treutlen ist die Arbeitslosenrate nicht bekannt. Bei der zum Merkmal Arbeitslosenrate gehörenden Stichprobe handelt es sich um die Liste 84.8, 4.0, 6.2, 6.1, 4.4, 6.9, 7.9, 6.0,, 3.2, 7.0, 6.3, 5.7, 6.6,, 4.6<. Um mit dieser Datenmatrix tatsächlich arbeiten zu können, müssen wir sie in der üblichen Weise in Mathematica eingeben (wobei wir dieser Datenmatrix den Namen georgia geben): georgia == 88Region, Einkommen, Arbeitslosenrate, Art, Einwohner<, 8Bryan, 10 826, 4.8, Land, 15 438<, 8Bulloch, 12 767, 4.0, Land, 43 125<, 8Candler, 14 214, 6.2, Stadt, 7744<, 8Chatham, 18 204, 6.1, Stadt, 216 935<, 8Effingham, 13 199, 4.4, Land, 25 687<, 8Emanuel, 12 682, 6.9, Stadt, 20 546<, 8Evans, 15 304, 7.9, Stadt, 8724<, 8Jenkins, 11 920, 6., Land, 8247<, 8Liberty, 11 470,, Land, 52 745<, 8Long, 8922, 3.2, Land, 6202<, 8Montgomery, 13 357, 7., Stadt, 7163<, 8Screven, 12 610, 6.3, Land, 13 842<, 8Tattnall, 14 665, 5.7, Stadt, 17 722<, 8Toombs, 14 963, 6.6, Stadt, 24 072<, 8Treutlen, 11 684,, Land, 5994<, 8Wheeler, 12 144, 4.6, Land, 4903<<; Mit dem Befehl TableForm lässt sich diese Datenmatrix in Form einer übersichtlichen Tabelle ausgeben (mit der Option TableSpacing lassen sich die Abstände zwischen den einzelnen Zeilen und Spalten einstellen): TableForm@georgia, TableSpacing Æ 80.5, 3<D Region Einkommen Arbeitslosenrate Art Einwohner Bryan 10 826 4.8 Land 15 438 Bulloch 12 767 4. Land 43 125 Jenkins 11 920 6. Land 8247 Liberty 11 470 Null Land 52 745 Montgomery 13 357 7. Stadt 7163 Treutlen 11 684 Null Land 5994 Wheeler 12 144 4.6 Land 4903 Mit dem Befehl Rest wird die erste Zeile dieser Datenmatrix (also jene Zeile, in der sich die Namen der einzelnen Variablen befinden) weggelassen:

01_Keine_Angst_vor_Daten.nb 3 TableForm@Rest@georgiaD, TableSpacing Æ 80.5, 3<D Bryan 10 826 4.8 Land 15 438 Bulloch 12 767 4. Land 43 125 Jenkins 11 920 6. Land 8247 Liberty 11 470 Null Land 52 745 Montgomery 13 357 7. Stadt 7163 Treutlen 11 684 Null Land 5994 Wheeler 12 144 4.6 Land 4903 Mit dem Befehl Part lassen sich gezielt Fälle der Datenmatrix aufrufen. Der folgende Befehl ruft beispielsweise den 3-ten, 5-ten, 10-ten und 12-ten Fall der Datenmatrix georgia auf: TableForm@Part@Rest@georgiaD, 83, 5, 10, 12<D, TableSpacing Æ 80.5, 3<D Mit dem Befehl Part lassen sich aber auch gezielt Variable der Datenmatrix aufrufen. Der folgende Befehl ruft beispielsweise die 1-te, 2-te und 5-te Variable der Datenmatrix georgia auf: TableForm@Part@georgia, All, 81, 2, 5<D, TableSpacing Æ 80.5, 3<D Region Einkommen Einwohner Bryan 10 826 15 438 Bulloch 12 767 43 125 Candler 14 214 7744 Chatham 18 204 216 935 Effingham 13 199 25 687 Emanuel 12 682 20 546 Evans 15 304 8724 Jenkins 11 920 8247 Liberty 11 470 52 745 Long 8922 6202 Montgomery 13 357 7163 Screven 12 610 13 842 Tattnall 14 665 17 722 Toombs 14 963 24 072 Treutlen 11 684 5994 Wheeler 12 144 4903 In Verbindung mit dem Befehl Rest kann mit dem Befehl Part auch die zu einem Merkmal gehörende Stichprobe aufgerufen werden. So ruft etwa der folgende Befehl die zum 3-ten Merkmal (Arbeitslosenrate) gehörige Stichprobe der Datenmatrix georgia auf: Part@Rest@georgiaD, All, 3D 84.8, 4., 6.2, 6.1, 4.4, 6.9, 7.9, 6., Null, 3.2, 7., 6.3, 5.7, 6.6, Null, 4.6< 1.2 Schreiben und Lesen von Daten in Datenfiles Mit dem Befehl Directory lässt sich ermitteln, welchen Ordner Mathematica gerade als aktuellen Ordner verwendet

4 01_Keine_Angst_vor_Daten.nb Mit dem Befehl Directory lässt sich ermitteln, welchen Ordner Mathematica gerade als aktuellen Ordner verwendet (üblicherweise ist dies der Ordner "Eigene Dateien"). Möchte man einen anderen Ordner zum aktuellen Ordner machen, so kann dies mit dem Befehl SetDirectory erfolgen: à Directory@D zeigt den gerade aktuellen Ordner an à SetDirectory@" adresse "D macht den Ordner mit der Adresse adresse zum aktuellen Ordner (die Adresse eines Ordners findet man nach Öffnen dieses Ordners in der zugehörigen Adressleiste - es ist ratsam, diese Adresse mit Copy und Paste in den Befehl SetDirectory einzusetzen, wobei im dabei erscheinenden Dialogfeld "No" auszuwählen ist und auf die Anführungszeichen nicht vergessen werden darf). Wir ermitteln den derzeit aktuellen Ordner: Directory@D C:\Dokumente und Einstellungen\Efrosinin\Eigene Dateien Wir kommen überein, Datenfiles jeweils im Datenordner (dieser befindet sich im Ordner "Statistik") abzulegen. Dazu müssen wir diesen Datenordner zum aktuellen Ordner machen. Die Adresse dieses Ordners ist üblicherweise von Computer zu Computer verschieden und daher individuell einzugeben! Auf dem Computer, mit dem dieser Lehrgang erstellt wurde, geschieht dies mit dem Befehl SetDirectory@$UserDocumentsDirectoryD C:\Dokumente und Einstellungen\Efrosinin\Eigene Dateien Damit haben wir den Datenordner zum aktuellen Ordner erklärt: Directory@D D:\work\Lehre\Seminar\WTMS_SS2014 Um Schwierigkeiten zu vermeiden, führe man jetzt die beiden folgenden Schritte durch: Man ersetze in der folgenden Zelle die Adresse durch die Adresse des Datenordners im gerade verwendeten Computer, mache diese Zelle zu einer initialisierenden Zelle (man aktiviere dazu diese Zelle und wähle anschließend im Menü Cell - Cell Properties die Option "Initialization Cell") und evaluiere diese Zelle: SetDirectory@$UserDocumentsDirectoryD; Man ersetze anschließend in allen mit pfad gekennzeichneten Notebooks des Ordners Statistik die unter dem jeweiligen Titel versteckte erste Zelle durch die eben geeignet abgeänderte Zelle. Wird daraufhin mit diesen Notebooks gearbeitet, so wird der Datenordner stets automatisch zum aktuellen Ordner erklärt. Daten lassen sich mit dem Befehl Put in Dateien schreiben und mit dem Befehl Get aus Dateien einlesen: à Put@daten, "datenfile"d oder einfach daten >> datenfile schreibt das Datenmaterial daten in das File datenfile des aktuellen Ordners. Wir kommen überein, jeweils nur ein einziges Datenmaterial daten in ein File zu schreiben und diesem File den Namen datenfile zu geben.

01_Keine_Angst_vor_Daten.nb 5 ein einziges Datenmaterial daten in ein File zu schreiben und diesem File den Namen datenfile zu geben. à Get@"datenfile"D oder einfach << datenfile liest das im File datenfile des aktuellen Ordners befindliche Datenmaterial daten ein. Wir schreiben die Datenmatrix georgia unter Verwendung von Put (bzw >>) in das File georgiafile: georgia >> georgiafile Wir lesen die im File georgiafile gespeicherte Datenmatrix unter Verwendung von Get (bzw >>) ein: << georgiafile 88Region, Einkommen, Arbeitslosenrate, Art, Einwohner<, 8Bryan, 10 826, 4.8, Land, 15 438<, 8Bulloch, 12 767, 4., Land, 43 125<, 8Candler, 14 214, 6.2, Stadt, 7744<, 8Chatham, 18 204, 6.1, Stadt, 216 935<, 8Effingham, 13 199, 4.4, Land, 25 687<, 8Emanuel, 12 682, 6.9, Stadt, 20 546<, 8Evans, 15 304, 7.9, Stadt, 8724<, 8Jenkins, 11 920, 6., Land, 8247<, 8Liberty, 11 470, Null, Land, 52 745<, 8Long, 8922, 3.2, Land, 6202<, 8Montgomery, 13 357, 7., Stadt, 7163<, 8Screven, 12 610, 6.3, Land, 13 842<, 8Tattnall, 14 665, 5.7, Stadt, 17 722<, 8Toombs, 14 963, 6.6, Stadt, 24 072<, 8Treutlen, 11 684, Null, Land, 5994<, 8Wheeler, 12 144, 4.6, Land, 4903<< Wir lesen unter Verwendung der Befehle Get und Cases nur jene Fälle des Files georgiafile ein, welche bei der Variablen "Art" als Stadt gekennzeichnet sind und geben diese Daten mittels TableForm tabellarisch aus: TableForm@Cases@<< georgiafile, 8x_, y_, z_, Stadt, u_<d, TableSpacing Æ 80.5, 3<D Montgomery 13 357 7. Stadt 7163 1.3 Exportieren und Importieren von statistischen Daten Ein in Mathematica vorliegendes statistisches Datenmaterial lässt sich mit dem Befehl Export in einer MS-Excel Datei ablegen. Ein in einer MS-Excel Datei abgelegtes statistisches Datenmaterial lässt sich mit dem Befehl Import in Mathematica einlesen (man beachte, dass die beiden Befehle Export und Import in dieser Form erst ab Version 6.0 unterstützt werden). Näheres dazu findet man im Tutorial tutorial/importing and Exporting Data. à Export@"daten.xls", datend legt das Datenmaterial daten im MS-Excel File daten.xls des aktuellen Ordners ab. à Import@"daten.xls"D@@1DD liest das im MS-Excel File daten.xls des aktuellen Ordners abgelegte Datenmaterial ein (da der Befehl Import das Datenmaterial mit einer zusätzlichen Klammer umgibt, ist der Ausdruck @@1DD erforderlich). Wir legen das Datenmaterial georgia in der MS-Exel Datei georgia.xls ab: Export@"georgia.xls", georgiad; Wir lesen das in der MS-Excel Datei stahl.xls abgelegte Datenmaterial ein und nennen dieses Datenmaterial stahlxls. Da dieses Datenmaterial sehr umfangreich ist, listen wir von diesem Datenmaterial (unter Verwendung von

6 01_Keine_Angst_vor_Daten.nb stahlxls. Da dieses Datenmaterial sehr umfangreich ist, listen wir von diesem Datenmaterial (unter Verwendung von Take) nur die Namen der Variablen zusammen mit den ersten 4 Fällen auf: stahlxls = Import@"stahl.xls"D@@1DD; TableForm@Take@stahlxls, 5D, TableSpacing Æ 80.5, 3<D Sorte Kohlenstoff Zugfestigkeit A 42. 686. A 42. 725. B 46. 752. B 46. 823. Man beachte, dass dabei Strings Mathematica-intern stets mit Anführungszeichen " " versehen werden. Dies ist zu beachten, wenn aus Exel importierte Files weiter behandelt werden. Obwohl sich etwa das im File stahlfile abgelegte Datenmaterial stahl auf den ersten Blick nicht vom gerade importierten Datenmaterial stahlxls unterscheidet TableForm@Take@<< stahlfile, 5D, TableSpacing Æ 80.5, 3<D Sorte Kohlenstoff Zugfestigkeit A 42. 686. A 42. 725. B 46. 752. B 46. 823. sind diese beiden Datenmaterialien nicht! identisch stahlxls === << stahlfile False