Erfahrungen mit SAS bei statistischen Problemlösungen und Erarbeitung von Lehrmaterialien in der Humanbiologie



Ähnliche Dokumente
4. Erstellen von Klassen

OECD Programme for International Student Assessment PISA Lösungen der Beispielaufgaben aus dem Mathematiktest. Deutschland

Korrelation (II) Korrelation und Kausalität

Aussage: Das Seminar ist hilfreich für meine berufliche Entwicklung

Meinungen der Bürgerinnen und Bürger in Hamburg und Berlin zu einer Bewerbung um die Austragung der Olympischen Spiele

Lineargleichungssysteme: Additions-/ Subtraktionsverfahren

Screening Das Programm. zur Früherkennung von Brustkrebs

Berechnung der Erhöhung der Durchschnittsprämien

Umfrage der Klasse 8c zum Thema "Smartphones"

Politikverständnis und Wahlalter. Ergebnisse einer Studie mit Schülern und Studienanfängern

50. Mathematik-Olympiade 2. Stufe (Regionalrunde) Klasse Lösung 10 Punkte

Info zum Zusammenhang von Auflösung und Genauigkeit

Private Altersvorsorge

Daten sammeln, darstellen, auswerten

ONLINE-AKADEMIE. "Diplomierter NLP Anwender für Schule und Unterricht" Ziele

Seite 1 von 7. Anlage 1. Erstes Anschreiben an den/die Beschäftigte/ -n. Frau/Herrn Vorname Name Straße PLZ Ort

Die Näherung durch die Sekante durch die Punkte A und C ist schlechter, da der Punkt C weiter von A entfernt liegt.

Mobile Intranet in Unternehmen

Statistische Auswertung:

Das Vermögen der privaten Haushalte in Nordrhein-Westfalen ein Überblick auf der Basis der Einkommens- und Verbrauchsstichprobe

Individuelles Qualifikationsprofil für

Diese Broschüre fasst die wichtigsten Informationen zusammen, damit Sie einen Entscheid treffen können.

1 topologisches Sortieren

Vermögensbildung: Sparen und Wertsteigerung bei Immobilien liegen vorn

Professionelle Diagramme mit Excel 2010 erstellen. Peter Wies. 1. Ausgabe, 2. Aktualisierung, März Themen-Special W-EX2010DI

Behörde für Bildung und Sport Abitur 2008 Lehrermaterialien zum Leistungskurs Mathematik

2. Psychologische Fragen. Nicht genannt.

mehrmals mehrmals mehrmals alle seltener nie mindestens **) in der im Monat im Jahr 1 bis 2 alle 1 bis 2 Woche Jahre Jahre % % % % % % %

Plotten von Linien ( nach Jack Bresenham, 1962 )

Professionelle Seminare im Bereich MS-Office

Deutliche Mehrheit der Bevölkerung für aktive Sterbehilfe

3.9 Brustdrüse der Frau

Welche Gedanken wir uns für die Erstellung einer Präsentation machen, sollen Ihnen die folgende Folien zeigen.

Quadratische Gleichungen

1.3 Die Beurteilung von Testleistungen

Hilfedatei der Oden$-Börse Stand Juni 2014

QM: Prüfen -1- KN

Erfahrungen mit Hartz IV- Empfängern

Dokumentation. estat Version 2.0

Statistische Auswertung der Bevölkerungsentwicklung

Monatliche Grundgebühr: 5,00 Zeitabhängige Nutzung: Feiertags/Sonntags: 0,04 /min

Erstellen von x-y-diagrammen in OpenOffice.calc

Verband der TÜV e. V. STUDIE ZUM IMAGE DER MPU

Wenn Sie am Grauen Star leiden, haben wir die Linse für Sie mit der Sie wieder ohne Brille in die Ferne UND Nähe sehen können!

6 Schulungsmodul: Probenahme im Betrieb

Satzhilfen Publisher Seite Einrichten

Fragebogen Weisse Liste-Ärzte

Download. Mathematik üben Klasse 8 Funktionen. Differenzierte Materialien für das ganze Schuljahr. Jens Conrad, Hardy Seifert

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Intrinsisch motivierte Mitarbeiter als Erfolgsfaktor für das Ideenmanagement: Eine empirische Untersuchung

Selbstcheck: Praktiziere ich einen gesundheitsförderlichen Führungsstil?

Tutorium zur Mikroökonomie II WS 02/03 Universität Mannheim Tri Vi Dang. Aufgabenblatt 3 (KW 44) ( )

Unterrichtsmaterialien in digitaler und in gedruckter Form. Auszug aus: Übungsbuch für den Grundkurs mit Tipps und Lösungen: Analysis

Erwiderung zur Stellungnahme der Flughafen GmbH zum NOA4-Bericht vom

1 Mathematische Grundlagen

1 Einleitung. 1.1 Motivation und Zielsetzung der Untersuchung

Im Jahr t = 0 hat eine Stadt Einwohner. Nach 15 Jahren hat sich die Einwohnerzahl verdoppelt. z(t) = at + b

Neomentum Coaching. Informationsbroschüre für Studienteilnehmer

Glaube an die Existenz von Regeln für Vergleiche und Kenntnis der Regeln

Deutschland-Check Nr. 35

Mathematischer Vorbereitungskurs für Ökonomen

Webalizer HOWTO. Stand:

Umsatz-Kosten-Treiber-Matrix Woodmark Consulting AG

Was bedeutet Inklusion für Geschwisterkinder? Ein Meinungsbild. Irene von Drigalski Geschäftsführerin Novartis Stiftung FamilienBande.

Anwendungshinweise zur Anwendung der Soziometrie

Ein neues System für die Allokation von Spenderlungen. LAS Information für Patienten in Deutschland

Auswertung des Jahresabschlusses Bilanzanalyse 2

Informationsblatt Induktionsbeweis


Kreativ visualisieren

Melanie Kaspar, Prof. Dr. B. Grabowski 1

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Qualitätsbereich. Mahlzeiten und Essen

Grundlagenschulung. Zweck und Ziel der Marktforschung. grundsätzliche Abgrenzung zum Direktvertrieb. Schulungsprototyp

einkommenssteuerbelastung seit 1990 gesunken

II. Zum Jugendbegleiter-Programm

Protokoll der Sitzung des LAK Bildung am in Nürnberg

Projektzeit erfassen. Allgemeines. Projektzeit erfassen - Maske. Erklärung der Tabellenspalten. In Arbeit!

Geyer & Weinig: Service Level Management in neuer Qualität.

Feiertage in Marvin hinterlegen

Zusammenfassende Beurteilung der Unterrichtsbeispiele für Wirtschaft und Recht

Das NEUE Leistungspaket der Sozialversicherung. Mehr Zahngesundheit für Kinder und Jugendliche bis zum 18. Lebensjahr. Fragen und Antworten

Auswertung JAM! Fragebogen: Deine Meinung ist uns wichtig!

4. Das neue Recht der GmbH ein Überblick

Offenlegung nach 7 Instituts-Vergütungsverordnung. TeamBank AG. Inhalt

Osteoporose. Ein echtes Volksleiden. Schon jetzt zählen die Osteoporose und die damit verbundene erhöhte Brüchigkeit der Knochen

Orientierungstest für angehende Industriemeister. Vorbereitungskurs Mathematik

Bundeszentrale für gesundheitliche Aufklärung Bekanntheit, Kauf und Konsum von Alcopops in der Bundesrepublik Deutschland 2003

Gussnummern-Lesesystem

Festigkeit von FDM-3D-Druckteilen

Grundlagen verteilter Systeme

Mikroökonomik 9. Vorlesungswoche

Anwendertreffen 20./21. Juni

Sehr geehrter Herr Pfarrer, sehr geehrte pastorale Mitarbeiterin, sehr geehrter pastoraler Mitarbeiter!

Weiterbildungen 2014/15

DemTect. Vorgehen. Beurteilung. 58 DemTect

BMV Visionen Ergebnisbericht der Mitglieder Befragung

Transkript:

128 Erfahrungen mit SAS bei statistischen Problemlösungen und Erarbeitung von Lehrmaterialien in der Humanbiologie Holle Greil (Universität Potsdam, Humanbiologie) Andreas Baudisch (Humboldt Universität zu Berlin, Rechenzentrum) Wolf F. Lesener (Humboldt Universität zu Berlin, Rechenzentrum) Arbeiten zur Erforschung der Variabilität der körperlichen Entwicklung von Menschen in Abhängigkeit von den unterschiedlichsten genetischen und umweltbedingten Einflüssen nehmen in der Humanbiologie einen breiten Raum ein. Wesentlichste Untersuchungsmethode ist dabei die Anthropometrie, die Menschenmessung. Im einfachsten Fall werden Körpermaße an den Probanden einer definierten Stichprobe mit einem standardisierten Instrumentarium bestimmt und statistisch ausgewertet, um zu allgemeingültigen Aussagen zu gelangen. Eine geeignete Archivierung der Daten und ein schneller Zugriff sind wesentlich, weil oft erst im Vergleich zu früher erhobenen Daten eine Kausalanalyse möglich ist. Am Rechenzentrum der Humboldt- Universität sind alle seit 1967 von mir und meinen Mitarbeitern erhobenen anthropometrischen Meßdaten archiviert. Die ersten DV-Auswertungen wurden an einem Zeiss Rechen-Automaten ZRA1 vorgenommen. Nach mehreren Zwischenstufen erfolgte sowohl im Rechenzentrum als auch im Institut für Humanbiologie der Übergang zu SAS Software. Die wesentlich verkürzten Rechenzeiten und die Vielfältigkeit des Systems erlauben seitdem ein deutlich höheres Auswertungsniveau. Auch bei der raschen Umsetzung von Forschungsergebnissen zur Präsentation in der Lehre hat sich SAS bewährt, teilweise direkt und teilweise durch die guten Exportmöglichkeiten in andere Grafiksysteme. An einem klassischen anthropometrischen Beispiel - dem Zusammenhang zwischen der Körpermasse (Körpergewicht), der Körperhöhe (Körpergröße) und dem Alter im weiblichen Geschlecht - wird hier über Erfahrungen mit den SAS-Versionen 6.10, 6.11 und 6.12 auf SUN-Workstation und Pentium-PC (DESKPRO XL 5120) berichtet. Das Beispiel ist deshalb von breiterem Interesse, weil Übergewicht und Fettsucht in unserer Population ein durchaus ernst zu nehmendes Problem darstellen. Jährlich werden große Summen für ambulante Schlankheitsdiäten oder entsprechende kurative Behandlungen bzw. für die Behandlung fettsuchtbedingter Folgeerkrankungen ausgegeben, ohne daß dem Arzt oder dem betroffenen Patienten Tabellen zur Verfügung stehen, die auf wissenschaftlich fundierten und repräsentativen anthropometrischen Untersuchungen basieren und eine objektive Beurteilung der individuellen Körpermasse im Vergleich zu einem als gesündestes Gewicht definierten Optimalgewicht erlauben. Erste Schritte auf dem Weg zu bevölkerungsrelevanten Optimalgewichtstabellen sind statistische Analysen zur Klärung der Zusammenhänge zwischen Körpermasse, Geschlecht, Alter, Körperhöhe und Körperbautyp sowie die Erarbeitung spezifischer Normalgewichtstabellen. Hierbei hat sich in der Zusammenarbeit des Fachgebiets Humanbiologie der Universität Potsdam mit dem Rechenzentrum der Humboldt Universität zu Berlin die Nutzung von SAS bewährt, über die hier zu berichten ist. Als Ausgangsmaterial für die statistischen Analysen dienten die anthropometrischen Daten einer geschichteten Stichprobe von 17.802 Mädchen und Frauen aus allen neuen Bundesländern im Altersbereich von der Geburt bis zu 65 Jahren. Die Datensätze entsprachen den untersuchten Probanden. Je Datensatz waren mindestens 81 Merkmale dokumentiert, davon mindestens 34 Körpermaße. Zur Anwendung kamen

129 Rechenoperationen mit SAS-BASE (proc univariate) und SAS-STAT, Grafik mit SAS- GRAPH (proc gplot, proc g3d, proc gedit), Grafik mit SAS-INSIGHT (scatter-plot), Tabellen mit SAS-FSP (proc fsview) und Texte mit SAS-GRAPH (proc gslide). Mit SAS-INSIGHT erstellte Scatter-Plots erwiesen sich neben anderen Prüfverfahren als besonders geeignet zur Beurteilung und gegebenenfalls Revision von Outsider- Werten. Die Körpermasse verändert sich altersabhängig. Sie nimmt im weiblichen Geschlecht im Durchschnitt von der Geburt bis zu etwa 52 Jahren mit unterschiedlicher Geschwindigkeit zu. Erst nach Beendigung des fortpflanzungsfähigen Lebensalters beginnt mit etwa 52 Jahren bei Frauen eine langsame Massenabnahme, die bis zum Lebensende andauert. Im Unterschied zur Körpermasse ist das Wachstum der Körperhöhe im weiblichen Geschlecht bereits mit etwa 18 bis 20 Jahren beendet und mit 40 bis 45 Jahren beginnt eine alternsbedingte Körperhöhenreduktion, weil die Zwischenwirbelscheiben sich verändern. Abb. 1 zeigt anhand der Medianwerte diesen unterschiedlichen ontogenetischen Verlauf der beiden Körpermaße. Das Diagramm dokumentiert diese Abnahme der mittleren Körperhöhe mit zunehmendem Lebensalter bereits von 20 Jahren an. Dies ist ein Effekt der säkularen Akzeleration, der für unsere Bevölkerung bei jeder anthropologischen Querschnittstudie auftritt. Bei der Datenaufnahme wurden unterschiedlich alte Probandinnen relativ gleichzeitig gemessen. Da die durchschnittliche Körperhöhe in

Abb3 130

131 den Industrieländern seit mehr als 100 Jahren zugenommen hat, waren die heute älteren Frauen zur Zeit ihrer größten individuellen Körperhöhe in ihrem jungen Erwachsenenalter im Durchschnitt kleiner als junge Frauen heute. Dies ergibt in der Querschnittanalyse einen Summationseffekt zwischen individueller Alternsschrumpfung und säkularer Akzeleration. Innerhalb eines jeden Altersbereichs ist die Körpermasse von der Körperhöhe abhängig. Im 3D-Needle-Plot (Abb.2) läßt sich diese Abhängigkeit durch gezielte Farbauswahl didaktisch gut darstellen. Deutlich sichtbar werden die breiten Überlappungsbereiche der Körpermasse sowohl in den Körperhöhengruppen als auch in den Altersgruppen. Die 2D-Darstellung der Körpermasse zur Körperhöhe in Form eines Scatterplots vermittelt durch die Projektion aller individuellen Körperhöhen-Körpermassen-Beziehungen ebenfalls einen guten Eindruck von der Beziehung beider Merkmale zueinander und von der körperhöhenabhängigen Variabilität der Körpermasse (Abb. 3). Darüber hinaus besteht bei dieser Projektionsmethode die Möglichkeit, auffällige Datenpunkte anzuklicken und den gesamten Datensatz abzufragen. So läßt sich bei allen Extremwerten leicht überprüfen, ob es sich um einen Beobachtungs- oder Dokumentationsfehler handelt oder um real vorkommende Werte. Um praxiswirksam zu werden, muß die im Scatterplot gezeigte Variabilität auf körperhöhenabhängige Normalgewichte zurückgeführt werden. Dabei ist unter Normalgewicht der jeweils gruppenspezifische Medianwert der körperhöhenabhängigen Körpermasse zu verstehen. Für eine Darstellung dieses körperhöhenabhängigen Normalgewichts bieten sich die beiden in Abb. 4 wiedergegebenen Vorgehensweisen an. Man kann eine lineare Regression zwischen Körperhöhe und Körpermasse bilden oder man kann die Körperhöhe äquidistant skalieren, beispielsweise in Zentimeterabschnitte, und für jede entstehende Körperhöhengruppe den Medianwert der Körpermasse bilden. Sind anstelle von körperhöhenspezifischen Normalgewichten Normalgewichtsbereiche erwünscht, so lassen sich diese in beliebiger Breite prozentual bilden. In Abb. 4 wurde ein Bereich von P 50 ± 10 % gewählt. Möglich wäre auch ein Bereich von beispielsweise P40 bis P60. Die Wahl von Art und Breite der Normalgewichtsbereiche ist kein statistisches Problem. Sie muß fachspezifisch humanbiologisch entschieden werden. Die durch derartige Gruppierungen erhaltenen Normalgewichtsbereiche vermitteln einen guten Eindruck von der Realität. Es ergeben sich jedoch ohne Berücksichtigung des Alters besonders in den höheren Körperhöhengruppen durch das gemeinsame Vorkommen von hoch-schlankwüchsigen Kindern und kleinen bis mittelgroßen korpulenten Erwachsenen in ein und derselben Körperhöhengruppe sehr unregelmäßige Perzentilkurven, wie dies aus Abb. 4 ersichtlich ist. Die Einführung des Alters als zusätzliche Variable ist demnach auch bei dieser Auswertungsmethode unumgänglich. Bei der Bildung einer linearen Regression zwischen Körperhöhe und Körpermasse ohne Berücksichtigung des Alters wird die Unsinnigkeit Vorgehensweise auch biologische besonders deutlich. Im Bereich der unteren Grenze der Körperhöhenskala ist das Regressionmodell kaum verwendbar. Im Körperhöhenbereich um 70 cm geht das Regressionsgewicht gegen Null, und noch kleineren Babies wird sogar eine negative Körpermasse zugewiesen.

132

133 Durch die in Abb. 4 mit SAS-GRAPH (proc gplot) gegebene Darstellungsweise läßt sich die Forderung nach altersspezifischen Regressionen nachdrücklich demonstrieren. Eine Auswahl altersspezifischer Regressionsgeraden mit bivariaten Konfidenzellipsen mit einem Vertrauensbereich von 90 % verdeutlicht in Abb. 5 die Zusammenhänge zwischen den 3 Variablen Körpermasse, Körperhöhe und Alter. Während des Wachstumsalters nimmt der Steigungswinkel der Regressionsgeraden ständig zu, und auch im Erwachsenenalter bestehen deutliche Unterschiede zwischen den Gruppen der jüngeren und der älteren Frauen. Metrik-Index MI w = - 2,654 - (0,035 x Körperhöhe) + (0,164 x Brustkorbbreite) + (0,180 x Brustkorbtiefe) Eichung 1942 an saarländischen Landkrankenhauspatientinnen - 2 + 2 0 leptomorph metromorph pyknomorph Abb. 6 Mode of operation of the Metric-Index by Strömgren and Conrad MI male = - 0,365 - (0,040 x height) + (0,125 x thoracic breadth) + (0,154 x thoracic depth) MI female = - 2,654 - (0,035 x height) + (0,164 x thoracic breadth) + (0,180 x thoracic depth) Abb. 7 marked leptomorphe mod. leptomorphe metromorphe mod. pycnomorphe marked pycnomorphe (MIN - P10) (P10 - P25) (P25 - P75) (P75 - P90) (P90 - MAX)

134 Für eine gute Annäherung an eine optimale Körpermasse ist die Einführung des Körperbautyps als genetisch fundierter Körperstruktur mit Hilfe einer weiteren Variablen zusätzlich zu Körpermasse, Körperhöhe und Alter empfehlenswert. Hierzu gibt es unterschiedliche Verfahren. In den USA ist eine Einteilung des Körperbautyps nach der Skelettrobustizität üblich, gemessen am Verhältnis der Ellenbogenbreite zur Körperhöhe. Die deutsche Schule bevorzugt den sogenannten Metrik-Index, eine lineare Funktion der ebenfalls durch das Skelett geprägten Maße Körperhöhe, Brustkorbbreite und Brustkorbtiefe (Abb. 6). Nach definierten Perzentilbereichen des Metrik-Index läßt sich eine bipolare Variationsreihe der Körperform mit einer Spannweite von einem niedrig-breitwüchsigen pyknomorphen zu einem hochschlankwüchsigen leptomorphen Pol in beliebig viele Körperbautypen verteilungsunabhängig skalieren. Die mittlere Körperbauform wird bei dieser Typologie als metromorph bezeichnet. Praktikabel ist eine Einteilung der gesamten Spannweite in 3 Typen mit Hilfe der Metrik-Index-Perzentile 20 und 80 (> P20 = leptomorph, P20 - P80 = metromorph, < P80 = pyknomorph, s. Abb. 6) oder eine Einteilung in 5 Typen mit Hilfe der Perzentile 10, 25, 75 und 90 (Abb. 7) Abb. 8 zeigt die Variabilität und die Altersabhängigkeit des Metrik-Index bei einer Einteilung nach 5 Typen. Dabei geben die Tiefstwerte des Index zu Beginn der Pubertät die Zeit des typspezifisch jeweils relativ am stärksten ausgeprägten Schlankwuchses an. Dieses Stadium der körperlichen Entwicklung wird körperbautypspezifisch von den akzeleriert reifenden ausgeprägt pyknomorphen Mädchen mit 8 Jahren am frühesten erreicht und von den langsamer reifenden ausgeprägt leptomorphen Mädchen mit 11 Jahren am spätesten. Diese in

135 Abhängigkeit vom Körperbautyp unterschiedliche Geschwindigkeit der körperlichen Entwicklung wirkt sich auch auf die alters- und körperhöhenspezifische Körpermasse aus. In Abb. 9 sind die Mittelwertskurven der körperbautypspezifischen altersabhängigen Körpermasse von der Geburt bis zu 65 Jahren dargestellt. Im Typenvergleich zeigt sich die deutlich schiefe Verteilung der Körpermasse. Auf diese Weise wird eine weitaus differenziertere Einschätzung von echtem und vermeintlichem Übergewicht möglich als dies ohne Berücksichtigung des Körperbautyps möglich ist. Wie in Abb. 1 ohne Berücksichtigung des Körperbautyps gezeigt, läßt sich auch unter seiner Einbeziehung die Körpermasse körperhöhenspezifisch gruppieren. Darüber hinaus besteht die Möglichkeit, alters- und körperbautypspezifische lineare Regressionen zwischen Körperhöhe und Körpermasse zu bilden. Entsprechende Diagramme unter Einbeziehung bivariater Konfidenzellipsen sind in Abb. 10 für stark leptomorphe, in Abb. 11 für metromorphe und in Abb. 12 für stark pyknomorphe Mädchen und Frauen dargestellt. Durch die Verwendung einer einheitlichen Achsenskalierung kann demonstriert werden, wie die Steigung der Regressiongeraden sowohl mit dem Alter als auch vom hoch-schlankwüchsigen zum niedrigbreitwüchsigen Körperbautyp zunimmt.

136

Zusammenfassend möchten wir feststellen, daß SAS aufgrund seiner vielfältigen und nutzerfreundlichen Programmierungsmöglichkeiten hervorragend zur Anwendung bei humanbiologischen Auswertungen geeignet ist. Auch problembezogene Diagramme für eine unmittelbare und didaktisch individuell gestaltete Umsetzung neuester Forschungsergebnisse in die Lehre in Form von Overheadfolien bereitet keine Schwierigkeiten. Etwas erschwerend wirkt sich allerdings die Tatsache aus, daß bei der Herstellung von Farbdiagrammen sowohl bei der Linienstärke als auch bei der Farbgestaltung gegenüber anderen Systemen, wie beispielsweise Excel, ein beträchtlicher Unterschied zwischen dem Monitorbild und dem Druckbild bestehen. 137