Evaluation von Standards und Modellen zur probabilistischen Expositionsabschätzung

Größe: px
Ab Seite anzeigen:

Download "Evaluation von Standards und Modellen zur probabilistischen Expositionsabschätzung"

Transkript

1 UMWELTFORSCHUNGSPLAN DES BUNDESMINISTERIUMS FÜR UMWELT, NATURSCHUTZ UND REAKTORSICHERHEIT Aktionsprogramm Umwelt und Gesundheit Förderkennzeichen (UFOPLAN) /02 Evaluation von Standards und Modellen zur probabilistischen Expositionsabschätzung Abschlussbericht von Dr. Odile Mekel, Dr. Olaf Mosbach-Schulz, Dr. Michael Schümann, Petra-Karin Okken, Claudia Peters, Jens Herrmann, Dr. Oliver Hehl, Dr. Michael Bubenheim, PD Dr. Rainer Fehr, Prof. Dr. Dr. Jürgen Timm Universität Bielefeld Fakultät Gesundheitswissenschaften Forschungsprojektleitung: Dr. Odile Mekel beim Landesinstitut für den Öffentlichen Gesundheitsdienst NRW (lögd) Im Auftrag des Umweltbundesamtes Bielefeld, Mai 2007

2

3 Evaluation von Standards und Modellen zur probabilistischen Expositionsabschätzung Anhang: A5 A6 Abschlussbericht Mai 2007

4

5 Inhaltsverzeichnis I Inhaltsverzeichnis Anhang Verzeichnis der Abbildungen... V Verzeichnis der Tabellen... VI A1 Checkliste A1.1 Allgemeiner Teil: Datenquelle... 1 A1.2 Spezieller Teil: Relevante Variable... 6 A1.3 Gesamtbeurteilung... 8 A2 Der RefXP Reader Claudia Peters A2.1 Das Programm... 1 A2.2 Festlegung der Zieltabelle... 3 A2.3 Datenformat des Eingabeskripts... 5 A2.4 Einlesen eines Skriptes und Eintragen der Inhalte... 8 A2.5 Tools zur Ansicht und zum Editieren von Memofeldern... 9 A2.6 Persönliche Einstellungen (Optionen) A2.7 Anhang A2.7.1 Headline- und Topicliste A2.7.2 Datenquellen und Abkürzungen A2.7.3 Skriptvorlage Xprob für den Info Block A2.7.4 Beispielskript SAS A2.7.5 Skriptbeispiel für die Übernahme von Tabellenwerten aus einer externen Quelle A2.7.6 Disclaimer... 27

6 II Anhang A3 Technische Dokumentation des Prototyps RefXP: Reference values for exposure factors Michael Schümann A3.1 Dokumentationsstruktur für Expositionsfaktoren... 1 A3.2 Dokumentation der Tabellenstrukturen... 2 A3.3 Struktur der Zugriffe auf Tabellen... 9 A3.4 Funktion der Suchmaschine A3.5 Entwicklung einer formalen Tabellenstruktur A3.6 Extensible Markup Language (XML) A3.7 Gestaltung der graphischen Oberfläche und der interaktiven Struktur des Programms (Graphic User Interface GUI) A3.8 Ebene I: Menügesteuerte Funktionen A3.9 Ebene II: Ansichten der Datenstruktur und Auswahlfunktionen A3.10 Ebene III: Ansichten der Daten und zugehörige Funktionen A3.11 Ebene VI: Anzeigen in der Statusleiste A3.12 Zusatzmodul: Suchen von Tabelleneinträgen A3.13 Quelltext des Programms A3.14 Literatur A3.15 Information zum Programm RefXP A4 Stratifizierung und Verteilungsanpassung mit SAS Programm-Dokumentation Jens Herrmann, Olaf Mosbach-Schulz A4.1 Aufbau des SAS-Skriptes... 1 A4.2 Eingabe der Steuerbefehle... 2 A4.3 Disclaimer und Copyrights... 7

7 Inhaltsverzeichnis III A5 Verteilungsbasierte Modellierung Olaf Mosbach-Schulz A5.1 Einleitung... 6 A5.1.1 Hinweise zum Gebrauch des Textes... 8 A5.1.2 Hintergrund verteilungsbasierter Modellierungen... 9 A Literatur zu verteilungsbasierten Modellierungen A5.2 Der Aufbau 13 A5.2.1 Der Programmaufruf A5.2.2 Das erste Hauptfenster: EXCEL-Tabellenblatt A Was Sie über EXCEL wissen müssen A Literatur zu EXCEL A5.2.3 Das zweite Hauptfenster: Modellfenster A5.2.4 Das dritte Hauptfenster: Ergebnisfenster A5.2.5 Speichern und Beenden 24 A5.2.6 Öffnen bestehender Simulationen A5.3 Definition des Modells A5.3.1 Beispiel: Cadmium-Aufnahme durch übliche Nahrung A Literatur zur Expositionsmodellierung A5.3.2 Verteilungen A Was Sie über Verteilungen wissen müssen A Was Sie über die Lognormalverteilung wissen müssen A Umrechnung der Parameter der GF-Verteilung für Unterverteilungen als Formulartabelle A Mischen von Verteilungen A Punktmasse auf Null (PMZ) A5.3.3 Modellgleichung A5.4 Monte-Carlo-Simulationen A5.4.1 Was Sie über Simulationen wissen müssen A5.4.2 Einstellungen A5.4.3 Simulation A5.4.4 Literatur zu Simulationen A5.5 Aufbereitung der Ergebnisse A5.5.1 Quick Report A5.5.3 EXCEL-Grafiken mit ungeordneten Daten A5.5.4 EXCEL-Grafiken mit geordneten Daten A5.5.5 Literatur zu EXCEL-Grafiken A5.6 Verteilungsanpassung A5.6.1 Sammeln von Informationen A Theoretische Modellannahmen A Auswahl empirischer Daten

8 IV Anhang A Nutzung von Expertenurteilen A5.6.2 Nicht-parametrische Verteilungen bei großen Datenmengen A Weitere Interpolationsverfahren A5.6.3 Anpassung parametrischer Verteilungen A Schätzung von Verteilungsparametern A Auswahl der besten Verteilung ( Best Fit ) A5.6.4 Verteilungen bei kleinen Stichprobenumfängen A5.6.5 Mischungen von Verteilungen A5.6.6 Literatur zu Verteilungen A5.7 Sensitivitätsanalyse A5.7.1 Was Sie über Sensitivitätsanalysen wissen müssen A5.7.2 Globale Sensitivitätsmaße A5.7.3 Lokale Sensitivitätsmaße A Gauß sche Fehlerrechnung A Gemittelter Varianzformel A5.7.4 Literatur zur Sensitivitätsanalyse A5.8 Literaturverzeichnis A5.9 Verzeichnis wichtiger Schalter A5.Anhang Ausdrucke der Beispielprogramme A5.A1 atrisk_bsp_cadmium.xls A5.A2 atrisk_bsp_parameter.xls A5.A3 atrisk_bsp_grafiken.xls A6 Liste der Veröffentlichungen des Xprob-Projektes

9 Inhaltsverzeichnis V Verzeichnis der Abbildungen Anhang 2 Der RefXP Reader Abbildung A2.1 Ansicht des RefXP Readers nach Öffnen eines Skriptes im Programm... 2 Abbildung A2.2 Auswahl der Haupttabelle der Datenbank RefXP... 3 Abbildung A2.3 Information über den Status der Haupttabelle der Datenbank RefXP... 4 Abbildung A2.4 Inhaltsübersicht nach Auswahl einer Datenbank... 4 Abbildung A2.5 Ansicht eines Beispielskriptes zum Einlesen in die Datenbank... 5 Abbildung A2.6 Öffnen des gewünschten Skripts... 8 Abbildung A2.7 Start des Einlesens in die Datenbank... 8 Abbildung A2.8 Betrachtungsmöglichkeit des Inhalts eines eingelesenen Skripts Abbildung A2.9 Editieren von Tabellenwerten und Bestätigen der Änderung Abbildung A2.10 Ansicht des Fensters Optionen Abbildung A2.11 Ausschnitt des Fensters Basic Data Set und Funktionsknöpfe Anhang 3 Technische Dokumentation des Prototyps RefXP: Reference values for exposure factors Abbildung A3.1 Vereinfachte Darstellung der Struktur der Datenbank- und Zugriffsstruktur... 2 Abbildung A3.2 Abhängigkeit der Tabellen und Veränderungsereignisse Abbildung A3.3 Benutzeroberfläche des Programms RefXP Abbildung A3.4 Menüleiste des Programms RefXP Abbildung A3.5 Unterprogramm zur Informationssuche und Positionierung Abbildung A3.6 Infofenster mit Angabe der Versionsnummer und des Programmstatus Abbildung A3.7 Datenansicht (Datenpositionierungsebene) des Programms RefXP Abbildung A3.8 Cursor-gesteuerte Datenanzeige des Programms RefXP Abbildung A3.9 Teilfenster des Fensters Prt./Options mit veränderlichen Optionen Abbildung A3.10 Fenster zur Anzeige der aktuellen Restriktionen (verbale Umsetzung) Abbildung A3.11 Fenster zur Anzeige der aktuell referenzierten Datentabelle, Auswahl von angezeigten Feldern und Variablen-Bezeichnungen Abbildung A3.12 Fenster zur formatierten Anzeige der aktuell referenzierten Datentabelle Abbildung A3.13 Fenster zur benutzerdefinierten Generierung von formatierten Datentabellen Abbildung A3.14 Fenster zur Anzeige der GF- und Verteilungsanpassung Abbildung A3.15 Anzeige der aktuell bearbeiteten Gruppe (Strata)... 26

10 VI Anhang Abbildung A3.16 Fenster zur Anzeige der GF- und Verteilungsanpassung über alle Gruppen Abbildung A3.17 Fenster zur Anzeige des Programmablaufes / Optionen Abbildung A3.18 Fenster zur Anzeige eines zusammenfassenden Berichtes Abbildung A3.19 Fensterleiste zur Anzeige der aktuellen Position Abbildung A3.20 Fenster zur interaktiven Suche von Tabelleneinträgen Abbildung A3.21 Teilfenster zur Definition der Suchbegriffe Abbildung A3.22 Teilfenster zur Navigation in den gefundenen Tabelleneinträgen Verzeichnis der Tabellen Anhang 3 Technische Dokumentation des Prototyps RefXP: Reference values for exposure factors Tabelle A3.1 Darstellung der Struktur für Kapitelüberschriften in Tabelle Topics... 3 Tabelle A3.2 Darstellung der aktuellen Inhalte der Tabelle Topics / Kapitelüberschriften... 3 Tabelle A3.3 Darstellung der Struktur für Abschnittsüberschriften in Tabelle Para Tabelle A3.4 Darstellung der aktuellen Inhalte der Tabelle für Abschnittsüberschriften (Auszug)... 4 Tabelle A3.5 Darstellung der Struktur der Tabelle Daten1a für die Quellen und Basisinformation... 5 Tabelle A3.6 Definition des Inhalte des Feldes FileType (Änderungen)... 6 Tabelle A3.7 Inhalte des Informationsfeldes INFO... 6 Tabelle A3.8 Vollständige Struktur für die spezifische Information zu einer Variablen... 8 Tabelle A3.9 Partielle Struktur für die spezifische Information zu einer Variablen (Deskription)... 8 Tabelle A3.10 Struktur für die Information zu zitierten Referenzwerten... 9 Tabelle A3.11 Struktur der Variablenlabel (VARLABEL)... 9 Tabelle A3.12 Struktur der generierten Suchlisten-Datei Tabelle A3.13 Auswahl des Tabellentyps (Generieren von Tabellen) Tabelle A3.14 Funktion der Schaltknöpfe: Generierung von formatierten Datentabellen... 25

11 O. Mosbach-Schulz A5 Verteilungsbasierte Modellierung Leitfaden zur Umsetzung verteilungsbasierter Modellierungen mit dem Bremen 2006

12 Dieser Leitfaden ist Teil des Projekts: Evaluation von Standards und Modellen zur probabilistischen Expositionsabschätzung (Xprob) gefördert durch das Umweltbundesamt, Dessau, Förderkennzeichen /02 Autor: Dr. Olaf Mosbach-Schulz Risikoforschung Umwelt Gesundheit projektgruppe probabilistische modellierung Universität Bremen FB 03: Institut für Statistik Bibliothekstraße 1, D Bremen Haftungsausschluss Alle in diesem Abschnitt enthaltenen Informationen wurden nach bestem Wissen zusammengestellt und mit Sorgfalt getestet. Dennoch sind Fehler nicht ganz auszuschließen. Aus diesem Grund sind die im vorliegenden Buch enthaltenen Informationen mit keiner Verpflichtung oder Garantie irgendeiner Art verbunden. Der Autor übernimmt infolgedessen keine Verantwortung und wird keine daraus folgende oder sonstige Haftung übernehmen, die auf irgendeine Art aus der Benutzung dieser Informationen - oder Teilen davon - entsteht, auch nicht für die Verletzung von Patentrechten, die daraus resultieren können. Ebenso wenig übernimmt der Autor die Gewähr dafür, dass die beschriebenen Verfahren usw. frei von Schutzrechten Dritter sind. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt also auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz- Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Dieses Werk ist urheberrechtlich geschützt. Alle Rechte, auch die der Übersetzung, des Nachdruckes und der Vervielfältigung des Buches, oder Teilen daraus, vorbehalten. 2

13 Vorwort zur zweiten Ausgabe Die erste Ausgabe dieses Leitfadens entstand im Rahmen des Projekts Wahrscheinlichkeitsrechnung als Hilfsmittel zur Wirkungsabschätzung bei Arbeitnehmern (F ) im Auftrag der Bundesanstalt für Arbeitsschutz und Arbeitsmedizin und ist die schriftliche Ausarbeitung einer zweitägigen Fortbildungsveranstaltung, die im Januar 2004 in Dortmund stattfand. Die Schulung wurde zusammen mit Frau Eva Elmshäuser durchgeführt, die die Fortbildung im Wesentlichen konzipierte und das Curriculum erstellte. Der Leitfaden wurde in der Zwischenzeit weiter ausgearbeitet, erprobt und kann jetzt als eigenständige Anleitung gelten. Dennoch sollte nicht vergessen werden, dass gerade bei der Erprobung einer neuen Software-Umgebung häufig Anfangsschwierigkeiten auftreten, die schneller durch einen persönlichen Rat oder Hinweis überwunden werden können. Dieser Leitfaden kann deshalb nicht die Einführung durch eine erfahrene Kollegin oder einen erfahrenen Kollegen ersetzten. In diesem Sinne sind wir ständig bemüht neue Netzwerke und Diskussionsforen zuinitiieren und würden uns freuen, wenn der vorliegende Text Sie neugierig macht, Sie zu entdeckendem Lernen anregt und Sie bei ihrer Arbeit unterstützt. Wir freuen uns auf den Austausch von Erfahrungen, Ihre Anregungen und Kritik. Januar 2006 Olaf Mosbach-Schulz 3

14 4 Inhaltsverzeichnis 1 Einleitung Hinweise zum Gebrauch des Textes Hintergrund verteilungsbasierter Modellierungen Literatur zu verteilungsbasierten Modellierungen Der Aufbau Der Programmaufruf Das erste Hauptfenster: EXCEL-Tabellenblatt Was Sie über EXCEL wissen müssen Literatur zu EXCEL Das zweite Hauptfenster: Modellfenster Das dritte Hauptfenster: Ergebnisfenster Speichern und Beenden Öffnen bestehender Simulationen Definition des Modells Beispiel: Cadmium-Aufnahme durch übliche Nahrung Literatur zur Expositionsmodellierung Verteilungen Was Sie über Verteilungen wissen müssen Was Sie über die Lognormalverteilung wissen müssen Umrechnung der Parameter der GF-Verteilung für Unterverteilungen als Formulartabelle Mischen von Verteilungen Punktmasse auf Null (PMZ) Modellgleichung Monte-Carlo-Simulationen Was Sie über Simulationen wissen müssen Einstellungen Simulation Literatur zu Simulationen... 73

15 5 5 Aufbereitung der Ergebnisse Quick Report EXCEL-Grafiken mit ungeordneten Daten EXCEL-Grafiken mit geordneten Daten Literatur zu EXCEL-Grafiken Verteilungsanpassung Sammeln von Informationen Theoretische Modellannahmen Auswahl empirischer Daten Nutzung von Expertenurteilen Nicht-parametrische Verteilungen bei großen Datenmengen Weitere Interpolationsverfahren Anpassung parametrischer Verteilungen Schätzung von Verteilungsparametern Auswahl der besten Verteilung ( Best Fit ) Verteilungen bei kleinen Stichprobenumfängen Mischungen von Verteilungen Literatur zu Verteilungen Sensitivitätsanalyse Was Sie über Sensitivitätsanalysen wissen müssen Globale Sensitivitätsmaße Lokale Sensitivitätsmaße Gauß sche Fehlerrechnung Gemittelter Varianzformel Literatur zur Sensitivitätsanalyse Literaturverzeichnis Verzeichnis wichtiger Schalter Anhang: Ausdrucke der Beispielprogramme

16 6 1 ist ein Computerprogramm zur Durchführung von Simulationen und Risikoanalysen. Es bedient sich dabei des bekannten Tabellenkalkulationsprogramms Microsoft EXCEL und ergänzt dieses um zusätzliche Funktionen. Mit Hilfe können Sie nach einer ersten Einarbeitung verteilungsbasierte Modellierungen einfach handhabbar durchführen. Der vorliegende Leitfaden soll Sie in die Besonderheiten und Funktionen einführen. Er orientiert sich dabei am Ablauf einer einfachen verteilungsbasierten Expositionsmodellierung und erläutert alle notwendigen Schritte von der Eingabe bis zur abschließenden Dokumentation der Ergebnisse. Damit besitzen Sie die Grundlage, um auch kompliziertere Modelle berechnen zu können. Im Kapitel 2 (Seite 13) wird zunächst ein Überblick über das Programm und seinen Aufbau gegeben. In Kapitel 3 (Seite 26) erfolgt dann die Eingabe der notwendigen Befehle für die Definition eines Modells. Es folgt die Durchführung der Simulation in Kapitel 4 (Seite 59) und die Aufbereitung der Ergebnisse in Kapitel 5 (Seite 74). Der Leitfaden umfasst noch zwei ergänzende Themen, die über eine erste Anwendung hinausgehen. Im Kapitel 6 (Seite 102) sollen verschiedene Verfahren vorgestellt werden, wie Verteilungen an empirische Daten angepasst werden können. Das abschließende Kapitel 7 (Seite 140) zeigt die Durchführung einer Sensitivitätsanalyse.

17 7 k Zum wurden vom Hersteller ebenfalls Dokumentationen herausgegeben: [@RISK 4.0 dt.] Risikoanalysen- und Simulations- Add-In für Microsoft Excel, Version 4. Newfield: Palisade Corporation, März [@RISK 4.5] Guide to Risk Analysis and Simulation Add-In for Microsoft Excel, Version 4.5. Newfield: Palisade Corporation, February Die jeweils aktuelle Version des Programms und des Benutzerhandbuchs finden Sie im Internet unter: Palisade Corporation 31 Decker Road, Newfield, NY USA sales@palisade.com Hier können Sie auch eine kostenlose Probeversion herunterladen. Die Beispiele im Leitfaden beziehen sich Version professional edition, Stand Dezember Weitere Literaturhinweise finden Sie in den einzelnen Kapiteln und im Literaturverzeichnis am Schluss des Leitfadens.

18 8 1.1 Hinweise zum Gebrauch des Textes Liebe Leserin, lieber Leser, der vorliegende Leitfaden soll Sie während Ihrer ersten Erfahrungen mit dem begleiten. Der Aufbau des Textes folgt dabei einer einfachen verteilungsbasierten Expositionsmodellierung mit Expositionsfaktoren aus dem Xprob-Projekt. Wir empfehlen Ihnen deshalb, den Text parallel zu Ihrer ersten Programmierung einmal vollständig zu lesen. Ihr Begleiter soll Ihnen weitere Orientierung geben: k y x Q d Am Ende jedes Kapitels finden Sie Literaturhinweise auf weiterführende Handbücher, in denen Sie Antworten auf spezielle Problemstellungen und Fragen finden, die wir in dieser ersten Einführung nicht behandeln konnten. Einzelne Themen werden aber auch im Leitfaden später wieder aufgegriffen, so dass Sie bei Interesse ruhig vorblättern sollten. Einige Begriffe und Vorgehensweisen werden nur verständlich, wenn Sie mit einigen Themen schon vorher vertraut sind. Wir haben diese Grundlagen in Einschüben zusammengefasst. Überspringen Sie die Blöcke, wenn Sie sich sicher fühlen oder wenn Sie sich zunächst nur einen Überblick verschaffen möchten. Wie auf jedem Gebiet gibt es auch Fallstricke, die häufig Anlass zu Verwirrung und Unklarheit geben. Wir haben diese gekennzeichnet, damit Sie den Tücken ausweichen können. Tipp: Schließlich möchten wir Ihnen auf Grund unserer Erfahrungen einige Arbeitsweisen besonders empfehlen. Wir freuen uns auf Ihre Kommentare und Anregungen und Wünschen Ihnen eine erfolgreiche Arbeit mit dem

19 Hintergrund verteilungsbasierter Modellierungen Ein wesentliches Problem der quantitativen Expositionsabschätzung liegt in der Festlegung der Eingangsgrößen auf bestimmte Zahlenwerte. Die Konzentration eines Schadstoffes, die in einem Kontaktmedium gemessen wurde, hängt von den konkreten Randbedingungen ab und variiert mit der Zeit, dem Ort oder dem Produkt. Aber auch die Aufnahme durch das Individuum, die Kontakthäufigkeit, -intensität und - dauer unterscheidet sich innerhalb einer Population. Somit sind die Einflussgrößen keine konstanten Werte, wie uns Punktschätzer vortäuschen. Um die vorhandene Komplexität dennoch in quantitativen Modellen behandeln zu können, wurden verschiedene Strategien zur Reduktion entwickelt. Dazu zählt der Übergang zu durchschnittlichen Werten, die eine durchschnittliche Situation beschreiben, das Betrachten von möglichen, ungünstigen Werten, die extreme Situationen abschätzen, oder die Betrachtung von konkreten Einzelfällen. In jedem Fall wird die vorhandene Variabilität auf eine ausgewählte Konstante reduziert. Keine dieser Herangehensweisen ist vollständig befriedigend, da sie die in den Größen vorhandene Variabilität nicht berücksichtigt und nur Spezialfälle betrachtet. Gleichzeitig sind die Ursachen, die die Festlegung auf einen konstanten Wert verhindern, sehr verschieden. Man beobachtet prinzipielle Ungleichheiten zwischen Kontaktmedien, Anwendungen und Personengruppen, Veränderlichkeit in Raum und Zeit oder Ungewissheit in der Messung einer konkreten Größe. In der Literatur werden hauptsächlich drei Typen von Variabilität unterschieden, die jeweils spezielle Konzepte in der Modellierung nach sich ziehen: Art Form Methode Verschiedenheit Variation Unsicherheit Unterschiede zwischen den Medien, Szenarien oder Personengruppen Reale Unterschiede in Zeit, Raum, interoder intraindividuell Begrenztes Wissen, Ungenauigkeiten in Datenlage und Kenntnisstand Abschichtung Probabilistische Modellierung Probabilistische Sensitivitätsrechnung Unter Verschiedenheit werden reale Unterschiede zwischen Medien, Szenarien oder Teilen der Population verstanden, die zu einer abgeschichteten Modellierung für verschiedene Spezialfälle führen (z. B. Exposition durch die Umwelt, Verbraucherpro-

20 10 dukte oder am Arbeitsplatz, Unterschiede zwischen Frauen und Männer, jung und alt). Die Abschichtung setzt dabei voraus, dass die Unterschiede bekannt sind und erhoben werden konnten. Im Gegensatz dazu fasst die Variation reale Unterschiede zusammen, die nicht explizit im Modell aufgenommen, aber berücksichtigt werden sollen. So existieren reale Unterschiede in der Population aus regionalen Gegebenheiten, dem Jahresverlauf oder individuellen Verhaltensweisen, ohne dass für jedes Bundesland, jeden Monat und jede Person ein individuelles Modell erstellt werden soll. In der Regel liegen ja gerade keine spezifischen Informationen für eine einzelne Person vor, so dass aus der Variation in der Bevölkerung und die Rahmenbedingungen auf den Spezialfall geschlossen werden soll. Die Unsicherheit umfasst schließlich den Teil der Variabilität, der durch unvollständige empirische Datengrundlagen entsteht und zumindest prinzipiell durch vermehrtes Wissen reduziert werden könnte. Zur besseren Unterscheidung von Variation und Unsicherheit empfehlen Morgan und Henrion [1990] den Clarity-Test. Dieser bezeichnet ein Gedanken-Experiment, bei dem unter der Annahme vollständigen Wissens die im Modell vorkommende Größe beschrieben werden soll. Zu benennen sind dabei sämtliche Rahmenbedingungen, die zur exakten Fixierung der Größe notwendig sind, damit ihr eindeutiger Wert zumindest prinzipiell (unter der Annahme vollständigen Wissens) geklärt werden kann. Die existierende Ungenauigkeit bei der Bestimmung der so fixierten Größe bildet die Unsicherheit. Die Zusammenfassung möglicher Rahmenbedingungen bildet die Grundgesamtheit im Modell, die verschiedenen Ausprägungen der Größe sind damit ihre Variation. Verteilungsbasierte Modelle beschreiben Größen unter unpräzisen Rahmenbedingungen durch ihre mathematische Verteilung in der Grundgesamtheit aller Rahmenbedingungen. Im Gegensatz zum Ansatz mit Punktschätzern soll diese Komplexität nicht reduziert werden, sondern in allen Berechnungen im Modell berücksichtigt werden. Die moderne Computertechnik mit ihrer großen Rechenkapazität ermöglicht eine solche Herangehensweise. An Stelle das Modell nur ein einziges Mal mit den Punktschätzern auszuwerten, werden bei der verteilungsbasierten Modellierung in einer Simulationsrechnung (Monte-Carlo-Simulation) mehrere Tausend Replikationen möglicher Kombinationen von Eingangswerten erzeugt und im Modell verknüpft. Dadurch ergibt sich im Rechner ein Abbild der Verteilung der Zielgröße, das näher untersucht und beschrieben werden kann. Das ist ein solches Werkzeug zur verteilungsbasierten Modellierung. Jede Eingangsgröße kann dabei als Verteilung definiert werden und fließt als solche automatisch in die Modellierung ein.

21 11 Modellierung mit Punktschätzern Effektive Dosis, Extrapolationsfaktoren Verteilungsbasierte Modellierung Effektive Dosis, Extrapolationsfaktoren Modell Modell Ergebnis: Referenzwert Ergebnis: Referenzwert Der vorliegende Leitfaden beschreibt im Wesentlichen die Durchführung einer verteilungsbasierten Modellierung, d. h. die Definition, Ausführung und Auswertung einer Simulationsrechnung mit dem Damit beschränkt sich der Leitfaden auf die eher technischen Aspekte. Im Vorfeld einer Simulationsrechnung sollten vorhandene Datenquellen, die zu verwendenden Modellansätze und mögliche Abschichtungen diskutiert und festgelegt werden. Im Nachgang sind die Quellen von Unsicherheit in der Modellierung zu diskutieren und mit der Modellsensitivität zu vergleichen, um zu einer Beurteilung der Unsicherheit des Endergebnisses zu kommen. 1.Schritt: Abschichtung Definition von Szenario, Abschichtungen, Schutzziel, Datenquellen und Modell Abschätzung mittels durchschnittlicher und konservativer Annahmen 2.Schritt: Probabilistische Modellierung Anpassung der Eingangsverteilungen Implementation des Monte-Carlo-Algorithmus Durchführung der Simulation Darstellung der Ergebnisverteilung 3.Schritt: Probabilistische Sensitivitätsanalyse Diskussion möglicher Quellen von Unsicherheit Durchführung der Sensitivitätsanalyse

22 12 k Literatur zur verteilungsbasierten Modellierung: [Bedford, Cooke 2001] Tim Bedford, Roger Cooke: Probabilistic Risk Analysis Foundations and Methods. Cambridge: University Press, [Cox 2001] Louis A. Cox: Risk Analysis Foundations, Models and Methods. Dordrecht: Kluwer, [Cullen, Frey 1999] Alison C. Cullen, H. Christopher Frey: Probabilistic Techniques in Exposure Assessment A Handbook for Dealing with Variability and Uncertainty in Models and Inputs. New York: Plenum, [Morgan, Henrion 1990] Millett Granger Morgan, Max Henrion: Uncertainty A Guide to Dealing with Uncertainty in Quantitative Risk and Policy Analysis. Cambridge: University Press, [Vose 2000] David Vose: Quantitative Risk Analysis A Guide to Monte Carlo Simulation Modelling, 2 nd edition. New York: Wiley, 2000.

23 Der Aufbau 2.1 Der Programmaufruf Sie starten das Programm indem Sie das Programmsymbol doppelt anklicken: oder im Startmenu unter Programme im Unterpunkt Palisade Decision Tools das 4.5 for Excel aufrufen. Ihr Rechner startet daraufhin das Tabellenkalkulationsprogramm EXCEL mit den Zusatzfunktionen 2.2 Das erste Hauptfenster: EXCEL-Tabellenblatt Auf den ersten Blick sind kaum Unterschiede zum normalen Erscheinungsbild von EXCEL zu erkennen, da das erste Hauptfenster eine EXCEL-Tabelle in einer sogenannten Arbeitsmappe ist: Aktive Zelle Bearbeitungszeile Spalten Zeilen Arbeitsblätter: Tabellen, Diagramme Rollbalken

24 Was Sie über EXCEL wissen müssen... x Mit EXCEL können Sie Informationen in Tabellen und Diagrammen zusammenstellen und bearbeiten. Diese Blätter sind in EXCEL in einer Arbeitsmappe zusammengefasst. Durch Anklicken mit dem Mauszeiger (Pfeil) können Sie am unteren linken Rand die verschiedenen Inhalte der Arbeitsmappe aufrufen. Drücken Sie dabei die rechte Maustaste erscheint ein Kontextmenü, mit Hilfe dessen Sie einzelne Blätter löschen, umbenennen oder kopieren können. Eine EXCEL-Tabelle besteht aus Zellen in Spalten und Zeilen. Die Spalten werden mit den Buchstaben A, B, C,..., Z, AA, AB, AC,..., die Zeilen mit den Zahlen 1, 2, 3,... bezeichnet. Jede Zelle kann durch Angabe ihrer Koordinaten (Spalte und Zeile) identifiziert werden. Der Name A1 bezeichnet die Zelle in der Spalte A und in der Zeile 1. Ein solcher Name wird auch Bezug genannt. Bezüge sind auch auf andere Tabellen der gleichen Arbeitsmappe möglich. In diesem Fall muss der Name der Zelle der Name der Tabelle mit einem Ausrufungszeichen! vorangestellt werden, z. B. Tabelle1!A1. Durch Anklicken einer Zelle mit dem Mauszeiger (Kreuz) wird diese für Eingaben aktiviert. Die jeweils aktive Zelle ist stark umrandet, ihr Name erscheint links neben der Bearbeitungszeile. Mit Hilfe der Rollbalken können Sie zu den nicht sichtbaren Teilen der Tabelle gelangen. Eingaben erfolgen direkt in der aktivierten Zelle oder in der Bearbeitungszeile. Beenden Sie Ihre Eingabe durch Anklicken des grünen Hakens neben der Bearbeitungszeile. Der Inhalt einer Zelle kann aus Text (alphanumerischen Zeichen), einer Zeitangabe (Datum, Uhrzeit) oder einer Zahl bestehen. In der Regel erkennt das Programm selbständig, um welche Eingabe es sich in der Zelle handelt. Die sichtbare Darstellung des Inhalts können Sie unter dem Menupunkt Format im Unterpunkt Zellen... festlegen. Im Dialogfeld Zellen formatieren legen Sie bitte dazu zunächst auf der Registerkarte Zahlen die Kategorie (Text, Zahl, Datum,...) des Inhalts fest. Die Voreinstellung Standard wählt eine passende Darstellung zur jeweiligen Kategorie, die EXCEL automatisch erkannt hat. d Tipp: Dokumentieren Sie Ihre gesamte Auswertung in der EXCEL- Arbeitsmappe. Eine geeignete Formatierung ermöglicht Ihnen während der Auswertung die Erstellung eines druckfertigen Berichts. Zum gemeinsamen Bearbeiten mehrerer zusammenhängender Zellen, Spalten und Zeilen können Sie bei gedrückter linker Maustaste

25 15 diese mit dem Mauszeiger überfahren. Starten Sie in einer Zelle oder einer Spalten- bzw. Zeilenbezeichnung und erweitern Sie den markierten Bereich bis zur gewünschten Größe. Der Bereich ist wieder stark umrandet. Zusammenhängende Tabellenzellen erhalten Namen mit Doppelpunkt :. Der Bereich A1:A5 umfasst in Spalte A die Zeilen von 1 bis 5, der Bereich A1:E1 umfasst in Zeile 1 die Spalten von A bis E. Schließlich werden mit B2:D4 alle Zellen zusammengefasst, die in Spalte B bis D und Zeile 2 bis 4 liegen. Der größte Vorteil eines Tabellenkalkulationsprogramms, wie EXCEL, besteht darin, dass einzelne Zellen auch Berechnungen mit Werten aus anderen Zellen enthalten können. Dazu schreiben Sie einfach eine Berechnungsformel in die entsprechende Zelle. In der Zelle wird anschließend das Ergebnis der Berechnung sichtbar. Bei Änderungen der Eingangswerte erfolgt automatisch eine Neuberechnung. Um eine Berechnungsformel einzugeben, beginnen Sie mit einem Gleichheitszeichen =. Einfache Formeln folgen der Konvention von Taschenrechnern. Weitere Funktionen

26 16 mit Rechenart Eingabesymbol Addition + Subtraktion Multiplikation * Division / Potenzieren ^ Klammern ( ( (... ) ) ) EXCEL bietet Ihnen aber auch eine reiche Auswahl von Funktionen für verschiedene Anwendungen. Im Auswahlfeld links neben der Bearbeitungszeile können Weitere Funktionen... aufgerufen werden. Es erscheint das Dialogfeld Funktion einfügen. Nach der Auswahl der Funktion öffnet sich der Funktionsassistent und es erfolgt die Abfrage der Argumente.

27 17 Geben Sie hier die notwendigen Argumente als Zahl oder Zellennamen ein. Durch Anklicken des Auswahl-Icons kann der Tabellenbereich auch direkt in der EXCEL-Tabelle markiert und übernommen werden: Der Übernahme-Icon ein. fügt den markierten Bereich in die Formel Mit Hilfe sind zusätzliche Funktionen zur Definition und Auswertung von Verteilungen hinzugekommen. Diese werden in Kapitel 5.2 (Seite 75) näher vorgestellt. Eine Besonderheit bildet das Kopieren von Zelleninhalten. Sie können dazu eine einzelne Zelle oder einen Bereich markieren und im Menüpunkt Bearbeiten mit Hilfe des Unterpunkts Kopieren zwischenspeichern. Schneller geht dies auch mit dem Kopier-Icon. Die entsprechenden Zellen sind jetzt gestrichelt umrandet. Markieren Sie den Zielbereich und klicken auf den Unterpunkt Einfügen bzw. den Einfüge-Icon um den Inhalt in die Zielzellen einzufügen. Haben Sie dabei eine Formel mit Bezügen auf andere Zellen kopiert, so werden diese relativ zur Zielzelle eingefügt. Die oben definierte einfache Berechnung wird also als Addition der Zellen drei Zeilen und zwei Zeilen oberhalb der Formel interpretiert und so kopiert.

28 18 Möchten Sie hingegen in einer Formel eine feste sich nicht verändernde Zelle benutzen, so müssen Sie einen absoluten Bezug definieren. Dies geschieht durch Voranstellen eines Dollarzeichen $ vor die Spalten- und/oder Zeilenbezeichnung. Die Formel =$B$3+$B$4 addiert die Zellen B3 und B4 und wird beim Kopieren nicht verändert. Sie können relative und absolute Bezüge in Formeln und sogar Zellen auch gleichzeitig verwenden, z. B. $B3. Schließlich können Sie auch nur das aktuelle Ergebnis der Berechnung aus einer Formel einfügen. Die geschieht im Menüpunkt Bearbeiten beim Unterpunkt Inhalte einfügen. Im Dialogfeld Inhalte einfügen wählen Sie den Punkt Werte aus. Zum Ausdruck der Tabelle gehen Sie im Menüpunkt Datei zum Unterpunkt Drucken oder klicken auf den Druck-Icon. Den Druckbereich und die Seitenumbrüche können Sie einfach unter dem Menüpunkt Ansicht Unterpunkt Seitenumbruchvorschau einstellen.

29 19 Zur Normalansicht gelangen Sie unter dem Menüpunkt Ansicht Unterpunkt Normal zurück. Schließlich können Sie die EXCEL-Arbeitsmappe unter dem Menüpunkt Datei, Unterpunkt Speichern unter... auf Ihrem Rechner abspeichern. Wählen Sie hier den Dateityp Microsoft Excel- Arbeitsmappe (*.xls) und einen sprechenden Namen. Ein späterer Aufruf ist dann unter dem Menüpunkt Datei, Unterpunkt Öffnen... möglich. d k y Tipp: Benutzen Sie vorhandene Arbeitsmappen zu ähnlichen Problemstellungen und führen darin nur noch die notwendigen Ergänzungen und Veränderungen durch. Bei sich häufig wiederholenden Problemstellungen lohnt sich schnell die Entwicklung einer Formulartabelle, in der die zu verändernden Zellen speziell farblich markiert sind Literatur zu EXCEL: [Frye 2001] Curtis Frye: Microsoft Excel 2002 Schritt für Schritt. Microsoft Press, [Monka, Voß 2002] Michael Monka, Werner Voß: Statistik am PC Lösungen mit Excel, 3. überarbeitete und aktualisierte Auflage. München: Hanser, Wichtige Schalter (Icons) Auswahl aus EXCEL-Tabellenblatt Seite 17 Übernahme in Formel-Definition Seite 17 Kopieren in EXCEL Seite 17 Einfügen In EXCEL Seite 17 Drucken des EXCEL-Tabellenblatts Seite 18 Speichern des EXCEL-Tabellenblatts Seite 19, 24

30 20 Sie können diese EXCEL-Arbeitsmappe wie gewohnt benutzen und abspeichern. Sie enthält alle Informationen zu Ihrer Problemstellung, inklusive der Formeln für das Modell und die zu definierenden Verteilungen. Dies ist unser Beispiel: Das hat EXCEL allerdings eine zusätzliche Symbolleiste hinzugefügt:

31 21 y Wichtige Schalter (Icons) Aufruf des 1. Hauptfenster: EXCEL-Tabellenblatt Aufruf des 2. Hauptfensters: Modellfenster Aufruf des 3. Hauptfensters: Ergebnisfenster Kapitel 2.2 Seite 14 Kapitel 2.3 Seite 22 Kapitel 2.4 Seite 23 Definition einer Verteilung Seite 29 Definition einer Ergebnisverteilung Seite 55 Anzeigen von Eingangs- und Ergebnisverteilungen Markieren im EXCEL-Tabellenblatt Seite 56 Seite 57 Einstellungen der Simulation Kapitel 4.2 Seite 61 Starten der Simulation Seite 63 Die letzten zwei Icons verweisen auf die weiteren Hauptfenster das Modellfenster y und das Ergebnisfenster. Die notwendigen Eingaben im EXCEL-Tabellenblatt werden anschließend in Kapitel 3 (Seite 26) erläutert.

32 Das zweite Hauptfenster: Modellfenster In diesem Fenster das verteilungsbasierte Modell, welches im EXCEL-Tabellenblatt definiert ist. Am Anfang enthält dieses Fenster noch keine Informationen, da noch keine Modellspezifikationen vorliegen. Liegt ein Modell vor, erfolgt im Modellfenster je eine tabellarische Zusammenstellung über alle Eingangsverteilungen ( Inputs ) und die Zielgrößen ( Outputs ). Veränderungen im bestehenden Modell können auch hier eingegeben werden. Zelle in der EXCEL-Tabelle t il Eingangsverteilungen Über den EXCEL-Icon gelangen Sie zurück zum Tabellenblatt.

33 Das dritte Hauptfenster: Ergebnisfenster Das Ergebnisfenster ist zunächst auch leer. Nach dem Durchlauf einer Simulation können hier alle Informationen zur Konvergenz ( Convergence Monitor ), den einzelnen simulierten Verteilungen ( Summary statistics ) und die simulierten Daten ( Data ) aufgerufen werden. In Kapitel 4 wird die Interpretation der Ergebnisdarstellungen näher erläutert. Konvergenz Verteilungen Daten Über den EXCEL-Icon gelangen Sie auch von hier zurück zum Tabellenblatt.

34 Speichern und Beenden besteht also aus zwei Teilen. Die Befehle und Eingaben, die in der EXCEL-Tabelle protokolliert werden und der Simulation, im Ergebnisfenster anzeigt. Q Sie müssen beide Teile einzeln abspeichern. Am besten beginnen Sie damit, Ihre Eingaben im EXCEL-Tabellenblatt abzuspeichern, sobald Sie ihr Modell definiert haben. Rufen Sie dazu im Menupnkt Datei den Unterpunkt Speichern unter auf und wählen ein passendes Verzeichnis und einen sprechenden Dateinamen. Als Dateityp sollten Sie die Microsoft Excel-Arbeitsmappe (*.xls) wählen. d Haben Sie schon zuvor den Dateinamen festgelegt, so reicht zum erneuten speichern der Unterpunkt Speichern oder das Anklicken des Speichern-Icons. Wenn Sie mit den Ergebnissen Ihrer Simulation einverstanden sind, müssen Sie diese Daten extra abspeichen. Dazu dient auf Symbolleiste der spezielle file schlägt Ihnen als Speicherort und Dateinamen, die Angaben der EXCEL-Datei, allerdings mit der Dateiendung *.rsk, vor. Tipp: Wenn Sie nicht zu einem Problem zwei unterschiedliche Simulationen speichern möchten, folgen Sie diesem wird Sie dann beim Öffnen der EXCEL-Datei automatisch zum Öffnen auffordern. Sie durch Anklicken des Menüpunkts Datei, Unterpunkt Beenden in der EXCEL-Arbeitsmappe.

35 Öffnen bestehender Simulationen Sie öffnen eine bestehende Simulation durch Aufrufen der zugehörigen EXCEL- Arbeitsmappe unter Menüpunkt Datei, Unterpunkt Öffnen.... Befindet sich im gleichen Ordner mit gleichem Namen, fragt das Programm Sie, ob diese Simulation ebenfalls geöffnet werden soll? Ist Ihre Simulation unter einem anderen Namen gespeichert und möchten Sie eine andere Simulation öffnen, klicken Sie auf den File -Icon.

36 26 3. Definition des Modells 3.1 Beispiel: Cadmium-Aufnahme durch übliche Nahrung Im Xprob-Projekt Evaluation von Standards und Modellen zur probabilistischen Expositionsabschätzung wurde ein verteilungsbasiertes Modell zur Cadmium- Exposition beim Leben auf einer Altlast entwickelt. Ein Expositionsmedium ist dabei die übliche, gekaufte Nahrung. In der folgenden Modellgleichung wird der Eigenanbau von Obst und Gemüse nicht berücksichtig und es ergibt sich: ADD res C IU R = BW mit ADD res Resorbierte Cadmiummenge bezogen auf Körpergewicht und Tag [ng] C Konzentration von Cadmium in der Nahrung [ng/g] IU Gesamtaufnahmemenge Nahrung pro Tag [g/d] R Resorptionsrate von Cadmium bei oraler Aufnahme [-] BW Körpergewicht [kg] Weiter sollen nur männliche Jugendliche im Alter zwischen 14 und 15 Jahren betrachtet werden. Es ist damit klar, dass dieses Modell stark vereinfacht wurde. Tatsächlich erfolgt die Erweiterung um zusätzliche Expositionsmedien und Altersabschnitte aber einfach durch eine Summation. Alle wichtigen Modellierungsschritte können schon an diesem einfachen Beispiel erklärt werden. Im ersten Schritt muss für jede der Eingangsgrößen des Modells eine Verteilung näher definiert werden. Dabei setzt sich das Modell aus vier Eingangsgrößen zusammen: 1. C: Konzentration von Cadmium in der Nahrung [ng/g] 2. IU: Gesamtaufnahmemenge Nahrung pro Tag [g/d] 3. R: Resorptionsrate von Cadmium bei oraler Aufnahme [-] 4. BW: Körpergewicht [kg]

37 27 Im Leitfaden sollen die notwendigen Eingaben an einem konkreten Beispiel erläutert werden. Dazu dient das Beispiel Cadmiumaufnahme durch die Nahrung bei jährigen, männlichen Jugendlichen. Die nachfolgende Tabelle gibt die zugehörigen Eingangsgrößen mit ihren Begründungen zur Festlegung wieder: Eingangsgröße Kriterium der Festlegung Verteilung Parameter C Literaturdaten: 3-5 Stetige Gleichverteilung Min = 3 Max = 5 μ= IU Nationale Verzehrsstudie (NVS ), Log-Normalverteilung keine Stratifizierung der Altersgruppe σ= R Literaturdatum: 0.05 mit zusätzlicher Streuung BW Nationale Verzehrsstudie (NVS ), Stratifizierung in Jahresklassen: Anteil 14-jährige: 51.9% Anteil 15-jährige: 48.1% in der Teil-Population Dreiecksverteilung Gammaverteilungen Einheitenumrechnung Konstante 1 Min = 0.04 Modus = 0.05 Max = jährige: α = β = jährige: α = β = Weitere Erläuterungen finden sich im Abschlussbericht, Teil 2, Kap.1 [Okken, Mekel 2005]. d Tipp: Zur Kontrolle der Vollständigkeit aller Daten ist es vorteilhaft, die bisherige Modellformel mit den Eingabewerten zu verknüpfen, wie dies z. B. grafisch durch eine Skizze erfolgen kann: ADD res C IU R = BW Die oberen Grafiken können Sie aus dem Definitionsfenster kopieren. (Seite 29)

38 28 k Literatur zur Expositionsmodellierung: [Cullen, Frey 1999] Alison C. Cullen, H. Christopher Frey: Probabilistic Techniques in Exposure Assessment A Handbook for Dealing with Variability and Uncertainty in Models and Inputs. New York: Plenum, [Kroes et al. 2002] R. Kroes et al.:assessment of intake from the diet. Food and Chemical Toxicology 40(2002), [Okken, Mekel 2005] P. Okken, O. Mekel: Szenario Leben auf einer Altlast. Xprob-Abschlussbericht, Teil 2, Kapitel 1. Bielefeld: 2005.

39 Verteilungen Das besondere an dieser Art der Modellierung ist also, dass die Eingangsgrößen im Modell durch mathematische Verteilungen beschrieben werden. Das erlaubt nun einer Zelle auf dem EXCEL-Arbeitsblatt ebenfalls eine Verteilung zuzuordnen. Dazu wird eine Zelle aktiviert und im der Unterpunkt Model und Define Distribution... aufgerufen. Direkter geht es durch Anklicken des Define Distributions -Icons. Als Folge erscheint ein neues Fenster mit den Informationen zur aktuellen Verteilung. Die Standardnormalverteilung ist dabei voreingestellt.

40 Was Sie über Verteilungen wissen müssen... x Der Begriff der Verteilung ist auf den ersten Blick verwirrend, da eine mathematische Verteilung durch viele Begriffe (Mittel, Modus, Median,...), Zahlen und Grafiken definiert werden kann. Der folgende Einschub soll Ihnen etwas Orientierung und Ordnung ermöglichen. Zunächst können Verteilungen nach zwei grundlegenden Eigenschaften unterschieden werden: - Ausprägungen: diskret oder kontinuierlich - Wertebereich: zweiseitig beschränkt, einseitig beschränkt oder unbeschränkt Diskrete Ausprägungen: Eine diskrete Verteilung kann nur (abzählbar viele) einzelne Werte annehmen. Dies können z. B. Anzahlen (0, 1, 2, 3,...), wie die Anzahl der geschädigten Tiere im Tierexperiment, die Anzahl der lebenslangen Arbeitstage, oder auch die Ausprägungen einer Kategorisierung sein, wie z. B. das Geschlecht: männlich=0, weiblich=1. Kontinuierliche Ausprägungen: Eine kontinuierliche Verteilung kann zu zwei Werten auch immer alle Zwischenwerte annehmen. Dies entspricht einer Messung mit prinzipiell beliebiger Genauigkeit. Zweiseitig beschränkter Wertebereich: Eine Verteilung ist zweiseitig beschränkt, wenn es sowohl einen (theoretisch begründeten) minimalen als auch einen maximalen Wert gibt, der die Verteilung nach unten bzw. oben einschränkt. Quantale Daten, d. h. Anteile von Merkmalsträgern, sind in der Regel durch 0 (keine Merkmalsträger) nach unten und durch 1 (nur Merkmalsträger) nach oben beschränkt. Einseitig beschränkter Wertebereich: Existiert nur eine (theoretisch begründete) Grenze nach unten bzw. nach oben, spricht man von einer einseitigen Beschränkung. Dies sind insbesondere alle Konzentrationsdaten, die per Definition nicht negativ sein können (0 ist also das Minimum). Unbeschränkter Wertebereich: Eine nicht beschränkte Verteilung ist unbeschränkt. Sie umfasst also negative als auch positive Zahlen beliebigen Betrages. Unbeschränkte Verteilungen treten auf, wenn keine Grenzen theoretisch abgeleitet werden können. In der Simulation heißt dies aber nicht, dass auch beliebig große Beträge auftreten müssen, da diese unter Umständen eine zu geringe Wahrscheinlichkeit besitzen, um beobachtet werden zu können.

41 31 Die Einflussgrößen im Cadmium-Modell (Beispiel 3.1) werden alle durch kontinuierliche Verteilungen modelliert. Es gibt aber noch weitere Verteilungen, die im Wesentlichen jeweils spezielle Experimente beschreiben. So beschreibt die Binomialverteilung die zufällige Anzahl des (unabhängigen) Auftretens von Schädigungen in einem Tierexperiment (mit gleichartigen Tieren). Ausprägungen Wertebereich diskret kontinuierlich Zweiseitig beschränkt Einseitig beschränkt Unbeschränkt Diskrete Gleichverteilung, Binomialverteilung, hypergeometrische Verteilung, empirische Verteilung Poisson-Verteilung, geometrische Verteilung, negative Binomialverteilg. Stetige Gleichverteilung, Beta-Verteilung, Dreiecksverteilung, kumulative Verteilung Exponentialverteilung, Weibullverteilung, Gammaverteilung, Lognormalverteilung, Loglogistische Verteilung Normalverteilung, logistische Verteilung, Student sche t-verteilung y Weitere Hinweise zur passenden Auswahl einer Verteilung zur Modellierung konkreter Daten gibt es im Kapitel 6. Im Auswahlfeld zur Verteilung ( Distribution ) können Sie jetzt eine Lognormalverteilung wählen. Wählen Sie bitte dazu Lognorm2 aus. Als Hilfestellung bietet auch ein grafisches Auswahlmenü an, dass Sie mit dem Distributions -Icon aufrufen können. Es erscheinen die verfügbaren Verteilungen jeweils mit einer kleinen Skizze der zugehörigen Dichte. Sie wählen die gewünschte Verteilung durch Klicken auf die Skizze aus.

42 32 Die Angabe des Verteilungsnamens reicht allerdings nicht zur Festlegung einer einzelnen Verteilung aus. Vielmehr können in einer solchen Familie von Verteilungen noch sehr unterschiedliche Vertreter zusammengefasst sein. Zur konkreten Auswahl bedarf es noch der Angabe der Parameter. Die Anzahl der Parameter ist dabei ein gutes Maß für die Komplexität der Verteilung. Bei der Lognormalverteilung ( Lognorm2 ) sind es zwei Parameter mit den Bezeichnungen μ und σ. y Die Zusammenstellung von notwendigen Kenngrößen zur Identifizierung einer Verteilung eines bestimmten Typs heißt Parametrisierung. So werden zur Beschreibung einer Lognormalverteilung zwei Kenngrößen als Parameter benötigt. Dies sind üblicherweise das arithmetische Mittel μ und die Standardabweichung σ der logarithmierten Werte, entsprechend dem Logarithmus (zur Basis e) des geometrischen Mittels bzw. der geometrischen Standardabweichung. Für bestimmte Modellierungen kann es aber auch sinnvoll sein, das arithmetische Mittel und die Standardabweichung der nicht transformierten Werte als Parametrisierung zu benutzen. Die Parametrisierung einer Familie von Verteilungen ist also weder eindeutig noch standardisiert, so dass jeweils genau darauf geachtet werden muss, welche Angaben zur Spezifikation der Verteilung benutzt werden. Näheres zur Lognormalverteilung finden Sie im nächsten Einschub.

43 33 Darüberhinaus besteht die Möglichkeit die Verteilung über zusätzliche Beschränkungen ( truncation minimum, truncation maximum ) oder eine Verschiebung ( shift ) zu verändern. Bei der Truncation wird die Verteilung durch zusätzliche Beschränkungen gestutzt, d.h. dass Beobachtungen außerhalb der Grenzen nicht bei der Simulation berücksichtigt werden. Die Lognormalverteilung ist per Definition einseitig durch 0 nach unten beschränkt und bedarf in der Regel keiner zusätzlichen Stutzung. Im Allgemeinen sollte eine passend gewählte Familie von Verteilungen vor einer nachträglichen Stutzung den Vorrang haben. Die entsprechenden Grenzen sind deshalb auf negativ unendlich ( tr. min=-infinity ) und positiv unendlich ( tr. max=infinity ) zu belasen. Bei der Verschiebung ( shift ) wird die gesamte Verteilung um den angegebenen Wert verschoben. Damit kann die untere Beschränkung auf den theoretisch begründeten Wert angepasst werden. Der Faktor für die Intraspeziesextrapolation kann nach seiner Definition nur Werte größer oder gleich Eins annehmen. Durch eine Verschiebung um 1 ( shift=1 ) kann die Lognormalverteilung so verändert werden, dass sie nur Ausprägungen größer gleich Eins erzeugt. Eine Verschiebung um Null ( shift=0 ) lässt die Verteilung unverändert. Bitte geben Sie die Parameter für die Lognormalverteilung der Aufnahmemenge aus dem Beispiel ein und beobachten die Veränderung in der Grafik und den Kenngrößen. Sie haben jetzt die spezielle Verteilung für die Aufnahmemenge festgelegt.

44 liefert Ihnen jetzt mit der Grafik und den Kenngrößen in der rechten Spalte weitere Informationen zur Kontrolle Ihrer Auswahl. Eine spezifizierte Verteilung enthält alle Informationen zur Lage (Lokalisation) der Werte der variierenden Größe das sind z. B. der Median, der arithmetische ( Mean ), der geometrische Mittelwert und der Modus (häufigster Wert Mode ) zur Streuung (Variation) das sind z. B. die Standardabweichung ( Std. Dev ), die Varianz ( Variance ) oder die Interquartilspanne (Differenz von 75 % und 25 %-Quantil) und zur Symmetrie und Form das ist z. B. die Schiefe ( Skewness ) oder Wölbung ( Kurtosis ). Das p %-Quantil beschreibt zusätzlich den Wert der variierenden Größe, so dass mit einer Wahrscheinlichkeit von p% alle Beobachtungen kleiner oder gleich sind. Damit sind 95 % der möglichen Werte der variierenden Größe kleiner oder gleich dem 95 %-Quantil der Verteilung und nur 5 % größer oder gleich. Diese Größen in der rechten Spalte an. Die Verteilung kann auch auf verschiedene Arten unter anderem als kumulative Verteilungsfunktionen oder als Dichtefunktionen grafisch dargestellt werden. Die kumulative Verteilungsfunktion beschreibt den Anteil, mit dem die variierende Größe bis zu einem bestimmten Wert, der auf der horizontalen Achse dargestellt wird, auftritt. Die vertikale Achse zeigt den zugehörigen Anteil (auch Wahrscheinlichkeit), der zwischen 0 % (=0) und 100% (=1) liegen kann. Log-Normalverteilung der Interspeziesextrapolation Kumulative Verteilungsfunktion 100% 75% 50% 25%-Quantil Median = geom.mittel 75%-Quantil arithm.mittel 25% 0% Extrapolationsfaktor Am Graph der Verteilungsfunktion können entsprechend besonders gut die Quantile der Verteilung abgelesen werden. Die Dichtefunktion stellt mathematisch die erste Ableitung (Steigung) der kumulativen Verteilungsfunktion dar.

45 35 Log-Normalverteilung der Interspeziesextrapolation Dichte 25%-Quantil Median = geom.mittel 75%-Quantil arithm.mittel Interquartilspanne Standardabweichung Extrapolationsfaktor Das Integral der Dichtefunktion entspricht damit wieder dem Anteil der Werte des Integrationsbereichs. Das Integral über den gesamten Wertebereich ist 1. Die Ausprägung der Dichte, aufgetragen auf der vertikalen Achse, gibt die Intensität an, mit der einzelne Werte der variierenden Größe auftreten. Dies entspricht ungefähr den beobachteten Häufigkeiten, die allerdings auf der Skala der Ableitung der Verteilungsfunktion gemessen werden. An der Dichtefunktion sind insbesondere die Lokalisation und die Symmetrie der Verteilung gut zu zeichnet deshalb die Dichtefunktion und markiert jeweils zwei Quantile und den zugehörigen Vorhersagebereich. Log-Normalverteilung der Intraspeziesextrapolation Dichte 5%-Quantil 95%-Quantil % 90% 5% Extrapolationsfaktor

46 36 Die Angaben für die Referenzlinien: Linke Referenzlinie Left X Left P Linkes p %-Quantil (horizontale Achse) Zugehörige Wahrscheinlichkeit p Rechte Referenzlinie Right X Right P Rechtes p %-Quantil (horizontale Achse) Zugehörige Wahrscheinlichkeit p können editiert werden. Aktivieren Sie dazu die entsprechende Zelle und verändern Sie den Wert nach Ihren Wünschen. Bei Eingabe eines Quantil-Wertes die zugehörige Wahrscheinlichkeit und umgekehrt. Geben Sie das 25 %- ( Left P=25% ) und das 75 %-Quantil ( Right P=75% ) ein, so unter der Differenz ( Diff X ) den Interquartilabstand an.

47 37 Die Grafik können Sie auch anklicken und mit dem Kopier-Icon zwischenspeichern. Damit steht Ihnen die Grafik in anderen Programmen, z. B. in WORD oder EXCEL zur Verfügung. Durch Anklicken der Grafik mit der rechten Maustaste öffnet sich ein Kontextmenü, bei dem Sie unter Graph Type und dem Untermenü Ascending Cumulative Solid auch die Darstellung der kumulativen Verteilungsfunktion aufrufen können.

48 38 Zum Abschluss soll die Verteilung noch mit einem Namen versehen werden, damit diese Verteilung später leichter identifiziert werden kann. Nach Anklicken des Input Properties -Icons öffnet sich ein Eingabe Fenster für den Namen. Beenden Sie Ihre Eingabe mit OK. In der obersten Befehlszeile können Sie jetzt zur Definition der Lognormalverteilung ablesen. Durch Klicken auf Tabellenblatt. übertragen Sie die Funktion in das EXCEL- Dies ist das arithmetische Mittel der definierten Verteilung: RiskLognorm2(7.621; ) In der Zelle erscheint das arithmetische Mittel ( Mean ) der Verteilung.

49 Was Sie über Lognormalverteilungen wissen müssen x Die Lognormalverteilung wurde 1879 von Galton als Grenzverteilung unendlicher Produkte hergeleitet. Sie ist eine stetige Verteilung, die nach unten durch Null beschränkt wird und damit auf positive Zahlen konzentriert ist. Ihre Dichte ist rechtsschief und skalenunabhängig, d. h. invariant gegenüber Transformationen der Maßeinheiten. Sie erlaubt wenige sehr große Beobachtungen. Ihren Namen verdankt die Lognormalverteilung einem engen Zusammenhang zur Normalverteilung: Die logarithmierten Beobachtungen entsprechen nämlich einer Normalverteilung. Aus diesem Grund hat sich auch eine Parametrisierung mit dem Mittelwert μ und der Standardabweichung σ der Normalverteilung durchgesetzt. Lognormalverteilung Zusammenhang Normalverteilung Natürlicher Logarithmus ( LN ) Exponentialfunktion zur Basis e ( EXP ) Parameter Parameter μ = μ Mittelwert σ >0 = σ >0 Standardabweichung Kenngrößen Kenngrößen Geometrisches Mittel =Median Geometrische Standardabweichung GM = EXP(μ) μ = LN( GM ) Mittelwert = Median GSD = EXP(σ) σ = LN( GSD ) Standardabweichung p%-quantil x p% = EXP(n p% ) = EXP(μ+σ z p% ) n p% = LN(x p% ) p%-quantil Anm.: Mit z p% werden die Quantile der Standardnormalverteilung ( Normal(0;1) ) bezeichnet, es gilt: z 1% = 2.33, z 5% = 1.64, z 10% = 1.28, z 25% = 0.67, z 75% = 0.67, z 90% = 1.28, z 95% = 1.64, z 99% = 2.33

50 40 Weitere Kenngrößen von Lognormalverteilungen Minimum 0 Maximum Arithmetisches Mittel Median nach oben unbeschränkt AM = EXP( μ + MED = EXP(μ) 1 2 σ 2 ) Modalwert, Modus 2 MOD = EXP( μ σ ) Standardabweichung 2 2 SD = EXP( μ) EXP( σ )[ EXP( σ ) 1] Schiefe 2 2 SKEW = [ EXP( σ ) + 2] EXP( σ ) 1 Zum Schätzen der Parameter μ und σ wird ebenfalls das Vorgehen bei normalverteilten Beobachtungen übertragen und auf die logarithmierten Werte angewandt. Es ergeben sich folgende Schätzer aus N lognormalverteilten Beobachtungen X 1,..., X N : und μ ˆ = N 1 LN(Xn ) N n= 1 σ ˆ = N 1 [ 2 LN(X μ] n) ˆ N 1 n= 1 ˆ N 2 ) n= 1 (ML-Schätzer: σ = 1 [ LN(Xn ) μ ˆ ] N

51 41 bietet die Lognormalverteilung unter dem Namen Lognorm noch mit einer alternativen Parametrisierung an. Hier werden das a- rithmetische Mittel und die Standardabweichung der Lognormalverteilung, also der NICHT logarithmierten Werte, zur Parametrisierung verwandt. Da die Bezeichnungen μ (jetzt: Mean ) und σ (jetzt: Std.Dev. ) beibehalten wurden, kann es leicht zu Verwechslungen kommen. Zusätzlich besteht die Möglichkeit durch Anklicken der alternativen Parametrisierung ( Alt -Icon) ein neues Fenster zu öffnen:

52 42 indem weitere Parametrisierungen, z. B. die Angabe zweier Quantile, gewählt werden können: Hier können Sie die Prozentangaben der vorgegeben Quantile ( Percentile ) eintragen und mit OK bestätigen. x Umrechnung der Parameter der GF-Verteilung für Unterverteilungen als Formulartabelle In der Datenbank RefXP werden die Verteilungen der Expositionsfaktoren als Generalisierte F-Verteilungen (GF-Verteilungen) beschrieben. Für diese Verteilungsfamilie findet sich kein Zufallszahlengenerator. Deshalb ist es notwendig auf zweiparametrige Unterverteilungen zurückzugehen, wie sie für Simulationen üblich sind. In der Datenbank werden entsprechende Vorschläge in der Rangfolge ihrer Anpassungsgüte gegeben. Die beste Approximation liefert der so genannte Best Fit. Dies ist die Log-logistische, Log-Normal-, Weibull oder Gamma-Verteilung, die den geringsten Unterschied zur GF- Verteilung aufweist. Die Angabe erfolgt in der Datenbank teilweise noch in der Parametrisierung der GF-Verteilung, so dass für die Eingabe Umrechnungen notwendig werden.

53 43 Ein neues EXCEL-Tabellenblatt enthält alle Formeln zur Umrechnung der Parameter und die sowie Kennzahlen und Funktionswerte zum Vergleich:

54 44 Da es sich hierbei um eine häufigere Anwendung handelt, lohnt sich die Programmierung eines passenden EXCEL-Formulares. Unter dem Menüpunkt Einfügen erhalten Sie im Unterpunkt Tabellenblatt ein leeres Tabellenblatt in EXCEL, das Sie passend umbenennen können. Die gelben Felder sollen zur Eingabe dienen und die grün unterlegten Felder die Ergebnisse enthalten. Die nachfolgende Tabelle zeigt die notwendigen Einträge und Formeln. Die Zahlenangaben beziehen sich auf die Gesamtaufnahme an Lebensmittel von männlichen Jugendlichen im Alter zwischen 14 und 15 Jahren aus der Datenbank RefXP. Selbstverständlich können die Angaben, Positionen und Bezüge in Ihrem eigenen Tabellenblatt andere sein. Benutzt werden verschiedene EXCEL-Funktionen. Weitere Informationen zu den Formeln finden Sie in der Literatur über Verteilungen, insbesondere [Evans et al. 2000].

55 45 A B C D E F G 1 Umrechnung der Parameter der GF-Verteilung für Unterverteilungen 2 3 Verteilung GF- Verteilung 4 RISK Loglogistische Verteilung Log-Normal- Verteilung RISK LOGNORM2 Weibull- Verteilung RISK WEIBULL Gamma- Verteilung RISK GAMMA LOGLOGISTIC 6 7 Parameter der GF-Verteilung (rote Angaben sind fest) 8 Parameter 9 m1= m2= λ= p= Parameter 15 Parameter 16 Shape α= Scale β= Mean μ= Std-Dev. σ= (Umrechnung für Lognormalverteilung) 20 ω2= Kennzahlen Arithm. Mittel E(X) Funktionen Beobachtung x= Dichtefunktion f(x)= Verteilungsfunktion F(X)= Wahrscheinlichkeit p Quantil q(p)=

56 46 Berechnungen: Zelle =Formel GF-Verteilung: Eingaben: 1. Parameter: m1 C9 2. Parameter: m2 C10 3. Parameter: λ C11 4. Parameter: p C12 Beobachtung: x C30 Wahrscheinlichkeit: p C34 Ausgaben: Arithm. Mittelwert: E(X) C26= EXP( LN( $C$10/$C$9 ) / $C$12 )*EXP( GAMMALN( $C$9 + 1/$C$12 )) * EXP( GAMMALN( $C$10-1/$C$12 )) / $C$11 / EXP( GAMMALN( $C$9 )) / EXP( GAMMALN( $C$10 )) Verteilungsfunktion: F(x) C32= 1 - FVERT( EXP( LN( $C$11*$C$30 ) * $C$12 ); 2*$C$9; 2*$C$10 ) Quantil: q(p)= C35= EXP( LN( FINV( $C$34; 2*$C$9; 2*$C$10 )) / $C$12 ) / $C$11 Beachte: Für große Werte von m1 bzw. m2 sind nicht alle Berechnungen mit EXCEL möglich. Log-logistische Verteilung: Eingaben: 1. GF-Parameter: λ D11 2. GF-Parameter: p D12 Beobachtung: x D30 Wahrscheinlichkeit: p D34 Ausgaben: α D16= $D$12 β D17= 1 / D22= RiskLoglogistic( 0; $D$17; $D$16 ) Arithm. Mittelwert: E(X) D26= EXP( GAMMALN( 1+1/$D$12 )) * EXP( GAMMALN( 1-1/$D$12 )) / $D$11 Dichtefunktion: f(x) D31= $D$11 * $D$12 * EXP( LN( $D$11 * $D$30 ) * ( $D$12-1)) / ( 1 + EXP( LN( $D$11*$D$30 ) * $D$12 ))^2 Verteilungsfunktion: F(x) D32= EXP( LN( $D$11*$D$30) * $D$12 ) / (1 + EXP( LN($D$11*$D$30) * $D$12)) Quantil: q(p)= D35= EXP( LN( $D$34 / (1 - $D$34)) / $D$12) / $D$11 Log-Normalverteilung: Eingaben: 1. GF-Parameter: λ E11 2. GF-Parameter: p E12 Beobachtung: x E30 Wahrscheinlichkeit: p E34 Ausgaben: μ E18= -LN( $E$11 ) σ E19= 1 / $E$12 Umrechnung: ω2 E20= EXP( $E$19^2 E22= RiskLognorm2( $E$18 ;$E$19 ) Arithm. Mittelwert: E(X) E26= EXP( $E$18 ) * WURZEL( $E$20 ) Dichtefunktion: f(x) E31= NORMVERT( ( LN($E$30) - $E$18) / $E$19; 0; 1; 0) / $E$30 / $E$19 Verteilungsfunktion: F(x) E32= NORMVERT( ( LN($E$30) - $E$18) / $E$19; 0; 1; 1) Quantil: q(p)= E35= EXP( $E$19 * NORMINV( $E$34; 0; 1) + $E$18 )

57 47 Weibull-Verteilung: Eingaben: 1. GF-Parameter: λ F11 2. GF-Parameter: p F12 Beobachtung: x F30 Wahrscheinlichkeit: p F34 Ausgaben: α F16= $F$12 β F17= 1 / F22= RiskWeibull($F$16; $F$17) Arithm. Mittelwert: E(X) F26= $F$17 * EXP( GAMMALN( ($F$16+1) / $F$16)) Dichtefunktion: f(x) F31= WEIBULL($F$30; $F$16; $F$17; 0) Verteilungsfunktion: F(x) F32= WEIBULL($F$30; $F$16; $F$17; 1) Quantil: q(p)= F35= $F$17 * EXP( LN( LN(1 / (1-$F$34))) / $F$16) Gamma-Verteilung: Eingaben: 1. GF-Parameter: m1 G9 2. GF-Parameter: λ G11 Beobachtung: x G30 Wahrscheinlichkeit: p G34 Ausgaben: α G16= $G$9 β G17= 1 / ($G$9 * G22= RiskGamma($G$16; $G$17) Arithm. Mittelwert: E(X) G26= $G$16 * $G$17 Dichtefunktion: f(x) G31= GAMMAVERT($G$30; $G$16; $G$17; 0) Verteilungsfunktion: F(x) G32= GAMMAVERT($G$30; $G$16; $G$17; 1) Quantil: q(p)= G35= GAMMAINV($G$34; $G$16; $G$17) Beachte: Für große Werte von m1 sind nicht alle Berechnungen mit EXCEL möglich.

58 48 d Tipp: Um ein solches Formular gegen versehentliche Änderungen zu schützen, kann die Eingabe auf einzelne Zellen eingeschränkt werden. Nach Aktivieren einer Eingabezelle (z. B. C9 ) ist im Menü Format, Unterpunkt Zellen..., Registerkarte Schutz die Sperrung aufzuheben (Voreinstellung = Gesperrt ). Nachdem dies für alle Eingabezellen erfolgt ist, wird das restliche Blatt unter Menüpunkt Extras, Unterpunkt Schutz / Blatt schützen für Eingaben gesperrt. Ein Kennwort muss nicht eingegeben werden. Auf dem gleichen Weg können Sie den Schutz auch wieder aufheben. Nach Eingabe der Parameter in die entsprechenden Felder erhalten Sie nach der Bestätigung Ihrer Eingabe die Ergebnisse angezeigt.

59 49 Wiederholen Sie jetzt die Schritte für die Eingangsverteilungen der Cadmium- Konzentration und der Resorptionsrate. Die stetige Gleichverteilung heißt RISKUNIFORM und die Dreiecksverteilung RISKTRIANG. Mehr zur Anwendung dieser Verteilungen erfahren Sie später in Abschnitt 6.4. Damit sind bis auf das Körpergewicht alle Eingangsverteilungen im Programm passend definiert.

60 Mischen von Verteilungen... x Beim Körpergewicht liegen zwei einzelne Verteilungen für jeweils die 14- und 15-jährigen, männlichen Jugendlichen vor. 14-Jährige: Gamma-verteilt: α = 28.81, β = Jährige: Gamma-verteilt: α = 39.89, β = Hier zeigte sich bei der Auswertung der Nationalen Verzehrsstudie (NVS ) als empirische Datengrundlage ein signifikanter Unterschied zwischen den Alterstufen, der allerdings in dieser Modellierung nicht berücksichtigt werden soll. Also müssen die zwei Teilpopulationen im Rechner wieder gemischt werden. Dazu wird im ersten Schritt entschieden, ob ein 14-jähriger oder ein 15-jähriger Jugendlicher simuliert werden soll. Anteil 14-Jähriger: 51.9% (in der NVS: N=152 Personen) Anteil 15-Jähriger: 48.1% (in der NVS: N=141 Personen) Mit Hilfe einer (diskreten) Binomialverteilung auf den Werten {0,1} mit dem Parametern n=1 und p=0.519 wird eine Variable erzeugt, die mit einer Wahrscheinlichkeit von p=0.519 den Wert 1 (=14-Jährige) und mit der Restwahrscheinlichkeit von p=0.481 den Wert 0 (=15-Jährige annimmt. in Zelle F12 lautet: (F12) =RiskBinomial( 1; )

61 51 Mit Hilfe dieser Zelle können die Gamma-Verteilungen in den Zellen G10 und G11 : 14-Jährige: (G10) =RiskGamma(28.81; 1.972) 15-Jährige: (G11) =RiskGamma(39.89; 1.561) gemischt werden: (B10) = $F$12 * $G$10 + (1-$F$12) * $G$11

62 52 In der Zelle B10 steht mit einer Wahrscheinlichkeit von ein wert aus der Verteilung der 14-Jährigen ( G10 ) und mit der Restwahrscheinlichkeit von ein Wert aus der Verteilung der 15- Jährigen ( G11 ). Nach dem gleichen Prinzip kann man auch mehr als zwei Verteilungen Mischen. Näheres finden Sie in Abschnitt 6.4. Da es sich hierbei um eine häufigere Anwendung handelt, lohnt sich die Programmierung einer passenden Formulartabelle. ist es auch möglich die Zahlenangaben in der Definition der Verteilung durch passende Zellennamen zu ersetzen, z. B. bei der Binomialverteilung zum Mischungsverhältnis: (F12) =RiskBinomial(1; $F$10; RiskName( MixBW )) an Stelle von: (F12) =RiskBinomial(1; 0.519; RiskName( MixBW )) wobei in der Zelle F10 der Mischungsanteil der 14-Jährigen steht. Analog heißen die Befehle der Gamma-Verteilungen: 14-Jährige: (G10) =RiskGamma($H$10; $I$10; RiskName( BW14 )) 15-Jährige: (G11) =RiskGamma($H$11; $I$11; RiskName( BW15 )) d Tipp: Im Beispiel wurden die Bevölkerungsanteile an Hand der repräsentativen Stichprobe von ermittelt. An dieser Stelle könnten auch die Bevölkerungsanteile der aktuellen Altersjahrgänge oder besonderer Teilgruppen der Bevölkerung (z. B. Fahrradfahrer) stehen. Damit ist es möglich die Alters- und Geschlechtsstratifizierung zur Anpassung der Expositionsabschätzung an die neuere Bevölkerungsentwicklung oder an Teilpopulationen zu benutzen. Die nachfolgenden Tabellen zeigen den bisherigen Aufbau des Programms:

63 53 A B C D E F G H I 1 Verteilungsbasiertes Expositionsmodell 2 Schadstoff: Cadmium 3 Medium: Nahrung (gesamt) 4 Teilpopulation: Jungen, Jahre 5 6 Eingangsgrößen Verteilung Bemerkungen 7 C 4.00 Konzentration im Medium [ng/g] 8 IU 2131 Aufnahmemenge pro Tag [g/d] 9 R 0.05 Resorptionsrate [-] Alter n Anteil Verteilung α β 10 BW 56.8 Körpergewicht [kg] % % Summe Zielgröße Modell 14 ADD-res Resorbierter Schadstoff bezogen auf Körpergewicht und Tag [ng/(kg*d)] Simulation 17 Simulation: Latin-Hypercube: 5000 Simulations 18 Startwert: Fixed seed: Berechnungen: Eingaben: Verteilung von C Verteilung von IU Verteilung von R Zelle = Modell B7= RiskUniform(3; 5; RiskName("C")) B8= RiskLognorm2( ; ; RiskName("IU")) B9= RiskTriang(0.04; 0.05; 0.06; RiskName("R")) Zu BW: eingesetzte Parameter der Gamma-Verteilungen: α= β= Stichprobengröße 14J E10 Verteilung von BW der 14J G10= RiskGamma($H$10; $I$10; RiskName("BW14")) H10 I10 Stichprobengröße 15J E11 Verteilung von BW der 15J G11= RiskGamma($H$11; $I$11; RiskName("BW15")) H11 I11 Berechnungen: Gesamtstichprobe BW Anteil 14J Anteil 15 J Mischungsvariable Verteilung BW E12= SUMME($E$10:$E$11) F10= $E$10/$E$12 F11= $E$11/$E$12 F12= RiskBinomial(1; $F$10; RiskName("MixBW")) B10= $F$12*$G$10+(1-$F$12)*$G$11 Ausgaben: Referenzwert B14= $B$7*$B$8*$B$9 / $B$10

64 Punktmasse auf Null (PMZ)... x Für viele Expositionsfaktoren wird zusätzlich zur Verteilung eine Punktmasse auf Null (Point Mass at Zero, PMZ) angegeben, die den Anteil der Bevölkerung beschreibt, die das entsprechende Expositionsmedium gar nicht betrifft. Für diesen Anteil der Bevölkerung ist der Expositionsfaktor also konstant auf dem Wert Null. Damit ist die Punktmasse auf Null aber nichts anderes als eine Mischung von zwei Verteilungen: Null-Wert: Anteil PMZ=p; Verteilung: Konstant =0 Werte über Null: Anteil 1-p; Verteilung: RiskVerteilung =RiskBinomial(1; 1-p) * RiskVerteilung Als Beispiel könnte bei der Konzentration eine Punktmasse auf Null von p=0.075 eingeführt werden, hier der Anteil unbelasteter Nahrung. (F7) =Binomial(1; 0.075) Für die restliche Nahrung gilt die bisherige Verteilung: (B7) =RiskUniform(3; 5) Für die Verteilung mit PMZ ergäbe sich (B7) =$F$7 * 0 + (1-$F$7) * RiskUniform(3; 5) oder die vereinfachte Formel (B7) = Binomial(1; ) * RiskUniform(3;5)

65 55 Q Die Vereinfachung in der Formel zur Punktmasse auf Null ist bei der Mischung von Verteilungen falsch: =RiskBinomial(1; p)*riskvert1 + RiskBinomial(1; 1-p) * RiskVert2 da hier sonst zwei, unabhängige Mischungsvariablen (= Realisationen zweier binomialverteilten Zufallsvariable) benutzt werden! 3.3 Modellgleichung Das Modell für den Referenzwert wird als Formel in der üblichen EXCEL-Konvention eingetragen. Der Zahlenwert gibt ebenfalls das Ergebnis der normalen EXCEL- Berechnung wieder. Dies ist noch der von EXCEL berechnete Wert, gemäß: B14 = B7 * B8 * B9 / B10 ohne Simulation! Zur Unterscheidung von bloßen Zwischenschritten und Zwischenergebnissen, werden die Simulationsergebnisse besonders als Output gekennzeichnet. Dies geschieht im Unterpunkt Model / Add Output bzw. mit dem Add-Output fordert Sie anschließend auf, einen Namen für diese Ergebnisverteilung zu vergeben. Sie können den Vorschlag dabei nach Wunsch abändern. Ihre Eingabe der Modellgleichung wird dabei um RiskOutput( Name )+ ergänzt.

66 56 Damit ist die Eingabe auch des Modells abgeschlossen. Einen Überblick über alle Eingangsverteilungen ( Inputs ) und Ergebnisverteilungen ( Outputs ) erhalten Sie im Unterpunkt Model / List Outputs and Inputs oder über den entsprechenden Display... öffnet daraufhin das Modellfenster mit einer tabellarischen Darstellung der Eingangsverteilungen ( Inputs ) und der Ergebnisverteilungen ( Outputs ). Sie springen zwischen den Tabellen durch eine entsprechende Wahl in der Anzeige ( Show ). Wechsel zwischen Eingabe- und Ergebnisverteilungen

67 57 Durch Auswahl einer Eingangsverteilung in der linken Liste und klicken des Define Distribution -Icons gelangen Sie ebenfalls zur Definition der Verteilung und können eventuelle Korrekturen vornehmen. Mit dem EXCEL-Icon gelangen Sie zurück zum Tabellenblatt. Möchten Sie nur einen knappen Überlick über im Tabellenblatt erhalten, betätigen Sie den Select functions -Icon wahlfenster. Im erscheinenden Aus- können Sie auswählen, im Tabellenblatt markiert werden sollen. Vor dem nächsten Schritt sichern Sie bitte Ihre Eingaben in EXCEL und speichern Ihre Datei mit Hilfe des Speichern -Icons ab.

68 58 y Wichtige Schalter (Icons) Definition einer Verteilung Seite 29 Auswahl von Verteilungen Seite 31 Optionen für Verteilungen Seite 38 Einfügen von Verteilungen Seite 38 Aufruf alternativer Verteilungsparameter Seite 41 Definition einer Ergebnisverteilung Seite 55 Anzeigen von Eingangs- und Ergebnisverteilungen Markieren im EXCEL-Tabellenblatt Seite 56 Seite 57

69 Monte Carlo-Simulationen Bis jetzt wurden alle Berechnungen mit EXCEL ausgeführt. In diesem Abschnitt wird beschrieben, wie eine Simulation gestartet wird. Q x d bei einer Simulation Veränderungen in der EXCEL-Tabelle vornimmt, darf diese nicht gegen Eingaben geschützt sein. 4.1 Was Sie über Simulationen wissen müssen... Im Computer werden Simulationen mit Hilfe von sogenannten Pseudozufallszahlen durchgeführt. Diese sind nicht wirklich zufällig, sondern werden mit Hilfe eines festen Algorithmus, dem Pseudozufallszahlen-Generator, erzeugt. Dabei berechnet der Computer aus der jeweils aktuellen die nächste, neue Zufallszahl. So entsteht eine Folge von beliebig vielen Zahlen, die sich erst nach ca. 2 Milliarden Schritten wiederholt. Mit üblichen statistischen Verfahren ist dabei kein signifikanter Unterschied zu theoretischen Zufallszahlen festzustellen. Ein Generator ist dabei umso besser, je speziellere Tests keine Unterschiede aufzeigen. Für eine Simulationsrechnung ist aber von Vorteil, dass die Berechnungen mit ihren Ergebnissen wiederholt werden können, wenn die Startzahl der Simulation ( Seed ) und die Anzahl der Replikationen bekannt ist. Tipp: Zur späteren Überprüfbarkeit ihrer Berechnungen sollten Sie immer die Startzahl ( Seed ) und Anzahl der Replikationen dokumentieren. Variieren Sie die Startzahl und Anzahl der Replikationen nur zur Kontrolle der Stabilität der Ergebnisse. Benutzen Sie aber für jedes neue Projekt eine andere Startzahl (z. B. das Datum des Projektbeginns) um systematische Effekte zu vermeiden. Eine Simulationsrechnung dient nicht der Nachbildung von zufälligen Ereignissen, sondern der approximativen Bestimmung der Zielverteilung, hier des Referenzwertes. Schon einfache Verknüpfungen von unterschiedlichen Verteilungen bewirken, dass eine explizite Bestimmung der Zielverteilung nur noch mit erheblichem Aufwand möglich ist. Hier vereinfacht die Simulationsrechnung die Darstellung der Ergebnisse erheblich. Allerdings ist eine Simulationsrechnung niemals exakt, sondern nähert sich der tatsächlichen Verteilung des Referenzwertes nur an. Je mehr Replikationen Sie durchführen, umso genauer wird das Ergebnis der Approximation. Man spricht von Konvergenz.

70 60 Angaben zur Lokalisation, wie Median oder Mittelwert, konvergieren schneller als Angaben zur Streuung, wie Interquartilspanne oder Standardabweichung. Das gleiche gilt für Quantile im Zentrum der Verteilung (25% bis 75%) im Gegensatz zu den Rändern (1% bis 10% oder 90% bis 99%). Um die Konvergenz festzustellen, wird nach einer vorgegebenen Anzahl von Replikationen geprüft, ob sich im Ergebnis noch starke Veränderungen ergeben haben. d Tipp: Erhöhen Sie zum Abschluss Ihrer Berechnungen die Anzahl der Replikationen nochmals erheblich (z. B. verdoppeln), um die Stabilität zu sichern. Alternativ können Sie auch die Startzahl verändern, um einen Eindruck über die verbleibende Unsicherheit zu bietet Ihnen zwei Alternativen bei der Durchführung Ihrer Simulation: Bei der Monte-Carlo-Simulation einer Verteilung über ihre (inverse) Verteilungsfunktion werden die Pseudozufallszahlen direkt in die Funktion eingesetzt. In der nachfolgenden Skizze von links (y-achse mit Pseudozufallszahlen) nach unten (x-achse mit Zufallszahlen in der gewünschten Verteilung). Log-Normalverteilung der Interspeziesextrapolation Kumulative Verteilungsfunktion 100% 75% 50% 25%-Quantil Median = geom.mittel 75%-Quantil arithm.mittel 25% 0% Extrapolationsfaktor Dabei kommt es zu Häufungen im Zentrum der Verteilungen. Dieses Verfahren ist schnell in der Berechnung weiterer Replikationen, aber langsam in der Konvergenz der Resultate.

71 61 Bei der Latin-Hypercube-Simulation erfolgt die Zuteilung der Zufallszahlen auf die Funktion in strukturierter Form, so dass in festen Blöcken (in der Skizze pro Quartil) immer gleich viele Zufallszahlen generiert werden. Log-Normalverteilung der Interspeziesextrapolation Kumulative Verteilungsfunktion 100% 75% 50% 25%-Quantil Median = geom.mittel 75%-Quantil arithm.mittel 25% 0% Extrapolationsfaktor Bei mehreren Einflussgrößen werden auch die Kombinationen kontrolliert. Dies führt insbesondere bei vielen Einflussgrößen zu einer verlangsamten Erzeugung von Replikationen. Dafür ergibt sich eine schnellere Konvergenz der Zielverteilung. Im vorliegenden Modell mit vier Eingangsverteilungen ist die Latin- Hypercube-Simulation zu bevorzugen. 4.2 Einstellungen Die Einstellungen für Ihre Simulation nehmen Sie im Unterpunkt Simulation / Settings vor. Sie können alternativ auch den Simulation Settings - anklicken. Es erscheint das Simulation Settings -Fenster mit vier Register- Icon karten. Bei Iterations können Sie die Anzahl der Replikationen ( Iterations ) wählen. Bei der Auswahl auto nach einer festen Anzahl von Schritten, die unter Monitor festgelegt wird, ob noch relative Veränderungen oberhalb der zuwählenden Grenze ( Auto-Stop Simulation Convergence Percentage ) stattgefunden haben. Ist dies nicht er Fall, wird die Simulation beendet, im anderen Fall bis maximal 5000 Replikationen ausgeführt. Sie können aber an Stelle von auto auch eine feste Anzahl von Replikationen (auch größer 10000) vorgeben.

72 kann auch mehrere Simulationsläufe gleichzeitig starten. Darauf soll aber im Leitfaden nicht weiter eingegangen werden. Unter Sampling wählen Sie bitte die Latin-Hypercube -Simulation aus und geben einen Startwert ( Seed ) vor. Bei der Wahl von Choose Randomly die Simulation mit immer neuen Startwerten, die auch nicht angezeigt werden. Die weiteren Einträge übernehmen Sie bitte der Abbildung.

73 63 Der letzte Eintrag erfolgt auf der Registerkarte Monitor. Hier können Sie eintragen, nach wie vielen Schritten eine Kontrolle der Konvergenz erfolgen soll ( Update every x Iterations ). Für die automatische Simulations-Beendigung sollte die Konvergenz häufiger mit strenger Genauigkeit kontrolliert werden. Bei vorgegebener hoher Anzahl von Replikationen kann die Kontrolle seltener erfolgen, um die Rechengeschwindigkeit nicht zu bremsen. Damit ist alles für die Durchführung der Simulation vorbereitet. Der Start erfolgt im Unterpunkt Simulation / Start oder mit Hilfe des Simulation- Start zeigt die Durchführung der Simulation in einem Fenster an.

74 Simulation Zum Abschluss öffnet sich das Ergebnis-Fenster: Die Simulationen müssen unabhängig von EXCEL gesichert werden. Dies erfolgt im im Unterpunkt File / Save bzw. Save as. Der - Icon. kürzt die Befehlsfolge ab (vergleiche auch Seite 24). Im Convergence Monitor werden die Ergebnisse der Konvergenzprüfung zusammengestellt. Hier werden nur Zellen aufgenommen und geprüft, die als Zielverteilung ( RiskOutput ) benannt wurden. Ein lachender Smiley zeigt an, dass die Ergebnisse entsprechend den Abfragen konvergiert haben. Ein trauriger Smiley deutet auf eine zu große Abweichung bei der letzten Kontrolle hin. Die relativen Abweichungen sind in den linken Spalten ( %Change in... ) protokolliert. In der untersten Zeile wird die Anzahl der Replikationen ( Iter #=5000 ) und die Gesamtlaufzeit ( Runtime=00:00:19 ) angezeigt. Bei unzureichender Konvergenz erhöhen Sie bitte die Anzahl der Replikationen. Eine kompakte Wiedergabe des Simulationsergebnisses erhalten Sie unter Menü Insert, Unterpunkt Summary Statistics bzw. durch Anklicken des Summary -Icons. Hier sind für alle Eingangs- und Ergebnisverteilungen der minimal und maximal

75 65 simulierte Wert, das arithmetische Mittel und zwei Quantile, sowie die Differenzen angegeben. Sowohl der Prozentwert der Quantile, als auch der Quantilwert selbst kann editiert berechnet anschließend die restlichen Zellen neu. Einen genaueren Überblick erhalten Sie unter Menüpunkt Insert, Unterpunkt Detailed Statistics oder mit Hilfe des zugehörigen Icons. Im entsprechenden Fenster werden zu den Eingangs- und Ergebnisverteilungen die wichtigsten Kenngrößen in Spalten zusammengestellt. Hier ist eine weitere Kontrolle möglich, ob die simulierten Daten den Vorgaben entsprechen.

76 66 Schließlich können auch die Ergebnisse der 5000 Replikationen angezeigt werden. Der Aufruf erfolgt unter Menu Insert, Unterpunkt Data oder mit Hilfe des Data - Icons. Jede Zeile steht für eine Replikation. Die Ausprägungen der rechten Eingangsvariablen ergeben eingesetzt in die Modellgleichung den linken Wert der Ergebnisvariablen, den Referenzwert für TMP. Durch Anklicken des Feldes oberhalb des Variablennamens kann die gesamte Spalte markiert und kopiert werden.

77 67 Einen schnellen Überblick über die Resultate der Simulation gibt auch die graphische Darstellung der Zielverteilung. Dazu markieren Sie bitte in der linken Spalte die Ergebnisvariable und rufen mit dem Grafik-Icon, Unterpunkt Histogram die Grafik auf. Alternativ führt auch das Menü Graph, Unterpunkt Graph type / Histogram-Bars zum Ziel. Q Leider sind die Grafiken zur Ergebnisverteilung nicht sehr präzise und bedürfen zumindest der Formatierung. Unter dem Menü Graph, Unterpunkt Format Graph rufen sie das Format-Fenster mit mehreren Registerkarten auf. Wir empfehlen Ihnen aber die Darstellung der Verteilung mit EXCEL-Diagrammen.

78 68 Auf der ersten Karte Type wählen Sie bitte folgende Einstellungen aus: Die Auswahl Density berechnet eine Annäherung an die Dichte. Die Anzahl der Balken ( # Bins ) bezieht sich auf die Skalierung der x-achse ( auto (graph axis) ). Auf der zweiten Karte Scaling können Sie den Bereich der x-achse angeben ( Automatically Scale deaktivieren). Nach der Auswertung ( Summary Statistics ) liegen ca. 80% der Simulationen im Bereich von 0 bis 30.

79 69 Die weiteren Karten legen Färbung und Beschriftung das Graphen fest:

80 70 Wieder können Sie zwei Begrenzungslinien auf ausgewählte Quantile legen. Dazu sind die Angaben ( Left X, Left P, Right X, Right P ) in der rechten Spalte zu editieren.

81 71 Wenn Sie mit dem Resultat zufrieden sind, können Sie die Grafik im Menü Graph, Unterpunkt Graph in Excel in eine eigene EXCEL-Arbeitsmappe überführen und dort weiterbearbeiten. 0.2 Cadmiumaufnahme durch Nahrung X <=3.58 5% X <= % M ean = Dichte Im folgenden Abschnitt werden aber bessere Möglichkeiten erläutert, eine Grafik mit EXCEL zu erzeugen.

82 72 d Tipp: Wenn Sie mit Ihrer Programmierung zufrieden sind und die Simulation abschließen möchten, wiederholen Sie den Lauf einmalig mit deutlich erhöhter Anzahl an Replikationen. Bei der heutigen Leistung von PCs ist dies kein Problem der Rechenzeit. Im Beispiel für Replikationen weniger als 11 Minuten. Ihr Gewinn liegt in wesentlich präziseren Ergebnissen.

83 73 k y 4.4 Literatur zu Simulationen: [Gentle 2003] James E. Gentle: Random Number Generation and Monte Carlo Methods, Statistics and Computing, new edition. Berlin: Springer, 2003 [Fishman 2003] George S. Fishman: Monte Carlo, Concepts, Algorithms, and Applications. Berlin: Springer, 2003 [Lahiri 2003] S.N. Lahiri: Resampling Methods for Dependent Data. Berlin: Springer, [Law, Kelton 2000] Averill M. Law, W. Dawid Kelton: Simulation Modelling and Analysis, 3 rd edition. New York: McGraw Hill, Wichtige Schalter (Icons) Einstellungen der Simulation Kapitel 4.2 Seite 61 Starten der Simulation Seite 63 Zusammenfassung der Eingangs- und Ergebnisverteilungen Detaillierte Statistiken der Eingangs- und Ergebnisverteilungen Seite 64 Seite 65 Daten der Simulation Seite 66 Aufruf des Grafik-Fensters Seite 67

84 74 5 Aufbereitung der Ergebnisse 5.1 bietet mehrere Möglichkeiten die Simulationsergebnisse in EXCEL zusammenzufassen und abzuspeichern. Im Ergebnis-Fenster findet sich das Menü Results Der Unterpunkt Report settings bzw. der Report settings -Icon Auswahl von Ergebnistabellen. erlaubt eine Interessant sind insbesondere die Ergebnisverteilungen. Durch Anklicken von Generate Reports Now wird eine neue EXCEL-Arbeitsmappe mit gut formatierten Tabellen erzeugt, die die ausgewählten Ergebnisse enthalten.

85 75 Kürzer, aber auch wesentlich übersichtlicher, ist der Kurzreport, der unter dem Menü Results, Unterpunkt Quick Report... aufgerufen werden kann. Hier werden die wichtigsten Daten und Grafiken auf einer Seite zusammengestellt und in einer weiteren EXCEL-Arbeitsmappe abgespeichert. Diese Seite kann mit EXCEL im Menü Datei, Unterpunkt Speichern unter.. abgespeichert und ausgedruckt werden.

86 76 Im Folgenden soll aber eine weitaus individueller gestaltete Ausgabe vorgestellt werden, die sich direkt der zusätzlichen Funktion bedient, in EXCEL zur Verfügung stellt.

87 77 Die nachfolgende Tabelle fasst die zusammen, die alle Auswertungen der Zelle B14, d.h. der simulierten Verteilung des Referenzwertes von TMP sind. Berechnet wird das arithmetische Mittel ( RiskMean(B14;1) ), die Standardabweichung ( RiskStdDev(B14;1) ), die Schiefe ( RiskSkewness(B14;1) ), verschiedene p-quantile ( RiskPercentile(B14;p;1) und der Wert der Verteilungsfunktion an der Stelle x ( RiskTarget(B14;x;1) ) Der Aufruf erfolgt im EXCEL-Tabellenblatt wie jede gewöhnliche EXCEL-Funktion. Sie finden die Funktionen unter weitere Funktionen Statistics : Im nachfolgenden Fenster werden jeweils die notwendigen Eingaben erläutert:

88 78 Unter Data Source geben Sie den Namen der Zelle ( B14 ) ein, in der sich die auszuwertende Verteilung befindet. Die Angabe des Simulationslaufes ( sim # ) ist optional, da nur eine Simulation parallel durchgeführt wurde A B C Ergebnisse der Simulation (erst nach der Simulation gültig) Kenngröße Wert Bemerkung 36 1%-Quantil %-Quantil %-Quantil %-Quantil %-Quantil %-Quantil %-Quantil %-Quantil %-Quantil Median Arithm. Mittel Standardabweichung Interquartilabstand Schiefe Referenzdosis Referenzwert (fiktiv) 51 zugehöriges Quantil 82.72% Berechnungen: Eingaben: Zelle = Formel Modell B14= $B$7*$B$8*$B$9 / $B$10 Referenzdosis B60 Ausgaben: 1%-Quantil 5%-Quantil 10%-Quantil 25%-Quantil 50%-Quantil 75%-Quantil 90%-Quantil 95%-Quantil 99%-Quantil Median Arithm. Mittel Standardabweichung Interquartilabstand Schiefe Quantil zur Referenzdosis B46= RiskPercentile($B$14;0.01;1) B47= RiskPercentile($B$14;0.05;1) B48= RiskPercentile($B$14;0.1;1) B49= RiskPercentile($B$14;0.25;1) B50= RiskPercentile($B$14;0.5;1) B51= RiskPercentile($B$14;0.75;1) B52= RiskPercentile($B$14;0.9;1) B53= RiskPercentile($B$14;0.95;1) B54= RiskPercentile($B$14;0.99;1) B55= $B$50 B56= RiskMean($B$14;1) B57= RiskStdDev($B$14;1) B58= $B$51-$B$49 B59= RiskSkewness($B$14;1) B61= RiskTarget($B$14;$B$60;1)

89 79 Q d Q Eine Besonderheit ergibt sich, wenn starten, da diese erst nach einer erfolgten Simulation die korrekten Werte annehmen. Zuvor wird nur der Inhalt der auszuwertenden Zelle, hier von B14 wiederholt. Tipp: Benutzen Sie um Formulare mit individuell gestalteten Berichten zu entwickeln. Diese Berichte können alle notwendigen Informationen zu Ihrem Projekt, wie Basisstudien, Entscheidungen etc. enthalten. Um einen solchen Bericht in einer EXCEL-Datei abzuspeichern, die unabhängig vom aufgerufen werden kann, bedarf es eines Tricks. Erstellen Sie dazu zunächst im EXCEL-Menü Bearbeiten, Unterpunkt Blatt verschieben/kopieren... eine Kopie Ihres fertigen Berichts. Der Punkt Kopie erstellen muss dazu aktiviert sein. Markieren Sie anschließend in der Kopie die gesamte Tabelle und löschen Sie den Inhalt mit der Entf -Taste. Sie haben jetzt eine leere Kopie Ihres Berichtes mit allen Textformatierungen erzeugt.

90 80 Markieren Sie nun die gesamte Tabelle in Ihrem Original-Bericht und kopieren Sie die Inhalte. Abschließend können Sie diese Inhalte im Menü Bearbeiten, Unterpunkt Inhalte einfügen wieder in die leere Version Ihres Berichtes einfügen. Durch diesen Trick werden zwar alle Formatierungen, nicht aber die Formeln und Berechnungen übernommen. Die Kopie Ihres Berichtes enthält nur noch die Werte, die auch mit EXCEL weiterbearbeitet werden können.

91 EXCEL-Grafiken mit ungeordneten Daten Ebenso wie die Auswertungen mit EXCEL programmiert werden können, ist es auch möglich die Grafiken mit EXCEL zu erzeugen. Für genaue Grafiken bedarf es nicht der gleichen Anzahl an Replikationen, wie für die Kennzahlen der Zielverteilung. In der Regel reichen hier 1000 bis Werte völlig aus. Führen Sie eine entsprechende Simulation aus und markieren Sie im Ergebnisfenster die Datenspalte mit den Simulationsergebnissen, die Sie darstellen möchten. Kopieren Sie die Ergebnisse und fügen diese in einem neuen Tabellenblatt in Spalte A wieder ein (Zelle A1 aktivieren und im Menü Bearbeiten, Unterpunkt Einfügen auswählen bzw. den Einfüge-Icon betätigen).

92 82 Die folgenden Befehle können bis zu ungeordnete Simulationen in Spalte A grafisch darstellen. Die Daten müssen im Bereich A5:A10004 vorliegen. A 1 2 ADD-res 3 Output 4 B

93 83 Die nachfolgenden Grafiken sollen jetzt mit EXCEL erzeugt werden: Cd-Aufnahme Nahrung Dichte Grafik: Dichtefunktion Cd-Aufnahme Nahrung Dichte Grafik: Dichte-Histogramm

94 84 Cd-Aufnahme Nahrung 100% 90% 80% 70% Verteilungsfunktion 60% 50% 40% 30% 20% 10% 0% Grafik: Verteilungsfunktion Cd-Aufnahme Nahrung 120% 100% 80% Verteilungsfunktion 60% 40% 20% 0% Grafik: Verteilung Histogramm

95 85 Folgende Angaben helfen Ihnen bei der Formatierung der Grafiken, die Befehle folgen in der übernächsten Tabelle. D E 8 Angaben für die Grafiken: 9 Titel= Cd-Aufnahme Nahrung 10 x-achse 11 von= 0 12 bis= Grafikbereich 14 von= 0% 15 bis= 100% 16 Anteil abgebild. Daten= 100% Kennzahlen der Daten: Anzahl= Minimum= Maximum= Mittelwert= Median= Standardabw= Interquartilabstand= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil= %-Quantil=

96 86 Für die Grafik werden 100 Stützstellen oder Histogrammbalken ausgewertet: D E F G H I J Daten für die Grafiken: 52 lfd. Nr. (von 0 bis=...) Obere Intervallgrenze Intervallmitte Anz. Beob. im Intervall Absolute Häufigkeit Relative Häufigkeit Dichte Verteilungsfunktion Relative, kumulierte Häufigkeit % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % Damit die Histogramm-Dichte die korrekte Fläche aufweist, müssen die relativen Häufigkeiten durch die Intervallbreite geteilt werden. Die kumulative Verteilungsfunktion ergibt sich stattdessen einfach als Summe der relativen Häufigkeiten. In der Grafik werden die Summen allerdings über den Intervallmitten aufgetragen.

97 87 Berechnungen: Konstanten: Zelle= Formel Anzahl Stützstellen: D53= 100 Eingaben: Titelzeile: Startwert x-achse Endwert x-achse Datenbereich Ausgaben: Anteil Beob. unterh. Startw. Anteil Beob. oberh. Endw. Anteil abgebild. Daten= Anzahl= Minimum= Maximum= Mittelwert= Median= Standardabw= Interquartilabstand= 5%-Quantil= 10%-Quantil= 15%-Quantil= 20%-Quantil= 25%-Quantil= 30%-Quantil= 35%-Quantil= 40%-Quantil= 45%-Quantil= 50%-Quantil= 55%-Quantil= 60%-Quantil= 65%-Quantil= 70%-Quantil= 75%-Quantil= 80%-Quantil= 85%-Quantil= 90%-Quantil= 95%-Quantil= E9 E11 E12 A5:A10004 E14= WENN($E$11>$E$21;QUANTILSRANG($A$5:$A$10004;$E$11);0) E15= WENN($E$12<$E$22;QUANTILSRANG($A$5:$A$10004;$E$12);1) E16= $E$15-$E$14 E20= ANZAHL($A$5:$A$10004) E21= MIN($A$5:$A$10004) E22= MAX($A$5:$A$10004) E24= MITTELWERT($A$5:$A$10004) E25= MEDIAN($A$5:$A$10004) E26= STABW($A$5:$A$10004) E27= QUARTILE($A$5:$A$10004;3)-QUARTILE($A$5:$A$10004;1) E29= QUANTIL($A$5:$A$10004;0.05) E30= QUANTIL($A$5:$A$10004;0.1) E31= QUANTIL($A$5:$A$10004;0.15) E32= QUANTIL($A$5:$A$10004;0.2) E33= QUANTIL($A$5:$A$10004;0.25) E34= QUANTIL($A$5:$A$10004;0.3) E35= QUANTIL($A$5:$A$10004;0.35) E36= QUANTIL($A$5:$A$10004;0.4) E37= QUANTIL($A$5:$A$10004;0.45) E38= QUANTIL($A$5:$A$10004;0.5) E39= QUANTIL($A$5:$A$10004;0.55) E40= QUANTIL($A$5:$A$10004;0.6) E41= QUANTIL($A$5:$A$10004;0.65) E42= QUANTIL($A$5:$A$10004;0.7) E43= QUANTIL($A$5:$A$10004;0.75) E44= QUANTIL($A$5:$A$10004;0.8) E45= QUANTIL($A$5:$A$10004;0.85) E46= QUANTIL($A$5:$A$10004;0.9) E47= QUANTIL($A$5:$A$10004;0.95)

98 88 Viele Auswertungsfunktionen gibt es auch als EXCEL-Funktionen mit etwas verändertem Namen. Sie finden diese Funktionen unter Statistik : Berechnungen: Zeile 55: Startnummer (Intervallzähler) Untere Intervallgrenze des ersten Intervalls Anz. Beob. bis untere Grenze des ersten Intervalls Rel. Häufigkeit bis untere Grenze des ersten Intervalls D55= 0 E55= $E$11+D55*($E$12-$E$11)/$D$53 G55= HÄUFIGKEIT($A$5:$A$10004;$E$55:$E$155) Bereichsfunktion! J55= G55/$E$20 Zeile 56: (entsprechend in Zeilen 57 bis 155 kopieren und einfügen) Intervallzähler D56= $D55+1 Obere Intervallgrenze E56= $E$11+$D56*($E$12-$E$11)/$D$53 Intervallmitte F56= ($E55+$E56) / 2 Anz. Beobachtungen im Intervall, abs. Häufigkeit G56= HÄUFIGKEIT($A$5:$A$10004;$E$55:$E$155) Bereichsfunktion! Relative Häufigkeit [%] H56= $G56/$E$20 Dichte I56= $H56/($E56-$E55) Verteilungsfunktion, rel. J56= $J55+$H56 kumulierte Häufigkeit [%]

99 89 Für die Grafiken werden Intervallgrenzen festgelegt ( E55:E155 ), die die Klassen für die anschließende Auszählung bilden. Die EXCEL-Funktion HÄUFIGKEIT bildet dabei eine Besonderheit, da sie eine Bereichsfunktion ist, deren Ergebniswerte einen ganzen Bereich ( Array ) über mehrere Zellen hinweg füllen. Q Markieren Sie dazu zunächst den betreffenden Bereich für die Ergebnisse. Mit den Angaben des Beispiels ist dies der Bereich G55:G155. Wählen Sie anschließend bei Einfügen, Unterpunkt Funktion... im Bereich Statistik die Funktion HÄUFIGKEIT aus. Wählen Sie den Datenbereich ( A5:A10004 ), sowie die Klassengrenzen ( E55:E155 ) und schließen mit OK ab. Gehen Sie mit dem Cursor in der Bearbeitungszeile hinter den Befehl Q und beenden Sie den Bereichsbefehl mit gleichzeitigem Drücken von Shift+Strg+Return. Die weiteren Befehle berechnen die Intervallmitten, die relative Häufigkeit und die Höhe des Histogramms (Dichte), sowie die Verteilungsfunktion. Die Angaben entnehmen Sie bitte der Tabelle und übertragen diese in Ihr Tabellenblatt.

100 90 Die Grafiken haben nun folgende Spezifikationen: Grafiken: Auszählungen der ungeordneten Daten Dateityp Datenreihen Optionen Dichte Funktion Punkt (XY) Name= $E$9 Interpoliert, ohne Datenpukte eine Datenreihe: X-Werte= $F$56:$F$155 Intervallmitten Kein Gitternetz Y-Werte= $I$56:$I$155 Dichte Kein Gitternetz Keine Legende Keine Datenbeschriftungen Dichte Histogramm Säule, gruppiert Name= $E$9 eine Datenreihe: Werte= $I$56:$I$155 Dichte Kein Gitternetz Beschriftung $E$55:$E$154 untere Intervallgrenzen Kein Gitternetz X-Achse= Keine Legende Keine Datenbeschriftung Keine Datentabelle Datenreihenformat: Überlappung= 0 Kein Rahmen Abstand= 0 Kein Fehlerindikator Verteilungsfunktion Punkt (XY) Name= $E$9 Interpoliert, ohne Datenpukte eine Datenreihe: X-Werte= $E$55:$E$155 obere Intervallgrenzen Gitternetz Y-Werte= $J$55:$J$155 Verteilungsfunktion Gitternetz Keine Legende Keine Datenbeschriftungen Verteilung Histogramm Säule, gruppiert Name= $E$9 eine Datenreihe: Werte= $J$56:$J$155 Verteilungsfunktion Gitternetz Beschriftung $E$55:$E$154 untere Intervallgrenzen Kein Gitternetz X-Achse= Keine Legende Keine Datenbeschriftung Keine Datentabelle Datenreihenformat: Überlappung= 0 Kein Rahmen Abstand= 0 Kein Fehlerindikator

101 91 Zum Einfügen einer Grafik rufen Sie im Menü Einfügen den Unterpunkt Diagramm auf. Es öffnet sich ein Auswahlfenster. Wählen Sie hier den angegebenen Typ aus. Mit Weiter gelangen Sie zum zweiten Schritt. Hier können Sie die angegebenen Datenreihen und Beschriftungen auswählen.

102 92 Im dritten Schritt werden noch zusätzliche Formatierungen festgelegt. Übernehmen Sie bitte die jeweiligen Angaben aus der Tabelle. Im vierten und letzten Schritt legen Sie den Namen des neuen Grafikblattes in Ihrer EXCEL-Arbeitsmappe fest. Beenden Sie die Grafik mit Fertig stellen. In diesem Fall müssen Sie noch die Datenreihe zusätzlich formatieren. Klicken Sie dazu doppelt auf eine Säule. Darauf erscheint ein Fenster mit Formatierungsangaben zur Datenreihe. Hier müssen Sie die Überlappung und den Abstand zwischen den Säulen noch auf Null setzen.

103 93 Die Formatierungen der weiteren Grafikelemente verlaufen nach dem gleichen Schema. Erzeugen Sie nach den Angaben in der Tabelle auch die weiteren Grafiken. d Tipp: Auch hier lohnt sich schnell die Entwicklung einer geeigneten Formulartabelle, da sich durch Einfügen von neuen Daten in Spalte A die Grafiken automatisch anpassen. Vielleicht verwenden Sie unser Beispielprogramm als Ausgangspunkt für Ihre Änderungen. Sowohl die Formulartabelle, als auch die Diagramme lassen sich gegen unbeabsichtigte Änderungen schützen.

104 EXCEL-Grafiken mit geordneten Daten Ein solches Formular ist auch die nachfolgende Auswertung für eine Grafik. Ausgewertet werden dabei bis zu geordnete Replikationen der Zielgröße im Bereich A1:A In diesem Fall benötigen wir die Information, welches der kleinste, zweitkleinste etc. Wert der Stichprobe ist. Kopieren Sie dazu Ihre simulierten Werte wie zuvor in Spalte A eines neuen Tabellenblatts. (Gegebenenfalls ist ein Blattschutz unter Extras / Schutz aufzuheben.) Löschen Sie dann mit der Entf -Taste die obersten Kommentare aus den Zellen. Markieren Sie Spalte A und gehen im Menü Daten auf den Unterpunkt Sortieren. Falls folgende Warnung erscheint, erweitern Sie nicht den Sortierbereich: sondern setzen Sie die Sortierung der Spalte A fort und schließen mit OK/Sortieren ab.

105 95 A B C D % % % % % % % % % % % % % % % % % % % % % Verteilungsfunktion (mit logarithmischer Abszisse) 100% 90% 80% 70% 60% Anteil 50% 40% 30% 20% 10% 0% Cd-Aufnahme Nahrung 5.00% 90.00% Median Mittel Grafik: Verteilungsfunktion mit logarithmischer Achse

106 96 F G 12 Angaben für die Grafik: 13 Titel= Cd-Aufnahme Nahrung 14 x-achse (bitte in Größenordnungen) 15 von= von (korrigiert)= bis= bis (korrigiert)= Grafikbereich 20 von= 0% 21 bis= 100% 22 Anteil abgebild. Daten= 100% Referenzlinien: 26 p-wert= 5.00% 27 zugehöriges Quantil= p-wert= 90.00% 30 zugehöriges Quantil= x-wert= zugehöriger p-wert= 83% Median= Mittel= Kennzahlen der Daten: 40 Anzahl= Minimum= Maximum= F G H I J K 45 Koordinaten 1.Quantil 2.Quantil x-wert Median Mittel 46 der Referenzlinien:

107 97 Berechnungen: Eingaben: Zelle= Formel Titelzeile G13 Startwert x-achse G15 Endwert x-achse G17 Datenbereich A1:A10000 Referenzlinien für 1. p-wert G26 2. p-wert G29 x-wert G32 Ausgaben: Korr. Startwert x-achse auf volle 10er-Potenz Korr. Endwert x-achse auf volle 10er-Potenz Anteil Beob. unterh. Startwert Anteil Beob. oberh. Startwert Anteil abgebild. Daten Quantil zum 1. p-wert Quantil zum 2. p-wert p zum x-wert Median Mittelwert= Anzahl Beobachtungen Minimum Maximum Zeile 1: G16= 10^RUNDEN(LOG( MIN(MAX($G$15;0.001);$G$27;$G$30;$G$32;$G$35;$G$36)) ;0) G18= 10^RUNDEN(LOG( MAX($G$17;$G$27;$G$30;$G$32;$G$35;$G$36)) ;0) G20= WENN($G$16>$G$41;QUANTILSRANG($A$1:$A$10000;$G$16);0) G21= WENN($G$18<$G$42;QUANTILSRANG($A$1:$A$10000;$G$18);1) G22= $G$21-$G$20 G27= QUANTIL($A$1:$A$10000;$G$26) G30= QUANTIL($A$1:$A$10000;$G$29) G33= WENN($G$32<$G$42;QUANTILSRANG($A$1:$A$10000;$G$32);1) G35= MEDIAN($A$1:$A$10000) G36= MITTELWERT($A$1:$A$10000) G40= ANZAHL($A$1:$A$10000) G41= MIN($A$1:$A$10000) G42= MAX($A$1:$A$10000) gestutzte Beobachtung B1= WENN($A$1>$G$16;WENN($A$1<$G$18;$A$1;$G$18);$G$16) lfd. Nummer der Beob. C1= 1 Anteil kleinerer Beob. D1= $C$1/$G$40 Zeile 2: (entsprechend in Zeile kopieren und einfügen) gestutzte Beobachtung lfd. Nummer der Beob. Anteil kleinerer Beob.[%] B2= WENN($A2>$G$16;WENN($A2<$G$18;$A2;$G$18);$G$16) C2= $C1+1 D2= $C2/$G$40 Diese Berechnungen enthalten viele logische Funktionen, die dazu dienen den Datenbereich auf den Ausgabebereich in ganzen Größenordnungen zu stutzen. An dieser Stelle soll es als Beispiel für die Möglichkeiten eines EXCEL-Formulars dienen. Zur Vereinfachung kann auch mit Spalte A an Stelle von Spalte B weitergearbeitet werden.

108 98 Grafik: Verteilungsfunktion mit logarithmischer Abszisse Grafiktyp / Datenreihen Bemerkung Optionen Punkt (XY) Erste Datenreihe Name= $G$13 interpoliert, ohne Datenpunkte X-Werte= $B$1:$B$10000 Gestutzte logarithmiert, Gitternetz Beobachtungen Y-Werte= $D$1:$D$10000 Anteile Gitternetz, schwarz, durchgezogen Legende unten keine Datenbeschriftungen Zweite Datenreihe Dritte Datenreihe Name= $G$26 p-wert X-Werte= $G$47:$G$48 =$G$27 Y-Werte= $F$47:$F$48 rot, durchgezogen Name= $G$29 p-wert X-Werte= $H$47:$H$48 =$G$30 Y-Werte= $F$47:$F$48 rot, gestrichelt Vierte Datenreihe Name= $G$32 x-wert X-Werte= $I$47:$I$48 =$G$32 Y-Werte= $F$47:$F$48 grün, durchgezogen Fünfte Datenreihe Name= Median Median X-Werte= $J$47:$J$48 =$G$35 Y-Werte= $F$47:$F$48 blau, durchgezogen Sechste Datenreihe Name= Mittel Mittelwert X-Werte= $K$47:$K$48 =$G$36 Y-Werte= $F$47:$F$48 blau, gestrichelt

109 99 Zum Einfügen der Grafik rufen Sie wieder im Menü Einfügen den Unterpunkt Diagramm auf. Wieder öffnet sich das Auswahlfenster. Wählen Sie hier den angegebenen Typ aus. Geben Sie jetzt die Datenreihen gemäß den Angaben in der Tabelle ein. Eventuell müssen Sie Vorschläge von EXCEL löschen ( Entfernen )

110 100 Bearbeiten Sie die nachfolgenden Schritte 3 und 4 wie im vorigen Beispiel, um die Grafik fertig zu stellen. Eine Besonderheit dieser Grafik sind die Achsenformatierungen. Klicken Sie dazu die senkrechte Achse doppelt an. Es erscheint ein Formatierungs-Fenster. Bei der y- Achse müssen Sie das Maximum auf 1 ( Maximum=1 ) setzen, um überzählige Beobachtungen von der Grafik auszuschließen. Bei der horizontalen Achse wählen Sie die logarithmische Skalierung aus.

111 101 k 5.4 Literatur zu EXCEL-Grafiken: [Voß, Schöneck, 2003] Werner Voß, Nadine M. Schöneck: Statistische Grafiken mit Excel Eine Rezeptsammlung. München: Hanser, 2003.

112 102 6 Verteilungsanpassung In den bisherigen Kapiteln wurde das Vorgehen bei Simulationen beschrieben, wenn für jede Eingangsvariable die Information in Form einer Verteilung vorliegt. Das Xprob-Projekt und weitere Quellen liefern dazu die notwendigen Angaben. Allerdings werden in Expositionsmodellen häufig auch Größen benutzt, für die keine Verteilungen vorliegen. Eine Verteilungsanpassung fordert dabei von der Bewerterin oder dem Bewerter deutlich mehr Wissen um empirische Grunddaten und statistisches Auswertungen, als dies bei einer Modellierung mit vorgegebenen Expositionsstandards notwendig ist. Dieses Wissen geht in die Beurteilung der empirischen Datenbasis und in die Modellierung der empirischen Daten mit Hilfe einer Verteilung ein. Das folgende Kapitel wird Sie in die Möglichkeiten einführen, spezifische Eingangsverteilungen zu bestimmen. Bitte fassen Sie die dabei beschriebenen Handlungsanweisungen jedoch nicht als strikte Vorschriften auf, sondern diskutieren Sie jeweils die Vor- und Nachteile der verschiedenen Ansätze am konkreten Einzelfall. Auch hierbei bietet ein einfaches Werkzeug, alternative Modelle zu berechnen und die Konsequenzen für Ihre Regulation zu überprüfen. 10 Empfehlungen für die quantitative Expositionsmodellierung... x 1. Sammeln Sie umfassende Informationen aus der Literatur, von Experten und Anwendern. 2. Lassen Sie die Expositionsmodellierung von der Problemstellung leiten. 3. Machen Sie die Expositionsmodellierung so einfach wie möglich, aber nicht einfacher. 4. Identifizieren Sie alle notwendigen Annahmen. 5. Machen Sie Ihre Auswahlkriterien klar und eindeutig. 6. Machen Sie die Unsicherheit der Analyse klar und vollständig. 7. Modellieren Sie die Variation und beschreiben Sie systematisch die Sensitivität. 8. Verfeinern Sie Ihre Problemstellung und Analyse iterativ. 9. Dokumentieren Sie Ihre Analyse klar und vollständig. 10. Lassen Sie Ihre Analyse extern evaluieren. (angepasst nach Morgan, Henrion 1990)

113 Sammeln von Information Bei der Ableitung von Eingangsverteilung für das Modell stehen Ihnen prinzipiell verschiedene Informationsquellen zur Verfügung: Annahmen des Regulationsmodells / Konventionen Empirische Daten Expertenurteile Jede Modellierung nutzt dabei stets ALLE drei Komponenten, wenn auch in unterschiedlichem Maße. Beginnen Sie mit der Zusammenstellung der theoretischen Modellannahmen Theoretische Modellannahmen Bevor Sie mit der Auswertung von Daten beginnen, klären Sie bitte die theoretischen Eigenschaften oder Annahmen die Sie einer Einflussvariable im Modell zuschreiben. Welche Ausprägungen kann die Variable annehmen? Diskret oder stetig. In der Regel werden Sie nur Verteilungen in die Auswahl nehmen, die dieselben Ausprägungen, wie die theoretische Variable aufweisen, d.h. diskrete Verteilungen für diskrete Variable und stetige Verteilungen für stetige Variable. Sind die Abstände zwischen den diskreten Ausprägungen klein und irrelevant für die Fragestellung, verschwindet aber der Unterschied zwischen diskreten und stetigen Modellierungen. Falsch wäre es jedoch, die Auswahl der Verteilung nach den Ausprägungen der Beobachtungen auszurichten, die eventuell durch mangelnde Präzision der Erhebung nur in groben Kategorien ( z. B. unterhalb der Nachweisgrenze, >x ) vorliegen. Welche Beschränkungen hat der Wertebereich? Minimum, Maximum, keine. Zur Modellierung einer Variablen kommen nur Verteilungen in Frage, deren Wertebereich, den der Variablen umfasst. In der Regel werden Sie Verteilungen wählen, die nicht durch zusätzliche Beschränkungen gestutzt werden müssen, da diese die theoretischen Eigenschaften der Variablen besser nachzeichnen. Allerdings kann es Teile des Wertebereichs der Verteilung geben, die zwar noch theoretisch möglich, aber so unwahrscheinlich sind, dass Sie in der praktischen Simulation nicht vorkommen. Dies ist dann einer theoretischen Beschränkung gleichzusetzen. Ist die Variable unabhängig von den anderen Modellvariablen? Ja oder nein. Falls Abhängigkeiten bestehen, wie ist die Abhängigkeit zu beschreiben? Die bisher beschriebene Simulationsrechnung geht von unabhängigen Einflussvariablen aus. Eventuelle Abhängigkeiten können durch den Übergang

114 104 auf eine Mischung bedingter Verteilungen modelliert werden. (vergleiche Kapitel 6.5, Seite 133) Kann man aus einem theoretischen Entstehungsmodell auf die Verteilung der Variablen schließen? Fast alle theoretischen Verteilungen wurden aus der Beschreibung experimenteller Datenerhebungen entwickelt und geben damit bestimmte Modellvorstellungen wieder. Die Binomialverteilung ( RiskBinomial(n;p) ) beschreibt z. B. die Anzahl der adversen Effekte bei einem Tierexperiment mit n unabhängigen Individuen und der Wahrscheinlichkeit p für den adversen Effekt. Die Normalverteilung ( RiskNormal(μ;σ) ) beschreibt z. B. die Verteilung des Mittelwertes einer großen Anzahl unabhängiger, gleichartiger Größen. In der Regel werden Sie zur Modellierung einer Einflussgröße stets die Verteilung benutzen, die zum bekannten Entstehungsmodell gehört. Gibt es theoretische Verteilungen, die üblicherweise zur Modellierung dieser Art von Einflussvariablen benutzt werden? Häufig werden die Entstehungsmodelle der Einflussvariablen aber nicht zu i- dentifizieren sein. Um in der Fülle aller möglichen Verteilungen nicht in die Beliebigkeit zu geraten, wird die Auswahl auf einfache Verteilungen eingeschränkt. Ein guter Maßstab für die Komplexität einer Verteilung ist die Anzahl der notwendigen Parameter zu ihrer Festlegung. Generalisierte Verteilungen sind Familien von Verteilungen, die ein breites Spektrum verschiedener, einfacher Unterverteilungen beinhalten. Sie sind zu bevorzugen, um auch einfache Verteilungen zu überprüfen. Welche Verteilungen aber konkret für eine Anpassung überprüft werden, ist in der Regel eine Konvention, von der erst abgewichen werden sollte, wenn es entsprechende Hinweise gibt. Für das Modell im Beispiel sind folgende Angaben festzuhalten: Variable Ausprägungen Wertebereich Entstehungsmodell Konvention; falls keine Detailinformationen vorliegen C stetig positiv Unbekannt Log-normalverteilt IU stetig positiv unbekannt Log-normalverteilt R stetig Beschränkt zw. 0 und 1 unbekannt Beta-verteilt BW stetig positiv unbekannt Log-normalverteilt bzw. normalverteilt

115 Auswahl empirischer Daten Im Expositionsmodell des Beispiels wurde die Variation in der Teilbevölkerung der 14- bis 15-jährigen, männlichen Jugendlichen betrachtet. Dazu zählt die variable Kontamination der Nahrungsmittel, die Unterschiede im Verzehr, der individuellen Resorption und dem individuellen Körpergewicht. Im nächsten Schritt stellen Sie bitte alle Informationen zusammen, die im weiten Sinne quantitative Aussagen zu den betrachten Einflussvariablen beinhalten. Dies können direkte Messungen oder Befragungen, Informationen aus Datenbanken, Zusammenfassungen aus der Literatur oder aus weiteren Experimenten abgeleitete Größen sein. Als Grundannahme der Modellierung gilt, dass jede quantitative Größe repräsentativ für die betrachtete Grundgesamtheit der Rahmenbedingungen und unabhängig von den weiteren Messungen ist. Diskutieren Sie die Präzision (Unsicherheit und Verzerrung) jeder einzelnen Größe. Bei Messungen ist die Messgenauigkeit meist bekannt. Aber auch Angaben wie unterhalb der Nachweisgrenze, unterhalb der Bestimmungsgrenze bzw. oberhalb des Messbereichs sind im Schätzprozess nutzbar, wenn die entsprechenden Grenzen bekannt sind. Systematische Fehler sollten nach Möglichkeit abgeschätzt und korrigiert werden, hierzu sind z. B. Kalibrierungen verschiedener Messverfahren nutzbar. Aber auch die qualitative Diskussion von möglichen Verzerrungen, wie z. B. bei der Nutzung von nicht-zufälligen Stichproben, sollte hinsichtlich ihrer Richtung erfolgen. Der Informationsgehalt empirischer Daten hängt aber wesentlich vom Umfang der Stichprobe ab. Betrachten wir hier zunächst nur einen Aspekt, nämlich die beobachtete Spannweite zwischen dem minimalen und maximalen beobachteten Wert. Bei stetigen, unbeschränkten Verteilungen können wir davon ausgehen, dass mit wachsender Stichprobengröße immer kleinere und größere Werte auftreten und die Spanne wächst. Im Sinne einer Stichprobenplanung kann die Frage beantwortet werden, ab wann bestimmte p%-quantile der Verteilung sicher (d.h. mit hoher Wahrscheinlichkeit) von der Spanne der Beobachtungen erfasst werden. Unteres Quantil Oberes Quantil Notwendige Stichprobengröße 17%-Quantil 83%-Quantil N=20 10%-Quantil 90%-Quantil N=36 5%-Quantil 95%-Quantil N=72 2.5%-Quantil 97.5%-Quantil N=146 1%-Quantil 99%-Quantil N= %-Quantil 99.5%-Quantil N= %-Quantil 99.9%-Quantil N=3688

116 106 Wir können also davon ausgehen, dass bei N=20 Beobachtungen die Spanne zwischen Minimum und Maximum mindestens. 2/3 der Wahrscheinlichkeit der Verteilung erfasst wird. Bei N>150 sind dies 95% und bei N>750 sogar 99% der Verteilung. Da in der Modellierung aber gerade Werte in den Randbereichen der Verteilung von Interesse sind, heißt dies im Umkehrschluss, dass kleine Stichprobengrößen alleine nicht zur Beschreibung der Randbereiche einer Verteilung ausreichen. Hier muss mit Hilfe von theoretischen Annahmen oder zusätzlichen Expertenurteilen in den Randbereich der Verteilung extrapoliert werden. Als Richtschnur kann (für stetige Verteilungen) folgende Einteilung gelten: Stichprobengröße Wesentliche Informationsquellen Verteilungsanpassung N > 200 Empirische Daten Nicht-parametrisch Empirische Daten mit theoretischen Annahmen Parameterschätzung N < 20 Empirische Daten mit theoretischen Annahmen und Expertenurteilen Grobe Verteilungsmodellierung Nutzung von Expertenurteilen Die Gründe, warum empirische Daten fehlen, sind vielfältig. Unzureichendes Monitoring von Verbraucherprodukten, genaue Messmethoden sind erst seit kurzem verfügbar, die Substanzen sind neu oder der Effekt war bislang unbekannt, Surveys zu speziellen Verhaltensweisen oder Umständen fehlen und vieles mehr. Um trotzdem verfügbares Wissen in den Modellierungsprozess einfließen zu lassen, ist es notwendig Expertenurteile abzufragen. Ein wesentliches Problem ist es dabei, dass inhärente Wissen des Experten in quantitativen Größen auszudrücken. Psychologen haben dazu eine ganze Reihe von Methoden zur Befragung und Visualisierung von Wissen entwickelt. Hier seien nur wenige Grundsätze genannt: Experten sollten nur zu Größen befragt werden, bei denen sie über eigene Erfahrungen (Messungen, Dokumentationen) in quantitativer Form verfügen. Notwendige Umrechnungen, Änderungen der Maßeinheiten etc. sollten erst nachträglich erfolgen. Die Befragung sollte sich auf Beobachtungen beschränken und nicht nach Eigenschaften (Mittelwert, Streuung) der Verteilung fragen. Die Befragung sollte mit typischen, sehr häufigen Beobachtungen beginnen (Anker) und anschließend zu den Randbereichen (seltene Beobachtungen) der Verteilung übergehen.

117 107 Quantil Verbalisierung Beschreibung Median / 50%-Quantil: Typische Beobachtung Jede Zweite ist kleiner. Jede Zweite ist größer. 25%-Quantil: Sehr häufige kleinere Beobachtung 75%-Quantil: Sehr häufige größere Beobachtung 10%-Quantil: Häufige kleinere Beobachtung 90%-Quantil: Häufige größere Beobachtung Nur jede Vierte ist kleiner. Nur jede Vierte ist größer. Nur jede Zehnte ist kleiner. Nur jede Zehnte ist größer. 5%-Quantil: Gelegentliche kleinere Beobachtung Nur jede Zwanzigste ist kleiner. 95%-Quantil: Gelegentliche größere Beobachtung Nur jede Zwanzigste ist größer. 1%-Quantil: Seltene kleinere Beobachtung 99%-Quantil: Seltene größere Beobachtung 0.1%-Quantil: Sehr seltene kleinere Beobachtung 99.9%-Quantil: Sehr seltene größere Beobachtung Nur jede Hundertste ist kleiner. Nur jede Hunderste ist größer. Nur jede Tausendste ist kleiner. Nur jede Tausendste ist größer. Die Angaben sollten visualisiert und rückgekoppelt werden. Für einen genauen Überblick sei auf die weiterführende Literatur verwiesen. 6.2 Nicht-parametrische Verteilungen bei großen Datenmengen Liegen ausreichend viele Beobachtungen x 1,...,x N zu einer Einflussgröße vor, so bilden auch diese beobachteten Werte und Anteile eine Verteilung, nämlich die sogenannte empirische Verteilung. Sie ist bei einer großen Anzahl von Beobachtungen ein gutes Abbild der zu Grunde liegenden wahren Verteilung. Unter der empirischen Verteilung versteht man konkret die diskrete Gleichverteilung auf den Beobachtungen. Q Die nachfolgenden Methoden sollen an einem konkreten Zahlenbeispiel veranschaulicht werden. Um die Übersichtlichkeit zu erhalten, seien nur N=10 Beobachtungen gegeben. Für eine sinnvolle Anwendung nichtparametrischer Verteilungen sind wesentlich größere Stichproben (in der Regel N>200) notwendig!

118 108 Zur Definition der empirischen Verteilung markieren Sie in EXCEL den Bereich mit Ihren beobachteten Werten und kopieren die Werte im Menüpunkt Bearbeiten / Kopieren oder mit Hilfe des Kopier-Icons in den Zwischenspeicher. Markieren Sie anschließend die Zelle (hier C17 ) für die empirische Verteilung und wählen im Unterpunkt Model / Define Distribution... bzw. den Define Distributions -Icon Verteilung ( Dist... ).. Wählen Sie die diskrete Gleichverteilung DUniform als

119 109 Markieren Sie die Datenspalte ( X ) und löschen die Standardeinträge mit Entfernen ( Entf ). Aktivieren Sie schließlich das oberste Datenfeld ( X1 ) und fügen Sie mit Hilfe der rechten Maustaste und dem Punkt Paste im Kontextmenü Ihre beobachteten Daten ein. Sie erhalten die gewünschte empirische Verteilung: Bestätigen Sie Ihre Auswahl mit. Während diese Eingabe die zugehörige Verteilung gleich bildlich darstellt und erste Statistiken liefert, hat sie auch Nachteile. So werden die Beobachtungen nur mit Ihren formatierten Werten (hier auf vier Nach-

120 110 kommastellen gerundet) in die Definition übernommen. Deshalb sei an dieser Stelle noch eine Alternative mit aufgezeigt. Markieren Sie die Zelle für die empirische Verteilung (hier C17 ) und wählen Sie unter Einfügen / Funktion... die Distribution und weiter RiskDuniform. Im nachfolgenden Fenster tragen Sie den Bereich Ihrer Beobachtungen als Argument ein (hier C6:C15 ). In die Zelle der EXCEL-Tabelle wird nach Bestätigung mit ok der Befehl =RiskDuniform(C6:C15) übertragen. Angezeigt wird der Mittelwert der Verteilung, nämlich Die empirische Verteilung besitzt jedoch für die Simulation erhebliche Nachteile, da sie zum einen nur die beobachteten Werte repliziert und zum anderen auf den Bereich zwischen minimaler und maximaler Beobachtung beschränkt ist. Im Beispiel sei die Verteilung, wie in der Standardmodellierung, auf die positiven Zahlen beschränkt und kann also Werte zwischen 0 und positiv unendlich annehmen.

121 111 Es gibt verschiedene Verfahren die empirische Verteilung zwischen den einzelnen Beobachtungen zu interpolieren und an ihren Rändern zu extrapolieren, so dass die Nachteile bei der Simulationen ausgeglichen werden. Die folgende Grafik veranschaulicht das Verfahren von Hazen, das im Folgenden weiter ausgeführt wird. Empirische Verteilung, interpoliert 100% 90% 80% 70% Kumulative Verteilung 60% 50% 40% 30% 20% 10% Empirische Verteilungsfunktion Interpolation nach Hazen 0% Beobachtungen Für die Extrapolation an den Rändern ist dazu die Angabe eines minimalen und maximalen Simulationswerts notwendig. Als minimaler Simulationswert kann das theoretische Minimum (also 0 ) genutzt werden. Ein maximal möglicher Simulationswert widerspricht hingegen den theoretischen Annahmen. Als Approximation wird mit Hilfe des arithmetischen Mittelwerts x und der Streuung s x der Stichprobe ein Bereich der Verteilung abgeschätzt, so dass außerhalb nur wenige Beobachtungen zu erwarten sind. N 1 1 x = N xn s x = ( x ) N 1 n x n= 1 Dieser Bereich ( c σ-bereich ) ergibt sich als [ x c s ; x + c ] x s x N n= 1 mit c 3 2

122 112 Für positive und rechtsschiefe Verteilungen ist häufig ein asymmetrisches Intervall sinnvoller, dass mit Hilfe des geometrischen Mittels GM und der geometrischen Standardabweichung GSD konstruiert wird. N 1 LN (x) = s = ( LN(x ) LN(x ) N 1 N LN(x n ) n= 1 2 LN (x) n ) N 1 n= 1 GM = EXP( LN (x) ) GSD = EXP( s LN(x) ) Der asymmetrische Bereich ergibt sich damit als [ GM GSD C ; GM GSD +C ] mit c 3 Für das Zahlenbeispiel gilt: GM = 1.07, GSD = Mit c=3 folgt für das approximative Maximum: GM GSD +C = 11. Die empirische Verteilung soll entsprechend im Bereich von 0 bis 11 extrapoliert werden. Der Umfang der Extrapolation und die Bedeutung für die resultierende Verteilung schwinden aber mit wachsendem Stichprobenumfang und ist im Zahlenbeispiel mit nur 10 Beobachtungen sehr groß. Das Verfahren von Hazen berechnet nun an den Beobachtungen und Grenzen die Werte der Verteilungsfunktion und interpoliert zwischen diesen Punkten linear. Dazu müssen die Beobachtungen geordnet vorliegen: Minimum = x (0) < x (1) < x (2) < < x (N-1) < x (N) < x (N+1) = Maximum Die Werte der Verteilungsfunktion werden wie folgt gesetzt: F ( x ) (n) 0, 1 n 2 =, N 1, für n = 0 für n = 1,...,N für n = N + 1 Bei Bindungen, d.h. wiederholten vorkommenden beobachteten Werten, gilt nur der größte Index n.

123 113 In der EXCEL-Tabelle sind folgende Einträge und Berechnungen notwendig: 1 2 A B C D E Anpassung nicht-parametrischer Verteilungen: 3 Lfd. Nummer 4 Bemerkung Geordnete Beobachtungen Wahrscheinlichkeit 5 0 Theoretisches Minimum Logarithm. Beobachtungen 6 1 Kleinste Beobachtung Zweitkleinste Beobachtung Drittkleinste Beobachtung N-te geordnete Beobachtung Approximatives Maximum Arithmetisches Mittel (AM) Streuung (SD) Geometrisches Mittel (GM) Geom. Standardabw. (GSD) Faktor (C) Resultierende Verteilung

124 114 Berechnungen: Eingaben: Theoretisches Minimum Geordnete Beobachtungen (ohne Bindungen) Lfd. Nummer / Index Stichprobengröße Faktor (C) Zelle= Formel C5 C6:C15 A5:A16 A15 C23 Ausgaben: Wahrscheinlichkeit Minimum D5= 0 Zeile 6: (entsprechend in Zeilen 7 bis 15 kopieren und einfügen) Wahrscheinlichkeit nach Hazen D6= ($A6-0.5)/$A$15 Logarithmierte Beobachtung E6= LN($C6) Wahrscheinlichkeit Maximum D16= 1 Arithm. Mittel der logarith. Beobachtungen E18= MITTEL($E$6:$E$15) Streuung der logarith. Beobachtungen E19= STABW($E$6:$E$15) Arithmetische Mittel (AM bzw. x ) Streuung (SD bzw. s x ) Geometrisches Mittel (GM) Geom. Standardabweichung (GSD) Approximatives Maximum C18= MITTEL($C$6:$C$15) C19= STABW($C$6:$C$15) C21= EXP($E$18) C22= EXP($E$19) C16= $C$21*$C$22^$C$23 Resultierende Verteilung C25= RiskCumul($C$5; $C$16; ($C$6:$C$15); ($D$6:$D$15) simuliert Zufallszahlen aus einer solchen interpolierten Verteilungsfunktion mit Hilfe der Funktion RiskCumul. Markieren Sie dazu die Zielzelle (hier C25 ) und wählen Sie unter Einfügen / Funktion... die Distribution und weiter RiskCumul.

125 115 Im nachfolgenden Fenster tragen Sie das theoretische Minimum (Minimum =C5), das approximative Maximum (Maximum =C16), den Bereich Ihrer Beobachtungen ( {x}= C6:C15 ) und die berechneten Wahrscheinlichkeiten ( {p}=d6:d15 ) ein. In die Zelle der EXCEL-Tabelle wird nach Bestätigung mit ok der Befehl =RiskCumul(C5; C16; C6:C15; D6:D16); übertragen. Angezeigt wird der Mittelwert der Verteilung, nämlich Weitere Informationen zur Verteilung erhalten Sie, wenn Sie bei markierter Zelle ( C25 ) unter dem / Model den Unterpunkt Define Distribution... oder den entsprechenden Define Distributions -Icon aufrufen.

126 116 Definieren Sie die Zelle als Output und starten Sie eine Simulation. Im Ergebnisfenster Icon: ) erhalten Sie unter Detailed Statistics (Icon: ) weitere Informationen zur Verteilung. Sie erkennen, dass die Quantile der Simulation den vorgegeben Punkten der Verteilungsfunktion folgen. Bei Replikationen wird auch das theoretische Minimum ( 0 ) und das vorgegebene Maximum ( ) beinahe erreicht. d Tipp: RiskCumul kann also allgemein dazu benutzt werden, aus vorgegebenen Quantilen die vollständige Verteilung zu inter- und extrapolieren. Sie können ebenfalls im Define Distribution -Fenster mit Left P bzw. Right P die interpolierten Quantile ablesen. Angaben zu den Quantilen der empirischen Verteilung finden Sie auch in RefXP, so dass Sie nicht die Originaldaten benötigen.

127 117 x Weitere Interpolationsverfahren... Das Interpolationsverfahren von Hazen ist nur eine mögliche Definition. Die folgende Tabelle fasst weitere Möglichkeiten zusammen. Für große Stichprobenumfänge ist der Unterschied aber in der Regel sehr klein. Name des Verfahrens Beobachtungen kumulierte Wahrscheinlichkeit Bemerkungen x mit: x (0) = Minimum x (N+1) = Maximum x (1) <x (2) <...<x (N) F(x) mit: F(x (0) )=0 F(x (N+1) )=1 Bei Bindungen (mehrfachen Werten) gilt nur der größte Index. Hazen x (n), n=1,...,n F(x (n) )= n 1 2 N Diese Definition wurde zuvor angewandt. x (n), n=1,...,n F(x (n) )= n 1 N 1 Unabhängig von Minimum und Maximum, unterschätzt die Varianz x (n), n=0,...,n F(x (n) )= N n Unabhängig vom Maximum, unterschätzt den Mittelwert, unterschätzt die Varianz x (n), n=1,...,n+1 n 1 F(x (n) )= N Unabhängig vom Minimum, überschätzt den Mittelwertes, unterschätzt die Varianz Gumbel x (n), n=0,...,n+1 F(x (n) )= n N 1 + Überschätzt die Varianz x=(x (n-1) +x (n) )/2; n=1,...,n+1 n 1 Träger zwischen [x F(x)= (o),x (N+1) ] N und [x (1),x (N) ] Neben dieser linearen Interpolation der Verteilungsfunktion, die äquivalent auch durch Histrogramm-Dichten beschrieben werden kann, gibt es weitere nichtparametrische Schätzungen der Dichte-Kurve (sogenannte Kern-Schätzer), auf die hier jedoch nicht weiter eingegangen werden soll, da ihre Berechnung und Umsetzung mehr Aufwand erfordert. Alle Verfahren benutzen aber sehr einfache Verfahren der Interpolation zwischen den Beobachtungen und Grenzen und sollten deshalb hauptsächlich bei einer großen Anzahl von Beobachtungen eingesetzt werden.

128 Anpassung parametrischer Verteilungen Liegt nur eine begrenzte Menge von Beobachtungen vor, wird es notwendig weitere Annahmen über die Form der zu Grunde liegenden wahren Verteilung zu machen. Diese ergeben sich in der Regel aus den theoretischen Modellannahmen, die eine Anzahl Familien von Verteilungen nahe legen. Angepasste Verteilungen der Intraspeziesextrapolation 100% Kumulative Verteilungsfunktion 75% 50% Empirische Verteilung Log-Normalverteilung Weibullverteilung Gammaverteilung 25% 0% Extrapolationsfaktor Die Bestimmung der passenden Verteilung erfolgt dann in zwei Schritten: 1. Zu jeder theoretischen Familie von Verteilungen werden die Parameter geschätzt, welche die empirischen Daten am Besten wiedergeben. 2. Im zweiten Schritt wird von den Alternativen die beste Anpassung ausgewählt Schätzung von Verteilungsparametern Im Folgenden gehen wir davon aus, dass für die Anpassung einer empirischen Verteilung nicht genügend Daten vorliegen. Dies sind als Faustregel zwischen 20 und 200 Beobachtungen. Q Die nachfolgenden Methoden sollen wieder an einem konkreten Zahlenbeispiel veranschaulicht werden. Um die Übersichtlichkeit zu erhalten, seien nur N=10 Beobachtungen gegeben. In der Regel sind allerdings bei unter 20 Beobachtungen keine sinnvollen Unterschiede bei der Anpassung verschiedener Verteilungen festzustellen. Markieren Sie den Datenbereich im EXCEL-Blatt

129 119 und rufen Sie im den Unterpunkt Model und Fit Distributions to Data auf. Darauf öffnet sich das Auswahl Fenster Fit EXCEL Data, indem Sie angeben können, ob es sich bei den markierten Daten um Beobachtungen ( Sampled Data ) oder Punkte einer Dichte Funktion ( Density Function ) oder einer Verteilungsfunktion ( Cumulative Curve ) handelt. Wir betrachten hier nur den Fall einer Stichprobe, d.h. von unabhängigen, wiederholten Beobachtungen.

130 120 Markieren Sie das Feld Continuous für stetige Beobachtungen und bestätigen Sie die Eingabe mit. führt jetzt Anpassungen verschiedener Verteilungen durch. Die zu Grunde liegenden Voreinstellungen sind aber im Allgemeinen nicht passend, so dass diese Ergebnisse noch keine Aussagekraft für die Daten besitzen. Im noch fehlenden Schritt müssen wir unsere theoretischen Annahmen an die Verteilung spezifizieren und die Verteilungsfamilien festlegen, für die parametrische Anpassungen bestimmt werden sollen. Dies geschieht im Menü Fitting unter Unterpunkt Specify Distributions to Fit... oder mit dem entsprechenden Icon:.

131 121 Es erscheint ein passendes Eingabefenster: Auf der linken Seite können Sie angeben, die Parameter nach dem Maximum-Likelihood-Schätzverfahren ( Find BestFit Parameters ) bestimmen soll. Hierbei wird innerhalb einer Verteilungsfamilie die Parameterkonstellation bestimmt, die die jeweilige empirische Beobachtung mit der maximalen Wahrscheinlichkeit (engl. Maximum Likelihood ) erzeugt. Somit ist die gemachte Beobachtung unter allen anderen Parameter weniger wahrscheinlich. Dies Schätzverfahren schränkt allerdings die Auswahl der Verteilungsfamilien noch nicht ein. Durch Angabe der unteren ( Lower Limit ) und oberen Beschränkung ( Upper Limit ) können Sie sich die Verteilungen anzeigen lassen, die von ihrer Struktur, die Beschränkungen nachbilden und einhalten. Gleichzeitig werden die entsprechenden Parameter auf die entsprechenden Schranken gesetzt. Für die meisten Expositionsfaktoren sollte die Verteilung nach unten durch Null ( Fixed Bound of 0 ) und nach oben unbeschränkt sein ( Open (extends to ±infinity) ). Durch diese Angaben verändert sich die rechte Liste der möglichen Verteilungen. Sie sollten aber zusätzliche Kriterien, wie z. B. Modellvorstellungen oder Konventionen, benutzen, um die rechte Liste noch weiter einzuschränken. Nehmen wir zunächst an, dass es sich bei den Beobachtungen um Realisierungen einer lognormal-verteilten Zufallsvariable handelt und beschränken die Auswahl

132 122 ( Clear All ) auf eine Verteilungsfamilie ( Lognorm2 ) und bestätigen mit. Nach Rückkehr zum vorherigen Fenster muss die Anpassung mit Hilfe des Fit Distributions to Data -Icons erneut aktualisiert werden. Sie erhalten die beste Lognormalverteilung für Ihre Daten, d.h. die Parameter einer Lognormalverteilung, die die größte Übereinstimmung zu Ihren Daten widerspiegeln. Gleichzeitig haben Sie zusätzliche Möglichkeiten die Güte der Anpassung zu bietet Ihnen zunächst zwei grafische Möglichkeiten an. Mit Hilfe der Darstellung des P-P-Plots und Q-Q-Plots werden die Unterschiede als Abweichung der Datenpunkte von der Diagonale angezeigt. Beim P-P-Plot wird die empirische, kumulierte Häufigkeit ( y-achse der Verteilungsfunktion ) mit der theoretischen, Wahrscheinlichkeit, die sich aus der angepassten Lognormalverteilung ergibt, verglichen:

133 123 P-P-Plot zur Interspeziesextrapolation 100% Wahrscheinlichkeiten der Log-Normalverteilung 80% 60% 40% 20% 0% 0% 20% 40% 60% 80% 100% Empirische Wahrscheinlichkeiten Wenn die Beobachtungen perfekt mit der Theorie zusammenfallen, müssten alle Punkte auf der Diagonalen liegen. Sie sehen den P-P-Plot Ihrer Anpassung auf der entsprechenden Karteikarte P-P : Allerdings nicht die Diagonale, sondern verbindet die einzelnen Punkte miteinander. Je gerader die Linie ist, desto besser ist die Anpassung. Beim Q-Q-Plot werden die empirischen Beobachtungen ( x-achse der Verteilungsfunktion ) mit den theoretischen Quantilen der Lognormalverteilung verglichen:

134 124 Q-Q-Plot zur Interspeziesextrapolation Quantile der Log-Normalverteilung Empirische Quantile Wieder würde eine perfekte Anpassung nur Punkte auf der Diagonalen liefern. Die entsprechende Karteikarte Q-Q zeigt Ihnen ebenfalls die verbundenen Punkte: Die Interpretation der P-P-Plots und Q-Q-Plots bedarf etwas Erfahrung und Übung. Während der P-P-Plot besser Abweichungen im Zentrum (um den Median) der Verteilung aufzeigt, deutet der Q-Q-Plot auf schlechte Anpassung an den Rändern der Verteilung hin, d.h. bei den seltenen Beobachtungen. In der Arbeit von Cullen und Frey [1999] sind an Hand simulierter Daten typische Abweichungen aufgeführt. An

135 125 Hand dieser Darstellungen kann abgeschätzt werden, welche Verteilungsfamile (an Stelle der Lognormalverteilung) zu einer besseren Anpassung führen schlägt einen weiteren Weg vor, der über die Betrachtung quantitativer Abstandmaße führt. Diese finden Sie auf der Karteikarte der Anpassungsgüte (engl. Goodness of Fit bzw. GOF ) Hier verschiedene Abstandsmaße ( Test-Value ). Für kontinuierliche Verteilungen sind im Wesentlichen nur der Kolmogoroff-Smirnov- ( K-S ) und der Andersen-Darling( A-D )-Abstand von Interesse. Beide Ansätze betrachten spezielle Aspekte der Differenz zwischen der empirischen und der theoretischer Verteilung. Während der K-S-Abstand die maximale, absolute Differenz der kumulativen Verteilungsfunktionen betrachtet, die in der Regel in der Nähe des Medians auftritt, gibt der A-S-Abstand die mittlere, gewichtete Differenz über die gesamte Verteilung an. Damit ist der K-S-Abstand als Zahlenwert besser zu interpretieren, da er anschaulich die maximale (horizontale bzw. vertikale) Abweichung des P-P-Plots von der Diagonalen benennt. Jedoch bezieht er sich im Wesentlichen auf das Zentrum der Verteilung, das für Anpassungen weniger bedeutsam ist. Der A-D-Abstand ist als Zahlenwert kaum zu interpretieren, gibt aber ein umfassendes Maß der Anpassungsgüte wieder. Seine Bedeutung erhält er beim Vergleich mehrerer Anpassungen mit verschiedenen Verteilungsfamilien. Die dritte Angabe ist der χ 2 -Abstand ( Chi-Sq ), der zur Beurteilung von diskreten ( Discrete ) Verteilungen eingesetzt wird. Auf die Anpassung diskreter Daten soll hier nicht weiter eingegangen werden. Der Ablauf ist aber sehr ähnlich. Die Angabe in der oberen Tabelle bezieht sich auf eine Diskretisierung der vorliegenden stetigen Verteilung, bei der die Beobachtungen zunächst in Kategorien zusammengefasst werden. Die Definition der Kategorien erfolgt mit Hilfe des -Icons. Da der Vergleich der empirischen und theoretischen Verteilung anschließend nur noch auf den groben Kategorien stattfindet, soll auf eine weitere Betrachtung hier verzichtet werden.

136 Auswahl der besten Verteilung ( Best Fit ) Im nächsten Schritt sollen mehrere Verteilungsfamilien in ihrer Anpassungsgüte miteinander verglichen werden. Dazu werden unter dem Menüpunkt Fitting im Unterpunkt Define Distributions to Fit... bzw. mit Hilfe des entsprechenden Icons zusätzliche Verteilungen ausgewählt. Hier sollen zusätzlich die Exponential-, Weibull- und Gamma-Verteilung geprüft werden. Im Xprob-Projekt wurde ebenfalls die Log-logistische Verteilung überprüft. Dabei handelt es sich um einfache, d.h. ein- bis zwei-parametrige, Verteilungsfamilien, die zur Modellierung von Expositionsfaktoren und Konzentrationen gebräuchlich sind. Die Auswahl beinhaltet aber immer theoretische Annahmen an die wahre Verteilung, die im Einzelfall zu begründen sind. Nach Rückkehr zum vorherigen Fenster muss die Anpassung mit Hilfe des Fit Distributions to Data -Icons erneut aktualisiert werden. In der linken Spalte des Fit-Results -Fensters die Liste aller angepassten Verteilungen an, die durch Anklicken einzeln aufgerufen werden können.

137 127 Mit Hilfe des Fit Summary -Icons erhalten Sie zusätzlich das Fit Summary - Fenster mit Angaben zum Vergleich der verschiedenen Anpassungen: In der Zeile A-D Test Value finden Sie eine Gegenüberstellung der Anderson- Darling-Abstände für alle angepassten Verteilungen. In diesem Fall zeigt die Weibull- Verteilung den geringsten Abstand zu den empirischen Daten. Da es manchmal mühsam ist, den kleinsten Abstand in der Tabelle zu lokalisieren, können Sie unten links die Reihenfolge auswählen, in der die Verteilungsnamen in der linken Spalte erscheinen:

138 128 Nach Auswahl des A-D-Abstands erscheint die Weibull-Verteilung an erster Stelle. Damit ist die parametrische Verteilungsanpassung abgeschlossen. Im ersten Schritt wurde für die angenommenen Verteilungsfamilien jeweils die beste Anpassung ermittelt. Anschließend wurde unter diesen Kandidaten wiederum der beste ausgewählt. Das Ergebnis unter dem Namen Fit1 abgespeichert. An dieser Stelle sei erwähnt, dass die Abstands-Maße auch zur Formulierung statistischer Tests dienen können. Mit Hilfe dieser Tests kann beurteilt werden, mit welcher Wahrscheinlichkeit die Beobachtung und Beobachtungen mit noch ungünstigerem Abstand aus der angepassten Verteilung stammen. Diese Angaben werden p- Wert genannt und finden sich auf der Karteikarte GOF und im Fit Summary - Fenster ( P-Value ). Kleine p-werte sprechen gegen die Nullhypothese, dass die Beobachtung aus der angenommenen Verteilung stammt. Allerdings hängen diese Testresultate sehr stark vom Stichprobenumfang ab. Bei kleinen Stichproben wird ein

139 129 statistischer Test selten ablehnen (insgesamt große p-werte), während bei sehr großen Stichproben schon kleinste Abweichungen zwischen Beobachtung und angenommener Verteilung zur Ablehnung führen (insgesamt kleine p-werte). Somit kann sich die Auswahl der richtigen Verteilungsfamilie selten auf diese Testergebnisse stützen. Als Ausweg bietet sich die Anpassung von sogenannten generalisierten Verteilungen (Meta-Modell) an, die durch zusätzliche Parameter die bekannten Verteilungen als Spezialfälle (Unterfamilien) enthalten. So enthält die generalisierte Gamma- Verteilung die bisher ausgewählten Exponential-, Gamma-, Weibull- und Lognormalverteilungen als Untermodelle. Mit Hilfe des Likelihood-Abstands und Likelihood- Quotienten-Tests lassen sich ebenfalls Kriterien zur Auswahl einer einfachen, einbis zwei-parametrigen Verteilung ableiten. Dieses Kriterium wird jedoch nicht angeboten und benötigt kompliziertere Algorithmen. Das Xprob-Projekt hat ein Programm für die Statistik-Software SAS/IML entwickelt, mit dem eine Verteilungsanpassung mit einer generalisierten F-Verteilung (GF-Verteilung) durchgeführt und Unterverteilungen geprüft werden. Zum Einfügen der gefundenen besten Verteilung kehren Sie zum EXCEL-Blatt zurück und markieren die gewünschte Zelle: Über den Unterpunkt Model und Define Distributions bzw. dem entsprechenden Icon: können Sie jetzt die Ergebnisse aufrufen.

140 130 Wählen Sie dazu im Define Distributions -Fenster: unter Quelle ( Source ) die Ergebnisse der Verteilungsanpassung ( Fit Results ). Bei mehreren Karteikarten müssen Sie unter Tab Ihre Anpassung (hier: Fit1 ) aufrufen. Sie erhalten die möglichen Verteilungen in der angegebenen Reihenfolge ( Rank By A-D ). Durch übertragen Sie das Ergebnis auf Ihr EXCEL-Blatt. 6.4 Verteilungen bei kleinen Stichprobenumfängen Liegen weniger als 20 Beobachtungen vor, ist das bisherige Vorgehen wenig sinnvoll, da die Ergebnisse bei der Auswahl der Verteilungsfamilie sehr stark mit den Beobachtungen schwanken werden. Trotzdem sind die bisher beschriebenen Wege auch für diesen Fall anwendbar. Allerdings müssen sie sich noch stärker auf Expertenwissen stützen. So wurde im Abschnitt (Seite 106) ein Verfahren vorgestellt mit dem gezielt Quantile einer Verteilung erfragt werden können. Diese können dann den Input für eine kumulierte Verteilung ( RiskCumul ) liefern, wie es auf Seite 114 beschrieben wird. Häufig wird auch eine Verteilungsfamilie per Konvention als Standard-Modell einer Verteilungsfamilie gelten, so dass keine Auswahl zwischen verschiedenen Vertei-

141 131 lungsfamilien getroffen werden muss. Die Schätzung der zwei Parameter einer Lognormalverteilung ist auch mit deutlich weniger als 20 Beobachtungen möglich. Die Umsetzung erfolgt wie im ersten Schritt aus Kapitel (Seite 118). Führen diese Wege nicht zum Ziel, so bietet sich die Auswahl sehr einfacher Verteilungsformen, wie z. B. die stetige Gleichverteilung, an. Hierfür werden nur Angaben über sehr seltene kleine ( Minimum ) und große ( Maximum ) Werte benötigt. die stetige Gleichverteilung ( Uni- Wählen Sie bei Define Distributions bzw. form ): und geben Sie die Werte für das Minimum ( min ) und Maximum ( max ) ein. Im Abschnitt 6.2 (Seite 107) wurde ein Verfahren zur Abschätzung der Grenzen angegeben. Diese Angaben können Sie nutzen um die drei Parameter einer Dreiecksverteilung ( Triang ) zu schätzen:

142 132 Als Minimum wird die theoretische Schranke ( min=0 ) benutzt. Der häufigste Wert (engl. most likely bzw. m. likely ) wird auf das geometrische Mittel (GM) gesetzt und als Maximum ( max ) dient: GM GSD +C, mit der geometrischen Standardabweichung (GSD). Schließlich auch die Möglichkeit Dreiecksverteilungen mit Hilfe von Quantilen zu definierten ( Trigen ):

143 133 An Stelle vom Minimum und Maximum werden nun untere ( bottom ) und obere ( top ) Quantile der Dreiecksverteilung eingesetzt. Im Beispiel wird als unteres Quantil das Minimum (0%-Quantil, d.h. bottom%=0 ) und als oberes Quantil das 95%- Quantil ( top%=95 ) verwandt. Diese können z. B. über die Methode von Hazen (Seite 112) bestimmt werden. Natürlich werden Ihre Simulationsergebnisse von der speziellen Wahl der Verteilung abhängen. Wie groß die Abhängigkeit des Resultats von Ihrer Wahl ist, können Sie durch mehrere Simulationsläufe mit den verschiedenen Alternativen ermitteln. Bei geringer empirischer Basis sollten Sie immer mehrere Alternativen ausprobieren und dokumentieren. Je nach Bedeutung des Resultats können Sie besonders konservative oder mittlere Ansätze auswählen. Eine systematischere Herangehensweise zur Untersuchung der Abhängigkeit des Endergebnis von den Eingangsverteilungen wird im Kapitel 7 (Seite 140) vorgestellt. 6.5 Mischung von Verteilungen Besteht die Grundgesamtheit aus mehreren Teilgruppen, so empfiehlt es sich die Teilgruppen zunächst separat zu modellieren und Verteilungen anzupassen. Der Grund besteht darin, dass die üblichen Verteilungsfamilien nur ein Maximum der

144 134 Dichtefunktion (den sogenannten Modus) zulassen, häufig treten allerdings bei zusammen erhobenen Teilgruppen aber mehrere Modi auf. Im Folgenden soll an Hand eines Beispiels erläutert werden, wie Verteilungen von mehreren Teilgruppen zu einer Gesamtverteilung zusammengeführt werden können. Man spricht hier von einer Mischung. A B C D E 1 Mischung von Verteilungen 2 3 Teilgruppe Anteil Stetige Gleichverteilung Parameter 4 min= max= % % % Zufällige Gruppe Mischung 0 12 Berechnungen: Eingaben: Zelle = Formel 1. Teilpopulation: Kenn-Nummer A5 = 1 Anteil an der Gesamtpopulation [%] B5 = 20% Parameter der st. Gleichverteilung min D5 = 1 max E5 = 2 2. Teilpopulation: Kenn-Nummer A6 = 2 Anteil an der Gesamtpopulation [%] B6 = 50% Parameter der st. Gleichverteilung min D6 = 3 max E6 = 4 3. Teilpopulation: Kenn-Nummer A7 = 3 Anteil an der Gesamtpopulation [%] B7 = 30% Parameter der st. Gleichverteilung min D7 = 5 max E7 = 6 Ausgaben: Verteilungen der Teilpopulationen 1. Teilpopulation C5 = RiskUniform(D5; E5) 2. Teilpopulation C6 = RiskUniform(D6; E6) 3. Teilpopulation C7 = RiskUniform(D7; E7) Zufällige Auswahl der Gruppe C9 = RiskDiscrete(A5:A7;B5:B7) Mischung der Verteilungen C11= WENN(C9=1;C5;0)+WENN(C9=2;C6;0) +WENN(C9=3;C7;0)

145 135 Als Voraussetzung nehmen wir an, dass die Gesamtpopulation in drei Teile zerfällt, die mit Hilfe der Nummern 1, 2 und 3 kodiert sind. Ihre Anteile an der Gesamtpopulation sind bekannt: Teilpopulation Anteil 1 20 % 2 50 % 3 30 % Gesamt 100 % In bestimmen wir zunächst aus welcher Teilpopulation ein Wert erzeugt werden soll. Dazu wird eine diskrete Verteilung ( Discrete ) auf der Menge der Kennnummern {1, 2, 3} mit den Einzelwahrscheilichkeiten {0.2, 0.5, 0.3} erzeugt. Das Define Distribution -Fenster zeigt folgende Einträge für die Zelle C9. Die Definition verläuft aber besser als Funktionsaufruf unter Einfügen / Funktion.. mit der Distribution und RiskDiscrete :

146 136 Dabei ist sowohl die Wahl der Anzahl der Teilpopulationen, ihrer (verschiedenen) Kennnummern und Einzelwahrscheinlichkeiten (Summe = 100%) beliebig. Für jede Teilpopulation benötigen wir jetzt die spezifische Verteilung. Um das Beispiel einfach zu gestalten, wird jeweils eine stetige Gleichverteilung ( Uniform ) auf dem Intervall [min, max] angesetzt. In den Zellen C5:C7 können aber auch beliebige andere Verteilungen eingetragen sein, die nun gemischt werden sollen. Zur Mischung bedienen wir uns der EXCEL-Funktion WENN, die als Funktionsaufruf unter Einfügen / Funktion.. mit der Funktionskategorie Logik und WENN aufzurufen ist: Dabei wird geprüft, ob das Ergebnis der diskreten Verteilung in Zelle C9 den Wert 1 annimmt. Falls dies wahr ist, wird als Ergebnis der Wert aus Zelle C5 (Simulationswert der 1. Teilpopulation) gewählt, andernfalls wird das Ergebnis auf 0 gesetzt. Ohne Simulationslauf ist das Ergebnis der Prüfung immer falsch bzw. 0, da in Zelle C9 der Mittelwert der diskreten Gleichverteilung (hier: 1.5) eingetragen ist. Während des Simulationslaufes wir die Zelle C9 aber mit den jeweils simulierten Werten gefüllt. Wenn die Simulation also bestimmt, dass die diskrete Verteilung auf {1, 2, 3}

147 137 den Wert 1 annimmt, wird in Zelle C11 der simulierte Wert aus der Verteilung der 1. Teilpopulation gezogen. Wir wiederholen dies für alle Teilpopulationen und bilden den Befehl: (C11) = WENN(C9=1;C5;0) + WENN(C9=2;C6;0) + WENN(C9=3;C7;0) Je nach Ausgang der diskreten Verteilung wird jeweils eine Abfrage wahr und der entsprechende Summand auf den Simulationswert der Teilpopulation gesetzt. Da die restlichen Summanden gleich 0 sind, nimmt die Zelle C11 die gemischte Verteilung an. Nachdem die Zelle C11 mit Hilfe des Add Output -Icons definiert wurde, zeigt eine Simulation folgendes Ergebnis: Die Grafik stellt die Simulation einer Mischung aus drei stetigen Gleichverteilungen auf den Intervallen [1, 2]; [3, 4] und [5,6] in den Anteilen {0.2, 0.5, 0.3} dar. Insbesondere ist dies eine Verteilung mit drei Modi, die ohne Mischung nicht aus den Standard-Verteilung erzeugt werden kann. In realen Anwendungen werden die Verteilungen häufig in einander übergehen und nicht mehr einfach optisch zu trennen sein. Auch statistisch ist es ein kompliziertes Problem Mischverteilungen zu schätzen, wenn die Einteilung in die Teilpopulationen nicht vorgegeben ist. Deshalb ist es bei Datenerhebungen sinnvoll, wichtige Einflussvariable mitzuerheben. Aber auch wenn die Einflussvariable in der Population eine unimodale Verteilung besitzt ist es sinnvoll die Informationen aus einer möglichen Stratifizierung nach z. B. dem Geschlecht und Alter zu nutzen, wenn die Größe der Teilgruppen dabei nicht zu

148 138 klein wird. Einerseits können durch die Abschichtung auch Modelle auf Teilpopulationem, z. B. nur die jährigen Jungen, gerechnet werden. Andererseits erlaubt eine Mischung mit neuen Anteilen die Anpassung einer Bevölkerung an neue Altersund Geschlechteraufteilungen, wie sie bei regionalen Betrachtungen oder durch die Bevölkerungsentwicklung notwendig werden. Allerdings sollte bei der Abschichtung einer empirischen Datengrundlage stets zwischen dem Informationsgewinn durch die Aufteilung und den Informationsverlust durch die geringere Stichprobengröße in den Teilgruppen abgewogen werden. Statistische Kriterien, die im Wesentlichen auf Mittelwertvergleichen oder Homogenitätskriterien beruhen, können auch hier helfen, die optimale Aufteilung zu finden, bei der nur Gruppen mit deutlichen Unterschieden in den Verteilungen weiter aufgeteilt werden. k 6.6 Literatur zu Verteilungen: [Cooke 1992] Roger M. Cooke: Experts in Uncertainty. Opinion and Subjective Probability in Science. Oxford University Press, 1992 [Cullen, Frey 1999] Alison C. Cullen, H. Christopher Frey: Probabilistic Techniques in Exposure Assessment A Handbook for Dealing with Variability and Uncertainty in Models and Inputs. New York: Plenum, [Evans, Hastings, Peacock 2000] Merran Evans, Nicholas Hastings, Brian Peacock: Statistical Distributions, 3 rd edition. New York: Wiley, [Palisade 2002] Palisade Corporation: A Consice Summary Probability Distribution Functions. Internet: 75 pages. [Johnson, Kotz, Balakrishnan 1994] Norman L. Johnson, Samuel Kotz, N Balakrshnan: Continuous Univariate Distributions, Volume 1, 2nd Edition. New York: Wiley, [Johnson, Kotz, Balakrishnan 1995] Norman L. Johnson, Samuel Kotz, N Balakrshnan: Continuous Univariate Distributions, Volume 2, 2nd Edition. New York: Wiley, [Johnson, Kotz, Kemp 2004] Norman L. Johnson, Samuel Kotz, N Balakrshnan: Univariate Discrete Distributions, 3rd Edition. New York: Wiley, 2004.

149 139 y Wichtige Schalter (Icons) Definition der Stichprobeneigenschaften Seite 120 Auswahl der Verteilungsfamilien Seite 120 Anpassen von Verteilungen Seite 122 Definition der Kategorisierung Seite 125 Zusammenfassung der Verteilungsanpassung Seite 127

150 140 7 Sensitivitätsanalyse In diesem Kapitel soll abschließend noch die Sensitivität der Zielgrößen bezüglich der Einflussgrößen untersucht und beschrieben werden. Das bisherige Verfahren wird unter dem Begriff der verteilungsbasierten Modellierung zusammengefasst und dient zur Beschreibung der Variabilität der Zielgröße, also im vorliegenden Bericht der Exposition. Davon zu unterscheiden ist eine Sensitivitätsanalyse, bei der versucht wird die Anteile der einzelnen Einflussgrößen an der resultierenden Variabilität zu quantifizieren. Mit dieser zusätzlichen Fragestellung können besonders bedeutende Einflussgrößen bestimmt werden, die großen Einfluss auf die Variabilität des Ergebnisses haben. Für diese Einflussfaktoren wäre zu überlegen, ob zusätzliche empirische Daten zu einer Präzisierung der Zielgröße führen könnten. x 7.1 Was Sie über Sensitivitätsanalysen wissen müssen... Die Variation der Zielgröße wird durch die Verteilungen der Eingangsgrößen verursacht. In verteilungsbasierten Modellen versucht die Sensitivitätsanalyse folgende Fragen zu klären: Welcher Anteil an der Variation der Zielgröße wird durch die Variation einer Eingangsgröße verursacht? Welches ist die bedeutendste Variable für die Variation der Zielgröße? Als Ansatzpunkt wird versucht die Variation der Zielgröße, hier des Referenzwertes, auf die einzelnen Eingangsvariablen aufzuteilen. Dazu ist es im Allgemeinen erforderlich, die Komplexität des Modell zu reduzieren. Als Ansatzpunkt gilt die Linearisierung des Modells. Bei globalen oder simulationsbasierten Sensitivitätsmaßen wird an die simulierten Daten jeweils eine lineare Funktion per Regression angepasst. Bei der multiplen Regression werden alle Eingangsvariablen als unabhängige Größen und die Zielvariable als abhängige Größe betrachtet und so der optimale lineare Zusammenhang bestimmt. Die Güte der Anpassung kann mit Hilfe des Bestimmtheitsmaße R 2 beurteilt werden, dass den Anteil der mit Hilfe der Regression erklärten Varianz der Zielgröße angibt. Je näher R 2 an 1 ist, desto genauer ist die lineare Approximation. Die standardisierten Regressionskoeffizienten dienen als Sensitivitätsmaße. Ihre Quadrate sind proportional zum zugeordneten Anteil an der Varianz der Zielgröße.

151 141 Wird die lineare Regression jeweils nur zwischen einer Eingangsvariablen und der Zielgröße ausgeführt, stimmt der standardisierte Regressionskoeffizient mit der Pearson-Korrelation überein. Die Korrelationen können in diesem Sinn also auch als Sensitivitätsmaß gelten. Ihre Quadrate gelten in erster Näherung als proportional zum Anteil an der Varianz der Zielgröße. Einen anderen Ansatz verfolgen die lokalen Sensitivitätsmaße. Sie analysieren die funktionale Form der Modellgleichung und linearisieren diese durch eine Taylor-Entwicklung. Bei der Gauß schen Fehlerrechnung erfolgt die Linearisierung jeweils an der Stelle des arithmetischen Mittelwerts jeder Eingangsgröße. Die standardisierten, partiellen Ableitungen an dieser Stelle dienen als Sensitivitätsmaß. Auch hier sind die Quadrate unter der Linearisierung proportional zum Anteil an der Varianz der Zielgröße. Um die lokale Auswertung der Modellfunktion zu erweitern, berechnet die gemittelte Varianzformel das arithmetische Mittel des Varianzanteils einer Eingangsgröße über alle möglichen Kombinationen der Eingangsgrößen. Wieder sind die Mittelwerte unter der Linearisierung proportional zum Anteil an der Varianz der Zielgröße. Da alle Sensitivitätsmaße auf mehr oder weniger zutreffenden Vereinfachungen der Modellgleichung beruhen, können sie nur ein grobes Maß für den Einfluss einer Eingangsverteilung auf die Zielgröße darstellen. Ihre Ergebnisse werden daher zwangläufig nicht vollständig übereinstimmen. Allerdings unterscheiden sich die Ansätze in ihren Grundannahmen und Informationen, die sie nutzen. Hier sind die lokalen Maße den globalen überlegen. Ebenso wie die gemittelte Varianzformel mehr Informationen der Modellgleichung nutzt als die einfache Gauß sche Fehlerrechnung. In Modellen, in denen die partiellen Ableitungen der Modellgleichung leicht zu berechnen ist, sollte die gemittelte Varianzformel den anderen Verfahren vorgezogen werden. 7.2 Globale Sensitivitätsmaße keine formalen Ableitungen der Modellgleichungen durchführen kann, sind im Programm nur simulationsbasierte Sensitivitätsmaße verfügbar.

152 142 Im Ergebnisfenster können im Menü Insert, Unterpunkt Sensitivities bzw. mit dem Sensitivity -Icon werden die Ergebnisse einer globalen Sensitivitätsanalyse abgerufen Zur Auswahl stehen die multiple Regression ( Regression ) und die Pearson- Korrelation ( Correlation ) die unter Display Significant Inputs Using: ausgewählt werden können. Ausgegeben werden die standardisierten Regressionskoeffizienten. Ihr Vorzeichen gibt an, ob der Einfluss gleichgerichtet ( + ) oder gegensinnig ( - ) ist. Um die Varianzanteile abzuschätzen, sind die Größen zu quadrieren und die Anteile an der jeweiligen Summe zu bestimmen. Bei der Regression wird zusätzlich das Bestimmheitsmaß R 2 ( R-Squared ) angegeben, das den Anteil der erklärten Varianz beschreibt. Es sollte nahe 1=100 % liegen. Im obigen Beispiel kommt ca. 64 % (= /0.855) der Variation der Zielgröße von der Nahrungsaufnahme, wobei 85 % der Gesamtvariation erklärt wird. zieht in seine Sensitivitätsanalyse jeweils alle Eingangsvariablen ( Inputs ) mit ein und berücksichtigt nicht, ob die Größen tatsächlich Bestandteil der Modellgleichung sind. Im Beispiel erhalten auch die Körpergewichte der 14- und 15-jährigen und die Mischungsvariable einen eigenen Varianzanteil, obwohl dies inhaltlich unsinnig ist.

Aktuelle Daten für bevölkerungsbezogene Expositionsschätzungen in Deutschland

Aktuelle Daten für bevölkerungsbezogene Expositionsschätzungen in Deutschland Aktuelle Daten für bevölkerungsbezogene Expositionsschätzungen in Deutschland Dirk Wintermeyer, André Conrad Umweltbundesamt (Berlin) für das Xprob-Konsortium Fortbildung für den Öffentlichen Gesundheitsdienst

Mehr

DAS EINSTEIGERSEMINAR

DAS EINSTEIGERSEMINAR DAS EINSTEIGERSEMINAR Microsoft Office Excel 2010 Gudrun Rehn-Göstenmeier LERNEN ÜBEN ANWENDEN Teil I: Lernen L1 Dateiorganisation Bevor wir uns mit den Excel-spezifischen Befehlen und Funktionen befassen

Mehr

1.1 Verwendung der Funktionen

1.1 Verwendung der Funktionen 1. Tragen Sie in die Arbeitsmappe Vorschlagswesen_Einsparungen2 in GROSS- BUCHSTABEN ein: A8 A10 A12 A14 SUMMEN MAXIMUM MITTELWERT MINIMUM 1.1 Verwendung der Funktionen Eine Funktion kann allein in einer

Mehr

Excel Kapitel 12 Lernzielkontrolle Excel 2013 Beantworten Sie die folgenden 12 Fragen

Excel Kapitel 12 Lernzielkontrolle Excel 2013 Beantworten Sie die folgenden 12 Fragen Excel Kapitel 12 Lernzielkontrolle Excel 2013 Beantworten Sie die folgenden 12 Fragen Im Ordner 12_kapitel lernzielkontrolle finden Sie alle notwendigen Dateien. 1. Wie wechseln Sie zu einer anderen geöffneten

Mehr

Informatik BMS. Excel. Trainingsunterlagen EXCEL XP BASIC

Informatik BMS. Excel. Trainingsunterlagen EXCEL XP BASIC Trainingsunterlagen EXCEL XP BASIC Karin Seibel Seite 1 21.01.2008 Was ist eine Tabellenkalkulation? Inhalt Was ist eine Tabellenkalkulation?... 3 Aufbau einer Datei... 3 starten... 4 Das -Anwendungsfenster...

Mehr

Microsoft Access Arbeiten mit Tabellen. Anja Aue

Microsoft Access Arbeiten mit Tabellen. Anja Aue Microsoft Access Arbeiten mit Tabellen Anja Aue 10.11.16 Tabellen in der Datenblattansicht Ansicht des Anwenders. Eingabe von neuen Daten. Bearbeiten von vorhandenen Informationen. Microsoft Access Einführung

Mehr

1 Excel Schulung Andreas Todt

1 Excel Schulung Andreas Todt 1 Excel Schulung Andreas Todt Inhalt 1 Darum geht es hier... 1 2 So wird es gemacht... 1 2.1 Zellen und Blatt schützen... 1 2.2 Arbeitsmappe schützen... 5 2.3 Schritt für Schritt... 6 1 Darum geht es hier

Mehr

Xpert - Europäischer ComputerPass. Peter Wies. Tabellenkalkulation (mit Excel 2010) 1. Ausgabe, 5. Aktualisierung, Juli 2013

Xpert - Europäischer ComputerPass. Peter Wies. Tabellenkalkulation (mit Excel 2010) 1. Ausgabe, 5. Aktualisierung, Juli 2013 Xpert - Europäischer ComputerPass Peter Wies 1. Ausgabe, 5. Aktualisierung, Juli 2013 Tabellenkalkulation (mit Excel 2010) XP-EX2010 3 Xpert - Europäischer ComputerPass - Tabellenkalkulation (mit Excel

Mehr

Kennen, können, beherrschen lernen was gebraucht wird

Kennen, können, beherrschen lernen was gebraucht wird Mit Namen arbeiten Namen vergeben Insbesondere bei umfangreichen, komplexen Formeln und Funktionen werden die Koordinaten schnell sehr unübersichtlich Durch die Vergabe von Namen für die Zellen und Zellbereiche

Mehr

Pivot-Tabellen und -Charts mit Datenschnitt und Gruppierung

Pivot-Tabellen und -Charts mit Datenschnitt und Gruppierung Pivot-Tabellen und -Charts mit Datenschnitt und Gruppierung AUSGANGSSITUATION... 2 ZIEL... 2 LÖSUNGSBESCHREIBUNG... 4 ERSTELLEN PIVOT-TABLE UND CHART... 4 DATENSCHNITT EINFÜGEN... 11 GRUPPIEREN IN PIVOT-TABELLEN...

Mehr

1 Univariate Statistiken

1 Univariate Statistiken 1 Univariate Statistiken Im ersten Kapitel berechnen wir zunächst Kenngrößen einer einzelnen Stichprobe bzw. so genannte empirische Kenngrößen, wie beispielsweise den Mittelwert. Diese können, unter gewissen

Mehr

Arbeitsmappe. Die Arbeitsblatt-Register. 31 Die Arbeitsblatt-Register 32 Der Umgang mit Arbeitsmappen 34 Mustervorlagen. ADer Einstieg in Excel 2000

Arbeitsmappe. Die Arbeitsblatt-Register. 31 Die Arbeitsblatt-Register 32 Der Umgang mit Arbeitsmappen 34 Mustervorlagen. ADer Einstieg in Excel 2000 2 Die Arbeitsmappe 31 Die Arbeitsblatt-Register 32 Der Umgang mit Arbeitsmappen 34 Mustervorlagen Abbildung 2.1: Die einzelnen Blätter können Sie auf den Registern anwählen Mehrere Blätter markieren: Umschalt-Taste

Mehr

3.1 Allgemeines. Abbildung 3.1: Eröffnungsmenü einer Excel-Mappe

3.1 Allgemeines. Abbildung 3.1: Eröffnungsmenü einer Excel-Mappe 3.1 Allgemeines Nach Aufruf des Programms-MS-Excel wird eine leere Datei, auch als Arbeitsmappe oder Excel-Worksheet als bezeichnet, geöffnet (= Abb. 3.1). Eine Arbeitsmappe besteht aus einem Stapel von

Mehr

5 Tabellenanpassung. 5.1 Spaltenbreite und Zeilenhöhe Spaltenbreite verändern

5 Tabellenanpassung. 5.1 Spaltenbreite und Zeilenhöhe Spaltenbreite verändern Um Tabellen effizient bearbeiten können, ist es notwendig, dass Sie die Struktur der Tabelle Ihren Bedürfnissen anpassen. Sie können mit Excel die Elemente einer Tabelle also Zellen, Zeilen und Spalten

Mehr

SELEKTIONSANLEITUNG ANGRILLEN 2015 VERSION: 1.0 DATUM: AUTOR: VKO

SELEKTIONSANLEITUNG ANGRILLEN 2015 VERSION: 1.0 DATUM: AUTOR: VKO SELEKTIONSANLEITUNG ANGRILLEN 2015 VERSION: 1.0 DATUM: AUTOR: 08.12.2014 VKO INHALTSVERZEICHNIS: 1. EINLEITUNG... 2 1.1. Haftungsausschluss und Copyright... 4 1.2. Dokumentenhistorie... 4 1.3. Hinweise

Mehr

2 Grundlagen und Grundeinstellungen

2 Grundlagen und Grundeinstellungen Grundlagen und Grundeinstellungen.1 Öffnen von ARCHICAD Wenn Sie das Programm ArchiCAD starten, öffnet sich zunächst der Einstellungsdialog ARCHICAD STARTEN. Bild -1 ARCHICAD wird gestartet Wählen Sie

Mehr

1 Excel Schulung Andreas Todt

1 Excel Schulung Andreas Todt 1 Excel Schulung Andreas Todt Inhalt 1 Die Excel Arbeitsoberfläche... 1 1.1 Die Mulitifunktionsleiste (Ribbon)... 1 1.2 Die Tabellen I Anmerkungen:... 4 1.2.1 Spalten... 5 1.2.2 Zeilen... 5 1.2.3 Zellen...

Mehr

Datenstrukturen bei Datenübernahme

Datenstrukturen bei Datenübernahme 7.3.2. Datenstrukturen bei Datenübernahme Folgende Abbildung enthält zwei typische Beispiele zur Organisation von Plan/Ist-Daten. Abbildung 22: Plan/Ist-Wertestrukturen Im linken Teil der Abbildung 22

Mehr

Arbeiten mit Watch- und Rezepturlisten

Arbeiten mit Watch- und Rezepturlisten Vom: 08.05.2006 ACP Thema: Arbeiten mit Watch- und Rezepturlisten Arbeiten mit Watch- und Rezepturlisten Inhaltsverzeichnis: 1 Einleitung... 2 2 Watchliste... 2 2.1 Anlegen einer Watchliste... 2 2.2 Importieren

Mehr

Anleitung zum Java - Applet

Anleitung zum Java - Applet Anleitung zum Java - Applet Stetige Verteilungen Visualisierung von Wahrscheinlichkeit und Zufallsstreubereich bearbeitet von: WS 2004 / 2005 E/TI 7 betreut von: Prof. Dr. Wilhelm Kleppmann Inhaltsverzeichnis

Mehr

Tabellenkalkulation. Tabellenkalkulation

Tabellenkalkulation. Tabellenkalkulation Dieses Modul behandelt grundlegende Begriffe der und die wesentlichen Fertigkeiten, die beim Einsatz eines sprogramms zur Einstellung von druckfertigen Unterlagen erforderlich sind. Modulziele Die Kandidaten

Mehr

Im Original veränderbare Word-Dateien

Im Original veränderbare Word-Dateien Die Benutzeroberfläche von Access Menüband Das am oberen Bildschirmrand befindliche Menüband beinhaltet die meisten Befehle von Access. Im Menüband sind Schnellzugriffsleiste und Titelleiste integriert.

Mehr

Stopp-Listen. Die Funktion von Stopp-Listen. Das Fenster zur Verwaltung der Stopp-Listen

Stopp-Listen. Die Funktion von Stopp-Listen. Das Fenster zur Verwaltung der Stopp-Listen Stopp-Listen Stopp-Listen Die Funktion von Stopp-Listen Stopp-Listen dienen dazu, eine Sammlung von Wörtern anzulegen, die für die Auswertung uninteressant sind. Dies können etwa die bestimmten und unbestimmten

Mehr

Microsoft Excel 2007 Basis. Leseprobe

Microsoft Excel 2007 Basis. Leseprobe Microsoft Excel 2007 Basis Kapitel 4 - Mit Formeln und Funktionen arbeiten 4.1 Formeln und Funktionen eingeben 4.1.1 Aufbau von Formeln und mathematische Operatoren in Formeln 4.1.2 Aufbau von Funktionen

Mehr

b.i.m.m PRINTMANAGER 2013

b.i.m.m PRINTMANAGER 2013 b.i.m.m PRINTMANAGER 2013 Benutzerhandbuch b.i.m.m GmbH September 2012 Version 2013.0.1.0 COPYRIGHT Dieses Handbuch dient als Arbeitsunterlage für Benutzer der b.i.m.m Tools. Die in diesem Handbuch beschriebenen

Mehr

4.1 Aufbau und Eingabe von Formeln

4.1 Aufbau und Eingabe von Formeln 4.1 Aufbau und Eingabe von Formeln Grundlagen zu Formeln Formeln sind Berechnungen, die in eine Zelle oder in die Bearbeitungsleiste eingetragen werden können. Standardmässig zeigt Excel in der Bearbeitungsleiste

Mehr

Vorwort Die Excel-Arbeitsumgebung...11

Vorwort Die Excel-Arbeitsumgebung...11 INHALTSVERZEICHNIS Vorwort...9 1. Die Excel-Arbeitsumgebung...11 1.1. Der Excel-Arbeitsbildschirm... 11 1.2. Das Menüband... 12 1.3. Symbolleiste für den Schnellzugriff... 14 1.4. Weitere Möglichkeiten

Mehr

Handbuch ECDL 2003 Professional Modul 2: Tabellenkalkulation Kopieren, Einfügen und Verknüpfen von Daten

Handbuch ECDL 2003 Professional Modul 2: Tabellenkalkulation Kopieren, Einfügen und Verknüpfen von Daten Handbuch ECDL 2003 Professional Modul 2: Tabellenkalkulation Kopieren, Einfügen und Verknüpfen von Daten Dateiname: ecdl_p2_02_02_documentation.doc Speicherdatum: 08.12.2004 ECDL 2003 Professional Modul

Mehr

Kennen, können, beherrschen lernen was gebraucht wird

Kennen, können, beherrschen lernen was gebraucht wird Inhaltsverzeichnis Inhaltsverzeichnis... 1 Das Excel-Anwendungsfenster... 2 Allgemeine Bildschirmelemente... 2 Befehle aufrufen... 3 Die Menüleiste nutzen... 3 Grundlegende Tabellenbearbeitung... 4 Im

Mehr

Beschreibung: Erforderliches Programm: Excel (97)2000 bis 2007

Beschreibung: Erforderliches Programm: Excel (97)2000 bis 2007 Beschreibung: Erforderliches Programm: Excel (97)2000 bis 2007 Diese Anleitung bezieht sich auf Microsoft Excel Versionen von (97)2000 bis 2003 und mit Spezialverweisen auch auf die Version 2007. Durch

Mehr

Erstellen von graphischen Ausgaben

Erstellen von graphischen Ausgaben Erstellen von graphischen Ausgaben Dieses Tutorial behandelt den Postprocessor von DELPHIN 5. Dieser ist auch in DELPHIN 6 enthalten und kann im Dialog >> Edit >> Preferences >> External Tools: External

Mehr

Anleitung zum Applet

Anleitung zum Applet Vertrauensbereich für Anteile (Binomialverteilung) 1 Anleitung zum Applet Vertrauensbereich für Anteile (Binomialverteilung) bearbeitet von: Armin Heiter WS 2007/2008 IN betreut von: Prof. Dr. Wilhelm

Mehr

WIKI IN EWS Grundlegende Syntaxelemente zur Bearbeitung von Wiki-Artikeln

WIKI IN EWS Grundlegende Syntaxelemente zur Bearbeitung von Wiki-Artikeln WIKI IN EWS Grundlegende Syntaxelemente zur Bearbeitung von Wiki-Artikeln Jede EWS-Veranstaltung umfasst ein Wiki auf Grundlage der Software MediaWiki, auf welcher auch die Online-Ezyklopädie Wikipedia

Mehr

Anleitung zur Nutzung von ONLYOFFICE in der Hessenbox

Anleitung zur Nutzung von ONLYOFFICE in der Hessenbox Anleitung zur Nutzung von ONLYOFFICE in der Hessenbox Inhalt 1 Verfügbarkeit von ONLYOFFICE... 2 2 Bearbeiten von Dokumenten... 2 3 Neue Datei erstellen... 2 4 Registerkarte Datei... 3 4.1 Datei Speichern

Mehr

Anleitung zum Applet

Anleitung zum Applet Anleitung zum Applet Visualisierung des Begriffs erwartungstreu bearbeitet von: Edwin Rohr WS 2004/2005 E/TI - 7 betreut von: Prof. Dr. Wilhelm Kleppmann Edwin Rohr - 1 - Inhaltsverzeichnis 1 Vorwort..

Mehr

Bezugsarten relative Bezüge

Bezugsarten relative Bezüge Bezugsarten relative Bezüge Produkt Filiale Umsatz Profit Kunden Produktionskosten iphone Ulm 120.000 80.000 600 Personen 40.000 Samsung Ulm 210.000 160.000 900 Personen 50.000 iphone Ulm 100.000 85.000

Mehr

MUNIA Bedienungsanleitung

MUNIA Bedienungsanleitung MUNIA Bedienungsanleitung by Daisoft www.daisoft.it 2 Inhaltsverzeichnis I II 2.1 2.2 2.3 2.4 2.5 2.6 III 3.1 3.2 3.3 IV 4.1 4.2 V 5.1 5.2 5.3 Einleitung... 3 Fälligkeitsarten... 5 Fälligkeitsarten...

Mehr

Analysen mit Pivot-Tabellen durchführen

Analysen mit Pivot-Tabellen durchführen Analysen mit Pivot-Tabellen durchführen Pivot-Tabellen auch PivotTables genannt erlauben es, die Daten in einer Excel-Tabelle in Form einer zusammenfassenden Kreuztabelle zu analysieren. Beispielsweise

Mehr

Informationstechnische Grundbildung. Powerpoint 2016 Grundlagen.

Informationstechnische Grundbildung. Powerpoint 2016 Grundlagen. 1 Informationstechnische Grundbildung. Powerpoint 2016 Grundlagen. Oktober 2018 WS 2018/19 Eine neue Präsentation erstellen mit Hilfe eines vorgegebenen Powerpoint Layouts 2 1.Datei Neu Layout auswählen

Mehr

Handbuch zum VivaWeb-Serienbrief-Programm

Handbuch zum VivaWeb-Serienbrief-Programm Handbuch zum VivaWeb-Serienbrief-Programm In 10 Schritten zum Serienbrief Das folgende Handbuch erläutert Ihnen die Nutzungsmöglichkeiten des ARV Serienbrief-Programms in all seinen Einzelheiten. Dieses

Mehr

Microsoft Excel 2007

Microsoft Excel 2007 Microsoft Excel 2007 Eine Einführung Seite 1 Willkommen... Organisatorisches 3 Vormittage von 9.15 12.30 Uhr Wo finde ich was im RRZN Allgemeines Seite 2 Literatur Excel 2007 Grundlagen der Benutzung unter

Mehr

Excel 2016 Formeln, Prozentrechnen und Runden. Peter Wies. Modul Ausgabe, Januar 2017 EX2016_FORMEL

Excel 2016 Formeln, Prozentrechnen und Runden. Peter Wies. Modul Ausgabe, Januar 2017 EX2016_FORMEL Peter Wies. Ausgabe, Januar 207 Excel 206 Formeln, Prozentrechnen und Runden Modul 2 EX206_FORMEL Impressum Matchcode: EX206_FORMEL Autor: Peter Wies Herausgeber: Koordination der Klubschulen/Freizeitanlagen

Mehr

L E S E P R O B E. Werte Kunden,

L E S E P R O B E. Werte Kunden, L E S E P R O B E Werte Kunden, Die vorliegende Leseprobe soll Ihnen im Vorfeld Ihres Kaufes zur Entscheidungsfindung helfen, ob der darin gebotene Inhalt und die Aufbereitung desselben für Sie oder für

Mehr

Modul Tabellenkalkulation

Modul Tabellenkalkulation Modul Dieses Modul behandelt grundlegende Begriffe der und die wensentlichen Fertigkeiten, die beim Einsatz eines sprogramms zur Erstellung von druckfertigen Unterlagen erforderlich sind. ZIELE Die Kandidatinnen

Mehr

Sicherheits- und Gesundheitsschutzplan für Baustellen (SiGe-Bau)

Sicherheits- und Gesundheitsschutzplan für Baustellen (SiGe-Bau) suva Sicherheits- und Gesundheitsschutzplan für Baustellen (SiGe-Bau) Anleitung Wichtiger Hinweis: Beim Öffnen des Formulars wird als erstes die Speichermaske angezeigt. Es wird empfohlen, das Formular

Mehr

In diesem Beitrag sollen die einzelnen Möglichkeiten detaillierter erläutert und bei Notwendigkeit mit einem Beispiel hinterlegt werden.

In diesem Beitrag sollen die einzelnen Möglichkeiten detaillierter erläutert und bei Notwendigkeit mit einem Beispiel hinterlegt werden. Inhalte einfügen Das Menü Inhalte einfügen bietet eine Vielzahl von Möglichkeiten kopierte Elemente wieder in ein Tabellenblatt einzufügen. Dabei kann im Gegensatz zum normalen Einfügen darauf geachtet

Mehr

10.2 Grafische QM-Verfahren 1

10.2 Grafische QM-Verfahren 1 .2 1.2 Grafische QM-Verfahren 1 Anpassen von Excel 0.0 0.0..2.0. Da alle QM-Verfahren mit den Originalfunktionen von Excel erstellt wurden, können Sie einschlägige Literatur von unterschiedlichen Verlagen

Mehr

ECDL-Vorbereitungskurs Modul 4 (Excel) - Syllabus 5

ECDL-Vorbereitungskurs Modul 4 (Excel) - Syllabus 5 ECDL-Vorbereitungskurs Modul 4 (Excel) - Syllabus 5 Allgemeines Tabellenkalkulationsprogramm starten und beenden neue Arbeitsmappe erstellen, speichern Arbeitsmappe in anderem Dateiformat speichern zwischen

Mehr

Excel der Taschenrechner

Excel der Taschenrechner Kapitel 3 Excel der Taschenrechner In diesem Kapitel ist es so weit. Sie machen das, wofür Excel da ist: Sie führen die ersten Berechnungen durch. Anstatt Berechnungen verwenden Sie den Ausdruck Kalkulationen.

Mehr

Operation Phrike Benutzerhandbuch

Operation Phrike Benutzerhandbuch Operation Phrike Benutzerhandbuch Einleitung Willkommen zum Operation Phrike Benutzerhandbuch! Dieses Handbuch geht davon aus, dass die Software bereits installiert und konfiguriert ist und geht nur auf

Mehr

Word Vorlage erstellen so gelingt es:

Word Vorlage erstellen so gelingt es: Word Vorlage erstellen so gelingt es: Option 1: Word Vorlage über die Backstage-Ansicht anfertigen 1. Öffnen Sie ein beliebiges Dokument oder ein leeres Dokument in Word. 2. Klicken Sie auf den Backstage-Knopf

Mehr

[Arbeiten mit dem Nvu Composer]

[Arbeiten mit dem Nvu Composer] Eine neue Seite erstellen Beim Start des Composers steht automatisch eine neue Composer-Seite zur Verfügung, die direkt verwendet werden kann. Über Datei > Neu > Composer-Seite kann jederzeit eine neue

Mehr

Vorwort Die Excel-Arbeitsumgebung Arbeitsmappen verwalten Daten eingeben und ändern 26 INHALTSVERZEICHNIS

Vorwort Die Excel-Arbeitsumgebung Arbeitsmappen verwalten Daten eingeben und ändern 26 INHALTSVERZEICHNIS INHALTSVERZEICHNIS Vorwort 9 1. Die Excel-Arbeitsumgebung 11 1.1. Der Excel-Arbeitsbildschirm 11 1.2. Das Menüband 12 1.3. Symbolleiste für den Schnellzugriff 14 1.4. Weitere Möglichkeiten der Befehlseingabe

Mehr

Ausbildungsziel: Erstellung eines Briefes mit Hilfe von Vorlagen

Ausbildungsziel: Erstellung eines Briefes mit Hilfe von Vorlagen Ausbildungsziel: Erstellung eines Briefes mit Hilfe von Vorlagen 1. Grundlagen (Inhalt Menü) Einer der grundlegendsten Anwendungen des Computers ist die als Schreibmaschine! Im Gegensatz zur Schreibmaschine

Mehr

Das Handbuch zu KCron

Das Handbuch zu KCron Das Handbuch zu KCron Autor: Frank Börner (f.boerner@selflinux.org) Autor: Robert Schröter (robert-schroeter@gmx.de) Autor: Morgan N. Sandquist (morgan@pipeline.com) Formatierung: Frank Börner (f.boerner@selflinux.org)

Mehr

Der Serienbrief bzw. Seriendruck

Der Serienbrief bzw. Seriendruck Der Serienbrief bzw. Seriendruck Sie lernen einen Serienbrief zu erstellen. In Word 2010 wird der Serienbrief unter der allgemeinen Bezeichnung Seriendruck geführt. Er besteht aus einem Hauptdokument (dem

Mehr

Exponent Version 5.0. Neue Funktionen

Exponent Version 5.0. Neue Funktionen Exponent Version 5.0 Neue Funktionen Projektwizard zur Erstellung neuer Projekte. Einbinden von automatischen Vorlagen. Automatische Berechnung der Messkurven Schnell-Auswertung. Automatischer Druck im

Mehr

Microsoft Excel 2010

Microsoft Excel 2010 Microsoft Excel 2010 Eine Einführung Seite 1 Tabellenkalkulation... Eine Excel-Tabelle stellt ein elektronisches Kalkulationsblatt dar, auf dem Sie Text, Zahlen und Formeln eingeben können. (RRZN, 1998)

Mehr

6 DATENBANKEN Datenbank. mit Spaltenüberschriften,

6 DATENBANKEN Datenbank. mit Spaltenüberschriften, 6 DATENBANKEN 6.1. Datenbank Eine Datentabelle mit Spaltenüberschriften, bei der in einer Spalte jeweils gleichartige Daten, stehen nennt man Datenbank. In Excel können kleine Datenbanken komfortabel verwaltet

Mehr

Christian Feichtinger. Excel für Fortgeschrittene

Christian Feichtinger. Excel für Fortgeschrittene Excel für Fortgeschrittene Excel für Fortgeschrittene Seite 2 Inhaltsverzeichnis 1. Grundbegriffe und Voreinstellungen... 3 1.1 Die Oberfläche von Excel - Begriffsbestimmungen:... 3 1.2 Voreinstellungen

Mehr

Die wichtigsten SHORTCUTS in Excel

Die wichtigsten SHORTCUTS in Excel Die wichtigsten SHORTCUTS in Excel Zellbearbeitung STRG + C Kopieren STRG + V Einfügen STRG + X Ausschneiden STRG + Z Letzter Schritt wird rückgängig gemacht STRG + A Tabellenblatt markieren Allgemeine

Mehr

Lektion: SUDOKU 1 (mittelschwer)

Lektion: SUDOKU 1 (mittelschwer) OSZ Wirtschaft und Sozialversicherung Fach: Datenverarbeitung /Wn EXCEL-Kurs Lektion: SUDOKU 1 (mittelschwer) Ziele dieser Lektion: Sie lernen, in EXCEL eine vorgegebene Tabelle zu erstellen, Rahmen zu

Mehr

LEITFADEN EXACT GLOBE. Budgetplanung. b.it Anwenderunterstützung. Version Hotline: 0662/

LEITFADEN EXACT GLOBE. Budgetplanung. b.it Anwenderunterstützung. Version Hotline: 0662/ LEITFADEN EXACT GLOBE Budgetplanung b.it Anwenderunterstützung Email: business.software@bitservice.at Hotline: 0662/6686-840 Version 20140327 Inhaltsverzeichnis 1. BUDGETVERWALTUNG... 3 1.1 GRUNDLAGEN...3

Mehr

Verknüpfen & Einbetten von Daten

Verknüpfen & Einbetten von Daten Verknüpfen & Einbetten von Daten In Office haben Sie die Möglichkeit, Daten in mehreren Anwendungen gemeinsam zu nutzen. Dies geschieht entweder durch Verknüpfen oder durch Einbetten von Objekten (Diagramme,

Mehr

Xpert - Europäischer ComputerPass. Peter Wies. Tabellenkalkulation (mit Excel 2013) 1. Ausgabe, Januar 2014

Xpert - Europäischer ComputerPass. Peter Wies. Tabellenkalkulation (mit Excel 2013) 1. Ausgabe, Januar 2014 Xpert - Europäischer ComputerPass Peter Wies 1. Ausgabe, Januar 2014 Tabellenkalkulation (mit Excel 2013) XP-EX2013 3 Xpert - Europäischer ComputerPass - Tabellenkalkulation (mit Excel 2013) 3 Mit Formeln

Mehr

Standardmäßig (wenn gerade kein Fenster im Programm geöffnet ist) stehen folgende Möglichkeiten zur Verfügung:

Standardmäßig (wenn gerade kein Fenster im Programm geöffnet ist) stehen folgende Möglichkeiten zur Verfügung: Die rechte Maustaste In WINLine können Sie zahlreiche Funktionen über die rechte Maustaste steuern. Durch Anklicken der rechten Maustaste wird ein so genanntes Abreißmenü geöffnet, das abhängig vom gerade

Mehr

Trainingsmanagement Gutschein Management. Beschreibung

Trainingsmanagement Gutschein Management. Beschreibung Trainingsmanagement Beschreibung www.dastm.de info@dastm.de 1. Einführung... 2 2. Gutschein Funktionen... 3 2.1. Gutschein Menü... 3 2.2. Gutscheine anlegen... 4 Gutschein Kassenwirksam erfassen... 6 Gutschein

Mehr

Inhaltsverzeichnisse

Inhaltsverzeichnisse Inhaltsverzeichnisse Überschriften zuweisen Formatieren Sie die Überschriften mit Hilfe der integrierten Formatvorlagen als Überschrift. Klicken Sie dazu in die jeweilige Überschrift und dann auf der Registerkarte

Mehr

Verwaltungsakademie Berlin. MS Excel Profiwissen Pivottabellen SEMINARUNTERLAGE

Verwaltungsakademie Berlin. MS Excel Profiwissen Pivottabellen SEMINARUNTERLAGE Verwaltungsakademie Berlin MS Excel 2010 - Profiwissen Pivottabellen SEMINARUNTERLAGE Verwaltungsakademie Berlin Nachdruck sowie jede Art von Vervielfältigung und Weitergabe nur mit Genehmigung der Verwaltungsakademie

Mehr

RECHNEN MIT WORD 2010

RECHNEN MIT WORD 2010 RECHNEN MIT WORD 2010 Viele Anwender wissen wahrscheinlich gar nicht, dass Word 2010 über eine versteckte Funktion verfügt, mit der man einfache Berechnungen im ganz normalen (Fließ)Text durchführen kann.

Mehr

Kennen, können, beherrschen lernen was gebraucht wird

Kennen, können, beherrschen lernen was gebraucht wird Inhaltsverzeichnis Inhaltsverzeichnis... 1 Das Excel-Fenster... 2 Das Menüband verwenden... 2 Daten in das Tabellenblatt eingeben... 3 Zahlen und Text eingeben... 3 Korrekturen der Eingaben vornehmen...

Mehr

Tiscover CMS 7. Neuerungen im Vergleich zu Tiscover CMS 6

Tiscover CMS 7. Neuerungen im Vergleich zu Tiscover CMS 6 Tiscover CMS 7 Neuerungen im Vergleich zu Tiscover CMS 6 Inhaltsverzeichnis An- und Abmeldung im Tiscover CMS 7... 3 1. Anmeldung... 3 2. Abmeldung... 3 Bereiche der Arbeitsoberfläche von Tiscover CMS

Mehr

3.4.1 Anlegen zusätzlicher Worte

3.4.1 Anlegen zusätzlicher Worte 3.4.1 Anlegen zusätzlicher Worte Nach Auswahl des Menüpunktes Wortdatenbank Worte bearbeiten... öffnet sich das in der Abbildung links dargestellte Fenster Wortdatenbank. Es enthält drei Karteikartenreiter

Mehr

Excel Kurzübersicht

Excel Kurzübersicht Excel 2007 Kurzübersicht E. Jähnert 2010 www.ejae.de Office- Schaltfläche Titelleiste Register Multifunktionsleiste Schnellzugriffsleiste (in der Abbildung unter der Multifunktionsleiste) Namenfeld Bearbeitungsleiste

Mehr

Kennen, können, beherrschen lernen was gebraucht wird

Kennen, können, beherrschen lernen was gebraucht wird Inhaltsverzeichnis Inhaltsverzeichnis... 1 Mit Namen arbeiten... 1 Namen vergeben... 1 Vorteile von Namen... 1 Zellen / Zellbereiche benennen... 2 Richtlinien für Namen... 2 Namen automatisch vergeben...

Mehr

Neuerungen im Überblick 5 wichtige Punkte. Tipps zur Arbeitserleichterung: Die neue Word- Statuszeile

Neuerungen im Überblick 5 wichtige Punkte. Tipps zur Arbeitserleichterung: Die neue Word- Statuszeile Inhaltsübersicht: Neuerungen im Überblick 5 wichtige Punkte Seite 2 Multifunktionsleiste: Weg mit den Menüs Seite 5 Tipps zur Arbeitserleichterung: Die neue Word- Statuszeile Seite 8 Tipps zur Arbeitserleichterung:

Mehr

3 Tabellenkalkulation

3 Tabellenkalkulation Aufbau von Tabellendokumenten 87 3 Tabellenkalkulation Hinweis Alle Erklärungen zur Tabellenkalkulation beziehen sich auf das Tabellenkalkulationsprogramm OpenOfficeCalc. Immer dann, wenn die Vorgehensweisen

Mehr

Erläuterungen zum Online-Zähltool b4p. Mehr Informationen über mds:

Erläuterungen zum Online-Zähltool b4p. Mehr Informationen über mds: Erläuterungen zum Online-Zähltool b4p Mehr Informationen über mds: www.mds-mediaplanung.de Zielgruppendefinition Mit dem Modul Zielgruppen-Definition wird eine Personengruppe festgelegt, auf die sich alle

Mehr

Anleitung zur Erstellung einer Concept-Map

Anleitung zur Erstellung einer Concept-Map Anleitung zur Erstellung einer Concept-Map Was ist eigentlich eine Concept-Map? Eine Concept-Map (ein Begriffs-Netz) ist ein anschauliches Bild, in dem einzelne Begriffe (Concepts) miteinander verbunden

Mehr

LÖS Lektion: SUDOKU 1 (mittelschwer)

LÖS Lektion: SUDOKU 1 (mittelschwer) OSZ Wirtschaft und Sozialversicherung Fach: Datenverarbeitung /Wn EXCEL-Kurs LÖS Lektion: SUDOKU 1 (mittelschwer) Ziele dieser Lektion: Sie lernen, in EXCEL eine vorgegebene Tabelle zu erstellen, Rahmen

Mehr

Programmaktualisierung und Parameter neu einlesen

Programmaktualisierung und Parameter neu einlesen PC-Kaufmann Programmaktualisierung und Parameter neu einlesen Impressum Sage GmbH Emil-von-Behring-Str. 8-14 60439 Frankfurt am Main Copyright 2016 Sage GmbH Die Inhalte und Themen in dieser Unterlage

Mehr

EDV-Fortbildung Excel 2010 Aufbaumodul

EDV-Fortbildung Excel 2010 Aufbaumodul EDV-Fortbildung Excel 2010 Aufbaumodul Auffrischung des bereits Gelernten Willkommen zurück! Um sich wieder einzufinden können Sie die Tabellenblätter der Wiederholungsübung bearbeiten. Hier wiederholen

Mehr

EDV Grundlagen. Tabellenkalkulation

EDV Grundlagen. Tabellenkalkulation EDV Grundlagen Tabellenkalkulation Definition & Programme Tabellenkalkulation = Software für die tabellarische, interaktive Eingabe, Verarbeitung und grafische Darstellung von numerischen und alphanumerischen

Mehr

MEHRJÄHRIGER KALENDER

MEHRJÄHRIGER KALENDER Kurzbeschreibung MEHRJÄHRIGER KALENDER FÜR EREIGNISSE UND TERMINE MIT EXCEL 2007 EINLEITUNG Auf Basis Microsoft EXCEL 2007 wurden durch den Autor ein Werkzeug entwickelt, mit welchem wiederkehrende Ereignisse

Mehr

Abbildung 1: Links: Skizze des Versuchsaufbaus, Rechts: Zeichnung auf Grundlage der zuvor erstellten Skizze

Abbildung 1: Links: Skizze des Versuchsaufbaus, Rechts: Zeichnung auf Grundlage der zuvor erstellten Skizze 1 Statistische Versuchsauswertung in Excel 1.1 Wichtige Daten zur Versuchsdurchführung Neben den reinen Versuchsergebnissen, sollten bei der experimentellen Durchführung eines Versuchs Daten zum Versuchsaufbau/-design,

Mehr

Wahrscheinlichkeitsrechnung und schließende Statistik

Wahrscheinlichkeitsrechnung und schließende Statistik Springer-Lehrbuch Wahrscheinlichkeitsrechnung und schließende Statistik Bearbeitet von Karl Mosler, Friedrich Schmid 4., verb. Aufl. 2010. Taschenbuch. XII, 347 S. Paperback ISBN 978 3 642 15009 8 Format

Mehr

Anleitung zum Applet

Anleitung zum Applet Anleitung zum Applet Vergleich von zwei Mittelwerten bearbeitet von: SS 2006 E/TI-7 betreut von: Prof. Dr. Wilhelm Kleppmann Inhaltsverzeichnis Anleitung zum Applet...1 1 Vorwort...3 2 Grafische Benutzeroberfläche...4

Mehr

Kapitel 3 Excel 2007 der Taschenrechner

Kapitel 3 Excel 2007 der Taschenrechner 53 Kapitel 3 Excel 2007 der Taschenrechner In diesem Kapitel ist es so weit. Sie machen das, wofür Excel 2007 da ist: Sie führen die ersten Berechnungen durch. Anstatt Berechnungen verwenden Sie den Ausdruck

Mehr

Excel 2003 Teil-1 HAFNER-EDVtechnik Uhlandstraße Geislingen

Excel 2003 Teil-1 HAFNER-EDVtechnik Uhlandstraße Geislingen Excel 2003 Teil-1 HAFNER-EDVtechnik Uhlandstraße 7 72351 Geislingen Inhaltsverzeichnis 1 Vorbemerkungen 1.1 Tasten-Bezeichnungen 2 Programm Excel 2003 2.1 Excel starten 2.2 Der Excel-Bildschirm 3 Der

Mehr

Binomialverteilung Vertrauensbereich für den Anteil

Binomialverteilung Vertrauensbereich für den Anteil Übungen mit dem Applet Binomialverteilung Vertrauensbereich für den Anteil Binomialverteilung Vertrauensbereich für den Anteil 1. Statistischer Hintergrund und Darstellung.... Wie entsteht der Vertrauensbereich?...

Mehr

Word starten. Word Word 2010 starten. Schritt 1

Word starten. Word Word 2010 starten. Schritt 1 Schritt 1 Word 2010 starten. 2) Klicke danach auf Microsoft Office Word 2010. Sollte Word nicht in dieser Ansicht aufscheinen, dann gehe zu Punkt 3 weiter. 1) Führe den Mauszeiger auf die Schaltfläche

Mehr

Dateien verwalten (Bilder, Dokumente, Medien)

Dateien verwalten (Bilder, Dokumente, Medien) 17 Dateien verwalten (Bilder, Dokumente, Medien) Bilder und Dokumente können Sie im Funktionsmenü unter Dateiliste verwalten. Alle Bilder und Dokumente, die Sie in Ihren Baukasten hochgeladen haben, werden

Mehr

Mehrfache Lineare Regression 1/9

Mehrfache Lineare Regression 1/9 Mehrfache Lineare Regression 1/9 Ziel: In diesem Fallbeispiel soll die Durchführung einer mehrfachen linearen Regressionsanalyse auf der Basis vorhandener Prozessdaten (Felddaten) beschrieben werden. Nach

Mehr