Physik Fehlerrechnung 1. Abschätzung des wahren Messwertes 1.1. Systematische/zufällige Fehler 1.. Mittelwert, Varianz 3 1.3. Gaußverteilung 5 1.4. Vertrauensbereich 6 1.5. Vergleich von Messwerten 8 1.6. Signifikante Stellen 9. Fehlerfortpflanzung 10 3. Lineare Regression 1 Autoren: Radmacher, Rybach, Sieber; Stand: 11/010
Hochschule iederrhein 1. Abschätzung des wahren Messwertes In der Physik werden Größen fast immer durch Messungen bestimmt. ehmen wir an, man will die Dauer t, die eine Kugel zum Durchfallen einer Höhe h benötigt, ermitteln. Man erwartet, wenn keine Luftreibung zu berücksichtigen ist, eine Fallzeit von: t = h g wobei g die Erdbeschleunigung bezeichnet, eine Konstante. Als Ergebnis der Messung erhält man einen Messwert, z.b. t = 3,4 s. Leider weiß man nicht, ob dieser Messwert richtig, "wahr", ist. Denn schließlich ist jede Messung mit einem gewissen - vielleicht sehr kleinen - Fehler behaftet. Ob der Fehler bei dieser einen speziellen Messung nun gerade sehr groß oder zufällig extrem klein, vielleicht sogar genau null ist, kann man nicht sagen. Wiederholt man die Messung, wird man daher unterschiedliche Messwerte erhalten, z.b. t = 3,5 s usw.. Messergebnisse: i 1 3 4 5 6 7 8 9 10 11 1 t i /s 3,4 3,5 3, 3,3 3,6 3,4 3,3 3,5 3,4 3,3 3,4 3,7 Selbst, wenn sich immer wieder derselbe Wert ergibt, kann man nicht sicher sein, dass dies der "wahre" Wert - nennen wir ihn t w - ist. Prinzipiell ist es also unmöglich, den wahren Messwert aus Messungen zu bestimmen. Man muss sich daher Gedanken machen, wie man den wahren Messwert am besten abschätzen kann. Hierzu dient die Fehlerrechnung. 1.1. Systematische/zufällige Fehler Man sollte sich im Klaren darüber sein, dass es zwei deutlich unterschiedliche Arten von Fehlern bzw. Störgrößen gibt: Zum einen kann das Messergebnis systematisch vom wahren Wert abweichen. Bezogen auf das obige Beispiel etwa, wenn die benutzte Uhr einen falschen Gang hat, also etwas zu schnell oder zu langsam läuft. Man wird dann immer eine zu kurze Physik: Fehlerrechnung Seite /13
Hochschule iederrhein (oder zu lange) Zeit messen, ohne dass man es dem Messergebnis ansehen kann. Diese Fehler nennt man systematische Fehler. Systematische Fehler können nur durch zusätzliche, unabhängige Experimente ermittelt werden. Für Ihre Abschätzung und Beseitigung gibt es kein allgemeines Verfahren (in unserem Beispiel müsste man einen Uhrenvergleich durchführen). Allerdings geben einige Hersteller Obergrenzen für die systematischen Fehler ihrer Messinstrumente an, die man bei der Fehlerabschätzung benutzen kann. Auch wenn kein systematischer Fehler vorliegt, wird eine Vielzahl von kleinen Störgrößen dafür sorgen, dass man bei wiederholten Messungen unterschiedliche Messwerte erhält. Diese Variationen nennt man zufällige Fehler. Der Mathematiker K. F. GAUß hat - als er ebenfalls über den möglichen Fehler eines Messwertes und eine Ermittlung des "wahren" Wertes nachdachte - herausgefunden, dass die zufälligen Fehler Informationen über die beste Abschätzung des wahren Wertes liefern können. 1.. Mittelwert, Varianz Um den Zusammenhang zwischen einzelnen Messwerten t i, (,...,) und dem Gesamtergebnis besser zu verstehen, ist es hilfreich, sich die Verteilung der Messwerte t i anzusehen, und zwar in Form einer Häufigkeitsverteilung, eines Histogramms. Hierzu legen wir Messwertintervalle (willkürlich) fest und ermitteln, wie oft ein Messwert in dieses Intervall fällt. In unserem Beispiel seien die Intervalle gegeben durch: Intervall Häufigkeit 3,0 s t < 3,1 s 0 3,1 s t < 3, s 0 3, s t < 3,3 s 1 3,3 s t < 3,4 s 3 3,4 s t < 3,5 s 4 3,5 s t < 3,6 s 3,6 s t < 3,7 s 1 3,7 s t < 3,8 s 1 Abb.1: Histogramm der Messwerte Offensichtlich muss der wahre Wert in unserem Beispiel in der ähe von 3,4 s liegen. Physik: Fehlerrechnung Seite 3/13
Hochschule iederrhein Die Überlegungen von Gauß gingen von der Betrachtung der "wahren Fehler" w i aus, d.h. der Abweichungen zwischen den einzelnen Messwerten t i und dem wahren Wert t w : w i = t i - t w Auch die w i können prinzipiell nicht ermittelt werden, da t w stets unbekannt bleibt. Den Mittelwert der Quadrate der w i nennt man die Varianz der Messwerte: " = 1 Auch diese Varianz, die die Kenntnis des wahren Messwertes voraussetzt, kann nicht aus den Messwerten errechnet werden. Wenn man einen Schätzwert s w für den wahren Wert t w irgendwie gewinnen könnte, gelänge es wenigstens die Abweichungen von diesem Wert, die "Fehler der Einzelwerte" e i zu berechnen: e i = t i - s w Gauß nahm nun an, dass man einige Schätzwerte s w einfach durchprobiert. Jedes Mal errechnet man einen neuen Satz von Fehlern e i. Bildet man die Summe der Quadrate der e i, erhält man für jeden Satz jeweils eine Zahl, die klein sein sollte, wenn die Messungen nur wenig von dem Schätzwert abweichen, die aber umso größer wird, je schlechter die Schätzung s w war. Gauß stellt nun die Behauptung auf, dass derjenige Schätzwert die beste Annäherung an den wahren Wert darstellt, für den die Summe der Fehlerquadrate e i ² am kleinsten wird: Forderung: Methode der kleinsten Quadrate # w i Wenn man diese Forderung erhebt, kann man zeigen, dass nur eine Zahl als "bester Schätzwert" in Frage kommt, nämlich der Mittelwert der Messwerte: Bester Schätzwert für den wahren Wert:! ei = Minimum i =1 t = 1 " t i Der Mittelwert ist der beste Schätzwert für den wahren Wert. In unserem Bespiel also: t = 3,4 s. Physik: Fehlerrechnung Seite 4/13
Hochschule iederrhein Wenn der Mittelwert - der ja die bestmögliche Schätzung s w für den wahren Wert t w darstellt - bekannt ist, kann man auch einen Schätzwert s für den mittleren wahren Fehler σ angeben: " = s = 1 #1 $ e i Diese Größe nennt man Standardabweichung der (einzelnen) Messwerte. (Man beachte, dass ( - 1) im enner steht und nicht wie üblicherweise bei einem Mittelwert. Es handelt sich hier also tatsächlich nicht um einen Mittelwert.) Bei einer vorgegebenen Messanordnung verringern sich Standardabweichung (und Varianz) nicht, wenn man die Anzahl der Messungen erhöht, sie variieren nur zufällig. Dies ist jedoch anders für die Abschätzung des Fehlers des Mittelwertes, d.h. die Abweichung t w - t. Für die Abschätzung dieses Fehlers gilt: Fehler des Mittelwertes: s mw = 1 s Dieser Wert wird kleiner, je mehr Messungen durchgeführt werden ( nimmt zu, steht im enner!). Es lohnt sich also, Messungen häufig zu wiederholen, um die Messgenauigkeit zu steigern. 1.3. Gaußverteilung Diese Aussagen - und die gezeigten Berechnungsmethoden - treffen allerdings nur zu, wenn die von GAUß gemachten Annahmen vorliegen. Gemäß dieser Annahmen müssen die Fehler symmetrisch um den Mittelwert verteilt sein, d. h. die Häufigkeitsverteilung der Messwerte muss eine ganz bestimmte Gestalt haben, die man ormalverteilung oder Gaußverteilung nennt. Die Form der Verteilung kann man durch eine Funktion beschreiben, die Gaußfunktion: basierend auf der Exponentialfunktion e x. H(t) = e " (t " t ) s Die Gaußfunktion wird durch nur zwei Zahlen festgelegt: den Mittelwert t als Zentrum der symmetrischen Glockenfunktion und die Standardabweichung s, die die Breite der Glockenfunktion bestimmt (siehe auch Abb. ). Der Maximalwert von H(t) ist 1. Folgt die Fehlerverteilung nicht einer ormalverteilung, kann man Mittelwert und Standardabweichung rein formal zwar weiterhin nach obigen Formeln berechnen, sie haben dann aber nicht die genannte Bedeutung! Physik: Fehlerrechnung Seite 5/13
Hochschule iederrhein Als Ergebnis einer Messreihe gibt man i.a. als beste Abschätzung für den wahren Wert den Mittelwert plus/minus dem Fehler des Mittelwertes an: t = t ± s mw Kann die Größe Δt sys des systematischen Fehlers abgeschätzt werden, gilt: t = t ± (s mw + t sys ) = t ± Δt mit dem Gesamtfehler Δt. Manchmal wird auch der relative Fehler angegeben: f relativ = Δt / t der relative Fehler ist immer dimensionslos und wird häufig in Prozent angeben. Abb. : Histogramm und normierte Gaußfunktion 1.4. Vertrauensbereich Die Tatsache, dass die Messwerte aufgrund der zufälligen Fehler stets in einem mathematisch wohl definierten Bereich schwanken - der durch die ormalverteilung gegeben ist - erlaubt es, mit guter Sicherheit vorherzusagen, in welchem Bereich ein zukünftiger Messwert liegen wird. Man betrachte hierzu die ormalverteilung: Die Position des Maximums ist durch den Mittelwert definiert (bis auf dessen Fehler), die Breite durch die Standardabweichung (bis auf deren Fehler). Die Form dieser Verteilung ist unabhängig von der Anzahl der Messungen, nur die Genauigkeit hängt von der Anzahl ab. Physik: Fehlerrechnung Seite 6/13
Hochschule iederrhein Führt man eine weitere Messung durch, wird der Messwert wieder mit großer Wahrscheinlichkeit in der ähe des Maximums, d.h. des Mittelwertes liegen; mit welcher Wahrscheinlichkeit, kann man direkt aus den Flächenanteilen der Kurve ablesen: Mit 68,3%-iger Wahrscheinlichkeit wird der neue Messwert im Bereich Mittelwert plus/minus eine Standardabweichung (±" ) liegen, mit 95,4%iger Wahrscheinlichkeit im Bereich Mittelwert plus/minus zwei Standardabweichungen (± " ). Anzahl Statistische Sicherheit Messungen 68,3% 95,4% n t t 1,84 1,71 3 1,3 4,30 4 1,0 3,18 5 1,15,78 6 1,11,57 8 1,08,37 10 1,06,3 0 1,03,09 50 1,01,01 100 1,00 1,98 >100 1,00 1,96 ±" ± " Abb. 3: ormalverteilung und Vertrauensbereich Die ormalverteilung erlaubt es also, so genannte "Vertrauensbereiche" zu definieren: Mit 68,3%-igem Vertrauen (oder Wahrscheinlichkeit) weicht jeder neue Messwert nicht mehr als eine Standardabweichung, mit 95,4%-igem Vertrauen nicht mehr als zwei Standardabweichungen vom Mittelwert ab. Allerdings muss man berücksichtigen, dass Mittelwert und Standardabweichung selber nicht beliebig genau definiert sind, insbesondere wenn nur wenige Messungen vorliegen. Will man diese Unsicherheit mit berücksichtigen, muss man für den Fall weniger Messwerte einen Sicherheitszuschlag geben. Hierzu führt man einen Parameter t ein, um den die Standardabweichung zu vergrößern ist. Der zu erwartende Messwert wird dann entweder mit 68,3%- iger oder 95,4%-iger Sicherheit im folgenden Bereich liegen: x = x ± t s mw wobei t den Korrekturfaktor bezeichnet, der vom Vertrauensbereich und der Anzahl der Messungen abhängt und durch folgende Tabelle gegeben ist ( Student-Verteilung ). Je nach Umständen muss man auch noch systematische Fehler berücksichtigen. Physik: Fehlerrechnung Seite 7/13
Hochschule iederrhein 1.5. Vergleich von Messwerten Das Messergebnis setzt sich zusammen aus Mittelwert und Fehler. Beide Werte benötigt man für eine Abschätzung der Genauigkeit der Messung. Werden zum Beispiel zwei Messungen mit unterschiedlichen Messverfahren oder von zwei unterschiedlichen Personen durchgeführt, kann man mittels Vergleich der Fehler eine Aussage über eine Übereinstimmung oder eine Unverträglichkeit der Messergebnisse treffen. B D Literaturwert A C Abb. 4: Vergleich von Messungen mittels Fehlerbalken und Literaturwert Im Beispiel stehen sich Messungen der Erdbeschleunigung gegenüber. Messung A hat ein deutlich größeres Fehlerintervall (Fehlerbalken) als Messung B. Stellt deshalb der Mittelwert von Messung B den besten Schätzwert des wahren Wertes dar? Beide Messungen weichen signifikant voneinander ab und sind miteinander unverträglich. Messung C und Messung D haben unterschiedliche Mittelwerte, weisen aber ähnlich große Fehlerbalken auf, die sich zudem auch überschneiden. Damit sind beide Messungen miteinander verträglich. Ist ein Literaturwert bekannt, wird sich das Ergebnis von Messung C als bester Schätzwert darstellen. Der Mittelwert liegt unterhalb des Literaturwertes, dieser aber innerhalb des Fehlerintervalls und damit in der Messunsicherheit. Messung D ist mit seinem Fehlerintervall sehr nahe an der Grenze zum Literaturwert. Hier trägt ein systematischer Fehler zur Abweichung bei. Physik: Fehlerrechnung Seite 8/13
Hochschule iederrhein 1.6. Signifikante Stellen Kennt man den Fehler einer Messung (i.a. erst nachdem die gesamte Messreihe ausgewertet und analysiert wurde), weiß man, wie viele Stellen des Messwertes bei einer dezimalen Darstellung von Bedeutung sind. In unserem vereinfachten Beispiel (mit dem Fehler des Mittelwertes) hatten wir erhalten: t = (3,417 ± 0,041) s, Der wahre Wert wird also zwischen t u = 3,376 s und t o = 3,458 s liegen. Dies bedeutet, dass die höchstwertige Ziffer (hier vor dem Komma) sicher eine 3 ist. Die zweitwertige Ziffer (hier die erste Ziffer nach dem Komma) kann entweder eine 3 oder 4 sein. Von der dritten Ziffer wissen wir, dass sie jeden Wert außer der 6 annehmen kann. Die vierte und alle folgenden Ziffern können schließlich jeden beliebigen Wert annehmen. Die Ziffern ab der vierten Stelle sind in unserem Beispiel also ohne Signifikanz (Bedeutung). Es ist daher hier nicht sinnvoll, mehr als drei zur Sicherheit vier Stellen anzugeben: Die Zahl signifikanter Stellen beträgt also höchstens vier. Allgemein gilt: Bei einem Experiment wird für das Ergebnis nur die Zahl signifikanter Stellen angegeben. Die Angabe von weniger Stellen bedeutet Ungenauigkeit, die Angabe von mehr Stellen ist sinnlos und täuscht Genauigkeit nur vor! Dabei ist es gleichgültig, ob die Stellen vor oder hinter dem Komma stehen. Dies wird deutlich, wenn wir das gleiche Ergebnis z.b. in Millisekunden angeben: t = (3417 ± 41) ms Auch hier gilt: Die höchstwertige Zahl ist eine 3, die zweitwertige entweder eine 3 oder 4 usw., d.h. die Zahl signifikanter Stellen beträgt auch hier wieder höchstens vier. Da man bei der Auswertung eines Versuches noch nicht exakt weiß, wie groß der genaue Fehler sein wird, benutzt man zu Beginn mehr Stellen, als nach Abschätzung des Fehlers wahrscheinlich nötig sein werden. Das Endergebnis wird dann aber nur bis zur Anzahl signifikanter Stellen angegeben. Physik: Fehlerrechnung Seite 9/13
Hochschule iederrhein. Fehlerfortpflanzung Bei vielen Versuchen hängt das Endergebnis nicht nur von einem Parameter ab - in unserem Beispiel war dies die Höhe h gemäß t = ( h/g) 0,5 - sondern von mehreren Parametern. ehmen wir an, die Fallzeit würde - wenn man sehr genau misst - nicht nur von der Höhe h, sondern auch noch von der Temperatur T und der Luftfeuchtigkeit F beeinflusst. Alle drei Parameter können nur mit endlicher Genauigkeit, d.h. mit einem gewissen Fehler Δh, ΔT und ΔF bestimmt werden. Ungenauigkeiten in der Messung übertragen sich aber auf das Endergebnis. Allerdings kann der Einfluss sehr unterschiedlich sein: Vielleicht muss man die Höhe auf mindestens 1 mm, die Temperatur auf 0,01 K und die Luftfeuchtigkeit auf 15% genau bestimmen, um im Endergebnis den gleichen Fehler zu erhalten. (Bisher hatten wir die Möglichkeit, dass Fehler bei der Bestimmung von h in das Endergebnis eingehen, nicht berücksichtigt. Die Abweichung Δh vom wahren Wert hatten wir als systematischen Fehler - den man schwer abschätzen kann - einfach unberücksichtigt gelassen.) Die Methode der Fehlerfortpflanzung erlaubt es, den Einfluss der Parameter auf das Endergebnis abzuschätzen, wenn ein funktionaler Zusammenhang zwischen dem Endergebnis und den Parametern bekannt ist. ehmen wir an, das Endergebnis y sei eine Funktion f der Parameter a, b, c usw.: y = f(a, b, c,...) etwa in der Form y = a + 17,3 b 3,5 - sin(6,9 c). Dann ist der Fehler Δy des Endergebnisses nach dem (Gaußschen) Fehlerfortpflanzungsgesetz gegeben durch: ' y = ( f # $ ' a! % ( a " ( f # + $ ' b! % ( b " ( f # + $ ' c! % ( c " + wobei angenommen ist, dass die Fehler von a, b, c usw. nicht alle in die gleiche Richtung wirken, sondern sich zufällig auch teilweise kompensieren. Andernfalls müsste man den größtmöglichen Fehler betrachten: " f " f " f! y max =! a +! b +! c + " a " b " c Die Δa, Δb, Δc usw. sind die Fehler, die bei der Bestimmung der einzelnen Parameter auftreten. Diese Fehler können abgeschätzt werden - man weiß etwa, dass man mit einer Schieblehre nicht genauer als 0,1 mm messen kann - oder sie werden durch mehrfache Messung bestimmt, indem man die Standardabweichung berechnet. Physik: Fehlerrechnung Seite 10/13
Hochschule iederrhein f/ a bezeichnet dabei die "partielle" Ableitung von f(a,b,c,...) nach a. Die Funktion f wird dabei so behandelt, als ob sie nur von a (als unabhängiger Variablen) abhinge, die weiteren Parameter werden als konstante Faktoren betrachtet. Konkret ergäbe sich im obigen Beispiel für die partiellen Ableitungen nach a, b und c: # f = 1 # a # f,5 = 17,3! 3,5! b # b # f = " cos(6,9! c)! 6,9 # c Interessant sind vorrangig die gesamten Faktoren f/ a Δa usw., da sie direkt den Beitrag des Parameters a usw. auf den Fehler des Endergebnisses Δy darstellen. Sie sollten daher getrennt ausgerechnet und miteinander verglichen werden: Sind alle Faktoren ungefähr gleich groß, dann haben alle Parameter den gleichen Einfluss auf das Endergebnis; dominiert jedoch ein Faktor, dann kann man den Einfluss der anderen auf den Fehler des Endergebnisses vernachlässigen. Für ein Produkt von Potenzen existiert ein Spezialfall. Ist f ( a,b,c, ) ein Produkt der Größen a,b,c, und gilt: f ( a,b,c, ) = const." a # " b $ " c % ", so lassen sich die entsprechenden relativen Fehler einfacher berechnen: "f f $ "a' $ "b' $ "c' = # % a ( ) + * % b ( ) + + % c ( ) + Physik: Fehlerrechnung Seite 11/13
Hochschule iederrhein 3. Lineare Regression Häufig besteht zwischen der zu messenden Größe y und der unabhängigen Variablen x ein linearer Zusammenhang: y = a + bx d.h. der Verlauf entspricht einer Geraden mit dem Achsenabschnitt a und der Steigung b (a und b sind konstant). Führt man Messungen bei vorgegebenen x i -Werten (,,... ) durch, so werden die Messwerte y i i.a. von zufälligen Fehlern beeinflusst und liegen keineswegs exakt auf einer Geraden. Das Ergebnis der Messung ähnelt daher eher einer "Punktwolke", die den Verlauf einer Geraden mehr oder weniger gut andeutet. Wie können aus dieser Punktwolke die Parameter a und b der Geraden bestimmt werden, so dass ihre Werte möglichst nahe an die "wahren" Werte herankommen? Achsenabschnitt a y Y i y i a b Steigung b x i x Abb. 5: Lineare Regression Die Überlegungen sind ähnlich wie im vorhergehenden Abschnitt. Man denke sich eine Gerade gegeben, die durch die beiden Parameter a Test und b Test bestimmt ist. An jeder Messstelle x i erhält man dann einen errechneten Datenpunkt Y i. Ein Maß für der "Güte" der Anpassung der Geraden an die Messwerte bildet offensichtlich die (Quadrat)Summe der Abweichungen zwischen den errechneten Werten Y i und den gemessenen Werten y i an den Messstellen x i. ach GAUß wird diejenige Gerade die beste Annäherung an die "wahre" Gerade ergeben, bei der die Summe der Abweichungen ein Minimum darstellt: #( Y i " y i ) = # a Test + b Test x i " y i ( ) = Minimum Physik: Fehlerrechnung Seite 1/13
Hochschule iederrhein Diese Methode der Bestimmung der besten Geraden nennt man lineare Regression. Die Vorgabe, dass obiger Ausdruck minimal werden soll, definiert eindeutig die Parameter a und b der bestangepassten Geraden, die gegeben sind durch: b = 1! xi yi (! yi! i 1 ' %! x ( % i! $ x " i # x und: a = y " b # x Dabei bezeichnet y den Mittelwert über die y i und x den Mittelwert über die x i. In vielen Taschenrechnern sind die Formeln für a und b bereits fest einprogrammiert. Auch für a und b kann man Standardabweichungen als Abschätzungen für den Fehler berechnen: s b = ) (! yi ( a )! yi ( b)! ' %! x ( % i! $ x " i # x y i i und: s a = s b " 1 "! x i Außerdem gibt es bei der linearen Regression einen Parameter, der die Güte der Anpassung beschreibt und der Korrelationskoeffizient r genannt wird; er liegt im Bereich -1 r 1. r = # (x i " x )(y i " y ) #(x i " x ) #(y i " y ) = # x i y i " 1 # x i # y i # x i " 1 $ % # x i ' ) ( # y i " 1 $ % # y i ' ) ( Physik: Fehlerrechnung Seite 13/13