Physikpraktikum für Pharmazeuten Universität Regensburg Fakultät Physik 1. Versuch: Fehlerrechnung - Statistik In diesem Versuch werden Sie mit den statistischen Grundlagen vertraut gemacht. Anhand der statistischen Auswertung von Bohnengewicht und -länge sammeln Sie erste Erfahrungen bei der Bedienung des Programms QTI-Plot zur graphischen Darstellungen von Messergebnissen.
1 Einführung In der Einführung zu diesem Praktikum haben wir festgestellt, dass Physiker Fakten auf quantitative Weise untersuchen. Man sagt beispielsweise nicht, dass ein Körper warm ist. Stattdessen sagen wir er hat zum Beispiel eine Temperatur von 97 C. Außerdem hängt die Gültigkeit dieser Aussage ( Der Körper A hat eine Temperatur von 97 C. ) von der Art der Messung mit welcher sie festgestellt wurde, beziehungsweise deren Fehler ab. An dem Konzept des Fehlers ist nichts falsch. Alle Messungen werden durch Fehler beeinflusst, die von der Präzision und Genauigkeit aller verwendeten Messinstrumente oder von Rauschen, Störungen und Fluktuationen der Umgebung abhängen. Diese Fehlerquellen sind unvermeidbar. Im Allgemeinen gilt: Je mehr man die Genauigkeit eines Instruments verbessert, desto wichtiger wird die Rolle von Fluktuationen der Umgebung. Andererseits erlangt das Auflösungslimit unserer Instrumente eine größere Bedeutung, wenn wir die externen Störungen reduzieren. Schlussendlich gibt es noch eine weitere Quelle von Fehlern, die systematischen Fehler. Diese sind die einzigen Fehler durch welche man auf eine wirkliche Fehlfunktion eines Messinstruments schließen kann. Zum Beispiel tendiert eine Uhr mit schwacher Batterie dazu zu spät gehen. Sie wird daher die gemessenen Zeiten systematisch unterschätzen. Solche Fehler lassen sich jedoch durch eine genaue Überprüfung des Experiments und der verwendeten Geräte vermeiden. Deswegen werden wir diese Art von Fehler in unserer Analyse nicht betrachten. Die von uns betrachteten zwei Fehlerquellen, die durch das Auflösungsvermögen unseres Instruments, sowie die in der Umgebung verursachten Fluktuationen gegeben sind, stellen beide eine Messung der Ungenauigkeit unserer Messung dar. Ausgedrückt werden sie durch die Angabe eines Intervalls mit denselben Einheiten des gemessenen Wertes, zum Beispiel 97 C±2 C. In diesem Beispiel bedeutet die Angabe der 2 C, dass wir vermuten, dass der genaue wahre Wert der Messung, welcher nicht verfügbar ist, irgendwo zwischen 95 C und 99 C liegt. Wie wir bereits in der Einführung zu diesem Praktikum erwähnt haben, beruht die Wahrheit in der Physik auf den Fehler der Messungen. Die Aussage der Körper A (mit einer Temperatur T A = 97 C±2 ) ist heißer als der Körper B (mit der Temperatur T B = 96 C±2 C) ist nicht notwendigerweise richtig, da ein entscheidender Überlapp zwischen den beiden Intervallen vorliegt, der beachtet werden muss. Obwohl beide Fehlerarten in derselben Weise dargestellt werden, behandelt man sie unterschiedlich. Der Fehler verursacht durch die begrenzte Auflösung des Messinstruments gibt einfach die Genauigkeit des Instrumentes an. Bei der anderen Sorte der Fehler, die durch Fluktuationen in der Umwelt induziert werden, ist die Situation komplizierter. Aufgrund der Fluktuationen wird das Ergebnis der Messung zu einer zufälligen Varia- 2
ble, selbst wenn unser Instrument sehr gut und präzise ist. Der einzig mögliche Umgang mit zufälligen Variablen besteht darin Statistik zu nutzen. Statistik ist ein extrem großes und wichtiges Themengebiet, das eine entscheidende Bedeutung in vielen Bereichen des menschlichen Wissens spielt. Es ist klar, dass ein solch riesiges Thema nicht in einem Abschnitt in diesem Skript zusammengefasst werden kann. Was wir jedoch versuchen werden, ist ein selbsterklärendes Konzept der Statistik zu vermitteln, wobei wir den Begriff des zufälligen Fehlers einführen werden. Wir werden erklären was ein maximaler Fehler ist und wir werden lernen wie man mit Fehlern umgeht, wenn wir verschiedene Messwerte, welche alle eigene Fehler besitzen, addieren, subtrahieren, multiplizieren, dividieren, etc. müssen. Nach der theoretischen Einführung wenden wir das Gelernte an einem (relativ kleinen) statistischen Ensemble an. Dieses besteht aus 100 Bohnen, deren Länge und Masse individuell gemessen werden. Da wir mit zwei unterschiedlichen Größen arbeiten, die beide zur selben Population gehören, können wir mit den gelernten Konzepten der Statistik schließen, ob eine Korrelation zwischen den beiden Größen besteht oder nicht. 3
2 Theorie 2.1 Mathematische Grundlagen 2.1.1 Mittelwert Das Ziel der Statistik ist es, Informationen über große (oder sogar unendliche) Mengen von Objekten zu erhalten. Die untersuchte Menge heißt Grundgesamtheit und die damit verbundene Größe wird Zufallsvariable genannt. Zum Beispiel kann man die Durchschnittskörpergröße der Studenten der Uni Regensburg bestimmen: Dazu nimmt man die Menge der Studenten als Grundgesamtheit und die Zufallsvariable ist in diesem Fall die Größe. Leider ist es bei einer Menge von 20186 Studenten (Stand Sommersemester 2014) ein immenser Aufwand, wirklich für alle Studenten die Größe zu bestimmen. Man kann allerdings eine genäherte Durchschnittsgröße ermitteln, indem wir nun als Versuchspersonen 5 Studenten zufällig auswählen und ihre Größe messen. Die Grundgesamtheit N unserer Stichprobe ist somit N = 5. Auf diese Weise könnten wir eine Reihe von Werten wie zum Beispiel diese erhalten: x 1 = 1, 85 m; x 2 = 1, 77 m; x 3 = 1, 81 m; x 4 = 1, 69 m; x 5 = 1, 75 m Aus dieser Stichprobe ermitteln wir nun eine Durchschnittsgröße, genannt (arithmetischer) Mittelwert x: x = 1 N (x 1 + x 2 +... + x N ) = 1 N N x i, (2.1) i=1 In unserer Stichprobe ergibt sich x = 1 N (x 1 + x 2 + x 3 + x 4 + x 5 ) = 1 (1, 85 m + 1, 77 m + 1, 81 m + 1, 69 m + 1, 75 m) 5 = 1, 774 m Es leuchtet ein, dass dieser Wert natürlich recht grob geschätzt ist und - je nach gewählten Versuchspersonen deutliche Schwankungen haben kann und somit auch deutlich von der Durchschnittsgröße eines Studenten der Uni Regensburg abweichen kann, je nachdem ob in der Stichprobe mehr über- oder unterdurchschnittlich große Studenten enthalten sind (siehe auch Versuch Stichprobenproblem ). Diese Abweichungen werden als Standardabweichung bezeichnet. 4
2.1.2 Standardabweichung der Einzelmessung Betrachtet man nun separat die Größe der einzelnen Studenten aus der Stichprobe, haben diese in der Regel nicht exakt die Durchschnittsgröße x, sondern verteilen sich mit einer gewissen Streuung um x. Die Standardabweichung s ist ein Maß für die typische Abweichung der x i -Werte rund um den Mittelwert. s = 1 N (x i x) N 1 2. (2.2) Manchmal benutzt man in der Statistik auch die Größe Varianz s 2, die jedoch einfach das Quadrat von s ist: s 2 = 1 N (x i x) 2. (2.3) N 1 2.1.3 Korrelation und Kovarianz i=1 i=1 Wenn man zwei Grundgesamtheiten (x i und y i ) hat und ihre Korrelation will, benutzt man die sogenannte Kovarianz C xy : berechnen C xy = 1 N 1 N (x i x)(y i ȳ). (2.4) i=1 Diese zwei Grundgesamtheiten können zum Beispiel Körpergröße (x i mit Mittelwert x) und Körpergewicht (y i mit Mittelwert ȳ) der Regensburger Studenten sein. Die Korrelation zwischen den zwei Größen wird durch die Korrelationskoeffizienten r xy dargestellt: r xy = C xy s x s y, (2.5) wobei s x und s y die Standardabweichungen der x i - und y i - Werte sind. Wenn r xy sehr klein ist, sind die zwei Werte nicht korreliert. Wenn r xy 1 ist, sind die zwei Werte perfekt linear korreliert (Abb. 2.1). 2.1.4 Darstellung der statistischen Daten Statistische Daten werden oft mit Hilfe eines Histogramms dargestellt. Wir entscheiden uns für die Gruppierung der möglichen Ergebnisse der Zufallsvariablen (die x i ) in endlichen Intervallen. Dann zeichnen wir einen Graphen, indem wir für jedes Intervall eine Spalte zeichnen, deren Länge proportional zur Anzahl der extrahierten x i ist, die in das angegebene Intervall fallen. Zum Beispiel könnten wir die Körpergröße von 1000 Studenten messen. Ein typisches Ergebnis ist in Abb. 2.2 abgebildet. Hier haben wir willkürlich entschieden, dass jedes Intervall 10 cm breit ist. Wir beobachten, dass 0 Studenten unserer Testgruppe eine Größe zwischen 1,30 und 1,40 m hatten, 2 Studenten zwischen 1,40 und 1,50 m waren, 56 Studenten zwischen 1,50 und 1,60 m und 354 Studenten zwischen 1,60 und 1,70 m, usw. 5
(a) (b) (c) y y y x x x Abbildung 2.1: Korrelation der Werte x i und y i für (a) r xy 0 unkorreliert, (b) 0 < r xy < 1 und (c) r xy = 1 perfekt korreliert. Wenn die Menge N unserer Grundgesamtheit groß genug ist, bildet das Histogramm zuverlässig die Wahrscheinlichkeitsverteilung für die Zufallsvariable ab. Viele Phänomene haben eine Wahrscheinlichkeitsverteilung, die wie eine Glocke aussieht. Eine solche Wahrscheinlichkeitsverteilung wird als Gauß-Verteilung bezeichnet, mathematisch wird sie durch eine Gauß-Funktion dargestellt: G µ,σ (x) = 1 σ (x µ) 2 2π e 2σ 2. (2.6) Die Gauß-Funktion hat zwei Parameter, µ und σ. Der µ-wert stellt den Mittelwert unserer Verteilung dar und σ ihre Standardabweichung. Abb. 2.3 zeigt die so gennante standardisierte Gauß-Funktion, die µ = 0 und σ = 1 hat. Die Interpretation einer Wahrscheinlichkeitsverteilung ist die folgende: die Wahrscheinlichkeit, dass x in das Intervall [x 1, x 2 ] fällt, ist entsprechend der Fläche unter der Kurve (mathematisch betrachtet das Integral x 2 x 1 G µ,σ (x)dx). 2.2 Messungen und Messfehler Messungen können nicht mit unendlicher Genauigkeit ausgeführt werden, jede Messung ist stets mit Fehlern behaftet. Zwei Messungen derselben Größe werden nie auf beliebig vielen Nachkommastellen übereinstimmen. Es ist daher unmöglich, den exakten, wahren Wert (der unbekannt bleibt) zu bestimmen. Die Schwankungen bei wiederholten Messungen werden Messfehler genannt. Es gibt verschiedene Arten von Messfehlern: Systematische Messfehler: sie hängen von dem Messgerät ab und haben immer den gleichen Betrag und Vorzeichen. Zum Beispiel haben wir eine systematische Messabweichung, wenn die Batterie unserer Uhr leer ist und deswegen langsamer läuft oder wenn eine Waage nicht geeicht ist. Bekannte systematische Abweichungen können durch Berichtigung ausgeschlossen werden. 6
Abbildung 2.2: Histogramm über Größe der Studenten. Zufällige Messfehler: sie werden von Fluktuationen des Messgeräts oder der Umgebung verursacht und können nicht durch Berichtigung ausgeschlossen werden. Zum Beispiel werden wir im Lauf des Praktikums die Periode der Schwingung eines Fadenpendels messen. Dafür benutzen wir eine Stoppuhr, die eine Auflösung von 0,01 s hat. Diese Genauigkeit bleibt jedoch unerreicht, da die Fluktuation unserer Reaktionszeit größer als eine solche Auflösung ist. Wie zuvor beschrieben, kann die Verteilung der Messwerte oft durch eine Gauß-Verteilung beschrieben werden. Der Mittelwert ist unser exakter Wert und die Standardabweichung ergibt unseren Messfehler. Wenn wir die gleiche Messung zehn Mal wiederholen, hätten wir eine Folge der Perioden wie zum Beispiel: t 1 t 2 t 3 t 4 t 5 t 6 t 7 t 8 t 9 t 10 1,57 s 1,68 s 1,66 s 1,60 s 1,77 s 1,69 s 1,57 s 1,54 s 1,64 s 1,73 s Die t i sind Zufallswerte: ihr Mittelwert ist 1,645 s und ihre Standardabweichung 7
G(x) s s µ x Abbildung 2.3: Gauß-Funktion für µ = 0 und σ = 1 (die so gennante standardisierte Gauß-Funktion). 0,075 s. Das Ergebnis unserer Messung wird deswegen wie folgt dargestellt 1 t + t = 1, 64 ± 0, 07 s. Maximale Fehler. Die Auflösung eines Messgeräts ist die kleinste Differenz zweier Messwerte, die das Messgerät eindeutig unterscheidet. Oft sind die Fluktuationen kleiner als die Auslösung, z.b. wenn man ein Objekt mit einer Waage mit Auflösung 1 g misst. In diesem Fall kann der Messfehler nicht durch die Standardabweichung (die Null ist, weil alle Messwerte gleich sind) abgeschätzt werden. Man kann nur sagen, in welchem Abstand der richtige Wert zu finden ist. Wenn unsere Waage (maximale Auflösung 0, 1 g) beispielsweise eine Masse von 13,4 g darstellt, können wir nur sagen, dass der richtige Wert irgendwo zwischen 13,3 g und 13,5 g liegt. Deswegen schreiben wir m = 13, 4 ± 0, 1 g, wobei 0,1 g der maximale Fehler ist. Wie bereits in der Einführung erwähnt, sind maximale und zufällige Fehler gewissermaßen komplementär zueinander. Die erste Fehlerart wird durch die Auflösung des Instruments bestimmt, während die zweite von Fluktuationen abhängig ist. Je mehr man das Messinstrument verbessert und seine Auflösung verschmälert (wodurch der maximale Fehler verringert wird), desto wichtiger wird die Rolle der Fluktuationen, was wiederum den zufälligen Fehler vergrößert. 1 Für den Fehler nimmt man nur eine signifikante Stelle. Für den Messwert sollte die letzte signifikante Stelle von der gleichen Größenordnung sein wie die letzte signifikante Stelle des Fehlers. Siehe dazu auch den Absatz Signifikante Stellen und Runden. 8
Absolutfehler und Relativfehler Zufällige Fehler und maximale Fehler sind beide Absolutfehler. Sie stellen das Intervall dar, in dem wir den richtigen Wert erwarten. Die Größe des Intervalls kann von der Auflösung des Geräts (maximaler Fehler) oder von den Fluktuationen (zufälliger Fehler) abhängen. Der Absolutfehler ist eine positive Menge, die mit der gleichen Einheit des gemessenen Wertes angegeben wird. Oft ist es sehr nützlich, den Quotient zwischen Absolutfehler und gemessenem Wert zu kennen. Dieser Quotient heißt Relativfehler ɛ x = x x. (2.7) Der Relativfehler ist eine dimensionslose Zahl, die oft in Prozent angegeben wird. Damit wird ausgedrückt, wie groß der Fehler im Vergleich zum Messwert ist. Signifikante Stellen und Runden Die Genauigkeit einer Messung wird - wie bereits oben erklärt - durch verschiedenste Arten von Messfehlern beschränkt. Bei der Angabe von Zwischen- bzw. Endergebnissen sowie der Messunsicherheiten stellt sich daher stets die Frage, wie genau das erhaltene Ergebnis denn tatsächlich ist, bzw. wie groß die Schwankungen bei einer wiederholten Messung sein dürften. Aus diesem Grund muss stets überlegt werden, wie viele Stellen des erhaltenen Ergebnisses anzugeben sind. Die Anzahl der bestätigten, belastbaren Stellen des Ergebnis werden als signifikant bezeichnet. Überflüssige Stellen müssen aufbzw. abgerundet werden. Das Runden von Zahlenangaben ist durch DIN1333 Zahlenangaben geregelt. Im Rahmen dieses Praktikums werden wir uns auf das Wesentliche beschränken. Aus diesem Grund folgende einfache Faustregeln: Im Pharmazie-Praktikum beschränken wir uns bei dem Fehler auf eine signifikante Stelle (zwei, falls die erste Stelle 1 oder 2 ist). Beispielweise wäre somit 17,10 ± 0,15 eine korrekte Rundung des Messergebnisses, während 191,37 ± 0,79 es nicht wäre. Im zweiten Fall wäre 191,4 ± 0,8 richtig. Die letzte signifikante Stelle des Fehlers bestimmt die des Messergebnisses. Das Messergebnis wird daher nur in so vielen Stellen angegeben, indenen sich der Fehler noch bemerkbar macht. Folgende Beispiele sind richtig dargestellt: 3893,15 ± 0,01, 2070 ± 30 und 15 ± 2. Falsch dagegegen wäre zum Beispiel: 1957,371 ± 0,3 oder 1096 ± 10. Das Ergebnis wird je nach Wert der Folgestelle entweder abgerundet (Wert der Folgestelle kleiner als 5) oder aufgerundet (Wert der Folgestelle 5 oder größer). Beispiele (Rundestelle ist fett gedruckt): 9
Beispiel A Beispiel B Messwert 5,4633 132, 04633 Messfehler 0, 1 0, 04 zu rundender Messwert 5, 4633 ± 0, 1 132, 04633 ± 0, 04 gerundetes Ergebnis 5, 5 ± 0, 1 132, 05 ± 0, 04 2.2.1 Fehlerfortpflanzung 1. Regel: Fehlerfortpflanzung für Summe und Differenz. Wenn y eine Größe ist, die aus der Summe (oder der Differenz) anderer Größen herstammt, ist sein Absolutfehler die Summe der Absolutfehler der Summanden. y = x 1 + x 2 x 3 +... y = x 1 + x 2 + x 3 +... (2.8) Korollar: wenn y = n x, dann y = n x, (2.9) wobei n eine reine Zahl ist, wie z.b. 3, π, 57, 2, e, etc. Hier ein konkretes Anwendungsbeispiel: Wir betrachten ein Dreieck, mit den Seitenlängen a± a = 10, 2±0, 1 cm, b± b = 8, 17±0, 23 cm und c± c = 3, 51±0, 17 cm. Wenn wir jetzt den Umfang dieses Dreiecks berechnen wollen, müssen lediglich alle Seitenlängen addiert werden: Umfang = a + b + c + ( a + b + c ) = 10, 2 + 8, 17 + 3, 51 ± ( 0, 1 + 0, 23 + 0, 17 ) = 21, 88 ± 0, 50 cm Da wir nach den gerade gelernten Regeln, die Anzahl der signifikanten Stellen beachten müssen, runden wir das Ergebnis wie folgt: Umfang = 21, 9 ± 0, 5 2. Regel: Fehlerfortpflanzung für Produkt und Quotient. Wenn y eine Größe ist, die aus dem Produkt (oder dem Quotient) anderer Größen herstammt, ist sein Relativfehler die Summe der Relativfehler der Faktoren. y = p 1p 2 p 3... q 1 q 2 q 3... ɛ y = ɛ p1 + ɛ p2 + ɛ p3 +... + ɛ q1 + ɛ q2 + ɛ q3... (2.10) Korollar: wenn y = x n, dann ɛ y = n ɛ x. 10
3 Versuchsdurchführung Mit einem Messschieber wird jede der einhundert Bohnen zunächst vermessen und anschließend ihr Gewicht bestimmt. Bitte beachten Sie, dass für jede Bohne sowohl Länge als auch ihr zugehöriges Gewicht notiert werden müssen. Es ist also die falsche Vorgehensweise zuerst alle Längen für die einhundert Bohnen zu bestimmen und erst danach die Gewichte für alle zu messen. Um vergleichbare Ergebnisse zu erhalten, müssen außerdem alle Messungen gleich ausgeführt werden. In unserem Fall bedeutet das, dass alle Bohnen der Länge nach oder der Breite nach gemessen werden sollten. Um eine ausreichende Genauigkeit der Messungen zu gewährleisten, werden wir mit Hilfe eines Messschiebers messen. Der Messschieber besteht aus einem festen Messschenkel, dem beweglichen Schieber, einer Messskala und einer sogenannten Nonius-Skala. Wenn man den Messschieber auseinander schiebt, kann man zwischen den beiden sich öffnenden Außenschenkeln den zu messenden Gegenstand legen und den Messschieber wieder zusammenschieben, bis er Kontakt mit dem Gegenstand hat. Nun kann man auf der Hauptskala den Millimeterwert ablesen, indem man kontrolliert, auf welchen Wert die Null der Noniusskala fällt. Um die Mikrometer zu bestimmen, muss man nun noch den Strich der Noniusskala finden, der sich mit einem Strich der Hauptskala deckt. Im Beispiel (Abb. 3.1) ist es der Wert 24,75 mm. Die Messungen werden anschließend direkt in das Programm QTI-Plot eingetragen (eine Kurz-Anleitung über die essentiellen Funktionen finden Sie auf der Praktikums- Website im Abschnitt Downloads). QTI wird in fast jedem Praktikumsversuch verwendet, weshalb es sich lohnt, dass jeder Praktikant einer Gruppe damit arbeitet. QTI ermöglicht eine schnelle Auswertung der Daten und ist im Internet frei 1 erhältlich, kann also auch zu Hause für das Studium genutzt werden. In diesem Versuch werden in die erste Spalte die Nummer der Messung eingetragen und in die zweite Spalte der jeweilige Messwert. Die Auswertungsmöglichkeiten für die verschiedenen Versuchsteile und die weitere Bedienung des Programms werden Ihnen direkt vom Praktikumsbetreuer erklärt. 1 zurzeit über die RZ Website nur für UR Studenten 11
2,4cm + 0,075cm = 2,475cm Abbildung 3.1: Messschieber mit Nonius-Skala Hier liegt der einzige aneinandergereihte Strich (=0,75 mm) Hier liest man die annähernde Länge (2,4 cm, Auflösung 1mm) 3.1 Aufgaben Messen Sie die Länge und das Gewicht von 100 individuellen Bohnen. Bitte beachten Sie, dass für jede Bohne sowohl Länge als auch ihr zugehöriges Gewicht einzeln notiert werden müssen. Zeichnen Sie mithilfe QTI-Plot zwei Histogramme, eins für die Länge l i und eins für das Gewicht m i der vermessenen Bohnen. Bestimmen Sie mithilfe QTI-Plot und der Funktion Spaltenstatistik die Standardabweichung s l und s m für die Messung des Gewichts und der Länge der Bohnen. Bestimmen Sie die Gauß-Kurven, die am besten die zwei Histogramme nähern (siehe QTI-Anleitung). Achten Sie beim Erstellen der Histogramme auf die richtige Intervallgröße. Durch zu große Intervalle wird das Histogramm zu grob, da es zu wenige Intervalle gibt. Zu kleine hingegen machen es zu verrauscht (nicht jedes Intervall enthält eine statistisch ausreichende Zahl von Elementen, wodurch die Werte zwischen benachbarten Spalten stark fluktuieren.) Der Gauß-Fit kann direkt 12
mit QTI-Plot erstellt werden. Zeichnen Sie ein Diagramm l i gegen m i. Wie sieht das Ergebnis aus? Bitte vergessen Sie nicht das Resultat zu kommentieren. Bestimmen Sie den Korrelations-Faktor für das l i gegen m i -Diagramm. Kommentieren Sie bitte das Ergebnis mit Bezug auf den vorherigen Punkt. 13