Instrumentelles Konditionieren

Ähnliche Dokumente
Instrumentelles Konditionieren I

Instrumentelles Konditionieren

Operantes Konditionieren

Lernen: Klassische Konditionierung II Operante Konditionierung I

Lernen und Gedächtnis

4. Operante Konditionierung

Tutorium VII Lernen Operantes Konditionieren. Friederike Rüffer Anna Lara Paeske Lisa Knake

Tutor: Liz Leutner. Termin: LERNTHEORIEN. Tutorium Persönlichkeitspsychologie I

Lernen: Themen der Vorlesung

Entwicklungspsychologie für Lehrer. Lernprozesse in der Entwicklung

Operantes Konditionieren - Instrumentelles Lernen

Lerntheoretische und kognitive Modelle

Definition Lernen VORLESUNG ZUR EINFÜHRUNG IN DIE PSYCHOLOGIE 1. Lernen. Wurde da gelernt? Jemand...

4. Operante Konditionierung

Lernen: Themen der Vorlesung

Zusammenfassung: Behavioristische Lerntheorien

Lernen: Behaviorismus - Klassische und operante. Konditionierung

Lernen: Themen der Vorlesung

Abb. 38: Aktivierung durch Erotik. 2.7 Reiz-Reaktions-Lernen in verschiedenen Bereichen 49

Experimentelle Untersuchung der klassischen Konditionierung

Klassisches Konditionieren

1. Die Anfänge der operanten Konditionierung. 5. Biologische Einschränkungen der operanten

Tutorium VII Lernen Modell-Lernen

Instrumentelles Konditionieren II

Instrumentelles Konditionieren II

Tutorium V Lernen Klassisches Konditionieren

Einführung in die Allgemeine Psychologie

Operantes Konditionieren

Eigene MC-Fragen Behaviorismus

Lernen: Klassische Konditionierung I

Grenzen zwischen Reflexen und Operanten = oft fließend

Klassische Konditionierung Iwan P. Pawlow ( ) Psychologie des Lernens. Iwan P. Pawlow. Iwan P. Pawlow - Literatur

Inhaltsverzeichnis. Vorwort 12. Was ist Lernen? 16

Behavioristisch: Verhaltens Kognitionswissenschaftlich: von mentalen Repräsentationen und Assoziationen im Geist Neurobiologisch:

Allgemeine Psychologie: Lernen. Sommersemester Thomas Schmidt

Management sozialer Prozesse

Basale Funktionen in Lehr-Lernprozessen Gedächtnis Lernen - Definition Behaviorismus Modelllernen

1. Pawlows Entdeckung und ihre Bedeutung

Verschiedene Facetten des positiven Coachings. Ognjen Zaric / Tobias Trautz

Ihr Name. Lernen. Reaktion Response. Reiz Stimulus. Veranstaltung Datum Ort. Name des Präsentators Firma

Seminar: Klassische Experimente der Psychologie Dozent: Prof. Dr. Michael Niedeggen Referentin: Teresa Gross

Ergänzungsfach Sport Pete Moor Gymnasium Biel-Seeland Wahrnehmen-Entscheiden-Handeln 1. Lernen im Sport

Lehrstuhl für Wirtschaftspädagogik und Wirtschaftsdidaktik. Pädagogische Psychologie

Klassisches Konditionieren II: Rest

Behaviorismus & Neobeahviorismus

Klassisches Konditionieren II

Was ist Lernen? Was ist Lernen? 10/7/2008. Behavioristische Lernforschung. Klassisches Konditionieren (Pavlov) Klassisches Konditionieren (Pavlov)

Inhalt. 1. Kapitel: Lernen und Lehren 1

3. Klassische Konditionierung

Kritik an den behavioristischen Lerntheorien. Kritik an den behavioristischen Lerntheorien. Kritik an den behavioristischen Lerntheorien

Theorien der Klassischen Konditionierung

Operante Konditionierung

Allgemeine und Biopsychologie Fakultät für Human- und Sozialwissenschaften

Fünfte Vorlesung Zur Psychologie des Lernens II: Thorndike, Hull und Skinner

Vorlesung im SS 2004 von Prof. Dr. Sabine Walper

Kapitel 3 Angeborene Verhaltensmuster und Habituation 71

1.1 Lernen: Definition, Abgrenzung Was ist Lernen? Lernen und seine Abgrenzung von anderen Konstrukten...

Klassische Konditionierung

Verhaltensmedizin bei der Katze

Allgemeine Psychologie

Ein Wort zuvor 8. Lernverhalten 11

Das Häufigkeitsprinzip (Thomas Brown 1820) 1. Grundlegendes zum assoziativen Lernen

der Psychologie: Allgemeine Psychologie basierend auf Folien und einem Skript von Prof. Dietrich Albert und Prof.

Lernen: 3 Vorlesungen I. Klassische Konditionierung I: Basisphänomene, Grenzen, Interpretation

Allgemeine Psychologie 2

Beispielbild. Lernen & Gedächtnis. Operante Konditionierung: Verstärkung. WiSe 2009

Psychologie des Lernens

Allgemeine/Biologische Psychologie

Über die Entwicklung des Hundes und warum es nicht so einfach ist

Psychologie. Das Prüfungstraining zum Zimbardo. Deutsche Bearbeitung von Ralf Graf

A u f g e h t s... Clickertrainingseminar

Vermeidung, Bestrafung, Erlernte Hilflosigkeit. Gliederung. Gliederung. 1.Vermeidung. 1. Vermeidung. Erlernte Hilflosigkeit. 1.

Verhaltenstherapapie im Kindes- und Jugendalter Grundlagen der Kinderverhaltenstherapie: Verstärkungslernen und Verhaltensanalyse Prof. Dr.

Beispielbild. Lernen & Gedächtnis. Einführung. SoSe 2007

B E L E G A R B E I T

Chomskys Antwort auf Skinner

James E. Mazur. 6., aktualisierte Auflage

Lerntheorien im Überblick

Lehrstuhl für Wirtschaftspädagogik und Wirtschaftsdidaktik. Pädagogische Psychologie

Viviane Theby. Verstärker verstehen. Über den Einsatz von Belohnung im Hundetraining

Verstärkungspläne. Verstärkungspläne. Verstärkungspläne. Verstärkungspläne. Seminar Lernen und Gedächtnis

Beispielbild. Lernen & Gedächtnis. Theorien der Klassischen Konditionierung. SoSe 2007

David G. Myers. Psychologie

w w w. a c a d e m y o f s p o r t s. d e w w w. c a m p u s. a c a d e m y o f s p o r t s. d e Pädagogik L E SEPROBE

Kognitive Lerntheorien

G. R. Lefran^ois. o]0. 4., überarbeitete und erweiterte Auflage Mit 102 Abbildungen und 23 Tabellen. fyj Springer

2 Freuds psychoanalytische Theorie der Motivation 27

1. Welchen Teil des Gedächtnisses hat Sperling mit seinen Experimenten zu Teil- und Vollbericht untersucht?

Forschungsansätze und Paradigmen Beschreibungsebenen

Eine biologische Definition des Begriffs Lernen

Psychologie 21., aktualisierte und erweiterte Auflage Richard J. Gerrig Tobias Dörfler, Jeanette Roos (Hrsg.) Aus dem Amerikanischen von Andreas Klatt

Beispielbild. Lernen & Gedächtnis. Operante Konditionierung: Faktoren der Verstärkung Anwendung der Verstärkung. SoSe 2007

Herzlich Willkommen an der Universität Mannheim!

Montag, um h. im Institut für Anatomie und Zellbiologie Prof Dr. Frank Schmitz Gebäude 61 UKS Homburg

Lernen und Kognition

Bis Hochladen der Vorstellungsvideo Lesen des Studienbegleithefts

Transkript:

Professur für Allgemeine Psychologie Vorlesung im WS 2011/12 Lernen und Gedächtnis Instrumentelles Konditionieren Prof. Dr. Thomas Goschke

Literatur Mazur, J.E. (2006). Lernen und Verhalten. München: Pearson Studium. Kapitel 6-8. Gluck, M.A., Mercado, E. & Myers, C.E. (2008). Learning and memory. From brain to behavior. New York: Worth Publ. Kapitel 8+9.

Überblick Thorndikes Gesetz des Effekts Skinners Forschung zum operanten Konditionieren Shaping und Verhaltenssequenzen Was wird beim O.K. gelernt? Arten von Verstärkern Verstärkungspläne Generalisierung und Diskrimination Abbau unerwünschter Verhaltensweisen und Bestrafung Flucht- und Vermeidungstraining Anwendungsbeispiele klassischer Lerntheorien

Instrumentelles (operantes) Konditionieren Lernen des Zusammenhang zwischen einer Reaktion (R) in einer bestimmten Situation (S) und den Konsequenzen (C), zu denen die Reaktion führt. Diese Konsequenzen können positiver oder negativer Natur sein (Verstärkung, Bestrafung) S R C(+) S R C(-) Operant: Lebewesen bewirkt durch seine Operationen eine bestimmte Konsequenz Instrumentell: Verhalten ist instrumentell für die Erreichung bestimmter Konsequenzen

Edward Lee Thorndike (1874-1949) Puzzlebox Eingesperrte Katze zeigt diverse Reaktionen (Miauen, Kratzen am Gitter, Fauchen etc.) Irgendwann betätigt Katze zufällig den Mechanismus, der die Tür öffnet Wird Katze wiederholt in Käfig gesetzt, löst sie Mechanismus zunehmend schneller aus

Lernen am Erfolg: Gewohnheitshierarchien und das Gesetz des Effekts Aus einer Menge zunächst zufälliger Handlungen werden solche mit höherer Wahrscheinlichkeit wiederholt, die zu positiven Konsequenzen führen Ein befriedigender Zustand bedeutet, dass das Tier nichts tut, um ihn zu vermeiden, sondern vielmehr versucht, ihn herbeizuführen und zu erhalten. Ein frustrierender oder unangenehmer Zustand wird normalerweise vermieden und rasch aufgegeben (Thorndike, 1898, S. 245). Durch Belohnung oder Bestrafung werden Reiz-Reaktions-Assoziationen selektiv verstärkt oder abgeschwächt

Analogie zwischen dem Gesetz des Effekts und Darwins Prinzip der natürlichen Selektion Variation: Lernen am Erfolg Produktion von Reaktionen nach Versuch und Irrtum Natürliche Selektion Variation: Variation von Merkmalen der Individuen einer Art Selektion: Reaktionen, die zu Belohnung führen, werden verstärkt Reaktionen, die zu Bestrafung führen, werden gelöscht Selektion: Individuen mit adaptiven Merkmalen reproduzieren sich häufiger Individuen mit weniger adaptiven Merkmalen reproduzieren sich seltener

Das Verhalten einer Katze im Problemkäfig von Guthrie und Horton (1946) Im Problemkäfig führte jede Bewegung des vertikalen Stabes zur Öffnung der Tür Abb. zeigt zwei verschiedene Katzen in den ersten 24 Durchgängen im Moment der Verstärkung James E. Mazur, Lernen und Gedächtnis, Pearson Studium Verlag 2004.

Skinners Forschung zum operanten Konditionieren

Burrhus Frederic Skinner (1904-1990): Operantes Konditionieren Einer der bekanntesten Psychologen des 20. Jh. 1931: Ph.D. Harvard Ab 1948 Professor für Psychologie in Harvard zahlreiche Publikationen; mehrere Bücher; große Zahl von Doktoranden; Beeinflusst durch Pavlov, Watson, Thorndike Durch ihn wurde das operante Konditionieren einer breiteren Öffentlichkeit bekannt Entdeckte viele grundlegende Lernprinzipien Strenger Behaviorist: Ablehnung mentalistischer Begriffe in der Psychologie (heftige Attacken auf die Kognitive Psychologie) Deterministisches Weltbild: Alles Verhalten ist Ergebnis unserer Gene und Lernerfahrungen Politische Schriften und alternative Gesellschaftsentwürfe auf der Basis von Konditionierungsprinzipien (Walden II)

Einige Zitate von Skinner All we need to know in order to describe and explain behavior is this: actions followed by good outcomes are likely to recur, and actions followed by bad outcomes are less likely to recur. (Skinner, 1953) Does a poet create, originate, initiate the thing called a poem, or is his behavior merely the product of his genetic and environmental histories? The major problems of the world today can be solved only if we improve our understanding of human behavior. (About Behaviorism, 1974) "We shall not solve the problems of alcoholism and juvenile delinquency by increasing a sense of responsibility. It is the environment which is 'responsible' for the objectionable behavior, and it is the environment, not some attribute of the individual, which must be changed.

Burrhus Frederic Skinner (1904-1990): Operantes Konditionieren Skinner-Box Ratte kann Hebel drücken bzw. Taube kann auf Scheibe picken (R) Verhalten (Hebeldruck) löst bestimmte Konsequenzen aus (Futter, Wasser, Elektroschock) Hinweisreize (Licht, Ton) können dargeboten werden (S) Verhaltenshäufigkeit (Reaktionsrate) wird aufgezeichnet

Phasen einer operanten Konditionierung Bestimmung der Basisrate (Grundrate): Wie oft tritt das zu konditionierende Verhalten ohne Verstärkung spontan auf? Verstärkung des Verhaltens in der Trainingsphase: Das zu konditionierende Verhalten wird verstärkt. Die Häufigkeit des Verhaltens nimmt zu. Löschung (Extinktion) des Verhaltens: Das Verhalten wird nicht weiter verstärkt. Häufigkeit des Verhaltens nimmt ab. Spontanerholung: Abgeschwächte Reaktion tritt nach einiger Zeit ohne Verstärkung erneut auf

Dreifachkontingenz S R C S: Situation / Kontext / diskriminative Hinweisreize R: Reaktion C: Konsequenzen, die auf die Reaktion folgen (z.b. Verstärker) Dreifachkontingenz In Anwesenheit eines diskriminativen Hinweisreizes tritt ein Verstärker nur dann auf, wenn eine bestimmte Reaktion ausgeführt wird Diskriminationslernen Licht an + Hebeldruck Futter Licht aus + Hebeldruck kein Futter Stimuluskontrolle: Stimuli, die Verhalten vorausgehen, kontrollieren Auftreten des Verhaltens

Beispiele Eine Ratte lernt, dass ein Hebeldruck (R) in einem bestimmten Käfig (S) regelmäßig zu Futter (C+) führt. Eine Katze lernt, dass ein Hebeldruck (R) in einem Käfig (S) dazu führt, dass sich die Tür öffnet (C+). Ein Kind lernt, dass es durch Schreien (R) im Bett (S) die Aufmerksamkeit der Mutter (C+) erweckt. Ein Schüler gibt auf eine Frage (S) die richtige Antwort (R) und wird gelobt (C+)

Vergleich klassisches vs. operantes Konditionieren Klassisches Konditionieren: Respondentes Verhalten: Ereignisse werden nicht durch die eigenes Verhalten beeinflusst, sondern Verhalten ist Reaktion auf Reize (US-UR bzw. CS-CR) Lernen von regelhaften Beziehungen zwischen Reizen (CS US). Operantes Konditionieren: Operantes Verhalten: Verhalten bewirkt bestimmte Konsequenzen Lernen der Konsequenzen, die das eigene Verhalten unter bestimmten Stimulusbedingungen hat (S - R C). O.K. ist Grundlage für zielgerichtetes Verhalten (= Verhalten, dass durch antizipierte Konsequenzen gesteuert wird)

Grundlegende Phänomene Viele Prinzipien des klassisches Konditionierens gelten auch für das operante Konditionieren Graduelle Akquisition Effekte der Anzahl von Lerndurchgängen Extinktion Spontanerholung Rolle der zeitlichen Kontiguität Rolle der Kontingenz Blocking Generalisierung und Diskrimination

Shaping und Verhaltensketten

Stufenweise Annäherung (Shaping) Durch Verstärkung kann eine große Bandbreite unterschiedlicher Verhaltensweisen erzeugt werden Shaping: ermöglicht es, Verhaltensweisen anzutrainieren, die nicht zum normalen Verhaltensrepertoire eines Lebewesen gehören Methode: 1. Abwarten, bis das Lebwesen ein Verhalten zeigt, das in die gewünschte Richtung oder einen Teil des gewünschten Verhaltens beinhaltet Verstärkung 2. Bewegung tritt häufiger auf 3. Nur noch Verhalten verstärken, das dem Gewünschten etwas näher kommt 4. Verhalten zunehmend selektiver verstärken, bis exakt das gewünschte Verhalten gezeigt wird Anwendung Tierdressur: Verkettung (chaining) von ganzen Verhaltenssequenzen Erwerb komplexer Verhaltensmuster in der Verhaltenstherapie

Ein Beispiel für Shaping

Verhaltensketten (chaining) Training von Verhaltenssequenzen durch Verkettung (chaining) Jeder Stimulus dient als konditionierter Verstärker für das vorangehende Verhalten und als diskriminativer Hinweisreiz für den folgenden Verhaltensschritt Stimuli Reaktionen Leiter (S D ) Hochklettern Platform, Seil (S R, S D ) am Seil ziehen Tür öffnen (S R, S D ) durch den Tunnel Rennen Rutsche (S R, S D ) Rutsche heruntergleiten Anblick des Hebels (S R, S D ) zum Hebel rennen Hebel in Reichweite (S R, S D ) Hebel drücken Futterpellet (S R )

Was wird beim operanten Konditionieren gelernt?

Wird ein spezifisches Bewegungsmuster gelernt? Viele Experimente zeigen, dass beim OK nicht spezifische Bewegungsmuster gelernt werden Lashley (1924): Ratten mussten durch Labyrinth mit niedrigem Wasser waten, um Futter zu erhalten Nach erfolgreichem Lernen wurde Wasserspiegel angeboten, so dass Ratten schwimmen mussten Obwohl völlig anderes Bewegungsmuster fehlerfreies Durchschwimmen des Labyrinth beim 1. Durchgang

Was wird beim instrumentellen Konditionieren gelernt? S-R-Assoziationen? Thorndike: Verstärker (C+) prägt Assoziation ein, ist aber nicht selbst Bestandteil der Assoziation R-C-Assoziationen? S-R-C-Assoziationen?

Evidenz für R-C-Lernen Colwill & Rescorla (1986): Verstärker-Entwertungs-Paradigma S R C Phase 1 Stimulus Reaktion A Reaktion B Futter Zuckerlösung Phase 2 Futter Lithiumchlorid (Übelkeit) Phase 3 Stimulus Reaktion A Reaktion B Spricht dafür, dass die Tier Assoziation zwischen Reaktion und Verstärker lernen

Evidenz für S-R-C-Lernen Hat Tier nur R-C-Assoziation (oder S-R-C-Assoziation) gelernt? Experiment von Colwill & Delamater (1995) Phase 1 Ton Reaktion X Futter Licht Reaktion X Zuckerlösung Phase 2 Sättigung mit Zucker Phase 3 Ton Reaktion X Licht Reaktion X Spricht für Lernen der S-R-C-Assoziation

Verstärker

Verstärkung und Verhaltenskontrolle Skinner: Wie kann Verhalten durch Umweltreize kontrolliert werden? Methode: Messung der Reaktionsrate von Versuchstieren in der Skinner-Box in Abhängigkeit von den Konsequenzen des Verhaltens U.V.: Art des Verstärkers und Verstärkungspläne Was aber ist ein Verstärker? Operationale Definition: Verstärker = jeder Reiz, der die Auftretenswahrscheinlichkeit eines Verhaltens erhöht

Arten von Verstärkern Verhaltenskonsequenz Reiz folgt auf die Reaktion Angenehm Positive Verstärkung (Belohnung) Unangenehm Bestrafung 1. Art Reaktion eliminiert oder vermeidet Reiz Bestrafung 2. Art (Omission training) Negative Verstärkung (Flucht / Vermeidung) Reiz (Verhaltenskonsequenz) Reiz folgt auf die Reaktion Reaktion eliminiert oder vermeidet Reiz Angenehm Futter, Lob, Geld Futter, Lob, Geld wird entzogen Unangenehm Schmerz, Tadel Schmerz, Tadel hört auf (Die Pfeile geben an, ob die Reaktionsrate zu- oder abnimmt)

Zimbardo, 2004)

Primäre und sekundäre Verstärker Primäre Verstärker Wirken ohne vorherige Lernerfahrung verstärkend (z.b. Futter, Schmerz) Sekundäre (generalisierte) Verstärker Zunächst neutrale Reize, die durch Paarung mit primären Verstärkern selbst zu Verstärkern werden (z.b. Geld) ( vgl. Klassisches Konditionieren höherer Ordnung: Zunächst neutraler CS erhält Qualitäten eines US)

Verstärkungspläne

Verstärkungspläne Skinner untersuchte Bedingungen, unter denen neues Verhalten gelernt und wieder verlernt wird (Erwerb bzw. Löschung) (Ferster & Skinner, 1957). Verstärkungspläne: legen fest, wie häufig bzw. nach welchen Zeitintervallen Verstärker gegeben werden

Verstärkungspläne

Verstärkungspläne Verstärkungspläne Kontinuierlich jede gewünschte Reaktion wird verstärkt Intermittierend Nur einige Reaktionen werden verstärkt Quotenplan Bestimmte Anzahl von Reaktion wird verstärkt Intervallplan Nach einem bestimmten Zeitintervall wird verstärkt Konstant z.b. genau jede 5. Reaktion wird verstärkt Variabel z.b. im Durchschnitt wird 1/5 der Reaktionen verstärkt Konstant z.b. die erste Reaktion, die nach Ablauf von 5 Minuten erfolgt, wird verstärkt Variabel z.b. eine Reaktion wird im Durchschnitt nach 5 Minuten verstärkt

Gerät für kumulative Verhaltensaufzeichnungen Verlangsamung Beschleunigung schnelle Reaktionen keine Reaktionen Verstärker langsame Reaktionen Papier bewegt sich langsam in diese Richtung

Ein Beispiel: Lerngewohnheiten von College- Studenten Mawhinney et al. (1971): durchschnittliche Zahl von Lernminuten pro Tag (a) tägliche Tests (b) größere Prüfung am Ende einer der Drei-Wochen-Phasen 180 Täglich 3 Wochen Täglich 3 Wochen 120 60 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 Sitzungen

Auswirkungen von Verstärkungsplänen auf die Löschung Kontinuierliche Verstärkung: Verhalten wird schnell erworben, wird aber auch schnell wieder gelöscht, wenn Verstärker ausbleibt Intermittierende Verstärkung viele höhere Löschungsresistenz Bsp.: Bettelnder Hund am Tisch, der bei jedem 10. Versuch ein Stück Wurst bekommt Bsp.: Getränkeautomat vs. Spielautomat Erklärung: Generalisierungsabnahme Kontinuierliche Verstärkung: Lebewesen hat nie Durchgänge ohne Verstärkung erlebt Lern- und Löschphase sind sehr verschieden Intermittierende Verstärkung: In Lernphase gibt es viele Durchgänge ohne Verstärker Lern- und Löschphase sind ähnlich Kognitive Erklärung: Lebewesen lernt, dass u. U. viele Reaktionen zur Erlangung des Verstärkers notwendig sind und bildet entsprechende Erwartungen aus

Auswirkungen von Verstärkungsplänen Variable Pläne relativ konstante Reaktionsrate Fixe Pläne variable Reaktionsrate Reaktionsrate in Quotenplänen > Reaktionsrate in Intervallplänen