オペラント 行動。 「オペラント条件付け」の日常例を活用!夢を叶えるためにやる気を出す方法

【図解】オペラント条件付けとは|日常生活の事例・活用方法にスキナーの実験を解説

オペラント 行動

オペラント条件づけとは オペラント条件づけとは、特定の刺激下で、弁別刺激、反応 オペラント行動 、強化刺激を随伴 三項随伴性 させることによって、反応の頻度を変容させる学習です。 「特定の状況下で、動物が自発的または道具を使って行った行動に対して、報酬または罰を与えることにより、その行動を起こす頻度を変える手続き」と言い換えることもできます。 英語では「operant conditioning」と表記され、日本語では「オペラント条件づけ」、「道具的条件づけ」、「オペラント学習」と呼ばれています。 また、オペラント条件づけの体系的な研究を行ったアメリカ合衆国の心理学者スキナー,B.F.の名前にちなんでスキナー型条件づけと呼ばれることもあります。 オペラント条件づけは、人の能動的かつ意図的な反応の増大や低減を目的として行われる条件づけで、行動主義心理学の基本的な理論です。 動物の多様な能動的行動がその対象となり、日常生活の様々な場面で偶発的に生じていますし、子どものしつけなどにも活用されてきました。 MEMO オペラント operant :操作するという意味のオペレート operate を語源とするスキナーの造語 行動主義心理学とは 行動主義心理学とは、心という目に見えないものを客観的に捉えるため、観察可能な「行動」を研究対象とする心理学です。 行動心理学では、「環境からの働きかけを受けて行動が変容すること」が発達であり、「学習」とほぼ同じ意味とされています。 オペラント条件づけの歴史 オペラント条件づけの実験は、アメリカ合衆国の心理学者ソーンダイク,E.によって開始され、スキナーが体系的な研究を行いました。 ソーンダイクの研究 ソーンダイクは、動物の自発的な行動が経験を通してどのように変容するかについて、以下の手順で実験を行いました。 問題箱 ペダルを押すとドアが開く仕掛けのある箱 の中に空腹の猫を入れ、箱の外に食べ物を置く• 猫がペダルを踏んで箱の外に出て餌を食べるまでの過程を記録する 猫は、最初のうちは箱の中を闇雲に動き回っていましたが、偶然ペダルを踏んで外へ出て餌を食べる経験をした後、回数を重ねるにつれて、箱に入れられてから脱出するまでの時間が短くなりました。 ソーンダイクは、この実験結果から、猫が箱の中を動き回るうちに偶発的に適切な反応 ペダルを踏むこと が行われ、その反応と刺激 箱の内部の光景 の結びつきが強まることで脱出に要する時間が短縮されたと考えました。 また、刺激と反応の結びつきについて、「満足 不快 を伴う反応は、その他の条件が同じ場合、反応が起こった場面 刺激 とより強固に結合する 結合が弱くなる。 また、満足や不快の程度により結合の度合いは強固または軟弱になる。 」という効果の法則を提唱しました。 その後、効果の法則は「正の強化」、満足は「正の強化子」、不快は「負の強化子」と名前を変え、現在まで重要な概念として使用されています。 スキナーの研究 スキナーは、行動を「反射による行動 レスポンデント 」と「自発的な行動 オペラント 」に分類し、パブロフの犬で有名な条件反射を古典的条件づけ レスポンデント条件づけ 、ソーンダイクの効果の法則に基づく強化をオペラント条件づけ 道具的条件づけ と定義しました。 また、スキナー箱という実験装置を使って強化と行動の関係を研究しました。 スキナー箱に空腹のネズミを入れ、ブザーが鳴ったときにレバーを押すと餌が貰えるようにしておく• ネズミがブザーを押して餌を食べる間隔を記録する 実験では、ネズミは、スキナー箱の中で過ごすうちにブザーが鳴ったときにレバーを押すと餌が出てくることを学習し、ブザーが鳴ったときにレバーを押す頻度が高くなり、ブザーが鳴ってからレバーを押すまでの時間が短くなるという結果が得られました。 レスポンデント条件付け(古典的条件づけ)については、「」で詳しく解説しています。 オペラント条件づけの用語 オペラント条件づけを説明する用語には意味が分かりにくいものが多いため、関連する用語を確認しておきます。 獲得 オペラント条件づけでは、反応 オペラント行動 に対して強化刺激 正の強化子 を与えることで、反応の頻度が増加していきます。 消去 オペラント条件づけを行った後、反応を起こさせた後で強化刺激 正の強化子 を呈示しないでいると、反応が徐々に弱まって最終的には消失します。 自発的回復 自発的回復とは、オペラント条件づけの消去により反応が消失させてからスキナー箱などの刺激下に置くと、再び反応が起こる現象です。 般化 般化とは、類似の刺激に対しても同様の反応が起こる 類似刺激に条件づけが転移する 現象です。 弁別 弁別とは、類似の刺激を受けても元の刺激と区別し、反応が起こらない現象です。 反応連鎖 反応連鎖とは、一連の反応が連鎖して起こる現象です。 例えば、スキナー箱の実験におけるネズミのレバーを押す行動は、レバーに触れて押し下げるなど複数の反応が連鎖した結果です。 オペラント条件づけでは、訓練を重ねることで個別の反応を意図的に連鎖させることもできると考えられています。 行動随伴性 オペラント条件づけの4パターン と日常例 オペラント条件づけは、反応 オペラント行動 後に刺激が与えられるか消失するか、刺激が与えられたかまたは消失した結果、反応の頻度が増加したか減少したかによって、4つのパターンに分類されます。 反応が増加 反応が減少 強化刺激が与えられる 正の強化 正の弱化 罰 強化刺激が消失する 負の強化 負の弱化 罰 正の強化の例 正の強化とは、反応 オペラント行動 後に好子 快刺激 が得られ、その反応の自発頻度が増加することです。 例えば、子どもが食事時に食器を運ぶお手伝いをしたら、親から褒められて好きなおかずを一品多めにもらえた場合、親の対応が正の強化となり、子どもはより一層お手伝いをするようになります。 負の強化 負の強化とは、反応後に嫌子 深い刺激 が消失し、その反応の自発頻度が増加することです。 負の強化には逃避と回避の2つがあります。 逃避 不快刺激にさらされた状態で反応することにより、不快刺激から逃れようとする 回避 反応しないと不快刺激が与えられる場合に、反応して不快刺激を避けようとする 例えば、日常的に親から早く宿題を終わらせるよう叱責されている子どもが、親の叱責を避けるために自ら宿題をするようになる場合や、宿題をしないと親から叱責されるので、叱責される前に宿題を終えてしまう場合が考えられます。 正の弱化 罰 正の弱化 罰 とは、反応後に不快刺激が与えられることにより、反応の自発頻度が減少することです。 刺激が与えられることで反応の自発頻度が増加する正の強化と対比して、正の弱化と呼ばれます。 例えば、つまみ食いをして親から叱責された後、子どものつまみ食いをする頻度が下がった場合などです。 負の弱化 罰 負の弱化 罰 とは、反応後に快刺激が消失することにより、反応の自発頻度が減少することです。 刺激が与えられることで反応の自発頻度が減少する正の弱化と対比して、負の弱化と呼ばれます。 例えば、買ってあるお菓子を全部食べて親から数日間のおやつ抜きを宣告された後、たくさんお菓子があっても少しずつ食べるようになった場合などが考えられます。 強化スケジュール 強化スケジュールとは、反応 オペラント行動 に対してどのような頻度で強化刺激を与えるかを示すものです。 スキナーは、異なる強化スケジュールが反応に対してどのような影響を及ぼすかについて研究し、以下のとおり分類しました。 問5 オペラント行動の研究の基礎を築いたのは誰か。 正しいものを1つ選べ。 Watson 引用:第1回公認心理師試験 問7 条件づけについて、正しいものを1つ選べ。 引用:第1回公認心理師試験 公認心理師試験については、「」で詳しく解説しています。 まとめ.

次の

オペラント行動:心理学基礎用語集

オペラント 行動

オペラント条件づけとは,個体が自発emitした反応(行動をなんらかの装置により計測したもの)にある事象を随伴させることにより,その反応が変化することをいう。 instrumental conditioningともいう。 オペラント条件づけの対象となるのは,個体の随意的な行動(オペラント行動operant behavior)である。 なお,共通の結果をもたらす反応は,すべて同一の反応クラスに属しており,このような反応クラスをオペラントoperantという。 このようなオペラント条件づけが,パブロフPavlov,I. の発見した(不随意的な行動の変容過程)とは異なる学習の過程であることを,スキナーSkinner,B. が指摘したのは1930年代のことであった。 スキナーは,新しい条件づけをパブロフの見いだした条件づけ()と区別するために,それぞれの条件づけの特徴を表わす名称として「オペラント条件づけ」と「レスポンデント条件づけ」と命名したのである。 これらの名称は,個体が自発的・能動的に環境に働きかけるという特徴(随意的行動,行為)と,刺激に対する受動的な応答という特徴(不随意的行動,反射)をそれぞれ表わすために作られた造語である。 このように二つの条件づけは,それぞれ「行為の原理」と「反射の原理」とよぶことができる。 しかし,スキナーによるオペラント条件づけの定式化以前にその先駆的研究がソーンダイクThorndike,E. により行なわれていたのである。 【ソーンダイクの先駆的研究】 ヒトや動物の行為がどのように形成・維持されるかという問いへの回答を最初に試みたのは,ソーンダイクであった。 彼は,1898年に,ネコやイヌ,あるいはヒヨコを被験体とした実験の結果をまとめた学位論文「動物の知能:動物における連合過程の実験的研究」を公刊したが,これは,「ソーンダイクの問題箱puzzle box」としてよく知られた実験装置を用いた研究であった。 この時代,アメリカのどの大学にも,動物実験施設はなく,ソーンダイクが実験を行なったのは,ハーバード大学のジェームズJames,W. 教授家の地下室であった(アメリカの大学で動物実験室が設けられるのは1898年以降である)。 この装置には,いくつかの仕掛けが設けられており,それらを一定の順番で外すことで,最終的に問題箱の扉が開くことになっていた。 空腹のネコを問題箱に入れ,扉の前に餌皿を置いておくと,ネコは箱から出ようとして,最初はでたらめに動き回るが,偶然仕掛けが外れて,箱の外に出られることも起こる。 餌を食べたら,再び問題箱に入れ,外に出るまでの時間を測定する。 これを繰り返していくと,やがてネコは,順番に仕掛けを外して外に出られるようになり,学習が成立する。 図1の問題箱では,ネコが外へ出るには,ペダルを踏む反応,ヒモを引く反応,バーを上または下に押すという反応を行なわなければならなかった。 最初,反応はでたらめに生じるが,やがて規則的かつ迅速に起きるようになる。 この過程が学習であり,縦軸に問題箱から出るまでに要した時間(所要時間),横軸に訓練試行数を取り,示したものが図1の学習曲線learning curveである。 訓練試行とともに,問題箱から出るまでの所要時間が短くなっていくことがわかる。 ソーンダイクは,このような形で初めて学習曲線を示したが,同時に学習曲線の全体的なパターン,すなわち変化の仕方(オペラント条件づけに用いられる反応率,すなわち単位時間当たりの反応数の変化)にも関心を示していた。 また,実験に先立ってネコを空腹にさせるという操作(動機づけ)を行なっていたことも,後のオペラント条件づけ研究における「動因操作」の先駆的な操作といえる。 ソーンダイクの扱った問題箱におけるネコの学習は,モーガンMorgan,C. によって試行錯誤学習trial-and-error learningと名づけられた。 この場面では,行動が試行という単位に区切られ,試行と試行の間には,個体は行動を自発することができない。 このような実験場面を試行反応場面とよぶ。 ソーンダイクは,後年,このような学習を効果の法則law of effectとよばれる行動の原理によって説明した。 効果の法則とは,「個体にとって満足がもたらされるような反応は,他の条件が等しいならば,その事態により強く結合する。 したがって,再び動物がその事態におかれたならば,そのような反応は再び生じやすくなる」というもので,事態と反応の結合(連合)が反応の結果により強められることを意味している。 これは,オペラント条件づけにおけるの原理を別のことばで表現したものといえる。 しかし,このことが正しく認識されるには,スキナーによるオペラント条件づけの体系化まで,さらに4半世紀ほど待たなければならなかった。 【スキナーによるオペラント条件づけの体系化】 スキナーは,『アメリカン・サイコロジストAmerican Psychologist』誌(1956)に,自己のオペラント条件づけ体系化の研究史を非常に興味深いエピソードを交じえて紹介しているので,この論文は,オペラント条件づけの研究史を理解するのに重要である。 スキナーの研究の出発点は,条件反射の枠組みからの驚愕反射の研究であった。 そのときの装置は,図2のaに示されている直線走路であった。 この装置では,ラットが目標点に到達して餌を食べた後,実験者が再び出発点に戻さなければならなかった。 そこで彼は,実験者が戻さなくてもすむように,図2のbの帰還式直線走路を考案した。 この装置では,ラットはBの直線送路を走り,C点の餌を食べる。 食べ終わると,Aの帰還用走路を通り,再び直線走路を走ることになる。 このとき,餌を食べた後のラットの行動に一定の規則性のあることを見いだしたことが,オペラント条件づけへの着想のきっかけとなったのである。 このように,帰還式直線走路を考案したことで,ラットの行動は中断されることがなくなり,後述する自由反応場面へのきっかけとなった。 次に,餌も実験者を煩わせることなく自動的に呈示できるシーソー型走路(図2のc)を考案した。 この装置は,ラットの移動に伴うシーソーの動きにより,餌の入った円盤を動かすことで,餌の自動呈示を可能にしたものである。 この装置が不調になり,餌が呈示されなかったときに,反応の消去曲線extinction curveが偶然得られ,また,反応は時々餌が呈示されるだけでも維持されるという新しい事実の発見(間欠強化intermittent reinforcement)という幸運に恵まれたのである。 さらに,餌呈示の記録も自動的に行なえるように工夫したことが,後年の反応の累積記録(図2のe)へと発展するきっかけとなった。 そうして,1930年代の初めには,後にハルHull,C. により「スキナー箱」とよばれた図2のdのような実験箱の原型(Skinner,1932)ができあがったのである。 図3にハト用実験箱(スキナー箱)の模式図を示す。 ハトが背後から照明された円形の窓(キー)をつつくと,給餌装置が作動し,餌が一定時間(通常3秒程度)食べられるようなしくみになっている。 空腹なハトを実験箱に入れると,ハトは最初でたらめに動いて必ずしもキーをつつかないが,偶然キーをつつくと餌箱が呈示される。 このようなことが何度か起きると,やがてハトはキーをつつくようになる。 つまり,オペラント条件づけが成立したのである。 【三項強化随伴性three-term contingencies of reinforcement】 自発された反応に,餌の呈示を伴わせる(随伴させる)ことを強化reinforcementといい,ハトがキーをつつくと餌が呈示されるしくみを強化随伴性contingencies of reinforcementという。 このとき,餌は反応を強めるもの,つまり強化子reinforcerであるといえる。 このように,オペラント条件づけの成立には,自発される反応とその結果としての強化子呈示が必要であり,この関係の確立により,反応を自発する手がかり(弁別刺激)も成立するのである。 これらの三つの項,すなわち弁別刺激-反応-強化子の関係を三項強化随伴性という。 図4は,オペラント条件づけの基本パラダイムである三項強化随伴性の模式図を示したものである。 この模式図は,どのような手がかり刺激のもとで,どのような反応が自発され,どのような強化子により反応が強められるのか,というオペラント条件づけ研究の課題を表わしている。 三項強化随伴性のうち,反応と強化子の関係は,強化子の呈示の仕方を決めるschedule of reinforcementの問題であり,弁別刺激と反応との関係は,弁別刺激がどのように反応を制御するかという刺激性制御stimulus controlの問題である。 このほか,このような強化随伴性に影響する要因として,強化子が反応を強める働きを保持するのに必要な,たとえば空腹にさせるという動因操作や,電気ショックなどの嫌悪刺激の呈示という情動操作がある。 ここでは,刺激や反応は集合論のクラス概念に基づいて定義される。 つまり,共通の結果(たとえば強化子呈示)をもたらす反応は,手でレバーを押す反応も口で咬んでレバーを押す反応もすべて同一の反応クラスに属する。 このような反応クラスをオペラントと名づける。 刺激についても,反応を自発する共通の手がかりになるものは,赤信号でも「止まれ」ということばでもすべて同一の刺激クラスに属することになる。 このような随伴性により形成・維持される行動に対し,ヒトの場合には,言語を介した行動の形成・維持も考えられる。 たとえば,「赤信号で止まり,青信号で歩き出す」という言語表現は,交通事故に遭わずに安全であるためには,どのように行動すればよいかを表現したものである。 こうした言語表現により形成・維持される行動は,随伴性にさらされて(危険な目に遭って)獲得された行動,すなわち随伴性形成行動contingency-shaped behaviorではないので,規則支配行動rule-governed behaviorとよばれる。 図3に示した実験装置(実験箱)は,行動を空間的な移動ではなく,時間的軸上で起こる出来事としてとらえる見方を具現化したものといえる。 ハトのキーつつきやネズミのレバー押しなどの自発反応は,時間軸上で起きる出来事である。 したがって,オペラント条件づけでは,反応強度を単位時間(たとえば1分)当たりの反応数,すなわち反応率response rateで表現する。 また,時間軸に対して反応を累積的に表わす方法を考案したことで,反応パターンを時々刻々記録することが可能になった。 【自由反応場面と試行反応場面】 前述した実験場面を自由反応場面とよぶが,先に述べたソーンダイクの問題箱を用いた実験のように,行動を試行によって区切る試行反応場面の条件づけを,とくに道具的条件づけinstrumental conditioningとして区別することがある。 この区別は単なる手続き上の相違にすぎないようにも見えるが,行動への影響が異なることが明らかになっているので重要である(Hachiya,S. , & Ito,M. ,1991)。 【新しい反応の形成】 オペラント条件づけでは,反応が自発されない限り,個体が強化随伴性にさらされることはない。 その意味で,随伴性とは偶然性であるが,新しい反応を形成させるためには,強化随伴性を逐次変化させる逐次接近法method of successive approximationという方法を用いる必要がある。 たとえば,最初はハトがキーの方を向いたら強化する。 この反応が安定して生起するようになったら,次はキーに近づいたら強化する(同時に,これまでのキーの方向を向く反応は強化されない)。 さらにキーに接触したら強化するというように,順次,強化の対象となる反応を変化させることで最終的なキーつつき反応を形成するという方法である。 【自動反応形成autoshaping】 空腹なハトを実験箱に入れ,キーを照明した後,餌を呈示することを一定の試行間間隔を挟んで繰り返すと,やがてハトは餌を食べると同時にキーもつつくようになる。 キーをつつくと,強化随伴性が設けられているので,餌が呈示され,キーつつき反応の条件づけが成立する。 このような現象を自動反応形成という(Brown,P. , & Jenkins,H. ,1968)。 自動反応形成には,キーの照明(CS)と餌呈示(US)というレスポンデント条件づけと,キーつつき反応と餌(強化子)呈示というオペラント条件づけの二つの過程が働いていると考えられる。 自動反応形成が成立した後,キーつつき反応が維持されることを自動反応維持automaintenanceという。 その後,キーの照明に続いて,キーつつき反応がないときに餌を呈示し,反応があるときには餌を呈示しない,いわゆる除去訓練手続き(負の罰)を用いても,キーつつき反応がかなりの程度維持されることが見いだされた(Williams,D. , & Williams,H. ,1969)。 この事実は,キーつつき反応がキーの照明(CS)と餌呈示(US)というレスポンデント条件づけの強い影響を受けることを如実に示している。 自動反応形成により形成されたキーつつき反応は,照明されたキーに向けられた反応であるという特徴をもっている。 この特徴から,正の特色価効果や行動対比の現象の説明に用いられている。 【実験的行動分析と行動分析学】 スキナーとその弟子たちを中心としたオペラント条件づけの研究は,やがて個体の行動分析をめざす新たな学派を形成していくことになる。 1958年の実験的行動分析誌『Journal of the Experimental Analysis of Behavior』の創刊は,この新しい学派の旗揚げとみなされるが,このようなオペラント条件づけの研究を基礎に,個体行動の実験的分析を行なう研究分野を実験的行動分析the experimental analysis of behaviorという。 さらに,実験的行動分析の成果を臨床的な分野の諸問題へ適用しようとする応用行動分析applied behavior analysisもその後に誕生する。 これらに,理論的な分析を指向する理論的行動分析theoretical behavior analysisを加えた新しい分野を行動分析学behavior analysisという(佐藤方哉,1976)。 行動分析学という名称は,フロイトの精神分析学を意識してのものである。

次の

「古典的条件付け」と「オペラント条件付け」の違いをわかりやすく説明する記事。

オペラント 行動

行動療法 行動療法は、 「人間の行動は経験に基づく後天的な学習の結果」と考えるに基づいた心理療法の総称です。 神経症・心身症・恐怖症などの 不適応な行動は、過去の誤った学習や条件付けの結果と考え、再学習、再条件付けによって適応的な行動に変えていくと言うのが大まかな治療の概要です。 また、不適応な行動は 生まれ持った素質ではなく、後天的に学習されたものであると考えます。 したがって、学習の原理により 適切に学習し直すことを治療と呼ぶのが特徴です。 主にに条件付けの理論からさまざまな治療技法が開発されています。 現在では、保険診療で用いられるが広く注目されていますが、その基礎となる治療理論でもあります。 「三項随伴性は学習理論の中心概念であり、基本的にすべての行動を三項随伴性で説明しています。 社会的学習は後者の代理経験によって学習が成立する過程のこどで、他人をモデルにして学ぶことから 「モデリング」と呼ばれます。 このモデリングによる社会的学習を理論的に説明しているのが、に代表される 社会的学習理論と呼ばれる考えです。 モデリングによる学習やバンデューラの提唱する 自己効力感の理論は行動の強化に用いられており、多くの技法に組み込まれています。 人間は、後天的な条件付け 体験 によって行動し、 良いも悪いもこれまで何を学習し、ノートに何を記したかによってその人が決まるのです。 つまり、環境が人を作るという考えです。 が 「私に健康な1ダースの赤ん坊と、彼らを育てるのに最適な場所とを提供してくれれば、私は彼らの才能とか生まれつきの傾向などとは関係なく、任意の1人をどんな人間にでもしてみせよう・・。 」と豪語したことはとても有名です。 行動療法からみた人の性格とは、 刺激に対する反応が習慣化したものであり、そうした習慣の集合体だと考えます。 適当な反応をするための学習が欠けている場合と、一つの誤った反応の学習が他の行動に影響している場合などが要因。 それぞれの理論は独立しているようで全てつながりがあり、学習を重視するという根底があります。 次に紹介する技法の一覧は、学習心理学の歴史の中で生み出されてきた行動療法そのものです。 反論として、目に見える症状だけを対象にしているため、たとえ症状が消えても原因が消えていなければ、また別の症状が現れるという意見もあります。 しかし、多くの場合、 目に見える症状が取り除かれることでパーソナリティにも変化がもたらされるのは事実です。

次の