【レポート】玉川大学グローバルＣＯＥプログラム特別集中講義
Conditioning and associative learning　　Bernard Balleine氏

玉川大学グローバルＣＯＥプログラム特別集中講義
Conditioning and associative learning

バーナード・バレイン教授
（Brain & Mind Research Institute,
School of Medical Sciences The University of Sydney）

Lecture 1. Basic learning processes

今回の特別集中講義では、"conditioning and associative learning"をテーマに、学習や動機付けの神経基盤の研究をなさっているシドニー大学のBernard Balleine教授に4日間にわたってご講義いただく。初日である本日は基本的な学習プロセス、特に古典的もしくはパブロフの条件付けと道具的（オペラント）条件付の2つの条件付けについてご講演いただいた。

本講義では、まず学習の要素として4つの項目をあげていた。一つ目に学習環境や状態、二つ目に離散的な感覚刺激、三つ目に自発的（もしくは生物学的に）顕著なイベント、四つ目は反応や行動。これらの要素をつかい学習の研究はなされてきた。そして、学習の定義としては、Bouton, ME.の書籍からの引用で「学習は人間や動物に環境の変化に適応する方法を与えるもの...より具体的には、彼ら（人間や動物）が経験を通して適応させることができる方法である」としていた。しかし、どのような方法で人間や他の動物は環境の変化に適応するのか？その答えとして2つあげていた。1つは人間や動物は行動を変化させる事ができる。もう一つは行動を引き起こすための認知プロセスを変えることができるからだ。これらは行動対認知定義という学習の競合を生み出す。これら2つは区別することができるのかを2つの例を上げて説明した。１つはラットにおける感覚プレコンディショニングと恐怖学習、もう一つはハトにおける音と食べ物の学習だった。ラットの実験では、音と光をペアにしたグループとペアにしていないグループで学習をさせた後に、光とショックを学習させた結果で2グループ間に差があることを示した。ハトの実験では2次条件付けと呼ばれる実験について示した。

次に、動物たちが一般的な学習メカニズムを進化させた事を示す例を2つあげていた。痛みを伴うイベントを予測するための学習と毒を予測するための学習です。喉の乾いたラットを使い、前実験として塩水を消費させる。そして塩水を舐めるとショックが来るようにする。そして後実験として塩水を消費するかを調べると、ショックが来るフェーズでは水を消費なる。次にやはり喉の乾いたラットを使い、前実験として光と音を組み合わせて水を消費させる。そして、グループSでは光と音の後にショックが与えられ、グループIでは光と音の後に人工的に具合が悪くなるように注射をする。後実験では光と音を与えると水を消費するかを調べました。結果はグループIでは前実験と後実験における水を舐める回数はかわらないが、グループSでは後実験で顕著に舐める回数が減っていた。同じ実験をTasteとBright-noisy waterで比較するとTasteでは具合が悪くなるのよりもショックが舐める回数が多くなり、Bright-noisy waterでは具合が悪くなるのよりもショックが顕著に少なくなることが示された。GarciaとKoellingは2種類の系があることを提唱し、１つは外需要のイベントに敏感なタイプともう一方は内受容に敏感なタイプだとした。種間ではラットで具合が悪くなる注射を打つと消費量が減っていたのが、ウズラでは変わらないことが報告された。さらに、ラットとウズラに青い水と塩水で具合が悪くなるようなトレーニングを行うと、ラットは青い水では舐める回数が変わらず、ウズラでは青い水を舐める回数が減った。このように多様な種が毒性を予見することを学習するための能力を進化させたように考えられた。しかし、学習メカニズムがその後進化したかどうかはいくつかの利点があるか、もしくは生殖プロセス自体に利点を提供している必要がある。これらを支援する例をgouramisと言う魚の古典的条件付けで説明した。

後半では、一般的な学習プロセスが因果関係に敏感であるように進化した場合、どのように研究するかについてご講義された。原因には一般的に生産的なものと防止的なものの2種類あり、これらの関係についてどのように動物が学習するかについてはパブロフの条件付けを使い研究がなされている。パプロフは3つの重要な観察を作り上げた。1つ目は反射、2つ目は応答可塑性、3つ目は条件付けである。USとCSをペアリングによって作られたCSの行動の変化は、その組み合わせによるものであることを言うためにはCS単独（例えば順応）であるとか、US単独（例えば感作）、もしくは単にCSとUSともに触れさせることによる行動の変化を排除することが重要である。

まとめでは2点についてご講義された。1つ目に連合学習は重大な適応の利点を与える一般的なプロセスであることを述べた。2つ目で、パブロフの条件付は確かに原始的で単純なものであるが、順応や感化、評価的な条件付によって複雑化することについて講義された。

本講義では基本的な学習プロセスとして条件付けと連合学習について講演いただいた。日頃当たり前に使っている用語や考え方を基本から丁寧に説明していただき、よく聞く実験の細かい部分まで知ることができ、有意義であった。2日目からの興奮性と抑制性の条件付け、条件付けの理論、道具的条件付けにも期待が寄せられる。

日時	2012年3月26日（月）10時00分～13時00分
場所	玉川大学大学研究室棟B107室
報告者	上條中庸（玉川大学脳情報研究科　博士課程後期1年）

Lecture 2. Excitatory and inhibitory conditioning

今日の講演は興奮条件付けと抑制条件付けを中心に行いました。興奮条件付けはさらに欲求の興奮条件付けと回避の興奮条件づけに分けられています。パブロフの犬の唾液分泌の条件づけは欲求の興奮条件付けの典型的な例で、捕食者が近づくと動物が逃げてしまうのは回避の興奮条件付けの一例です。回避の興奮条件付けを調べる為には「恐怖」を動物に感じさせる状態を作ります。例えば、条件性抑制のパラダイムを使います。具体的なやり方として、動物にレバーを押すと食べ物をもらえるのを最初にトレーニングして、その後は音か光が電気ショックと関連する条件を作ります。しかし、この電気ショックはレバー押しや食べ物とは全く関係がないです。ネズミが何回か電気ショックを経験すれば、音が出る時にすぐレバー押しを止めてショックが来るのを待つようになりました。このようにして動物は回避の興奮条件付けの環境では学習ができます。

多くの行動学習理論は学習を感覚と運動の関連づけだと解釈しているが、認知行動理論はCSはUSの置き換えだと説明しています。前者の解釈の場合は、 USがなくても動物の条件付け反応には影響を及ぼさないはずで、後者の場合は USがなければ動物の反応が落ちると予測しています。動物がある食べ物に対して飽きてしまう状況を作ったり、CSの音とそれにつながるUSの電気ショックの間の間隔を長くしたりして、動物の条件付け反応が落ちる結果が見られました。

欲求の因子と回避の因子にそれぞれ促進の面と抑制の面を持っています。例えば、電気ショックがないのは回避することを抑制できます。動物の行動における回避のシステムと欲求のシステムは互いに促進か抑制かのように影響し合っています。

日時	2012年3月27日（火）10時00分～13時00分
場所	玉川大学大学研究室棟B107室
報告者	Fan Hongwei（脳情報研究科・博士課程後期）

Lecture 3. Theories of conditioning

集中講義3日目は、初日そして2日目に引き続き、古典的条件づけ学習に関して「Theories of conditioning」という題目で講義がおこなわれた。講義は、これまで提唱されてきた古典的条件づけに関する多くの原理や理論について、その長所・短所とともに歴史的な変遷を概観できる内容となっていた。

ヒトを含め動物は、外界で起きる出来事の因果的・予測的関係を学習することができる。このような学習の成立には、対象間および事象間の時間的間隔そして時間的順序などに鋭敏な学習メカニズムが必要である。古典的条件づけの理論においては長らく、時間的間隔に焦点をあてた「近接(contiguity)の原理」が学習の成立を説明すると考えられていた。「近接の原理」とは、CSとUSが時間的に近い場合には連合が成立する、というものである。しかし、CS-US間に長期遅延をおいた場合にも味覚嫌悪学習が成立すること、CS-US間の近接にも関わらず逆行条件づけ（CSよりもUSが先に提示される）が成立しにくいことなど、近接原理では説明できない学習もみられた。これについてRescorla(1968)は、CS-US間の随伴性(contiguity)、具体的にはCS提示中にUSが提示される確率、もしくはCS提示中にUSが提示されない確率を統制した実験をおこなった。そこから、CS-USが近接して提示されることよりも、CSがどれだけUS（またはno US）を予測するかが学習成立には重要であるという「随伴性の理論(contingency theory)」を提唱した。

また、Kamin（1968）によって報告された「ブロッキング効果」も、それ以前に提唱されていた「頻度の原理（2つの刺激が対提示される回数が多いほど連合が成立しやすい）」では説明できない現象である。Kaminの実験では、2群の被験体に対して、同じ回数だけ複合CS（音＋光刺激）とUS（ショック）の組み合わせを経験させた。ただし、実験群だけはそれに先立って光刺激単体とUSの組み合わせを連合が成立するまで十分経験させていた。テストでは、両群での音刺激に対するCRの生起が調べられた。頻度の原理によれば、両群は同じだけ音刺激とUSの組み合わせを経験しているのであるから、そのCRに違いは見られないはずである。しかし、音刺激へのCRが生起したのは統制群においてのみで、実験群ではCRの生起は見られなかった。実験群では、初めに光刺激とUSが提示され、すでに連合が成立していた。その後で、光＋音刺激を提示しても、音刺激はUSを予測するには必要のない冗長な情報として、光刺激にブロックされたと解釈される。つまり、学習の成立には、刺激頻度だけではなく、その刺激がどれだけ有効なUSの予測子となるかが重要なのである。

このような過程を経て、古典的条件づけによる学習理論はより広く、より複雑なものへと発展した。講義では、その中でも主要ないくつかの理論が紹介された。たとえば、先のブロッキング効果を説明する理論としてはRescorla-Wagnerモデルが挙げられた。このモデルにおいては、主体によるUSの予測と実際のUSの強度の誤差に焦点があてられていて、予測されない・予測に反した（誤差が大きい）USは学習を促進し、十分予測される（誤差が小さい）USは学習を促進しないと考えられる。これによればブロッキング効果は、光刺激によって予測されるUS以上のものが光＋音刺激によって起きなかったため、主体による音刺激への学習が促進されなかったと説明できる。このRescorla-Wagnerモデルに基づいて、遮蔽、過剰予期効果、消去などの、学習において見られるさまざまな現象が、神経科学からの知見もまじえて説明された。また同時に、CS先行提示効果など、同モデルでは説明できない現象についても触れ、そこから新しく提唱された、CSの顕著さの変化とそれに対する注意を重視したMackintoshの注意理論や、USの予測性だけではなくそれに伴うCSの効果の変化を重視したPearce-Hallによる理論、また連合学習と記憶に関するWagnerのSOP理論などについても、それぞれの長短を合わせて紹介いただいた。

古典的条件付けをはじめとした学習心理学は長い歴史をもつ学問であり、心理学に限らず多くの領域に関連している。しかし、個人的には（そして多くの人にとってもおそらく）、たとえ心理学を学んでいても、その詳細や歴史的変遷などについてあらためて学ぶ機会はなかなか得ることができない。内容が複雑すぎる（気がする）、用語が難解（な気がする）などの理由で、なかなか踏み込めずにいることも多いと思う。今回の全4回の集中講義でBallein教授は、学習心理学について、広くそして非常に分かりやすく丁寧に講義してくださった。今回の講義は、自分を含め参加者の多くにとって、学習心理学を学び直す、はじめて学習心理学を学ぶためのうってつけの機会になったと感じた。

日時	2012年3月28日（水）10時00分～13時00分
場所	玉川大学大学研究室棟B107室
報告者	村井千寿子（グローバルCOE研究員）

Lecture4. Instrumental conditioning

世界的な行動心理学の大家であるバレイン教授に四日間に渡って行動心理学の基本についてレクチャーをしていただくという大変稀有な機会を持つことができた。この講義には、玉川大学の研究員や学生だけではなく、外部からも大勢の参加者が講義の聴講に訪れており、バレイン教授がどれだけ影響力がある研究者なのかを体感することができた。

バレイン教授の４日目の講義は、道具的条件づけ（Instrumental conditioning)についてであった。まずバレイン教授はオペラント条件づけと道具的条件づけの違いについて丁重に説明してくださった。オペラント条件づけは、予測的システム（次に来る刺激を予測して生じる反応）なのに対して、道具的条件づけはこのような予測的システムによる反応を抑制するよりゴール志向的なシステムであるといえる。オペラント条件づけにもとづく行動と道具的条件づけにもとづく行動を明確に分類することは決して簡単ではないが、devaluationという刺激の価値を低下させる実験操作を加えることにより、この二つの条件付けを分離する実験について詳しく説明していただいた。さらに報酬スケジュールをインターバルにした場合と、確率にした場合での行動の違いを説明するBaumのモデルについて説明することで行動と結果の連合の学習についてもお話を伺った。さらにより最近の知見として、行動決定におけるゴール志向的な行動とハビットな行動の違い、モデルベースとモデルフリーの行動の違いやその背後にある大脳基底核のネットワークについての仮説についても伺った。大脳基底核のネットワークのモデルとしてはゴール志向的な行動システムの大脳基底核・皮質のループとハビット的な行動システムの大脳基底核・皮質ループが線条体を介してインタラクションするというモデルが非常に面白かった。最後に、価値そのものがどのように学習されるのかについdevaluationを題材に教えていただいた。その中でバレイン教授は、身体感覚がまず価値をつくり、それが脳内で表象となるというダマジオのソマティックマーカー仮説を、身体感覚を薬物によりブロックしたネズミであっても報酬のdevaluationが起こったことを論拠に批判的に論じられた。このように通説に対立する議論を聞けるところも、世界的大家の講義ならではの体験であろう。

分野を引っ張ってきた研究者に研究についてのレクチャーを四日間に渡って受けられるということは、知識の量が増えるというだけではなく、分野を引っ張ってきた研究者のもつバイタリティや人間性に触れられるという意味でも大変貴重な機会であった。このような機会をつくっていただいた玉川大学脳科学研究所グローバルCOEプログラムに心から感謝をしたいと思う。

日時	2012年3月29日（木）10時00分～13時00分
場所	玉川大学大学研究室棟B107室
報告者	高橋英之（グローバルCOE研究員）

▲ ページの先頭へ