【レポート】
--- 神経科学における「意思決定」研究の最前線を学ぶ ---
2009年度 Joint Tamagawa - Caltech lecture course
on DECISION MAKING

 2010年3月3日から5日にかけての3日間、玉川大学とその連携大学であるカリフォルニア工科大学(Caltech)のメンバーを迎えてレクチャーコースが開催された。本コースでは神経科学の中でも最も重要なトピックスの一つである「意思決定」に注目し、9人の先生方によってレクチャーが行われた。我々は日常生活から、株式市場や政治的な場面まで幅広い意思決定を行っているが、その神経機構はいまだ明らかになっていない。現在の神経科学では意思決定の中でも特に、「どのように異なる物や状況の価値を評価しているのか」、「不確実な状況においてどのように将来の価値を見積もっているのか」という問題に関して多くの研究が現在行われている。今回はこれらの問題に対して様々なアプローチで取り組んでいる世界的に有名な先生方をご招待しての講演となった。

 Trinity CollegeのJohn O'Doherty先生はヒトの行動実験及びfMRI実験によって「experienced utilities (reward)」とそれに続く「decision utilities (action values)」がヒトの脳の中のどのような部位で処理されているかに着目した研究をされている。本講演ではまず、「食べ物」や「お金」などの予期を行った際のfMRIデータからorbitofrontal cortex (OFC)がexperienced utilitiesに関係していることを突き止めた経緯を話され、さらにdecision utilitiesについてventromedial prefrontal cortexがコードしていることを示された。後半はgoal-directed learning (目的指向学習)、特に道具的条件付けの際にOFCで行われる報酬予測が「刺激-反応」、「刺激-報酬」または「反応-報酬」の連合のどれに影響を与えているのかという問題にdevaluationのパラダイムを用いて実験された内容について講演された。devaluationは特定のoutcomeのvalueが繰り返し呈示などされることによって低下する現象である。先生実験によるとdevaluationが起きた際にOFCの活動が上昇することから、特定の反応に対する報酬予測の計算がOFCで調整されていることを示された。O'Doherty先生の研究は意思決定の報酬予期の問題を、学習心理学の巧妙なパラダイムと計算論的方法を用いてアプローチされている点が印象的であった。

 次に、沖縄科学技術研究基盤整備機構の銅谷賢治先生によって意思決定における強化学習モデルとベイズ推定についてのレクチャーが行われた。先生は脳のメカニズムを計算理論によってアプローチされている。強化学習理論はある入力に対する出力の評価のみが報酬という形で与えられる学習パラダイムであり、このシステムが脳内では中脳ドーパミンシステムによって実現されていると考えられている。レクチャーの前半では強化学習モデルを実装したロボットなどのご自身の研究を織り交ぜながら、強化学習理論の基礎について講演された。さらに後半ではベイズ推定の基礎についてのレクチャーが行われた。ベイズは観測されたデータからその背後に隠れた原因の確率を推定する理論だが、この理論は神経科学の2つの側面で有用である。一つには、我々研究者は限定された部位やデータから脳の機能を推定しているため、その背後に隠れた脳のシステムを推定するのに必要になる。二つ目には我々の知覚は完璧に環境を理解しているわけではなく、物理法則、過去経験、遺伝性の気質などの事前知識が我々の意思決定をサポートしており、我々の脳の行動決定メカニズム自体がベイズ的な推定を行っている可能性がある。先生はさらにそれらの計算システムが脳内でどのように実現されているのかの仮説をお話になられた。

 三人目はFordham UniversityのFrank Hsu先生のCombinatorial fusion analysis (CFA)のレクチャーであった。CFAは複数あるデータをどのように統合するかの統計学的方法である。例えば、4種類の職業の中から1つを選ぶ際に、給料、休日の日数、一日の仕事時間、必要なスキルなど複数の要因を統合する必要があり、また我々は普段からそのような情報の統合を意識的、無意識的に行って意思決定を行っている。現在の一般的な理論では質的に異なる物の比較にはutilityという概念が使われているが、この情報統合のメカニズムにCFAの考え方が有用である可能性がある。また、現在の神経科学は分子生物学、生理学、行動科学などあらゆるレベルの実験が別々の世界を構築しているが、これらの分野の知見をどのように統合するべきなのかと言う問題に示唆を与えてくれるかもしれない。

 2日目の最初のレクチャーはUniversity College LondonのBen Seymour先生から始まった。Seymour先生はpain (痛み)とモチベーションや学習、意思決定の関係を計算理論的な手法で紐解いている。レクチャーではまず、痛みの受容体から中枢神経系までのメカニズムについて話された後、その情報がどのように大脳で報酬情報と結びつき、モチベーションや学習、意思決定に影響を与えているのかのご自身の研究について話された。多くの意思決定に関する多くの研究がポジティブな報酬のみを対象として実験しているが、現実世界ではネガティブな結果に対する逃避行動としての意思決定を多く行っていることは言うまでもないだろう。Seymour先生の研究からネガティブなpainに対する逃避行動のTD学習が、ポジティブな報酬の学習や予期と同様に、線条体で表象されているという点は大変興味深かった。

 二人目はUniversity College LondonのWellcome trust centerで活躍されている吉田和子先生による他者の推論に関する計算論的アプローチの講演が行われた。ここでも、銅谷先生の時と同様にベイズ理論を適応した研究が紹介された。吉田先生は不確実な環境情報下での意思決定や、他者の行動からその意図を推論するメカニズムなどの認知モデルを、ベイズ理論を用いた行動実験やfMRI実験を用いて検証されている。先生はまず、ベイジアンのコンセプトについて分かりやすい例を挙げながら説明された後、部分的にしか環境を把握できない迷路課題において被験者の「自分が今どこの位置にいるか」という推定位置とその確信度を逐次的ベイズ法によって行動から推定する方法とそれに対応する脳領域がanterior PFCとmedial PFCで観測された実験について話された。また後半は、他者の意図の推定に関してstag-hunt gameを用いた実験によって、「協力相手の行動を推定度(entropy)」がmedial PFCに、「どの程度まで相手の意図を考慮して行動を選択しているか(sophistication level)」がdorsolateral PFCやpost parietal cortex, frontal eye fieldの活動に相関することを示された。さらにこのゲームを他者の意図の理解に問題があると考えられている自閉症の人々に行った実験についても言及された。

 三人目はUniversity of OxfordのMark Buckley先生によるサルの前頭葉の破壊による意思決定への影響に関する講義であった。現在のシステム神経科学につながる近代の脳研究は、ヒトの脳損傷患者や脳除去手術によって引き起こされる特徴的な行動変容の記述から始まった。Buckley先生はそれらの歴史と、それにとって代わったモデル動物であるサルの脳破壊実験について概略を話された後、ご自身のサルの前頭葉破壊実験の内容を中心に講義された。Buckley先生はサルにWisconsin card sorting testに似たもので、答えをはっきりと呈示されるのではなく、自身で正しい行動を推量して選択する課題を学習させた後に前頭葉のsuperior dorsolateral PFC (sdlPFC), principal sulcus within dorsolateral PFC (PS), orbitofrontal cortex (OFC), anterior cingulated cortex (ACC)のそれぞれを破壊した際にどのような行動の変化が起こるかを調べた。その結果、sdlPFCの損傷ではタスクの成績に差が見られなかったが、PS損傷は現在のルールに関するworking memoryが阻害され、OFC損傷では新しいルールへの素早い適応が阻害された。一方ACCの損傷では正答率の低下に加え、反応時間の促進が見られた。この結果からはACCは一見Conflictが起こった際の最適な行動選択をコントロールしているように見えるが、ACCはconflict detectionに重要であり、実行中に注意を向けなくてはならない特徴を選び出すにはdorsolateral PFC (DLPFC)が重要な役割を担っているとするACC conflict-monitoring theoryについて論じられた。

 三日目の最初のレクチャーは当初予定されていたNIHのBarry Richmond先生が体調を崩され、日本にいらっしゃることが出来なかったため、Richmond先生に師事された放射線医学総合研究所の南本敬史先生による講義であった。南本先生は報酬のサイズやそれにかかるコストなどの外的要因や、のどの渇きなどの内的要因が変化した際に、どのようにモチベーションが影響されるかをサルの行動実験のエラーの特徴から研究されている。先生の実験の結果によると、報酬量や報酬遅延に対する時間割引という外的要因とエラー率は双曲線関数で、のどの渇きの変化という内的要因とエラー率にはシグモイド関数でフィッティング出来るという。また、LPFCとOFCの損傷サルを用いて、報酬量と報酬遅延がどのように影響されるかを調べた結果、OFCにはそれぞれが別々に表象されており、LPFCはそれを統合していることを示唆するプレリミナリーなデータを紹介してくださった。先生のエラー率からモチベーションに影響を与える外的要因と内的要因を切り分ける試みは大変興味深く、様々な実験パラダイムにおいて利用できる可能性を感じることが出来た。

 二人目はUniversity of Pennsylvania のJosh Gold 先生によるperceptual decision making (知覚的意思決定)の講義であった。ここでは2つ以上の刺激と行動の選択の中から1つを選び出すために、脳がどのように情報を処理しているかを信号検出理論とベイジアンを用いた推定過程としてとらえ、log likelihood ratio (log LR)という確率情報の比を用いて説明された。刺激A→反応Xと、刺激B→反応Yという関係があるとき、まず、刺激がAかBかという知覚が必要である。このためにはA,Bそれぞれの刺激だというsensory evidenceを蓄積し(蓄積された情報をdecision variableという)、片方がある閾値(これは任意の値)に達したら、対応した反応が行われる。先生はMT野とLIP野の神経細胞をそれぞれsensory evidenceとdecision variableに対応付け、MT野の神経活動がLIP野で時間積分され、ある閾値に達したら意思決定がおこなわれるというモデルベースの実験について話された。また、刺激A→反応Xという関係を学習する際には強化学習モデルを用いて学習が進むに従ってLIPにおいてdecision variableがより早く蓄積されていく様子を示しされた。Gold先生のperceptual decision makingのお話は理論と実験は歯車のように噛み合いながら意思決定を行う神経メカニズムが説明されており、とても説得力がある理論に感じることができた。

 最後の講義はポルトガルのInstituto Gulbenkian de CiênciaのZach Mainen先生のodor-guided decisionとuncertaintyの講義であった。先生はuncertaintyがどのようにコードされ、それを動物がどのように利用しているのかを2種類の匂いを混ぜた刺激を用いて研究されている。講義ではまず視覚を用いた課題でのuncertaintyの研究と、嗅覚を用いたuncertaintyに関する先生の実験手法を比較しながら、olfactory cortexのanterior piriform cortexに個々の匂いをコードしたニューロンが存在することを示された。さらに、このニューロン応答はsniffingのタイミングに一致して、視覚課題などに比べてノイズが少なく、コンスタントな応答を示し、そこから匂いの情報をdecodingも可能なことを示された。後半では、さらに嗅覚刺激を用いた独自の課題によってuncertaintyとconfidenceがどのように脳に表現されており、動物がどのようにその情報を意思決定に使用しているのかの研究を紹介された。先生はOFCのニューロン応答の分散が、uncertaintyをコードしており、動物はそのuncertaintyという情報を用いて、情報に重みづけをしたり、情報を再び集める行動を引き起こしたりしていることを示された。Mainen先生のお話は、神経応答のばらつきが単にノイズであるのではなく、むしろその曖昧性を、動物は積極的に意思決定に用いているというアイディアはとても興味深かかった。

 今回の3日間のレクチャーではperceptual decision makingのような、比較的ミクロな意思決定システムから、他者の意図の推量まで様々なレベルでの意思決定の講義があり、神経科学の意思決定という分野の広さを感じた。しかし、どの講義も共通していた点は意思決定の研究にはベイジアンの導入が有用であり、より計算論的アプローチが求められていることであった。その一方で、多くの先生方の主張の違いから報酬の予期が脳のどの部分に、どのような形で表現されているのかという根本的な問題についてさえ、はっきりとした答えが出ていないということも浮き彫りになった。意思決定を研究する一人として今回のレクチャーコースは神経科学の意思決定の最前線を理解するとても素晴らしい機会であった。

 レクチャーコースでは、著名な先生方のレクチャーだけでなく、玉川大学とCaltechのメンバーを中心としたポスター発表も行われた。私自身の研究も発表する機会をいただき、多くの先生方に研究の問題点やその具体的な改善方法について多くの貴重なご意見をいただくことが出来た。先生方とディスカッションをさせていただいたことは自分の研究に対する自信にもつながり、とてもよい経験となった。また、Caltechのメンバーの研究と自身の研究を比較し、彼らとディスカッションしたことによって、同世代の若手研究者や学生がどのような問題に意識を持って研究しているのかについても知ることが出来た。

 1日目のレクチャーコースの後には有志で玉川大学とCaltechのポスドクや学生を募り、交流会も企画された。ここでは、お互いの研究の話はもちろんのこと、日本とアメリカの大学での研究生活や、将来の夢などを語りあうことが出来た。交流会を通して彼らとの友情も生まれ、その後のレクチャーの休憩時間や昼食などでも彼らとディスカッションをすることが出来、とても思い出深い経験となった。

 このような貴重な機会を与えてくださったGCOEプログラムならびに関係者の皆様には深く感謝いたします。

日時 2010年3月3日(水)~2010年3月5日(金)
場所 玉川大学 大学5号館
報告者 渡邊 言也(玉川大学工学研究科脳情報専攻博士課程1年)