【レポート】
Interactive dynamics between corticostriatal circuit in reinforcement learning and decision making
Michael J. Frank 氏

グローバルCOE特別講演会
Interactive dynamics between corticostriatal circuit in reinforcement learning and decision making

Michael J. Frank氏
(Univ. of Arizona, U.S.A. )

 本講演では、米国Arizona大学のMichael Frank教授に学習における皮質線条体回路の果たす役割についてご講演頂いた。Frank教授は、行動実験と神経回路モデルを組み合わせて、学習におけるドーパミンの役割について明らかにした研究(Frank et al., Science, 2004)で知られる、新進気鋭の計算論的神経科学者である。今回はFrank et al., Proceedings of the National Academy of Sciences, 2007で公表されている研究を中心にご講演頂いた。

 2004年に公表された研究において、彼らは2つの選択肢から正解を当てるという単純な行動課題(ただし、選択肢Aは80%の確率で正解というように、正解は確率的に決まっていて、試行錯誤して学習しなければならない)を使った。この行動課題において、「正答から学習して確率の高い選択肢をより選ぶようになる」と「誤答から学習して確率の低い選択肢をより避けるようになる」という2つの学習戦略が考えられる。そこで彼らは、学習に関連しているとされているドーパミンと、2つの学習戦略との関連について、パーキンソン病患者(線条体におけるドーパミンが枯渇していると考えられる)を対象とした行動実験で検討した。その結果、パーキンソン病患者では「正答からの学習」より「誤答からの学習」のほうが良いこと、内服治療(線条体におけるドーパミン濃度を上昇させる)によって、この傾向が逆転すること、さらにこれらの結果が彼らの考案した神経回路モデルの予測とよく一致することを示し、ドーパミンD1受容体を介した「Go」回路とドーパミンD2受容体を介した「NoGo」回路が、2つの学習戦略に対応するフィードバックによって別々に修飾されるという説を提唱した。

 今回ご講演頂いた研究では、同様の行動課題を用い、さらに正常人における遺伝的背景の違いの影響について検討がなされた。その結果、線条体のドーパミン機能に関係するDARPP-32遺伝子の遺伝子多型により、「正答からの学習」と「誤答からの学習」のバランスが逆転すること、ドーパミンD2受容体遺伝子のC957T多型により、「誤答からの学習」の度合が変わること、さらに前頭前野のドーパミン機能に関係するCOMT遺伝子のVal/Met多型が、誤答のあと次の行動を変える、という行動の柔軟性に関与していることが明らかになった。さらにこれらの遺伝子多型による効果が、強化学習モデルから推定されるパラメータと独立に対応することを示した。これらの結果は学習においてドーパミンが多様な役割を果たしており、それぞれに特有の神経基盤があり、特有の遺伝子が関与していることを示唆する。

 Frank教授の研究は、数理モデル、行動実験、遺伝子多型解析など多様な方法を組み合わせた先駆的なものであり、普遍的な神経メカニズムを探りつつ、さらに従来の神経科学では扱われなかった個性の神経基盤の解明まで視野に入れている点に感銘を受けた。近年神経科学分野はますます学際化しているが、新規な知見を得るため既存の枠組みを超えて実験を計画することの重要性について具体的な成功例を伺うことができ、非常に勉強になった。

日時 2008(平成20)年10月14日(火)10:00~11:30
場所 玉川大学研究管理棟5階507室
報告者 野元 謙作(玉川大学脳科学研究所・GCOE研究員)