脳がゼロからスタートしない理由

脳科学・意識・知性
この記事は約10分で読めます。

本動画は、脳が新しいタスクをゼロから学習するのではなく、既存のスキルモジュールを「レゴブリック」のように組み合わせる「コンポジショナリティ」の理論を検証したプリンストン大学の研究を解説したものである。サルを用いた視覚識別実験と神経活動の解析を通じ、色モジュールや運動モジュールが異なるタスク間で物理的に再利用されることが示された。また、タスクへの「信念」シグナルが入力の取捨選択と出力のルーティングを制御するメカニズムも明らかにされており、人間が新環境に素早く適応できる理由を神経科学的に裏付ける内容となっている。

Why the Brain Doesn’t Start From Scratch
Learn faster and retain more with Recall. Use my code artem25 for 25% off a subscription, that is valid until 1 April 20...

脳の学習における「コンポジショナリティ」とは

神経科学の根本的な問いがあります。なぜ生物の脳は、新しいことを学んだり、未知の状況に対応したりするのがこれほど得意なのでしょうか?その答えの少なくとも一部は、「コンポジショナリティ(合成可能性)」という理論にあるようです。

具体的にどういうことか、考えてみましょう。自転車に初めて乗ったとき、あなたの脳は2輪でバランスをとるという特定のスキルを習得しました。これを「バランスモジュール」と呼びましょう。数年後、自動車の免許を取得する過程で、今度は「交通ルールモジュール」を作り上げました。さて、今度はバイクに乗りたいとします。脳にとってこれは新しいタスクです。なぜなら、この特定の行動はこれまで経験したことがないからです。しかし、ゼロからスタートするわけではありません。

自転車から得た「バランスモジュール」を取り出し、自動車から得た「交通ルールモジュール」とパチッと組み合わせる——そうすれば、バイクに乗れてしまうのです。学習のスピードは驚くほど速い。コンポジショナリティの考え方とは、脳がスキルをレゴブリックのように扱い、再利用可能なパーツを組み合わせて複雑な行動を作り上げるというものです。

プリンストン大学の研究:サルを使った実験

直感的にはよく分かる話ですが、このような「組み合わせ」が、個々のニューロンのレベルで物理的に起きていることをどうやって証明できるのでしょうか?そして、脳のどの部位でそれが起きているのでしょうか?

今日は、プリンストン大学のTim Bushmanグループが最近『Nature』誌に発表した論文を取り上げます。この論文はまさにその問いに答えようとしています。

(スポンサー紹介パートは省略なく収録)直近で読んだ論文や見た動画、5本のうちどれだけ実際に覚えていますか?私と同じように、大量のリサーチコンテンツを消費しているけれど、そのほとんどが頭から消えてしまう、という方にぜひ使ってほしいのが今日のスポンサー、Recallです。個人の知識管理の次のステップとなる、AIで強化されたセカンドブレインです。ブラウザ拡張機能でコンテンツを保存すれば、それがあなたのナレッジベースの一部になり、チャット形式で対話したり、アイデアを相互に結びつけたり、統合エディタで新しいノートを作成したり、そして間隔反復(スペーシング)によって本当に記憶に定着させることができます。新たに登場した最新機能「Quiz 2.0」では、問題の種類・難易度・問題数を自由にカスタマイズできます。複雑なトピックを理解するためにスペーシング反復を深く信じている私にとって、これは忘却曲線に打ち勝ち、より深い直感を養うための強力なアプローチです。作ったクイズを他の人とシェアして、リーダーボードで競うこともできます。学びを始めた頃からこんなツールがあればよかったと思える、本当に稀なツールです。getriall.ai で無料で試してみてください。説明欄のコードを使えば25%オフになります。では、動画に戻りましょう。

実験の設計:3つの視覚識別タスク

研究者たちが着目したのは、まさにこのアイデアを検証するために設計された特別なビデオゲームをサルが行うときの脳内で何が起きているか、という点です。このゲームには3つの視覚識別タスクが含まれていました。毎回の試行でサルは、ウサギと「T」の字の中間、そして赤と緑の中間に形態変化した画像を見せられます。

最初のタスクでは、サルは形を識別しなければなりません。画像がよりウサギに近ければ画面の左上に、よりTに近ければ右下に視線を動かす必要があります。正解すれば、ご褒美としてジュースがもらえます。これを「S1」タスク(形の軸1を意味する)と呼びます。

2つ目のタスク「C2」は全体的な構造は似ていますが、サルは形ではなく色を報告し、視線も別の軸に沿って動かす必要があります。画像がより赤に近ければ右上を、より緑に近ければ左下を見ます。そして3つ目のタスク「C1」では、色を報告しつつ、視線は軸1に沿って動かします。緑なら左上、赤なら右下です。

ここに研究の巧妙さがあります。タスクC1は「合成」なのです。C2の「色を見る」という感覚ルールと、S1の「左上・右下の対角線上に動く」という運動出力を組み合わせたものです。もし脳が本当に効率的であるなら、C1のためにゼロから新しい回路を作るはずがありません。C2から色検出器を取ってきて、S1の運動ドライバーにつなげればいい、となるはずです。そして、まさにそれを検証しようとしたのがこの研究です。

ニューロン集団活動の解析

脳内で何が起きているかを垣間見るため、研究者たちは高次の抽象的意思決定を担う領域である前頭前皮質に電極を埋め込み、サルがゲームをプレイする間、数百個の個々のニューロンの活動を記録しました。モジュールは複数のニューロンにまたがっているため、単一の細胞の活動だけを見ていても意味がありません。細胞集団全体で何が起きているかを一度に把握する方法が必要です。

各軸がニューロン1個の活動レベルを表す座標系を想像してください。100個のニューロンから記録すれば、100次元の空間になります。ある瞬間のサルの脳の状態は、その空間上の1点として表されます。赤いカテゴリを見たときの全試行の脳活動データをまとめると、特定の点の集まり(クラウド)ができ、緑の画像の試行は別のクラウドを形成します。この神経活動空間には、この2つのクラウドを最もうまく分離できる特定の方向が存在するかもしれません。数学的には、これが空間を赤と緑に二分する「決定境界」を定義します。これを「色サブスペース」と呼びます。

この分離超平面を使って分類器を構築できます。活動空間上のまだ見ていないデータポイントを受け取り、それが境界のどちら側に落ちるかを確認して予測を返す機械です。つまり、神経活動だけから純粋に色の識別を読み取ることができるわけです。この分類器の精度は、色という変数に関する情報が脳内にどれだけあるかを測る指標として使われます。

研究者たちは、C1とC2の両タスクにおいて、画像が提示されてから約0.5秒後に、皮質活動から色の識別を成功裏に読み取ることができました。これは、この情報が前頭前皮質に正常に処理・伝達され、活動空間に明確な2つのクラウドを形成していることを意味します。

情報の「選択」と「無視」

ただし重要なことに、サルがS1タスクで形に集中しているときは、色を読み取ることができませんでした。これは、画像処理が前頭前皮質に達するまでの間に、タスクと無関係な情報が能動的に捨てられていることを示唆しています。赤と緑のクラウドがごちゃごちゃに混ざり合い、押しつぶされてしまうのです。同様に、形はS1タスクでは簡単に読み取れましたが、C1やC2では読み取れませんでした。

モジュールの物理的な再利用の証明

ここが核心的なテストです。もしモジュールが再利用されているなら、色処理に依存する両タスクで色サブスペースは同一のはずです。C2タスクで訓練した分類器の超平面は、C1タスクで観測された赤と緑のクラウドも分離できるはずですし、逆も然りです。このようなクロスタスク・デコーディングの精度は高いはずです。

そして、これがまさに研究者たちの発見でした。デコーダーを入れ替えても、ほぼ完璧に機能し続けたのです。つまり、脳の色モジュールは2つの異なるタスク間で物理的に再利用されています。同様に、運動方向を読み取るために訓練された分類器はS1とC1タスク間でうまく汎化し、運動指令モジュールも合成的に再利用されていることが示唆されました。

動的なルーティング:「鉄道の切り替えポイント」

これで脳に色モジュールと運動モジュールが存在し、それらが神経活動空間上の安定したサブスペースとして実在することが分かりました。しかし、パーツがあるだけではタスクを実際に解けません。脳はそれらを動的に接続しなければなりません。たとえばC1タスクでは、色サブスペースの「赤」シグナルを運動サブスペースの「右下に動く」シグナルへとルーティングする必要があります。

研究者たちはこれを、1回の試行内の神経活動を追跡することで可視化しました。画像が現れてから約100ミリ秒後、神経状態が色サブスペースに飛び込みます。その後、数百ミリ秒後には状態が色サブスペースから流れ出し、目を動かすための運動サブスペースへと回転していきます。

重要なのは、この流れがコンテキストに依存している点です。C1タスクでは「赤」のベクトルが軸1の運動方向へ流れます。C2タスクでは、同じ「赤」のベクトルが軸2の運動方向へ流れます。これはちょうど鉄道の切り替えポイントのように機能します。貨物(色)は同じですが、タスクのコンテキストが分岐を切り替え、列車を別のレールへ、別の目的地へと向かわせるのです。

入力の選択:タスク信念シグナルの役割

ただし、この鉄道の切り替えが説明しているのは出力をどうルーティングするか、という部分だけです。脳はもう一つの問題にも直面しています。正しい入力を選ぶ、という問題です。サルは形と色の両方を見ています。C1タスクでは色をルーティングして形を無視する必要があります。S1タスクでは形をルーティングして色を無視する必要があります。ここで間違えると、間違った貨物を線路に乗せてしまいます。では、何が列車に乗せる荷物を決めるのでしょうか?

これを明らかにするため、研究者たちはゲームに含まれる便利な要素、「不確実性」を活用しました。サルはブロック単位でタスクをこなします。新しいブロックが始まると画面がフラッシュしますが、次がどのタスクか教えられません。どの軸に沿って視線を動かすべきかだけが分かります。軸が2であれば話は簡単で、C2タスクしかその軸を使わないからです。しかし、ブレイクが終わって軸1に沿って動くタスクを行う必要があるとき、サルはミステリーに直面します。ルールは色なのか形なのか?

これが完璧な実験ウィンドウを生み出しました。最初の数十試行、サルは推測し、フィードバックから学び、ルールが何であるかについて内部の信念をゆっくり更新しなければなりません。研究者たちはまた別のデコーダーを訓練し、神経活動からこのタスク信念をリアルタイムで読み取りました。「形だと思う」から「ああ、確実に色だ」へとシグナルが変化していく様子を、リアルタイムで見ることができたのです。

タスク信念が神経のジオメトリを再構成する

そして、ここが核心です。この抽象的な信念シグナルが、神経のジオメトリを物理的に再構成していました。タスク信念が感覚入力のゲインノブ(音量調整のようなもの)として機能することが分かったのです。サルが色タスクだと気づくにつれ、脳は色サブスペースを増幅させ、赤と緑のクラウドをさらに引き離します。それと同時に形サブスペースを抑制し、ウサギとTのクラウドをフラットに押しつぶします。これにより、関連する情報だけがルーティングの切り替えポイントに届くほど大きな声を持つようになるわけです。

脳の柔軟性のメカニズム:まとめ

このように、柔軟性のメカニズムは二重構造になっています。脳は色・形・運動指令といったあらゆる特徴について、再利用可能な直交モジュールを構築し、そして中央のタスク信念シグナルを使って入力のゲインを調整し、出力のスイッチを設定するのです。

結論:脳はエンジニアである

すべてをまとめると、この論文は脳が新しい問題のたびに世界をゼロから再学習するわけではないという証拠を提供しています。代わりに、固定された再利用可能なコンポーネントのライブラリを構築するエンジニアのように機能しています。新たな課題が生じたとき、脳はただ関連するモジュールを起動し、それらを組み合わせて回路に情報をルーティングし、不要なものを抑制するだけでいいのです。

これが、人間が新しい環境にこれほど素早く適応できる理由を説明しています。毎回ゼロから新しい神経ハードウェアを構築しているわけではなく、既存のレゴブリックを新しい構成に組み直しているだけなのです。

動画が気に入ったら友人にシェアしてください。まだの方はチャンネル登録を、そしていいねボタンも押していただけると嬉しいです。計算論的神経科学と機械学習に関するコンテンツをこれからもお届けしていきますので、お楽しみに。

コメント

タイトルとURLをコピーしました