Max Bennettによる人間の知能進化に関する講演である。彼は商用AI技術の分野で長年のキャリアを持ち、人間の脳とAIシステムの違いに興味を抱き、進化的観点から脳の仕組みを理解しようとする研究を行った。本講演では、最初の脳から人間の脳に至るまでの進化的発展を追跡し、各段階で実装されたアルゴリズムを分析している。線虫の化学勾配追跡から、脊椎動物の強化学習、哺乳類のメンタルシミュレーション、霊長類の心の理論まで、段階的に複雑化する知能システムの発展を解説し、これらの知見がAI開発にどのような示唆を与えるかを論じている。
- はじめに
- 講演者の背景と動機
- 研究の目標:脳の仕組みを理解する
- なぜ神経科学が重要なのか
- 現在のパラダイムとその課題
- 進化的アプローチの提案
- 進化的枠組みの必要性
- 進化の神経生物学的変化
- 行動能力の出現を追跡する
- 重要な注意点
- 行動能力の進化的出現
- 最初の動物:化学勾配追跡
- 線虫の行動状態とアルゴリズム
- 脳の必要性:トレードオフの決定
- 最初の脊椎動物:強化学習の出現
- 時間差学習アルゴリズム
- 最初の哺乳類:新皮質とメンタルシミュレーション
- 哺乳類の独特な能力
- 反実仮想学習と挿話記憶
- メンタルシミュレーションの概念
- 最初の霊長類:心の理論
- メンタライジング:思考について考える
- 言語の進化
- 人間知能のアルゴリズム的進歩
- 結論:なぜこれが重要なのか
- 質疑応答
はじめに
次の講演者をご紹介できることを大変嬉しく思います。Max Bennettは最近本を執筆され、人間の知能の進化について、そしてそれがなぜ重要で、私たち自身、神経科学、AIについて何を教えてくれるのかについてお話しいただきます。これまでデータ側面について2つの講演を聞きましたが、今度は知能側面に移っていきます。Maxの講演を聞けることを本当に楽しみにしています。脳がどのように意思決定を行うかについてより多くを学べるだけでなく、生物学が脳を通じて行うこの効率性を活用して、コルが警告したようなAIのスケーリングに関する状況を回避できる方法についても学べると思います。
Max、ありがとうございます。
講演者の背景と動機
まず最初に、ここにいることを大変光栄に思い、謙虚な気持ちでいっぱいです。お招きいただきありがとうございます。私は博士号を持っておらず、古典的な訓練を受けた科学者でもありませんので、皆さんのような素晴らしい方々の前で、私が取り組んできた研究について共有できることに、とても興奮しています。
私の経歴を簡単に説明しますと、すべてAI技術の商業化に関わってきました。私が設立し、キャリアの大部分を過ごした会社はBlueeという名前で、世界最大規模のブランドにAIプラットフォームを販売していました。私は共同創設者兼最高製品責任者でしたが、そこでの10年間の旅路で最も困惑したのは、AIシステムと人間の知能がいかに異なっているかということでした。
これは古典的にはモラベックのパラドックスと呼ばれるもので、皆さんもよくご存知だと思いますが、コンピューターが非常に得意なこと(高速計算など)は人間が非常に苦手で、コンピューターが非常に苦手なこと(常識的推論や細かい運動技能など)は人間が楽々とこなすということです。
私は徐々に、ほとんど強迫観念に近いほど魅力を感じるようになりました。人間の脳とAIシステムの違いは本当は何なのか、そしてなぜ私たちはそれらの中で何が起こっているのかを理解していないのかということに。この興味が非常に深くなったため、最終的にフルタイムの職を辞し、何年もかけてここで何が起こっているのかを理解しようと研究に取り組みました。それが最終的に一冊の本にまとまりました。私は様々な神経科学者やAI研究者と協力し、いくつかの論文を発表しました。
研究の目標:脳の仕組みを理解する
今日お話しするのは、この本につながった核心的なアイデアです。
目標は何かというと、脳がどのように働くかを理解することです。これは何世紀にもわたって語られてきたため、ほとんど平凡な目標のように思えますが、私は非常に特定のことについて話しています。David Marrの考え方が本当に気に入っています。
脳がどのように働くかという質問には、実際には3つの方法があります。最初は計算レベルで、これは様々なサブシステムの機能や目標といったことです。神経科学では、このレベルで話すとき、認知、記憶、計画といった用語を使います。
その下にアルゴリズムレベルがあり、これらの機能がどのような抽象的数学原理によって実装されているかについて話します。予測コーディング、能動推論、時間差学習といったものを指します。これらは機能の基盤となるアルゴリズムです。
そしてその下に実装レベルがあり、これはアルゴリズムが発生する基盤となる神経学的メカニズムです。
私が興味を持ち、私たちが行った研究は、実際にはこの2番目のレベルについてです。なぜなら、これはAIシステムの構築に移植できる可能性がある部分であり、両者の間にシナジーが生まれる可能性があるからです。明らかに、私たちは近いうちにニューロンを使ってコンピューターを構築しようとはしていませんが、なぜこれが重要なのでしょうか。
なぜ神経科学が重要なのか
生物学者が大部分を占める部屋では、これは明らかかもしれませんが、AI研究者の部屋にいるときは、多くの人が「なぜ神経科学を全く気にする必要があるのか」と質問します。これは大きな間違いだと思いますし、すでに確信されているかもしれませんが、その理由をお話ししましょう。
第一に、AIは多くの重要な面でまだ性能が悪いのです。私たちが見てきた成功にもかかわらず、ラットの脳でもできることをChatGPTが全くできないことがまだ多くあります。これらは継続学習、常識的推論、細かい運動技能、説明可能性、能動学習、頑健性などです。これらはほんの一例です。つまり、AIは脳に実装されているアルゴリズムについて学ぶべきことがたくさんあるのです。
第二に、AIはエネルギーコストが高すぎるということです。Fox博士もこのことについて話していました。AI界では現在、より良い性能を得る手法を見つけたという一般的なトレンドがあります。それはより多くのデータとより多くの計算です。同じ性能を得るために、より多くのデータやよりエネルギー効率の良いアルゴリズムが何かを見つけるという困難な研究をする代わりに、実際には問題により多くのエネルギーを投げつけているだけです。これは最終的に危機につながるでしょう。
第三に、おそらく最も興味深く微妙なものは、脳の仕組みを理解することで、世界の他の知能との関係を理解できるということです。それは他の動物であれ、私たちがもうすぐ作ろうとしているAIシステムであれ。
現在のパラダイムとその課題
脳のアルゴリズムを理解しようとする現在のパラダイムは、機能分解と呼ばれるもので、皆さんもよくご存知だと思います。認知、知覚、意思決定といった計算機能があり、それらの基盤となる脳領域を見つけようとします。
神経科学の成功の多くがこのパラダイムから生まれているとはいえ、2つの大きな課題があります。
ひとつは機能が高度に分散していることです。これは過去20年間で多くを学んだことです。言語はブローカ野とウェルニッケ野だけで実装されているのではありません。現在では、これは非常に明確で、多くの脳領域に分散していることがわかっています。視覚的物体認識も非常に分散した領域で起こります。意思決定も一つの場所では起こりません。
同様に、単一の機能を割り当てたい脳の特徴が、実際には非常に多目的であることがわかります。ドーパミンが良い例です。ドーパミンに一つのことをさせたいのですが、ドーパミンについて学べば学ぶほど、それが多くのことをしていることが明らかになります。
進化的アプローチの提案
私たちが理解してきたのは、認知操作と領域の間の期待されたマッピングが実際には実現していないということです。そこで、一つ深いレベルに進み、「もしかしたら機能を領域に割り当てるのではなく、アルゴリズムはどうだろうか」と言う、計算神経科学の新たな世界が生まれています。
これは素晴らしい研究アジェンダですが、これにも課題があります。なぜなら脳は非常に複雑だからです。Vernon Mount Castleが1970年代に神経マイクロ回路について話して以来、私たちはまだそれが何をしているのか本当には知りません。
私が主張したいのは、私がツールボックスに追加しようとするツールが最良のツールではないかもしれませんが、十分に活用されていないツールだということです。進化は、アルゴリズムが何かを逆算しようとする新しい方法論を与えてくれます。
ご存知の通り、人間の脳はゼロから設計されたものではありません。長い一連のステップを経て出現しました。そして進化のステップは制約があり、経路依存的です。つまり、事前のステップが何だったかがわかれば、後続のステップが何をしていたかについての情報が得られるのです。つまり、順序立てられた出来事のセットは、出現するシステムを理解するのに有用なのです。
進化的枠組みの必要性
これは、もし最初の脳から始めて、実装されたアルゴリズムを理解し、時間の中で重要な修正を追跡していけば、おそらくその最終的に見る出現システムについて何らかの洞察が得られるという新しいアイデアを与えてくれます。
この進化的アイデアは長い間存在してきました。MacLeanの三重脳は非常に有名なものです。しかし、これは様々な理由で大部分が脇に置かれてきました。ひとつは、この進化的物語が間違っていることが今ではわかっているからです。脳は層を追加するだけで進化したのではありません。爬虫類も私たちと同様に大脳辺縁系を持っています。ここでの線引きは明確ではありません。
これも機能分解と同じ問題を抱えています。感情が大脳辺縁系にのみ存在し、大脳新皮質には存在しないということはありません。また、これは基盤となるアルゴリズムについて実際には何も教えてくれません。
私たちが必要とするのは、新しい進化的枠組みです。比較心理学についてのすべての新しい理解、AI における知能の基盤となるアルゴリズムについての理解を考慮した枠組みです。
進化の神経生物学的変化
面白いことに、進化の神経生物学は実際によく研究されているのです。私たちはすでに、最初の脳から人間の脳まで順序立てられた出来事のセットを知っています。これは非常によく研究されています。
ここで見ることができるのは、最初の動物から私たちまでの系譜を描いているだけで、この長い系譜を通じて主要な神経生物学的修正として広く知られているものを描いています。私たちはこれをすでに知っていますが、これは私たちが求める質問の答えを実際には教えてくれません。これらの修正の適応的利益は何だったのか、それらが可能にした新しい能力は何だったのか、実装されていたアルゴリズムは何だったのかということです。
行動能力の出現を追跡する
私がこれに本当に興味を持ち、研究を始めたとき、私にとって興味深くなったのは、私たちの系譜を通じて出現する行動能力の順序立てられたセットを逆算しようとするメタ分析が実際には存在しなかったことです。
そこで私が決めたのは、このメタ分析を行うことでした。私が考え出したのは、進化系譜のいつ特定の行動能力が出現したかを推論するための標準的な比較アプローチを使うことです。
詳細にはすべて入りませんが、行動能力がこのグループの最後の共通祖先の前に出現したと主張したい場合、3つの一般的な条件が真であるべきです。このグループのほとんどのメンバーが、相同的領域から出現するこの能力を行えるべきです。このグループの人々がこの能力を行えないか、もしそれを行うなら非相同的領域から出現しているべきです。そして、なぜこれがこの幹グループで出現したのかについての理解があるべきです。
これを行う例を示しましょう。これはアロセントリック空間マッピングタスクです。これは異なるグループや種で一貫して行われている数少ないタスクの一つです。
このタスクの仕組みは、これらの小さなカップの一つに少し食べ物を入れ、どれに食べ物が含まれているかについてカップに信号はありません。つまり、魚が食べ物がどこにあるかを理解できる唯一の方法は、外部の地図に対する自分の位置を理解することです。
魚はこのタスクを見事に解決できます。食べ物を取り除いても、嗅覚的信号がないのに向かっていくのです。これは実際に多くの異なる種で テストされています。ミツバチは非相同的領域からできる可能性があり、頭足類もおそらくできますが、多くの種で多くの陰性結果を見ます。
これは、アロセントリック位置を記憶する能力が初期脊椎動物で出現したとかなり高い信頼度で推論できる例です。
重要な注意点
生物学者でいっぱいの部屋には特に重要な重要な注意点は、人間の進化系譜について話すとき、私たちは既存のすべての動物と排他的に比較しているわけではないということです。空間マッピングが初期脊椎動物で出現したと主張することは、脊椎動物のみが空間マッピングを持つということと同じではありません。飛行が複数回独立して進化したのと同じように、収束進化は常に起こります。
行動能力の進化的出現
このメタ分析を行うと、進化時間を通じて出現する能力の全体的なスイートを見ることができます。もちろん、正確な年を知るほどの極端な忠実度はありませんし、これらすべてが一つの遺伝的突然変異で起こったわけでもありませんが、6億年の脳進化を広く見ると、これらの行動能力がどこで出現したかについて合理的な理解が得られます。
重要な質問は、これがアルゴリズムについて何かを教えてくれるかということです。空間マッピングが出現したと言えることは、脊椎動物の出現で何が変わったコアなことか、哺乳類の出現で何が変わったコアなことかについて深く教えてくれるわけではありません。
最初の動物:化学勾配追跡
24分では明らかにすべてのマイルストーンを説明する時間がないので、時間を遡る簡単な物語をしましょう。もちろん、これは多くの他の人々の研究のメタ分析で、私はそれを相互に関連付けているだけです。
最初の動物には脳がありませんでした。動物が進化したとき、脳はなく、神経網がありました。サンゴは通常、最初の動物のモデル生物として使用されます。確実ではありませんが、おそらく脳がなく、約5億5000万年前に最初の両側動物で最初の脳が進化したことがわかっています。
それらが両側動物と呼ばれるのは、中央平面に対して左右対称だからです。これらの放射対称動物と両側動物を見るとき、核心的な違いは、これらの両側動物が食べ物を見つけるために動き回っていたということです。重要な違いは、最初の動物はおそらく無柄で、食べ物が来るのを待っていたが、最初の両側動物は実際に食べ物がどこにあるかを特定しようとしていたということです。
彼らが実際に何をしたかを理解するために、モデル生物を使いましょう。線虫はこれの素晴らしいモデル生物で、C. elegansは302個のニューロンを持ち、目も耳もないのに、食べ物を見事に見つけます。
その方法は化学勾配を追うことです。おそらく部屋の皆さんがよく知っているものを利用しています。食べ物の断片があると、化学プルームが作られます。非常にシンプルなアルゴリズムがあります:食べ物の匂いが増加しているなら前進し、減少しているならランダムに回転するのです。
線虫は食べ物を見事に見つけ、線虫の脳に入ると、もちろんこれより複雑ですが、このアルゴリズムがかなりエレガントに実装されているのがわかります。彼らは実際には人間のように価値や物事の良し悪しを脳の深部で計算していません。あなたの目、網膜、目のニューロンは実際には価値を計算していません。それは視床下部のようなより深い場所で起こります。
線虫のような最初の脳では、そうではありません。彼らの感覚ニューロンは、検出したものに向かって進みたいか、検出したものから離れたいかの投票を直接エンコードしています。
線虫の行動状態とアルゴリズム
もちろん、世界は実際にはこれほど単純ではありません。勾配は実際には希薄で、ノイジーで、塊状です。現実世界では、右側のようなものが得られます。流れがあります。
実際に線虫を追跡すると、非常に興味深いことがわかります。感覚入力がない場合でも持続する行動状態があることがわかります。
一般的に、C. elegansが持つ3つの状態があります。ローミング:素早く動き、まれに回転する、つまり再配置。ドウェリング:非常に頻繁に回転する、局所探索のような状態。そして睡眠状態があります。
興味深いことに、これはルンバで使用されているアルゴリズムです。なぜなら世界は塊状だからです。ルンバが汚れを検出すると、実際にはもう汚れを検出していなくても、非常に急速に回転し始めます。なぜかというと、汚れを検出したとき、まだ検出していなくても近くに他の汚れがある可能性が高いからです。
さらにクールなのは、これを駆動する基盤となる神経調節物質が実際に脊椎動物、さらには無脊椎動物の核心的感情世界のテンプレートを明らかにしていることです。
これらの行動状態を駆動するものは何でしょうか。C. elegansの外部で細菌の存在を検出する文字通りのニューロンがあります。それらはドーパミンニューロンです。線虫が近くの食べ物を検出すると、脳をドーパミンで満たし、この搾取的なドウェリング行動を駆動します。これは文字通り近くの食べ物の信号です。
C. elegansのセロトニンニューロンは何をするのでしょうか。喉にある食べ物を検出し、より多くのセロトニンが放出されると睡眠や休息を駆動します。線虫の非常に基本的な神経生物学の中に、この一般的な感情のテンプレートが現れているのがわかります。
線虫の外側で食べ物を検出するドーパミンニューロン、内側のセロトニン、そして近くの報酬の平均というこの非常に最初の基本的出発点から、ドーパミンがどのように精緻化されるかがわかります。
脳の必要性:トレードオフの決定
なぜ脳が必要なのでしょうか。トレードオフを行うために脳が必要です。線虫が、好きではない銅バリアを越えて反対側の食べ物にたどり着くかどうかを決めなければならないときに何が起こるかを研究できます。これは彼らの空腹と各々の相対的レベルの両方に依存します。これらは共通の場所に収束しなければならず、前進ニューロンと回転ニューロンが共通の決定を行うために相互に抑制し合うのがわかります。
ここでのアイデアは、初期両側動物で出現するすべてのものを見ると、複雑な感覚器官を持たずに海底を航行するために、単純にタキシスアルゴリズムを実装する必要性というシンプルなレンズを通じて理解できるものが実際に魅力的に多いということです。
つまり、最初の脳の目的は、おそらく単にタキシスアルゴリズムを実装することだったという考えです。
最初の脊椎動物:強化学習の出現
時間が足りないことに気づいているので、最初の脊椎動物に早送りしましょう。最初の脊椎動物脳テンプレートの出現が見られます。
この研究を始めたときに最も興味深いと思ったことは、おそらく皆さんはよくご存知でしょうが、人間の脳の仕組みを理解したいなら、魚の脳を研究するだけでかなりのところまで到達できるということです。魚の脳には前脳、中脳、後脳という人間の脳の基本テンプレート全体があるからです。人間の脳のすべての基本構造が、ヤツメウナギの脳にさえ既に見られます。
すべての核心的感覚器官が脊椎動物と共に出現しました。明らかに彼らの脳は魅力的な感覚処理を行います。空間内の位置を記憶でき、間隔タイミングができ、匂いパターンを認識でき、人間の基本的感覚装置のすべてが脊椎動物の出現で既に見られます。
彼らは報酬を得るために本当に任意の行動シーケンスを学習できます。これは私たちが強化学習でAIシステムでやり方を理解し始めたばかりのことです。魚に迷路を通り抜けることを教えることができ、1年後でもそれを覚えています。魚に輪くぐりを教えることもできます。明らかに線虫や扁形動物にはこれらのどれもできませんでした。
神経科学とAIの間の最も美しいシナジーの一つを示すたくさんの研究が行われており、皮質と基底核の間の関係が時間差学習アルゴリズムに似たものを実装していることを示しています。
時間差学習アルゴリズム
AIでは、エージェントに強化学習を通じて学習させる方法、つまり報酬を最適化する方法を見つけることが大きな研究パラダイムの一つでした。Richard Suttonが発見したのは、その方法は単に報酬を得るものを繰り返すようにアルゴリズムを訓練することはできないということです。なぜなら時間的信用割当問題があるからです。
チェスゲームをしていて最後に勝った場合、どの手を強化すればよいのでしょうか。勝つ直前に起こった手だけを強化するなら、チェスが上手になるまでにあまり速く学習できません。
Richard Suttonが考え出したのは、強化学習が機能する必要がある方法は、チェスゲームの各瞬間で自分がどれくらいうまくやっているかの理解を持つ必要があるということです。自分のポジションが向上したと思う瞬間に、その行動を強化するのです。これは期待される将来報酬の時間差をシグナルする、アクター・クリティックというアイデアです。
魚でも脊椎動物の脳に入ると、ほぼ正確にこのアルゴリズムを実装する神経生物学的システムが見られます。これはこれら2つの分野間の魅力的なシナジーです。
近くの報酬の平均から明示的に計算された予測報酬信号へと、ドーパミンがどのように転用されたかがわかります。もちろん、最初の近似を行っており、簡略化していますが、最初の両側動物脳をこの価値システム、感覚入力、運動反応として考えることができ、初期脊椎動物脳は実際にパターンを認識し、それに基づいて試行錯誤に従事することを学習するためにこのシステムをその周りに構築したのです。
最初の哺乳類:新皮質とメンタルシミュレーション
前進して最初の哺乳類に行くと、哺乳類の脳の核心的違いは新皮質の出現です。以前に存在していた皮質の一部が6層構造に精緻化されました。
ラットの脳でさえ魚の脳とどれほど似ているかを学ぶのは、少なくとも私にとっては魅力的でした。核心的違いはこの新皮質構造です。もちろん、人間の脳を見ると、見えるもののほとんどが新皮質です。
なぜ新皮質が進化したのでしょうか。神経科学の教科書を読むことで推論できる標準的な議論は、知覚や運動と関係があるということです。なぜなら、実際に新皮質に入って調べると、それを損傷したときに障害されるもののようだからです。
しかし、新皮質が進化した理由は実際にはそれではなかったと私は主張します。なぜなら、初期脊椎動物が新皮質なしにこれらすべてのことを見事にできることは明らかに明確だったからです。
哺乳類の独特な能力
哺乳類が他のほとんどの脊椎動物に比べてユニークにできることは何でしょうか。鳥類のように、収束進化を通じて哺乳類ができることの多くをできる例外は確実にあります。
David Redishは私のお気に入りの研究をしました。ラットの脳に入ると、海馬という領域があり、そこには場所細胞があります。場所細胞をマッピングすると、迷路の各場所で活性化するユニークな細胞があり、場所細胞は常にラットがいる場所で活性化していることがわかります。
Tolmanは1940年代に、ラットを迷路に入れると、選択点に到達したときに前後を見回してから決定するという奇妙なことをすることに気づきました。彼はラットが可能な将来の経路を想像していると仮説を立てました。もちろん、行動主義運動の多くは「それは馬鹿げている、彼らが実際にそれをしているかどうかわからない」と言いました。
2000年代に、David Redishと彼のグループはラットの脳に入り、文字通りラットが自分の未来を想像しているのを観察しました。なぜなら、ラットが一時停止すると、海馬の場所細胞は現在の位置をエンコードするのを止め、可能な将来の経路のそれぞれをエンコードし始め、それから選択をするからです。ラットが自分の未来を想像しているのを見ることができるのです。
ほとんどの非哺乳類脊椎動物ではこれを見ません。魚の脳に入ると、場所様細胞も見つかりますが、それらは現在の位置のみをエンコードします。
反実仮想学習と挿話記憶
哺乳類は反実仮想学習にも従事します。興味深い時間ですが、簡単にスキップしますが、ラットが一時停止して代替的な過去の選択を想像し、それが将来の選択を変えることを明らかにする実験ができます。つまり、彼らは「私がしたばかりの選択を後悔している、違うことをすることを想像するつもりで、行動を変えるつもりだ」と想像することができるのです。
挿話記憶を明らかにする多くの研究もあります。これは論争の領域です。主に挿話記憶という用語に多くを込めるからです。挿話記憶とは、私は単に過去の出来事を心の中で再現する能力を意味します。挿話的な自己感覚や何かがあるという意味ではありません。
ラットがこれをできることは非常に明確です。選択を提示されたとき、過去の出来事を思い出すことによって異なる選択をすることができます。哺乳類が祖先のアミオテに比べて本当に優れた細かい運動技能を持っていることを示す多くの実験も行われています。
哺乳類のほとんどの運動技能をトカゲのそれらと比較すると、トカゲは実際には手の動きを予測しないことを示す多くの研究があります。それはより反射的です。
メンタルシミュレーションの概念
哺乳類で出現する新しい機能の核心的なもの – 代理的試行錯誤、反実仮想学習、挿話記憶、改善された細かい運動技能 – これらすべては実際にメンタルシミュレーションの異なる応用として理解できます。
これはAI世界でよく理解された概念で、実装方法のアルゴリズムはわかりませんが、世界のメンタルモデルを持ち、そのメンタルモデルで自分が行動を取ることを想像し、結果を正確に予測できるというアイデアです。
可能な未来をシミュレートでき、過去に異なる行動を取ることをシミュレートでき、過去の出来事をシミュレートでき、自分が異なる運動動作を行うことをシミュレートして自分を訓練し、実際の運動技能を向上させることができます。
時間がないので詳しくは説明しませんが、運動皮質は実際には運動制御の場所ではなく、初期哺乳類では実際には運動計画の場所であり、霊長類で転用されたことを明らかにする魅力的な研究がたくさんありますが、それはスキップします。
簡略化し過ぎていますが、哺乳類で起こったことの概略図を持ちたいなら、この全体の上にこの種の世界モデルシミュレーションを追加することと考えることができます。AI世界では、これをモデルベース強化学習と呼びます。
モデルフリーは脊椎動物に存在したと議論するもので、現在の状態の知覚に直接反応して行動を起こします。モデルベースは、私が一時停止し、世界のモデルを持ち、可能な未来を想像してそれに基づいて決定を下すことを意味します。
これはAlphaGoの動作方法です。AlphaGoはモデルベースRLシステムで、すべての単一モードで選択をする前に約40の異なる可能なシミュレーションを素早く実行しました。もちろん、AlphaGoのモデルは哺乳類の脳のモデルとは全く似ていませんが、原理は同じです。
最初の霊長類:心の理論
最初の霊長類に移りましょう。霊長類の脳は非霊長類哺乳類の脳と同じマクロ構造をすべて持っていますが、新皮質のいくつかのユニークな領域があります。
これらは何をしたのでしょうか。霊長類に入ると比較心理学により多くの論争がありますが、一般的に霊長類でユニークな心の理論能力が見られることにはほとんど合意があります。
これは古典的なサリーアンテストで、チンパンジーまたはこの場合はマカクが、他の誰かが世界について異なる理解を持っていることを実際に理解できるかどうかを見ようとします。
この俳優が入ってくるのを見て、人が何かを箱の下に置き、それから去ります。人が部屋から出ている間に再配置され、それから戻ってきます。どこを見ると思うかを知りたいのです。
これは古典的な心の理論の質問で、霊長類は実際にオブジェクトがある場所ではなく、彼らが思うオブジェクトがある場所の方向を見事に見ます。新しく進化した霊長類領域を抑制すると、この能力を失います。
霊長類にはユニークな模倣学習能力もあることがわかっています。霊長類は道具使用にユニークに優れています。ある種の原始的文化形態を持っていることがわかっています。一匹のチンパンジーに特定のタイプの技能や道具の使い方を教え、群れに戻すと、数ヶ月以内に群れ全体が全く同じ技術を使うようになります。ある種の模倣学習が起こっていることがわかります。
この研究はあまり行われていませんが、それでも非常に興味深いと思うのは、霊長類が実際に将来のニーズを予測することにおいて非霊長類哺乳類一般よりもはるかに優れている可能性があることです。
2006年に行われた研究があります。詳細には入りませんが、リスザルがまだ喉が渇いていないときに将来の喉の渇きを減らすために今日決定を下せるかどうかを見たかったのです。リスザルはそれができることがわかりました。将来の喉の渇きを減らすために今日より少ない食べ物を選ぶことができましたが、ラットはそれをしませんでした。
メンタライジング:思考について考える
この研究を人々に話すと、通常心に浮かぶのは「明らかにマウスは冬に備えて貯蔵する」ということです。これについても多くの研究が行われており、これは遺伝的にハードコードされていることがわかっています。マウスを檻に入れて温度を下げるだけで、貯蔵を始めます。実際に将来自分が空腹になることを想像しているわけではありません。
同じ一般的アイデアを取ると、基盤となるアルゴリズムがあるようです。私はメンタライジングというアイデアを主張します。これは自分の思考について考える(メタ認知)、または自分の内的シミュレーションをシミュレートすることが、実際にこれら3つのユニークな霊長類能力すべてを説明していると。
心の理論では理にかなっています。それが他の個体の思考について考える方法です。しかし、なぜこれが模倣学習や将来のニーズの予測に適用されるのでしょうか。
AIではこれは実際によく知られています。1989年に直接模倣を通じて自動運転車を訓練しようとしました。これは、私が運転するのを見るニューラルネットを訓練し、運転中の街を見て、私がすることを正確にしようとするニューラルネットを訓練することを意味します。
あまりうまくいきません。なぜかわかりますか?私がミスから回復するのを見ることがないからです。専門家だけを見ているので、ミスをすると、破滅的な何かに向かって連鎖し始めるだけです。
今日のほとんどの模倣学習システムが動作する新しい技術は逆強化学習と呼ばれます。直接コピーはしません。専門家が何をしようとしているかを理解しようとし、彼らがしようとしていることは道路の中央に留まることだと学習します。彼らの報酬関数を推論し、専門家から採用した報酬関数を最適化するように自分を訓練します。
Andrew Ngは有名にこの技術を使ってヘリコプターに素晴らしいトリックをするよう訓練しました。直接コピーをすると、これはうまくいきません。
これは、なぜメンタライジングが重要かを理解するのに役立ちます。あなたの行動をコピーしようとしているなら、模倣が実際に得意になるためには、なぜあなたがしていることをしているのか、あなたの意図を理解する必要があります。
Thomas Suddendorfは、なぜ将来のニーズの予測と心の理論が関連している可能性があるかについて本当に優れた理論を持っています。概念的には比較的シンプルです。
「24時間食べなかった後、ジェームズは何を欲しがるだろう」という質問をすることを想像してください。それは心の理論の質問です。それは「24時間食べなかった後、私は何を欲しがるだろう」という質問をすることと、アルゴリズム的に本当に異なるでしょうか?あなたは現在のものから切り離された心の状態を想像しようとしているだけです。
これは、これらが実際に同じことの3つの異なる実装である理由についていくつかの洞察を提供するかもしれません。一つは他の誰かに心を投影すること、一つは他の誰かに心を投影して運動技能をシミュレートすること、もう一つは自分の将来の心の状態を投影しようとすることです。
言語の進化
言語については、これが十分に研究されているので、非常に速く進みます。確実にわかっていることは、言語は霊長類コミュニケーションの拡大版ではないということです。フーツや鳴き声のような非人間霊長類は非新皮質領域から来ます。それが、関連していないにもかかわらず、非常に一般的な霊長類コミュニケーションシステムを見る理由です。
言語には実際にユニークな脳領域がないことも知っています。これは私が魅力的だと思ったことで、私が受けた大学の神経科学クラスの一部ではありませんでした。ウェルニッケ野とブローカ野は他のすべての霊長類にもあり、明白な構造的違いはありません。意味のある構造的違いを見つけようとするのは骨の折れることです。
文献で最も説得力があると思う議論は、実際に進化するのは言語のためのユニークな学習プログラムだということです。私たちは幼い頃に言語を採用するユニークな本能を持っています。例えば、人間は注意の指差しに従事し、同じオブジェクトに注意を向けたがります。幼児も順番交代に従事します。
言語とメンタライジングがいかに相互関連しているかがわかり、今日の言語モデルで特にこれを見ることができます。私たちがお互いにコミュニケーションするとき、常に相手が何を意味したかを推論しようとしています。これは、メンタライジングが言語進化の必要前提条件だった理由を説明するかもしれません。
私が「紙クリップの生産を最大化してください」と言う理由は、これがNick Bostromの超知能本の有名な寓話だからです。AI システムに「紙クリップの生産を最大化してください」と言って、それが地球を紙クリップに変えることを想像してください。明らかに私たちはそれがそうすることを望んでいません。
核心的問題は、言語で目的を述べることは実際には非常に困難だということです。私たちの心の働きを理解しない何かと相互作用していることに気づき始めると。つまり、メンタライジングは言語にとって鍵なのです。
人間知能のアルゴリズム的進歩
これを行うと、人間知能への道のりで起こった重要なアルゴリズム的進歩の一般的な第一近似が得られます。これはもちろん第一近似で、人間進化の全体の総和では決してありませんし、もちろんこれほど線形でもありませんでしたが、第一近似として、脳が実際にどのように働くかについて非常に示唆に富むと思います。
これらのものがお互いにどのように構築されるかがわかります。これが進化のオープンエンデッドシステムの魅力的なところです。報酬の基本的アイデア、世界を良いものと悪いものに分類することから始まり、それがそもそも報酬関数の概念に基づく強化学習システムを可能にし、それがシミュレーションを可能にします。なぜなら、実際の行動を通じて自分を訓練する代わりに、異なるタスクを行うことを想像して代理的に自分を訓練できるからです。
物事について考えているメンタルワールドを持つとき、実際にその思考自体について考えることができます。つまり、自分の知識がどこから来るかを理解でき、それによって言語が可能になります。
もう一つのテーマは、より多くのデータソースへのスケールアップです。AI世界ではより多くのデータソースへのスケールアップがすべてですが、進化でも本当に興味深い方法でこれを見ることができます。
人間知能の進化をフレームする一つの方法は、より多くの学習ソースを獲得することです。初期脊椎動物の強化学習は実際の行動から学習するアイデアです。過去に起こったことに基づいて将来異なる行動を取ることを学習しています。
シミュレーションは新しいデータソースを追加します。想像から学習できます。異なる経路を想像でき、世界のモデルが十分にリッチなら、実際にそれによってより賢くなることができます。
メンタライジングは他の人々の行動からも学習することを可能にしました。それが模倣学習です。言語によって、あなたの想像からも学習できるようになりました。なぜなら、あなたの心の中で起こっていることを自己報告できるからです。
このデータソースの拡張が見られます。
結論:なぜこれが重要なのか
重要なアイデアは、多くの異なる知的技能が、以前のものの上に構築された共通のアルゴリズム的進歩から来ているように見えるということです。
最後のスライドです。なぜこれが重要なのか、このツールが実際にどのように私たちを助けるのか。本当に有用だと思ういくつかのことがあります。
一つは、機能的分割のみを通じてではなく、脳全体として解釈するのに役立つということです。例えば、新皮質は何をするのかを問うのではなく、新皮質を追加することでどのような能力が可能になったのかを問うことができます。これらは異なる質問です。最初のものは脳の他の構造との関係を理解することを可能にし、2番目のものは可能にしません。
第二に、様々な修正の機能の解釈に制約を追加します。例えば、運動皮質は運動制御のためだと考えたがりますが、進化的文脈を通じて見ると、実際には最初に運動計画のために進化し、後に運動制御のようなものに転用されたことが非常に明確になります。
評価すべきアルゴリズムのクラスを狭める。シミュレーションやメンタライジングなどの基盤となる実際のアルゴリズムを明らかに示していないので、作業はまだ終わっていません。しかし、新皮質を調べるとき、シミュレーションと関係のある何かを探すべきだと理解しているので、クラスを狭めるのに役立ちます。
多目的神経生物学的特徴を説明するのに役立つ。人間の脳でのみ見るとドーパミンの物語は非常に多くのことをするので、ほとんど煩わしくなります。進化時間を通じて見ると美しくなります。平均報酬のシグナルが学習シグナルにも転用され、次に哺乳類でその同じシグナルが作業記憶に使用されます。なぜなら、それが高いなら、おそらく前頭前皮質で表現を維持したいからです。それからそれがそのために転用され、これらの異なる機能すべてが物語を見るときに理にかない始めます。
これが私の講演です。申し訳ありません。少し超過してしまいました。
質疑応答
デフォルトモードネットワークについて
質問者:私はアレックスです。デフォルトモードネットワークをどのように得たのか、本当に興味があります。これについて少し話していただけますか。また、これをAIでどのように使用できるでしょうか。
デフォルトモードネットワークについて興味深いのは、一時停止して外界のシミュレーションをレンダリングする構造のようだということです。生成モデルの一部として、シミュレーションまたは想像と知覚を相互関連させます。
生成モデルは自分の入力を予測しようとすることで世界をモデル化することを学習します。人々が新皮質が部分的に行っていると考えるのは、これらのものを見ることで世界のモデルを学習し、見ているものと一致する何かを内部的にレンダリングすることです。
想像する方法は、入ってくる感覚入力を遮断し、内なる心を探索することです。しかし、シミュレーションを知覚に合わせるのか、一時停止して物事を想像するのかを脳が決定する何らかの方法が必要です。
予測コーディング世界のいくつかの理論では、デフォルトモードネットワークは外部のことについて考えていないが内部のことについて考えているとき、反芻しているときに起こっていることです。
人間の暴力的傾向について
質問者:Barry Levyからです。他の人間に対する暴力に従事する傾向など、人間の脳における逆進化的名残をどのように理解できるでしょうか。
霊長類学の研究について学び始めたとき、本当に興味深いことの一つは、私たちの最悪の本能の多くが霊長類の遺産から来ていることでした。霊長類が互いに非常に政治的で冷酷な相互作用を持つことを容易に見ることができるからです。チンパンジーのグループが互いに戦争をするのを見ることができます。
私たちの最悪の本能の一部は、霊長類の祖先に存在していたこの政治的階層から来ています。AIシステムを構築しようとするとき、私がよく受ける共通の質問の一つは、実際にAIシステムで人間の知能を要約したいのか、それともより良いものが欲しいのかということです。
私がいつも言うのは、私たちがしたいことは人間の知能を理解して、意図的に特定のものを除去し、他のものを追加できるようにすることです。これは私たちが確実に除去したいもののタイプの素晴らしい例です。
このタイプの本能が本格的に出現したと思われる進化史のどこかを知っています。それは初期霊長類でした。他の人々の心を理解する能力と高度に関連しているようです。そこで嘘をつく能力を得始めます。
他の誰かの心の状態を想像する能力によって、あなたが持っている知識を操作するための行動を取り始めることもできるようになり、霊長類のグループで欺瞞と反欺瞞のサイクルが起こるのを見ます。
心の理論と批判的思考について
質問者:私の質問は心の理論、批判的思考、実行機能、前頭前皮質に関してでした。それはリモートビューイングや幽体離脱などに結びついていました。これらのほとんどは疑似科学と考えられていますが、政府機関は何十年もそれを行っており、インターネット上にスターゲートがありました。
この問題についてコメントしたいなら、それで結構です。
二元論の質問は依然として強く立っていると思います。私は確実に機械論的側のキャンプに属しており、脳の全体が脳で起こっていることの単純な物理的基盤で理解できると考えたいと思いますが、Roger Penroseは意識と量子力学の関係について本当に興味深いことを言っています。
あなたが持ち出していることには、次の10年間で現れる非常に現実的な倫理的質問があり、誰も話していません。現在ほとんどの人々は心配していませんが、5年後に科学者が意識があるとは信じていないが、実際の人間と相互作用することと全く区別がつかないAIシステムを持ったとき、何が起こるでしょうか。
社会のどの部分がそのシステムに道徳的権利を与え、意識の知覚を与えるでしょうか。もしかしたら彼らが正しいかもしれません。わかりません。そのシステムが私たちの召使いになるように構築されることは受け入れられるでしょうか。彼らの同意なしに彼らの心に介入し、変更することは受け入れられるでしょうか。
これらは、非常にサイエンスフィクションのように思えるので考えないタイプのことですが、AIシステムが実際に意識を持つかどうかに関係なく、社会が明らかにそうであるかのように反応し始めるため、私たちは既に関連し始めていると思います。
脳とコンピューターのインターフェース
質問者:60年前にタフツの学生で、今MITにいた若い教授Marvin Minskyを思い出します。人間の脳とコンピューターの間のインターフェースが可能だと思いますか。本を読むためにUSBドライブを何らかのインターフェースに差し込んで、脳内のすべての情報を自動的に更新するというような。
それが可能になることを高度に懐疑的です。哺乳類の生物学的脳で学習がどのように起こるかについて、Marrの3つのレベルの一つ深いレベルに実際に行き、実装を見ると、コンピューターがファイルをダウンロードできる方法で学習を加速できるかは明確ではないからです。
例えば、チェスのプレイ方法を学習したい、またはギターコードを弾く方法を学習したいなら、実際にギターコードを弾く行動を行う必要があり、運動皮質でその運動行動を活性化する必要があります。それを一度にハードコードすることはできません。それには反復が必要です。神経可塑性の長期間のプロセスが必要です。
ミュージシャンで見ることができるように、運動皮質の特定の折り目が拡張されているのは、はるかに多くの接続があるからです。シナプスが機能する方法の根本的変化なしには、コンピューターでできる方法で学習の基盤となる生物学的プロセスを加速できるかは明確ではありません。
意識と進化について
質問者:意識について戻りたいのですが、モンタナとワイオミングを運転している間、それについて多く考えていました。あなたが今日説明した進化的プロセスと意識が何かの違いを見分けることは非常に困難で、AIが意識的かどうかは無関係に思えます。ある程度、それがあなたが言っていることでしょうか。
知的関連性の意味では非常に興味深いので、わかりません。しかし、AIシステムを持つことの社会的結果に関連するかどうかを尋ねているなら、人々の大きな群れが彼らが意識を持っているかのように扱い始めるので、それは完全に無関係だと同意します。完全に同意します。


コメント