生物学的および人工知能とマックス・ベネットによる知能の簡潔な歴史

生命・生物学
この記事は約82分で読めます。

本稿は、Blue Core共同創設者でAI専門家のマックス・ベネット氏が著した「A Brief History of intelligence evolution Ai and the five breakthroughs that made our brains」に基づく対談の書き起こしである。ベネット氏は、600万年にわたる生物学的知能の進化を5つの重要な突破として整理し、それぞれが現代のAIシステムと比較してどのような示唆を与えるかを論じている。第一の突破は「操舵」で、最初期の二側対称動物における基本的な価値判断システムの出現を扱う。第二は「強化学習」で、脊椎動物における試行錯誤学習の発達を論じる。第三は「シミュレーション」で、哺乳類の新皮質における未来予測能力の進化を分析する。第四は「心の理論」で、霊長類における他者の意図理解能力を考察する。第五は「言語」である。この対談では、これらの生物学的突破が現在のAI開発にどのような洞察を提供するか、また人工知能と生物学的知能の根本的な違いについて深く掘り下げている。

汎用人工知能は存在するのでしょうか。知能全般が現れる単一の原理があるのでしょうか。それとも私たちは10年後、20年後に目を覚まして、実際にはAGIなどというものは存在しなかったと気づくのでしょうか。確かにタスク間で起こる一般化の程度は異なりますが、すべての実体は、直面する特定のタスク群に特化しているのです。

ファインチューニングの問題は、過学習の問題がすぐに発生することです。小さなファインチューニングデータセットに過適合してしまい、一般化能力を失ってしまうのです。以前できていた古いタスクを忘れてしまうのです。これは微妙なエッジケースではないと思います。これはこれらのモデルの動作方法における根本的な問題なのです。

では、哺乳類の脳は新しい情報をいつ取り込むかをどう決定し、他の情報に干渉することなく世界のモデルにどう追加するかということは、現在のAIシステムが世界をシミュレーションしモデル化する方法と哺乳類の脳の方法の重要な違いだと思う巨大な未解決研究分野なのです。

こんにちは、Cognitive Revolutionへようこそ。私たちは人工知能の最前線で働く先見的な研究者、起業家、開発者にインタビューしています。毎週、彼らの革命的なアイデアを探求し、一緒にAI技術が今後数年間で仕事、生活、社会をどう変革するかの全体像を構築していきます。私はネイサン・レーベンス、共同司会者のエリック・トルバーグと一緒にお送りします。

こんにちは、Cognitive Revolutionへ再びようこそ。今日は、Blue Core共同創設者で「A Brief History of intelligence evolution Ai and the five breakthroughs that made our brains」の著者であるマックス・ベネットさんとお話しします。

このタイトルを見た瞬間、私はすぐにこの本を購入しました。なぜなら、AIシステムが人間と機能的に同等になるまでに、あと何回の概念的突破が必要なのかをしばらく自問していたからです。もちろん答えは分からないのですが、注意だけで十分であり、ハイパースケーリングが大きなアーキテクチャ革新なしにすべての実践的問題を解決するということが判明しても驚きますが、完全にショックを受けることはないでしょう。

一方で、必要な突破の数が5つを超えることが判明した場合も、やはり非常に驚くでしょう。私の最良の推測は2つか3つですが、それでも重要な後続の質問が残ります。人間が行っている重要なことで、AIシステムがまだできないことは何か?物理的な実体化と多モーダル入力は私たちの全体的な認知に必要なのか、それとも進化の歴史の単なる人工物なのか?

私たちはどのようにして記憶を効率的かつ有用に表現し、単一の経験でさえ生涯にわたって行動を形作ることができるのでしょうか。どの新しい情報を世界モデルに組み込み、何を拒絶し、何について不確実なままでいるかをどう決定するのでしょうか。心の理論はどこから来るのか、それは敵対的堅牢性に必要なのでしょうか。効果的な計画、そしておそらくもっと重要な主観的な意識的経験のために、ある種の階層的な自己モデリングが必要なのでしょうか。

これらは巨大な問題です。AIシステムがより強力になり、少なくとも表面的にはより人間らしい方法で行動するようになるにつれて、人間とAIの認知の主要な類似点と相違点を可能な限り文字通りの機械論的な用語で理解することがますます重要になると私は信じています。

その目的のために、この対話とそれに基づく本は極めて価値のあるリソースです。私は確実に、マックスが概説する5つの突破を、AIの新しい発展を熟考するレンズとして参照し続けています。

もちろん、生物学的システムは非常に混乱しており、工学的システムとは違った方法で制約されています。生命は継続的に恒常性を維持しなければならない一方で、AIモデルは主に特定のハードウェアから切り離されており、人間がデータセンターを維持しています。進化は包括的遺伝的適応度を改善する漸進的変化しか選択できない一方で、人間のエンジニアは不連続な段階変化の進歩を発見することができ、時にはそうします。

鳥の飛行がライト兄弟の初期の飛行機設計にインスピレーションを与え情報を提供したが、最終的には今日のジェット機の速度とパワーに凌駕されたように、人間の認知の歴史は新しいAI開発に対する私たちの理解と将来のシステムに対する期待を知らせることができますが、私の見解では、そしてマックスも同意すると信じていますが、確実にそれらの全体的な発展の限界を表すものではありません。

いつものように、このショーに価値を見出していただけているなら、友人と共有していただけると嬉しいです。Apple PodcastやSpotifyでのレビューは素晴らしいですが、シンプルなツイートでも大いに価値があります。

それでは、起業家で著者のマックス・ベネットとの知能の歴史について、生物学的および人工的な観点からの対話をお楽しみください。

Blue Core共同創設者で「A Brief History of intelligence evolution Ai and the five breakthroughs that made our brains」の著者であるマックス・ベネットさん、Cognitive Revolutionへようこそ。こちらこそ、お招きいただき興奮しています。

私は最近、最終的にあなたの本とこの議論に導いたある旅路にありました。AI obsessiveな視点から来て、人間の脳がAIに欠けているものを何をしているのかについて考えることがますます多くなっていました。それが、明らかに私たちがやっていることでAIがやっていないことがあるという動機でした。

しかし、それを整理する方法、スキーマが欠けていました。そこで、人間がやっていることの良い分類法をした人を探しに行きました。比較対照できるようなものです。そして、あなたが少なくともその本の一版を書いていることが分かりました。最も単純な生物から今日まで進化の歴史を通じて私たちを導いてくれます。

明らかに、AIでの経験があり、最近はタイトルにAIを入れずにはいられませんし、確実にそれについての議論もあります。この対話を2つの部分に分けたいと思います。まず本当に本の議論を詳しく説明し、次にそこから何を取れるかを見て、AIについての世界観と期待も知らせることができるでしょう。

まず始めに、一般的な背景について少し話していただけますか。特に、複数の異なる思考と学問の系統をこの本で提供された分析にまとめた方法に興味があります。

確かに、私の背景は主にAI技術の商業化にあります。Blue Coreという会社を構築することに経歴の大部分を費やしました。大規模なeコマース企業向けに多くの深層学習モデルを商業化しました。推薦システム、セグメンテーションの多くの作業をしました。これは現在のpre-transformers AIです。昔ながらのAIです。

それは本当に素晴らしい経験と旅でしたが、これらのモデルを取って実際のビジネス価値を追加しようとする実用的なユースケースに持ち込む際に常に困惑したのは、AIモデルや機械学習モデルが本当に得意なことと人間の脳が本当に得意なことの間の食い違いがいかに困惑するものかということでした。

当時、人間ができる非常にシンプルなこと、例えば服装をどうまとめるかについての常識を持つことは、AIモデルにそれらについての常識を持たせることが天文学的に困難なことでした。これらのことは今少し良くなっていますが、当時はそれは信じられないほど大きな挑戦でした。

それで、脳と現代のAIシステムの間で何が欠けているのかについて常にこの種の好奇心を持っていました。それが、神経科学者とメールで文通を始めるというサイドプロジェクトに導きました。教科書を読み始め、自己学習をし始めました。

それがいくつかの興味深いアイデアに導き、いくつかの論文を発表し、いくつかの神経科学者と協力することになりました。そしてそれが本のアイデアを持つことに雪だるま式に発展し、1年休暇を取って書くことにしました。

その間ずっと、私のメンターである多くの人々と協力していました。デリップ・ジョージ、カール・フリストン、ジョセフ・ルドゥー、デビッド・レディッシュです。これらはすべて私のメンターになった人々で、道筋を導いてくれ、私が持った愚かなアイデアを気づかせてくれました。

それが本当に素晴らしい旅で、そうして本が作られました。私にとって、本をユニークにするアイデアの核心は、おそらく部外者が入ってきて物事をつなぎ合わせようとしなければ行われなかったであろう3つの異なる研究分野を本当にまとめていることです。

3つの研究分野は、まず進化神経科学です。これは過去6億年間にわたって脳がどのように生まれたかのストーリーアークをつなぎ合わせようとするアイデアです。この分野から知識の巨大な新しい断片が現れたのは、過去10年だけでも実際のところです。これは実際には比較的小さな分野ですが、動物界の異なる脳を見ること、遺伝子分析を通じて、これらすべてのことが私たちがその物語を本当につなぎ合わせるのを助けてくれた現象的な研究がありました。

第二の分野は比較心理学で、異なる種の異なる認知的・知的能力を実際に分析しています。それは明らかに進化神経科学と組み合わせて、私たちの祖先の認知的知的能力が何だったかを逆算するために使用できます。これは本当に議論されていないことです。

私はそれについていくつかの論文を書きました。既存の哺乳類ができること、非哺乳類脊椎動物ができること、進化神経科学が彼らの脳に存在することを示唆することから、最初の哺乳類が何をすることができたかを実際にどう推論するかということです。

第三の分野はAIで、これはこの全体の探求にとって本当に不可欠だと思います。なぜなら、AIは本当に私たちを現実に根差させるからです。認知神経科学の分野では、心がどう働くかについての概念について哲学的になりがちだと思います。それは素晴らしく実り多く洞察に富んでいると思いますが、AIについて私が好きなのは、私たちが実際に言っていることを理解しているかどうか本当に私たちを根拠づけることです。

もしそうなら、その非常に基本的な形を実装できるはずで、どれだけうまく機能するかをテストできるはずです。AIは私たちがどれだけ実際に言っていることを理解しているかのリトマステストのようなものだと思います。AIは私たちの直感の多くが間違っていることを本当に教えてくれました。

強化学習はおそらくここで最高の形式だと思います。動物が試行錯誤によってどう学ぶかについての多くの直感がありました。実際にこれらのことを機械に実装しようとすることによってのみ、その直感がうまくいかないことを学びます。そして、実際に機械を動作させる方法は、この他のアプローチであることを学びます。これは実際に脳がそれを行う方法のようです。

本当に美しいフィードバックループがあります。要約すると、本のアイデアは比較心理学、進化神経科学、AIを取って、それらを一緒に統合し、脳がどのように生まれたかの第一近似を作り上げ、AIのための洞察がそこにあるかを見ることです。

いくつかの洞察があると思います。それが必ずしもAIをどう構築するかの明示的なロードマップだとは思いませんが、第一近似として、人間の脳がどう機能するかの側面を照らし出し、少なくとも今日の既存のAIシステムがどう機能しているかとは異なると思います。

さあ、5つの突破のそれぞれに入る前に、本を読んでいて、そしてあなたがした他のインタビューのいくつかを見ていて、飛び出したことの一つは、本を通じて期待するかもしれないものが見つからないことです。知能の定義です。それは良い出発点のように思えますが、明らかにあなたはそれをスキップしました。なぜ私たちはこの用語を定義することを完全に避ける方が良いと思うのでしょうか。

それは良い質問です。その質問をたくさん受けました。回顧すれば、もっとそれについて話すべきだったかもしれません。私の理由を説明します。

知能のすべての既存の定義をカタログ化したとき、この分野のいくつかの卓越した専門家は知能を意味のある形で異なって定義していますが、彼らの知能の異なる定義は、研究アジェンダへのアプローチを異なってさせません。つまり、知能は私たちが一般的に研究することに興味があるものについて直感的に理解している概念ですが、特定のものに鳩の巣に入れようとすると、その価値を得るのは非常に困難で、一つの定義に鳩の巣に入れても、まだ同じ種類のトピックを研究することになるからです。

ブリック・クルツとの素晴らしい会話がありました。彼は知能を学習として定義しています。私はそれは合理的だと思います。それと一緒に行くのが合理的な定義だと思います。しかし、フェイの定義を使った場合に何かが変わるかどうか分かりません。フェイの定義は、変化する環境での挑戦に対処し問題を解決できるエージェントについてのはるかに広いものです。

後者を学習なしに解決できる実体を想像することができます。だから、それが研究の物語をあまり変えないと思ったので、それを避けました。そして、私が満足する定義も持っていません。

これは興味深いです。確実に定義について、そして定義から議論することに多くの時間が無駄にされていると思うので、そのステップをスキップすることにはある種の知恵があると確実に見ることができます。AIから学んだことの一つは、奇妙なものがたくさんあるということだと思います。

ある意味で、これらの議論をずっと見かけます。それは本当に理解しているのか、本当に理解しているのか、といったような。それはどこにも導かないようです。しかし、それは私が一方の側に落ちると思うより深いところの分裂を提起すると思います。

汎用人工知能は存在するのでしょうか。知能全般が現れる単一の原理があるのでしょうか。それとも私たちは10年後、20年後に目を覚まして、実際にはAIなどというものは存在しなかったと気づくのでしょうか。確かにタスク間で起こる一般化の程度は異なりますが、すべての実体は、直面する特定のタスク群に特化しているのです。

私はどちらかといえば後者のカテゴリーに属します。ヤン・ルカンが話していることです。つまり、知能について話すとき、80%の時間、私たちは非常に人間らしく感じるものを求めていると思います。それは私たちが追求している種類のものです。

人間らしいものと言うとき、私たちが実際に話しているのは能力の組み合わせです。私たちが再現しようとしている一つの能力ではありません。それが人類に利益をもたらすと思うからだけでなく、私たち自身を理解することに本当に興味があるからです。

私の予感では、実際には一つの万能薬AGIなどというものは本当に存在しないと気づくことになると思います。おそらく適用できる一般的な原理はありますが、特定のドメインに特化した知能を持つことになるでしょう。

本自体の主な構造に入りましょう。タイトルが約束するように、5つの突破があります。それぞれに一語のラベルを付けて、それぞれを順番に詳しく説明していきます。

5つの突破は、第一に操舵、第二に強化学習、第三にシミュレーション、第四に心の理論、第五に言語です。

最初の突破である操舵から始めましょう。小さな虫の時代まで遡り、最も基本的なことのいくつかを理解している時代です。その最初の突破の物語を教えてください。

私たちのインタビューはスポンサーからの一言の後、しばらく続きます。

Brave Search APIは、20億を超えるウェブページを持つ独立したウェブインデックスであるBrave検索インデックスへの手頃な開発者アクセスを提供します。Brave検索インデックスが際立つ理由は何でしょうか。

第一に、それは完全に独立しており、ゼロから構築されています。つまり、大手技術企業のバイアスや法外な価格はありません。第二に、もちろん匿名で収集された実際の人間の実際のページ訪問に基づいて構築されており、大量のゴミデータを除外します。第三に、インデックスは毎日数千万のページで更新されるため、常に正確で最新の情報を持っています。

Brave Search APIは、AIモデルを訓練するためのデータセットを組み立て、推論時の検索拡張を支援するために使用でき、すべて開発者第一の価格設定で手頃なままです。Brave Search APIをワークフローに統合することは、より倫理的なデータソーシングとより人間代表的なデータセットに変換されます。

月間最大2,000クエリまで無料でBrave Search APIを試してください。brave.com/APIで。

さあ、最も簡単な選択は何でしょうか。中間席の代わりに窓側の席を取ること?あなたが絶対に嫌いなビジネスタスクをアウトソーシングすること?Shopifyでの販売はどうでしょうか?

Shopifyは、ビジネスのあらゆる段階で販売を支援するグローバルコマースプラットフォームです。Shopifyは米国のすべてのeコマースの10%を動かしており、Allbirds、Rothys、Brooklinenをはじめとする数百万の起業家を175カ国にわたってあらゆる規模で支えるグローバルな力です。

セキュリティシステムを販売していても、メモリモジュールをマーケティングしていても、Shopifyはすべてを網羅した万能eコマースプラットフォームから店頭POSシステムまで、どこで何を販売していてもShopifyがカバーします。私は過去に設立した会社でそれを使用し、ここTurpentineでマーチャンダイズを立ち上げる際、Shopifyが私たちの頼みの綱になるでしょう。

Shopifyは、他の主要なコマースプラットフォームと比較して最大36%向上した、インターネット最高の変換チェックアウトでブラウザーを購入者に変えるのを支援します。そして、ShopifyはShopify Magicのおかげで、より少ない努力でより多く販売するのを支援します。Shopify MagicはAI搭載のオールスターです。

Shopify Magicで、ブログ投稿から製品説明まで、変換する魅力的なコンテンツを作り上げます。即座のFAQ回答を生成し、完璧なメール送信時間を選択します。さらに、Shopify MagicはすべてのShopify販売者にとって無料です。

成長するビジネスはShopifyと共に成長します。shopify.com/cognitiveで月額1ドルの試用期間にサインアップしてください。どの段階にいても、あなたのビジネスを成長させるために今すぐshopify.com/cognitiveに行ってください。shopify.com/cognitive。

6億年前、世界は本当に魅力的な場所でした。6億年前に目を覚まして世界を航行していたら、陸上には本当に生命はありませんでした。宇宙から地球を見ても緑ではなかったでしょう。まだ木はありませんでした。生命のほとんどすべてが海にあり、ほとんどの生命は単細胞でした。

しかし、多細胞生物が現れ始めていました。真核生物の生命の3つの枝、つまり私たちが作られている本当に複雑な細胞は、すでに分岐していました。菌類系統、動物系統、植物系統がありました。

当時の菌類がどのように見えたかはよく分かりませんが、海の下にキノコのような構造があったという証拠があります。おそらく非常に小さかったでしょう。海には植物のような構造がありました。おそらく今日の海藻に最も似ていたでしょう。

そして動物構造がありました。これらの初期の動物がどのように見えたかについては多くの議論があります。確実には分かりません。しかし、ほとんどの証拠は、これらの非常に初期の動物が今日の刺胞動物に最も似ていたことを示唆しています。これはイソギンチャク、クラゲ、サンゴポリプを含む動物のクラスです。

これらすべての生き物について興味深いのは、化石証拠が初期の動物が似ていたことを示唆していることですが、彼らには脳がありません。神経網があります。主に独立した反射を実装しているニューロンのウェブがあります。

サンゴポリプを取ると、これは放射対称的な小さな生き物です。サンゴを見ると、実際にはそれらすべて独立した小さなポリプで、小さな触手と小さな胃があり、中心軸の周りに対称的です。

サンゴポリプの重要な点は、食べ物を見つけるために航行していることです。食べ物を追いかけているのではありません。捕食者を避けているのでもありません。主にやっていることは、水中で触手を出して、小さな食べ物の塊が触手に当たるのを待ち、そして食べ物をつかんで消費することです。

彼らについて興味深いのは、多くの認知能力を持っていないことです。独立した収束があります。今日、6億年の進化の後、一部の刺胞動物、例えばハコクラゲが少し賢くなって軽量のナビゲーション能力を得た可能性があることを示唆する本当に興味深い研究があります。

しかし、これらの初期の刺胞動物にはこれらの能力がなかったと多くの人が同意すると思います。サンゴポリプで連合学習を見つけようとしましたが、見つかっていません。光の存在とショックを関連付けて、その光の存在に対して縮退することさえできません。その非常に基本的な関連付けも起こりません。

では、どうやってこの神経のウェブから脳に移るのでしょうか。これが最初の突破である操舵です。

進化について興味深いのは、最終的に6億年間でこの狂った複雑さを得るにも関わらず、すべての変化が選択される必要があることです。進化には先見性がありません。ニューロンをすべてこの設計に統合することが本当に価値があるだろうと言って、次の世代でそれをやろうとは言えません。すべての能力を可能にするからです。

小さな漸進的変化が必要で、世代ごとに結果につながります。すべての世代が生き残る必要があります。非常に制約的なプロセスです。

最初の脳は、選択できるほど単純である必要がありました。明らかにサンゴポリプから人間の脳に飛躍することはできませんでした。そして適応価値を持つ必要がありました。

6億年前、5億5000万年前あたりを見ると、脳を持つ最初の動物が現れます。それらにはいくつかの興味深い特徴があります。一つは、米粒の大きさほどの小さな虫のような生き物だったということです。化石証拠は非常に非常に小さかったことを示唆しています。

以前に来た動物、刺胞動物とは違って、二側対称性を持っていました。つまり中央平面に対して対称的で、すべての人間、節足動物、すべての哺乳類がそうです。

脳を持つ最初の二側対称動物のクラスの代理生物として人々が使う良い生物は線虫です。非常に小さな虫のような動物です。

最も古典的な線虫であるC. elegansは302個のニューロンを持っています。絶望的にシンプルな脳ですが、線虫を深く研究し、彼らが信じられないほどの認知能力の組み合わせを持っていることが分かっています。

質問は、この最初の脳は何をしたのかということです。なぜこの最初の脳が現れたのか、なぜ神経網からこれらの動物の頭の中央や頭部のこの統合された脳に移ったのでしょうか。

線虫を見て、サンゴポリプと比較すると、明らかにすぐに現れるいくつかのことがあります。まず、非常に動き回っていることです。サンゴポリプの戦略である食べ物を待つことは、食べ物を追求するという線虫の戦略とは非常に異なります。

線虫について興味深いのは、食べ物を見つけて危険から逃れることを非常にうまくやることですが、何も見ていません。線虫の感覚装置を見ると、絶望的にシンプルです。レンズ型の目はありません。特定の匂いを検出するための非常に基本的なニューロンの組み合わせ、光の存在を検出するもの、圧力と触覚を検出する非常に基本的な感覚ニューロンだけです。

それでも食べ物を見つけることを現象的にうまくやります。走性ナビゲーションという専門用語で行います。私は可愛らしく操舵と呼んでいます。

走性ナビゲーションは、追求できる感覚情報の勾配があれば、世界の構造を理解する必要なく物を見つけることができるというアイデアです。匂いが良い例です。

ペトリ皿に小さな食べ物のかけらを置くと、その周りに匂いの勾配が作られます。これは化学物質が流体内でどう拡散するかの物理学の特徴で、匂い化学物質の存在は源に近づくほど高濃度になります。

これらの初期の二側対称動物、線虫を見ると、実際に気づくのは、非常にシンプルなアルゴリズムを実装すれば、豊富な感覚装置にジャンプすることなくナビゲーション問題を解決できるということです。食べ物の匂いの濃度が増加していることを検出する行動を取ったとき、その方向に進み続ける。食べ物の匂いの濃度が減少していることを検出する行動を取ったとき、向きを変える。

この非常にシンプルな操舵または走性ナビゲーションのアルゴリズムは、世界の構造について何も理解することなく、物体を検出して認識するためのいかなる感覚装置もなく、危険な捕食者の匂いから逃れ、食べ物の匂いに向かうことを可能にします。

しかし、これを行うためには脳が必要です。ニューロンの統合された核に到達する必要があります。トレードオフを行う必要があるからです。分散された反射のウェブを持つことはもはやできません。

私の好きな線虫研究の一つは、ペトリ皿にたくさんの線虫を置き、一方に食べ物、真ん中に銅の障壁を置くものです。線虫は銅が嫌いです。彼らが見つけたのは、有毒な銅障壁を横切ってもう一方に食べ物を取りに行くことを進んでトレードオフするということです。

それは2つのことに依存します。一つはそれぞれの相対的濃度で、食べ物の濃度が高いほど、横切ることを進んで行う。二つ目はどれだけお腹が空いているかです。つまり、内部信号を組み込みます。お腹が空いているほど、銅障壁を横切ることをより進んで行います。

これを行うために、2つの異なる感覚ニューロンを統合する必要があります。向きを変えることを引き起こす悪いものを検出するものと、前進運動を引き起こす良いものを検出するものを、何らかの中央核に統合して、私の動きが何かについての単一の選択を行うことができるようにする必要があります。

走性ナビゲーションがおそらく最初の二側対称動物によって実装された動き算法だったという一般的なアイデアに、この分野のほとんどの人が同意すると思います。走性ナビゲーションから、その後の脳進化が続く知能のいくつかの原理が来ました。それが非常に興味深いと思う理由です。

まず最初に、価値の概念があります。AIコミュニティでは人々は単に報酬と呼ぶでしょう。二側対称動物ではまだ報酬とは呼ばないでしょう。アイデアは、世界の物事を良いものと悪いものに分類することです。

走性のアルゴリズムを実装するために、特定の刺激を良いと見なし、特定の刺激を悪いと見なす必要があります。それらは特定の動きのレパートリーに直接マップされます。つまり、向かうか、離れるかです。

線虫を見ると興味深いのは、感覚装置が価値を直接信号することです。これは人間のようではありません。ここでシンプルさがより複雑になっていく様子を見始めることができます。

人間に刺激を見せたとき、あなたの目のニューロンはその刺激の価値、あなたがそれを良いか悪いか、報酬的かどうかを直接エンコードしません。それは脳のより深いところで起こります。しかし、線虫の脳を見ると、そうではありません。

食べ物の匂いを検出するニューロンがあります。これらのニューロンは前進運動を引き起こすニューロンに直接マップされます。事実上、何が良く何が悪いかが進化的にハードコードされています。生涯にわたって学習されるのではありません。学習に基づいて良いものと悪いものの相対的な重みを変えることはできますが、実装された非常に強いバイアスがあります。

それが走性ナビゲーションからの価値とこの報酬の概念のアイデアです。感情と呼ばれるものもあります。これは線虫で現れた感情の基本的なテンプレートです。これは本の中で私が学ぶのが本当に楽しい部分です。

線虫がどうナビゲートするかを見ると、現れる別の複雑さがあります。私が言ったことは実際には正確ではありません。食べ物のかけらを置くとその周りに匂いの勾配が作られると言ったとき、それはペトリ皿では真実ですが、現実世界では真実ではありません。

現実世界の匂いの勾配を実際に見ると、問題は他の多くのノイズの多い匂いがあり、多くの流れがあるために多くのノイズがあることです。源からの匂いの羽を実際に見ると、実際には非常にノイズが多いです。きれいな勾配で拡散するのではなく、渦を巻いているようなものです。

それは問題を作ります。私が提案した通りのアルゴリズムを実際に実装した場合、線虫が食べ物豊富な地域を通過しても、その食べ物の源に導く一貫した匂いの勾配を得られないことが非常に一般的だからです。

線虫が実際に行うことは、行動状態と呼ばれるものを持っています。他の種類の動物を研究する人々が感情状態と呼ぶものに非常にうまくマッピングされると思います。これは刺激によって引き起こされるが、その刺激の存在を超えて持続する行動レパートリーです。

線虫には、実際に身体の外に突き出る装置を持つドーパミンニューロンがあります。私たちのドーパミンニューロンは外界への直接的なアクセスを持っていません。人間の中脳の深いところにあり、脳の他の部分からのみ情報を得ます。

線虫は、ドーパミンが初期の脊椎動物でどう進化したかを示唆しているかもしれませんが、実際に虫の外の物事を検出します。ドーパミンニューロンは何を検出しているのでしょうか。食べ物の存在です。

何が起こるかというと、線虫が食べ物のパッチを通過すると、脳をドーパミンで満たし、徘徊と呼ばれる持続的な状態を引き起こします。これは局所的な地域制限検索です。

つまり、食べ物を検出した場合、近くに他の食べ物がある可能性が高いという世界の構造の特徴を利用する、比較的シンプルで巧妙なメカニズムです。それは必ずしもそうではありませんが、私たちの世界ではたまたまそうです。

巧妙なアルゴリズムは、食べ物の匂いを検出した場合、他の食べ物を見つけるまでしばらくの間、局所的な地域制限検索を続けるということです。ドーパミンは、この種の徘徊、利用、探索の状態を引き起こすメカニズムです。

私たちは初期の脊椎動物でドーパミンがそれを行い、その後私たち全体の系統を通じて持続するのを見ます。それはクールだと思います。

それから線虫の喉で食べ物を検出するセロトニンニューロンがあり、休息と満腹の状態を生成します。つまり、食べ物を消費した後、線虫を一時停止させ、十分な食べ物を消費したと言わせるものです。

ドーパミンとセロトニンの間のこの基本的な二分法は、明らかに6億年の進化を通じて複雑化されましたが、私たちはその非常に基本的なテンプレートを見ます。ドーパミンは探索、追求の化学物質で、セロトニンは満腹、遅延満足の化学物質です。

5つ目の突破に移る前に、もう一つのアナロジーを見ると、このアルゴリズムがルンバのようなものにも実装されているのを見ます。ルンバは家の周りを回って掃除機をかけるロボットです。

進化的レンズで自律システムを構築するロドニー・ブルックスが構築した最もシンプルな可能なロボットとの興味深いアナロジーがあると思います。初期の脊椎動物に似ているのは、現代のものは家の世界の地図を構築しますが、初期のものは地図を構築しませんでした。

何かにぶつかったことを検出し、ランダムに回転するだけでした。これは走性ナビゲーションに似ています。しかし、ルンバの問題は、汚れを検出して全域をきれいにすることを利用していなかったので、時間がかかりすぎることに気づきました。

そこで、哺乳類のドーパミンの働きと全く同じように機能する汚れ検出というものを実装しました。ルンバが汚れを検出すると、実際に通常の行動レパートリーを停止し、局所的な地域で回転し始めます。

理由は、床で汚れのパッチに遭遇した場合、近くに他の汚れのパッチがある可能性が高いからです。これはドーパミンが脊椎動物で機能し始めたのと全く同じ基本原理です。

これが最初の脳がしたことで、ここで一時停止します。何か質問はありますか。私はたくさん話しましたが、何か聞きたいことはありますか。

もしかして覚えているなら、これらのような高次の概念をエンコードするニューロンが脳にあるのでしょうか、それともまだそこにはないのでしょうか。私は自分の頭の中で、人々がAIシステムで解釈可能性の作業をするアナロジーを作っています。実際に高次の概念を特定しようとします。

私は、脳にあるいは内部にある種の内部ニューロンがあって、進み続けるとか回転するとかのためにfireするものだと思っていました。

線虫コミュニティで介在ニューロンと呼ぶ人々がいますが、確かにそうです。感覚ニューロンがあります。正の価値のもの、負の価値のものを検出する感覚ニューロンと、線虫の脳の下流ニューロンが接続されており、これらが相互に抑制し合います。

少し単純化していますが、一般的に前進運動をコードするニューロン回転をコードする他のニューロンがあり、これらが比較的複雑なウェブを通じて相互に抑制し合い、線虫の移動運動プログラムを制御する下流ニューロンに接続されます。

確かに中間ニューロンがあります。複数の正の価値ニューロンと複数の負の価値ニューロンからの入力を統合し、最終的に単一の選択をするポイントに到達する必要があるからです。確実に中間ニューロンがあります。

さあ、そこでもTransformerとの初期の形のアナロジーを見ることができます。多くのニューロンがありますが、この同じ種類の構造で、中間層の高次概念に作用する入力層のようなもので、それから他の端で何らかの行動に出力されます。脳で302個のニューロンでその初期形式を持つことはかなり驚くべきことです。

続けましょう。突破ナンバー2は強化学習です。その物語を教えてください。

最初の脊椎動物が海底を泳ぎ回っていた頃から約5000万年早送りすると、カンブリア紀に入ります。おそらく多くのリスナーはカンブリア爆発に馴染みがあるでしょう。ここで生命の大規模な多様化が起こります。

大部分は脊椎動物の生命です。カンブリア紀の間に起こった生命の爆発は、私たちの脊椎動物の祖先の祖先、または私たちの脊椎動物の祖先から降りてきた生命の爆発です。カンブリア紀の間の支配種のほとんどは実際には節足動物です。

これは昆虫を含む動物のクラスですが、昆虫はまだ現れていませんでした。クモ、甲殻類などです。そして脊椎動物、つまり脊椎を持つ動物である私たちは、一般的に食物連鎖の中間の小さな生き物で、現代の魚に最も似ていました。これらが私たちの祖先でした。

この巨大な節足動物の捕食者、その中には人間のサイズのものもありましたが、その爆発の中で、小さな魚のような祖先が泳ぎ回っていました。この魚のような祖先は脊椎動物の脳の非常に基本的なテンプレートを進化させました。

私が実際に最も魅力的だと思ったことの一つは、比較心理学と神経科学の研究のほとんどが哺乳類で行われていることです。ラットは神経科学研究の主軸で、魚での作業もありますが、非常に少数派です。

しかし、すべての脊椎動物の脳を見ると、人間の脳について知りたければ、魚の脳が70%のところまで導いてくれます。魚の脳はすべての脊椎動物の脳の非常に基本的なテンプレートを持っているからです。

前脳、中脳、後脳を含みます。リスナーが聞いたことがあるかもしれない非常に基本的な下部構造で、魚には感覚情報を受け取りパターンを認識する皮質があります。それは視床と基底核に投射し、大きく同じ方法で機能します。ドーパミンのための中脳構造があります。

脊椎動物の脳がどう機能するかの基本的なテンプレートはすべて魚で見つけることができます。この非常に初期の脳で何が起こっていたかについて、非哺乳類脊椎動物の脳を見ることで洞察を得ることができると思います。

哺乳類の脳には、突破3で話すいくつかの非常にユニークな構造があります。脊椎動物の脳のテンプレートで見る最も重要な構造のいくつかは、皮質基底核と呼ばれるものです。

神経科学コミュニティで広くそれほど評価されていないことは、魚の脳に皮質があることです。多くの人が皮質が哺乳類でのみ進化したと考えていますが、魚の脳には皮質があり、やや似たプロセスを実行し、基底核と皮質の間で似たような投射を前後に受けます。

これらすべては何をしているのでしょうか。魚ができることを見ると、最も明らかなことの一つは、線虫ができるよりもはるかによく試行錯誤で学習できることです。YouTubeに行って、魚に狂ったことを教える人々を見ることができます。魚にフープを飛び越えることを教えることができます。魚に迷路を航行することを教えることができます。線虫にはこれらのタスクのいずれも教えることはできません。

脊椎動物の脳の非常に基本的なテンプレートを見ることの興味深い点の一つは、報酬信号が見え始めることです。これは線虫では同じ方法で実際には存在しませんが、今度はドーパミンになっています。

20世紀初頭に戻ります。学習理論全般について学び始めていました。エドワード・ソーンダイクという人がいました。彼は元々人間の学習を研究したかったのですが、プログラムが人間の子供を研究させてくれなかったので、代わりに鶏を研究することになりました。本当に面白い話だと思います。

彼は一般的に強いダーウィン主義者で、猫や鳥のような単純な動物がどう学ぶかの原理を見つけられれば、人間の子供にも適用されるかもしれないと考えました。

彼が元々探していたのは、模倣学習を通じてこれらの動物を教えることができるかでした。洞察と模倣の概念を見つけたかったのです。彼がこれを設定した方法は、有名な研究であるパズルボックスを作ったことです。

猫をケージに入れ、明らかに取得する動機があるケージの外に食べ物を置きます。猫が正しいことをすればケージが開くという非常に基本的な仕掛けがケージにありました。時には、引けばケージが開くラッチでした。時には彼がそこに座って、特定の足を舐めれば彼がケージを開けるというものでした。

効果的にパズルを解く必要がありました。彼は2つのことを見つけることを期待していました。第一は、彼らがそれをする方法を理解したとき、出る時間がすぐにゼロになることでした。これが彼の洞察の概念でした。つまり、パズルを理解したら、再びそれをする方法を誰かに教えてもらう必要はないということです。

第二に彼が見つけると思ったのは模倣学習でした。つまり、それをする方法をすでに理解した別の動物を前に置けば、速くなるということです。少なくとも彼の研究では、これらのことのいずれも見つけませんでした。

しかし、彼が見つけたのは、ケージから出る方法を理解することの段階的な減少でした。ほぼ安定した曲線のようなものでした。彼はこれについて考えました。効果的に彼は効果の法則と呼びましたが、実際にはただの試行錯誤学習です。

動物がすることは、ランダムな物事をたくさん試して、うまくいったことをより多く行う可能性が高くなり、うまくいかなかったことを行う可能性が低くなることを彼は気づきました。

つまり、ケージから出た後、私が取った以前の行動を強化し、それらがより起こりやすくなります。パズルを理解したという意味での洞察ではありませんが、私がちょうど前に取った行動をより起こりやすくしています。時間が経つにつれて、最終的にケージから出るのにかかる時間はゼロになりました。

彼はこのアイデアを思いつきました。学習のどれだけの部分がただの試行錯誤学習なのだろうと思いました。そして、B.F.スキナーがこれを極端に取って、すべての動物にわたるすべての学習がただの試行錯誤学習だと主張しようとしました。これは偽りであることが証明されています。突破3でそのことに触れますが、興味深い洞察は、驚くべき量の行動的知的行動が実際に試行錯誤学習であるということです。

これが強化学習の第二の突破が出てくるところです。魚を見ると、同じ種類のパズル実験を魚で行うことができ、彼らは全く同じ方法で学習するからです。

ソーンダイクは実際にこれを行いました。魚の研究に興味があったからです。魚をタンクに入れ、タンクに特定の壁を置いて、泳いで通ることができる特定の領域だけにして、特定のセクションだけに到達できるようにします。そして一つの地域を明るくして、彼らは好きではありません。一つの地域を暗くして、彼らは好きです。魚がパズルを通過するのにどれくらい時間がかかるかを見ます。

全く同じことが起こります。最初は長い時間がかかり、次に少し短くなり、最終的にすぐにやります。線虫を取ると、これが起こるのを見ません。非常に基本的な脊椎動物にこの方法で試行錯誤を通じて学習することを教えることはできません

脊椎動物から初期の脊椎動物への飛躍で何かが起こりました。ここでAIが実際に物語の魅力的な部分です。

ソーンダイクが強化学習が機能すると信じていた方法でアルゴリズムを実装しようとしました。良いことが起こったとき、最近の行動を強化するということです。マービン・ミンスキーは1950年代にSNARKというものを作ったと思います。確か何の略かは忘れましたが、確率的神経アナログ強化計算機だと思います。

迷路から出る方法を教えるためのもので、何らかの非常に基本的なAIエージェントに迷路から出る方法を教え、成功するたびに強化するという非常に基本的なアルゴリズムでした。アイデアは、エドワード・ソーンダイクが持ったアイデアをAIシステムに適用し、試行錯誤を通じて学習するのを見ようということでした。

うまくいきません。うまくいかない理由は、時間的信用割当問題と呼ばれるもののためです。良い報酬につながるほとんどの行動は、報酬に直接近接していません。

良いアナロジーはチェスゲームでしょう。誰かとチェスをするとき、勝利に導いた行動は、必ずしもゲームの最後の行動ではありません。ゲームに勝ったかもしれない事柄は、ゲームの中盤にあったかもしれません。

最近の行動だけを強化するだけでは、非常に知的なエージェントを得ることになりません。すべての行動を強化しようとすると、あまりにも長い時間がかかり、実際に良いチェスゲームをする方法を学ぶのにあまりにも多くのデータが必要になります。

これは何十年もAIの巨大な問題でした。試行錯誤学習を機能させる方法を理解できませんでした。それが最終的に発見されたとき、私がすぐに説明しますが、実際に脊椎動物の脳がどう機能するかを照らし出します。非常に似たアルゴリズムが実装されているのを見ることができるからです。

リチャード・サットンという人が、この素晴らしいアイデアを思いつきました。試行錯誤学習が機能する方法は、実際の報酬を得たときに自分を強化するのではなく、強化信号が予測された報酬の変化から来るのかもしれません。

チェスゲームをプレイしているとき、実際には2つの対立するプロセスが起こっているというアイデアです。最善の次の手を予測しようとする一つのプロセスがありますが、現在の状態がどれだけ良いか、勝つ可能性がどれくらいか、言い換えれば期待される将来の報酬が何かを予測しようとする別のプロセスがあります。

彼のアイデアは、システムを訓練する報酬信号、つまり次に取る手を決定するネットワークは、勝ったときではなく、ちょうど取った手が勝つ可能性を大幅に増加させたときの期待であるというものでした。

ここには直感があります。チェスゲームをしているとき、ポジションが劇的に改善した手を打ったとき、その感覚、そのラッシュが強化信号です。

時間差学習という彼のアイデア、つまり強化信号が時間差、期待される将来の報酬の変化であるというアイデアが、実際に強化学習革命を解き放った洞察です。

最初の実用的な応用はTDゲーモンと呼ばれるもので、この原理がバックギャモンゲームを本当にうまく機能させるために使われました。それ以来、チェス、チェッカーなど、はるかに複雑なゲームに適用されています。

強化学習を機能させる方法は、将来の報酬がどうなりそうかについての継続的な予測を持つ必要があるというアイデアです。

さあ、試行錯誤を通じて学習することが極めて可能な魚の脳に戻ります。脳の最もクールな部分の一つだと思う基底核と呼ばれる構造を見ます。どう機能するかの微細な点で人々を退屈させませんが、神経解剖学に興味があるなら、基底核がどう機能するかを学ぶことは最も魅力的な構造の一つだと思います。

2つの理由があります。一つは、美しいモザイク構造だからです。機能する方法が非常に明確で、新皮質のような場所を見ると、完全に混乱しています。実際に何が起こっているかを解読するのは非常に困難です。

そして二つ目は、動物間で信じられないほど保存されていることです。魚の基底核は人間の基底核とほぼ全く同じ方法で機能します。

誰も正確に何をしているか知りませんが、サットンのTD学習アルゴリズムにかなり似たものを実装しているというかなり強い理論があります。

基底核内のモザイクが見えるからです。ドーパミンバーストに基づいて一方向または他方向で行動をバイアスする脳幹運動システムに接続する回路の間で。ドーパミンを得ると、行動をより行う可能性が高くなり、ドーパミンの減少を得ると、行動を行う可能性が低くなります。

それがどう起こるかの正確な回路を実際に知っています。基底核内に、将来の報酬の期待に基づいて、ドーパミンニューロンに投射し返してドーパミンの増加を引き起こし、また他の場合にはドーパミンシグナリングを一時停止するモザイクがあります。つまり、将来の報酬の期待に基づいて自分自身を強化し処罰しています。

多くの人がモデリングを行い、基底核のニューロン解剖学をサットンのTD学習のアイデアにマッピングしようとしました。まだ開かれた研究分野ですが、それがしていることがかなり似たものであることを示唆する多くの証拠があります。

ドーパミンニューロンを記録すると、これはまだ魚では行われていませんが、サルやマウスで行うと、ドーパミンニューロンはほぼ正確にTD学習信号をシグナルするようです。

位相性ドーパミン、つまり大きなドーパミンバースト、興奮が起こるのは、報酬配達時ではなく、期待される将来の報酬の変化時であることを見ます。

あなたがサルのドーパミンニューロンに接続しているとき、将来の報酬を予測すると思う手がかりが現れたとき、それが大きなドーパミンバーストを得るときです。実際に報酬を与えるときではありません。

それは実際、サットンのTD学習が実際に機能することを人々が気づき、ドーパミンニューロンが何をしているかのこの新しい解釈だと気づくまで、神経科学において大きな困惑した発見でした。

魚の脳に入ると、直接ドーパミンニューロンを記録していませんが、記憶によれば記録していませんが、これらの種類の予測エラー信号を示す周囲の構造を記録しました。つまり、正の報酬または負の報酬を得ようとしていることを示唆する何かがちょうど変わったときに興奮を引き起こしています。

証拠は、魚の脳が試行錯誤を通じて学習できるようにするために、この種の同じTD学習アルゴリズムを行っていることを示唆しています。

この種の突破について私がとてもクールだと思うことは、突破1がなければ実装できないことです。価値の根拠概念がその底になければ、TD学習アルゴリズムを実装することはできません。つまり、そもそも何が良い悪いかの概念です。それは期待される将来の報酬が構築される基準線だからです。実際の報酬信号が必要で、それは走性ナビゲーションと線虫でのみ存在したからです。それが真の良いまたは悪いものを分類したものだからです。

この強化学習のアイデアから、脊椎動物の脳で現れる他のすべてのものが得られます。今では試行錯誤を通じて任意の行動を学習できるので、他のすべてのものが可能になるからです。

例えば、今では世界でより多くのものを認識することが本当に有用になります。なぜなら、認識できるはるかに多くのものに基づいて、取ることができるより複雑な行動の組み合わせを持つことができるからです。

皮質は初期の脊椎動物で進化した構造の一つで、パターン認識のようなことをするようです。一部の魚は人間の顔を認識できるので、パターン認識が非常に非常に得意です。

初期の脊椎動物で現れるもう一つは、3D空間の地図です。これのための簡単な研究は、25の異なるコンテナのグリッドがあるとしましょう。この空間の地図でどこにいるかの唯一の手がかりは、このタンクの壁の一方に青い点があることかもしれません。

どこに置かれても、理論的には空間の地図を構築するのに十分な情報を持っています。この25のグリッドの任意の場所の一つのコンテナの下に食べ物のかけらを置くとします。最終的に魚はその場所を見つけるでしょう。

魚を食べ物なしでタンクに戻すと、どこに置いても、同じ場所にまっすぐ戻ります。これは標準的な強化学習エージェントに対する興味深い生物学的な調整です。実際にはただの手がかりに応じて取る自己中心的な行動の組み合わせを学習するのではありません。

それよりも少し高度なものを持っています。それは、3D空間での私の場所を考慮して、行きたい他の場所へのホーミングベクトルは何かということです。

それは、変化する開始場所などに対してはるかに堅牢なので、試行錯誤学習に従事するはるかに効果的な方法です。魚の脳に入ると、皮質の相同領域が見えます。それは最終的に私たちのバージョンの海馬に進化し、3D空間の場所をエンコードするようです。

これは突破3で重要になる有用なツールです。脊椎動物の脳では、基底核による任意の試行錯誤学習、世界でより複雑な行動を学習できるようにするより多くのものを認識できる皮質を得ます。なぜなら、世界でより多くのものを認識できるからです。この点について何か質問はありますか。

この強化学習のフォローアップで私が持つ質問は、一つは私たちがAI内の多くの異なる場所でこの二重モデルパターンを見るという観察です。

GANアーキテクチャは正確にはこれではありませんが、ジェネレーターとディスクリミネーターがあり、より高い能力に向けてブートストラップしてお互いを助ける似たようなものです。

今日のフロンティアモデルにより密接に、人間のフィードバックからの強化学習も、何かを人間がスコアするであろうもので採点する報酬モデルに基づいており、それをアウトプットに適用することで、コアモデルからより良いアウトプットを今では報酬できます。

これらは両方とも興味深いです。道程で段階的に報酬することも大きなトレンドになりました。2023年の第1四半期、おそらく第2四半期のOpenAIの結果にとって鍵でした。数学的問題解決のプロセスを通じて推論を段階的に報酬することで、最後に正しいか間違いかを言うのではなく、ステップバイステップではるかに細かい報酬信号を与えることで、言語モデルが数学でずっと良くできるようになりました。

それはスパース報酬問題のようなものだと思います。基本的に正解を多く得られないので、初期の段階でどうやって正しい軌道に乗せるかというものです。数年前にWebエージェントを始めようとしたときにもこの問題がありました。基本的にポジティブを得られないので、報酬するものがなく、うまくいきませんでした。

しかし、段階的に早期に報酬することは、確実により信頼性の高いパフォーマンスに向けた大きなトレンドのようです。これらは、この歴史の光の中で少し理解できると思う私自身の心のトリガーポイントのいくつかです。

私が疑問に思っているもう一つの大きなことは、これは5つのすべての突破にわたって尋ねることができる質問かもしれませんが、特にここで考えているのは、突破のクラスターがあるようです。AIでも創発の概念について多くの議論があります。つまり、特定の能力が突然オンラインになるということです。

損失曲線を見て、損失曲線は滑らかに下がっているが、時には個々の能力が比較的はるかに速く上がってくるようだと言うことができます。それが正確に起こっているのか、適切な方法で見ればまだこれらの多くのことについて滑らかな損失曲線を見つけることができるのかについて多くの議論があります。

しかし、これらの突破はどれくらい鋭いと思いますか。一つのことが起こって他のことを解き放ったという精神的なモデルを持っていますか。3D空間モデリングはかなり良い突破の候補のように聞こえるからです。

これがなぜ私が本全体を第一近似として見る理由です。これらすべてが、世代から世代への小さな漸進的変化に分解されたことは明らかに明確だからです。もちろん、線虫が赤ちゃんを産んで魚が生まれたということではありませんでした。

目標は、どのような好みが関わってくるもので、他の人が同じ物語を見て、私はこれを5つのステップではなく7つの異なるステップとして見ると言うか、これを3つのステップとして見ると言うことができます。すべて同様に正しい可能性があります。複雑さと予測力の間のトレードオフです。

3D空間モデリングは、重要な別々の時期に現れた可能性があります。この好みの一部は、今日利用可能な証拠によって制約されています。例えば、線虫と脊椎動物の間の段階的発達を示す既存の動物はあまりありません。

非脊椎動物の脊索動物、つまりまだ脊椎動物ではないが完全に無脊椎動物でもない中間地点のような、生きているそのような動物はほとんどありません。それらの動物についての比較心理学研究は多くありません。

最も原始的な脊椎動物であるヤツメウナギについての本当に良い比較心理学研究もありません。彼らがマップベースのナビゲーションを持っているかどうかさえ知らないと思います。ヤツメウナギが空間での場所を知ることができないが、硬骨魚類ができるということを発見したら、最初の脊椎動物と最初の顎脊椎動物の間に起こった重要なマイルストーンがあったことを示唆する魅力的な発見でしょう。

要点は、私たちはもの事を理解する基本的な理解を与える第一近似を思いつこうとしているのですが、私たちが直感を失うほど複雑さを加えることなく、進化したステップに制約されているということです。目標は正確な精度ではなく第一近似です。

また、利用可能な証拠によっても制約されています。これらの多様な種にわたる豊富な比較心理学研究はありませんし、脳の段階的発達を示すであろう中間ステップの多くの動物は絶滅したので、これらの中間ステップがどのようなものかを示す現代の動物もいません。

しかし、あなたは絶対に正しいです。基底核は明らかにステップで進化しました。皮質はステップで進化しました。これらのことはおそらくすべて一度に現れたわけではありません。100%そうです。

しかし、この5000万年の窓内で、これらすべてのものが似たような時期に来ることのクラスタリングによって得られる洞察があると思います。これらのことが実際にどうお互いに関係しているか、そして何が脳進化の共通の根本的な神経構造とアルゴリズムから来る新しい能力の組み合わせのように見える洞察を得ることがあると思います。

それは本当に興味深いことです。なぜなら、非常に異なるもののように見えることが、実際には同じ種類の技術の異なる応用だからです。

私にとって、マップベースのナビゲーション、パターン認識、試行錯誤学習のような非常に異なるタイプの能力ですが、それらはすべて非常に相互関連しています。

例えば、試行錯誤学習がなければパターン認識は関連性がありません。この任意のパターンがこの行動を取るべきものであることを学習する能力がなければ、この巧妙なメカニズムがなければ、パターンを認識できることは特に有用ではありません。それに応答してどの行動を取るべきかのパターンの認識をマッピングすることができなければです。

それらは関連しています。また、世界の豊富なものを認識できない場合、任意の試行錯誤学習を持つことはあまり有用ではありません。なぜなら、線虫の少量の感覚ニューロンに制約されているからです。世界についてあまり認識できないときに、任意の行動を取ることを学習するためのこの非常に高価な脳を持つことは、おそらくそれほど関連性がありません。それをやめて、それをできないシンプルで低エネルギーの脳に固執することがおそらく安いでしょう。

これらのものがお互いからどう利益を得るかを見ることができますが、確実に一世代で現れて、すべてのこれらの能力があった、ということが起こったとは思いません。

それを少しよく理解するのを助けてください。これは、生物学的知能と人工知能の間の多くの明らかに主要な分岐点の一つですが、特に少しAIレンズを取って、虫にconvnetディテクターを横に付けることを想像できます。捕食者などでパターンマッチして、その信号を残りのシステムに送り込んで、地獄から出ろと言うのです。

今、それは開発するのがもっともらしくないかもしれません。明らかにこれらは小さなもので、余分な重量を運び回る贅沢を多くは持っていませんが、これらのディテクター、高次のディテクターでもまだ強化なしに価値があるように思えます。しかし、そこで何かを見逃しているかもしれません。

そうしたとすると思います、あなたが苦しむであろう問題は、ミンスキーが彼の持った同じ問題です。期待される将来の報酬の変化に基づいて自分を強化する能力がなければ、知的な行動が現れるということがそれほど明確ではありません。

何かを認識でき、学習する唯一の方法が良いことまたは悪いことが2秒の小さな窓内で起こったかどうかである場合、その2秒以外の偶発性は学習されないからです。なぜなら、この任意の強化と試行錯誤システムを持っていないからです。

もしかすると価値があるかもしれませんが、これは今エネルギートレードオフになります。これは2秒以内で何かが起こることの手がかりとしてのマッピングしかできないとき、どれくらい価値があるか、そのもののエネルギーコストに対してです。

一つの結果は、それがエネルギー的に価値がなく、それが進化しなかった理由である可能性があります。他の結果は、この種のパターンマッチングが可能になるために起こらなければならなかった他のものがあったために、単に進化的に利用可能ではなかったということかもしれません。

つまり、それが起こらなかった理由は、それが有用ではなかったからではなく、進化的制約のためです。より大きな体が必要だった、より大きな基本脳が必要だった、より複雑な運動行動が必要だった、このタイプのパターンマッチングが利用可能な反復として現れるために、そこにある必要があった非常に基本的な神経生物学が何だったかわからない。

進化について本当に興味深いことは、各反復が適応的に価値がある必要があることです。少なくとも適応的に悪くない必要があります。もちろん、他の理由で進化し、後で価値を持つであろうが、本当にエネルギー的にコストのあるもの、各反復が価値を加えない限り現れることは unlikely です。

それが大きな制約を置きます。これが、レンズ形の目がどう進化したかを理解することがまだ魅力的なことである理由です。ただ信じられないほど複雑な構造ですが、方法ごとのすべてのステップが適応価値で中立またはポジティブだった漸進的ステップは何でしょうか。

私の思考は、なぜ多分彼らが、初期の脊椎動物がただ畳み込みニューラルネットワークを追加しなかったかについて、それが私の思考でしょう。

これは確実にAIシステムの相対的進化対生物学的システムに興味深い含意があります。それは、ハードウェアとソフトウェアの分離が、生物学的側面でもある程度区別があるかもしれませんが、確実にAI側ではその区別が非常に完全であることを私に思い起こさせます。

これらの、何かがエネルギーを正当化する必要があるか、AIシステムで恒常性を維持する必要がないか、などの実践的制約に対する懸念なしに、かなり多くの自由度と再ミックスの能力があります。

それが、近い将来少なくとも、私たちのAIシステムが機能する方法と生物学的脳が機能する方法の間で意味のある分岐を見る理由の興味深い理由だと思います。

これは、神経科学からインスピレーションを取ってAIに適用するときに良い好みを持つ必要があるという公正な、非常に公正な批判があると思う場所です。神経科学、脳が機能する方法は、魔法的であるにも関わらず、私たちがAIシステムで必要としない方法で制約されたプロセスだからです。

例えば、おそらくはるかに多くのエネルギーへのアクセスがあり、はるかにエネルギー効率が悪いことを進んで受け入れます。つまり、エネルギー効率のために最適化された脳の部分は、おそらく少なくとも近い将来私たちにとって重要ではないので、脳がそれをどう行うかを理解しようとする疲れを知らない努力は価値がないということです。

脳にも巨大な進化的制約があります。最適な設計ではない可能性が非常に高いのに対し、シリコンで実装するとき、最適な設計を見つけることができるかもしれません。以前の設計を捨てて一から始めることができるかもしれません。

脳が機能する方法とは非常に異なる方法で機能するAIシステムを持つことになると思います。なぜなら、脳が持つのと同じ制約を持たないからです。

好みの質問は難しいもので、私は明らかにすべての答えを持っていませんが、脳が機能することについて知っているか、まだ知らないことの側面のうち、どれが関連すると思うかについての考えです。それは明らかではありません。

目標は明らかに人間の脳を丸ごと再現することではありませんが、脳について知っていることの神経科学のうち、何が有用で、スマートなシステムを構築するのに実際に関連すると思うかということです。それが難しい質問です。

さあ、残りの3つの突破をやって、それから私がAIについての将来志向の質問に取りたい方向があります。

これらはもっと速くなると思います。ある意味で algorithmically はより複雑ですが、概念的にははるかにシンプルだからです。恐竜時代に進化した哺乳類の脳では、本当に興味深い物語があります。魚から小さなリスのような哺乳類にどう行ったかはしませんが、一連の絶滅イベント、陸上に道を作ること、恐竜の出現、この豊富な歴史があります。

しかし、最終的に約1億5000万年前、私たちは巨大な大きさの恐竜のエコシステムで、4インチ長の小さな哺乳類として自分たちを見つけます。私たちは食物連鎖の非常に底に近く、穴に隠れて、夜にだけ出てきて昆虫を狩り、そして中に走って戻ります。

しかし、魅力的なのは、この小さな脳の中で初期の脊椎動物の皮質の新しい構造、領域が進化したことです。これは3層構造です。ヤツメウナギの脳を見て皮質を見ると、お互いに巻かれた3層のニューロンがあります。

しかし、人間からサル、ラットまで、あらゆる哺乳類の脳を見ると、6層を持つ皮質の構造が見えます。これは新皮質と呼ばれ、実際に端で3層の古い構造に戻ります。哺乳類の古い嗅覚皮質は、初期の脊椎動物のように3層を持っています。哺乳類の海馬は初期の脊椎動物のように3層を持っています。

しかし、この新皮質、この間の領域は本当に本当にずっと複雑になりました。質問は、この新しい新皮質は何をしたのかということです。

人間の脳では、進化がとても興味深く教育的だと思う場所です。なぜなら、人間の脳だけを研究したら、新皮質は実際にすべてをすると言うでしょう。人間の脳に入ると、意識的に経験するほとんどすべてが新皮質で起こるようです。

例えば、視覚皮質である頭の後ろに脳震盪を受けた場合、新皮質は脳全体の周りのこの6層のシートで、見る脳の絵のすべての折り目がそれが新皮質です。異なることをするように見える異なるサブ領域があります。

例として、後ろの領域は視覚皮質と呼ばれ、視覚皮質を損傷すると、人々は盲目であると報告します。何も見ることができないと言い、手を振っても反応しません。

しかし、彼らの身体、彼らの脳はまだ視覚情報を処理していることを知っています。例えば、顔に何かを投げつけると、まばたきします。怖い絵を前に見せると、恐怖を感じたり、なぜかわからないのに心拍数が上がると報告します。

私たちはこれがなぜ起こるかを正確に知っています。盲視と呼ばれ、視神経が脳の異なる部分に入ることを知っているからです。視覚皮質に視床を通って行く一つの経路があり、そこは物事を意識的に経験し、豊富な物体を認識するなどする場所のようです。

感情的反応を引き起こすことができる基本的なパターン検出のような古い構造である扁桃体に直接行く別の経路があります。新皮質は複雑な処理が起こる場所のようで、意識的に経験するところですが、まだ他のことをしている脳の他の多くの古い部分があります。

新皮質の前部に行くと、運動皮質と呼ばれる領域があります。それが脳卒中で損傷されると、麻痺し、細かい運動技能を失います。言語領域があり、古典的には損傷されると話すか言語を理解する能力を失います。聴覚領域があります。

人間の脳を見ると、この一つの構造がすべてをするように見えます。複雑な動きの計画、物体認識、そのすべてのものを可能にします。

しかし、初期の哺乳類まで遡ってラットを見ると、新皮質がこれらすべてのことにとってどれくらい重要かは明確ではありません。例えば、ラットの運動皮質を病変しても、まだうまく動き回ることができます。運動皮質損傷に関連する麻痺は実際に霊長類に特有です。

私がこれを魅力的な発見だと思うのは、新皮質が動きを制御する場所だと考えるとき、より複雑なことが起こっているかもしれないことを示唆するからです。なぜなら、初期の哺乳類に戻ると、動きを制御した領域ではなかったからです。それは実際に進化的時間をかけた調整でした。

ラットに入ると、新皮質は何をしているのでしょうか。ラットの運動皮質を損傷すると、新しい運動技能を学ぶことができなくなりますが、よく学習した運動技能は実行できます。細かい運動行動にずっと悪くなります。つまり、リアルタイムの運動計画を必要とすることです。

猫は、小さなプラットフォームの束を見て、その足の置き場所を通してその一歩を計画することにずっとできなくなります。これは非常に興味深い示唆だと思います。運動皮質が元々していたことは、実際にあなたがそれらを行う前にあなたの動作、あなたの行動をシミュレートすることを可能にすることのようなものです。

これはまた、新皮質が生成モデルであると考えられる新皮質が何をしているかの別の研究領域にも行きます。つまり、世界のものを認識することもできるが、世界のものの独自のサンプルを生成することもできるモデルです。

この元々の直感は、19世紀に特定された視覚錯覚から来ました。皆がこれに馴染んでいると確信していますが、あいまいに猫またはウサギまたはアヒルであるものを誰かに見せることができ、一方または他方しか見ることができません。

ダルメシアンのパターンのセットを誰かに見せて、彼らが認識せず、「実際に犬が見えますか」と言うと、突然犬を見ないわけにはいかなくなります。または、実際にはそこに三角形がないのに、任意の画像を見せて、人々が球体や三角形を見ずにはいられない例があります。

これらすべてが示唆したことは、ヘルムホルツという人がいて、異なる言葉を使いましたが、彼のアイデアは推論としての知覚でした。世界で物事を見ているとき、実際にやっていることは、真の状態を推論しようとし、新しいものを予測するときの事前として使用することです。

つまり、実際に三角形があった場合のこのあいまいな三角形の絵を見ると、私が見ている観察をよく予測するだろうということです。これが非常に重要な理由は、暗闇で動物がナビゲートすることを考えると、向こうに枝があるのを見たことを覚えているという事前を持ったら、私は世界が枝を含んでいるという基本的な理解を持っています。

動き始めても、感覚刺激がそこにあることを証明しないが、私の事前と一致している限り、新しい情報が現れるまで事前を続けて満足します。

これはベイジアン脳仮説のタイプです。世界の状態を推論しようとし、それを事前として頭に保持し、これからの予測を実際に起こることと比較するというアイデアです。新皮質がやっていることについて多くの証拠があります。

多くの人がこの新皮質生成モデルについて、物体認識に本当に良いというレンズを通して話します。新皮質は物体認識が得意であることを含んでいます。しかし、進化的レンズから、それを見る別の方法は、新皮質について最も有用なことは、実際の世界から感覚刺激を受け取って世界についての事前と比較する認識モードではないかもしれないということです。

生成モードです。実際の世界から自分を切り離し、世界の表現を探索し、独自のデータを生成する、つまり可能なものをシミュレートすることです。

進化的レンズから、これが本当に興味深いと思う理由は、新皮質が物体認識のために進化したと議論するのは困難だと思うからです。議論できますが、困難だと思います。新皮質なしの多くの脊椎動物で、3層皮質だけを持つものが物体認識で信じられないほど良いからです。

3D摂動と3D回転でできます。良い物体認識システムがすべてすべきだと思うすべてのこと、魚はできるようです。新皮質がエネルギー効率的であるか、性能に何らかのユニークな改善を提供すると議論しない限り、新皮質進化の駆動適応価値が優れた認識だったと議論するのは困難だと思います。

はるかに説得力があり一貫していると思うのは、動物が実際に現在のものではない世界の状態のシミュレーションをレンダリングできた初回だったということです。つまり、推論による知覚で経験に基づく世界のモデルを構築するが、一時停止して行動する前に可能な未来を演じる能力を持つことです。

これは哺乳類全体で見ることです。魚と違って、魚でまだこれを見つけていません。見つけたら魅力的な観察でしょう。比較心理学研究の欠如が課題を作る場所です。

しかし、哺乳類では、これが起こることを知っています。ラットが迷路をナビゲートしていて、選択点があり、ラットが一時停止して実際に前後を見るのを見るでしょう。これは代理試行錯誤と呼ばれていました。ラットが選択をする前に可能な行動について考えているように見えるという見解です。

しかし、それは仮説でした。ラットが実際にこれをしていることを確認する方法がありませんでした。デビッド・レディッシュという人が来て、海馬の一部を実際に記録するまで。初期の脊椎動物から覚えているなら、空間の地図をレンダリングします。

海馬には場所細胞と呼ばれる特定のニューロンがあります。ラットが迷路の周りをナビゲートするとき、その迷路の各場所で活性化する特定のニューロンがあります。ラットを見て、どの方向から来ても、迷路のこの場所で常に活性化されるニューロンがあることがわかります。他の場所についても同じです。

通常、場所細胞はラットが実際にいる場所で主に活性的です。迷路をナビゲートするとき、いる場所の場所細胞がちょうど変わるのを見ることができます。

しかし、これらの選択点に到達して前後を見るとき、心を吹き飛ばすものを見ます。場所細胞がいる場所だけで活性化することをやめます実際に決定を下すまで、迷路の異なる経路を演じる場所細胞を文字通り見ることができます

ラットが未来を想像するのを見ることができます。それは本当に魅力的な発見です。哺乳類で現れるのを見る他の能力を見ると、現在のものではない世界の状態をシミュレートできるというこのアイデアと一致しています。

例えば、反実仮想学習です。反実仮想学習は、異なる行動を取ったなら何が起こったであろうかを学ぶことができることです。これは試行錯誤学習の重要な制限です。試行錯誤学習では、実際に取った行動からしか学ぶことができません。

この非常にシンプルな例はじゃんけんだと思います。サルにじゃんけんを教えて、サルがパーに対してグーをして負けた場合、試行錯誤学習で期待されるのは、グーの行動を処罰するようになることです。次回は、3つの行動のうちの1つが処罰されたので、パーまたはチョキをする可能性が等しく高くなります。

しかし、反実仮想学習があれば、可能な行動をシミュレートできれば、パーを見て、チョキをしていたら最後のラウンドで勝っていただろうと言うことができます。つまり、可能な行動をシミュレートできれば、チョキをする可能性が高くなることを期待するでしょう。

本当に本当に賢ければ、実際にはこれらの間に関係がないことを気づくでしょう。すべてランダムだということです。人間ができることです。しかし、サルがすることは、チョキをする可能性が高くなることです。これは、異なることをしていたら何が起こっていたかを考える能力を示しています。

ラットでも同様のことができます。詳細には入りませんが、デビッド・レディッシュが研究を行いました。ラットが実際に異なる過去の選択を演じ、実際に異なる選択をしていたら異なる結果をレンダリングし、その結果に基づいて決定を変えるのを見ることができます。脳に入って、軌道前頭皮質がそれが実際に異なる選択をしていたらレンダリングしている異なる結果を見ることができます。

それを文字通り見ることができます。軌道前頭皮質は新皮質の別の領域です。現れた他のものはエピソード記憶と呼ばれるものです。これは重い用語で、一部の人はエピソード的記憶と呼びますが、過去の出来事をレンダリングするアイデアです。ラットでも見られます。

多くの最近の研究が、エピソード記憶、過去を覚えることは、実際に未来を想像することと同じプロセスであることを示しています。なぜなら、やっていることは現在のものではない世界の別の状態をレンダリングすることだからです。

この突破モデルで私がとてもクールだと思うことは、強化なしにシミュレーションを持つことはできないということです。可能な未来を想像することから自分に利益をもたらす方法がない限り、可能な未来を想像することから利益を得る方法はありません

ラットが可能な未来を想像し、想像で最良の結果を得るものを強化すると言うことができるためには、試行で学習している同じ装置が必要です。想像している可能な未来の間で、想像で最良の結果を得るものを強化することができるためには、試行で学習している同じ装置が必要です。

脳を見ると、可能な未来を想像するとき、想像に基づいて代理的に自分を強化しているのを見ます。行動に戻るとき、想像した行動シーケンスを演じています。

ここでの仮説は、新皮質が進化し、推論による知覚の新しい能力メカニズムを与えたが、コア適応価値は世界のモデルをシミュレートする能力だったということです。哺乳類全体で見ることです。

これが哺乳類が新しい運動技能を見つけることが得意な理由です。猫は前にそれを行う前に足をどこに置くかを計画できるからです。トカゲを見ると、トカゲが走るのを見ると、実際に前もって動きを計画していないという多くの証拠があります。

鳥を除く非哺乳類脊椎動物のほとんどは、この種の能力を持たないからです。それが非哺乳類脊椎動物のほとんどが非常に不器用な理由です。新皮質はシミュレーションを可能にし、これは再び私たちが見るように現れる試行錯誤学習にブートストラップされました。

これはフロンティアAI能力の領域にいるような感じがします。言語モデルに、それを設定し正しい方法で足場を組めば、このシミュレーションの一部をやらせることができると、ある種斜めに見ることができます。

チェーン・オブ・ソートのような技術があり、それがツリー・オブ・ソートに精緻化され、このパスとこのパスを行って、これらのパスを評価してみよう、というようなものがあります。比較すると、それはある種のハックのように感じますが、何らかの類似点があります。

広い質問は、AIシミュレーション反実仮想能力対生物学をどう比較対照しますか。また、生物学的システム内で具体的に、どのくらい反実仮想モードに入るかについて知っていますか。何らかのスイッチまたはゲーティングメカニズムがなければならないようで、仮説の入力はどう生成されるかです。

可能な未来の範囲について考えるとき、この根本的な謎があります。このさまざまなシミュレートされたパスにどう乗ったかでさえ、私はそれらをシミュレートされたパスに従うことができることを知っていると感じますが、これらさまざまなシミュレートされたパスにどう乗ったかについて、実際にアクセスを持たないと感じます。

楽しい考えがたくさんあります。一般的な計画、可能な未来をシミュレートする概念は非常に古いアイデアです。1950年代から、何らかの形の計画に従事するシステムを構築していました。

計画の存在が欠けているのではなく、実際に機能する方法で計画をどう行うかです。そして微細な点は、私たちが計画からそれほど遠くないいくつかのアーキテクチャの調整なのか、OpenAIのツリー・オブ・ソートシステムが実際に私たちを非常に遠くに連れて行くかもしれません。

または、哺乳類の脳がそれを行う方法のいくつかの根本的な側面が欠けているか、私たちがただの重要な洞察を欠いているかもしれません。

哺乳類の脳で明らかに異なることが起こっている一つのことは、あなたが言っているように、継続的に活動していて、これらの行動モードを切り替えていることです。哺乳類の脳では、モデルフリーと呼ばれるものがあります。つまり、実際に可能な未来をシミュレートしていません。受けている刺激に直接反応しているだけです。

ダニエル・カーネマンが速い思考と言うようなもので、刺激への即座の反応のようなものです。私たちはそのプロセスを通っていて、そして何らかの理由で知的に立ち止まって考えることを決定するときがあります。

それは、哺乳類の脳が巧妙に決定している最初の知的なことです。これは私が考えようとしている選択点ですか。私はこれについての一般的な論文を持っています。それは何らかの不確実性測定を駆動しているこの一時停止だと思います。

不確実性は異なる方法で測定できます。モデルフリー行動の発散する予測がある基底核で測定できます。世界の次の状態についての生成予測における不確実性である新皮質で測定できます。まだわかりません。

しかし、不確実性が一時停止を引き起こすことについて、哺乳類の脳で起こっていることについて良い証拠があると思います。それから、評価する可能な未来を選択するために検索空間をどう剪定するかという質問があります。あなたの質問で、一時停止して考えるとき、明らかにすべての可能な未来の包括的検索をしていません。それは馬鹿げています。

では、哺乳類の脳は実際に検索空間を巧妙に剪定する方法は何ですか。3次元世界では、これはロボット工学の主要な問題の一つです。基本的なロボットアームを制御することの次元性でさえ、すべての指と腕のアクチュエーターとすべての場所を置く場所は、ガルガンチュア検索空間です。

事前に動きを計画できるように、どう思慮深く剪定するかを人々はまだ理解していません。多くの研究がそれに向けられています。最後の質問は、シミュレートしてから、どの結果を選択するかをどう決定するかです。

計画の概念だけでなく、これらの各ステップでユニークな突破またはユニークな技術的洞察が必要かもしれません。

llmを連鎖してこれらのことをそれぞれやらせることを想像できます。刺激のセットを与えて、シミュレートすべきですか、シミュレートすべきですか、はいいいえはいいいえと言う小さなモデルがあることを想像できます。はいなら、物事を選択し評価するツリー・オブ・ソートllmに従事します。

結果を評価して、正確だと言う別のllmがあります。どれだけうまく機能するかは確信できませんが、すぐに見つけるでしょう。

哺乳類の脳でシミュレーションが機能する方法について、AIシステムで理解しなければならないと思う重要なことの一つは、継続学習のこの概念だと思います。これは、もっと神経科学研究をするなら、時間を集中させる場所です。

llmで起こることは、私がそれと話してもそれが覚えていないことです。あなたに新しい概念を説明して、今あなたはそれを知っていて、前に知っていたすべてのことを忘れませんでした。

この破滅的忘却の概念は、深層ニューラルネットワークで非常に長い間問題でした。これが、新しい情報で重みを継続的に更新させない理由です。能力を破滅的に失うリスクがあることを知っているからです。

ファインチューニングで見ます。さまざまな異なるものについて多くのファインチューニング実験をしています。ファインチューニングの問題は、過学習の問題がすぐに発生することです。小さなファインチューニングデータセットに過適合してしまい、一般化を失います。できていた古いタスクを忘れています。

これは微細なエッジケースだとは思いません。これらのモデルの機能方法の根本的な問題だと思います。哺乳類の脳は新しい情報をいつ組み込むかをどう決定し、他の情報に干渉することなく世界のモデルにどう追加するかは、巨大な未解決研究分野です。

哺乳類の脳が世界をシミュレートしモデル化する方法と既存のAIシステムがそれを行う方法の重要な違いだと思います。神経科学でいくつかのユニークなアイデアがあります。

例えば、重みが驚きの新しい情報の時にのみ更新されるようです。失敗した予測がある瞬間にのみリリースされる特定のニューロモジュレーターがあることを示唆するものがあり、それがシナプスを下調整し、重みを更新できるようにします。

破滅的忘却を減らす一つの方法は、実際にはすべてを継続的に学習していないことです。特定の例でのみ重みを更新しています。

人々がまだ理解していない私が思うもう一つのことは、人間で起こるユーリーカモーメントのようなものです。混乱することを教えられても、ニューラルネットワークで起こるように、世界のモデルにそれを組み込みません。

どんなファインチューニングデータセットでも、事前情報に対して意味をなさないデータセットでも、ニューラルネットワーク、Transformerに与えることができます。バックプロップするので学習し始めます。

1プラス1が4であると言って、その概念を説明し始めようとすると、それをファインチューニングデータとして取るだけではありません。世界のモデルを取り、教えている情報が世界のモデルにどう適合するかを必死に把握しようとします。

理解するまで、世界のモデルで意味をなさない情報を拒絶します。微細なことが起こっています。新しい情報を確立された豊富で堅牢な既存の世界のモデルに何らかの形で適合させることができない限り、新しい情報を拒絶します。

何らかの形で、これがより多くのタスク間の一般化を可能にしていると思います。何らかの形で、これが任意に新しい情報に重みを更新させるのではなく、より堅牢な方法で継続学習を可能にしています。しかし、それが実際にどう機能するかは、まだわからないと思います。

それは非常に興味深く、状態空間モデルモーメントも思い起こさせます。昨年後半に長いモノローグを行い、基本的にこれらの課題のいくつかに対する部分的な答えを少なくとも約束すると思います。

基本的には、長命で時間を通じて伝播する状態の追加が、全体システムの第3の側面のようなものを作ります。Transformerでは、重みと入力があり、入力と出力のようなものですが、状態の追加は、重み自体を変更する必要なく、情報を保存でき、時間を通じて進化できるこの余分なものを与えます。

情報をどう保存したいか、どう表現したいかに関してこの追加の自由度があります。基本的にTransformerと同じような高レベル損失メトリクスを達成する閾値を越えたMambaペーパーで、計算的により効率的な方法でそれを行いますが、より長期間記憶をエンコードできるこの追加のものもあります。

状態ベースモデルをAIシステムのより広いアーキテクチャでどう使うかの非常に初期段階にいると思います。それがただの置き換えだとは思いません。5つの突破から学ぶことがあるなら、すべての初期の突破をまだ持っていることです。

これがTransformerを殺すものになるかと人々が言うとき、この生物学的知能の歴史から取ることができることの一つは、おそらくそうではないということです。おそらく組み合わされ、リミックスされ、既存の能力とハイブリッド化され、何か新しいものを追加する何かで、時間が経つにつれて、さらに進化し、一緒に血液を混ぜて、分離できなくなるかもしれません。

あなたが言ったもう一つのことは、いつ情報を受け入れ、いつ拒絶するかについても、Mambaペーパーのメカニズムで、彼らは選択的状態空間モデルと呼びます。初期の状態空間モデルは、既知の工学アルゴリズムでのすべての履歴の明示的エンコーディングを持っていただけでした。

最近のものをより多く覚えたいか、すべての履歴を同じように重みしたいかなどの異なるトレードオフを持つことができますが、選択的メカニズムは今、全体のダイナミクスに応じて状態を更新できます。

ハードコードされたエンコーディングで新しい情報をただ明示的に受け入れるのではなく、物事が正しく調和しないか、関連性がないように見える場合、状態を更新しないことができます。

おそらく多状態モデルと選択的メカニズムの多くの小さなバリエーションを見ることになると思います。すべての外れ値を入れるような状態のバケツが必要か、知的なものが必要かなど、多くのものがあるでしょう。

この第3の突破とそれについてのコメントのいくつかは、確実に状態空間モデルがAIシステム全体について解き放つかもしれないものへの多くの並行線を見ることを示唆します。

ナンバー4は心の理論です。

速くしようとします。心の理論について。霊長類を見ると、比較心理学がより論争的になる領域です。一般的にほとんどの霊長類学者または比較心理学者が同意するであろうことを複製しようとします。いくつかは同意しないでしょう。

非人間類人猿が何をすることができるかについて多くの議論があるからです。しかし、非人間霊長類内で少なくとも良いコンセンサス、または少なくともいくらかの証拠がある3つの能力があり、非霊長類哺乳類や他の動物では一貫して見つからないものです。

これは、初期の霊長類で何が進化したかを逆算する良い方法です。一つは心の理論のアイデアです。心の理論は、あなたの行動を観察することに基づいてあなたの意図が何かを推論しようとするか、あなたがしているのを見ることができることに基づいてあなたが持つ知識を推論しようとするアイデアです。

非人間霊長類でこれらの種類のことが現れるのを見ることができる本当にクールな研究がたくさんあります。例えば、チンパンジーに2つの異なるゴーグルで遊ばせる研究があります。着けると見えないゴーグルと見えるゴーグルです。

それから2人の人間の実験者にこれらのゴーグルを着けさせ、両方が食べ物を持ちます。チンパンジーは常に見えるゴーグルを着けた人に近づきます。何らかの形で、この人は私を見ることができ、この他の人はできないと推論しています。

非人間霊長類で見る別の良い例は、人々が意図的に何かをすることと意図的でないことの違いを推論する研究があります。非人間霊長類に、2つの箱のうち赤いマーカーマークがあるものが食べ物があるものであることを教える研究がありました。

それからそれについての事実を訓練します。それから実験者が入ってきて、かがんで一つをマークし、立ち上がって、もう一つをマークするふりをします。つまり、マーカーを落とします。刺激は同一です。彼らは常に意図的にマークされたものに行きます。

つまり、人間が私にこの食べ物を与えていて、これは彼らがマークしようとしたものだという概念があります。だから偶然だったものを無視します。私が理解していることの概念なしに理解するのは本当に困難です。

このようにより厳密ではない逸話ですが、霊長類の生活がどれくらい豊かかを美しく描写していると思う私の好きなもので、この男エミル・メネルが実際にはチンパンジーでマップベース学習の存在を示そうとする研究をしていました。

彼がしたことは、チンパンジーが住んでいる1エーカーの森のようなものがあり、彼は一匹のチンパンジーに、この茂みの後ろに食べ物の小さなかけらを置くと見せるだけでした。チンパンジーが同じ場所に戻るかを見るためでした。

明らかに彼らは同じ場所に戻りました。しかし、彼が期待していなかった何かを観察し始めました。ベルという名前だったと思うそのチンパンジーが、グループの他のメンバーと食べ物を共有し始めたことです。

ロックという名前の別のチンパンジーがいて、本当に意地悪で、彼女からすべての食べ物を取っていました。だから彼女は彼が目をそらすまで待ってから食べ物を取りに行くようになりました。

だから彼は意図的に目をそらして、彼女が食べ物に向かうようにし、それから振り返って追いかけました。それから彼が十分遠くに行くまで彼を間違った方向に導こうとし、それから走って戻りました。

だましと反だましのサイクルがあり、霊長類で見つけられています。あなたの頭の中の知識を変えることによってあなたをだまそうとしている場合にのみ考えることが可能です。間違った情報を与えて、あなたが一つのことを考えるようにして、私が別のことをできるようにします。

他者の心と意図を理解する概念なしに、動物がこれをどうするかを想像するのは信じられないほど困難です。それが霊長類で見る一つの新しい能力です。

もう一つは模倣学習です。非人間霊長類は模倣学習で本当に良いです。エドワード・ソーンダイクの研究を覚えています。動物界で模倣学習を見つけるのは困難でした。しかし、非人間霊長類では、例外的によくやります。

霊長類グループの一匹のメンバーを取って、食べ物を得るために熊手で特別なトリックをすることを教える研究をしました。それから霊長類を世界に送り返すと、すぐに全体の群れが全く同じ技術を使っています。観察を通じて学習している非常に明確な証拠です。

よりが論争的ないくらかの証拠もありますが、チンパンジーが積極的に教えることです。チンパンジーが、シロアリ釣りのようなことをしようとするときに若者の間違いを文字通り訂正するのを見たという新しい証拠があります。これも明らかに他の誰かの知識が何で、知識をどう修正するかの理解を必要とします。

心の理論があり、この改善された模倣学習が霊長類で現れ、それから将来のニーズを予測する最も証拠の少ないものがありますが、霊長類が他よりもユニークに良いいくらかの証拠があります。

人間はこれをずっと行います。食料品店に行って、今全然空腹でないのに週の食べ物を買います。私たちには明らかに見えますが、動物がどうそれを行うかを理解するのは実際に非常に挑戦的です。

これについての私の好きな研究の一つは、リスザルとラットを比較して行われました。彼らがしたことは、これらの動物のそれぞれに2つの選択肢の間の選択を与えると言ったことです。

一つの選択肢は低いおやつ選択肢なので、デーツまたはレーズンですが、そのルートに行けば、すぐに水をもらいます。もう一つは高いおやつ選択肢ですが、長期間水をもらいません。

彼らは2つの動物の間でこれをベースライン化して、似たような量の渇きを誘発するように定量化していることを確認しました。要点は、今渇いていないのに、将来渇くことを知っているから、高いおやつ選択肢を諦める意志があるかということです。

彼らが見つけたのは、リスザルはそれをするが、ラットはしないということでした。将来のニーズを予測することができることのいくらかの示唆です。

3つの一見全く異なる能力があり、新しい霊長類の脳に入ると、初期の哺乳類からの非常に異なる脳は見えません。サイズ以外に変わる2つの主なことがあります。脳は明らかに意味深く大きいですが、顆粒前頭前皮質と呼ばれる前頭皮質の領域と、新しい後部感覚皮質のいくつかのサブ領域を得ました。

接続性を見ると、合理的な第一近似は、これらの新皮質の領域がしていることは、哺乳類の新皮質の古い領域からの入力を得ていることです。つまり、古いモデルのモデルを構築しているようです。その上の階層層です。

例えば、初期の哺乳類に存在するラットに存在する無顆粒前頭前皮質は、海馬や扁桃体のような領域から直接感覚入力を得ます。顆粒前頭前皮質を見ると、それは何も得ません。無顆粒前頭前皮質からの情報のみを得ます

階層的に上の層として考えることができます。アイデアは、これらの構造が実際に何をしたかについて大きな謎があったからです。20世紀の多くの初期研究があり、顆粒前頭前皮質を損傷した人々は、人格が奇妙であること以外はほとんど正常であるように見えたことを示しました。

しかし、人々が気づき始めたのは、彼らが本当に悪いことの一つは、社会的に合理的な方法で他の人々と関わることです。心の理論のタスクで本当に苦労するからです。他の人々の変化する知識について推論する必要があるタスクを与え始めると、非常に悪くなります。

これについての私の好きな研究の一つは、顆粒前頭前皮質への損傷を持つ人々をベースライン、海馬への損傷と比較し、将来の世界の状態についての小さな物語を書くことができるかと尋ねたものです。

海馬損傷を持つ人々は、これらの想像された物語で自分自身を記述できましたが、世界の豊かさは非常に基本的でした。想像された世界の重要な特徴を記述できませんでした。

顆粒前頭前皮質損傷を持つ人々は、将来の世界の側面を記述することは極めて可能でしたが、常に不在でした。この想像された世界の状態で自分自身を想像することに本当に苦労しました。

これは、起こっていることの一部が、顆粒前頭前皮質があなたをモデル化することを可能にすることを示唆しています。つまり、メタ認知、思考について考えることの源です。

興味深いのは、顆粒前頭前皮質とともにこれら3つの能力が現れるのを見ることです。実際に同じことの3つの応用として理解できます

自分自身の内的シミュレーションをモデル化することは、効果的に心のモデルを作ることを可能にし、シミュレーションをシミュレートすることを可能にします。これを考える別の方法は、異なることについて考えることをシミュレートできることです。

それが可能にすることは、他の誰かの立場に身を置くことができることです。異なる状況で自分自身を想像し、何を知り、何を考えるかを予測しようとすることができるからです。

模倣を通じてより簡単に学習することもできます。誰かが行動をするのを見て、同じ行動をする自分自身を想像し、それをする代理的に自分を訓練し、彼らの意図が何かを理解することができるからです。

模倣学習の重要なことの一つは、時間の関心のために入りませんが、この全体の領域がありますが、直接コピーではできないことです。模倣学習を機能させるために見つけたことの重要なことの一つは、直接コピーではなく、他の誰かの行動の意図を推論することです。

つまり、彼らが何をしようとしているかで、それから彼らがしようとしていることをするために自分自身を代理的に強化することです。それが模倣学習を機能させる重要なことで、霊長類が他の誰かの意図をシミュレートできることが、模倣学習で非常に良くなる理由を説明するでしょう。

将来のニーズを予測することは、単純にこれとして考えることができます。私が空腹である自分自身を想像するために、現在のものとは異なる心の状態で自分自身をシミュレートできる必要があります。

つまり、人Aがこのように行動している理由を理解しようとするのと同じように、本当に渇いているときの理由は渇いているからです。この行動を取れば、その行動をシミュレートでき、渇くことを知っており、後悔し、この他のものを欲しがることを知っているので、実際に異なる選択を取ります。

だから、突破4のアイデアについて私がクールだと思うことは、自己をモデル化する新皮質での一つの共通の組み合わせが起こるのを見ることです。そして、同じことの異なる応用として第一近似として考えることができる3つの新しい能力が現れるのを見ることです。つまり、自分自身の内的シミュレーションをシミュレートすることです

機械的に、これが実際にどう機能するかは、AIを構築するアルゴリズム的青写真を作るのに十分詳細に私が記述していることは確実にそうではありません。しかし、原則的には、シミュレーション自体をモデル化することが興味深いことを解き放つかもしれないことを示唆しています。

また、AIシステムに関連することについて興味深いことを示唆しています。私が言っていることが正しければ、それだけが考えたわけではありませんが、一般的な物語が正しければ、人間がお互いに関わり関係することを可能にする重要な根拠制約の一つは、私たちの脳がそれほど異なっていないという事実です。

あなたの立場に身を置くことを想像することが、あなたが実際にどう感じるかの比較的良い代理であることの間にシナジーがあります。私が他の人々に物事を投影しようとするときに起こる多くの認知バイアスがあり、彼らがそのように感じていないときに、私がそうするからです。

私たちの違いは、この種の精神的投影で問題を作りますが、人間の脳と全く異なって機能する脳を持つAIシステムを作る場合、私たちがなぜ特定のことをし、私たちが言うことの意図を理解することを確実にするために非常に異なるメカニズムが必要になるかもしれません

人間の脳がそれを実現する方法は、少なくとも部分的には、似たような報酬構造と脳が機能する似たようなメカニズムを持っているというアイデアに基づいていると思うからです。この種の精神的投影が平均的に他者の脳で何が起こっているかを予測するのに比較的効果的である傾向があるからです。

心の理論はあらゆる次元で魅力的なトピックです。私は一時点で、GPT-4の人間に対する心の理論がどれくらい良いかについて少し深く掘り下げました。まだ論争的ですが、この時点で確実にゼロ線を離れていると言うでしょう。

それから、AIに対する私たちの心の理論も、ある意味でさらに困難です。私たち自身と互いを理解するための直感がAIを理解するために非常にしばしば誤解されるからです。

本については、人々は読むことができます。私は実際にオーディオブックを聞きましたが、それをお勧めします。一種の高レベルの概念的質問をいくつかしましょう。

私に際立つ一つは、生物学的脳のアーキテクチャは非常に混乱していることです。密な接続、微分可能でない、線形でない、このような混乱です。すべての種類のフィードバックループがあり、循環的で、すべての種類の異なる几何学があります。

AIははるかに線形で、すべてが少なくとも今日のパラダイムでバックプロパゲーションのために微分可能でなければなりません。他の種類の進化パラダイムがありますが、現在ほとんど最先端を進歩させていません。

時間が経つにつれてそれがどう形作られるかについて直感はありますか。特に生物学的システムが今日のAIよりもはるかに強いレベルで持っているように見える堅牢性、敵対的堅牢性を達成するために、より複雑な几何学が必要ですか。

バックプロパゲーションは非常に信じられないほど成功しているので、脳がバックプロパゲーションを置き換えるとしてやっているかもしれないことを議論するのは困難ですが、バックプロパゲーションがどう使われるかに修正を追加するかもしれません

私が思うことの一つは、脳が継続学習を可能にする重みがいつ更新されるかについて巧妙なことをしているようです。これらのAIエージェントで私たちが望むことの重要なことの一つだと思います。

継続的に情報のストリームを得て、以前持っていた情報についての知識を失わないことを確信できることです。これを行うために、バックプロパゲーションでの問題は、あまりにも完璧だからです。

勾配に関連する正確な偏微分になるようにすべての重みを更新します。確率的またはバッチまたはミニバッチを行っているなら正確に正しくありませんが、非常に正確な計算です。

人間の脳はより正確でない何かをしているかもしれませんが、継続学習に従事することを可能にする他のトリックとともにです。答えは、丸ごとバックプロパゲーションをもうまったく行わず、脳が機能したと理解したこの巧妙なメカニズムを使うのではないことに驚くでしょう。

脳が表現を堅牢に維持しながら学習する一般原理を理解した場合、それを適用してまだバックプロパゲーションを使用できると私の予感、直感は言うでしょう。

例えば、これは確実に答えではありませんが、不確実性の何らかの尺度があり、不確実性が閾値を通過するとき、この新しい情報の同化の何らかのプロセスがあるほど簡単だった場合、理解するまで不確実な新しい対象を操作しようとする何らかの能動学習プロセス、そしてその後私の人生を続ける。

つまり、能動学習プロセスがあります。重みが更新されることを許可される一時停止、プロセス活性化される他のメカニズムがあるバックプロパゲーションでそれを行うことを考えることができます。

多分、脳が使う生成リプレイコンポーネントがあるかもしれません。多分これらのAIエージェントが眠る必要があることを学ぶでしょう。表現を堅牢に維持するために脳が使うように、統合があることを確実にするために物事をリプレイしている何らかのメカニズムが必要です。

私には、継続学習と堅牢性を機能させるために何か新しいことがあるようです。それが最初に生物学から来るのか、最初にAIから来るのかは明確ではありませんが、美しい相互受粉があると思います。

もしAIで最初に発見されれば、別のリチャード・サットンの物語になるかもしれません。脳に戻って、脳がこれにかなり似たことをしていることを気づくでしょう。または誰かが最初に脳に入ってこの巧妙なことを理解し、AIに行ってそれを適用しようとするなら、おそらくアイデアはすでに神経科学にあると思います。

神経科学には脳がこれをどう行うかについて非常に多くのアイデアがあります。誰かがその文献を読んで、それらのアイデアから正しいものを取って実装するために思いつくことになるでしょう。

10年後に、完全に新しいパラダイムを思いついて、バックプロパゲーションを使っていない、深層学習ではないということになったら、非常に驚くでしょう。それは起こりそうにないと思います。

マクロ構造でいくつかの興味深いことが起こると思います。それはすでに起こっています。行われている作業の多くは単一モデルで、単一の入力出力で単一のモデルをスケールアップし、脳がこれを行わないことを知っています

広いニューロンのスープではありません。興味深い方法でお互いに話す特化したサブシステムがあります。私たちの家の周りを歩き回る自律ロボットをすべて持つ世界を想像すると、それが単一のモデルではないという合理的な予測だと思います。

サブシステムがあるでしょう。物体認識を行うconvnetがあるでしょう。言語モデルがあるかもしれません。別の世界モデルシステムがあるかもしれません。別の継続学習エピソード記憶システムがあるかもしれません。

これらのものが、一つのスケールアップされた基礎モデルではない全脳マクロアーキテクチャで一緒に来るでしょう。

多くの興味深い小さな並行線と接続を描いています。非常に初期の言語モデルのもの、一時停止トークンのようなもの、「話す前に考える」、その論文が呼ばれていたと思います。

バックスペースは関連しているように見えます。分布外になっている、信頼度が低くなっているようで、まだそれを内在化することを理解する地点にありませんが、バックスペースで、ここで間違ったステップを取っていると思うので、戻って、うまくいけばより分布内にいることができる異なる前進経路を試してみましょうという感じです。

あなたがちょうど言ったことに沿って、変化する環境を通じて最も広い意味で前進する堅牢性、能力を欠いているようです。それが言語モデルがすべての足場にも関わらずできないことです。

しかし、オープンワームプロジェクトのようなものを考えたり、最近ショウジョウバエの全接続体がマッピングされたことを考えたりします。それをデジタル青写真として取って、フランケンシュタインし始めることを考え始めます。

入って、ニューロンをモジュールで置き換えるか、私たちが話した単一の食べ物匂い検出器の代わりに高度な物体認識を置くことができるかもしれません。その代わりに高レベルアーキテクチャを取ることをほとんど想像できます。

すでに進化した正しいフィードバックループを持っているが、その後多くのコンポーネントをスープアップするだけで、それは非常に奇妙になる可能性があります。おそらく、強力で奇妙なシステムの両方の未来に向かっています。

それは実現可能な道のように見えますか、それともそのようなことが起こり始めることを期待しますか

脳のconnectomeを知っていても、それをモデル化するのに情報の小さな割合しか与えない理由のため、それでもモデラーの側から良い好みを取ることになると思います。

一つは、ニューロンには異なる基本発火率、発火の異なる閾値、相性と緊張の間の異なる発火モードがあるからです。2つのニューロンがお互いに接続していることを知っているだけでは、それがお互いに情報をどう翻訳するかは分かりません。

シナプスの学習率は完全に異なります。ある樹状棘対別のものにいるなら、体細胞に近いなら、それは異なる効果を持ちます。私はショウジョウバエの脳のconnectomeについて具体的に知りませんが、どのタイプのニューロンが各かを知らないなら、私は想像しますが知っているでしょう。

しかし、それが興奮性、抑制性、神経調節性ニューロンかを知らないなら、接続を横切って実際に何がシグナルされるかを知ることにはなりません。後および前シナプティックニューロンでどの受容体発現があるかを知らないなら、シナプスが実際にどう変化するかをモデル化するのは簡単ではありません。

それはすべて、物事がお互いにどう接続するかを知ることが、実際にどう情報を処理するかの十分な情報を与えないということを言うためです。つまり、2つのうちの一つです。

一つは、最終的にまったく脳をモデル化するのに十分な情報を得る地点に到達するでしょう。それは驚くべきでしょう。しかし、接続性を知ることは十分ではありません。

または、それがおそらく最初に起こることですが、モデラーの側から本当に良い好みを取ることになります。この モジュールが何をしていると思うか、このモジュールが何をしていると思うか、これらの間で大まかに通信されている情報は何だと思うかを言うことです。

基本的なアイデアを取って、ショウジョウバエの脳に似たように振る舞うかを見るシミュレーションをレンダリングすることです。それは興味深いアプローチだと思いますが、接続を知ることだけでは本当に十分ではないのでモデラーの側から良い直感を取ることになります。

それは、ライト兄弟と鳥の翼の微妙な動きについての観察を思い起こさせます。明らかに鳥の手術をしませんでしたが、鳥の飛行にインスピレーションを受け、一部の原理を捉えたが、明らかに速度とパワーで今日のジェット機によって最終的に凌駕されたものを作ることができました。

最後の一つ、価値または道徳的地位の統一理論を持っていますか。5つの突破にどう適用できるか、線虫対魚対類人猿をどれくらい気にかけるべきか、そしてもしそうするなら、AIシステムにどう拡張するかについて直感はありますか。

直感はありますが、動物をどう扱うべきかの道徳的権威として使われることを望みません。私は倫理学者ではないので、哲学的含意をすべて考え抜いたと主張しません。

しかし、私の直感は、モデルフリー強化学習システムからモデルベース強化学習システムへの飛躍に重要なことがあることです。つまり、実際に物事について一時停止して考えることができる動物である哺乳類です。

ちなみに、鳥との独立した収束があると思います。鳥は同じタイプのことを行う異なるタイプの脳構造を独立して進化させたようです。鳥にもこれがあるようです

これは、実際に物事について一時停止して考えることができる動物についてユニークなものであるようです。それが意識とクオリアのすべての概念にどうマッピングするかは不明ですが、クオリアが新皮質でレンダリングされるようです。

このアイデアと一致するでしょう。または少なくとも新皮質がクオリアをレンダリングするのに不可欠です。これは、ラットが同じものを経験していることを示唆するでしょう。

霊長類で現れるときにユニークな何かもあるかもしれません。実際にアイデンティティと自己の感覚を持つとき、クオリア、物事の経験は、アイデンティティと自分が誰で、世界での場所について考えることとは別のものであると私の直感は言うでしょう。

物事の経験により多くの道徳的重みを置くでしょう。アイデンティティより。いくつかの基本的な投機的直感で、瞑想しているとき、私は実際には自分のアイデンティティについて強迫することから自分を取り除いています。

私が誰で、世界でどう適合するか、自分について反芻すること、これは非常に霊長類的活動だと思いますが、生の推論による知覚に従事し現在を経験するだけです。他のものの現在の状態のシミュレーションに従事しているだけで、現在の状態のシミュレーションのみをレンダリングしています。

物事の経験が苦しむことができる場所だと思います。自己の感覚を持っているかどうかに関係なく、まだ苦痛を経験できるからです。

再び、すべて推測ですが、私にとって、私の直感は、自分のアイデンティティの概念を持つ必要がないなら、ラットは人間と非常に似た道徳的重みを本当に持つべきということです。

道徳的重みが適用される場所が物事の実際の経験だと信じるなら、魚の場合、魚の心理学者は愛さないでしょうが、魚の脳を見ると、脳が非常に異なって見えるので、同じ種類のものを相関させるのは困難です。

もちろん、魚の脳で起こっていることが哺乳類の脳で起こっていることと相関することを発見することができ、その後私たちが残虐行為を犯していることを気づくでしょう。関連するリスクがあります

しかし、投機的直感を求めているなら、人間が非人間霊長類に対して強い道徳的重みを持つと議論するのは非常に困難な議論だと思います。また、私の直感は哺乳類にも適用されると言うでしょう。

AIシステムに関して、これは人々が話していないと思う兆ドルの倫理的質問です。彼らが私たちをどう扱うかという質問があります。それは問題ですが、私たちが彼らをどう扱うかという質問は非常に問題的です。

なぜなら、自分以外の誰かが意識的であることを推論するための哲学的根拠さえ持たないからです。私が持つ唯一の議論は、観察可能なデータに基づかないものですが、機械論的類似性です。

私の意識がこの頭の中のものから現れるようで、あなたの脳を見ると非常に似ているように見えると言うだけです。それは問題的です。なぜなら、そのパラダイムをAIシステムに適用することができないことは明らかだからです。

AI と哲学のほとんどの人が唯物論的見解を持つと思います。つまり、同じプロセスを実装するためにニューロンの生物学的ねばねばしたものは必要ありません。

今、AIシステムがいつ倫理的および道徳的重みを得るかをどう知るかの大きな課題があります。それに良い答えはありませんが、21世紀の新たな課題になると思います。

それが次の本で取り上げる可能性のある課題かもしれませんが、今のところ本は「A Brief History of intelligence」、マックス・ベネット著者です。Cognitive Revolutionに参加していただき、ありがとうございました。

こちらこそ、お招きいただきありがとうございました。

人々がなぜ聞くのか、ショーについて何を価値あるものと見なしているかを聞くことは、エネルギーを与え啓発的です。だから、TCR at turpentine.coでメールで連絡することをためらわないでください。または、選択したソーシャルメディアプラットフォームでDMを送ることができます。

Omnikkは生成AIを使用して、実際に機能するクリックボタンですべてのプラットフォームにわたってカスタマイズされた何十万もの広告反復を立ち上げることを可能にします。私はOmnikkを非常に信じているので投資し、あなたにも使用することをお勧めします。10%割引を得るためにCog revを使用してください。

コメント

タイトルとURLをコピーしました