Michael Timothy Bennett: スタック理論と身体化された超知能 | AGI-25

本発表は、意識的機械の構築を目指した博士論文から派生した「スタック理論」と身体化された超知能に関する理論的枠組みを提示するものである。発表者のMichael Timothy Bennettは、従来のAI研究における「計算二元論」の問題点を指摘し、ソフトウェアとハードウェア、そして環境との関係を統一的に捉える新たな視点を提案している。スタック理論の核心は、客観的に最適な知能行動を形式化するために、複雑性ベースの帰納法に代わる「弱さ(weakness)」という概念を導入した点にある。この理論では、身体を抽象化レイヤーとして捉え、より弱い制約を持つ政策(ポリシー)を体現することが適応性の最大化につながると論じている。実験結果では、形式の単純性を最大化する従来のアプローチ(simpaxing)に対して、機能の制約の弱さを最大化するアプローチ(wmaxing)が優れた性能を示すことが実証された。さらに「スタックの法則」として、制御を階層的に委譲することでより弱い政策を形成できることを示し、生物学的システムの効率性と柔軟性を説明する理論的基盤を提供している。

Michael Timothy Bennett: Stack Theory and Embodied Superintelligence | AGI-25

What do biological, computational, and human organizational systems share in common? Why is simplicity of form correlate...

スタック理論と身体化された超知能の理論的基盤
AI研究における計算二元論の問題
抽象化レイヤーとしての身体
パンコンピュテーショナル・イナクティビズム
技術的成果と実験結果
他のメタアプローチとの比較
オッカムの剃刀と抽象化レイヤーの最適化
委譲と分散の違い
スタック理論の他の応用

スタック理論と身体化された超知能の理論的基盤

この講演のタイトルはスタック理論と身体化された超知能についてです。私の博士論文である「意識的機械の構築方法」に基づいていますが、今日は意識や言語については話しません。論文の哲学的基盤と、AIに最も関連する技術的成果についてお話しします。

私がこの研究で答えようとしている問いは、客観的に最適な知能行動をどのように形式化できるかということです。主観的に最適、つまり「私は最適だと信じている」というレベルではなく、客観的にです。この主観的に最適な知能行動の上限は何か、そしてこの上限を達成する機械をどのように構築できるかという問題です。これはオッカムの剃刀にも関連しており、なぜそれが機能するのか、なぜ形式の単純性が客観的なパフォーマンスの概念と関係があるのかを説明します。そして複雑性ベースの帰納法に代わる選択肢を提案するものです。

AI研究における計算二元論の問題

哲学的基盤について説明します。AIには私が「計算二元論」と呼ぶ問題があります。これは、複雑性ベースの帰納法を使用して最良のモデルを選択し最高のパフォーマンスを達成するAixiと呼ばれる理論的な超知能ソフトウェアマインドによく例示されています。しかし複雑性は解釈に依存します。チューリングマシンに依存して世界と相互作用しており、この相互作用的な設定では、システムが単純だと考えるものが外部の視点から見て必ずしも単純であるとは限りません。

環境内のハードウェア上で動作するソフトウェアマインドとして考えることができます。これらは一種の抽象化レイヤーです。これは16世紀のデカルト的二元論を思い起こさせます。そこでは精神的実体が松果体を通じて物理的実体と相互作用していました。精神が動物精気に作用し、それが身体を動かすというものでした。これは精神的実体と物理的実体を相互作用的関係に置く方法でした。

私たちがAIでやってきたことは、AIをソフトウェア知能の追求として枠組み化することで、松果体をチューリングマシンに置き換えたようなものです。行動について客観的な主張をしたいのであれば、モデルを拡張して、身体がどのように適合するか、環境がどのように適合するかを理解する必要があります。これがスタック理論につながります。

抽象化レイヤーとしての身体

計算二元論の問題は、意思決定装置と環境との間のこの抽象化レイヤーにあります。ソフトウェアマインドの解釈を入れ替えるだけで、そのパフォーマンスを任意に良くしたり悪くしたりできます。ハードウェアを入れ替えることでソフトウェアマインドを任意に良くしたり悪くしたりできると考えることができます。

しかし環境とハードウェアの関係を見ると、ハードウェアは環境上で動作するソフトウェアのようなものです。ソフトウェアがハードウェアの状態であるのと同じように、それは環境の状態なのです。これはずっと続いていきます。ソフトウェアがハードウェア上で動作し、それは抽象化レイヤーです。ハードウェアが環境上のソフトウェアとして動作するのは、ある種の注意をそらすものであり、これは永遠に続けることができます。

これは私たちに疑問を残します。これは意味を永遠に延期し続けるだけなのでしょうか。内容はどこにあるのでしょうか。これはある種の問題です。哲学的議論に詳しい方はご存知かもしれません。行動について客観的な主張をしたいのであれば、すべての抽象化レイヤーに当てはまることを枠組み化する必要があります。スタックが永遠に続くと仮定した場合、どのような結論を導き出せるでしょうか。

どのような環境であろうと、どのようなスタックであろうと、変化または差異が存在しなければなりません。そうでなければ、単一性か基本的には何もないことになります。差異が存在する場合、状態の集合があります。これは無限の状態集合かもしれませんが、要点は状態の集合があるということです。これは一種の構造主義的な見解で、すべての状態が差異の点を表しています。時間とは差異であると言えますし、世界に存在するすべてのものは、それが持続する状態の集合であると言えます。

すべての可能な環境、または考え得るすべての環境を状態の集合として記述でき、それらの環境に存在するすべてのものを状態の集合の集合として記述できます。これは非常に弱い主張ですが、ここから行動とは何か、知能とは何か、そして何が最適かもしれないかについて議論を構築できます。

パンコンピュテーショナル・イナクティビズム

これは次の部分を説明するために考え出した長ったらしい名前です。この無限のスタックはあらゆる考え得る世界を記述しており、その中での行動について話したいと考えています。このスタック内での認知を形式化するために、典型的なエージェント環境のパラダイムを避けたいと思います。なぜなら、再びこれらの二元論的な仮定に戻ってしまうからです。代わりに、より不活性または身体化されたものについて考えます。

これを行うために、エージェント環境を持つ代わりに、身体を抽象化レイヤーとして持ちます。この無限の抽象化レイヤーのスタックにおいて、抽象化レイヤーとは何を意味するのでしょうか。それは単に状態の集合です。それは私たちが住むどの宇宙であろうと、その言語のサブセットです。

身体は次に何が起こるかを制約する抽象化レイヤーです。私の身体の状態が、もし私がこの状態にあれば、次に起こる可能な世界は、私がこの状態やこの状態にいる場合とは異なります。異なる状態を体現するのです。これらは政策(ポリシー)として考えることができます。なぜなら、私が心の中で実行しているプログラムの状態が、昼食をどうやって手に入れるか、この講演をどうやって行うかを決定するからです。

身体はタスクを体現する抽象化レイヤーとして考えることができます。レノンが言っていたことと少し似ていますが、私たちには特定のタスクのサブセットに対する暗黙のバイアスがあります。象は人間とは非常に異なる課題に直面します。いくつかの問題に対処するために構築されたコンピュータは、別のコンピュータとは異なる利点を持っています。

この身体化を、可能な世界の集合に対処するものとして考えることができ、その身体の状態がどの可能な世界が続くかを制約します。もしこれができるなら、正しさの概念、追求できる何らかの目標があるでしょう。それは私が到達したい可能な世界のサブセットです。もし私がシステムにとって何が正しいかを定義しようとする外部の観察者であれば、これをタスクとして考えることができます。

ここでのタスクについて重要なことは、少し先に進みますが、それは目標とその満足の手段を統一するということです。ソフトウェアの表現や目標、それらの目標を達成するための計画について話す代わりに、タスクとして統一された表現を持つだけです。これは、目標を追求する手段がない場合には目標について話すことができないことを意味します。

この例として、ホメオスタシスを維持する生物、つまり生き続けることを考えることができます。まだ生きている場合、その過去としての行動の広範な定義を持っています。まだ生きているという事実に従って何が正しいかを示しています。これから、何らかの形で正しい行動に適合するように将来の行動を制約する状態を体現することが期待されます。

脳であれ身体の他の部分であれ、生き続けることができる状態を占有しなければなりません。なぜこれを行うのでしょうか。状態の集合があり、各状態が現実における差異の点を表し、これらの状態が時間の点のようなものであると考えると、各状態が別の状態に遷移するにつれて、世界を構成するこれらの状態のサブセット、これらの部分のいくつかは保存され、いくつかは破壊されます。

これは現実に一種のインセンティブを生み出し、自己を保存するものは保存されると言っています。これは一種の「べき」であり、そこから他の「べき」を導き出し、ホメオスタシスまたは生殖目標を追求するシステムが得られると論じることができます。

生命の起源などについて話すのはまだ先の話です。生きていること、または岩のように存在することには暗黙のバイアスがあると仮定してください。岩は宇宙の状態変化と互換性があるために存在します。存在しないものは存在しません。そして、この中で知能を定義できます。身体がタスクを完了し、存在し続けるためにできるだけ適応可能であるようにインセンティブがある場合、本当に欲しいのは適応の効率性です。

より多くのタスクを完了できれば、適応においてより効率的です。最も適応可能なシステムが欲しいのです。これをより多くの可能な世界を通じて持続することと考えてください。これらの哲学的基盤を繰り返すと、エージェント環境パラダイムを拒否していますが、互換性がないわけではありません。ただ異なるフレームを取っているだけです。代わりに、身体化された言語で記述を表現しており、その身体は多くの身体化されたタスクを完了できる抽象化レイヤーです。

私たちはそれが生き続けるか、何らかの目標を満たす政策または状態を体現することを望んでいます。そのような身体を設計する場合、生き続けることではなく、洗濯をするなど他の目標を満たすことを望むかもしれません。知能を適応性として定義し、もちろん目標とその満足の手段はこの枠組みで統一されています。

技術的成果と実験結果

これはコンピュータサイエンスの論文なので、哲学の博士号に移行せざるを得ない何かを考え出す必要がありました。それはいくつかの実験を実行することを意味しました。これらの実験は、最適な政策をどのように学習するか、最適な政策とは何かについてでした。ここでの最適な政策とは、身体を正しいものに制約するものです。私の実験の場合は二進算術でしたが、身体化された生物の場合は生き続けることなどです。

正しい将来の行動に私を制約する認知状態を体現したいのです。機械学習のツールがある場合、これを検索ベースまたは近似ベースに分解できます。異なる点の集合を通して曲線をフィットさせることができ、皆さんはそれをどのように行うかよく知っています。その後、まだ見たことのない点、まだ見たことのない経験、まだ見たことのない未来によりよく一般化するために、アーキテクチャの定義方法に対してメタ最適化または第二レベルのメタアプローチを取ることもできます。

より適応可能にするための一つのアプローチは、明らかにもっとデータを投入することです。つまり、もっと多くの点を与えるだけです。これは本当により知的というわけではありません。ただより多くの点があるというだけです。LLMの場合は、より多くの言語です。これは機能します。誰もがこれを愛しています。素晴らしいです。過去3年間、誰もがこれについて話しているすべてです。

私はこれをスケールマキシング(scale maxing)と呼んでいますが、これはものをより知的にするわけではありません。ただより大規模にするだけです。別のアプローチは、世界の表現の単純性を最大化しようとすることです。しかしこれも、インタプリタ、抽象化レイヤー、使用している表現スキームに依存します。ある言語で何かを言った場合、別の言語で言うのと同じことを意味するかもしれませんが、はるかに短い文になるかもしれません。

つまり、一般化されるものと明らかに相関していますが、十分ではありません。私たちは明らかに、私が10分未満で話してきたこの客観的に最適なものを望んでいます。これが私がwmaxingまたは機能に対する制約の弱さと呼ぶものにつながります。これが私の論文の主な技術的成果です。私の機能を最も弱く制約する政策を選択します。これは哲学的基盤について話した後では本当に明白に思えるかもしれません。しかしそれが哲学的基盤のポイントだと思います。なぜ何かをしているのかを明確にすることです。

他のメタアプローチとの比較

これらの他のメタアプローチの問題は何でしょうか。スケールマキシングは高価であり、単純性の最大化は最適ではありません。だから代替案が必要なのです。より弱い仮定はより少なくコミットします。熊手を踏むと言うのは、この非常に特定の方法で熊手を踏むと言うよりもはるかに弱いコミットメントです。これはより多くの可能な解決策を認めると考えることもできます。

弁護士は多くのことを言ってもコミットメントをしないことができると考えることもできます。数学を行い、適応性を最大化するために政策の弱さを最大化することが必要かつ十分であることを証明しました。これは抽象化レイヤーに関係なく成立します。少なくとも単調増加ですが、明らかに抽象化レイヤー自体は、弱い解決策が異なる抽象化レイヤー間で一様に常に同じように良いというわけではありません。抽象化レイヤーも最適化する必要があり、それが次に説明することです。

弱さは単純性より優れており、常により良いとは限りません。単純性とは、簡潔さまたは形式の単純性を意味しますが、弱さはもっと構文的な概念です。そして単純性が必要でも十分でもないことを示しました。いくつかの実験を実行し、二進文字列予測、例から二進加算と乗算を学習し、これらの概念を学習するためにシステムが必要とする例の数を比較しました。

形式の単純性と機能の弱さ、つまりwmaxingとsimpmaxingを比較しました。結果は良好でした。これらの線、緑の実線とオレンジの実線が加算でどうだったかを見ることができます。ここの例の数がより多くの例です。差はより顕著になりました。データがなければすべてが等しく悪いと思いますが、これらの実験では非常に限られた範囲で、最良の場合は500%のパフォーマンス向上がありました。

これは2年前のAGIで発表し、今年出版したものです。率直に言って、この会議で受けた励ましがなければ、この研究はおそらくそこで終わっていたでしょう。だからこれをすべて受け取っているのは、あなたたちがこれを望んでいると言ってくれたからであり、私は続けました。今ではあなたたちのせいです。

しかし、これについてもっと多くのものが出てきます。昨年ここで再び客観的行動の上限について発表しました。つまり、異なる身体化を反復できる場合、政策をどれだけ弱くできるかということです。これは知能行動の上限であると述べました。これはAixiの主観的上限とは対照的です。

オッカムの剃刀と抽象化レイヤーの最適化

それでも単純性がなぜまだ機能するのか知りたいと思っていました。なぜなら機能するからです。つまり、よりシンプルなものはより一般化する傾向があります。オッカムにはある程度のポイントがありました。これらの質問は抽象化レイヤーに依存しており、今度は抽象化レイヤーをどのように最適化するかを知りたいと思っています。これがスタックの法則につながります。

いくつかの証明を行いました。単純性は抽象化レイヤーに相対的です。すべてを等しく単純にすることができます。抽象化レイヤーがない場合、単純性は概念として実際には存在しないと言っているだけです。これは私が話している形式の単純性です。

なぜ単純性が機能するのでしょうか。物事は空間を占めます。私たちは空間的に広がった宇宙に住んでいます。物の中に詰め込むことができる情報量には限りがあります。つまり、抽象化レイヤーには有限の語彙があることを意味します。この場合、いくつかの抽象化レイヤーで形式の単純性と機能がどれだけ弱く制約されているかの間に相関を強制できます。

一般的にシステムについて、なぜ一部のシステムが他のシステムよりも適応可能なのか、どのようにしてより適応可能なシステムを構築できるかと言った場合、一歩下がって考えました。なぜ単純性と弱さを相関させる抽象化レイヤーが得られるのでしょうか。それは、一般的にシステムとは何かを考えることにつながりました。

すべてが抽象化レイヤーであると述べました。各レイヤーは下のレイヤーの動作のようなものであり、他に何が言えるでしょうか。予測コーディングなどを見たことがあると思いますが、各適応システム、特に生物は、制御を委譲するか、レナードが言ったように、あなたの脚はまだ機能しており、抽象化レイヤー内で制御を分散させる傾向があります。

委譲すると考えることができます。軍事的な例として考えることができます。なぜなら、私がこの論文を読んでいたとき、多くのことを考えていたからです。それは1990年代のボスニア紛争についての論文でした。そこには二つの勢力がありました。オランダ軍とNorbat 2と呼ばれる北欧軍です。

オランダ軍は非常にトップダウンでした。すべての決定について本部まで食物連鎖全体を通じてすべてを実行しました。非常に柔軟性がありませんでした。Norbat 2軍は引き金を引きたがるとして知られていました。彼らはどのルールにも従いませんでした。彼らはミッションコマンドと呼ばれるものの文化を持っており、できるだけ多くの制御を現場の部隊に委譲し、全体的な目標を追求する際に自分の判断を使用することを期待していました。

Norbatは非常に効果的でした。これら二つの勢力は同じ地域で活動していましたが、対照的でした。ある程度、生物学的システムが大きな制御を委譲していることがわかります。細胞、器官、生物、それらは抽象化レイヤーです。細胞から人間、言語まであり、これらを底辺にある適応システムとして考えることができ、これらの高レベルの抽象化を生み出します。

しかし実際には、これは私たちが自分自身に語っているフィクションです。私たちはそれを見ているときです。私たちは自分自身の抽象化を扱いたいのです。何でもこのように枠組み化できます。しかし、これらのものを比較し、これらすべてのシステムに共通するものを見ると、制御の委譲によってより弱い政策を形成できます。なぜなら、上の抽象化レイヤーを変更して、より弱い政策を体現できるようにできるからです。

委譲と分散の違い

抽象化のレベルとは何を意味するのでしょうか。たとえば、プログラミングで言えば、皆さんはPython、C、FPGAなど異なる抽象化レベルに精通しています。しかし、これはどう異なるのでしょうか。一つの抽象化レベルでプログラムすれば、より高い抽象化レベルに固執するよりも大きな適応性を達成できることがわかります。これが人々がPythonの代わりにCでゲームを作る理由です。より効率的にできます。

これは単なる分散とどう異なるのでしょうか。フードスタンプとユニバーサルベーシックインカムの例が好きです。どちらも同じ人々の集合に資源を分配します。おそらく同じ量の資源ですが、UBIはそれらの資源で何をするかについての完全な制御を分配します。一方、フードスタンプでは、それらの資源ができることに非常に強い制約があります。

このアイデアを取れば、かなり些細な証明を行い、スタックの法則を得ることができます。これは単に制御を委譲すればより弱い政策を形成できると言っているだけです。どのくらい時間がありますか。あと数分あるはずです。わかりました。

これは生物学的知能とソフトウェア知能の違いを説明しようとしており、どのようにしてより効率的な機械を作ることができるかを説明しています。現在構築しているコンピュータを、Pythonレイヤーでモデルを実行している柔軟性のない官僚制度のように考えることができ、多くの場合、より低いレベルでは何もしていません。

DeepSeekのように、人々が低いレベルに行った例を見ることができます。彼らはCで多くのものを最適化し、明らかにより効率的でした。生物学は適応をスタックの下に委譲するものです。人間の相互作用をシリコンに具現化するとき、それらを生み出した適応プロセスから切り離しているようなものと考えることもできます。

より知的なシステムを構築したい場合、細胞や生物学により密接に似た、より分散された委譲されたアーキテクチャを活用する必要があります。なぜこれが単純性がどのように機能するかを説明するのでしょうか。スタックの下に制御を委譲している場合、空間を効率的に使用するために、単純性と弱さの間に相関が得られます。

私が示した実験結果のように、確かにまだ違いはありますが、本当に望めば完全な相関を作成できます。適切な身体を作成するだけで、シンプルにできます。単純な形式を作ることができます。弱い制約が単純な形式をとります。これがオッカムの剃刀がなぜ機能するかを説明し、将来ナノマシンの群れがたくさん存在することを示唆しています。

スタック理論の他の応用

これは私が簡単に示した他の結果のボーナスラウンドのようなものです。スタック理論で他に何ができるでしょうか。因果学習の説明が得られます。つまり、何かの原因が何であるかを知りたい場合、本質的に身体として私のために原因の価値を分類する最も弱い政策を見つけているということです。

手を炎に近づけ続け、それが身体に反発的である場合、その刺激を分類する政策を体現することになります。そのため、価値を引き起こすものに対する因果的アイデンティティのこの格子または階層を学習します。これを使って記号論や言語を形式化することもできます。

生命の起源のようなことにさえ入り込むことができます。たとえば岩を取ると、それは明らかに非常にシンプルです。岩はsimpingによって持続しますが、実際にはwmaxingしていません。ただの単純性です。しかし、地球のような非常に安定した抽象化レイヤーを取れば、非常に高く扱いにくいスタックを持つことができます。

自己修復するものと修復しないものを基本的に考えることができます。他のすべてが等しい場合、一方はより複雑で、自己修復する方です。しかしそれはまた、生き残ることができるものにおいてより弱く制約されているため、wmaxingでもあります。しかしそれは、構築する安定した抽象化レイヤーを持つことに依存しています。

生命の起源についての全体的な議論があり、基本的には生命とはsimpmaxingなしでwmaxingするものだと言っているだけです。それから意識についての全体的なことがあり、私は日曜日にそれについて話していました。時間制約はありますか。どうですか。まだ続けられます。

Q&Aの時間を取りたいと思います。わかりました。これについて何でも質問してください。朝食に何を食べたかでも。答えは何もないです。右から左に行きます。

実際には、simppingとwmaxingの間のこの区別を本当に評価します。オッカムの剃刀を必ずしも同じように読んでいません。形式の制約に制約することで、それをより弱くしているように見えます。なぜなら、私はそれをより概念的な単純性で考えているからです。おそらくそれがwmaxingとsimppingで実際に取得しようとしているものです。なぜなら、オッカムの剃刀では、私が理解している限り、形式の単純性を直接見たことがないからです。

それは良い点であり、次の講演で確実に出てくるものです。オッカムの剃刀はかなり曖昧です。多くの方法で解釈できますし、700歳の死んだ修道士と信用を共有したくありません。彼が非常に曖昧で、それで多くのことを説明できる場合、代替案が必要でした。それが私がこれの多くを行った理由です。

AIの文脈で人々が通常オッカムの剃刀をどのように解釈しているでしょうか。それは歴史的に形式の単純性であり、それが私がそれとまとめた理由です。なぜなら、非常に曖昧な何かと非常に具体的な何かがある場合、それは関連していて、それ自体を解決するからです。

リソースマキシングの効果をどのように説明しますか。時々、十分なリソースがあれば、機能的に質的に異なる何かを実際に行うことができるようで、これはあなたの理論にどのように適合しますか。リソース、つまりデータの量を増やすだけの場合、データがないことがすべてを等しく悪くしたのと同じように、すべてのデータを持つことはすべてを等しく良くします。なぜならすでにすべての答えを持っているからです。

それがすべてだと言っているわけではありません。私たちは物事に曲線をフィットさせており、それは一般化する傾向がありますが、その理由は、生物としての私たちの概念が時間と空間を効率的に使用するように適応されているためだと思います。私たちは政策において弱い制約を表現したいと考えており、その一部はコンピュータに実装する言語にあります。

本質的にzmaxingとwmaxingをかなりの程度相関させています。したがって、トランスフォーマーに多くの言語を学習させることで、よりシンプルまたはより圧縮された形式に向かうとき、それはどのように制約されているかにおいて少し弱くなるでしょうが、実際には弱い制約のために最適化しているわけではありません。

数年前に行った論文があり、LLMを鏡の館に例えました。なぜなら、50の異なる視点から同じ概念を50回学習しているようなもので、質問をすると、多くの場合、同じオブジェクトであるにもかかわらず、二つの異なるオブジェクトを扱っていると考えているように見えるからです。最も弱い制約のために最適化していません。理解できますか。

もしコルモゴロフ複雑性のような非常に鮮明な定義を取る場合、より幸せになりますか。質問を繰り返してもらえますか。コルモゴロフ複雑性のようにオッカムの剃刀を定義した場合。コルモゴロフ複雑性、または最小記述長、あるいは正則化でさえ、コルモゴロフ複雑性よりも少し広いですが、コルモゴロフ複雁性は最初に焦点を当てていたので、明らかに最初の犠牲者でした。

Greg: すばらしい講演をありがとうございます。とても刺激的です。しかし生命の起源を持ち出したので、あなたの弱さの概念とCroninの組立指数との関係について説明または記述を考えましたか。

彼は以前Twitterで私をブロックしました。でもその後ブロックを解除してくれたので大丈夫です。彼に再びブロックされたくありません。だからノーコメントです。