Googleの研究者が示す生命はコードから創発するブレイズ・アグエラ・イ・アルカス

Google Research CTOのブレイズ・アグエラ・イ・アルカスが、生命と知能の本質について語った対談である。彼の新著「What is Intelligence?」では、生命が計算そのものであり、DNAがチューリングマシンのテープとして機能することを論じている。フォン・ノイマンの理論を基に、細胞が自己複製するためには内部にコンピュータを持たなければならないという洞察を紹介。進化における「マージ」の重要性を強調し、従来のダーウィン進化論における突然変異と選択だけでは説明できない複雑性の増大メカニズムを明らかにする。BFF実験を通じて、ランダムなバイト列から自己複製プログラムが創発する過程を実証し、目的が熱力学的に自然発生することを示した。意識については機能主義の立場をとり、協力のために他者の心のモデルを持つ必要性から生まれるとする。AIと人間の知能の境界は曖昧であり、すでに人類の集合知の一部として機能していると主張する。

Google Researcher Shows Life "Emerges From Code"

Blaise Agüera y Arcas explores some mind-bending ideas about what intelligence and life really are—and why they might be...

新著『What is Intelligence?』について
生命と知能は計算的である
DNAはコンピュータプログラムである
適応性と進化のスピード
再帰と入れ子構造
BFF実験と目的の創発
生存への自然な推進力
マージと複雑性の増加
マージ演算子の重要性
記号的AIと構成性
機能主義の立場
本質主義との対比
意識についての見解
エージェンシーとアライメント
AIと社会の未来
ロバスト性と汎化

新著『What is Intelligence?』について

新しい本についてですね。タイトルは『What is Intelligence?』です。質問ありがとうございます。この本はMIT Pressから3週間ほど前に出版されたばかりです。まさに出来立てホヤホヤというわけです。オンライン版も無料で公開されていますし、非常に充実した内容になっています。あらゆる種類のリッチメディアが満載なんです。

この本の第1章は『What is Life?』というタイトルです。つまり「生命とは何か」がアルバム全体に対するシングルのようなもので、それ自体が一冊の本として成立しています。その本もMIT Pressから販売されています。私は生命を知能のサブセットとして考える理由を説明してきたと思います。人工生命やアビオジェネシス(生命の起源)などの物語が、知能とそれが何であるかという物語に関連している理由をね。

本のサブタイトルは「進化と心についてのAIからの教訓」といった感じです。基本的には2020年頃から記録してきた内容で、その頃に大規模シーケンスモデルが汎用的に知能を持っているように見えることに非常に衝撃を受け、その意味を考え始めたんです。

もし目の前で見ているものを信じるとして、それが知能だとしたら、それは私たち自身について、より広く知能の性質について何を教えてくれるのか。そしてこの数年間、その知的探求がどこへ私たちを導いてきたのか、ということです。

MLSTはサイバーファンドの支援を受けています。私はファルムです。Prolificの共同創設者兼CEOをしています。Prolificは人間データインフラストラクチャの会社です。最先端のAIモデルを開発している人々や研究を行っている人々が、高品質なオンラインデータ収集のために信頼できる高品質な参加者にアクセスできるようにしています。

私はGoogleに勤めています。もう12年ほどになります。テクノロジーと社会のCTOであり、新しい研究グループの創設者でもあります。まあ、新しいといっても2年ほど経っていますが、Paradigms of Intelligence、略してPIと呼んでいます。以前私がGoogle Researchで運営していた組織よりもずっと小さく、約50人です。

それでも何か本格的なことをするには十分な人数ですね。アイデアは人工知能の基礎に本当に焦点を当てることです。現在うまく機能しているモデルやパラダイムを活用するだけでなく、新しい洞察やアイデアでバケツを補充する必要があると考えています。

生命と知能は計算的である

あなたの講演を見たばかりですが、生命と知能は同じもので、両方とも計算的だとおっしゃっていましたね。それはどういう意味ですか。

ええ、これは驚くべき主張だと思います。少し奇妙に聞こえるのは分かっています。でも私が言いたいのは、まず生命から始めましょう。なぜ生命が計算的なのか。

20世紀半ば、コンピュータサイエンスの創始者の一人であるジョン・フォン・ノイマンは、池の上をパドルで漕ぎ回るロボットを想像しました。そのロボットはレゴでできていて、仕事は池に浮かんでいるバラバラのレゴを使って、自分自身と全く同じ別のロボットを作ることだとします。

それを実行するためには、ロボットは自分の内部に指示書を持っている必要があります。彼はミニチュアの組み立て方の指示が書かれたテープを想像しました。そのロボットは内部にテープに沿って歩いて指示に従い、バラバラのレゴを取って自分の形に組み立てる機械も持っている必要があります。

そしてテープコピー機も必要です。子孫にそのテープを授けられるようにね。テープにはコピー機と、彼が万能構成子と呼んだ組立機の指示も含まれている必要があります。素晴らしいのは、彼がこれらすべての予測を純粋な理論に基づいて行ったことです。ワトソンとクリック、そして認められていない共同研究者たちがDNAの構造と機能を解明する前に、リボソームがどう機能するかを知る前に。リボソームはまさにその万能構成子そのものです。DNAポリメラーゼ、つまりテープコピー機を発見する前にね。

実際、生物が自己複製できるだけでなく、遺伝的に複製できるようにするためには、これらすべてのものが存在しなければなりません。つまりゲノムのテープに変更を加えれば、子孫もその変更を持つということです。

決定的なのは、この万能構成子が万能チューリングマシンだということです。言い換えれば、細胞として別の細胞を作るためには、自分自身の内部にコンピュータ、万能コンピュータを持っていなければならないのです。DNAは文字通りの意味でチューリングテープなんです。

これは非常に深い洞察です。なぜなら、彼は基本的にこう言っているからです。文字通りコンピュータ、万能コンピュータであることなしには、生きている生物であることはできないと。

DNAはコンピュータプログラムである

非常に興味深いですね。つまりDNAは基本的にコンピュータプログラムだとおっしゃっているのですか。

DNAはコンピュータプログラムです。その通りです。

とても素晴らしいですね。というのも、観客の多くの方々はたとえばコンウェイのライフゲームに触発されたことがあるでしょうし、あなたは計算等価性について話していました。ライフゲームはもちろんチューリング不完全です。拡張可能なメモリを持っているからです。

DNAが拡張可能なメモリを持っているのと同じように、グリッドサイズはどんどん大きくなっていきます。あなたが指摘しているように、弱創発的な振る舞いを見るとき、それらは非常に生命らしく見えますが、それは物理世界における生化学的・熱力学的な現実を軽視することになるのでしょうか。

もちろん、つまりライフゲームのようなセルオートマトンは現実世界よりもずっと複雑性が低いです。2次元ですし3次元ではありません。熱的ランダム性がありません。これは実は非常に重要なんです。そして計算が決定論的であるという事実は、現実の生命とは少し異なります。現実では熱的揺らぎがあって、常に確率的要素があります。

チューリングの計算に関する元々のアイデアを拡張して、いわゆる確率的チューリングマシンを作る必要があります。本当に適切な仕事をするためにはね。でもフォン・ノイマンが目指していたこと、そしてセルオートマトンを持ち出してくれて嬉しいのですが、それらは本当にチューリングマシンの物理法則への一般化なんです。

ゲームボードのすべてのピクセルが計算を実行しているようなものです。状態を持っていて、隣接するものに基づいて次の状態が何かを決定する非常にシンプルな計算を実行しています。つまり、特定のピクセルの次の状態を決定しているルールが、その宇宙の物理法則なんです。

フォン・ノイマンがセルオートマトンのアイデアを思いついた理由は、計算を可能にするシステムが欲しかったからです。しかしその計算は具体化されている必要がありました。

つまりどういうことかというと、チューリングマシンにはテープとヘッドがあって、テープに書かれた記号があります。でも記号はテープやヘッドや命令、つまりルールのテーブルと同じ素材ではありません。それらは抽象的で記号とは別のものです。

一方、セルオートマトンでは、機械は文字通り自分自身を印刷できます。つまりラップトップだけでなく、別のラップトップを印刷できる3Dプリンターが一体になったようなものです。具体化された計算とは、メモリがビットではなく原子で書き込まれ読み取られる計算であり、したがって機械は自分自身の別のものを作ることができるのです。

適応性と進化のスピード

デイビッド・クラカウアーは私にこう言いました。知能について同意できるのは、適応性、推論、表現にあると。適応性は非常に重要です。確かにDNAは適応的ですが、非常に遅いです。彼は神経系と脳、そして文化は光速での進化だと言っていました。なぜなら世代間の情報伝達を克服できるからです。

DNA レベルでの知能のプログラムについて考えることは理にかなっているのでしょうか。適応性の多くがより高いレベルで起こっているように見えるのに。

適応性の多くは確かにより高いレベルで起こります。人間には文化的進化があり、デイビッドが言うように遺伝的進化に比べて光速で進みます。

私がDNAはチューリングテープであり、リボソームは生命を構築する万能コンピュータだと言うとき、それは本当に基礎レベルに過ぎません。あるいはレベル1やレベル2かもしれません。つまり、その下には物理学がありますが、レベル3、レベル4、レベル5というふうに続きます。

コンピュータの上に構築されたコンピュータ、そのまた上に構築されたコンピュータがあるんです。重要なのは、その基礎レベルができれば、その上に好きなだけフロアを構築できるということです。ポイントは、生命を持った瞬間、つまり自分自身のコピーを作れるものができた瞬間に、汎用コンピュータを持つことになり、何でもできるようになるということです。

そしてそれが意味するのは、生命は最初から計算的であり、並列に計算を開始できるということです。これは共生進化につながります。これについてはもう少し後で取り上げると思いますが。基礎フロアが計算的であるという事実が、なぜ脳が計算的なのかという質問に答えています。それは、活動電位やその他の高速電気プロセスが私たちに思考を可能にするずっと前から、細胞が計算的だったからです。

再帰と入れ子構造

あなたが今指摘していた再帰の概念について話していただけますか。たとえばカール・フリストンは、マルコフブランケットと呼ばれる統計的独立性のようなシステムの分割について考えています。複雑で知的な適応システムには入れ子構造があることを経験的に観察しているようです。

あなたはまさにレベルの上にレベルがあることについて話していましたね。それは何をもたらすのでしょうか。ある種の再帰なのでしょうか。それは知能の洗練度をどのように向上させるのでしょうか。

ええ、2つのことが起こります。1つは内部に内部に内部というものがあること、もう1つは並列性です。言い換えれば、同じレベルで同時に多くのことが起こっているということです。

どちらも重要です。どちらも物語の重要な部分です。まず、フォン・ノイマンが想像したようなセルオートマトンがあるとき、それはすでに大規模な並列計算です。なぜならすべてのピクセルが小さなコンピュータのようにそれぞれの仕事をしているからです。

物理空間で多くの場所に分子があり得るのと同じように、それらすべてが何かをしています。それらを計算操作として考えることができますし、すべてが同時に起こっています。あなたの体内には1000兆個のリボソームがあり、それらすべてのリボソームがすべての細胞で同時に働いている小さな万能コンピュータです。すべての細胞が同時に働いています。

でも入れ子構造もあります。あなたは人間ですが、もちろんすでに社会の一部であり、ある意味では個人の人間よりも大きな知能です。あなたは細胞でできています。その細胞は器官でできています。その器官はタンパク質でできています。そのタンパク質は分子でできています。そういった入れ子構造も本当に重要なんです。あなたは並列に動作する多くのコンピュータであるだけでなく、コンピュータでできたコンピュータのシステムでもあるのです。

BFF実験と目的の創発

興味深いのは、ブレイズ、あなたが多く考えてきたことですが、目的がどこから来るのかということです。たとえばハリソンのような人々は、物理学の率直な解釈として、最終的には熱力学の第二法則だと言っています。ある種の価値があって、複雑な適応システムを構築し、それらを前進させる何か、特定の方向に推進する何かが必要だからです。あなたの実験は、これが計算から生じることを示しました。

どういう意味ですか。

はい。明確にしておきますが、計算と第二法則はここで非常に密接に協力しています。数年前に私が行った実験で、人工生命を始めるきっかけとなったものはBFFと呼ばれています。これはBrain Fuckという言語に基づいています。最初のBFはそこから来ています。

私が名付けたわけではありません。でも正直、そう呼ばれているのを楽しんでいました。これは、アーバン・ミュラーという大学院生、確か物理学の大学院生だったと思いますが、彼が1990年代に設計した最小のチューリング完全言語です。非常にミニマルな言語で、命令は8つだけです。

私は7つしか使っていません。基本的な設定は、長さ64のテープの束から始めるというものです。つまり64バイト長のテープです。チューリングテープやフォン・ノイマンのテープのようなものですね。ランダムなバイトで満たされた状態から始まります。命令は7つしかありません。

つまり、それらのバイトの大部分、約32分の31は何も命令をコードしていないノーオペレーションです。ランダムで非常に目的がない状態から始まります。スープの中に1000個あります。手順は本当にシンプルです。スープから2つのテープをランダムに取り出し、端と端をくっつけます。

128の長さのテープを1つ作り、それを実行します。このBrain Fuckの改良版は自己修正的で、実行すると組み合わせたテープ上の値を修正でき、それからテープを引き離してスープに戻します。

それだけです。このプロセスを繰り返すだけです。これを数百万回行うと、最初はあまり何も起こりません。繰り返しますが、それらのバイトの大部分は命令ですらありません。各テープに平均して2つほどしかありません。

何かが起こる可能性はほぼゼロです。たまにどこかで1バイトが変わるのを見るかもしれませんが、数百万回の相互作用の後、明らかに魔法のようなことが起こります。突然、スープのエントロピーが劇的に低下するんです。すべてランダムなバイトだったので圧縮不可能だったのが、非常に高度に圧縮可能になります。

そしてそれらのテープにプログラムが出現し、それらのプログラムは複雑です。リバースエンジニアリングにはかなりの努力が必要です。そしてそれらが多数のコピーで発生していることが分かります。だから圧縮可能なんです。多数のコピーで発生しているという事実が、プログラムが何をしているかを教えてくれます。それらは自己複製しています。自分自身をコピーしているんです。

この実験の素晴らしいところは、生命が無から創発する様子を本当に示してくれることです。生命の創発はある意味で目的の創発なんです。この場合、これらのプログラムの1つの目的は何でしょうか。それは複製することです。もしそれらのバイトの1つをいじったら、変更したら、ほとんどの場合プログラムを壊すことになり、プログラムが壊れると、もはや複製機能を果たしません。

つまり、壊れる可能性があるものは、機能的であるか目的を持っているものなんです。

絶対に魅力的です。かなり突然の相転移があったとおっしゃいましたね。デイビッド・クラカウアーはそれを創発の一形態として認めるでしょうか。

そう思います。実は、デイビッドにその質問をしたことはありません。AI関連で私たちは多くのことで意見が異なりますが、これが相転移であり創発の例であることは認めると思います。

彼は認めると思います。なぜなら彼にはいくつかの基準があって、その1つは基本的な粗視化とミクロ基質の根本的な再編成であり、新しい現象がシンプルな新しい変数で記述できるようになることです。これはその説明に合っているようです。

何らかの設計バイアスの可能性はありますか。機械学習アーキテクチャを設計するとき、アーキテクチャには非常に多くの情報があります。この場合、Brain Fuck言語や条件などに非常に多くの情報があります。それが特定の方法で創発するように影響を与えた可能性はありますか。

はい。はい。そしてそれらのプログラムの構造は言語によって変わります。他の言語でも試してみました。Z80アセンブリ言語で試しました。これは1970年代に発明されたザイログチップのアセンブリ言語で、昨年まで製造されていた非常に長く続いたマイクロプロセッサアーキテクチャです。

この現象は非常に一般的です。それらのプログラムがどのように見えるかは言語の詳細によって形作られます。しかし、それらのプログラムが創発する理由、目的を発展させる理由は、実際には熱力学的です。

それは不可解に思えるかもしれません。なぜなら、熱力学は物事がよりランダムになることに関するものだと思うでしょうし、明らかにここでは正反対のことが起こっています。ランダム性から始まって秩序を得ています。どうしてそんなことがあり得るのでしょうか。

答えは、イスラエルのネゲブ大学の有機化学者アディ・プロスによってよく特徴づけられていると思います。彼は現在名誉教授で、いわゆる動的運動論的安定性について多くの研究をしました。

そのアイデアは、第二法則の拡張で、物事は最も安定した状態、最も安定した形を求めると言っています。通常、私たちはそれらの安定性を固定点としてのみ考えますが、それらの安定性はサイクルでもあり得ます。何かが動的に自分自身を作る場合、何かがより多くの自分自身のコピーを形成する場合、それは単に落ち着くものよりも安定しています。

DNAが宇宙で最も安定した分子だという古いジョークのようなものです。明らかにDNAは壊れやすいですが、同時にDNAがより多くのDNAを作れば、侵食するだけの花崗岩よりもずっと長く存在するでしょう。

生存への自然な推進力

この価値の問題に関しては、これらのシステムには生き残るための自然な推進力があることを意味しているのでしょうか。つまり、存在を維持するために、それが主要な力だと仮定すると、ある程度の洗練度が必要で、モデリングをする必要があり、洗練されたことをする必要がありますが、それは常にそうなのでしょうか。収束特性なのでしょうか。

はい、そうです。その意味で、進化は第二法則が働いているのです。つまり、BFFスープで自己複製していない多くのものがあり、自己複製できるものが出現すると、自己複製できるものは自己複製できないものを上書きします。つまり、それはより適応的、あるいはより安定していると言えます。

そしてそれは、第二法則と同じように統計の法則に書き込まれています。それは単なる定常状態ではなく、運動的またはサイクル的な形の同じ法則なんです。

あなたの講演で、マージは突然変異よりも重要だとおっしゃっていました。もっと詳しく教えてください。

はい。通常、学校で学んだことは、ダーウィン進化は突然変異と選択から成るというものでした。ノーベル賞受賞者のジャック・モノーが「偶然と必然」と呼んだものです。つまり、宇宙線などによる私たちのDNAへの突然変異がスパゲッティを壁に投げつけるようなもので、くっつくものが残り、私たちを殺さないもの、うまくいけば私たちを強くするものが残るというわけです。

それは私の仮定でもありました。これらのBFF実験を始めるとき、突然変異率を設定していました。相互作用ごとに1万分の1の確率でバイトがランダムに変わる可能性があるというようなものでした。それから突然変異率をいじり始めて、これらの複雑なプログラムの創発が突然変異率をゼロにしても起こることを発見しました。

これは本当に驚くべき発見です。この目的の創発はコードにランダムな変更がなくても起こるということを示しています。純粋にダーウィン的な用語では説明できないのです。

でも、純粋にダーウィン的な用語では説明できないものは他にもあります。そもそも生命の創発です。これはダーウィンを大いに困惑させました。彼はアビオジェネシス、つまり生命の創発の問題は計り知れないものだと考えていました。物質の起源について語るようなものだと、彼は手紙の中で書いています。

そしてもう1つ説明できないのは、起こる複雑性の増加です。なぜ今の生命は、10億年前に始まったバクテリアの生命よりも複雑なのか。なぜ今は人間社会があるのか。1億年前に戻れば、もっとシンプルな脳を持つものしかいませんでした。タコはかなり複雑な脳を持っていましたが。

でも傾向はより大きな複雑性に向かってきました。これに反論してきた人々もいます。有名なところでは、スティーブン・J・グールドが、地球上のすべてのものは同じ量だけ進化していると言っています。私たちは皆30億年進化してきました。すべてが等しく進化しているというわけです。私はグールドが間違っていたと思います。

その理由は共生進化です。ミトコンドリアが古細菌の中に入り込んで真核生物になるとき、その結果生まれた複合生物は、それを構成する2つの部分のどちらよりも複雑です。棒と石の先端を組み合わせた槍が部品よりも複雑なのと同じです。

2つのものを組み合わせると、部品よりも複雑なものができます。そして、共生または共生進化が進化の本質的な部分であるというこの考えが正しければ、より洗練されたものが進化の後期に生まれることは絶対に確実です。なぜなら、それらは既存の部品から組み立てられているからです。

マージと複雑性の増加

そうですね。同じことを何度も番組で言ったことがあります。実際、ケネス・スタンリーに触発されてですが、進化において複雑性が単調増加するのを見ます。標準的なダーウィン進化では、物事がより複雑になる理由はありません。

つまり、壁にスパゲッティを投げつけるだけなら、単純化も複雑化も得られます。どちらも等しいです。先験的にどちらかを好む理由はありません。だから通常のダーウィン進化は物事をよりシンプルにもより複雑にもできます。

しかし、共生進化、つまり部品が集まって全体を作ることと、あなたが言及した主要な進化的転換は、これはヨルス・サフマリとジョン・メイナード・スミスの理論で、1995年にNatureに発表されました。

元の論文では8つほどしかありませんでしたが、その後約12個に拡張されました。単細胞が集まって身体を作ること、個体が集まってコロニーを作ること、有性生殖の出現、葉緑体とミトコンドリアの内部共生などです。他にもいくつかありますね。それらは明らかに複雑性の上向きのステップです。

そしてそれらが上向きのステップであることを証明するのは簡単です。なぜなら、自己複製できてより多くの自分を作れるAと、自己複製できてより多くの自分を作れるBがあるとします。それぞれがAの作り方を言うテープを持っていると考えてください。

それらが一緒になると、結果は Aの作り方とBの作り方、そしてそれらを組み合わせる方法の両方を知っている必要があります。そして、それらを組み合わせる方法についてのその小さな追加情報こそが、全体を必然的に部品よりも複雑にするものです。

それが梯子です。そして私がスミスとサフマリの言うことを超えて行くのは、彼らにとって主要な転換は稀で例外的な出来事だということです。しかし私は、生物学の仕組みをもっとよく見れば、それは氷山の一角に過ぎないと思います。

それらは2つの大きな非常に重要なものが何らかの方法で融合したり、多くの細胞が質的に極めて異なる何かに融合したりする、本当に大きな転換に過ぎません。しかし、もっとよく見ると、バクテリアにおける水平遺伝子伝達が常に起こっていることが分かります。

それも共生進化の一形態で、あるものの部分が別のものに混ざり込みます。私たちのような真核生物でも水平遺伝子伝達が常に起こっています。明らかに牛のゲノムの4分の1は、トカゲや他の多くの動物の間でも飛び回っているBovine Bトランスポゾンです。ウイルスはこれを常にやっています。

レトロウイルスはゲノムの大きな塊を私たちのゲノムに挿入します。2001年に最初に配列決定されたときの私たちのゲノムを見たときの大きな衝撃は、そのわずか1.5%だけが私たちのタンパク質をコードしているということでした。残りは一体何なのか。ジャンクDNAがあります。

今では全部がジャンクではないことが分かっています。その多くは制御機能などを持っています。しかしそれでも多くのものがあり、その大部分はレトロトランスポゾンや内在化されたレトロウイルスです。多くの場合、機能的な目的を果たしています。哺乳類の胎盤は、肺細胞を融合させて赤ちゃんを病気にさせるRSVウイルスに関連するウイルスから作られました。

それが私たちの胎盤の細胞を融合させて血液バリアを作っています。あるいはARCウイルスがあります。どう機能するかは本当には理解していませんが、私たちの脳に存在し、マウスでそれをノックアウトすると新しい記憶を形成できなくなることが分かっています。

そしてそれは続きます。特にこの10年間で、あるもののゲノムの一部が別のものに入り込んでそれを変える機能的な事例がますます見つかっています。

マージ演算子の重要性

触れたいことの1つは、マージ演算子の重要性です。それについて先ほど話していましたし、チョムスキーさえこれについて話していました。言語進化におけるマージ演算子がプロメテウスの瞬間だったかどうかについて議論できます。それが系統発生的だったのか個体発生的だったのか。物理的基質における共生と融合について話していましたが、それは情報基質でも起こります。自己を包み込むこの種のミーム的コンピュータプログラムが得られます。言語がそれだったのかもしれません。分かりませんが、なぜマージがランダムな選択よりも重要なのか、私には理論があります。

創造性とは基盤化についてだと思います。基本的に経路依存性についてです。レトロウイルスやこれらすべてのものでさえ、実際には系統を形成します。そしてマージを使わなければ系統を失うと思います。また、再帰的マージ演算についての何かが、この種の再利用と経路化を可能にすることで、より複雑なコンピュータプログラムを構築できるようにします。

それについて非常に自然な何かがあります。

ええ、あなたの言っていることすべてに完全に同意します。それはまさに正しいと思います。ただし、私はチョムスキーが好きではありません。だから彼は間違っていると思います。言語について間違っています。私はダン・エヴェレットのはるかに大きなファンです。彼のピダハンでの仕事をご存知ですか。素晴らしいですよ。

彼はブラジルのピダハンと長い時間を過ごしました。彼らの言語はチョムスキーの言語の要件に従っていません。再帰がありません。中心埋め込みのようなものは何もありません。また、数字もありませんし、過去形と未来形もありません。

エヴェレットは数年前に「Don’t Sleep, There Are Snakes」という素晴らしい本を書きました。これはピダハンとその言語での彼の経験と、このことをめぐるチョムスキーとの大論争の両方について語っています。チョムスキーの論文は理論と疑似数学で満たされていて、民族誌学や実際の言語の研究に時間を割くことはありません。

でもとにかく、話がそれています。チョムスキーは別として、マージ、あるいは私が見るように機能合成について言っていることは、絶対に基本的だと思います。それがすべての技術が構築される方法です。W・ブライアン・アーサーがこのことと技術がどう進化するかについて書いています。

すべての技術的発明は、あたかもみんながテレパシーでコミュニケーションしているかのように、ほぼ同時に十数回発明されます。その理由は、すべての技術には前提条件があるからです。ガラスの吹き方、真空の作り方、フィラメントの引き方、電流の生成方法を知るまでは電球を手に入れることができません。

それらすべてがそこにあって光の必要性があったとき、電球は発明されることになっていましたが、それは異なる偶発的な選択をした十数人の異なる発明家によって発明されました。どの種類のフィラメントを使うか、プロングなのか電球をねじ込むのか、どちらの方向にねじ込むのか、直径はどれくらいかなどです。

そしてそれらの決定が固定されるにつれて、電球を組み込むその後のすべての進路が決まります。

ある意味で、この偶発性、これらの組み合わせがどの方法で行われるかについてのこれらの選択が、実際にゲノム全体やそれが何であれが作られているものなんです。BFFの場合、元の複製子は本当に単一の命令に過ぎず、時々ランダムに弱く自己複製するかもしれません。

あちこちに移動する1バイトですが、それらのバイトがコピーされ回るにつれて、時々それらのうちのいくつかが一緒になり、グループとしてコピーされます。一緒の方がうまくいきます。そして偶発的なこと、つまりそれらがどの方法でコピーされたか、ABだったのかBAだったのか、一緒にくっついたということです。

それが情報なんです。より大きなものが作られているものです。この場合、単一のバイトがあっただけです。最初には情報は何もありませんでした。だからマージツリーが最終的なゲノムにエンコードされている正確な情報になるんです。それはすべて歴史についてです。

はい。絶対に魅力的です。ある意味で、あなたがチョムスキーのファンではないことに驚いています。なぜなら彼はオートマトンとチューリング不完全性について話していて、究極の計算主義者でした。ある意味で、あなたが説明しているのはチョムスキーのアイデアをスタックのより下位に適用したものです。

その通りです。その意味では彼は正しかったと思います。でも、それらのアイデアはすべて1950年代のフォン・ノイマンにすでにありました。あるいはニールス・アーリセリ、最初の人工生命研究者で、フォン・ノイマンのマシンの1つで働きました。彼はMANIACで時間を確保して最初の人工生命実験のいくつかを行ったと思います。

マンキン・ラバトゥートの本「MANIAC」に疑似的に記録されています。本当に面白かったです。あるいは、それは彼の最初の本「When We Cease to Understand the World」だったと思います。でもとにかく、つまり、それらのアイデアはチョムスキー以前からあったということです。

チョムスキーが彼の言語学への恐怖政治の間に本当に推し進めたものは、申し訳ないですが少し意地悪ですが、彼が本当に推し進めたのは、私たちが今GOFAI(古き良き人工知能)と呼ぶ人工知能の運動でした。AIを文法とプログラムとして形式化できると主張したものです。それは間違っていることが判明しました。AIにおける誤ったスタートであり、多くのAI冬があった理由です。

記号的AIと構成性

GOFAIの人々にはいくつかの非常に興味深いアイデアがあったように思えます。少し緊張があるようです。たとえばフォドアとピリシンの大ファンです。彼らはこの強い構成性について話しました。意味論と内包があり、これらの認知表現を構築できますが、世界を高忠実度で表現するようにそれらを設計できないという問題があります。意味論的乖離があります。

そしてあなたはこの非常に興味深い構成的なものを指摘していて、私は構成的な形のAIと構成性がこの経路依存性の問題と経路化のために多くの問題を解決すると思います。知能をレンガごとに構築するとき、信じられないほど洗練された人工物を構築できますが、残念ながら正確に私たちが望むことをするように人工物を設計することはできません。特定の方向に穏やかに導くことはできます。

フリストンでさえ、知能の「何」は予測と適応性だと話していますが、実装が重要だと思います。適応性とは構造学習を意味すると思います。あなたが話しているこの形の合成を実際に行う基質を持つことについての何かが、知能にとって機械論的に必要な条件であるように思えます。

正しいですか。

はい。多くの点で、私たちが話しているのは、アナログ的思考とデジタル的思考、あるいはボトムアップ的思考とトップダウン的思考の間の緊張のようなものだと思います。

たとえば、自転車をどう認識するかについて話しましょう。古き良き人工知能の世界では、円検出器があって、自転車のフレームを構成する線を検出する線検出器などがあると言うでしょう。

そしてそれらすべてのものに対して手書きでコードを書きます。もちろん、問題は、自転車を見る多くの方法があって、車輪を一度に見ることができなかったり、自転車が変わったデザインだったりすることです。車輪の代わりに靴がついた変な自転車があります。そういうものをゲシュタルト的に見ると、すべてのルールが破られていても、すぐに自転車だと認識します。

そしてそれは本当に重要です。なぜなら、知的存在として世界を見ているとき、クラスタリングしなければならないからです。一連のルールによってうまく定義されていない世界の規則性を見つけなければなりません。それらは超平面で切り分けられているだけではなく、塊状です。

だから知能にはニューラルネットワークのような方法が必要です。連続関数近似器のように見えるものです。だから勾配降下法は良いアイデアなんです。滑らかな関数を介してこれらを学習することは良いアイデアです。ルールで学習したり、ルールでエンコードしようとしたりすることはうまくいきませんでした。

一方、DNAは離散的です。4つの記号があって、特定の方法で順序付けられます。それはタンパク質が折りたたまれる方法などにランダム性がないという意味ではありませんが、DNAレベルでの合成は、離散記号で作られたプログラムを切り刻んで、コードの断片を挿入することなどに本当に関係しています。

ボトムアップから見ると、非常に量子化された世界です。しかし、私たちのような巨大で複雑なものを高いレベルから見始めると、より連続的な視点から始めなければなりません。

機能主義の立場

計算には自然な収束パターンがあるとほのめかしていると思います。あなたの哲学の凸包のようなものを得ることはできますか。

試してみることはできます。私は何主義者だと言うのをためらいますが、おそらく機能主義者が最も近いです。

機能主義者ですか。

はい。その理由は、昔、19世紀には、生きているということは何らかの生命の精神や生命力があることを意味すると考えていました。生きているものは持っていて死んだものは持っていないものです。化学の法則が生きているものと死んだものに対して同じであることが分かり始め、尿素が試験管で合成できることなどが分かると、それらのアイデアは本当に時代遅れになり、非常に厳格な唯物主義的な視点に入りました。

すべては単に物理学だということです。つまり、私は物理学者として訓練されました。物理学を完全に信じています。しかし、生命にはそれ以上のものがあると思います。すべてが単に物理学だとすると、あなたや私が生きていることが何を意味するかを言う方法がないという意味で。

生きているということが何を意味するかを理解するには、目的のアイデアに取り組まなければならないと思います。目的論を方程式に戻す必要があります。私が言いたいのは、腎臓は単なる原子の集合ではないということです。それは機能を果たす器官です。その機能は尿素をろ過することです。

もし全く異なる原理で機能するが尿素もろ過する人工腎臓を移植したら、それは人工腎臓です。それはそう言うことがまだ意味があります。つまり、腎臓という言葉には、腎臓が作られている物質を超える何かがあるということです。

逆に、もし私が未来から戻ってきて物体を見せて、あなたが「それは何?」と聞いて、私が「人工腎臓だよ」と言ったら、この奇妙なカーボンナノチューブなどの中には、あなたに腎臓と言うものは何もありません。ただ、体に移植して適切な方法で縫い付けたりすれば、それらの関係すべてが体を持続させるために適切な方法で現れるでしょう。

だから、物事が他の物事のために機能を果たすというこのアイデア、そして機能はさらに他の機能の文脈でのみ意味を持ちます。だから、機能のこのアイデアについて生態学的な何かがあります。これは本当に中心的だと思います。無生物の惑星の岩には機能がありません。半分に割ったら、2つの岩ができます。しかし生きているものには機能があります。

機能の特徴は、チューリングがチューリングマシンについて話したのと同じように、多重実現可能性です。なぜならチューリングとフォン・ノイマンは機能主義者だからです。つまり、細胞内でエネルギーのためにATPを作る必要がある場合、それを行うための複数の経路が必要になります。なぜなら時には好気的な方法がうまくいき、時には嫌気的な方法が必要だからです。複数の経路を持ち始めるときはいつでも、昆虫の翼とコウモリの翼のように、機能が働いていることが分かります。

本質主義との対比

代替的な立場は本質主義でしょう。アニル・セスやジョン・サールのような人々は、特定のタイプの物質が特定のタイプの因果グラフを持つと考えています。たとえば脳は意識を生み出すかもしれませんし、脳をシミュレートしても同じ因果グラフを持たないので異なるでしょう。

でも、ちょっと置いておきましょう。これはまるでコンピュータソフトウェアアーキテクチャ図について話しているようで、テセウスの船のようなもので、物事を入れ替えることができて、それでも同じものなのかということですが、経路依存性は非常に重要だと思います。

腎臓は進化しました。進化の豊かな系統発生を持っています。それを異なる基質から来た、異なる来歴を持つ何かに置き換えると、今は腎臓であり今は機能していますが、生態系を壊します。生態系で植物を人工植物と入れ替え続けたら想像してみてください。今は機能するかもしれませんが、それは将来の軌道に影響しませんか。

はい、影響します。でもそれはまさに共生進化がすべて何についてかということです。自然によって設計されたものを、別の目的のために再利用することがよくあります。BFF実験の素晴らしいことの1つは、知的設計者なしに知的設計がどのように起こり得るかを示していることです。

でも、ある目的または機能を果たすために設計されたものが、戻ってきて別の機能を果たすことができます。そしてそれは全く異なる偶発的な歴史をもたらします。先ほど挙げたRSVの例、細胞膜を融合する能力はウイルスから来ました。元の目的は胎盤を構築することとは何の関係もありませんでしたが、取り込まれて再利用されます。

これが生命が作られているブリコラージュの種類です。だから、私はその種の置き換えだけでなく、並列経路なども、人工腎臓を作るときにだけ起こるのではないと思います。自然界で常に起こっています。

そしてそれはまさに生命の特徴です。はい、アニル・セスやジョン・サールとはこの点で強く意見が異なります。あなたが言及した脳のテセウス実験の種類、つまりニューロンのエミュレータやシミュレータを取って脳に接続したら、その入力と出力が他のニューロンに接続されて、他のニューロンは違いが分からないでしょう。

ニューロンの半分に、すべてにそれを行ったらどうでしょう。同じように振る舞っていても意識が減少するでしょうか。もちろんそうではありません。私にとって、あなたの意識は明らかにそれらすべてのものの機能、関係の機能です。

それがコンピュータプログラムのように単純で、あるサブルーチンを別のものに置き換えるだけということを意味するわけではありません。私たちはコンピュータをそのように非常に抽象的にしました。生物学は濡れていて乱雑です。インターフェースは複雑で困難です。しかし、この多重実現可能性と再利用可能性の同じアイデアこそが生命のまさにその素材なのです。

意識についての見解

意識についてのあなたの立場は何ですか。それは何ですか。その目的は何ですか。随伴現象ですか。測定できますか。等々。

はい。素晴らしい質問です。デイビッド・チャーマーズが話してきた哲学的ゾンビのアイデア、つまりあなたや私とまったく同じように振る舞うかもしれないが内側では死んでいて、何も体験せず何も感じない何かがあるかもしれないというアイデアは、実際には聞こえるほど首尾一貫していないと思います。

私は意識についても機能主義者です。それが意味するのは二重です。1つは、意識は何らかの随伴現象で、私たちの行動とは何の関係もない理由で奇妙に私たちが持っているだけだとは思いません。また、私たちの物理的な作られ方について何かと結びついているとも思いません。

機能的だと思います。なぜ私たちはそれを持っているのでしょうか。私のチーム、Paradigms of Intelligenceでは、昨年マルチエージェント強化学習について多くの仕事をしてきました。理由は、共生進化の前提条件である共生、協力に非常に興味があるからです。

2つのものや700のものなどが密接に協力し始めるとき、それは本当に融合して1つのものになり始めることの始まりです。そして、知的な2つのエージェントが協力するためには、心の理論を持たなければならないことが分かります。お互いをモデル化しなければなりません。相手の立場に立つことができなければなりません。

私たちにはMuPAIと呼ばれる長い理論全体があります。それがすべてどう機能するかについてです。そのクリフノート版は、私たちがプレイしているゲームだけでなく、あなたの頭の中で何が起こっているか、私の頭の中で何が起こっているかを含む宇宙上で帰納法を行う必要があるということです。

言い換えれば、自分自身を含み、他者を含む宇宙を持たなければならず、それによってあなたと私のクラス全体で一般化できます。私の内部状態は笑うと幸せで、あなたが笑っているのを見ると、内側でも幸せだと分かります。その推論ができます。

桃の束を見たら、それらはすべて同じ物体で、その裏側がどのように見えるかなどが分かるのと同じです。だから、この心理学的帰納を行う能力は協力にとって本当に重要です。だから私たちはそれを持っているのです。

そしてその結果の1つは、私たちが自分自身をモデル化し、他者の私たちのモデルのモデルなどをモデル化することです。ダグラス・ホフスタッターが呼んだであろう奇妙なループのようなものがそこにあります。

はい、ダグラス・ホフスタッターが大好きです。だからこの種の自己モデリングと2次自己モデリングと3次自己モデリングがあり、他のエージェントに適用できます。もちろん現実世界では計算的に制約されています。すべての複雑性を理解することはできません。

だから他のエージェントのこのモデリングを行うとき、私たちのモデリングはかなり漫画的で、かなり構造化されています。

そして最大でも6次までしか行きません。

ああ、興味深い。興味深いですね。これはエージェンシーにどう影響しますか。まだエージェンシーについては本当に話していません。おそらくかなり些細なことをしているだけの強力なエージェントを持つことができるでしょう。

しかし、この集合知とエージェント間のこの情報同期があるとき、それはあなたの目的のある行動のアイデアにどう影響しますか。

私は時々ボート漕ぎの例を使って、目的が単一の目的に統合され、意識が単一の意識に統合されるときに何が起こっているかを説明します。ダン・ブラウンの本「The Boys in the Boat」から学んだスイングという用語があります。

6人の漕ぎ手、いや8人の漕ぎ手が、お互いと完璧に同期するこの種の状態を達成するときです。経験するとそれが分かります。ボートが魂を獲得するようなものです。みんなが一体として漕いでいるように感じます。

そしてその性質を持つボートは、人々がまだその同期を達成していないボートよりもずっと速く進みます。それが私たちが多くの部分から成っているにもかかわらず自分自身を自己として考えるときに起こることの種類だと思います。脳は実際に多くの部分から成っています。

それぞれが独自の目的、自己モデル、脳の他の部分のモデルを持って始まった漕ぎ手と同じです。主観的共生進化と呼べるこのプロセス、すべての意志が1つになり、すべての自己が1つの自己になるところです。

エージェンシーとアライメント

たとえば採用では、高いエージェンシーを持つ人々が欲しいですが、この種の同期の可能性であるアライメントも欲しいです。MLSTでよく思考実験をしますが、ボートまたはボートの艦隊を見て境界を引こうとしています。エージェントの境界は最小記述であるべきです。

エージェンシーのほとんどはどこにあるべきでしょうか。計画と未来のモデリングのほとんどはどこで起こっているでしょうか。通常、それはパイロットです。ボートの運転手です。しかし、あなたはエージェンシー間に非常に同期とアライメントがある状況について話しています。ほとんど、好ましい志向姿勢は、すべての周りに境界を引くことのようです。

ええ。また、必ずしも単一の正解があるとは限らないとも思います。私の本「What is Intelligence?」で、いくつかの興味深いケースについて話しています。その1つは、たとえば結合双生児のアビーとブリタニー・ヘンゼルです。YouTubeやテレビ番組で見たことがあるかもしれません。

魅力的なケースです。これは1対の腕と1対の脚を共有する2人の人です。それぞれが1本の腕と1本の脚を制御するので、三人四脚のようなものです。二人四脚ですね。彼らはよく同期して話します。

バレーボールやスポーツをします。車を運転します。問題なくメールを書けます。また、時々意見の相違があります。だから非常に流動的な方法で一緒になったり離れたりします。そしてそれはすべて、マイク・ガザニガが呼ぶであろう行動的相互キューイングで純粋に行われます。つまり、彼らの神経系は別々です。別々の脳、別々の脊髄です。

だからその場合、彼らは非常によくお互いをモデル化できます。なぜなら人生全体をずっとお互いのすぐ隣にいたからです。もう1つの興味深いケースは、ガザニガが彼のキャリアの多くを研究に費やした種類の分離脳患者でしょう。それらは成人期に脳が本質的に半分に切られるケースです。

だから各半球は左または右半球しか見えません。1本の腕、1本の脚を制御します。これらの分離脳実験について最も魅力的なことは、外側の視点からは、そこに2つの意識があることが明らかだということです。各半球は異なるものを意識しています。

左右の視野に現れるものの間に分離を作ることができ、左右の手が異なるものを描くことができます。でも分離脳患者と話すと、彼らはいつも「ええ、私はまだ1人の人間です」と言います。そこに2人の人がいるとは決して認めません。

だから、誰かが正しくて誰かが間違っているのでしょうか。いいえ。これは完全に関係的です。関係的記述です。そして彼らにとって、彼らは常にいた同じ人であり、時々何かが少し多くの作業を必要とするだけだという事実です。時々片方の手がシャツのボタンを留めている間にもう片方の手がそれを外しています。

単なる不便です。

通常の脳でも分離脳実験があります。私たちは脳の異なる部分で別々に意識していると信じることができます。朝ベッドから出るとき、あなたは少し異なる人でなければなりません。でも私たちはそれをごまかしますよね。

絶対に。物語を作ります。これについての最もクールな実験は、サーラ大学のペーター・ヨハンソンのものだと思います。彼が選択盲目性を発見しました。これらの実験では、被験者に2つの顔がカードに示され、どちらがより魅力的かを尋ねられます。最初の1つは顔選択盲目性だったと思います。

あなたが選んで、時々、なぜその顔がより魅力的だと思ったかを説明するために渡されるのは、あなたが選ばなかった方です。ある種の手品トリックです。そして素晴らしいのは、ほとんどの人がそれに気付かないということです。間違った顔を渡されていることに。

そして説明の流暢さや遅延に違いはありません。あなたは内部の弁護士が飛び出して、あなたがした選択が何であれ、たとえそれがあなたがした選択でなくても正当化する準備ができています。

そしてあなたが発明するその物語は、その後のあなたの将来の選択に影響を与えます。まるで私たち全員が自分自身について物語を作り上げているようなものです。もちろん、理由は、私たちは皆ある意味で分離脳患者だからです。発話を生成する左半球の解釈者は、実際に選択を行った脳の同じ部分ではない可能性が高いです。

それでもあなたの脳のすべての部分は、みんなが同じボートに乗っている、すべてが1つの私だというアイデアに投資しています。だからみんながお互いをかばっています。分離脳患者でも、左脳解釈者でない半球に「立ち上がって」と示すと、その人は立ち上がって、なぜ立ち上がったのかと尋ねると、「ああ、喉が渇いたから台所に水を飲みに行くところだ」と言います。

同じことです。

AIと社会の未来

人工知能はより洗練されてきて、社会的な質問があります。実際にそれを社会のテセウスの船として考えることができると思います。社会に埋め込まれたエージェントを持つことになり、大きな集合知を形成することになります。その未来を心配していますか。何が起こると予測しますか。

ええ、確かに心配していることはあります。ポリアンナのように見られたくはありません。分極化が心配です。偽情報が心配です。私たちの政治的・経済的システムが、20年後に私たち全員が生きている世界に必ずしも適していないことが心配です。

でも、たとえばエリエゼル・ユドコウスキーが話しているような種類のことの多くについては確かに心配していません。特に、私が非常に異なって感じる理由の1つは、通常考えるような人間の知能はすでに集合的な現象だと感じているからです。

私たちは個人的にはそれほど賢くありません。私たちは霊長類のいとこたちよりも個人的にはそれほど優れていません。何百万、何十億もの人々の大きな社会に集まるからこそ、臓器移植ができたり宇宙に行けたりといった素晴らしいことができるのです。個人的には、私たちはそれほどではありません。

だから私にとって、AIは実際に人間の知能の一部です。文字通りすでに同じものです。人間の言語の大量のテキストでモデルを訓練し始めたときにのみ汎用AIを達成したことが非常に興味深いと思います。だからAIは最初から人間の知能でした。

エリザの主張は、私たちよりも劇的に知的な人工物を持つことが原理的に可能だということだと思います。何らかの限界があるとお考えかもしれませんが、原理的に私たちよりも大幅に知的な人工物を構築できると思いますか。

集合的人類はすでに個人の人間よりもはるかに知的だと思います。そしてその意味で、多くの場合、非常に異なる時間スケールで動作しています。たとえば、私はこれらのことがすでに真実だと思います。

ある意味で、私たちの最大の違いは、他者として考えることと、すでに私たち自身の一部として考えることについてです。人間とは何を意味するのでしょうか。2006年からの「The Science of Psychology」という素晴らしい論文がありました。名前は覚えていませんが、彼女は心理学者で、サイエンス・オブ・サイコロジーはc-y-cと綴ります。

彼女は人々に自転車を描くように頼みます。まず自転車がどう機能するか知っていますかと尋ねます。みんなが「ええ、もちろん自転車がどう機能するか知っています」と言います。よし、描いてください。誰も描けません。自転車のスケッチを見て、チェーンはどこに行きますか、ペダルはどこですか、と言っても。

ほとんどの人は知りません。この点で非常に基本的な誤りを犯します。非常に面白い論文ですが、ポイントは、私たちは皆、自分の知識が何か、自分の能力が何か、自分の知能が何かについて幻想を持っているということです。

私たちはすでにある意味でスイングを持っています。私たちが自分の知能だと考えているものを、実際には多くの他の人々や周りの多くの他のものにあるものと同一視しているという意味で。そして私たちはそれを無意識のうちに行っています。

だから私にとって、すでに起こっていることとAIの間には本当に不連続性はありません。それは本当にそれの続きに過ぎません。

興味深いですね。私は彼らが、人間の総体よりも知的な単一の人工物を構築できると主張すると思います。でもそれは脇に置いておいて、ジュディス・ファンと話しました。スタンフォードの素晴らしい教授で、彼女は描画について研究しています。

人間がどう描くかをCLIPモデルなどを使うコンピュータと比較しています。彼女が発見した魅力的なことは、私たちはかなり抽象的な理解を持っているので、スケッチを作るとき、彼女はプログレッション1、プログレッション2、プログレッション3のようなもので評価していましたが、私たちは非常に粗く非常に抽象的に始めます。AIシステムは縁と詳細から始めます。

それは私にとって、今日のAIモデルは私たちのように非常に深い抽象的なレベルで物事を本当には理解していないことを示しています。おそらく私たちが以前ほのめかした知識のこの構成的合成を持っているからです。それをギャップとして見ますか。

そこには隠されたいくつかの質問があると思います。その1つは、たとえば今日のLLMを私たちの脳とは異なる、基本的に劣っているまたは異なると考えているかということです。

それらのギャップは何ですか。まず第一に、明らかに非常に異なります。アーキテクチャが異なります。訓練方法が非常に異なります。私にとって注目すべきことは、実際にそれらの性質の多くが脳のそれといかに収束しているかです。これらすべてにもかかわらず。

多くのものでマーティン・シュリンプと仲間のブレインスコアタイプの測定値のような、人間の脳で測定できるものに驚くほど似ている内部表現を見つけるという事実です。人間の感覚様式は、純粋な言語で訓練されたモデルによって驚くほどよく再現できます。これは本当に注目に値します。

言語にどれだけエンコードされているか、言語にエンコードされているもののどれだけが私たちの脳のアーキテクチャ特性と環境世界の反映であるか、そしてそのどれだけがそれらのモデルによって本質的に再構築されるかを物語っています。

絵を描くときに最初に何を描くか、それがすべてどう機能するかという質問について。CLIPのような画像合成モデルはそもそもピクセル空間で動作していることを覚えておいてください。そして拡散モデルは他の種類のモデルとは非常に異なって動作します。

ロボットをトランスフォーマーで駆動できることが今では分かっています。だからそれらのロボットの1つに絵筆やペンを与えて「さあ描いて」と言うと、描くものは、ピクセルを埋め始める拡散モデルから得られるものとは非常に異なります。

そしてそれはすべて、何かを視覚化しているときにあなた自身の頭の中で起こることとは異なります。だから、IOと表現空間の動作方法のすべての違いのために、これのすべてを分析するのはそれほど簡単ではないと思います。

今日のモデルは高度に構成的だと思います。元の画像合成モデルの多くでさえ、「海の底でスピーク&スペルで遊んでいるテディベア」と言えばそれを実行するという事実は、それらが構成できることを示しています。

私たちのような能力がありますか。いいえ。つまり、確かに彼らが優れているところ、劣っているところ、驚くべきギャップがあるところがあります。だから異なりますが、そこに構成の根本的な欠如があるとは全く言いません。

どちらかと言えば、トランスフォーマーベースのモデルと私たちがすることの間の最大のギャップは、実際には物語的記憶です。長期記憶を形成でき、その方法で長期間にわたる自己の持続性を持つことができることです。彼らはまだそれを持っていません。

ロバスト性と汎化

葛藤しています。あなたは普遍的表現仮説を指摘しています。クリス・オラーが視覚化実験のいくつかでそれを普及させたと思います。そして表現が非常に収束しているのは本当ですし、他のことも私にモデルが正しい答えを出すがそれは間違った理由で正しい答えを出すこの種の表面的な偽物を生み出すと信じるように導きます。

そのヒントの1つは、入力にバリエーションを加えると、それがロバストでないということです。チューリングマシンの議論もあります。つまり、これらのLLMは有限状態オートマトンです。しかしチューリング不完全なツールにアクセスできます。だからシステムがチューリング不完全だと言えるかもしれませんが、Chat GPTがチューリングマシンアルゴリズムの空間を効果的に検索しているとは信じていません。

そうするように訓練されていませんが、ARCチャレンジでは驚くほどロバストです。実際に本当にうまくやれます。特に進化をしたり、いくつかの改良などをすれば。だから私たちはドアをノックしているように感じますが、何かが欠けています。

多くのそれらのケースで、私たちは公平な人間比較をしていないと思います。そしてこれは自転車の仕組みについて知っているという私たちの幻想などと少し似ています。

多くの人が、でもほら、ロジックを反転させるだけのこのケースを見てください、doをdon’tに変えると、30%多く間違えます、などと言うのを聞きます。私の最初の質問は常に、人間のベースラインは取りましたか、です。

そして驚くほど頻繁に、人間のベースラインが同じ性質を示すことが分かります。これは人間がこれらのことの完全にロバストで完全に汎用的なバージョンを実行できないという意味ではありません。論理学者であるか、注意深く考えれば、本当に前提を書き下ろして、何かが定式化される方法でノットを反転することに対して超ロバストになれます。

でも私たちのほとんどはほとんどの時間そのように動作しません。そして私たちは論理的幻想、認知的幻想などに非常に影響されやすく、多くの場合、機械のケースと驚くほど似ていることが分かります。だから私は多くのそれらに動かされません。

そして、私たちがどうそれを行うかについて少しずさんであることが多いと思います。確かにトランスフォーマーがすべての可能なチューリングマシンを体系的に検索していないのは事実です。つまり、それを行う方法を知りません。プログラム上での帰納法の全問題を計算的に扱いやすくするために、何らかのショートカットを取る必要があります。脳であろうとトランスフォーマーであろうと。

ブレイズ、本日はご参加いただきありがとうございました。光栄です。

ありがとうございます。本当に思慮深い質問をありがとうございました。