DeepMindの創設者Demis Hassabisが、AGI(汎用人工知能)と超知能の明確な違いについて語った重要なインタビューである。彼は、現在のAIシステムがいくつかの課題を解決できるとしても、真のAGIには程遠いと主張する。AGIとは人間が持つすべての認知能力を備えたシステムであり、単に問題を解くだけでなく、アインシュタインやピカソのように全く新しい理論や芸術ジャンルを創造できる能力を含むと定義している。また、画像生成モデルや動画生成モデルが物理世界の理解に貢献し、AGIへの重要なステップとなる理由や、AIが人間の仕事を代替する未来においても、人間は新たな目的と意味を見出すことができると展望を示している。

AGIの真の定義とは何か
私たちはこれまで何度かAGIについて話してきましたよね。では、この点についてあなたに直接お聞きしたいと思います。というのも、私は年末にSam Altmanと話をしていて、彼にこう尋ねたんです。あなたは2つのことを言っているように見えますね、と。私たちはまだAGIには到達していない、でもGPTモデルができることについて話すたびに、それは彼の定義に当てはまるように思えます、と。
すると彼は、AGIは定義が曖昧だと答えました。そして彼が皆に同意してほしいと思っているのは、私たちはある意味AGIをさっと通り過ぎて、超知能に向かって進んでいるということだと言いました。あなたはそれに同意しますか。
彼がそう望んでいるのは間違いないでしょうけど、いいえ、絶対に同意しません。AGIをマーケティング用語に変えたり、商業的利益のために使うべきではないと思います。
AGIには常に科学的な定義があったと思います。私の定義では、それは人間ができるすべての認知能力を示すことができるシステムです。そして私が言う「すべて」というのは本当にすべてです。つまり、私たちが常に称賛する人間の創造性の最高レベル、私たちが賞賛する科学者やアーティストのことです。
つまり、単に数学の方程式や予想を解くだけでなく、画期的な予想を思いつくこと、それははるかに難しいことです。物理学の何かや化学の問題、例えばAlphaFoldのタンパク質折り畳みのような問題を解くだけでなく、実際に新しい物理学の理論を思いつくこと、例えばアインシュタインが一般相対性理論でやったようなことです。システムはそれを思いつくことができるでしょうか。なぜなら、もちろん私たちはそれができるからです。最も賢い人間が人間の脳のアーキテクチャで歴史の中でそれを成し遂げてきました。
そして芸術の面でも同じです。既知のものの模倣を作るだけでなく、実際にピカソやモーツァルトになって、これまで見たことのない全く新しい芸術のジャンルを創造することです。そして今日のシステムは、私の意見では、それにはまったく近づいていません。
どれだけ多くのErdos問題を解こうとも関係ありません。何らかの理由でそういうことが注目されていますが、それらをやっていることは良いことだと思いますが、真の発明やRamanujanのような人ができたことからは程遠いと思います。そして、これらすべての領域でそれができる可能性のあるシステムが必要です。
身体性と物理的知能の重要性
その上に、私は物理的知能も加えたいと思います。なぜなら、もちろん私たちはスポーツをしたり、自分の体を驚くべきレベルでコントロールしたりできるからです。今日ここダボスを歩いているエリートスポーツ選手のように。そしてロボティクスの例を見ても、私たちはまだそれには程遠い状態です。
ですから、AGIシステムは、AI分野の本来の目標を本当に達成するためには、これらすべてのことができなければならないと思います。そして、私たちはそこから5年から10年離れていると思います。
何かがそれらすべてのことができるなら、それは超知能と見なされるという議論があると思いますが。でもあなたはAGIが良い定義だと思うんですね。
もちろん違います。なぜなら、個々の人間は新しい理論を思いつくことができるからです。アインシュタインもできましたし、Feynmanもできましたし、私の科学的ヒーローである偉人たちは皆それができました。稀ではありますが、人間の脳のアーキテクチャでそれは可能なのです。
超知能とAGIの本質的な違い
超知能は話す価値のある別の概念です。しかし、それは本当に人間の知能ができることを超えることができるものでしょう。私たちは14次元で考えることはできませんし、気象衛星を脳に接続することもできません。少なくとも今のところは。ですから、それらは本当に人間を超えた、あるいは超人的なものであり、それについてはまた別の議論をする必要がありますが、AGIに到達してからの話です。
最近あなたの話を聞いていて、本当に驚いたことがあります。Google DeepMindのポッドキャストで尋ねられたんですが、とても良い内容ですよね。今日AGIに近いシステムがあるかと聞かれて、私はGemini 3かもしれないと思ったんです。
あなたはNano Bananaと答えましたね。
そうです。
画像生成モデルです。
そうです。
え、何ですか。
画像生成と世界モデルの関係
まあ、時には楽しい名前をつけて楽しまなければなりませんからね。でも、どうして画像生成モデルがAGIに近いんですか。
ええ、もちろん、画像生成モデルについて話しましょう。でも、私たちの動画生成モデルVOについても話しましょう。これは動画生成における最先端です。AGIの観点からすると、こちらの方がさらに興味深いと思います。
10秒、20秒のリアルな場面を生成できる動画モデルは、ある意味で物理世界のモデルです。私たちが物理学の世界で時々呼ぶ「直感的物理学」です。そして、それは液体や物体が世界でどのように振る舞うかを直感的に理解しています。
そして明らかに、理解を示す一つの方法は、少なくとも人間の目に十分正確に見え、人間の目を満足させられるようにそれを生成できることです。明らかに、物理学の観点からは完全に正確ではありません。私たちはそれを改善していきます。しかし、これは世界モデルというアイデアに向けた一歩です。世界の仕組みや因果関係を理解できるシステムです。
そしてもちろん、それはAGIにとって不可欠だと思います。なぜなら、これらのシステムが現実世界で計画を立てることを可能にするからです。おそらく非常に長い時間軸にわたって。もちろん、人間としての私たちはそれができます。
4年間かけて学位を取得して、より多くの資格を得て、10年後にはより良い仕事に就けるようにする。これらは私たちが皆かなり楽に行っている非常に長期的な計画です。そして現時点では、今日のシステムではまだそれをどうやるかわかりません。一つの時間スケールでの短期的な計画はできますが。
でも、こういった世界モデルが必要だと思いますし、ロボティクスを想像してみてください。ロボティクスにまさに必要なのは、ロボットが現実世界で計画を立て、何らかのタスクを完了するために現在の状況から多くの軌道を想像できることです。まさにそれが必要なのです。
そして最後に、私たちの観点から、そしてこれが私たちがGeminiを最初からマルチモーダルとして扱ってきた理由です。動画、画像を扱うことができ、最終的にはそれらすべてを一つのモデルに収束させる。それが私たちの計画です。ユニバーサルアシスタントにとっても非常に有用になるでしょう。
AI技術が人間に与える影響
ゲームについて考えることに戻りますが、これが経済に与える影響について話していて、あなたの技術の対戦相手たちに申し訳ない気持ちになってきました。Leedul。
はい。
意気消沈しましたね。
そうですね。
StarclaftでプレイしたこのManaという人があなたのボットに勝ちましたが。
ええ。
基本的に人間対機械は終わったと気づいたんですね。
そして今、私たちは皆、この技術が知識労働に進出してくる中で、何らかの形でこれに立ち向かっています。
ああ、AIの競合相手のことかと思いました。彼らについては大丈夫です。そのことで悲しく感じません。AIの容赦ない進歩ですね。ゲーマーのことを言っているんですね。ゲーマーですね。ええ、あなたは私にゲーマーに申し訳ない気持ちにさせました。
でも、これについてお聞きしたいんです。世界最高のStarcraftやGo棋士に対して見事に対戦したこれらのモデルが、今度は私たちの仕事をし始めています。私たちも同じ状況に陥ることになるんでしょうか。
ゲームAIが示す人間とAIの共存
そうですね、ゲームを例に挙げたので、ゲームで何が起こったか見てみましょう。
チェスでは、私が10代の頃から、90年代のGarry Kasparovより優れたチェスコンピュータがありました。それらは汎用AIシステムではありませんでしたが、Deep Blueがありました。チェスはこれまで以上に人気があります。誰もコンピュータ同士の対戦を見たいとは思っていません。私たちはMagnus Carlsenが世界のトップチェスプレイヤーと対戦するのを見たいのです。
興味深いことに、Goでは、世界最高のGoプレイヤーは韓国人で、AlphaGoの対局が行われたときは15歳くらいだったと思います。彼は今20代半ばで、Eloレーティングでこれまでで最も強いプレイヤーです。なぜなら、彼は若い頃からネイティブにAlphaGoの知識を知識プールに持って学んだからです。彼はAlphaGoの知識と共に学んだ最初の世代と言えます。そして彼は実際に当時のAlphaGoよりも強いかもしれません。
ですから、そして私たちは皆Starcraftや他のすべてのコンピュータゲームを楽しんでいます。私たちは人間の営みを楽しんでいます。これは100メートルのオリンピック競技を今でも愛しているのと少し似ていると思います。Usain Boltよりもはるかに速く走れる乗り物があるにもかかわらず、それは別のことですよね。
ですから、私たちには適応する無限の能力があると思いますし、テクノロジーと共に進化していくのです。なぜそうなのか。なぜなら、私たちは汎用知能だからです。それがポイントです。私たちはAGIシステムです。もちろん人工ではありません。私たちは汎用システムであり、科学を発明することができます。
人間の適応能力と道具製作者としての本質
そして私たちは道具を作る動物です。それが人間を他の動物から区別するものです。コンピュータを含む現代文明のあらゆるものを作ることができ、もちろんAIはコンピュータの究極の表現ですが、これらすべては私たちの人間の心から生まれました。その心は狩猟採集のライフスタイルのために進化したものです。
ですから、私たちが今日見ている現代文明にたどり着けたのは驚くべきことです。そして、私たちがどれほど汎用的であるかを示しています。私たちはAIや科学、物理学、これらすべてのことについて話しています。そして私たちは再び適応するでしょう。
ただ、仕事や経済的なことを超えて、重要な問題が実際にあります。それは目的と意味についてです。なぜなら、私たちは皆、自分の仕事から多くの目的と意味を得ているからです。私は確かに自分がやっている科学から得ています。
では、それの多くが自動化されたらどうなるのか。私は、新しい偉大な哲学者が必要だと呼びかけてきました。そして、それは人間の状態にとって変化となるでしょうが、必ずしも悪化する必要はないと思います。産業革命のようなもの、おそらくそれの10倍のようなものだと思いますが、私たちは再び適応しなければなりません。
そして、私たちは新しい意味を物事に見出すと思います。そして私たちは今日でも、単に経済的利益のためではないことをたくさんやっています。芸術、エクストリームスポーツ、極地探検、これらの多くのことです。そしておそらく、将来的にはそれらのもっと洗練された、難解なバージョンを持つことになるでしょう。


コメント