
7,816 文字

サティア・ナデラは実際にドウェッシュ・パテルのポッドキャストで、少し物議を醸す発言をしました。彼はAGI(汎用人工知能)の定義はかなり無意味だと述べ、実際の定義は少し異なると考えていると言いました。このビデオでは、彼がAGIについてどう考えているのか、そしてそれに対する業界全体の反応について詳しく見ていきます。
まず最初のクリップで、彼は基本的にAGIの定義は実際には常に変化するものだと述べています。
「私が質問に対するあなたの回答を聞いて確信が持てないのは、あなたがAGIを『物』として考えているかどうかです。つまり、少なくともコンピュータでできるすべての認知労働を自動化できるものがあるということでしょうか?」
「ここで私が問題だと思うのは、人々がそれについて話す定義です。認知労働は静的なものではありません。今日の認知労働があり、私のエージェントがすべて管理しているインボックスがあれば、それは新しい認知労働なのでしょうか?そして、今日の認知労働が自動化されるかもしれませんが、新しく生まれる認知労働についてはどうでしょうか?これら両方のことを考える必要があります。だからこそ、少なくとも私の頭の中では、知識労働者と知識労働を混同しないことが大切だと思います。今日の知識労働はおそらく自動化できるでしょう。誰が『メールの分類が人生の目標だ』と言うでしょうか?AIエージェントにメールを分類させればいいのです。しかし、メールを分類した後、『これら3つの下書きを本当に確認してほしい』というより高いレベルの認知労働タスクを与えることは、異なる抽象化です。」
ここで彼が言っていることを理解できなかった場合、彼は基本的に「このAGIベンチマークというものは本当に意味をなさない」と言っています。彼が実際に話している重要なことの一つは、認知労働は静的なものではないということです。認知労働は常に動的で変化するものであり、それは本質的に今日の認知労働は明日の認知労働とは非常に異なる可能性があることを意味します。
また、それは本質的に、どのようなタスクを自動化する必要があるかを分析する必要があることを意味し、もちろん、もしAGIがすべてのタスクを自動化するものであれば、それは常に変化するものになるでしょう。したがって、AGIの定義も常に変化することになります。
この区別を明確にすることは本当に重要だと思います。AGIは本当に曖昧な用語であり、現在では人によって異なる定義があります。サム・アルトマンも定義を持っていますが、それはサティア・ナデラのものと非常に似ていて、実際の価値を提供する必要があるという点です。
「この時点で、AGIの正確な定義が重要なほど十分に近づいていると思います。あらゆる分野の世界的専門家が一緒に絶え間なく働くとき、それは多くの人がAGIと考えるものを超えていると思います。だから、いつそこに到達するかについて話すよりも…申し訳ありません、それは本当に分かりにくかったですね。私が言いたいのは、今後数年でコンピュータがそんなことをするとは本当に思わなかったと多くの人が見て言うようなものに到達すると思います。」
サティア・ナデラはまだ話し終えていませんでした。彼が話した別の分野として、AGIを実際の定義として見るなら、彼のAGIの定義は実際にはかなり異なると述べています。彼は基本的に「もし私たちが自分たちをAGIを作った国や会社と呼びたいなら、毎年10%の経済成長を達成したときにAGIがあると分かるだろう」と言っています。
彼がこの区別をした理由は、AIの会社が何度もベンチマークハッキングに焦点を当てているからだと思います。もちろん、モデルがどれだけ優れているかを人々に見せるためにそうするインセンティブがあります。しかし、企業が焦点を当てていないのは、実際の世界の顧客や企業に実際の価値をもたらすことです。もしそれができるなら、そのような指標のほうが重要だと思います。だからこそ、10%の経済成長を達成するというベンチマークは、多くのタスクを自動化できるという曖昧な定義よりも重要だと思います。
「自分自身でAGIのマイルストーンを主張するのは、私にとっては無意味なベンチマークハッキングです。本当のベンチマークは世界が成長しているかどうかです。世界が10%成長しているなら、世界経済は100兆ドルほどですから、世界が10%成長すれば毎年10兆ドルの追加価値が生み出されることになります。そうであれば、800億ドルはたくさんのお金のように思えますが、本当に数年で世界経済をこのペースで成長させると思うなら、必要なコンピューティングパワーを持っているかどうかが鍵になるでしょう。」
「古典的な供給側の考え方は『作ればお客が来る』ということですね。それは一つの議論であり、結局のところ、私たちはそれをするためにリスクを取ってきました。しかし、ある時点で供給と需要は一致しなければなりません。顧客に実際の価値をもたらす方法を本当に理解するのではなく、すべての供給側でハイプしてしまうと、完全に脱線してしまう可能性があります。」
「与えられた時点で両者が対称的に一致する必要はないと言いませんが、昨日の資本を今日の需要に変換できるという存在証明が必要です。そうすれば、完全にレートミスマッチにならないことを知りながらも、再び指数関数的に投資することができるでしょう。」
彼が実際に話していたのは、現在これらの企業がAIインフラに何十億、何百万ドルも費やしているという事実であり、彼は「AIインフラにお金を使うことは確かに理にかなっているが、潜在的に過剰支出している可能性に注意しなければならない」と主張しています。現在持っているAIが明日の顧客に価値をもたらすという証拠を少なくとも持っている必要があり、そうすれば、すべてのインフラを構築する際に、企業が過剰支出し、需要が少なすぎるという状況に陥らないでしょう。
企業が今インフラを構築することは理にかなっていると思いますし、AGIとASI(超知能AI)の影響を考えると理にかなっていると思いますが、投資に関して物事がどのように進んでいくのか見るのは興味深いでしょう。
「これら二つの異なる見方に矛盾があるのではないかと思います。あなたが素晴らしくやってきたことの一つは、2019年にOpenAIに投資するなど、Co-pilotやアプリケーションがある前に早い段階でベットしたことです。産業革命を見れば、鉄道などの6〜10%の建設において、多くは『チケットから収入があるから次に進もう』といったものではなく、多くのお金が失われました。」
「そう、もし世界の成長率を10倍や5倍にする可能性があると本当に考えるなら、計算リソースに何千億ドルも費やすべきではないでしょうか?」
「計算リソースを構築することだけでなく、次の大きなモデルを訓練するだけでなく、次の大きなモデルを提供するのにも役立つ計算リソースを構築することが重要です。これら二つのことを行うまでは、投資の利点を本当に活かす立場にはないでしょう。だから一つのことだけでなく、完全な考えを持つ必要があります。」
AI定義に戻りましょう。BloombergによってリークされたOpenAIの内部文書を参照するのは常に良いことだと思います。これは彼らが持っているものであり、おそらく皆さんはこれに精通していると思いますが、現在彼らはレベル3にあり、それはもちろん行動を取ることができるエージェントとシステムです。
来年までにエージェントは本当に優れたものになると思います。さまざまなワークフローがあるでしょう。それは私が個人的にAIアカデミーで取り組んでいることで、説明欄にリンクがあります。私は多くの異なるタスクを自動化できる多くのAIエージェントワークフローに取り組んでいます。
ここでのポイントは、5つのレベルがあり、レベル4はもちろん革新者AIであり、カナダの発明です。そしてレベル5は、おそらく組織の仕事を行う多くのAIシステムが一緒になったものでしょう。
AGIの定義について他のCEOはどう考えているのか、AGIについてどう思っているのかと聞かれるかもしれません。最近のポッドキャストで、Anthropicのジョエン・CMOは実際にこれについて話し、彼は2027年までにAGIが到来すると考えていると述べました。
「今までの曲線を外挿すると、もしあなたが『昨年は学部レベルで、その前の年は高校生レベルだったけど、今はPhDレベルに近づいている』と言えば、どのタスクで、何のためにまだモダリティが欠けているかを議論できますが、それらは追加されています。コンピュータの使用が追加され、画像入力が追加され、画像生成が追加されました。完全に非科学的ですが、これらの能力が増加するペースを目で見ると、2026年か2027年までにそこに到達すると思わせます。」
「もちろん、多くのことが脱線する可能性があります。データが枯渇するかもしれませんし、望むようにクラスタをスケールできないかもしれません。台湾が爆発するようなことがあれば、望むだけのGPUを生産できないかもしれません。プロセス全体を脱線させる可能性のあることはたくさんあります。だから直線的な外挿を完全に信じているわけではありませんが、直線的な外挿を信じるなら、2026年か2027年にそこに到達するでしょう。」
興味深いことに、このビデオのリサーチをしていて、意見が非常に異なる人々を見つけました。分断を生み出すつもりはありませんが、多額の資金を調達している企業は、より確立された企業よりも短いタイムラインを持つことが多いというのは非常に興味深いと思います。
例えば、OpenAIのようなAGIが近いと言っている企業があります。私はAGIが遠いとは思いませんが、彼らのインセンティブはAGIが近いと言うことだと思います。しかし、アメリカのコンピュータ科学者であるアンドリュー・ンなどの人々は、AGIはかなり遠いと言っています。
「AGIの標準的な定義は、人間ができるあらゆる知的タスクを行えるAIです。AGIがあれば、AIは車の運転や飛行機の操縦、大学のPHD論文の執筆を学べるはずです。この定義のAGIについては、何十年も先、あるいはさらに長い時間がかかると思います。生涯でそこに到達することを願っていますが、確信はありません。」
「数年でAGIに関するハイプがある理由の一つは、AGIの非標準的な定義を使用している企業があることです。AGIをより低い能力と再定義すれば、もちろん1年か2年でそこに到達できるでしょう。しかし、人間ができるあらゆる知的タスクを行えるAIという標準的なAGIの定義では、まだ何十年も先だと思います。」
他のCEOがAGIについて何を話しているかについて、デミス・ハサビスは実際に3〜5年先だと言っています。
「私たちはこれに20年以上取り組んできました。人間が持つすべての認知能力を発揮できるシステムとしてのAGIについて一貫した見方を持っていました。近づいていると思いますが、まだおそらく数年先だと思います。」
「そこに到達するには何が必要でしょうか?今日のモデルはかなり能力がありますね。私たち全員が言語モデルと対話してきましたし、今はマルチモーダルになっています。まだいくつかの欠けている属性があると思います。推論、階層的な計画、長期記憶などです。現在のシステムが持っていないと言える能力はかなりあります。また、全体的に一貫性がありません。いくつかのことには非常に強いですが、他の分野ではまだ驚くほど弱くて欠陥があります。」
「AGIには、あらゆる認知タスクで一貫した堅牢な行動が必要です。明らかに欠けていることの一つ、私がAGIのベンチマークとして常に持っていたのは、これらのシステムが科学について独自の仮説や推測を発明する能力です。既存のものを証明するだけでなく。」
「もちろん、既存のマース予想を証明したり、世界チャンピオンレベルの囲碁をしたりすることはすでに非常に有用です。しかし、システムは囲碁を発明できるでしょうか?新しいリーマン仮説を思いつくことができるでしょうか?アインシュタインが当時持っていた情報で相対性理論を思いつくことができるでしょうか?今日のシステムは、そのような創造的で発明的な能力からまだかなり遠いと思います。」
「AGIまであと数年だと思います。おそらく3〜5年でしょうか。AGIシステムの重要な要素ですが、それだけでは恐らく十分ではないでしょう。AGIに到達するためにはまだ2、3の大きなイノベーションが必要だと思います。そのため、私は他の人よりも10年のタイムスケールを考えています。同僚や他の競合他社の中には、もっと短いタイムラインを持っている人もいますが。」
デミス・ハサビスが10年のタイムスケールだと述べていることは非常に興味深いです。GoogleのようなAGIが遠いと考える企業には長いタイムフレームがあるようですが、Googleにいないか、AGIが遠いと考える人々はどうでしょうか?
私はいつもこのインタビュークリップを取り上げています。なぜなら、AIアクションサミットでヤン・ルカンは基本的にAGIの重要な要素が欠けていると述べ、デミス・ハサビスと同様の意見を共有しています。実際にそこに到達するためには特定のブレークスルーが必要だと言っています。
もちろんこれは10%の経済成長があるかどうかについてではありませんが、システムが実際に何ができるかを見るなら、彼はAIシステムと人間ができることの違いについて最も現実的な理解を提供していると思います。
彼は猫がいかに複雑な行動を計画できるか、10歳の子供が学習なしに食事の後片付けと食器洗い機のセットアップができること、17歳の若者が20時間の練習で車の運転を学べることについて話しています。私たちはテスラの自動運転のために何時間もの、何億もの分のデータを持っていながら、それでもまだ完璧ではありません。人間ができることと比較すると、人間は数時間で車の運転を学ぶことができますが、何年分のデータを持つAIシステムでさえ完璧ではないという事実は、私たちが明らかに何か重要な要素を欠いていることを示しています。
「私たちは大きな何かを欠いています。人間の知能を再現することはおろか、猫の知能や鼠の知能、まして犬の知能さえ再現できません。彼らは驚くべき能力を持っています。物理的な世界を理解し、どんな家猫でも非常に複雑な行動を計画できます。彼らは世界のカオスモデルを持っており、ドアや水道の蛇口を開ける方法を知っているものもいます。」
「人間では、10歳の子供は学習なしで初めて頼まれたときに、食事の後片付けと食器洗い機のセットアップをゼロショットでできます。17歳の若者は20時間の練習で車の運転を学べます。しかし、猫のように行動できるロボットはまだありませんし、食事の後片付けができる家庭用ロボットもなく、何十万時間、あるいは何百万時間もの教師付き訓練データがあるにもかかわらず、レベル5の自動運転車もありません。これは私たちが何か本当に大きなものを欠いていることを示しています。」
おそらく物議を醸す意見で、皆さんが理解できないかもしれませんが、私はAGIよりも先にいくつかの分野でASIが実現すると思います。なぜなら、AGIは人々が考えるよりも難しいと思うからです。OpenAIはAGIの構築方法を知っていると言っていますが、なぜAGIに到達する前に多くの分野でASIが実現するだろうと考えるのか、その理由について簡単に話したいと思います。
ASIには一つのことが非常にうまく機能するだけでいいのですが、AGIには人間ができることなら何でもうまくできるほど全体のシステムがうまく機能する必要があり、それは考えてみると非常に難しいことです。
Google DeepMindの論文を見ると、私が話していること、つまりAGIよりもASIが先に実現する可能性が高いということは、実際にすでにさまざまな分野で起こっていることが分かります。
狭いAIの分野では、明確に定義されたタスクのセットがあり、すでにレベル5の超人的AIがあり、100%の人間を上回る性能を持っています。例えば、タンパク質の折りたたみとタンパク質構造の理解を行うAlpha Foldや、人間が今まで遊んだよりも優れた囲碁を遊ぶことができるAlpha Zeroがあります。それは超人的です。そして、世界最高のチェスプレイヤーであるStockfishがあり、それは本質的に狭いAIのASIです。
狭いAIは、言ったように、はるかに簡単なものです。特定の企業はおそらくまずこのようなアプリケーションに焦点を当てるだろうと思います。なぜならそれははるかに簡単に見えるからです。
論文が書かれた時点での汎用AIについては、少なくとも50%の熟練した大人の能力を持つ「有能なAGI」にさえまだ到達していないことが分かります。これは現在のAIシステムにとって非常に難しいことであり、AGIの約束は私たちが考えるよりも少し弱いかもしれないと思います。
前に言ったように、OpenAIは実際に「私たちは今、伝統的に理解されてきたAGIを構築する方法を確信している」と述べており、これは非常に大きな声明です。人間の知能を本質的に複製できるアーキテクチャに到達する方法を正確に知っていると言えば、それは大胆な主張であり、何らかの製品や証拠で裏付ける必要があります。
そして、OpenAIはまた、「代わりに超知能に焦点を当てる」とも述べています。だからこそ、GPT-4.5がそれほど大したことではないと思った理由です。彼らは「私たちは超知能に目を向け始めています。真の意味での超知能に。私たちは現在の製品を愛していますが、素晴らしい未来のためにここにいます」と言っています。もちろん、超知能があれば他の何でもできるでしょう。
私にとって、AGIを目指しているこれらの企業は、私は間違った見解を持っているかもしれませんが、医学研究を行うことができる超人的AIシステム、特定の生物学的科学研究を行うことができるツールなど、特定の分野で超人的なAIが先に登場しても驚かないと思います。
車を運転し、ヒューマノイドロボットに入り、最高のアドバイスを与え、最高の詩を書き、コンピュータを制御するAIシステムが登場する前に。もしかしたら一度にすべてを手に入れるかもしれませんが、それは間違いなく非常に非常に興味深いことです。
進歩に懐疑的な人々のために、特定のベンチマークがどのように打ち破られているかを見るのは確かに価値があります。私が感じているのは、これまで困難だったベンチマークはほとんどすべて、2年でAIによって打ち破られているということです。
AGIベンチマークについてどう思いますか?10%の経済成長の方が良いと思いますか?それとも他の方が良いと思いますか?


コメント