「AIのゴッドマザー」が語るAIの次なるフェーズ(フェイフェイ・リー&リード・ホフマン)|Summit 2025

AGI・ASI
この記事は約18分で読めます。

「AIのゴッドマザー」として知られるフェイフェイ・リーが、リード・ホフマンとのMasters of Scale Summit 2025での対談で、AI技術の次なるフロンティアである空間知能と世界モデリングについて語る。ImageNetでコンピュータビジョンに革命をもたらした彼女は、現在World Labsの共同創設者兼CEOとして、言語を超えた知覚と行動の統合に取り組んでいる。カンブリア爆発における知覚と運動の進化的関係から、DNAの二重らせん構造の発見における空間的推論の重要性まで、彼女は空間知能がAGIへの鍵となる理由を解説する。自動運転車やロボット工学の発展に必要な数十年規模の地道な取り組み、そしてAI時代における信頼構築の重要性についても言及し、技術者や起業家に対して知的な大胆さと創造性の解放を呼びかける内容である。

The “Godmother of AI” on the next phase of AI (Fei-Fei Li & Reid Hoffman) | Summit 2025
The brilliant computer scientist Fei-Fei Li is often called the Godmother of AI. She talks with host Reid Hoffman about ...

AIの次なるフェーズへ:空間知能と世界モデリング

もし科学者が大胆である必要があるなら、起業家はもっと大胆である必要があると思います。大胆さ、私はこの言葉が大好きで、実際これは私が採用を行う際の基準の一部でもあるんです。特に若い人たちの中にその大胆さを持っている人を探しています。大胆であるということは、自由であるということです。自分の創造性、勇気、そして物事をやり遂げる能力を制約する足かせから解放されることなんです。

言葉遣いが悪くて申し訳ないんですが、これは実は専門用語なんです。はい。私が強く感じていることの一つは、AI時代において、信頼を機械に外注することはできないということです。信頼とは根本的に人間的なものです。個人レベル、コミュニティレベル、そして社会レベルでのものなんです。皆さんの中には、インフラやSaaS、その他何かのアプリケーションだけに携わっている方もいるかもしれません。それはもっと遠い存在だと感じるかもしれませんね。でもそれは違います。なぜなら、皆さんは人々にサービスを提供しているからです。ビジネスにサービスを提供しているんです。信頼は本当に重要です。信頼の源として人間の主体性を持つことが大切なのです。

皆さん、今週の番組では、2025年のMasters of Scale Summitからリード・ホフマンとフェイフェイ・リー博士との対談をお届けします。フェイフェイは優れたコンピュータ科学者であり作家であり、数十年にわたってAI開発の最前線に立ってきました。彼女はスタンフォード大学の人間中心AI研究所の創設ディレクターであり、現在はWorld Labsの共同創設者兼CEOです。彼女はリードとステージ上で、AIが進化する中で私たちが今どこにいて、どこに向かっているのかについて率直な考察を行いました。きっと楽しんでいただけると思います。これがMasters of Scaleです。

リード:これまで何回こうして対談してきたか数え切れないくらいですが、いつも素晴らしくて光栄です。ここに来てくれてありがとう。

フェイフェイ:ありがとうございます。私も数え切れないですね。

リード:あなたのキャリアをフォローしている人なら誰でも知っていることですが、あなたはAIの波における本当のOGの一人ですよね。ImageNetをはじめ、今日私たちがいる場所の基礎となっている貢献の数々です。ちなみに、そのことに感謝します。そして今、あなたは空間知能と世界構築に取り組んでいます。あなたが愛する仕事、つまり人間中心AIやスタンフォードのコンピュータサイエンスから一種の休暇を取って、この会社を始めた理由について少し話してもらえますか。そして今何をしているのかについても。

フェイフェイ:リード、改めて招待してくれてありがとうございます。ここにいられて本当に光栄です。あなたが言っているのは、私が共同創設者兼CEOを務めているスタートアップ、World Labsのことですよね。リード、あなたはOpenAIの最初の支援者、投資家の一人でした。OpenAIが設立されたとき、あなたと私はAGIの夢について話しましたよね。AI科学者として、私はAIとAGIという言葉の間で引き裂かれています。というのも、私にとってはほぼ同じ意味なんです。でも言葉はさておき、実際には…

リード:私はAGIという言葉を、まだ私たちが発明していないAIに使っています。

フェイフェイ:それはいいですね。アラン・チューリングやおそらくジョン・マッカーシーも同じことを意味していたと思います。では、私にとってAGIとは何か。AGIとは、人間と同等の機械の知能の能力であり、多くの場合、人間を超えることができるものです。私はこれを未来への扉と考えていて、その扉には複数の鍵穴があります。言語はその一つ、主要なものの一つです。なぜなら、言語は知能の本質的な部分だからです。リード、あなたは準哲学専攻だったと知っていますが、ヴィトゲンシュタインが…

リード:準というのは実はスタンフォードでは肯定的な言葉なんです。リードは卒業生ですから。非常に特別な専攻があって、Simsと呼ばれています。記号システムですね。哲学と認知科学とコンピュータサイエンスを組み合わせたものです。ちなみに、私はその専攻を宣言した8番目の人間でした。

フェイフェイ:わあ、すごい。その専攻からは多くの有名人が輩出されていますね。

リード:はい。だから準というのは単に割合を意味するだけです。良い言葉ですよ。

フェイフェイ:後で訂正してくださいね。でも大丈夫です。私は自分で穴から抜け出しているところです。ヴィトゲンシュタインは、言語が世界の限界を定義すると言っています。

リード:はい、実は私はそれに反対していません。

フェイフェイ:素晴らしい。なぜなら、言語は世界が記号的な形で記述できる一定レベルの境界を定義すると思いますが、それを超えると世界は実際には無限だからです。そしてその世界とは何か。それをどう定義するのか。それは知能と何の関係があるのか。そして機械を使ってそれをどう表現するのか。私はそのすべてを世界モデリングという言葉にまとめています。

世界モデリングは言語と非常に密接に関係しています。しかし、それは世界の状態を表現し、表現し、最終的にはその変化に参加することについてです。それは仮想的なものかもしれないし、物理的なものかもしれません。世界モデリングには何が含まれるのか。言語は含まれます。なぜなら、言語は世界との質問の一形態だからです。しかし、それはまた視覚、光、意味論、空間、物理的な行動も含みます。そしてそのすべてはまだ夜明けの段階であり、AIの次のフェーズにあります。それがWorld Labsが取り組んでいることです。私たちは世界モデリングに取り組んでおり、その空間知能のレベルをAIの次の章に持ち込もうとしています。

リード:空間知能について2つ質問があります。一つは、どうやってわかるのかということです。なぜなら、ここで深く理解している人もいますが、多くの人にとってLLMの主な経験はChatGPTやGeminiなどのようなものだからです。彼らは何を理解すべきでしょうか。認知能力だけでなく、私たちの世界は言語だけではないという点で何が違うのか。そして二つ目は、前途にはどのような道が見えるのか。そこに到達するために克服すべき課題は何か。世界モデリングを手に入れたとき、私たちは何を得られるのでしょうか。

世界モデリングの可能性と課題

フェイフェイ:ええ。私たちはすでにその萌芽的な兆候を見ています。多くのストーリーテラーはクリエイティブであり、ピクセル、映画、彫刻、デジタルアートなど、多くのメディアを使っています。そしてそれは、言語だけでは表現できない非常に創造的でインタラクティブな世界です。

世界モデリング、つまり自分が没入でき、インタラクトできる世界を生成する能力を生成することは、クリエイターにとって非常に魅力的でエキサイティングです。これは娯楽やストーリーテリングだけのものではありません。デザインのためのものかもしれません。産業用途にも使えるかもしれません。医療、医学、教育にまで及びます。

また、受動的に娯楽を受けることと、体験に積極的に参加することの距離は、今急速に縮まっています。そして、そのような没入的な体験を可能にする世界モデルを機械に作らせる能力は本当に強力です。

そしてそれはシミュレーションにもつながります。シミュレーションは人間の体験や人間の学習にとっても、エンボディドAIにとっても本当に重要です。ロボットは実世界から学ぶのと同じくらい、シミュレーションから学ぶ必要があります。自動運転車を含むロボットの歴史や、シミュレーションが果たしてきた重要な役割について、本当に深く話し合うことができます。

ですから、応用は本当に無限です。課題は何か。一つの課題を挙げましょう。実際には多くの課題があります。一つの課題はデータです。言語の場合と違って、データはインターネット上至る所にあります。世界モデリングに関しては、データは言語に比べて明白で簡単に入手できるものではありません。

もちろん、ビデオデータがあります。それは世界モデリングにとって最も重要なデータ形式の一つです。しかし先ほど言ったように、世界は非常にマルチモーダルです。非常に空間的です。基本的な3D情報、幾何学、物理学、動力学を持っており、それらのいくつかは簡単には入手できません。

リード:明らかにロボット工学について多くの議論がありましたが、私たちが皆のために線を引くべきだと思うことの一つは、世界モデリングがあらゆる種類のロボットによる仕事と人間の状態の向上にどれほど重要であるかを理解することです。この認知セットがそこでなぜそれほど重要なのか、少し話してもらえますか。

フェイフェイ:素晴らしい質問ですね。私はそれについて多くの時間を費やして考えてきました。なぜなら、率直に言って、ImageNetの後、コンピュータビジョンの第一波が一定レベルの忠実度と品質を達成した後、私は実際に少し危機に陥り、知覚とは何か、ビジョンは何のためにあるのかについて魂の探求を始めたからです。物体認識の問題に取り組むのに100年かかると思っていましたが、思ったより少し早く進みました。だから、別の北極星が必要でした。

それは私を進化に立ち戻らせました。私は進化について多くを読み始め、哲学的な文献も少し読みました。リードに比べれば私は本当にこれくらいの哲学の学生です。約5億3000万年前にカンブリア爆発と呼ばれる信じられない進化的イベントがありました。動物の種分化が爆発的に起こり、神経系の始まりでもあり、光感受性細胞の始まりでもありました。

多くの文献を読んで考えた結果、本当に私にとって明らかになったのは、動物が知覚を持つ進化的な理由は、実際には活動のため、相互作用のためだということです。それは能動的です。受動的ではありません。つまり、知覚と知覚的知能は運動の基礎であり、運動の始まりは非常にシンプルです。体をどこかに移動させるだけです。

すぐに運動ははるかにインタラクティブになります。食べ物を求めて戦うことから、交配、巣作り、子育てまで、もっと深いものになります。哺乳類や人間を見てください。私たちの動く能力は非常に複雑です。指、つま先、体幹の間にある自由度は非常に高いです。

そしてこれらすべては、私たちがいる世界に対する根本的な知覚的空間的知能を必要とします。そうすることで、私たちは理解し、すべての動きを計画できます。ですから、私の意見では、微妙で複雑な空間的世界理解のレベルこそが、ロボットを含むエンボディド知能の脳なのです。

リード:ええ、そうですね。実際、ロボットにはそのエンボディド知能が必要だという特定の感覚を与えますが、すべてがエンボディドされるわけではありません。もちろん、ヴィトゲンシュタインに関するあなたの冒頭のコメントのように、少し哲学的になって前を見ると、純粋に言語的ではない実際の認知的推論能力の問題もあります。これは少し哲学的で先を見ています。

フェイフェイ:それが好きです。

リード:しかし、空間知能で得られるものの一部は、そこでも重要となる他の形態の知能です。純粋な知覚-行動ループだけではありません。なぜなら、知覚がカメラで行動が別だという古い西洋の考え方は明らかに間違っているからです。それはあなたが言及していたことですね。

しかし、それはまた、私たちの認知能力や、私たちが世界をどのように想像するか、頭の中でどのようにモデル化するかを高めるでしょう。ロボットだけでなく、すべてのAIシステムに空間知能を追加したときに、出てくると思われる推論の特性は何ですか。

フェイフェイ:素晴らしい質問です、リード。だからこそ私はあなたと話すのが好きなんです。人類の文明全体を通じて、人間が文明を築くマイルストーンを見ると、言語だけでは到底達成できないマイルストーンが多くあります。空間と空間的推論、世界モデリングの微妙さは非常に明確です。

例えば、初期のピラミッド建設を見てみましょう。幾何学を抽象化し始める能力、幾何学の感覚、そして大きな構造物の建設。そこには、この単純な取引的な行動、つまり何かを見てそれを動かしたいという行動ではない、多くの認知的空間的推論が関わっています。

もう一つ例を挙げましょう。DNAの構造の推論です。DNAがどのように発見されたかの歴史を知っているなら、もちろん多くの科学者が、今日の言葉を使えば、私たちの遺伝の基本的な構成要素に何かがあるという予感を得ていました。しかし、それにはロザリンド・フランクリンという過小評価されている科学者が、DNA分子のX線画像、X線かそのような画像撮影技術を使う必要がありました。平面画像上に十字のように見えるX線です。

しかし、フランシス・クリックとジェームズ・ワトソンは、もちろん彼らはこれについて深く考えていました。しかし、この画像から3Dの二重らせん構造に至るには、深い空間的思考が必要です。この推論に言語で到達することはできません。もちろん言語も参加したと確信しています。私は言語に反対しているわけではありません。

リード:私も言語を話しますし、言語支持派です。

フェイフェイ:まさに、その通りです。しかしこれは、人間が空間的推論と認知能力を使って、これまで一度もしたことのない何かを発見する美しい例です。ですから、AIにこの能力を与えることで、これは単にグラスや立方体を拾うことができるロボットのためだけではありません。

これは人類全体の能力を高めるためのものです。なぜなら、私たちはこの能力を持つ機械と協力できるからです。

リード:素晴らしい。実は私はあなたからDNAの答えを聞いたことがなかったので、これまで聞いたことのない質問をするのが好きなんです。それが素晴らしいことの一つです。

AIの未来と信頼の構築

リード:一般的なことに話を移すと、明らかにAIが過大評価されているか過小評価されているかについて多くの議論があります。私たちは明らかにバレーにいるので、バレーの誰もがほぼ過小評価されていると考えています。AIの冬を再び経験するのか、という質問についてのあなたの見解は何ですか。この議論について、AIで何が起こっているかについて何を言いますか。これは過小評価されている部分です。これらは少し早すぎるかもしれない部分です、過大評価と比べて。現在の議論で賢者へのガイドは何でしょうか、小麦ともみ殻を少し選別することについて。

フェイフェイ:ああ、私はこの質問にどう答えるか気をつけなければなりませんが、完全に理解しています。AIは文明的な技術です。私だけがこれを言っているわけではありませんが、本当にそう信じています。なぜなら、人間と進化に触発されたとしても、これは知的に考え、行動する能力であり、人間にとって基本的なものだからです。そしてそれができる技術は驚異的です。

私の意見では、人類の知的な未来として過大評価されているわけではありません。なぜなら、AIは新しいコンピューティングだからです。今日の世界を見て、チップがある場所を認識してください。なぜなら、チップはコンピューティングが行われる物理的な場所だからです。電球から自動運転車、飛行機まで、至る所にチップがあります。

チップがあるところにはコンピュートがあります。コンピュートがあるところにはAIがあるでしょう、まだなければ。その観点から、ビジネスとユースケースの観点の両方から、AIは明らかに未来です。

誇大宣伝に関しては、少しニュアンスを持つ必要があると思います。例えば、本当に、舞台裏で話していたと思いますが、セバスチャン・スラン氏の最初の自動運転車が、交通のないネバダ砂漠で130マイル運転できるようになってから、サンフランシスコでWaymoが走るようになるまで、20年以上かかったんです。

まあ、あなたは言うかもしれません、ソフトウェアの一部だからディープラーニング時代以前で、ソフトウェア開発が遅かったと。その通りです。確かにディープラーニングは自動運転車の頭脳を加速させました。しかし、自動車産業、サプライチェーン全体、そして顧客の使用基盤が100年以上にわたって確立されてきたことも忘れないでください。それは非常に成熟したビジネスモデルであり、非常に成熟したインフラと製造とすべてです。

ですから、もし単純な形のロボットである自動車を路上に出すだけで20年かかったのなら、ルンバもありますが、私は彼がそう言うと思っていました。はい。ルンバはミニカーです。はい。

ルンバは実際には、文字通り2D表面を動く四角い箱で、唯一しなければならないことは何にも触れないことです。なぜなら触れたら大変なことになるからです。ロボットは触れますが、概してそれで大丈夫です。

しかしロボットについて重要なことは、それは3次元の機械であり、その全体的な目標は物に触れることです。そして正しい方法で触れることです。これは巨大なことです。ですから、ロボティクスにはまだ道のりがあると思います。間違いなく100%です。

リード:この文明的技術を実現するために信頼を構築することです。それは技術者、企業などを通じてです。信頼を構築するために、リーダーとして、企業として、起業家として私たちがすべきことは何だと思いますか。なぜなら、明らかに私たちはそこに到達して初めて本当の利益を実現し始めるからです。

フェイフェイ:素晴らしい質問ですね。私とあなたの両方がこれを気にかけていることを知っています。私が強く感じていることの一つは、AI時代において、信頼を機械に外注することはできないということです。信頼は根本的に人間的なものです。個人レベル、コミュニティレベル、社会レベルでのものです。

だからこそリードは、スタンフォードの人間中心AI研究所の支援者の一人だったんです。私たちは2018年にそれを設立しました。この最新のAIの波が花開く前からです。なぜなら、私たちは機械がコンピューティング、推論、そして最終的には行動可能な能力においてより強力になるにつれて、新しい規範を確立する必要があることを認識していたからです。

それは社会の構造の一部である必要があります。この規範の中で、人間はAIのような新しいツール、チャットボットやその他のもののようなより強力な製品と互いに信頼を構築する主体性を持ち続けます。そして最終的に、この信頼は私たちのガバナンスモデルに更新または更新される必要があります。コミュニティや企業のガバナンスだけでなく、社会全体のガバナンスにも。

ですから、信頼は非常に重要な要素だと思います。この聴衆は起業家が多いですが、最初からこれを気にかけてくださいと言いたいです。あなたがどんな製品やビジネスをしていようとも。あなた方の中には医療に携わっている人もいるでしょう。それがどれほど重要かわかっていますね。

あなた方の中には、インフラ、SaaS、その他何かのアプリケーションだけに携わっている人もいるかもしれません。それはもっと遠い存在だと感じるかもしれませんね。それは真実ではありません。なぜなら、あなたは人々にサービスを提供しているからです。ビジネスにサービスを提供しています。信頼は本当に重要です。信頼の源として人間の主体性を持つことです。

リード:100%です。そしてあなたとエッチが人間中心AIで主導していた仕事の一部、それはあなたのニューヨーク・タイムズのコラムから来たもので、その命名の一部でもあります。それが私を主体性に焦点を当てることに導いた一部です。人間の主体性の向上は、私たちがすべき重要なことの一つです。

あなたと話すのが大好きなことの一つは、私たちは文字通り何時間でも話し続けることができるということです。残り時間はわずか数分しかありません。しかし、アンビエント・インテリジェンスとか、それが医療にとって何を意味するかとか、OGとしてのすべてのことの一部として、あらゆるテーマについてあなたは深く入り込むことができます。

大胆さと創造性の解放

リード:では、科学の側面に行きましょう。おそらく締めくくりの質問として、あなたは科学者が知的に大胆であることが重要だと言いました。では、それは未来を発明することについてどう考えるべきかという点で何を意味しますか。科学はどのように進歩すべきなのか。次世代のイノベーターにとって、大胆さはどこに作用すべきなのか。

フェイフェイ:素晴らしい。その質問をしてくれてありがとう。もし科学者が大胆である必要があるなら、起業家はもっと大胆である必要があると思います。大胆さ、私はこの言葉が大好きで、実際これは私が採用を行う際の基準の一部でもあります。特に若い人たちの中にその大胆さを持っている人を探しています。

大胆であるということは、自由であるということです。自分の創造性、勇気、そして物事をやり遂げる能力を制約する足かせから解放されることです。

言葉遣いが悪くて申し訳ないんですが、これは実は専門用語なんです。

リード:はい。

フェイフェイ:実際、これは私たちの会社の核となる文化の中にあるものです。つまり、人間は地球上で最も速く、最も強い動物ではないですよね。多くの側面を見ると、私はこの夏アフリカに子供たちと一緒にいましたが、私たちよりもはるかに優れている動物がたくさんいます。

リード:私もそう感じますし、たくさんいますね、はい。

フェイフェイ:しかし、私たちの脳、心、魂の中には、世界のため、自分自身のため、お互いのために信じられないことを成し遂げることができる何かがあります。その多くは、私たちの創造性という根本的な独自性と、コミュニティの感覚から来ています。そしてこれらすべて。

それを解き放つために、特にテクノロジーが非常に速く動いているので、私にとって基礎的な感情的基準は、創造的であること、自由であることです。そしてそれは大胆であることに変換されます。不確実性に飛び込んでください。まだ誰も実現していない大胆なアイデアに飛び込んでください。逆説的な仮説に飛び込んでください。困難な課題に飛び込んでください。

誰かが言っていました、誰が言ったか忘れましたが、非常に確実な簡単な課題と不確実な課題は、時に同じくらい難しいと。不確実なものを選んでください。なぜなら、あなたの創造性がより一生懸命働くからです。そしてそこで魔法が起こるのです。

ですから、私は大胆という言葉が好きです。なぜなら、そこで境界が破られ、創造性が解き放たれ、魔法のようなことが起こるからです。

リード:これで、なぜ私たちが最初のファイアサイドをフェイフェイと開きたかったかがわかるでしょう。拍手を送りましょう。ありがとうございます。

フェイフェイ:ありがとうございます。

リード:Masters of Scale Summitに参加してくれたフェイフェイ・リー博士に感謝します。この対談は、サンフランシスコのプレシディオ劇場のステージ上で録音されました。

コメント

タイトルとURLをコピーしました