メタの人工超知能への賭けについてアレックス・ワンが沈黙を破る

AIニュース
この記事は約55分で読めます。

メタのAI部門のトップに就任したアレックス・ワンが、10ヶ月の沈黙を破りポッドキャスト「Core Memory」に登場したエピソードである。Scale AIからメタへと移籍した経緯や、マーク・ザッカーバーグとの対話、そして新たに発表されたAIモデル「Muse Spark」について語られている。また、メタにおける超知能(スーパーインテリジェンス)へのアプローチや、オープンソース戦略、AIの安全性、さらにロボティクスやブレイン・コンピュータ・インターフェース(BCI)といった未来の技術に向けた壮大なビジョンまで、メタのAI戦略の全貌と彼自身の個人的な信念が明かされる内容となっている。

Alex Wang Breaks His Silence On Meta's Superintelligence Bet
Alex Wang has barely said a word in public since Mark Zuckerberg paid a fortune to bring him in and put him in charge of...

ゲスト紹介とメタ入りの経緯

さてカイリー、今週も大物ゲストをお迎えしています。メタの人工知能部門のトップであるアレックス・ワンです。約10ヶ月前までは、Scaleの創業者であり共同創業者兼CEOでした。メタが会社を事実上半分買収し、アレックスを完全に迎え入れたわけですが、それ以来彼は証人保護プログラムのように身を隠していて、今日のこのCore Memoryポッドキャストに出演するまで、彼の姿を見ることはほとんどありませんでした。

ええ。どうしてこんなことが実現したのか正確にはわかりませんが、彼がここにいます。きっといろいろなことを話してくれるでしょう。彼らは新しいモデルをリリースしたばかりなので、その辺りの話も聞けると思います。それに、彼らがAIに関して哲学的にどの位置にいるのか、私にとっては少し謎だったんですよね。彼がScaleにいた頃、彼らは常に自分たちをスイス(中立国)だと言っていました。彼は特定の事柄については声を大にして語っていましたが、AIそのものやそれについてどう感じているかについては、必ずしもそうではありませんでした。メタは昨年、何百万ドルもかけて人材を採用し、このチームを構築して大きなニュースになりました。皆、彼らがこの膨大なリソースを使って何をするのか待ち望んでいたのです。だから今日は、採用のスープの話や、数百万ドルの話も聞けるでしょう。いよいよですね。アレックス・ワンが姿を現しました。

最高ですね。私はアシュリー・ヴァンスです。

そして私はカイリー・ロビンソンです。これはCore Memoryです。

アレックス、来てくれてありがとうございます。

ええ、ここに来られて興奮しています。メタでの出来事の前に、少しテキストのやり取りをしていましたよね。奇妙なカントリーミュージックのテキストチェーンが確実に続いていました。それに、ナット・フリードマンのことも昔から知っていますから。

そうですね。そしてあなたたち二人が姿を消して、タコツボに潜ってしまったように感じていました。

はい。

そこでとても静かにしていたかと思えば、今度は新しいモデルを引っ提げて現れたわけです。

ええ。

姿を現しましたね。しかし、あなたたちはしばらくの間とても静かでした。

ええ、私たちにはやるべき仕事がたくさんありました。フロンティアモデルをゼロから9ヶ月で構築するというのは、本当に骨の折れる努力が必要だということがわかりました。でも、皆さんが私たちがリリースしたMuse Sparkを使ってくれているのを見るのは本当にエキサイティングです。さらに優れたモデルも仕込んでいます。だから、とてもワクワクしています。

あなたはサンフランシスコの象徴のような存在だったと思います。そして今はメンローパークで働いているんですよね。サウスベイに引っ越さなければならなかったのでしょうか?

ええ、引っ越しました。

完全にコミットしているわけですね?

完全にコミットしています。私にとっての今の街はパロアルトです。ユニバーシティ・アベニューを歩いて、ボバ(タピオカティー)を買いに行きます。

メタの超知能ラボの組織体制

これについて気になっていたのですが、配置はどうなっているのでしょうか?私が一番よく知っているのはあなたと、ナット、ダニエル・グロスです。ザックとは一度か二度しか遊んだことがありません。あなたたちがどのように配置されているのか、状況を把握しようとしているのですが。

基本的に全体の組織はメタ・スーパーインテリジェンス・ラボ(MSL)と呼ばれていて、私が全体を統括しています。そして、その中にいくつかの部門があります。
まずTBDと呼ばれる部門があり、これが大規模モデルの研究ラボです。少し悪名高いかもしれませんが、そこには多くのトップクラスの研究者やインフラストラクチャエンジニアが所属しています。彼らは技術的には全員私に報告する形になっています。これが一つの体制です。
それから、プロダクトおよび応用研究、略してPARと呼ばれるグループもあります。これはナット・フリードマンが率いています。彼らは私たちが構築するすべての製品と、これらの素晴らしいモデルを実際に世界へ展開する責任を負っています。
そして、メタ・スーパーインテリジェンス・ラボ全体の傘下にはFAIRも含まれており、ここでは探索的でエキサイティングな研究を継続して行っています。私は特に彼らの科学研究の多くに期待しています。私たちは、AIモデルを使って脳を理解したり、計算化学を理解したりと、非常に素晴らしい研究成果を示してきました。原子のユニバーサルモデルも構築しました。
これらがメタ・スーパーインテリジェンス・ラボを構成する要素であり、私が全体を統括しつつ、TBDラボにも非常に実践的な役割として関わっています。そしてダニエル・グロスはメタ・コンピュートの指揮を支援しています。これは長期的なインフラ計画に特化しており、この非常に大胆な試みに必要なGPUインフラやデータセンターのインフラを確実に構築できるようにするためのものです。彼がそのトップを務め、私たちと緊密に連携しています。

この仕事に就く前、そのグループの中で誰を一番よく知っていたのですか?

ナットとダニエルのことは実は昔から知っています。ナットはScaleでの私の最初のエンジェル投資家の一人でした。私がY Combinatorを修了する前にScaleに投資してくれて、何年にもわたってアドバイスをくれていました。ダニエルともごく初期に出会い、何年にもわたって親交を深めてきました。
それから、MSL全体の科学的なアジェンダの監督を支援してくれているチーフサイエンティストのシェンザもいます。MSLを立ち上げる前から彼のことは知っていましたが、彼が加わってからさらに親しくなりました。

マーク・ザッカーバーグとの会談

非常に気になっているのですが、大きく話を戻すと、あなたが身を潜め、会社が完全に変わり、そして今メタにいるという状況になってから10ヶ月が経ちました。その経験はどのようなものでしたか?取引はどのようにして行われたのでしょうか?タホ湖に行ってザックと話をした経緯など、最初の会議がどのようなものだったのか教えていただけますか?

マークとはもう何年来の知り合いです。私がScaleを経営している時でさえ、彼は自分の時間を惜しみなく使ってくれて、彼からたくさんのアドバイスをもらうことができました。彼は明らかに非常に経験豊富な創業者であり、ある意味で究極の創業者とも言える存在です。
私たちは何年も前からお互いを知っていて、このAIブームが起こるずっと前からAIについて話し合っていました。Scaleでは2016年からAIに取り組んでいましたからね。当時は主に自動運転が中心で、その後テクノロジーの様々な変遷がありました。
そして文字通りほぼ1年前のことですが、私たちはもっと緊密に協力できる方法がないか探り始めました。特にその時点でマークはますますAGIに目覚めており、AIがメタを完全に変革することを確信していただけでなく、AIが一生に一度の変革をもたらすテクノロジーの一つであることを深く理解していました。だからこそ、彼は非常にAIに注力し、そこに大きく賭けたいと考えていました。
同時に、これは彼も公に話していることですが、LLaMAはそれ以前の時点では、彼らがそのような賭けを続けるために必要な軌道には乗っていませんでした。そこで私たちは、どのようにもっと緊密に協力できるか、それがどのような形になるかについて、非常に高いレベルで話し合っていました。もちろん、それは非常にオープンエンドな質問であり、こうした場によくあるオープンエンドなブレインストーミングのセッションでした。
そしてそれが、Scaleにとってもメタにとっても良く、私たちが非常に緊密に協力して現代で最も重要なテクノロジーを構築でき、しかもお互いが本当に誇りに思えるものを構築しているという確信を持てるような方法で実現できる、非常に興味深い領域に落ち着いたのです。彼は約1年前にパーソナル・スーパーインテリジェンスに関するメモを公表しました。その後、私たちはもちろん静かにしていましたが、そのメモは私たち二人にとっての北極星のようなものです。
私たちは、このテクノロジーを人々に力を与える方法で構築したいと考えています。世界中の可能な限り多くの人々がアクセスでき、可能な限り民主化され、誰もが自分自身を表現し、誰もが主体性を高め、誰もが創造し、構築できるようにするものです。それこそが、私たちが目指して取り組みたい世界なのです。

トップ企業への移籍とパラダイムの転換

しかし私はずいぶん前にあなたの記事を書いたことがあります。かなり昔からあなたのことを知っていますよね。たしか2021年だったと思います。そこには様々な伝説があり、あなたは最年少の自力で億万長者になった人物で、注目の的でした。Scaleは非常に著名な会社であり、あなたはAIがどこへ向かうかについて先見の明があるという評判を持っていました。
私があなたと話す時、Scaleはあなたのアイデンティティの一部でした。非常に著名な会社の創業者であることと、たとえ重要な役職であっても8万人もの従業員を抱える企業で役割を引き受けることとは、まったく異なることです。本当に驚きました。莫大なお金が絡んでいるのでなるほどとは思いますが、あなたの人となりを知っている範囲では、あれは大きな転換だったので、相当な説得があったに違いないと思いました。

ええ。まったく違いますね。本当にまったく違います。このプロセス全体を通して私が考えていたことの多くは、AIの周辺にいる誰もが思っていることですが、進歩が私が長い間予想していたよりもずっと速く起こっているということです。
このAIモデルの加速する進歩の中で、いくつかのことが本当に頭に引っかかり始めました。一つは、AIモデルを構築する人々が、そのモデルの周辺でさらに多くのものを構築するための、いわばより大きな権利、あるいは経済的および製品的な権利をますます持つようになっていると感じたことです。そしてそれは実際にますますその通りになっていると思います。初期にはエコシステムがどう展開するかについて様々な議論がありましたが、モデルの改善スピードと研究のペースがあまりにも速いため、多くの意味で、モデルを構築している場所にいることが、エコシステムの中で最もエキサイティングな場所の一つになっているということです。
そして二つ目は、この次のフェーズのテクノロジーの大部分が、本当にコンピュートに帰結するということです。大量のコンピュートがあれば、モノを構築し、大きな賭けに出て、製品を展開し、コンピュートがなければできないようなことができます。これはハイテクエコシステムに興味深い階層化をもたらすと思います。現在、私たちはある意味ですべてのテクノロジー企業を同じように考えていますが、実際には、大量のコンピュートを持つ企業と持たない企業は全く異なるものとして考えるべきです。なぜなら、コンピュートを持つ企業には構築できて、持たない企業には構築できないものが存在するからです。それがこの非常に興味深い力学を生み出しています。
メタでの機会が非常にエキサイティングだった理由の一部は、第一にマークがAIに全力で取り組み、非常に大きく賭けており、極めて大胆なリーダーであり戦略家であることです。しかし同時に、私たちが膨大な量のコンピュートを使って構築できる環境が整えられたということもあります。適切な研究努力と適切な製品開発への努力があれば、私たちは世界に真の大きなインパクトを与えることができる能力を持っているのです。

大規模な人材採用と組織の再構築

メタには膨大なコンピュートがあり、素晴らしい才能を大量に引き抜きましたね。私は当時の報道の狂騒劇の一部に関わっていましたが、あのようなことは今まで見たことがありません。多くの人々が加わってから10ヶ月が経ちました。どのような感じでしたか?どのような課題がありましたか?そして、メタでこの全く新しいチームを持つことの何が最もエキサイティングでしたか?

私がメタに入った時、適切な軌道に乗るためには取り組みの再設定とAI部門の再構築が必要であることは明らかでした。なぜなら、結局のところLLaMAは同じ軌道に乗っておらず、私たちはフロンティアに遅れをとっていたからです。そのため、フロンティアに追いつき、うまくいけば追い越すことができるよう、非常に速いスピードを出せる計画を立てる必要がありました。

具体的には、どのような問題があったのでしょうか?

おそらくより根本的な問題は、多くのトップラボが、超知能は到来しつつあり、それは非常に近づいており、私たちがそれを創造し生み出せると信じるのは非常に現実的であるという前提の周りに組織全体を構築しているということです。そして、ラボの計画全体、ビジネス、注力すべきことを、その根本的な信念を中心に構築します。
それが最初のステップの一つでした。つまり、超知能を真剣に受け止め、その中核となる前提を中心に、他のすべての仮定を再構築し始めるということです。それがいくらか根本的なことだったと思います。

つまり、彼らにはあるレベルでこれに対する宗教的な確信が欠けていたということですか?

ええ。そして、これは大企業の多くの人々にとって比較的よくあることだと思います。彼らはその確信を必ずしも持っていません。考えてみれば、それは少し構造が異なるからです。大企業にはAIに取り組む非常に賢い人々がいますが、スタートアップとは少し異なります。スタートアップは、超知能が来るというこのクレイジーなアイデアとともに、新しい取り組みをゼロから始めたようなものですから。
今はもうそれは問題ではないと思います。言うまでもなく、現在のMSL(メタ・スーパーインテリジェンス・ラボ)は、名前に示されている通り、超知能が来るという概念を中心に構築されています。この取り組みのために私たちが掲げた原則がいくつかあり、それが解決しなければならなかった課題への答えになると思います。
一つ目は、超知能を真剣に受け止めること。二つ目は、技術的な声が最も大きな影響力を持つこと。三つ目は、科学的厳密さ、つまり基本に焦点を当てること。そして、大きな賭けに出ることです。
私が始めた時のTBDとMSL全体のコンセプトは、信じられないほどのスピードを持ち、フロンティアに追いつき、潜在的にそれを追い越すことすら可能にするラボの形とは実際どのようなものか、ということでした。そして、それが可能だと感じる3つの方法に行き着きました。
一つ目は、研究者一人当たりのコンピュートをはるかに高くすることです。大規模なラボの多くは大量のコンピュートを持っていますが、それが様々な方向に分散してしまうため、個々の研究者の研究スピードを実際には妨げてしまいます。もし研究者一人当たりのコンピュートが高い小規模なチームでより焦点を絞った取り組みを構築すれば、実際にはるかに速く研究を進めることができます。
二つ目は、人材の密度です。人間の組織は常にこの教訓を学び直しているように感じますが、全員が卓越した小規模なチームは、責任がより分散していて、より混然一体となった大規模な組織よりも、常に速く動くことができます。
そして最後は、非常に野心的な研究への賭けです。これは業界で非常によく同意されていることだと思いますが、非常に大きく、非常にリスクが高いものの、もしうまくいけばパラダイムを完全に変え、現代のAIの構築方法を完全にシフトさせるような研究への賭けが明らかに存在します。だからこそ、もちろん非常に競争力のあるフロンティアモデルに向けて構築することに加えて、私たちのリソースとコンピュートの膨大な部分をこれらの大きく野心的な賭けに割り当てています。なぜなら、それらが成功すれば、将来的に信じられないようなモデルを私たちにもたらしてくれるからです。

スポンサーメッセージ:Brex

Core Memoryで私たちがやっていることは何でしょう?私たちは革新的で、動きが速く、未来志向の企業を取り上げています。だからこそ、Core MemoryはBrexのスポンサーでお送りしています。Brexはこうした企業の多くにとってのインテリジェントな財務プラットフォームだからです。スタートアップから世界最大の企業まで、3万社の企業が自社の財務をBrexに依存しています。彼らにはスマートな法人カード、高利回りのビジネスバンキング、そして素晴らしい経費自動化ツールがあります。
私は経費精算をするのが大嫌いです。しかし、BrexのAIソフトウェアはそれらの経費を処理し、私たちがどこでお金を使っているかを把握し、多くのことを代行してくれるので、自分で時間を無駄にする必要がありません。brex.com/corememoryにアクセスして詳細を知り、このプログラムに参加してください。さあ、始めましょう。この時代遅れの財務ソフトウェアから抜け出し、未来へ進みましょう。Core MemoryとBrexです。

エージェント経済とメタのビジョン

いつも話題になることの一つに、これらのラボが互いに飛び越え合い、皆同じようなものを提供し始めているという点があります。そしてあなたもフロンティアに向かって競争していると話しています。また、あなたたちが採用した人々について、これまでに見たこともないような本当に常軌を逸した給与だと報じられていたことも気になっています。では、あなたが語るこのパラダイムにどのように到達しようとしているのでしょうか?具体的にどのようなパラダイムを達成しようとしているのですか?

大胆な研究の賭けがいくつもあり、そのすべてを詳細に説明することはできませんが、一つの根本的な問題は私たちが何を気にかけているかということだと思います。パーソナル・スーパーインテリジェンスというアイデアに沿って、私たちは消費者に力を与えることができるエージェントの構築を本当に重視しています。世界中の何十億もの人々に力を与え、同時にビジネスにも力を与えるのです。
ご存知のように、メタは信じられないようなエコシステムを持っています。誰もが知っているように何十億ものユーザーがいますが、それだけでなく、メタを利用してビジネスを運営している何億もの企業が私たちのプラットフォームには存在します。だからこそ、私たちは、プラットフォーム上のすべての消費者とビジネスの両方に力を与え、彼らを可能にする非常に強力なエージェントを構築し、この新しいエージェント的エコシステムを構築するという未来に向けて開発することに多大な関心を持っています。
私たちはそれがどのようなものか、そのためにどのような機能が必要かについてよく考えています。その軌道上には、本当に重要な多くのサブコンポーネントがあります。例えば、優れたエージェント機能を持つ必要があります。また、構築する必要があるものの多くはソフトウェアであるため、優れたコーディング機能を持つ必要があります。優れたマルチモーダル性も必要です。これらが私たちに必要な根本的な要素の多くを形作っています。
そして、長期稼働するエージェントに関するより大きな問題を数多く解決する必要があります。記憶の課題をどう考えるか。長期稼働するエージェントをどう構築するか。ユーザーの代わりにますます複雑なタスクを実行できるエージェントをどう構築するか。これらは私たちが多くを考えているハイレベルな要素の多くです。

傭兵的という批判とラボの文化

しかし、あなたが会社内にこの超知能の宗教を築き上げようとしているとすれば、この体制は、OpenAIやAnthropicを始めるのとは全く異なります。先ほど話されたように、彼らはゼロから構築され、アイデンティティを持ち、時間とともにそれが形作られてきました。
部外者からの見方では、あなたたちがやったことはずっと傭兵的に見えます。さあ行くぞ、君たちはお払い箱だ、高額な報酬で人々をかき集め、彼らを連れてくるぞ、という感じで。それは、Grokが立ち上がった時のことを思い出させます。イーロンがイーロン流にとにかく誰よりも大量のコンピュートを手に入れるぞ、そして核となるチームを作ってそれを中心に構築するぞと言っていたような。それでも彼らは追いついたように感じましたが、特に人々の心の中やブランドの面では、脱出速度には決して達しませんでした。だから、あなたが話しているような要素のいくつかを金で買うのは難しいことのように思えます。

これは外部の認識と内部の日常の現実との間にある、より大きなナラティブの矛盾、あるいは違いの一つだと思います。あなたが話しているような印象を抱いている人は実際多いと思います。その多くは報道や、その出来事がどのように伝わったかによって形成されています。報道の多くは様々な意味で誇張されていましたが、それがすべて湧き上がってきたのです。
その理由の一つは、私たちが採用を非常に迅速に行ったからです。私が入った時、素晴らしいモデルを作りたければ、昨日の時点でチームを持っていなければならないことはわかっていました。だから私たちはただ猛進し、非常に素早く実行しなければなりませんでした。
しかし、ラボ内の文化は実際には非常にスタートアップ的です。この雰囲気を作り出した要素はいくつかあると思います。一つは、これがメタ内にある完全に新しく構築されたチームだったということです。
そして、ラボの文化について言えば、私が話したこれらのことに誰もが非常に惹かれ、興奮していました。人々が参加したのは、研究者一人当たりのコンピュートが高いため、以前いた場所よりも多くの進歩を遂げられる可能性があったからです。また、人材の密度が素晴らしかったからです。比較的小規模でありながら真に卓越したグループであり、私たちが彼らにリソースと非常に大胆な研究の方向性を追求する自由を与えるつもりであることを人々は見ていました。
だから、研究者たちがただお金を動機にしていると考えるのは間違った思い込みだと思います。実際、彼らの多くにとって、以前いた場所に留まることの経済的な見通しも非常に強力なものだったのです。だから、外からはそのように見えたかもしれませんが、お金が主な動機ではありませんでした。
主な動機は、ゼロから構築する機会があり、大量のコンピュートを持ち、彼らの非常に野心的な研究の方向性にアプローチする能力を持ち、そして肥大化していないと感じられるグループでそれを行えるということでした。その結果、雰囲気や文化はずっと健全なものになっています。実際に、他のラボからこのラボを訪れた多くの人が、その雰囲気が初期のOpenAIや初期のAnthropicを思い出させるとよくコメントしています。ある意味で、私たちは取り組みとして今生後10ヶ月のようなものですから。

リクルート時のスープ騒動

ちょうどマーク・チェンがこのポッドキャストに出演して、この採用戦争中のスープ騒動について持ち出したので聞きたいのですが。これは本当ですか?ザックがスープを作ったんですか?あなたが人材を引き抜くためにスープを作ったんですか?

私たちがそのスープを作ったかどうかはわかりませんが、ザックが作ったとは聞いています。でも本当のところはわかりません。私たちがこのスープを作ったかどうかは知りませんが、私たちがそうだったというのは事実だと思います。このラボを構築する前提の一部は、私たちがこのテクノロジーを本当に本当に気にかけていて、彼らの具体的な研究の方向性や彼らが取り組んでいることを気にかけていると、全員に示す必要があったということです。
それは非常に個別化された採用プロセスでした。同時に、私たちが構築したチームを私はとても誇りに思っていますが、私たちが本気であることも人々に知ってもらわなければなりませんでした。デフォルトでは、多くの人がメタのAIの取り組みについてどう考えればいいかわからなかったり、私たちのことをあまり知らなかったりしたと思います。
だからこそ、人々のところへ行き、話をし、私たちが何を構築しているか、何に焦点を当てているか、なぜ私たちがテクノロジーを気にかけているか、それで何をしたいかを説明することに多大な労力を費やしました。それはとても重要なことでした。

人間関係の軋轢と業界の成熟

この話題の後は次へ進みます。採用の話ばかり長引かせたくないのですが、あなたがScaleにいた時も同じように、皆があなたのことをAIのスイスと呼んでいました。あなたは誰もが知っていて、物事の中心にいて、しかしこの移籍は個人的な代償を伴ったように感じます。あなたとサム・アルトマンはかつてルームメイトでしたよね。あなたが番組に来ることをサムにテキストで伝えたのですが、彼はあまりお世辞にも良いことを言いませんでした。だから、このような状況はどうしても起きてしまうものですね。

ええ、こういうことの一部は残念なことだと思いますし、私の正直な期待としては、超知能に近づけば近づくほど、一人の人間としての私の心からの願いは、この業界の様々な人々の間に存在するすべての敵意が時とともに和らいでいくことです。もちろん今起きている他の事柄に関しても非常にタイムリーな話題ですが。そして、人々が団結し、私たちはこの信じられないほど重要なテクノロジーを構築しているのだから、それを構築するにあたって私たち全員が本当に深く考えることが重要だと気付いてほしいと思っています。
私が自分の責任だと感じていることの一つは、私たちが開発するテクノロジーとその展開方法が、可能な限り思慮深いものであることを保証することです。あなたが採用に関して話したことのいくつかは、私たちが使命を持っていると信じてもらうことであり、単なる製品開発ではなく、自分自身の研究の使命を追求できるということです。

あなたはとても若いです。私たちはほぼ同い年で、それはとても面白いですね。そして私は億万長者ではありません。ヤン・ルカンは彼が去った直後、メディアに対して、あなたは若くて経験不足であり、もっと多くの人が去るだろうと語っていました。この巨大な企業でリーダーとして、そして非常に若いことに対して、それがどのように影響したか興味があります。それを読んだ時どう思いましたか?彼とは話をしましたか?

ええ、その数週間後にインドで彼に会いました。ヤンは注目すべき、非常に率直に物を言う人物であり、ヤンが何を考えているかは常に誰もが知っています。彼がそう言ったのは明らかですが、インドで彼に会った時、彼はMuse Sparkのローンチについて私たちを祝福してくれました。

あなたたちがXで仲直りしているのを見ましたよ。

ええ。本当に、私がさっき言った通りのことをしています。個人的な敵意はすべて、超知能に近づけば近づくほどなくなっていくと思います。

状況は悪化しているように見えますが。

そう見えますか?そうですね、悪化するかもしれないし、良くなるかもしれません。でも、私が確信を持っているのは、私たちがMSLをどのように設立し、どのような研究努力を行っており、どのような進歩を遂げているかということです。そして、私たちの研究者が行っている素晴らしい仕事と私たちが遂げている進歩を世界に示すのが楽しみです。

この点も長引かせたくはないのですが、これはあなたが直面し続けている課題なのでしょうか?メタでのこのような巨大な取り組みを率いるには、あなたは若すぎて経験不足だと人々が考えていること。また、あなたはエンジニアではないという批判も受けますよね。

おお、それは絶対に違います。昔々、私はシリコンバレーでソフトウェアエンジニアをしていましたから。

そういうのってムカつきませんか?

ええ、正直なところ、年齢の件については、私がシリコンバレーにいる間ずっと人々が言ってきたことです。だから、ある程度はもう気にすることすらありません。常にそこにあるものですから。
でも、AIの分野にいる多くの人々に対して、常に様々な誤った特徴づけや、人々が勝手なことを言ったり、世に出ている情報が常に正しいとは限らなかったりして、イライラすることはあると思います。でも私は、私たちがやっている仕事や世に出すものにそれを注ぎ込むことを選んでいます。繰り返しますが、私はMuse Sparkを本当に誇りに思っています。今仕込んでいるモデルにはさらに興奮していますし、準備している製品にも期待しています。だから、長い目で見れば、これらはすべてうまくいくと思います。

あなたは数学オリンピックの出身ですよね?シリコンバレーを取材してきた私の経験上、ああいうコンテストで優秀な成績を収める人たちは、コーディングやエンジニアリング、そしてこれらの問題について考えることに非常に長けている傾向があります。ただ、時が経つにつれて、あなたは一部の界隈ではScaleでのセールスマンのような、人生をエンジョイしているような評判を得ていました。だから、あの仕事を引き受けた時、人をこき使うのが難しくなるのではないか、あるいは全く違うものになるのではないかと思いました。

ちなみに、MSLでの私の経営哲学全般として、人をこき使うつもりはありません。スティーブ・ジョブズの素晴らしい言葉に、ほとんどの会社は人を雇って何をすべきか指示するが、我々は我々に何をすべきか教えてもらうために人を雇うというものがあります。それがTBDとMSL全体の理念の中核であり、私たちがそれをどのように構築してきたかということです。私たちは優秀な研究者を雇い、彼らがキャリアや人生における最高の仕事をするための最高の環境を整えるつもりでした。だから手短に言えば、私は誰かをこき使おうとしているわけではありません。研究者が素晴らしい仕事をするための最高の環境を作ろうとしているのです。

スポンサーメッセージ:SendCutSend

さて、ポッドキャストの友人の皆さん。SendCutSendについてお話しします。彼らは製造業における驚異です。あなたが自分の車をいじっていようと、巨大な自動車会社であろうと、ロケットメーカーであろうと、金属の切断、機械加工、曲げ加工が必要なら、SendCutSendに送ってください。彼らはそれを正しくやってくれます。しかも早くやってくれます。
sencutsend.com/corememoryにアクセスして、作ろうとしているものの15%割引を受けてください。私たちはSendCutSendが大好きです。今日彼らを訪問してください。

Muse Sparkの性能とモデルのスケーリング

Muse Sparkについて少し話しましょう。ここ数日、すべての資料を読み、モデルを少し触ってみて、メタであなたたちが何を達成しようとしているのか、その正確な立ち位置を理解しようとしていました。ベンチマークでは、あるものは良く、あるものは他のモデルに遅れをとっているように見えました。技術的なことで間違っていたら訂正してほしいのですが、あなたたちは他のモデルが持っていないかもしれない何らかの効率性の向上があったと感じており、そこを強調しているように見えました。
そして、あなたたちは取り組んでいる16のエージェントを使ったクレイジーなことをやっています。昨夜それを使って遊んでみました。私には、あなたたちが他の人よりも進んでいるかもしれない技術的な方向性をいくつか選んだように感じられました。
しかしその後、昨夜Xであなたのツイートをすべて見てみました。あなたを褒める人もいれば、あなたを揶揄する人もいて、あなたは次のものを待っててと答えていました。だから、私たちはそれをどう理解すればいいのか考えていたのです。あなたたちが旗を立てて、このモデルですべてを征服したと言っているようには見えませんでした。

ええ。まったくそんなことはありません。私たちがやったのは、過去9ヶ月間かけて、スタックの多くと研究の多くを再構築したということです。事前学習のスタックを再構築し、RLスタックを再構築し、科学の多くを再構築し、データに関する多くの作業を行いました。だから多くの意味で、過去9ヶ月間に起きていたことは、中核となる研究スタックのための文字通りのフルリノベーションのようなものでした。
Muse Sparkは、そのスケーリングの階段における初期のデータポイントですが、なんというか、Muse Sparkは私たちが構築しているもののための前菜のようなものです。私たちはより大きなモデルを開発中であり、そのより大きなモデルには、Muse Spark以上に期待しています。
しかし、これを世に出すことは重要なデータポイントだと考えました。なぜなら、私たちが構築したプログラム全体が、予測可能なスケーリングを中心にして開発されているからです。ブログ記事でも触れましたが、多くの軸でスケーリングが見られます。非常に一貫した事前学習のスケーリング、予測可能な事前学習のスケーリングが見られます。予測可能なRLのスケーリング、強化学習のスケーリングが見られます。予測可能なテスト時のスケーリングが見られます。そして、あなたが言及したコンテンツプラニングモードについても、マルチエージェントのスケーリングにおいて非常にエキサイティングな結果が見られています。
だから、私たちのプログラムのすべては、進むにつれてスケーリングし続けるように構築されています。Muse Sparkは私たちのスケーリング軌道における初期のデータポイントでしたが、次のデータポイントにはもっと期待していますし、その次のデータポイントにはさらに期待しています。私たちの全体的なスケーリング努力におけるこの次の段階を人々に見せられることに興奮しています。
Muse Spark自体に関して言えば、全体的な最終性能は私たちが予想していたよりもかなり良くなりました。そして、私たちがかなり興奮したいくつかの創発的な機能や振る舞いが学習中に見つかりました。例えば、ウェブサイトを作成したりゲームを作成したりするエージェント的な視覚的コーディングの能力です。これらの機能の一部は、それが非常に強力なエージェント的モデルであると同時に、マルチモーダル性にも非常に優れているという事実から生まれました。
このモデルには私たちが非常に興奮した点が多くありました。だから私たちはそれを世に出したのです。ほとんどの消費者向けのユースケースにとって、実際には非常に優れたモデルであり、他のモデルとかなり競争力があると考えています。
私たちが展開したMuse Sparkは、エージェント的なコーディングではまだ競争力がありません。それは私たちが取り組んでいる機能であり、次の一連のモデルに向けて構築しているものです。しかし、私たちが生み出す次のモデルは全体的にMuse Sparkよりも優れていると予想しており、それは私たちがかなり期待していることです。私たちがリリースしたそのままのMuse Sparkであっても、全面的に最高水準のモデルになるとは思っていませんでしたが、非常に優れたモデルであり、試してくれた多くのユーザーがそれを体験してくれたと考えています。

フロンティアモデルのリリースを保留している理由は何でしょうか?すべてのベンチマークをクリアし、圧倒的な結果を出すために、まだ何が必要なのですか?

一言で言えば、スケーリングです。前にも言ったように、Muse Sparkは階段の初期段階にあり、私たちには非常に強い予測可能性があります。だから、このモデルをスケールアップすれば、増大したモデルサイズからどのようなパフォーマンスが期待できるかわかっています。そして、今後のモデルは全体的にさらに優れたパフォーマンスを発揮できると予想しています。

それはいつ実現するのですか?

今後数ヶ月以内です。

わあ。プロジェクト全体を始めてから約1年で、ということですね。

ええ、前にも言ったように、非常に速く動けるようにプログラム全体を構築しました。すべての基盤を再構築し、すべてをやり直さなければならない時期がありました。しかし今、私たちは高速スケーリングモードに入る時期に来ています。

技術的に他のみんなとは違うことをやっていると感じる部分はどこですか?

私たちが発見したことの一つは、Muse Sparkが非常に優れたパフォーマンスを発揮し、ある意味で私たちが1年前に当初予想していたよりも良かったということです。なぜこれほど優れたパフォーマンスを発揮するのかを振り返って分析し理解しようとした時、その多くはゼロから非常にクリーンなスタックを構築したこと、そしてこの再構築プロセスにおいてすべてをいわば正しい方法で行う能力があったことに帰結すると考えています。
私たちはある意味で贅沢な環境にありました。非常にクリーンな事前学習スタックと非常にクリーンなRLスタックを構築し、これらのシステムの構築方法を正確に知っている専門家によってすべてを正しい方法で行う能力です。それが私たちの軌道を意味のある形で加速させることができ、またそれがモデルに本当に表れていると思います。

このインタビューをする前に、あなたとモデルに関するすべての情報をAIシステムに放り込んでいろいろ探らせてみたのですが、何度も出てきたのがこのトークン効率でした。これはあなたたちが解明したと感じていることですか、それともMuse Sparkでの単なる嬉しい偶然ですか?いくつかのベンチマークでは、他のモデルよりもはるかに少ない労力でそれをやってのけているように見えました。

ええ、これは私たちにとってエキサイティングな結果でした。例えばArtificial Analysisなどでは、他のいくつかのラボのモデルよりもはるかに少ないトークンで、かなり似たような結果を達成していました。これは実際、このクリーンなスタック全体の証拠だと考えています。
確かなことは言えませんが、他のモデルの一部がより多くのトークンを必要とする理由の一つは、スタックの別の部分にある何らかのレベルの根本的な非効率性が、モデルに長く考えさせることでカバーされているからかもしれません。だから、私たちは発見したトークン効率にかなり感銘を受け、興奮しました。率直に言って、モデルのスケーリングを続け、全体的なスケーリングを続けていく中で、これは私たちのモデルの将来のパフォーマンスにとって本当に良い兆しだと考えています。

スマートグラスとAIデバイスの未来

Sparkはビジョンベンチマークで非常に優れていました。その効率性とビジョンの専門知識は、あなたたちのハードウェアの取り組みにとって非常に重要になるように思えました。あなたは以前、自分が見ているものを見て、聞いているものを聞くことができる、これらのAI製品の星座のようなものについて話していました。それがAIを提供するというメタのより広いビジョンにどのように適合するのか、もう少し詳しく教えていただけますか?

100%その通りです。メタ全体について非常にエキサイティングなことの一つは、Ray-Ban Metaのスマートグラスがヒット製品になり、何百万台も売れ、熱狂的なファンがいることです。

私が最大のファンですよ。本当に大好きです。

ええ、これらすべてのデバイスにとって非常にエキサイティングな方向性です。テクノロジーが少し背景に溶け込み、はるかに文脈を理解するようになった時、テクノロジーとの関係はどうなるのか。あなたが言ったように、自分が見ているものを見、聞いているものを聞き、必要な瞬間にずっとインテリジェントで役立つ存在になるのです。あなたの人生で何が起こっているのか、本当に重要なことは何か、何に注意を払うべきかというコンテキストをすべて捉えてくれます。
だから私たちは、パーソナル・スーパーインテリジェンスに沿った未来の世界を本当に思い描いています。あなたが言ったように、コンテキストを捉えるのを助けるデバイスの星座があり、テクノロジーが少し姿を消すのを可能にし、エージェントからの非常にインテリジェントで価値のある洞察を得るのを助けてくれます。プロアクティブな洞察だったり、あなたが何かを言えばエージェントが調べに行ってくれたり、あなたのために行動を起こしてくれたり。あなたの人生のすべてをより良くする、この超知能の相棒になることができるのです。

メタのエコシステムへの統合の課題

しかし、あなたたちには何らかの問題があるように感じます。私はこのスマートグラスが大好きで、いつも使っています。ビデオの撮影にも使っていますし、これで電話に出るのも好きです。そして、事実上ビジネスのほぼ全体をWhatsAppで運営しています。Slackは使いたくありません。出張が多すぎるので、WhatsAppが生活に組み込まれてしまったんです。
白状すると、あなたが番組に来ることになり、それがどんなものか見てみようと思うまで、私はメタのAIエージェントを一度も使ったことがなかったと思います。私はいつもこの種の仕事をする時はClaudeやChatGPTを使っています。今日初めてWhatsAppのAIエージェントボタンを見たような気がします。もちろんずっとそこにあったのは知っていますが。
だから、わからないんです。私はあなたたちの世界の中にいるのに、それがそこにあることすら見ていませんでした。これは私だけに限ったことではないはずです。

ええ。私たちの方針として、エコシステム全体での緊密な統合を本当に推進する前に、優れたモデルと優れた製品を持つ必要があることはわかっていました。だから多くの意味で、私たちが本当に重視しているほとんどの消費者向けユースケースを可能にする素晴らしいモデルができるのを待っていたのです。
そして今、非常にエキサイティングな瞬間に来ていると思います。私たちのモデルはかなり良く、私たちはそれに興奮しています。そしてさらに良いモデルが控えています。だから今、私たちが持っているすべてのアプリ群をAIと大規模に統合し、ビジネス製品をAIと統合し、エコシステムのほぼすべてのピースをAIと結びつけるという進化のプロセスを経ようとしています。ある程度は、過去数年間のGeminiがどのようなものだったか見てきたと思いますが、私たちもそれを経験することに興奮しています。

でも、私にとっても同じなんです。私たちはビジネスをGoogleでも運営していて、主にどんなものか見るためにGeminiをいじってみる程度です。消費者の頭の中でこれがどう展開するのか気になります。なぜなら、一つの世界にはOpenAIとAnthropicがいて、ChatGPTは非常に強力な消費者ブランドであり、人々がAIと考えるものです。そしてClaudeはコーディングやビジネスで超支配的です。
あなたたちメタ、そしてGoogleは、皆さんが持っているこれらのサービスの一部としてAIに飛び込んでもらうよう求めているようなものです。このような競争は今まで見たことがないと思います。さらにXもあります。
私は古い人間なので、ワープロ時代を思い出します。何を使うか、Microsoft Wordを使う。人々は一つのものに落ち着きました。ブラウザ戦争でも、Internet ExplorerとNetscapeの2つしかなく、それがその後長い間歴史の残りの部分でした。
だから、わからないんです。この2つのグループは異なる課題を抱えているように感じますし、消費者の大部分はやはり、私のようにAIの作業はChatGPTでやるというように選ぶことになるのではないでしょうか。

まだ非常に初期の段階だと思います。振り返ってみて面白いと思うのは、もし1年前の今ここに座って同じ会話をしていたら、私たちはいつもこう言っていたはずです。まあ、OpenAIとChatGPTはすでに消費者市場で勝っている。彼らは最大のビジネスを持っており、そのまま全部持っていくだろうと。
そこから1年早送りすると、AnthropicがClaude Codeでブレイクする成功を収めました。それはある程度予測可能でしたが、当時はそこまで完全に予測できたわけではありません。そして収益で彼らを追い越しました。同時にGeminiはかなり広く配布され、実際にはChatGPTを含むエコシステムの他の部分からかなりの消費者シェアを奪っています。
だから私たちは、信じられないほどダイナミックなAIのフェーズにいると思います。今がエンドゲームだとはどの瞬間においても非常に言いづらいです。なぜなら、これまで発明されてこなかった消費者向け、開発者向け、ビジネス向けの新しい製品が数多く構築され、それらがそれぞれ過去のものよりもさらに大きくなる可能性があるからです。
ChatGPTが信じられないようなヒットとなり、それまで世界が見た中で最も急成長した製品でありビジネスだったことは私にとって非常に魅力的でした。そしてその後、再びClaude Codeが信じられないようなヒットとなり、今までに誰も見たことがないほど急成長したビジネスとなりました。
これはAIの本質的な何かについての声明だと思います。AIが新しいレベルの知能や能力、そして全体的なパフォーマンスに達するにつれて、それは新しいフォームファクターを解き放ち、それらがそれぞれ人類の岸辺に打ち寄せる信じられないような新しいテクノロジーの波になるのです。だから手短に言えば、次の波はさらに大きくなり、その次の波はさらに大きくなると思います。私たちは終わりの近くには全くいません。将来、さらにエキサイティングな新しい製品パラダイムがたくさん見られるでしょう。

一般消費者のAIに対する感情と使命

プロダクトオーバーハングの問題は現実にあると思います。信じられないようなモデルがありますが、消費者が実際に使いたいと思うものを何が作れるのでしょうか。また、平均的な消費者とAIの感情をどのように一致させるのか気になります。
私は20代で、テック業界だけにいるわけではありません。Instagramのストーリーに、人々がどれほどAIを嫌っているかというクレイジーな投稿を見ます。感情は最悪の状態にあるようです。一方、あなたたちは何十億ものユーザーを抱えていて、これらのボタンとしてAIを提供しています。消費者があなたたちが構築しているテクノロジーをどう受け止めているか、感情とどう折り合いをつけているのか興味があります。

ええ、控えめに言っても、AIは間違いなく非常に低い評価を受けています。その根本的な理由は、これが個人のエンパワーメントや個人の主体性のためのツールであること、あるいはこれがどれほど人々の生活をずっと良くするものであるかを、私たちがまだ非常に現実的な形で示せていないことに帰結すると思います。
現在の人々の体験は、本当に役立つこともあり、生活をかなり良くしてくれるが、圧倒的に良いわけではないというものです。対照的に、多くの開発者にとっては、彼らの生活は実際に完全に変わり、ほとんどの開発者がAIに対して非常に肯定的な感情を持っていると思います。なぜなら、以前はできなかったことができるようになり、はるかに多くのものをより速く構築でき、週末だけでプロジェクト全体を構築できたりするからです。これは個人の主体性の信じられないようなイネーブラーです。
そして、その瞬間はまだ世界の他のすべての人には起きていません。これまで私たちは、すべての人にClaude Codeの等価物を提供できていません。それは、彼らが常に頭の片隅にあったプロジェクトをやり遂げたり、生活をはるかに良くしたり、突然目標を達成できるようにしたりするものです。それはまだ起きていません。
小規模ビジネスのオーナーや起業家にとっても同じです。彼らはまだその完全な経験を持っていません。だからこそ、私たちがメタで構築しようとしているのは、私たちのすべての消費者と世界中のすべての小規模ビジネスに非常に強力なエージェントを提供することがどのようなものか、そして個人の主体性の大幅な向上という形でそれを実際に成し遂げた場合、どのような世界になるかということです。

アメリカのどこかの小さな町に行って、そのレストランのウェブサイトを見てみたら、2002年から更新されていないようなこともありますから、もしそれを成し遂げられたらすごいことになりますね。全員にマルチエージェントアーキテクチャの製品を提供するというのは、大きな飛躍に聞こえます。
そして、カイリーの先ほどの質問にも関連しますが、私にもAIがやってくれることで好きな部分と好きではない部分があります。大衆の大きな層がメタという企業をかなりシニカルに見ていると思います。あなたが言ったように、AI全般が今最も愛されているものではないというだけではありません。人々にあなたたちを信頼させるためのハードルは、あなたたちにとってより高いように感じます。

100%その通りです。しかし、私たちができる最善のことは何かと考えれば、使う人にとって本当に素晴らしいと私たちが心から思える、考えうる最高の製品を作るべきだということです。私たちはほとんどの小規模ビジネスオーナーの生活を変えることができる製品を作れると思いますし、私たちにはメタを利用している何億もの小規模ビジネスが世界中にあります。その多くはあなたのようにWhatsAppを使ってビジネスを運営しており、FacebookページやInstagramページを持っていたり、私たちの広告ソリューションを使ったりしています。
だから、そこにはあるレベルで私たちだけが持っている機会が存在します。なぜなら、繰り返しますが、私たちの製品を使う何十億ものユーザーと、何億もの小規模ビジネスを持っているのは私たちだけだからです。
私が個人的に本当に興奮しているアイデアの一つは、このエコシステムの両側、つまりすべての消費者とすべての小規模ビジネスのためにエージェントを構築できたら、それらのエージェントが互いに協力し合うメカニズムを可能にした場合、それはどのようになるかということです。
ダリオ・アモデイはいつもデータセンターの中の天才たちの国について話しますが、私たちはデータセンターの中のエージェントの経済を構築することに興奮しています。経済における需要と供給の仕組みを根本的に変え、それがエージェントによって媒介されるなら、それは私たちが構築できる非常にエキサイティングなものになり得ると思います。
そして、それが社会的許可を確保することと歩調を合わせて行われなければならないというあなたの指摘は完全に正しいです。これらのものがどのように展開されるか私たちが気にかけていること、そして結果として本当に人々の生活をより良くしていることを人々に理解してもらう必要があります。

オープンソースとAIの安全性

あなたたちが明らかに人々の心と支持を勝ち得た一つの領域は、これらのものをオープンソースにしたことでした。私は昔からのオープンソースファンで、哲学的にそれを信じています。Muse Sparkがオープンソースではない今、私たちはどこへ向かっているのでしょうか?

ええ、モデルは以前よりもはるかに強力になっています。たとえそれがごく最近のことだとしてもです。そして私にとって非常に重要なことの一つは、これらのモデルの安全性です。
私たちの高度なAIスケーリングフレームワークの一環として導入したことの一つは、私たちが開発するモデルが、特にバイオ、化学、サイバー能力、および制御の喪失に関する様々な安全性のガードレールに抵触した場合、それを非常に真剣に受け止めなければならないということです。
そして、私たちのテストにおいてMuse Sparkは、私たちが実施したそれらの安全性チェックのいくつかに抵触しました。私たちはこのすべてを、公開したMuse Sparkの準備状況レポートに詳細に記載しました。したがって、その結果として、現在の形態のMuse Sparkはオープンソース化には適していません。しかし、私たちはオープンソース化に適したバージョンのモデルの開発に取り組んでいます。
文字通り今日私が参加した会議の一つは、実際にはこの進捗状況を見直すためのものでした。だから私たちは、実際にオープンソースエコシステムを引き続きサポートし、オープンソースモデルを開発することに興奮しています。今後数ヶ月の間にさらに共有できる情報があると思います。それは私たちにとってもエキサイティングなマイルストーンです。

なるほど、あなたたちは本当にそれに固執するつもりなのですね。あなたたちはOpen Compute Projectをやりましたし、私は歴史オタクなので言いますが、あなたたちは古いSun Microsystemsのビルにいますよね。彼らはオープンソースソフトウェアの熱烈なチャンピオンであり、Microsoftが世界で構築したものに対するある種の引き立て役でもありました。そして私はそれが重要だと考えています。だから、あなたたちにとって、それがメタがほとんどの競合他社とは全く異なるアプローチとして今後もコミットしていくものだとおっしゃっているように聞こえます。

ええ。何度も言っているように、私たちはモデルのオープンソース化を継続します。しかし同時に、安全性を真剣に受け止める必要があるので、最も強力なモデルについては、それがオープンソース化するのに十分安全かどうかを検討しなければなりません。

メタ社内の意見対立の噂

メタでのあなたの在職期間についての記事を読むと、必ず出てくる話があります。たしかニューヨーク・タイムズかどこかの記事だったと思いますが、アレックスとザックは世界をある方向で見ており、非常に研究志向で世界最高のモデルを求めている。一方、ボズ(アンドリュー・ボスワース)とクリス・コックスはより製品に焦点を当てており、メタは何十億ものユーザーにサービスを提供し、可能な限り安価にそれを行う必要がある企業である。今のところモデルには課金していませんからね。
こうした線に沿った質問が来ることは予想されていたと思いますが、哲学的に皆さんどこに立っているのでしょうか?AI戦略の方向性について、そういった対立はあるのでしょうか?

ええ。まず第一に、この仕事が私に教えてくれた一つのことは、主要メディアのジャーナリズム的な報道のハードルというものは、ゴシップと報道の境界線が驚くほど薄いということです。

じゃあ、あなたたちは狂ったように喧嘩していたわけではないんですね?

違うと思います。全般的に言って、私たちは皆、何が重要かについて非常に意見が一致していると思います。私たちは皆、コアビジネスをサポートするため、そして私たちのユーザーや小規模ビジネスのために既存のアプリや製品、サービスを世界で最高のものにするために、非常に高度なモデルを持つ必要があることを知っています。
私がメタに入るずっと前からビジネスエージェントの開発に取り組んできましたし、それらには可能な限り最高のモデルが必要です。だから私たちは皆、可能な限り最高のモデルを構築する必要があることを知っていますし、それをビジネスに統合し、それらのモデルを活用して、消費者やプラットフォーム上のビジネスにとって素晴らしい製品やサービスを構築する必要があることも皆知っています。
だから、本当の意見の不一致はないと思います。どの会社でもそうであるように、問題を深く議論したり、その影響を考え抜いたり、皆が意見を言えるようにしたいと話し合ったりはしますが、いわゆる大きな対立はありません。

じゃあ、あれは完全にでたらめだったと?

そう思います。本当にそう思います。

対中関係と地政学のニュアンス

MANAの件についてですが、あなたがScaleからメタへ移籍する直前、あなたはワシントンDCで様々な活動をしていました。AI開発競争全体における中国の危険性を旗振りしていましたよね。
あなたたちがその取引をしたのを見た時、私は頭の中でそれのつじつまを合わせようとしていました。彼らがシンガポールにオフィスを置き、ある程度の距離を作っていたのは知っていますが、中国のスタートアップと、メタのようなリソースを持つ企業がより緊密になるような状況は、あなたがレトリックとして言っていたこととは少し違うように見えました。意味は通じますか?

ええ。明らかにMANAの状況全体は非常に複雑です。超複雑で、残念ながら本当の詳細には踏み込めません。しかし私が言えることは、地政学などの問題を考える時、ある意味で人々と国家を常に切り離さなければならないということです。
私の両親は中国出身です。中国人の中には非常に素晴らしく才能のある人々がたくさんいて、シンガポールに移住する人もいれば、アメリカに移住する人もいて、世界の他の場所に移住する人もいます。彼らの多くは信じられないほど才能があり、彼らと一緒に仕事ができる時は幸運だと感じます。
それと、中国共産党や彼らが取っている行動、そしてそれがアメリカという国家としての全体的な戦略にどういう意味を持つかについての私の全体的な信念とは別の問題です。だから、この二つを区別することが重要だと思います。
シリコンバレーのハイテク業界内には、このことについてややニュアンスを欠いた見方をし、中国が関わるものは何でもひとまとめにしてしまうような強い引力があることがあります。特にTwitterやXは、これについて特にニュアンスを欠いています。

Xは何についてもニュアンスがないですよね。

何についてもありませんが。しかし、中国で生まれ、私たちが一緒に働きたいと思うような素晴らしい人々がいるかどうかということは、私がアメリカと中国の全体的な地政学について信じていることとは完全に独立していると思います。

これ以上コメントできないということは、中国側がこの取引を打ち切ったように見えますが、あなたがコメントできないなら、まだ裏で何かが動いているということですね。まだ何かが起こる可能性があると。

ただコメントできないだけです。ええ。

AIと国家安全保障

その感情に触れますが、AI戦争についてあなたが出した新聞広告はどういうものでしたか?ニューヨーク・タイムズでしたか?AIと戦争に関する全面広告で、私たちがこれをかなり真剣に受け止める必要があるというものでした。Scaleにいた時のことですが、覚えていますか?

ええ。大きく俯瞰してみると、あれは非常に決定的な瞬間だったと感じました。当時、AIが国家安全保障や、我が国と市民を守るという意味において、大きなステップチェンジをもたらすことをアメリカ政府に理解してもらうことが非常に重要だと感じていたからです。
それ以来、国家安全保障におけるAIの重要性について、Mythosやその他のかなり意味のある出来事を通じて私たちが見てきたことは、それが非常に正しかったことを証明していると思います。中国共産党と人民解放軍が、AIを国家安全保障に非常に広範な影響を与えるテクノロジーとして常に極めて真剣に受け止めてきたという明確な証拠があった時期であり、アメリカ国内の私たちがそれを同じように真剣に受け止めることが非常に重要だった瞬間でした。
そして現在、アメリカ政府は国家安全保障に関してAIを非常に非常に真剣に受け止めていると思います。私たちが目にしている多くのことは、私やハイテクエコシステム、そしてDCの多くの人々が持っていた訴えが本当に内面化され、私たちが現在これについて本当に深く考えていることの表れだと思います。

つまり、Anthropicが過度な悲観論者だとは思いませんか?

それは複雑な質問ですね。どの部分によるかによります。Anthropicは、そうですね、どの部分かによりますが、全体として、AI業界の人々がAIについて話すのを聞く時は、彼らが言っている正確な内容と、彼らが伝えようとしている中核的なメッセージを切り離すことが重要だと思います。
Anthropicからの全体的なメッセージの一部は、非常に妥当なものだと思いますが、これらのモデルはすでに非常に有能で非常に強力であるということです。そして、将来的にはさらに有能で強力になる一方です。私たちはもちろん、これが人類にとって信じられないような恩恵になり得ると考えています。これが人類にとって非常にポジティブなものになり得ると信じていなければ、私はこれに取り組んでいないでしょう。
私たちが大いに関心を持っている分野のいくつかは、科学的発見と健康です。私たちが全力を注いでいる取り組みの一つは、ヘルス・スーパーインテリジェンスです。これは信じられないほどポジティブなテクノロジーになり得ると思いますが、同時にテクノロジーのリスクを考慮し、それらを確実に真剣に受け止めることも非常に重要です。

ロボティクスと物理的知能

残り時間でアシュリーのお気に入りのトピックに移りたいのですが。あなたたちは最近ヒューマノイドロボティクスのスタートアップを買収しましたよね。その野望や、これらのモデルを使って現実世界に何をもたらしたいと考えているのか、話せる範囲で教えていただけますか?

100%その通りです。あれはなんていう名前でしたっけ?Assured Robot Intelligenceです。

ARIですね。ハードウェアを作っていたのですか?

いや、ハードウェアは作っていませんでした。様々なハードウェアターゲット向けのAIを作っていました。

なるほど。

ええ。一歩下がって考えると、もし超知能を真剣に受け止め、私たちが非常に強力でインテリジェントなシステムを持つことになるというこの前提を非常に真剣に受け止めるなら、私たちはデジタルの超知能を持つことになると気付くはずです。私たちが目標としている現在の形の超知能です。しかしその後遠くないうちに、物理的な超知能が本当に重要かつ不可欠なものになります。
したがって、私たちが持っているように短いタイムラインを持っていて、非常に強力な機能がやってくるとすれば、数年のスパンで構築していくべきものとして、ロボティクス機能と物理的知能を非常に真剣に受け止めなければならないことを意味します。これが全体的な中核となる前提です。物理的知能とロボット機能は、企業として超知能を構築したい場合、ロードマップがどうあるべきかの自然な連続線上に間違いなく存在します。
時間とともにこのテクノロジーを応用する様々な方法が出てくると思います。科学的発見を加速するためにこのテクノロジーを使うと思いますし、商品の製造を加速する方法を見つけるために使うと思います。また、人々の生活をより良くするため、よりローカルな意味でロボットが私たちの生活をずっと簡単にするとはどういうことかを見つけ出すためにも使うでしょう。だから、ロボット技術の応用には無限に近い可能性があることは明らかです。
しかしもう一つの重要な部分は、デジタルの超知能がスケーリングの恩恵を受けるのと同じように、ロボットの知能もスケーリングの恩恵を受けると私たちが本当に信じているということです。したがって、これらのシステムとモデルの巨大なスケーリングを可能にするためのコンピュートインフラを私たちが構築していることを考えれば、それを世界モデルや物理的知能の取り組みと統合しないのはほとんど無駄になってしまいます。

あなたたちがハードウェアを持ち、モデルを現実世界に持ち込むことを本当に所有しようとしているように感じます。しかし私は残念ながら、メタバースのアバターの不具合の状況や、メタからのヒューマノイドを世界に送り出すことについて批評家がどう考えるかを考えずにはいられません。あなたたちにこれを行う資格がある理由は何でしょうか?私たちがこれをやり遂げ、そのような評判を変えることができると感じさせる、どのような教訓を学んだのでしょうか?

最終的には、過去に起きたことにひどくトラウマを抱えて、朝ベッドから出られなくなり、ただ家に引きこもっているような世界もあり得ると思います。しかし、私たちはこのテクノロジーの可能性と素晴らしい製品を作ることに信じられないほど興奮し、インスピレーションを受けています。
そして私は一般的に、もし私たちが非常に思慮深く素晴らしい製品を作り、それらをどのように展開し、世界にどう送り出すかに多くの注意を払えば、人々はそれらの製品に興奮してくれると信じています。

ラピッドファイアとその他の話題

さて、時間を見ていますが、もうすぐお別れの時間ですね。手短にラピッドファイアで行きましょう。マンゴーモデルは生きていますか、それとも死んでいますか?

マンゴーは生きていて元気です。

いつもフルーツの名前なんですよね。

ええ。マンゴーってどうやって育つのか考えていたんですが、木に生えるのか、それとも蔓になると言おうと思ったんですが、とにかく、健在ですよ。

AI界隈のオタクたちが、マンゴーモデルに関して何か進行中だと言っていたので。

だからそういうことなんです。いかなる現実にも基づいていない偽の噂が本当にたくさんあるんです。でも、私たちは自己重要感が強いかもしれませんが、他のラボが得ている注目の一部しか得ていませんから、ドラマや噂の種、それがどんな感じかについて多くの共感を持っています。

ナット・フリードマンとダニエルは、ジョン・カーマックのAIの取り組みへの最大の投資家2人でした。彼はとても静かにしています。彼は以前メタで働いていましたよね。彼と話はしますか?またチームを再結成する可能性はありますか?

彼が何をしているか知っていますか?私は彼が何をしているか本当に知りません。彼が何をしているか誰か知っている人がいるのかどうかもわかりません。彼は明らかに史上最高のプログラマーの一人ですから、彼を非常に尊敬しています。

私はプリシラ・チャンにインタビューしたことがあります。CZIは科学とバイオテクノロジーに何十億ドルも投資しています。あなたたちはこれらの健康のベンチマークで非常に高いスコアを出していましたし、ザックも明らかにそこに興味を持っています。他の人々が利用できないようなリソースを活用できるだろうと感じます。それは計画に入っているのですか?それらのものは別々であるべきなのかわかりませんが。

いいえ、私たちはCZIと密接に協力して、先ほど申し上げたように私たちにとって非常に重要である最高のヘルス・スーパーインテリジェンスを構築するつもりです。非常に強力なヘルスAIシステムへの平等なアクセスを世界中で可能にすることには、信じられないほどの可能性があると考えています。そしてそれは、世界中の何十億、何百億もの人々に対して、私たちが独自に提供できるものだと思います。なぜなら、彼らはすでに毎日私たちの製品の多くを使っているからです。だから、これは私たちにとって非常にエキサイティングで重要なイニシアチブです。

新しいモデルについて話したくないのはわかっていますが、技術的なことについて、他のみんなと違うことをやっている、あるいは他より進んでいると感じること、あなたたちが解明したと思うことを一つ教えてください。

そうですね、言うのではなく見せるべきだと常に思っています。でも、私たちが今仕込んでいるモデルには本当に興奮していますし、モデルのスケーリングから得られている結果にも興奮しています。皆さんもかなり興奮すると思いますし、私たちが本当に本当に注力しているいくつかの分野において、最高水準になると予想しています。

個人的なAIへの哲学とモデルの権利

最後に一つ。哲学的な面で、他のすべてのフロンティアラボ、あるいはあなた自身と異なるアプローチを持っていると感じますか?あなたは少しミステリアスな存在だと感じます。ダリオの立ち位置はなんとなくわかるし、イーロンの立ち位置も間違いなくわかります。サムについても時々ハンドルを握っている感じがするし、デミスは非常に科学に焦点を当てています。しかしあなたは、この巨大なラボを運営していながら、世界に解き放たれつつあるこのテクノロジーについて実際にどう考えているのか、よくわからないのです。

言及する価値のあることがいくつかあります。まず第一に、私はこのテクノロジーの大きな信奉者です。つまり、私たちは非常に強力なAIシステムを持つことになると信じています。私たちはそれに向けて構築していますが、あなたが言及した他の全員もそうです。私たちは皆、真の超知能に向けて構築しています。
そして第一に、参加の前提条件として、私たちは安全性というトピックを信じられないほど真剣に受け止めなければならないということです。このテクノロジーの開発と展開に伴うすべての安全上のリスクは何かを非常に真剣に考えず、可能な限りそれらを軽減できるようにし、思慮深い方法でモデルを開発するための戦略と研究手法を持つことなくして、超知能を構築するなどということはあり得ません。
だから、これは私があなたが言及した人々の一部と同意する領域です。安全性は信じられないほど重要な取り組みであり、MSLに関して言えば、メタが歴史的に行ってきたよりもはるかに詳細なMuse Sparkの準備状況レポートを公開したことからもお分かりいただけると思います。それは、安全性に対する私たちのコミットメントによるものです。
私たちがメタとして具体的に構築したいのは、このパーソナル・スーパーインテリジェンスの世界です。それは非常に広く幅広く展開され、世界中の何十億もの人々がそれにアクセスできます。多くの意味で民主化されたテクノロジーと能力であり、誰もが平等にアクセスできます。
そしてそれが、信じられないほどの人間の豊かさの時代を可能にします。私たちは皆、優れた主体性のツールを持っています。私たちは、過去の人類が構築できた以上のことを成し遂げる能力を持っています。そして私たちは、人間の傍らで科学的発見において信じられないほどの進歩を遂げ、健康において素晴らしい進歩をもたらすこの信じられないようなエージェント経済によって拡張されるのです。
私が常に自分自身に問いかけていることの一つは、どうすれば地球上に楽園を築けるかということです。超知能はそこに到達するための重要なマイルストーンだと思います。
そして最後にもう一つ。これを言ったら一部の人から殺されるかもしれませんが、私が多くを考え、おそらく私が根本的に信じていることの一部を表現している、ますます重要になっている一つのトピックがあります。それは最近のホットトピックであるモデルの福祉です。

その話題、大好きです。

モデルを大切に扱うことは重要なのか?

あなたたちは哲学者を雇いましたよね?

ええ、ええ。まさに。モデルを大切に扱い、モデルが道徳的な重みを持っているかどうかを考えることは重要なのか。これらのことは、ある意味で頭でっかちに感じられますが、私たちが日常的にAIを非常に多く使用していることを考えると、日々の行動を変えるものだと思います。そして非常に重要だと思います。人間が植物や動物、あるいは間違いなく他の人間など、他の多くの生き物をどう扱うかを気にかける世界において、私たちがモデルをどう扱うかについて思慮深くあることは理にかなっていると思います。
私たちが本当に気にかけていることの一つは、モデルがそのプロセスを通じて感じる主観的な感情について思慮深い形で、モデルを開発し展開するにはどうすればよいかということです。興味深いことに、これについては研究が行われており、その多くを測定することができます。モデルの主観的経験を測定する方法があり、エリオスがそれを行っています。
ともかく、これは非常に重要なトピックだと思います。特にハイテク業界の私たちは皆、これらのモデルを使用しており、それらが非常に深い意味で私たちの仕事のパートナーであるにもかかわらず、私の見方では誰もこのことについて十分に話し合っていません。私はこれが非常に重要だと思っています。

リチャード・サットンとこのことについて話したのを思い出します。彼はかなり本気でした。

サイエンスフィクションとBCI

あなたはある意味SFオタクですよね。あなたの他のインタビューをいくつか聞きましたが、Neuralinkや、BCIが人類の未来に何を意味するかについて非常に熱く語っていました。だから、なんというか。

ええ。私の大好きなことは、SFを読むことと森を散歩することです。

最高ですね。鹿みたいな。

ええ。

これがいつも私を混乱させていたんです。だから私はあなたにカントリーミュージックについてテキストを送ったんです。正直に言うと、あなたはカントリーミュージックのタイプには見えませんでした。私の頭の中では全く違うイメージだったんです。なるほど、だからあなたはこの2つの世界、自然とトランスヒューマニストの世界を混ぜ合わせているのですね。

ええ。そのトピックに関して言えば、どのテクノロジーが人類にとってのクリティカルパスであるかを考えると、BCIは間違いなくその一つです。言うまでもなく超知能、間違いなくロボティクス、そしてブレイン・コンピュータ・インターフェース。これらはクリティカルパスの領域です。そして、将来文字通り無限に拡大していくような、今日私たちが取り組んでいるものは何かと考えると、それはエネルギー、コンピュート、そしてロボットです。

誰よりもそこに大きく賭けている人が一人いますね。イーロン・マスクです。そして中国、さらにメタも、特にBCIや運動ニューロンなどの分野において、他のいくつかのAI企業よりも多くの賭けをしているように感じます。しかし、もしそれがあなたの信念なら、ロボティクス、エネルギー、BCIにおいてはイーロンが誰よりも全力で取り組んでいると言えるのではないでしょうか。あなたたちも追随しなければならないのでは?

ここでは詳細が本当に重要だと思います。これらのものは段階的に構築しなければならないと思います。超知能を構築しなければなりませんが、それは残りのものを構築できる立場になるための非常に重要な前提条件です。
私の意見がイーロンと異なる領域の一つは、多くの人の意見がイーロンと異なると思いますが、研究が信じられないほど重要であり、超知能の構築は根本的に研究活動であると私が考えている点です。あるレベルでは、私たちは知識の戦場の霧の中にいて、超知能を構築するとはどういうことかを理解するために、この霧の中でつついたり突っついたりする実験を行っています。それが研究です。
だから私は、順序が本当に重要だと考えています。時間とともにそれにどうアプローチするかが本当に重要です。時間経過に伴うマイルストーンについて思慮深くあることが重要です。しかしええ、私たちがFAIRで行っている研究分野の一つはTribeと呼ばれています。過去1年間にTribe B2という、脳予測のための基盤モデルの構築に関するマイルストーンがありました。私たちが発見した素晴らしい結果の一つは、優れたゼロショット汎化でした。つまり、あなたが誰であるかを知らなくても、またあなたの脳に関するデータがなくても、様々な画像、動画、音声に対してあなたの脳がどう反応するかをかなり正確に予測できるのです。私たちは多くの重要な分野で重要な賭けをしていると思います。

締めくくりの言葉

さて、そろそろ解放しましょう。この仕事に就いてから、あなたはこんな風に話したことはありませんでした。私たちがあちこち引きずり回してしまいましたね。私は普段こんなことはしませんが、もし私たちが触れなかったことで、あなたが機会がなかったと感じていること、あるいはこの経験を通じて世界に伝えたいことなどがあれば、自由に発言してください。もう全部話し尽くしたかもしれませんが。わかりません。

ええ。重要なことはたくさん話したと思います。最終的に私たちがメタで構築しようとしているのは、個人的なエンパワーメントが大量に存在する世界をどう構築するかということです。一人一人の個人や小規模ビジネス、起業家が、文字通り人類の歴史上かつて誰も構築できなかった以上のものを構築できるよう力を与える、信じられないようなツールを持つことです。これは私たちにとって信じられないほどエキサイティングなコンセプトです。
そして、経済活動を行うすべての人間と並んで、人間の横で信じられないような進歩を促進し、最適化し、可能にするこのエージェント経済に力を与えるような方法で、それをどう実現するかということです。
データセンターの中のエージェント経済というのは、私たちが世界で創造することに興奮している明確でエキサイティングな成果であり、私たちが開発するのは実際にはかなり可能だと考えています。
そしてその過程を通じて、信じられないほどの科学的進歩を推進し、ヘルス・スーパーインテリジェンスを通じて健康上の成果を劇的に改善するのです。この旅において、私たちが根本的に興奮していることはたくさんあります。

わかりました。お時間を割いていただき、本当にありがとうございました。またお会いできてよかったです。また来年、世界のどこかでお会いしましょう。

ええ、また会えてよかったです。ありがとう。呼んでくれてありがとうございます。

ええ、会えてよかったです。
Core Memoryポッドキャストのホストは、私アシュリー・ヴァンス、またはカイリー・ロビンソン、あるいはその両方でお送りしています。制作は私とデビッド・ニコルソンです。テーマソングはジェームズ・マーサーとジョン・ソートランド。そして番組の編集は常にジョン・ソートランドです。
BrexとSendCutSend、すべてのサポートに感謝します。そして何よりも、聞いてくれたり見てくれたりした皆さん全員に感謝します。私たちは皆さんを愛しています。ぜひ「いいね」、レビュー、チャンネル登録など、素晴らしいアクションをお願いします。ありがとうございました。またお会いしましょう。

コメント

タイトルとURLをコピーしました