この書き起こしでは、OpenAIのCEOサム・アルトマンが2025年のSnowflake Summitにおいて、AGIのタイムラインと次世代AI能力について語った内容を収録している。企業リーダーに対しAI技術への早期参入と迅速な反復による実験を強く推奨し、現在のAIモデルが既に本格的な企業利用に十分な成熟度に達していると述べた。特にコーディングエージェントCodexを通じてAGIの片鱗を感じた体験を語り、AGIの定義よりも技術進歩の指数関数的な継続こそが重要であると強調している。
これから先を見据えると、AIには未来を形作る可能性があり、それをより良い方向に導く力があることが分かります。生成AIは、コード作成から哲学的推論まで、あらゆるものを解き放ちました。その旅は基盤モデルから始まりました。これらのモデルは数十億のユーザーが、これまでアクセスできなかったデータの力を活用することを可能にしました。
これらは私たち全員にとってゲームチェンジャーとなりました。そして、その未来をOpenAIほど形作った企業はほとんどありません。毎日10億人以上が使用するChatGPTの爆発的な成長を通じて、彼らは私たちがデータや知能とどのように相互作用するか、そして仕事の未来をどのように想像するかを再定義しました。そしてこの変革の中心にいるのが、今日のテクノロジー界で最も影響力のある声の一人です。
彼はOpenAIを画期的な研究から、現在数十億人に影響を与える製品へと導き、真にグローバルな規模でAIの進化を推進してきました。 OpenAIの創設者兼CEOであるサム・アルトマンをお迎えしましょう。
そして、この議論の司会を務めるために、Convictionの創設者兼マネージングパートナーであり、良き友人でもあるサラ・グオに参加していただきます。ありがとうございます。
サムとサラ、ようこそ。戻ってこられて素晴らしいですね。最初に言ったのですが、これはロックコンサートのように見えますが、データのためのものですね。データの人たちのための。そうですね、2年前にもここにいらっしゃいましたが、その時ほど素晴らしくはありませんでしたね。
さて、始めに、サム、2025年のAI環境をナビゲートする企業リーダーにどのようなアドバイスをされますか?
とにかくやることです。 まだ多くの躊躇があり、モデルは非常に速く変化していて、次のモデルを待つ理由がたくさんあったり、これがこちらの方向に進むのかあちらの方向に進むのか様子を見たり、AとBのどちらで構築すべきか待ったりしています。一般的な技術の原則として、物事が急速に変化している時は、最も迅速な反復速度を持ち、間違いを犯すコストを最も低くし、学習率を最も高くする企業が勝利します。 そして確実に、企業とAIに関して私たちが見ているのは、早期に賭けをして非常に迅速に反復している人々の方が、すべてがどのように展開するかを待っている人々よりもはるかに良い結果を出しているということです。
ストリート、あなたはどう思われますか?それに完全に同意します。そして私が付け加えたいのは好奇心です。私たちが当たり前と思っていることの多くが、物事が以前どのように機能していたかについて、もはや真実ではないということです。そして実験に行き、多くの人々、OpenAI、Snowflakeが実験のコストを非常に非常に低くしました。多くの小さな実験を実行し、そこから価値を得て、その強みの上に構築することができます。サムが再び言ったことを繰り返しますが、最も速く反復できる人々が物事から最も多くの価値を得るでしょう。なぜなら、彼らは何が機能し、何が機能しないかを知っているからです。 彼らはこの急速に変化する未来をナビゲートできます。すべてが落ち着いて、その後私たちが何をすべきかを理解できる完璧な瞬間は、少なくとも今後数年間はないと思います。
去年言ったであろうことと、あなたのアドバイスはどう違いますか?
好奇心が最も見過ごされていることだと思いますし、間違いを犯すのは問題ないと思うという点で、去年も同じことを言ったと思います。それほど重要でない状況を見つける必要があり、そのような状況はたくさんあります。しかし、技術も急速に成熟しています。 最新の出来事に関する情報を得るために今ChatGPTを絶対に使用できます。なぜなら、ウェブ検索をいつ使用してそれを提供するかを知っているからです。
そして、構造化データであろうと非構造化データであろうと、チャットボットのような多くのアプリケーションがあり、技術は成熟しています。それを採用することができます。はい、それで他に何ができるかの境界を常に押し広げることはできますし、よりエッジの効いたエージェント的なアプリケーションもありますが、フロンティアから遠く離れたところでは、この技術は実際に主流での使用に準備ができていると思います。
興味深いことに、去年は全く同じことは言わなかったでしょう。去年はスタートアップには同じことを言ったでしょうが、大企業に対しては、少し実験することはできるが、これはほとんどの場合、本格的な本番使用には完全に準備ができていないかもしれないと言ったでしょう。そしてそれは本当に変わりました。私たちの企業ビジネスはこのように成長しました。 そして私たちは、今実際に多くのことで私たちを使用している大企業と話し、何がそんなに違うのかと言うと、私たちは「あなたたちがそれを理解するのに時間がかかっただけですか?」と言います。そして彼らは、それも一部だったが、ただずっと信頼性高く動作するようになったと言います。
それは動作し、私が可能だとは思わなかったこれらすべてのことができます。そして過去1年間のどこかで、これらのモデルの使いやすさにおいて本当の変曲点に達したようです。
今、興味深い質問は、来年私たちは何を違って言うでしょうか?来年の時点では、いくつかのビジネスプロセスを自動化したり、これらの新しい製品やサービスを構築したりするためにシステムを使用できるだけでなく、私のビジネスにこの非常に重要な問題があります、それを解決できるなら大量のコンピュートを投入しますと本当に言えるでしょう。そしてモデルは、人々のチームが独力ではできないことを理解することができるようになるでしょう。
これらのモデルでの経験を積んだ企業は、AIシステムよ、私の最も重要なプロジェクトをやり直してくれ、ここに大量のコンピュートがある、本当に懸命に考えて、答えを見つけ出してくれと言える世界に対して良いポジションにいます。
それに準備ができている人々は、来年また大きなステップチェンジを得ると思います。推論を考慮し、困難な問題により多くのコンピュートを適用し、そしていくつかのワークフローへのエージェントの導入を考慮すると、メモリと検索が大きく変わらなければならないという見解があります。 この次の時代におけるメモリと検索の役割についてどう思われますか?
検索のようなものは、生成AI技術を必要な時に根拠のあるものにするために常に重要な役割を果たしてきたと思います。事実に関する質問をする場合、信頼できる答えが欲しいのです。ですから、GPT-3では、2023年初頭にウェブ検索スケールシステムを構築しました。例えば、ニュース速報のように、現実世界からの参照点が答えるために必要な質問をした時はいつでも、そのコンテキストを提供できました。
同様に、以前に特定の問題にどのように取り組んだかを知ること、メモリ、特定のシステムとの相互作用は、そのシステムを将来に向けてより良くすることに大きく影響することができます。これらのモデルをますます興味深いタスクに使用するにつれて、それらの役割は増え続けると思います。 そして、より多くのコンテキストがあるほど、これらのシステムは、対話的な観点からも、エージェント的な観点からも良くなると思います。
サム、今日と来年、エージェントが何ができるかについて考えるフレームワークを、ここにいるすべてのリーダーに提供していただけますか?
私たちが立ち上げたばかりのCodexと呼ばれるコーディングエージェントは、私のAGIを感じる瞬間の一つでした。 このものを見ていると、たくさんのタスクを与えることができます。それはバックグラウンドで動作します。本当にかなり賢いです。これらの長期的なことができて、それからあなたはただそこに座って、これにはイエス、あれにはノー、もう一度試してと言うだけです。そしてそれはあなたのGitHubに接続することができ、いずれはあなたが望むならあなたの会議を見ることも、あなたのSlackを見ることも、あなたのすべての内部文書を読むこともできるようになり、信じられないほど印象的なことをしています。
そして今日はおそらく数時間働けるインターンのようなものですが、いずれは数日間働ける経験豊富なソフトウェアエンジニアのようになるでしょう。 そして私たちは他の多くの作業カテゴリーでこれを見ることになります。そして顧客サポートの大部分や、アウトバウンドセールス、その他数多くのことを自動化するエージェントを構築している企業から話を聞きます。
そして今の彼らの仕事は多くのエージェントに仕事を割り当てることだと話す人々から話を聞きます。 品質を見て、それがどのように組み合わされるかを理解し、フィードバックを与える。そしてそれは、まだ比較的ジュニアの従業員のチームとどのように働くかと非常に似ているように聞こえます。そしてそれはここにあります。まだ均等に分散されていませんが、それは起こっています。
来年は、少なくともいくつかの限定的なケースで、いくつかの小さな方法で、新しい知識を発見することを助けたり、非常に些細ではないビジネス問題の解決策を見つけることができるエージェントを見始めるに賭けます。現在は、何か反復的な認知作業があれば、短期間で低レベルでそれを自動化できるというカテゴリーにあります。
そしてそれがより長い時間軸とより高いレベルに拡張されるにつれて、いずれはAI科学者、新しい科学を発見できるAIエージェントを得ることになり、それは世界にとって重要な瞬間となるでしょう。
Codexとコーディングエージェントの体験がAGIを感じた瞬間だったとおっしゃいましたね。 そこで、それについて聞かなければなりません。あなたにとってAGIの定義とは何ですか?そしてそれはどのくらい遠くにありますか?それは私たちにとって何を意味するでしょうか?
5年前、2020年に時間を遡ることができたとすると、AIにとって暗黒時代のようでした。実際、それは非常に興味深い時期です。なぜなら、正確に5年前に戻ることができたなら、間違っているかもしれませんが、私たちがGPT-3を立ち上げる直前だったと思います。 世界はまだ良い言語モデルを見たことがありませんでした。そしてその瞬間に戻って、Codexや他の何かは言うまでもなく、今日のChatGPTを誰かに見せることができたなら、ほとんどの人がそれは確実にAGIだと言うと思います。
そして私たちは期待を調整するのが得意で、それは人類の素晴らしいことだと思います。AGIが何かという質問はほとんど重要ではないと思います。 それは人々が異なって定義する用語です。同じ人でも異なって定義することがよくあります。
重要なことは、過去5年間に見てきた年々の進歩率が、少なくとも次の5年間、おそらくそれをはるかに超えて続くべきだということです。 しかし、それを言うのは難しいです。そして24年、26年、28年にAGI勝利を宣言するか、28年、30年、32年に超知能勝利を宣言するかは、この一つの長い美しい、衝撃的に滑らかな指数関数よりもはるかに重要ではありません。
そのすべてを言った上で、私にとって、自律的に新しい科学を発見できるシステム、あるいは人々にとって信じられないほどのツールとなって、世界における私たちの科学的発見の率が4倍になるようなもの。それはAGIについて私が想像できるあらゆるテストを満たすでしょう。
他の人々は、それは自己改善能力のあるシステムでなければならないと言うでしょう。多くの人々は、今日メモリを持つChatGPTは非常にAGI的だと言うでしょう。 確実に、人々がかつて目標だと言っていたチューリングテストのような私たちの初期のテストのいくつかを横断しています。
2020年に戻って、ストリート、検索を構築していた時に使った最初のOpenAIモデルは何年の何だったか覚えていますか?実際にGPT-3プレイグラウンドを使って小さな実験を実行し、その後APIを使っていましたが、GPT-3をウェブスケールで実行する余裕がありませんでした。そこで基本的に、70億、100億パラメータモデルでこれをどのように行えるかを逆算しました。
しかし、既にGPT-3で抽象的要約と呼ばれるこの問題がうまく解決されるという素晴らしさを見ることができました。これは基本的に1500語のブログを取って、それを説明する3つの文を書くことです。 これは本当に困難です。人々はこれを行うのに苦労し、これらのモデルが突然それを行っていました。それは、ウェブコーパス全体でこれを行えるなら、どの10ページを見るべきかを理解できる検索があることの、ちょっとした開眼の瞬間でした。
それは、ここには信じられない力があるという開眼の瞬間で、もちろんそれは積み重なり続けています。起業家として、またはSnowflakeのCEOとしてのあなたの旅のどの時点で、すごい、私は以前のNEVAの人も雇用しており、私の前提の一部は、この時代ではすべてが検索または検索プラスだということでした。いつその考えを持ったのですか?
それはコンテキストの設定についてです。これらのモデルを見て相互作用したり、任意の問題について考えたりすると、それを動作させたいレンズを絞り込む方法も欲しくなります。そしてそれは非常に強力で一般化可能な技術です。 登場した多くのポストトレーニング技術を見ても、それは少し、この信じられないほど強力なモデルを取って、何がうまくいき、何がうまくいかないかのコンテキストを与え、それを使ってそれが生み出すものを改善するということです。
何かを起こすための特定のツールというよりも、より一般的な概念だと言うでしょう。すべてが適切なコンテキストの設定についてです。 常にコンテキストの無限性があります。人間は私たちが注意と呼ぶもの、何かに焦点を当てることでそれを解決します。私は検索をモデルの注意を設定するためのツールと考えています。
そしてサムが言うように、この指数関数的な能力曲線に乗っているということに同意しますか、それともあなたにとって、または顧客にとって重要なAGIの定義がありますか?
サムが言っているように、それは議論の問題になると思います。時にはそれは哲学的な問題でもあると思います。私は、潜水艦は泳ぐのかという疑問に例えるでしょう。一つのレベルでは馬鹿げていますが、もちろんそうです。そして私は、これらのモデルを、2030年にものがどのようになるかを見る任意の人が、それはAGIだと宣言するような信じられない能力を持つものとして見ています。しかし、サムのポイントに戻れば、あなたと私も2020年に25年に見ているものについて同じことを言ったでしょう。私にとっては、本当に驚くべきはその進歩の率であり、そこから多くの素晴らしいことが生まれると心から信じています。
同様に、かなりまともなコンピュータが世界中のチェスをプレイできるすべての人に勝てるという事実についてどう感じるかと同じで、重要ではありません。私たちには今でもチェスをプレイするのが非常に上手な人々がいます。定義が重要です。何が?今ではより人気があります。 以前よりも人気があります。囲碁でも同じです。そこから学ぶことがたくさんあると思います。実際の瞬間はそれほど重要ではないと思います。
個人的に直感として、人々がAGIについて尋ねる時、彼らは実際には意識について尋ねているのだと思います。 ただ、常にそのように枠組み化するわけではない、またはあなたが言ったように、より哲学的な質問である少なくとも大きなサブセットがそうです。
あなたはより多くのモデルを訓練しており、他の誰よりも先に次の能力を見ているので聞かなければなりません。製品の観点から何を構築したいか、OpenAIをどのように運営するかを変える、次のモデルセットで見ている創発的な行動は何ですか?
次の1年または2年間のモデルは非常に息をのむようなものになるでしょう。 本当に私たちの前には多くの進歩があり、多くの改善が来るでしょう。そして以前の大きなジャンプで見てきたように、GPT-3からGPT-4まで、企業は前世代のモデルでは全く不可能だったことを単にできるようになります。
そして企業ができるようになることについて、私たちはこれについて少し話しましたが、あなたの最も困難な問題を与えてください、もしあなたがチップ設計会社なら、私が以前持っていた可能性があるものよりも良いチップを設計してくださいと言ってください。もしあなたが何らかの病気を治そうとしているバイオテック会社なら、私のためにこれに取り組んでくださいと言ってください。 それはそれほど遠くありません。
そして、あなたが可能な限り与えたいすべてのコンテキストを理解し、すべてのツール、すべてのシステム、何でもに接続し、それから本当に懸命に考える、本当に優秀な推論をして答えを持って戻ってくるこれらのモデルの能力、そして自律的にいくつかの作業を行って出かけることを信頼できるだけの十分な堅牢性を持つこと。
それがそんなに近く感じるとは思わなかったかもしれませんが、本当に近く感じます。
何の知識が範囲内にあるか、またはすぐに範囲内になるかについて、ここにいる皆さんに何らかの直感を与えていただけますか? なぜなら、コア知能について考える時、私は、まあ、私は合理的に賢いですが、頭の中に完璧な物理シミュレーターを持っていません。だから、何が可能かをどのように知るべきでしょうか?
これについて考えるのが好きなフレームワークは、私たちが出荷しようとしているものではありませんが、プラトンの理想のようなものは、超人的な推論能力を持つ非常に小さなモデルです。 それは馬鹿げて速く実行でき、1兆トークンのコンテキストとあなたが想像できるすべてのツールへのアクセスを持ちます。
そして問題が何であっても関係ありません。 モデルがその中に知識やデータを持っているかどうかは関係ありません。これらのモデルをデータベースとして使用するのは馬鹿げています。それは非常に遅く、高価で、非常に壊れたデータベースです。しかし素晴らしいことは、それらが推論できることです。
そして推論エンジンとして考え、そこにビジネスや人の人生のすべての可能なコンテキストとその物理シミュレーターやその他何でも必要なツールを投入できるなら。 それは人々ができることにとって非常に驚くべきことで、方向的に私たちはそこに向かっていると思います。
素晴らしいですね。あなた方お二人により推測的な質問をしたいと思います。もし1000倍多くのコンピュートがあったら、元々の考えは無限でしたが、それは馬鹿げたものになります。1000倍多くのコンピュートがあったら、あなたはそれで何をしますか?
超メタな答えを言うなら、この後に役立つものを与えますが、おそらく本当の答えは、AI研究に非常に懸命に取り組むよう求め、はるかに良いモデルを構築する方法を理解し、その後そのはるかに良いモデルにすべてのコンピュートで何をすべきかを尋ねることでしょう。 あなたの最も困難な問題をやることです。
まあ、それが合理的にすべきことだと思います。つまり、あなたは本当にその答えを信じなければなりません。そうしなければなりません。より役立つことを言うなら、私たちは今、ChatGPT内で、または私たちの最新モデルを使用している企業内で、テスト時間コンピュートに対する実際のリターンがあるこれらすべてのケースを見ています。
モデルがより多く推論できるようにしたり、困難な問題をより多く試したりすると、既により良い答えを得ることができます。 そしてすべての問題に1000倍多くのコンピュートを投げると言っただけの企業は、いくつかの驚くべき結果を得るでしょう。 今、あなたは文字通りそれをするつもりはなく、1000倍のコンピュートを持っていません。
しかし、それが今可能だという事実は、人々が今日できる興味深いことを指し示していると思います。それは、オーケー、私は本当にこれをべき乗法則として扱い、私の最も困難な問題や最も価値のあることに対して、もっと多くのコンピュートを試すことを喜んでするつもりだということです。
ストリート、あなたはただSnowflakeとあなたの最も困難な問題が何であれ同じことをしますか、またはあなたはデータインフラ、検索最適化の素晴らしいキャリアを築き、Snowflakeを運営していますが、それは単に質問を尋ねることですか?
それは多くのコンピュートを使用するかなりクールな方法だと思いますが、私たちが住むテクノロジーの世界とは異なる答えを与えるだけで、アルノメプロジェクトと呼ばれるプロジェクトがあります。それは20年ほど前に行ったDNA配列決定プロジェクトのようなものです。 しかし、それはRNA発現を理解することについてです。RNA発現が私たちの体内でタンパク質がどのように働くかをほぼ制御していることが分かります。
そこでのブレークスルー、RNAがDNA発現をどのように制御するかを正確に知ること、それは多くの病気を解決し、人類をはるかに前進させる可能性があります。 それは、多くのコンピュートを何かに投げかけなければならない場合、言語モデルで行われるDNAプロジェクトの等価物の、かなりクールな使用法でしょう。 多くのコンピュートを何かに投げかけなければならない場合、それはかなりクールな結果でしょう。
人類の最大の問題の一つである、刺激的で。 ストリート、どうもありがとうございました。ありがとうございます。サラ、ありがとうございました。ありがとうございます。


コメント