サム・アルトマンが語る:ゼロパーソンAI企業、Sora、AGIのブレイクスルー、その他

OpenAI・サムアルトマン
この記事は約24分で読めます。

OpenAIのCEOであるサム・アルトマンが、DevDay 2025で発表された最新技術について語ったインタビューである。ChatGPTのアプリSDK、エージェントビルダー、Soraなど、多岐にわたる新機能が紹介されている。特に注目すべきは、ゼロパーソン企業(人間ゼロの企業)の実現可能性についての議論であり、アルトマンは数年以内にその実現を予測している。また、AGI(汎用人工知能)の定義として、AIが新たな科学的発見を行えるようになることを重視していることが明らかにされた。GDPvalベンチマークでClaude Opusに次ぐ2位となったことについても率直に認め、改善への意欲を示している。Soraのディープフェイク問題、AI時代における仕事の変化、グローバルなAI規制の必要性など、技術的進歩がもたらす社会的影響についても幅広く議論されている。

Sam Altman on Zero-Person AI Companies, Sora, AGI Breakthroughs, and more
OpenAI just unveiled HUGE developer updates at DevDay 2025 - Apps in ChatGPT, Agent Builder, Sora API, and Codex updates...

DevDay 2025の発表内容について

サムさん、お越しいただきありがとうございます。これを実施していただき感謝します。さて、私たちは今DevDay 2025にいますが、発表されるすべての内容について教えていただけますか。また、あなた個人として最も楽しみにしていることは何でしょうか。

私はすべてに対してワクワクしています。ChatGPTのアプリ機能は、私が長い間やりたかったことなんです。でも、人々がエージェントビルダーで構築しているものについて話していました。たくさんのものがあります。あるいはエージェントキットですね。本当に使いたいものがたくさんあります。でも、もし個人的に一つ選ぶとしたら、ChatGPTのアプリ機能が素晴らしいと思います。あなたは何に最もワクワクしていますか。

私はエージェントビルダーが好きです。ChatGPTのアプリ機能もクールだと思うので、そこから始めましょうか。週間アクティブユーザーが8億人というのは、ところでおめでとうございます。

ありがとうございます。信じられないことです。ChatGPTが次の配信プラットフォームであることは明らかだと思います。ビルダーや創業者は、ChatGPT上に構築するためにアプリSDKをどのように活用できるでしょうか。少し反復が必要だと思いますが、人々がこれらをどのように主に使用するかを把握する必要があります。例えば、人々は常に名前でアプリを呼び出すのでしょうか。それとも、ChatGPTが使用しているものを認識して、それらを提案し続けることを人々は望むのでしょうか。

新しい配信メカニズムが出てくると思います。開発者たちが、自分たちにとって本当にうまく機能するものを見つけ出すでしょう。でも、これらのものを世に出すと、驚かされる方法があるものです。

あなた方は、推奨される方法を最大化する方法についてのドキュメントを公開すると思いますが。

はい、ただし、新製品は急速に変化し、一緒に学んでいくという標準的な注意書き付きです。でも、今日これを公開しています。

それを読むのが楽しみです。エージェントビルダーについて少し話しましょう。最初のDevDayに戻りますが、2年前にあなた方はGPTビルダーをローンチしましたね。それは素晴らしかったです。実は私は最初に公開GPTを構築した人の一人だったと思います。

それ以来、エージェントビルダーを構築するまでに、どのようなブレイクスルーがありましたか。

最大のものは、モデルが格段に良くなったことです。他にも話すべきことはたくさんありますが、最初の日を振り返ってみると、当時と今とのモデル能力の違いは、22ヶ月か23ヶ月だったと思いますが、本当に非常に長い道のりを歩んできました。

それに加えて、人々がこの種のエージェントをどのように構築したいかについて、多くのことを学びました。また、ChatGPT以外の他のサービス上でそれらを構築したいということも分かりました。でも、ビジュアルビルダーを使って、いくつかのファイルをアップロードして、データソースへのアクセスを与えたり、何が欲しいかを伝えたりして、それに従わせてデプロイするという、かなり洗練されたものを簡単に構築できるというのは、かなり注目に値することだと思います。数分でそれができるんです。

私が最も驚いたのは、昨日リハーサルをしていたときのことです。初めて全体を見る機会があったんですが、Codexやエージェントキットなどを使って印象的なソフトウェアを速く構築する能力は、地殻変動のようなシフトを経験したように感じます。そして、それが何を意味するのか、まだ理解できていないと思います。

私の理解が正しければ、エージェントビルダーでノーコードでエージェントを構築できるということですね。

完全にできます。コードの書き方を知っていれば、より役立ちますし、より具体的なものを構築できます。でも、平均的な日常の知識労働者も、今ではエージェントを構築できます。完全にそうです。

つまり、エージェントのノーコード革命のようなものですね。あなたが言ったように、少しでもコードを書けたり、たくさん書けたりすれば、より印象的なことができます。でも、参入障壁、始めるための障壁は、明らかに非常に低いです。これが次の波のビジネスやビルダーにどのような影響を与えると思いますか。

そうですね。これが私が理解しようとしていることです。ロマンのデモを見ていました。彼が舞台にいる間、舞台裏で見ていたんです。そして、1年前だったらこれをするのにすごく時間がかかっただろうなと思いました。でも、今はほぼライブでできるという事実。もう十分に速くアイデアを思いつけない気がします。

繰り返しますが、これがどうなるかは分かりません。でも、世界で書かれるソフトウェアの量が劇的に増えることは明らかです。アイデアをテストして改善するのにかかる時間は、明らかにどんどん短くなっていきます。でも、これが正確に何を意味するのか推論するのが本当に難しいんです。

物事がより速く起こり、より多くのことを試して、より良いアイデアを素早く見つけられるようになるということだと思います。でも、他に何が変わるかは分かりません。

ゼロパーソン企業の実現可能性

あなたは友人の間で、エージェントによって運営される最初の10億ドル企業がいつ実現するかについて賭けをしていると聞きましたが、エージェントビルダーはまだそのレベルの自律性をもたらしていないでしょうか。

おそらくまだです。以前は、最初の1人企業で10億ドル企業がいつ始まるかという小さな賭けプールがありました。そして今は、これは正式なものではありませんが、たくさんの憶測があります。最初のゼロパーソン企業がいつ実現するかということです。

数ヶ月、数年、私は数年を予想します。

でも、チャットボットにプロンプトを入力するだけで、というようなことについて信頼性を持って話せるという事実は、とても信じられないことです。そうですね。

でも、2024年はエージェントの年になるはずだったのではないかと思います。まあまあ機能するエージェント製品をいくつか見てきましたが、それでもかなり重要な人間の監視が必要です。いつになったら、フィードバックなしで1週間ただ働くことができるエージェントが手に入るでしょうか。

Codexが1週間の作業からそれほど遠くないと思います。これもまた、言うのはおかしなことですが、おそらく2025年のことではないでしょう。でも、今日何人かの人と話していて、彼らは「Codexが今や1日がかりのタスクをやっているなんて信じられない。どうしてこんなに速く起こったんだ」と言っていました。

そして、AIの進歩が失望するほど速く感じることはあまりないんですが、Codexができるタスクの長さの改善率を見ていると、そう感じる時の一つです。そして、1週間のタスクはそう遠くないと思います。

そこに到達するための技術的なボトルネックは何ですか。

より賢いモデル、長いコンテキスト、より良いメモリです。

エージェント、これらすべてのモデルのアップグレード、Codexが今APIを使用していることなど、構築できるものがたくさんあるようです。もしあなたが時間を遡って、今持っているすべての知識を持った、最近スタンフォードを中退した20歳の自分を現在に連れてきたら、何を構築し、何を構築しないでしょうか。

先日そのことを考えていました。私は現在世代の20歳の中退者を羨ましく思います。今構築できるものの量、機会空間が信じられないほど広いからです。過去2年間、何を構築するかについて真剣に考えるための本当の自由な精神的空間がありませんでした。でも、構築すべきクールなものがたくさんあることは分かっています。そして、今日ここで人々が構築しているものについて話を聞くだけで、素晴らしいです。

それは私や、ここにいる他の多くのビルダーが苦労していることだと思います。今はとてもたくさんのものを構築できます。これらの製品を構築している間に保持できる独自の利点について、何かアドバイスはありますか。配信、データ、何らかのワークフローモード。

この質問には抽象的には常に答えるのが難しいです。なぜなら、最高の独自の利点は、あなた自身で見つけ出すものだと思うからです。私たちはOpenAIで独自の利点を見つけ出すために非常に懸命に働きました。

ここでの一般的なケースは難しいと思います。そして、この質問に対する最良の答えは、あなたがやっていること、あなたの製品、あなたの技術、適切なタイミングでの市場でのあなたの立場にのみ意味をなすものを見つけ出すことです。そして、それは新しいものを創業することによってあなたが創造する価値のかなりの部分のようなものです。

一つの一般的なことを言うとすれば、それは進みながら見つけ出すということです。私が常に愛してきた素晴らしいビジネスの引用があります。「戦術を戦略にさせよ」というものです。うまくいくことをただやり始めることができます。そして、驚くほど頻繁に、そのプロセスの中で、戦略に発展するものが出現します。

ChatGPTを始めたときに、私たちの永続的な利点が何になるかと尋ねられたら、私は分からないと言っていたでしょう。たくさんの推測はあったでしょうが、確信は持てなかったでしょう。

でも、最もエキサイティングだと証明されたものは、例えば、メモリは私たちにとって本当に素晴らしい競争上の優位性であり、人々がChatGPTを使い続ける理由です。それは当時全く頭になかったことです。だから、機能を構築し始めると、時々何かが出現して、「ああ、これは私たちにとって本当に永続的な利点になり得る」となるんです。

GPT-6に向けて構築すべき優位性へのヒントはありますか。あるいは、今持続する製品を構築することについて、どのように考えるべきでしょうか。

それはあなたが見つけ出さなければならないことです。いつかそれについてブレインストーミングするのは楽しいと思います。でも、OpenAIが私の精神的空間のすべてを占めていて、新しいスタートアップの構築方法について考える機会がないというのは、少し悲しいことです。

世界について多くのことを変えたと思いますが、企業にこれらの優位性をもたらすものは、それほど変わりません。ネットワーク効果があります。ブランドとマーケティングの優位性があります。ユーザーのデータのようなものがあります。マーケットプレイス効果のようなものを持つことができます。

近年これに対してうまくいったもののリストを作れば、今でもほぼ同じように見えると思います。でも、それを確立するための新しい戦術があるでしょう。

GDPvalベンチマークとAGIの定義

OpenAIは最近、主要な知識労働者の仕事における経済的に価値のある実世界のタスクでAIモデルがどれだけうまく機能するかを測定するGDPvalベンチマークを立ち上げました。私にとって驚きだったのは、GPT-5がClaudeのOpusモデルに次いで2位になったことです。あなた方がそれでも結果を公開したことには大きな称賛を送りますが、結果に驚きましたか。

まず第一に、私たちのモデルが2位のときに公開することを厭わないなら、それは本当に悪いことだと思います。私たちは常に何かで最高であり、他のことでは最高ではありません。そして、時間をかけて改善していく文化を構築する方法は、あるベンチマークや評価や他の何かで他の誰かがあなたより優れているときに、快活に直接的に認めることです。

彼らは多くの企業ユースケースを理解し、出力を非常に美しくフォーマットするという素晴らしい仕事をしたと思います。だから私は驚きませんでした。より良くなるようにインスピレーションを受けました。

そのベンチマークは、GPT-6の構築方法をある程度変えましたか。

いくつかのポストトレーニングの方法を変えるでしょうが、GPT-6に入るものについての私たちの戦略は変わらないと思います。

あなたは最近、AGIの定義を「ほとんどの経済的に価値のある仕事で人間を上回るとき」と言いました。どのGDPvalスコアがAGIを達成したと言えるでしょうか。

それについて考えてきました。まず第一に、他の多くの人々と同様に、AGIの複数の定義があります。それに近づくほど、概念はより曖昧になります。

でも、私が最も気にかけていることの一つは、そして私の大きな驚きに、私たちはついにその瞬間にいます。それが起こり始めているときです。それは、新しい発見ができるとき、人類の知識ベース全体を拡張できるときです。そして、これらのことは非常に小さいです。本当に誇張したくありません。

でも、Twitterで科学者たちがこれらの異なる分野で、小さな発見をしたとか、新しいアプローチを思いついたとか、何かを解明したと言っている例をたくさん見ます。繰り返しますが、誇張したくありませんし、過小評価もしたくありません。

これがそのことであり、私たちがその最初にいて、今後数ヶ月、数年でそれを強く推し進めることができると楽観的であるという事実、それは本当に大きなことです。それはおそらく私が最も気にかけているAGIのようなことです。

特に解決または解明することに特に興味を持っている科学的ブレイクスルーはありますか。

明らかに病気の治療法、新しい物理学の発見は素晴らしいでしょう。今起こっている小さなこと、例えば数学などでも、本当に重要に感じます。

GPT-4が出たとき、チューリングテストが正確に何であるかについては多くの議論がありますが、チューリングテストの一般的な認識は、不可能に遠い未来に感じられるようなものでした。そして突然、それが合格して、社会は基本的に全く更新しませんでした。

人々は2週間のパニックのようなものがあり、その後「なぜこのクソみたいなものはもっと速くないんだ」とか「これをするとかあれをするとか、もっと良くしろ」と言いました。そして、それは人類について素晴らしいことを物語っていると思います。

でも、永遠にあったAIテストというものがあって、それがサーッと通り過ぎて、私たちは皆適応しました。そして、同じことが今起こると感じています。AIが科学的発見をすることに非常に速く慣れるでしょう。

Waymoのようなものです。一度だけ奇妙なんです。

一度だけ奇妙で、3分間だけ奇妙で、その後慣れます。だから類似性は分かります。

ワークスロップとAIの活用

最近のスタンフォードの「ワークスロップ」研究について、皆さんに簡単に説明します。基本的にこれは、洗練されているように見えるが、やり直しを通じてより多くの作業を生み出す低努力の出力を説明する新しい用語です。1000人以上のデスクワーカーを調査したところ、41%が過去1ヶ月間に同僚からこのワークスロップに遭遇したと答えています。クリーンアップ時間は1件あたり平均1時間56分で、従業員1人あたり月額約186ドルのコストがかかります。

AIがこの部屋にいる多くの人や、このイベントにいる多くの人の出力を10倍にできるなら、他の人にいつそれを使うべきか、いつ使うべきでないかを教える教育やオンボーディングに何が欠けているのでしょうか。

まず第一に、多くの人間もワークスロップに相当するものをしています。だからこれはAI専用の現象ではありません。私の特に気になることは、作業を生み出すだけのメールのようなものです。同じことをする会議もあります。だから、これは新しいことではありません。

長い間、ツールを使ってより効果的になる人々がいて、ツールを使って組織内でドラッグを生み出すような人々がいます。そして、AIが異なる理由は何もないと思うべきです。

経済は自己修正します。そして、ツールを使ってより多くのことを成し遂げる人々や企業は、それを使って組織を遅くし、少なくする人々よりも、未来に影響を与える能力を持つでしょう。そして、どんな新しいツールでもそうですが、学習曲線があることを期待します。でも、かなり速いと思います。

OpenAIは、人々がこれらのようなAI直感スキルをより良く学ぶのを助けるための教育やオンボーディングについて何かしていますか。

はい、完全にしています。人々は使う方法でツールを使います。私が学んだことの一つは、素晴らしい教育コンテンツを作り、素晴らしいトレーニングをすることができても、人々は海賊のように話させることができると気づいて、そうするでしょう。

でも、はい、私たちは人々がワークフローで使うのを助けるための多くのコンテンツを作ろうとしています。そして場合によっては、確かにCodexでは、採用は非常に速く進み、ワークフローへの非常に生産的な方法での統合は、会社全体で数日または数週間の期間で起こります。

Soraとディープフェイクについて

スロップの話題で、あなたは正式にインターネット中でバイラルなディープフェイクを持つ世界初のCEOです。ターゲットGPU強盗のようなあなたのSoraミームを見ることは、全く怖くないですか。

実際、それは予想していたよりもはるかに奇妙でないことの一つでした。奇妙な方法で、100個をスクロールして見ることは、1つを見るよりもはるかに奇妙ではありませんでした。

私は考えていました。ローンチ前に世界中を大旅行していました。そして、チームの一人が私にメッセージを送ってきて、「あなたのカメオのことをオープンアクセスにしてもいいですか」と。それは、考えずに8秒で返信するつもりだけど、おそらくもっと考えるべきことの一つのような瞬間でした。

でも、これは新しい技術であり、私が本当にそれを実験する意思がないのは恥ずべきことです。だから、ただやることにしました。その後、飛行機の中で時間があって、「これは奇妙な体験になるのかな」と思いました。そして、「ええ、おそらく本当に奇妙になるだろう」と思いました。

それからローンチして、私はすでにOpenAI内の人々が私や他の人々のたくさんのミームを作っていたので、いくつか見ていました。でも、私はアジアにいて、真夜中でした。ツイートするために起きて、また寝ました。それから6時間後くらいにまた起きました。

アプリを取り出したら、ミーム、ミーム、ミーム、ミームという感じでした。そして、Waymoに乗ったときのように、最初の3分間かそれ以下の間は奇妙でした。それから、「わかった、これは明らかに生成されたビデオでいっぱいのアプリで、これらは面白いし、笑える」という感じでした。そして、持続的な奇妙さはありませんでした。

私が心配しているのは、ウォーターマーク除去のようなものです。今朝、それをリリースした会社がいくつかあります。Soraウォーターマーク除去のようなものです。もし彼らがウォーターマークを削除してソーシャルメディアに投稿する可能性があるなら、私が人々に自分をカメオさせる動機は何でしょうか。それは私の個人的なブランドに悪い影響を与えるでしょう。その誘因は何でしょうか。

まず第一に、このような技術をリリースする理由の一つは、私たちが何かが来るのを見ていて、数ヶ月または数年で広く利用可能になることを知っているからです。

素晴らしいオープンソースモデルが出てきて、誰でもあなたのビデオを作ることができるようになります。インターネット上で公開されているあなたのビデオを使って、彼らがやりたいことは何でもできます。社会はもちろんこれに適応するでしょう。

でも、社会がこれらの移行を助ける方法の一つは、ガードレール付きで早期にリリースすることです。そうすることで、社会と技術が一種の共進化する時間を持てるようになります。

それはテキストでうまくいきます。ビデオはもっと難しいと思います。なぜなら、ビデオはテキストが常にそうでない方法で直撃するからです。でも、私たちは適応することを学び、ウォーターマークなしで生成された、追跡するのがそれほど簡単ではない何らかのオープンソースモデルによって、インターネット上にあなたの偽のビデオがたくさんあるだろうということに非常に速く学ぶと思います。それはただ起こるでしょう。だから、社会にそれに対する免疫をつけさせることには、おそらくある程度の価値があります。

区別できないAIビデオが実際に目標ですか。

目標はAGIのようなものです。素晴らしいビデオはいくつかの理由でそれにとって重要だと思います。空間推論、ワールドモデルから学べること、いつかロボット工学での本当の進歩につながることを願っています。重要になるでしょう。

でも、素晴らしいビデオは良いことだと思います。未来の唯一のインターフェースがテキストであることは望んでいません。リアルタイムのビデオストリームで相互作用でき、それが常にあなたのために新しい種類のUXを生成している未来に非常に興奮しています。

だから、それは素晴らしいと思いますが、最も重要なのは、これが本当のAGIへの道のりにおいて非常に価値のあるステップだと思うことです。

金曜日に、あなたは自分の顔のカメオを許可する人々のための収益分配を探求している可能性があるというブログ投稿を公開しました。その詳細を共有できますか。どのように機能するでしょうか。

そうですね。多くの場合、新しい製品をリリースすると、人々が思っていたのとは異なる方法で使うことが分かります。私たちが起こると思っていたことの一つは、少数のクリエイターがこれらの非常にクールで、楽しく、複雑なビデオを作って共有するということでした。

そして、大きなオーディエンスがそれらを見るでしょう。そして、確かにそれが起こっています。でも、人々が自分だけのため、そして3人の友人のためにビデオを作り、グループチャットで共有するという膨大な使用量があります。それがフィードではなく、グループチャットでです。そして、それが定着するのか、それともただの目新しさなのか分かりません。

でも、もし定着するなら、それは私たちがどれだけのコンピュートを必要とするかという点で、それによって得られるエンゲージメントに対して、モデルを大きく変えます。そして、おそらく人々にビデオ生成に対して支払わせるようなことをするでしょう。

もし1日に100本のビデオを生成して友達にミームを送りたいなら、それは問題ありません。そして、もしそこに有名人を入れたいと思っていて、その人がそれを望んでいるなら、おそらく彼らもその生成ごとの支払いの一部を受け取るでしょう。

だから、ここで実験する必要があります。そして、6日前の製品について何か断言するのは非常に危険です。なぜなら、これはすべてまだ目新しさかもしれないからです。そして、これはユースケースにならないかもしれません。でも、少なくとも今のところ、それは大きなユースケースになっています。

Soraアプリでの広告の可能性を探りましたか。

まだです。でも、そこでやるべき興味深いことがあると思います。つまり、恐ろしいこともありますが。しかし、ChatGPTとは異なり、人々がサブスクリプションで私たちに支払うという素晴らしいビジネスモデルを実行できます。もし人々が使いたいSoraのバージョンが、フィードで面白いコンテンツや美しいコンテンツを見るようなものであれば、それはおそらくより自然な広告駆動型モデルです。

もしそれが主にDMなら、それは異なる種類のモデルです。だから、楽観的に見て、今年の終わりまでに、あるいはそれは楽観的すぎるかもしれません。第1四半期の終わりまでには、製品がどのようなものになるかを理解できると思います。そして、それに沿ったビジネスモデルを見つけ出せるでしょう。

つまり、確かに生成ごとに課金することは意味があり、試すべきことだと思いますが、他のすべてのアイデアは製品がどのように進化するかによってより依存します。

それは魅力的ですね。仕事の話題で、仕事は変化しています。私は農家の類推を使うのが好きです。

もし50年前の農家に、インターネットと呼ばれるこの魔法のようなものが10億の新しい仕事を生み出し、あなたは机に座っていて、開発者やマーケターがいると言ったら、彼はおそらく信じないでしょう。そして、私たちが今いるこの時代と同様に、あなたや他の多くの人々が、多くの新しい仕事が生み出されるだろうと繰り返し述べています。

そして、それらの仕事がどのようなものになるかを見ることは本当に難しいです。でも、この時代とインターネット時代の違いは、インターネット時代には何もないところから10億の新しい仕事が生み出されました。一方、インテリジェンス時代には、新しい仕事が生み出される前に、まず10億の知識労働者の仕事が影響を受けるでしょう。それはあなたを心配させますか。

完全に心配です。あなたがそこで触れたことは本当に重要なことで、私を少し心配させなくし、別の意味でより心配させるものです。

その農家についてですが、彼らはあなたがすることや私がすることを信じないだけでなく、おそらくそれを見て、「それは本当の仕事ではない」と言うでしょう。もし農業をしているなら、人々が本当に必要とするものをやっています。彼らに食料を作っている。人々を生かしている。これが本当の仕事です。

そして、未来のあなた方みんなは、人生があなた方にとって楽になりすぎました。豊富な食料と豊富な富、そしてこれらすべてのものがあります。そして、あなた方は必要なすべての食料にアクセスでき、自分の時間を満たし、自分が重要だと感じる必要性を満たすためにゲームをプレイしているようなことをしています。そして、それは私たちにとって本当の仕事ではありません。

でも、私たちにとっては本物に感じます。確かに私にとっては本物に感じます。そして、満足感があり、重要に思えるものに取り組む機会を得られることに感謝しています。

もし未来の仕事を見ることができたら、私たちは「わかった、私たちの仕事は農家の仕事ほど本物ではなかったかもしれないが、あなたが自分を楽しませるためにプレイしているこのゲームよりはずっと本物だ」と言うかもしれません。

だから、私は非常に信じられます。人々はまだ人生に多くの意味を持つでしょうが、私たちが仕事と考えるものが本当に変わるだろうと非常に信じられます。そして、私たちの参照視点からは、今私たちがしていることよりも仕事のように見えないかもしれません。

また、特にこれがかなり速く起こる移行を経る場合、社会契約が大きく変わることも信じられます。でも、この移行を経る際の短期的な心配はあります。

でも、人間の駆動力がそのままであることに賭けることを非常に喜んでいます。そして、私たちはすべきことをたくさん見つけると思います。

宇宙探査を考えていますか。BCI(ブレイン・コンピュータ・インターフェース)。AGI後に私たちが焦点を当てるだろうと思う具体的なことはありますか。

すべてがあらゆる方向に進むことを望んでいます。そして、私たちはすべてのことをやりに行くでしょう。

宇宙は私にとって非常にクールに見えますが、おそらくあなたやあなたやあなたにとっては、他に本当にクールだと思うことがあるでしょう。そして、この可能性のキャンバスが非常に広く開かれていることを望んでいます。

グローバルなAI規制とChatGPTの進化

もし明日一つのグローバル政策を設定できるとしたら、それは何でしょうか。

それを一つに絞るのは本当に難しいです。でも、頭に浮かび続けたのは、AI規制についての大きな議論があり、それが良いか悪いか、それが大企業に有利すぎるかどうかということだと思います。そして、私はその多くの側面を見ることができます。

でも、超強力なモデルに到達するにつれて、壊滅的なリスクを減らすためのグローバルな枠組みがあるべきだと思います。最先端のもの、本当に大きな安全問題についてどう考えるかということです。そして、そのためのグローバルな政策があれば、それは非常に良いことでしょう。

それを概説できますか、ハイレベルで。

始めるには、良いテストフレームワークを取るだけでいいと思います。

もう一つ触れたいのはWeChatです。中国では、買い物もでき、ソーシャルメディアをスクロールでき、友達とチャットできる万能アプリのようなものがあります。今、ChatGPTでは、ショッピング、ウェブ検索、Sora、これらすべての新機能があるようです。アメリカのための万能アプリのようなものを構築しようとしているのですか。

いいえ。そのアプローチがこの市場で同じように機能しない理由はたくさんあると思いますが、いいえ、私たちは本当に素晴らしいAIスーパーアシスタントを構築しようとしています。

すべての機能を別々にローンチする目標は何ですか。例えば、Soraは別のアプリです。なぜそれをChatGPTで直接ローンチしないのですか。

ChatGPTは多くの人にとって、彼らが使う最も個人的なアカウントになっています。そして、そこにソーシャル体験を組み合わせるのは奇妙に感じたと思います。メッセージングのようなものは想像できます。なぜなら、人々はこれらを多く共有し、協力するからです。でも、人々がChatGPTアカウントについて考える方法と、エンターテインメントアプリについて考える方法は極めて異なり、不協和音があったでしょう。

でも、もちろん多くのものをChatGPTに入れています。

エージェントビルダーについてもう一度話しましょう。人々が構築できる、あなたが最も楽しみにしている本当に重要または有用なエージェントは何だと思いますか。

Codexで起こったことを見て、それを他の多くの産業について考えています。法律や財務モデルの構築、あるいは他の多くのことについて、Codexのような経験があり得るでしょうか。素晴らしいスタートアップがこれらのことを始めているという良い実在証明を見てきました。

でも、技術が成熟するにつれて、それらのことを彼らの産業でCodexがコーディングで行っているのと同じくらい良くできるなら、それがおそらく私が最も興奮している分野です。

つまり、1人スタートアップを始められる世界を想像できます。たくさんのエージェントと話すだけでスタートアップを始められます。エージェントビルダーはまだ十分に良くないと思います。エージェントキットはまだ十分に良くありません。でも、ここからそこへの道は見えます。

基調講演で、音声がAIやエージェントの最終的なインターフェースだと思うと簡単に述べましたね。それについてもう少し触れてもらえますか。

最終的なインターフェースだとは思いません。音声が正しいインターフェースではない時がたくさんあります。公共交通機関にいて、それに向かって話しているような人になっているなら、それはちょっと迷惑です。

でも、音声が非常に自然なインターフェースである時がたくさんあります。一般的には言語ですが、時には音声、時にはタイピングすることが過小評価されています。私たちは皆、スマートスピーカーがカテゴリーとしてやや馬鹿にされていることに慣れてしまいましたが、多くの人がそれらを使い、本当に愛していることを忘れています。そして、それらはまだあまり良くありません。

単に十分に良いAIがなかっただけです。そして、それらの周りに十分に良いインフラストラクチャがありませんでした。だから、もしあなたがデバイスに話しかけるだけで、それがあなたが望むことを正確に行い、その後邪魔にならないようになったらどうなるかを考えると、それは私が使いたいコンピューターの種類のように思えます。

ioについてのヒントはありますか。あなた方がそこで構築しているものは何ですか。音声でインターフェースするものになるのでしょうか。

時間がかかるでしょう。これは、私たちがただ忍耐を求めなければならない場所です。新しい種類のデバイスを、超高品質レベルで、大規模に作るためです。全く新しいコンピューターの使い方です。

それを解明するための創造的な空間が必要です。いくつかのアイデアがあります。私たちは本当に興奮しています。でも、話す準備ができているものは何もありません。そして、しばらくの間はそうならないでしょう。でも、私たちは待つ価値が十分にあるものを作ろうとします。

わかりました。それだけです。あなたへの質問はこれで全部です。どうもありがとうございました。

これをやる機会を楽しめました。ありがとうございます。ありがとうございました。

コメント

タイトルとURLをコピーしました