OpenAI Enterprise内部:フォワードデプロイエンジニアリング、GPT-5、その他|BG2ゲストインタビュー

OpenAI・サムアルトマン
この記事は約55分で読めます。

この動画は、OpenAIのプラットフォーム部門を率いるエンジニアリング責任者のSherwin Wuとプロダクト責任者のOlivier Godementによる企業向けAI導入に関する包括的なインタビューである。ChatGPTで知られるOpenAIの消費者向け事業とは異なり、B2B企業向けプラットフォームの実情と、T-Mobile、Amgen、ロスアラモス国立研究所といった大手顧客との具体的な導入事例が詳しく語られている。最新のGPT-5の開発背景、リアルタイム音声API、強化学習ファインチューニング(RFT)などの技術革新から、AI自律性の現状、将来のAGI実現への展望まで、OpenAIの企業戦略の全貌が明かされる貴重な内容となっている。

Inside OpenAI Enterprise: Forward Deployed Engineering, GPT-5, and More | BG2 Guest Interview
Open Source bi-weekly convo w/ Bill Gurley and Brad Gerstner on all things tech, markets, investing & capitalism. This w...

OpenAI企業向けプラットフォームの現実

皆さん、こんにちは。私はApoorv Agarwalです。今日はOpenAIのオフィスで、OpenAIの企業向け事業について幅広い議論を行いました。OpenAI Platformのエンジニアリング責任者であるSherwin Wuさんとプロダクト責任者のOlivier Godementさんをお迎えしています。

OpenAIは世界中の何十億人もの人々に愛され楽しまれているChatGPTの開発者として広く知られています。しかし今日は、ビジネスのもう一つの側面、つまりOpenAIの企業向け事業について深く掘り下げていきます。特定の顧客との具体的な取り組みや、OpenAIがヘルスケア、通信、国家安全保障研究といった重要で大規模な産業をどのように変革しているかについて詳しく見ていきます。

また、SherwinさんとOlivierさんのAIの未来、テクノロジーの次なる展開、そして長期と短期の両方での選択についての見解についても話し合います。これは本当に楽しい時間でした。皆さんにも楽しんでいただけることを願っています。

世界クラスの二人の構築者、構築を簡単に見せる二人の人物です。Sherwinさんは私のPalantir 2013年同期で、テニス仲間でもあります。QuoraとOpendoorでIPOまで経験した後、ChatGPT以前にOpenAIに参加し、現在3年間在籍してOpenAI Platform全体のエンジニアリングを率いています。

Olivierさんは元起業家で、Stripeでゴールデンラマ賞を受賞し、約10年間在籍した後、現在はOpenAI Platformの全プロダクトを率いています。

その通りです。ありがとうございます。こちらこそありがとうございます。株主として、思考パートナーとして、アイデアを交換し合う中で、いつも皆さんから多くのことを学んでいます。それは本当に素晴らしいことです。

皆さんのためにこれを行うのは本当に素晴らしいことです。まず最初に、人々はOpenAIを、彼らが毎日仕事や個人的な生活で携帯している製品ChatGPTを構築した会社として知っています。しかし今日の焦点はOpenAIのエンタープライズ向けです。皆さんはOpenAI Platformを率いています。それについて教えてください。B2B企業向けのOpenAI Platformの基盤は何でしょうか。

実は、これは非常に興味深い質問でもあります。なぜなら、私が約3年前にAPIの開発のためにOpenAIに参加したとき、それは実際に私たちが持っていた唯一の製品だったからです。多くの人が実際に忘れていることですが、OpenAIの最初の製品は実際にはChatGPTではありませんでした。それはB2B製品でした。開発者向けのAPIだったのです。

ですから、実際にChatGPTのローンチとそれに続くすべてのことを見てきました。しかし、その核心において、私たちがプラットフォームを持ち、APIから始めた理由は、実際にはOpenAIのミッションに関わっていると思います。私たちのミッションは明らかにAGIを構築することですが、それ自体がかなり困難なことです。しかし、その恩恵を世界中のすべての人に、全人類に配布することでもあります。

ChatGPTがそれを行っているのを見るのは今非常に明確です。なぜなら、私の母親や、おそらく皆さんのご両親もChatGPTを使っているからです。しかし、私たちは実際にプラットフォーム、特にAPIと企業顧客との連携を、AGIやAIの恩恵をできるだけ多くの人に、世界のあらゆる隅々にいるすべての人に届ける方法として見ています。

ChatGPTは明らかに今本当に、本当に、本当に大きくなっています。世界で5番目に大きなウェブサイトだと思います。しかし、実際にAPIを使用する開発者と連携することで、世界のあらゆる隅々にいるより多くの人々に、そして皆さんが持つかもしれないあらゆる異なる使用例に実際に到達することができます。特に企業顧客の一部では、ビジネス内の使用例やそれらのビジネスのエンドユーザーにも到達することができます。

ですから、私たちは実際にプラットフォームをAGIの恩恵をすべての人に届けるという私たちのミッションを完全に表現する方法として見ています。具体的に、プラットフォームが今日実際に含んでいるものは、私たちが持っている最大の製品は明らかに開発者プラットフォーム、つまりAPIです。多くの開発者、スタートアップエコシステムの大部分、そして現時点では多くのデジタルネイティブなFortune 500企業がこの上に構築しています。

また、政府や公共セクターにも販売する製品があります。それもすべてこの一部です。そして、プラットフォームにおける私たちの新興製品ラインは企業向け製品です。ですから、実際にコアAPIの提供以外にも、企業に直接販売することもあります。

興味深いです。そして、さらに突っ込んで言うと、B2Bは実際にOpenAIのミッションにとって非常に中核的だと思います。AGIの恩恵を配布するということは、年間10倍多くの薬が出る世界に住みたいということです。

教育、公共サービス、市民サービスがますますすべての人に最適化される世界に住みたいです。そして、B2Bを通じてのみ実現される使用例の大きなカテゴリがあります。率直に言って、企業を有効にしない限り。Palantirについて話しましたが、これはおそらくPalantirでも同じ論理だと思います。

つまり、実際に現実世界で物事を実現させているのはそれらのビジネスだということです。ですから、それらを有効にし、加速させれば、それが本質的にAGIを配布する恩恵を受ける方法なのです。

企業での具体的な導入事例

おそらくOlivierさん、そこを詳しく見てみましょう。チャットの到達範囲は明らかに広く、何十億人ものユーザーがいます。しかし企業については、その点について教えてください。おそらく顧客事例を一つか二つ詳しく見て、私たちが変革を支援した組織について、どのような層で話していただけますか。

振り返ってみると、私たちは数年前にAPIでB2B取り組みを開始しました。最初の顧客は、スタートアップ、開発者、インディーハッカー、つまり極めて技術的に洗練された人々でした。彼らは本質的にクールな新しいものを構築し、取れる巨大な市場リスクを取っていました。

私たちにはまだそのカテゴリの顧客が多数いて、彼らを愛し、彼らと一緒に構築し続けています。それに加えて、過去数年間で、伝統的な企業やデジタルネイティブとより多く連携してきました。基本的に、みんながChatGPTで目を覚まし、これらのモデルが機能していることを理解しました。多大な価値があり、企業内で多くの使用例を本質的に見ることができました。

私が最も気に入っている例をいくつか挙げてみます。非常に新鮮で、非常にクールなものの一つです。私たちはT-Mobileと多く連携してきました。T-Mobile、アメリカの大手通信事業者です。T-Mobileには巨大なカスタマーサポート負荷があります。人々が「なぜこの金額が請求されたのか」とか「携帯電話が機能しなくなった」などと尋ねるような。その負荷の大部分が音声通話です。人々は誰かと話したがります。

ですから、彼らにとって、本質的により多くを自動化し、人々が自分のサブスクリプションをデバッグするのを自分でできるように支援することは非常に大きなことでした。

ですから、私たちは過去1年間、T-Mobileとほぼ連携してきました。基本的にテキストサポートだけでなく、音声サポートも自動化しました。そして今日、T-Mobileアプリには機能があり、電話をかけると実際にはOpenAIモデルが舞台裏で処理します。それは本当に超自然的に聞こえ、人間のような音、レイテンシ、品質を持っています。

それは本当に楽しかったです。2番目のものは非常に――

その点で、フォローアップ質問をしてもいいですか。テキストモデル、音声モデル、いつか動画モデルもT-Mobileに導入されるかもしれません。しかし、モデルの上または隣接するもので、例えばT-Mobileを支援したかもしれないことは何でしょうか。

やっていることはたくさんあります。まず第一に、企業の購買者の立場に立つ必要があります。彼らの目標は、カスタマーサポートを自動化し、削減し、最適化することです。そして、モデルからトークン入力、トークン出力への変換は困難です。

ですから、まず多くの設計、システム設計があります。実際に現在、私たちを大いに支援しているフォワードデプロイエンジニアがいます。フォワードデプロイエンジニア。つまり――そうですね、それは――よく知っています。Palantirからその用語を借りました。それは素晴らしい用語です。あなたはPalantirでFDでしたか。私はFDではありませんでした。開発側と呼ばれていたと思います。ソフトウェアエンジニアリングのようなものです。私もPalantirではインターンだけでした。しかし、それは素晴らしい用語です。

私たちが人々に求めていることを正確に表現していると思います。つまり、顧客と非常に深く関わり、正直に言って、彼らのシステムに特化したものを構築することです。彼らはこれらの顧客に配備されます。しかし、T-Mobileで非常に効果的だったため、私たちはそのチームをかなり成長させ、雇用しています。4年間の私の人生でした。フォワードデプロイでした。しかし、続けてください。

ですから、フォワードデプロイエンジニアリング。フォワードデプロイエンジニアと彼らが行っているシステムや統合の種類は、まず、それらのモデルを調整する必要があることです。それらのモデルは、CRMや何が起こっているかについて何も知らないだけではありません。

ですから、モデルを多くの異なるツールに接続する必要があります。企業内のそれらのツールの多くは、APIやクリーンなインターフェースさえ持っていません。第三者システムに公開されるのは初めてです。ですから、APIゲートウェイ、ツール、接続の立ち上げが多くあります。

次に、本質的に何が良いかを定義する必要があります。エクササイズを皆さんに入れると、ゴールデンセットの評価を定義することは、聞こえるよりも簡単です。聞こえるよりも難しいです。ですから、私たちは彼らと多くの時間を費やしてきました。評価は重要です。評価は非常に重要です。特に、オーディオ評価。評価は、評価し、正しく行うのが非常に困難です。

しかし、ここでの使用例の大部分は実際にオーディオです。5分間の通話転送があり、実際に正しいことが起こったかどうかをどのように知るのでしょうか。これはかなり難しい問題です。とても難しいです。そして実際に、顧客体験の品質を確定し、自然に感じるまで。ここで、レイテンシと中断が本当に重要な部分です。

私たちは先週GAでAPIをリアルタイムAPIとして出荷しました。数週間前だったと思います。先週だったと思います。これは本当に美しいエンジニアリングの作品です。舞台裏には本当に優秀なチームがいました。これにより、基本的に、奇妙な中断やラグなしに、最も自然な音の音声体験を得ることができます。そこで、本質的に物事がずれていることを感じることができます。

ですから、それらすべてを組み合わせると、本当に良い体験が得られます。それはモデルだけよりもはるかに多くのものです。実際にT-Mobile体験から得た本当に素晴らしいことの一つは、実際に彼らと連携して私たちのモデル自体を改善することです。例えば、先週のリアルタイムGAで、明らかに新しいスナップショット、GAスナップショットをリリースしました。

実際にモデルに取り入れた改善の多くは、T-Mobileからの学習から生まれました。他の顧客からの他の変更も多く取り入れていますが、T-Mobileに非常に深く組み込まれ、彼らにとって何が良いかを理解できたため、それを私たちのモデルの一部に持ち込むことができました。それは理にかなっています。

ですから、私たちは数千万人、場合によっては数億人のユーザーを持つ大きな顧客と連携しており、ビフォー・アフターはサポート側、内部の技術サポートと顧客サポートの両方にあります。理にかなっています。皆さんが共有できる他の例はありますか。私はAmgenがとても好きです。Amgen、ヘルスケア事業です。

ですから、私たちはヘルスケア企業とかなり連携しています。Amgenは大手ヘルスケア企業の一つです。彼らはLAを拠点とし、がんや炎症性疾患の薬を専門としています。私たちは本質的にAmgenと連携して、基本的に薬物開発と会話プロセスを加速させています。ノーススターはかなり大胆です。

Amgenと深く組み込まれて彼らのニーズを理解することは本当に興味深いことです。それらのヘルスケア企業を見ると、大きく2つのニーズのバケットがあるように感じます。1つは純粋なR&Dです。大量のデータを見て、それをテストしようとする非常に賢い科学者がいます。それが1つのバケットです。

2つ目のバケットは、他の業界でより一般的な、純粋な管理、文書作成、文書記述作業です。R&Dチームが薬のレシピを本質的にロックした時点で、その薬を市場に出すのは多大な作業です。価値ある規制機関に提出し、多くのレビューを受ける必要があります。

そして、それらの問題を本質的に見たとき、モデルが何ができるかを知ったとき、それらのチームの作業を自動化し、本質的に拡張する多くの恩恵、多くの機会を見ました。ですから、AmgenはGPT-5の主要顧客の一つでした。

つまり、新しい薬がより早く開発されれば、これは何億人もの生命に関わる可能性があるということです。まさにその通りです。巨大な影響です。ですから、それは、企業を有効にする必要がある影響の種類の良い例の一つだと思います。そして、私たちはそのようなことをますます行うつもりです。

率直に言って、個人的なレベルで、本質的に現実世界で人々が得る薬を倍増させるという小さな役割を果たすことができれば、それはかなり良い成果のように感じます。巨大です。巨大、巨大です。あなたも1つ持っていたことを知っています。

私のお気に入りの最近の導入の一つは、実際にロスアラモス国立研究所とのものです。これは、米国政府がニューメキシコ州ロスアラモスで運営している政府の国立研究所です。40年代と50年代にマンハッタンプロジェクトが行われた場所でもあり、当時は秘密プロジェクトでした。

その後、彼らはそれを都市とプログラムとして正式化し、現在はかなり大規模な国立研究所です。これは非常に興味深いのは、まず、ここでの影響の深さが私には想像できないほどで、Amgenやこれらの他の大企業の規模のようなものです。しかし、明らかに彼らはそこで多くの実際の新しい研究を行っているので、多くの新しい科学です。国防省や防衛用途でも多くのことを行っています。だから非常に激しい、非常に激しいものです。

しかし、実際にこれについて非常に興味深い他のことは、これが私たちが行った非常に特注で新しいタイプの導入の物語でもあったことです。彼らは政府研究所であり、非常に制限的で高いセキュリティと高い許可があるため、通常の導入を行うことができませんでした。

国家安全保障研究を行っている人々が私たちのAPIにアクセスすることはできません。ですから、実際にVenadoと呼ばれる彼らのスーパーコンピューターの一つにカスタムオンプレミス導入を行いました。これには実際に、FDEの一部、また私たちの開発者チームの多くとの非常に特注の作業が含まれ、実際に私たちの推論モデルの一つであるo3を彼らの研究所に、エアギャップされたスーパーコンピューターVenadoに持ち込み、実際にそれを導入し、彼らのハードウェア、ネットワークスタック上で動作するように設置し、この特定の環境で実際に実行することでした。

実際に非常に興味深かったのは、文字通りモデルの重みを物理的に彼らのスーパーコンピューターに持ち込む必要があったことです。ちなみに、携帯電話や他の電子機器を持ち込むことが許可されていない非常にロックダウンされた環境で、良い理由でそうなっています。だから、それは非常にユニークな挑戦だったと思います。

そして、この導入についてのもう一つの興味深いことは、それがどのように使用されているかということです。非常にロックダウンされていてオンプレミスであるため、実際に彼らが何をしているかについて多くの可視性はありませんが、フィードバックは得ています。

実際にいくつかのテレメトリはありますが、それは彼ら自身のシステム内にあります。しかし、それがさまざまなことに使用されていることは知っています。実験の加速を支援するために使用されており、彼らが処理しようとしている大量のデータを含む多くのデータ分析用途、多くのノートブックを実行しています。

実際に思考パートナーとして使用されており、これは私にとって非常に興味深いことです。o3はモデルとしてかなり賢いです。そして、これらの人々の多くは本当に困難で新しい研究問題に取り組んでいます。多くの場合、彼らはo3と一緒に行ったり来たりして、実験設計について、実際に何に使用すべきかについて使用しています。これは、私たちの古いモデルについては実際に言えなかったことです。

ですから、国立研究所での多くの異なる用途に使用されています。そして、他の興味深いことは、実際にロスアラモスと他の研究所、ローレンス・リバモア、サンディアの間で共有されていることです。なぜなら、それらがすべてリモートで接続できるスーパーコンピューターセットアップだからです。

興味深いです。つまり、私たちは数千万人、場合によっては数億人に触れる可能性のある3つのかなり大規模な企業導入を見てきました。しかし、その一方で、数週間前に出たMITレポートがあります。AIデプロイメントの95%は機能しません。市場を数日間揺るがすような多くの恐ろしい見出しがありました。

これを視点に入れると、機能するデプロイメントごとに、おそらく機能しないものが多数あるということです。おそらくこれについて話すことができるでしょう。成功する企業デプロイメント、成功する顧客デプロイメントを構築するのに何が必要か、そして、これらの大企業すべてにサービスを提供した経験に基づく反実仮想について。その時点で、数百の企業と連携したことがあると思います。数百です。

パターンマッチングをします。私が見てきた成功の明確な先行指標は何でしょうか。第一は、トップダウンの賛同と、本質的にタイガーチームの明確なグループを有効にすることの興味深い組み合わせです。時にはOpenAIと企業従業員の混合です。

典型的に、T-Mobileを例に取ると、トップリーダーシップは極めて退屈で、優先事項でした。しかし、チームが組織して、小さく始めたいなら小さく始めて、本質的にそれをスケールアップできるようにしました。それが第一部です。トップダウンの賛同とボトムアップと呼ばれるタイガーチーム。

タイガーチーム、技術スキルと組織知識、制度知識を持つ人々の混合です。企業で面白いのは、カスタマーサポートの良い例として、私たちが発見したのは、知識の大部分が人々の頭の中にあることです。これはおそらく一般的に持っているものですが、カスタマーサポートを考えると、すべてが完璧に文書化されているなどと思うでしょう。現実は、標準的な操作手順、SOPが人々が言ったよりも大きいということです。

ですから、技術と主題専門家の混合であるタイガーチームがない限り、何かを立ち上げるのは本当に困難です。それが1つです。2つ目は評価第一です。良い評価として定義するものが何であれ、それは人々が目指すべき明確に明確な共通の目標を与えます。顧客が良い評価を思いつくことができない場合、それは動く標的です。本質的に、それを達成したかどうかです。

評価は、見た目よりもはるかに困難です。そして評価は多くの場合、ボトムアップで来る必要があります。なぜなら、これらのことはすべて実際のオペレーターの頭の中にある種のものだからです。実際に、評価がどのようになるべきかのトップダウンの義務付けを持つのは非常に困難です。多くは、ボトムアップの採用が必要です。

ですから、私たちは評価についてかなりのツールを扱っています。評価製品があり、本質的にその問題を解決するか、できるだけ簡単にするために、より多くに取り組んでいます。

最後のことは、本質的に登ることを支援したいということです。評価があり、目標は99%に到達することです。46%から始まります。そこにどうやって到達するのでしょうか。ここで、率直に言って、それを以前にやったことがある人々からの知恵の混合のようなものだと思います。その多くは、時には科学よりも芸術のようなものです。

モデルの行動の過程を知ること、時には私たち自身がモデルを微調整する必要があること、明確な制限があるときに、忍耐強く、そこまでの道を歩み、そして出荷すること。

少し詳しく見てみることはできますか。私たちが多く考えていることの一つは、より広範な自律性ですよね。一方で、サンフランシスコでは、SFの一部から他の部分まで完全に自律的に車で行くことができます。人間は関与しません。ボタンを押すだけです。彼らは数十億回の乗車を行いました。Tesla FSDで35億回の乗車だったと思います。数百万、数千万回の乗車をほぼ行ったと思います。それは多くの自律性です。

物理的世界では、デジタル世界とは対照的に、私は今オンラインでチケットを予約することができません。オペレーターにチケットを予約してもらおうとすると、あらゆる種類の問題が発生します。身体的安全のハードルははるかに高いです。生命が危険にさらされているため、身体的安全のハードルは人間の能力よりも高いです。デジタル安全のハードルはそれほど高くありません。失うのはお金だけで、誰の生命も危険にさらされないからです。

しかし、2025年において、物理的自律性がデジタル自律性よりも進んでいるのは直感に反します。技術レベルで、なぜそうなのでしょうか。より簡単に聞こえるはずのことが、実際にははるかに困難なのはなぜでしょうか。

私は、ここで2つのことが作用していると思います。自動運転車との類推が本当に気に入っています。なぜなら、それらは実際に私が最近使ったAIの最高のアプリケーションの一つだったからです。しかし、2つのことが作用していると思います。そのうちの一つは、正直に言って、タイムラインです。私たちは自動運転車に非常に長い間取り組んできました。

2014年に遡ると、これの出現のようなもので、みんなが「ああ、5年で起こる」と言っていました。結局、それには10年、15年ほどかかりました。技術が本当に成熟するまでには長い時間がかかりました。2015年や2018年頃には、それが起こらないように感じた暗黒時代がおそらくあったと思います。幻滅の谷です。そうです。

そして今、ついにそれが導入されているのを見ており、これは本当にエキサイティングです。しかし、それは最初の研究から10年、おそらく20年もかかっています。一方、AIエージェントは本当にここで1日目のようなものだと思います。ChatGPTは2022年に出たばかりなので、約3年、3年未満前です。

実際に、AIエージェントで考えていることは、昨年後半にo1プレビューモデルをリリースしたときに開始された推論パラダイムで本当に始まったと思います。ですから、実際にAIエージェントでのこの推論パラダイム全体と、それらがもたらす堅牢性は、本当に1年未満、実際には1年未満で展開されただけだと思います。

あなたのブログ投稿にあったチャートが本当に気に入りました。現在、傾きが大幅に異なっています。自動運転は非常に早期に始まりました。傾きは少し遅いようですが、今では約束の地に到達しています。しかし、私たちはAIエージェントで非常に最近始めたばかりで、傾きは信じられないほど急で、おそらくある時点で交差が見られるでしょう。しかし、これらのことを探求するのに本当に1年しかありませんでした。

特にコーディング作業を見ると、私たちはすでに交差していないと思いますか。良い指摘です。あなたのチャートは実際にAIエージェントが自動運転より下にあることを示していますが、Y軸は何でしょうか。いくつかの尺度で、実際にAI製品、AIエージェント製品が現時点でWaymoよりも多くの収益を上げていても驚かないでしょう。

Waymoはたくさん稼いでいましたが、新興スタートアップをすべて見て、ChatGPTとそこで起こっているサブスクリプションの数などを見てください。ですから、おそらく実際に交差しており、数年後には非常に、非常に異なって見えるでしょう。Y軸は具体的な感じられる自律性です。客観的ではありません。どう感じるかです。収益は良いものです。おそらく収益でそれをやり直すべきでしょう。

これについて言及したかった2番目のことがあります。それは、これらのものが動作する足場と環境です。実際に、自動運転の初期の頃を覚えていますが、自動運転に関する研究者の多くは、自動運転に対応するために道路自体を変更しなければならないと言っていました。

自動運転車が相互作用できるように、どこにでもセンサーがあるかもしれません。これは振り返ってみると過剰だと思います。しかし、実際に自動運転車は世界で動作するためのかなりの足場を持っていると思います。完全に無制限ではありません。道路があり、道路は存在し、かなり標準化されています。信号機があります。人々は一般的にかなり正常な方法で動作します。学習できる交通法則がすべてあります。

一方、AIエージェントは何もない真ん中に落とされ、それらの周りを感じ取らなければなりません。Olivierが言ったことから離れて、私の直感では、実際に機能しない企業導入の一部は、これらのエージェントが相互作用するための足場やインフラストラクチャを持っていない可能性があります。

私たちが行った本当に成功した導入の多く、私たちのFDEがこれらの顧客の一部で最終的に行うことの多くは、ほとんどプラットフォームや何らかの足場、コネクタを作成し、モデルがより標準化された方法で相互作用できるものを持てるようにデータを整理することです。

ですから、自動運転車は実際に彼らの導入の過程で道路でこれをある程度持っていたという私の感覚です。しかし、実際にAIエージェント空間ではまだ非常に初期だと思います。多くの企業、多くの会社が足場の準備ができていないだけで驚かないでしょう。ですから、AIエージェントをそこに落とすと、それは実際に何をすべきかわからず、その影響は限定的になります。

ですから、この足場がこれらの会社全体で構築されれば、導入も加速すると思います。しかし、先ほどの私たちの点に戻ると、減速はないと思います。物事はまだ非常に速く動いています。

GPT-5の開発とリアルタイムAPI

素晴らしいです。自律性を3部構造として考えてきました。知覚があります。推論、つまり脳があります。そして足場、物事を機能させる最後の一歩があります。おそらく2番目の部分、つまり皆さんがGPT-5で構築している推論、ジュースについて詳しく見てみることができるでしょう。

最近、巨大な取り組み、おめでとうございます。皆さんが初めてモデルや一連のモデルではなく、完全なシステムをローンチしました。その点について話してください。つまり、その開発の全体的な流れ、何に焦点を当てたのか。正直に言って、ベンチマークはすべて飽和しているように見えます。明らかに、ベンチマーク以上のものに焦点を当てていました。

ノーススターは何ですか。GPT-5について、スープからナッツまで教えてください。それは長い間、多くの人々の愛の仕事でした。あなたが指摘したように、GPT-5は驚くほど知的だと思います。スイートベンチなどのベンチマークを見ると、かなり高くなっています。しかし、私にとって同じくらい重要で影響的だったのは、クラフト、スタイル、トーン、モデルの行動だったと思います。

ですから、能力、知性、モデルの行動です。モデルの行動について、これは私たちが何ヶ月も多くの顧客と非常に密接に連携してきた初めてのモデル、大きなモデルリリースだと思います。本質的に、モデルの具体的なブロック、具体的なブロッカーは何かをよりよく理解するために。

多くの場合、それははるかに知的なモデルを持つことではなく、指示によりよく従うモデル、何かを知らないときにノーと言う可能性が高いモデルです。ですから、GPT-5でのその非常に密接な顧客フィードバックループは見ていて非常に印象的でした。過去数週間でGPT-5が得ているすべての愛は、本質的に構築者がそれを感じ始めていると思います。

それを見ると、非常に知的だが高尚で学術的なモデルに戻るのは本当に困難です。構築していく中で行ったトレードオフはありますか。GPT-5を構築する際に行った最も困難なトレードオフは何でしょうか。

実際に非常に明確なトレードオフは、正直に言って、まだ反復していると思いますが、推論トークンとどのくらい長く考えるかとパフォーマンスとの間のトレードオフです。正直に言って、これは推論モデルのローンチ以来、顧客と連携してきたことだと思います。これらのモデルは非常に、非常に賢く、特にすべてのこの思考時間を与えれば。

GPT-5 Proに関するフィードバックも非常にクレイジーだったと思います。これらの未解決の――Andrejが昨夜素晴らしいツイートをしました。Samがそれをリツイートしたのを見ました。しかし、他のモデルが扱えなかったこれらの未解決の問題を、GPT-5 Proに投げると、それがワンショットでそれをやってのけるのは非常にクレイジーです。

しかし、ここでのトレードオフは10分間待つことです。それはかなり長い時間です。これらのものは、より多くの推論時間でとても賢くなります。しかし、これらのビジネス用途の一部でAPI側の製品ビルダーとして、そのトレードオフを管理するのはかなり困難だと思います。私たちにとって、そのスペクトラムのどこに落ち着きたいかを理解するのは困難でした。

ですから、モデルがどのくらい考えるかとどのくらい知的になるべきかについて、いくつかのトレードオフを行わなければなりませんでした。製品ビルダーとして、ユーザーが世界最高の答えを10分間待つことに満足しないかもしれない実際のレイテンシトレードオフに対処しなければならないからです。まったく待つことなく、劣った答えでも大丈夫かもしれません。

そうですね、GPT-5とGPT-5思考の間でも、時々非常に忍耐強くないので切り替えなければなりません。より簡単な答えがASAPで欲しいだけです。スキップする機能がありますよね。その通りです。GPTで、忍耐強くないので、より簡単な答えが欲しいときのように。その通りです。

4週間経って、GPT-5のフィードバックはどうですか。フィードバックは非常にポジティブだったと思います。特にプラットフォーム側で、それを見るのは本当に素晴らしいことでした。Olivierが言及したことの多くが、顧客からのフィードバックに出てきていると思います。

モデルはコーディングに非常に優れており、さまざまなタスクを推論することに非常に優れています。しかし、特にコーディングの使用例では、特にしばらく考えるとき、他のモデルが解決できない問題を通常解決します。だから、それは大きなポジティブなフィードバックポイントでした。

堅牢性と幻覚の減少は、本当に大きなポジティブフィードバックでした。幻覚が多くの場合基本的にゼロになったことを示す評価があると思います。完璧ではなく、まだやるべき作業はたくさんありますが、そこでの推論のためでもあると思いますが、モデルがノーと言う可能性が高くなり、答えを幻覚する可能性が低くなります。だから、それも人々が本当に気に入ったことです。

他のフィードバックは指示従順に関するものでした。指示従順に本当に優れています。これは実際には、私たちが取り組んでいる建設的なフィードバックに漏れ出すもので、構築従順にとても優れているため、指示従順で人々がプロンプトを調整する必要がある、またはほとんど文字通りすぎることです。

それは実際に興味深いトレードオフです。開発者に何が欲しいか尋ねると、もちろんモデルに指示を求めます。しかし、非常に文字通りなモデルを持つと、本質的に何を望むかを非常に明確に表現することを強制されます。そうでなければ、モデルが横道にそれる可能性があります。ですから、それは興味深いフィードバックでした。

それは、開発者とプラットフォーム顧客が、より良い指示従順を求める猿の手のようなものです。はい、本当に良い指示従順を与えますが、それは非常に厳密に従うようなものです。ですから、それは明らかにチームが実際に取り組んでいることです。

ちなみに、この良い例は、一部の顧客がこれらのプロンプトを持っていたことです。GPT-5をテストしていたとき、得た否定的なフィードバックの一つは、モデルが非常に簡潔すぎるということでした。何が起こっているのかと思いました。なぜモデルがそんなに簡潔なのでしょうか。

そして、彼らが他のモデルからの古いプロンプトを使用していることに気づきました。他のモデルでは、モデルに簡潔になるように本当にお願いしなければなりませんでした。だから、簡潔になってください、本当に簡潔になってください、答えを短くしてくださいのような10行がありました。それをGPT-5に与えると、ああ、この人は本当に簡潔になりたがっているということになります。

ですから、応答は1文のようで、それは短すぎました。ですから、簡潔になることに関する追加のプロンプトを削除するだけで、モデルははるかに良い方法で、実際に彼らが最終的に求めていたものにはるかに近い方法で動作しました。正しいプロンプトを書くことはまだ重要であることがわかります。はい、プロンプトエンジニアリングはまだ非常に、非常に重要です。

GPT-5の建設的なフィードバックについて、実際にかなりの量もありました。それも私たちはすべて取り組んでいます。そのうちの一つは、私が次のスナップショットが出てこれの一部を修正することを本当に楽しみにしているのは、コードの品質と、彼らが使用するかもしれない小さなコード、パラダイムやイディオムのようなものです。彼らが使用していたコードのタイプとパターンに関するフィードバックがあったと思います。それも私たちが取り組んでいることだと思います。

そして、他のフィードバックの一部で、内部的にすでに良い進歩を遂げていると思うのは、推論トークンと思考とレイテンシと知性の間のトレードオフに関するものです。特に簡単な問題では、通常多くの思考は必要ありません。思考は理想的にはもう少し動的であるべきです。そして、もちろん、私たちは常にできるだけ少ない推論トークンにできるだけ多くの推論とパフォーマンスを詰め込もうとしています。だから、それも下がっていくと思います。

巨大なおめでとうございます。これは、私たちの会社の多くにとって進行中の作業であることを知っています。彼らはGPT-5で信じられない成果を上げています。そのうちの一つはExpo、サイバーセキュリティ事業で、それは巨大な――そのチャートを見ました。それはかなりクレイジーでした。彼らが以前に使用していたものからの巨大、巨大なアップグレードです。彼らはすぐに新しい評価が必要になると思います。その通りです。新しい評価が必要になります。すべては評価についてです。

マルチモーダルモデルとカスタマイゼーション

マルチモダリティの側面について、明らかに皆さんは先週リアルタイムAPIを発表しました。T-Mobileがそこでの注目顧客の一つだったのを見ました。それについて話してください。明らかにテキストモデルが先頭集団を率いていますが、その後オーディオと動画があります。マルチモーダルモデルの進歩について話してください。次の大きなアンロックはいつ期待すべきで、それはどのようなものでしょうか。

良い質問です。チームはマルチモダリティで素晴らしい進歩を遂げています。音声、画像、動画で、率直に言って、最後の世代のモデルはかなりクールな使用例をアンロックしています。受け取ったフィードバックの一つは、テキストが知性でそれほど先頭に立っていたため、音声では人々がモデルが多少知性が劣ると感じていたことです。

実際にそれを見るまで、テキスト対音声でより良い答えを持つのは奇妙に感じます。それは現在私たちが持っている焦点です。そのギャップの一部を埋めたと思いますが、確実に完全なギャップではありません。テキストに追いつくことが一つです。

2番目で、絶対に魅力的なのは、モデルが現在、簡単なカジュアルな会話、コーチ、セラピストとの会話で優秀であることです。私たちは基本的に、実際の仕事で経済的に価値のあるセットアップでモデルにより良く話すことを教えなければなりませんでした。

例を挙げると、モデルはSSNが何かを理解し、SSNをスペルすることを意味する必要があります。一つの数字がファジーであれば、推測ではなく実際に繰り返す必要があります。私たちの音声に持っているそのような多くの感覚があり、私たちは現在モデルに教えています。

それは実際に顧客との継続的な作業です。モデルを実際の顧客サポートコール、実際の設定学校に直面させるまで、それらのギャップを感じるのは本当に困難です。それも最優先事項です。

これは完全にスクリプトから外れていますが、音声モデル、特にリアルタイムAPIで出てくる興味深い質問は、以前は人々が音声入力を取り、それをテキストに変換し、次に何らかの知性の層を持っていたことです。その後、それを再生するテキスト音声モデルがあります。これら3つの部分のステッチでした。

リアルタイムAPI、皆さんはそれらすべてを統合しました。どのように起こるのでしょうか。多くのロジックがテキストで書かれているからです。ブール論理や関数呼び出しはテキストで書かれています。リアルタイムAPIでどのように動作するのでしょうか。

それは素晴らしい質問です。リアルタイムAPIを行うべき理由は、ステッチモデルを見たからです。ステッチモデル。リアルタイムAPI。ステッチ。音声からテキスト、思考、テキストから音声をステッチして呼びます。本質的にいくつかの問題を見ました。一つ、遅さ、より多くのホップ本質的に。二つ、信号の損失、クローズステッチモデルのように。音声からテキストモデルは知性が劣ります。感情を通過させます。まさに。パーズ。

実際の音声、電話をかけているとき、本質的に、それらの信号は非常に重要です。私たちが抱えている課題の一つは、あなたが言及したもので、テキスト対音声で本質的に少し異なるアーキテクチャを意味することです。それは私たちが積極的に取り組んでいることです。しかし、音声体験を本質的に自然に聞こえるようにすることから始め、本質的に本番環境に置くことに快適に感じるポイントまで持って行き、その後、モダリティ全体で本質的にオーケストレーションロジックを統一するために後方に作業することが正しい決定だったと思います。

そして明確にするために、多くの顧客はまだこれらをステッチしています。最後の世代で機能したもののようです。しかし、私たちが見ることに興味があるのは、より多くの顧客がリアルタイムアプローチに移行することです。どれほど自然に聞こえ、どれほど低いレイテンシかのため。特にモデルの知性をアップレベルしながら。

しかし、一歩下がっても、これが機能することは私にとって非常に驚異的だと言います。これらのLLMが全く機能することは驚異的だと思います。多くのテキストでトレーニングし、次のトークンを自己回帰的に思いつくだけで、非常に知的に聞こえます。それ自体が驚異的です。

しかし、この音声から音声のセットアップが実際に正しく機能することは、実際にさらに驚異的だと思います。文字通り誰かが話しているオーディオビットを取り、ストリーミングし、モデルに入れ、その後オーディオビットを生成し返しているからです。私にとって、これが全く機能することは実際にクレイジーです。アクセントやトーン、ポーズなどのことを理解でき、その後サポートコールなどを処理するのに十分知的であることは言うまでもありません。

テキスト入力、テキスト出力から音声入力、音声出力に移行したら、それはかなりクレイジーです。私たちのポートフォリオには、これらのモデルを使用している多くの会社があります。カスタマーサポート側のParloa、インフラ側のLiveKit。音声から音声モデルが対処できる使用例が見え始めています。困難なもの

の多くは、あなたが「ステッチモデル」と呼んでいるものでまだ実行されています。しかし、すべてがリアルタイムAPIになる日が遠くないことを願っています。ある時点で起こるでしょう。

実際に、おそらくそれはモデルカスタマイゼーションについて話すことの良いセグエです。非常に多様な企業顧客がいると思うからです。数百の顧客、もしかするとそれ以上と言いましたよね。それぞれに異なる使用例、異なる問題セット、異なる呼び出し封筒パラメータがあります。レイテンシ、電力、その他。どのように対処しますか。

彼らのために素晴らしいモデルを素晴らしくするためにカスタマイズされたバージョンを必要とする企業にOpenAIが提供するものについて話してください。

モデルカスタマイゼーションは、実際に最初からAPI プラットフォームで非常に深く投資してきたものです。ChatGPT以前の日々でも、実際に教師あり微調整APIが利用可能で、人々は実際にそれを素晴らしい効果で使用していました。

モデルカスタマイゼーション周りで最もエキサイティングなことは、明らかに顧客とよく共鳴することです。自分のカスタムデータを持ち込み、o3やo4-miniや何かやGPT-5でさえ、自分のニーズに適した独自のカスタムバージョンを作成できるからです。非常に魅力的ですが、最近の開発で最もエキサイティングだと思うのは、強化微調整の導入です。

昨年のクリスマスの12日間で発表したもので、その後GAにしており、それを継続的に反復しています。それは何か、私たちのために分解してください。実際に面白いことに、強化微調整という用語を私たちが作ったと思います。私たちが発表するまでは実際のものではありませんでした。今では定着しています。いつも見ています。私たちが議論していたときのことを覚えています。「RPIについてはわからない」と言っていました。冗談ではありません。

強化微調整。それは本当に微調整プロセスに強化学習を導入することです。元の微調整APIは教師あり微調整と呼ばれるものを行います。SFTと呼んでいます。強化学習を使用していません。教師あり学習を使用しています。

通常、それは多くのデータ、多くのプロンプト完了ペアが必要であることを意味します。モデルがどのように動作すべきかを本当に監督し、正確に伝える必要があります。その後、微調整APIでトレーニングすると、その方向により近づけます。

強化微調整は、スループにRLまたは強化学習を導入します。はるかに複雑で、はるかに気まぐれですが、桁違いにより強力です。だから、それが実際に多くの顧客と本当に共鳴したものです。

RFTを使用すれば、議論は自分の使用例に特化したカスタムモデルを作成することよりも少なくなります。実際に自分のデータを使用し、実際にRLをクランクし、RLのクランクを回して、自分の特定の使用例のための実際にクラス最高のモデルを作成できます。それがここでの主な違いです。

RFTでは、データセットは少し異なって見えます。プロンプト完了ペアの代わりに、非常に段階的なタスクのセットが本当に必要です。ここでも使用できる非常に客観的な段階評価者が必要です。それは実際に昨年投資してきたもので、実際に多くの顧客がこれで本当に良い結果を得ているのを見てきました。

さまざまな分野の顧客について話しました。金融サービス分野のスタートアップであるRogoです。彼らは非常に洗練されたAIチームを持っています。AIプログラムを運営するためにDeepMindから何人かを雇ったと思います。彼らはRFTを使用して、金融文書の解析、それに関する質問への回答、そしてそれらに関するタスクの実行において、クラス最高の結果を得てきました。

税務分野でこれを行っているAccordanceという別のスタートアップがあります。彼らはTaxBenchと呼ばれる評価をターゲットにしていると思います。これはCPAスタイルのタスクを扱うものです。

非常に段階的なセットアップに変換できるため、実際にRFTクランクを回すことができ、私たちのRFT製品を使用してTaxBenchでSOTA結果を得ることができると思います。ですから、自分の使用例に何かをカスタマイズするだけの議論から、実際に自分のデータを活用して、自分のビジネスにとって気にかけることのために、クラス最高の、おそらく世界最高のモデルを作成することに議論が移っています。

ベースモデルが指示従順において非常に優秀になっているため、行動操縦については、その時点で微調整する必要がないように感じます。何が欲しいかを説明でき、モデルはそれにかなり良いです。しかし、実際の能力の境界を押すことについて、私の心はRFTがかなり標準になるということです。

自分の分野で実際に知性をかなり高いポイントまで押し上げているなら、ある時点で、カスタム環境で本質的に島を作る必要があります。

それまで遡って、これらの企業の一部のトップダウン対ボトムアップのポイントでも、RFTに最終的に必要なデータの多くは、実際に行っている正確なタスクについての非常に複雑な知識と、それをどのように段階付けするかの理解を必要とします。その多くは実際にボトムアップから来ます。

これらのスタートアップの多くが、適切なタスクと適切なフィードバックを得るために、彼らの分野の専門家と連携して、これらのデータセットの一部を作成しようとするのを知っています。

それでは、私のお気に入りのセクションである迅速回答質問に移りましょう。多くの素晴らしい友人たちから皆さんへの質問をいただきました。Altimeterのお気に入りゲーム、ロング・ショートゲームから始めます。

長期投資したいビジネス、アイデア、スタートアップを選んでください。そして同じく、賭けに反対するもの、現実よりも誇大宣伝が多いものをショートしてください。最初に準備ができた人、ロング、ショート。

私のロングは実際にAI分野ではないので、これは少し異なります。しかし、私のショートはAI分野にあります。実際に私はeスポーツを非常にロングしています。

「eスポーツ」とは、ビデオゲーム周りで出現している全体的なプロゲーミング業界を意味します。私の心に非常に近く親しく、多くのビデオゲームをプレイし、これを多く見ています。ですから、明らかに私はこれについて非常に詳しいです。しかし、eスポーツには信じられない未開拓の可能性と、この分野で得られる信じられない成長があると実際に思います。

具体的に、私が意味するのは、本当に大きなものはLeague of Legendsです。Riot Gamesが出すすべてのゲームで、実際に独自のプロリーグを持っています。実際にプロトーナメントを持っており、信じられないでしょうが、今はスタジアムを借りています。しかし、若者と若い子供たちが見ているもの、彼らの時間がどこに向かっているかを見ると、主にこれらのものに向かっています。

彼らは多くの時間をビデオゲームに費やしています。サッカーやバスケットボールよりもeスポーツを多く見ますか。そうです、そうです、そうです。これらの成長数も。実際に私はこれらのイベントのいくつかに行ったことがあり、非常に興味深いです。彼は自分のロングに非常にコミットしています。

ですから、彼らは人々が電子スポーツを見に行くためにスタジアムを予約しています。そうです、そうです。私は文字通り、これらの一つを見るためにOracle Arena、古いWarriorスタジアムに行きました。COVIDの前ですか。COVIDの前でした。それは5年前です。6年前です。ですから、私はこれをしばらくフォローしており、実際にCOVIDで本当に大きな瞬間があったと思います。みんながビデオゲームをプレイしていたように。

それはもっとそうでした…今は少し下がってきたと思います。だから、過小評価されているように思います。誰も本当にそれを今評価していません。しかし、本当に、本当に離陸するすべての要素を持っています。

若者がそれをやっています。私が言う他のことは、アジアで絶対的に巨大だということです。韓国、中国でも絶対的に大きいです。私たちがOracle Arenaを借りたように、私の感覚では、アジアでは、サッカースタジアム全体を借り、プレイヤーが有名人のように準備されます。

とにかく、韓国文化が米国にも本当に進出してきているように、それは全体的なことの別の追い風だと思います。しかし、とにかく、eスポーツは成長の余地が多くあるため、注意を払うべきものだと思います。非常に予想外です。聞いて良かったです。

ショート。私のショートは少しスパイシーです。AI製品周りのツール全体のカテゴリーをショートしています。これは多くの異なるものを包含します。少し騙しているのは、これらの一部が既に実現し始めているからです。しかし、2年前は、評価製品やフレームワークやベクターストアのようなものだったと思います。私はそれらを非常にショートしています。

現在、他のAIモデル周りの追加のツールについて多くの追加の興奮があると思います。RL環境も現在本当に大きいと思います。残念ながら、私はそれらを非常にショートしています。そこで多くの可能性は実際に見ていません。強化学習とそれを適用することには多くの可能性を見ています。しかし、RL環境周りのスタートアップ空間は本当に困難だと思います。

主なことは、一つ、それは非常に競争の激しい空間だということです。それを運営している多くの人がいるだけです。そして二つ、過去2年間が私たちに示したもの何でも、この空間は非常に迅速に進化しており、モデルの次世代に本当に引き継がれる正確なスタックは何かを理解し適応しようとするのは非常に困難です。ツール空間にいるとき、それが非常に困難になると思います。今日の本当にホットなフレームワークや本当にホットなツールが、モデルの次世代で使用されないかもしれないからです。

同じパターンに気づいています。AIでブレイクアウトスタートアップを構築するチームは非常に実用的です。彼らは知的ではなく、完璧な世界などです。それは面白いです。私たちの世代が技術で基本的に始まったのは、技術が何年も何年もSaaS、クラウドなどで構築されてきた非常に安定した瞬間だったからだと思います。

ですから、私たちはある意味で、非常に良い抽象化とツールを設計することが理にかなっている非常に安定した瞬間で育てられました。なぜなら、どこに向かっているかの感覚があるからです。しかし、今日は非常に異なります。来年や2年後に何が起こるかわからないかのように待つことはしません。ですから、完璧なツールプラットフォームを定義することはほとんど不可能です。

そこには多くのものがあります。多くの宿題があります。Olivier、どうぞ。

ロング・ショート。私は過去1ヶ月間、子供たちの文脈で教育について多く考えてきました。基本的に人間の記憶を強調する教育をかなりショートしています。私はほとんどその教育を自分で受けてきたと言いながらも、歴史の事実、法的なことなど、多くを学びました。その一部は思考方法を形作ります。多くは、率直に言って、本質的に知識トークンです。

そして、その知識トークンは、他のアイテムがそれにかなり良いことがわかります。ですから、それをかなりショートしています。戦略がバイオニックであるとき、記憶が必要になるでしょう。頭の中に直接考えることができるだけです。まさに、まさに。

私が何をロングしているか。率直に言って、ヘルスケアはおそらく次の1年か2年でAIから最も恩恵を受ける業界だと思います。もっと言うでしょう。すべての成分が完璧な嵐のためにここにあると思います。

構造化データの膨大な量、それは基本的に製薬会社の心臓部です。Mauserは、そのようなデータを消化処理することに優秀です。管理重い、文書重い文化の膨大な量。

しかし同時に、非常に技術的で、非常にR&Dフレンドリーな企業、彼らが行うことの中心でテクノロジーが心臓部である企業のように。ですから、それについて非常に強気です。

これはライフサイエンスのようなものです。薬を生産している研究組織をライフサイエンス、研究組織を意味しますか。まさに。

過去20年、30年にわたって、これらの製薬やバイオテック企業が行っている作業を見ると、実際の研究はほんの一部で、そのうちの多くが管理や文書などのことになってしまいます。

その分野は、AIで何かが起こるのに非常に熟しているだけです。そして、それがAmgenや他の顧客で見ているものだと思います。まさに。そして、彼らがやりたいことでもありません。明らかにそこに規制があることは良いことですが、それは彼らが通過しなければならないページの大量があることを意味するだけです。

ですから、そのようなもののコストを本当に下げることができるテクノロジーがあるとき、それはただそれを引き裂くでしょう。そして、政府や機関が、一歩下がると、おそらく人間の進歩への最大のボトルネックの一つであることを理解するでしょう。

過去10年を振り返ると、画期的な薬がどれくらいあったでしょうか。それほど多くありません。その率を倍にしたら人生がどう違うでしょうか。本質的に。ですから、何が危険にさらされているかを理解すると、その分野でかなりの勢いが見られると思います。

多くの宿題がそこにもあります。次のもの。ChatGPT以外のお気に入りの過小評価されているAIツール。私はGranolaが大好きです。ああ、私の答えを盗みました。Granolaで非常に多くやります。

Granolaに2票です。何かのように、そうです。ChatGPT録画はどうですか。ChatGPTも好きですが、Granolaの写真のいくつかは、本当によくやられていると思います。Google Calendarとの統合全体が優秀です。

そして、転写と要約の品質がかなり良いです。Granolaをオンにしているだけですか。カレンダーがぎっしり詰まっているのを知っているからです。Granolaをオンにしているだけですか。面白いことに、内部的にはGranolaを使用していません。ほとんど個人的な生活でGranolaを使用しています。

デートで。冗談です。Granolaが実際に私のものになる予定でした。だから、Granolaに2票です。私の簡単な答えはCodexです。ソフトウェアエンジニアとして。最近非常に良くなっています。

Codex CLI、特にGPT-5で。特に私にとって、コーディングとの反復ループについてあまり時間に敏感でない傾向があります。ですから、Codex上でGPT-5に寄りかかることは本当に…興味深いです。

Codexの何が変わったのでしょうか。Codexも旅を経てきているからです。Codexはしばらく存在しています。1年以上前にローンチされたのを覚えています。Codexの何が変わったのでしょうか。

実際に私は…Codex CLIはしばらく存在しています。Codexについては1年未満だと感じます。Codexについては1年未満だと感じます。時間の膨張は非常にクレイジーで、これは…1年前にあったように感じます。

GPT-5で。ああ、あのデモのように、それは何年も前のように感じます。それはまだ出てきてさえいませんでした。おそらくそれが起こっていないからです。音声デモは…名前の付け方の問題だと思いますが、とにかく…

Codexモデルがありました。それが考えているものです。Codexモデルがありました。そうです、私たちは。その混乱は責められません。GitHubのものもCodexと呼ばれていたと思います。その通りです。はい、はい。

私はChatGPT内の私たちのコーディング製品について話しています。Codex Cloudオファリング、そしてCodex CLIもです。ですから、実際に、答えをもう少し絞るなら、Codex CLIです。本当に、本当に気に入っています。ローカル環境のセットアップが好きです。

最後の1ヶ月ほどで本当に有用にしたことは、一つ、チームがすべての細かい問題、小さな製品の磨きと細かい問題を取り除くのに本当に良い仕事をしたことだと思います。今は使うのが喜びのように感じます。より反応的に感じます。

そして2番目のことは、正直に言って、GPT-5です。GPT-5が本当に製品を輝かせることを可能にすると思います。結局のところ、これは基礎となるモデルに本当に依存する製品の種類です。モデルと4、5回反復して戻って、正しくしてもらわなければならない、望む変更をしてもらわなければならない対、少し長く考えてもらい、ワンショットで正確に望むことをやってもらう。

モデルと完璧に心が溶け合っているような奇妙で、バイオニックな感覚を得ます。私が何をしているかを完璧に理解しているように。ですから、codecsでその種のドーパミンヒットと継続的なフィードバックループを得ることは、本当に、本当に好きな不可欠なもののようにしました。

そして、Codexについて私にとって本当に良いと言う他のことは…個人的なプロジェクトに使用します。コードベースを理解するのを助けるためにも使用します。エンジニアリングマネージャーとして、今は実際のコードにそれほど詳しくありません。

ですから、実際にCodexを使用して、コードベースで何が起こっているかを本当に理解し、それに質問をさせ、物事について答えてもらい、物事に追いつくことができます。ですから、非コーディング使用例でさえ、Codex CLIで本当に有用です。

SamがCodexの使用について、昨日だったと思いますが、裂けているというツイートをしました。そこで何が起こっているのかわかりませんが、あなただけではありません。Twitterのフィードバックから判断すると、人々はCodex CLIとGPT-5がどれほど素晴らしい組み合わせかを本当に理解していると思います。

そのチームは多くのスケーリング課題を受けているのを知っていますが、システムは私にとってダウンしていないので、彼らに敬意を表します。しかし、私たちはGPUクランチにいるので、それがどれくらい続くか見てみましょう。

素晴らしい、素晴らしい。次のもの。10年後にソフトウェアエンジニアは多くなるか少なくなるか。約4000万、5000万人の…フルタイム、プロのソフトウェアエンジニア。フルタイム、実際の仕事のようなものを意味しますか。

これは難しいものです。なぜなら、間違いなく多くのソフトウェアエンジニアリングが行われるようになるからです。もちろんです。実際に、最近共有された本当に素晴らしい投稿があります。私たちの内部Slackで共有されたと思います。

実際に最近投稿されたRedditの投稿でした。それがこれを強調する本当に感動的な物語だったと思います。Redditの投稿で、誰かが非言語の兄弟を持っていることについて投稿しました。これを見たかわかりません。投稿されたばかりです。

Redditの人が投稿したのは、世話をしなければならない非言語の兄弟がいることです。兄弟は、兄弟が世界と相互作用し、コンピューターを使用するのを助けるために、これらのタイプのことをすべて試しました。しかし、視覚追跡は機能しませんでした。彼の視覚が良くなかったからだと思います。すべてのツールが機能しませんでした。

そして、この兄弟は最終的にChatGPTを使用することになりました。codecsを使用したとは思いませんが、ChatGPTを使用し、基本的に非言語の兄弟のために特注の一連のツールを作成する方法を自分に教えました。基本的に、彼らだけのカスタムソフトウェアアプリケーションです。

そのため、彼は今、兄弟によって書かれ、インターネットをブラウズすることができるカスタムセットアップを持っています。ビデオは彼がシンプソンズか何かを見ていることだったと思います。それは本当に感動的でした。

実際に私たちが多く見ることになると思います。この人はプロのソフトウェアエンジニアではありません。彼のタイトルはソフトウェアエンジニアではありませんが、多くのソフトウェアエンジニアリングを行いました。おそらくかなり良いです。確実に、兄弟が使用するのに十分良いです。

コードの量、起こる構築の量は、信じられないほどの変革を遂げると思います。私のようなソフトウェアエンジニアにとってそれが何を意味するかはわかりません。おそらく同等か、おそらく――もちろん、より多くのSherwin。より多くの私。より多くの私、具体的に。あなたがもっと必要です。その通りです。

しかし、確実に多くの会社で多くのソフトウェアエンジニアリング。私はその論理を完全に買います。世界に巨大なソフトウェア不足があるという論理を完全に買います。私たちは過去20年間それを受け入れてきました。しかし、ソフトウェアの目標は、その超剛性で、構築するのが超困難なアーティファクトになることではありませんでした。カスタマイズ可能で、可鍛性であることでした。

ですから、はるかに多くの――人々の仕事とスキルセットの再構成の種類が見られることを期待しています。はるかに多くの人がコードを書くようになります。プロダクトマネージャーがますますコードを書くようになることを期待しています。最近、PMにコードを書かせましたよね。

ああ、そうです、それをやりました。本当に楽しかったです。基本的にPRD、プロダクト要件ドキュメントをやるのをやめました。クラシックなPMのことです。5ページ書きます。私の製品はそれをやります、など。PMは基本的にプロトタイプをコーディングしてきました。

GPT-5とCodexでかなり速いです。ほんの数時間だと思います。めちゃくちゃ速いです。そして2番目に、ドキュメントよりもはるかに多くの情報を伝えます。本質的に機能を感じます。正しいかそうでないか。ですから、そのような行動をますます見ることを期待しています。

英語を書く代わりに、実際に望む実際のものを書くことができるようになりました。素晴らしいです。キャリアを始めたばかりの高校生へのアドバイス。

私のアドバイスは――わかりません。おそらく普遍的です。何よりも批判的思考を優先してください。極めて高い批判的思考を必要とする分野に行けば――数学、物理学、または哲学がそのバケットにあるかもしれません――どんなことがあっても大丈夫でしょう。

それを軽減する分野に行けば。そして再び、それは記憶、パターンマッチングに戻ります。おそらくあまり将来性がないでしょう。

批判的思考を鋭くする良い方法は何でしょうか。ChatGPTを使ってテストしてもらう。それは巧妙なテストです。本質的にあなたができることより20%上のバーを常に置く方法を知っている一流の家庭教師を持つことは、実際におそらくそれを行う本当に良い方法です。

あなたからも何かありますか。私のは――実際に私たちがそのような興味深い、ユニークな時期にいると思います。若い――だから、おそらくこれは高校生だけでなく、より一般的なアドバイスですが、若い世代に対して、大学生でさえ。

私が思うアドバイスは、AIネイティブであるかもしれない、またはツールの方法でどれだけかということに関して、現在世界の他の部分に対してどれだけの利点を持っているかを過小評価しないでください。

私の直感では、高校生、大学生が職場に入ってくるとき、実際にAIツールの使用方法、実際に職場を変革する方法について巨大な優位性を持つでしょう。若い高校生への私の押しは、一つ、この物事に本当に浸ることです。

そして二つ、労働力の他の誰もおそらくあなたがやるほど深くこれらのツールを理解していないという事実を本当に活用してください。

この良い例は、実際に最近OpenAIで最初のインターンクラスを持ちました。多くのソフトウェアインターンです。そして、彼らの一部は、私が今まで見た中で最も信じられないCursorパワーユーザーでした。彼らは非常に生産的でした。ショックを受けました。

良いインターンを得ることができることは知っていましたが、彼らがこれほど良いとは知りませんでした。その一部は、彼らが大学でこれらのツールを使って育ったからだと思います。しかし、メタレベルのポイントは、彼らが非常にAIネイティブだということです。

私とOlivierでさえ、OpenAIで働いているので、ある種AIネイティブですが、これに浸り、これで育ったわけではありません。ですから、ここでのアドバイスは、それを活用することです。入って行き、この知識を広め、職場でそれを活用することを恐れないでください。なぜなら、それは彼らにとってかなり大きな利点だからです。

Palantirで誰かが私たちに言ったのを覚えていませんが、すべてのインターンクラスはより速く、よりスマートに、ラップトップのようにスマートになっていました。すべての世代でスマートになっていました。2013年の夏に私がインターンだったときにピークに達していなかったのは確かです。その通りです。奇妙なスパイクがあります。2013年夏です。二人の男が。その通りです。

多くのことがここで起こりました。皆さんがOpenAIに参加してから多くのことが起こりましたよね。3年とほぼ3年で。OpenAIの旅で、ローズの瞬間、お気に入りの瞬間、つぼみの瞬間、何かについて最も興奮しているが、まだ先に機会がある、そして棘、3年間の旅の最も困難な瞬間は何でしたか。

私にとって棘は簡単です。私たちが「ブリップ」と呼ぶもの、取締役会のクーデターです。それは本当に困難な瞬間でした。面白いことに、事後的には、実際に会社をかなり再結集させました。以前もOpenAIにはかなり強い文化がありましたが、さらに強い本質的な仲間意識の感覚がありました。しかし、確実に、その日は困難でした。

その反脆弱性を見るのは非常にまれです。そのようなことの後、ほとんどの組織は崩壊しますが、OpenAIは強くなったように感じます。OpenAIが戻ってきました。良いポイントです。事後を見ると、本質的にOpenAIを本当により強くしたと感じます。他のニュース、退職、または何でも、悪いニュースを本質的に見るとき、会社はより厚い皮膚とはるかに速く回復する能力を構築したと感じます。確実に正しいと思います。

その一部でもあると思いますが、文化でもあります。それがまた、多くの人にとってそれほど低いポイントだった理由でもあると思います。OpenAIの非常に多くの人が、私たちがやっていることを非常に深く気にかけているからです。それはなぜ彼らがそんなに一生懸命働くかの理由でもあります。その仕事を本当に気にかけているからです。それはほとんど人生の仕事のように感じます。

それは非常に大胆なミッションであり、あなたがやっていることです。それがなぜブリップが多くの人にとってそれほど困難だったかの理由だと思いますが、人々を再び結束させ、どのようにして一緒に持ちこたえ、その厚い皮膚を得ることができたかの理由でもあります。

私には別の最悪の瞬間があります。それは昨年12月に起こった大きな停電でした。覚えていますか。複数時間の停電でした。APIがどれほど本質的にユーティリティのような重要なものになったかを本当に浮き彫りにしました。

背景として、昨年11月か12月のどこかで3、4時間の停電があったと思います。本当に残酷で、純粋にゼロに設定されました。誰もChatGPTにアクセスできませんでした。誰もAPIにアクセスできませんでした。本当に厳しかったです。

顧客の信頼の観点から本当に困難でした。何が起こったか、そして今後の計画について、多くの顧客と話し合ってポストモルテムを行ったのを覚えています。ありがたいことに、それ以来、それに近いものは何もありませんでした。過去6ヶ月間で行った信頼性へのすべての投資に本当に満足しています。しかし、その瞬間は本当に困難でした。

幸せな側面、ローズについて、私には2つあると思います。最初のものはGPT-5が本当に良かったことです。GPT-5へのスプリントは、本当にOpenAIの最高を示したと思います。最先端の科学研究、極端な顧客焦点、極端なインフラストラクチャと推論の才能を持っていました。

そのような大きなモデルを出荷し、ほぼ即座に多くの、多くの、多くのトークン毎分にスケールできたという事実は、それを物語っていると思います。私が本当に――停電なしで。停電なしで。本当に良い信頼性です。1年、1年半前にGPT-5 Turboを出荷したとき、スケールトラフィックに恐れていたのを覚えています。それらの巨大なアップデートを出荷することが本当に上手になったと感じます。

私にとって2番目のローズ、幸せな瞬間は、最初のdev dayが本当に楽しかったことです。OpenAIとしての成人の儀式のように感じました。開発者の巨大なコミュニティがあることを受け入れています。モデルと製品を出荷するつもりです。基本的に私のお気に入りの人々、OpenAIかそうでないかを問わず、本質的に何を構築しているか、次に何が来るかについて夢中になっているのを見たのを覚えています。時間的に本当に特別な瞬間のように感じました。

それも私のものになる予定でした。それに便乗します。2023年11月の最初のdev dayです。覚えています。明らかに、それ以来多くの良いことが起こりました。私にとって非常に――なぜかわかりませんが、非常に記憶に残る瞬間でした。

一つは、実際にdev dayまでかなりのダッシュでした。多くを出荷しました。だから私たちのチームは本当に、本当にスプリントしていました。だから、上がって行く高ストレス環境のようでした。それに加えて、もちろん私たちはOpenAIなので、出荷したすべてのもののSamの基調講演でライブデモを行いました。

観客の後ろに座ってチームと一緒にいて、デモが起こるのを待っていたのを覚えています。それが終わったとき、私たちはみんな巨大な安堵のため息をつきました。ああ、ありがとう、と言いました。だから、それへの多くのビルドアップがありました。

私にとって最も記憶に残ることは、dev dayの直後を覚えていることです。すべてのデモがうまくいき、すべての講演がうまくいきました。アフターパーティーがあり、その後、音楽が流れているWaymoで夜家に帰っていました。dev dayの素晴らしい終わりでした。それが私が覚えていることです。それが過去数年間の私のローズでした。大好きです。それは素晴らしいです。

皆さんがそうだと仮定しますが、AGI信者ですか、イエスかノーか。そして、もしそうなら、あなたをそこに連れて行った瞬間は何でしたか。あなたのアハ瞬間は何でしたか。いつAGIを感じましたか。

私はAGI信者だと思いますか。私はAGI信者だと思います。あなたは確実にAGI信者です。そうですか。いくつかありました。最初のものは、2023年に私が手動でコーディングする必要が二度とないという実現でした。私は最高のコーダーではありません。理由があって仕事を選びました。

しかし、人間が基本的に永遠に機械言語を書かなければならないと思っていたことが、実際には与えられたものではないという実現。そして、その驚きの給料は巨大です。

私にとって2番目のAGIを感じた瞬間は、おそらく音声とマルチモダリティの進歩でした。テキストのように、ある時点で慣れます。機械がかなり良いテキストを書けることがわかります。音声はそれを現実的にします。しかし、実際にあなたのトーン、フランス語での私のアクセントを理解するものと実際に話し始めると、機械が冷たく、機械的で、決定論的な論理を超えて、はるかに感情的で具体的なものに行くような瞬間のように感じました。

それは素晴らしいものです。私のものは、私はAGI信者だと思います。おそらく過去数年間で徐々にAGI信者になりました。2つあると思います。私にとって、実際にテキストモデルからより多くのショックを受けます。マルチモーダルなものも本当に素晴らしいですが。

私にとって、実際に2つの一般的なブレークスルーと並んでいると思います。最初のものは、2022年9月に会社に参加したときでした。ChatGPT以前でした。2ヶ月前です。GPT-4が内部的に既に存在していた頃です。どのように展開するかを理解しようとしていたと思います。NickがChatGPTについて初期に多く話していたと思います。

しかし、初めてGPT-4と話したときでした。何もないところからGPT-4に行くことは、私にとって最も心を揺さぶる体験でした。世界の他の部分にとっては、おそらく何もないところからChatGPTでGPT-3.5に行くことが大きなものだったかもしれません。その後3.5から4に行くこと。

しかし、私にとって、そしておそらくその頃に参加した他の人々にとって、何もないところから、または何もないわけではありませんが、当時公開されていたものから。それからGPT-4に行くことは信じられませんでした。非常に多くのことを投げかけたのを覚えています。この物事が理解できる答えを出すはずがないと思いました。

そして、それがパークからそれをノックアウトしました。絶対に信じられませんでした。GPT-4は狂気でした。GPT-4がOpenAIと面接しているときに出たのを覚えています。まだ携帯電話を見て、参加すべきかと考えていました。そして、そのものを見て、もう他の何にも歩くことはできないと思いました。その通りです。GPT-4はとてもクレイジーでした。

そして、他のものは、他のブレークスルーのようなもので、推論パラダイムです。実際に、私にとってその最も純粋な表現はDeep Researchでした。本当にそれが知ることができないと思ったことを調べるように求めること。それがすべてを考え抜き、検索で本当に粘り強く、書き上げで本当に詳細になるのを見ること。

それはかなりクレイジーでした。投げた正確なクエリは覚えていませんが、AGIを感じる瞬間は、モデルに何かを投げるときで、この物事が得ることができるはずがないと思ったのに、それがパークからそれをノックアウトするようなものです。それがAGIを感じる瞬間の種類です。

Deep Researchで尋ねていたことの一部でそれを確実に感じました。

これは素晴らしかったです。皆さん、本当にありがとうございました。皆さんは未来を構築しています。毎日私たちを刺激してくれています。会話に感謝します。本当にありがとうございました。ありがとうございます。お招きいただき、ありがとうございました。

みなさんへのリマインダーとして、これは私たちの意見であり、投資アドバイスではありません。

コメント

タイトルとURLをコピーしました