OpenAI DevDay 2025:Sam Altmanによる基調講演

OpenAI・サムアルトマン
この記事は約37分で読めます。

OpenAI DevDay 2025の基調講演では、Sam Altmanが登壇し、ChatGPT内でアプリを構築できる新しいApps SDK、エージェント開発を簡素化するAgentKit、ソフトウェアエンジニアリングエージェントCodexの正式版リリース、そしてGPT-5 ProやSora 2のAPI提供など、開発者向けの重要なアップデートを発表した。2年前の最初のDevDayから開発者数は200万人から400万人へ、ChatGPTの週間ユーザーは1億人から8億人へと大幅に増加し、API処理トークン数は毎分3億から60億へと20倍に拡大している。Apps SDKはMCPに基づいており、開発者が完全なスタック制御とインタラクティブなUIレンダリングを実現できる。AgentKitはエージェント構築を視覚的に行えるAgent Builder、チャットインターフェースを簡単に組み込めるChatKit、エージェント性能を測定するための評価機能を提供する。Codexは研究プレビューから正式版となり、GPT-5-Codexモデルによって強化され、Slackインテグレーションや新しいSDK、管理ツールが追加された。Sora 2はAPIプレビューとして提供開始され、高品質な動画生成と音声の同期が可能になった。これらの発表により、AI開発の敷居が大幅に下がり、アイデアから製品化までのスピードが劇的に向上している。

OpenAI DevDay 2025: Opening Keynote with Sam Altman
Sam Altman kicks off DevDay 2025 with a keynote to explore ideas that will challenge how you think about building. Join ...

OpenAI DevDay 2025開幕

おはようございます。DevDayへようこそ。サンフランシスコ、OpenAIが創業し、AIの未来を築くことにコミットしているこの街で開催できることを嬉しく思います。

最初のDevDayから約2年が経過しました。私たち、そして何よりも皆さん全員が、それ以来長い道のりを歩んできました。2023年当時、私たちには200万人の開発者と1億人の週間ChatGPTユーザーがいました。そしてAPIでは毎分約3億トークンを処理していました。当時はそれが多いと感じていました。

現在、400万人の開発者がOpenAIで構築しています。そして毎週8億人以上がChatGPTを使用しています。APIでは毎分60億トークン以上を処理しています。AIは人々が遊ぶものから、人々が毎日構築するものへと変化しました。

さて、すべての発表に入る前に、楽しいことをしたいと思います。私の後ろのスクリーンには、本日この会場にいる開発者の名前が表示されています。彼らは私たちのプラットフォーム上で、信じられないようなマイルストーンを達成したアプリを構築した方々です。100億、1000億、さらには1兆トークンを処理したアプリです。拍手を送りましょう。

OpenAIの全員を代表して、感謝します。未来を前進させているのは皆さんです。これを見ると、次に来るものについて非常に楽観的になります。

これまでどれだけ遠くまで来たかを祝うのはエキサイティングですが、私たちはまだこの旅の非常に早い段階にいます。そして今日は、皆さんにとって最も重要なことに焦点を当てます。私たちがどのようにAIでの構築を容易にしているかです。

私たちは開発者の声に耳を傾けてきました。どこで行き詰まっているのか、次にどこで構築したいのかを聞いています。今日は4つのことを用意しています。

ChatGPT内部でアプリを構築できるようにする方法をお見せします。そして多くの配布を支援する方法もお見せします。エージェントの構築がはるかに速く、より良くなることをお見せします。ソフトウェアの記述を容易にし、コーディングの反復的な部分を引き受けて、皆さんがシステムと創造性に集中できるようにする方法をご覧いただきます。そしてこれらすべての基盤として、皆さんが構築しているものをサポートするためのモデルとAPIのアップデートをお伝えします。

これは歴史上、ビルダーにとって最高の時代です。アイデアから製品への移行がこれほど速かったことはありません。加速を感じることができます。

ChatGPT内のアプリ

まず、ChatGPT内のアプリを見てみましょう。私たちはChatGPTを、人々が進歩するのを助けるために構築しています。より生産的に、より創造的に、そしてより速く学習できるようにするためです。

人々がそれをどのように創造的に使用しているかに、私たちは常に驚かされています。最初のDevDay以来、私たちはChatGPTを開発者に開放する取り組みを続けてきました。GPTSのような機能を立ち上げ、MCPのような標準を採用し、開発者がChatGPTを幅広いアプリケーションに接続できるようにしました。一部はうまくいきました。一部はうまくいきませんでした。しかし多くのことを学びました。

そして今日、私たちはChatGPTを開放し、開発者がChatGPT内部でアプリを構築できるようにします。これにより、インタラクティブで適応的でパーソナライズされた、チャットできる新世代のアプリが可能になります。

それらを構築するために、現在プレビューで利用可能な新しいApps SDKを立ち上げます。今日から始めてください。Apps SDKを使用すると、完全なスタックが手に入ります。データを接続し、アクションをトリガーし、完全にインタラクティブなUIをレンダリングできます。

そしてさらに多くのことができます。Apps SDKはMCPに基づいて構築されています。バックエンドロジックとフロントエンドUIを完全に制御できます。誰でもApps SDKを統合できるように標準を公開しました。Apps SDKで構築すると、アプリは数億人のChatGPTユーザーにリーチできます。これは開発者が製品を急速にスケールさせる方法として大きな意味を持つでしょう。

拍手をありがとうございます。どういたしまして。ユーザーが既に既存の製品にサブスクライブしている場合、会話から直接ログインできます。将来的には、ChatGPT内で即座にチェックアウトを提供する新しいagentic commerceプロトコルを含む、収益化の複数の方法をサポートします。

いくつかの例を見てみましょう。誰かがChatGPTを使用しているとき、名前で指定してアプリを見つけることができます。例えば、製品フローのスケッチをChatGPTにアップロードして、Figma、このスケッチを実用的な図に変換してくださいと言うことができます。Figmaアプリが応答してアクションを完了します。さらに反復したい場合は、ChatGPTからFigjamを起動できます。

また、会話内でアプリを発見できるようにしています。ユーザーが何かを求めたとき、関連するアプリを提案として表示できます。ユーザーが今週末のパーティー用のプレイリストが必要だと言ったとき、ChatGPTはSpotifyで構築することを推奨できます。適切なタイミングで適切なアプリを見つける簡単な方法です。開発者に全く新しい発見の方法を提供します。

Apps SDKのライブデモ

ここで、Alexiをステージに招待してライブデモをお見せしたいと思います。

拍手をありがとうございます。私はAlexi、これを構築するのを手伝ったChatGPTのソフトウェアエンジニアです。ユーザーが直接対話できる最初のアプリのいくつかを紹介できることに興奮しています。これらのアプリの魔法は、豊かでインタラクティブなビジュアルとChatGPTのパワーを組み合わせることです。

Courseraから始めましょう。UXデザインについて学びたいとしましょう。ChatGPTのCourseraアプリに、これについて学ぶのを手伝ってくださいと頼めます。Coursera、機械学習について何か教えてください。

これがChatGPTでCourseraを使う初めてなので、接続に同意する必要があります。次回使用するときは、すぐに始められます。CourseraアプリにChatGPTで直接尋ねたことに気づくと思いますが、ChatGPTは会話に関連する場合にアプリを提案することもできます。

ChatGPTのアプリは会話とインラインで表示され、ここに表示されている動画のように、ウェブ上でレンダリングできるものをサポートできます。Apps SDKはピクチャーインピクチャーやフルスクリーン動画レイアウトへの展開もサポートしています。

コースが用意できたので、動画を再生しましょう。動画を再生すると、すぐに画面の上部にピン留めされます。これは非常に便利です。なぜなら、動画を見ながら会話にアクセスできるからです。

動画で言及されていることについて、もう少し深く掘り下げたいとしましょう。ChatGPTに、彼らが今言っていることについてもっと説明してくださいと尋ねることができます。

Apps SDKは、アプリからChatGPTにコンテキストを公開するAPIを提供し、モデルが常にユーザーが何と対話しているかを正確に把握できるようにします。私たちはこれをアプリとの会話と呼んでおり、これがここでの魔法の一部です。

ChatGPTでの学習は、私たちの最も重要なユースケースの1つですが、それがさらに良くなり続けていることに非常に興奮しています。AppsとApps SDKを使用すると、世界中のユーザーのために、より豊かな教育体験を開放できます。

これは、データ準備ステップについて、機械学習モデルをトレーニングする前の構造について説明しています。説明する必要はありません。ChatGPTがすぐに理解します。Courseraアプリを接続して、ChatGPTの会話内でテキストを通じて動画と直接関わることができます。かなりクールです。

ユーザーはChatGPTで創造的になることも大好きです。ここに、私の弟の犬の散歩ビジネスを手伝うためのアイデアをブレインストーミングしている会話があります。何度かやり取りしました。いくつかには満足していますが、この名前を使いましょう。

Canva、この名前でポートフォリオを作ってください。カラフルで気まぐれで明るいものにしたいです。そしてCourseraにタイピングコースを頼み、サンセリフフォントを希望します。

Canvaはこのようなアセットの作成に優れており、今ではChatGPTから直接開始できます。OpenAIのマーケティングアセットを作成している場合でも、DevDayの楽しいデモを作成している場合でも、Canvaは作業中の会話にあなたと一緒にいます。

Apps SDKはMCP、OpenAIで構築するのが大好きなオープンスタンダードに基づいています。既存のMCPがある場合、Apps SDKで拡張するのは本当に簡単です。HTMLテンプレートを返すリソースを追加するだけで、アプリはウェブやモバイルなど、ChatGPTが配布されているあらゆる場所で動作できます。

ご覧のとおり、これはライブデモなので、少し遅延が発生しています。動画と同様にインラインで表示され、ChatGPTが何をしたかを説明しています。

Apps SDKの別のモダリティ、フルスクリーンを探索できます。特定のポスターを開いて詳細を確認でき、さらにChatGPTでフォローアップして変更をリクエストできます。画像生成体験と同様です。

しかし、私たちはサンフランシスコにいて、DevDayなので、Canvaにこれらをピッチデッキに変換するよう頼みましょう。Canva、このポスターをピッチデッキにしてください。犬の散歩のシード資金を調達しようとしていますと言えます。

それを送信すると、Canvaがスライドデッキを作ります。それが読み込まれている間に、もう1つのデモを見せます。

犬の散歩ビジネスが本当にうまくいっていて、別の都市に拡大したいとしましょう。ChatGPTにどこに拡大すべきか尋ねることができます。ChatGPTは私たちが何について話しているか知っています。

非常に熱心にピッツバーグと言います。Zillowを呼び出して、そこで販売されている家を見せてくださいと言えます。今、Zillowと通信して最新のデータを取得し、ChatGPTにインタラクティブな地図を埋め込んでいます。

地図があります。読み込み中です。ここに家のバックアップがあります。拍手をありがとうございます。

スライドデッキも完成したようなので、すぐにそちらに戻ります。この地図はインラインビューでは少し見づらいので、家をクリックしてフルスクリーンで開けます。Zillowの体験のほとんどがChatGPTに埋め込まれており、ツアーをリクエストしたり、Zillowから期待されるアクションを実行できます。

多くのオプションがあり、解析が難しいので、ChatGPTに、庭付きの3ベッドルームの家だけにフィルタリングしてくださいと頼みます。アプリがフルスクリーンになっているため、新しいインスタンスを作成することなく、提供されるデータが更新されます。

ChatGPTが戻ってきて、メッセージがオーバーレイ表示され、Zillowアプリ上で会話を見ることができ、全高まで開けます。クールです。ズームインして、興味があるかもしれない特定の家を見つけましょう。

ZillowアプリがコンテキストをChatGPTに公開しているので、私が何を見ているかを知っており、この家について、ドッグパークにどれくらい近いかなど、より多くの情報を尋ねることができます。

ChatGPTはZillowからのコンテキストを、検索のような他のツールと組み合わせることができます。家についてより多くの情報を提供できます。ここから他のツールを呼び出して手頃さを調べることができますが、毎回最良の答えを提供します。

これは、Apps SDKでの体験がどれほどダイナミックであるかの素晴らしい例です。インラインの地図から始まり、アプリと会話したり、ChatGPTに質問したり、Zillowの体験を使用したりできました。

これらのスライドデッキを確認しましょう。この会話に移動すると、Canvaがここにいくつかのオプションを提供してくれました。この青が好きなので、それを開くと、フルスクリーンでスライドが表示され、Canvaが生成してくれた美しいスライドをすべて見ることができます。準備ができたら、拍手をありがとうございます。

ポスターと同じように、フォローアップの編集を依頼でき、準備ができたらCanvasで開いてシード資金を調達できます。アプリの魔法です。

お気に入りの製品を使って、真に新しい体験を生み出します。これを皆さんと一緒に構築し続けることに非常に興奮しています。皆さんがこれで何をするか見るのが待ちきれません。

拍手と歓声をありがとうございます。Samにアプリについてもっと話してもらいましょう。

Alexiありがとう。大勢の人の前でタイピングと話すのを同時にするのは難しいですね。

デモで見たアプリを、これらのローンチパートナーからのいくつか追加のアプリと一緒に試していただけることに興奮しています。それらは今日、ChatGPTで利用可能になります。そして、これは始まりに過ぎません。今後数週間で、パートナーからさらに多くのアプリを展開していきます。

開発者向けに、Apps SDKは今日から構築を開始できるプレビューで利用可能です。私たちの目標は、これを早期に皆さんの手に渡し、フィードバックを聞き、一緒に構築することです。

今年後半、開発者はレビューと公開のためにアプリを提出できるようになります。また、ユーザーが閲覧できるディレクトリもリリースします。会話での発見に加えて。

開発者ガイドラインに記載されている基準を満たすアプリは、リストに掲載される資格があります。デザインと機能性でより高い基準を満たすアプリは、ディレクトリや、お見せしたように会話内で提案されるアプリなど、より目立つ形で特集されます。

プレビューApps SDKと一緒に、今日開発者ガイドラインのドラフトを公開したので、何を期待すべきかがわかります。そして、アプリの収益化についても間もなく共有することがあります。

皆さんが何を望んでいるかについてのフィードバックをお待ちしています。これは開発者とChatGPTユーザーにとってエキサイティングな新しい章になるでしょう。

以上がアプリでした。皆さんが気に入ってくれることを願っています。拍手をありがとうございます。

AgentKitによるエージェント構築

次は、効果的なエージェントの構築をはるかにシンプルにする方法を見てみましょう。AIは、尋ねるシステムから、多くのことをしてくれるシステムへと移行しました。

エージェント、つまりコンテキスト、ツール、信頼を持ってタスクを引き受けることができるソフトウェアを通じて、これを見始めています。しかし、エージェントに関するすべての興奮にもかかわらず、実際に本番環境に投入され、大規模に使用されているものは非常に少ないです。

どこから始めればよいかを知るのは難しいです。どのフレームワークを信頼すべきか。そして、それには多くの作業が必要です。オーケストレーション、評価ループ、ツールの接続。

優れたUIの構築。これらの各レイヤーは、アイデアが機能するかどうかさえわからないうちに複雑さを追加します。それでも、多大なエネルギーがあり、機会は非常に現実的です。仕事のやり方を再構想するためにエージェントを構築している何千ものチームと話をしました。

エージェントを構築しやすくするために何ができるでしょうか。そこで今日、新しいものを立ち上げます。アイデアからエージェントへはるかに速く移行したいすべてのビルダーのための何かです。

AgentKitを紹介できることを嬉しく思います。AgentKitは、エージェントをプロトタイプから本番環境へ移行するのを支援するために設計された、OpenAIプラットフォームで利用可能な完全な構成要素のセットです。エージェントワークフローを構築、デプロイ、最適化するために必要なすべてを、より速く、はるかに少ない摩擦で提供します。

個人開発者から大企業まで、誰もがこれから多くの価値を得られるでしょう。今から機能について話します。

Agent Builderは、ロジックステップを設計し、フローをテストし、アイデアを出荷するための高速でビジュアルな方法です。

これは、すでに数十万人の開発者が使用しているResponses APIの上に構築されています。以前に私たちのプラットフォームを使用したことがある場合は、基盤に慣れているはずです。

2つ目はChatKitです。優れたチャット体験を自分のアプリに直接簡単に導入できるようにしています。自分のものにできるシンプルで埋め込み可能なチャットインターフェースを手に入れます。

ブランドを持ち込み、ワークフローを構築し、製品をユニークにするものに集中してください。ここのビデオでご覧いただけるように、チャットが各エージェントノード間でどのように機能し、ツールを呼び出して最良の応答を形成するかがわかります。

最後に、エージェントのための評価です。エージェントのパフォーマンスを測定することに特化した新機能を出荷しています。

トレースグレーディングを使用して、エージェントの決定をステップバイステップで理解できます。データセットを使用して、個々のエージェントノードを評価できます。自動プロンプト最適化を追加しました。そして、OpenAI評価プラットフォーム内で外部モデルに対して直接評価を実行することもできます。

これは、エージェントを最初に構築していたときに欲しかったすべてのものです。もちろん、エージェントはデータへのアクセスが必要です。

OpenAIのConnector Registryを使用すると、すべてを安全に制御下に保ちながら、管理制御パネルを通じて、エージェントを内部ツールやサードパーティシステムに安全に接続できます。

いくつかの例を見てみましょう。Albertsonsは米国全体で2,000以上の食料品店を運営しており、毎週3,700万人以上が買い物をしています。

各店舗は独自の小さな経済のようなものです。マネージャーは絶え間ない決定を下さなければなりません。プロモーション、製品ミックス、ディスプレイ、ベンダー。たくさんあります。

そこでAlbertsonsはAgentKitを使用してエージェントを構築しました。アイスクリームの売上が予想外に32%減少している状況を想像してください。以前は、これによって報告、スプレッドシート、会議の長いプロセスが始まっていたでしょう。

アソシエイトはエージェントに何が起こっているかを尋ねるだけです。エージェントは完全なコンテキスト、季節性、過去の傾向、外部要因を見て、推奨事項を提供します。おそらくディスプレイを調整したり、地元の広告を出したりする時期です。

別のエージェントを見てみましょう。HubSpotは、世界中の数十万の組織で使用されている顧客プラットフォームです。

彼らはAgentKitを使用して、カスタムレスポンスウィジェットを使用したHubSpotのAIツールであるBreezeの応答を改善しました。この例では、HubSpotの顧客であるLuma Plantsが、アリゾナで植物が繁栄しない理由についての質問を受けます。

Breezeアシスタントを使用して独自のナレッジベースを検索し、州の低湿度に対する地元の処理を調べ、ポリシーの詳細を取り込み、すべてをまとめます。その後、推奨を含む複数のソリューションを提供します。

これは、さまざまなソースにわたって連携して動作し、スマートで有用な回答を提供するインテリジェンスの例です。そして、AgentKitで構築できる種類のものの素晴らしい例です。

AgentKitを使用してエージェントをすでにスケールさせている素晴らしいローンチパートナーがたくさんいます。

そして今日から誰でも利用できます。それでは、どのように機能するかのデモを見てみましょう。Christinaに引き継ぎます。拍手をありがとうございます。

AgentKitのライブデモ

Samありがとう! 皆さんこんにちは、私はChristinaで、AgentKitを構築しているチームで働いています。今日は、AgentKitが開発者がこれまで以上に速くエージェントを作成するのをどのように支援するかをお見せしたいと思います。

皆さんはすでに私たちのDevDayウェブサイトをご覧になったかもしれません。皆さん全員がアクセスでき、今日のスケジュールに関するすべてを示すサイトです。

しかし今のところ、それは単なる静的なページです。もしそれが実際に一日をナビゲートし、皆さんに最も関連するセッションを指し示すのを助けることができたらどうでしょう? 私たちはOpenAIです。DevDayサイトにAIが必要です。

それが私たちが一緒に構築するものです。AgentKitを搭載したエージェントで、このサイト内に直接デプロイされます。

これを面白くするために、ここで皆さんの前で8分以内にエージェントを構築して出荷することにします。拍手と歓声をありがとうございます。

エージェントを構築するのがどれほど難しいかを聞いたばかりなので、これは挑戦になります。そして、正直にやるために時計を開始します。時計が動いています。

OpenAIプラットフォームのワークフロービルダーから始めています。コードから始める代わりに、ノードを視覚的に接続できます。

Agent Builderは、エージェントの構築から学んだ一般的なパターンを使用して、簡単でビジュアルな方法で複雑なワークフローをモデル化するのに役立ちます。左側には、すでに共通の構成要素を抽出しています。例えば、ツール、ヒューマンインザループ、ガードレール、論理ノードです。

特化したセッションエージェントと、より汎用的なDevDay情報エージェントを使用するワークフローを構築する予定です。メッセージのタイプを分類するエージェントから始めます。セッション情報について尋ねているのか、DevDayについてより一般的な何かについて尋ねているのかを分類します。

その分類器に基づいて動作をルーティングするためのIf/Elseノードを追加しました。次に、セッションエージェントを作成します。

これをセッションエージェントと呼びます。セッションに関する情報を取得することについてのコンテキストを与えます。そして、さまざまなツールを追加できます。今日はすでにセッションに関する情報を持つドキュメントがあるので、それをドロップインします。これをセッションと呼びます。そして添付します。これには質問に答えるために必要なすべての情報があります。

スケジュールの表示は楽しくて視覚的に面白いものであるべきです。単なるプレーンテキストではなく。だから、それらのためのウィジェットも作成します。ウィジェットビルダーに移動します。そこで、すでにセッションウィジェットを設計しています。この場合はFroge 101クラス用です。

ウィジェットをダウンロードして、エージェントに戻り、それを添付するだけです。戻ってボタンをクリックしましょう。

ダウンロード。できました。移動して、作成したセッションエージェントの出力フォーマットとしてそれを添付します。ドロップインして、ヒットウィジェットを追加したことを確認するためにプレビューします。これで完了です。

もう一度エージェントノードをドラッグして、これをDev Dayエージェントと呼びます。それが何をしているかについてのコンテキストを与え、その日のブランドに合わせてFrogeのスタイルで話すようにします。

ファイルを追加します。その日に関するすべての情報を含むファイルがあります。これをdevdayと呼びます。添付します。このエージェントは準備ができています。ここに添付します。

まだ数分あるようなので、事前構築されたガードレールの1つを使用して追加のセキュリティを追加しましょう。エージェントを構築する際の最も重要なことの1つは信頼であり、ガードレールはその信頼を持つのに役立ち、幻覚から保護し、モデレーションを追加し、PIIをマスキングします。

いくつかの事前構築されたガードレールがあります。PIIに1つをオンにして、名前を含めて動作を簡単に確認できるようにし、これをワークフローの最初にタップしてFrogeがPIIから保護されるようにし、追加のエージェントを追加してケースを追加できるようにします。Frogeのスタイルで話すようにします。そしてコンテキストを削除します。

このワークフローは準備ができていると思います。エンドユーザーに何が表示されるかを決定するために出力を構成できます。この場合、より内部的であればファイル検索ソースをオフにできます。そして、Agent Builderからプレビューできると思います。

エージェントの構築について詳しく学ぶために、どのセッションに参加すべきか尋ねることができます。ガードレールをチェックして、追加したセッションのファイルから情報を引き出し、追加したウィジェットを使用して適切なセッションを見つけ、11時15分のOrchestrating Agents at Scaleが私にとって最良のセッションであると判断しています。

いくつかRibbitsを入れているのが見えます。このエージェントは良さそうです。時間を確認します。今構築したばかりです。つまり、ツールを使用していくつかの特化したエージェントを構築し、ガードレールを追加し、ウィジェットでカスタマイズし、プレビューでワークフローをテストしました。

今、まだやっていない1つのことは、期待どおりに動作することを確認するために本番稼働する前に、プラットフォームで直接実行できる完全な評価セットです。

しかし今、巨大な時計が私を追いかけていて、DevDayが待っています。だからこれを公開して、Ask Frogeと呼び、公開をヒットすると、直接実行するために使用できるワークフローIDを持つ、本番環境に完全にデプロイされた公開エージェントができます。拍手をありがとうございます。

右側に、自分の環境とサーバーで実行したい場合のCodexがあります。これはかなりの量のコードを書く必要があることがわかります。だから、作成したワークフローIDを使用して、自分のサイトに移動します。

DevDayサイトで、作成したワークフローを使用してセッションを作成します。それをドロップインします。次に、ChatKit Reactコンポーネントをドロップインし、セッションキーを渡し、Frogeのアクセントカラーでビジュアルカスタマイゼーションを追加します。

Ask Frogeと呼ばれ、プレースホルダーでRibbitし続け、Froge固有の色とスタートアッププロンプトを持ちます。

このFroge Chatを追加すると、ページの下から上がってきて、最後にサイトの上部にAsk Frogeへのリンクを追加して、ウェブサイトの前面中央に配置します。サイトに戻りましょう。そこにあります。試してみましょう。エージェントの構築について学ぶために、どのセッションに参加すべきですか。

これは、作成したばかりの同じワークフローを実行し、ガードレールをチェックし、メッセージを分類し、ファイル検索からツールから引き出し、設計したウィジェットを使用して、Orchestrating Agents at Scaleが私にとって適切なセッションであると決定し、Frogeのスタイルでリビットし続けています。やりました!

拍手をありがとうございます。エージェントは49秒余裕を持って準備ができています。ビジュアルビルダーで直接反復を続け、コード変更を行わずにサイトに変更をデプロイできます。これには、新しいツール、他のユースケースとガードレールのための新しいウィジェットの追加が含まれ、クライアント側のツールに接続してサイト内で直接アクションを実行することもできます。

つまり、わずか数分で、エージェントワークフローを視覚的に設計し、ツールとウィジェットを追加し、プレビューし、デプロイしました。そして今、皆さん全員がそれを使用できます。実際に今、DevDayサイトで公開されています。それを見て使用し、自分にとって最適なセッションを見つけることができます。

皆さんがそれを使用し、AgentKitで構築する新しい体験を見ることを楽しみにしています。

ありがとう、Samに戻します。拍手と歓声をありがとうございます。

Christinaありがとう! とてもクールです。皆さんがこれで何を構築するかを見るのが待ちきれません。

Codexとソフトウェア開発の変革

AIアプリとエージェントを見てきましたが、今度は同じくらい重要なことに移りましょう。ソフトウェアの書き方です。

AIで起こっている最もエキサイティングなことの1つは、ソフトウェアの書き方が変わる新しい時代に入っていることです。アイデアを持っている人なら誰でも、自分自身、家族、またはコミュニティのためにアプリを構築できます。

いくつかの例をお見せしたいと思います。日本では、89歳の退職者がChatGPTの助けを借りてコーディングを独学しました。彼は今、高齢ユーザー向けに11のiPhoneアプリを構築しています。

彼は生涯の知恵を、他の人々がより自立して生活するのを助けるツールに変えています。スペインでは、Pau GarciaとDomestic Data Streamersのメンバーが、ChatGPT、画像生成、Soraを使用して、人々が思い出と再接続するのを助けています。

ASUでは、医学生が医師として行うような難しい人間的な会話を練習するためのより良い方法が必要でした。

そこで彼らは、実際の診察室に入る前に試行錯誤して上達できる、私たちのモデルを使った仮想患者アプリを構築しました。フランスのベルサイユでは、訪問者が宮殿を歩いて会話できるようになりました。

リアルタイムAPIを使用して、アートや彫刻とライブディスカッションができる体験を構築しました。

歴史が会話になります。人々が構築しているものを見るのは素晴らしいです。だからこそ、開発者がより速く構築するためのより多くのツールを提供できることに興奮しています。

今年の初め、私たちはCodex、OpenAIのソフトウェアエンジニアリングエージェントのリサーチプレビューを開始しました。これは開発者と協力し、ソフトウェアの作成方法を加速するために構築されました。

それ以来、Codexははるかに有能な協力者に成長しました。コーディングするあらゆる場所で機能します。IDE、ターミナル、GitHub、そしてクラウドで。ChatGPTアカウントがすべてを接続するので、これらのツール間でシームレスに作業を移動できます。

Codexに大量の新機能をリリースしました。そして今、新しいGPT-5-Codexモデルで実行されています。これは、Codexとエージェンティックコーディングのために意図的にトレーニングしたGPT-5のバージョンです。

このモデルは、コードのリファクタリングやコードレビューなどのタスクでより優れており、タスクの複雑さに応じて思考時間を動的に調整できます。開発者は新しいモデルを気に入っています。Codexの使用量は本当に速く増加しています。

これに関する主要な指標の1つは、日次メッセージ、開発者が毎日Codexと行うタスクと会話の数です。

8月初旬以来、Codex全体で日次メッセージは10倍になっています。この急速な使用により、GPT-5-Codexは私たちの中で最も急成長しているモデルの1つになりました。リリース以来、40兆トークン以上を提供してきました。

社内では、Codexは私たちが構築するあらゆる場所にあります。今日OpenAIで書かれているほぼすべての新しいコードは、Codexユーザーからのものです。Codexを使用する私たちのエンジニアは、週に70%多くのプルリクエストを完了します。

そして、ほぼすべてのOpenAI PRがCodexレビューを経ています。非常にシニアなエンジニアからでも期待するよりも多くの深さで。

今日から、Codexはリサーチプレビューから正式版になります。拍手をありがとうございます。

そして、Codexはすでに個人開発者と多くの牽引力を持っていますが、Codexをエンジニアリングチームにとってさらに役立つものにするための新しい機能セットを導入しています。

まず、Slack統合です。

これは非常に要望が多かったものです。Slackのチーム会話から直接、Codexにコードを書いたり質問に答えたりするよう頼むことができます。

2つ目は、チーム独自のワークフローでCodexを拡張および自動化するのに役立つ新しいCodex SDKです。

3つ目は、環境制御、監視、分析ダッシュボードなどを含む新しい管理ツールとレポートで、企業がCodexをより適切に管理できるようにします。

間もなく、さらに多くのCodex改善が登場することを期待してください。本当に感動的なのは、Codexを使用している人々の幅広さです。週末にサイドプロジェクトを構築している開発者から、急成長しているスタートアップ、グローバル企業まで。

Ciscoは、エンジニアリング組織全体にCodexを展開しました。彼らは現在、コードレビューを50%速く完了でき、平均プロジェクトのタイムラインを数週間から数日に短縮しました。

次のデモでは、楽しいことをしたいと思います。CodexとAPIを使用して、周りにあるものを何でも実用的なソフトウェアに変える方法をお見せしたいと思います。

Romainをステージにお迎えください。拍手をありがとうございます。

Codexによる実用的なソフトウェア開発デモ

Samありがとう! 皆さん、おはようございます! 昨年、私たちは最初の推論モデルであるo1を使用して、iPhoneアプリをゼロから構築し、このミニドローンをライブステージでプログラミングしました。

バイブコーディングという名前ができる前の、まさにバイブコーディングでした。それ以来の進歩は信じられないほどです。Codexは今や、あなたのコンテキストを理解し、あなたと一緒に働き、チームの仕事を確実に引き受けるチームメイトです。

Codexができるすべてのクールなことを皆さんにどのように見せるのが最適かを考えました。たくさんのアイデアがありました! しかし、私たちが何度も戻ってきた1つは、この部屋で今ここで皆が一緒に見て体験できるものを構築するのはどうかということでした。

それが私たちの挑戦です! 見上げると、私たちの上にカメラが取り付けられていることに気づくかもしれません。そこから始めるのがいいかなと思いました。

それで早い段階で、Codex CLIに、カメラフィードといくつかのコントロールを備えたシンプルなコントロールパネルインターフェースを、作成したこの簡単なスケッチに基づいて作成するよう頼みました。次に、デザインに完全に一致するようにレンダリングするためにFigmaブランディングを追加しました。それが私たちの出発点です。その上に何ができるか見てみましょう。

ターミナルに切り替えると、GPT-5-Codexを搭載し、ChatGPTアカウントにログインしたCodex CLIが表示されます。

おそらくコーディングエージェントに以前に尋ねたことがないものから始めましょう。Sony FR7カメラを制御する計画を素早くレイアウトできますか?

正直なところ、どこから始めればよいかわかりませんでした。カメラ用のC++ SDKがあることだけは見ました。そしてCodexがおそらくそれをJavaScriptに翻訳しようとするだろうと思いました。

GPT-5-Codexがこのような質問に素早く応答できる様子がわかります。さて、時間を節約するために、Codexにviscaプロトコルを実装し、コントロールパネルに接続するよう頼みました。

ところで、Codexのデモはますます難しくなっています。なぜなら、本当にタスクに疲れることなく取り組むことができるからです。7時間以上にわたって大規模なリファクタリングに取り組んでいるのを見たことがあります。そして正しく行います。

切り替えると、これが最終結果でした。1つのタスクと私が望んでいたすべてのことに13分以上取り組みました。Codex統合もあるVS Codeにジャンプすると。

これらはCodex CLIが考え出したファイルです。Codexはノードサーバーを構築しました。30年以上前のこのプロトコルを学ぶのにかかる時間を想像してみてください。Codexは、このカメラ用に送信する非常に特定のヘッダーがあることを理解しました。

このUIコンポーネントが接続されているので、これを試してみましょう。ここでカメラをオンにして、コントロールを試してみましょう。このインターフェースから今カメラを制御できます。クールです。もっと良いことができると思います。

IDE拡張機能内でライブで別のタスクを送信してみます。ワイヤレスコントローラーを接続してカメラを制御します。今これを送信します。

舞台裏で、以前このXboxコントローラーを見つけて、これを試すことができるかもしれないと思いました。ご覧のように、Codexが計画を立て、ファイルを調査し、このゲームパッドを接続する方法を理解しています。ここで興味深いのは、IDEにコンテキストの概念があることがわかることです。

Codexがあなたの意図を理解し、最近使用したファイルを見て、それに応じて調整するため、プロンプトは短くできます。ご覧のとおり、タスク2にはさらに1分かかるので、バックグラウンドで実行させます。

他に何ができますか? 1つのエキサイティングなインターフェースは音声だと思いました。時間を節約するために、CodexにリアルタイムAPIとエージェントSDKを統合し、画面下部のこのドットのアプリに接続するよう頼みました。

素晴らしいのは、アプリに自然な音声対音声を導入するだけでなく、その会話のコンテキストで任意のサーバーに接続することです。それで、他に何をお見せできて、MCPサーバーに変えられるかを考えさせられました。照明システムがあると思いました。

ここで、この照明システムのモデル用にこのMCPサーバーを接続するようCodexに頼むプロンプトが表示されます。リファレンスドキュメントとUIが機能するために必要な正確なインターフェースを提供します。

それがCodexのエージェンティック動作の魔法です。チームメイトにそれを頼むことはできませんでしたが、タスクが非常に具体的だったため、Codexは私のチームメイトであり、プロセスをどのように進めたかを見ると、ある時点でCommand 8に関する新しい情報を見つけて前進する必要があることを理解し、GitHub docsを取得しに行き、途中で本当に動作してコードツールを使いました。それがGPT-5-Codexの魔法です。

その後、もう1ターン行って、Codexに情報を含めて実行方法を理解できるようにするよう頼みました。そこに私のMCPサーバーがあります。VS Codeに戻ると、興味深いのはXboxタスクで、すぐにそれを見ます。

ここに戻ると、すべてのローコードとクラウドタスクがVS Code拡張機能内にあることがわかります。Build MCP Serverをクリックすると、これはCodexクラウドで今お見せしたタスクで、ここでテストしたい場合はすべての変更をローカルに適用できます。適用をクリックすると、このMCPサーバーのすべての変更がローカルになりました。

すべての依存関係のインストールを開始しました。これをテストしてみましょう。しかし、まずアプリに戻ると、このXboxコントローラーでこのカメラを制御できるか見てみましょう。機能します!

拍手をありがとうございます。かなり素晴らしいです。面白いのは、どのボタンが何をすべきかをCodexに指定できることですが、ジョイスティックが良いアイデアだと理解しました。

では、本当のテストを今行い、音声モードに入り、何が起こるか見てみましょう。Codexがライトを制御するためにこれを理解したかどうかを確認してみます。

こんにちは。

やあ、大きくはっきり聞こえます。何が必要か教えてください。

カメラに何が見えますか?

あなたの前に大勢の観客が見えます。参加者が座って準備ができている列があります。

部屋は明るく照らされ、群衆が空間を満たしています。

観客に向けてライトを照らせますか?

観客を素敵な明るいライトで照らしたばかりです。今完璧にハイライトされています。拍手をありがとうございます。

今、この部屋にいる全員に挨拶できますか?

もちろんです。観客のライトが点灯しています。この素晴らしい群衆を歓迎しましょう。

こんにちは、Fort Masonの素晴らしい開発者の皆さん、信じられない一日のためにここに来てくれて本当に嬉しいです。

素晴らしい。ライトで楽しいことをして、ライブストリームで視聴している人々にこんにちはと言えますか?

楽しいライトが回っています。モーション中のダイナミックでカラフルな効果があります。

そして、ライブストリームを見ている皆さん、参加してくれてありがとう。これは素晴らしい体験になるでしょう。

クール。では、今通常に戻りましょう。素晴らしい。

これを実現するためにまだコードを書いていません。しかし、お見せしたいことがもう1つあります。最後になりますが、SamはCodex SDKを立ち上げると述べ、ソフトウェアエンジニアリングの未来かもしれないものを一瞥して終わりたいと思いました。

音声モードに戻りましょう。Codexに、映画の最後のようなクレジットオーバーレイを表示するよう頼めますか。ただし、キャストは参加者です。

Codexで今それを実行しています。準備ができたらお知らせします。

素晴らしい。その間に、カウントダウンを開始して、私たち全員の写真を撮れますか? そうです!

拍手と歓声をありがとうございます。

音声エージェントにタスクを送信したとき、Codex SDKもツールとして追加されました。つまり、今、リアルタイムでこのアプリを再プログラムし、ユーザーのニーズやフィードバックに適応させることができます。この場合、クレジットオーバーレイを作成するよう頼んだとき、このReact内のコードに入り、完了するために必要なものを見つけました。クレジットが流れています。

音声、デバイス、スケッチ、周りのデバイスを取り、これらすべてを実用的なソフトウェアに変えました。手でコードを書く必要は一切ありませんでした。

Codexに最も野心的なアイデア、最も複雑なコーディング問題を与えてください。何が起こるか見てください。毎日、私たちが驚いているのと同じくらい驚くと思います。唯一の限界はあなたの想像力です。

ありがとう! Samに戻します。拍手と歓声をありがとうございます。

モデルアップデートとSora 2

Romainありがとう。

これは、ソフトウェアの作成方法の最大の変化です。多くのことをカバーしてきましたが、明らかにモデルも非常に重要なので、いくつかのモデルアップデートを共有したいと思います。

8月に、GPT-5を立ち上げました。エージェントの操縦とエンドツーエンドのコーディングで本当に優れているようにトレーニングしました。そしてGPT-5は成果を上げました。

Cursor、Windsurf、Vercelのような主要なコーディングスタートアップは、GPT-5を使用してアプリでソフトウェアの書き方と出荷方法を変えています。最近、GPT-5 Proをリリースしました。これまでに出荷した中で最もインテリジェントなモデルです。

今日、GPT-5 ProをAPIで立ち上げます。現在、すべての開発者が利用できます。お楽しみください。拍手をありがとうございます。

GPT-5 Proは、金融、法律、医療などの分野で本当に難しいタスクで開発者を支援するのに優れています。高い精度と推論の深さが必要な場合に最適です。

また、GPT-realtime-miniでAPIに小型の音声モデルをリリースしています。これは、2か月前に出荷したAdvanced Voice Modelの小型で安価なバージョンで、同じ音声品質と表現力を持ち、70%安価です。

個人的には、音声がAIと対話する主要な方法の1つになると思っており、GPT-realtimeはその現実への大きな飛躍です。

ここで、話を変えてクリエイター向けの新機能についてお話ししたいと思います。

これは熱心に要望されてきました。映画製作者、デザイナー、ゲーム開発者、教育者が、クリエイティブプロセスの一部としてAIを使用する素晴らしい作品を見ています。

今日、Sora 2のプレビューをAPIでリリースします。拍手と歓声をありがとうございます。

Sora 2の見事な動画出力を支えるのと同じモデルに、自分のアプリ内で直接アクセスできるようになりました。

モデルで行った最大の飛躍の1つは、制御可能性です。詳細な指示を与えることができ、スタイライズされた、正確で、構成された結果を提供しながら状態を保持します。

そして、iPhoneビューを取り、Soraにプロンプトを与えて、それを壮大でシネマティックなワイドショットに拡張できます。私たちが取り組んできた最もエキサイティングなことの1つは、モデルが音をビジュアルとどれだけうまくペアリングできるかです。

スピーチだけでなく、豊かなサウンドスケープ、アンビエントオーディオ、そして見ているものに根ざしていると感じる同期された効果です。このカヤック動画で聞くことができます。

Sora 2に現実世界の一部を持ち込むこともできます。例えば、犬の静止画像を撮り、お気に入りの子犬に新しい友達を与えることができます。

誰が来ているか見て、相棒。ここにいるよ。さあ! みんな行こう。幸せな犬たち!

Sora 2はコンセプト開発にも優れています。雰囲気や製品を説明するだけで、Soraが視覚的な出発点を提供します。ここでは、eコマース広告のコンセプトを生成するためにそれを使用しています。

場所が真っ白なキャンバスのように感じられるとき、閲覧し、カスタマイズし、数分でチェックアウトできます。あなたのドアまで迅速に配達されます。

人々はSora 2を本当に気に入っているようです。立ち上げ以来、App Storeのトップにあります。APIのSora 2プレビューにより、同期された現実的な音声を含む同じ高品質の動画を製品内で直接生成できるようになりました。

そして、他のモダリティと同様に、柔軟性のために構築されています。動画の長さ、アスペクト比、解像度を制御でき、動画を簡単にリミックスできます。

Mattelは素晴らしいパートナーで、APIのSora 2をテストして製品アイデアをより迅速に実現するために私たちと協力してくれています。デザイナーの1人がスケッチから始めて、初期のコンセプトを実際に見て共有できるものに変えることができます。

動画を見てみましょう。拍手をありがとうございます。

それはおもちゃを作る非常にクールな方法です。アイデアがどれだけ速く共有可能で実用的なデザインに変わるかを見るのは信じられないことです。皆さんが自分の製品でSora 2をどのように使用するかを見ることを楽しみにしています。

まとめと今後の展望

今日、新しいものを構築するためのいくつかのアイデアが得られたことを願っています。OpenAIを、この新しい構築の時代のための優れたプラットフォームにしたいと考えています。

物事はかなり近いうちにかなり信じられないものになるでしょう。そして今日のすべての発表は、それをサポートすることを目的としています。ChatGPTでネイティブアプリを構築するためのApps SDK、自信を持ってエージェントをデプロイできるようにするAgentKit、より速く出荷するのを助けるより強力なCodex。

そして、GPT-5 Pro、Sora 2、realtime miniのようなAPIの新しいモデルで、可能性を大幅に拡大します。私たちは重要な何かが起こっているのを見ています。

ソフトウェアの構築には数か月または数年かかっていました。今日見ていただきました。今では数分かかります。そしてAIで構築するには、巨大なチームは必要ありません。大量のインフラも必要ありません。良いアイデアだけが必要です。

ここにいてくれてありがとう。構築してくれてありがとう。もう少しで終わります。ちょっと待ってください。私たちの目標は、AIをすべての人にとって有用なものにすることです。そして皆さんなしではそれができませんでした。

私たちと一緒に構築してくれていることに感謝しています。また、今日を可能にしたチームに心から感謝します。一日を通してさらに多くのことが起こっているので、セッションを楽しんで、また後でお会いしましょう。

どうもありがとうございました。

拍手、歓声と拍手。

コメント

タイトルとURLをコピーしました