
5,609 文字
私たちは開発者がより簡単に信頼性の高い便利なエージェントを構築できるようにする新しいツール群の立ち上げに興奮しています。OpenAIは開発者やビジネスがAIを活用したエージェントをより簡単に作成するのに役立つ新しいAPIとツールのセットを発表しています。これらのツールは、OpenAI自身のAIエージェント、例えばインターネットを検索して詳細かつ整理された報告書を作成するDeep Researchや、ユーザーが入力した内容に基づいてウェブブラウザを操作し、スポーツチケットの検索や予約などのタスクを支援するOperatorなどと同じ技術に基づいています。
開発者がこれらの強力なOpenAIエージェントの背後にある技術を使用できるようになったことで、特定のニーズやオーディエンスに合わせた独自の競合製品やサービスを作成することができます。絶え間ない技術革新への探求を超えて、この新しい発表の背後にある本当の理由を知ることが必要です。OpenAIの新ツールの真の理由を探ってみましょう。
OpenAIは推論、様々な種類の情報の処理、そして安全機能の向上において本当に素晴らしい進歩を遂げています。特にO1や O3を含むOファミリーの推論モデルにおいて顕著です。OpenAIの製品開発を率いるオリビエ・ゴドムは、AIエージェントをより効果的にするための推論モデルの重要性について最近説明しました。彼は過去の最大の難しさの一つが計画などの長期的なタスクの処理であったと指摘しました。これらの課題により、AIが複雑な状況でスムーズに動作することがより困難になっていました。
推論モデルを改良することで、OpenAIはAIエージェントがより論理的に考え、時間をかけて慎重な意思決定を必要とするタスクを管理できるようにすることを目指しています。このような改善により、AI駆動システムがより信頼性を高め、現実世界のアプリケーションをより効率的に処理できるようになると期待されています。しかし同社は、開発者がビジネスやその顧客向けのアプリケーションを簡単に作成するための適切なツールを今まで持っていなかったと述べています。
新しい発表により、OpenAIが開発者の課題を解決するための新しいツールを導入することは喜ばしいことです。これらのツールには、Responses API、ウェブや文書を検索するための組み込み機能、コンピュータ使用ツール、オープンソースのAgents SDKが含まれます。
Responses APIは開発者がOpenAIの技術を使用してエージェントを作成できるようにする一方、Agents SDKはこれらのエージェントを他のウェブツールやプロセスに接続し、ユーザーやビジネスが必要とするタスクを自分自身で処理できるようにします。これらの新しいツールは、複雑なプロンプトエンジニアリングやカスタムセットアップの必要性を減らすことで、AIエージェントの開発を簡素化することを目的としています。
また、これらのツールは、Manis、アリババのQuen、Deepseek、そして他の競合企業であるAnthropicやGoogleなどの企業との競争が激化する中でも、より多くの開発者がOpenAIのプラットフォーム上での構築を継続するよう促すはずです。他の企業も開発者ツールや製品を提供していますが、OpenAIの常に進化する開発者プラットフォームは競争が難しいものとなっています。最新のAI技術をシンプルで迅速、そして予算に優しい方法で使用したい人にとって素晴らしい選択肢です。
Agents SDKの影響を検討すると、OpenAIはAgents SDKを導入することでオープンソース開発への大きな回帰を決定しました。これはAIエージェントの動作を管理し改善するのを支援するために作られた特別なツールキットです。この新リリースの最も興味深い部分の一つは、開発者がOpenAIだけでなく、異なるAIモデルを使用できるようにすることです。AnthropicやGoogleなどの他の企業のモデルだけでなく、Deepseek、Quen、Mistral、そしてMetaのLamaファミリーなどのオープンソースモデルも統合できます。
Agents SDKの目標は、ビジネスや開発者がOpenAIの技術に限定されることなく、自分たちのニーズに最も適したモデルを選択する自由を与えることです。このツールキットには、AIエージェントをより効果的に機能させるためのいくつかの有用な機能が付属しています。一つの重要な機能は、AIモデルを特定の指示とツールで設定できる機能で、タスクをより効果的に実行できるようにします。
もう一つの機能は、状況に応じて異なるAIエージェント間でタスクがスムーズに移行できるようにし、より組織的で効率的なワークフローを可能にします。AIエージェントが安全かつ責任を持って運用されるようにするために、SDKには組み込みの安全対策が含まれています。これらは入力のチェック、コンテンツのフィルタリング、潜在的なリスクの防止に役立ちます。
さらに、開発者はAIエージェントのパフォーマンスを監視、追跡、最適化できるツールにアクセスできます。これにより、エージェントが何をしているか、どのようなタスクを作成しているか、どのような種類のデータを収集しているか、そしてどのように応答を生成しているかを正確に確認できます。
このリリースにより、OpenAIは開発者がより柔軟で制御されたAIを扱えるようにしています。新しいSDKはAIの動作を追跡するための明確で透明性のあるシステムを提供し、開発者がよりスマートで安全、そして効率的なAIアプリケーションを構築するのに役立ちます。
新しいOpenAI APIから期待できること。OpenAIは最新のアップデートの重要な部分としてResponses APIを導入しました。この新しいAPIは既存のChat Completions APIの機能をAssistance APIのツール使用機能と組み合わせています。ただし、同社はAssistance APIが2026年半ばには使用できなくなることを発表しています。これらの機能を統合することで、OpenAIは複雑で多段階の対話を必要とするアプリケーションを開発者が構築しやすくすることを目指しています。
Responses APIの主な利点の一つは、開発者が単一のリクエスト内で複数の組み込みツールを使用できることです。これにより、AIモデルは複数の別々のAPI呼び出しを必要とせずに、より効率的にタスクを完了できます。ローンチ時、このAPIは3つの主要なツールを含んでいますが、それについてはまだ見ていきます。
この新しいAPIの大きな利点は、開発者にAIモデルの動作についてより多くの洞察を提供することです。彼らはモデルがどのツールを使用しているか、その選択の背後にある理由、そしてそれらのツールを使用する前後の意思決定がどのように行われるかを確認できます。OpenAIはこのAPIがAI駆動アプリケーションの強固な基盤となり、複数の外部システムの必要性を減らすと考えています。
Responses APIは現在全ての開発者が利用可能であり、その使用はトークンとツールアクセスについてのOpenAIの標準価格に従います。Chat Completions APIは引き続き更新を受け取りますが、OpenAIはResponses APIをより高度なバージョンとみなしています。組み込みツールと多段階のAI対話が必要な開発者は、将来のプロジェクトにResponses APIを使用することが推奨されています。
OpenAIはResponses APIの機能を拡張し、3つの重要なツールを利用可能にしています。これらのツールは、ウェブ検索、ファイル検索、そしてコンピュータ使用です。これらのツールは、AIエージェントが実世界の情報にアクセスし、文書から詳細を収集し、デジタル環境とより効果的に対話するのを支援するために設計されています。これらの機能を統合することで、OpenAIはAIモデルをより広範なアプリケーションに役立つようにすることを目指しています。
ウェブ検索ツールは主要な追加機能であり、AIがインターネットからリアルタイムの情報を見つけることを可能にします。この機能は、研究アシスタント、ショッピングガイド、コンテンツ収集プラットフォームなどのアプリケーションに特に役立ちます。このツールの主な利点の一つは、ユーザーが情報の正確さを確認できるよう、応答に出典を提供することです。
OpenAIは検索結果に明確な引用が含まれ、ユーザーがリンクをクリックして元のソースを自分で調べることができることを確認しています。開発者はこのツールを、独自のプライベートデータソースを含む可能性のあるより大きな検索システムの一部として使用できます。
アップデートのもう一つの重要なツールはファイル検索で、AIが大量の文書コレクションから関連する詳細を素早く見つけるのに役立ちます。このツールは複数のファイル形式をサポートするために設計されており、クエリ最適化、メタデータフィルタリング、カスタムランキングなどの高度な機能を備えています。これらの機能により、AIはより正確で効率的に情報を取得できます。
より高度にするために、OpenAIはこのツールの価格モデルを導入し、1000回の検索につき250ドル、ストレージに1日あたり1ギガバイトあたり0.10ドルの少額の料金を課しています。ただし、最初の1ギガバイトのストレージは無料で提供されます。
導入される3番目のツールはコンピュータ使用ツールで、AIの能力をテキスト処理だけでなく拡張します。この機能により、AIエージェントはデータの入力やソフトウェアインターフェースのナビゲーションなどのアクションを実行して、コンピュータシステムと直接対話できるようになります。これはOpenAIのコンピュータ使用エージェントモデルによって駆動され、AI生成の指示をコンピュータで実行できる実際のコマンドに変換します。
これにより、既存のAPIが利用できない場所でもAIがタスクを処理できるようになり、デジタルワークフローでのより大きな自動化と柔軟性が可能になります。これらのツールを導入することで、OpenAIはAIの機能を拡張しています。これらの追加により、AIエージェントはウェブから最新の情報を収集するか、大量の文書データベースを検索するか、またはコンピュータでアクションを実行するかにかかわらず、より効果的に機能できます。
このアップデートにより、開発者はよりスマートでインタラクティブなAI駆動アプリケーションを構築するためのより多くのオプションが提供されます。コンピュータ使用ツールは現在テスト中であり、より高い使用層の一部の開発者のみが利用可能です。OpenAIはその価格を入力トークン100万個あたり3ドル、出力トークン100万個あたり12ドルに設定しています。
ビジネスや技術リーダーにとって、これらの新しいツールは、ゼロからカスタムソリューションを構築する必要なく、AI駆動プロセスを改善し自動化するための実用的な方法を提供します。IT管理者、最高技術責任者(CTO)、中間管理職はこれらの機能を活用して、ワークフローをより効率的にすることができます。
組み込みのウェブ検索とファイル検索ツールにより、企業は既存のシステムにAI駆動の情報検索を簡単に統合できます。一方、コンピュータ使用ツールは、直接APIアクセスを持たない古いアプリケーション内のタスクを自動化し、AIがそれらと対話しやすくします。
OpenAIのオープンソースAgents SDKは、ビジネスにAIワークフローに対するさらなる制御を提供します。このツールキットにより、組織は異なるチーム間でAI駆動プロセスをより適切に調整できます。これは、AIが反復的なタスクをより効率的に処理できるカスタマーサポート、文書管理、市場調査などの分野で特に役立ちます。
これらのツールには組み込みのセキュリティと監視機能も付属しており、企業はAI操作に対するより良い可視性と制御を得ることができます。これにより、ビジネスはより大規模にAIを使用しながら、セキュリティを維持し、規制に従い、パフォーマンスを監視できることが保証されます。
OpenAIはこれらの新しいリリースをはるかに大きな計画の始まりに過ぎないと考えています。同社は将来的により多くのツールと統合を導入し、開発者がAI駆動アプリケーションをより効果的に構築、テスト、拡張するのを支援する予定です。OpenAIは既にDeep Researchなどの独自のAIエージェントで成功を収めていますが、開発者が様々な種類のAI駆動エージェントを作成する上で重要な役割を果たすと考えています。
AIアプリケーションをより安全にするために、OpenAIはセキュリティ機能の改善にも取り組んでいます。これには、プロンプトインジェクションに対する保護やデータへの不正アクセスの防止が含まれます。これらの新しいツールの使用に興味のある開発者は、OpenAIのドキュメンテーションとAPIプレイグラウンドを調べ、すぐに構築を開始することができます。
ここまで読んでくださった方は、下のコメント欄であなたの考えをお聞かせください。より興味深いトピックについては、画面に表示されている推奨ビデオを今すぐご覧ください。ご視聴ありがとうございました。


コメント