Codexスーパーアプリ:OpenAIはClaude Codeを終わらせたのか?

スタートアップ・VC
この記事は約10分で読めます。

OpenAIがデスクトップ向けコーディングツール「Codex」をアップデートし、Mac、スマートフォン、CIパイプライン、社内サーバーをシームレスに連携させる強力なプラットフォームへと進化させたことについて解説する。モバイルアプリからのリモート操作、セキュアなリレーインフラ、エンタープライズ向けのリモートSSH接続、そしてCIへの統合を可能にするフックやプログラムアクセス権などの新機能により、Codexがいかにして本格的なAIエージェントの「スーパーアプリ」となったのかを紐解く内容である。

Codex SuperApp: Did OpenAI Just Kill Claude Code?
OpenAI just shipped three updates in one drop that turn Codex from a desktop coding tool into a full-blown developer sup...

Codexスーパーアプリの誕生

OpenAIがついにCodexスーパーアプリを正式にリリースしました。本日発表された3つのアップデートにより、Codexは単なるデスクトップ用コーディングツールから、Mac、スマートフォン、CIパイプライン、そして会社のサーバーで同時に稼働する完全なプラットフォームへと生まれ変わりました。それでは詳しく見ていきましょう。OpenAIが本日リリースしたCodexのアップデートは、表面上は単なるモバイルアプリの発表のように見えますが、実は彼らが数ヶ月前から構築してきた大きな計画、つまりCodexスーパーアプリにおける欠けていたピースなのです。まずは何が新しくなったのかをご説明します。iOSとAndroidのChatGPTモバイルアプリ内でCodexにアクセスできるようになりました。これはChatGPTがサポートされているすべての地域で利用可能です。OpenAIによると毎週400万人がCodexを利用しており、本日からその全員がプレビュー版としてこれを利用できるようになります。モバイルアプリはMac上のCodexデスクトップと通信します。Windowsデスクトップのサポートはロードマップにはありますが、まだライブではないため、Windows開発者にとっては大きな制限となります。

セキュアなリレーインフラの仕組み

このペアリングは、OpenAIがセキュアリレーレイヤーと呼ぶものを介して行われます。これがすべてを動かす重要なインフラストラクチャです。このリレーは非常に重要なので、それが実際に何なのかを理解しておく価値があります。通常、スマートフォンから自宅のマシンにアクセスしようとする場合、パブリックIPでSSHのようなものを使用するか、ngrokのようなトンネリングサービスを実行するか、ルーターに穴を開けることになります。これらはすべて、何らかの形であなたのマシンをオープンなインターネットにさらし、設定も面倒です。このリレーはそれを完全に回避します。あなたのMacはOpenAIのインフラに接続します。あなたのスマートフォンもOpenAIのインフラに接続します。そして、この2つのデバイスはその中間レイヤーを介して通信するのです。あなたのマシンがパブリックなウェブから直接アクセスされることは決してありません。また、セッションのステータスも同期されます。つまり、ノートパソコンでスレッドを開始し、スマートフォンでそれを引き継ぎ、さらに別のノートパソコンに切り替えても、コンテキストは3つすべてに引き継がれます。これは、OpenAIが次におそらくリリースするであろう多くの機能の基盤となるでしょう。

スマートフォンからの強力なリモート操作

スマートフォンからは、デスクトップで行うすべてのことが可能です。Codexが作業している内容の確認、コマンドの実行前の承認、スレッド途中でのモデルの変更、新しいタスクの開始、エージェントが行き詰まった際の質問への回答などができます。スクリーンショット、ターミナルの出力、コードの差分、テスト結果など、リアルタイムの更新がスマートフォンに送られてきます。つまり、Codexが自宅でテストスイートを実行している場合、その結果がスマートフォンに届くのをリアルタイムで見ることができます。コードに変更が加えられれば差分を確認できます。ブラウザを開いて一連のフローをクリックして進めれば、そのスクリーンショットも実際に受け取ることができるのです。さて、ここで発表では控えめに扱われている部分があります。今日のアップデートは、1ヶ月前の4月16日にリリースされた、OpenAIがほぼすべてのためのCodexと呼んだものを理解して初めて意味を持ちます。そのアップデートでは、CodexのMacアプリにネイティブなコンピュータ使用機能が追加されました。つまり、Codexはあなたの画面を見て、自分自身のカーソルを制御し、UI要素をクリックし、アプリケーションに入力し、クリップボードを使用する能力を得たのです。これらすべてを、あなたが指定したあらゆるMacアプリケーション内で行えます。また、アプリ内ブラウザ、GPT Image 1.5による画像生成、セッション間のメモリ機能、そして外部ツールに接続するための90以上のプラグインも追加されました。

並行作業を可能にする設計

Codexでのコンピュータ使用機能の仕組みは、アプリ内に専用のコンピュータ使用プラグインをインストールし、Mac OSの画面録画とアクセシビリティの権限を一度だけ付与するというものです。その後、Codexはあなたのカーソルを乗っ取ることなく、自分自身のカーソルでアプリを操作できるようになります。これは素晴らしい機能です。なぜなら、エージェントが並行して実行されている間も、あなたは作業を続けることができるからです。現在はMacのみの対応で、ローンチ時点ではEU、イギリス、スイスは除外されています。ですので、今日のアップデートを先月のものと合わせると、全体像が見えてきます。Mac上のCodexはすでに画面を見て、あちこちクリックし、フォームに記入し、ブラウザを使用し、コードを実行することができます。今日から、そのすべてをスマートフォンからトリガーできるようになりました。これが、今回のローンチを単なるモバイルアプリのローンチ以上のものにしている理由です。スマートフォンは、あなたの実際のマシン上で実際のソフトウェアを操作できるAIエージェントの、リモコンになるのです。あなたはスマートフォンでコーディングしているのではありません。スマートフォンは、自宅で実際の作業を行っているエージェントに対する入力レイヤーにすぎないのです。

エンタープライズ向けのリモートSSH対応

今日リリースされたもうひとつの機能で、ほとんど報道されていないのが、リモートSSHの一般提供開始です。Codexは、管理されたリモート開発環境に直接接続できるようになりました。これは、大企業が開発者に対し、事前承認された依存関係、認証情報、セキュリティポリシーを提供するために使用するような環境です。デスクトップアプリはあなたのSSH設定を自動的に読み取り、アクセス権のあるホストを検出し、ローカルと同じようにそれらのリモートマシン内でCodexプロジェクトを立ち上げられるようにします。一度接続すれば、それらのリモート環境へも同じリレーインフラを通じてスマートフォンからアクセスできます。このアップデートはエンタープライズ市場に向けたものです。大企業がAIエージェントを採用する際の最大の障壁は、彼らのコードベースがコンプライアンス、ネットワーク制限、認証情報のゲーティングといった何重もの層の後ろにあり、ほとんどのエージェント製品がそこにうまく適合しないことでした。リモートSSHとリレーを組み合わせることで、OpenAIは、環境はロックダウンされたそのままの状態で、エージェントがその内部で動作する、と言っているのです。コードを移動させる必要はありません。モデルと認証情報を共有する必要もありません。Codexを、すでに適切な設定がされているボックスに向けるだけでよいのです。

AIエージェント開発競争の最前線

少し引いた視点で、これが全体として何を意味するのかを考えてみましょう。これは単に400万人がモバイルアプリを手に入れたという話ではありません。エージェントがあなたのマシンや会社のマシン上で動き、あなたが使うのと同じようにソフトウェアを実際に使う能力を持ち、セッションをまたいで記憶を保ち、どこからでも操作でき、なおかつエンタープライズ基準を満たすセキュリティインフラの背後で機能する、そうしたエンドツーエンドの製品が完成したということです。これこそが、Codexデスクトップアプリが最初にローンチされた2月から、OpenAIが少しずつ構築してきた実際の製品なのです。競合の状況も指摘しておく価値があります。Anthropicはしばらく前から非常によく似た形の製品をリリースしています。Claudeは2024年の10月からコンピュータ使用機能を備えており、彼らのデスクトップエージェント製品は数ヶ月前からモバイルでのタスクディスパッチ機能を搭載しています。ですから、OpenAIがここで新しいカテゴリーを発明しているわけではありません。彼らは機能面で追いつこうとしているところですが、これまでにリリースしたものを見れば、おそらく少しリードしていると言えるでしょう。より優れたオーケストレーション、より優れたセーフティレイヤー、そしてより優れたツールのエコシステムを構築した者が、AIエージェントの次のフェーズを制します。今日のアップデートは、OpenAIがこの競争に本気で取り組んでいることを物語っています。

信頼性とセキュリティの重要性

信頼性の問題は現実のものであり、声に出して言う価値があります。あなたはAIエージェントに対し、あなたの実際のアカウントでサインインした実際のマシン上で、アプリやブラウザを操作する権限を与えようとしているのです。エージェントは、あなたがそれらのアプリでできることなら何でもできます。OpenAIは機密性の高いアクションに対して承認のゲートを設けていますが、あなたは慎重になるべきです。銀行にログインしているChromeプロファイルにこれを接続しないでください。深く考えずに、破壊的な書き込み権限を持つアプリにこれを向けないでください。試してみたい場合は、MacのCodexアプリとスマートフォンのChatGPTアプリの両方をアップデートしてください。両方で同じアカウントでサインインすると、あなたのMacが接続された環境として表示されます。Windows版もまもなく登場します。これが本当に必要かどうかはあなたのワークフロー次第ですが、すでにCodexのユーザーであれば、モバイル機能はあなたがCodexを使う頻度を静かに変えてしまうものになるでしょう。

開発チーム向けの静かな、しかし強力な新機能

OpenAIが今日ひっそりとリリースした他の2つの機能は、Codexを実際のエンジニアリングのワークフローに組み込もうとしている開発チームを真っ直ぐに見据えたものです。1つ目はフックと呼ばれ、2つ目はプログラムアクセス権トークンです。どちらも単体では小さな機能ですが、これらが組み合わさることで、Codexは誰かのノートパソコンの上だけでなく、CIパイプラインや内部ツールの内部に組み込まれるようになります。フックを使用すると、タスクの特定のポイントで実行されるスクリプトを使用して、Codexのループをカスタマイズできます。つまり、Codexが作業を行う前や後にバリデーターを実行したり、プロンプトがモデルに届く前に機密情報をスキャンしたり、コンプライアンスのためにすべての会話を社内システムに記録したり、リポジトリやディレクトリごとにメモリを作成して動作をカスタマイズしたりすることができます。この最後の機能は最も過小評価されている部分です。これはつまり、フロントエンドチームは自分たちのリポジトリ内でCodexをある方法で動作させ、バックエンドチームは自分たちのリポジトリ内でCodexを別の方法で動作させることができるということです。そして、誰かを再トレーニングしたり、グローバルな設定を維持したりする必要はありません。動作はコードベースと一緒に移動します。

CIパイプラインへの統合と今後の展望

もうひとつの要素が、プログラムアクセス権トークンです。これらはビジネスおよびエンタープライズチーム向けのスコープ付き認証情報です。ChatGPTのワークスペース設定内でこれらを生成し、CI、リリースワークフロー、または社内の自動化ツールに組み込むことができます。これにより、誰も対話的にサインインすることなく、ビルドパイプラインがCodexと通信できるようになります。トークンに有効期限を設定したり、必要なときにいつでも取り消したりすることができ、すべての使用状況はワークスペースに紐付けられたままになります。つまり、どの認証情報を使って何が行われたかの監査ログを実際に保持できるのです。実際のプロダクションエンジニアリングのプロセスにAIを統合しようとしたことがあるなら、対話的なサインインが致命的な障害になることをご存知でしょう。パイプラインにはマシンが使用できる認証情報が必要であり、管理者は何か問題が発生した場合に備えて、それらの認証情報を素早く無効化できなければなりません。OpenAIはまさにその両方をリリースしたのです。フックと組み合わせることで、大量のグルーコードを書くことなく、Codexをあなたのリリースプロセスに実際に組み込めるようになります。これは静かなリリースですが、エンジニアリングチームを運営している人なら、間違いなく注目すべき内容です。今日の動画は以上です。ぜひチャンネル登録をして、universeai.behive.comの新しいニュースレターもフォローしてください。また、メインチャンネルのWorld of AIの登録と、XでUniverse of AIZのフォローによるサポートもよろしくお願いします。それでは、次回の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました