新GPT-5 Codexモデルがローンチ

OpenAIが2024年9月15日にリリースしたGPT-5 Codexモデルのアップデートに関する解説動画である。従来のコーディングAIの課題であった「外科的編集の困難さ」と「長期的なエージェント作業の正確性不足」を解決した新モデルの技術的進歩と、ClaudeとOpenAIの競争構造の変化について詳細に分析している。特にコーディング分野におけるOpenAIの戦略的優位性の確立と、AI業界の急速な発展に対する適応の重要性を強調した内容となっている。

NEW GPT-5 Codex Model Launches

My site: substack: 1. Codex Upgrade: OpenAI launched a new flavor of ChatGPT-5 optim...

新GPT-5 Codexモデルのローンチと技術革新
モデルの理解力向上と戦略的変化
OpenAIの継続的な技術革新と競争環境
品質重視のアプローチと競争優位性
エコシステムでの戦略的優位性
指数関数的変化への適応と継続的学習

新GPT-5 Codexモデルのローンチと技術革新

9月15日の月曜日、ChatGPTがCodexのアップグレードをリリースしました。Codexはもちろん、ChatGPTが構築してきたエンジニアリングプラットフォームであり、OpenAIが開発を進めているものです。今回のCodexのアップグレードは、実際にはコーディング専用に最適化されたChatGPT-5の新しいフレーバーなんです。

これは、私たちCodexで構築している人たち、Claude Codeで構築している人たち、あらゆるAIツールで構築している人たちにとって、本当にフラストレーションの原因となっていた2つの問題を修正しています。

具体的には、AIに停止させて一つのことだけを修正してもらうことが本当に、本当に、本当に困難だったということです。外科的編集は本当に大変でした。そして、高い正確性を持って長期的なエージェント作業をやってもらうことが困難でした。この最後のフレーズが重要です。なぜなら、これらのAIツールを使ったことがある人なら知っているように、長期的なエージェント作業は簡単にこなしますが、必ずしも高い正確性を持ってではないからです。

私は以前、これをプロンプトでどう対処するかについて話しました。データのチャンク化でどう対処するかについて話しました。コードベースをどう扱い、コンテキストとしてコードベースをどうフィードし、決定事項をマークダウンファイルでどう追跡するかについて話しました。

人々が使っているトリックは色々あります。これらのトリックはおそらく今でも役に立つでしょうが、これらのコアタスクで実際により優れているベースモデルがあることは確実に助けになります。なぜ突然うまく機能するようになったのかと自問し、玉ねぎの皮をむくように考えてみると、コード実行タスクとコーディング関連のプロンプトの理解に関して、推論器の品質を向上させたのだと思います。

モデルの理解力向上と戦略的変化

これが、外科的編集を行う際にトークンをはるかに節約し、長期的なエージェント作業を行う際にトークンをはるかに多く、あるいは広範囲に使用するモデルフレーバーを同時に実現できる唯一の方法です。モデルがあなたの求めるものをより良く理解する必要があるのです。これは、考えてみると大きな問題です。なぜなら、ChatGPT-5全体について本当に困難だったことの一つは、粘着性を感じることだからです。

行き詰まった感じがします。どんなプロンプトを投げても、「これらがすべてのアクションアイテムで、これが私たちがやることです」と言う、過活動的なスピードボートのようなモデルを得ることになる感じがします。そして他のことをやってもらうには、プロンプトに本当に重く依存しなければなりません。私はプロンプトにどう依存するかについて大量に話してきました。

そしてそれについて再度やる別のビデオももうすぐ出します。しかし今回の場合、これはあなたに見逃してほしくない、何か違うものの兆候です。この状況では、モデルがあなたのプロンプトをより良く理解するようになっています。あなたが巧妙にプロンプトを書かなくても、モデルがあなたのプロンプトをより良く理解するようになっているのです。これは本当に大きなことです。

確かにこれはコード用です。コードは、おそらくプロンプト解析において最も簡単なユースケースです。率直に言って、エンジニアは非常に具体的である傾向があるからです。エンジニアは非常に具体的である傾向があります。エンジニアは実際の特定のコードアクションを参照する傾向があります。そのため、モデルをプロンプトの解析と理解において少し良くしようとしているなら、それを少し良く理解してもらうのは簡単モードでしょう。でもそれでも一歩前進です。

このモデルにとっては大きな一歩です。なぜなら、ChatGPT-5全体は人々にとってプロンプトを書きやすくしていないからです。高度なモデルでの作業を諦め、ChatGPT-5があまりにもプロンプトが困難なモデルだったためプロンプトを諦めた人を複数知っています。私は理解できます。私のことではありませんが、私はこの分野が大好きですが、なぜそれが理にかなっているか理解できます。

OpenAIの継続的な技術革新と競争環境

こんなに難しいはずではありません。こんなに難しいはずではありません。このアップデートを作った時、チームが考えていたのはそういうことのようです。もっと簡単であるべきです。そして、SweetBenchでちょっと高いスコアを取ったり、あれこれありますが、ここでの真の要点は、OpenAIのこのチームが本当に、本当に、本当に速く出荷し続けているということです。

Claude Codeに関するRedditスレッドや、そこでCodexに移行していると言っているRedditユーザーのうちどれだけが本物かという騒動について、あなたがどう思おうと。Codexへの勢いの変化は本物です。Codexに向けて大きな勢いの変化があり、それが戦略的な戦場を長い間変えてきました。

OpenAIが消費者ベースを考えると最高の一般市場ポジションを持ち、Claudeがコードでの橋頭堡を考えると最高の専門ポジションを持っているというのが長い間の真理でした。

それが変わりつつあり、今ではClaudeの戦略さえも変わっているのがわかります。なぜならClaudeは今、より強調しています。私たちにはこれらのデータコネクターがあります。私たちはこの素晴らしいPDF作成とこの素晴らしいPowerPoint作成、この優れたExcel作成ファイルをローンチしました。私はそれについてビデオを作りました。本当に、本当に良いです。それは異なる戦略です。

そして私にとって、彼らがClaude Codeではなくそれをリリースすることを選択したという事実は、少し絶望的に感じられます。もしCodexがどこに向かっているか、Codexがどれほど速く出荷しているかと競合できるリリースするものがあったなら、彼らはそうしたでしょう。私は9月15日の月曜日にこれを言っていますが、今週ダリオ・アモデイの大きなスピーチが予定されており、Opus 4.5が出てくるという噂があることを承知しています。

だから、週末には彼らが行った大きな動きについて話しているかもしれません。これがこういうゲームの進み方ですよね。軍拡競争です。行ったり来たりです。しかし今週何がローンチされるかに関係なく、あなたは気づくべきです。戦略的な景観が変化し、このようなローンチが体験を粘着性のあるものにするエンジニアリング努力の質を強化することを認識すべきです。

品質重視のアプローチと競争優位性

それらは粘着性を作ります。指先により多くのパワーがあって、それが正しいものと、指先により多くのパワーがあるが、それが間違っているか悪いプルリクエストにつながりやすいものの選択肢があるなら、あなたは毎回品質を選びます。なぜならそれはやり直し作業を減らすからです。すべてのエンジニア、10人中10人のエンジニアがそれを選ぶでしょう。そして彼らは正しいです。

そして実際、それは仕事の他の部分にも当てはまります。皮肉なことに、ClaudeのExcelでのコネクターリリースを強力にしたものの一部は、実際に以前にOpenAIから見た何よりもExcelの多くを正しく取得したということです。PowerPointについても同様に、これまで以前より良いPowerPointデッキを作るのが簡単でした。

PDFからも良い結果を得られました。まだそのビデオは作っていませんが、そのビデオを作る予定です。要点はこれです。品質の高い仕事を提供するモデルを優先する必要があり、そのようなモデルの変更は本物だが、あなたが思うより稀だと期待する必要があります。

これは細かい点ですが、考えてみると、Claude Codeは1年以上にわたって全体的に最高のコーディングエコシステムでした。そして今になってようやくCodexに向けたシフトが見え始めています。そしてこれらのシフトは粘着性があり、行われている変更が品質を強化し、チームがClaudeに対して本当に速く出荷しているため、そのシフトは粘着性があると予想します。

私はAIで何かが永続的な優位性だと宣言する用意があるかというと、絶対にそうではありません。長期的には常にマルチモデルを考えるべきです。しかし、本番パイプラインを構築する際のマルチモデル使用例を考えることと、エコシステムでのポジションを考えることには違いがあります。

そしてエコシステムでのポジションはより粘着性があります。より粘着性があるのです。この場合、CodexはエコシステムのコーディングポジションからClaudeをシフトさせ、押し出し始めています。

エコシステムでの戦略的優位性

それは非常に強力なスポットです。なぜなら、コードが可能にする他のすべてのことと、あなたが得ることができるレバレッジのためです。より多くのコードがOpenAIへの強化学習として入っていくという事実は、彼らが今、エコシステムの他のプレイヤーから、直接Claudeから直接獲得している些細ではない利益です。

だから、Codexは定着すると予想します。私はCodexについてもっと長いビデオを作る予定です。これはただの導入でした。これは速報アップデートです。もし一歩下がって、私たちが皆生きているこの指数曲線のどこにいるかを見てみると、私にとって思い浮かぶことの一つは、私たちが誇大宣伝に飽きており、これらすべてのアップデートに慣れてしまったために、このようなニュースのいくつかがいかに途方もないものかを忘れてしまったということです。

人間は何にでも慣れることができます。私たちは過去2年半にわたる途方もないニュースの流れに慣れてしまいました。もしCodexが2022年の青空から落ちてきたなら、それがコーディングのことであっても、非常に知的なモデルだからという理由で、あらゆる種類の新聞の一面に載ったでしょう。しかし今では9月のただの月曜日です。

私たちはそれに慣れてしまいました。特にこれらのモデルがより良くなり、よりエージェント的になり、文字通りグラフがそこにあるように、あなたが適切にプロンプトすればよりエージェント的だからという理由で、あなたのためにはるかに多くのことができるようになったとき、あなたに挑戦したいと思います。そしてそれがまさにCodexができることです。

指数関数的変化への適応と継続的学習

もしあなたがエンジニアなら、報酬は不釣り合いになるでしょう。誇大宣伝に飽きず、集中し続け、AIから何を求めるかを知り、それを利用して自分が構築したい方法で構築できるなら。そして誰もがコードで構築するわけではありません。言葉で構築する人もいれば、数学で構築する人もいます。

しかし、あなたは自分が何を気にかけるかを決める必要があり、その流れに食いつき、それに従い、真剣に受け止め、ツールセットを大幅にアップグレードする必要があります。学習曲線は本物になるでしょう。なぜなら私たちは皆、一緒にこの指数曲線を通り抜けているからです。他の皆がただの月曜日だと言うことに騙されないでください。

ただの月曜日ではありません。ニュースは来続けるでしょう。今週でもより大きなリリースがあるでしょうが、これは大きなことでした。そしてCodexで何かを構築することを楽しんでほしいと思います。以前にコードを構築したことがある人として、Codexがより良いというこの約束全体、彼らは定量的分析を行いましたよね。ただ約束しているだけではありません。

実際にプルリクエストなどを見ています。しかし、これが私たち全員にとって実際に実現することを本当に望みます。なぜなら、帽子を落としただけでコードベース全体をリファクタリングすることに執着しないAIを持てることは本当に素晴らしいことだからです。外科的編集があったら素晴らしいでしょう。

だから外科的編集に乾杯。指数関数的変化に乾杯。誇大宣伝を見抜いて、それが飽きるべき誇大宣伝ではないと認識することに乾杯。それは本当に大きなことです。ただの月曜日ではありません。Codexで楽しんでください。