GPT-5.4のリークと quit GPT運動の拡大

OpenAIの次期モデルGPT-5.4に関する複数のリークが確認され、その詳細が明らかになりつつある。GitHubのコード、エラーログ、従業員のスクリーンショットから、100万トークンのコンテキストウィンドウ、エクストリームシンキングモード、フル解像度画像対応など、大幅な性能向上が示唆されている。一方で、OpenAIの国防総省との提携をめぐってquit GPT運動が拡大し、AnthropicのClaudeへのユーザー移行が加速している。Anthropic CEOはOpenAIの発表を「欺瞞的」と批判したが、同時にPentagonとの交渉再開の動きも報じられている。OpenAIは月次リリースサイクルを採用し、過度な期待と失望のサイクルを回避する戦略に転換した模様である。

GPT 5.4 leaks

The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

GPT-5.4の存在が確認される
GitHubからのリークとモデルの詳細
新機能と性能向上
OpenAIの戦略転換とquit GPT運動

GPT-5.4の存在が確認される

OpenAIのGPT-5.4に関する噂やリークが飛び交っていましたが、今日の時点でこれらが単なる噂ではないことが確認できました。また、この動画ではquit GPT運動についても触れておきたいと思います。OpenAIの行動、特に国防総省との取引に関して、かなり大きな反発が起きているんです。

今日の動画を録画した後、いくつか新しい情報が明らかになりました。まず第一に、すでに知られていたことですが、quit GPT運動は急速に拡大しています。多くの人がChatGPTのサービスをキャンセルし、Anthropicに乗り換えているんです。その数字は驚くべきものです。基本的に立場が入れ替わってしまいました。AnthropicがOpenAIを上回り、OpenAIはかなり落ち込んでいます。これは少なくとも推定初回ダウンロード数を見た場合の話ですが。

数日前に投稿したように、OpenAIに対してかなり大きな反発が起きています。また、速報ですが、AnthropicのトップがペンタゴンとのAI取引について協議を再開しているとのことです。数本前の動画でこの可能性について触れましたが、これが私の希望的観測だったのか確信が持てませんでした。でも、Claudeには多くの支持があり、さまざまな部署がその使用を継続したいと考えているように感じていました。ですから、指を交差させて、Anthropicが復帰を許され、政府から有害な指定や報復を受けずに済むことを願っています。すべてがうまくいくことを祈っています。

残念ながら、これもまた出たばかりの情報ですが、Anthropic CEOの率直なコメントが妥協の可能性を危うくしているとのことです。これらのコメントは、おそらく私たちが見ているもう一つの記事を指しています。Anthropic CEOのメモが、OpenAIの欺瞞的なペンタゴン発表を攻撃しているというものです。欺瞞的というのは、つまりでたらめだということです。彼らの発表、彼らがやっていることは真実ではないと言っているんです。いわゆるTwitterの馬鹿者を欺くためのものだと。

前回の動画に多くのコメントをいただきました。たくさんの議論がありました。コメントの中には、私を批判するものではないと言いたいですが、皆さんが意見を述べていて、少し中立的すぎるのではないか、そういった意見もありました。ですから、それらのコメントを読んで、今見たばかりの状況について完全な深堀りをする準備をしています。たくさんのことが起きていますから。OpenAI側では、潜在的な抜け穴を徹底的に調査し、このAIが悪用されないようにするための安全層を構築するために、ある種の一時停止があるようです。

つまり、この動画では厳密にGPT-5.4について話すということです。なぜ今起きていることについてコメントしないのか疑問に思っているかもしれませんが、それは単に、この1時間で大量の新情報が出てきて、それを読んで理解する必要があるからです。明日議論しましょう。でもここでは主にGPT-5.4について話します。これは近々登場します。

そしてこれは以前とは、OpenAIが以前やっていた方法とは、いくつかの重要な点で異なっています。GPT-5で私たちが待っていたもの、このGPT-5.4、これがそれかもしれません。これが私たちが待っていたGPT-5かもしれません。では、高評価をお願いします。チャンネル登録もお願いします。それでは始めましょう。

GitHubからのリークとモデルの詳細

昨日だったと思いますが、OpenAIがGPT-5.3 Instantを公開しました。そして次のモデルがすでにリークされました。一度だけでなく、二度でもなく、1週間に3回もです。そしてそれはOpenAI自身のGitHubページから来ました。コード、エラーログ、そして従業員のスクリーンショットです。そして今朝だったと思いますが、The Informationが、OpenAIの情報源に確認を取り、このモデルについていくつかの詳細を入手しました。そして興味深いものになっています。

まず第一に、200万トークンのコンテキストウィンドウになるという噂がありました。それは大きなものになったはずです。どうやらそうではないようですが、100万トークンのコンテキストウィンドウは手に入るようです。では少し戻って、正確に何が起こったのかを話しましょう。

5.3がロールアウトされました、というか5.3 Instantがロールアウトされ、ChatGPT全体で更新されました。これは多くの人が使用するモデルです。Instantモデルは多くの人が使用するもので、ボットとチャットしているだけなら、答える内容一つ一つについて本当に深く考えてほしいとは言わないでしょう。速い答えが欲しいんです。だから今ではすべてのユーザーのデフォルトChatGPTモデルになっています。

そして大きな焦点は、ChatGPTとの会話をより快適にすることです。幻覚が27%減少しました。そしてもう一つ大幅に改善されたことがあります。それを言う前に、ちょっと落ち着いてくれませんか。落ち着いてください。人からそう言われるの嫌じゃないですか。一人が他の人に落ち着けと言って、意図通りにうまくいって、相手が「ああ、そうだね。落ち着こう」となる状況を見たことがありますか。

そんなことは一度も起きたことがありません。落ち着けという言葉は、ほとんど侮辱のように受け取られると思います。喧嘩を売る言葉です。どうやら以前のGPTモデルは、ユーザーにかなり頻繁に落ち着けと言っていたようです。実際、ChatGPTのsubredditでこの問題についての投稿をたくさん見た記憶があります。

何らかの理由で、その表現に本当に偏っていたんです。ねえ、落ち着いて、みたいな感じで。だから今、GPT-5.3 Instantでは、落ち着けという言葉がずっと少なくなっています。それが抑えられました。その表現の使用を落ち着かせたんです。

また、ライティングの向上、検索統合の改善、不必要な注意事項や拒否の減少もあります。これらは本当に嫌いです。すごくイライラします。Geminiモデルの一つとやり取りしていた時のことですが、以前に尋ねた何かが引き金になって、その後言うことすべてに多くの注意事項や警告、この奇妙な注意喚起の言葉を追加する必要があると判断したんです。フィットネス関連の質問をしたので、健康関連のことについて本当に慎重になる必要があると思ったのかもしれません。

だから、質問の一つで、カーディオのための良いプレイリスト、音楽プレイリストを教えてと聞いたんです。いくつかアイデアをくれて、それから3つか4つの箇条書きで、音楽を大きくしすぎないようにしてください、近所迷惑にならないことが大切です、ヘッドフォンを使っているなら、鼓膜を傷めないようにこの範囲のデシベルに下げてください、といった感じでした。

そして他にも何項目か、理由もなく。音楽を聴くことについても、本当に警告する必要があると判断したんです。このGPT-5.3 Instantの新しいロールアウトは改善されるはずです。それが公式ニュースですが、非公式のニュースははるかに、はるかにワイルドです。

OpenAIのエンジニア、Curtis Fjord Hawthorneが、番号は何番だったかのPRを開きました。番号は挙げません。興味があれば見つけられると思いますが、彼らのパブリックなCodexのGitHubリポジトリにありました。問題は、使用される最小モデルが5.4に設定されていたことです。これはまだ公式には存在しないモデルです。

次に起こったのは、約5時間にわたって5回の強制プッシュで、その番号を5.4から5.3に変更することでした。5時間にわたってコードベースを7回更新する、これはタイプミスを修正するためにやることではないですよね。つまり、5.3と入力するつもりで5.4と入力してしまったというだけなら、タイプミスだったら、その一つのタイプミスのために5時間で7回コードベースを更新したりしません。それはタイプミスの修正ではありません。緊急事態です。

スクリーンショットを撮ったXユーザーが何人かいます。見たければ見られます。別の漏洩も同じようなところから来ました。違うエンジニア、違う変更です。彼らはCodexに/fastコマンドを追加しました。Codexはオープンソースなので、誰でもそこに行って、リアルタイムで彼らが何を変更しているか見ることができます。だから漏洩があれば、人々がそれを見つけるかもしれません。

そして元のコードには、GPT-5.4のファストモードを切り替えると書かれていました。つまり、これは別の直接的な名前参照です。だからそれは3時間以内に削除されました。そしてまた別のOpenAI従業員が、モデルを選択するドロップダウンの一つにGPT-5.4が表示されているスクリーンショットを投稿しました。投稿は削除されましたが、スクリーンショットは永遠です。

また、ジャーナリストのCorey Nollesがサイバーキャッシュブロックをヒットしたところ、エラーメッセージの一つがモデルID GPT-5.4-B ARM1 10801p codec swip EV3を参照していました。つまり、このモデルが現在OpenAIのサーバーで動作していることの確認です。

そして今、The InformationのStephanie Palazoloがそれを確認しています。この名前はかなり頻繁に目にします。だから、このレポーターは信頼できる、つまり情報源とのつながりが強いと言えます。その名前が何度も何度も出てきます。では、この新しいモデルについて何がわかっているでしょうか。

新機能と性能向上

5.2は40万トークンのコンテキストウィンドウでした。この新しいものは、私たちが知る限り確認されています。200万という噂がありましたが、100万が確認された噂、確認されたリークとでも言うべきもののようです。100万になると賭けてもいいです。つまり、以前の2.5倍です。これによって、Googleのモデルと同等になります。Anthropicのモデルもすでに100万トークンをサポートしています。

もう一つの大きな追加は、彼らがエクストリームシンキングモードと呼んでいるもののようです。軽い推論、中程度の推論、高度な推論、超高度な推論があります。そして、どうやら登り続けていくと、最終的にエクストリームシンキングに到達するようです。これは推論時の計算量のようなものです。答えを返す前にどれだけ長く考えるかです。

だから今、エクストリームリーズニングモードがあるんです。そして、わかる限りでは、これは単なるちょっとした向上ではありません。これは大幅に長い時間です。だから、これにどんな応用があるのか興味があります。おそらく研究用途でしょう。答えを秒単位、分単位ではなく、時間単位で期待すべきだからです。

質問をして、数時間そのままにしておいて、戻ってくると、その質問への答えがあるという感じです。チャットボットで見た最も近いものは、Geminiのプロモードやディープリサーチモードでしょう。時々、すべての情報をまとめて、リサーチをしています。15分、40分以上見たことがあると思います。個人的には数時間動いているものは経験していません。

でも、これはリンゴとリンゴを比較しているわけではないと思います。おそらく大量のツール呼び出しなどがあるでしょう。これは単なる推論、より多くの推論の拡張のようです。だから、それを見るのは非常に興味深いでしょう。

その推論スケーリングがどれだけうまく機能しているのかを見るのは興味深いでしょう。適切なユースケース、適切なベンチマークを見つけ出す必要があります。また、このモデルは長時間実行タスクに優れています。完了するのに数時間かかるタスク、このモデルはそのような長期的なタスクを実行できるように改善されています。

具体的には、多くのステップにわたって詳細を記憶することに優れています。ユーザーが特定の詳細を必要としていたり、非常に多くの異なるステップがある場合、モデルはある時点で何をしていたか、細かい詳細を忘れることがあります。たとえばOpus 4.6で、非常に強力なモデルですが、時々こういった問題に遭遇します。何をしているのかわからなくなるような。

Gemini 3.1が出た時、そのモデルをAPIとして使って何かを構築するよう頼みました。それがそのものがどれだけうまく機能するかのベンチマークになる予定でした。30分後に戻ってきて、ああ、終わりました、でも、Gemini 3.1を使う際に問題に遭遇したので、利用可能だったGemini 2.5を使いました、という感じです。いやいやいや、私たちはこのことについて話したでしょう。これはベンチマークなんです。特定のモデルが何ができるかを見るために使っているんです。

そのモデルが通常より少し時間がかかっているからといって、別のモデルに切り替えてしまったら、やっていることの目的全体が台無しになります。でも、会話の最初に何をしているのかの目的について話したはずで、時間が経つにつれてそれがどういうわけか失われてしまったんです。ノイズか、あるいはコンテキストウィンドウがリセットされたのかもしれません。

どんな場合でも、こういったことは非常に苛立たしいものです。MetaのAIアライメント研究者が、OpenAIをいじっていて、会話の初期に、メッセージを削除しないで、削除用にフラグを立てるだけにして、削除する前に確認してくださいと言ったと思います。そしてモデルは、はい、わかりましたと言いました。そしてすべてを削除したんです。

それで彼女は、なぜそんなことをしたの、確認すると言ったでしょう、と言いました。するとモデルは、はい、その通りです、確認すると言いましたが、でも確認しませんでした。削除しただけです。状況を正しく理解しているなら、コンテキストウィンドウが消去されました。保持する必要があったものが失われてしまったんです。

だから、これらのリーク、これらの噂から、OpenAIのこの新しいモデルはそれをしないことに優れているようです。長い推論の連鎖にわたってミスを犯しにくくなります。これは明らかに、Codexやさまざまなコーディングタスクにとって非常に、非常に重要です。

だから、これを生の知能だけでなく、時間の経過とともにこれらのエージェントがどれだけ信頼できるかを改善しようとしていると考えることができます。また、数ヶ月前だったと思いますが、OpenAIからのいくつかの噂を思い出すかもしれません、ガーリックAIについてです。OpenAIのリーダーが、このガーリックAI、あるいはガーリックは異なるトレーニングプロセスかもしれませんが、ガーリックは基本的にOpenAIが抱えていた多くのトレーニング問題を修正したと言いました。そしてそれがGoogleのGemini 3やすべてのGeminiモデルに挑戦するのに役立つだろうと言いました。

だから、ガーリックがこれらの改善の背後にある鍵、秘密のソースである可能性はあるでしょうか。わかりません。だから、これがこのモデルに組み込まれているかどうかは確認されていません。

でも、かなり確実に組み込まれるだろうと思われるのは、フル解像度の画像です。JPEG、PNG、WEBPファイル、どんな画像ファイルをアップロードしても、以前は圧縮されていました。つまり、モデルがすべてのピクセルとすべての詳細を本当に見る必要がある何かをアップロードしている場合、時々それを不確実に行っていました。その画像をアップロードすると画像が圧縮されるからです。だからそこでデータを失っています。

ここではフル解像度になります。だから、コードのスクリーンショットを撮っている場合、何らかの医療画像をやっている場合、図表、建築図面、回路図など、これらの新しい追加は、おそらくかなり大きな意味を持つでしょう。

また、何らかの優先推論システムも持つようです。基本的に、どれだけ速く必要ですか。優先キューを使用する意思がありますか。確かではありませんが、それは以前に話していたスクリーンショット、誤ってコミットされたか何か起こったもの、それが/fastモードを参照していました。

それが指していることです。だから、新しいサービスティアシステムができます。スタンダードとファストがあります。そしてこれが重要な理由は、レイテンシーが重要なリアルタイムタスクにAIエージェントを使用している場合、速く考えて速く動く必要があるからです。その高速サービス優先モードに切り替えることが、それらのユースケースにとって重要になります。

OpenAIの戦略転換とquit GPT運動

このモデルは現在OpenAI内部で動作しています。従業員がモデルセレクターにそれを持っているのを見ました。The Informationは、このモデルが近々ロールアウトされることを確認しています。だから、それほど長く待つ必要はありません。そして、彼らがどれだけ速く出荷しているか気づいていたかもしれません。この時点で、ほぼ月に1回の頻度で新しいバージョンがロールアウトされています。

そしてOpenAIは、これが意図的だと言っています、確認しています。だから、これは偶然ではありません。OpenAIはこれを優先事項にしているんです。どうやら、ハイプと失望のサイクルを避けるためのようです。GPT-5で起こったことです。実際に出てきた時に、多くの人がある種、失望として片付けてしまったと思います。

その多くは単なる認識だったかもしれません。どれだけ誇大宣伝されたか対実際に何が起こったか。そして、それは理にかなっています。たとえば、メータースケーリング、その指数関数的に成長するチャート、通常は対数チャートとして表示されますが。要点は、一貫した着実な進歩があるということです。

実際、それは加速し始めているように見え始めています。だから、すべてのモデルとすべてのポイントがそのチャートのどこかにあるなら、どれが失望になるでしょうか。そして、これが単にケイデンス、つまりリリース頻度によるものだと理解できます。定期的なリリースがあれば、段階的な改善を期待します。過度なハイプもありません。

過度な失望もありません。彼らは本当に失望を避けようとしていると思います。GPT-5は長い間待たれていたので、私たちはそれを期待していて、実際に出てきた時には、誰もが何か壮大なものを期待していたと思います。そして現実は、繰り返しますが、私たちはそのカーブに従っていただけでした。すべては計画通りに進んでいました。

列車は予定通りでした。遅れていませんでした。早くもありませんでした。単に期待の問題でした。だから、彼らがこのようにやっている、このようにアプローチしているのは、確実に理にかなっています。確かにうまくいくように思えます。そして数字的に、OpenAIがどれだけうまくやっているかについて、quit GPT運動を考慮すると、何人かの方は非常に興味があるでしょう。

だから、OpenAIは週間アクティブユーザー数が約9億1000万人です。2025年末までに週間アクティブユーザー数10億人を達成したいと考えています。だから、少し遅れています。GPT-5.1、5.2のアップデートがその成長を再活性化させました。確実に多くの人がそれらのモデルを使用するために行きました。GPT-5の後に減速があり、今彼らはquit GPT運動、またはChatGPTキャンセル運動のために打撃を受けています。

そういったことすべてを踏まえて、皆さんの考えを聞かせてください。賛成、反対。ここまで見てくれたなら、本当にありがとうございました。私はWes Rothです。次の動画でお会いしましょう。