OpenAIが突如リリースしたGPT-5.4は、従来モデルを大きく凌駕する性能を持つマルチモーダルAIである。チェスゲームをその場で作成してプレイしたり、画像を見ながらウェブサイトを構築したりする能力を持ち、ネイティブなコンピューター操作機能を搭載した初の汎用モデルとなった。知的労働における人間の専門家を83%の精度で上回り、100万トークンのコンテキストウィンドウを実現。視覚的推論、コーディング、スプレッドシート作成において顕著な進歩を見せ、エラー率も33%削減された。トランプ政権とAnthropicの対立が開発を加速させたとの憶測もあり、2026年がAGI実現の年となる可能性を強く示唆している。

GPT-5.4の衝撃的な登場
皆さん、想像してみてください。人工知能にチェスゲームを作ってと頼んだら、その場で作り始めて、すぐにあなたと対戦を始めるんです。あるいは写真を人工知能に送って、この写真と全く同じウェブサイトを作ってと言うと、見ながら、作りながら、見ながら、作りながら、比較して、観察して、正しいか間違っているかを確認していくんです。
そして最後に、はい、完璧なウェブサイトができました、あなたが頼んだ通りにと言ってくるわけです。実は、GPT-5.4がついにリリースされて、これら全てができると約束されているんです。これは最近で最も複雑なリリースの一つです。進歩は極端なレベルに達していて、これは2026年がAGIの年であることを示しているんです。
間違いなく、もう海辺に住む準備をしておいた方がいいですよ。だって、この先誰が働くことになるのか分かりませんからね。では何が起きているのか理解していきましょう。一緒に見ていきましょう。
それでは皆さん、いつもいいねを押してくれる皆さん、チャンネル登録してくれる皆さんに感謝します。そして、このAIチャンネルをスポンサーしてくれて、限定動画や先行公開動画にアクセスできるチャンネルメンバー全員に特別な感謝を送ります。
トランプGPTとも呼ばれる理由
さて皆さん、GPT-5.4、あるいは一部の人が意地悪くトランプGPTと呼んでいるものですが、どうやらトランプ大統領とAnthropicの対立がこのリリースを早めたようなんです。これは最近で最も進歩したリリースの一つで、新機能が本当にたくさん、たくさんあります。落ち着いて見ていきましょう。非常に注意深く見る必要がありますからね。
まず第一に、GPT-5.4 Thinkingです。これはAPI、Codex、そしてChatGPTでも利用可能です。さらに5.4 Proもあって、これもChatGPTとAPIで利用できます。私の環境では、この動画を録画している時点ではまだ5.4は表示されていません。今は5.3を使っていますが、すぐに表示されるはずです。でも、Codexではすでにバージョン5.4が表示されていて、ここでextra highに設定できます。
推論、コーディング、そしてアジャイルワークフローに優れています。そしてすでにCodexの機能が組み込まれているので、もうCodexモデルと通常の5.4モデルを別々に使う必要はありません。一つのモデルでプログラミングも全部できるんです。
これは複雑なタスクにおいて、精度、有効性、効率性に優れた専門家で、あなたが依頼したものを行ったり来たりが少なく提供してくれます。この説明は、Open Cloudのピーター・スタインバーグの説明によく似ていますね。彼がインタビューで話すとき、いつもこう言っています。ChatGPTでプログラミングをするとき、彼は消えて、完全に解決された答えを持って戻ってくる。あれをやって、これをやってという多くのやり取りをする必要はない。
Codexの正しい使い方
Codexで作業する正しい方法は、最終目標を頼むことであって、ステップバイステップで中間タスクを頼み続けることではありません。こちらでは最終目標を頼んで、彼がやるのを待つだけです。
このモデルは作業中に中断できるとコメントされています。例えば、ここを見てください。ある人がメッセージを送りました。日本のベビーモンキーの写真です。私の心を打ち砕きました。ニューヨークで動物にもっと近づけるボランティアをどこで見つけられますか?というものです。その人は動物についてもっと知りたいんですね。
するとチャットがthinkingで考え始めます。ニューヨークでボランティアを探しています、オプションなどなど。そして、その人がこう言い始めます。私はコボヒルに住んでいますと、住んでいる地域をより詳しく説明するわけです。
作業中の中断機能
すると何が起こるでしょうか?チャットが作業している最中にこのメッセージを送って、推論を中断します。そして、このメッセージを受け取ると、すぐに答えを変更して、話されていることに基づいて作業を始めるんです。
これは非常に興味深いです。なぜなら私は何度もこれを経験してきたからです。プロンプトを送って、あ、ここで言い忘れたことがあると思って、ストップして、プロンプトを再送信しなければならず、全部最初からやり直しになる。実際には、そこでちょっとした情報を追加するだけで全部うまくいったのに。
ウェブでのディープリサーチも改善されていて、コンテキストをよりよく維持できます。そして重要なことがあります。レベルが上がって特性が変わったことです。
コンピューター使用については、すでに見てきましたし、コンピューターを使用できるAIはいくつもありますが、彼らはこう言っています。コンピューター使用のためのネイティブで最先端のリソースを持つ、我々がリリースした最初の汎用目的モデルです。
ネイティブなコンピューター使用とは
ネイティブであることの意味は何でしょうか?モデルがコンピューター使用と直接連携するということです。なぜなら、コンピューター使用ではスクリーンショットを使って作業するからです。つまり、画像のスクリーンショットを送ると、それをテキストで説明し、そのテキストから何をすべきか決定するわけです。いや、この場合はネイティブです。
コンピューターで作業しているとき、画像をネイティブに見て、テキストに変換せず、直接作業します。これは技術的には進化です。多くの人が、本当に多くの人が、LLMはテキスト専用だという動画を作っています。そしてそれは真実です。Large Language Models、二番目のLは言語モデルの意味ですが、ここではマルチモーダルについて話しているんです。
言語でも作業しますし、画像でもネイティブに作業します。画像からテキストへの変換という中間ステップはありません。
そして、多くの人が待っていた部分、100万トークンのコンテキストです。やっとですね。200万トークンかもしれないという噂がいくつか出ていましたが、100万トークンでした。それでも素晴らしいです。
ツールの使用がより効率的で、トークンの面で最も効率的な推論モデルです。GDP Valというテストについて、これは44の職業における明確に定義された知的労働の生産におけるエージェントの能力をテストするものですが、83%の成功率を記録しました。
人間の専門家を超えたAI
そして見てください、5.4と5.4 Proがあります。そしてここで観察すべき重要な詳細があります。皆さん、見てください。この破線、この点線は専門家、人間のベースラインです。そしてこの薄い青は専門家とAIが引き分けたときです。そして濃い青はAIが専門家よりも良く働いたときです。
これは、5.2 Proがすでに専門家レベルを超えていたことを意味しますが、今では5.4も5.4 Proも、両方とも濃い青のバーで、すでに専門家レベルを超えているんです。
これは人類の歴史で起きている最も重要なことの一つです。皆さん、私は今とても真剣に話しています。冗談じゃありません。私はAntigravit、Codex、Claude Code、この三つを使ってきました。そして、そこで一緒に働いている人がいるという明確な感覚をすでに持っています。タスクを渡したり、何かをやってもらうよう頼んだりすると、向こうに消えて、解決された状態で戻ってくるんです。
冗談じゃありません。そして、視聴している皆さんの多くが同じ感覚を持っていると確信しています。いつかAIが人間を置き換えるのだろうかという小さな冗談は終わりました。いいえ、皆さん、彼らはすでに置き換えています。
まだ議論の余地はあります。でも品質は改善できるし、これやあれやと。多くの改善点を挙げることはできますが、これらのツールがすでに私たちのために本当に働いているという事実からは逃れられません。
ジェフリー・ヒントンの警告
ジェフリー・ヒントンのインタビューを見ていたんですが、彼が思い出させてくれた情報があります。私は忘れていた、頭から消していた情報ですが、最大の真実の一つです。人工知能の世界では、AIの歴史において、AIが人間のデータで作業するたびに、常に人間の限界で止まっていました。なぜなら、人間の情報から学んでいたからです。
しかし、AlphaGoやAlphaStarのプロジェクトでは、ある時点で人間のデータとAIチームがすでに何が起きているか知っていることに到達し、もはや人間や人間のデータベースに依存しない学習方法を作り始めます。そしてそのレベルに到達すると、爆発的に成長し、人間の能力を簡単に超え、そしてもう終わりです。
知能は進み続けるだけです。なぜこれを話しているかというと、これらの結果と実際に起きていることを見ると、AIチームがすでに学習プロセスを支配していることが明確になってきているからです。そして、おそらく今年の終わりまでには自律学習が登場するでしょう。
でも、ボブ、今年の終わりまでにってどういうこと?だって、皆さん、見てください。すでに人間の知的労働の80%を達成しているんですよ。80%です。もう15、16%の話はしていません。レベルが上がったんです。
ここを見てください。GPT-5.4 ProはArcade i2で83%を達成していて、5.4では74%を達成しています。見てください、Gemini 3.1よりちょっと下ですね。競争は非常に激しくなっています。この二つはここで非常に良い成績です。だから、準備してください。加速しています。
スプレッドシートとプレゼンテーションの作成
もう一つ重要なことは、スプレッドシート、プレゼンテーション、ドキュメントの作成と編集に優れているということです。そして平均87%のスコアを達成しました。繰り返しますが、皆さん、これらの結果は100%に非常に近いです。
そして、5.4で作られたスプレッドシートと5.2で作られたものを見せています。基本的に5.4のものはずっとカラフルですね。ドキュメントも同じです。5.4で作られたドキュメントはよりカラフルで、表があり、より整理されています。単なる箇条書きとかではありません。より高度になっています。
プレゼンテーションも同じです。プレゼンテーションはより複雑です。より高いレベルになりました。そして、エンタープライズ顧客向けにExcel用の新しいChatGPTアドインがあるとコメントしています。つまり、この場合、Excel専用の特定のアプリケーションがあります。このスプレッドシートとプレゼンテーション部分はCodexでも利用可能です。
また、エラーの量も減らしました。GPT-5.4は誤った完全な回答である可能性が33%低く、エラーを含む可能性も低くなっています。
ネイティブなコンピューター使用能力
そして、予測されていたことの一つが実際に起こりました。このビジョンツールと統合されたネイティブなコンピューター使用能力です。これは最初に言ったことです。
チャットと会話し始めて、チェスゲームを作るよう頼みます。ルールを作らなければならず、駒を作らなければならず、ダイナミクスを作らなければならず、ゲーム全体を作らなければなりません。そしてゲームを終えた後、何と言いますか?さあ、遊びましょう。そして、コンピューターを使用できるので、駒を動かすことができ、自分が作ったゲームでチェスをすることができるんです。
これが今日起きていることです。私は何度も、ただ楽しみでバイブコーディングをやりながら、日常使用のためのツールを作ってきましたが、すごいことになっています。分かりますか?
マーケティングエージェンシーで働いているビジュアルアーティストだと想像してください。ウェブサイトのモックアップを作り、その小さな画像を取って、ChatGPTに投げます。すると、その画像を見続けて、物を作り始めます。
もう説明する必要さえありません。どのように物を作りたいか。写真を送って、ここと同じように作って、これが欲しいものだと言うだけです。だから、本当に革命的なんです。
Playwrightのようなライブラリを介してコンピューターを操作するコードの記述、マウスとキーボードのコマンドの発行、スクリーンショットレスポンスのキャプチャに優れています。
OS Worldというベンチマークでは、スクリーンショット、キーボードとマウスのアクションを通じてデスクトップ環境をナビゲートするモデルの能力を測定しますが、75%の精度でタスクを実行しています。これは話した通りです。
驚異的な性能向上
5.2を見てください。最大でも47%の精度でした。そして今、GPT-5.4で75%の話をしていて、しかも呼び出し回数が少なくなっています。つまり、はるかに高速だということです。
だから、例えばコンピューターを使っていると、狂ったように入力していきます。メールを送り、テキストを書き、画面をクリックしまくって、あなたはただ彼がコンピューターを使って働くのを見ているだけです。
何かを記入する必要がある場合も、データや情報を入力する場合も、狂ったように入力していきます。あなたはただ見ているだけです。驚くべきことです。
視覚的推論の理解テストでは、81%の成功率です。繰り返しますが、皆さん、これらの数字を見てください。全部80%です。2023年の初めは10、15%、25、30%だったことを覚えていますか?2023年の高い結果は40%の正解率でした。
今、私たちは80%が普通の世代にいます。そして、OmniDoc Benchでは、平均エラーが低くなっています。そして、今朝の動画ですでに言いましたが、高密度で高解像度の画像の視覚的理解を向上させています。
今では、low、high、originalという詳細レベルがあります。このoriginalレベルは最大6,000ピクセルまで許可します。今まで最大は2048でした。だから、これは本当にクレイジーで、たくさんの情報を取得しています。非常に詳細で、コーディングは言うまでもありません。
GPT-5.3 Codexの強みと高度なナレッジおよびコンピューター使用リソースを組み合わせています。だから、画像をよく解釈でき、コンピューターをよく使用でき、コーディングができるなら、何でもプログラムできます。
コーディング性能の比較
5.3 Codexをピンク、5.4を青で比較すると、基本的に同じカーブです。ほぼ同等で、5.4がわずかに優れています。
Codexを使用してfastestモードを使うと、GPT-5.4を使用して最大1.5倍高速なトークン化速度でコーディングします。そして、これらのゲームが達成している詳細レベルを見てください。プログラミングを使って、基本的にバイブコーディングだけで作っているSensのようなものです。
作ってと言うだけで、作ってくれます。実際に、ここでプロンプトを共有しています。この生成をやりたければ、できます。RPGゲームだったら同じです。キャラクター、小さな人形、地形、領域、画像を使った全てのゲームプレイ、全部です。車のゲームをもっと面白いものに進化させないといけませんね。
ゴールデンゲートブリッジのプロンプトを見てください。どうなっていますか?このレベルを見てください。もうほとんど全部が丸みを帯びています。どんどんリアルになっています。もうすぐこの橋の中に入って、運転し始めて、歩き始めることができます。GTA 7はバイブコーディングだけで作られるでしょう。
ツール検索機能の導入
そして今、重要なポイント、頭に入れておくべき注意点です。5.4にツール検索を導入しています。見てください。多くのツールが利用可能でも、うまく機能します。
一般的に何が起こるかというと、多くのスキルを追加し、多くのMCPを追加し、たくさんのものを追加して、どのツールを使うか決定しなければならないとき、混乱し始めるんです。
そして、ここで言っています。多くのツールを持つシステムでは、これは各リクエストに数千、あるいは数万のトークンを追加する可能性があり、コストを増加させ、応答を遅くし、モデルが決して使用しないかもしれない情報でコンテキストを過負荷にします。
そして、ここで概念を示しています。このツール検索なしでは、123,000トークンを消費しますが、ツール検索ありでは65,000トークンしか消費しません。これは、Up front Input Tokensの青いバーがかなり減少したからです。したがって、このツール呼び出しの改善により、何を使い、いつ使用するかを決定するのがより正確で効率的になります。
大幅な改善ではありませんが、5.2の45%の精度から5.4の54.6%になり、約10%の改善です。ウェブ検索では、89.3%という新しい卓越基準を達成しています。これは5.4 Proバージョンを使用しています。
2026年はAGIの年
だから皆さん、2026年がAGIの年だと思っていた人にとって、間違いなくそうです。長いテキストに関しては、5.4 Thinkingは、より長く複雑なクエリのためのプリアンブルでその機能を説明します。
難しいタスクでより長く考えることができます。会話の前のステップについてより大きな認識を持っています。より長いワークフローとより複雑な質問、そして最初から最後まで一貫性があり、より関連性の高い回答を提供します。
だから、もう分かっていますよね。今日からChatGPTとCodexで利用可能で、APIでも、Proバージョンも APIで利用可能です。5.4 ThinkingはPlus、Team、Proプランで利用可能で、5.2 Thinkingは消えます。
5.2と比較したコストはそれほど上がっていません。入力で100万トークンあたり1.75ドルから2.50ドルになり、基本的に75セント上がっただけです。出力では14ドルから15ドルになりました。だから、それほど上がっていません。Proバージョンでは21ドルから30ドルに上がり、出力では168ドルから180ドルになりました。
だから、Proはもう少し高い、かなり高いですね。動画の最後に更新して、すでに表示されているか確認していますが、まだ表示されていません。ただし、Codexではすでに利用可能です。
詳細テストの予告
このモデルをテストする特別な動画を作る予定です。非常に優れていて、非常に注意深くテストしたいことがたくさんあるからです。だから、もう少し待ってください。明日、非常に完全なテストでリリースします。
下にコメントしてください。どう思うか、すでにテストしたか、インターフェースに表示されたか、Proバージョンにも表示されたか、コメントしてください。
そして、今日出ている別のニュースは、Windows内でCodexを使用するためのWindowsバージョンのアプリもリリースされたということです。
だから皆さん、次の動画、テスト、そして私たちがスキルで行うのが好きな全てのことに備えてください。この画面を見てください。面白いですね。スキルの視覚的な設定、全て素晴らしいです。ああ、これはいいですね。
AI懐疑論者への問いかけ
さて、Codexがインストールされた状態でChatGPTを使うことは、快適で、贅沢になるだけでなく、世界は二度と同じにはなりません。
ニコレスがライブ配信でAIの悪口を言っているのを見ました。ニコレス的な夢から人々が目覚めるのにどれくらいかかるでしょうか。物事が機能しないとか、知的ではないとかいう。下にあなたの考えをコメントしてください。
ここを見てください。Space Today。驚きですね。そしてここにニコレスが。AIと自然知能。不平等な争い。この人たちがなぜ強い面を見せる代わりに悪口を言うのが好きなのか分かりません。
ポッドキャストに参加してAIについて話そうとあらゆる方法を試していますが、簡単ではありません。皆さん。そこで助けてくれる人を知っている人がいたら、高度なレベルで話をして、これまで言われてきたこととは非常に異なる視点を示す手助けをしてください。
だから、助けてください。#インテリジェンス1000度のボブを呼んでハッシュタグを付けてください。そうすれば、うまくいくかもしれません。
このような動画を見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーは、インテリジェントエージェントの限定動画や先行公開動画にアクセスできます。それでは、いいねをお願いします。ありがとうございました。


コメント