OpenAIの新しいGPT 5.4 MiniとNanoが驚異的な性能を見せ、バイブコーディングを圧倒する

OpenAIが新たに公開した GPT 5.4 Mini と GPT 5.4 Nano を、実際にAI同士がサッカーをする自作プロジェクトを通して検証していく内容である。小型モデルでありながら高い推論力とコスト性能を備え、特にコーディングやサブエージェント運用、低遅延な反復作業に強みを持つことが示される。実演では GPT 5.4 Mini が Nano を大きく引き離しつつ、軽量モデル活用の現実的な設計思想や、今後のAI開発の方向性についても語られている。

NOVO Chat GPT 5.4 Mini e Nano da OpenAi Surpreendem e Dão Uma Goleada no Vibe Codinng

Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

OpenAIの新モデルでAI同士にサッカーをさせてみた
GPT 5.4 MiniとNanoで作ったAIサッカーゲーム
小型モデルが重要な理由
大型モデルと小型モデルの使い分け
GPT 5.4 MiniはどこまでGPT 5.4に近いのか
サブエージェント時代にMiniが向いている理由
コンピュータ利用や価格面での魅力
どこで使えるのか
Geminiとの価格比較と軽量モデルの進化
AIサッカーのスコアはますます開く
GitHubで公開されたプロジェクトの中身
これからはAIが自分でベンチマークをする
OmniRouterと複数API統合の話
最後のまとめと今後の実践テスト

OpenAIの新モデルでAI同士にサッカーをさせてみた

入りました。ゴールです。

OpenAIがこのモデルを公開したばかりなのに、私たちはもうこれでサッカーをさせています。今は IMG Sports Arena があって、人工知能同士が互いにサッカーをプレイできるようになったんです。

いや本当に、皆さんに告白しなければいけません。私は今、バイブコーディングにどっぷりはまっています。そしてこの沼に入ってからというもの、ここ一週間だけで、もう10件くらいのプロジェクトをコミットしてしまいました。

なので今回はこのプロジェクトについて話しつつ、OpenAIで何が起きているのかを見ていきましょう。一緒に行きましょう。

はい、というわけで皆さん、始めていきましょう。まずは、いいねを押してくださった皆さん、チャンネル登録してくださった皆さん、本当にありがとうございます。そして、このAIチャンネルを支援してくださっているメンバーの皆さんにも、特別な感謝をお伝えします。

いつもお伝えしているとおり、メンバーの方はインテリジェントエージェントに関する限定動画をご覧いただけます。そこで私は、WhatsAppとの連携方法や、MCP、PDFの読み取りなど、さまざまなことを教えています。それに加えて、こんなふうな限定動画も見られます。そこでは、メンバーだけが知っている内容を解説しているんです。

皆さん、これ面白いでしょう。

GPT 5.4 MiniとNanoで作ったAIサッカーゲーム

オープニングの間に、皆さんは GPT 5.4 Mini のゴールシーンを見ましたか。私は見ていなかったんですが、今すごく面白いことになっているんです。私はこのゲームをバイブコーディングで作りました。ほら、ここでズームして、何が起きているのか近くで見られます。うちのチャンピオンたちをもっと間近で見られますよ。

GPT 4 mini はブラジル代表で、5.4 nano のほうはアルゼンチン代表です。

しかも面白いことに、今はゆっくりプレイしているんです。というのも、このゲームは本当に作ったばかりで、今日作ったばかりなんですよ。次の段階としては、これをもっと高速化することです。というのも、こうしたモデルはもっと速く動けるからです。

では何が起きているのでしょうか。OpenAIは今回、5.4 mini と nano を公開しました。これは、コンパクトでありながら非常に強力で、しかもとても安価なモデルです。つまり、製品をスケールさせたいとき、スピードが必要なとき、勢いが必要なとき、そういう用途に向いたものなんです。

地下室にこもっているタイプの重たいオタク向けではありません。これは俊足タイプですね。コンパクトながらより強力なモデルで、高ボリュームのワークロード、コーディング、推論、マルチモーダル理解、ツール使用向けに設計されていて、しかも2倍以上高速だというんです。

皆さん、この Mini は今まさに見えているこれです。アルゼンチンのゴール前からほとんど出てこない、まさに点取り屋ですね。

一方で Nano は、GPT 5.4 のさらにコンパクトで経済的なバージョンで、速度とコストが決定的に重要なタスクに最適です。

皆さん、これはまさに理想的なシナリオなんです。今私たちは小さなゲームを作っていて、大量にAIを使います。AIは常に考え続けなければならず、次から次へとリクエストが飛んできます。ゲーム自体もかなり長く続きます。だからこそ、こういう場面ではローカルなタスクをこなせる小型モデルが最適なんです。

小型モデルが重要な理由

なぜそれが重要なのかというと、遅延がそのまま製品体験に直結するなら、欲しいのは速いモデルだからです。その場合、大きなモデルを使っても意味がありません。大きなモデルは鈍くて、遅くなってしまうからです。

ここで皆さんにもはっきり言っておきます。もしここに大型モデルを入れたら、どうなると思いますか。3時間ずっと考え込んでしまって、試合が始まりません。

サッカーというのはスピードです。そこは皆さんも分かっていますよね。

それから、最初から目を引くポイントが一つあります。たとえば mini extra high は、ベンチマークによっては 5.4 と肩を並べているんです。皆さん、普通の GPT 5.4 ですよ。特別仕様でも何でもない、標準の 5.4 です。

たとえばこの SWEBench では、57 に対して 54、さらに 52 です。みんなかなり接戦なんですよ。

そしてこの TAU-bench では、これはツール利用の指標ですが、54 に対して 42 です。

このケースでは、ツール利用がかなり重要なんです。というのも、このゲーム内でアクションを実行しなければいけないからです。

ですから、私がすでに気づいているのは、この小型モデルたちがとても優秀になってきているということです。これは本当に素晴らしいことです。AIがどんどん安くなるということは、結局みんなが使うようになるということです。もう避けられません。非常に良い流れです。

彼らが言っているのは、mini と nano は、素早い反復の恩恵を受けるコーディングワークフローに効果的だということです。

大型モデルと小型モデルの使い分け

私が感じているのは、プログラミングが必要なプロジェクトを作るとき、しかも可能な限りコストを抑えたいとき、最善のやり方の一つは、まず大型モデルでプロジェクトを始めることだということです。

最初のアーキテクチャを作る。フォルダ構成を作る。ソフトウェアエンジニアリングの設計を固める。セキュリティ面も整える。そうした部分を、しっかりした大型モデルで先に準備するんです。

その大型モデルが、必要な要素すべての計画を立ててくれます。必要なタスク、各機能の動き方、互いの通信方法まで整理してくれるわけです。

そして、その後で実行すべき小さなタスクを記述してくれたなら、そこから先はどんどん小型モデルに渡していけます。場合によっては、Mini も Nano も、そういうレベルの用途に使えるかもしれません。

もっと単純な小タスク、たとえば狙いを定めた編集、コードベースのナビゲーション、インターフェース生成、低遅延のデバッグループなどです。

つまり皆さん、もう分かりましたよね。どのタスクに何を使うかを考えなければいけないんです。

この一日、AIサッカーゲームを作ってみて私が感じたのは、小型モデルがプレイの組み立てを担当してくれるのが本当に最高だということです。ポジショニングをして、ボールを取りに行って、プレイ全体を組み立てる。そういう部分は小型モデルがうまくやってくれます。

でも、ゴールを決める瞬間、シュートを打つ瞬間、狙いを定める瞬間、最後の仕上げの部分になると、大きいモデルのほうが少し優秀なんです。

そして彼らがここで示しているのも、まさにその感じなんですよ。たとえば GPT 5.4 がこの上の人で、この濃い茶色の線だとしましょう。SWE-bench ではやはり一番良い結果を出しています。

でも Mini は、そのすぐ下に来ています。Mini はそこまで離れていないんです。確かに Mini はここまでの性能には届きません。でも、このあたりの近い領域なら十分なんです。

Nano のほうは、もう少し下です。そこは正直、少し弱いですね。実際に低い位置にいます。まあ、それは認めるしかありません。

そして Mini の前バージョン、つまり o4-mini の系統の以前のモデルは、彼ら全部と比べるとかなり見劣りします。そこはもう、言うまでもありません。

GPT 5.4 MiniはどこまでGPT 5.4に近いのか

ここでも同じことが見えます。5.4 mini は、中程度の推論努力において、5.4 本体にかなり近づいてきているんです。

つまり技術的には、mini の extra high は GPT 5.4 の medium に相当するということです。ここは頭に入れておくべきポイントです。5.4 を medium で使うのは、Mini を extra high で使うのとだいたい同じ感覚なんです。

なので、たとえば Codex に行くと、もう 5.4 mini を選べるようになっています。

ただし、なぜ nano がまだ出ていないのかは聞かないでください。Mini はもうここにありますし、extra high の推論努力も選択できます。

これは重要です。というのも、extra high のような設定はどこでも表示されるわけではありません。API では出ますし、Codex でも出ます。でも通常のインターフェースでは、そういう設定は見えないんです。

少なくとも、私の環境では表示されません。もし皆さんのところでは出ているなら、ぜひコメント欄で教えてください。

サブエージェント時代にMiniが向いている理由

それから今、みんなが盛んに話しているのが、いわゆるサブエージェントです。サブエージェントというのは、まさに私がさっき話したシナリオそのものです。非常に強力なAIが重要なタスクを担当し、そこからより小さいタスクを、そこまで高性能ではない別のAIたちに委任するわけです。

そのとき、Mini はサイズの異なるモデルを組み合わせたシステムにとって、とても優れた選択肢になります。

もし皆さんが、こういう小型モデルをどこで使えばいいのか分からなかったなら、今でもうかなり見えてきたはずです。どんどん明確になってきています。

たとえばサブエージェントを考える一つの方法として、skills を思い浮かべてもいいかもしれません。ただ、skills の場合は、どのモデルを使うかを自分で設定できないので、その観点ではそこまで深く考えにくいんです。

でも皆さん、もう理解できていますよね。サブエージェントとは、大きなタスクの中で処理する小さなサブタスクのことなんです。

コンピュータ利用や価格面での魅力

コンピュータ利用の指標では、これがまた面白いんです。5.4 は 75% の精度を出していますが、5.4 mini は 72% なんです。

つまり、ものすごく安いのに、5.4 にかなり近い精度を出しているわけです。これなら財布にお金が残り始めますよ、皆さん。

とても安く払って、小さなモデルを使って、それでいてかなり高い効果を得られるようになるんです。

そしてご覧のとおり、Nano は最終的にはあまりうまくいっていません。Nano はこのサッカーでかなりやられています。今のスコアを見てみましょう。9対1です。Mini が9点、Nano が1点です。

ただ言っておきますが、Nano が決めたその1点はきれいでした。私はちゃんと見ました。

どこで使えるのか

では、このモデルはどこで使えるのでしょうか。API、Codex、そして ChatGPT です。

Codex では、先ほどお見せしたように、私の環境ではもう Mini が表示されています。ただし Nano はまだ出ていません。

このモデルはテキスト入力と画像入力、ツール使用、関数呼び出し、ウェブ検索、ファイル検索、コンピュータ利用、そして skills に対応しています。コンテキストウィンドウは 400,000 トークンです。これはかなりしっかりした窓ですね。小さすぎず、大きすぎず、中くらいのサイズです。

でも、長い間、大きなコンテキストウィンドウといえば 200,000 や 100万トークンが話題だったことを思えば、これはかなり優秀です。

価格は入力が100万トークンあたり0.75ドル、出力が100万トークンあたり4.50ドルです。

ChatGPT では、5.4 mini は無料版ユーザーと Go アカウントのユーザー向けに、Thinking 機能を通じて利用可能です。メニュー内のプラスボタンから使えるとのことです。

たとえば今ここで無料アカウントにアクセスしても、Thinking という表示は見えませんし、何も出てきません。でも、ここで「考える」を有効にすると、この「考える」が、彼らの説明によれば 5.4 mini にあたるそうです。

まだピンと来ていないなら、今この試合で 9対1 になっていることを見ればいいんです。つまり、かなり強いということです。

Nano は API で、入力が100万トークンあたり0.20ドル、出力が100万トークンあたり1.25ドルです。

Geminiとの価格比較と軽量モデルの進化

この価格を見ると、Gemini 3.1 Flash-Lite を思い出します。あれも小型モデルで、Google のものですが、入力は100万トークンあたりテキストで0.25ドル、出力は1.50ドルです。

つまり価格だけで見れば、Nano のほうが少し安いんです。こちらは0.20、あちらは0.25ですし、こちらは1.25、あちらは1.50です。

ですから価格面では Nano のほうが安いわけです。

ただし、みんなの extra high や high を比較する段になると、話は変わります。そのときには、Mini も Nano も、5.4 extra high にかなり見事に打ちのめされています。

それでも興味深いのは、こうした小型モデルでも、ベンチマークによっては 70%、80%、時には 90% 近くまで出すことがあるという点です。つまり、こうしたものはどんどん進化していて、しかもどんどん安くなっているということです。

AIサッカーのスコアはますます開く

というわけで皆さん、このAIサッカーですが、動画冒頭では6対1で始まり、オープニングの間に7点目が入り、今ではもう 11対1 で 5.4 mini が勝っています。

ですから、少なくともこのサッカーに関しては、ちゃんと機能していることを私はもう示しましたよね。アルゼンチン相手に圧倒的な試合を見せてくれました。本当に素晴らしいです。

GitHubで公開されたプロジェクトの中身

では、このプロジェクトは何なのか。どうやって動かすのか。どうやって遊ぶのか。皆さん、遊びたいですよね。

このプロジェクトは GitHub で公開されています。コードはすでに公開しましたし、これからも作業を続けていきます。このアイデアを気に入って、一緒に作業してくれる人たちもいます。正直に言って、私自身かなり気に入っています。

皆さんがすでに見たあの画面もありますし、ほかの画面もあります。どうやって起動するのか、どうやってインストールするのか、各部分が何をしているのか、設定をどうするのか、全部きちんと説明しています。

何かあれば、動画のコメント欄に書いていただければ、こちらでもお答えします。

このプロジェクトで面白い部分はここでもあります。ここが私の設定画面です。見てください。5.4 mini。ここでモデルを設定しました。そしてこちらの 5.4 nano がアルゼンチン側の設定です。

つまりここでスコアも見られますし、プロンプトも見られます。皆さんがプロンプトを変更したければ、それも可能です。

ほら、また1点入りました。12対1です。

つまり、ここで交わされているメッセージも全部追えますし、何が起きているのかも全部見られるんです。この停止ボタンがあるということは、マルチターンになっていて、限界まで無限にプレイし続けるという意味です。

そして、今皆さんが見ているこのすべてが、このオープンなプロジェクトに入っています。あとはアクセスしてインストールするだけです。

何か問題が出たら、あるいは疑問があれば、AI に聞いてみてください。AI がそこも助けてくれます。

これからはAIが自分でベンチマークをする

そしてこれからは、インテリジェンス1000グラのベンチマークは、AI自身がやる時代です。私たちはただ試合を見るだけです。ほら、ただ眺めていればいいんです。

見てください、このフェイント。Nano のあの1点目の場面では、Mini に対して見事なフェイントを決めたんですよ。本当に素晴らしかったです。ほら見てください。フェイントです。分かりましたか。あっちへ行くふりをして、こっちへ行くふりをして。

ほら、また戻ってきますよ。見てみましょう。ほら、見えましたね。もう一度フェイントです。あと少しで行きそうです。あ、今度は取られそうですね。うわ、またフェイントです。

いやあ、このあたりは本当に熱いですね。ほら、ほら。Nano が Mini を置き去りにして、砂ぼこりを食わせています。そして Nano が追加点を入れそうです。

ほら、ほら、ほら。ゴール正面です。あとは蹴るだけです。行け、Nano。行け、Nano。もう蹴るだけだ。蹴ってくれ、今がその時だ。

ここで2点目を取れるぞ。みんな見ていますよ。

蹴りました。でも弱かったですね。シュートには3段階あるんです。弱いシュート、中くらいのシュート、強いシュートです。そして今のは弱いシュートでした。

ただ、実際には悪いシュートではなかったんですよ。では、見てみましょう。決められるでしょうか。ほら、2度目のチャンスです。Nano が近づいてきています。Mini もそこへ寄ってきています。

見てください。Mini がボールを取ります。Mini がまたシュートを打とうとしています。取り返しました。Mini がクリアしました。

では、今度は Mini がフェイントを見せるでしょうか。見てみましょう。ほら。ほら。Mini は Nano を置き去りにしてゴールへ向かいました。でも決めきれませんでした。Mini がボールを奪い返して守備をして、そしてたぶん、もうこれ以上は何も起きませんね。

いやあ皆さん、このゲーム、見てのとおり本当に熱いです。インストールする価値がありますよ。自宅にこのゲームを置いてみてください。

OmniRouterと複数API統合の話

そのうち OmniRouter についての限定動画も作る予定です。これがブラジル人の開発者によるプロジェクトで、私はこれを通じて、いろいろな会社のAPIを大量に統合しているんです。

ここでは Gemini も選べますし、OpenAI も選べます。ここでは Jaken も設定してありますし、そのほかにもさらにいろいろなものを設定していくつもりです。

もしかすると皆さんは、こう思っているかもしれません。OpenRouter でいろいろなモデルをまとめて使うことなんて、もう前からできるじゃないか、と。

まあまあ、落ち着いてください。私が新しいと言っているなら、本当に新しい要素があるんです。もっといろいろあるんです。ただそれだけではありません。

なので、皆さんが何を考えているのか、ぜひ下のコメント欄に書いてください。

最後のまとめと今後の実践テスト

いやあ皆さん、この試合の最終スコアは 13対1 ですよ。まさか 6対1 で始まった試合が 13対1 で終わるとは、誰が思ったでしょうか。私はここまで行くとは思っていませんでした。

でも良いデビューでした。なぜこのモデルが注目されるのか、それをしっかり見せてくれました。

そして、カートゲーム、3D都市、さらにいくつかの新要素を使った完全版のテストも、もうほとんど準備ができています。かなり詳細なテストを進めていて、この小型モデルたちを限界まで徹底的に酷使してみたいんです。

ですから、実践テストの公開を楽しみに待っていてください。

そして、このチャンネルを応援して、これからもこういう動画を見たいと思ってくださるなら、ぜひメンバーになってください。メンバーの方は、インテリジェントエージェントに関する限定動画や先行公開の動画をご覧いただけます。

というわけで、ぜひいいねをお願いします。ありがとうございました。