GPT 5.3 Codexは本当にClaude Opus 4.6を超えたのか? Kimi k2.5を含む2026年モデルの徹底比較

AI競争
この記事は約17分で読めます。

2026年初頭にリリースされた主要AIモデルの包括的な比較検証である。OpenAIのGPT 5.3 Codex、AnthropicのClaude Opus 4.6、Kimi k2.5の3モデルを対象に、ウェブサイト生成、ゲーム開発、複雑な3D環境構築など多様なタスクで実地テストを実施。各モデルの生成品質、コスト効率、使用制限、創造性を詳細に分析し、それぞれの強みと適用シーンを明らかにしている。特にコーディング能力とコストパフォーマンスの観点から、予算制約のある開発者にとって実用的な選択指針を提供する内容となっている。

NOVO GPT 5.3 Codex Superou o Claude Opus 4.6? Comparando os Modelos de 2026 incluindo o Kimi k2.5
Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

GPT 5.3 Codexの登場と初期テスト

皆さん、OpenAIがGPT 5.3 Codexをリリースしたばかりなので、これからテストを行って、このモデルがClaudeと比べて良いのか悪いのかを見ていきます。Kimi k2.5、Claude、GPT 5.3の比較を行います。これらは2026年にリリースされたモデルです。GeminiとGrokも新バージョンをリリースするのを待っているところですね。イーロン・マスクは昨年末のリリースを忘れてしまったようで、まだ待っている状況です。

それでは早速テストに移りましょう。さあ、皆さん、いつもいいねを押してくれる皆さん、チャンネル登録してくれる皆さんに感謝します。このAIチャンネルをスポンサーしてくれているチャンネルメンバーの皆さんには特別な感謝を。メンバーの方々は、WhatsApp、MCP、PDF読み込み、スプレッドシートなどとの統合を含むインテリジェントエージェントに関する限定動画にアクセスできることを覚えておいてください。

また、先行公開動画にもアクセスできます。さて、皆さん、OpenAIの5.3 Codexのアップデートが出ました。今日はこれをテストして、どのように機能するか見ていきます。このテストのコード生成には、OpenAI公式のCodex拡張機能を備えたVS Codeを使用しました。ご覧のように、5.3モデルがすでに表示されています。

ちなみに、最初にログインしたときは表示されていませんでした。一度ログアウトして再接続する必要があり、そうしたら表示されました。ここで生成されたすべてのコードは、extra highバージョンを使用しましたので、品質は常に最高レベルでした。妥協はありませんでした。もう一つ興味深いのは、この動画を録画している時点で、クレジットはすでにリセットされていましたが、すべてのテスト、すべての変更、たくさんのプロンプトを経た後でも、確か68%か66%くらいの使用量が残っていたと思います。

これは、Cloud Opus 4.6の動画では、100%の制限を2回使い切る必要があり、さらに275レアルのボーナス枠も100%使い切って、たった1本の動画のテストをしなければならなかったことを考えると重要です。コストの面でCodexがはるかに安いことがお分かりいただけると思います。では、テストと生成されたサイトを見ていきましょう。

Matrixスタイルのプロンプトショップ

Matrixスタイルのプロンプトショップでは、たった1行のプロンプトです。正直、このバージョンがとても気に入りました。シンプルで洗練されています。皆さん気づいたかどうか分かりませんが、このMatrixプロンプトのテストはずっと前からやっているんです。この緑の色調、背景に落ちてくる文字、このレイアウトは、今回特に際立っていました。

このケースでは、AIのトレーニングが少し変わったことが分かります。正直、この結果が気に入りました。目が痛くなるような非常に明るい緑は使っていません。たった1行のプロンプトで、完全な問題を解決できることが分かります。Kimi k2.5と比較すると、この画像生成は実際にKimi自身がNano Bananaを自動的に使って行ったものです。

つまり、画像を作成するように指示する必要はなく、勝手にどんどん作成していきました。このケースでは、文字があり、画像があり、すべてがあります。スクロールできます。Kimi k2がエージェントの使用中に作成した様々な画像があります。

なぜこの点を示すのが興味深いかというと、サイトを作成したいけれど、アイデアも画像も何もない場合があり、そういう時は自動化されたソリューションの方が価値がある場合があるからです。すでにコメントで考えを教えてください。

ペリカンが自転車に乗るプロンプト

ペリカンが自転車に乗るプロンプトでは、このバージョンを作成しましたが、正直あまり気に入りませんでした。良いペリカンの生成には程遠いですが、少なくとも自転車はあり、ペダルもあります。ペリカンは明らかに足でハンドルを握っているようですが、ハンドルは前にあって間違っています。ペダルにあるべき足は、逆になっているべきですね。同じ場所から出てここのペダルに来るべきでした。

このVの字が逆なら完璧でした。そして明らかにペリカンも逆向きです。頭が後ろを向いていますが、前を向いているべきです。でも少なくとも前を見ています。太陽も雲もありませんが、少なくとも芝生と青空があり、シーンを考えていたことが分かります。

ペリカンに関しては、あまり良くありませんね。リオデジャネイロのボクセルアート生成では、もう少し気に入り始めました。確実にOpus 4.6よりも良くなっています。キリスト像があり、ここに階段があります。この階段を見てください、興味深いですね。いつも表示されるわけではありません。山々があり、シュガーローフがあります。

見てください、ケーブルカーがここで動いています、私が言った通りでしょう。Kimi k2.5もケーブルカーが動いているのを作りました。Claudeだけがケーブルカーを止めて作りました。シュガーローフが分かります。建物が水の中にないのは、通常かなりよくあることなんですが、ここで泳いでいる人がいるようですね、たぶんアバターでしょう、建物とほぼ同じくらい巨大ですから。

でも正直、これは確実に最高のバージョンの一つです。特にキリスト像があり、ケーブルカーがあり、ケーブルカーが動き、色彩がとても良いからです。小さな注意点として、この色彩にするために2回目、3回目のプロンプトが必要でした。影をつけすぎて全体が真っ黒になっていたからです。これは一部の生成でよく起こる典型的なことです。

でも色彩の修正が完了したら、きちんとできました。この霧があるのが分かりますね。やり方によっては見えなくなります。そして完全に黒くなってしまい、実際にはこの過度な影の問題だと分かることがよくあります。ただし黒のトーンで。Kimi k2のこの生成と比較するのは興味深いです。Kimi k2も良いものを作りました。

ケーブルカーが動いているのを見てください。Kimi k2のケーブルカーは少し面白いですが、言ったように、海の上に建物を作ることがあって、全く意味がありません。そしてこのキリスト像には階段がありませんね、皆さん。とはいえ、Kimiは少し創造的で、ここにグアナバラ湾を作り、小さなボートをいくつか、橋を配置し、誰もやらないようなことをしましたが、OpenAIの色彩の方がより美しいことが分かります。

Intelligence 1000 Grauサイトのプロンプト

このプロンプトでは、かなり興味深い結果になったと思います。このプロンプトでは何と言っているかというと、Intelligence 1000 Grauのサイトを作成するように指示し、チャンネルのアドレスを渡し、2つのプレイリストを入れて、「エージェントコースとMachine Conscienceのコーストラックを作ってほしい」と言います。つまり、この情報を取得し、チャンネルの動画をここに配置し、エージェントコースへのリンクを作成する必要があります。ここでエージェントが見られます。

そしてプレイリストを配置し、注目の動画を配置し、ここにプレイリストの最初から最後までのすべての動画を配置します。これは興味深いことです。2、3個のリンクを渡してサイトを作るように指示すると、サイト全体を作ってくれます。多くのことを説明する必要さえありません。

正直、このバージョンが気に入りましたが、チャンネルの色は使っていません。この画像は私がNano Bananaで生成したものです。自分の画像を取り、絵に変換し、それからこの画像に変換しました。つまりCodexが生成したわけではないので、ロゴとこの画像を渡しただけで、それを配置しました。

Cloudの生成と比較すると、Cloudでは画像もロゴも渡しませんでしたが、Cloud自身がチャンネルの色を検索し、このサイトを生成しました。同様に、エージェントコースとMachine Conscienceのコースも生成しました。Kimi k2のサイトバージョンでは、ロゴをここに配置し、画像を小さく配置しました。

逆であるべきですよね。ここでも多くの時間を費やして説明しませんでした。画面の隅で3Dが起こっていて、もう少し速くあるべきかもしれませんが、ニューラルネットワーク、未来的な何かが成長しているのが見えます。ここでも同じことが起こりました。サイトを生成し、完全エージェントコースを配置し、サイトがどのようなものかについて少し詳しく説明しました。

正直、この生成の方が興味深いと思います。より洗練されているからです。サイトのオープニングがあります。この画像を変更して、今作った新しい画像を入れることができます。それから最近の動画があり、コースが大きく表示されます。これはより興味深いものになりました。どう思いますか。エージェントコースでも同じです。

ここにバグがあって読み込まれませんでした。このプロンプトを続けて修正を依頼すべきでしたが、正直Kimi k2.5のこのバージョンがとても気に入りました。さあ、どれが一番好きですか。GPT 5.3 Codex、Claude Opus 4.6、Kimi k2.5。コメントで教えてください。

カーゲームのバージョン比較

GPT 5.3バージョンのカーゲームでは、今は音楽付きです。見てみましょう。音を消しますね、エイリアンの音楽があるので。注目すべき点の一つは、車がドリフトしていないことです。とはいえ、バックで進んでいますね、逆方向に行っています。コインは機能していて、車も機能しています。

AIが私に勝ちました。ここでもう一度始めましょう。爆発、衝突、すべて正しいです。このコインを取れるか見てみましょう。コインを取りました。シーンは美しいです。車、品質、すべてが改善されました。車輪があり、影があり、すべて正しいです。これはすでに良いカーゲームの生成です。

とはいえ、Cloudの動画で言ったように、もう大きな変化は見られなくなり、これが普通になってきています。少し前は優れていたものが、今では普通になっています。Kimi k2の生成は特に気に入りました。誰も考えなかった面白いものを発明したからです、CloudもChatGPTも。

では見てみましょう、音楽付きです。見てください、このケースでは車がドリフトしていて、車は少し奇妙で、画像は少し奇妙ですが、例えばこのスライドを見てください。これは他にはなかったものです。音を消します。音楽があり、コインがあり、すべて正しく、車の後ろから煙が出ています。これまで誰もやっていなかったことです。

車には車輪があり、窓があり、ライトがあり、すべて正しく、シフトを押すとターボを解放します、ターボ起動、非常に正確です。かなり興味深いものになりました。つまり、これらの生成はかなり興味深くなっていて、Kimi k2には私がとても気に入ったクリエイティブな何かがあることが分かります。

Kimi k2のこのケースでは、エージェントで生成されました。通常のプロンプト、通常のシンキングでの生成ではありませんでした。これは音楽付きのCloudの生成です。聴いてください。始めましょう。音を消しますね、そうしないと聞こえません。さて、皆さん、これはとても良くなりました。正直、これほど良い車の生成は見たことがありません。

車は一切ドリフトしていません。線路の上を正しく走っています。シーンは全部カラフルです。車もとても可愛らしく、車輪、ライト、窓の部分があり、後ろなどもあります。車を90度回転させて前を向くようにするだけでよかったのですが、それは簡単にできます。

では、3つのカーゲームのうちどれが一番好きか、下にコメントしてください。そして、ほぼ50項目のプロンプトという最も難しいコードの生成では、今度はGPT Codex 5.3バージョンで見てみましょう。興味深いですね、皆さん。このバージョンでは、いくつかのことを確認し、機能しているか見るのが好きです。

例えば、マップの品質。横断歩道の線、すべて正しいです。信号機、信号機の品質、ここのプレイヤー、腕と脚があります。ここの歩道には高低差があります、ほとんど誰もやらないことです。木は正しい場所にあり、道路の真ん中に木はありません。

街灯は、上部にきれいに配置されています。とはいえ、あまり照らしていませんね。非常に弱い電球が見えます。右上のミニマップです。キャラクターについて行くと、オレンジ色の点があります。あの点を追いかけています。ここで人を見つけられるか見てみましょう。ここです。正しいです。

ミニマップを使用でき、それで方向を知ることができます。機能しています。そして今オブジェクトを拾ったので、キャラクターの手にオブジェクトが見えます。分かりますか。私が拾ったオブジェクトが私の手にあります、キャラクターと一緒に。これを青い人に届けます。

頭の上の青い四角が見えますか。これが四角を受け取る人です。さあ、届けます、届けます。届けました。素晴らしい。もう一つ知りたいのは、車の中の様子です。車の中もすべて正しいです。そうあるべきように人々を轢くことができます。

マップを狂ったように移動できます。この車はとても良いです。素晴らしいです。ヘリコプターでは、ここで素晴らしい飛行もできます。コントロールして、街を観察します。この街はとても良くなりました、皆さん。ヘリコプターの上から、横断歩道がとても良いことが分かります。

このプロンプトにいくつかの改善を加えて、建物の上を歩けるようにしました。つまり今プロンプトでは、建物の上に着陸したければできます。着陸して、Fを押して、ヘリコプターから出ました。今はキャラクターをコントロールしているように、ここにいます。

ヘリコプターに戻りたければ戻れます。これはありませんでした。そして、ヘリコプターの中からゲームのミッションを達成したければできます。頭の上に四角がある人形が見えますか。四角を集めましょう。ここの近くを通りました。四角を取りました。ミニマップを見てください。青いものが見えます。

青い人にオブジェクトを届けましょう。青い人がいます。彼の上を通ります。届けましょう。届けました。分かりますか。これでヘリコプターでこのゲームをプレイできます。この変更を行うことができます。物事は非常にダイナミックになりました。また、オブジェクトを取りました。届けに行きましょう。つまり、この方法でプレイするのはかなり楽しくなりました。ヘリコプターだとはるかに興味深い視点が得られるからです。

でも覚えておいて、他の人が何をしたか見てみましょう。Kimi k2のバージョンでは、街はそれほど美しくありませんでしたが、起こるべきことは起こっています。ヘリコプターは機能していますよね。建物の窓が点灯していて、すべて正しいです。ヘリコプターが飛んでいて、突然、建物の上に着陸できます、すべてうまくいきました。

これらすべての機能が実装されました。つまり、かなり興味深いものになりました。このシーンの見た目は、最悪の一つだったと思います。この見た目を修正しようとしましたが、それでもそれほど良くなりませんでした。ヘリコプターの中からプレイすることもできます。白い四角が頭にあるこの人のお腹にある黄色い四角が見えますか。近づくと消えます。ほら。消えました。

オブジェクトを集めました。そしてミニマップの赤い点を見て、頭に四角がある木の近くのこの人に配達しなければなりません。そこで届けます。できました。物が届けられました。ポイントを獲得し、時間を獲得しました。つまり、ミッション、可視化、マップのこと、すべてとても良いです。

とはいえ、言ったように、このマップは改善しようとしましたが、あまりうまくいきませんでした。マップを美しくするのが最も難しかったですが、色付きの窓を作ったのはこれだけでした。そしてすべて正しく、すべて非常によく機能しています。Cloudに行きましょう。Cloudのバージョンでは、3D都市ゲームで、これがCloudが作ったバージョンです。

動画で、少し固まっていて、放置されていて、これを解決すると言ったのを覚えていますか。解決しました、皆さん、画面をキャプチャして録画していますが、超高速です。車に乗りたければ乗れます、すべて正しいです。ズームイン、ズームアウトできます。

非常によく機能します。ヘリコプターを取ることもできます。この部分もあり、機能します。ヘリコプターの中からミッションを達成することもできます。つまり、マップの緑の点を見ると、そこにあります。ここです、緑の点。

頭に何かある人です。近くを通ります。集めます。もう集めました。ミニマップの赤い点を見て配達します。赤い箱がある人形です。行きましょう。届けました。これはとても良いですよね。街の上空からの景色ですべての電球が点灯します。

白い点が見えますか。点灯した電球です。これは夜だから点灯しただけです。そしてこれが昼間のCloudのマップバージョンです。横断歩道が少し奇妙なのが分かりますね。修正が必要です。飛んでいるときに少し奇妙な影があります、でもマップは非常に正しく、物事は機能しています。

マップの配置がとても良かったと思います。そしてプレイでき、ヘリコプターの中からミッションを達成できるこのバージョンもとても良かったです。ここでも建物の上に着陸でき、建物の上を歩くことができます。つまり、すべて非常に正しいです。このゲームは続行する準備ができています。

そして、このCloudのバージョン、色付きの窓がありいくつかの新機能があるKimi k2.5のバージョン、または街がよく組み立てられすべてが正しいChatGPTのこのバージョンのうち、どれが一番気に入ったか下にコメントしてください。機能性の観点では、どれがより興味深いと思いますか。

各モデルの総合評価と考察

機能のナイトでは、実質的にすべて同じです。すべて飛べます、すべてヘリコプターのミッションができます、すべて車を取れます、すべてに昼と夜があります。プロンプトをコントロールするのが最も難しかったAIはKimi k2でした。トークンと使用制限の問題が最悪だったのはCloudでした。そして最高のコストパフォーマンスだと思ったのはCodex 5.3でした。

今回、これまでになかったことが起こったからです、皆さん。これまで起こっていたのは、これらのモデルのうち、このマップを作れるのはほんの数モデルだけだったということです。例えば、Gemini 2 Flashだけがこの3D都市ゲームのプレイ可能なバージョンを作ることができました。

他は誰もまともなバージョンを作れませんでしたが、今はすべてができました。これが最も奇妙なことでした。Cloud、Kimi k2.5、GPT 5.3、すべてがプレイ可能なバージョンを作ることができ、すべてプロンプトで質問をすると、修正し、訂正し、常に改善されていきました。

つまり、結局のところ、お金がなくてCloudを購入できない場合、Codexを使っても全く問題なく、制限が爆発する問題もありません。Xで人々が何を言っているか見に行きました。例えば、Enhowはこう言っています。「Codex 5.3のコード品質は4.6より高い。

Opusのコンテキストは5.3より大きい。今は100万トークンあるからです。Opusの速度はCodexより速い。人々がかなり文句を言っていることの一つは、Codexが非常に遅いことです、25%高速化したにもかかわらず。そしてCodexの価格は、ここではOpusより高いと書いていますが、実際には彼はより有利だと言いたいのです。ここで説明しているからです。

生のコーディングパワーをより低コストで望むなら、Codex 5.3を使ってください。広範なコンテキスト、より速いインタラクションが必要なら、Opus 4.6です。これが私が気づいていることです。今は2つの優れたモデル、非常に良い品質で、要求に応えるものの間で選ぶことができます。Waywayはこうコメントしています、彼が言ったことを見てください。Opus 4.6は全般的に強いですが、短期タスクではナンバーワンではありませんでした。

彼は4.5、つまり以前のOpusがロケーターでより良く、Gemini 2 Flashがアサーションでより良かったとコメントしています。ロケーションはlocatorsで、アサーションはassertionsであることを理解する必要があります。翻訳されているからです。そして彼はここで結論づけています、競争力はあるが勝者はいない、明らかに。

お分かりですね、皆さん。これが私の感覚です。モデルが引き分け始めました。Geminiについては言及しません。彼らが2026年のGeminiバージョンをリリースするのを待っているからです。今は現在のモデルについてのみ話します。そしてGabrielはここで4.6があまり好きではないとコメントし、あまり良くないと言い、4.5を戻してほしいと言っています。

つまり、4.5には4.6より良い点があるとコメントしている人がいるのは興味深いです。お分かりのように、私の経験はこれとほぼ似ていました。物事がほぼ互角のようです。おそらくGeminiが次のバージョンをリリースしたら、みんなの前で大暴れするか、みんながほぼ互角のままになるでしょう。

どうなると思いますか。ここでコメントしてください、知りたいです。そして、このような動画を見続けるためにチャンネルをサポートしたければ、メンバーになってください。メンバーはインテリジェントエージェントの限定動画と先行公開動画にアクセスできます。それでは、いいねを押してください。ありがとうございました。

コメント

タイトルとURLをコピーしました