GPT-5.2がリリース:実際にテストしてみた(誇張なし)

GPT-5、5.1、5.2
この記事は約10分で読めます。

本動画は、OpenAIが新たにリリースしたGPT-5.2の実践的なコーディング性能を検証するものである。作成者はClaude Codeのコース制作中にGPT-5.2のリリースを知り、急遽テストを実施した。ベンチマークではなく実際のウェブサイト構築タスクを通じて評価を行い、GPT-5.1 Codex Max Extra Highよりも4%高いSW-Benchスコアを記録したという公式発表を検証している。テストでは、Visual Studio CodeのCLI環境でサービスベースのウェブサイト構築を指示し、15〜20分で完全に動作するNext.jsアプリケーションを生成することに成功した。特筆すべき点として、404エラーが一切発生せず、サイトマップやSEO対応も完璧に実装され、多言語対応も問題なく動作した。また、コンテキスト管理能力が優れており、81%のコンテキスト使用率で完了したことから、Claude Codeと比較しても遜色ない性能を示した。月額19.99ドルのProプランで利用可能な点も評価されており、現時点で市場最高クラスのコーディングAIモデルの一つであると結論づけている。

GPT 5.2 Just Dropped: Let's Test (NO BS)
OPENAI Just dropped GPT 5.2 - In this video I fully test it with my Benchmark and see how it does with raw coding inside...

GPT-5.2の突然のリリース

さて皆さん、Claude Codeのコースを作成していたところ、GPT-5.2がリリースされました。これについて完全に誇張なしのレビューをやっていこうと思います。では、どんな性能なのか見ていきましょう。正直なところ、私の昔ながらのテスト方法でやってみるつもりです。

最高のチャンスを与えるために、Codex内でテストしようと思います。実際にどのように構築されるのか、他のモデルと比較してどうなのか、純粋に興味があります。見た感じはかなり良さそうですね。ただ、こういうのはあまり読まないんです。ベンチマークとかそういったものには、正直あまり関心がないんですよね。

でも、これは気になります。OpenAIによると、GPT-5.1 Codex Max Extra Highよりも優れているとのことです。これは実に興味深いですね。SW-Benchで4%高いスコアを記録しているそうです。これは私が気にする数字です。では、実際にテストしてみましょう。

Visual Studio Codeを開いて、Schoolコミュニティから昔からあるプロンプトの一つを取り出して、どうなるか見てみます。実はかなり興味津々なんです。フォルダを開いて、新しいフォルダ、GPT-5.2という名前にします。

テスト環境のセットアップ

今日は一日中コンテンツを作っていたんですよ、皆さん。本当にクレイジーな一日でした。普段ならライブ配信するんですが、今はあまり配信する気分じゃないので、動画をリリースすることにします。さて、これがまだ更新されているか見てみましょう。いや、まだですね。よくやったぞ、ChatGPT、と言いたいところです。リリースバージョンに切り替えます。プレリリースバージョン。もしもし、これできますか?

どうやらCLIで使う必要がありそうですね。実は私、Codex CLIはあまり好きじゃないんですが、仕方ないですね。では、MKD GPT-5.2 CLIと入力して、それからCD GPT-5.2-CLIと入力します。完璧です。それからCodex updateと書いてみます。うまくいくかな。いや、違うか。Codex d-updateですね。

では、npmでやってみましょう。うまくいくか見てみます。変更があったと表示されていますね。もしかしたらうまくいったかもしれません。確認してみましょう。Codex model。ありました。GPT-5.2です。完璧です。Extra Highにしておきます。可能な限り最高のチャンスを与えましょう。

Schoolコミュニティに行って、クラスルームに入ります。私のフロントワークフローを全部確認します。このテストをするのは久しぶりなんですよね、正直なところ。サービスベースのウェブサイトに行きます。これは実際には今の私のサービスベースのウェブサイトの作り方ではないんですが、新しいモデルのテストとしては良いものです。

スポンサーメッセージ

動画を続ける前に、今日のスポンサーについて簡単にお話しします。それは私自身です。動画の説明欄とピン留めコメントに、Schoolコミュニティへのリンクがあります。もし私たちが話している内容についてもう少し学びたい場合、コーディングの基礎から、これらの技術の絶対的なマスターになるまで、本番環境対応のアプリ、SaaSアプリケーションの立ち上げ、そして私は数百のウェブサイトも立ち上げてきました。

私はそこにいて、それをやってきました。現在3つのSaaSを持っています。私がどうやってそれをやっているか学びたい場合、Claude Code、スタック、Next.js、JavaScriptなど、私がこれまでに学んだすべてのことをSchoolコミュニティにまとめました。ご視聴ありがとうございました。メインコンテンツに戻りましょう。

実際のテスト開始

では、このプロンプトを投入して、この問題にどう対処するか見てみます。意図的に難しいプロンプトを与えました。まともなものなら修正できるはずです。GPT-5.2が修正できるのか、それとも単に混乱を引き起こすだけなのか見てみましょう。

さて、このリリースについてどう思うかですが、もしこれがOpenAIから出てくる極めて優れたモデルでないなら、とあるYouTubeのフレーズを引用すると「終わり」だと感じています。正直なところ、見てみましょう、皆さん。というのも、私はOpenAIにはそれほど熱心ではないんです。

ただ、Codexは好きだと言っておきます。特に、Visual Studio Code内のCodexは好きです。CLIではあまりうまく動作させることができていません。5.2でなにか改善や向上があったか見てみましょう。楽観的ではあります、と言っておきましょう。

というのも、OpenAIには何か企んでいるものがあると感じているからです。もしそうでなければ、真面目なコーダーには使われなくなってしまうでしょう、正直なところ。ただ一つ言えることは、Codexの19ドルプランでは、Claude Codeのようなものと比較して、かなり多くのコーディングができるということです。

では、これを実行させましょう、皆さん。どうなるか見てみます。実際にスキャフォールディングしていますね。スキャフォールディングを選択しています。これは基本的なテストのようなものです。NextJSアプリを作成するコマンドを実行するのか、それともスキャフォールディングするのか。スキャフォールディングすることにしたようですね。私はこれをあまり好きではありません。なぜcreate next appを実行できないのかわかりませんが、まあ、仕方ないですね。

Claude Codeならアプリを作成するだけですが、あまり優れていないCLIコーディングツールはスキャフォールディングしますよね。それに、ここのCodexもスキャフォールディングしていたでしょう。

コンテキスト管理能力の評価

さて、Codexについて気づいたことが一つあります。これは実際かなり素晴らしいことで、5.2のリリースによってさらに改善されている可能性があります。それは、コンテキストを扱う能力が極めて優れているということです。

繰り返しになりますが、Visual Studio Codeアプリの観点から話しています。しかし、おそらくCLIでも同じだと思います。ちょうど今気づいたんですが、これは実際にはCLIでの会話なんですよね。すごい、これは実に興味深いです。

そう、Codexの最も優れた点の一つ、そしてこれまでのところ5分間、まったく中断なく動作していますが、これはかなり良いことです、それはコンテキストを扱う能力です。コンテキストがなくなりかけると、何かをするようです。おそらく、会話の以前の不要な部分をカットして、コンテキストをリフレッシュしているのでしょう。これは本当に、本当に素晴らしいことです。

さて、20分間動作しています。これはかなり良いですね。理由なく文句を言うつもりはありません。最終的な成果物が良いかどうかは、もうすぐわかります。コンテキストの81%を使用しているので、これは極めて低いです。Claudeは通常、このあたりかそれより前にコンパクト化を実行する必要があります。

さて、ほぼ完了したと思います。コードを少し見ていました。私は開発者ではありません。実際にはコーダーでもありません。でも、まあ大丈夫そうだと言えます。これがどうなるか、実際に何が生成されるか、確実に興味があります。

サイトマップを作成しましたね。これは良いことです。通常はこれをやりません。だから興味深いです。ここでは本当に細部に多大な注意を払っているようです。実際のコードが細部に注意を払っているのか、それとも単にゴミの山なのか見てみましょう。

ビルドプロセスの確認

では、まだ必ずしも完了していませんが、CD my next tabと入力して、それからnpm installと入力してみます。完了したと思います。現在、ヒーローコンポーネントを修正しているところです。ただ、これがうまくいかない理由はないはずで、すべてインストールされるはずです。

ここにある赤いものも、npm installを実行した後に消えるはずです。通常なら自分で終了するまで待つんですが、ただ、どうなったのか本当に興味があるんです。

さて、GPT-5.1と非常に似ているように見えますね。率直に言って、最初から。極めて似ています。どこかで404エラーが出ていないか見てみましょう。これはかなり良いですね。正直に言うと、私が目撃していたことや、コードで見たことから期待していたよりも良いです。これは実際に、私が期待していたよりも大幅に良いです。

SEOはできていますか?はい、できています。npm run buildはしませんでした。npm run devをしました。では、npm run buildをやってみましょう。すぐにビルドされるか見てみます。もしそうなら、極めて印象的です。

コードに全くミスがないというのは非常に稀です。だから、極めて良いですね。繰り返しになりますが、一つ言及しておくと、私はProプランのみです。ChatGPTに月19ドル支払っています。つまり、これは確実に考慮すべきことですね。

サイトマップがそこでビルドされていないようですが、私が見逃しただけかもしれません。でも見てみましょう。sitemap.xmlです。あ、サイトマップがあります。すごいですね。つまり、これは指示に完璧に従っています。

15〜20分かかりました。これは極めて速いです。明らかに、ここには画像がありません。もしロールスロイスの画像があれば、さらに良く見えるでしょう。デザインは気に入っています。

最終評価

ChatGPTで作られたものだとわかります。以前にChatGPTを使ったことがあれば、ChatGPT 5.1 Max Codexによく似ています。しかし全体的に、これは非常に、非常に印象的なビルドです、正直なところ。これは間違いなく、ChatGPTが誇りに思える技術的なビルドです。だから、よくやりました。

これは現在市場で最高のモデルの一つだという感じがします。月額19.99ドルで使用でき、かなり良いレート制限もあります。だから、確実に見る価値がありますよ、皆さん。

もし何かを構築するのを待っていたなら、YouTubeを見るのをやめて、今すぐ構築を始めてください。新しいモデルがリリースされるたびに、私はいつも人々にこれを言います。このモデルは、今のように良いのは、あるいは今と同じくらい良いのは、2週間だけです。

基準に達していますよ、皆さん。正直に言って、私が期待していたよりも良いです。ここでの技術的なビルドは完全に完璧です。今のところ、404エラーには一度も遭遇していません。通常起こることは、英語がイタリア語と混ざってしまったり、例えばイタリア語のページが404になったりすることです。それはClaude Codeでもいつも起こります。これは非常に完全なビルドです。

日付まで正しく設定されています。2025年と表示されています。ほとんどのモデルは2024年と言うでしょう。だから、カットオフ日も変更したのだと思います。全体として、OpenAIからの良いアップデートです。

もしこれを見ているなら、YouTubeを見るのをやめてください。他のバイブコーダーを見るのをやめて、自分でコーディングを始めて、何かを作り始めてください。ご視聴ありがとうございました、皆さん。もし動画の最後まで見ているなら、あなたは絶対的なレジェンドです。非常にすぐに、さらなるコンテンツでお会いしましょう。ではまた。

コメント

タイトルとURLをコピーしました