GPT-5.5 Pro(Spud)がリーク:OpenAIの新モデルがClaude Opus 4.7を凌駕する可能性

GPT-5
この記事は約12分で読めます。

OpenAIが新たに開発中のモデル「Spud」は、GPT-5.5 Proとしてリリースされる見込みで、早ければ来週にも公開される可能性がある。注目すべきは、AnthropicがClaude Opus 4.7を発表した直後のタイミングであり、流出したSpudの出力結果を見る限り、Opus 4.7を上回る性能を示している可能性が高い。公式ベンチマークはまだ公開されていないものの、初期の生成サンプルはGPT-5.4やOpus 4.7を超える品質を示唆しており、VoxelCraft、3Dシミュレーション、SVGコード生成、フロントエンド開発、ゲーム制作など多岐にわたる分野で卓越した性能を発揮している。OpenAI社員による非公式なテスト提供も行われており、新モデルへの期待が高まっている。

GPT 5.5 PRO (SPUD) LEAKED: OpenAI's New Model BEATS Claude Opus 4.7!
OpenAI's next frontier model just leaked. Codename Spud, likely shipping as GPT 5.5 Pro, and it could drop as early as n...

OpenAIの新モデル「Spud」が間もなく登場

OpenAIは現在、Spudというコードネームの新しいモデルをパイプラインに持っており、おそらくGPT-5.5 Proとして出荷される予定で、早ければ来週にもリリースされる可能性があります。興味深いのはそのタイミングです。AnthropicがちょうどOpus 4.7を今週リリースしたばかりなのです。

そして私が確認してきたSpudからのリーク出力は、本当にOpus 4.7を打ち負かせるものに見えます。まだ公式のベンチマークはありませんが、人々が投稿している初期の生成物を見る限り、その生成品質はGPT-5.4やOpus 4.7から見てきたあらゆるものより一段上のレベルにあります。

では、お見せしましょう。

VoxelCraftテストで見せた驚異的な完成度

最初にお見せする例はVoxelCraftです。これは多くのAIモデルが試されてきた一般的なテストで、Minecraftのクローン、つまりMinecraftが実際にどのように見えるかのシミュレーションを作成するものです。そしてこのようなインベントリテーブルが作成されたのを見るのはこれが初めてです。

自由に動き回ることができます。物理演算も実際に機能しています。というのも、これまでこれらのテストが作成された際、物理演算は実際には機能しないことが多かったのです。プレイ不可能な状態でした。物をクリックしたり壊したりはできても、明らかにこの生成物ではそうではないことが分かります。

水の中に入れるでしょうか?はい、入れます。ここで動き回ることができ、飛び回ることもでき、すべてが機能し、世界が実際に生成されています。これは本当に素晴らしいことです。なぜなら、多くの場合、世界はグリッチだらけで、今ご覧になっているほどスムーズではないからです。

物を壊すこともできます。下に潜ることもできます。インベントリレベルが増えています。つまりAIモデルは本当にMinecraftがどのように見えるかを理解し、そのバージョンを作成しようとしているのです。

このようにまとまった生成物をモデルが作り出すのを見るのはこれが初めてです。なぜなら、これまでは生成物が十分に強力でなく、実際に世界を動き回ることができなかったため、これらのテストは成立しないことが多かったからです。

3Dシミュレーション:フレンズのアパートメント再現

次の例をお見せしましょう。こちらは別のテストで、フレンズのモニカのアパートメントのシミュレーションを作成し、three.jsを使って作られたものです。明らかにここで動き回ることができます。

three.jsがこれまでの生成物よりも少し良く感じられるのを見るのはこれが初めてです。少しグリッチがあるでしょうか?ええ、あそこには浮いているライト、あるいはキャンドルのようなものがあります。でも悪くありません。これはかなりまとまっています。

私はフレンズの大ファンではないので、これが実際のアパートメントにどれだけ正確かは分かりませんが、AIモデルがこのような3Dシミュレーションを作成できることに驚いています。そしてかなりまとまっています。

あそこには浮遊しているソファがありますが、それは大丈夫です。多少の余裕を持たせましょう。おそらくこれはワンショットプロンプトだけで生成されたのでしょう。もしこれをいじって更新したりすれば、もっと良くなったかもしれません。でもこれはかなり良いです。

続ける前に、私たちはUniverse of AIニュースレターを立ち上げました。AIニュースを探し回る必要なく最新情報を把握したい方は、説明欄にリンクがあります。お見逃しなく。

フロントエンド開発能力の大幅な向上

そしてモデルはフロントエンドのウェブ開発も上手くなったようです。このセクションは重要です。なぜなら多くの人々は明らかにVoxelCraftを作成したり、モニカのthree.jsシミュレーションを作成したりはしないからです。ほとんどの場合、これらのモデルはより良いウェブサイトを作成するような単純なタスクに使われます。

簡単な手描きのモックが与えられ、それに基づいて包括的なウェブサイトを作成することが求められました。これはかなり良いです。そして多くのモデルのようなAIっぽいスロップには見えません。新しいテーマが何なのか分かりませんが、以前はすべて紫色のような色使いでした。それから新しいテーマがすべてのAIモデルに適用されています。

でも今回は、これはよりミニマリスティックに見え、以前の生成物やAnthropicのOpus 4.7と比較してもよりプロフェッショナルに見えます。このフロントエンド開発側面は、かなり有望に見えます。ですから私は興奮しています。

そして下に見えているのはEricという名前の人物です。Ericは実際のOpenAI従業員で、彼は明らかに人々に返信していて、GPT-5.4 Proで問題が発生している場合は、現時点でOpenAIを使ってSpudを実際にテストできると言っています。

彼らはモデルをテストしており、Ericは明らかに人々の反応を監視していることを示唆しています。なぜなら彼らはモデルにステルスアップデートを行ったからです。みんながまだ古いモデルを使っている間に、新しいモデルは人々が得ているインプットやフィードバックに基づいてトレーニングされているのです。

そして人々はGPT-5.4 Proが少し違った感じになり始めていると報告しています。それは彼らが水面下で新しいモデルを密かにテストしているからです。ですから、あなた自身でもテストしてみることができるかもしれません。

SVGコード生成の飛躍的な進化

Spudはまた、SVGコード生成も上手くなりました。出力をお見せする前に、SVGについて説明しましょう。基本的にこう考えてください。これは実際には画像ではありません。このXboxコントローラーは実際にはコーディングされています。画面上に見える形や色などを作成する数式の束なのです。

画像を生成しているわけではありません。そうですね?ですから、それを理解すれば、バックグラウンドで何が行われているかをより評価できるようになります。SVGコードなら、どんな画面でも拡大しても同じように見えます。でも画像の場合、例えば画像の解像度によって変わってしまいます。だからSVGがウェブサイトなどで特に作成されるのです。

これがワンショットSVGコードで、今回は通常のGPT-5.4 Proと比較してはるかに速く、異なるスタイルの出力を提供していると言われています。ですから、モデルがバックグラウンドでステルスアップデートを受けたことが明らかに分かります。

これが生成物の見た目で、かなり素晴らしいです。これはかなりリアルに見え、ここにあるコード行数のおかげでどれだけ詳細かが分かります。見てみましょう。コード行数はどれくらいあるでしょうか。

たった463行のコードしかありませんが、その正確さを見てください。以前のSVGコード生成と比較して、私のチャンネルでも過去に古いモデルのSVGコード生成の多くの例をお見せしてきましたが、今画面上でご覧になっているものほど包括的でも正確でもありません。

ですから、このコントローラーは明らかに以前の生成物よりもはるかに良く見えます。ですから、私は個人的にSpudに興奮しています。なぜなら、これが現時点で生成できるものなら、実際にリリースされたときに何を生成するか想像もつきません。

他のモデルとの比較:Spudの圧倒的優位性

こちらはSpudのSVG能力がテストされている別の例です。ここでは、これが画像で、右側に見える画像です。明らかにこれが最も良く見えるでしょう。これはSVGコードです。100%正確でしょうか?いいえ。でもはるかに近いです。

そして他の最先端モデル、いわゆる最先端モデルからの例をお見せすると、これをもう一度はるかに評価できるようになります。これがどのように見えるかです。これが画像が実際に見えるべき姿です。そしてこれがSpudが生成したものです。

ここをスクロールすると、これがSpudの生成物です。次のモデルはGemini 3.1 Proで、SVGコード生成のために本当にファインチューニングされたモデルでした。

明らかにSpudはGemini 3.1 Proを打ち負かしています。なぜなら、ここには脚が一本しかないことが明らかに分かるからです。物事が少しずれて見えます。くちばしもずれて見え、これと比較するとすべてがそうです。

それから最新モデル、先週リリースされたと言えるOpus 4.7。数日前です、先週でさえありません。私はこれを日曜日に録画しているので、数日前でした。

これがOpus 4.7です。明らかにSpudモデルと比較すると期待外れです。私はSpudモデルを持ち上げているわけではありません。正直に言っているだけです。これらの生成物に基づいて、GPT-5.4が、いえ、Spud次期モデルまたはGPT-5.5 Proが、コーディングやSVGコード生成と比較して本当に良くなることが明らかに分かります。

ですから、この例は明らかにOpus 4.7、Gemini 3.1 Pro、そしてGPT-5.5 Proを示しています。

ボクセルアートとインタラクティブ要素の融合

VoxelCraftテストと自転車に乗るペリカンを組み合わせると、次にお見せするプロンプトが見えてきます。プロンプトはこうでした。「自転車に乗るペリカンのボクセルアートを作成してください。できるだけ詳細にシーンを作成してください。メインビルドのあらゆる細部について考えてください。周囲についても、一つのHTMLコードブロックで。他のすべてよりどれだけ優れているかを示すほど良くコーディングしてください。面白いプロンプトですね。完全な創作の自由を与えます。それを活用してください」

これが生成物です。皆さんはどう思いますか分かりませんが、これは素晴らしく見えます。これがゲーム開発などのためのものなら、明らかにこれはシンプルなプロンプトで、ワンショットですべてそうですが、これはプロフェッショナルです。

車輪などが動き回っているのを見てください。背景を見てください。これらの鳥、ボクセルの鳥がいます。背景に灯台があります。太陽があります。そして動き回ると、太陽の光がここで動き回るように見えます。これは本当に素晴らしいです。

そして見てください、3Dアニメーションです。ペリカン、自転車レーン。カニがいて、紙吹雪があります。そしてここにあるコードの量を見てみましょう。繰り返しますが、これはワンショット生成でした。そしてワンショットで、モデルは約1,000行のコード内でこれらすべてを出力しました。

ですからかなり効率的で、かなり良いです。悪くありません。そして繰り返しますが、これはかなり素晴らしく見えます。このペリカンは実際にかなりかっこいいです。帽子までかぶっています。

モデルを持ち上げないように最善を尽くしていますが、この生成物はそうしないことを難しくしています。皆さんはどう思いますか?コメント欄でも教えてください。

わずか10分でゲームを完成させる能力

そしてこのユーザーがしたことは、単にゲームの仮想の画像を提供し、「この画像に基づいて、即座にプレイ可能な3D詳細オフィスパンチゲームスタイルにしてください」と言っただけです。そして約10分以内にゲームが実際にコーディングされ、明らかに少し違って見えますが、スタイルはそこにあります。

そしてこれが10分以内にコーディングされ、単純なプロンプト画像と「このようなゲームを作ってください」と伝えただけでした。ですからこれは全く悪くありません。

ポケモンゲームの完全な実装

こちらは別の例で、「インタラクティブであるべき3DポケボールのKodaを作成し、ランダムなポケモンが出てくる、一つのHTMLコードブロックで」というプロンプトが与えられました。

これを見ると、これはかなり良いです。ポケモンは実際にかなりリアルに見え、これはクレイジーです。皆さん、ワンショットでこれほど包括的で、これほど詳細なものを生成するモデルを見たことがありません。

画像の能力を組み合わせていると思います。なぜならOpenAIからImage 2、GPT Image 2のようなリークされた画像モデルも出回っているのを見てきたからで、そのモデルは良くなっています。ですから、それを新しいアップグレードと組み合わせれば、これには本当にクレイジーなゲーム能力があることになります。ですから私は興奮しています。

そしてフォローアップとして、ユーザーは一つの追加プロンプトを与え、そこから本格的なポケモンゲームを手に入れました。これを見てみましょう。

これが実際のゲームです。Pokeball Clashと呼ばれています。この人がいます。Diboというポケモンがいます。Goldenと対戦しています。攻撃できます。攻撃してみましょう。おお、かなりかっこいいです。これは本当に良いです、皆さん。モデルがこれをするのを見たことがありません。

持ち上げようとしているわけではありませんが、これに基づいて、これは最先端のモデルになると思います。スペシャルをやってみましょう。

ああ、攻撃されています。回復させてください、死にそうなので。回復してみましょう。もう回復がありません。死んでしまいます。スペシャルアタックをやってみましょう。オーケー、これはかっこいいです。

オートバトルをやってみます、次のポケモンが何か見たいので。新しいバトルを生成します。何が出るか見てみましょう。Drowsyが出ました。そして相手はFrizzy Backです。オーケー、スペシャルアタックをやってみましょう。

オーケー、これで楽しみすぎていますが、皆さんはポイントを理解していただけたと思います。

結論:新時代のAIモデルへの期待

来週がとても楽しみです。まとめると、皆さん、OpenAIから来るこの新しいモデルに本当に興奮しています。GPT-5.5 Proコードネーム Spudができるだけ早くリリースされることを期待して待機します。なぜならこのモデルへのアクセスが本当に欲しいからです。

私はゆっくりとOpenAIから離れ、Claudeのエコシステムに移行していました。今、この新しいモデルがどのように見えるかに基づいて、少し考え直しています。

言ったように持ち上げようとしているわけではありませんが、公平であろうとしているだけです。もしAnthropicがこれよりもはるかに優れた別のモデルをリリースすることにしたら、そのモデルについても良く話すつもりです。なぜなら私はこれにかなり中立だからです。

私は単に利用可能な最高のAIモデルへのアクセスが欲しいだけです。まだAGIには到達していないと思いますが、これに基づいて、私たちは少し近づいているかもしれません。

皆さんはどう思いますか?でも今日の動画は以上です。チャンネル登録を忘れずに。universeai.behive.comで私たちの新しいニュースレターもフォローしてください。メインチャンネルのWorld of AIもチャンネル登録してください。そしてUniverse of AIZをフォローしてXでも応援してください。

それでは、次の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました