OpenAIの新型GPT Image 2が登場間近か?Gemini Imagen 3を超えるのか実機テストで徹底検証

OpenAIの新しい画像生成モデルがLM ArenaとDesign Arenaでテスト段階に入り、コードネーム「Chestnut」と「Hazelnut」として運用されている。現在最高峰とされるGemini Imagen 3との性能比較において、セレブリティの顔の生成品質、テキストレンダリング、そして特にプロンプトへの忠実度で優れた結果を示している。ブラジルの著名な建造物を組み合わせた複雑なプロンプトテストでは、ペロウリーニョの石畳の街並み、クリチバの目の博物館、ブラジリアの大聖堂、リオデジャネイロのコルコバードのキリスト像という4つの要素すべてを自然に統合した画像を生成し、Geminiを含む他のモデルを上回るパフォーマンスを発揮した。GPT-5.2と同時リリースの可能性が高く、OpenAIとGoogleの画像生成AI競争が新たな段階に突入しようとしている。

NOVO GPT Image 2 da OpenAi Saindo do FORNO Vai Superar Nano-Banana? Veja os Testes em Primeira Mão

Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

OpenAIの新画像生成モデルが目撃される
新モデルの発見と特徴
プロンプト精度の検証テスト
ブラジルの風景を使った精度テスト
まとめと視聴者への呼びかけ

OpenAIの新画像生成モデルが目撃される

皆さん、OpenAIの新しい画像生成モデルがすでにテストされていて、どうやら皆さんが投稿している結果を見る限り、これは素晴らしい出来栄えのようですね。皆さんはどう思いますか。この有名人のAI生成画像を見てください。皆さん、これは本当なんです。この写真に写っている人全員が人工知能によって生成されたものなんです。

そして、この一人一人の顔の品質を見てください。どうやら、あの著作権の問題についてはかなり変更があったようで、もう彼らは気にしていないようです。では、何が起こっているのか理解していきましょう。一緒に見ていきましょう。

さあ、皆さん。いつもいいねを押してくれた皆さん、チャンネル登録してくれた皆さんに感謝しています。このAIチャンネルをスポンサーしてくれているチャンネルメンバーの皆さんに特別な感謝を送ります。メンバーの方々は、WhatsApp統合、MCP、PDF読み取り、スプレッドシート読み取りなど、私たちが好きなすべての機能の作り方を教えるインテリジェントエージェントの限定動画にアクセスでき、また動画を先行視聴することもできます。

そして、もしあなたの会社にAIを導入したいとお考えなら、Maximiza AIの人たちと話してください。彼らはあなたのカスタマーサービスアシスタントのプロジェクトを作ったり、もううんざりしているあの大量の法律文書を読むためのプロジェクトを作ったりできます。だから、Maximizaの人たちと話せば、あなたのための解決策を見つけてくれます。リンクは説明欄にあります。

新モデルの発見と特徴

そして皆さん、今日のニュースはこれです。Mar MadukがTwitterに投稿したこの投稿を見てください。ご覧ください、OpenAIの新しい画像モデルがついに発見される可能性があります。おそらくこれらはGPTの次の画像モデルからのものです。そうなんです皆さん、これがOpenAIがやることと非常に似ている理由をお見せしますね。

彼らは今まさにDesign ArenaとLM Arenaでテストされています。これらはAIの対決プラットフォームです。それらがどのように機能するかすぐにお見せします。おそらくGPT-5.2と一緒に今週か来週リリースされるでしょう、もし私が正しければ。そして私は言いますが、皆さん、彼らがLM Arenaでテストを始めるときは、リリースの準備ができているということです。

もしかしたら今日かもしれません。なぜなら、皆さんは朝早くこれを見ていて、もしかしたら今日の午後2時頃にはリリースがあるかもしれません。火曜日と木曜日がリリース日で、今日は木曜日だからです。だから、このことが起こりそうだということに注目しておいてください。もし今出なくても、来週出ます。

そして彼らはここでコメントしています。主な観察点として、Gemini Imagen 3 Proに似た世界的な知識があり、これは現在地球上で最高の画像生成ツールです。Imagen 1だと言っても無駄です、違うんですから。そして実際、Mid Journeyについていくつか詳細をお見せして、この画像生成というものが何なのかをよりよく理解してもらいます。

彼はここでコメントしています。品質がGemini Imagen 3 Proに非常に似たセレブリティのセルフィーを生成できます。そしてコードと画像を非常にうまく書くことができます。ここのモデルの名前は、ChestnutとHazelnutと呼ばれています。これは翻訳ですね。でも英語ではchestnutとhazelnutとして表示されます。それが私たちがそこで見る名前です。すぐにお見せします。

そして彼はここにいくつかの画像を投稿しました。この生成された画像を見てください。ここにいる有名人たちがこのたくさんの著名人とセルフィーを撮っています。私は全員を知っているわけではありませんが、The Rock、Friendsの女性、Minecraftなど、皆さんが私と同じくらいよく知っているであろうこの人たち全員がセルフィーを撮っています。Billie Eilishもいます。

当初、企業は著作権の問題をとても気にしていました。しかし実際、今日私が理解していることは、もし私が間違っていたら訂正してください、もう長い間、有名人や著作権のあるものの画像生成で問題を抱えていません。もし私が正しければ、基本的に起こっているのは、画像の生成そのものは著作権の問題ではなく、その画像を製品や何かに使用することが問題なのです。まるで自宅でシンプソンズの絵を描くようなものです。それ自体は何も侵害していませんが、権利のあるもので製品を作ると、それが問題になります。

だから今日では、彼らはもう何も恐れていないと思います。彼はテキストを入れました、OpenAI nによって作成されたものです。ここにたくさんのことが書かれていて、とてもきれいに、まるで黒板のようで、テキスト生成をしていることを示しています。そしてこのもう一つの画像では、ここにコードの一部を置いています。それはJSONとジョイスティックで、ジョイスティックを生成していることと、そこにコードを生成していることを示しています。

そして、もしImagen 1を使用した場合、同じプロンプトがどうなるかの投稿をしています。これが古いバージョンです。だから、もし皆さんが気づけば、この古いバージョンもいいですが、AIで作られたもののような見た目をしていて、私たちはもう少し慣れてきていますよね。今日、私はこのような写真を見ると、すでにそれが人工知能で作られたものだと思います。

そして彼はここで2番目の生成をして、同じことです。だから、皆さん、何が起こっているか理解するために、例えば、LM Arenaに入って、バトルを見て、画像を選択する必要があります。でも詳細があります皆さん、ここは運次第なんです。プロンプトを送信して、ブラインドテストで私たちが見たいモデルの1つを選んでくれることを願うしかありません。

だから、ここで遊んで当たりを引くまでにはある程度時間がかかります。例えば、私はカンガセイロの帽子をかぶってアコーディオンを弾くジャガーと、カイピーラギターを弾くワニとの音楽決闘というプロンプトを投げました。このプロンプトは何度もお見せしていますよね。ジャガーがアコーディオンを弾いています。カンガセイロの帽子をかぶっています。

プロンプト精度の検証テスト

そしてここに重要な詳細があります。この帽子はカンガセイロの帽子ではないのが見えますか。これが、Gemini Imagen 3なのかChatGPTなのかを見分ける方法です。以前はChatGPTだけがカンガセイロの帽子を作っていました。それからGemini Imagen 3 Proがリリースされたとき、彼らもカンガセイロの帽子を作り始めました。

だから、これを見ると、これはProバージョンではないGemini Imagen 3だと推測します。そしてこちらはワニさえ作れなくて、私が書いたプロンプトへの適合性もありません。これはどこかの未知のモデルだとわかります。そういうことです。じゃあ私は何をするか。左側の方が良いか、引き分けか、両方とも悪いか、右側の方が良いか投票する必要があります。

左側の方が良いと入れます。すると、これを生成したモデルが何かを明らかにします。私はこれがGemini Imagen 3の何かだと想像しています。ほら、見てください。もう表示されましたね。Gemini 2.5 Flashです。これは古いGemini Imagen 3で、Proではありません。Proだとカンガセイロの帽子を作るからです。そしてこちらはRecraft V3です。

わかりますか皆さん。もう私はこの仕組みに詳しくなっています。画像を見ただけで、裏で何が起こっているかだいたいわかります。もし私がこれと全く同じプロンプトをMid Journeyで実行したら、ほら、ここに同じプロンプトがあります。帽子をかぶったジャガー、全く同じプロンプトです。

Mid Journeyはプロンプトへの適合性がありません。ここで作った楽器を見てください。アコーディオンでもカイピーラギターでもありません。そしてジャガーは美しく、素晴らしいです。なんて美しいジャガー、なんて美しいワニでしょう。でもプロンプトへの適合性は最悪です。だから、画像の品質について話すとき、私は皆さんに言います。例えばMid Journeyは素晴らしい画像を作りますが、プロンプトへの適合性という点では最良のシナリオではありません。

でもLM Arenaに戻ると、面白いですよ。私はジャガーの生成を始めました。だから、ここにGeminiのGemini Imagen 3があり、ここにOne 2.5が生成をしています。このOneについて私が気に入ったことの1つは、人間の腕があることです。人間の腕を持つワニです。これはいい感じです。

そしてここに、見えますよね、小さなカンガセイロの帽子がここにきちんとあります。そして私が言ったことを見てください、GPTプラス1です。だから、カンガセイロの帽子がきちんとここに現れるたびに、アコーディオンを持つジャガー、ギターを弾くワニ、これはChatGPTかGemini Imagen 3だとわかります。でも私はあまり運が良くなくて、ここでエラーが出ていました。

それで何をしたか。Design Arenaに行きました。そしてここは少し違います。4つの生成を行い、左と右のどちらが好きか聞き始めます。そして投票して、投票して、投票して、投票して、最後に結果を教えてくれます。例えば、この結果では、1位は画像4になりましたが、これは画像4で、古いバージョンです。

この画像で私が気に入らなかったのは、このワニが少しプラスチックのように見えることでしたが、画像は美しく、画像は良いです。帽子は、見てわかるように、カンガセイロの帽子ではありません。ここの2位では、あのカンガセイロの小さな帽子が見えますね。ジャガーが見え、ワニが見え、アコーディオン、ギター、すべてがここに正しくあります。GPT Imageです。

そして突然ここに、Hazelnutがあります。これは人々がChatGPTになる可能性が高いと言っている新バージョンです皆さん。もし皆さんが気づけば、私たちはすでにここでカンガセイロの小さな帽子をあの形で、あるべき特徴とともに検出できています。アコーディオンを弾くジャガーがいて、焚き火のそばの夕日でギターを弾くワニがいます。

例えばここで私が良くないと思ったのは、プロンプトでは決闘だと言っていて、お互いに勝とうとして決闘していると。でもここは、彼らがLegião Urbanaの「Pais e Filhos」を演奏しているシーンのように見えます。だからここは決闘というよりも友達のように見えます。そしてこれはおそらく、もしかしたらそうではないかもしれない、そうかもしれない、わからないという点かもしれません。

でも小さな帽子はそこにあり、ジャガーはアコーディオンを弾いていて、ワニはギターを弾いています。この部分は良いですよね。これがカイピーラギターではなく、これはギターだということは別として。でもテストに行ったり来たりして、私はいくつかの顔を生成したくて、Geminiにいくつかの有名人を含むプロンプトを生成してもらうよう頼みました。

それでペレを選び、アイルトン・セナを選び、カルメン・ミランダを選び、フェルナンダ・モンテネグロ、マシャード・ジ・アシス、ジルベルト・ジルも選びました。そして私はこのプロンプトをここに投げて何が起こるか見ました。それで何が起こったか。最初の画像、1位になったのは、この生成をしました。ペレ、アイルトン・セナ、ここにカルメン・ミランダ、おそらくマシャード・ジ・アシスです。

そしてここは、これがジルベルト・ジルかどうか私にはわかりません。外見ではジルベルト・ジルには見えないからです。でも私が言えるのは、私が認識できなかった唯一の人物はこのケースだけだということです。でもペレは現れ、アイルトン・セナは現れ、カルメン・ミランダは確かに、そしてここに推定マシャード・ジ・アシスがいます。

そして写真は、実際にはあのセルフィー写真のようなモンタージュではありません。皆がセルフィーに写っているような。これはいくつかの画像が混ざったようなものです。だから、これはChatGPTかどうか確信が持てないもう一つの兆候です。一方では正しいけれど、もしかしたらしないようなことをしているからです。

もしここのGPT Image 1のバージョン、古いバージョンを見ると、アイルトン・セナを見てください、ペレを見てください、ここのカルメン・ミランダを見てください。これはずっと良くなりましたね。本当に同じ写真に写っているように見えますよね。複数の画像が重ね合わされたコラージュのようには見えませんよね。皆さんはどう思いましたか。

唯一うまくいかなかったのは、横向きの画像であるべきだったのに四角くなってしまったことです。だからペレの顔が切れてしまい、ここにいるべきだったフェルナンダ・モンテネグロ、ジルベルト・ジル、マシャード・ジ・アシスが外れてしまいました。でも重要なのは、ChatGPTでは人々が人々のように見えるということ、そして適当な外国のサイト、例えばこの中国の画像生成ツールなどを使うと、誰も誰にも似ていないということです、わかりますか皆さん。

だから、あの画像を見て「うわー、好きじゃない、画像が悪いと思った」と言うとき。でもこの誰も誰にも似ていない顔を見てください。すべてが完全に入れ替わっていて、何も関係ありません。このFluxのバージョンを見てください。ここには宇宙人までいますね。AshtarとPower Rangersのような人たちです。何も関係ありません。プロンプトへの適合性が何かを理解してもらうために。

あなたが書くとき、それがあなたの画像に現れてほしいのに、この画像は今まで見た中でずっと良い品質だとわかります。でもプロンプトへの適合性はどこにありますか皆さん。私たちが見たかったものはどこにありますか。

ブラジルの風景を使った精度テスト

さて、プロンプトへの適合性という点で、私はAIを挑発してブラジルの風景を作らせるのが好きなんです。彼らがブラジルを知っているかどうか、そして生成をお願いするとき、それがブラジルの何かであると理解できるかどうかを知るためです。

例えば、ここのChatGPTのImagen 1、古いモデルでは、ペロウリーニョのミックスの画像を作るよう頼みました。ここの石畳の通りの色とりどりの家を見てください、バイーアのペロウリーニョ、クリチバの目の博物館と、これはまさにこのようになっています、ブラジリアの大聖堂と、これはまさにこれです、リオデジャネイロのコルコバードのキリスト像と。

だから、わかりましたよね。私は4つのことを頼んで、4つすべてが現れました。ペロウリーニョ、目の博物館、ブラジリアの大聖堂、リオデジャネイロのコルコバードのキリスト像。これはGPT1ですよ皆さん。他のモデルに行くと、ここに何が現れるか見てください。目の博物館が何になったか見てください。ここの宇宙人博物館になりましたね。ここに目があります。

こんなものは存在しません、こうではありません。参照はあります、目の博物館の前にある湖です。目の博物館を思い出しますが、これではありません、ですよね皆さん。これは冗談です。でもここのImagen 4では、ペロウリーニョがここにあり、ブラジリアの大聖堂がそこにあり、コルコバードのキリスト像がそこにあります。だから、参照は大体正しいですが、プロンプトへの適合性は弱いです。

Fluxも同じことです。目の博物館が奇妙なものになり、キリスト像があり、ペロウリーニョがありますが、大聖堂がなく、目の博物館が幻覚になりました。Dalleは言うまでもありませんね。古いバージョンで、このようなものです。

でも私はLM Arenaに戻ってこのプロンプトをテストしました。そしてHazelnutでのこの興味深い生成を見てください。これがまさに彼らが話しているモデルです。この画像生成を見てください皆さん。コルコバードのキリスト像が完璧にそこの上にあり、ここに目の博物館があり、ここの水の反射さえ見せています。実際には水鏡が湖になりました。

目の博物館に入るために上って下りる歩道が完璧です。大聖堂が完璧にここにあります、このように配置されていて、まるで現実のシーンのようで、これが本当に存在するかのようです。ペロウリーニョがあり、つまり、4つの要素すべてが存在します。ペロウリーニョ、大聖堂、目の博物館、コルコバードのキリスト像。すべての画像に触発された組み合わせを本当に生成した画像で、コントロールC、コントロールVではありません。

だから皆さん、この生成ツールについてどう思いましたか。本当にOpenAIの新しいモデルなんでしょうか。なぜなら、ここでGeminiの同じプロンプトでの生成は、皆さん、Geminiが何をしたか見てください。基本的に同じ画像ですね。ここは少し奇妙になりました。ここに突然建物があって、ここに大聖堂が現れるようにカットされています。

ここに目の博物館がありますが、あのきれいな小道はありません。ペロウリーニョがあり、コルコバードのキリスト像が後ろにあります。皆さんはどう思いましたか。この戦いで誰が勝ちましたか。Geminiの生成かChatGPTの生成か。これをここで直接生成したことを覚えておいてください。私は自分のGeminiに入れて、推論を有効にして画像を生成しました。Gemini Imagen 3 Proが保証されています。

まとめと視聴者への呼びかけ

さて皆さん、生成してこれらのモデルで当選するのには時間がかかるので、自宅でテストをすることをお勧めします。そして何が起こったか教えてください。このバージョンのChatGPTとこのバージョンのGemini、どちらが勝ったと思うか下にコメントしてください。私は皆さんが何を考えているか知りたいです。

この戦いは良いものになりそうで、年末にかけて盛り上がりそうですね。皆さんはどう思いますか。下にコメントして教えてください。私は知りたいです。そして、このようなビデオを見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーはインテリジェントエージェントの限定動画と先行動画にアクセスできます。それでは、いいねを押してください。ありがとうございました。