Gemini 3.1 Flash画像モデル、通称Nano Banana 2がリリースされた。このモデルは、前世代のFlash 2.5よりも高品質でありながら、Nano Banana Proに近い性能を持ちつつ、より小型で高速かつ低コストを実現している。特筆すべき点は、極めて精度の高いテキストレンダリング能力と正確な指示追従性である。複数言語への翻訳、最大14枚までの参照画像サポート、キャラクター一貫性の向上など、実用的な機能が大幅に強化されている。価格面ではNano Banana Proより安価でありながら、旧Flash 2.5よりは高額という位置づけで、大規模運用を検討していたユーザーにとって魅力的な選択肢となっている。

Nano Banana 2の登場
さて、Nano Banana 2がリリースされました。これは、より小型で、より高速で、より低コストでありながら、Nano Banana Proとほぼ同等の品質を持つというストーリーです。早速見ていきましょう。
実際にリリースされたのはGemini 3.1 Flash画像モデルです。Nano Banana 2と呼ばれている理由は、最初に登場したモデルが実はGemini 2.5 Flash画像モデルだったからなんですね。そして、もちろん11月に登場したNano Banana ProはGemini 3 Pro画像モデルでした。基本的にここでのストーリーは、Flash 2.5で得られたものよりも高品質な画像モデルが手に入るということです。そして多くの場合、Nano Banana Proモデルとほぼ同等の品質になります。
主要機能の概要
それでは、このモデルができることのいくつかの重要な点を簡単に見ていきましょう。まず第一に、画像に対する推論を行うモデルがあります。これはNano Banana Proとまったく同じです。ここでは、ストライキ中、今日はネズミを捕まえないという看板を持った猫の画像を作成するように依頼しました。このモデルの特徴の一つは、テキスト処理が非常に優れているということです。
見てください、テキストはすべて問題なく表示されています。そして、マヨネーズを追加するように依頼すると、それも問題なく処理されます。これらは、彼らが注力してきた2つの主な機能です。つまり、正確な指示追従と正確なテキストレンダリングおよび翻訳という考え方です。
そこからわかるように、他の2匹の猫にも看板を持たせるように依頼できます。ここでもすべてのテキストが正しく表示されています。そして、おもちゃのネズミがいるのが見えます。そのネズミを本物にして、猫たちを支持しますという看板を持たせるように依頼すると、確かに今度は本物のネズミが、猫たちを支持しますという看板を持っています。
翻訳機能の実力
これは全体的に非常に高品質な画像であることがわかります。翻訳機能などを活用して、すべての看板をイタリア語に翻訳するように依頼できます。そしてそこから、すべての看板をタイ語に翻訳するように依頼することもできます。特定の言語には多くの異なるフォントがあり、他の言語よりも使用した元のフォントに合わせて調整されるようです。
このケースでは、初期の英語版にあったような手書き風の要素は確かに失われています。とはいえ、私はそのようなプロンプトを一切使っていないので、これをどう受け取るかはお任せします。Nano Banana Proと比較すると、本当に良い結果が出る場合もあれば、それほど良くない場合もあります。
Nano Banana Proとの比較
これは元のNano Banana Proの動画で紹介したものの一つです。後ろにティラノサウルスが走っている原始人との、何気ない偶然の自撮り写真を依頼しました。確かにそれらしく見えますね。上からの視点を依頼すると、確かに上からの視点が得られます。次に何が起こるかを尋ねると、論理的にこれを推測できます。
ここでNano Banana 2にまったく同じプロンプトを使用すると、確かに同じような考え方が多く見られますが、作成される画像はおそらくそれほど良くありません。実際にカメラが彼の手に見えるなら、これは自撮りの視点からではありませんよね。そして上からの画像を依頼すると、なるほど、アイデアは理解しているようですが、今度はティラノサウルスが彼のすぐ隣にいます。
そして、起こりうる結果の写真を作成するように依頼すると、ここでは大丈夫そうです。確かにはるかに軌道に乗っています。さて、この2つの画像の見た目は非常に異なります。そして私は環境の説明などは一切使っていません。ですから、最良の結果を得たい場合は、そういったものを使用することを確実にしたいですね。
技術仕様と新機能
さて、他に何が本当に優れているのでしょうか。Proモデルと同様に、完全なアスペクト比のサポートがあります。解像度は512ピクセルまで下げることができます。2つの思考レベルがあります。しかし、他にも持っているのは、ツールにアクセスする機能です。
Nano Banana Proが持っているGoogle検索によるグラウンディングツールがあります。そして、実はNano Banana Proにはないツールがあります。それが画像検索です。画像検索を実行するように条件付けして、それを実際のグラウンディングと制御に使用できます。このモデルが本当に優れているもう一つの機能は、キャラクターの一貫性が大幅に向上したことです。
キャラクター一貫性と複数参照画像
ここでは3つの入力画像があり、これらの特定のキャラクターに基づいて複数の画像やストーリーを生成できるのがわかります。これをさらに発展させて、実際に生成のために最大14枚の異なる参照画像を提供できるようになりました。ここでは農場があります。
農場のためのこれらすべての異なるキャラクターと、トラック、トラクター、そして実際の納屋があります。そしてこれらすべての参照入力を取り込んで、この生成に使用できるのです。ですから、製品に関することをしたい場合、これは大きな勝利です。同じ製品ラインに複数の製品の参照があり、それらすべてを画像に含めたい場合、Nano Banana 2では実際にそれをネイティブに行うことができます。
価格設定と展開
さて、モデル自体は旧バージョンほど安くはありませんが、確実にNano Banana Proほど高価ではありません。そして、さまざまなGoogleアプリで展開される予定です。Geminiアプリのようなものから、もちろんアンチグラビティAIスタジオのようなものまで、そして明らかにGoogle CloudのVertex AIなどで完全なサポートがあります。
本番環境でNano Banana Proの使用を検討していたけれど、大規模に使用するには高すぎたという場合、これは確実に勝利です。また、実際に使ってみて感じている大きな特徴は、テキストレンダリングがいかに優れているかということです。これらすべての異なる生成スタイルを得ることができます。
今後の展望
明らかに、このリリースによって、Gemini 3.1 Flashモデルを待っている人たちにとっても良い兆候となるはずです。でも、それはまた別の日に話せる話題だと思います。とにかく、モデルを試してみてください。コメントで、このモデルについてどう思うか、どこで強みを感じているか、Nano Banana Proモデルほど使いやすくないと感じている点はどこか、教えてください。
それでは、いつものように、次の動画でお話ししましょう。


コメント