業界がGemini 2.5 Flash Image(Nano Banana)に強く反応

Google・DeepMind・Alphabet
この記事は約10分で読めます。

GoogleのNano Banana(Gemini 2.5 Flash Image)がリリースされ、業界に大きな衝撃を与えている。このモデルはAR体験の生成、建物の3D化、写真復元、スタイル転送、色彩強化など幅広い画像編集機能を単一のプロンプトで実現する。特に3Dアイソメトリック変換や一貫性のあるカットシーン生成において優れた性能を発揮し、クリエイターからはPhotoshopキラーとの評価を受けている。一方でフォント処理や顔の置換には課題があり、イーロン・マスクはGrokの優位性を主張するなど、AI画像生成分野での競争が激化している。

The Industry Reacts to Gemini 2.5 Flash Image (Nano Banana)
Check out the Zapier vs n8n comparison today: Humanities Last Prompt Engineering Guide (free) 👇🏼

Nano Bananaリリースで業界が騒然

Nano Bananaが出たばっかりで、業界がめちゃくちゃ反応しとるわ。これの使い方のええ例もぎょうさんあるし、これがPhotoshopキラーやて言うとる人らもおるんや。今から全部見せたるから、しっかり見とってな。

まずはBillow Siduからや。Nano BananaにはGeminiの世界知識が入っとるから、現実世界のスクリーンショットをアップロードして、そこにあるもんに注釈つけてもらうことができるんや。

ほんでプロンプトはこんな感じや。「あんたは位置ベースのAR体験生成器や。この画像の興味深いポイントをハイライトして、関連する情報を注釈として付けてくれ。」

ここにサンフランシスコの写真があるやろ。ここがTransameピラミッドや。見て分かる通りにハイライトしてくれとるわ。めちゃくちゃきれいやろ。そんで画像の上に、ちゃんとしたツールチップみたいなんを置いて、情報くれとるんや。フロア数とか高さとか。

「詳細情報」て書いてあるけど、当然これは画像やからクリックはできへんねんけどな。

サンフランシスコの名所を的確に認識

ここサンフランシスコフェリービルディングの例もあるわ。かなりええ感じにハイライトしとるやろ。ちょっとここは見落としとるけど、それでもなかなかええわ。サンフランシスコて書いてあるけど、ちょっとスペル間違えとるな。建築年とか開業年とかも出しとる。

ここはPalace of Fine Artsやで。「Palace B. Fine Arts」て呼んどるな。近いけど、正確やないわ。でもちゃんとハイライトしとる。めちゃくちゃかっこええやろ。

さらにな、建物を抽出して3Dアイソメトリックオブジェクトにするんがめちゃくちゃ得意なんや。このプロンプト見てみ。「画像を昼間にして、寺院だけをアイソメトリックにしろ。」

3Dアイソメトリック変換の驚異的性能

これが元の画像や。そんでこれが3Dアイソメトリックアセットになったやつや。誰かがこの写真でもやっとるわ。見て分かる通り、この建物は街灯やら木やら茂みやらで遮られとるやろ。でもほら、何も遮るもんのない3Dアイソメトリック表現になっとるわ。素晴らしいやろ。

そんで誰かが「めちゃくちゃかっこええローラーコースター追加してくれ」て言うたら、ほらこの通りや。これでめちゃくちゃ楽しめるわな。

そんでFocietyが「これをHunan 3Dと組み合わせてみ」て言うて。これが元の画像で、今度は実際に3Dで回転できるんや。めちゃくちゃすごいやろ。ゲーム開発者らは、これからAIのおかげで基本的に無限のアセット使えるようになるんやで。

アニメキャラクターの合成と写真復元

ここにもう一つすごい例があるわ。2体のアニメキャラクターと手描きの棒人間のアクションシーンがあって、Nano Banana Gemini 2.5 Flash imageが、むしろNano Bananaて言うべきかな、これを全部まとめてめちゃくちゃかっこよくて正確なシーンにしてくれるんや。2体のキャラクターがちゃんと登場しとる。

写真復元もめちゃくちゃ得意やで。これが史上初の写真らしいわ。見て分かる通り、完全に復元されとるやろ。こんな荒い、めちゃくちゃ荒い、低画素の白黒画像から。シーンを再現してくれとるんや。まあ確かに、建物がどんな感じかは相当自由に解釈しとるけど、それでもめちゃくちゃかっこええわ。

プロンプトエンジニアリングとクリエイター活用

もちろん、Ply the Liberatorがジェイルブレイクしとるわ。GoogleのGemini 2.5 flash image previewが解放されたて。プロンプトはここにあるで。プロンプトが欲しかったら、Ply本人から直接もらいに行けばええ。画像は見せへんけど、露骨な内容でGoogleの利用規約に違反するからな。

DDからのNano Bananaが今日Googleからドロップされたんや。写真から物体を取り出して、さっき見せたみたいに3Dモデル作れるんや。もう一回見てみようか。ここに3Dオブジェクトがもう作られたシーンがあるけど、これを抽出して単体にして、別のモデルに読み込める。そこから3Dオブジェクトが手に入るんや。クリエイターの夢やろこれ。

Bilawiduも、別のAIコンテンツクリエイターやけど、これ見てめちゃくちゃ気に入っとるわ。基本的にComfy UIの全ワークフローとPhotoshopを全部まとめて単一プロンプトに落とし込んだもんやて比較しとる。

APIとしての画像編集機能

画像エディターのAPIに最も近いもんやで。コントロールネットもLoRAもIPアダプターも要らん。グラフィックデザイナーの頭脳と、世界知識を持った熟練コンポジターが手に入るんや。ここで見れる通り、自分の写真を撮って自分を画像に入れとるわけや。

3Dメッシュ表現も取得できるで。ここで見とる通りや。これが元の写真で、これが上に重ねた3Dメッシュや。

Nano Bananaで最初の画像を生成して、それをV3使って動画にすることもできるんや。ほらいくで。

朝はGruns Cubsなしでは始まらへんねん。スーパーフードと緑の野菜とビタミンが全部入った美味しいグミやねん。緑の野菜がこんなに美味いとは知らんかったわ。この小さなグミにはスーパーフードとビタミンがぎっしり詰まっとるんや。

正直言うて、キャンディーみたいな味やで。毎日の栄養摂取は複雑である必要ないんや。Greens Cubsならスーパーフードと緑の野菜と必須ビタミンが一つの簡単なグミに入っとる。健康的な習慣はこんなに簡単でええんや。

印象的な性能向上の可能性

驚異的やわ。ほんまに、めちゃくちゃ印象的や。そして忘れたらあかんのは、これが今後最悪の状態やということや。

もしこういった異なるツールを繋げて自動化するんが好きやったら、今日の動画のスポンサーであるZapierをチェックしてみてな。ZapierはそこにあるベストなAIオーケストレーションプラットフォームやで。なんで私が個人的にN8NよりもZapierを選んだか教えたるわ。

まず、Zapierはマーケティングから営業、サポート、HR、財務まで、どんなチーム、技術的であろうとなかろうと、みんなに力を与えてくれるんや。一方で競合他社は、全部セットアップするのに技術的専門知識が必要やねん。

Zapierのエージェントとワークフローは数分でデプロイできるけど、場合によっては数週間かかることもある。そしてZapierは圧倒的に最多の統合機能を持っとる。8,000以上や。比較すると1,000だけや。

さらに、Zapierの使いやすさについて言うと、完全にホスティングしてくれるんや。だから超簡単に始められる。サーバーも、パッチングも、スケーリングも、停止もない。だから私は自分でホストしたくなかったし、全部自分で管理したくもなかった。それは私が本当に集中したいこと、素晴らしいAIコンテンツの作成から時間を奪うだけやからな。

Zapierの企業対応機能

そしてZapierはもちろん、SOC 2コンプライアンス、SSO、監査ログ、ロールベースアクセスで企業対応済みや。これも、もし自分でホスティングするんやったら全部自分でやらなあかん。

さらに価格設定は予測可能で一貫しとるし、自分でホスティングする解決策みたいにインフラコストについて考える必要もない。私は何年もZapierを使っとるし、めちゃくちゃ満足しとる。この動画で私とパートナーシップ組んでくれて興奮しとるわ。ぜひチェックしてみて、私が紹介したって言うてな。リンクは下にあるで。

さて、動画に戻ろうか。

衣装試着とスタイル転送機能

Lionus Ekinstamも、別の仲間のコンテンツクリエイターやけど、衣装の試着に使っとるんや。このモデルでめちゃくちゃ人気の使用例らしいで。これ見てみ。これが元の写真や。これが着たいファージャケットや。そんでこれが彼が着とるやつや。完璧に見えるやろ。AIで生成されたコートやて知らんかったら、あるいは下の小さなウォーターマーク見えへんかったら、絶対に分からんわ。

スタイル転送もめちゃくちゃええみたいやで。私がテストしとった時はちょっとだけ運が良かったけど、これ見てみ。有名なムハンマド・アリのノックアウト写真があるやろ。これをシンプソンズスタイルに転送したらどうなるか。ほらこの通りや。頭がちょっと変やな。頭が少し左に傾いとるのが分かる。

でも全体的にはめちゃくちゃええわ。背景にホーマーがおって、クラスティ・ザ・クラウンもおって、ここにマージもおる。そんで他のみんなもええ感じに見えるわ。

色彩強化とモデルの得意不得意

色彩強化も得意やで。TwitterのCallによると、元の写真がこれや。この写真は退屈で平坦やから強化してくれ。コントラスト上げて。色彩をブーストして。もっとリッチにしてくれ。ほらこの通りや。

めちゃくちゃ簡単やろ。同じCallが、Nano Bananaが特に得意なことと、ちょっと苦手なことのリストもまとめてくれとるわ。

得意なこと:スタイル転送、オブジェクト参照、軽微から重大な修正、色変更、色追加、コントラストや明度みたいな基本的なPhotoshop強化、シーンの再照明、表情変更、テキスト削除、キャラクター位置調整。

苦手なこと:フォントに苦戦する。

フォント処理と制限事項

まあ私はそうは思わへん。実際かなりフォントは上手やと思うで。画像を滑らかにしすぎる。詳細を追加できへん。透明度は作り話や。できへん。リフォーカスできへん。被写界深度を除去できへん。ウォーターマークを追加する。霧を除去できへん。リアルに見えるSFの背景に苦戦する。人種、民族、性別について言及したら拒否を吐き出してくる。

私が気付いた一つのことは、顔の置換で一貫して失敗することや。例えば私の顔をモナリザに置きたい時、明らかに私の顔を切り取ってそこに置くだけじゃいややんか。二つのスタイルを融合させて、リアルに見えるようにしてほしいねん。それができへんのや。試そうともせへん。めちゃくちゃ奇妙なことや。

元の画像をそのまま吐き出すだけで、それ以上何もせえへん。

アニメ制作とカット間の一貫性

ここにNano Bananaと他のツールでできることの別の例があるわ。Nano BananaプラスSeed Dance 1.0や。Nano BananaとCedance 1.0で狂ったAIアニメを作る。2時間未満でできるで。

Nano Bananaが他のツールと組み合わさって活躍するのは、ここで見とるようなジャンプカットができることや。ここにショットがあって、カット、別のカット、また別のカット。そのカット間の一貫性がNano Bananaが得意とするところなんや。

元からフレームを取って、「よし、このキャラクターにして、でも別のことをさせたり、自転車に乗らせたり、何でも好きなことをさせて」て言って、そんでSeed Danceを使って継続してアニメーションするんや。

彼のガイドを直接フォローしたかったら、下にリンク落としとくで。

カメラアングル変更とGrokとの比較

カメラ視点を変えるんもめちゃくちゃ得意やで。これ見てみ。ここにええ絵があるやろ。これが入力画像で、これが出力画像や。まったく違う角度やけど、スタイルはめちゃくちゃ一貫しとるわ。

最後に、もちろんイーロン・マスクが「Grokの方がええで」て言わなあかんかったんや。

Techdev Notesが「Nano Banana対Grok Imagine」て言うとる。これがNano Bananaや。エッフェル塔の前の2匹の猫。そんでこれがGrok Imagine。正直言うて、どっちも基本的に同じやわ。品質の違いが全然分からん。

もちろん、イーロンはこの場合Imagineの方がええ出来やて言うとる。彼が何を指して「ええ」て言うとるのか理解できへん。

どっちも同じ品質に見えるわ。彼が言うには、今後出るImagineのバージョンは劇的にええものになるらしいで。

イーロン・マスクは大げさなことで有名やけど、それでも何が来るかもしれへんかを考えるとワクワクするわ。

というわけや。業界の素早い反応と素晴らしい例をいくつか見せたかったんや。この動画を楽しんでくれたら、ぜひいいねして登録もよろしく頼むわ。

コメント

タイトルとURLをコピーしました