この動画は、GoogleのNano Bananaという革新的なAI画像編集・生成モデルについて詳しく解説している。既存の画像に対する編集能力が従来のモデルを大幅に上回り、物体の追加、人物の合成、写真の修復・カラー化、3Dメッシュ生成など多様な機能を高品質で実現する。LM Arenaでテストが可能で、GPTやFluxなどの競合モデルとの比較においても圧倒的な優位性を示している。

Nano Bananaの衝撃的な登場
Nano Bananaって何や?この2つの単語を一緒に聞いたことないっちゅうんやったら、たぶんAIの動向についていけてないで。なんでかって言うたら、もうどこでも話題になってるからや。これはめちゃくちゃ凄い新しいテキスト画像生成モデルで、今まで見た画像モデルのどれよりも良さそうやねん。今までにない画像編集をやってくれるんや。今のところ分かってることを教えたるし、それからようけ例を見せたるで。みんながLM ArenaでNano Bananaっちゅうコードネームで見つけたからな。
まず最初にChris Chat GPT21から。Nano Bananaがマジで俺の頭をぶっ飛ばしとるわ。まず、この元画像がある。これがベース画像や。ショッピングカートがあって、TargetかFuture Shopとかの通路を歩いてるみたいに見える。それでカートの中にドッグフードの袋が2つ入ってる。
プロンプトは「カートにドッグフードの袋をもう1つ、他の2つと同じやつを追加して」や。そしたらほら、これや。見てみ。全部のディテール、文字もほぼ完璧や。袋の上の犬の部分でちょっと変なとこあるけど、それ以外は現象的に見える。他の全部も一貫して、同じままや。これがNano Bananaでみんながめちゃくちゃぶっ飛んでる理由や。既存の画像を取って、プロンプトに基づいて変更するのがめっちゃ上手やねん。
驚異的な人物合成と3D理解
もう一つ例を見せたろ。ここに若いマイケル・ジャクソンの写真がある。それからビリー・アイリッシュ。で、今度は2人一緒にセルフィーを撮ってる。これがめちゃくちゃ信じられへんほど良く見えると思うねん。マイケル・ジャクソンも本物に見える。ビリー・アイリッシュも本物に見える。ぼかしの入った携帯も本当に良く見える。この画像の全部がめちゃくちゃ良く見える。
もしAIに詳しくない人にこれ見せたら、たぶん本物やと思うやろな。それに2D画像の中で3D空間をめっちゃよく理解してるねん。これ見てみ。トム・ホランドが背景の絵の前を歩いてる写真がある。で、誰かがNano Bananaに彼の上に3Dメッシュをかけてくれって頼んだ。これ見てみ。ドーン。これや。
マジで完璧や。どんだけ良く見えるか見てみ。実際に彼から光が出てるみたいに見える。見えるかどうか分からんけど、3Dメッシュがめっちゃ良く見える。ポケット全部が正しくメッシュされてる。ここの肘の折り目の小さいしわも正しくメッシュされてる。手も本当に細かい3Dメッシュができてる。
やからNano Bananaは写真で何を見てるかを本当によく理解してるみたいやねん。写真の修復とカラー化もめっちゃ上手にできる。これ見てみ。元の写真がこれや。めっちゃぼやけてる。写真にようけ損傷がある。ここに折り目の跡が見える。ディテールが欠けてるのも見える。
写真修復とカラー化の威力
それで、これが完全にカラー化された修正版や。これは人々にとって本当に大きな可能性があるで。ここに並べて比較したやつがある。やから損傷をようけ綺麗にして、全部正確に見える色を追加したのがよく分かる。全体的に、これはめっちゃクールやと思う。もう一つ例がある。
元のやつと完全にカラー化されたやつや。後ろにちょっとぼやけてるとこ見えるけど、もう写真についてようけのこと推測してるし、めっちゃ良く見える。もう一つ例や。ソファに座った赤ちゃん。これはめっちゃめっちゃ古い写真に見える。で、これが綺麗にされて、カラー化されたバージョンや。
古い写真の小さい損傷が全部除去されて綺麗になってるのが見える。驚くことに、壁にも損傷があるように見えるけど、これは写真の損傷と混同された可能性もあるけど、違う、実際に壁の損傷はそのまま残してる。もう一つ例や。この写真は露出オーバーか日焼けしたみたいに見える。分からんけど。
長時間後のポラロイド写真で起こるみたいなことやな。で、完全に綺麗になった。もう一つや。これが一番印象的かもしれん。写真がここにある。ディテールがようけ失われてる。実際の写真にようけ損傷があって、それから完全に綺麗になった。これはめっちゃ印象的や。
モデルの正体と利用方法
さて、みんなはこのモデルをどう使ってるし、このモデルは誰が作ったんや?みんながLM Arenaで見つけ始めたんや。
テキスト画像のセクションに行って、バトルモードを使い始めたら、自分でも見つけられるかもしれん。それでこのモデルを誰が作ったかの手がかりを得た。Logan Kilpatrickがバナナの絵文字以外何も投稿せんかった。それだけや。この投稿に50万ビューや。で、彼は基本的に俺らに言うたんや。「そう、Nano Bananaは俺らのもんや」って。俺らっちゅうのはGoogleのことや。
やからこれは、おそらくGeminiのテキスト画像と画像編集AIモデルの1つになりそうや。これが最先端のモデルやように、今日のスポンサーであるChatbaseで、GPT-5や市場で基本的に最高のモデル全部みたいな他の最先端モデルも試すことができる。
Chatbaseは、あなたのビジネスのデータで訓練されたAIパワードエージェントを通して、あなたのビジネスが顧客に高速で正確で個人化されたカスタマーサポートを提供できるようにする強力なノーコードプラットフォームや。
これは特にカスタマーサポート業務を拡大し、効率化するために設計されてる。Chatbaseは、カスタマーサポートをして、24時間365日顧客の問題を解決する信じられへんエージェントを構築できるようにしてくれる。で、それは全てのチケットに人間の介入が必要ないねん。これは既存のサポートチームを拡大する素晴らしい方法や。
最新のフロンティアモデルを活用することで、Chatbaseエージェントはあなたのビジネスコンテキストを理解し、自然言語で応答し、時間とともに良くなってサポートの品質と効率を改善する。FAQに答えることでも、トラブルシューティングガイダンスを提供することでも、複雑な政策クエリを処理することでも、Chatbaseエージェントは全てのタッチポイントで顧客が即座に高品質なサポートを得られるようにしてくれる。
Chatbaseはあなたのウェブサイトや他のデジタルチャネルにシームレスに統合されて、顧客のための統一された体験を作る。大企業でもスタートアップでも、Chatbaseはあなたのサポートチームがよりスマートに拡大できるようにしてくれる。Chatbaseをチェックしてみ。素晴らしいパートナーやった。下にリンク貼っとくで。俺が送ったって言うといてや。
またChatbaseありがとう。それでは動画に戻る。
実践的な活用例
ここはMarcoや。Nano Bananaでもっとテストしてる。プロンプト:スポーツの瞬間を示す4パネルのモンタージュを作って。参考画像のスタイルを使って。上に参考画像がある。他のやつらを見てみ。スタイリングが正しいだけやなくて、4つの他のスポーツも選んでる。
全部がハイパーリアルに見える。ぼかしもある。ストリーキングもある。全部がめっちゃ良く見える。これはマーケティングにも使える。これは明らかに今見た写真補正にも使えるし、もっといろいろ使える。カラー化のもう一つの例や。元画像がここにあって、Nano Bananaで色を追加した。
本当にただただ信じられへん。画像を反転させることもできるし、画像の物体の後ろに何があるかを推測したり推定したりできる。これ見てみ。元画像がここにあって、Nano Bananaに基本的に後ろから見たらどんなふうに見えるかをシミュレートしてって頼んだ。やからこの人の後頭部がここや。この人の後頭部がここや。
で、今度は反対方向に歩いてる。それから、この画像からNikeの広告を作って。やから、元画像があって、それから「Just do it. Run your story.」Nikeのロゴ。Just do it。フォントは俺には正しく見える。Nikeのチェックマークがちょっとおかしく見えるけど、分からん。実際によく分からん。
例がここにある。4つの別々の画像がある。この男がここにいる。この女性、犬、車がある。男性と女性がペットの犬と一緒に車の前に立ってる。画像がどうなるか見てみよう。これや。興味深いことに、俺やったら気づかんかったやろな。彼はシェフのコートを着てる。
実際に画像に戻って確認せなあかんかった。彼はシェフのコートを着てるんか?で、そう、エプロンを着てるってことが分かった。これは実際には画像に写ってへんかもしれんけど、シェフのコートは確実にある。それが翻訳されて、そこにある。シェフのコートがある。車がある。これがどんな車か分かりにくいけど、なかなかええ感じのものをまとめてくれた。
さまざまな編集例とモデル比較
ここはAkos Bongadや。噂のiPhone 17とTim Cookの写真を与えて、この出力画像を生成した。やからこれや。これが噂のiPhone 17や。Tim Cookがここにいる。で、画像がこれや。実際にこれはあんまりええ感じに見えへんかもしれん。まだめっちゃいいけど、電話がちょっと変で、ちょっと形がおかしくて、ちょっと大きいかもしれん。
やからこれは結構いいって言うやろな。今まで見せたやつほどやないけど。これはどうや?BatmanをSupermanに置き換えて。見てみよう。そこにある。で、これもまた結構いいって言うやろな。最高やないけど。これは確実にSupermanやし、最近のSupermanは少なくとも彼に見える。
それから猫がいるけど、これは実質的に全然変わってへん。猫はこの2つの画像で同じや。やからNano Bananaは画像で変更する必要のある要素を分離するのが本当に上手で、それが一番印象的な部分や。もう一つある。女性Cindy Sweeneyに野球帽をかぶせて。どうなるか見てみよう。
ドーン。で、Nano Bananaはキャラクターの一貫性が全てや。帽子がめっちゃリアルに見えると思う。めっちゃいいな。もう一つある。本のスタックを立てて、2つのブックエンドの間のテーブルに置いて。3冊の本がある。どうなるか見てみよう。そこにある。
ちょっと問題に気づいた。Oscar B ここ、名前、苗字や。ここを見たら、テキストがちょっとおかしくなってる。で、他の本のテキストもちょっとおかしくなってるのが見える。ちょっと不明確や。それからGPT-4o Image Oneとの比較がある。左側がNano Bananaや。
同じプロンプトを次のに使った。これや。こっちはもっとスタイライズされてる。こっちの方が全体的に良くて、よりリアルに見えると思うけど、両方とも独自の見た目と雰囲気がある。それからAI商品配置はどうや?これ見てみ。これはTech Hollaからや。元画像がここにある。
GTA 5の画像みたいに見える。右側には、Redneck Breweryの商品があって、女性がビールを持ってるって書いてある。Flux Dev Contextではできんかった。そのビール瓶を彼女の手に入れることができんかった。代わりに、彼女はビールのカップを持ってるだけや。で、彼女は1、2、3、4、5本、それから親指が後ろにあると思うから、6本の指がある。
Nano Bananaやと、まさにそのビール瓶がそこにある。テキストも全部正しく見える。で、彼女がそれを持ってる。4本の指がある。親指も見える。この新しいモデルからの信じられへんほど印象的な作業や。それで、Satya NadellaとSundar Pichaiを自然な感じでビーチに一緒に置いたらどうなるか。現象的や。
本当にめっちゃ良く見える。なんで彼にジーンズのショーツを着せることにしたんか分からんけど、それがNano Bananaの決定やった。最後に一つ、商品配置や。この椅子とこのランプがある。一緒に置いて。これや。GPT-4o Image Oneともっとリアルなnano banana。これがどんだけ信じられへんか見てみ。ランプの中の光からランプのパターンで作られた実際の影が地面に反映されてる。
俺はこれにぶっ飛ばされてる。
実際の利用方法と体験談
やからLM ArenaでNano Bananaを試す方法がここや。今すぐ試すことができる。lmarena.aiに行く。それからプロンプトフィールドに、「画像を生成」って書いてある小さいボタンがここにある。これをクリックしたら、画像を生成するためのプロンプトを挿入できるようになる。
それでバトルモードになる。バトルモードを選択せなあかん。それから基本的にLM ArenaがNano Bananaをランダムに選ぶのを待たなあかん。一度に2つの画像生成モデルを選ぶだけやから。時々Nano Bananaが選ばれて、時々選ばれへん。俺が作った生成をいくつか見せたろ。
これは俺の写真や。これは古いオフィスからのサムネイル顔写真やった。で、「背景を削除して。男を宇宙に置いて」って言った。これがNano Bananaや。Gemini 2.0 Flashを見たら、何か間違ってる。顔がちゃんと見えへん。みんなも同じように思ってくれるといいんやけど。でもNano Bananaが明らかに勝者やった。
基本的に背景だけを分離して、俺の後ろに宇宙を置いた。それから「その男にスペースヘルメットをつけて」って言った。画像がここにある。2つのバリアントがあった。これはQwen2-VL Image Editに対するやつで、もちろんオープンウエイトモデルや。これがNano Bananaや。めっちゃ良く見えると思う。
それから同じ画像を取って、もう一度ロードして、「ヘルメットのガラスを少し色つきにして」って言った。またQwen Image EditとNano Bananaを得た。実際にはQwenバージョンの方がちょっと良く見えると思ったけど、Nano Bananaはこんな感じやった。それから「今度は巨大なバナナが男を追いかけてる」って言った。そこにいる。
これはめっちゃおもろい。これは全然俺に見えへん。これは本当に全然良くない。でも少なくとも前の画像からの俺の顔と一致してる。やからそういうことや。LM Arenaで見つけることができたらチェックしてみ。どう思うか教えてくれ。Googleのloganに連絡して、早期アクセスを得られるかどうか見てみるつもりや。
この画像編集モデル、このテキスト画像モデルは絶対に狂ってる。今まで見た中で最高や。試すのが待ちきれん。やから、もしこの動画を楽しんでもらえたら、いいねと登録を考えてくれ。


コメント