GoogleのNano Banana Proが画像生成AIの新たなリーダーとして登場した。従来版から大幅に進化し、2K解像度、高度なテクスチャレンダリング、最大6枚の画像結合機能を搭載している。特筆すべきは、ブラジル文化特有の要素であるカンガセイロの帽子を正確に生成できるようになった点や、ポルトガル語のアクセント記号を完璧に処理できる点である。Photoshop的な画像編集機能が非常に優れており、背景の削除、視点の変更、キャラクターの回転、表情の変更などを自然に実行できる。さらに漫画形式での会話シーン生成、複数の人物を組み合わせた構図、製品モックアップの作成、ロゴデザイン、ラフスケッチから高品質な3Dアニメーション風画像への変換など、幅広い用途に対応している。ChatGPTの画像生成機能と比較しても、プロンプトへの忠実性、テキスト生成の正確性、文化的要素の理解において優位性を示している。

Nano Banana Proの衝撃的な進化
皆さん、Nano BananaがPro版として今リリースされました。この新しいアップデートは、全ての画像生成ツールを置き去りにする可能性を秘めています。特にNano Bananaは画像編集のための優れたPhotoshopとして機能しており、今後このツールは1000倍パワーアップすることを約束しています。
私はすでにいくつかのテストを行いました。これから皆さんにお見せします。きっと驚かれることでしょうし、今すぐ使い始めたくなると確信しています。では、始めましょう。
いつもいいねを押してくださる皆さん、チャンネル登録してくださる皆さんに感謝しています。この人工知能チャンネルをスポンサーしてくださっている全てのチャンネルメンバーの方々に特別な感謝を申し上げます。
メンバーの方々は、インテリジェントエージェントに関する限定動画にアクセスでき、WhatsApp統合、MCP、PDF読み取り、ドキュメント処理など様々なことの実装方法を教えています。さらに先行公開動画も視聴できます。もし皆さんの会社に人工知能を導入したいけれど、エージェントを作成する時間を無駄にしたくない、誰かに「カスタマーサービスを行うエージェント、生産性を最適化するもの、従業員向けのツール、人工知能を使ったカスタマイズされたものを作ってほしい」と説明するだけで済ませたい場合は、説明欄にMaximiza AIのリンクがあります。彼らがその問題を解決してくれます。詳細についてはそちらをクリックしてください。
新機能の詳細と利用方法
それでは皆さん、この件に注目してください。Nano Banana Proがリリースされました。人工知能による画像生成を既に追いかけている方なら、この画像生成の品質が素晴らしいことをご存知でしょう。
しかし私はいつもいくつかのことを言っていました。ChatGPTの画像生成の方が優れていると。なぜならプロンプトへの忠実度が高く、アクセント記号のエラーが発生せず、ブラジル文化では生成が難しいものを生成できるからです。では、この点が改善されたか見てみましょう。
まず旧バージョンがどうだったか見てみましょう。なぜなら明らかにこれは驚異的だからです。最初に知っておくべきことは、古いNano Bananaは高速版の画像生成で引き続き機能しており、古いモデルのままだということです。Nano Banana Proを使用したい場合は、思考推論バージョンに移行する必要があります。推論バージョンでのみPro版が使用されるからです。
これに注意してください。レンダリングのテクスチャが進化しており、編集がより正確になり、2K解像度を持ち、世界に関する知識が進化し、より多くの写真を組み合わせることができます。私が見たところでは6枚の写真です。
解像度について考えると、このツールが扱える解像度の種類を見てください。正方形、横長、拡張横長、再び正方形、縦長、拡張縦長。つまり、皆さん、かなり興味深く、より多くの可能性があります。Google AI Plusで利用可能で、Pro版とUltra版ではアクセスが増加します。ですから、アプリやウェブアプリケーションで探してみてください。もしかしたらすでに機能しているかもしれません。
生成自体については、大きな新機能はありませんね。小さな犬がいます。私たちが既に慣れている画像を生成します。これらの品質は素晴らしいですが、私たちがいつか見たものと大きく異なるわけではありません。しかしいずれにせよ、素晴らしいものを作ることができます。
例えば、小さな絵とテクスチャを取ってオブジェクトに変換することができます。これは興味深いことですね。何かのスケッチと別のテクスチャ、例えば料理の皿のようなものを取って、この小さな絵に変換します。これはかなり楽しそうです。この小さな絵のテストをもうすぐ行います。
ロゴやロゴマークの作成、本の表紙の作成、カスタマイズ、テキストの書き込みができます。皆さん、このテキスト部分を見てください。アクセント記号が正しく表示されているか、長いテキストが表示されているか、論争を呼ぶことが分かっているこれらすべてを確認します。では、始めに私が投稿した最後の世代のNano Bananaのフラッシュバックをしましょう。
実践テスト:カンガセイロの帽子問題の解決
このプロンプトを再び使用して評価を行います。私の以前のバージョンでの生成では、注意してください、これは古いバージョンです皆さん、新しいものではありません。画像はすでに驚くほど良い品質でした。ジャガーがアコーディオンを弾き、ワニがギターを弾いているセルタンでした。これがプロンプトにある説明です。
そして私は「上から見た視点で」「横から見た視点で」「反対側から見た視点で」というように変化を付け始めました。見てください。横から見て、反対側から見ています。これらのことが分かりますか。そして気づくと、見てください、興味深いことに、横から見た時でも、ここ中央にあった太陽は横に移動せず、ここ中央に留まり続けました。
ですから、いくつかイライラする細部がありました。例えば上から見ても、太陽は画面の中央にありました。ここには何の関係もありません。太陽がここの地面の中にあります。これは間違っています。これは起こるべきではありませんでした。そしてもう一つ重要なこと、私はこう言っていました。彼はカンガセイロの帽子を被っています。
皆さんはこれらの帽子のどれもがカンガセイロの帽子ではないことに気づくでしょう。カンガセイロの帽子が何であるかを理解できませんでした。そして私はいつも「ChatGPTは全ての画像生成ツールの中でカンガセイロの帽子を作る唯一のものだ」と言っていました。私は多くのテストを行いましたが、それだけでした。しかし今この新バージョンで何が起こったと思いますか。これを修正したでしょうか。見てみましょう。
続けます。全く同じプロンプトです。ここの詳細を見てください。Nano Banana Pro。そして忘れないでください皆さん、ここで推論を有効にする必要があります。推論を有効にしなければNano Banana Proになりません。彼が生成した画像を見てください。ここにリアルなジャガーがアコーディオンを弾いています。ここにワニがギターを弾いています。
ここにカンガセイロの帽子があります皆さん。もはやあのランダムな帽子ではありません。そしてここの二匹の小動物が決闘をしています。一目で、これは以前は小さな絵、アニメーションだったものが、今では映画のようなリアルな画像になったことが分かります。全てが素晴らしいです。すると皆さんは私に尋ねます「上から見る、横を見る、他の位置から見ると言ったら何が起こるのですか」と。では「上から見たバージョンを作って」とコメントしました。
そして何が起こったか見てください皆さん。太陽は地面の真ん中に埋め込まれておらず、ジャガーとワニが上から見られるバージョンが影と共に正しく表示されました。実際、この影を見てください皆さん、後ろから来ている太陽によって作られています。そして肩越しのバージョンを頼みました。すると何が起こったか見てください皆さん。
ここにジャガーがワニの方を向いており、本当に素晴らしい映画的なバージョンで正確に表現されています。ですから皆さんもう理解しましたね。これは本当に品質が向上しました。アマチュアリズムから脱却しました。見てください、ワニの後ろから見ても同じことが起こりました。ここでいくつかの細部に気づくでしょう。
例えば、ここのジャガーの帽子が消えました。そしてワニの帽子も同様に消えました。しかしこれは私たちが見ないふりをするあの細部です。なぜならプロンプトで「ワニの帽子が消えた、戻して」と説明できるからです。そうすれば戻してくれます。このPhotoshopの特性、画像を取って何かを頼む、これは以前のバージョンからすでに良く機能していました。
ですからこれは新しいことではありません。そして私は彼に「ジャガーとワニのテーマから4つの画像を作成して。出会いのシーン、開かれた公共の場所のシーン、閉じられた場所のシーン、そして最後に別れのシーン」と頼みました。すると彼は4つのバージョンを持つ1つの画像を生成しました。ここで二匹が出会っています。次に二匹が公共の場所で一緒にいます。
次にここの閉じられた場所、パブのように見える場所で、最後に二匹が正確に私が頼んだ通りに別れを告げています。素晴らしいですね。しかし私たちはこいつのPhotoshopバージョンがどうなっているか、物事がどのように機能しているかを知りたいのです。ここのオープニングTAMBから私の写真を送り「この画像を再作成して、人物にカンガセイロの帽子を被せて背景を切り取って」と言いました。
彼はこの画像を生成しました。私のマイクを持った写真で、全て正確です。カンガセイロの帽子、革製で、星が付いていて、全て綺麗です。そして背景を切り取りました。実際、ここを見ると分かります皆さん、ここにグレーと白の部分がありますが、おそらくここに欠陥があります。
彼は実際に背景の切り取りを、いわば、行いました。ここは全て正確です。彼は本当に背景を取り除きました。ただしこれは本当の背景切り取りではなく、人工的な背景切り取りです。この画像を画像エディタで開くと、背景が黒くならず、チェック柄になっていることが分かります。これは一部の画像ビューアが透明な背景を持つ画像の後ろに配置して、背景が透明であることを人々に知らせるリソースをシミュレートしています。
ですから結局、彼は偽の背景を作りました。それでも、切り取りが正しいことは分かります。私は同じアイデアを実行しました。彼に右を向いているバージョンを作るよう頼むと、正確に右を向いたバージョンを作りました。これは驚きました。なぜなら非常に良くできていたからです。この写真は私の本物の写真だと簡単に言えます。
この回転は非常に良くできています。次に上から見たバージョンを作り、同様に画像は素晴らしく、リオデジャネイロなどいくつかのリクエストを始めました。これはあまり好きではありませんでした。Chaves風のコラージュのようになりましたね。文字通り前の写真が別の写真に貼り付けられたように見えます。ここのコントラストが良くありませんでした。そして私はこう頼みました。
歩道で他の人々と一緒に歩いているキャラクターにして、この下手なコラージュの雰囲気を取り除いてください。すると彼は歩道でのこの画像をはるかに良く、はるかにリアルに生成しました。解像度、品質はそれほど良くありませんでした。やや低解像度でしたが、少なくともここのリアリズムははるかに高くなっています。
もはやコントロールC、コントロールVされた人、その下手な編集には見えません。これで私は多くのリクエストを始めました。クリチバのオリョ博物館。そして彼はクリチバのオリョ博物館バージョンを作りました。次にサルバドールのペロウリーニョを頼みました。そして彼はサルバドールのペロウリーニョを作りました。
次にアマゾンでジャガーと会話することを頼みました。アマゾンでジャガーと会話している私が登場しました。ノルウェーでオーロラを見ることを頼みました。ノルウェーでオーロラを見ている姿がここにあります。ですから皆さん、これは本当に信じられないことです。Nano Bananaが持つこのPhotoshop能力は素晴らしいです。ChatGPTで回転を行うのに優れています。
テキスト生成とアクセント記号の完璧な処理
これらの変換を始めて、ここの環境を変えるよう頼むと、彼はキャラクターを修正し始めます。最初は日本人の画像だったのが、最後には何度も再生成しているうちに象に変わってしまうほどです。そしてこのタイプの問題はNano Bananaでは発生しません。
しかしテキストの書き込みはどうでしょうか。私はここで頼みました。カナインデオウムとゴールデンライオンタマリンが会話している漫画を生成して、オウムがタマリンにNano Banana Proがリリースされたことを伝え、タマリンが感動するという内容を、ブラジルポルトガル語で9×16フォーマットで。すると彼はこの漫画を生成しました。
タマリン、タマリン、信じられない。Nano Banana Proがリリースされたばかり、本当だよ。そしてカナインデオウムがここでバナナを出し、タマリンが驚いて「ワオ!」と言います。するとオウムが「とても小さいけど超栄養があるんだ。私はこの技術が必要だ」とゴールデンライオンタマリンが答えます。私は素晴らしいと思いました。特に私が多くの詳細を説明する必要がなかったからです。
ここを見てください。全てのキャラクターが正確です。アクセント記号の問題は一切ありませんでした。「lançar」は正しいです。「é real」のéは正しいです。Nano Banana Proのアポストロフィは正確です。「minúscula」のアクセントは正しいです。全てが完璧で、私たちが好む通りで、アクセントの問題で再送信しなければならないようなばかげたエラーはありません。
さらに、彼らは「この技術は6枚の画像まで組み合わせる」と言っていました。そこで私は6枚の画像を取りました。私の画像、イーロン・マスク、ザッカーバーグ、サム・アルトマン、ビル・ゲイツ、GoogleのSundar Pichai。そして「全ての人を最後の晩餐のようにテーブルに座らせて。全てのキャラクターをつなぐ吹き出しに『É, pessoal』とブラジルポルトガル語で書いて、16×9フォーマットで」と言いました。
そして生成はこうなりました。皆を座らせました。真ん中のテーブルにボブ、イーロン・マスク、サム、Sundar Pichai、ザッカーバーグ、ビル・ゲイツ。皆が「É, pessoal」と言っています。しかしこの画像を見ると、コントロールC、コントロールVの雰囲気があります。そして私は改善しようとしました。「よりリアルで映画的なバージョンを作って」と言いました。
すると彼はここでより良いバージョンを作りました。やや低解像度でピクセル化していますが、見てください、後ろの照明が全てのキャラクターに光の効果を作り出し、これにより彼らが画像内に切り取って貼り付けられているようには見えなくなりました。皆が本当にここにいたように見えますが、「É, pessoal」の吹き出しは皆のための大きな吹き出しを作る代わりにここ中央に配置しました。
そして私は何と言ったか。画像の解像度を上げて、人々が一緒に「É, pessoal」と言っている吹き出しを付けるのを忘れないで。すると彼はここの画像を吹き出しで変換し、画像を再利用しました。解像度は同じままで、高解像度にはなりませんでした。ですからコメント欄に、この解像度を上げるプロンプトがあるか教えてください。解像度を上げるよう頼んでも解決せず、やや奇妙なままで、画像は高解像度ではありません。
ロゴとプロダクトモックアップの作成
続けて、私たちのブランドを作り、ロゴマークなどを探索するための製品を作りました。ここにプロンプトを送りました。鷲が鶏と一緒に地面をつついている画像を作り、「O brasileiro é nós brasileiros」というテキストを書いて。ブラジル人は鶏と一緒に育った鷲で、飛べることを知らない。
そして私は9×16フォーマット、つまり縦フォーマットにしました。彼はこの画像を生成しました。鷲がいて、多くの鶏がいて、地面に打ち付けられた看板にこう書いています「ブラジル人は鶏と一緒に育った鷲で、飛べることを知らない」。そしてこれは皆さんへのモチベーションのフレーズです。自分が鷲であることを知っているのに、飛べることを発見していない、まだ鶏だと思っている皆さんへ。
違います皆さん、私たちにはやるべきことがたくさんあります。ブラジル人には輝くべきことがたくさんあります。では、私は何をしたか。私はこう言いました。「鷲にセレソンのユニフォームを着せて」。ブラジル代表のユニフォームとは言わず「セレソンのユニフォーム」と言いました。そしてNano Bananaはこれを実行し、鷲にセレソンのユニフォームを着せ、画像の残り全てを維持しました。
私が言ったように、これらのPhotoshop特性は既にNano Bananaのものであり、既に素晴らしいです。頼むだけで実行してくれます。そして満足せず、私はこの鷲がとても真剣な顔をしていることに気づきました。もう少しリラックスが必要でした。そして私はこう言いました。「今度は鷲にこの絵文字のような笑顔をさせて」。
そしてあのいたずらっぽい笑顔の絵文字を送りました。見てください、IáがIAが何をしたか。この画像を取って鷲の顔に大きな笑顔を配置し、同じ画像を作りました。しかし今、画像が横向きになっています。そして私は彼にこれを修正するよう頼み、彼は修正して画像を再び縦向きにしました。ここでテキストが少し小さくなりましたが、ここは全て正しいです。
ここまでは全て素晴らしいです。しかし私たちは製品を作成しているので、今度は何と言ったか。この画像をマグカップのアートに変換して。マグカップの片側に鷲があり、反対側にテキストがある。製品を示すモックアップを作って。モックアップは無料サンプルのようなもので、どのように機能するか見ることができます。そして皆さん、彼はキッチンの中にある環境を作りました。
鷲が描かれたマグカップがここにあり、テキストが書かれた別のマグカップがここにあります。ですから、もっと注意深く見たければ、ここで正確に見ることができます。マグカップが良くできています。彼はここに画像を配置しましたが、おそらく背景を切り取って鷲だけを残すこともでき、ここにテキストも配置しました。背景を取り除いて看板だけを残すよう頼むこともできました。
しかし理解すれば、とても上手くいきましたね。彼は製品のモックアップを作りました。製品を生成していたなら、たった1つのプロンプトでこれがどのようになるか理解できます。そして私は頼みました。今度は鷲のロゴを作成して。そしてチャットはこのロゴマークを作りました。ブラジル人は鷲だ。
良かったです。なぜなら最も重要で前向きなメッセージのポジティブな意味を与える部分を要約したからです。ブラジル人は鷲だ。ここの詳細を見ると、かなり良いですね。私たちが配置したあの笑顔を持つ鷲ができました。セレソンのユニフォーム、ここに「ブラジル人は鷲だ」と看板に書いています。
そしてこれをロゴに変換するためのいくつかの詳細をここに配置しました。これはもう非常に興味深いです。皆さんはどう思いましたか。自分の製品を作りたくなりましたか。画像生成でいくつかテストをして製品の生成を行いたくなりましたか。私はこれは素晴らしいと思いました。そしてもう1つ私が行ったテストは次の通りです。
ラフスケッチから高品質画像への変換
私はペイントに入り、非常に下手な絵を描き、「img」と書きました。これは「知能1000度」という意味です。非常に下手な家を描き、いい加減な屋根を付け、非常にいい加減なドア、ここに道を描き、ここに意図的にZとUを使って「Vai Brasil」と書いてユーモアのようなものを作りました。そして棒人間をここに描きました。両手を頬に当てている、私が慣れている私のTAMBのようなものです。
そして次のテキストを書きました。「このアートを月明かりのある映画の画像に変換して」。霧のある照明で洗練された豪華な雰囲気を与えて。すると彼はこの絵からこの生成を行いました。ここにより大きな不気味な家を作り、月を配置し、このIMGをここで銀色に輝くIMGに変換し、この棒人間をスーツを着た怖がっている男のように見せ、壁にここに「Vai Brasil」と書きました。
私はこの画像をまあまあだと思いました。あまり好きかどうか分かりません。ホラー映画の画像のように見え、実際には洗練された豪華な雰囲気が欲しかったのですが、まあいいでしょう、私の責任です。おそらくもう少し良く説明する必要がありました。そして私は何をしたか。同じ画像を取り、全て同じように送り、こう言いました。
今度はディズニー・ピクサースタイルの3Dアニメーションに変換して。すると彼はこの生成を行いました。これは皆さん、これは驚異的、驚異的、驚異的です。彼は小さなimgを書きました。あの下手な小さな家が素晴らしくなりました。ここの道は私が作ったものと全く同じです。棒キャラクターがこのハンサムなキャラクターになりました。
「Vai Brasil」は非常に美しく素晴らしいテクスチャとテキストになりました。そして彼らの例に従って、ここの画像のラフスケッチを取り、ここに落ちているサグの図を取り、こう言いました。「ラフスケッチを画像のテクスチャで変換して」。そして彼がしたことはこれです皆さん。
彼はここにサグの小さな家を作りました。ここに「Vai Brasil com sagu」と書きました。サグの小さな人形をここに作り、「imgu」と書きました。ですから皆さん、どうやら画像の生成、編集、変換、そして画像で行いたいあらゆることにおいて、新しいリーダーがいるようです。Googleは非常に良い仕事をしたと思います。彼らは目標を達成しました。
画像を扱う仕事をしている方、マーケティングで働いている方、製品の写真がなくてウェブサイトを作りたい製品を持っている方、製品を美しくしたい方、これはプロンプトだけで画像と会話し、変更を要求し、改善を行って素晴らしいことをする素晴らしい機会です。
下にコメントして、どう思ったか教えてください。私はこれは素晴らしいと思いました。ChatGPTは他のツールができないことができると私が話していたあの話、もう言えません。なぜなら今ではカンガセイロの帽子までNano Banana Proが作っているからです。テキスト書き込みで抱えていた問題。
今ではもうありません。アクセントは正しいです。セディーユは正しい、éのアクセントは正しい。全てとても美しいです。そして私のテストでは何の問題も見当たりません。どうやらこの男がテキスト付き画像生成、品質、編集、そして私たちが享受できる全てにおける新しいリーダーのようです。テストを行った場合、どう思ったか、同意するか、まだ改善できると思うことがあるかコメントしてください。私たちは知りたいです。
そしてこのようなビデオを見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーはインテリジェントエージェントの限定ビデオと先行公開ビデオにアクセスできます。それでは、いいねを押してください。ありがとう。


コメント