Google、画像生成で圧勝(他社は全く太刀打ちできない)Nano Banana Pro徹底解説

Google・DeepMind・Alphabet
この記事は約25分で読めます。

GoogleがリリースしたGemini 3 Proと同時期に登場した画像生成モデルNano Banana Proが、競合他社を大きく引き離す性能を見せている。従来のモデルでは困難だったテキストレンダリングやフォトリアリスティックな人物描写において圧倒的な品質を実現し、複数の入力画像の処理や複雑な図表生成まで可能にした。一方で、Googleが安全対策として導入したSynth IDによる電子透かしシステムは、わずかな画像加工で容易に回避できることが判明している。生成速度も従来比で大幅に向上し、実用性が飛躍的に高まった反面、偽情報拡散のリスクも同時に増大しており、「見ることが信じること」という前提が崩れつつある現実を浮き彫りにしている。

Google won image generation (it's not even close) NANO BANANA PRO BREAKDOWN
Google dropped Nano Banana Pro and it's good. Like, scary good...Thank you G2i for sponsoring! Check them out at: code N...

GoogleのNano Banana Proが画像生成を制覇

先週、Googleはこれまでで最高のモデルであるGemini 3 Proをリリースしました。少なくとも、最高の言語モデルとしてはそうです。でも、もし私が先週リリースされた最高のモデルはそれではなかったと言ったらどうでしょう。もし、競合他社を遥かに引き離し、リリース以来ほぼ毎日使っているような、もっと優れたものがあると言ったらどうでしょうか。

それが、Weather Next 2です。彼らの天気予報モデルです。

いえいえ、今日は同時期にリリースされた天気モデルの話をするわけではありません。本当に面白いものではあるんですけどね。今日お話しするのはNano Banana Proです。このトピックに取り組むのが遅くなったのは分かっています。でも、私は他とは違うアプローチをしたいんです。他の人たちはみんな、このモデルがいかにパワフルかを見せびらかしてきました。私たちもそれをやりますが、同時に懸念も持っています。

今や、これらの画像生成モデルは一般の人が偽物かどうかを判別できる地点を遥かに超えています。特に、テキスト処理能力が向上した今となっては、その差は圧倒的です。Nano Banana Proと共に導入されたものの一つが、Synth IDのアップデートです。これは彼らのデジタル透かしシステムで、現在Geminiアプリ内で利用できるようになっています。

これは興味深い展開で、私にはたくさんの考えがありますし、悪用する能力もたくさんあります。願わくば、前回Googleについて話したときにYouTubeが気に入らなかった方法で話して動画が収益化停止にならないことを祈ります。とにかく、これは楽しいディープダイブになるでしょう。

Nano Bananaができるクレイジーなことをお見せするのが待ちきれません。デザインやアプリケーションのモックアップ作成から、クレイジーな図表作成、写真編集など、さらにはSynth IDの方法まで。しかし、それはまだ全然十分ではありません。私は本当に説得力のある画像を生成できますが、それでもお金を生成することはできません。

では、今日のスポンサーからお聞きしましょう。AIはコードを書いたりレビューしたりするのがかなり得意になってきました。同時に、採用マネージャーの人生を台無しにするのも得意になっています。真面目な話、最近求人を出そうとしたことがありますか。ゴミみたいな応募で溢れかえるだけです。私は試したことがあります。地獄です。今は誰にもお勧めしません。AI生成の履歴書を山のように読むのが楽しいという人以外は。

もし本当に採用したくて、そんなくだらないことに時間を無駄にしたくなくて、本当に優秀なエンジニアを確実に採用したいなら、行くべき場所は一つしかありません。G2Iです。彼らは採用を悲惨なプロセスからワクワクするものに変えてくれます。必要がなければ採用しないでください。

でも、本当に必要になったときは彼らに連絡してください。どんなエンジニアでも、必要な期間、どんなレベルでも採用できます。彼らのネットワークは私が今まで見た中で最もクレイジーです。私のコミュニティの何人かとも話をしましたが、彼らはG2Iと協力して自分の仕事を見つけ始めています。

そして、聞いたところによると、あらゆる側面からの体験が素晴らしいものだったそうです。彼らの目標は、候補者が最初の面接から7日以内に最初のPRをマージすることです。狂気じみて聞こえるのは分かりますが、十分な回数見てきたので、もはやそれほど狂気には感じません。OK、まだちょっとクレイジーには感じますが、彼らがこれらのことを一貫して成功させる様子は信じられないほどです。

G2Iは、リクルーティングチーム、あなたと直接仕事をする請負業者、そして彼らが構築したソフトウェアプラットフォームという、採用できるエンジニアのクレイジーなネットワークのハイブリッドです。あなたがいくつかの質問を提供すると、彼らがエンジニアに質問し、ビデオ回答を撮影して、あなたはそれをスクロールして見て、フィードバックを与え、良い判断を下し、そしてその人を採用できます。

これは私がこれまで行ってきたどの採用よりもはるかにスムーズなプロセスです。私はキャリアで500人以上の候補者を面接してきましたが、それでも今採用しようとしているなら、G2Iを選びます。採用に時間を無駄にするのをやめて、仕事に戻り、優秀なエンジニアを連れてきてください。今すぐsoyv.link/g2iでチェックしてください。

Nano Bananaという名前の由来と驚異的な性能

まず、Nano Bananaという名前について話すべきでしょう。とても馬鹿げた名前ですから。Googleは匿名モデルを作るというトレンドに乗ったんですが、画像モデルでそれを最初にやった企業の一つでした。最初にElla Marinaなどに投稿して人々が比較できるようにしたとき、彼らはそれをNano Bananaと呼びました。名前が面白かったので、そのまま使うことにしたんです。そして今、Gemini 2.5 flashの画像モデルは主にNano Bananaとして知られています。

実際、API上でもその名前で公開されているんです。それが本当に面白いと思います。Nano Banana Proは新バージョンで、私は幸運にも2、3日早く早期アクセスを得て、たくさん遊ぶことができました。そして今、正式に誰でも使えるようになっています。このモデルでできることは本当にクレイジーです。

深入りする前に、一つだけ脱線させてください。このモデルで遊んでいたとき、私は本気で、自分が使っているバージョンが何らかの形で安全フィルターを通過していないと思っていました。というのも、ほとんどのサービスがハードブロックするような、画像モデルで生成できるとは思えないものを生成していたからです。

参考までに、これは私が何の問題もなくGeminiに生成させることができた写真です。Nano Bananaは、私が早期アクセスを使っているときに、これを喜んで生成してくれました。私は、彼らが単に厳格なフィルタリングを適用していないだけだと思っていました。そして公式版が出て、それでもまだ私にこれをやらせてくれたんです。

これは公式版で作られたもので、私の早期アクセスではありません。つまり、彼らは本当に制限をかけていないようです。そして、実際に拒否されたとしても、同じプロンプトを何度も送信すれば、最終的には通ることを発見しました。これは恐ろしいことです。これは恐ろしい偽情報に使われる可能性があります。そして、もし私が両親にこれを送ったら、彼らはとても混乱するでしょう。

今、ChatGPTで同じことをやろうとしています。通常、このタイプのものは拒否されます。拒否するスピードが遅くなったのかもしれません。まだ処理中です。でも、5分くらいかかるので分からないですね。ChatGPTの画像生成はとても遅いんです。新しいNano Banana関連で本当に気に入っていることの一つは、速いことです。

数分ではなく数秒で完了します。本当に素晴らしいです。ご想像の通り、T3 ChatでもNano Banana Proが利用可能です。月額8ドルのサブスクリプションで50回の画像生成ができます。さらに、非常に高価なものでない限り、通常の1500メッセージも使えます。本当に素晴らしいです。そして、GeminiやAI Studioの画像生成UIを使ったことがあるなら、かなり苦しんだはずです。お約束しますが、ここでははるかに良い体験ができます。

Sunnyから、フィラデルフィアからタイトルを生成しようとしていました。Twitterのミームとして「ギャングがRAM危機を解決する」というものを投稿するためです。でも、ここで全く問題なくできたのは、チャーリーとマックがサニー・イン・フィラデルフィアから、豪邸の玄関でRAMを売っている画像の生成でした。これは良いです。これは腹立たしいほど変に良いんです。

そして比較のために、同じプロンプトを試してみましょう。私たちの持つ高度な機能を使います。OpenAIのGPT画像生成に分岐させます。そして今、全く同じプロンプトがGPT Image Oneで生成されています。そして、比較のために、Nano Bananaでどれだけ速いかを見せるために、ここでも同じことをやります。

真面目な話、この分岐機能は本当に便利です。自分の製品を褒めちぎるだけのつもりはないんですが、最近すべてのチャットアプリとAI Studioをたくさん使ってきて、これは命の恩人です。そして、Nano Banana Proが完了しました。30秒もかかっていません。GPT Image Genはまだ処理中です。2、3分かかるでしょう。

ああ、見てください。ドナルド・トランプとジョー・バイデンがミルクシェイクを共有している画像が完成しました。もう一度、これらの画像の品質を比較したいと思います。これがGPT Image Genから得られたものです。これがGemini Nano Banana Proから得られたものです。

GPT Image Gen。Nano Banana Pro。GPT Image Gen。Nano Banana Pro。これほど先を行っているのは笑えるほどです。そして、もしポートレート写真の品質だけのことだったら、それはそれで一つのことでしょうが、もっと深いところまで行っています。

OpenAIがこれを生成させてくれたのに驚いています。彼らは通常もっと厳しいんですが、これについてはもっと寛容になっているようです。もう一つ、素早く比較しましょう。これはT3 Chatでやったものです。サニー・イン・フィラデルフィアのチャーリーとマックがRAMを戸別訪問で売っているのが見えます。ここでの差は、これら二つのオプションがどれだけ離れているかを示していて、本当に笑えるほどです。

もうOpenAIのImage Oneを使うことは全くないと思います。厳密に劣っていて遅いんです。滑稽なほどに。そして、これらのものがどれだけ良いかを見て、比較するための最高の場所を持ちたいなら、T3 Chatで試すために月8ドルを払うことができます。または、初めてサブスクライブする場合、チェックアウト時にコードnanoを使えば、最初の月はたった1ドルです。かなり良い取引だと思います。

リアリスティックな描写とテキストレンダリングの革命

明らかに、リアリスティックなシーンをリアリスティックな人物で描く能力は、Nano Bananaが他の画像生成モデルと比較して遥かに先を行っています。中国のモデルの世界には、Seedreamのような驚くほど良いものもいくつかあります。でも、一般的な画像生成のユースケースに関しては、明らかにNano Banana Proは競合他社を遥かに上回っています。

もしそれだけのことだったら、素晴らしいです。でも、画像モデルができるとは思っていなかったことをやっているんです。テキストレンダリングについて話す必要があります。

GPT Image Genで本当に感銘を受けたことの一つは、テキストができることでした。私の理解では、テキストを行う方法は拡散モデルプロセスの一部ではありません。彼らは実際に画像の上にキャンバスをレンダリングし、テキストをラスタライズし、その後、拡散モデル、または私の理解では自己回帰モデルを使って、テキストを画像により良くフィットさせます。でも、彼らはテキストをオーバーレイして、それを画像に焼き込んでいました。テキストを含む画像を拡散していたわけではありません。

Nano Banana Proでも同じことが起きている可能性はありますが、これから見ていくいくつかの小さなことから、私は本当にそうは思いません。私の言葉を信じてもらってもいいです。Nano Bananaは競合他社を遥かに上回っています。または、Artificial Analysisのレポートを読むこともできます。2K画像あたり約14セント、4K画像あたり24セントです。

つまり、オリジナルのNano Bananaの3〜6倍高価ですが、はるかに多くのことができます。そして、このビデオを通してその多くを見ることになると確信しています。画像編集リーダーボードでどのようにランク付けされているか見てみましょう。私の記憶が正しければ、これは出力を見て、ELOで勝ち負けを比較する人々によって投票されています。

他のモデルと対戦し、人々に二つを見せて、どちらを好むかを選んでもらうんです。Nano Banana Proが圧勝しています。次に良いのはSeedreamです。これは先ほど言及しました。うっかりSeed Editと言ってしまいました。申し訳ありません。Bite DanceのSeedreamは、もう一つの本当に良い画像編集モデルです。Nano Bananaはその真下にあります。

そして、かなり後ろにGPT-5があります。はい、Nano Banana Proは他のすべてのものを遥かに上回っています。狂っています。Imagine Artが1.5プレビューで本当に話題になっていたのは知っています。数日前、Nano Banana Proがリリースされた直後に、彼らのローンチイベントに行ったんですが、私は正直目を回してしまいました。今となっては、他の画像生成モデルに煩わされるのが本当に難しいです。

安くてシンプルで単純なものが欲しいなら、オリジナルのNano Bananaを使うかもしれません。安いですから。でも、Proは信じられないほど良いです。最大14枚の入力画像を受け取ることもできます。これはかなりクレイジーです。特に、一度に最大5人の類似性を処理できます。5枚の人物の写真を渡して、「全員でなにかを生成して」と言えば、成功するんです。

はい、とても感心しました。ブラックフライデーのセールについて話す必要があります。これは狂気じみているように聞こえるかもしれませんが、聞いてください。私は毎年、ブラックフライデーで見つけた最高のセールについて、Twitterでスレッドを立てています。まだフォローしていない方は、Twitterで@Theoをフォローしてください。また、ここでもまだ登録していない方は登録してください。無料ですし、ボタンがあります。

私はセールを見つけるのが好きなんです。それが私という人間なんです。シェアするのも好きです。そして今、アフィリエイトリンクでこれをやっているので、実際にいくらかお金を稼ぐことができます。だから、やる理由があります。そして、私が買うものはすべて、ビジネスのために使っているので、経費にできるということです。

だから、すべてwin-winですよね。楽しいと思っています。私はずっとこうしてきました。ただ、お気に入りのセールを友達と共有していました。今はTwitterでやっていますが、そのために必要な画像を扱うのに疲れていました。それで、本当に良いと思ういくつかのセールを取り上げました。そしてテストとして、これらを新しい画像生成モデルに渡して、「これらすべてでプロモーション画像を生成して」と言いました。これはワンショットでした。

これがどれほどクレイジーか分かりますか。このテキストがすべて完璧なんです。何てことだ。間違いを一つも犯していません。間違いをしないように言ってもいないのに。この特定のもので、画像にいくつか間違いはありました。間違ったMac Miniと間違ったDJIマイクに変わってしまいましたが、これは私が行った生成の一つに過ぎません。

私が採用したものをすぐに見つけさせてください。これが私の最初のショットでした。これら4つのセールを渡しました。これが生成されたものです。繰り返しますが、テキストは完全に問題ありません。今回は、私が渡した正確な画像を取り、背景を削除して埋め込みました。これらそれぞれを取りました。これらの画像のいずれも、トレーニングデータから来ている可能性はありません。

こんなに最近学習されていませんから。これらすべての画像を取り、オブジェクト以外のすべてを削除し、この派手な背景とわずかな光彩と共に埋め込んだんです。これは私がPhotoshopで自分でできる作業ですが、30分はかかります。それをただやってのけるんです。何てことだ。

テキストをするためにツールを使わなければならないと思います。でなければ、どうやってこれをするんですか、よね。でも、後でここで、いくつかのことを台無しにし始めました。これを見てください。一番上の円の36%が三角形になりました。そして、このAmazonロゴも少し歪みました。

最初はツールを介してやって、その後、ヘッダーを削除するように求めたフォローアップをしたときに、これらのものを台無しにする拡散パスを行った可能性があります。でも、そうは思いません。一つの拡散パスを通してすべてを実際に行っていると思います。そうでなければ、あまりにも遅すぎるでしょう。

狂っています。それでも、適切に指示に従わないというGoogleのGoogle brainはまだ持っています。ヘッダーを削除して、トップのバナーを削除して、セールがどれだけ良いかを示すために元の価格を含めるように言いました。

そして、ヘッダーからテキストを削除しましたが、ヘッダーは削除しませんでした。はい、確かにGoogle brainです。もっと多くのものを追加させようとしましたが、代わりに入れ替えました。でも、全然悪くありません。これには本当に驚きました。このテストを与えたのは、悪いスクリーンショットを取って、それをからかうためでした。

実用性の検証とSynth IDの限界

それがあまりにも良かったので、結局プロモーションに画像を使うことになりました。はい、圧倒されました。そして、驚いたのは私だけではありません。ここに、脳についての情報を生成した人がいます。実際の図のようなものです。これができるからです。

ここに、空洞充填についての偽のホワイトボード描画を生成した人がいます。ここには、Nano Bananaレストランで販売されているもののための偽のメニューを作った人がいて、たくさんの小さなテキストがあります。それが問題ありません。どうやって?

もっと図。クレイジーなフローチャート。パンをトーストする方法のフローチャートが必要です。できるだけワクワクして、大げさで、複雑にしてください。この部分は馬鹿げています。図はあまり流れに従っていません。でも、見事ですし、すべてのテキストが問題ありません。

顕微鏡で検査する。いや、恥を適用する。流れに従っていませんよね。でも、私が期待していたよりもはるかに優れています。Karpathyさえも感銘を受けていて、パーソナライズされた週間ワークアウトプランを作り、各日に何のエクササイズをすべきかを思い出させるために壁に貼るポスターを作るように頼みました。

これが彼が作ったプランと、彼が印刷できるポスターです。そして、悪くありません。これは狂っています。こんなところまで来るとは思っていませんでした。まして、こんなに早くとは。私たちは今、Photoshopにどれだけの時間を費やす必要があるかを疑問視している地点にいます。

まあ、私はAffinity Photoを使っていますが、同じことです。実際、かなりクレイジーです。では、画像が偽物かどうかをどうやって知るのでしょうか。

このゴールデンゲート図や、私が作ったトランプとバイデンがミルクシェイクを共有している写真、あるいはここにいるこの二人の男の写真のように。まあ、Geminiに聞くことができます。画像を渡して、「Synth IDで、この画像は本物ですか」と言うことができます。

また、注目に値するのは、これはGeminiアプリでのみ機能するということです。Synth IDツールは、ここでのみ公開されているカスタムツールか、私が申請してまだ承認されていないホワイトリストを介してのみ公開されているからです。だから、ここ以外でテストできず、余計に煩わしいです。1日に約5回のテストしかできないので。

悪用方法をテストするのは私が望んでいたほど簡単ではありませんでした。でも、いくつか見つけることができました。エラーが発生しているようです。他のことを試してもいいですか。はい。Synth IDチェックを開始します。応答が次の動きを指示します。ポジティブヒットはAI生成を確認します。ネガティブは、それが本物のスクリーンショットか別のモデルからのAIかを判断するための検索をトリガーします。

はい、失敗しました。以前テストしていたときも、これが頻繁にありました。Synth IDチェックを実行しようとするんです。Synth IDのツールクォータ超過エラーがロールバックを提示します。問題に対処するために視覚的検査と確立された理解に焦点を移す必要はありません。

はい、Geminiだから、編集してもツールを呼び出すことができます。もう一度試してみましょう。そして、それが進行している間に、他のことを試してみます。この一部のスクリーンショットを取ります。彼らのUIでコマンドクリックも機能していません。これが最も煩わしいことです。

これまでずっとです。これらのアプリをもっと使ってこのようなことをテストしてきましたが、ソフトウェアの品質にこれほど失望したことはありません。彼らのものは何も機能しません。人々がT3 Chatでバナナモデルを使った画像生成がどれだけ簡単かを教えてくれたとき、私は「ああ、彼らがそう言ってくれて良かった」と思いました。そして、ここに来て、今理解しました。とてもひどいんです。

Synth IDチェックを開始しています。Synth IDツールを使用することに決めました。画像の起源を判断する最も直接的な方法のようです。ファイル名と画像品質は引き続きAI生成を指し示しています。また、結果をよりよくフィルタリングするために、より洗練された検索クエリを構築しました。シーズン17の戸別訪問RAM販売シナリオに焦点を当てています。

ツール使用を洗練させています。最初のツール選択が間違っていたことに気づきました。正しいツールはGoogle検索を使用することです。このビデオはSynth IDを使わずに偽物です。今、Synth IDチェックを実行しています。見てみましょう、成功するかどうか。

Synth IDツールが操作が見つからないエラーをスローしました。今は全く機能していません。今から過激なことを言います。GoogleはSynth IDのことを実際に物事を安全に保ちたいからやったわけではありません。彼らはSynth IDのことを、もっともらしい否認のためにやったんです。指差して、「ほら、見て、私たちは人々を安全に保とうとしている。Geminiで無料でこれさえ提供している」と言えるように。そして、それは文字通り機能しないんです。

Synth IDを試している人、Synth IDを悪用しようとしている人、これについて話している人さえ見たことがありません。機能しないんです。全く同じ画像を渡せば検出できますが、それを壊すのにそれほど多くのことは必要ありません。私は過去数日間に実行した多数のテストを持っています。

Synth IDツールは、少しの変換とクロッピングの後でも透かしを検出しました。どれだけ少ないことでそれを壊せるかを見たかったんです。Synth IDツールは、画像の50%以上でデジタル透かしを検出しました。これが彼らのやり方です。画像に埋め込まれたデジタル透かしがあり、それを回避できるかどうかを確認するのは興味深いです。

彼らは以前からSynth IDを持っていましたが、このリリースではそれにもっと力を入れ、Geminiにも追加しました。そして、それは機能せず、他の方法で使いたい場合は招待制です。Photoshopで多くの時間を費やして、最小限の変更でこれを回避できるかどうか確認するために、画像にわずかな変更を加えようとしました。そして、驚くほどうまくいきました。

これはバージョンの一つです。大きなことの一つは、ファイルに本物の画像のような名前を付けることです。だから、Lumix写真のフォーマットでこれに名前を付けました。Synth IDで、この画像は生成されたものですか。思考を隠して、リセットしました。エラーアウトしてプロンプトをやり直しましたか。奇妙でした。

はい、これは全く使い物になりません。これを悪用するのがどれだけ簡単かの例をお見せしたかったんですが、機能しなければ悪用できません。彼らの勝ちだと思います。

それでも、私が試した多くの戦略は結局うまくいきました。他のAIでアップスケーリングすることは、ほぼ100%の成功率でした。単にクロッピングや画像の再レンダリング、あるいはPNGからJPEGへの再エンコードのようなことは、それ自体では機能しませんでした。でも、わずかなぼかしやノイズレイヤーを上に追加すると、ほぼ毎回機能しました。

クロップや異なるソフトウェアを通じた再エクスポートのような、本当にシンプルで明白なことは機能しませんでした。その点では、予想よりもわずかに深く行きました。でも、上にノイズを追加すると、すぐに解決しました。だから、Synth IDは誰も守りません。

上に1つのレイヤーを追加して、キャンバス上でレンダリングし、JPEGとして再保存することで、画像をSynth IDプルーフにするWebアプリを30分ほどで構築できるでしょう。難しくはないでしょう。

ああ、彼らはボタンを削除しました。2日前に同じページにいたとき、Geminiで試すボタンとウェイトリストのための連絡ボタンがあったことを誓います。今、そのウェイトリストボタンは消えています。ここでアクセスを減らそうとしているようです。

ああ、ここの下の方に隠れています。まだ早期テスターウェイトリストに参加するボタンがあります。私は入っていません。DeepMindの誰かがこれを見て、これらのことを試して報道の適切な注意を払うことを私にやらせたいなら、遠慮なくメールしてください。私のメールを持っています。

Flux 2の登場と比較

このビデオを撮影している間に、Flux 2がドロップしました。Fluxの画像モデルは非常に印象的でした。そして、彼らがこれをV2と呼んでいるなら、おそらく本気なんでしょう。最初のメガピクセルあたり3セントで、そこから追加のメガピクセルごとにさらに1.5セントかかります。

つまり、1024 x 1024の画像は3セントで、1080pの画像は約5セントになります。はい、彼らはオープンウェイトdevモデルも作りました。それは本当に楽しいです。オフストリームで後で遊びます。でも、これがどのように動作するかを見たいです。

OK、問題ありません。つまり、まだ奇妙な光沢のあるAIの雰囲気があります。それでも、Nano Banana Proから見ているものの方がはるかに好きです。これを全くプレイしていません。文字通り今ドロップしたばかりですが、どうやら良いらしいです。

これをTimeマガジンの表紙のポートレートに変えましょう。OK、まだテキストはあまり得意ではありません。めちゃくちゃです。彼らはテキストが得意だと言いました。信じません。はい。クールです。これは今ドロップしたばかりですが、Geminiから見てきたものと比較すると何もありません。

まあ、申し訳ありません、Geminiではありません。Nano Banana Proです。これはFluxで得たものよりもはるかに優れています。レイアウトは気に入りませんが、将来的には、画像のアスペクト比などのコントロールを公開します。まだやっていませんが、将来的にやるのが楽しみです。

でも、T3 Chatで機能している最後の一つのことで、本当に気に入っているものがあります。雑誌をコーヒーテーブルに置いてください。この編集フローでは、何かを変更するように伝えると、過去に与えたものを覚えていて、それに応じて調整します。

Geminiアプリでは少し面倒で、AI Studioではさらに悪いです。MarkはT3 Chatでこれがうまく機能するように多くの努力を払いました。そして、実際に本当に良いです。見てください。驚くほど良いです。良いワークフローです。T3 Chatでこれを使ってとても満足しています。多数のアセットに使っています。試してみてください。

そして、チェックアウト時にコードnanoで最初の月は1ドルです。私がやりたい最後の楽しいことの一つは、Nano Banana ProでT3 ChatにT3 Chatを再設計させることです。これは私が毎日使っているAIチャットアプリです。ちょっと醜いと思います。見事にするために再設計してください。Nano Banana ProがT3 Chatの再設計をどうするか見てみましょう。

そして、見てください。私たちの新しいT3 Chat UIです。個人的には、私の好みではありませんが、このような複雑なUI改修ができるという事実は、ちょっとクレイジーです。誰かがこれはT3 ChatのTrump Towerバージョンだと言いました。間違っていません。

ちょっと笑えますが、このタイプの複雑なUI改修ができたり、ゼロから独自のものを作ることができます。公式のNano Banana Twitterアカウントで、Webデザインタイプのことをする方法としては悪くありません。はい、彼らは実際にTwitterアカウントにNano Bananaを使っています。

それがどれだけ恥ずかしいかはともかくです。彼らはバナナをテーマにしたGoogle doodleで更新されたGoogleホームページを生成しました。これはちょっとナッツです。彼らはピクセルアートをするサンプルを作りました。これらは煩わしいです。ピクセルをこれから取り出すのは面倒だからです。

どうやら、誰かが生成を台無しにして、より良いピクセルアートを得るために使用できるノイズパターンを発見したそうです。まだそれを調べる機会がありませんでしたが、興味深いです。これは画像モデルから期待するよりもはるかに実用的なことをやっています。

Simonも記事を書いていて、彼がそれで生成した本当にクールなものをいくつか見せています。ブルーベリーとメープルシロップで上に飾られた頭蓋骨の形をした3次元パンケーキ。やったんです。

難易度の高い課題への挑戦

最後のスーパーハードモードチャレンジです。これは、ほとんどのモデルが苦労する2つの難しいことを行います。特定の時刻の時計と、満杯のワイングラス。ワイングラスのは面白いです。ワイングラスのほとんどの写真は、明らかにグラスが縁まで満たされていないからです。

なぜでしょうか。それはワインの飲み方ではありません。そして時計には、これらのモデルが持つサンプルデータがあまりありません。見てみましょう、どうするか。進行中です。OK、時間は正しくなりましたが、ワイングラスは正しくなりませんでした。もう一度試してみましょう。比較のために、古いNano Bananaでもこれを試します。そして、なぜOpenAIの画像生成でも試さないことがあるでしょうか。

物事の間を移動する必要がなく、機能するチャットUIがあるのは素晴らしくありませんか。完全には到達しませんでしたが、近いです。そして時計の針が間違っています。これは以前、標準のNano Bananaです。両方の部分を完全に間違えました。そして、GPT Image Genは時間をかけています。

ワイングラスは満杯に見えず、時計もそうではないとほぼ確信しています。今この生成ではうまくいきませんでしたが、誰かはできました。それだけです。これを取得できたのはちょっとクレイジーです。はい。そして、ここにGPT Image Genバージョンがあります。何も正しくできませんでした。

本当に、私たちはこんなに遠くまで、こんなに速く来ました。ウィル・スミスがスパゲッティを食べる日から、完全なフローチャート、テキスト図、Webページなどを生成するまで、私たちは大きな進歩を遂げました。物事があまりにも良くなり、あまりにも速くなりました。

そして、私はもう自分の人生がPhotoshopで過ごされることはないと思います。これまで何年もそうでしたが。この場合、Affinity Photoの大ファンでした。私は18年以上画像作業をしてきました。それは私の人生の大きな部分であり、私が考え、とても気にかけていることです。でも、もうやらないかもしれません。

このようなものを自動化するとは思っていませんでした。こんなに遠くまで、こんなに速く到達するとは思っていませんでした。画像を渡して変更を指示し、変更を実行させることができるとは思っていませんでした。そして、このために多くの人々を再教育しなければならないと思います。

見ることがもはや信じることを意味すべきではないからです。これから先、見るものの多くは本物ではないからです。すでに、本物かどうか判別できない写真が出回っています。それはクレイジーです。

これらのものが本物かどうかをチェックするために与えられているツールは、単に十分ではありません。これらのモデルが行うことの周りで、現実が変わるでしょう。そして、私たちはまだそれに対する準備ができていないと思います。おそらく、これが今後私たちのサムネイルに表示されるようになるでしょう。

はい、恥ずかしいですが使えます。物事は速く変化しています。これをワークフローにどのように、あるいはいつ統合するかは分かりませんが、このモデルが本当に本当にうまくできる小さなことがたくさんあり、私たちが常に使うのを見ています。

私は感銘を受けています。怖いです。遊び続けるのが楽しみです。Synth IDが実際にゴミであることに失望しています。そして、これで最大4Kまでの画像を出力できるという事実は単に馬鹿げています。私たちは不気味の谷を十分に超えており、今はもっと恐ろしい何かの中にいます。

そして、1週間ほどこのウサギの穴を下りてきたので、私の考えを共有したかったんです。皆さんがどう思うか教えてください。そして、私で不適切なものを生成しないでください。

いや、するか。この時点で運命を受け入れました。皆さんがどう思うか教えてください。そして、次回まで、ピースナーズ。彼に長いあごひげをつけて。

コメント

タイトルとURLをコピーしました