Google、Gemini 2.5 Flash Image モデル(Nano Banana)ライブストリーム配信

Google・DeepMind・Alphabet
この記事は約35分で読めます。

GoogleがGemini 2.5 Flash Image(通称Nano Banana)モデルのライブストリームを実施し、AI Studioでの画像生成・編集機能をリアルタイムでデモンストレーションした。開発者たちがバイブコーディングを駆使して、写真編集アプリ、商品ビジュアライゼーションツール、フィルターアプリなど様々なアプリケーションを即座に構築する様子が紹介された。モデルの高速性、編集機能の自然さ、一貫性の向上が特に強調され、従来モデルの課題であったコピー&ペースト感のある編集から大幅に改善されたことが実演された。

Google Launches (nano Banana) Gemini 2.5 Flash Image Model Livestream
Google Gemini Releases Banana Model aka Gemini 2.5 Flash Image Model #ai #openai #llm

Google AI Studioでの画像生成革命

そんでな、基本的には画像を渡して、それでアプリで言うとったらな、それを色んな年代のスタイルで再現しとるだけや。その人を、その年代のスタイルで想像し直してもらうんや。ほんまにそれだけやねん。

それで、服装、髪型、写真の質なんかも含めて、その年代に見られるような詳細をちゃんと反映させとるのが見えるやろ。これはほんまにめっちゃクールやで。

このアプリはどうやって作ったんや?これはもう純粋なバイブコーディングや。基本的に数回のプロンプトで「時代を通して自分を見ることができるアプリが欲しい。ポラロイド形式でやってほしい」って感じで言うたら、すぐに基本アプリを作ってくれた。そっから細かいところを調整していく感じやった。

ポラロイドをドラッグして動かしたいとか、このアプリでできることの一つやけど、一つ振ったら再生成されるんやで。めっちゃ楽しいやろ。そういう細かいところをモデルが上手に追加してくれるんや。

これ見とったら、アマールは時間余りすぎやろって思うけど、素晴らしいのは全部バイブコーディングやから、実際に作る必要がなかったんや。

これはほんまに好きやわ。この「パストフォワード」アプリをライブでリミックスしとる人たちもぎょうさん見かけたし。実際にやってみて、スターターテンプレートから何か新しいものを作れるかライブで試してみようか?

ええな、聞こえるで。過去やなくて未来をやってみようか。システム指示を更新して、過去やなくて未来の自分が見られるようにしてみるわ。2030年、2040年、2050年とかでやってみよか。そんでそれを実行して、モデルが何を考えつくか見てみよう。

AI Studioの多様なアプリケーション

それはええな。その間に、キャット、他のアプリも見せてくれるか?スターターアプリがめっちゃたくさんあるし、ゼロから作る体験も見せられるんちゃうか。

そうやな、両方やった方がええな。アマールが見せとったように、AI StudioのBuildタブに入ったら、Gemini 2.5 Flash Imageってタグが付いた新しいアプリがいっぱいあるで。アマールが最初のやつを見せてくれとったから、今度は「ホームキャンバス」アプリの編集機能を見せたるわ。

このアプリでできることは、商品をアップロードして、シーンをアップロードして、その商品をそのシーンの中に配置して想像できることや。せやから、私のリビングルームから画像をアップロードするで。私の後ろにあるリビングルームや。みんなで私のリビングルームについて素敵なコメントしてもらえるかな、傷つきやすいから。

クッションをアップロードするわ。新しいソファのクッションが必要やと思うから。それとソファの画像もアップロードする。この画像をドラッグして持ってくるで。そしたらGemini 2.5が商品画像の文脈を読み取って、私が与えたシーンに合わせて商品を調整して、元画像に直接混ぜ込んでくれるんや。これはめっちゃ便利やで。

おお、私の汚いストライプのクッションを素敵なオレンジ色のマッチするやつに替えてくれたやん。この写真は商品を正面から撮ったやつやったけど、それでも調整して、ソファの角に配置して、すごく自然に見せてくれとる。

ちょっと難しいやつも試してみたいな。商品ってほどやないけど、最近めっちゃペットが欲しいねん。猫おって、いつも一緒におったらどんな感じかなって想像してみるわ。きっと今頃私のキーボードの上歩き回っとるやろうな。

商品ってほどやないけど、猫や。これをドラッグ&ドロップしたら、2.5が私の友達の猫のポルトを私のソファの上に直接追加してくれた。私の窓から入る光に基づいて影まで作り始めとるのが見えるやろ。2.5 Flashでの編集機能はほんまにすごいで。めっちゃ楽しくて遊べるし、新しいアパートに引っ越すときにもめっちゃ便利や。

リアルタイムでのアプリリミックス

新しい生成もキックオフしとくわ。アマール、君のリミックスがどうなったか見てみようか?

やってみよか。ここに戻ってきたら、アプリがどういう思考をしたかが見えるんや。これもバイブコーディングのときに見られることの一つで、モデルがどう考えて編集したかがわかるんや。明らかに年代についての何かを見つけて、それをファイルに反映させ始めたんやな。

アプリの名前も「パストフォワード」やなくて「フューチャーフォワード」に変えてくれた。そういう細かいところに気づいて整理してくれるんや。今度は私らのお気に入りのプロダクトマネージャーを入れて、未来でどんな風に見えるか確かめてみよか。

待て待て、お気に入りのプロダクトマネージャーって。あ、神様、君が私のお気に入りや。ライブストリームのためだけやけどな。興味深いニュースや、長いやつで話そう。

本当の質問はアマール、これはロボット未来みたいになるんか、それとも実際にどこまで先の未来を見とるんかやな。モデルは来年から向こう50年間、本当に空飛ぶ車があると思っとるみたいやで。ユートピアやな。

そうや、すごいな。どうやらBluetoothヘッドセットが復活するらしいで。ファッションは結構標準的みたいやけどな。興味深い未来の展望やな。めっちゃクールや。

これはやばいで。私にとって大きな収穫は、その場で簡単に継続的に反復できることやな。他の人がまだこれやってるの見たことないけど、もしこの体験を使ったことがなくて、初めて見とる人は、AI Studioにはこういう体験がたくさんあるんや。これらのものをシェアできるし、コードもダウンロードできる。完全にポータブルで、AI Studioに留まる必要もない。

ゼロから始めるアプリ開発

キャット、他のクールな例も見せてもらえるか?色んなモデルの機能を見ていきたいし。

そうやな、新しい生成に取り組んどるところや。ゼロから始める生成を見せられるで。AI Studioの素晴らしいところは、この新しいモデルを今立ち上げたばかりやのに、もうこの新しいモデルを使って新しいアウトレットを作れることや。

私は広告ビジュアライザーを作ろうとしとるねん。基本的に商品画像をアップロードして、それを色んなシーンや文脈で広告として配置できるやつや。モデルが生成しとるのを見とると、2.5 Flash Image プレビューモデル文字列を使っとるのがわかるで。

アマールが言うとったように、モデルの思考過程が全部見えるんや。Buildは常に2.5 Proを生成に使っとる。これはたまにTwitterで質問されるから、一応お知らせしとくで、2.5 Proや。アマール、UIに追加せなあかんな、リストに追加して。

めっちゃクールなのは、この生成でエラーが出たんやけど、バイブコーディングではよくあることで、いつものバイブベースやな。でもAI Studioがそのエラーをキャッチして、自動でエラーを修正しようとしてくれるんや。

他に気づくかもしれんことは、このUIが24時間前とはかなり違って見えることや。AI Studioとアプリレット全体でUIをたくさんアップデートして、アプリ生成のプレビューにほんまに焦点を当てて、コードアシスタントのためのスペースを増やしたんや。もちろんコードの間も行ったり来たりできるで。

実践的な商品ビジュアライゼーション

ジョーとI がエラーを解決できたみたいやな。動くかチェックしてみよか。私はアマールとポイント稼ごうとしとるねん、ローガンが彼のお気に入りのPMやってわかったから。マースの本をアップロードするわ、Amazonで買えるで。都市のビルボードの文脈に配置してみよう。

これは明らかに高解像度の商品画像でもストック画像でもない。私の机の上のマースの本を撮っただけの写真や。でもGemini 2.5がこの未来的な都市のビルボードテーマに配置してくれた。これで売上は間違いなく急上昇するで。

100パーセントやな。この話で本当に驚きなのは、アマール、私がこの本のコピーもらえてへんことや。君はキャットや他のみんなにはコピーあげとるのに、なんで私はもらえてへんねん。明日オフィスで私のにサインしてくれな。

もちろんや。本物っぽくしてくれ。クールやな。色んな文脈がどんな感じか見てみよか。ロンドンのバス停の例も試してみよう。

キャット、ちょっと聞くけど、このアプリの最初のプロンプトは何やった?生成始まっとるときに君の画面見えたから、最初は何やったん?

左側に見えるで。基本的に、ユーザーが商品の画像をアップロードして、それを色んな広告面でビジュアライズできるようにするって言ったんや。私がよう追加すんのは、クリーンな美学を使うことと、アイコンやなくて絵文字を追加することやな。明らかにモデルは独自のSVGを作るのが大好きで、その方面ではめっちゃクリエイティブやから。

でもこういうことの多くは、AI Studioのビルド体験も反復しとるから、理想的には将来こういう細かいニュアンスを追加せんでもええようになるはずや。

高品質なテキストレンダリング機能

うわ、これはそうや、めっちゃクールや。これはロンドンのバス停や。数週間後にロンドンに行く予定やから、その文脈を既に追加してくれとる。めっちゃクールやで。

モデルがニューヨークの地下鉄広告も追加してくれたみたいやから、試してみよか。でも、Gemini 2.5 Flash Imageがシンプルな画像を受け取って、こんなクールな文脈に配置できるのを見るのはほんまにクールやで。

「魔法の冒険が待っとる」か。これもここでの進歩の一つやけど、新しいモデルはテキストレンダリングがめっちゃ上手やねん。色んなテキスト文字列なんかを追加できるで。

私が実際にリミックスしてみたいことの一つは、プロモーション追加機能や。アマールの本が今100%オフやって言いたいなら。狂った割引やな、そんな話してへんかったのに。売上必要やもんな。

プロモーションメッセージを含める機能を追加って感じで、そのプロンプトを実行してみるわ。ニューヨークの地下鉄がこんなにきれいに見えたことないで。すごいな。

AI搭載写真編集アプリ

これをリミックスしとる間に、アマール、AI搭載写真編集アプリも見せてもらえるか?

ええで、そっちに行ってみよか。ここに写真を与えたら、この写真の詳細を実際に編集できることがいろいろあるんや。例えば、口ひげを変えたいかもしれん。口ひげが必要やな。

よし、やってみよか。長い口ひげをつけてくれ。これは私が記録として言っとくけど、口ひげのやつを選んだ理由は、今年の4、5ヶ月前に立ち上げた最初の2.0 Flash ネイティブ画像生成モデルで、自分に偽の口ひげを追加する例をたくさんやったからや。

ちょっとズームインしてくれる?気づいたことの一つは、画像に口ひげが付いとる感じがちょっとPhotoshopっぽく見えたことやった。でもこれは本物に見えるで。ハリソンと次に話すときは、彼がこれに取り組まなあかんと思うで。

これを評価やと偽装しとるけど、実際は君がハリソンに口ひげ生やしてほしいだけやろ。そうやな、今度はシルクハットも必要やと思うで。何かそんな感じや。

やってみよか。動くかな?言っとけへんかったけど、こういう画像の超高速反復のユースケースは、Flashがこのユースケースで輝く理由の一つやと思うで。45秒も待たなあかんかったら、こんなに楽しくないと思う。5、6秒でこういうのを継続的に反復できるから、こういう例を行ったり来たりするのがめっちゃ楽しくなるんや。

多様なフィルター機能

君が話しとる間に、モノクルもつけといたで。これで彼はモノポリーボード用意できたな。自然な感じや。素晴らしいで。このアプリは他に何ができるん?

このアプリはちょっとインセプションみたいやな。決定論的コントロールがある AI写真編集アプリで、モデル自体もこういうことの一部をできるようになっとる。私の画面では小さすぎるけど、色んなオプションがあると思うで。

モデルは色んなことができるで。これが詳細を追加できるリタッチ機能やった。適用できるフィルターもある。もっとアニメとか漫画スタイルで見てみたいかもしれん。それも実際にできるで。そういうフィルターを適用してくれるんや。

私のアニメプロンプトはあんまり一貫して動いてへんかったから、これで動くか見てみよう。漫画って言ったんか、アニメって言ったんか?わからんで。アニメフィルターを選んだけどな。

ミックスやな。悪くないで。Tシャツに印刷できそうやな。気に入ったで。そうやな、それはTシャツ向きやな。

アプリのリミックスと改良

キャット、君がさっきリミックスしとったけど、どうなったか見せてもらえる?

そうやな、君らがしゃべっとる間に私はリミックスして、新しい生成を始めたんや。見てみると、私がやったシンプルなプロンプトは「プロモーションメッセージを含める機能を追加」で、5 Proがこの素敵な小さなテキストボックスを追加してくれた。もちろん、マースの本は今無料や。

70年代の新聞スタイルに戻ったけど、この新聞広告「100%オフ」を生成してくれた。ビルボードなんかでも試せるで。一昨夜立ち上げたばかりやから、みんなの意見聞きたいねんけど、アプリビルダーにこの提案機能も追加したんや。反復しとる間に、フローに入って色んなオプションを継続して追加できるようになっとる。

これらは展開するで。「UI レイアウトを改善」って、ちょっと受け身攻撃的やな。UIは大丈夫に見えるけどな。でもこれはフルプロンプトに展開されて、それを実行したら2.5 Proが引き継いでくれるんや。他の生成がどうなっとるかチェックしてみよか。

AI Studioの機能向上

ちょっと聞くけど、これらの提案の裏で実際に動いとるのは2.5 Flash Lightなん?

そうや、まさに2.5 Flash Lightや。カスタム指示なんかもあるけど、君のアプリの現在の状態を認識しとる。せやから既に作った機能、アプリの今の見た目なんかに応じて文脈的であるべきや。

ええな。ユーザーが画像をアップロードして色んなフィルターを適用できるっていう新しいプロンプトをキックオフしたで。ここでドラッグ&ドロップしたり、クリックして選択したりできるのが見えるやろ。自分のヘッドショットを選んで、色んなスタイルを適用してみるわ。

キャット、これで失敗の一つは、このモデルをリリースした後に、私ら全員がもっといいヘッドショットを手に入れてへんかったことやと思うで。私のは2019年のやから、アップデートが必要や。マースのアプリを使って未来風のやつを手に入れなあかんな。

クールやな。色んなスタイルが見えるで。ピクセルアート。フィルター適用中やな。私が追加したこの小さなアニメーションが気に入っとる。バイブコーディングの素晴らしいところの一つは、考える必要がないことや。ただバイブするだけや。

内部エラーが出たな、よくあることや。立ち上げ日やから、TPUが燃えとる。TPUが燃えとるし、私ら三人ともAI Studioを猛スピードで動かしとるしな。それも問題やな。

服装ビジュアライゼーション機能

服装ビジュアライゼーションをもう一回プロンプトしてみるわ。これも時間かかるけど、これがやることは自分の画像をアップロードして、試着したい服のアイテムの画像をアップロードして、実際にどんな風に見えるかを正確にビジュアライズすることや。

これが生成されとる間に、アマール、ASの新しいUI更新をハイライトしてくれる?

ええで、バイブコーディングの機能を追加しながら、実は広いAI Studio UIにもたくさんのアップデートを加えとったんや。フィードバック聞いたで。モデルを見つけるのが難しいっていうのを、めっちゃ簡単にしたんや。

新しいモデルピッカーができたで。ドキュメントから詳細が全部手に入る。ここのボタンをクリックしてドキュメントに直接ジャンプしたり、モデル文字列をコピーしたりできるで。提供してる色んなモダリティも見られるようになった。

画像生成や。私らの写真がこの上に乗っかっとるから、動かしてもらえるかどうかわからんけど。ズームインしたら実際に動くな。色んなタブが見えるやろ。ライブストリームではあっちはクリックせえへんで。

詳細が全部手に入るし、フィルタリングも欲しいって聞いとるから、それも近々来るで。これがヒントしとるのは、間もなく一つのプレイグラウンドができて、色んなページを飛び回らんでも、これらのモデル全部を切り替えられるようになることや。そこの部分がほんまにシームレスになるで。

会話タイムライン機能

もう一つの新しい機能で、私の新しいお気に入りは、長い会話をしたことがある人なら、その会話の適切なポイントに戻るのがめっちゃ難しいことがあることや。そのポイントを見つけるために一番上までスクロールしなあかん。

でも今はこのタイムラインを追加したから、会話の色んな部分が実際に見えるようになったんや。そこにジャンプできるし、私のお気に入りの小さな秘密は、上下の矢印を押したら、実際に行ったり来たりできて、エンターを押したら探してたポイントにジャンプできることや。

AI Studioの体験をもっと使いやすくするための、あっちこっちの小さな調整やな。

それはええな。モデルをプロトタイプして機能をテストするときのチャットUIの体験から、ビルドに行ったときに見る体験まで、一貫性を保つっていう別のスレッドもあるんや。UI体験が一貫してて、ボタンが同じ場所にあって、全部同じことをするっていう一貫性を確保することや。

AI Studioで色んなユースケース全体をやるときに、APIキーを取得して、プロトタイプして、モデルをテスト して、基本的なリクエストをたくさん送って、アプリをビルドする、そういう体験がどこでも同じに感じられるのが楽しみや。

バーチャル試着機能の実演

100パーセントやな。キャット、君の方はどうや?

うまくいっとるで。Geminiが生成したんや。これは「服装をビジュアライズしてくれ」っていうアップデートされたプロンプトで、Geminiがこの素敵でシンプルなUIを生成してくれた。気に入っとる。自分の写真と服のアイテムの写真をアップロードして、この美しい黒いスウェットシャツのバーチャル試着を手に入れたんや。私らが言うところの、アマールの日常オフィス服やな。

正式にプロダクトデザイナーやな、キャット、ありがとう。アマール、ローガン、これをリミックスする方法について何か考えはあるか?複数のやつを持ち込むとか。

私にとってアプレット体験での最大の収穫の一つは、私がやりたくて見せたいバイブコーディングしたやつは基本的やけど、このポイントを押さえとることや。チャットUIはこのプロトタイプの一部には素晴らしいけど、モデル機能を本当に素早くテストする場合、本当に深い体験や幅広い体験をしたいときは難しいんや。一回のチャットターンで15個の異なることはできへん。

せやから、アプレットやビルドタブを通してこういうことをやるのは、その体験を実際に生きたものにする素晴らしい方法やねん。5つの異なることを組み合わせて、モデルが実際に同時に全部やってくれるかどうか見てみるのは楽しいと思うで。

私は5つは頼んでへんから、2つやったら勘弁してくれ。生成面で何が得られるか見てみよう。モデルがやっとるアップデートを見るのがいつも好きや。

ファイル変更の追跡機能

アプレットでええと思うことの一つは、これらのファイル名の上にカーソルを合わせたら、それぞれのファイルで実際に何を変更したかのGeminiが生成した要約を提供してくれることや。大きなアプリケーションをコーディングしとるときにめっちゃ便利やで。たくさんのファイルが作られとる。何が起こっとるかいつもわからん。

ここで各ファイルで実際に何をしたかが正確にわかるで。編集を加えたときも、特定のファイルで実際に何を編集したかを正確に見せてくれる。アプリケーションで何が変わっとるかを実際に把握しとくのにめっちゃ便利や。

それはええな。ずっと言い続けとるリマインダーやけど、みんながここに最初からいたわけやないと思うから。これと非常に似た体験をキックオフしたい場合は、AI Studio、AI.studio、apps、左上の角や。実際についてきて、私らがビルドしながらこういうものをたくさんビルドできるで。

クールなものをビルドしとったら、インターネットのどこかにコメント欄があるから、みんながシェアしとるクールなものを誰かが見つけてくれるで。キャットとアマールと私は、これが終わった後にそれをたくさんリミックスするで。

リアルタイムでのコラボレーション

ローガンのTwitterの言及を爆破するのはやめてくれ、私のTwitterを爆破せんといて。カマール、彼らに送ってくれ。

よし、試してみよか。どうなるか見てみよう。私は100パーセント明日シルクハットをかぶって現れるつもりや。

Twitterでみんなが「君らはライブストリームでバナナのコスチュームを着るべきや」って言うとったのに申し訳ない。でも郵便で紛失したか、予算がなかったかや。アパートの周りを見回して、後ろにバナナでも置けるかと思ったけど、バナナ切らしとったんや。この2週間、バナナのことが多すぎたからな。

実は面白い話やけど、私バナナアレルギーなんや。今頃出てくるなんて信じられへん。

よし、モデルが私をちょっと誤解したみたいやな。2つの別々の画像を生成して、全部一緒に試着させてくれとる。そこでプロンプトを続けて反復して、理想的には1つの合成画像にしたいんやけど、みんなをここに座らせてモデルと続けさせるのは嫌やから、私の15画像コラージュを見せたいねん。

モデルに、リクエストオブジェクトが「プロンプト、画像、カンマ、画像」みたいなのを渡すだけでええような気がするねん。それで全部一度にやってくれると思うで。

これは、開発者で実際に何が起こっとるかちょっと知識があったら、本当に役立つ例やな。コードに入って、欲しいものを手動で編集できるからや。モデルが非常に単純な間違いを続けて犯すときなんかに便利やな。

コードビューでの直接編集

そうやな。このコードビューに行ったら、すべてのファイルをナビゲートして、検索もできるで。Geminiサービスには大体、使っとるモデルが正確にわかるようになっとる。ファイブコーダーでプロンプトエンジニアやったら、ここでプロンプトも編集できるで。

ローガンが言うとったように、特定のことを編集して認識を持ちたい場合は直接編集しに行けるけど、私はバイブコーディングするで。それがええな。バイブし続けよう。

AIパワードコラージュアプリ

このコラージュを見せたいねん、画面に表示されとるかどうかわからんけど、これが気に入っとるからや。これは「AI パワードアプリコラージュを作って」っていうほんまにシンプルなプロンプトやったんや。私の画面がまだ画面に表示されとるかどうかわからん。それやったら描写するだけや。どんなにクールか想像してくれ。

そこにあるやん。ローガンの写真がいっぱいや。ローガンの写真がいっぱいや。でも私がこれで気に入っとることは、自分では思いつかへんかったようなクールで独特な視覚的スタイルがめっちゃたくさんあることで、モデルに責任を委ねて、こんなんが実際にめっちゃかっこええっていうのを思いついてもらうことや。

下のこれがほんまに気に入っとるし、これは素晴らしい新しいプロフィール画像になりそうや。画像を入れたらモデルが15のバリエーションを作って、それを全部一つのUIに入れてくれるGemini 2.5 Flash Image パワードコラージュアプリを作って、っていうプロンプトやった。反復の観点からほんまに楽しかったで。たくさんのクールなものがあるな。

Nicole PMによるモデル解説

キャット、その例を動かすことを確実にし続けとる間に、実際にニコルを呼んでモデルについて話してもらおうか。ニコル、ライブで私らとバイブコーディングするか、モデルについて話すか、どっちでもええで。ニコル、自己紹介してあいさつしてくれる?

みなさん、こんにちは。私はニコルです。GoogleでGemini 2.5 Flashを含む画像モデルの仕事をしとるPMや。このリリースにめっちゃ興奮しとるで。これに参加できて嬉しいわ。君らがこれまでにコーディングしたもの全部気に入っとる。ラップトップ持ってきてへんから、このうちの何個かに私の顔を自由に使ってくれてええで。

このモデルで遊びまわって楽しんでもらいすぎてるな。他の人たちにも楽しんでもらって、他の人たちのためにQPSをちょっと節約するのがええな。

モデル開発の背景

ニコル、君と私と研究チームのたくさんの人たちで、モデルの背景コンテキストについて深く掘り下げた会話を実際に録音したんや。それを作るのにかかったこととか。今ライブでその話の一部を聞かせてくれるか?このモデルで君が興奮しとることとか、本当にうまくいったこととか、次に来ることとかを全部。

ちょっと話したけど、明らかに今年の3月の時点でやと思うけど、2.0 Flash from usを見た人もおるやろ。あのモデルについてたくさんのええフィードバックもらったで。みんな、どんなに速いかを気に入ってくれた。生成編集で素早く反復できることとか、君らが既に話したことの一部やな。

モデルで動いてへんかったことについてもたくさんのフィードバックもらったで。そういうフィードバックもらうのが大好きやから、ここでもぜひやってくれ。君らが言うてた、誰かに口ひげを追加する編集をしたときに、ちょっとコピー&ペーストしたみたいに見えて、自然にブレンドしてへんかったことなんかや。

視覚的品質が、ちなみに同じチームが作っとるImagineモデルより遅れとったんや。せやからそれを本当に推し進めたかった。一貫性も本当に推し進めたかった。それらが2.5 Flash でほんまに焦点を当てた大きな領域やったんや。

どこに着地したかめっちゃ興奮しとるで。視覚的品質は素晴らしいし、指示に従うのもめっちゃよくなった。編集ももっと自然に見えるやろ?画面にローガンの画像がたくさん見えるのを見とるだけや。その深い対話でもそれが見られるで。私らはローガンの画像作るのが大好きやねん。

進歩にめっちゃ興奮しとる。この一般的な一貫性機能は、私らが本当に推し進めたかったものや。キャットが見せてくれたデモに翻訳されるで。部屋の家具を見せて、君のスペースがどんな風に見えるかを再構想できるんや。キャラクターでもできるし、自分自身でもできる。これらのモデルとの本当に新しい種類のインタラクション方法みたいに感じられて、めっちゃ興奮するで。

モデルの改善点と今後の課題

ニコル、人々が感動しとるのを感じるで。どこまで言えるかわからんけど、次に何が来るかについて。うまくいかへんものの例を送ってくれたら、それらのことでモデルをよくするけど、特に知られとる制限について具体的に文書化もしたやろ。それらは改善したい事柄やと思うけど、私らが改善の岩を坂の上に押し続ける中で、君の頭の中にあることはあるか?

あんまり言いすぎんようにするけど、このモデルが望んどるほどよくないと知っとることの一つは、テキストレンダリングや。簡単なことは比較的うまくいくし、テキストを指定したときはかなりうまくいく。でも「新しいイタリアンレストランのメニューを作って」みたいに非常に汎用的なことをして、モデルが画像に入るテキストを考え出さなあかん場合は、望んどるほどうまくいかへんのがわかっとる。せやからそれは間違いなく取り組みたい領域の一つや。

前にスタイライゼーションについて言うてたと思う。それもうまくいく領域や、でもすべてのスタイルに対してやないし、十分に一貫してへん。せやからそれも続けて押し進めたい別の領域や。

ローガン、私らが話したときに、この事実性の最前線を押し進めることについても話したな。インフォグラフィックなんかを作るとき、見た目がええだけやなくて、実際に正確な情報も持ってて、使えるものにすることや。これまでできへんかったユースケースなんかでな。

せやから、それらが続けて押し進めたい主要なことやと言うで。明らかに、このモデルでうまくいっとることについてフィードバックを送ってくれ。それを私らのバックログに追加して、修正に取り組むで。

それは気に入ったで。ゼロショットかワンショットイタリアンレストランメニューは、APIへの明確な道筋にあるに違いないと感じる。それができたら、何でもできると感じるで。それはめちゃめちゃ難しい、特に画像生成テストみたいに聞こえるで。これが私らのAGIベンチマークになるで。ここで最初に聞いたで。

チーム紹介と今後の展開

それは気に入ったな。ニコル、ほんまに興奮しとる。私らと一緒にバイブコーディングしたかったら歓迎やで。そうでなかったら、立ち上げがスムーズに続くように、今頃消すべき火事がたくさんあるのは確実やな。君はXにおるな。せやから公式にXにおるで。

私は公式に、この立ち上げのために私にXを取得させたのは君の責任や。みんな、それはローガンの責任や。まだサブハンドレッドフォロワーで、ニコルをフォローしに行ってくれ。ニコル、うまくいかへんものを送ってくれ。うまくいくものを送ってくれ。

チームの観点から、このモデルをドアの外に出すことを確実にするための遅い夜の押し込みと、それを実現させるための研究チームへのハードワークに対する私らの感謝を伝えてくれ。

ありがとう。モデルを輝かせてくれてありがとう。申し訳ない、キャット。ニコル、Twitterからもう一つ質問。みんな、なんでNano Bananaなんや?

功績は私らのチームのPMのナナに行くで。彼女がモデルをリリースするのにかかったこれらの長い夜の一つの午前2時30分に名前を思いついたんや。彼女がそれが面白いと思って、実際面白いねん。独自の命を持つようになった。せやからナナに功績を与える。私らはそれが大好きや。

すべてのええミームは、午前2時30分にランダムなアイデアを思いつく誰かのPMから始まるねん。せやから気に入ったで。それは素晴らしいな。

素晴らしい。まあ、ニコル、もう一度ありがとう。オマール、君が戻って、私らがもうちょっとバイブコーディングした例を見せてくれるか?君が見せてくれたかったフィルターのやつが実際にあったと思う。

Creative Labsのフィルターアプリ

そうや。これはCreative Labsの人たちが作ったやつや。いつも何か楽しいものを作っとる。Creative Labsにちょっとシャウトアウト。Creative Labsは最もクールなものを思いつく。みんなXやTwitterや他の場所におって、AI Studioに入るものをたくさん思いつくんや。

素晴らしいな。ダン、アレックス・チェン、君らがこれを作ってくれてシャウトアウト。いつも私らに新しいおもちゃをくれる。

ローガン、君の口ひげと競争するコメントをたくさんもらっとったから、この大きいヒゲフィルターでいこうと思う。何が起こるかわからんけど、自分の写真を撮るで。

下でヒゲをくれるはずや。何が起こるか見てみよう。でも何個かキューできるみたいやから、8ビットのやつもやってみよう。うわ、それは私らが求めとる見た目やない。でも確実に君に負けへんで。8ビットのやつを手に入れた。それはめっちゃクール。うわ、ほんまにええな。それはプロフィール画像素材みたいやな。正直に言って、非常に独特な視覚的アイデンティティみたいに感じるで。

そうやそうやそうやそうや。メガネも下げてくれとる。細かいところまでできとるで。売れた気分や。正直に言うで。コミックブックのやつも。うわ、小さい吹き出しまで追加してくれた。それはめっちゃクール。ええな。「エウレカの瞬間」って何やったん?混乱しとる。

Anna Bananaがうまくいったときや。それから私がほんまに老けたときどんな風に見えるか。どんな風に見えるかわからんで。

それは気に入ったな。アンダー、ちょっとダブルクリックすると、これは私らが他の例で見たのと似とる。文字通り画像をキャプチャしとるだけや。裏でたくさんのプロンプトがあるで。

うわ、君は老けてもええ感じやな。それはほんまにほんまに老けとる。でもそうや、文字通りそれだけや。それがこのアプリのクールなところで、私らは君にこれらのアプリをリミックスして、実際に自分の方向に持っていって、自分のフィルターを追加してほしいねん。

せやからこのアプリでカーソルを合わせとるとき、私らが実際に君にフィルターが何かを教えとるのが見えるやろ。私らが君に、モデルに与えとるプロンプトが何かを教えとる。モデルはただそれで作業して、これらの画像を変換しとるんや。それはそうや、ただ素晴らしいな。1つか2つのええプロンプトがあったら、素晴らしい結果が得られるで。

アプリの共有とデプロイ機能

それはかっこいいな。それは気に入ったな。もっと見せるものある?そうやな、そうしたいで。一つは、1つのプロンプトでうまくいったことや。私ら戻ってきて、秋の背景にレイヤーをくれた、それは重要や。

どんくらいプロンプトがかかった?もう1つのプロンプトだけで君はよかったんか、それとも実際にモデルにうまくいかへんかったらクビになるって脅しをかけなあかんかった?同じやけど、私は最初にワンショットを与えて、それで釘付けにしてくれた。せやから脅しは必要やなかった。

でもそうや、この1つのプロンプトに基づいて更新してくれた。見るのが気に入っとる。でも私はまた、いくつかの異なる方法で君のアプレットを世界とシェアするのがどんなに簡単かも見せたかったんや。

右上のこの「アプリをシェア」をクリックしたら、これは私らの顔がこれを覆うことになる例やと思うから、プロダクションクルーが私らを消して、画面の右上の角に焦点を当ててくれるかどうかわからん。素晴らしい。うわ、これは魔法や。完璧や。

右上のシェアをクリックしたら、この公開オプションがあるやろ。これを有効にしたら、このリンクが誰でもアクセスできるライブになる。せやからこれをツイートできる。みんなバーチャル試着で遊ぶのに死にそうになっとるのがわかるから、後でこれをソーシャルでシェアするで。

君のアプリを世界とシェアするのがめっちゃ簡単になるで。それからGitHubコミットグラフを点灯させ続けるのが好きな人たちのために、ここから新しいリポジトリも作れるし、進むにつれてコミットを追加して、間違い、あ、間違い。途中でコミットを作って、君のアプレットをGitHubと最新に保つことができる。それから君がバイコーディングしとる他のツールからもアクセスできるで。

2.5 Flash Flashlightが実際に私にええコミットメッセージを生成してくれて、これらの変更をステージしてコミットできるのも見えるやろ。それでGitHubと同期するから、それはええオプションや。ここに私のリポジトリへのリンクがある。

それは素晴らしいな。キャット、私は、これらのアプリを友達とシェアしたいねんけど、大体携帯で使っとる。これらのアプリは携帯でも動くんか?

そうや、間違いなく。これらのリンクに携帯でもアクセスできるで。アプリで遊べるし、コードアシスタントも使えて、君のアプリのリミックスを始めることもできるで。

素晴らしいな。携帯でそれができるのは知らへんかった。携帯で今リミックスできるけど、まだゼロから始めることはできへん。ゼロから始める体験はできれば間もなく来るで。

ゼロから始める体験は間もなくもっとよくなるで。一つのことは、プロンプトを実行しとるときやコードアシスタントなんかでページに留まっとく必要があることで、バイブコーディングしとるときに私らと一緒におることや。生成中に他のアプリに出て行ったりなんかしたら、今は中断されるけど、将来はめっちゃシームレスになるで。

移動中にプロンプトを送信して、10分後に戻ってきて、コンピューターで開いて、携帯デバイスで開いて、生成の進行状況を見ることができるようになるで。

最後のオプションは、このCloud Runにデプロイオプションや。アプリを自分のドメインにデプロイしたかったら、Cloud RunとGoogle Cloudを使ってデプロイできる。私らが君のアプリをコンテナ化するで。めっちゃシンプルにする。これは押す必要がある唯一のボタンや。ライブになるのに数分かかる。でもめっちゃ簡単に始められる。

うわ、それはほんまに速かった。Cloud Run、素晴らしい仕事や。そうや、今私はこのアプリURLを持っとるし、開いたら準備完了や。せやから、このリンクもシェアするで。

君がそれを演出したんか、それとも分単位でかかるふりをしとっただけで、実際はいつもあんなに速いんか、ほんまにわからん。いや、それは特に速いやつやった。それで、つまりいつもあんなに速いってことや。いや、大体1、2分や。でもあれは特に印象的やった。せやからデモの神様が私らと一緒におったときの一つや。

ユーザーフィードバックと今後の改善

それは気に入ったで。私はXのコメントを見とって、誰かが拒否とかについて言うとって、時々うまくいかへんけど、もう一回試したらうまくいくって言うとる。これを調べるで。初日初週の色んな設定で多分いくつかのちょっとした問題があると思うで。

せやからそれはええ提案や。誰かがプロンプトキューイングを要求した。私らは今ライブで機能リクエストを受け取っとる。プロンプトキューイングかっこいい。やるべきや。ローガンが君にそれを言うように金払ったんか?いや、いや、私らはそれに取り組んどる。間もなく手に入るで。

誰かが「AI.studioappsダウンしとる?」って言うた。見てみよう。ダウンしてへんはずや。いや、私には動いとる。他のみんなには動いてへんかもしれんけど、私には動いとる。Creative Labsのアレクサンダーチェンもチャットで見とる。それはアプリや。あ、それはアプリやからや。申し訳ない。studioアプリ。appsって確実に言うてへんのか?ストリームの上の左上の角にはappsって書いてある。

両方動くかもしれんけど、両方動くで。そこに行ったで。見てみ。せやから、いや、ダウンしてへん。それは気に入ったで。誰かがサムネイル生成器を作っとる、それはめっちゃクール。実際それは別の素晴らしいユースケースやと感じる。私ら、アマール、君は私らのチームの他の誰かとこのライブストリームのサムネイルのいくつかを手作りしたけど、今度は純粋にNano Bananaを使ってやらなあかんと感じるで。

Nano Bananaは関わっとったけど、Figmaもちょっと関わっとった。Nano Bananaは関わっとった。全部のアニメーションを作ってくれた。私ら全員をこれらのアニメの服装に入れて、めっちゃ簡単にしてくれたナタリーにシャウトアウト。

それは気に入ったな。これはめっちゃ楽しかった。もっとこういうのをやるべきや。やることとミーティングと出荷する他のものがたくさんあるけど、ハングアウトしてバイブコーディングしてくれて感謝するで。

Nano Bananaでもっとたくさんのものが来る。AI Studioでももっとたくさんのものが来る。せやからみんな、調整して、ハングアウトしてくれてありがとう。インターネットで会おう、プロダクトフィードバックとリクエストを送って、うまくいかへんときを教えてくれ。キャットとアマールにピングして、私にはピングせんといて。実現させるで。

そうや、リフィングしてくれてありがとう。ええな。ええな、みんな、さようなら。また会おう。素晴らしい一日を。

個人的な感想とライブテスト

テスト、テスト、テスト。よし、ちょっと待ってくれ。ここで音量レベルを調整して、始めるで。

せやから、みんなはどう思った?Nano Bananaが元の名前で、今は何て呼ばれとるんや?Gemini 2.5 Flash Image プレビュー。みんなはどう思う?

個人的に、そうや、これがNano Bananaやった。今は他の名前で呼んどるけど、これがそうやった。画像エディターとして言わせてもらうと、これまでテストしとるけど、めっちゃええ感じや。今いくつかの生成を見せるで。

ちょっと待ってくれ。よし、テスト。テスト。ブーム。ここで、プロンプトは何やった?「美しいブロンドの髪をくれ」。そしてやってくれる。せやから、物を追加するのがめっちゃ上手みたいや。

「テキストをnano bananaに変更」。それもめっちゃ簡単にやってくれる。せやから、画像編集、テキスト編集の能力について話すなら、テキスト編集はそれの弱い点の一つやって言うとったけど、これはめっちゃええ感じや。

間違いなく、同じ種類のフォントと他の全部とスタイルを取ってくれた。せやからめっちゃええ感じや。「背景を宇宙とブラックホールの近くにして」。

私は実際に10分でインタビューがあることの通知をもらったんや。完全に忘れてた。申し訳ない。完全に空白になった。どうやら今日2人の人とのインタビューを2つやることになっとるのを完全に忘れてたんや。

ジョゼフ、ほんまにありがとう。私は自分のサムネイル全部にそれを使うべきや。めっちゃええ感じや。文句言えへん。

他にもいくつかの異なる生成をやったのがあったか見てみよう。とにかく、でも今日はファルザドと一緒にポッドキャストをしてた人のハンスと話すことになっとる。せやから彼を知っとる人のために、彼とのインタビューをやるんや。イーロン・マスクがやっとることについてちょっとチャットするだけや。

ウェス・クルーズ、それは気に入った。実際にここでもっとええのをやったと思う。見られるかどうか見てみよう。流れるような髪のやつでもっとええのをやったような気がするで。私のサムネイル全部にそれを使い始めるかもしれん。

他にもやったのがいくつかある。せやから今のところ、画像生成品質、まあ、画像編集品質は素晴らしいで。画像生成、そういうもの全部は、人々があんまりよくないって言っとる。まだ完全にテストしてへんけどな。

ライブストリームでGoogleを打ち負かしたのはめっちゃびっくりした。Google開発者向けにやっとるからやと思うで。何らかの理由で、あんまりよくなかった。プラス、事前に発表してへんかったしな。せやからWhit Snakeに参加してもええで。そうやな、そこに行け。

グラフィティに変更してみよか。グラフィティってどう綴るんや?多分そんな風に綴らへんやろ。ウェス・ピット、そうや、ありがとう。

私は間違いなく、リアルに見えるとは言わへんけど嘘はつかへん。とにかく、後でこれの完全な取材をするで。私がオンラインに飛び込もうとしてたのは、10分前に発表したばかりで、ライブストリーミングを始める前やったからや。せやから飛び込んでチェックアウトしようと思ったんや。

1から10のスケールで教えてくれ。10が素晴らしい、1が何もないとして。この特定のことにどんくらいワクワクしとる?つまり、これについて興奮しとるか?画像編集なんかをやっとるなら、これは君のツールスイートへの素晴らしい追加になりそうや。

これはPhotoshopキラーやと思うか?Photoshopの使用量に食い込むと思うか?ライブでインタビューやってしまおうか。それができるかどうかわからんけど。

あ、見てみ。これがグラフィティや。Nano Bananaや。それはグラフィティか?Nanoは間違いなくグラフィティや。Bananaはきれいで整いすぎや。つまり、Nanoは、グラフィティの見た目を100%釘付けにした。Bananaはもうちょっと均等やったり何やったりで、グラフィティには整いすぎとる。でもめっちゃええと言わなあかん。

編集機能のせいで10のうち9やな。編集はここで素晴らしいと言わなあかん。ちなみに、今日後で、Grokで画像やその他いろんなものを使って完全なゲームを作り続けとる人たちにインタビューするで。

せやから、バイブコーディングゲームに興味があるなら、かなり大きくて、かなり印象的なゲームを完全なグラフィック、バンパイアサバイバースタイルなんかでクランクアウトしとる2人の人と話すで。

それは私の邪悪な双子の兄弟やな。そうやな。みんながそれぞれのアプリを作れるようになったら、さらには一部の人が話しとるように、いつか君の携帯で、君が使っとるエッジデバイスで、必要なアプリを何でも自動生成するようになったら、アプリストアに何が起こるかめっちゃ気になるで。

こういうものがその場で作るのが簡単になったときに、SaaSがどこに行くか、アプリストアがどこに行くかが気になるで。

バナナを修正してくれ。ウォーターマークはあるか?あるで、それは実際にええ質問や。みんなが見えるかどうかわからんけど、右下に、彼らのAI画像アイコンみたいなやつが見えるで、何て呼ぶんかわからんけど。

せやから、そこにあるで。よし、いや、バナナをグラフィティに変えてくれてへんのは変やけど、4分でそのインタビューがあるのを完全に忘れてた。せやから降りるで。申し訳ない。

普通スケジュールするもの全部は通知もらうし、気づいとる。それから他の人が私らのためにスケジュールするものは、どうやら私は忘れてまう。通知もらって助かったで。そうでなかったら今頃電話かかってきて「どこにおるんや?」って言われとったやろ。

せやからめっちゃありがとう。自分で削除できる。そうや、何らかのウォーターマークやない何かをやることについて話しとった。見えへんけど、ウォーターマークみたいやけど、そんなに見えへんものって忘れたけど何って呼ぶんや。

ウォーターマークやけど、視覚的に明らかやないものや。AIやって示唆するものがそこにあるけど、視覚的に明らかやない。せやからいつかGenie 3を試すのが楽しみや。それはめっちゃめっちゃ興味深くなりそうやで。

今のところ、やったもののほとんどは、めっちゃうまくやってくれた。ピクセルアートを求めたのがいくつかあって、そんなにうまくやってくれへんかった。バナナを同じ流れるようなグラフィティテクスチャに変えられへん。でもそれ以外は、絶対に絶対に。

Vulpaが言っとる「わからん。私のPhotoshopは全ソフトウェアがそうあるべきように海賊版や」。本物の海賊みたいに話すな。その素晴らしいノートで降りよう。

知らん人のために、私はPhoto Peを使っとる。photoopa.comやで。無料や。広告ブロッカーがインストールされとったら素晴らしいで。ほんまにええで。基本的にPhotoshopのコピーや。Photoshopがええところがあっちこっちにちょっとあるだけで、でもほとんどのことには、これはめっちゃすごいで。せやからPhoto Peep。

ミラ・ミアティはAIの選ばれし者や。彼女がそこで何を作っとるかめっちゃ気になるで。とにかく、みんなめっちゃありがとう。今日参加してくれてありがとう、私と一緒に参加してくれてありがとう。みんなに感謝しとるし、次回また会おう。ありがとう。

コメント

タイトルとURLをコピーしました