なぜ皆がGoogleの新AIを恐れているのか

Google・DeepMind・Alphabet
この記事は約10分で読めます。

この動画では、Googleが開発したとされる最新の画像編集AIモデル「Nano Banana」について解説している。このモデルは複数の人物を自然に合成し、カメラアングルを変更し、写真を復元する能力を持つ。特に注目すべきは、生成された画像が現実と見分けがつかないほど高品質である点だ。動画では7つの具体例を通じて、このAI技術がいかに革新的である一方で、誤情報の拡散や社会的信頼の失墜といった深刻な社会問題を引き起こす可能性があることを警告している。現在、AI生成画像を識別する唯一の方法はテキストの歪みを確認することだが、多くの人がそこまで詳細に確認しないため、オンライン情報の信頼性が根本的に脅かされる時代に突入することを示唆している。

Why Everyone is Terrified of Google's New AI.
Want to stay up to date with ai news - 🐤 Follow Me on Twitter 🌐 Checkout My website - http...

Googleの革命的AI「Nano Banana」が世界を変える

この動画では、文字通り世界を変える何かについて話すで。いつもそんなこと言うとるけど、この動画を見たら、なんでそう言うたかが分かるはずや。今日の後半、Googleは「Nano Banana」というモデルをリリースする可能性が高いんや。

このモデルは、基本的に画像編集において最先端のもんなんやな。そして、この技術が他のすべてのAIリリースと根本的に違う理由は、現実とAIを融合させるシステムを手に入れたってことや。これには深刻な影響があるんやけど、それについては後で話すわ。でも、このモデルがどうやってこれを実現してるかを見るのは確実に興味深いで。

複数の人物を自然に合成する驚異の技術

最初に見せたいのは、このモデルが複数の人物をどう扱うかってことや。以前にtrack GPT imageでちょっとした兆候は見えてたけど、この画像モデルは完全に次元が違うレベルやな。この動画では、このモデルが優秀な7つの異なる例を見せるつもりや。

この最初の例で、複数の人物に対してモデルがどれだけうまくやれるかが分かるはずや。今のところ、このモデルにアクセスしたかったら、まだできへんのや。LM Arenaを使って、運良くNano Bananaのランダムモデルの一つを引き当てるしかないんやな。でも、この複数人物の例は、同じ環境で二つの異なる人物を合成することにおいて、このモデルがどれだけ優秀かを示してるわ。

MicrosoftのCEO、GoogleのCEOが両方とも同じ画像にいるのが見えるやろ。信じられないことに、もし誰かが右下の画像について、Nano Banana以前にAI生成されたものかって聞いてきたら、私はノーって言わなあかんかったやろな。これは彼らが一緒に休暇を過ごしてる可能性が高い画像や。AI画像を見抜く目を持ってる私でも、AI コンテンツを見る時間が多すぎて訓練されたって言えるほどやのに、特にこのNano Bananaモデルでは、見分けるのが非常に困難になったって言わなあかんわ。

理解しなあかんのは、多くの人がこの画像がAI生成やって識別できる理由は、競合他社同士の二人の著名人が、ランダムな場所にいるっていう事実があるからやねん。

でも、もしこれがネット上の二人のランダムな個人で、彼らがおそらくいるべきでない場所にいたらどうなるんやろ?その影響は本当に深刻やで。

複数の人物を画像に配置するだけが唯一のことやないんや。もう一つの使用例として見なあかんのは、角度の変更やな。

カメラアングル変更の驚異的な精度

Twitterのこのユーザーによると、Nano Bananaはカメラアングルの変更が非常に得意やって言うとるんや。ここにある二つの画像を見ると、これは非常に驚異的やな。両方の画像を見て、左の方が、そして本当に今どっちがオリジナルなのか分からんのや。左の方がオリジナルやと思うけどな。

でも左の画像と右の画像を比べて見ても、画像がAI生成やっていう決定的な手がかりは全然ないんや。実際、両方とも人が文字通りちょっと動いただけに見えるんやな。画像にAI生成っぽさが全然ないから、これがオンラインやインターネットを大幅に、大幅に変えようとしてるって言うとるんや。

オブジェクトを持って、そのオブジェクトを好きなように回転させることができるっていう影響を考えると、そういった画像操作は結構聞いたことがないもんで、文字通りSF映画から出てきたもんやな。だから見るのがめちゃくちゃ面白いんや。全体的にこの影響を実際に見ると、人々が本来すべきでない方法で画像を操作できるなら、かなり驚異的やな。

悪意のある使用例については話さんけど、少しでも創造的やったら、分からんけど5年後、10年後に、どんな人のどんな画像でも好きなように編集できるオープンソース版があるかもしれんって理解し始めることができるやろ。

可能性は無限やけど、それは決して良い意味やないんや。

他のAIニュースとChatLMの紹介

AIニュースの他のセクションに入る前に、AIツールで作業してるけど、常にタブを切り替えたり、モデルをやりくりしたり、ペイウォールにぶつかったりしてるなら、実はもっと良い方法があるんや。それはChatLMって呼ばれるもんで、私が今まで使った中で最も強力なオールインワンAIプラットフォームやな。

すべてのトップティアモデルにアクセスできるんや。GPT-4.1、Claude 4、Gemini 2.5、Grok 4、全部が一つの屋根の下にあるんやな。もうプラットフォーム間を跳び回る必要がないんや。でもそこで止まらへん。Deep Agentがあれば、なんでもできるんや。一つのプロンプトでアプリを作れる。完全な文書やピッチデッキを生成したり、ウェブを閲覧してDeep Agent MCPでサービスに接続するエージェントを立ち上げることもできるんや。

ビジュアルが必要やったら、最先端の画像・動画生成ツールにアクセスできる。コードが必要やったら、ChatLMには複数のモデルで動くプロレベルのコーディング環境であるCode LMが含まれてるんや。整理整頓したかったら、プロジェクトやワークフローに直接統合される組み込みタスクファイル管理システムがあるんやな。

そして、これら全ての中で一番クレイジーなのは、すべての機能がたった月10ドルってことや。Deep Agent、Code LM、アプリアクセス、すべてが一回のランチより安いんや。私のリンクを使ってサインアップしたら、今日からChatLMを始められるで。真面目に、必要以上に難しくするのはやめや。

写真復元技術の驚異的な精度

ここに、どっちかと言うと軽いやつやけど、もう一つの使用例があるんや。これは写真復元やな。オンラインで複数の異なる写真復元ウェブサイトを見たことあるけど、Nano Bananaについては言わなあかんわ。これは本当に本当に、画像に文字通りゼロの不完全さしか見えへん最初のやつの一つやな。

すべての微妙さ、すべてのモーションブラー、すべての色と豊かさを捉えてるんや。どうやって色を得てるかも分からんけど、高度なAIが非常に多くの画像を見てきて、何をすべきかを自動的に知ってるんやろな。これは本当に驚かせてくれたことやねん。なぜなら、普通AI生成画像には大抵いくつかの小さな不完全さがあるからや。

そして、覚えといてくれ、ここで言ってることは、これがこんなに深刻な理由は、AI生成と、もちろん実際の人生で起こったことの間の現実を曖昧にするっていう事実やねん。この画像も、私が言ったように、実際の人生で起こった画像やけど、今AI生成版があるから、まだ現実に基づいてるっちゅうことで、線を曖昧にしてるんや。

未来について考えてみ。深刻な影響があるで。

著名人との合成画像の完成度

ここで見れるもう一つのもんがあって、Twitterのこのユーザーからこの画像を見たんやけど、これは目立ったわ。なぜなら、これは信じられんかったからや。もし友達の一人が写真を撮って「おい、信じられるか?俺は実際にここでTrumpと座ってるんやで」って言って、この画像を送ってきたら、この画像にはTrumpがそこにいないっていう決定的な手がかりがないから、私は本当にTrumpがそこにいるって信じるやろな。

画像がどれだけ白っぽく洗い流されてるかを見ても、何かオフセットのような白いバランスがあって、最高の照明で撮られたように見えへん。Trumpの画像は非常にうまく合成されてるから、私は画像が偽物やって言えへんのや。

繰り返しになるけど、彼がそんな著名な人物やからこそ、なんでその辺りに警備員がいるんやろって疑問に思うかもしれんけど、それでも、もし他の誰かの違う写真を使ったら、Trumpが文字通りそこに座ってるって信じるのはかなり簡単やと思うわ。

だから、これが本当に驚異的なんや。文字通り人間を自分たちの画像に合成できるんやもん。これもソーシャルメディアの台頭に深刻な影響を与えるんやな。

ソーシャルメディアと情報の信頼性への脅威

ソーシャルメディアで最大の問題の一つは、時々人々が写真を編集したり、写真を改ざんしたりすることで、何が本物で何が偽物かを判断するのに本当に困難な時間を過ごすことやねん。もしTrumpを文字通り自分の隣に座らせることができて、何の影響や合法性もなかったら、インターネットはどうやって検証された情報源として安定を保っていけるんやろ?これは間違いなく大きな問題やな。

政治には踏み込まんけど、著名人がやってないことをやってるっていうのは、確実に何の助けにもならんって言うわ。

繰り返しになるけど、もっと軽い使用例では、これは私が本当に好きなやつや。これはシーン構築やな。Twitterのこのユーザーは、キャラクターの一貫性があるから話してたんや。

映画制作における革新的な活用

キャラクターを一つの場所から別の場所に移動させて、手に物を追加したり、手から物を取り除いたりできる時、これによって複数のショットを持つ映画の制作が非常に非常に速くできるようになるんや。そして、前に言ったように、これがAIやっていう手がかりは本当にないのが見えるやろ。

6本指もないし、完全にスムーズな肌もない。現実に基づいた完全に実在の人物のベース画像と、もちろん同じ場所があるんやな。そして今、ショット1とショット2があるから、それらは信じられないほど本物に見えるって言うわ。個人的に、それらがAI画像やって教えてくれるもんは何もないんや。

だから、より創造的な側にいる人たちにとって、物事が本当に、本当に楽しくなる領域に入ろうとしてるって思うわ。本当に次のレベルに持っていきたい1、2ショットがある限りやけどな。完璧なショットを得られなかったって想像してみ。何かを撮影してて、誰かが銃を持ってるショットか、誰かがシャベルか何かを持ってるショットを撮るつもりやったんや。

シンプルなテキストプロンプトで、すぐにそのシーンビルダーを変えることができるんや。一日中外に出て撮影しなあかんっていうのを変えるやろな。いくつかのベースプレート画像を撮って、その全体的なシーンの残りは完全にAI生成にできるかもしれんのや。これの影響を考え始めると、本当に信じられんわ。

AI技術の限界と識別方法

Twitterのこのユーザーによる別のもんもあるし、これは本当に私をショックにさせたけど、非常に特定の理由でこれを含めたんや。左の画像がベースの真実で、右の画像は画像に何かを追加するよう求められた画像で、かなりうまくやったのが見えるやろ。

でも、ついにAI生成されたアーティファクトが実際に見え始める使用例/画像を見つけることができたんや。これを言ってる理由は、将来、これにますます注意深くならなあかんからやねん。もし注意してなかったら、偽の画像を見て、誰かがあなたに買わせたい話に騙される可能性があるんやな。

ここで見ることができるのは、実際によく見て、実際にズームインすると、様々な異なるもんのテキストが、まだ現在AIが苦手とする何かやっていうことなんや。この問題がいつ解決されるか分からんけど、今のところ、幸い、まだ修正されてへんのや。でも今のところ、多くの異なるもんにズームインしたら、テキストは完全にぼやけるやろ。

これはAI生成画像の決定的な手がかりやねん。そして、これをするのは非常に非常に困難やろな。なぜなら、オンラインでは、ほとんどの人が画像の表面レベルを超えて掘り下げへんからや。ほとんどの人はヘッドラインをスクロールし、画像をスクロールして、それに飛び込まへんのや。だから、まだ問題になるって信じてるわ。

でも、検討してる話があるなら、これが今、個人的に画像がAI生成かどうかを判断する唯一の方法やねん。

Googleは、安全なAIの開発に関して最も責任感のある企業の一つやと言うわ。だから、それらの画像はウォーターマークを保持する可能性が高いんやな。

でも、本当にしたい人、オンラインのすべての個人にとって、彼らはおそらくそれらのウォーターマークを削除する範囲まで行くやろな。

情報の時代における深刻な懸念

そういうことで、前に言ったように、これが本当にすべてを変えると信じてる理由は、誰かが買い物中の日中に起こってることを簡単に変えることができるなら、オンラインで見るものを絶対に信じるのが非常に困難になるからやねん。特に、それらのAI生成画像が今現実に基づこうとしてるっていう事実を考えるとな。

そして、判断しなあかん唯一の本当のことは、起こってる特定の出来事が合成されたものか、ただAI生成されただけかっていうことやねん。だから、私たちは本当に誤情報の時代に入ろうとしてるんやな。ほとんどの人がオンラインで見るものを何も信じへん時代にな。

そういうことで、みんながどう思うか教えてくれや。また会おう。

コメント

タイトルとURLをコピーしました