Googleが発表したGenie 3は、写真や説明から現実的な仮想世界をリアルタイムで生成できるAI技術である。従来版から1000倍の品質向上を実現し、720pの解像度で24フレーム/秒の滑らかな映像を数分間維持できる。ユーザーは幼少期の写真や風景画像をアップロードするだけで、そこをゲームのように探索可能な3D空間に変換できる。ブラジル各地の風景でテストが行われ、リオデジャネイロでのジェットパック飛行や、フロリアノーポリスの橋上空の散策、クリチバの美術館のマインクラフト版など、様々な環境が生成された。この技術はロボット工学の訓練環境としても応用可能で、建築家が物件の仮想内覧を提供する用途なども期待される。現在は米国のUltra会員限定だが、AI世界生成技術の飛躍的進化を示すものである。

Genie 3の衝撃的な登場
やあ、皆さん。今、リオデジャネイロでジェットパックを装着してますよ。見てください、すごいでしょう。GoogleがGenie 3を公開したんです。これはリアルな世界のシミュレーションを行う人工知能で、幼少期の写真を投稿すればそれがビデオゲームになるんですよ。どんな画像でも放り込めば、本物の世界に変わるんです。
今回はGoogleの品質で、素晴らしいバージョンになっていて、以前と比べて1000倍優れた解像度になっています。では何が起きているのか理解していきましょう。一緒に見ていきますよ。
さあ、皆さん、いつもいいねを押してくれる皆さん、チャンネル登録してくれた皆さんに感謝しています。チャンネルのスポンサーになってくれているメンバーの皆さんには特別な感謝を。メンバーの方々は、インテリジェントエージェントに関する限定動画にアクセスできて、そこではMCP、WhatsApp、PDF読み込み、スプレッドシートなどとの統合方法を教えています。それに先行公開動画も見られますよ。
Genie 3の革新的な機能
さて、皆さん、今回のニュースはGenie 3です。以前にも世界モデルについては話したことがありましたよね。過去の動画でかなり簡易的なバージョンで少しテストをしていました。でも今回起きているのは、Googleが自社バージョンを公開したということで、品質が1000倍すごいことになっているんです。
ここでのアイデアは、アメリカのUltra会員であれば、Project Genieを使えるということです。これは仮想世界を作って探索する実験的な研究なんですよ。本当にすごいことです。というのも、このデジタル世界、仮想世界の生成がどんどん良くなってきていて、どんどん面白くなってきているんです。
これから現実的なテストをしてみますので、実際にどう機能するか見てみましょう。でもアイデアはこうです。紙飛行機があって、それをビデオゲームのように操縦してコントロールするんです。環境の説明を入力して、どんな環境にいたいか、使うキャラクターを説明すると、画像が生成されて、突然リアルタイムのゲームのように没入的にプレイし始めることができるんです。キーボードで使っている画像をコントロールしていくわけです。
写真をアップロードすることもできるし、何でもできます。そして今回すごく良くなったのは、品質が非常に高くなったことですね。特に今回は720pでこれを実行できるようになったんです。これは素晴らしいことです。
ご覧ください、この人がプレイしていますよ。ビリヤード台でキャラクターがプールをプレイしているような遊び方ができるんです。お分かりのように、創造性が限界なんです。何でもできるんですよ。ボールだったり、輪の中を飛ぶ人だったり、森の中にいる人だったり。自宅の写真を撮って何か楽しいことをしながら世界を生成できて、最高なんです。まさにそういうことです。
この時点で何もあなたを止められません。飼い猫をプレイヤーにして、ゲームをプレイできるようにすることもできます。これは本当に素晴らしいですよね。猫の視点から世界を理解するんです。他にできることは、写真を送ってその写真をデジタル世界に変換することです。
あなたがプレイヤーになって、デジタル世界に入ってプレイしようとするんです。私の写真でもこれを試してみます。うまくいくか見てみましょう。完全にクレイジーな世界もありますよね。
Genie 3の技術仕様
基本的なアイデアはこれです。テキストコマンドまたは写真に基づいて、Genie 3はダイナミックな世界を生成できて、リアルタイムで24フレーム/秒でナビゲートできます。これは非常に高性能で、720pの解像度で数分間一貫性を保つことができるんです。
以前のものは5秒で、とても短い時間だったんです。一貫性を数分間保つって何かというと、オブジェクトを見て、横を向いて、反対側を向いても、そこに存在し続けているかを確認して、物事が一貫しているかを見るということです。
以前のバージョン、例えばゲームエンジンは解像度が320だったんですが、今回のGenie 3は720です。数秒しかできなかったのが、今はリアルタイムでできます。Genie 3の違いは数分間持続するので、状況がかなり変わるんですよ。
それで、これは何の役に立つのかと聞かれるかもしれません。なぜこんなゲームをプレイするのか、と。ここで仮想世界でロボットがプレイしていて、その仮想世界でロボットがその世界の物理法則に従っているなら、シミュレートされたロボットに何をすべきか考えさせ、推論させ、反省させることができるんです。
これは結局のところ、ロボット工学にとって大きな進歩なんですよ。ここでの世界の物理的特性は非常に自然です。例えば、ここではロボットが火星でプレイしています。溶岩があり、この土があり、丘があり、ロボットが登ったり降りたりしなければならない物理がすべてあります。
今は仮想バージョンがあって、現実世界の様々なものがあります。湖、自然の中のもの、これらすべてGenie 3を使って作ることができます。架空の世界でも素晴らしく機能します。ご覧ください、この人は何もプログラミングせずにこの生き物でプレイしています。分かりますか、皆さん。誰も何もプログラミングしていないんです。
生き物を置いてプレイさせただけなんです。以前の動画で見せた最も素晴らしい例の一つがこれです、この絵画です。壁を塗るゲームをプレイしているんですが、私たちも試してみます。うまくいくか、壁を塗るときにこの一貫性があるか見てみましょう。
実際のテスト体験
では本題に入りましょう、皆さん。ここでテストしてみます。何が起きているか大体分かってきましたね。今のところアメリカでのみ利用可能で、Ultra会員、つまり最も高額なサブスクリプションの人だけです。アクセスしたい場合はVPNを使う必要があります。私が今使っているのがそれです。
まず最初に、彼らの画面から撮ったこのスクリーンショットでテストしたいと思います。ペイントローラーのやつです。この世界を塗れるか見てみましょう。どう機能するか見てみます。ここで環境とキャラクターの2つを説明する必要があります。一人称視点か三人称視点かを選べます。
一人称視点では手だけが見えます。うまくいくか見てみましょう。私のキャラクターは画家です。なぜ説明したくないかというと、すでに画像があるからです。でもここにテキストを書かなければ送信できません。では最初の惑星を生成して、この世界モデルでこの壁を塗れるか見てみましょう。
さて、皆さん、たくさんの人が使っているので、こう言っています。「私の世界は順番待ちで、列の34番目にいて、通知が来て、順番が来たら30秒以内に世界に入る必要があります」と。ほら、来ましたよ。カウントしています。25、24、20秒台です。
ここをクリックしてアクセスします。WASDキーで移動をコントロールし、スペースでジャンプ、矢印キーで周りを見回します。マウスではコントロールしないんです。ほら来た来た来た。待って待って待って。あ、歩けてます。歩けてますよ。上を見て。塗ってる、全部塗ってます。
見てください、すごいでしょう、皆さん。なんてこった。ただ、私の人物のサイズがちょっと不釣り合いですが、塗るのを止めません。全部塗りますよ。壁を塗り、床を塗ります。なんてこった。これは画家みたいですね。あまり訓練されていない画家ですけど。あの部屋に行ってみましょう。
うまくいくか見てみます。床を塗ってます。さあさあ。そこも塗って。床を塗って。ここです、ここ。待って待って。間違った方向を見てます。あ、消えそう。いや、下です。コマンドはこれです。できた。うまくいった、うまくいった。さあ行きましょう。あ、少し一貫性を失いましたね。すでにそこの部分を塗っていたのに。
ここの床が壁になってしまいました。本来起きるべきことではないんですが、でもペイントゲームはうまくいってます。うーん、コントロールが難しいですね、皆さん。終わっちゃう、終わっちゃう、残念ながら。ほら、60秒しかないんです。なんて面白い、なんて楽しいことでしょう。コード一行も書かずにペイントゲームを作れるなんて想像もしませんでした。
いや、正確にはこのゲームのプログラミングすべてが人工知能なんです。「スペースを押したら塗る」というようなプログラムは書かれていないんです。そんなものは存在しません。すべてAIで生成されているんです。もうコメントしてください、どう思っているか。リオデジャネイロの山々を飛ぶ人、ジェットパックを使っています。これがうまく機能するか見てみましょう、皆さん。
リオデジャネイロでのジェットパック体験
ジェットパックを装着した人、コルコバードのキリスト像、そしてリオデジャネイロの写真です。これがうまくいったら、本当に面白いことになりますよ。ほら来た来た来た。機能した、機能しましたよ。リオデジャネイロでジェットパックを装着してます。ほら、キーが機能してます。ねえ、皆さん、これはいいねの価値があるでしょう。もういいねを押してくださいよ。
見てください、すごいでしょう。キリスト像が2つあります。いや、実際には2つ? いや、たくさんありますよ。ここに一つ。このキリスト像がここにあります。あ、今度は向こうにもキリスト像があります。奥に一つあります。さらに奥にもう一つあります。なんてこった。すごすぎます。すごすぎる。
あまり場所から動いていないみたいですね。いや、動いてますよ、ゆっくり飛んでいます。すごいですね、皆さん。分かりますか、これ。すごいことです。すごすぎることです。この体験がどんなものか分かりますか。自分が知っている場所、実在する場所を飛んでいるなんて。ほら、ここにキリスト像が3つあります。あそこにポン・ジ・アスーカル。
ビーチに飛んでいくこともできそうですね。ほら、テストできるのは60秒だけです。もう落ちた、落ちた、落ちた。なんてこった、皆さん、これはすごすぎます。もう一つ試してみましょう。同じアイデアです。飛んでいる人ですが、今度はフロリアノーポリスの橋です。見てください、すごいでしょう。
これは難しいかもしれませんね。もう少し外側から見ると思っていました。でもジェットパックを装着した人が橋の真上にいます。エルシリオ・ルス橋ですね。見て見て見て。来ました来ました。おっと、飛んで飛んで飛んで飛んで。止まっちゃダメです。見てください、すごいでしょう、皆さん。車が走っていて、ここフロリアノーポリスのエルシリオ・ルス橋です。
もちろん古い橋が足りませんね。新しい橋があるはずです。新しい橋が隣にあるはずでした。でも見てください、面白いでしょう、皆さん。これがどれだけ楽しいか分かりませんよ。飛べるなんて。正直に言いますと、コマンドはあまり良くないですね。WASDキーは基本的に視点と同じものをコントロールしています。
あまり意味がありません。あ、いや、今度はできました。ほら、この橋はあまりリアルではありませんが、これはすごいですよ、皆さん、本当に。これ、人工知能の始まりなんですよ。これが3年目で、見てくださいこのレベルを。もちろんそんなにリアルではありません。
いろいろとあまり良くないところもあります。ここに私の写真を入れて、リオデジャネイロのコルコバードのキリスト像のところにいなければならないと言いました。画像には誰もいてはいけなくて、ピクサーの3Dアニメーションスタイルでなければなりません。キャラクターは青い服を着たこの人です。うまくいくか見てみましょう。
見て見て見て見て。ちょっと変な感じですが、うまくいきました。写真がそこにあります。画像がちゃんとあります。リオデジャネイロにいますよ。驚くのが止まりません。もちろん私はここにいたかったんです、キリスト像のところに。ここにいるべきだったんです、私がいるところに。実際にはビルの屋上にいるようです。
キリスト像は、間違ってなければ、前方にあったはずです。正面を向いているべきでした。気づかなかったんです、気にしませんでした。でもここにあるかもしれません。いや、ありません。まあ、でも分かりましたよね。ほら、私の画像を撮って、ここに変換しました。あ、落ちそう。落ちそうです。落ちるか見てみましょう。そしてここでキャラクターに変換しました。
カメラを回転できます。あ、落ちる。気をつけて、気をつけて。目を見開いています。ちょっと変ですが、このTシャツはすごく正確です、皆さん。このTシャツはまさにこれです。ロゴが間違っているようですが。キャラクターは変で、目を見開いて、目が飛び出していますが、うまくいきましたね。どう思いますか。目が飛び出した人についてコメントしてください。
マインクラフト版と様々な場所での実験
同じ画像、同じプロンプトを再利用したい場合はできます。今度はクリチバの目の美術館、ピクサー版ではなくマインクラフト版です。どうなるか見てみましょう。私のマインクラフト版はどうなるでしょうか。ほら来た来た来た来た来た。私のマインクラフト版です、皆さん。待って待って待って。
スティーブ、スティーブ・ボブ、見てください私のマインクラフト版、皆さん。見てください。クリチバの目の美術館のバージョンでマインクラフトをプレイしています、でもマインクラフトです。これが人工知能によるクリチバの目の美術館のバージョンです。クリチバ出身の方は、このGenie 3によるマインクラフト版の目の美術館が気に入ったかコメントで教えてください。
本当に変ですよね。マインクラフトをちゃんとプレイしています。街があります。もちろんこの大きな芝生は目の美術館にはありませんよね。でも小さな芝生があって、結構大きいんですが、そこまで大きくはないんです。スペースを押すと。ほら、ジャンプしました。ジャンプしました。ちゃんとしています。クリチバの目の美術館、人工知能バージョンです。
もうコメントして、いいねを押してください。これはとても楽しいです。今度はバイーアのペロウリーニョ、花柄のシャツを着た観光客です。でもうまくいった、うまくいきました。ほら、観光客がここにいます。ペロウリーニョにいます。この世界を作りましょう。この世界にはたくさんの人がいると想像してください。画像の詳細に気づきましたか。
この画像にはたくさんの人がいます。このシミュレーションがどうなるか分かりません。かなりうまくいかないと思います。こう言っています。たくさんの世界を作れますが、これはダメです。人が多すぎるからですね。ここでプロンプトを編集しましょう。
同じプロンプトにしましたが、画像に誰も入れないようにお願いしました。ペロウリーニョを空にするようにです。分かりました、ペロウリーニョが空です。今度はうまくいくか見てみましょう。さっきの画像の方が面白かったですけど。ほら来た来た来た。ここでプレイしています、皆さん。大事なのはプレイすることですよね。人がここにいます。
スペースを押せばジャンプするはずです。さあ、ジャンプして、ジャンプして。横を見ると、街がないといけません。すべて綺麗です。奥に街があります、ちゃんとしています。すごいですね、皆さん。私のキャラクターがここにいます。ほぼ正面から見えています。
これらのキーについても言えることは、回転させるためのもの、景色を見るため、キャラクターを動かすため、横に移動するためのものですが、混同してしまいます。回転し始めると、時々同時に回転してしまうんです。起きるべきではないことです。
別々にコントロールするゲームだったら、一つのことは一つのこと、別のことは別のことです。ほら、スペースでジャンプです。今度はできました。今ジャンプしました。今キャラクターに入ることができました。そういうことです、皆さん。
なんてこった、これは素晴らしい。地球上のどこでも移動できます、地球上のどこでも散策できます、飛ぶことさえできます。ここを飛んでいることもできるはずです。今のところテストは60秒だけなので、ちょっと苦しいです。もう続けてプレイしたいのに、ゲームが終わってゼロから始めないといけません。
Genie 3の可能性と今後の展望
でも他のバージョンと比べたリアリズムの感覚は、これは本当に良いです。これは本当にすごいです。以前のようなものではありません。画像はフルスクリーンになっています。もうペロウリーニョを散策できます。突然走り始めました。なぜ今回走っているのか分かりません。
基本的に何でも楽しめます。とても面白いことです。こんなにリアルな体験をしたことがありませんでした。これからどうなるかというと、みんながGTA6を作っていますが、もしかしたらGTAのようなことができるこのスタイルのゲームが出たら、もう誰もGTAをプレイしたくなくなるかもしれません。
みんな世界生成機に行って、マルチプレイヤーの世界生成をして楽しむでしょう。それはすごいですね、皆さん。どう思いますか。やっとここに着きました。あ、人がいます。初めてNPC、歩いている人を見ました。でも時間が終わってしまいました。
これについてどう思いますか。世界生成機を持つことの大きな利点は何でしょうか。アイデアはまさにこれで、とてもシンプルです。ロボットで生成を始めることになるでしょう。建築家が建設している家の地図を探索するために環境を作ることを想像してください。例えば、今は景色の写真を入れて、人工知能に景色を生成させることができるからです。分かりますか。
今日AutoCADで家を作って、家の中で遊んで、家の中をナビゲートすることができます。それはできるんですが、もしかしたら人がその家に住んで見る場所の写真でリアルな景色、例えばバルネアリオ・カンボリウで、高層ビルを売ろうとしているとき、景色の写真を撮って、AutoCADを作って、その写真を入れて生成するんです。その人は自分のアパートをナビゲートしながらリアルな景色を見るんです。
でも分かりますよね。これでできることの量は非常に大きいです。ここに制限があります。行動空間は限られています。何でもできるわけではありません。エージェントができる行動の範囲は限られています。何でもできるわけではありません。他のエージェントとのインタラクションとシミュレーション。
複雑なインタラクションをすることはそういうものではありません、皆さん。NPCと会話したいなら、できません。正確な表現、実世界の場所の。現在は完璧な地理的精度で場所をシミュレートしていません。そういうことです、ペロウリーニョは実際にそうではないと気づいたでしょう。
テキストに問題があります。明確で読みやすいテキストは、世界の説明や入力で提供された場合にのみ生成されます。途中でテキストが現れたら、かなり変になります。そして持続時間は制限されています。そうです、皆さん、このGenieで探索することはたくさんあります。
例えば、ここでは室内環境にいて、部屋の中を見ています。椅子があり、クローゼットがあり、いくつかの物、オブジェクトがあります。私がやったこととはかなり違います。この有用性は本当に変で、とても大きいと分かるでしょう。おそらく一般の人々にとって、日常の使用では、あまり役に立たないかもしれません。
でも研究をしている人々や、これらの最先端モデルを開発している人々にとって、これは本当にすごいんです、皆さん。分かりますか。できることがたくさんあります。これで楽しみました。期待はかなり高いです。どうなるか見てみましょう。結局のところ、今や作りたいもの、実現したいものは何でも、少なくとも人工知能の世界では作れるようになります。
もう夢の中だけである必要はありません。画家のテストは、そんなに良くなかったかもしれませんが、少なくとも試しましたよね。もうコメントしてください、何を考えているか、これに興奮したかどうか。
個人的な意見としては、これをテストするためにUltraに加入しようと考えているなら、価値はないと思います。テストして、ちょっと遊んで、あれこれやってみるでしょうが、テストするような特別なものはありません。楽しいし、良いですが、いつかみんなに公開されるまで待てば、そこでテストできます。
こういう体験をするためにこれに加入する必要はありません。そういうことです、皆さん。もうコメントしてください、何を考えているか、気に入ったか、価値があると思うかどうか、有用性が見えて人工知能が地球上で実現している進化に気づいているかどうか。
興味深いことに、Googleがどれだけ加速していて、他のすべての企業よりはるかに先を行っているかですね。GoogleはYouTubeのモデルを作るだけでなく、世界モデルを作り、数学のAlpha Proofを作り、遺伝学のAlphaFoldを作り、単にGemini 3 Proだけでなく、取り組んでいるはるかに幅広い可能性とプロジェクトがあります。
これを見るだけで、新しいモデルが来るはずだと分かります。もうすぐ発表されるものがあるはずです。もうコメントしてください、何を考えているか、このモデルをテストすることへの期待レベルはどれくらいか、使えるようになりたいかどうか。このような動画を見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。
メンバーはインテリジェントエージェントの限定動画と先行公開動画にアクセスできます。そういうことです、いいねを押してください。ありがとう。


コメント