
4,148 文字

グーグルが非常に興味深い研究を発表しましてん。生成AIゲームに関する論文なんですわ。そこではグーグルが「アンバウンド」というものを発表してはって、これは無限のキャラクターライフシミュレーションゲームなんです。これは基本的に、完全にAIで生成されたゲームを作るために必要なアーキテクチャで、プレイヤーがストーリーの展開を完全にコントロールできる形でナラティブが展開されていくんです。
ほな、これがどういう仕組みなのか詳しく説明させていただきます。ここで示されてる内容の多くは基本的なもののように見えますけど、今後の展開を考えると、2年以内に完全にAIで生成された世界やゲームが登場しても驚きませんわ。この動画の内容を見ていただいたら、なぜそれが実現するのかわかっていただけると思います。
従来のゲームエンジンについては皆さんご存知やと思います。従来のゲームエンジンには、ゲームの動作を制御するルールやコードが組み込まれてます。ゲームの裏にはエンジンがあって、コードがあって、物理演算があって、ゲームメカニクスがある。これが約20年間、ゲームの伝統的な仕組みでした。
グーグルが目指しているのは、この現実を完全に変えるための基盤を作ることです。これが将来実現すると思いますわ。ゲームは様々な面で大きく変わっていくことになりますからね。
実は、これに似たようなものを以前にも見たことがあります。ゲームコミュニティにおられた方なら、ゲームスポットのこのトレーラーを覚えてはるかもしれません。これはAIで生成されるゲームになる予定でした。グーグルが今試みていることとよく似てて、「鳥も、木も、海も、遺跡も、星も、全てがプロシージャル(自動生成)」というものでした。
つまり、どの世界に行っても、その全てがAIによって生成されるゲームのトレーラーやったんです。例えば、ある星や惑星に行くと、そこにある宇宙船やあらゆる要素、影に潜むものまで、全てがLLM(大規模言語モデル)を使ってその場で生成される仕組みです。生成AIはテキスト、動画、画像、音声など様々な分野で活用されてますから、それらを使って完全な現実を作り出すことができます。
これは10年前にゲーム「No Man’s Sky」が試みたことですが、残念ながらその時は上手くいきませんでした。でも現在の技術では、グーグルが言うように、こういったことが可能になってきてるんです。
必要なのは、まずカスタムキャラクターの作成です。今ではMidjourneyで思い描くどんなキャラクターでも作れますし、頭の大きさや顔の大きさなど、様々な方法でカスタマイズできます。将来のゲームではこういったことができるようになり、キャラクターの制御と一貫性に関して驚くべきレベルになるでしょう。
この研究で彼らが目指したのは、キャラクターの一貫性を保つことでした。論文では、キャラクターの一貫性を維持するために様々な手法を使用したことが説明されています。実際、今Midjourneyで「consistent character」と入力し、その後に「male」「female」「redhead」「explorer」などと入力すると、同じキャラクターが異なるポーズやアニメーションの姿勢で描かれた複数の画像が得られます。現在の技術レベルを見るとすごく面白いですね。
これは重要な部分の一つです。というのも、リアルタイムでゲームを生成する際には、キャラクターの一貫性を確保する必要があるからです。完全生成型のゲームでは、キャラクターだけでなく、生成AIツールで各フレームを生成する際に、キャラクターの一貫性を保つ必要があります。これが彼らのソフトウェアで目指したことです。
また、生成される環境の一貫性も確保しています。私自身もChat GPTで自分のキャラクターを生成してみました。これは基本的な例ですが、今Chat GPTやGPT-4で、「特定のキャラクターのビデオゲームのスクリーンショットを生成して」と指示すると、自分自身や任意の人物に似たキャラクターを描写できます。私は「体力ゲージやスタミナゲージを含むHUDのあるランダムなビデオゲームキャラクターの画像を生成して」というプロンプトを使いました。
その後、他の生成AIツールを使って面白いことをやってみました。キャラクターと体力ゲージ、統計情報を取り、それを使って異なる環境を生成したんです。緑豊かな土地のような環境を生成し、それはすごくクールで遊び心のある感じになりました。次に熱帯のパラダイスのような環境も生成してみました。
キャラクターが様々な環境を自由に探索できるのを見ると、多くの人がこれを楽しむことになるのは間違いありません。自分のキャラクターを作って、行き先を自由に制御できる。「この環境に行こう」「木の次元に行こう」「熱帯雨林の次元に行こう」「これを食べたらどうなる?」「あれを食べたらどうなる?」といった具合です。
先ほど話したキャラクターの一貫性について、グーグルは新しい手法を開発しました。他の人々も異なる手法を試みていましたが、そこには少し問題がありました。
環境、キャラクター、セマンティックアラインメントの一貫性について見てみましょう。環境の一貫性は、キャラクターがいる環境が説明と一致していることを保証します。キャラクターの一貫性は、最初に生成したキャラクターの特徴が完全に維持されることを意味します。そしてセマンティックアラインメントは、プロンプトへの忠実性を意味します。
プロンプトをChat GPTに入力したとき、意図が効果的に伝わらないのは最悪の事態の一つです。そのため、彼らは独自のシステムを開発しました。彼らのシステムは、AI生成世界のあらゆる要素を捉えることができます。
AIにおいても独自の進歩を遂げています。彼らが言及した一つは、大規模言語モデルの蒸留に成功したことです。蒸留プロセスとは、大きなLLMから小さなLLMをより賢くする過程です。ジュースを薄めても美味しさを保つようなものです。
彼らは2つのLLMを使ってゲームを共に実行させました。一つはプレイヤーとして、もう一つはゲームマスターとして機能します。GPT-4から5,000の異なるゲームプレイシナリオを記録し、その蒸留されたLLMは大きなLLMと比較しても非常に良好なパフォーマンスを示しました。
5,000の異なるゲームプレイシナリオから学習し、それらをこの大規模言語モデルに効果的に組み込むことに成功しました。GPT-4を使用し、現在このモデルはGPT-4と同等の性能を持っています。これはすごいことです。
私はいつも、なぜグーグルがこれほど小さなモデルを開発しているのか考えていました。多くの人はグーグルのAIニュースに詳しくありません。現在のハイプサイクルでは主要プレイヤーとして注目されていないからです。
しかし彼らは実際、Gemma 2という20億パラメータの大規模言語モデルを開発しています。これは現在、GPT-3.5、Llama 2、Mixtral、その他多くのLLMよりも優れていますが、非常に小さなモデルです。より大きなモデルの特性を全て蒸留することに成功しました。
これを行った理由は、AIモデルとリアルタイムで対話するためには、適切なレイテンシーで動作する必要があるからです。これは最小のモデルの一つで、Llama 2 70Bと比較しても、チャットボットアリーナのELOレーティングが驚くほど高いことがわかります。
グーグルは、リアルタイムのユーザー体験を可能にするエッジユースケース向けの小規模なAIシステムの開発に力を入れています。これによってゲームをリアルタイムで動作させることができるのです。
後でお見せする面白いものがありますが、これは将来の方向性を示すものとして、皆さんにもぜひ試していただきたいと思います。
これが環境の仕組みです。このダイアグラムは全てが1ページに詰め込まれていて少し分かりにくいかもしれませんが、体力を追跡し、様々な環境でユーザーを追跡する方法を示しています。これがリアルタイムで行われます。
例えば、「あそこに何かありますよ、探検してみませんか?」「ここに店があります」「休憩しましょう」「食事をしましょう」などと提案できます。これらの指示、これらの異なる要素、これらのゲーム環境生成が、私たちが将来手にするものになります。
私も個人的に似たようなものをテストしてみたいと思いました。完全に同じではありませんが、AIで生成された世界を探索する未来がどのようなものになるかを皆さんに示せると思います。
これは何のスポンサーでもありませんが、リアルタイムAIジェネレーターで遊んだことがある人なら、これがとても面白いことをご存知でしょう。例えば、「スーツを着た男性、でもカートゥーン風で」と入力してみましょう。「カートゥーンキャラクター」「ソファーでピザを食べている」といった具合です。
リアルタイムのAI生成でこういったことができます。「麺を食べている」に変えたり、「ご飯を食べている」に変えたり、「チキンを食べている」に変えたりできます。チキンを食べているように見えますね。
「スーツを着た男性」を「スーツを着た太った男性」に変えることもできます。チキンをたくさん食べた後ですからね。これが最適な例示方法ではないかもしれませんが、可能性が無限にあるようなゲームを想像してみてください。
ストーリーラインややるべきことのナラティブに従いたい人もいるでしょうが、オープンワールドゲームの未来を考えると、「ソファーにいる男性」を「痩せた男性」に変えたり、「筋肉質な男性」に変えたりすることができます。
AIで創造性を様々な方法で探索できることは本当に驚くべきことで、ビデオゲームが将来のリリースでこれをどのように取り入れていくのか、とても興味深いですね。最初にこれを実現するゲームがどんなものになるのか、そしてこれらの異なるキャラクターを探索できるようにする最初のゲームがどんなものになるのか、見守りたいと思います。


コメント