80億人のデジタルクローンがもたらす社会シミュレーション革命

デジタルマインド・デジタルツイン
この記事は約13分で読めます。

スタンフォード大学の研究者Jun Parkが開発した大規模言語モデルによる社会シミュレーション技術が、1億ドルのシード資金を調達し本格的に始動した。数年前の「Smallville」実験では25体のAIエージェントが仮想村落で生活し、情報伝播や社会的相互作用をリアルに再現して注目を集めた。現在は「Simile」として進化し、数千から数万規模のデジタルツインによる社会シミュレーションを可能にしている。Andre Karpathy、Fei-Fei Leeなどの著名投資家が参加し、CVS HealthやTelstraといった大手企業がすでに顧客として導入している。市場調査、製品テスト、決算発表の質問予測など幅広い応用が可能で、従来のビッグデータ分析から「ビッグシミュレーション」への転換を示唆している。この技術により、スタートアップは実際のコストをかけずに何千回もの試行錯誤を仮想空間で行えるようになり、イノベーションの障壁が大幅に低下する可能性がある。

8 BILION DIGITAL CLONES
The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

スタンフォード発の画期的な社会シミュレーション実験

数年前、スタンフォード大学で非常に興味深い実験が行われました。大規模言語モデルを使って村全体を構成したらどうなるのか。シミュレーションで現実世界で起こることを再現できるのか。そういった問いに答えようとした実験です。これはJun Parkによる研究で、Smallville、別名「インタラクティブ・シミュラクラ」と呼ばれるものでした。私はこの研究を取り上げることを本当に楽しみました。

非常に非常に魅力的な論文でしたが、今回それが戻ってきました。そして以前よりもはるかに大規模になっています。つまり、スタンフォードの研究者であるJun Parkが、今回Simileと呼ばれるものを携えて戻ってきたのです。基本的なコンセプトは、デジタルツインのアイデアを取り入れて、社会全体を作り出すというものです。例えば、トランスクリプト、取引ログ、科学データなど、あらゆるものに基づいて人口統計全体を取り込むのです。

そうやって社会、都市、村、何でもいいのですが、それらを作成します。そしてシミュレーションを実行します。ここでの目標は、何が起こるかについて特定の質問をできるようにすることです。税金を上げたり下げたりしたらどうなるか。特定の製品に対して新しいマーケティングキャンペーンがあったらどうなるか。このニュースが流れたら人々はどう反応するか。本当に何でも聞けますが、特に社会的な相互作用をターゲットにしています。

特定のニュースがコミュニティ内をどのように流れるか。人々はどう反応するか。そしてこれは小さなプロジェクトではありません。かなり大規模なもので、かなり重要な人物たちが参加しています。Andre Karpathyを含む何人かのエンジェル投資家がいます。彼はOpenAIの共同創業者で、Teslaの元AI責任者であり、業界の大物です。

豪華な投資家陣と支援企業

それからFei-Fei Leeがいます。彼女はAIのゴッドマザーです。スタンフォードの人間中心AI研究所の共同ディレクターです。Adam D’Angeloもいます。彼のことを覚えているかもしれません。サム・アルトマンが解雇されたあのOpenAIの騒動のときの取締役会メンバーの一人です。彼は今でもOpenAIの取締役会にいます。Quoraの CEOでもあります。それからGuillermo Rauchがいます。彼はVercelのCEOです。

非常に大きな企業で、広く使われています。最近、私のAIエージェントであるOpenClawdを使って何かを構築していたとき、WordPressを使うよう提案しました。すると彼らは「いや、WordPressは使わない。Vercelを使う」と言ったんです。Verselなのか、発音もよく分かりませんが、彼らはそれが正しい方法だと教えてくれました。

そして私もそれに従いました。とても満足しています。5つ星評価で、また私のAIエージェントに使わせたいと思います。それからScott Belsky、Adobeの最高戦略責任者でBehanceの創業者もいます。では、ここで何が重要なのでしょうか。元のSmallvilleの論文は、ある意味で衝撃的でした。なぜなら、ChatGPTのストーリーのかなり初期段階だったからです。

当時、彼らは村のすべてのエージェントをシミュレートするためにChatGPTまたはGPT-3.5 Turboを使っていたと思います。確か25体のエージェント、つまり小さなキャラクターがいて、可愛らしいピクセルアートのアニメーションがあり、それぞれにバックストーリーや性格がありました。仕事があったり、学校に通ったりしていました。誰かと結婚していたり、子供がいたりしました。

そして小さなスケジュールもありました。朝8時に起きて、仕事に行かなきゃとか、学校に行かなきゃとか。文字通り彼らは自分たちの人生を生き、家事をこなし、愛する人と交流したりしていました。そして当時の質問は非常にシンプルでした。彼らの一人に何らかのインスピレーションを与えたらどうなるか。まるで神様が寝ている間に現れて「これをやりなさい」と言い、あなたが「ああ、これをやらなきゃ」となるような、神聖なインスピレーションのようなものです。

バレンタインパーティーの情報伝播実験

それをキャラクターの一人に対して行いました。確かIsabellaという名前だったと思います。これは数年前のことです。細部を間違えたら申し訳ありませんが、彼女に「街のみんなのためにバレンタインデーパーティーを開催しなさい」と伝えました。興味深いことに、今気づいたのですが、彼らはバレンタインデーの前日にこれをローンチしているんです。そして過去、あの実験全体がバレンタインデーパーティーの企画についてだったんです。

しかし重要だったのは、このコミュニティがどれだけうまくこのパーティーを作り上げられるかを見ることでした。なぜなら、彼らは一人の人にしか通知しなかったからです。だからこの一人が、まず第一にみんなに伝え、パーティーをすることに同意させなければなりませんでした。それからパーティーを計画し、企画する必要がありました。

ですから1日目、あるいは0日目と呼んでもいいですが、Isabellaだけがこのアイデアを持っていることを知っていました。他の誰もそれについて考えていませんでした。それで彼女は親しい友人たちのところに行って、「ねえ、このパーティーをやりましょう」と言いました。何人かは気に入り、何人かは気に入りませんでした。しかしニュースは小さな村、小さな社会の中に浸透していきました。

結末まで早送りすると、実際にバレンタインパーティーは開催されました。来た人全員がIsabella、つまり最初の人に招待されたわけではありませんでした。つまり、ある程度は浸透したのです。彼女がAさんに伝え、AさんがBさんに伝え、そしてBさんが現れる。現実の世界で起こるのと同様に、情報が人々を通じて伝わる方法がそこにありました。

そして何人かは来たがり、何人かは来るのを忘れ、何人かは来たくなくて来ませんでした。少なくともその小さな村、小さな社会において、物事がどのように進む可能性があったかを非常によくシミュレートしていました。そしてこの論文について、今振り返って非常に非常に興味深いことの一つは、彼らが大規模言語モデルの周りに作り出す多くの方法と多くのスキャフォールディングを見つけ出したことです。それらは非常に非常に効果的でした。

記憶システムとエージェント技術の進化

例えば、メモリーストリームを持っていました。そして記憶を、どれだけ関連性があるか、最近のものかといった観点で整理していました。時間が経つにつれて、すべてを忘れるのではなく、最もコアな記憶を持ち、その記憶プールが時間とともに追加されていきました。だから突然すべてを忘れることはなかったのです。

これについて興味深いのは、今OpenClawのようなAIエージェントでは、これらのエージェントを非常に非常に非常に有能にするために、同じアイデアの多くが組み込まれているのを見ているということです。だから私たちの多くは、これからもっと多くのものが出てくることを期待していました。人間の行動を予測し、シミュレートするのに役立つという点で、より大きなプロジェクトが出てくることを知っていました。そしてこのアイデア全体が多くの人々の想像力をかき立てたと思います。しかししばらくの間、何も聞こえませんでした。

そしてついに今日、おそらく彼らはステルスモードから出てきて、それについて話しているのだと思います。そして明らかに彼らはすでに1億ドルのシード資金調達を完了しています。つまり、かなり本気の人々がこれに関わっています。かなりの資金が投入されており、そして明らかにすでに大規模な企業クライアントがいて、参加しているようです。

CVS Health、アメリカの薬局チェーンや、Telstraもあります。彼らはモバイルカバレッジ、携帯電話、インターネットなどを提供しています。これらの企業がやりたいことの一部は、例えば、市場調査を行って、例えば1000人のグループが新しいマーケティングキャンペーンや製品テスト、UIテストなどにどう反応するかを見ることです。

Jun Parkは、これが決算発表でのアナリストの質問を予測する点でかなり正確だったと報告しています。つまり、モデルはアナリストが尋ねるこれらの決算発表の質問の10個中8個を正しく予測します。考えてみれば、これは非常に非常に有用である可能性があります。決算発表を行っているとします。それはライブです。

人々は厳しい質問をしないわけではありませんが、シミュレーションを実行すれば、おそらく彼らが何を尋ねるかを教えてくれます。だから、それに備えることができます。これは社会科学にも使用できます。人々は新しい健康不安や経済ショックなどにどう反応するか。私は2020年を再実行して、トイレットペーパーがどこでもなくなったあの現象を見てみるべきだと思います。

あれは予測可能だったのでしょうか。明らかだったのでしょうか。なぜなら私はあの現象が起こっていることを非常に早い段階で認識していましたが、どういうわけかトイレットペーパーの件は私のビンゴカードには全くなかったからです。では、なぜこれがそれほど重要なのでしょうか。考えてみると、これはビッグデータからビッグシミュレーションへの移行を示すかもしれません。つまり、過去において企業は、持っているデータが多ければ多いほど、それが金であり、デジタルオイルのようなものでした。そのデータをマイニングして特定のイベントに備え、予測などができたからです。そのデータがどこかに保存されていて、それを解析して洞察を抽出しようとすることは大きな意味がありました。

ビッグデータからビッグシミュレーションへの転換

これらのシミュレーションが十分に大規模で正確になれば、それほど重要ではなくなるかもしれません。つまり、どこかに保存されているその実世界のデータはそれほど重要ではなくなるかもしれません。代わりに、これらのシミュレーションを実行してそこから仮想シミュレーションデータを抽出しようとする方向に移行するでしょう。

だから、そこに出て行って1万人の顧客にインタビューして彼らの考えを見ようとし、そのデータを取得する代わりに、10万人の顧客でシミュレーションを実行し、そのシミュレーションに基づいて彼らがどう考えるか、または新しいマーケティングキャンペーンにどう反応するかを把握するのです。ここでのもう一つの大きな変化は、多くのスタートアップには「イノベーション税」と呼ばれるものがあるという事実かもしれません。「先駆者には背中に矢が刺さる」という言葉を聞いたことがあるかもしれません。基本的には、何かで最初に市場に出るとき、革新的なアイデアを持っているとき、それにはコストがかかるという考え方です。なぜなら失敗すれば、失敗は高くつくので代償を払うことになるからです。

しかし、もし何かを見つけ出せば、他の人々が入ってきてあなたがやっていることをコピーしたりできます。だから、先発者には先発者優位がありますが、イノベーション税もあり、この二つが互いにバランスを取り合っているのです。しかし、イノベーション税がなかったらどうなるか想像してみてください。スタートアップや新しい企業が、新製品やその他について、どのように展開するかについて1000回のシミュレーションを実行できたらどうでしょうか。そしてそれをデジタルシミュレーションのサンドボックスで実行できるとしたら。

データを収集し、これが成功するアプローチのようだ、これはより危険なアプローチだなどと確認します。もしそれら1000回のシミュレーションを実行するコストが、実際にそれらの一つを現実世界で実行する費用と同等だったらどうでしょう。つまり、同じ価格で1000回試すことができるということです。それは本当にイノベーション税を削減します。その一つの成功する結果を見つける限り、シミュレーション内で999回失敗できるのです。

もちろん、この多くはもう少し統計ベースになるでしょう。だからシミュレーションは85%の確率でしか正確でないかもしれません。85%と言うのは、Jun Parkの声明の中で、研究者がそれらの決算発表に関連して発見したことだからです。85%の確率で正確だったということです。

そして繰り返しますが、これはどんどん良くなっていくだけです。しかし85%だと仮定しましょう。85%正確なシミュレーションを実行できれば、それだけでも信じられないほど有益でしょう。しかし、ここで私が思うに重要なこと、大きな影響を与える可能性のある大きな出来事があります。私たちのデータや統計の多くは、平均への回帰を示します。

平均では見えない少数派の影響力

平均的な人を見つけようとしています。平均的な人はこの電話についてどう思うか。10点満点で8点と評価するとか。しかし現実には、その平均の中には、多くの異なる意見を持つ多くの異なる人々がいます。その中の一部は市場に過大な影響を与えます。

そして平均を見るだけでは、人々がどう行動するかを必ずしも予測できません。人々の99%が何かに対して大丈夫で、そして1%の人々があなたが出している特定のメッセージや製品が持っている何らかの機能によって本当に引き金を引かれ、彼らが戦争を宣言してそれについて大騒ぎしたらどうでしょう。

製品が大丈夫だと思っている残りの人々。彼らは好きですが、愛してはいません。しかし嫌いでもありません。でも彼らは、製品によってダメージを受けた、または引き金を引かれたこの一つのグループの人々を見ます。何が起こるにせよ。私たちは現実世界で起こるそれらの奇妙な特異的なことをシミュレートできるかもしれません。なぜなら、平均を見ていると、平均してみんな大丈夫ですよね。みんなある程度好きです。問題ありません。

しかしその少数派の人々が過大な影響を与える可能性があります。そしてこれにより、私たちはそれらの奇妙なトレンドや奇妙な特異性をキャプチャできるでしょう。それらはシミュレーションで見ることができますが、大量のデータに対して統計分析を実行している場合には見られないものです。そしてもちろん、これは株式市場分析にとって巨大なものになる可能性があります。

CEOや市場トレーダー、そして企業のリーダーシップチームや企業に関わる多くの人々をシミュレートして、彼らが市場の暴落や競合の動きにどう反応するかを見て、それらが起こる前にいくつかのことを予測できるかどうかを確認できるかもしれません。確かに、私の人生には、このようなものを通して実行してみたい会話がありました。それらがどうなるかを垣間見ることができればと期待して。

この人に厳しいニュースを伝えなければならない場合、これが起こることのいくつかの可能性のある結果は何か。彼らは何と言うかもしれないか。私はどう反応するかもしれないか。そしてそれが何かを引き起こすか。とにかく、この会社からもっと多くのものが出てくるのを見るのがとても楽しみです。SimileとJun、もちろん、彼が成功を収めていることをとても嬉しく思います。明らかに、信じられないほど知的な人物で、ChatGPTを利用した最初の本当に衝撃的な論文の一つです。

彼がそこで行ったすべてのことを本当に愛しましたし、これからもっと多くのものを見ることを期待しています。彼らはTwitter、XのSimile Companyにいます。@simile_aiです。だからこの会社は人々が持っている多くの質問に答えるだろうと思いますし、いわば新しい質問を提起するかもしれません。それは、データを取得するためにシミュレーションを実行することがとても素晴らしく、シミュレーションが正確であればあるほどデータがより価値があることは確かですが、それならこれがシミュレーションである可能性はどのくらいか、そして私たちは皆ここで、何らかのマーケティングキャンペーンに反応するためだけに立ち往生しているのではないか。考えるべきことです。

ここまで見ていただいた方、本当にありがとうございました。私の名前はWes Rothです。また会いましょう。

コメント

タイトルとURLをコピーしました