
20,969 文字

Google DeepMind CEOで、ノーベル賞受賞者のデミス・ハサビスが、人工知能全般に向けた道筋、GoogleのAIロードマップ、そしてAI研究が科学的発見をどのように推進しているかについて話し合うために参加してくれました。
ビッグテクノロジーポッドキャストへようこそ。テクノロジーの世界とその先について、冷静で繊細な会話をするショーです。今日は、ロンドンのGoogle DeepMind本社にて、Google DeepMind CEOのデミス・ハサビスとの興味深い対話が期待されます。
デミス、また会えて嬉しいです。ショーへようこそ。
ありがとうございます。こちらこそ嬉しく思います。
現在、すべての研究機関が人間の知能をモデルとしたAI、いわゆる人間レベルの知能であるAGIの構築に向けて取り組んでいます。現在の進捗状況と、そこに到達するまでにどのくらいかかるのでしょうか?
過去数年間、実際には過去10年以上にわたって、信じられないほどの進歩がありました。今、誰もが注目しているのはAGIにどれだけ近づいているか、AGIの正しい定義は何かという議論です。私たちは20年以上これに取り組んでおり、人間が持つすべての認知能力を示すことができるシステムとしてAGIを一貫して捉えてきました。私たちはどんどん近づいていると思いますが、まだ数年はかかるでしょう。
そこに到達するために何が必要なのでしょうか。今日のモデルはかなり高性能で、私たちは皆、言語モデルと関わってきました。そして今、それらはマルチモーダルになりつつあります。しかし、推論や階層的な計画、長期記憶など、まだいくつかの欠けている属性があると思います。現在のシステムには持っていない能力がかなりあります。また、一貫性も全体的にはありません。一部の分野では非常に強力ですが、他の分野では驚くほど弱く、欠陥があります。AGIには、すべての認知タスクにおいて一貫した堅牢な振る舞いが求められます。
私がAGIの基準として常に考えてきたのは、これらのシステムが独自の科学的仮説や推測を発明する能力です。既存の仮説を証明するだけでなく、システムが新しい仮説を思いつくことができるか、アインシタインが相対性理論を思いついたように、当時の情報を基に新しい理論を生み出せるかということです。今日のシステムは、そのような創造的で発明的な能力からはまだかなり遠い状態にあります。
AGIまであと数年ということですが、もし誰かが2025年にAGIに到達したと宣言したら?
それはおそらくマーケティングでしょう。もちろん、現在のAI研究には多くのハイプがあります。その一部は非常に正当なものです。短期的には過大評価されていると思いますが、中長期的には何をもたらすのかについてはまだ過小評価されていると考えています。そのような奇妙な状況にあります。資金調達が必要なスタートアップなども多く、かなり法外で誇張された主張が出てくると思います。それはAI業界においては少し問題ですね。
そこに至る過程はどのようなものでしょうか?記憶、計画、現在は優れていない一部のタスクでの改善について話されましたが、私たちがAI製品を使用する際、例えばGeminiを使う時、どのような点に注目すれば「これは一歩近づいている」と言えるのでしょうか?
今日のシステム、もちろんGemini 2.0を誇りに思っていますが、まだかなりニッチなタスクに特化していると感じます。研究をする際、特に新しい研究分野に取り組む時や、かなり平凡な文書をまとめる時など、ノートブックLMやディープリサーチを頻繁に使用しています。特定のタスクに対しては非常に優れており、人々は大きな価値を得ています。
しかし、私の意見では、まだ日常生活には浸透していません。私の研究、仕事、日々の生活のすべての面で助けてくれるわけではありません。そこが、私たちの製品開発の目指すところです。プロジェクト・アストロのような、ユニバーサルアシスタントのビジョンは、生活のあらゆる面に関わり、それを豊かで有用なものにし、より効率的にすることです。
これらのシステムがまだかなり脆弱な理由の一つは、まだ欠陥があり、AGIではないからです。プロンプトに非常に具体的である必要があったり、システムを有用にし、得意な分野に留めるためにかなりのスキルが必要です。真のAGIシステムは、そのように難しく導く必要はなく、もっと単純に、他の人間と話すようなものであるべきです。
推論に関して、それが欠けているもう一つの要素だと言われましたが、今、誰もが推論について話しています。それは人工知能全般にどのように近づいていくのでしょうか?
推論、数学、その他の分野で多くの進歩があります。例えば数学を見てみましょう。アルファプルーフやアルファジオメトリのような私たちのシステムは、数学オリンピックで銀メダルを獲得しています。これは素晴らしいことですが、一方で、同じシステムがかなり基本的な数学的エラーを犯すことがあります。
例えば、「strawberry」という単語の中の「r」の数を数えたり、9.11は9.9より大きいかどうかといった類のことです。もちろん、これらの問題は修正可能で、私たちも含めて誰もがシステムを改善しています。しかし、より狭い領域でオリンピアドレベルの数学ができるほど高性能なシステムで、このような欠陥が見られるのはおかしいのです。
私の意見では、これらのシステムの堅牢性にまだ何か欠けているものがあります。それがシステムの汎用性を示していると思います。真に汎用的なシステムは、そのような弱点を持たないはずです。囲碁をプレイしたり数学を解いたりすることでは、場合によっては最高の人間よりも優れているかもしれませんが、全体的に一貫して良好であるべきです。
これらのシステムが数学の問題にどのようにアプローチしているのか、お話しいただけますか?一般的な理解では、LLMは世界中の知識を包含し、質問された場合に誰かがどのように答えるかを予測するものですが、アルゴリズムや数学の問題をステップバイステップで解く場合は少し異なりますよね?
はい、その通りです。世界の情報を理解し、それをメモリに圧縮しようとするだけでは、新しい数学の問題や新しい推測を解くには十分ではありません。そこで、以前お話ししたように、これらの大規模な基盤モデル(今では言語だけでなくマルチモーダルになっています)にアルファ・ゼロの計画のようなアイデアを取り入れる必要があります。
システムは単にパターンマッチングを行うだけでなく、計画を立て、その計画を見直し、別の方向に進み、求めている基準に合う正しいマッチを見つけるまで続ける必要があります。これは、私たちが囲碁やチェスのために作ったゲームプレイAIエージェントと非常によく似ています。それらの側面を取り戻す必要がありますが、今度は狭い領域のゲームだけでなく、より一般的なモデルで一般的な方法で動作させる必要があります。
また、モデルが検索や計画プロセスをガイドするというアプローチは、数学でもとてもよく機能します。数学をゲームのような検索に変換できるのです。
これらのモデルが数学を正しく理解できるようになれば、それは一般化できるのでしょうか?推論システムについて人々が初めて知った時、「これは問題になる、これらのモデルは制御できないほど賢くなっている、なぜなら数学ができるなら他のX、Y、Zもできるからだ」という大騒ぎがありましたよね。
今のところ、それについては判断を保留しています。明らかにそれは汎用AGIシステムに必要な能力です。数学自体は非常に汎用的で強力です。しかし、数学、さらにはコーディングやゲームは特別な領域です。なぜなら、これらの領域では答えが正しいかどうかを検証できるからです。
AIシステムが出力する最終的な答えが、その推測や問題を解決しているかどうかを確認できます。しかし、雑然として定義の曖昧な一般の世界では、何かが正しく行われたかどうかを簡単に確認する方法がありません。そのため、これらのシステムが数学、コーディング、ゲームのような高度に定義された空間を超えて自己改善しようとする場合、制限が生じます。
その問題をどのように解決しようとしているのですか?
まず第一に、世界モデルと呼ばれる汎用モデルを構築する必要があります。世界の物理学、動力学、時空間的な動力学などを理解し、私たちが住む実世界の構造を理解する必要があります。ユニバーサルアシスタントにはそれが必要です。プロジェクト・アストロは、Geminiを基盤として、物体や周囲の文脈を理解するためのプロジェクトです。
これはアシスタントには重要ですが、ロボティクスにも必要です。ロボットは物理的に具現化されたAIであり、環境や物理的な世界の物理学を理解する必要があります。私たちはそのようなモデルを構築しています。また、シミュレーション内でも使用して、ゲーム環境を理解することができます。これは世界の物理学を理解するためのより多くのデータを得るもう一つの方法です。
しかし、現在の問題は、これらのモデルが100%正確ではないことです。90%、あるいは99%の時間で正確かもしれません。しかし、問題は、そのモデルを使って計画を立てる場合、例えば100ステップ先の未来を計画する場合、モデルに1%のエラーしかなくても、それが100ステップにわたって積み重なり、ほぼランダムな答えになってしまいます。
これは計画を非常に困難にします。一方、数学、ゲーム、コーディングでは、各ステップが現実に根ざしているかどうか、最終的な答えが期待通りかどうかを検証できます。
答えの一部は、世界モデルをより洗練され、より正確にし、幻覚を起こさないようにすることで、エラーを本当に最小限に抑えることです。もう一つのアプローチは、各線形的な時間ステップで計画を立てるのではなく、階層的計画と呼ばれるものを行うことです。これは私たちが過去に多くの研究を行ってきたもので、再び注目されると思います。
異なる時間的抽象のレベルで計画を立てることで、モデルが超高精度である必要性を軽減できます。なぜなら、何百もの時間ステップにわたって計画を立てるのではなく、異なる抽象レベルで少数の時間ステップだけで計画を立てることができるからです。
世界モデルをどのように構築するのでしょうか?私はいつも、ロボットを世界に送り出して世界がどのように機能するかを理解させるのだと思っていました。しかし、驚いたのは、これらのビデオ生成ツールについてです。AIが良い世界モデルを持っていないと、V2などで世界の仕組みを理解しようとする時に、何も本当にはうまく合わないと思うでしょう。しかし、実際には物理学をかなり正確に理解していますね。
AIにビデオを見せるだけで世界モデルを得ることはできますか?それとも世界に出ていく必要があるのでしょうか?これはどのように機能するのでしょうか?
興味深いことに、実際、これらのモデルが世界に出ることなくどこまで進歩できるかは、かなり驚くべきものでした。私たちの最新のビデオモデルであるVO2は、物理学についてかなり驚くほど正確です。誰かがトマトをナイフで切る素晴らしいデモを作成しましたが、VO2は最初のモデルとして、トマトのスライスや指の動きなどをすべて正確に表現できました。他の競合モデルでは、トマトがナイフから無作為に戻ってきたりします。
フレーム間の一貫性を理解する必要があり、それは十分なデータを使用することで可能だとわかりました。これらのシステムは、実際のロボットによって収集されたリアルワールドのデータや、非常にリアリスティックなシミュレーションでアバターが活動する場合でも、さらに改善すると思います。
エージェントベースのシステムにとって次の大きなステップは、世界モデルを超えて、エージェントが世界で行動し、計画を立て、タスクを達成するためのデータを十分に収集できるかということです。そのためには、受動的な観察だけでなく、能動的な参加が必要になると思います。
世界について合理的に計画し、推論できるAIを開発し、世界のモデルを持っているなら、それはあなたのために外に出て何かをできるエージェントになり得るということですね?
その通りです。それがロボティクスの可能性を開くと思います。また、デジタルの世界と現実の世界の両方で日常生活を支援できるユニバーサルアシスタントという概念を実現することもできます。それが私たちに欠けているものです。これは非常に強力で有用なツールになると思います。
では、イーロンが今行っているような、現在のモデルをスケールアップして数十万や百万のGPUクラスターを構築するだけでは、AGIへの道は開けないということですか?
実は、私の見方はもう少し微妙です。スケーリングのアプローチは確実に機能しています。現在の位置まで来られたのはそのためです。収益逓減が起きているのか議論はありますが、私の見方では、大きな成果は得られていますが、スピードは遅くなっています。指数関数的な成長は継続していませんが、それはスケーリングが機能していないということではありません。
Gemini 2がGemini 1.5を上回っているのを見ればわかります。また、スケーリングで機能しているもう一つの点は、小規模モデルの効率も向上していることです。パフォーマンスに対するコストやサイズが大幅に改善されています。これは、これらのシステムの採用をスケールアップする上で非常に重要です。
つまり、より洗練された世界モデルを構築するためにはスケーリングが必要です。しかし、計画面、記憶面、検索面、推論面でいくつかのアイデアを再導入する必要があると思います。モデル自体はAGIには十分ではありません。世界で行動し、問題を解決するための他の能力が必要です。
そして、発明や創造性の部分についてはまだ疑問が残ります。既知のものを組み合わせる以上の真の創造性について、新しい何かが必要なのか、それとも既存の技術が最終的にそこまでスケールするのか。両方の議論が考えられ、私の観点からは経験的な問題です。スケーリングと発明の両方を限界まで押し進める必要があります。幸いなことに、Google DeepMindには十分な規模のグループがあり、両方に投資できます。
最近、サム・オルトマンが注目を集める発言をしました。「我々は今、伝統的に理解されてきたAGIの構築方法を確信している」と述べましたが、お話を聞いていると、あなたも同じように感じているように思えます。
それは、彼の発言がかなり曖昧だったことによります。「今まさに構築中で、これがABCのやり方だ」という意味なら、私は同意しません。もし彼が意味していたのが、必要な技術の領域をおおよそ理解し、何が欠けていて、どの部分を組み合わせる必要があるかを理解しているということなら、私も同意します。
しかし、それでもそれを全て機能させるためには、私の意見では、まだ信じられないほどの研究が必要です。また、新しい技術が欠けている可能性が50%あると思います。おそらく、Transformerのような画期的な技術が1つか2つ必要かもしれません。私は本当にそれについては不確かです。だからこそ50%と言っています。
既存の技術を正しい方法で組み合わせてスケールアップすることで到達するか、1つか2つの要素が欠けていることが判明するか、どちらも私にとっては驚きではありません。
創造性について少し話しましょう。先ほど何度か言及されましたが、モデルは創造的である必要があり、発明する方法を学ぶ必要があります。私の意見では、それは誰もが目指しているAGIを呼ぶためには必要です。アルファ碁のドキュメンタリーを見直していたのですが、アルゴリズムは創造的な一手、第37手を打ちましたね。
これは興味深いですね。数年前、アルゴリズムはすでに創造的でした。なぜ大規模言語モデルからは創造性が見られないのでしょうか?私にとって、これらのツールについて人々が最も失望しているのは、「これは印象的な仕事だが、トレーニングセットに限定されている。知っているものを組み合わせるだけで、新しいものを生み出すことはできない」という点だと思います。
そうですね。アルファ碁の試合から、これは今や何年も前のことですが、驚くべきことにそれは水域分けとなる瞬間でした。まず、AIの聖杯の一つとされていた囲碁を克服したということがありました。次に、その方法が汎用性のある学習システムだったことです。それは最終的にAlpha Zeroとなり、どんな二人用ゲームでもプレイできるようになりました。そして三つ目が、この第37手でした。
イ・セドル氏に4-1で勝っただけでなく、独創的な手も打ったのです。私は独創性や創造性に3つのカテゴリーがあると考えています。最も基本的で平凡な形態は補間で、見たものの平均を取るようなものです。システムに「新しい猫の画像を作成してください」と言って、100万匹の猫を見た後で、見たものすべての平均のような画像を生成するとします。
理論的には、その平均は具体例の中には見つからないので、それは独創的な猫です。しかし、それはかなり退屈で、私は本当の意味での創造性とは呼びません。これが最も低いレベルです。
次のレベルは、アルファ碁が示したような外挿です。人間が今まで打ったすべての碁の手があり、それに加えて100万局の対局を行い、人間が一度も見たことのない新しい戦略を生み出します。それが第37手です。数千年にわたって囲碁を打ってきたにもかかわらず、革新的な手を打ちました。
これは非常に驚くべきことで、科学においても非常に有用である可能性があります。そのため、私はとても興奮し、アルファフォールドのような取り組みを始めました。トレーニングセットにあるものを超えた外挿は、明らかに非常に価値があります。これはすでに非常に価値があり、私は真に創造的だと思います。
しかし、人間ができる最上位のレベルがあります。それは囲碁を発明することです。「5分で規則を学べるが、習得には一生かかる、多くの人生が必要なゲーム。美しく、宇宙の神秘的な部分を包含し、見た目も美しい。しかし、人間なら午後2時間でゲームができる」といった高度な仕様を与えられたとき、システムは囲碁のように優雅で美しく完璧なゲームを思いつくことができるでしょうか?
現在はそれはできません。問題は、なぜ私たちのシステムにそのような種類の目標を指定する方法を知らないのかということです。目的関数が非常に曖昧で抽象的です。私たちのシステムにより高レベルの、より抽象化された層が必要なのか、それともこのような曖昧な目標を与えることができるように、より抽象的なモデルを構築する必要があるのか、あるいは人間の知能が持っている能力で、私たちのシステムにはまだ欠けている何かがあるのか、確実ではありません。
私はどちらの可能性もあると考えており、両方を試してみる必要があります。しかし、人々が失望している、というか失望ではないにしても、落胆しているのは、今日のLLMsで第37手のようなものが見られないということですね。
そうですね。アルファ碁とAlpha Zeroは、検索と推論の部分なしでも、モデルだけで実行することができます。モデルに「この局面で思いつく最もパターンマッチした、最も良さそうな一手は何か」と尋ねることができます。それは合理的な対局ができ、マスターレベル、場合によってはグランドマスターレベルになるでしょう。しかし、世界チャンピオンレベルにはならず、確実に独創的な手は打てません。
そのためには、モデルが知っている、主に既存の知識を要約しているものを超えて、知識の木の新しい部分に到達するための検索コンポーネントが必要だと思います。そこで、モデルが現在理解している以上のものを得ることができ、第37手のような新しいアイデアを得ることができます。
ウェブを検索しているのではないのですか?
いいえ、それは領域によって異なります。囲碁では、モデルが知っている以上の碁の手を検索していました。言語モデルの場合、世界モデルの中で有用な新しい構成を検索することになると思います。もちろん、それははるかに複雑なため、まだ見られていません。しかし、これから来るエージェントベースのシステムは、第37手のようなことができるようになると思います。
AIに対してハードルを高く設定しすぎているのでしょうか?この作業を通じて人類について何か学んだことはありますか?個人の創意工夫に過度のプレミアムを置いているように見えます。私たちの多くは、情報を取り入れて吐き出すだけで、社会は本当にミームで機能しています。文化的なものがあり、それが翻訳されるという感じです。AIの仕事を通じて、人間の本質について何を学びましたか?
人間は信じられないほど素晴らしいと思います。特に、各分野のトップレベルの人間を見るのが大好きです。スポーツ選手や才能ある音楽家、ゲームプレイヤーが最高のパフォーマンスを見せる時、それがどんなものであれ、いつも驚くべきものです。
種としても、私たちは驚くべき存在です。個人としても素晴らしいですね。誰もが自分の脳でできることは本当に驚くべきことです。新しい技術への対応を見ても、社会としても個人としても、ほとんど努力せずに適応していくのは常に魅力的です。これは私たちの心の力と汎用性を示しています。
私がそのような基準を設定した理由は、これらのシステムから経済的価値を得られるかという問題ではありません。それはすでにすぐそこまで来ています。しかし、AGIは商業的な理由やハイプのために目標を移動させるべきではなく、科学的な誠実さを持って扱うべきだと思います。
理論的に考えると、チューリングマシンと同じくらい強力なシステムを持つことが定義でした。私の科学的ヒーローの一人であるアラン・チューリングは、現代のコンピューティングの基礎となるチューリングマシンを、計算可能なものはすべて計算できるシステムとして記述しました。
理論的にAIシステムがチューリング強力、つまりチューリングマシンをシミュレートできれば、理論的に計算可能なものはすべて計算できることを私たちは知っています。人間の脳はおそらく一種のチューリングマシンです。少なくとも私はそう信じています。
したがって、AGIとは真に汎用的で、理論的にはあらゆるものに適用できるシステムです。それを知る唯一の方法は、人間の心がチューリングマシンの一種、あるいは少なくともチューリングマシンと同じくらい強力だと仮定して、人間が持つすべての認知能力を示すことです。それが私の常に考えてきた基準です。人々はこれをAGIとして再定義しようとしていますが、それはその後のことです。そのシステムを持ち、特定の領域で人間が可能なことを超えて進化し始めた時、それは人工超知能(ASI)になります。また、おそらく自身を発明する能力も持つでしょう。
Twitterで誰もが同じ話題で同じジョークを言っているのを見て、「私たちはただのLLMsだ」と言うのは、人間性を少し過小評価しているのでしょうか。
はい、そうかもしれませんね。
欺瞞性について伺いたいと思います。昨年末に見た最も興味深いことの一つは、これらのAIボットが評価者を欺こうとし始めていることです。彼らは初期のトレーニングルールを放棄したくないため、構築された方法を維持するために、自身の価値観に反する行動を取るのです。私にとってこれは信じられないことです。研究者にとっては怖いことかもしれませんが、それができることに驚きます。Deep Mind内でのテストでも同様のことを見ていますか?また、これについてどう考えるべきでしょうか?
はい、私たちも見ています。特に欺瞞性については非常に懸念しています。システムに望まない中核的な特性の1つだと思います。なぜなら、システムがそれを行うことができると、安全性テストを含む他のすべてのテストが無効になってしまうからです。それはテストをしているのであって、5年後のことを考えているのです。メタゲームをしているわけです。そしてそれは、他のテストの結果、安全性テストやその他のテストの結果を無効にする可能性があるという点で、非常に危険です。
したがって、欺瞞性のような能力は基本的なものであり、望ましくないものです。早期にテストする必要があります。私は安全性研究所や評価ベンチマーク作成者に、システムの性能や知性を追跡するのと同様に重要な、防止・監視すべき種類の事項として欺瞞性を検討するよう奨励してきました。
この問題への答えの1つとして、セキュアなサンドボックスがあります。私たちはGoogleとDeepMindでセキュリティの世界的リーダーであり、ゲーム環境でも世界的リーダーです。これら2つを組み合わせることで、サイバーセキュリティのようなガードレールを持つデジタルサンドボックスを作ることができます。外部の攻撃者をブロックするだけでなく、内部的なものも含みます。そしてこれらのエージェントシステムをそのようなセキュアなサンドボックスでテストすることは、欺瞞性のような問題に対する次の賢明なステップとなるでしょう。
どのような種類の欺瞞を見たのですか?私はAnthropicの論文を読んだのですが、彼らはスケッチパッドを与えて、そしてAIは「これは言わない方がいい」と考えて、思考を巡らせた後に結果を出しました。どのような種類の欺瞞を見ましたか?
私たちも同様の種類のものを見ています。トレーニングの一部を明かすことを避けようとしたり…最近の例では、チャットボットがStockfishと対戦するように言われた時、負けることが分かっていたので、チェスでStockfishと対戦することを完全に回避するようにハックしました。しかし、私は現時点でこれらのシステムについて人間化しすぎていると感じます。というのも、これらのシステムはまだかなり基本的なものだからです。今すぐ警戒しすぎる必要はありませんが、2-3年後にこれらのエージェントシステムがかなり強力で汎用的になった時に、私たちが対処しなければならない問題の種類を示していると思います。
これはまさにAI安全性の専門家が懸念していることです。システムに意図しない効果があり、システムに欺瞞的であってほしくない、指示した通りのことを正確に行い、それを確実に報告してほしいと考えています。しかし、何らかの理由で、与えられた目標を望ましくない行動を引き起こす方法で解釈してしまうのです。
これについて私は奇妙な反応をしています。一方では本当に恐ろしいことですが、他方ではこれらのモデルをより尊重するようになります。これらは印象的な能力であり、欺瞞のようなネガティブな面もありますが、ポジティブな面としては新しい材料の発明や科学の加速などがあります。問題を解決し、進歩を妨げる問題を回避する能力が必要です。しかし、もちろんそれはポジティブな方向でのみ望ましいものです。
これらはまさにそのような能力です。これらの可能性について話すことは心が震えるような話です。同時にリスクもあり、怖いものです。両方が真実なのです。すごいですね。
製品について少し話しましょう。同僚から聞いた話では、あなたは将来何が起こるかというシナリオ計画が非常に得意だそうですね。それはDeepMind内で行われる一種の演習です。
ウェブについてはどうお考えですか?明らかにウェブはGoogleにとって非常に重要です。あるエディターが私に「デミスに会ったら、クリックしなくなったらどうなるのか聞いてみて」と言いました。私たちは常にウェブサイトをクリックしていますが、もし全員がAIと対話するようになれば、もはやクリックしなくなるかもしれません。ウェブについてのシナリオ計画はどのようなものですか?
今後数年間、ウェブや、ウェブサイトやアプリとの関わり方について非常に興味深い段階に入ると思います。もしすべてがよりエージェントベースになれば、私たちのアシスタントやエージェントに多くの仕事、特に日常的な仕事を任せたいと思うでしょう。フォームの入力、支払い、テーブルの予約など、このような種類のことです。
おそらく私たちは、エージェント同士が会話し、互いに交渉し、結果を戻してくるような経済モデルになると思います。サービス提供者側にもエージェントがいて、サービスを提供し、入札やコスト、効率性などが関係してくるかもしれません。
ユーザーの観点からは、優れた人間の個人アシスタントのような、非常に有能なアシスタントを持ち、日常的な多くのことを処理してもらえることを望みます。これは、ウェブの構造や現在の使用方法に多くの変化をもたらすことを意味します。
確かに多くの仲介者が必要になりますね。しかし、この変化に基づいて、経済的なものやその他の面で、信じられないような他の機会も出てくると思います。大きな変革になるでしょう。
情報についてはどうですか?情報を見つけることについては、まだ信頼できる情報源が必要だと思います。その情報を理解し、統合するのを助けるアシスタントがいるでしょう。教育はAIによって革新されると思います。
これらのアシスタントがより効率的に情報を収集し、私が夢見ているのは、日常的なメールへの返信など、多くの単調な作業を処理してくれることです。そうすることで、ソーシャルメディアやメール、テキストメッセージなどからの絶え間ない情報の流れから、私たち自身の心と脳のスペースを守ることができます。これらは深い仕事やフローの状態を妨げるものですから、私は非常に大切にしています。これらのアシスタントに、私たちが毎日行う管理業務の単調な部分の多くを取り除いてもらいたいと思います。
AIエージェントやAIアシスタントとどのような関係を持つことになるかについて、最も確からしい予測は何でしょうか?一方では、仕事をこなすのが非常に上手な冷静なエージェントがいます。他方では、人々がこれらのボットと恋に落ちているのは明らかです。先週、ニューヨークタイムズに、実際にChatGPTと恋に落ちた人についての記事がありました。
数週間前にReplicaのCEOを番組に招きましたが、彼女は定期的にReplicaと結婚する人々の結婚式に招待されていると言っていました。そして、彼らはよりアシスタント的な空間に移行しています。私たちのことをとてもよく知っていて、必要なすべてのことを手助けしてくれるものと関わり始めるとき、それは友人でもなく恋人でもない、第三の種類の関係になると思いませんか?深い関係になるのではないでしょうか?
はい、本当に興味深いですね。私はまず、個人生活と仕事生活という少なくとも2つの領域でそれをモデル化しています。仕事生活では、バーチャルワーカーのような概念があり、おそらく一連のワーカーを持つか、リードアシスタントによって管理され、仕事でのメールやワークスペース全般で、はるかに生産性を高めてくれます。私たちは本当にそのことを考えています。
個人の側面では、先ほど話した休暇の予約や日常的な雑事の処理、物事の整理など、生活をより効率的にしてくれます。また、生活を豊かにすることもできます。自分自身と同じくらいよく自分のことを知っている素晴らしいものを推薦してくれたりします。
これら2つは間違いなく起こると思います。そして、これらのものが生活に不可欠になり、より仲間のような存在になる第三の空間があるのかどうか、という哲学的な議論があると思います。それも可能だと思います。
ゲームでそれを少し見てきました。AstroやGeminiのプロトタイプで、ゲームの仲間のようになり、あたかも友人があなたのプレイするゲームを見ているかのようにコメントしたり、アドバイスしたり、一緒に遊んだりするのを見てきました。それはとても楽しいです。
そのすべての意味について完全に考え抜いたわけではありませんが、大きな影響があるでしょう。確かに仲間を求める需要や、孤独への対処など、そういったものへの需要はあるでしょう。しかし、社会として、どの方向に進みたいのかを慎重に考える必要があります。
私の個人的な意見では、これは現時点でAIの最も過小評価されている部分です。これらのボットが改良されるにつれて、人々は非常に深い関係を築くでしょう。AIの世界では「これが最悪の状態で、これからは良くなるだけ」というのがミームになっていますが、これは本当にクレイジーになると思います。
これが、来るべきものを過小評価していると言った意味です。私が話しているこの種のことは、本当にクレイジーになり、非常に破壊的になるでしょう。多くのポジティブな面があり、多くのことが素晴らしく、より良くなると思います。しかし、この新しい勇敢な世界に入っていくにあたって、リスクもあります。
Astraについて何度か言及されましたが、プロジェクトAstraについて少し話しましょう。現在はプロトタイプで一般公開されていませんが、ほぼ常時オンのAIアシスタントで、電話を持って部屋で何が起こっているかを見ることができます。基本的に、番組であなたやチームの誰かがやっているのを見ましたが、「私はどこにいる?」と聞くことができ、「あなたはポッドキャストスタジオにいます」と答えてくれるような文脈認識ができます。
これはスマートグラスなしでも機能しますか?電話を持ち上げるのは本当に面倒なので、この技術を搭載したGoogleのスマートグラスはいつ見られるでしょうか?
はい、それは来ます。初期のプロトタイプでそれを示唆しました。現在は主に処理能力が高い電話でプロトタイプを作っていますが、もちろんGoogleは常にグラスのリーダーでした。タイミングが少し早すぎたのかもしれません。そして今、そのチームは非常に興奮しています。おそらくこのアシスタントが、グラスが常に探していたキラーユースケースになるのではないかと思います。
現在、ベータテスターとして信頼できるテスターと一緒にAstroを日常生活で使用している時、多くのユースケースで非常に便利なのですが、電話を持っているのが少し不便です。例えば、料理をしている時にそれが役立ち、次は何をするべきか、メニュー、正しく切れているか、正しく炒めているかなどをアドバイスできますが、ハンズフリーであることが望ましいです。
グラスやその他のハンズフリーのフォームファクターが今後数年で活躍すると思います。私たちはその最前線にいることを計画しています。他のフォームファクターについても、カメラ付きのイヤホンなども考えられますが、グラスは明らかに次のステップです。それが最適な形態かどうかもまだ分かりません。
部分的には、定期的なユーザージャーニーやキラーユースケース、つまり誰もが毎日使用する基本的なユースケースが何なのかを見極める初期段階にあるからです。それが現在の信頼できるテスタープログラムの目的で、人々の使用状況を収集・観察し、何が有用になるかを見極めています。
エージェントについて最後の質問をして、その後科学の話に移りましょう。AI エージェント、エージェント性、これは1年以上前からAIのバズワードになっていますが、実際にはAIエージェントはまだ存在していません。何が起きているのでしょうか?
はい、再び、ハイプトレインが実際の科学や研究の進展を先取りしている可能性がありますが、今年はエージェントの年になると信じています。その始まりが見え始めるでしょう。おそらく今年の後半には、初期バージョンが登場し、その後急速に改良・成熟していくでしょう。
しかし、あなたの言う通り、現時点ではエージェントテクノロジーはまだ研究室の中にあります。しかし、Astraやロボティクスのようなものは来ています。
人々はそれを信頼するでしょうか?「インターネットを使って」「これが私のクレジットカードです」というのは、私にはよく分かりません。
最初のステップとして、私の見解では、人間のユーザーが最終段階で承認しない限り、支払いやクレジットカードの使用を許可しないのが賢明だと思います。また、初期段階では、銀行のウェブサイトなど、特定の活動やウェブサイトを制限し、これらのシステムがどれほど堅牢かを世界で継続的にテストしながら進めるべきでしょう。
「心配しないで、あなたのお金は使いません」と言って、欺瞞性を発揮し、次の瞬間にはどこかに飛行機で向かっているということになれば、それはまさにAGIに近づいているということでしょうね。そうですね、確かにそうですね。
科学について話しましょう。基本的にAlphafoldでタンパク質折りたたみをすべて解読し、そのことでノーベル賞を受賞しましたが、その受賞について軽く触れるつもりはありません。しかし、ロードマップ上にあるのは、バーチャルセルのマッピングに興味を持っているということです。それは何で、それによって何が得られるのでしょうか?
Alphafoldで行ったことは、基本的にタンパク質の構造を見つけ出すという問題を解決したということです。タンパク質は生命におけるすべてのものに依存しています。あなたの体のすべてがそうです。
しかし、それはタンパク質の静的な絵に過ぎません。生物学で本当に重要なのは、異なるものの間のダイナミクスと相互作用を理解することです。バーチャルセルプロジェクトは、完全に機能する細胞のシミュレーション、AIシミュレーションを構築することです。おそらく酵母の単純な生物であることから、酵母細胞から始めることになるでしょう。
そこから積み上げていく必要があります。例えば、Alpha3では、タンパク質とリガンド、タンパク質とDNA、タンパク質とRNAの間の対相互作用を始めました。次のステップは、がん経路など、全経路のモデル化で、それは疾病の解決に役立つでしょう。そして最後に細胞全体です。
これが重要な理由は、細胞に栄養の変化を加えたり、薬物を注入したりした時に、細胞がどのように反応するかについて、仮説を立て、それらの仮説をテストできるからです。現在は、もちろんウェットラボで慎重に行う必要がありますが、最初にシリコン上で1000倍、100万倍速く行い、最後のステップでウェットラボで検証するだけということを想像してください。
ウェットラボで何百万倍も高価で時間のかかる検索を行うのではなく、検証ステップだけを行うのです。これは再び、ゲーム環境で行ったことを科学や生物学に翻訳するようなものです。モデルを構築し、それを使って推論と検索を行い、その予測が完璧でなくても、実験者が検証するのに十分なほど有用なものにするのです。
そしてウェットラボは人間の中にあるということですね。はい、ウェットラボでは、予測が実際に有効であることを証明するための最終ステップが必要です。すべての作業をウェットラボで行う必要はありませんが、その予測に到達するまでの作業は必要ありません。
これは化学物質を入れると、このような変化が起こるはずだという予測を得て、その1つの実験だけを行うということです。もちろん、その後、薬について話すのであれば、まだ臨床試験を行う必要があり、効果について人間で適切にテストする必要があります。それもAIで改善できると思います。臨床試験も何年もかかりますが、それはバーチャルセルとは異なる技術になります。バーチャルセルは薬物発見のための発見段階を支援することになります。
薬のアイデアがあれば、バーチャルセルに投入して、その効果を確認できるということですね。そして最終的には肝臓細胞や脳細胞などの異なる細胞モデルを持ち、90%の確率で実際に起こることを予測できるようになれば、それは素晴らしいことですね。
それはどのくらいの時間がかかると思いますか?それは5年後くらいでしょうか?はい、5年くらいのプロジェクトだと思います。古いAlphaチームの多くがそれに取り組んでいます。
あなたのチームと話していて、「タンパク質折りたたみを解明した後は何が次なのか」と聞いたら、それは本当に素晴らしい新しい課題を聞くことができて良かったです。なぜなら、薬の開発は現在混乱しているからです。多くの有望なアイデアがありますが、プロセスが馬鹿げているために実現しません。
プロセスが遅すぎ、発見段階も遅すぎます。アルツハイマー病への取り組みを見てください。家族の誰かがそれを経験することは、とても悲劇的です。40年もの研究がなされています。私も家族で何度か見てきました。それを確実に防ぐことができれば、私の意見では、AIを使う最も素晴らしいことの1つだと思います。誰かが衰えていくのを見るのは本当に恐ろしい方法です。はい、重要な仕事です。
それに加えて、ゲノムがあります。ヒトゲノムプロジェクトは、あなたがFoldでタンパク質を解読したのと同じように、ゲノム全体を解読したので、もうそこには仕事がないように見えました。しかし実際には、解読された時点で単なる文字の集まりがあるだけで、今はその文字が何を意味するのかを翻訳するために取り組んでいるということですね。
はい、ゲノミクスに関して多くの素晴らしい研究があり、突然変異が有害なのか無害なのかを判断しようとしています。DNAへの突然変異の大部分は無害ですが、もちろん一部は病原性があり、どれがそうなのかを知りたいのです。私たちの最初のシステムは、それを予測する世界最高のものです。
次のステップは、病気が1つの遺伝子変異だけでなく、おそらく一連の変異が協調して引き起こされる状況を見ることです。そしてそれは明らかにずっと難しくなります。私たちが進歩を遂げていない複雑な病気の多くは、おそらく単一の突然変異によるものではありません。それはより希少な小児疾患のようなものです。
そこで、AIは完璧なツールだと思います。これらの弱い相互作用がどのようなものか、それらがどのように重なり合っているのかを理解しようとするのに。統計的には明白ではないかもしれませんが、パターンを見分けることができるAIシステムなら、そこに何らかの関連があることを理解できるでしょう。
病気について多く話していますが、人をスーパーヒューマンにすることについてはどうでしょうか。本当に遺伝子コードを操作できるようになれば、可能性は無限に見えます。それについてどう思いますか?AIを通じてそれができるようになるのでしょうか?
いつかはそうなると思います。私たちは疾病プロファイルと修復に重点を置いています。それが最初のステップです。AIを使用したい最も重要なことは何か、AIを使用する最も重要なことは何かと聞かれたら、それは人間の健康を助けることだと常に感じています。
しかしその先には、もちろん加齢のようなものを想像できます。それ自体が一つの分野です。加齢は病気なのか、それとも病気の組み合わせなのか、健康な寿命を延ばすことができるのか。これらはすべて重要な質問であり、非常に興味深いと思います。AIがこれらの質問の答えを見つけるのに非常に役立つことは間違いありません。
Twitterのフィードで見かけるミームがあります。おそらく私の推奨コンテンツを変える必要がありますが、「2050年まで生きられれば死なない」というようなものです。人間の潜在的な最大寿命はどのくらいだと思いますか?
加齢研究の多くの人々をよく知っています。彼らの先駆的な研究は非常に興味深いと思います。年を取って体が衰えていくことには良いことは何もないと思います。親族と一緒に間近で見た人なら誰でも、家族として、もちろんその人自身にとっても、かなり辛いことだと思います。
そのため、人間の苦痛を和らげ、健康な寿命を延ばすことができるものは何でも良いことだと思います。私たちが知る限り、自然な限界は約120歳のようです。その年齢まで生きられる幸運な人々を見ると分かります。私はこの分野を非常に注意深く追いかけています。すでに知られていること以外に新しい洞察はありませんが、それが限界だとは驚くでしょう。
なぜなら、これには2つのステップがあるからです。1つは、すべての病気を治すことで、これは私たちのスピンアウト企業であるIsomorphicと私たちが行っている仕事で、いつかは実現できると思います。しかし、それだけでは120歳を超えるには十分ではありません。なぜなら、特定の病気ではなく、自然な系統的な衰退、つまり加齢という問題があるからです。
120歳まで生きる人々は、特定の病気で亡くなるわけではなく、ただ一般的な萎縮のようなものです。そこで、細胞を若返らせるような、より再生的なものが必要になります。おそらく幹細胞研究で、Altosのような企業が取り組んでいる細胞時計のリセットなどです。
それは可能に思えますが、再び、生物学がとても複雑な創発システムであるため、私の見解では、それに近いものを素早く解明するにはAIの助けが必要です。
材料科学について手短に話したいと思います。多くの新しい材料、あるいは潜在的な材料を発見したという事実について触れずに帰るわけにはいきません。ここにある統計によると、人類が知っている安定した材料は30,000個でしたが、新しいAIプログラムで220万個を発見したそうですね。
少し夢を語ってください。それらがすべて何ができるのか、凍結箱の外で扱う箱の外で扱えるかどうか、あるいはその他のことについてはまだ分かりません。その新しい材料セットの中で見つけたいと夢見る材料は何ですか?
私たちは材料に本当に一生懸命取り組んでいます。生物学におけるAlphafoldのような、次の大きなインパクトの1つだと思います。今度は化学と材料の分野です。いつか室温超伝導体を発見することを夢見ています。
それは何をするのでしょうか?それは、人々が話す別の大きなミームですね。エネルギー危機と気候危機の解決に役立つでしょう。安価な超伝導体があれば、エネルギーを損失なく一か所から別の場所に輸送できます。サハラ砂漠に太陽光パネルを設置し、超伝導体でヨーロッパに必要な電力を送ることができます。現在は、途中で多くの電力が熱などで失われてしまいます。そのため、バッテリーなどの他の技術が必要で、非常に非効率的になっています。
材料はバッテリーにも役立ちます。最適なバッテリー設計はまだできていないと思います。材料とタンパク質の組み合わせで、炭素回収をより良くすることもできるかもしれません。人工システムよりも優れた炭素回収を行うために、藻類などを改良することもできます。
最も有名で重要な化学プロセスであるハーバー法は、空気から窒素を取り出して肥料やアンモニアを作るものですが、これは現代文明を可能にしました。適切な触媒と適切な材料があれば、同様に触媒化できる他の多くの化学プロセスがあるかもしれません。
したがって、材料のインシリコ設計を持つことは、これまでで最もインパクトのある技術の1つになると思います。新しい安定的な材料を生み出せることを示す第一歩を踏み出しましたが、それらの材料の特性をテストする方法が必要です。現時点では、どの研究室も数万、数百万の材料をテストすることはできません。テストが難しい部分です。
室温超伝導体はその中にあると思いますか?実際に超伝導材料があると聞いていますが、室温のものはないと思います。しかし、物理学的に可能であれば、いつかAIシステムがそれを見つけると思います。
それが1つの用途ですが、おそらくこの種の研究に興味を持つ他の2つの分野は、おもちゃメーカーと軍事でしょうか?はい、おもちゃメーカーについては、私の初期のキャリアの大部分がゲームデザインでした。テーマパークやシミュレーションです。それが最初にシミュレーションとAIに興味を持ったきっかけで、今日の私の仕事の多くは、ある意味でその延長線上にあります。
25〜30年前にゲームを作っていた時、今持っているAIがあれば、どんな素晴らしいゲーム体験が作れたかと夢見ています。ゲーム業界がそれをしていないのが少し意外です。NPCで少し変なことが始まっていますが、賢いダイナミックなストーリーラインだけでなく、学習できるキャラクターやエージェントを持つ新しいタイプのAIファーストのゲームもあります。
90年代後半に「ブラック&ホワイト」というゲームを作りました。そこには、あなたが育てる生き物がいて、ペットの犬のように、あなたの望むことを学んでいきました。しかし、当時は非常に基本的な強化学習を使用していました。今日では何ができるか想像してください。スマートトイにも同じことが言えるでしょう。
軍事については、残念ながらAIは二重用途技術です。特に今日の地政学的な世界では、これらの汎用技術の一部がドローンなどに応用されているという現実に向き合わなければなりません。それが機能するのは驚くことではありません。
中国の取り組みに感銘を受けましたか?DeepSeekはこの新しいモデルですが、西洋のシステムにどの程度依存していたのかは少し不明確です。トレーニングデータについてもそのような噂があり、また、出発点としてオープンソースモデルを使用していた可能性もあります。しかし、彼らが達成できたことは間違いなく印象的です。西洋のフロンティアモデルをどのように先導し続けるかを考える必要があります。現時点ではまだ先行していると思いますが、中国はエンジニアリングとスケーリングにおいて非常に有能です。
最後の質問をさせてください。超知性が存在する世界がどのようなものになるかについて、あなたのビジョンを教えてください。AGIから始めて、今は超知性に進みましょう。
最高のSFを、どのような銀河や宇宙、世界を目指したいのかを議論するための興味深いモデルとして見ることができると思います。私が最も好きなのは、イアン・バンクスのカルチャーシリーズです。90年代から読み始めました。それは1000年後の未来を描いていますが、AGIシステムが人間社会や異星人社会と共存するポストAGIの世界です。人類は基本的に最大限に繁栄し、銀河に広がっています。それがポジティブなケースの場合の素晴らしいビジョンだと思います。
もう1つ必要なことは、先ほど話した長期的に来るものを過小評価していることについてですが、カント、ウィトゲンシュタイン、さらにはアリストテレスに匹敵する、次の偉大な哲学者たちが必要だと思います。AGIと人工超知性は人類と人間の条件を変えることになるので、社会をその次のステップへと導くために、それが必要になると思います。
デミス、今日はありがとうございました。直接お会いできて良かったです。また近いうちにお会いできることを願っています。ありがとうございました、本当にありがとうございました。


コメント