この動画は、キングス・カレッジ・ロンドンのAI祭典2025で行われた講演の記録である。生物医学工程の上級講師であるヘクター・ゼニル博士が、人工超知能(ASI)がいかにして人類の疾病問題を解決するかについて詳述している。現在の大規模言語モデル(LLM)や統計的AIの限界を指摘し、アルゴリズム確率論に基づく新たなアプローチの必要性を論じている。特に、相関関係ではなく因果関係を理解できるAIシステムの開発と、個人の疾病シグネチャーを特定する精密医療の実現可能性について解説している。

開会の挨拶と講演者紹介
それでは始めさせていただきます。こんにちは、そして人工超知能がいかにして人類の疾病を解決するかというセッションにご参加いただき、誠にありがとうございます。これはキングスの人工知能祭典2025の一部となっております。
この祭典はキングス人工知能研究所によって組織されており、今年で3年目を迎えます。キングス大学の内外の幅広い聴衆に向けて、キングス全体にわたるAI専門知識の幅を紹介する様々な無料イベントを提供してまいりました。今年は5月20日から5月24日までの5日間にわたって、45以上の個別イベントが開催されます。
キングスAI研究所についてさらに詳しく知りたい方、メーリングリストに参加したい方、または祭典の他のイベントについて知りたい方は、www.kcl.ac.uk/aiにアクセスするか、キングス研究所のソーシャルメディアをフォローしてください。
少し事務的なお知らせですが、マイクロフォンはサイレントに設定していただき、講演中はQ&Aに質問を追加してください。今日のプレゼンテーション後に講演者に質問をお渡しします。
それでは始めさせていただき、本日ヘクター・ゼニル博士をご紹介できることを嬉しく思います。博士はキングス・カレッジ・ロンドンの生命科学・医学部における生物医学工学の上級講師または准教授です。複雑性科学、計算可能性理論、因果AIからのツールを活用し組み合わせた生物医学システム工学の研究を行っています。オックスフォード大学からのAIスピンアウトであるオックスフォード・イミューン・アルゴリズミクスの唯一の創設者兼最高ビジョン責任者であり、最初の5年間はCEOを務めました。ゼニル博士、お願いします。
ヘクター・ゼニル博士の講演開始
グスタボさん、ありがとうございます。ここにいられて非常に嬉しく思いますし、この素晴らしいイベントを組織してくださったキングス人工知能研究所に感謝いたします。祭典の開幕を飾ることができて光栄です。
人工超知能がいかにして、または必ずや人類の疾病を解決するかについてお話しします。ここで言う疾病とは予防可能な疾病のことですが、予防可能という言葉そのものも時代とともに変化し、AIによってさらに急速に変化し続けるでしょう。
私自身の研究を要約するとすれば、コンピューターとAIにランダム性を理解し扱うことを教えていると言えるでしょう。また、パターンマッチングに基づく従来の統計的アプローチよりも、コンピュータープログラムや数学的関数、方程式により似た世界のモデルを生成することも教えています。現在のAIよりもさらに先を目指しています。これは、人間の心は統計的なもの、または統計的なもののみではないと信じているからです。
この点について複数の論文を発表しており、そのうちの一つは世界のメディアで大きな注目を集めました。画面でご覧いただけるのは、ニューサイエンティストの記事の一つです。私たちがその時「宇宙型チューリングテスト」と呼んだものについてです。
チューリングテストは、コンピューターに質問をして、十分な回数騙されれば、基本的に人間と区別できない、つまりそのシステムが知能を持っていると言えるというものです。今回の場合、実際には逆のことを行いました。人々にコンピューターであるかのように質問をして、最も良いランダム性を生成できるか、またはこれらの物体の配置がランダムに見えるかどうかを尋ねました。
その結果、人間による選択のすべてを通常の統計では説明できないことが判明しました。アルゴリズム情報理論と呼ばれる理論を用いて、統計をはるかに超える必要がありました。
簡単な例を挙げてみましょう。電話番号を覚えなければならなかった頃を思い出してください。統計的パターンがある番号、例えば575が7回繰り返されるような番号は覚えやすかったのは確かです。しかし時には、少なくとも些細な統計的パターンを持たないものを覚えることができる場合があります。
例えば、電話番号が1、2、3、4、5、6、7のような自然数の列だとしましょう。実際これはボレル正規数と呼ばれる数で、基本的には統計的パターンがないことを意味します。つまり、どの部分列も同じ回数同じ数字を表現します。しかし、次の数字が基本的に一度に一つずつ数字を足すだけだということを教えてくれる心の中のモデルがあるため、これを覚えることができます。
これが統計では見逃されているものです。なぜなら、その列、その電話番号でパターンを探していても、この場合は後続関数という関数にアクセスしない限り見つからないからです。私たちの心はまさにそのように働いています。
なぜヘルスケアと医学にAIが必要なのか
それでは、なぜヘルスケアと医学にAIが必要なのか、そしてどのようなタイプのAIが必要なのかという質問に移ります。スケールアップが必要だからです。現在、深刻なスタッフ不足があり、病院と医療従事者は過重労働で、大きな疲労の兆候を示しています。また、高齢者人口の増加もあります。需要に対処するためには、技術をスケールアップしなければなりません。
また、不公平な格差にも対処しなければなりません。アクセスの不平等、遠隔地の人々は良い病院や良い研究所に簡単に行けないため、最適ではないケアにアクセスしているといったことです。実際、非常に悲しいことですが、10億人が生涯で一度も医師に診てもらうことがありません。
ケアも非常に非人間的になり、予防的ヘルスケアへのアクセスは困難で、高価で、あるいは存在しません。そのほとんどが人口ベースの一律のヘルスケアで、予防的ではありません。
また、非常に遅くて不正確なプロセス、多くのボトルネックもあります。例えば血液検査を含めて、NHSで血液検査を受けたい場合、時には数週間かかることもあります。診断もほとんどが症状のパターンマッチングに基づいており、根本原因ではありません。
これらが、ヘルスケアと医学にAIが必要な理由の一部です。システム自体の重みで崩壊しているからでもあります。イングランドでは2億件以上の薬物エラーが発生し、多額の費用がかかっていますが、より重要なのは、例えば誤診が世界中で多くの死者を出していることです。米国だけで80万人です。
人工知能、汎用人工知能、人工超知能の定義
まず、そもそも人工知能とは何かから始めましょう。理解すべき重要なことは、AIのすべての定義が人間中心的であり、人間中心であるため、それほど客観的ではないということです。通常、AIは機械が何らかの主体性または主体性の錯覚とともに実行できる、伝統的に人間によって行われた自動化されたタスクに関連しています。
ここに、書くことや描くことができる美しいオートマトンの非常に古い例があります。これは有名な博物館に展示されています。
次の質問は、汎用人工知能とは何かということです。AGIについて話すことには多くの誇大宣伝があります。典型的な定義は、AGIはすべての人間のタスクにおいて、どの人間または全人間と同じくらい優秀なAIだというものです。これは、人間の知能を定義することすら困難であるため、もう一つの非常に広範で不明確な人間中心的定義です。
それでは、人工超知能またはASIとは何でしょうか。多くの研究者によって使用される一般的な定義は、ニック・ボストロムによって書かれた「スーパーインテリジェンス」という本からのものです。彼の定義では、スーパーインテリジェンスとは、科学的創造性、一般的知恵、社会的スキルを含む実質的にすべての分野において、最高の人間の脳よりもはるかに賢い知性であるとしています。
私の観点から、この定義はあらゆる角度から非常に問題があります。知性とは何か、知恵とは何か、さらには社会的スキルとは何かを定義しなければなりません。この画像は、AIよりもさらに問題があるかもしれません。
私たちが問いかけたのは、スーパーインテリジェンスをより人間中心的でない方法で定義できるかということです。なぜなら、結局のところ、それは定義上人間の特性ですらないからです。定義上、私たちはスーパーインテリジェントではありません。なぜなら、人間の知能を超えた何か異なるものを定義しようとしているからです。
ある意味で、私は狭い超知能と呼ぶものを味わい、テストしてきました。これは電卓のようなものですでに存在しています。電卓は、算術において、どんな人間よりも、おそらくすべての人間を合わせたよりも優れています。彼らは時間をほとんど要さず、どんなに長い算術演算でもほぼ瞬時に実行できます。
これは、顔認識、過去数十年間の定理証明、チェスや囲碁のプレイ、天気予報、方程式の解決など、以前は人間にのみ可能だと思われていた多くの他のタスクでのコンピューターにも当てはまります。これらすべては、人間よりもコンピューターによってはるかに優れて実行されます。
ある意味で、私たちは狭い超知能を味わってきました。AGI、さらには生物学的人間や動物の知能でさえ、ある意味で超知能の特殊なケースと考えることができます。電卓やコンピューターも、数値、単語などの記号を操作するため、記号的AIの例です。これは次のスライドの一部に役立ちます。
知能に必要な要素:モデル抽象化と計画
最近、知能にとって基本的なものとして浮上した2つの特性は、モデル抽象化と計画または予測です。これは、ヤン・ルカンを含む複数の研究者から来ており、最近の論文がオンラインで利用可能で、画面にリンクが表示されています。
モデル抽象化と計画は、これらのリーダーが知能、したがってAIにとって基本的だと信じている機能の2つです。モデル抽象化は帰納的推論の一種です。これらは大きな言葉ですが、基本的には、理解したり説明したりしたいものについて何かを言うことができることを意味します。つまり、その物体やその出来事の理解や表現に関連しています。
計画または予測は演繹的推論の一種で、基本的には一連の出来事や観察から何が続くかについて何かを言うことができることを意味します。言い換えれば、それは現実的な将来のシナリオのある種のシミュレーションです。
私たちが主張してきた点、そして最近投稿した論文で見ることができる点は、モデル抽象化はデータ圧縮に非常に近いということです。なぜなら、世界のモデルは、何かの主要な関心のある特徴を捉えることを目的とした表現だからです。
例えば、それが猫だとしたら、捉えたいのはおそらくそのサイズや特別な歩き方、ひげなどでしょう。プロセスは何かを観察することから始まり、説明、記述、または表現で終わります。これが逆問題と呼ばれるものです。
逆問題は何かを見て、それからその説明やそれを説明するモデルを思いつくことです。モデルはノイズとノイズの一種であるランダム性を識別しなければなりません。そのため、私はAIにランダム性について教えようとしています。なぜなら、ノイズは定義上データを説明するのに重要ではないからです。データを説明するのは特徴です。
先ほど猫の例で述べたように、おそらく彼らが細長い目を持っていることは非常に重要かもしれませんが、足を持っているだけでなく、なぜなら足を持っていることは猫だけを特徴づけるものではなく、より多くの動物を特徴づけるからです。だから、実際にどの特徴を捉えるかに注意しなければなりません。
すべての詳細を含むモデルは実際にはモデルではありません。なぜなら、それはデータそのものだからです。ある意味で、モデルは圧縮されたものでなければなりません。
アルゴリズム情報理論の枠組みを使った計画は、モデル抽象化の反対側であることが判明します。なぜなら、一連の出来事や猫のような物体の本質を捉える主要な特徴が特定されれば、モデルが有用であるためには逆向きに実行できるはずだからです。言い換えれば、それを前進させて元のデータを生成するのです。
説明は元のデータを再現できるはずです。これはアブダクティブ推論とも呼ばれます。これも大きな言葉ですが、言い換えれば、基本的に与えられた時点で利用可能な情報で最良の予測を行うことです。
現在の生成AIの限界
なぜ現在の生成AIが、大規模言語モデルやLLMを含むこれらすべてを実行するのが苦手なのでしょうか。LLMは世界規模のウェブのある種の圧縮されたバージョンであることは確かです。問題は、モデルが非常に非効率的であることです。なぜなら、多くのノイズを伴い、機械的ではないからです。高精度で逆向きに実行することはできません。逆向きに実行しようとすることはできますが、それは非常に統計的です。
画面で私たち全員がすでに知っていることを見ることができます。例えば手、指の再構築はかなり苦手だということです。これについては非常に良い説明があります。ちなみに、これは古い画像ではありません。2日前にGPT-4oで生成したものです。つまり、これらは最高のフロンティアモデルでもまだ抱えている問題です。
最も合理的な説明は、これらがデータへの統計的アプローチであるため、LLMは常に別の指の隣に指がある可能性を考慮するということです。2本の指だけが隣人を持たないため、それはそうでない可能性よりも高いです。一方の側に隣人を持たない極端な部分にあるからです。
しかし、任意の指が指の隣人を持つ確率を尋ねているなら、基本的により可能性が高く、そのため基本的に周りにもっと指を印刷し続け、多すぎると言って今やめなければならないとなります。言い換えれば、それは決して正しく取得しないことが多く、画面で例えば右手または右腕を2本持っている人さえ見ることができます。
失礼します、ヘクター。人々が言っているようですが。
それはデータを再現するこの記号的理解を欠いており、人間なら誰でも5本の指を持つべきだという予測や計画において非常に貧弱な性能を示します。AGIや超知能の解決策のようには見えません。
もう一つの例があります。これもオンラインで見たことがあるかもしれません。これも2日前に最高のモデルの一つであるChatGPTでのみ見たものです。例えばリスボンがChatGPTによるとスペインにあったり、この地図にはあらゆる種類の監査があることがわかります。
LLMは私たちのユーザーインターフェースをある種ハックしたため、非常に知能的に見えます。これにより、実際にそうかもしれないよりも知能的に見えます。LLMは、ロボットに通常適用される知能の不気味の谷のようなものにあります。非常に人間に似たロボットは、私たちにとても似ているが私たちではないと知っているため、ある種恐ろしいのです。
それはLLMにも起こります。なぜなら、彼らが話す方法で私たちにとても似ているように見えるが、実際には統計的ツールであるため、ほとんどの時間私たちを騙しているからです。
これはLLMのもう一つの問題です。例えば算術演算を行うよう求めると、時間の経過とともにますます良くなっています。より多くのデータを取り込み、LLMの上に配置する他のプログラムを使うことによってです。それが何を意味するかは後で見ることにしましょう。
しかし、2つのランダムな数字を選んでLLMにそれらを足すよう求めると、それらのケースを捉える何らかのエンジンを持っていなくて、コアLLMからの統計的アプローチを実行するだけなら、間違いを犯す可能性が高いです。
コンピューターと電卓は算術に優れていることを見たように、これはある種恥ずかしいことです。コンピューターに尋ねると間違いを犯すとはどういうことでしょうか。しかし、これは基本的にLLMが訓練セットでそのデータを見ていない場合、正しい答えを簡単に思いつくことができないという問題を示しています。
LLMには、この1ピクセル攻撃と呼ばれるもののような、あらゆる種類の問題があります。これはLLMではありません、これは生成AIなので、画像上の何があるかを分類または識別しようとする畳み込みニューラルネットワークです。例えば鳥の例を見ることができますが、画像上の1ピクセルだけを変更すると、分類器は非常に高い信頼度でそれがカエルだと言います。
そのため、これは1ピクセル攻撃と呼ばれます。何かをわずかに変更するだけで、ニューラルネットワークは基本的に間違いを犯し、すべてが壊れます。それは非常に脆弱で、それは基本的に鳥とは何かのモデルを持っていないからです。1つのピクセルを変更するだけですべてが壊れてしまいます。
これは畳み込みニューラルネットワークで今でもかなりこれを行うことができる例です。これは、ランダム性が重要である別の例です。画面で見るのは3つの画像です。左側はスクールバスで、次に画像にノイズを追加することができ、私たちにはまだスクールバスのように見えますが、ニューラルネットワークは完全に混乱します。
私たちはこれをパンダテストと呼んでいます。例えば、ノイズがあると、ニューラルネットワークは実際にはそれが骨のように完全に異なる何かだと思うからです。
ヘルスケアと医学の文脈でこの種の攻撃を想像してみてください。CTスキャンやMRIのようなデータを改ざんすることで悪意のある目的に使用される可能性があります。何かをわずかに変更するだけでシステムを壊すことができます。
悪意がなくても、それは単なるエラーである可能性があり、基本的にこれはわずかなことでシステムが壊れる可能性があることを示しています。非常に堅牢な何かが必要です。
これは別のタイプで、基本的にオブジェクトの位置を変更するだけで、ニューラルネットワークが再び間違いを犯します。これは私たちが提案した攻撃の一種で、LLMでは非常に興味深いものです。私たちはこれを意見変更攻撃と呼んでいます。
あなたもこれを経験したことがあるかもしれません。なぜなら、LLMは基本的に何かに対する最も平均的な答えを見つけることであなたを喜ばせようとしているからです。私たちが発見したのは、実際にプロプライエタリーと非プロプライエタリーのLLMには意見変更攻撃の異なる閾値があるということです。
例えば、プロプライエタリーLLMは人間によってこの方法で攻撃されやすく、一方、非プロプライエタリーのオープンLLMは他のAIエージェントによって攻撃されやすいです。
私たちはこの研究をすべて使って、基本的にAIアライメントの問題を説明しようとしました。AIアライメントは基本的に、AIを私たちの価値観と人間の利益に整合させる方法です。問題は、それらを制御し、エージェントが人間の利益と整合し続けることを確実にすることは不可能であることを数学的に証明したことです。
与えられたタスクを言うとしましょう。しかし、実際にできることは、それを一線に保つのを助けるために他のエージェントを持つことです。エージェントと人間とのある種の同盟を持って、他のすべてのエージェントを制御しようとすることができます。
現在のAIをヘルスケアと医学で信頼すべきか
現在のAIをヘルスケアと医学で信頼すべきでしょうか。私たちが見てきたように、それは非常に困難です。ここに数年前からの別の例があります。GoogleのGeminiがピザに糊を付けて岩を食べることを推奨していました。時には監督下にないと非常に問題になることがあります。
主な問題の一つは、私が以前話していたことです。機械学習の核心では、彼らが例示しているのは、因果関係ではなく相関関係に関連するある種の機械です。彼らは世界のモデルを生成しません。
これはまた、彼らが世界そのものからどれだけ離れているかを評価する方法、世界に対する彼らの表現とも関連しています。これは通常、損失関数と呼ばれます。損失関数は基本的に、ニューラルネットワークが基盤からどれだけ離れているかを見るために実装するメトリックです。しかし、このメトリックは因果関係ではなく相関関係に基づいています。
畳み込みニューラルネットワークの例を挙げてみましょう。これは明らかに彼らがどのように動作するかの過度の単純化ですが、猫と犬を分類したい、猫と犬の画像で何があるかを認識したいとしましょう。多くのラベル付き画像でトレーニングした後、実際にこれらの画像のそれぞれにラベルを付けることを経て、ニューラルネットワークにラベルなしの画像を与え、それが猫か犬かを基本的に教えてくれることを期待します。
猫の場合、ニューラルネットワークが長いひげや狭い瞳孔などの猫の主要な特徴を実際に拾い上げることを期待するでしょう。しかし、これらは通常、ニューラルネットワーク内のニューロンで、直接アクセスできないものです。そのため、これは隠れ層と呼ばれます。
これがブラックボックスと呼ばれる理由でもあります。なぜなら、通常はニューラルネットワークに入力するもの、これは入力層と呼ばれるもの、そして猫か犬か、またはその間の何かである出力しか見えないからです。あなたから隠されているため、それはブラックボックスと呼ばれます。
ブラックボックスを開けて初めて、中に何があるかがわかります。この図解でまさにそれを行うつもりです。
これは猫に期待していたものです。これは入力である猫から期待される出力である猫に到達するこれらのニューロンの活性化経路のようなものです。そして犬を見せると、再び多くの猫と犬の写真を見た後、トレーニングセットから特徴を拾い上げることを期待するでしょう。
ニューロン隣人は、おそらくより大きな鼻を持っているとか、細長いものではなく丸い瞳孔を持っているとかを言うことを期待するでしょう。しかし、ブラックボックスを引用符付きで開けてみると、彼らが完全に間違った特徴、または予期しない特徴を拾い上げていることが判明します。必ずしも間違っているわけではないからです。
実際にこれらの特徴の一部を示した研究がありました。畳み込みニューラルネットワークが拾い上げたのは、犬が屋外にいるかどうか、または猫が屋内にいるかどうかに関連していました。これは根本的な特徴の一種ではありません。それはトレーニングセットからのバイアスの一種ですが、それは常に起こり得ることです。
そして再び、これはニューラルネットワークが猫や犬とは何かのモデルを抽象化していないからです。トレーニングセットから特徴を拾い上げているだけで、それは非常にバイアスがかかっている可能性があります。
深層学習の問題をどう解決するか
深層学習でこれらの問題をどう解決するかについて、因果関係理論で高く評価されている研究者であるユディア・パールからのアイデアの一つは、原因と結果を理解する機械を構築することです。それが基本的に私が過去数年間やろうとしてきたことです。
人工超知能ができることで、人工知能や汎用人工知能でさえできないことは、この種の相関関係のアプローチをデータに対して超えることです。人工超知能は実際に50年代にレイ・ソロモノフという研究者によって理論的に解決されました。
その理論はアルゴリズム確率と呼ばれ、基本的にデータの一部を説明できる最良の最適で最小のモデルとは何か、そして利用可能な情報から最適な予測を可能にするものは何かという質問に答えます。
基本的に超知能が必要とするすべてがこのアルゴリズム確率理論に含まれており、それは究極のベイジアン・アブダクティブ手法の一種です。これらは大きな言葉で、多くの方には馴染みがないかもしれませんが、何人かの方はご存知かもしれません。しかし、これは基本的に非常に重要な帰納的および演繹的推論の形の数学理論だと言っています。
レイ・ソロモノフと人工知能の歴史
レイ・ソロモノフは誰だったかというと、彼はAIの研究者でした。彼は、マービン・ミンスキーやマッカーシー、さらにはシャノンを含むAIのすべての創設者が出席した非常に有名なダートマス会議に参加しました。そこで人工知能という用語が初めて作られ、造語された場所です。
基本的にアルゴリズム確率がAI、AGI、超知能を解決しているという合意がありました。一部の研究者はそれを奇跡と呼んでいます。データを生成する方法のために、閉じた普遍分布と呼ばれています。しかし、それは非常に理論的で実装が困難でした。
超知能は実際に実用的に解決できるのでしょうか。私たちはそうだと信じており、それが過去数年間取り組んできたことです。人工ニューラルネットワークで起こったことと非常に似ています。
それらは50年代から80年代にかけて、多層パーセプトロンの定義からチューリング普遍的なニューラルネットワークの概念まで、理論的にある種解決されていました。つまり、任意の計算可能関数を実装できる、汎用目的コンピューターだということです。
しかし、実用的な側面が解決されたのは2000年代初頭または2010年代になってからで、言い換えれば、実用的なアプリケーションのために何かに役立つようになったのです。それを可能にした単一のブレークスルーについての合意はありません。インターネットからより多くのデータにアクセスできるようになり、より多くのコンピューター能力を持つようになったこと以外には。
私たちは、これは超知能とその理論的側面でも同じケースだと信じています。実際には、多くのコンピューター能力が必要で、私たちはそれにアクセスできるようになっているため、テストを始めています。驚くべきことは、私たちはそれほど多くのデータを必要としないということです。実際、他のアプローチははるかにデータ集約的です。
アルゴリズム確率の説明
アルゴリズム確率がどのように説明できるかを少し説明します。それは科学の2つの基本的な領域、古典的確率と計算を非常に美しい方法で結びつけます。また、それはランダム性の受け入れられた定義でもあります。
なぜなら、それはランダム性を圧縮不可能、予測不可能、特徴付け不可能なものとして定義するからです。つまり、例えば、データよりも短いある種のモデルを思いつくことができないということです。データ自体よりも短いモデルでオブジェクトやデータを特徴付けることができないでしょう。
それは非常に普遍的でもあります。これはおもちゃのメトリックのようなものではありません。多くの研究者は同じ概念のために異なるアイデアを思いつこうとしますが、それらは互いに等価であることが判明しました。つまり、それは非常に強力な数学理論です。
基本的に、それはランダムモデルが実際にデータを特徴付ける確率を定量化します。私たちがすることは、データの一部を与えられたときに、それを小さな部分に分解し、その部分のための小さなモデルを見つけようとし、それからそれらをまとめ、常にそれを続けることです。
基本的に、より小さなものからより大きなデータの部分を説明することができ、それからサイズによってより可能性の高いものから可能性の低いものまでモデルを並べます。サイズだけでなく、その小さなモデルで元のデータをどれだけ予測できるかも重要です。
より多くのデータにアクセスするたびに、モデルを更新し続けることができます。そのため、それはベイジアン形式で最適です。
これはある種のニューロ・シンボリック計算です。なぜなら、ニューラルネットワークができるように不確実性を扱うことができる両方の部分を持っているからですが、オブジェクトを操作して、逆向きに実行したときに基本的に元のデータを生成するコンピュータープログラムである非常に正確なモデルを思いつくことができるシンボリック計算もあるからです。
著名人の意見とアルゴリズム圧縮の重要性
AIの父の一人であり、この元の会議にいたマービン・ミンスキーは、実際にアルゴリズム確率は科学をも解決するかもしれないと言いました。2014年にニューヨーク市のワールド・サイエンス・フェスティバルから非常に素晴らしいビデオがあります。彼が亡くなる数年前のことで、基本的に彼はアルゴリズム確率にそれほど強力で科学をも解決できるため、自分の人生を捧げたかったであろうと認めました。
イーロン・マスクやイリヤ・サツケヴァーからの言及も見つけることができます。私は彼らの誰も支持しているわけではありませんが、彼らは圧縮とアルゴリズム複雑性(基本的にアルゴリズム確率の別名)がAIの未来にとって基本的な領域と概念だと言っています。
現在のAIを解決するために必要なこと
現在のAIを解決するために必要なことは何か、そしてそれはすでに起こっています。データを機械的に説明する方法を見つける必要があります。ここに2つの例があります。
一つは北アイルランドを含むいくつかの場所で見たことがあるかもしれない玄武岩柱です。もう一つは英国でもそれほど珍しくないフェアリーリングです。これらは円形のパターンで成長するキノコです。
一つは完全に物理現象で、これらは非常に熱い溶岩が水と非常に迅速に接触した結果としての六角形の形です。これらは彼らが形成する形の種類です。
もう一つは、基本的に中心から始まるが、資源を使い果たし、基本的に周辺に向かって成長し始める生物の過程です。
ここには多くのパターンがありますが、何らかの統計的ニューラルネットワークを使いたいなら、最初にこれらのパターンを生成したものの原因にたどり着くことはできないでしょう。それが私たちがその生成メカニズムにアクセスできるフレームワークを探している理由であり、これが科学のすべてです。
私たちは太陽系のモデルを持っていました。この場合は地球中心モデルだったので間違ったものでしたが、それでも惑星の動きについて多くを予測することができました。しかし、それは単純なモデルではありませんでした。特に太陽中心モデルと比較すると、それは非常に複雑でした。
太陽中心モデルでは、より単純であっただけでなく、さらに多くを説明することができました。なぜなら、それを例えば銀河などに外挿できたからです。なぜなら、それは宇宙の中心に地球を強制するよりも、重力がどのように機能するかに基づいているからです。
科学はかなりアルゴリズム確率の方法で機能し、時間の経過とともにより短いがより強力なモデルを見つけようとします。
ここにアンティキテラ装置という古代ギリシャの装置の別の例があります。ある種の初期条件があり、それから例えば惑星の動きや日食などについての予測があります。これが基本的にそのすべての説明です。
太陽に関連しており、太陽サイクルと関係があり、正しい予測を出すために適切なサイズの年を思いつかなければなりません。これが現在のAIの統計的アプローチに欠けていることであり、私たちが基本的にこれらのモデルに追加していることです。
道路上の車の分布例
私が非常に気に入っているもう一つの非常に興味深い例は、道路上の車の分布についてです。道路の観察者として、車間の時間がこのように分布することを見たことがあるかもしれません。
それらの間には常に短い期間があり、つまり明らかに同じ空間を占有することになるため、ゼロで分離することはできません。この場合、おそらく数秒の一部のようなもので、車は互いに非常に近いか、一般的に互いに非常に近いです。そして、互いに分離されている車のバッチはほんの少しだけあります。
これが統計的説明ですが、それは原因を教えてくれません。私にとって、原因を見つけ続けようとすることは非常に興味深いものでした。
この分布の原因、起源は基本的に科学者と研究者に委ねられており、それを思いつくことになりました。モデル自体からは来ませんでした。なぜなら、これは統計的モデルで、車間の時間などを教えているだけだからです。
理由は、実際には常に道路に遅い車があるため、速い車がその後ろに蓄積し、そのため常に車のバッチが来るのを見るということです。実際にこれをテストすることもできます。追加の車線を追加すると、車が他の車を追い越すことができるため、パターンを破壊し始め、分布は完全に異なって見えます。
これは、原因を持つ何かが基本的に統計を変える方法の非常に良い説明ですが、統計自体は原因を教えてくれません。これが私たちがやろうとしていることです。
両方の世界の最良を組み合わせる
両方の世界の最良を組み合わせるために、私たちはアルゴリズム確率とニューラルネットワークを結合するある種の普遍的アルゴリズム機械学習アプローチを持っています。最終的に得られるのは、データのある種のモデルで、それは数学的関数と方程式、またはデータを説明するコンピュータープログラムである可能性があります。
これは例えばバイナリでの自然数の列で、小さな部分に分解されたときにデータの一部を説明できる小さなモデルを見つけることができ、それらをまとめると、実際にはすでに知っているモデルであることに気付き、元のデータを説明する関数を生成できます。基本的にそれがどのように機能するかです。
私たちはネイチャー・マシン・インテリジェンスに論文を発表し、ネイチャー自身が非常に素晴らしいビデオを独自の主導で制作しました。私たちは何もお金を払いませんでした。それは単に私たちの論文を宣伝するためでした。
このQRコードをスキャンすると、私たちがカウザル・デコンボリューションと呼ぶものを非常にうまく説明するこのビデオにアクセスできます。これがランダム性を学習するようにコンピューターに教えることの意味です。なぜなら、データのモデルを思いつくためにランダム性を無視しなければならず、それが予測的になるからです。
超知能の測定方法
超知能をどのように測定できるかについて、非常に最近の論文で、私たちはスーパーARCと呼ぶこのメトリックも思いつきました。ARCテストに馴染みのある方には、それがインスピレーションでした。しかし、ARCテストは汎用人工知能を測定すると主張し、私たちが測定したかったのはアルゴリズム確率の文脈での超知能でした。
私たちは、私たちの方法によって実装された人工超知能に対して、整数およびバイナリ列での予測力についてこれらすべてのLLMをテストしました。次のスライドの一つで見るように、実際に時系列予測に特化したLLMよりもはるかに良い結果を出しました。
精密医療と予測医学への応用
超知能は精密医療や予測医学のようなことの鍵となるでしょう。私自身のグループでは、スタートアップとともに、時間の経過とともにデータを収集する医療機器も構築しています。
私たちが基本的にやろうとしていることは、医療を逆転させ、早期発見と予測医学のために疾病シグネチャーと呼ぶ重要なパターンを見つけることです。しかし、これらすべてのために、どの個人人間またはすべての人間を合わせても分析することが不可能な深い縦断データセットを扱う必要があります。
そのため、非常に強力なAIが必要であり、予測のために私が話している種類のフレームワークが必要です。なぜなら、通常医療で持っているのはこの種のデータだからです。
縦断データ、または理想的には持つべきものです。なぜなら、現在のシステムは基本的にスナップショットを撮り、最良の場合でも、医師は最後の前の結果と新しい結果のみを見るからです。
しかし、今年の初めにハーバードのグループがネイチャーに発表した非常に美しい論文があり、臨床的および生物学的証拠があります。基本的に、血液検査であっても、すべての人が異なり、時間の経過とともに個人的なセットポイントまたはベースラインを持っていることを示しています。
小さな変化にフラグを立てるためにそれらを学習すべきです。なぜなら、正常な検査値の範囲内にいても、健康ではない可能性があるからです。
疾病シグネチャーの例
私たちが疾病シグネチャーと呼ぶもののいくつかの例があります。例えば、細菌感染には、ウイルス感染と比較して非常に特定のシグネチャーがあります。一つの場合は好中球が、もう一つの場合はリンパ球の数が上下するからです。
それが一方か他方かを区別する方法ですが、単一のスナップショットしかなければはるかに困難で、予測、早期発見、最適な予測を行うことはできません。
この理論は基本的にこの種のケースで非常に有用であることが証明されており、次のスライドで見るように因果モデルを思いつくためです。
これは私が話していた結果で、アルゴリズム確率に基づく方法を使用して、基本的に配列を予測することでLLMを上回りました。これらは時系列の予測を行うことに専ら特化したLLMでさえあります。
言い換えれば、彼らはAGIから非常に遠いです。なぜなら、覚えているように、ARCテストでそれをテストするのは非常に困難だからです。一部の人々は彼らがすでにそこにいると主張していますが、その後彼らはテストを変更し、今では彼らはそれほどよく実行していません。
この場合、私たちはこのテストが非常に安定しており、騙すのが非常に困難であることを証明し、すべてのLLMは基本的にほぼ底にいます。彼らはモデル抽象化または生成と正確な予測を非常に貧弱に扱います。
疾病ネットワークとデジタルツイン
しかし、これらの疾病シグネチャーを得たら、私たちができることは疾病ネットワークと呼ぶものに移ることです。互いに関連している2つのバイオマーカーは、通常相関していると設定され、ある種の相関ネットワークを作成できます。
しかし、実際には、それぞれがどのように因果的に互いに関連しているかのある種の仮説のセットである因果ネットワークを作成できます。2つのものが相関している場合、基本的にそれらの2つのものが同じ原因から来る可能性があるという仮説である別のポイントを作成します。
それからそれらの仮説を確認または拒否しようとし、これらすべては基本的に人々のある種のデジタルツインを作成するためです。介入のようなことができるモデルとして身体を理解し、その個人の将来の軌道をシミュレートするためです。
私たちが思いついたのは、数スライド前に話した研究者であるユディア・パールからの因果関係の梯子で、過去数十年で開発したすべてをこの種のフレームワークに適用し、因果関係に関するすべてのこれらの他のアイデアと組み合わせます。
私たちはアルゴリズム情報ダイナミクスと呼ぶ追加の層を追加しました。これはアルゴリズム確率に関するこれらすべてのアイデアに基づいていますが、介入や反実仮想のすべてのこれらの他のアイデアと組み合わせます。
反実仮想は、物事が異なっていたら起こったかもしれないことを想像できるものです。例えば、10代の時に喫煙を始めなかったら、物事はどのように変わっていたでしょうか。ちなみに、私は喫煙者ではありません。
介入は、この薬を飲む代わりにこの他の薬を飲んだらどうなるかということです。個人のシミュレートされたデジタルツインで、将来どのように変化するかを見るために、あらゆる種類のシミュレーション実験を行うことができます。
医療における人工超知能の究極目標
これらすべては基本的に、スター・トレックに馴染みのある方にはトライコーダーと呼ばれたものに非常に似た、非常に洗練された単なるデバイスだけでなく医療へのアプローチを思いつくためです。疾病を検出し、治療がより困難になる前に治療できるようなアプローチの一種です。
そのため、私は超知能が医療と医学にとって重要だと思い、基本的に私のグループでは医療と医学で超知能を可能にしようとしています。
質疑応答セッション
ここで止めて、皆様に感謝し、質問をお受けしたいと思います。
ありがとうございました。Q&Aページの質問を見ています。質問が追加されるのを待つ間、約5〜10分間質問の時間がありますので、まず私から始めます。
素晴らしい講演のタイトルを見て、あなたが提案しているテスト、または少なくとも人工超知能が持参できるテストが医師とどのように相互作用するか、この新しい技術での医師と臨床医の役割をどのように見ているかと思います。
素晴らしい質問です。現時点で私たちがやっていることは医師をサポートすることです。なぜなら、先ほど述べたように、実際に医療システムは多くのプレッシャーの下にあることをご存知だからです。
私たちはAIからのツールで彼らを助けることによって、より多くの時間を持つという贈り物を与えています。現時点では、彼らは常にループの中にいて、AIを監督しているというアイデアです。しかし、将来的には十分な信頼を得て、AIが十分に信頼できることが証明されれば、より少ない監督でAI側により多くの責任を残し始めることができるかもしれません。
それがもう一つの問題です。私たちは十分な医療従事者を訓練していません。医師と看護師が不足しています。だから、何も良くなるということではありません。英国を含む世界のほとんどで高齢者人口も増加しているため、もしあるとすれば、さらに悪化するでしょう。
より多くの需要がありますが、医師、看護師、医療従事者はさらに少なくなります。だから、技術、自動化、AIにますます依存し、希望し続けなければなりません。
ありがとうございます。ここに質問があります。相関ネットワークから因果グラフへの移行にボトルネックがあるようです。文献を手動でチェックするなど。人間や私たち自身のバイアスを排除する方法はありますか。
それは本当に素晴らしい質問です。相関関係から因果関係への移行には確かに実際のボトルネックがあります。しかし、問題は現在私たちはほとんど因果関係を行っていないということです。少しでも針を動かすことは有用です。
アイデアは、最終的にはこのプロセスの一部を自動化できるようになることです。原因そのものを生成することではないとしても、それは私たちがやっていることの一種ですが、それは非常に数学的で、時にはマシンからの出力を解釈するのが難しい場合があります。
少なくとも、AIは他の誰かがすでに説明を持っているかどうかを見つけるのを助け、それらの仮説を確認または拒否するための実験を設計するのを助けてくれると思います。しかし、それは良い質問です。因果関係を行うのは非常に困難ですが、それは私たちがやるべきことであるべきです。それが主なメッセージです。
ありがとうございます。そして、ボトルネックについてですが、今度は別の種類のボトルネックについてです。NHSには多すぎるボトルネックがあると述べました。例えばテスト診断が高速化された場合、超早期発見が完全に実施される前に、ケア経路のさらに下流にボトルネックを移動させることにならないでしょうか。それとも、ASIが外科的介入を含む治療も高速化することを想定していますか。
最終的にはそれが主な目標ですが、多くの年月、おそらく10年以上かかる可能性があります。あなたが正しい通り、規制的なものを含む多くのボトルネックがあります。
例えば、AIにどれだけ残すかは、規制の観点からだけでなく、社会的観点からも困難になるでしょう。どれだけAIに責任を与える準備ができているかです。なぜなら、誰かが責任を負わなければならず、基本的に人間の側面を取り除く方法がないからです。
誰かが決定を下さなければならず、AIやAIを書いた人を単に責めることはできません。しかし、それは素晴らしい点です。多すぎるボトルネックがあり、基本的に私たちは一度に一つずつクラックしようとしています。システム全体を一度に変更することはできません。
素晴らしい。そして、おそらく最後の質問です。ここで示したすべてが薬物や治療開発パイプラインとどのように相互作用するか、そしてデジタルツインが臨床試験を置き換えることができる、または置き換えることができると思うかです。
そう思います。最終的にはそうなるでしょうし、現在でもAIは素晴らしいツールです。ちなみに、LLMでさえ、それらが何のためにあるかを理解すれば素晴らしいツールだと思います。
私たちは論文を書き、それが受け入れられ、うまくいけば今朝王立協会のインターフェースで発表される予定です。LLMを使用して、人間がまだ探索していない可能性がある薬物組み合わせの領域を探索することについてです。
これらは、組み合わせると乳がんのようなもので相乗効果を発揮する可能性があるFDA承認薬の組み合わせです。同時に、彼らが相乗効果を発揮する、つまり一緒に置くことで乳がん細胞を攻撃するという目的を果たすと同時に、健康な細胞を殺したくないので毒性もありません。
私たちの知識では、薬物組み合わせ発見論文が出てくるのは初めてです。なぜなら、私たちがしたことは、単にLLMの出力を得るだけでなく、ウェットラボに行ってLLMが私たちに言っていることを検証し、それが意味をなすかどうかを見ることでした。
それから、実際の実験の結果をLLMにフィードバックし、新しい仮説を得ました。論文の全体のポイントは、AIが基本的にこの場合薬物発見の科学的発見のループを閉じるのを助けることができることを示すことです。
現在のAIの状態でも非常に有用であることが証明されていると思います。非常にクリエイティブではないかもしれませんが、それでも多くのデータを取り込み、すべての人間がアクセスできない、または自分で取り込むことができない領域をおそらく探索することができます。
しかし、最終的にはそれは絶対に正しく、製薬会社はすでにやっているか、少なくともやることを考えています。シリコ内でのテストと呼ばれる薬物のテストにデジタルツイン技術を使用することです。つまり、最初にシミュレーションを行うのです。
完全に置き換えることは決してないと思います。なぜなら、最終的には人間に与えても安全であることを証明しなければならず、シミュレーションだけでなく、薬物承認の非常に長いプロセスを短縮できることを希望するからです。
完璧です。ありがとうございました。専門知識と洞察を共有してくださったゼニル博士に感謝します。このイベントは本当に素晴らしく、祭典への非常に価値ある貢献でした。ありがとうございました。聴衆の皆様にも感謝し、画面にすぐに表示されるQRコードをスキャンして、祭典の評価にご協力いただくために一つの質問にお答えください。
今日この講演に来てくださってありがとうございました。祭典は5月24日土曜日まで続き、プログラムには他にも多くのイベントがありますので、QRコードをフォローして詳細を調べ、登録してください。
また、対面セッションに参加する場合は、もっと知りたければ祭典のTシャツを着た人に話しかけることもできます。再度ありがとうございました。


コメント