AI科学者は既に存在している。しかし進歩は加速しているのか?

AIサイエンティスト・科学研究
この記事は約28分で読めます。

Future HouseのCEOであるサム・ロドリゲスが、AI科学者の実態と可能性について語る。彼が開発したCosmosは、PhD研究者6ヶ月分の作業を一晩で完了できるAIシステムである。しかし、大手AI企業のCEOたちが主張する「10年以内に全ての病気を治療できる」という予測には懐疑的な立場を示す。臨床試験や製造プロセスといった現実的な制約が、科学的発見から実用化までの時間を大幅に延ばすためである。一方で、タンパク質構造予測や抗体の生成的デザインなど、AIによる具体的な科学的進歩も着実に進んでいる。サムは30年という時間軸であれば、医療分野における劇的な飛躍が期待できると予測している。

A.I. Scientists Are Here. But Is Progress Accelerating? | EP 170
The leaders of the biggest A.I. labs argue that artificial intelligence will usher in a new era of scientific discovery,...

AI科学の現在地

ケビン・ルースです。ニューヨーク・タイムズのテクノロジー担当コラムニストをしています。

ケイシー・ニュートンです。Platformerから来ました。

そしてこれがHard Forkです。今週はFuture HouseのCEO、サム・ロドリゲスがスタジオに参加して、AI科学における誇大宣伝と現実を切り分けていきます。

さて、ケイシー、科学の時間がやってきましたね。

ちょっと待ってください、ケビン。白衣を着て、ブンゼンバーナーを取り出して、今日は何を料理してくれるのか見せてもらいますよ。

私はAIが科学や科学的発見のために何をしているのか、何をしていないのかという問題に取り憑かれています。明らかに、これは大手AI企業のリーダーたちからよく聞く話です。ダリオ・アモデイ、サム・アルトマン、デミス・ハサビスといった人々ですね。彼らは最近、自分たちが構築しているこれらの新しいAIツールを使って、新しい科学的問題を解決し、病気を治療し、気候を修復することにどれほど近づいていると信じているかについて語っています。

そしてその一部は明らかに誇大宣伝であるか、少なくとも誇大宣伝の痕跡があります。しかし実際には、AIと科学において多くの本物の出来事が起きているのですが、私個人としてはそれを評価する資格があるとは感じていません。

そうですね。そして科学は、これらのテクノロジー企業のリーダーたちが私たちに彼らを評価してもらいたい主な方法の一つになっています。なぜなら、彼らのモデルの一つが何か恐ろしいことをするたびに、基本的に返ってくるメッセージは「心配しないで、私たちはもうすぐ癌を治療しますから。ちょっと待っていてください。このチャットボットがあなたを狂気に駆り立てているかもしれないことは分かっていますが、あと数回のリリースを待ってくれれば、本当に素晴らしいことをやりますから」というものですからね。

はい。そしてこれは今、アメリカ政府からも聞いている話です。Genesisミッションが感謝祭の直前にホワイトハウスによって発表されました。彼らはこれを、AIの新時代を解き放ち、今世紀の最も困難な問題を解決できるイノベーションと発見を加速させるための、専用の調整された国家的取り組みと呼んでいます。

ああ、Genesisミッションというのは、フィル・コリンズにホワイトハウスのクリスマスパーティーで演奏してもらおうとしているだけかと思いました。

どうやら違うようですね。そして今日は、そこにある科学的発見と可能性のうち、どれが本物でどれがそうでないかを理解するために、正真正銘の科学者を招きました。幅広い焦点を持つ専門家が必要です。バイオテックや創薬だけでなく、さまざまな科学分野におけるAIの影響を追跡している人物が必要なのです。そしてケイシー、私たちは完璧な人物を見つけました。

聞かせてください。

サム・ロドリゲスは、Future HouseとEdison Scientificの共同創設者兼CEOです。サンフランシスコを拠点とする、非営利団体と営利企業の両方ですね。

前に聞いたことがあるような。

はい。彼が取締役会のクーデターを起こしたら戻ってきてください。Future Houseが非営利で、Edison Scientificがそこからスピンアウトした営利企業です。私は彼らのドッグパッチにあるオフィスに行ったことがあります。本当に楽しいところです。ちょっと風変わりなマッドサイエンティストの研究室のような感じがします。私が理解できない実験機器がたくさんあって、白衣を着た人々が走り回っていて、みんながAIについて話していて、とてもクールな場所にいるような感じがします。

そして彼らは、サムがAI科学者と呼ぶものを構築しています。これは科学研究のプロセスの一部を実行できるAIエージェントです。そしてサム自身も科学者です。MITで物理学の博士号を取得しています。Future Houseを立ち上げる前は、数年間応用バイオテック研究室を運営していました。つまり、彼はこういったことがいくつかの異なる角度から起こっているのを見てきたわけです。

そうですね。今日は彼が何をしているのかについて話したいのですが、全体的な状況についての彼のビジョンも聞きたいと思います。何が機能していて、何が機能していないのか、どこが誇大宣伝で、どこが本物なのかを教えてください。サムにはそれについて多くのことを語ってもらいます。

はい。サムはAIが科学のために何をするかという信念のスペクトラムの中で、より楽観的な側にいると言うのが公平だと思います。しかし、私たちの会話で聞くように、彼は5年か10年で全ての病気を治療できると主張している最も楽観的な人々よりは懐疑的です。

そうですね、最も大胆な予測に対して少し冷や水を浴びせてもらいたいと思っていた方には、彼はそういったものも提供してくれます。

では、彼を呼びましょう。

AI科学者Cosmosの実力

サム・ロドリゲス、Hard Forkへようこそ。

こんにちは。ありがとうございます。

さて、今日はあなたを科学の専門家として、科学で起きている最大のAIを活用した最近のブレークスルーへのガイドとしてお招きしました。これは私が何となく重要だと理解している分野で、大きなことが起きているのですが、私たちのどちらも科学者ではありません。もっとも、私は小学校で素晴らしい重曹火山を作りましたけどね。

今日は話すことがたくさんありますが、いくつかの詳細に入る前に、あなたが取り組んできたプロジェクトについてお聞きしたいと思います。先月、あなたの非営利団体の商業部門であるEdison Scientificが、Cosmosという新しいAI科学者をローンチしました。あなたによると、このモデルの1回の実行で、PhD研究者やポスドク研究者の6ヶ月分に相当する作業を達成できるそうです。Cosmosがどのように機能するのか、そしてその6ヶ月という数字がどこから来たのか教えてください。

はい、その通りです。実は最初に言っておきたいのは、その6ヶ月という数字を得たとき、私の最初の反応は「これが真実であるはずがない」というものでした。そして今では、いくつかの異なる方法で測定しています。それについて皆さんにご説明できます。

しかし基本的には、少し話を戻しましょう。私たちは2年間、AI科学者を構築する方法を考えてきました。ここでのコンセプトは、科学者がいるよりもはるかに多くの科学を行うことができるということです。では、どうやって科学をスケールアップするのか。Cosmosで起きた非常にクールなことは、Cosmosは私たちが作った中で初めて、実際に一緒に作業しているときに本当にAI科学者のように感じられるものだということです。

つまり、研究目的を与えると、それが去っていって、実際に非常に深く興味深い洞察を持って戻ってくるのです。時には間違っていることもありますが、約80%の確率で正しいです。これは人間に何かをするように頼んだときと同じような割合です。一緒に作業するのは新しい体験のようなものです。それはすべて非常にエキサイティングです。

特に6ヶ月という数字については、複数の学術協力者がいて、彼らはまだ発表していない多くの科学を行っていました。基本的に、同じ研究目的と同じデータセットをAI、Cosmosに与えて、新しい発見をするように頼みました。そして一晩で戻ってきて、研究者たちが見つけたのと同じものを見つけていました。そして研究者たちに、最初にこれを見つけるのにどれくらいかかったか尋ねると、3ヶ月、5ヶ月、6ヶ月といった答えが返ってきます。そこからその数字が来ているのです。彼らがその発見に至るまでにかかった時間の量なのです。

では、いくつか質問させてください。このツールは他のチャットボットのように入力するボックスのようなものですか。もしそうなら、何がそれを動かしているのですか。あなた方は独自のモデルをゼロから構築したのですか、それとも他社のモデルに微調整を加えたのですか。

はい、そうです。基本的に入力するボックスのようなもので、研究目的を尋ねます。チャットボットではありません。最終的に発見を持って戻ってくるまでに約12時間動作します。

どのように構築されているかについては、OpenAI、Google、Anthropicのさまざまな言語モデルの上に構築しています。どの実行でも、すべての異なるプロバイダーのモデルを使用しています。また、特定のタスク用に社内でトレーニングした独自のモデルもあります。それらのモデルは、トレーニングした特定のタスクについては、フロンティアプロバイダーが作るモデルよりもはるかに優れています。

そしてCosmosの重要な洞察は、基本的に私たちが構造化された世界モデルと呼ぶものの使用です。今日のAIシステムの主な制限の一つは、タスクの長さとタスクの複雑さに制限があり、それを実行する前に軌道から外れてしまうことです。何をしているのか忘れてしまう。もはやタスクに集中していない。

そして私たちが見つけ出したのは、時間をかけて構築されるこの世界モデルに貢献させる方法です。これは基本的に、取り組んでいるタスクについての完全な知識の状態を記述します。これにより、並列で、直列で動作する何百もの異なるエージェントを編成し、それらすべてを一貫した目標に向かって作業させることができます。それが本当の解決策でした。

Cosmosについて興味深いと思ったもう一つのことは、コストです。このモデルは1プロンプトあたり200ドルかかります。

はい。

つまり、タスクを与えるたびに200ドルを支払うわけです。なぜそんなに高いのですか。

つまり、多くの計算を使うからです。それが根本的な答えです。多くの計算を使うのです。

どれくらいか教えてください。

Cosmosの個々の実行は、平均して42,000行のコードを書き、1,500本の研究論文を読みます。例えばClaudeを実行すると、数百行のコードを書くかもしれません。つまり、これには多くの計算が投入されているということです。

猫がキーボードの上を歩いて誤ってエンターを押して、突然600ドル使ってしまった科学者はいませんか。

これは問題です。問題なんです。理解しなければならないのは、科学者が実験を行ってデータを得る場合、そのデータを集めるのに5,000ドルから10,000ドルを費やすということです。そして科学者が望んでいるのは、得られる絶対最高のパフォーマンスです。Cosmosを使用した科学者は一般的に、私たちがたった200ドルしか請求していないことが信じられないと言って戻ってきます。

そして、200ドルは今のところプロモーション価格だと言わなければなりません。実際には最終的にもっと請求しなければなりません。

価格が上がるんですね。クリスマス前にプロンプトを入れておいてください。

まさにその通りです。しかし実際には、データを集めるのに数千ドルを費やさなければならないなら、最終的にはコストは制限ではありません。人々がミスをするので、返金には非常に寛大でなければなりません。タイプミスをしてしまった、ひどいですよね。

科学的発見の現実

あなたがちょうど言及した、このツールがどれくらい長く動作できるか、科学者たちにどれだけの時間を節約しているかを把握するために実施したテストについてですが、それは既存の研究を複製することについてです。しかし、これらの大手AI研究所を運営している人々から聞くことの多くは、かなり近い将来、AIが新しい科学的発見を始める可能性です。既存の科学的方法やプロセスではできないことを始めるでしょう。それにどれくらい近づいているのですか。

実はそれはすでに起きています。Cosmosについて発表した論文を読んでいただければ、7つの結論を示していますが、そのうち3つは既存の発見の複製でした。4つは科学文献への全く新しい貢献、つまり新しい発見でした。

そのうち、最も印象的なものは何ですか。

私たちが本当に気に入っているものの一つは、人間のゲノムには何百万もの遺伝子変異が含まれています。これらは異なる人々のDNA間の違いで、病気と関連しています。ほとんどの場合、私たちは変異が病気と関連していることは知っていますが、その理由は全く分かりません。

そこで私たちはCosmosに、多数の異なる遺伝的要因についての大量の生データを与えました。変異が何か、どのタンパク質が変異の近くに結合するか、そういったあらゆることです。そして2型糖尿病について、これらの変異の一つに関連するメカニズムを特定するよう頼みました。

そしてそれが戻ってきて、これは遺伝子の中にない変異であることを特定しました。Cosmosは、これが実際には異なるタンパク質が結合する場所であることを特定しました。どのタンパク質が結合するか、どの遺伝子が発現しているかを特定でき、それをその遺伝子SR1の実際のメカニズムに結び付けました。これは膵臓でインスリンを分泌することに関与しています。

つまり、この場合に私が聞いているのは、あなたのモデルが既存のデータに対して非常に高度な推論を行い、他の人間の科学者がまだ取り組んでいなかった、そして本当に長い間取り組まないかもしれないことを特定できたということですね。

はい、その通りです。

科学は一般的に、どのデータを集めるかを決定し、そのデータを集め、そして結論を導き出すという構成になっていると思います。この時点で、基本的にCosmosが目指しているのは3番目のステップですね。

あなたはステップゼロを省きました。トランプ政権にあなたの資金凍結を解除してもらうことですが、他はすべて正しいです。

Cosmosからこのような発見を得たとき、それを検証する必要がありますか。研究者のチームに渡して、機能することを確認してもらう必要がありますか。次に何が起こりますか。

はい、絶対に検証する必要があります。実際、論文の中で、その特定の変異をどのように検証したかを説明しています。一般的に人々がそれを使用しているときは、そうです、入っていって、実際に文字通りCosmosの実行を行うとき、最初にしなければならないのは、それが何を教えてくれているのかを理解することです。なぜなら、科学者が6ヶ月分の仕事だと考えるようなことをちょうど行ったばかりだからです。そしてあなたはそこに座って長い時間、ただ読んで理解することになります。

それを読んで理解したら、はい、確かに実験を実行し、自分自身の分析を行い、これが真実であると自分を納得させるために相互参照します。そして研究目的が何であるかに基づいて、次のステップを決定します。この場合、この特定の発見から新しい創薬ターゲットになる可能性は低いと思います。しかし、他の発見でこれを実行すれば、最終的には新しい創薬ターゲットを見つけて、創薬プログラムを開始するかもしれません。

Cosmosのようなモデルについて人々が表明している懸念の一つは、これは単に障害がある場所ではないということです。AIで発見された薬やデザインされた薬がもっと多くの病気を治療していない理由は、実際にはそれらを発見する研究方法がないからではないのです。臨床試験を行い、人間の被験者を募集し、FDA承認を得なければならないからです。そういったことすべてが、実際の薬の発見よりもはるかに長い時間がかかります。

では、このようなモデルは現在、私たちの科学プロセスのどのような問題を解決するのに役立っているのですか。

絶対にその通りです。実際、医学を解決する上で最終的なボトルネックは基本的に臨床試験だということには本当に同意します。これを見る最も簡単な方法は、マウスで治療する方法を知っている病気の数を見ることです。天文学的な数です。なぜなら明らかに実験を実行できるからです。しかし人間では物事が遅いのです。

とはいえ、製薬会社が現在実行しているすべての実験、実行されているすべての臨床試験が、完全な知識状態を考慮して最適に計画され、最適に考案されていると思うなら、完全に間違っています。そんなことはありえません。そしてそれらの実験は数億ドルかかります。

つまり質問は、最終的には臨床試験を実行しなければならないが、持っているすべての知識、持っているすべてのデータを考慮して、実行できる最良の実験であることをどのように確認するかということです。まだ発見されるのを待っている洞察を含む非常に多くのデータがあります。しかし、それらを見つけに行く人がいないだけです。そして最終的には、それがより良い実験、より良い試験につながるでしょう。

では、あなたのツールが今日の科学者のワークフローにどのように適合するかについて興味があります。実験を完了して、今分析の助けが欲しいという感じですか。それとも、少しの分析しかしなかった古い実験がすべてあって、もっと汁を絞り出せるか興味があるという感じですか。AIが現在働いている科学者にとって本当に良い他の方法は何ですか。

はい。良い質問です。2019年の私に戻りましょう。それは私が博士課程を終えようとしていた時です。私は巨大なデータセットを持っていて、卒業したかったのです。なぜなら私は博士課程の学生で、年間4万ドルくらいしか稼いでいなかったからです。そして博士課程の学生でなくなる素晴らしい機会がたくさんありました。

それで私は6ヶ月間、文字通りただ机に座ってデータを分析し、結論を導き出し、論文を読んでいました。今のところ、それがCosmosが適合する場所です。そのデータセットを取って、Cosmosに渡すと、多くの発見を思いつきます。今のところ、それらの発見を検証するために多くの手作業をする必要があります。かなりすぐに、発見を持って戻ってきて、素晴らしいと言えるようになるでしょう。

AI科学の現状

サム、今のAI科学の世界の状況を私たちとリスナーに説明していただけますか。最近、ホワイトハウスがGenesisミッションと呼ぶものを発表しました。これは連邦政府が保有しているすべてのデータセットを集めて活用し、新しい科学的探求を行うための連邦政府の取り組みです。

テクノロジー業界、バイオテック業界の内外で起きている多くの取り組みもあります。あなたのものも含めて、材料科学のためのAIを行っている人々もいます。今AI科学でホットなものは何か、努力と資金がどこに向かっているのか、全体像を教えてください。

AI科学の状況を理解するために、まず根本的に理解しなければならないのは、AIはモデルを構築することだということです。例えば、言語モデルとは何でしょうか。言語モデルは根本的に人間の言語のモデルです。人間の言語のモデルを構築すると、人間が自分の考えを言語でエンコードするため、ある意味で人間のように考える方法を学ぶということがたまたま起こります。これは21世紀で最も偉大な発見の一つ、おそらく史上最大の発見の一つです。

同様に、AIと科学について話すとき、考えなければならないのは、あなたが物事をモデル化しているということです。それがAIがすることです。基本的に二つのカテゴリーがあります。自然界をモデル化することと、科学を行うプロセスをモデル化することです。これらは根本的に異なり、この区別をする理由は、私たちがやっていることは科学を行うプロセスをモデル化することだからです。

AI科学の世界のもう一方の側は、例えばタンパク質の構造を予測できるモデル、新しい抗体を生成できるモデル、ゼロから新しい生物を作成できるモデルを構築することです。これらはすべて2025年に起きたようなことで、非常に多くの勢いがあります。

自然界をモデル化する部分で起きていることの中で、あなたがタンパク質フォールディング、新しい生物といったものに言及しましたが、科学者としてあなたが見てきた中で最もワクワクしたものは何ですか。

今最もエキサイティングなのは、間違いなく生成モデルと呼ばれるものへのこの傾向だと思います。これらは、基本的にゼロから望ましい特性を持つタンパク質や抗体などの例を生成できるモデルです。これは私たちがこれまで一度も持ったことのない新しい能力です。そしてそれは巨大です。

すべての実験を実行する際の信頼性の部分について興味があります。今週ソーシャルメディアで回っているのを見ました。自分でも再現しました。Googleに「2026年は来年ですか」と尋ねると、「いいえ、2026年は来年ではありません。再来年です」と答えました。

サム、そのような世界で、すべてのデータ分析をAIに委ねるという考えに懸念を抱く人もいるかもしれません。科学者たちは基本的にAIの作業を確認するのにどれくらいの時間を費やさなければならないのでしょうか。そしてそれは彼らの作業にどのような負担をかけますか。

はい、これは非常に面白いです。遡って確認するのに多くの時間を費やさなければなりません。しかし明確にしておくと、これはAIがやるかどうかに関係なく真実です。友人に頼む場合でも同じです。論文を発表するつもりなら、遡って確認して、自信を持っている方が絶対に良いです。決して100%にはなりません。できる最善のことは、自分でやっていた場合と同様に良い場所に到達することです。それは100%ではありません。なぜならあなたも間違いを犯すからです。

そして作業を確認することは、最初にそれを作成するよりも常に速いです。はるかに速いです。

歴史上の最大の科学的ブレークスルーの多くは、この種の奇妙な偶然、セレンディピティの瞬間から来ています。ペニシリンがペトリ皿で成長し始めるとか、ああ神様、これは素晴らしいと発見するとか。AIはそのようなセレンディピティ、そのような偶然を保持しますか、それともそれを最適化して排除しますか。

これは素晴らしい質問で、事実として私たちはまだ本当に分かりません。これは多くの人々が尋ねている本当に重要な核心的な質問になるでしょう。

あなたの直感はどうですか。

おそらく保持されると思います。

保持される。

保持されると思います。ペニシリンについて、私の理解では基本的に窓が開いていて、抗生物質のないいくつかの寒天の上に、明らかに抗生物質がなかったのです。これが最初の抗生物質の発見だったのですから。窓が開いていて寒天があり、胞子が飛んできて成長し始め、バクテリアが阻害されているのを観察しました。それはミスです。誰かが失敗したのです。そしてそのミスが素晴らしいものにつながりました。

そしてミスは起こるでしょう。それは保持されると思います。

しかし、その間、科学者は常に窓を開けておくべきですね。

何が起こるか分かりませんから。真面目な話として、学術界で大学院生を迎えると、大学院生の1年目は何をすべきか全く分かっていません。何をすべきか全く分かっていないのです。そしてそれは科学的進歩の大きな源です。なぜなら彼らは、何かを知っている人なら決して考えないような最もランダムで奇抜なことをするからです。そしてそれは実際に本当に重要です。

AI科学者モデルに少し幻覚を起こさせたいようなものですね。

まさに。

そうすればそれを失わない。

ノイズを加えるという話をします。これは実際に生物学的進化にとっても重要です。ゲノムには多くのノイズがあり、それが進化がランダムに新しいものを思いつく方法です。完全にランダムで何もしないタンパク質があって、ある日突然、おっと、何かをするようになって、それが素晴らしいということです。

大手AI研究所のリーダーたち、デミスやダリオ、サム・アルトマンといった人々が、AIによって今後10年か20年以内にすべての病気またはほとんどの病気を治療できるようになると言っていることについてどう思いますか。

10年というのは狂っています。私は喜んでこれについて非常に強い立場を取ります。なぜなら、もし私が間違っていたら、それは素晴らしいことだからです。もし私が間違っていたら、みんなが勝つのです。しかし、10年というのは狂っています。

なぜ狂っているのですか。

前に話していた理由のためです。臨床試験を実行しなければならないからです。今、25歳から65歳の間の人間の老化を完全に止める薬があったとしても、10年間は分かりません。なぜなら、その年齢範囲の人間で老化しているかどうかを検出するには、少なくとも5年か10年かかるからです。1年から次の年で老化していることを検出できません。だから、それが機能しているかどうか分からないのです。

まあ、私の10年ぶりの同窓会では、すでにかなり悪く見える人もいましたけどね。

言いたくはありませんが。

私は25歳と言いました。確かに。確かに。

しかし、実験を実施しなければなりません。それらの実験には時間がかかるでしょう。30年なら非常にもっともらしいと思います。何が可能になるか分かりません。老化を止めることが可能かどうか分かりません。すべての病気を治療することが可能かどうか分かりません。しかし、今から30年の間に、巨大な飛躍を見ることを期待すべきだと思います。

もう少し掘り下げたいのですが、一部の人々はそれを聞いて、これは本質的に規制の問題だと言うかもしれないからです。つまり、FDAがこれを測定するように設定されていないということです。実験の側面について興味があります。十分な生物学者がいて、すべての実験を実行できるわけではないという私の理解は正しいですか。実験に資金を提供する資金がないかもしれません。そして、これらの実験の一部は実際に実行するのに長い時間がかかるという点を指摘されました。それで、あなたの心の中で、それを非常に困難にするすべての要因は何ですか。

人間でテストしたい分子があり、どの人間でテストしたいか分かっていたとしても、それを作りに行かなければなりません。人間は大きいです。多くが必要です。実際に人間に入れることができる十分に高い等級であることを確認しなければなりません。患者を見つけなければなりません。つまり医師との関係を形成することです。実際に、喜んでやってくれる十分な患者が集まるまで待たなければなりません。多くの病気では、単に患者がそれほど多くありません。だから患者を見つけるのは難しいのです。

そして実際に彼らに投与し、何が起こるか待って見なければなりません。規制がなくても、遅いでしょう。

そして現時点では、そのほぼすべてに対するAIのショートカットはありません。

いいえ。AIが私たちにできるようにすることは、すでにそれを発見する情報を持っている多くのことを発見することです。まだそれを理解していないだけです。

AI研究者が時々話すもう一つのことは、おそらく合理的ではありませんが、ある日GBT-7を手に入れて、アルツハイマーの治療方法を尋ねると、それがただ教えてくれるだろうと期待すべきではないということです。私の期待は、十分な知識がないということです。無限の知性があっても、原理的にそれを解決するのに十分な知識がありません。無限の知性があっても、実験を実施して確認しなければならない、世界についてまだ知られていないことがあるでしょう。知られているすべてのことを考慮して、可能な限り最良の実験を計画することはできるでしょう。しかし、ゼロから解決することはできないでしょう。

ケイシー、私はラテン語を勉強しました。ゼロからという意味です。

ああ、ありがとうございます。助かりました。

AI研究の焦点と課題

これは正確には科学ではありませんが、サム、これについてどう思うか興味があります。すべての大手AI研究所は数学に夢中です。

はい。

国際数学オリンピックで勝つこと、金メダルのスコアを出すこと、これらの未証明の数学定理を解くことに夢中です。私はこれについて考えを持っています。これらの研究所が、高校時代に自分たちが競技数学選手でIMOに参加してかなり良い成績を収めた人々で満たされているからだと思います。そして、それらの人々の多くは、AGIは単に自分たちのわずかに賢いバージョンのようなものになるだろうと考えているのです。

しかし、これらの場所がなぜ数学を最初に多くの進歩を遂げたい場所の一つとしてこれほど夢中になっているのか、興味があります。

二つの理由があります。理由の一つは、あなたがちょうど言ったことと全く同じだと思います。単に馴染みがあるのです。しかしもう一つの理由は、進歩を測定できるということです。最終的に、機械学習の進歩を推進するものの大きな部分はベンチマークです。

数学では、証明が正しいかどうかを判断でき、改善すべき無限の数のことがあるようなものです。だから、良くなっているかどうかを判断するのが本当に簡単なのです。IMOのようなものは素晴らしい機会を提供します。

対照的に、今年のAIの生物学における最大のブレークスルーのいくつかを見ると、Chai DiscoveryやNabがゼロから抗体を生成するための非常に優れたモデルを思いつくといったことです。巨大なブレークスルーですが、最終的に彼らの勝利は人間で承認されたときになるでしょう。それはあと5年くらいかかるかもしれません。

Ark Instituteが初めて誰かがゼロから生物をデザインしたことを発表しました。彼らはバクテリオファージをデザインしました。バクテリアに感染する一種のウイルスです。信じられないことです。しかし、どれくらい良いかを評価するのは難しいです。野生に放つわけではありませんから。

IMOは本当にクリーンです。だから、私たちが多く考えることの一つは、科学で良い仕事をしているかどうかを測定するために追求できる本当に明確なベンチマークをどうやって得るかということです。

ここに答えがあります。国際癌治療オリンピック。

それは良いですね。

これを始めましょうか。勝った人にメダルをあげられます。

それに取り組みましょう。これらの企業のCEOやリーダーたちが、今後10年か15年、あるいは彼らが与えるどんなタイムラインでもAIを使ってすべての病気を治療すると発言するとき、彼らはボトルネックを理解していないからそうしているのでしょうか。彼らは非常に賢い人々です。では、彼らは何を見ていないのでしょうか。それとも、これはある種のマーケティング活動としてやっているのでしょうか。これは、そうでなければAIに怯えるかもしれない人々をワクワクさせようとする試みですか。なぜ彼らはこれらの予測をしているのですか。

いいえ、私は、合理的な人々が意見を異にする可能性があると思います。実際にモデルが超賢くなり、臨床試験を実行する前に進歩しているかどうかを測定する方法を見つけ出し、それが反復サイクルを増やすだろうと主張できる多くの理由があります。それについての合理的な議論があります。もう完全な臨床試験は行わなくなるでしょう。バイオマーカーを使うだけです。それは狂っていません。そしてそれが私が間違っている可能性がある一つの方法で、おそらく10年後にはすべての病気の治療法があるかもしれません。

だから、その一部は明らかに、彼らはただ物事を誇大宣伝したいのです。その一部は、サム・アルトマンが臨床に入れる低分子の製造をスケールアップするのに何が必要かを本当に深く理解しているかというと、おそらくそうではないでしょう。

だから混合しています。悪意があるとは思いません。人々が非常に興奮しているだけです。ある時点で現実との衝突が少しあるでしょう。それが正確にどこになるかは分かるでしょう。しかし、関係なく、未来は素晴らしいものになるでしょう。

2025年のこの瞬間に、AIツールが働く科学者の生活をどれくらい変えたと思いますか。そして、1年後にはどれくらい違うと予想しますか。

彼らがまだ変わっていない程度に、あなたは驚くと思います。一般的に科学者は非常に保守的な人々です。なぜなら、実験を実行しているとき、少なくとも生物学では通常、実験がなぜ機能するのか、なぜしないのかを完全に理解していないからです。

過去に実行したプロトコルから受け継いだものがあり、このようにやっているのです。テストすることもできますが、テストすべきものが多すぎます。だから、方法に固執しているだけです。そして、それが機能するものです。機能するものをやりたいだけなのです。

そのため、生物学者は新しい方法をゆっくりと採用します。世界中のほとんどの研究室はおそらく、以前と同じように科学を行っているでしょうし、おそらくしばらくの間そうし続けるでしょう。そして、それで大丈夫です。

コーディングの部分では、多くの人々がすでにそれを採用していると思います。生物学では歴史的にコーディングが大きなボトルネックだったからです。コーディング方法を知らなかった生物学者が、Claude、OpenAIのモデル、Geminiなどを使って多くのコーディングができるようになったのは巨大な解放です。だから、それは非常に迅速に採用されるでしょう。

文献検索も同様です。科学文献の膨大さを解析できるようになることです。それは巨大な解放です。非常に迅速に採用されるでしょう。私たちが構築しているようなツールは、もう少しフロンティアです。文献検索エージェントも構築していて人々が使っていますが、一般的にツールはもう少しフロンティアです。採用には少し時間がかかるかもしれませんが、それで大丈夫です。

最終的に、人々は他の人々がそれらを使用して素晴らしい結果を得ているのを見たときに採用します。

過大評価と過小評価

サム、ここで少し稲妻ラウンドゲームをプレイできますか。これを「過大評価、過小評価」と呼んでいます。何かをお伝えしますので、あなたの科学的意見でそれが過大評価か過小評価かを教えてください。準備はいいですか。

はい。

バイブプルービング。これはAIシステムが数学の証明を書きに行くことです。

4番目の選択肢があるとすれば、おそらくちょうど適切に評価されています。AIの進歩推進力としては素晴らしいです。それが得意であることは、おそらく他の場所に影響を与えるでしょう。しかし、それ自体が有用かというと、確信が持てません。

AI研究室の自動化のためのロボティクス。

科学研究室を自動化するためのロボティクスですか。

はい、科学研究室を自動化するためです。

科学研究室を自動化するためのロボティクスは、適切に評価されていると思います。完全に変革的になるでしょう。技術はまだ全くそこにありません。やるべきことがたくさんあります。しかし、おそらく適切に評価されています。

AlphaFold 3。

興味深いものですね。つまり、おそらく過小評価されていると言うでしょう。すべてのタンパク質構造モデルには多くの誇大宣伝がありますが、それでも非常に変革的になるでしょう。だから、過小評価されていると言うでしょう。ただし、多くの誇大宣伝があるので、判断するのは難しいですが。

仮想細胞。今夏、パトリック・コリソンから、Ark Instituteが仮想細胞を作ることで行ったことについて聞きました。

これは過大評価されていますが、特定の理由があります。Arkで構築しているモデルは素晴らしいです。New Limit、Chan Zuckerbergのような場所でも同様のことをやっています。これらの素晴らしい企業や組織の多くがそれをやっています。しかし、それを仮想細胞と呼ぶのは少し、それは少し過大評価です。最終的に、そのようなモデルは非常に特定のものをモデル化します。実際に真の仮想細胞を構築すること、コンピューター内で細胞をシミュレートできることは素晴らしい目標です。しかし、私たちはそれから非常に遠いです。

量子コンピューティング。

過大評価されています。

脳コンピューターインターフェース。

ああ、これは本当に難しいです。過大評価されていると言います。私はBCIの大きな信者です。私たちがSFで想像するような効果的なBCIは、人々が想像するよりも先のことだと思います。Neuralinkでさえ素晴らしい進歩を遂げています。

ケイシーは今、頭の中に一つ入っています。

調子が悪いようです。

素晴らしい人々がたくさんいて、そこで進歩していますが、人々が思っているよりも先のことだと思います。

年末が近づいています。少し振り返りモードに入っていただけますか。今年のトップ3のAI駆動の科学的進歩は何だと思いますか。

最初の一つは、今年はエージェントの年でした。これは人々がエージェントを発見した年であり、善意で、私たちも自分自身をそのリストに載せなければなりません。Google Co-Scientistもそうです。私たちだけが取り組んでいるわけではありません。Googleも素晴らしい仕事をしていますし、他にも多くの人々がいます。だから科学のためのAIエージェントは間違いなくそうです。

そして、ゼロからの生成的デザインがまさに大きな瞬間を迎えています。他のものはおそらく、Chaiが行ってきた作業、Nabaが行ってきた作業、そして他の多くの人々がゼロからの抗体デザインについて行ってきた作業でしょう。

放送の前半でゼロからを定義してくれて本当に良かったです。かなり出てきていますから。

はい。すみません、ゼロからと言うとき、文字通りゼロから生成するという意味です。何も与えません。あるいは、結合させたいターゲットを与えると、ゼロから生成します。

これは巨大です。なぜなら、基本的にChai、Nabaなどの企業が追求している約束は、この病気を治療するためにそのタンパク質を標的にしなければならないことが分かっている世界です。ボタンをクリックすると、明日人間に入れることができる抗体ができます。それは巨大です。

あるいは、前に述べたように、製造は面倒です。製造しに行かなければなりません。しかし、それは巨大です。人々が以前にやらなければならなかったことの膨大な量を削減します。だから、それは巨大な一つです。

そして3番目は、Ark Instituteのブライアンとパトリック・シューなどが、ゼロから生物を生成することで行ったことだと思います。すみません、ゼロから生物を生成することです。

今ではその意味が分かります。

これは今週のピーウィーのプレイハウスの言葉です。

生物のゼロからのデザイン。それは有用ですか。分かりません。素晴らしいですか。絶対に。それは非常に大きなブレークスルーです。

サム、来年は何を注目すべきでしょうか。2026年に向けて準備されているかもしれないことで、ワクワクしているものは何ですか。

正直に言うと、エージェントの爆発を見ることになるでしょう。私たちは今、そのS字曲線の始まりにいて、それが続くでしょう。おそらく1年前、2024年に人々に言っていたのは、2026年か2027年には、科学界が生成する高品質の仮説の大部分が、私たちや私たちが構築しているようなエージェントによって生成されるだろうと思っていました。

2024年にそれを言ったとき、過大宣伝していると思っていました。しかし、誇大宣伝が必要だと思ったのです。この時点で、それは現実かもしれません。2026年は野心的だと思います。良い仮説の大部分がエージェントによって作られるというのは巨大な飛躍です。しかし2027年、そうですね。2026年は、これらのエージェントがすべてに浸透し始めるのを見る年になるでしょう。研究室に浸透し、人々の普通の生活に浸透します。すでに起きています。

素晴らしいですね。

では、楽しみにしています。サム、学校で明らかに得られなかった科学教育を提供してくれて本当にありがとうございました。

そうですね、本当にゼロからの考えるべきことをいただきました。感謝します。

良かったです。ありがとうございます。

ありがとうございました。

コメント

タイトルとURLをコピーしました