マーク・ザッカーバーグとプリシラ・チャンが、Chan Zuckerberg Initiative(CZI)を通じて今世紀末までに全ての疾患を治療・予防・管理するという野心的なミッションに取り組む背景と戦略を語る。彼らは基礎科学研究の加速を目指し、顕微鏡や望遠鏡のような革新的ツールの開発に注力している。特にAIと生物学の融合による「バーチャル細胞」モデルの構築を進めており、シングルセル解析データの標準化や、タンパク質から細胞、組織レベルまでの階層的モデリングを実現しようとしている。CZIは10年間の活動を経て、科学研究分野での成果を確信し、今後はBiohubを中心としたフィランソロピー活動にさらに注力する方針を明らかにした。オープンソースのアプローチにより、スタートアップや製薬企業を含む広範な科学コミュニティが彼らのツールを活用し、特発性肺線維症などの難解な疾患研究にも貢献している。

AIと生物学の融合が切り開く未来
これはAIによる大きなレバレッジが効く分野なんです。この領域では、ツール構築にもっと多くの努力を注ぐ余地がまだまだあるように思えます。2025年になっても、生物学における元素周期表のようなものが存在しないというのは、ある意味クレイジーなことですよね。
私たちは、これがおそらく構築すべき最も重要なツール群の一つだと考えています。今世紀末までに疾患を治療し予防するという目標を最初に掲げたとき、正直なところ、ほとんどの科学者は真顔で私たちを見ることができませんでした。
それは本当にクレイジーなことでした。その通りです。そしてそれが現実だったんです。なぜなら、もし単に国内の全ての研究室に次の最良の助成金を提供するためにお金を使うことにしたとしても、それが実現する道筋は存在しなかったからです。生物学者たちは、これを途方もなく野心的だと見なしていたと思います。
一方でAI関係者たちは、「まあ、それはちょっと退屈だね。それは自動的に起こることだよ」という反応でした。そうなんです。つまり、この間に橋渡しが必要な何かがあるわけです。マーク、プリシラ、Azaポッドキャストへようこそ。お招きいただきありがとうございます。ええ、来られて嬉しいです。楽しみです。さあ、お二人をお迎えできて嬉しいです。お二人はエキサイティングなことをやっていますね。
Chan Zuckerberg Initiativeの誕生
そうですね。そういう意味で、ほぼ10年前、お二人はChan Zuckerberg Initiative(CZI)を立ち上げ、今世紀末までに全ての疾患を治療、予防、管理するというミッションと意図を掲げました。お二人が時間とリソースを注ぎ込むことができたミッションは他にもたくさんあったはずです。なぜこれを選んだのか、その背景にある会話について話していただけますか。プリシラ、まずあなたの側から話を聞かせてください。
私たちが基礎科学研究に取り組んでいると話すと、人々はいつも驚きます。私は小児科医として訓練を受けましたが、人々はいつも「ああ、それは医療についてなんだね」と思うんです。でも私にとっては、医療に進んだのは人々の生活を改善したかったからなんです。変化をもたらしたかった。他の人を助けられるようになりたかったんです。
UCSFで小児科医としての訓練を受けていたとき、多くの患者に会いました。率直に言うと、小さな子供たちやその家族で、私たちが問題が何なのか全く分からないケースがたくさんありました。運が良ければ、名前を挙げられる特定の遺伝子があるかもしれません。あるいは、他の疾患のグループにまとめられて、一般的なPDFが印刷されて渡されることもありました。「これが私たちが知っていることです」というような。
そして、インターンや研修医として、わずか数行の情報をどうやって患者のケアに翻訳すべきかを試みるのが私の仕事でした。私にとって、それが基礎科学の力と、基礎科学に取り組む必要性を本当に実感した瞬間でした。可能性の最前線を進めるためには、それが必要なんです。それなしには、私が「希望のパイプライン」と考えているものが存在しないんです。
野心的な目標への道筋
では、なぜ全ての疾患を治療できると思ったのですか。それは非常に攻撃的な目標ですよね。その質問に答えたいですか。ええ、まあ、明確にしておきたいのは、私たちが全ての疾患を治療するわけではないということです。つまり、戦略は科学者と科学コミュニティが全ての疾患を治療するのを助けることなんです。
ですから、戦略は本当に基礎科学のペースを加速させることなんです。そして私たちが持っていた理論は、科学の歴史を見れば、ほとんどの大きなブレークスルーは基本的に、新しい方法で現象を観察するための新しいツールの発明に先行されているということです。
そうですよね。顕微鏡のようなものを考えてみてください。細菌を観察できるようになったこと。あるいは他の分野では望遠鏡。でも、エンジニアリングの例を使うなら、それはつまり、それらのようなツールなしには、コードをステップスルーしてデバッグすることなくコーディングしているようなものですよね。それは昔のやり方です。
だから私たちのこの問題への全体的なアプローチは、基本的には、分野全体のペースを加速させるツールを構築するのを助けようということなんです。そして、私たちがそこにニッチがあると考えているのは、科学における資金提供の仕組みを見ればわかると思います。
資金の大部分は政府とNIH助成金から来ています。それは比較的小規模な助成金に分割されて、個々の研究者が通常はかなり短期的なことを調査できるようになっています。そして、これらの新しいタイプのツールの開発、それがイメージングであれ、今ではバーチャル細胞モデルのようなAI関連のものを構築することであれ、より長期的で、多くの場合開発にもっと費用がかかります。
つまり、10年から15年の期間にわたって、1億ドルから10億ドル規模のオーダーで考えるということです。そしてそれらのツールをアンロックして科学コミュニティに提供し、ペースを加速させるんです。それが理論ですね。そして、ある意味で、多くの場合ツールに対してはクレジットが得られないという側面もあるようです。
私たちは気づいていますが、あなたのツールを使う企業があって、彼らはそれについて非常に満足しています。でも、私はそれがそうだとは知らなかったんです。だから、それがフィランソロピーである理由です。そうですね。でも、ほとんどの人はクレジットを得るためにもフィランソロピーをしますよね。つまり、それもその一部なんです。では、それについて考えたのか、それとも単に「いや、これはうまくいく、うまくいけばそれで十分だ」と思っていたのか、どちらですか。
私たちは、全ての科学者をより良くすることに超集中しています。そして科学を超えて、スタートアップや起業家も含めてです。なぜなら、私たちだけではこれを達成できないからです。そして今世紀末までに疾患を治療し予防するという目標を最初に掲げたとき、正直なところ、ほとんどの科学者は真顔で私たちを見ることができませんでした。
クレイジーでしたね。その通りです。そしてそれが現実でした。なぜなら、もし単に国内の全ての研究室に次の最良の助成金を提供するためにお金を使うことにしたとしても、それが実現する道筋は存在しなかったからです。しかし、もし人々に本当にこれについて考えさせて、「さて、これを実現するための最も信頼できる道筋は何か、そしてその信頼できる道筋に対する障壁は何か」と問いかければ、私たちはある程度前進できたんです。
彼らは「まあ、共有ツールがないとか、大きなプロジェクトに取り組んだり適切なデータセットを構築したりしていない」と言いました。そして私たちは「よし、それなら私たちは何かを始められる」と思ったんです。そして共有ツールを構築するというアイデアが生まれました。なぜなら、今の科学には誰もいないからです。
それは本当に興味深いですね。つまり基本的に、あなたたちは「全ての疾患を治療する」と言って、彼らは「ええ、できないよ」と。なぜできないのか。「まあ、ツールがないから」。なるほど、それはかなりクールな流れですね。
ええ。つまり、生物学者たちがこれを途方もなく野心的だと見なしていた一方で、AI関係者たちは「まあ、それはちょっと退屈だね。それは自動的に起こることだよ」という反応でした。そうなんです。つまり、この間に橋渡しが必要な何かがあるわけです。
そして、もし現代のAIツールを使って生物学者が必要とするタイプのツールを構築できるなら。それが私たちの仕事についての考え方の大きな部分なんです。AIは史上最も過大評価されると同時に過小評価されている技術だと思います。同時にですよ。本当に奇妙です。
つまり、インターネットの初期もそうだったかもしれませんが、私たちは自分たちとBiohubで行っている仕事を、最先端の生物学と最先端のAIを組み合わせたものだと考えています。基本的に最も高度なモデルを構築している最先端のAIを行うラボがあります。そして、新しいデータセットを発見したり、特定の課題に取り組んだりするために非常に先端的な研究を行う多くの生物学研究組織があります。しかし今のところ、この両方を同時にやろうとした人はいないんです。
そして、AlphaFoldのようなものを見ても、これは素晴らしいものですが、それは数十年前に作られた公開データセットをベースに構築されていますよね。そして、もし両方を一緒に行えば、AI モデルをトレーニングして特定のことができるバーチャル細胞を構築する目的で、特定のデータセットを作成する機会があると思うんです。それはかなり興味深い領域だと思います。そして私たちが取り組んできた全てのことの中で。
実際、CZIを始めたとき、私たちは実際にいくつかの分野に焦点を当てていました。そして私たちが見つけたのは、科学研究が圧倒的に最大のリターンを生み出したということです。
だから私たちは何度も何度もそれに倍賭けしてきて、今では10年が経ち、Biohubが本当に私たちのフィランソロピーの主要な焦点になっています。でも、ええ、それが基本的な焦点です。もしかしたら、あなたたち自身に十分なクレジットを与えていないかもしれません。なぜなら、あなたたちは「まあ、一口サイズの科学がある。私たちはそれをやりたくなかった」と言っているようなものですから。
「世紀規模の科学があって、それは長い時間軸のように思えたけれど、達成可能で野心的だった。」でも実際には、あなたたちは本当に素晴らしいと思いますが、壮大な科学的課題を特定したんです。それはちょうど中間にあるんです。少なくともあなたたちがそれらについてコミュニケーションする方法や、科学コミュニティをそれらについて活気づける方法によれば、10年から15年の時間軸です。
10年から15年という時間軸の意味
10年から15年というのは、ベンチャーキャピタル支援企業の時間軸に似た、かなり興味深い時間軸です。チームが一緒に働ける期間の時間軸にも似ています。どうやってその数字にたどり着いたのか、そして各10年から15年の波で取り組む課題についてどのように考えているのか教えてください。なぜなら、それは具体的で達成可能で、あなたたちはそれについて多くの信頼性を築いていて、それらの課題を発表する方法も。あなたたちがどう考えているのか興味があります。
でも私たちにとって、10年から15年の時間軸での壮大な課題を見たとき、それを見て「道筋が見える」と思えるものである必要があるんです。全てが解決されている必要はありません。実際、全てが解決されていたら、それは単に行くべきだと感じます。十分に野心的じゃないですね。ええ、私たちにはある程度のリスク許容度があります。
だから、「信頼できる道筋があって、それを率いることができる誰かがいて、私たちがそのリスクを引き受けられるだけの十分な曖昧さがある」というものが欲しいんです。そして、もし私たちがそれを実行したら、リターンは期待以上に高くなる可能性があります。私たちがBiohubでそれをモデル化した方法は、
私たちには3つのBiohubがあります。サンフランシスコに1つ、シカゴに1つ、ニューヨークに1つ。ニューヨークのものは細胞工学に取り組んでいます。つまり、細胞を工学的に操作して、シグナルを検出して読み出したり、特定のアクションを取ったりできるかどうかです。シカゴでは、組織を構築していて、組織内の組織細胞コミュニケーションを見ています。そしてサンフランシスコでは、深部イメージングとトランスクリプトミクスに取り組んでいます。
その仕事の場所は偶然ではありません。パートナー大学も見ています。なぜなら、Biohubに来てこの仕事をする人々がいるからです。協力的で、学際的で、伝統的な研究室に制約されない形で。でも、私たちはこの仕事をサポートするこれらの学術機関の研究室も活用しています。
だから、それが壮大な課題と場所を選ぶ方法なんです。そして、大規模言語モデルとAIが登場してレイヤリングされてきたのは本当に興味深いことです。なぜなら、私たちはすでに興味深いデータを測定するツールを構築していて、データセットを構築していたのですが、それらをどうすればいいかまだよくわかっていなかったんです。
そして大規模言語モデルが登場して、「わあ、今これら全てを理解できるんだ」という感じでした。治療領域での成功をどう見ているのか興味があります。つまり、私たちは生物学を理解することについて多く考えています。そして時々、私たちは完全に新しい生物学的領域、何が起こっているのかわからない疾患をアンロックしたいスタートアップに賭けます。
そして、何が起こっているのか理解した今、それを修正しようという別のグループの人々がいます。薬を使いましょう。新しいタイプの化学、新しいタイプの抗体を使いましょう。CZ Biohubにとって、10年後、20年後、50年後に、あなたたちが可能にした新しい医薬品という観点で、成功はどのようなものだと思いますか。
私たちは、これらを構築するコミュニティの爆発的増加を望んでいます。精密医療を展開するという意味の新しい波です。希少疾患と一般的な疾患の両方について、あなたは本当に個々の生物学について話しているんです。私たちは一緒くたにしがちなんです。そして、多くの場合、それがどのように起こるのかわからないんですよね。あなたにこの変異があることはわかっています。あるいは最悪の悪夢は、意義不明の変異があることです。それは一体何を意味するんでしょうか。恐ろしいです。ええ、恐ろしいです。
そして、あなたは誰かに何かを知っているようなことを伝えますが、それが何を意味するのかわかりません。でも、変異を見る方法やシングルセルトランスクリプトミクスを見ると、「さて、この変異は実際にこの一連の下流の細胞に影響を与えている」と言い始めることができます。そして、発現するタンパク質や、それが健康な細胞がどのように見えるかと似ているか異なっているかを見始めます。そうすると、ターゲティングを始められるんです。
よし、それをターゲットとして見てみようと。そして、構築したいターゲットの特異性と、オフターゲット効果を予測する能力の両方を持つことができます。副作用は何ですか。なぜなら、その薬が体の他のどこと相互作用できるかもわかるからです。
そして、これらは希少です。でも、私は本当にほとんどの疾患は希少疾患として考えるべきだと思います。なぜなら、私たち一人一人の生物学が異なるからです。今は一緒くたにされるだけです。年齢、人口統計、祖先に基づいてグループ化されます。そのレベルの理解を持てれば幸運です。でも、本当に私たち一人一人の生物学は異なるんです。高血圧やうつ病を見ると、私たちは試行錯誤で、「その薬を試してみて、何が起こるか見てみよう」というような感じです。
でも、本当に起こるべきことは、個々の生物学を見ることによって、人々を正確に、正確に、そして迅速に治療できることです。私たちは基礎科学を可能にしたいんです。そして、私たちが構築するモデルを人々が取り上げて、必要な診断法や治療法を構築できたら、私たちは大喜びします。あなたたちは素晴らしいデータセットを構築しましたね。
私は本当に言わなければなりません。つまり、スタートアップコミュニティや製薬コミュニティやR&Dコミュニティからのフィードバックを聞かないかもしれませんが、それは存在しています。なぜなら、あなたたちはオープンソースにコミットしているからです。だから人々は、全員が論文を書いているわけではないかもしれませんが、それらのツールを使っているんです。私たちのポートフォリオには特発性肺線維症に取り組んでいるスタートアップがあります。その名前が、その疾患がどれほど厄介かを物語っています。特発性なんです。なぜ起こるのかわからないんです。
IPFはそのように名付けられています。そして、彼は私に、あなたのcell by gene atlasを使って、疾患のある患者とない患者の数百万の単一細胞を見て、線維芽細胞を特定して、線維芽細胞とその遺伝子発現をダブルクリックしようとしたと言っていました。
それを使って、「この特発性の起源の奇妙な塊である疾患で、新しい薬のターゲットをどこに求められるか」を情報として使おうとしたんです。だから、ツール、視覚化、クエリシステム、そして本当にそのデータを信じられないほどアクセスしやすくするために構築したソフトウェアアプローチを愛する巨大なイノベーターのグループがあると思います。でも、cell by geneはほとんど偶然のようなものです。
Cell by Geneの誕生
もっと教えてください。cell by geneについて少し共有しますか、それとも私が始めましょうか。まあ、どの部分に入りたいのかわかりませんが、つまり、cell atlasの仕事全体は、ある意味でほとんど偶然なんです。つまり、2025年になっても、生物学における元素周期表のようなものが存在しないというのは、ある意味クレイジーなことですよね。だから、それがインスピレーションの多くを占めていました。さて、Biohubで行う仕事と、他の助成金を通じて、どうやって全てのこのデータをまとめて標準化できるかということです。
そして始めたとき、私たちはそれを使ってバーチャル細胞モデルを構築することさえ必ずしも念頭に置いていませんでした。
私は、それはAIの仕事が進むにつれて焦点が合ってきたようなものだと思います。でもそれは非常にエキサイティングなことです。バーチャル細胞モデルについて多くの時間を費やすべきですが、cell atlasについて何に入りたかったのかわかりません。まあ、シングルセルの仕事は10年前に始めた最初のRFAの1つでした。そして私たちは「よし、これは可能だと思う」と。
実際、それを行う方法を標準化するための方法論に資金を提供しました。それが10年前です。そして、そのデータセットの構築を始めるために、いくつかの研究室にシードを提供しました。でも、私たちは「何百万、何十億もの異なる細胞タイプと異なる順列がある。どうやってこれを行うつもりなんだろう」と思っていました。特に萌芽的な技術で。
そして結局、いくつかのグループにシードを提供して、彼らは仕事を始めました。そして彼らは問題があると私たちに言ったんです。データに十分な速さでアノテーションを付けられないというボトルネックがワークフローにあったんです。だから、cell by geneはアノテーションツールとして構築しました。これがこの元々のソースです。だから、シングルセル科学を行っている人々が簡単にデータにアノテーションを付けられるようにアノテーションツールを構築しました。
そして、収集したデータを公開して、人々が共有できるようにしました。でも、全員が同じアノテーションツールを使い始めたので、全員が同じデータフォーマットで標準化されました。そして、ツールの周りにコミュニティが形成され始めました。そして彼らは共有し返してatlasを構築したいと思ったんです。
だから今、10年後、この共有リソースに何百万もの細胞が構築されて、科学コミュニティ全体のために使われています。私たちはその約75%にしか資金を提供していません。申し訳ありません、それは間違いです。私たちは25%にしか資金を提供していません。75%は、「これは有用で、標準化して同じメタデータを構築する簡単な方法がある」と言う広範なコミュニティから来ました。その通りです。
これはネットワーク効果と呼ぶものに似た興味深いものですね。ええ。インターネットのように聞こえると言おうとしていました。ええ。アノテーションのために来て、バーチャル細胞モデルのために留まる。まあ、仕事を始めたときに、それを行っている全員が一貫したフォーマットを持つことが非常に重要でした。そうすることで、使用可能で移植可能になります。
そして、それが行われる方法として定着すると、他の人々もそれが価値があると感じたんです。ええ。そして、GIOなどの以前のデータベースと比較しても、それらは単に標準化されていないかQCされていません。コントロール。ええ。バーチャル細胞に入りましょう。あなたたちが焦点を当てている素晴らしい課題の1つです。
バーチャル細胞の可能性
約束や希望について、そしておそらくいくつかの課題や私たちがどこにいるかについて話してもらえますか。ええ。つまり、私たちは、この時点で最も重要なツールの1つになると思っています。基本的に、タンパク質から細胞内のさまざまな構造、全体的な完全なバーチャル免疫系やさまざまな階層レベルまでの階層を構築することです。
そして、これは人々がさまざまな科学的研究のための仮説を効果的に生成するための非常に重要なツール群の1つになると思います。実際に完全な実験を実行するポイントに到達する前でさえ、それがどのように実行されるかのある程度の推定を得ることができます。それは、プリシラが数分前に話していた精密医療タイプの例のいくつかに役立つでしょう。でも、私たちは、これが構築する必要がある最も重要なツール群の1つだと考えています。そして、それは単一のものではありません。だから、これにアプローチするさまざまな角度があるんです。cell atlasデータは、細胞レベルで物事を理解するのに役立ちます。
今私たちが行っている最も重要なことの1つは、この素晴らしい会社Evolutionary Scaleです。実際にMetaでタンパク質折り畳みモデルに取り組んでいた多くの研究者がいて、Biohubに参加しています。そしてそのリーダーであるAlex Rievesが、実際に科学プログラム全体の責任者になる予定です。これは実際に興味深いことです。ええ。
考えてみると、AIと生物学が一緒になっていて、実際には生物学を理解しているAI の人が、AIをある程度理解している生物学者ではなく、それを運営しているんです。私はそれが、これらのものの相対的な重みについて私たちがどう考えているかを少し物語っていると思います。でも、つまり、プリシラがさまざまなBiohubについて言っていたように、私たちは基本的に見ています。
ニューヨークが細胞工学を行うことで、基本的に体の周りで起こっているさまざまなことを記録してそのデータを共有できる細胞を持つことができます。そしてそれをモデルに組み込むことができます。シカゴのBiohubは炎症を記録できて、基本的にそれを研究してそれを理解するのを助けることができます。それは異なるデータセットです。イメージング研究所があって、私たちはそれに関する最初のモデル群をトレーニングしたところです。これらは、細胞がさまざまな状態でどのように見えるかを理解することに関する最初の空間モデルのようなものです。そして最終的には、産業側の言語モデルに関する類推のように、さまざまな機能があって、時間をかけてそれらをモデルにトレーニングして、ますます一般的になっていきます。それがここでのアイデアのようなものです。だから私たちは
壮大な生物学的課題の周りにBiohubを構築します。Biohubは新しいデータセットを生成するツールを構築します。それらに基づいてモデルを構築し、最終的にモデルをますます一般的なバーチャル細胞のビューに組み合わせます。それは科学者にとって有用で、うまくいけば薬を見つけることに取り組んでいるスタートアップや企業にとっても有用です。それは私たちの全体の一部ではありませんが、でも起こる必要がある非常に重要な部分だと思います。ええ。そして、あなたたちは
常にリスクについて考えています。投資を行う際の観点では、バーチャル細胞モデルを使ってバーチャル生物学を行えるという約束は、実際によりリスクの高いアイデアを引き受けることができるということだと思います。今、助成金の資金調達は得にくい場合があり、ウェットラボの仕事は高価で遅いです。そして、それはお金だけではなく、時間でもあるんです。だから、研究室のキャリアを続けるために成功の可能性がある程度あると思うものを選ばなければなりません。だから、自然とある程度のリスクを取るように導かれますが、多くのリスクは取りません。なぜなら、テニュアを取得したり発表したり、彼らが行う必要があることをするために、ある程度の割合でヒットする必要があるからです。
でも、本当に高品質の生物学をシミュレートできるバーチャル細胞モデルがあれば、実際に計算側でテストやいじくり回しを始めることができ、ラボで時間とリソースの観点で高価で時間がかかったようなよりリスクの高い質問をすることができます。そして、ウェットラボで時間とお金の投資をする前に、シリコン内で実験を行うことで約束があるかどうかを実際に確認できるんです。モデル生物のように考えていますか。ええ。新しいショウジョウバエのようなものです。
ええ。細胞の複雑さを考えると、どれくらい近い、どれくらい正確になると思いますか。つまり、細胞の完璧に正確な表現を得ると仮定しても、バーチャル細胞が有用であるためにどれくらい正確である必要がありますか。明らかに反復して良くなっていくと思います。なぜなら、今私たちは、今私たちはまだトランスクリプトミクスについて話しているだけだからです。
細胞を見るさまざまな方法に拡大していますが、ますます正確になっていきます。でも、100%正確である必要はないと思います。なぜなら、単にフロントエンドでアイデアを少しデリスクしたいだけだからです。そして、デリスクすればするほど、明らかに効率的になりますが、方向性のあるシグナルを得るだけでも有用なんです。そして、はい、私たちはそうします。
私たちは、これをモデル生物として考えていますが、人体に忠実度があるような方法でです。つまり、全てのモデルは間違っている。いくつかは有用です。ええ。これはうまくいけば特定の軸で有用性があります。まさに。そして、言語モデルと同じように、特定の機能を組み込むんです。
だから、それは例えば、私たちが公開する予定のモデルの1つはVariant Formerです。基本的に、効果的に細胞のペアでトレーニングされています。細胞を持ち、それにCRISPRを適用して、反対側で何が出てくるかを見ます。だから、基本的にそのような予測ができるんです。つまり、細胞にこの編集を行っている場合、何が起こる可能性が高いかです。もう1つのモデルは、この拡散モデルです。基本的に、シミュレートしたい細胞のタイプを記述すると、その細胞の合成モデルを生成します。
繰り返しますが、つまり、プリシラの先ほどの点について、全員が異なっていて、異なる細胞がどのように持っているかについての興味深いことです。これらの希少な構成をシミュレートできるようにしたいんです。少なくともそれがどのように見えるかの合成版を持つことは興味深いです。そしてそれに対してテストできます。cryoモデルが興味深いと思うのは、それが空間的だからです。だから、持つことができるさまざまなモデルがあるという感覚を与えてくれます。それらは、さまざまな種類のものを見ることを可能にして、時間をかけてそれらをトレーニングして、ますます一般的にしていくだけです。すごい。非常に興味深いです。
そして、モデリング技術は基本的にLLMですか、それとも推論モデルはありますか。それは実際に興味深いものの1つでもあります。新しいモデルの1つは、これは非常に初期だと思いますが、基本的に生物学に関する最初の推論モデルです。
だから、アイデアは、さまざまな方法で世界モデルをシミュレートするこれらのモデルを効果的に持ち、それが単に見つけたものの相関関係を吐き出すことができるだけでなく、物事がどのように進化するか、なぜ物事が起こるかを実際に推論できるようにしたいということです。
そのものはかなり初期だと思いますが、それは明らかにこれらのモデルが進化する方法の重要な方向として、概念的には興味深いです。ええ。いや、それは私が考えていたことです。なぜなら、それがうまくいかない場合、次の質問は「なぜ」かということですよね。ええ。つまり、でも推論で見つけることは、あなたは自分の仮説に結婚しているという類推です。
まあ、ええ。確かに。確かに。ええ。つまり、いや、推論モデルがうまくいかない場合、なぜかと言っていると思っていました。つまり、そのようなものだと思います。いや、言語モデルの類推は、推論が良くなるためには、より良い世界モデルやより良い事前トレーニングされたモデルが必要だということです。
でも、単により多くの機能をそれに組み込むだけです。そして、おそらく順序もあると思います。だから、AlexとEvolutionary Scaleの人々が取り組んだ仕事の多くは、タンパク質に関するものです。これは興味深いです。なぜなら、それは明らかに細胞データやcell atlasよりも小さな解像度だからです。でも、仮説の一部は、これらのさまざまな細胞を見て、それらがどのように振る舞うかをシミュレートできるということですが、細胞のサブコンポーネントがどのように相互作用するかについての階層的な理解を実際に持たない限り、やや浅い理解しか持てないだろうということです。
だから、私たちの見解は、基本的に最先端のタンパク質モデルを構築して、それを最先端の細胞モデルの一部にしたいということです。そしてそれを持ったら、よりはるかに複雑なシステムをシミュレートできるバーチャル免疫系のようなものを構築するんです。
でも、これらのバーチャルモデルを構築するためのこの階層的なアプローチのようなものです。それは非常に理にかなっています。なぜなら、パーソナライゼーションに入ると、一般的なタンパク質がユニークな細胞に組み合わさっているからです。だから、システムの観点からは、それははるかに管理しやすくなります。それは非常に理にかなっています。興味深いです。ええ。ええ。それは非常に魅力的なものです。ええ。
大きな発表
あなたたちは今週大きなニュースを発表しています。プレビューを教えてもらえますか。まあ、大きなニュースは、私たちがどのように1つのチームとして集まるかについて考えることです。過去には、Biohubを運営したり、ソフトウェアを構築したり、いくつかのAI研究を行ったりしてきましたが、全てが本当に考えていたことは、少し分散化されていました。でも今、Alexのリーダーシップの下、私たちはBiohubとして、単一の目標に奉仕して科学を行う運営フィランソロピーとして一緒になります。そして、AIと生物学の交差点で生物学と研究の状態を実際にどのように進めるかです。
素晴らしい。Alexは素晴らしいです。だから、ええ。いや、彼は素晴らしいです。そして、それから、私が先ほど言及したもう1つの部分は、ええ。
つまり、CZIはいくつかの異なることに焦点を当ててきました。私たちは本当に時間をかけて、科学で最大の違いを生み出すことができたと感じてきました。だから、私たちはそれに倍賭けし続けてきて、教育の仕事を続けます。地域コミュニティをサポートし続けますし、それらのさまざまな部分をサポートし続けます。
でも今後は、Biohubが本当に私たちのフィランソロピーの主要な推進力になります。そして、私たちはそれについて非常に興奮しています。なぜなら、これは、世紀末までに科学コミュニティが疾患を治療し予防できるかどうかを見るミッションを始めたとき。
AIの進歩により、それを大幅に早く実現できるはずだと思います。そしてそれは非常に価値があり、重要で、非常にエキサイティングな目標です。私たちは、他の人々がそれで速い進歩を遂げるのを助けることができるエコシステムの中でユニークな場所を持っていると思います。だから、分散化には明らかに管理やコミュニケーションのオーバーヘッドなどの観点から多くの利点があります。だから、この種の新しいレイヤー/統一を上に追加することによって、何を追加しようとしているのですか。出力は何で、それから推測ですが、それに対する複雑さは何ですか。なぜなら、それは、申し訳ありません、CEOの質問を聞いてしまいました。
いやいや、私は超あなたに先に行ってもらって、それから私が入れます。ええ。だから、明らかに最先端のAIを行っている素晴らしいグループがあり、素晴らしい最先端の生物学を行っている多くのグループがあります。そして、私たちがユニークにできると思うのは、実際にこれら2つを結び付けることです。そして私たちは、データセットに資金を提供し、データセットを構築し、細胞を見ることができる機器を今構築しています。それが組織細胞コミュニケーションのためであれ、私たちのcryoEMで、ほぼ原子レベルで細胞を見ることができます。だから、私たちは
データセットを構築する能力だけでなく、実際に既存の知識体系を補完するために必要だと思うものに基づいて、私たちが望む方法でそれらを形成し、形作る能力を持っています。そして、私たちはこの仕事を行っている素晴らしいチームがいて、これらのAIモデルを構築しています。だから、一緒にそれを行う理由は、実際にフライホイールを完成させることができるからです。つまり、モデルがこの分野でいくつかのギャップや盲点があるように見えています。
よし、誰と話しますか。次のデータセットをどのように構築しますか。そして、ラボでこれを見ています。メタデータは非常にリッチになるので、このモデリングを行う方法にフィードバックできます。ええ。私はそれが信じられないほど強力になると思います。そしてそれは、単に仕様を書き下ろして「これを届けてください」と言うだけではありません。
これらの人々は、これが実際に人間の細胞がどのように機能するかのますます正確なモデルになるために、肩を並べて仕事をして、お互いの仕事を形作る必要があるんです。まあ、ええ。それは非常に興味深いです。なぜなら、それは正確に、それはAIの世界で私たちにとって産業界での最大の驚きでした。1秒間、生物学を忘れてください。つまり、ドメイン固有のモデルが本当に超興味深かったということです。元々の論説は、AIがとても賢くなって、全てにおいて誰よりも賢くなるというものでした。でも、ビデオモデルのように、全てのビデオモデルは何かについては最高ですが、全てについてではありません。
だから、解決している問題を知ることが、実際にはAIで非常に重要であることが判明したんです。なぜなら、実際にはるかに良い結果を得ることができるからです。ええ。もし2つを一緒にすれば、ええ、私たちはそれを何度も何度も見ています。それに入る全体の物語に非常に直感に反する方法で。
そして生物学では、それは、あるいは少なくとも1つの仮定は、まあ、データセットはインターネット上にない。だから、ドメイン固有のモデルが必要な理由の一部は、データセットが公開されていないからです。あなたたちは、データへのオープンソースアクセスを多く作成することによって、そのトレンドにも逆らっているようです。そして、それでも、あなたたちは他の産業で見ているトレンドに賭けているように聞こえます。でも、それでも、データにアノテーションを付ける方法、データをキュレーションする方法、そして科学者とどのように話すかにニュアンスがあるでしょう。そうです、データとモデルなどを知るだけでなく、会話は私たちが見つけ続けることが非常に非常に重要であることが判明します。そうですよね。だから
科学者はチャットGPTや何かと話すようには話さないでしょう。だから、これは話すことができるハエです。ええ。ええ。ええ。それは本当に、それは超エキサイティングです。
そしてユーザーインターフェースは実際に本当に重要です。あなたたちは、Cell by Geneを使っている創業者について話しました。そのユーザーインターフェースは、問題を見るためにさまざまな分野から来る人々を望んでいるため、計算的または本当に非常に深い生物学的背景を持つ必要がないように意図的に設計されました。
だから、ここを見て、ここで問題を解決するのを手伝ってください。そして、学ぶことができて、知識を自分の仕事に持ち帰ることができるように、あまり高い参入障壁がない方法でユーザーインターフェースを構築することは意図的です。
そして、これらのバーチャルモデルを構築するとき、私たちは本当に、人々が「つまり、これについて何か知識がある。貢献できるかもしれない」と言えるように、ますます低い参入障壁に到達できる場所に着くことを望んでいます。非常に適切な例は、免疫学は神経変性と関係があることが判明したということです。だから、免疫学は全てこれの背後にあるかもしれないので、あなたの世紀ビジョンの一部かもしれません。
だから、免疫学者が入ってきて神経変性を理解し、彼らの世界がどのように適合するかを理解できるようにする必要があります。だから、参入障壁を下げれば下げるほど、人々が本当に真に協力的で学際的な方法で考えることができるようになります。
Biohubの成長と将来
Biohubはチームとして成長しますか。Biohub本体でより多くの人々を雇用しますか、それともより多くのサイト、より多くのラボ、よりコミュニティ駆動のデータセットを持つネットワークモデルに向かっていますか。推進力はどちらですか。あるいはおそらく両方ですか。おそらく両方です。そして、時間をかけて新しいBiohubを追加してきました。そして、このような中央のAIチームをより多く構築しています。クールです。
だから、でも、これをどのように設定するかというこれらの組織的な質問は魅力的だと思います。そして、私たちのアプローチの多くは、残りの分野が何をしているかによって形作られています。なぜなら、科学をそれがトライしているもののポートフォリオのようなものだと考えるからです。社会にはトライしているもののポートフォリオがあります。そして、フィランソロピーの観点からは、他に代表されていないものを見つけ出すことによって、最も付加的であることを望むんです。だから、科学はデフォルトで非常に分散化されています。それは助成金が機能してきた方法のようなものです、科学者がデフォルトで働きたいと思う方法です。だから、私たちが見つけたことの多くは、以前は非常にシンプルに見えたけれど起こっていなかった方法で協力を促進する方法を見つけ出すことが、多くの価値をアンロックできるということです。
だから、最初のBiohubで私たちが行ったことには、2つの興味深いことがありました。1つは、UCSF、スタンフォード、バークレーの間の協力でした。そして、これらのさまざまな場所に本当に賢い人々がたくさんいて、以前は理論的には一緒に働く方法を見つけ出すことができたかもしれませんが、それを行うための正式な構造は本当になかったんです。そして、これは単により多くの協力を可能にしただけです。分野横断的です。
基本的に、生物学者をエンジニアの隣に座らせることと、これら2つの分野が必要なものであるという見解です。そして、わかりません。つまり、あなたは多くの企業で見てきたと思いますが、とても多くの興味深いことがあります。企業では常に彼らを離して設置します。まあ、興味深いです。
いや、2つのチームを一緒に座らせるだけで修正できる組織的な質問や問題がどれだけあるかは興味深いです。組織図が何であるかは関係ありません。あなたたちはお互いの隣に座る必要があって、これがうまくいくまでです。そして、それは私が本当に信じていることです。だから、そして、あなたたちには10年から15年があります。
まあ、いや、コミュニケーションは一般的に非常に過小評価されている問題です。ええ。何かを構築したり解決したりするあらゆる種類のことで。だから、それはかなり素晴らしいことです。ええ。ええ。そして、それは本当に単純なもののようなものですが、でもモデルとしては新しいと思います。
そして、素晴らしいことの1つは、最初のBiohubからBiohubネットワークにこれをコピーして、他のモデルに拡大してきたことですが、この分野で働いている他の人々も同様のモデルを採用するのを見るのも単に素晴らしいことです。なぜなら、それはかなり直感的なことだからです。でも、ある時点で、実際に分散化された仕事も本当に良いというポイントに達するでしょう。だから、これが全ての科学が働くべき方法だと言っているわけではありません。私たちは単に、これのためのスペースがあると言っているだけです。何らかの理由でデフォルトではなかったので、多くの価値をアンロックできます。ええ。そして、私たちはまだ、ええ。
MITラボでの有名な話があります。それが彼らがレーザーを発明した方法などです。異なる部門からの人々をたくさん同じラボに入れたんです。ええ。実際、物理学は私たちが多くのインスピレーションを得た場所です。
物理学は歴史的に、ラボが大きなプロジェクトと大きな共有リソースの周りに集まってきました。そして、私たちは比較的集中化されていますが、それでも正確な最先端の仕事や補完的な仕事を行っている多くのラボに依存して、これをサポートするために一緒に来ています。それはあります。
でも、拡大の質問についてもう1つの考えは、おそらくこれは現代のAIラボのようなものです。私たちは多くの平方フィートごとに拡大しているわけではありませんが、コンピュートを拡大しています。ええ、研究者たちは彼らのために働く従業員を望んでいません。彼らはスペースを望んでいません。ええ。彼らは単にGPU、エージェントを望んでいます。
だから、ある意味で、それは新しいラボスペースです。それはウェットラボスペースよりもはるかに高価です。そして、あなたたちはそれについて常に創造的でした。ここ数年でさえ、コンピュートへのアクセスを共有する方法を作成してきました。学術ラボが、私はあなたのプログラムの名前を忘れましたが、駐在科学者のようなものや何か、レンタルのようなホテリングを可能にしてきました。その核心はクラスターです。
個々のラボを見ると、大きなラボで数十のGPUがあります。そして私たちは最初に大規模なコンピュートクラスターを本当に構築した人でした。1000で、今私たちは10000の範囲に移動する計画があります。そしてそれは明らかに異なるタイプのプロジェクトを必要とします。異なるタイプの質問をすることができます。そして、それは私たちが使用するリソースですが、科学者に申請して「この量のリソースを使用できる質問は何ですか」と言ってもらい、その方法で協力の種をまくことができるように招待してきました。だから、科学者が
そこにいて、Biohubで雇用されていないか、Biohubで働いていないけれど、Biohubと協力したい人がいるなら、あなたたちはリソースを利用するための興味深いドアを作成するつもりです。それは素晴らしいです。ええ。つまり、GPUはやや ゼロサムです。そうですよね。だから、データはそうではありません。だから、ええ。ええ。それはもっともです。ええ。だから、あなたたちはこれを行って10年を祝おうとしています。
10年を振り返って未来を見据える
今後の年を見据えて、将来について考えていること、あるいは今後の成長と進化の指針となる原則やノーススターについて、他に教えてもらえることはありますか。過去10年間で本当に興味深かったのは、実際に最初の数年間は、営利企業で働く人々を完全に羨ましく思っていたことです。なぜなら、非常に明確だからです。
市場は、それがプライベートか公開かに関わらず、あなたが良い仕事をしているかどうかを教えてくれます。彼らがあなたが良い仕事をしていると思うなら、彼らがそう思っていないなら。彼らは常に正しいわけではありません。彼らは異なっていません。でも、私はそれでも羨ましかったです。なぜなら、私はそのフィードバックを切望していたからです。私は良い仕事をしていますか。そして、10年後、生物学に倍賭けしている理由は、私たちが言ったことを達成しただけでなく、これらのプロジェクトに着手すると決めたとき、それは実際に私たちが思っていたよりも多くを提供したからです。そして私は
「よし、それは私がつかむことができるシグナルだ」と思いました。そして、それは私たちが本当に倍賭けし続けて、それをもっとやり続けることができるシグナルです。だから、「よし、これをもっとやろう」というような初期の曖昧さを耐え続けることだと思います。そして、辛抱強くいることですが、同時にせっかちでいることです。
なぜなら、途中のすべての反復が、私たちがAIと大規模言語モデルを活用するためのデータデータセットを構築して幸運になる準備ができたこの場所に到達することを可能にしたからです。それは私たちが行ってきたすべての仕事のおかげです。だから、この曖昧さの中で前進し続けることができて、時には大きな目標に対するシグナルの欠如があっても、私たちはそのためのDNAを設定したと思います。素晴らしい。ああ、意図していません。
ええ。でも、私たちはどれだけの人々がツールとフィードバックを使用しているかを見ることができます。ええ。ええ。ええ。あなたたちは顧客を持っています。それはかなりクールです。ええ。フィランソロピーにとって。それは素晴らしいです。ええ。いや、ツールを構築することの楽しいことの1つは、見ることができるようなものです。ええ。
人々はツールをどれだけ価値があると思いますか。人々はツールを使用して重要な仕事を発表しますか。そうですね。そうですね。そうですね。ええ。そして、まあ、つまり、私たちのフィードバックは彼らが素晴らしいということです。フィードバックと、ところで完全にユニークです。だから、他のことは、もしこれがなかったら何を使いますか。何もないようなものです。いや。ええ。それは本当に本当に一種の空白です。
基礎科学を加速させることから、それを使用するために多くの人々に資金を提供すること、そして基本的に新しい治療法を考え出すことを開始できるバイオテック企業に入ることまで、存在する必要がある全体のパイプラインがあります。そして、それらを大規模に行う製薬会社を手に入れます。
そして、基本的に治療法を取って、世界中の全員にそれらを持っていくという公衆衛生の反対側にフィランソロピーのためのスペースがあります。でも、これはAIで大量のレバレッジが効く分野です。そして、それは、ええ、ツールを構築することに関するこの分野でもっと多くの努力がある可能性があるように思えます。そして、全体のことをもっと速くすることができます。ええ。そして、あなたたちが完全にユニークである場所だと思います。そうですよね。
他のことは、それを行うことができる他の人々がいますが、創業者市場のグッドを行っている人は誰もいません。ええ。創業者市場フィット。つまり、もし私たちが存在しなかったら、それは問題でしょうか。ええ。そのような質問は、VCとして本当に私たちのうちの1人はエンジニア、もう1人は科学者医師です。ええ。この方向に非常に満足しています。
ええ。私たちは、私たちの企業のためだけでなく、人間としての私たちのために、この仕事に取り組んでいただいて、本当にありがとうございます。それは素晴らしい仕事です。ありがとうございます。ありがとうございます。本当にありがとうございました。


コメント