この動画は、2024年ノーベル化学賞を受賞したジョン・ジャンパー博士が、AIが科学的発見に革命をもたらしている現状について講演した内容である。物理学から計算生物学、そして機械学習へと転身した自身の経歴を振り返りながら、Google DeepMindでのAlphaFold開発の背景、技術的な挑戦、そして科学界に与えた実際の影響について詳しく解説している。特にタンパク質構造予測という従来は極めて困難で時間のかかる問題を、AIによって劇的に効率化した過程と、その成果が世界中の研究者によってどのように活用されているかを具体例とともに紹介している。

AIと科学研究への情熱
これは素晴らしい変化ですね。私はこれまで多くの科学的な講演を行ってきましたが、私が登壇するときに誰も拍手や声援を送ってくれることはありませんでした。普通は登壇するときでさえそんなことはないのです。本当にエキサイティングです。ここにいられて本当に素晴らしいです。
この広大なホールにいる皆さん全員が私のことを知っているとは限らないと思うので、まず自己紹介から始めましょう。私は誰でしょうか?私は科学のためのAIの分野で仕事をしてきた人間で、AIシステム、これらの技術、これらのアイデアを使って世界を非常に具体的な方法で変えることができると心から信じています。科学をより速く進歩させ、新しい発見を可能にするためにです。
私はこれが本当に本当に素晴らしいことだと思います。私たちにはこれらのツール、これらのアイデアを手に取り、病気の人が健康になって病院から家に帰ることができるような適切なAIシステムをどのように構築するかという問題に向けて活用する機会があるのです。そして私がここに辿り着くまでは、本当に素晴らしくて曲がりくねった旅路でした。
物理学から生物学への転身
私はもともと物理学者として訓練を受けました。宇宙の法則を扱う物理学者になろうと思っていました。もし非常に非常に運が良ければ、教科書の中の一文になるようなことができるかもしれないと思っていたのです。私は物理学を学び、実際に物理学で博士号を取るために進学しました。しかし、取り組んでいることが私の心を掴まなかったのです。
それは私がやりたいことのようには感じられませんでした。だから私は中退しました。スタートアップを立ち上げたわけではありません。それはこのイベントにとても適していたでしょうが、私は中退して、計算生物学を扱う会社で働くことになりました。コンピューターに生物学について賢いことを言わせるにはどうしたらよいかということです。そして私はそれを愛しました。
それが楽しかったからだけでなく、私が得意だと思うことをさせてくれるものだったからです。コードを書き、方程式を操作し、世界の本質について深く考える。そしてそれを最終的に薬を作りたい、あるいは他の人が薬を作ることを可能にしたいという、この非常に応用的な目的に向けて使うのです。
機械学習との出会い
それから私は本当に生物学者そして機械学習研究者になりました。実際に機械学習研究者になったのは、その仕事を辞めて生物物理学と化学の大学院に戻ったのですが、もはや前の職場で持っていたような素晴らしいコンピューターハードウェアにアクセスできなくなったからです。実際、彼らはタンパク質、つまり私がこれから話す体の一部がどのように動くかをシミュレートするためのカスタムASICを持っていました。
それがもうなくなったのに、同じ問題に取り組みたいと思っていました。より少ない計算資源で同じことをしたいとは思いませんでした。そこで私は学び始め、統計学、機械学習に非常に興味を持つようになりました。当時はそれをAIとは呼んでいませんでした。実際、機械学習とさえ呼んでいませんでした。
それは少し評判が悪かったのです。私は統計物理学で仕事をしていると言っていました。しかし、アルゴリズムをどのように開発するのか?データから学習し、非常に大きな計算の代わりにそれを行うにはどうすればよいのか?そして結果的に、AIに関しては、新しい問題に答えるために非常に大きな計算に加えて、ということになったのです。
Google DeepMindでの挑戦
その後、私はGoogle DeepMindに入社し、これらの強力な技術とあらゆる種類のアイデアを取り上げて、特にゲームだけでなく、データセンターなどにも応用することで、これらの技術がいかに強力であるかが非常に明らかになっていました。これらの技術をどのように活用して科学を発展させ、科学のフロンティアを本当に推し進めるかということを考えたい会社に入社しました。
そして、本当に賢い人々と一緒に、素晴らしいコンピューターリソースを使って、産業的な環境で非常に速いペースでこれをどのように行うことができるか。そして、そのすべてをもってすれば、間違いなく何らかの進歩を遂げなければならない。それは本当に本当に楽しく、私がこのステージにいるという事実は、私たちが何らかの進歩を遂げたことを示しています。
私にとって本当に指導原理となっているのは、この仕事を行うとき、最終的には科学者が発見を行うことを可能にするツールを構築しているということです。私たちが行った仕事について本当に心強いと思うこと、そして今でも私の核心で共鳴している部分は、AlphaFoldには約35,000の引用があることです。
しかし、その中には、私一人ではできないような科学を行うために私たちのツールを使って発見を行っている人々の数万の例があります。ワクチンであれ、薬物開発であれ、体がどのように機能するかであれ。そして私はそれが本当に本当にエキサイティングだと思います。
タンパク質構造予測の重要性
今日皆さんにお話ししたい部分、そして私がお話ししたいストーリーは、問題について少し、私たちがそれをどのように行ったかについて少し。そして特に研究と機械学習研究の役割、そしてそれが単なる既製の機械学習ではないという事実について。そして、何か素晴らしいものを作ったときに何が起こるか、人々がそれをどのように使い、それが世界にとって何をするかについて少しお話ししたいと思います。
それでは、世界最短の生物学レッスンから始めましょう。細胞は複雑です。高校や大学で生物学を学んだことしかない人にとっては、細胞は名前の付いたラベルが付いたいくつかの部品からなるものだというイメージがあるかもしれません。そしてそれはかなり単純なものですが、実際にはスクリーンに表示されているもののようになっています。密度が高く、複雑です。混雑という点では、7月4日のプールのようで、それは途方もない複雑さに満ちています。
人間には約20,000種類のタンパク質があります。それらはスクリーンに見えるいくつかの塊です。これらが一緒になって、細胞内のほぼすべての機能を実行しています。緑色の尻尾は大腸菌の繊毛だとわかります。それが動き回る方法です。そして実際にそれがどのように動き回るかを見ることができます。
そして、回転しているように見えるものがあり、実際に回転してこのモーターを駆動しています。これらすべてがタンパク質でできています。人々がDNAは生命の取扱説明書だと言うとき、これはそれがあなたに何をするかを教えているものです。これらの小さな機械の作り方を教えているのです。そして生物学は、必要な機械、文字通りのナノマシンを構築し、それらを原子から構築するための信じられないほどのメカニズムを進化させました。
タンパク質のフォールディング
そして、あなたのDNAはタンパク質を構築するよう指示します。あなたのDNAは線であり、ある意味でタンパク質もそうだと言うかもしれません。それは一つずつビーズを取り付ける方法についての指示であり、各ビーズは原子の特定の種類の分子配置です。もし私のDNAが一列に並んでいて、私が一次元では全くないとすると、その間に何が起こるのか疑問に思うべきです。
答えは、このタンパク質を作って一度に一つずつ組み立てた後、それはあなたがIKEAの本棚を開いたように自発的に形に折り畳まれ、大変な作業をする代わりに、それは単純に自分自身を構築し、あなたはこの非常に複雑な構造を得るということです。聴衆の中の生物学者の方々にとって、これは非常に典型的なタンパク質、キナーゼを見ることができます。そして原子のこの非常に複雑な配置を見ることができ、その配置は機能的で、あなたの体内のタンパク質の大部分(全部ではありませんが)がこの変換を受け、それが機能するものであり、それは信じられないほど小さいのです。
光自体は数百ナノメートルのサイズで、これは数ナノメートルのサイズです。つまり、顕微鏡で見ることができるよりも小さいのです。そして長い間、科学者たちはこの構造を理解したいと考えてきました。なぜなら、彼らはそのタンパク質の変化が病気にどのような影響を与えるかを予測するためにそれを使用するからです。それはどのように機能するのか?生物学はどのように機能するのか?しばしば薬を作るとすると、それはこのような特定のタンパク質の機能を中断するためです。
構造決定の困難さ
科学者たちは信じられないほどの巧妙さを通じて多くのタンパク質の構造を解明してきましたが、今日でもそれは例外的に困難なままです。これをタンパク質の構造を決定したいと思ったら、タンパク質構造決定のラボプロトコルを開く、手順に従う、というようにイメージすべきではありません。
それは巧妙さ、アイデア、多くの方法を見つけることから成り立っています。この場合、私は一種類のタンパク質構造予測、すみません、タンパク質構造決定、実験的測定について説明しています。そこでは、私が先ほど示したあの大きくて醜い分子を、食塩のような規則的な結晶を形成するよう説得します。
これには誰も簡単なレシピを持っていません。だから、彼らは多くのことを試します。彼らはアイデアを持っていて、それは例外的に困難で、科学の多くのもののように失敗に満ちています。そして、これがどれほど困難かのアイデアを得る一つの方法を本当に見ているのです。私たちが使っていた一種の普通の論文を取り上げました。私は後ろをめくって、彼らのプロトコルに、一年以上後に結晶が形成し始めたと書かれているのを見ました。
つまり、彼らはこれらすべての困難な実験を行っただけでなく、それが機能するかどうかを見つけるために約一年待たなければならなかったのです。そしておそらくその一年は待つことに費やされたのではなく、同様に機能しなかった他の千のことを試すことに費やされたのでしょう。それを行ったら、これをシンクロトロンという控えめなものに持っていくことができます。この装置の外側にある車のリギングを見ることができるので、信じられないほど明るいX線をそれに照射して、回折パターンと呼ばれるものを得ることができ、それを解くことができ、PDBまたはタンパク質データバンクと呼ばれるものにそれを保存することができます。
データの重要性と活用
私たちが行った仕事を可能にしたことの一つは、50年前の科学者たちが、これらは重要であり、これらは困難である、私たちはそれらをすべて一箇所に集めるべきだと言う先見の明を持っていたことです。つまり、コミュニティ内のタンパク質構造のほぼすべての学術的成果を表し、誰もが利用できるデータセットがあります。
私たちの作業は非常に公開されたデータに基づいていました。約200,000のタンパク質構造が知られています。それらは年間約12,000ずつかなり定期的に増加しています。しかし、これは必要性よりもはるかにはるかに小さいです。タンパク質についてのDNAという種類の入力情報を得ることは、はるかにはるかにはるかに簡単です。つまり、数十億のタンパク質配列が発見されています。
タンパク質構造よりもタンパク質配列について学ぶ速度は約3,000倍速いのです。さて、それはすべて科学的な内容ですが、この種の概略図を持つ私たちが行った小さなことについてお話しするべきです。私たちはAIシステムを構築したいと思いました。実際、それがAIシステムであるかどうかさえ気にしませんでした。科学のためのAIで働くことの良いことの一つは、どのように解決するかを気にしないことです。
それがコンピュータープログラムになったとしても、他の何かになったとしても、私たちは左側から何らかの方法を見つけたいのです。そこでは、これらの文字のそれぞれが順序と考えられるタンパク質の特定の構成要素を表しています。私たちは真ん中にAlphaFoldの何かを置きたく、右側で何かを得たいのです。
よく見ると、そこに二つの構造が見えるでしょう。青色が私たちの予測で、緑色が一年か二年の努力をかけた人の実験構造です。それに経済的価値を置きたいなら、10万ドル程度の価値があり、私たちがこれを行うことができたのを見ることができます。どのようにしたかをお話ししたいと思います。
機械学習の三要素
これを行うため、または任意の機械学習問題を行うために本当に三つの構成要素がありました。データと計算と研究があると言うことができ、私たちは最初の二つについてあまりにも多くの話をし、三つ目について十分な話をしていないと感じています。
データについては、私たちは200,000のタンパク質構造を持っていました。誰もが同じデータを持っています。計算に関しては、これはLLMスケールではありません。最終モデル自体は128のTPU v3コア、コアあたり大体GPUに相当するもので、二週間でした。これは再び学術的リソースの範囲内ですが、どれくらいの計算が必要かを考えるとき、最終モデルの数字に惑わされないことが重要だと言う価値があります。計算の真のコストは、機能しなかったアイデアのコスト、そこに到達するためにしなければならなかったすべてのことです。
そして最後に研究で、これに取り組んだのは約2人を除いてすべてだと言えるでしょう。それは少数の人々のグループが最終的にこれを行うことになります。つまり、これらの機械学習のブレークスルーを見るとき、それらはおそらくあなたが想像するよりも少ない人々です。そして本当にここが私たちの仕事が差別化されたところです。
私たちはこの問題に機械学習をどのように持ち込むかについて新しいアイデアのセットを思いつきました。以前のシステムは主に畳み込みニューラルネットワークに基づいており、まあまあうまくいったと言えます。確実に進歩を遂げました。それをトランスフォーマーに置き換えても、正直に言って大体同じです。トランスフォーマーのアイデアと多くの実験と多くのアイデアを取れば、それが本当の変化を始めるときです。
研究アイデアの価値
今日見ることができるほぼすべてのAIシステムにおいて、途方もない量の研究とアイデア、そして私が中規模アイデアと呼ぶものが関与しています。それは人々がトランスフォーマー、スケーリング、テスト時間推論と言うヘッドラインだけではありません。これらはすべて重要ですが、本当に強力なシステムにおける多くの要素の一つです。実際、私たちの研究がどれだけ価値があったかを測定することができます。
誰かがAlphaFold 2、これは非常に有名なシステムで、非常に大きな改善をもたらしたものです。AlphaFold 1は世界最高でしたが、AlcesiラボのAIシステムが非常に注意深い実験を行い、AlphaFold 2のアーキテクチャを取って、利用可能なデータの1%でそれを訓練し、利用可能なデータの1%で訓練されたAlphaFold 2が、以前の最先端システムであったAlphaFold 1と同じかそれ以上に正確であることを示すことができました。
つまり、これらの要素の三番目である研究が、これらの要素の最初であるデータの百倍の価値があったということを示す非常にきれいなものがあります。そして私はこれが一般的に本当に本当に重要だと思います。皆さんがスタートアップにいるか、スタートアップについて考えているときの大きな一つとして、アイデア、研究、発見がデータを増幅し、計算を増幅する量について考えてください。それらは一緒に働きます。私たちが持っているよりも少ないデータを使いたいとは思いませんし、利用可能なよりも少ない計算を使いたいとは思いませんが、機械学習研究を行うときにアイデアは核心的な構成要素であり、それらは本当に世界を変革するのに役立ちます。
私たちは戻って、アブレーションを行い、どの部分が重要かを言うことさえできます。詳細にあまり焦点を当てないでください。私たちはこれを論文から引用しました。ここでベースラインと比較した違いを見ることができます。それらのいずれかを取って、私たちの最終システムから削除するかもしれないアイデアのそれぞれを見ることができます。種類の個別の識別可能なアイデア、その一部は分野内で信じられないほど人気のある研究領域でした。この作業が出てきて、その一部は等変であり、人々は等変性、それが答えだ、AlphaFoldは等変システムであり、素晴らしい、さらに素晴らしいシステムを得るために等変性についてもっと研究しなければならないと言いました。
私はこれに非常に困惑しました。なぜなら、そこの6行目、IPA不変点注意なし、それはAlphaFoldのすべての等変性を除去し、少し傷つけますが、ほんの少しだけです。左のグラフで見ることができるこのGDTスケールでAlphaFold自体。AlphaFold 2はAlphaFold 1よりも約30GDT良く、等変性はこれの2つまたは3つを説明します。それは一つのアイデアについてではありません。変革的なシステムに加わる多くの中規模アイデアについてなのです。
生物学的関連性の重要性
これらのシステムを構築するときに、この文脈で生物学的関連性と呼ぶものについて考えることは非常に非常に重要です。私たちはより良いアイデアを持っていました。私たちは一度に1%ずつシステムを粉砕していました。しかし、本当に重要だったのは、機械学習を気にしない実験生物学者にとって重要だった精度を超えたときでした。そして多くの作業と努力を通してそこに到達しなければなりません。そして到達したとき、それは信じられないほど変革的です。
そして、この軸に対して測定することができます。ここで濃い青軸は当時利用可能だった他のシステムです。そしてこれは評価されました。タンパク質構造予測は、LLMや一般的な機械学習空間よりもある意味でブラインド評価ではるかに進んでいます。1994年以来、2年ごとに、タンパク質の構造を予測することに興味のある人は全員集まって、それを解いたばかりの研究グループ以外には誰も答えを知らない100のタンパク質の構造を予測します。未発表です。そして、本当に何が機能するかがわかります。
私たちはこの評価で他のどのグループよりも約3分の1のエラーを持っていました。しかし、答えがわからない問題に取り組んでいるときに、本当にものがどれほど良いかを測定することができるので、それは重要です。そして、多くのシステムが研究の過程で人々が信じるレベルまで実際に達していないことを本当に見つけることができます。
ベンチマークを持っていても、私たちは皆、アイデアをベンチマークに過度に適合させるからです。ホールドアウトを持っていない限り。そして実際、現実世界で持つ問題は、訓練する問題よりもほぼ常に困難です。なぜなら、多くのデータから学習し、それを非常に重要な特異な問題に適用しなければならないからです。
検証と公開の重要性
だから、開発しているときと人々があなたのシステムを使うべきかどうか決めようとしているときの両方でよく測定することは非常に非常に重要です。外部ベンチマークは何が機能するかを理解するために絶対に重要であり、それが本当に世界を前進させるのに役立つものです。
私たちにとってこれは典型的なパフォーマンスの素晴らしい例です。これらはブラインド予測です。それらがかなり良いことがわかります。私たちはそれを利用可能にし、私たちはそれがそうだと思い、多くの評価を行いましたが、二つの方法でそれを利用可能にすることが非常に重要だと決めました。一つは、私たちがコードをオープンソースにし、実際にデータベースをリリースする約一週間前にコードをオープンソースにしました。
最初は300,000の予測から始まり、後に2億、つまりゲノムが配列決定された生物からのほぼすべてのタンパク質の予測のデータベースです。そしてこれは途方もない違いを生みました。最も興味深い社会学的なことの一つは、専門家が使うことができるコードの断片をリリースして、いくらかの情報を得て、そして世界にこのデータベース形式で利用可能にしたときの間の大きな違いです。
何かをリリースして、毎日Twitterまたは今はXをチェックして何が起こっているかを見つけるのは本当に興味深いことでした。私たちが本当に見ていたのは、そのCASP評価の後でさえ、構造予測者たちはこれが明らかに巨大な進歩であり問題を解決したと確信していたと言えるでしょう。しかし、一般的な生物学者、私たちが使ってほしいと思っていた人々、構造予測を気にしない人々、彼らの実験をするためにタンパク質を気にしていた人々は、それほど確信していませんでした。
彼らは「まあ、多分CASPは簡単だったのかもしれない。わからない」と言いました。そしてこのデータベースが出て、人々は好奇心を持ち、クリックして、証明が社会的だった程度は並外れており、人々は見て「DeepMindはどうやって私の未発表構造にアクセスを得たのか?」と言うでしょう。彼らが本当にそれを信じた瞬間、誰もが解決していないタンパク質を持っているか、未発表のタンパク質を持っている友人がいて、比較することができた、それが本当に違いを生んだものです。
実際の活用と影響
このデータベース、このアクセシビリティ、この簡単さを持つことで、誰もがそれを試して、それがどのように機能するかを理解するようになりました。口コミが本当にこの信頼が構築される方法です。これらの証言のいくつかを見ることができます。私はこの科学的タスクを実行しようとして3〜4ヶ月格闘しました。今朝AlphaFoldの予測を得て、今ははるかに良くなりました。
私の時間を返してほしいと。1年間発現と精製を拒否したタンパク質でそれを実行するとき、AlphaFoldを本当に感謝します。つまり、彼らは1年間、実験を開始するための材料さえ得ることができませんでした。これらは本当に重要です。適切なツールを構築し、適切な問題を解決するとき、それは重要であり、あなたがすることではないが、あなたの作業の上に構築することを行っている人々の生活を変えるのです。
そして私はこれらを見ることや話をする人々の数が並外れだと思います。私がこのツールが重要だと本当に知った時間。実際、ツールが出てから数ヶ月後に核膜孔複合体についてのサイエンスの特別号がありました。特別号はこの特別な非常に大きな種類の数百のタンパク質システムについてのすべてでした。
サイエンスでのこれについての4つの論文のうち3つがAlphaFoldを広範囲に使用しました。私はサイエンスでAlphaFoldという単語の100以上の言及を数えたと思いますが、私たちはそれと何の関係もありませんでした。私たちはそれが起こっていることを知りませんでした。私たちは協力していませんでした。それは私たちが構築したツールの上で新しい科学を行っている人々だけでした。そしてそれは世界で最高の気分です。
予想外の活用方法
実際、ユーザーは大胆なことをします。彼らはあなたが可能だとは知らなかった方法でツールを使うでしょう。左からの森脇良佳氏のツイートは、私たちのコードが利用可能になってから2日後に出ました。私たちは個々のタンパク質の構造を予測していましたが、タンパク質がどのように一緒になるかを予測するシステムの構築に取り組んでいることを考えていました。
しかし、この研究者は「まあ、AlphaFoldがある。二つのタンパク質を一緒に置いて、間に何かを置いてみよう」と言いました。これをタンパク質のプロンプトエンジニアリングと考えることができます。そして突然、彼らはこれが世界最高のタンパク質相互作用予測だと発見します。本当に本当に強力なシステムで訓練するとき、それらが整列している限り、ある意味で創発的なスキルを持つでしょう。
人々は私たちが予想していなかったAlphaFoldが機能するあらゆる種類の問題を見つけ始めました。科学の分野がこれらのツールの存在にリアルタイムで反応し、その限界を見つけ、その可能性を見つけるのを見るのは非常に興味深く、これは続いており、人々はタンパク質設計であれ、私たちが構築したアイデア、しばしばシステムの上で他の人においてエキサイティングな作業をあらゆる種類行っています。
科学研究の変革
本当に重要だと思った一つの応用は、人々がそれを使って大きなタンパク質を設計する方法を学び始めたことです。私がこの話をしたい理由は二つあります。一つはこれが本当にクールな応用だと思うからですが、二つ目はそれが科学の作業を本当に変える方法で、しばしば人々は科学は実験と検証についてのすべてだと言うでしょう。
だから、これらすべてのAlphaFold予測を持つのは素晴らしい。今、私たちがしなければならないのは、あなたの予測が正しいか間違っているかを教えることができるように、古典的な方法ですべてのタンパク質を解くことだけです。そして彼らは一つのことについて正しいです。科学は実験についてです。科学はこれらの実験を行うことについてです。しかし彼らは別のことについて間違っています。科学は特定のタンパク質の構造についてではなく、仮説を立ててそれらをテストすることについてです。
この場合、質問は彼らが左側にある収縮性注入システムと呼ばれるこのタンパク質を取ったことでしたが、それは大口です。彼らはそれを分子注射器と呼ぶのが好きです。そしてそれが行うことは、細胞に付着してその中にタンパク質を注入することです。MIT のJangラボの科学者たちは「このタンパク質を標的薬物送達に使うことができるだろうか?CRISPR-Cas9のような遺伝子編集者を細胞に入れるために使うことができるだろうか?」と言っていました。
彼らは、構造を持っていなかったこのタンパク質を取って、これは後から作られた描写に過ぎませんが、「それが認識するものをどのように変えることができるか?」と言うために100以上の方法を試しました。私はそれがもともと植物防御か何かに関与していたと思いますが、彼らはそれをどのように行うかを知りませんでした。そして彼らはAlphaFold予測を実行しました。左側にあるものを見ることができます。
私はそれが素晴らしいAlphaFold予測だとは言いません。しかし、ほぼ即座に彼らはそれを見て言いました。「ちょっと待って。底部のこれらの脚は、それが細胞を認識して付着する方法でなければならない。設計タンパク質でそれらを置き換えてみよう。」そして、ほぼ即座にAlphaFold予測を得るとすぐに、彼らは新しいタイプの細胞を標的にするために、赤で見ることができるこの設計タンパク質を追加するために再エンジニアリングしました。
彼らはこのシステムを取って、実際にマウス内の細胞を選択し、この場合は蛍光タンパク質であるタンパク質を注入できることを示します。だから、色を見ることができ、マウスの脳内で彼らが望む細胞を標的にすることができます。そして彼らはこれを使って新しいタイプの標的薬物発見システムを開発しているのです。
さらに多くの例を見ています。科学者がこのツールを使って何千何千もの相互作用を試して、どれが可能性が高いかを理解しようとするもの。実際、卵子と精子が受精でどのように一緒になるかの新しい構成要素を発見しました。これらの上に構築された多くの多くの発見があります。
将来への展望
私は私たちの作業が構造生物学、構造を扱う生物学と呼ばれる分野全体を5%または10%速くしたと思いたいです。しかし、それが世界にとって重要である程度は巨大であり、私たちはこれらの発見をもっと持つでしょう。そして私は最終的に構造予測とより大きな科学のためのAIは、実験者の作業の増幅器となる信じられない能力として考えられるべきだと思います。
私たちはこれらの散在する観察、これらの自然データから始めます。これは私たちのインターネット上のすべての単語に相当するものです。そして私たちはその下にある規則を理解し、残りの絵を埋めることができる一般的なモデルを訓練します。そして私たちはこのパターンを続けて見ると思い、それはより一般的になり、これを行うために適切な基盤データソースを見つけるでしょう。
そして私が本当に特性だったと思うもう一つのことは、データがある場所から始めるが、それからそれが適用できる問題を見つけるということです。だから私たちは巨大な進歩、細胞内の相互作用や他のものを理解する巨大な能力を見つけます。これらの予測の科学的内容を抽出し、それから彼らが使用する規則を新しい目的に適応させることの下流にあるのです。
そして私はこれが本当にAlphaFoldや他の狭いシステムの基盤モデルの側面を見る場所だと思います。そして実際、私はLLMやその他のより一般的なシステムでこれを見始めると思います。私たちはその中により多くの科学的知識を見つけ、重要な重要な目的のためにそれらを使うでしょう。
そして私はこれが本当にこれが向かっている場所だと思います。そして私は科学のためのAIで最もエキサイティングな質問は、それがどのほど一般的になるかだと思います。変革的影響を持ついくつかの狭い場所を見つけるのか、それとも非常に非常に広いシステムを持つのでしょうか?そして私はそれを理解するにつれて、最終的に後者になると期待しています。ありがとうございました。


コメント