Googleの新しいAIコサイエンティストが全てを変えた(AIコサイエンティストの解説)

AGIに仕事を奪われたい
この記事は約9分で読めます。

5,164 文字

Googles New AI Co Scientist Just Changed EVERYTHING (AI co-scientist Explained)
Join my AI Academy - 🐤 Follow Me on Twitter 🌐 Checkout My website -

今日は業界に衝撃を与えたものについて見ていきたいと思います。それはもちろんGoogleのコサイエンティストです。これが何をできるのかは驚くべきものであり、AIが科学的発見を支援し、効果的な治療法を研究する効率性を高める上で、私たちがどこに向かっているのかを示唆しています。
基本的にコサイエンティストはGoogle Researchによって開発されたマルチエージェントAIシステムで、科学者が新しい仮説や研究提案を生み出すのを支援するように設計されています。これは複雑なトピックを理解し、新しい研究の方向性を提案できる仮想的な共同研究者として機能します。
この技術はかなり驚くべきもので、後ほど説明する実世界での応用例もありますが、まずはこの仕組みについて詳しく見ていきましょう。
ここで短いデモをご覧いただけますが、詳細についてはすぐに説明します。ここには科学者がいて、その科学者が研究目標を特定し、それをAIコサイエンティストに伝えます。AIコサイエンティストは完全にサブエージェントで構成されており、スーパーバイザーエージェント、生成エージェントなど、全てのエージェントが存在します。そしてそれらのアイデアが互いに競い合い、最終的に最良のものが提案されます。
各エージェントの役割について説明すると、生成エージェントは新しい仮説を生み出すもので、リフレクションエージェントはアイデアを評価・洗練するエージェントです。ウェブ検索機能を備えており、シミュレーションレビュー、トーナメントレビュー、深い検証が可能で、アイデアの検証に非常に有効です。
そして進化エージェントは、時間とともにアイデアを改善し、他のアイデアからインスピレーションを得るものです。さらにメタレビューエージェントは、正確性と科学的価値を確保します。そしてランキングエージェントがありますが、これは最も重要なものの1つだと思います。最良の研究方向を優先順位付けするからです。
研究仮説の比較とランキングは科学的議論とトーナメント形式で行われ、アイデアを継続的にランク付けします。リフレクションと進化により、時間とともに、そしてこれはテストタイムコンピュートを活用しているのですが、アイデアは継続的に改善されていきます。
基本的に科学者が「これについて研究したい」と制約条件や属性とともに述べることから始まります。これが全体のアーキテクチャで、ツールの使用、検索、追加ツールを備えたマルチAIエージェントフレームワーク全体を示しています。また、メモリも持っており、時間とともに研究仮説を継続的に生成、レビュー、議論、改善していきます。
単に1つのアイデアを出すだけでなく、内部で複数のアイデアを評価し(具体的な数は分かりませんが)、それらについて検討・反映し、ランク付けして時間とともに改善できるようにします。また、ウェブを閲覧し、科学データベースを通じて全ての発見を検証することができます。
さらに、AIサイエンティストが割り当てられた目標を研究計画の設定に変換し、それをスーパーバイザーエージェントが管理する仕組みについても説明があります。スーパーバイザーエージェントは専門エージェントをワークキューに割り当て、リソースを配分します。この設計により、システムは柔軟にコンピュートをスケールし、指定された研究目標に向けて科学的推論を反復的に改善することができます。
このエージェントをワーカーに割り当てるスーパーバイザーエージェントがあり、このシステム全体が詳細な仮説を含む研究概要を生成できます。
この研究エージェント・サイエンティストエージェントのワークフローで驚くべきことの1つは、テストタイムコンピュートを活用していることです。AIコサイエンティストはテストタイムコンピュートのスケーリングを活用して、出力を反復的に推論・進化・改善します。これは非常に驚くべきことです。テストタイムコンピュートのパラダイムは最近になって登場したものですが、すでに多くの分野で応用されているのを目にしています。
主要な推論ステップには、新しい仮説生成のためのセルフプレイベースの科学的議論、仮説比較のためのランキングトーナメント、品質改善のための進化プロセスが含まれます。システムのエージェント的性質により、ツールを使用したフィードバックを含む再帰的な自己批判が可能になり、仮説と提案を洗練させることができます。
時間とともにより良いアイデアを継続的に生み出すことができ、さらなるコンピュートとより効率的なアルゴリズムによって、このシステムはより良い仮説を出力すると予想されます。
また、このシステムの自己改善は、トーナメントから導き出されたELO自動評価指標に依存しています。ここでのトーナメントとは、AIコサイエンティストの仮説を競争的にランク付けするプロセスを指します。システムは複数のアイデアを生成し、事前に定義された基準を使用してそれらのアイデアを体系的に比較します。
全てのアイデアを互いに比較し、強み、弱み、裏付けとなる証拠を検討します。最良のアイデアがランク付けされ、自己改善ループを使用して反復的に改善され、最高品質のアイデアのみが科学者に提示されます。
ELOレーティングとGPQAベンチマークのダイヤモンドセットにおける困難な質問での一致度を分析したところ、より高いELOレーティングは正解の確率の高さと正の相関があることが分かりました。
GPQAダイヤモンドセットの質問に対するAIコサイエンティストのパフォーマンスとELOレーティングの一致度を見ることができます。Gemini 2.0は少し停滞していますが、AIコサイエンティストについては、7人のドメインエキスパートが各専門分野で15の未解決の研究目標とベストな解決策を選定しました。
自動化されたELO指標を使用して、AIコサイエンティストが複雑な問題に対して他の最先端のエージェント型推論モデルを上回るパフォーマンスを示すことを確認しました。
このグラフは、新しい研究アイデアを生み出す際のAIコサイエンティストと他のAIモデル、人間の専門家との比較を示しています。科学者は15の異なる問題をAIと人間の専門家に与え、チェスのようにパフォーマンスをランク付けするELOレーティングシステムを使用して、誰が最良の解決策を提案したかを確認しました。
このグラフは、AIコサイエンティストが問題に取り組めば取り組むほど(テストタイムコンピュート)、パフォーマンスが向上することを示しています。人間の専門家の位置、Gemini 2.0フラッシュの位置、Gemini 2の位置も確認でき、AIコサイエンティストが全ての指標で明確に上回っていることが分かります。
これは非常に良い結果です。AIが問題に取り組めば取り組むほど改善を続け、科学者がより良い解決策をより早く見つけるのを支援できることを意味するからです。
実世界での使用例について話したいと思います。派手なデモは良いものですが、実際にどのように役立つのかという点について、AIは急性骨髄性白血病(血液がんの一種)の治療に既存の薬の新しい用途を見つけることを支援しています。
通常、新薬の開発には長い時間と多額の費用がかかりますが、薬剤の再利用とは、科学者が既存の薬の新しい使用法を見つけることを意味します。GoogleのAIコサイエンティストは、この種のがんと戦うために既存の薬のどれが役立つかを予測するために使用されました。
科学者がAIの提案を研究室でテストした結果、Kira 6と呼ばれる薬の1つが特定の用量でがん細胞の成長を抑制できることが分かりました。このグラフは、薬物濃度が増加するにつれてがん細胞の数が減少することを示しており、効果的な治療法となる可能性があることを意味します。
これはAIががん研究のスピードを上げ、医師がより良い治療法をより早く、より少ない副作用で見つけるのを支援できることを意味します。これが実世界での使用例の1つです。
また、肝臓線維症に関する研究もあります。肝臓線維症は、肝臓に過度の瘢痕化が起こり、正常な機能が妨げられる状態です。科学者は新しい治療法を必要としていますが、どこをターゲットにすべきかを把握するのは難しい課題です。
GoogleのAIコサイエンティストと科学者たちは、研究室で培養したミニ肝臓(オルガノイド)でテストを行いました。このグラフは線維症誘導因子(瘢痕化を悪化させるもの)、線維症阻害因子(瘢痕化を軽減するもの)、そしてAIが提案した4つの薬を示しています。これらもまた瘢痕化の軽減に役立ち、AIが実際に機能する新しい治療法を発見した可能性があることを意味します。
最初の2つの薬剤は実際にかなりの低下を示しており、これは非常に良い結果です。
また、AIは抗菌薬耐性における重要なメカニズムを再発見することにも貢献しました。これは細菌が抗生物質に対して耐性を獲得する仕組みです。通常、科学者はこの研究に何年もかかります。
科学者たちは細菌が耐性遺伝子を共有する仕組みを理解するために何年もの実験を重ねており、重要な発見の1つがCFPI CISでした。これは細菌が耐性遺伝子を転移するのを助ける小さなDNA断片です。
2013年から2025年にかけて、人間は実験を通じてこの仕組みを徐々に解明してきました。しかし驚くべきことに、2024年に研究者たちがGoogleのサイエンティストに同じ質問をしたところ、わずか2日でAIは独自にCFピックスがファージと相互作用して耐性を広げることを突き止めました。
これは非常に驚くべきことです。AIが人間の何年もの研究を文字通りわずか2日で独自に再現したのです。7年どころか、それよりもはるかに長い期間を要した研究をわずか2日で行ったのです。
AIはこれを非常に独立して行い、発見のプロセスを何年もかかるものから数日に短縮しました。薬の開発においてこれがどれほど驚くべきことか想像してください。
Dario Amodeiが科学研究が10倍速くなると話していた際、一部の人々は誇張した主張だと述べていましたが、これこそが彼らが言及していた種類のことです。文字通り科学者が48時間以内にこれを成し遂げることができたのは、初めての事例の1つです。
気になった点の1つは、これが単に訓練データに含まれていただけではないかということでしたが、画像とテキストを注意深く見ると、AIが単に訓練データを思い出して装っていないことを確認するための制御されたテストであったことを示す点がいくつかありました。
研究者たちは特に、まだ公開されていないトピックを選んで第三者による検証テストを行ったことが言及されています。より具体的には、AIコサイエンティストシステムを使用する前に行われた元の新規実験室実験にのみ存在する研究について、同一の研究質問でAIコサイエンティストをテストしたと述べています。これは実際に本物で、真実であり、かなり驚くべきことです。
私たちが本当に必要としている研究の全てが10倍速くなる可能性があります。考えてみてください。これはAIコサイエンティストバージョン1の開発に過ぎません。バージョン10が登場し、100万のAIが24時間365日、非常に多くの異なる実験を実行している状況を想像してください。その時何が起こるでしょうか。それは本当に驚くべきことです。
この動画を作った理由は、ほとんどの人が気付いていないこの記念碑的な情報について伝えたかったからです。皆さんの意見もぜひ聞かせてください。
人々が苦しんでいる全ての慢性疾患や、世界に存在する全ての恐ろしい衰弱性疾患が、最終的には消えることを願っています。私たちが直面している多くの病気を克服する本当の可能性があると思います。
衛生管理やワクチン、抗生物質で対処できるような比較的容易な病気はすでに解決していますが、がんやアルツハイマー病のような病気ははるかに複雑です。そのため、その複雑さを理解し、多くの人が想像している以上にはるかに速くそれらの病気を克服するために、AIが本当に必要なのではないかと考えています。
私たちはそれらの病気が非常に対処が難しく、進歩が遅い世界に慣れてしまっていますが、そうである必要はないと思います。正しく取り組めば、これらの不治の病を実際に克服することができ、ペストや天然痘を振り返るように、将来これらの病気を振り返ることができるようになると思います。
動画をご視聴いただきありがとうございました。また次回お会いしましょう。

コメント

タイトルとURLをコピーしました