初の本物のAI科学者がついに登場…そしてそれは驚異的だ

AIサイエンティスト・科学研究
この記事は約12分で読めます。

エジソンサイエンティフィックが開発したCosmosは、データ駆動型の科学的発見を完全自動化する次世代のAI科学者である。従来のAI科学者の限界であった情報統合能力をワールドモデルの導入により克服し、数千の論文を読み込み、数万行のコードを書き、数ヶ月分の人間の研究作業を数日で完遂する能力を持つ。Cosmosは既に7つの重要な発見を成し遂げており、そのうち3つは未発表の人間の研究結果の独立した再現であり、残りの4つは完全に新規の発見である。ベータユーザーの評価では、Cosmosが1日で達成する作業量は人間の科学者が6ヶ月かけて行う作業に相当するとされ、その結論の79.4%が正確であることが確認されている。この技術は科学研究の自動化だけでなく、AI研究そのものの加速にも応用可能であり、次世代のAI開発における重要な転換点となる可能性を秘めている。

The First REAL AI Scientist Is Here... and It's INSANE
Kosmos might be the first REAL AI scientist. It uses world models to stay coherent for millions of tokens, runs for days...

Cosmosの革新的なアプローチ

Cosmosは、データ駆動型の発見を完全に自動化するAI科学者です。この重要なイノベーションは、私たちがワールドモデルと呼んでいるものです。これはシステムの脳のようなものだと考えてください。エージェントが発見したすべてのものを継続的に統合し、パターンや知識のギャップを見つけ出し、次に何を調査すべきかを戦略的に決定します。

科学者が探究課題を考案し、システムに研究目標を提供することから始まります。これは非常にシンプルで、ただの1、2行でも構いません。例えば、老齢マウスの脳におけるタンパク質分解の老化バイオマーカーを特定するといった具合です。

そこから、システムは12時間から48時間の間、自律的に稼働し、数百のエージェント軌跡を展開します。これらはエジソンが行う文献レビューまたはデータ分析のいずれかです。そしてそのプロセスで、数万行のコードを書き、2,000から5,000の個別の研究論文をレビューします。

これについてあまり多くの人が話していないのですが、私には正直なぜだか分かりません。エジソンサイエンティフィックと呼ばれるグループが、自律的発見のためのAI科学者であるCosmosをリリースしました。そしてこれは本当に驚異的なものです。クリップからご覧いただいたように、彼らはこれが何日も稼働し続け、数千行のコードを書き、数千の研究論文を分析し、実際に有用な仮説を生成できると主張しています。

これは実際、Future HouseのRobinの次世代版です。Robinを覚えているかもしれません。私は以前の動画でそれを取り上げました。基本的には、科学研究の主要な部分を自動化することを目指して協力するAIエージェントのクラスターです。Cosmosに似ていますが、はるかに原始的なものでした。しかし実際に、加齢黄斑変性症の新しい治療法を発見することに成功しました。

これは2025年5月のことでした。今日まで早送りすると、Future Houseは現在エジソンサイエンティフィックと呼ばれるグループにスピンオフしており、Robinの次世代版がCosmosと呼ばれています。では、Cosmosは何が違うのでしょうか。そしてなぜRobinに対してこれほど大きなアップグレードなのでしょうか。

Cosmosの技術的優位性

彼らが書いているように、Future HouseのRobinのような以前の世代のAI科学者は、主に大量の情報を統合する能力において制限されていました。言語モデルの有限なコンテキスト長は、AI科学者がある程度のステップしか踏めないか、ある程度の論理的飛躍しかできないことを意味しており、道がなくなる前に、できる発見の複雑さが制限されていました。

しかしCosmosでは、構造化されたワールドモデルを使用しており、これにより数百のエージェント軌跡にわたって抽出された情報を効率的に組み込み、数千万トークンにわたって特定の研究目標に向けた一貫性を維持することができます。

このワールドモデルのアプローチは非常に興味深いものです。正直に言うと、それがどのように機能するのか完全には理解していませんが、エジソンサイエンティフィック自身はそれをモデルの脳として見ています。基本的には、情報を圧縮し、保存し、その中の欠けているギャップやパターンを見つけて、どこに脳力を集中させるべきかを決定するシステムです、理解できるでしょうか。

また、これをNvidiaの具現化された知能、つまりロボットのためのワールドモデルという意味で考えることもできます。これも皮肉なことにCosmosと呼ばれていますが、KではなくCです。このワールドモデルは、ロボットに世界の内部シミュレーションを与えることを意図しています。したがって、生のカメラ入力だけに頼る必要はありません。これはほとんどロボットに直感を与えるようなもので、因果関係を理解し、過去にうまくいったことを記憶し、混乱したり劣化したりすることなく数歩先を計画する方法です。

KのついたCosmosは基本的にまったく同じことをしていますが、まったく異なる領域で行っています。ロボットのように物理世界をモデル化する代わりに、Cosmosは科学世界をモデル化しています。分子間の関係、生物学的経路の構造、臨床データのパターン、どの仮説がすでに試されたか、どの方向が有望に見えるか、などです。

これが、再びKのついたCosmosに、1回の実行で1,500の論文を読み、42,000行の分析コードを実行する能力を与えているものです。彼らが知る限り、どのエージェントよりもはるかに多いと彼らは述べています。したがって、当然これは以前のツールよりもはるかに洗練された分析を実行できることを意味します。

実際、彼らは、ベータユーザーがCosmosは人間が6ヶ月かかることを1日で行うことができると推定していると主張しています。そして彼らは、その結論の79.4%も正確であることを発見しました。彼らはこれに衝撃を受けました。理性的な人間なら誰でもそうあるべきです。そして後ほど投稿で少し見るように、その6ヶ月という数字は控えめな表現かもしれません。

透明性と再現性への配慮

では次に、実際にこのシステムが行った発見に移る前に簡単に言及したいことがあります。たくさんありましたから。それは、Cosmosが透明性とトレーサビリティを念頭に置いて設計されたということです。

透明性の部分はかなり自明です。彼らはCosmosのレポートが完全に監査可能で、完全に法的範囲内であることを保証しています。しかしトレーサビリティの側面も重要です。なぜなら、システムに尋ねられたときにただがんの治療法を吐き出すだけでは望ましくないからです。それはかなり素晴らしいことではありますが。

がんの治療法を吐き出してほしいのですが、それと一緒にそこに到達するために踏んだ正確なステップも必要です。それが引き出した正確な情報と、それを再現する正確な方法です。これは明らかに非常に重要です。信用すべきところに信用を与えるためだけでなく、少なくとも可能な限り、人間が科学的発見の進歩をコントロールし続けることを保証するためにも重要です。

Cosmosの7つの重要な発見

さて、それではCosmosが実際に発見したものについて話しましょう。ここから物事が本当になってきます。Cosmosは7つの主要な発見を行いました。そのうち3つは、まだ発表されていない人間の結果の独立した再現であり、他の4つは完全に新規のものでした。少なくともそれが彼らの主張です。

最初の発見で、Cosmosは低体温マウスにおける代謝経路の破壊を正しく特定しました。これは当時、未発表の原稿にのみ存在していた結果です。次に材料科学に飛び込み、絶対湿度がペロブスカイト太陽電池効率の重要な要因であるという発見を再現しました。これも、言語モデルのトレーニング打ち切り後に発表されたプレプリントからです。これが何を意味するのか全く分かりませんが、重要に聞こえます。

そしてまた、人間の神経科学者が以前に報告した、種を超えたニューロン接続の同じ数学的規則を再発見しました。これらが3つの再現でした。そして今から新しいものです。

CosmosはSOD2の高レベル、これは抗酸化酵素ですが、これが人間の心臓線維症を因果的に減少させる可能性があるという証拠を発見しました。また、特定の遺伝的変異が2型糖尿病のリスクを低下させる可能性がある仕組みを説明する新しい分子メカニズムを生み出しました。

アルツハイマー患者におけるタウの蓄積につながる分子イベントのシーケンスを再構築するまったく新しい方法を構築しました。そして最後に、Cosmosはアルツハイマーで特定のニューロンが最初に死ぬ理由について、潜在的に重要な手がかりを明らかにしました。

Cosmosは、嗅内皮質ニューロンが加齢するにつれて特定のフライアス遺伝子の発現を失い、ミクログリアがそれらを破壊するきっかけとなるエティシグナルを露出させることを発見しました。そしてチームは実際にこれを別の人間のデータセットで検証しました。

繰り返しますが、これらの言葉の半分が何なのか全く分かりませんが、これは本物だと信じています。なぜなら、これについてあまり多くの反対や懐疑論をオンラインで見ていないだけでなく、公平に言えば、これについてあまり話題になっているのを見ていないのですが、サム・アルトマンもチームを祝福し、これはエキサイティングだと言い、今後このようなものをもっと多く見ることを期待しており、このタイプのものはAIの最も重要な影響の1つになるだろうと述べました。

ですから、私は本当にこれが本物だと思いますし、エジソンサイエンティフィックチームまたはFuture Houseチーム、彼らが今何であれ、ここで特別なことをしたと思います。彼らは、このような完全に自律的なAI科学者を最初に作成し、ワールドモデルをスタックに統合した最初の人たちであり、それがゲームチェンジャーであることが示されています。

現在の制限事項

もちろん、まだいくつかの制限もあります。例えば、Cosmosは気軽に遊べるチャットボットではないという事実です。これはむしろディープリサーチマシンに近く、プロンプトを入力するよりも実験を実行することに近いです。彼らは、それを適切に操縦する方法を学ぶには時間がかかり、それがうまく機能するためには本当に彼らのプロンプティングガイドラインに従う必要があると言っています。

そして価格もそれを反映しています。現在1回の実行につき200ドル、または200クレジットですが、彼らは実際にこれを大幅に割引されていると呼んでいます。ですから、これは確かに一般の人向けではありません。これは正当な科学者のためのものです。

そして彼らは、Cosmosは強力ですが、必ずしも集中しているわけではないと言っています。それは人間の作業の数ヶ月分に相当するものを生み出すことができますが、統計的に有意だが無意味な相関を追いかけて、喜んでウサギの穴に迷い込んでいきます。これは人間もよくやることです。

エジソンは、同じ目標に対してCosmosを複数回実行して、それが選択する可能性のあるさまざまな研究軌跡を見ることさえあると言っています。これもまた高価になります。その上、UIはまだ粗削りです。ワークフローにはまだ鋭いエッジがあり、彼らは問題に遭遇する可能性があることを率直に認めています。

ですから、これは本当にバージョン1のようなものか、Robinを数えればバージョン2かもしれません。しかし、これは私たちが向かっているところの氷山の一角に過ぎません。

6ヶ月の作業を1回の実行で

これで、おそらくレポート全体で最もクレイジーな部分、6ヶ月の推定値に到達します。ですから、以前にCosmosが6ヶ月分の人間の作業に匹敵すると言ったのを覚えていますか。実は、エジソンサイエンティフィックはそれを比喩的に言ったのではありません。彼らは実際にそれを測定し、得られた数字に彼らは衝撃を受けました。

彼らがベータテスター、つまり本物の科学者に、手動で同じ結論に到達するのにどれくらいの時間がかかったかを尋ねたところ、完全な20ステップのCosmos実行の平均回答は6.14ヶ月でした。それは1回の実行から6ヶ月です。

これはほとんど信じられないように聞こえますが、考えてみてください。エジソンサイエンティフィックは、1つの論文を人間の科学者が読むのに15分かかり、1つのデータ分析軌跡を実行するのに約2時間かかると推定しています。

覚えていますか、Cosmosは1回の実行につき数千の論文を読んで分析しており、1回の実行には通常12時間から48時間の実際の時間がかかります。ですから、これらの計算に基づくだけで、15分かける1,500論文を60で割ると、375時間、つまり15日間、人間の科学者がその量の論文を読むのにかかる時間です。

そしてそれはまた、データ分析を行い、仮説を生成し、科学者が行う他のすべてのことをただ驚異的に速く行っています。さらにクレイジーなのは、実行の深さに対して線形にスケールすることです。実行が深くなるほど、それが生み出す人間相当の作業が増えます。

言い換えれば、Cosmosが考える時間が長いほど、それが出力する科学が増えます。これは実際、科学研究そのものに対する推論時間スケーリング法則に近いものを見た最初の例の1つです。

ですから、6ヶ月の推定値は実際に複数の方向から一致しています。そして今見たように、Cosmosは実際の人間の研究室からの3つの発見を再現しました。これらは彼ら自身が明らかにするのに約4ヶ月かかったものです。Cosmosはそれを1回の実行で行いました。

AI研究の加速への可能性

ですから、もしそれがすでに人間の科学者のチーム全体が数ヶ月かかる発見を数時間で行っており、実行時間が長いほど、より多くの人間相当の作業を行うのであれば、これは私たちがこれまでAIで見た最大のブレークスルーの1つではないでしょうか。

真実は、これは間違いなくブレークスルーです。そしてそれはスケールしますが、実行を深くさせ続けるほど、それが奈落の底に漂流する可能性が高くなります。彼らは、実行の深さを永遠に増やし続けると、最終的にはより多くの思考がそれを悪化させるポイントに到達すると推定しています、良くするのではなく。

それでも、これは絶対的なゲームチェンジャーです。科学を加速するためにワールドモデルを使用することは、科学を自動化するだけでなく、AI研究そのものを自動化する鍵になる可能性があります。それは科学的発見です。そしてそこが物事が本当に興味深くなるところです。

なぜなら、もしAI科学者が生物学、化学、材料科学を加速できるなら、次のバージョンがモデル設計、トレーニング戦略、安全性研究、基本的に次世代のAIにつながるすべてのものを加速することを止めるものは何もないからです。

そして私たち全員が知っているように、一度それが起こったら、後戻りはできません。とにかく、ご視聴ありがとうございました。皆さんがこの解説を楽しんでいただけたことを願っています。そしてこれすべてについてどう思ったか、コメントで教えてください。

これが本当にブレークスルーだと思いますか、それともこれはただのさらなる誇大広告でしょうか。また、動画に「いいね」をするのを忘れないでください。チャンネルを購読して最新情報を入手してください。そしていつものように、次の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました