AIエージェントによって制御される核融合(Los Alamos)

AIエージェント
この記事は約16分で読めます。

この動画はLos Alamos国立研究所におけるAIマルチエージェントシステムの実世界実装について解説している。特に慣性閉じ込め核融合実験においてAIエージェントが実験機器とデジタルツインの両方を制御し、科学研究プロセス全体を自動化する取り組みを紹介している。研究の加速化という利点がある一方で、安全性とセキュリティリスクについても言及されている重要な事例である。

FUSION Controlled by AI Agents (Los Alamos)
URSA is a modular agentic AI ecosystem by Los Alamos National Labs that accelerates scientific discovery by using a team...

AIマルチエージェントシステムの実世界実装

こんにちはコミュニティの皆さん。また戻ってきてくださって本当に素晴らしいです。そうです、今日はLos Alamos国立研究所におけるマルチエージェントシステムの実世界実装を見ていきます。実世界のユースケースです。そしてLos Alamosは、ご存知の通り、今OpenAIと協力して国家安全保障アプリケーションを推進しており、彼らはスーパーコンピューターを持っています。絶対に彼らはここで量子コンピューティングの最新秘密を理解する作業をしています。つい一か月前の出版物があります。

本当に美しいものです。そして彼らは今、AIエージェントをどのように使用するかを発表しました。彼らは言います、「Los Alamos国立研究所での科学的取り組みを加速するためのエージェントワークフローをここに紹介します。これは科学コミュニティによる使用のためのものです。そして美しいツール使用と結合されたモデラー構成可能エージェントのセットをお見せします。すべてのアシスタントが今できることは、研究成果の加速において領域専門家を補完するために、仮説立案、計画、実行、研究アーキテクチャタスクを行うことです」。

科学研究における加速のためのエージェント

科学における加速のためのエージェント、研究成果の加速、素晴らしく聞こえますが、実際に素晴らしいのでしょうか?

Ursaはここで計画、仮説立案、研究、計算タスクの実行に特化したエージェントを使用し、さらに実際の実験機器との統合があります。彼らはもちろんここで慣性閉じ込め核融合のユースケースで作業しており、特にICFのための信頼できる放射流体力学モデルです。

これはレーザー核融合アプリケーションです。そして今、彼らがどのようにAIを使用するかの内部を見ることができるのは素晴らしいことです。この話題は2019年8月の出版物からのもので、私は元の出版物をお見せできません。2019年からのものなので、かなりの金額を支払わなければならないでしょう。これはもはやオープンソースではなく、既に専用サーバー上にあります。これは機械学習の応用により慣性閉じ込め核融合モデルをより予測可能にするものです。素晴らしいです。

6年間彼らがこれを研究しているのがわかります。しかしもちろん、今どのように高価な実験モデルデータと大規模物理シミュレーションを組み合わせることができるかです。実世界の実験とその隣にあるデジタルツインをAIが行います。そして今AIが実験とデジタルツインを組み合わせ、制御しています。

これは本当に次のステップです。しかし彼らが既に6年間これに取り組んでいることがわかります。そしてもちろん彼らは一人ではありません。彼らはスーパーコンピューターを使ってLawrence Livermore国立研究所とこの話題で協力しています。素晴らしいです。

AI物理学の新たな段階

今日私たちが話していることは、そうです、ついに物理学のためのAIです。しかし科学においては少し正確であるべきです。これは大規模実験物理学です。私たちはここで巨大な機械で行う実際の実験のためにAIによって行われる研究プロセスを最適化しようとしています。AIが機械と予測のためのデジタルツインを制御し、次の実行で機械を最適化する方法を見つけます。だから私たちはAI実験のための直接的な実世界フィードバックを持っています。

あなたは「核融合実験でこれは良いアイデアなのか」と言うかもしれません。あなたの最後のビデオの一つで科学AIについて見せてくれたものがそれほどうまくいかなかったとき、これはCarnegie Mellon大学の研究でした。GoogleとStanfordによる共同科学者AIも、いくつかの制限があったかもしれません。あるいはSakana AIを見てください。これは2024年8月からです。もう1年前になります。

Los Alamos国立研究所の最新研究

これが今日の論文で、2025年6月末のLos Alamos国立研究所からのものです。すべての著者に感謝します。美しいです。彼らは実際の核融合研究のためのAI多エージェントシステムをどのように使用するかを示してくれます。そして彼らは言います、「私たちは能動的に科学を行うAIシステムを構築しようとしています」。これは魅力的なことですが、実世界の核融合レーザー核融合で核融合モデルについて科学を行うAIについて少し心配でもあります。

彼らは言います、「科学を行うシステムを構築しようとしながら、重要な科学アプリケーションでのエージェントの自律的使用において残るギャップを照らしています」。だから彼らは素晴らしいと言いますが、レーザー核融合では持ちたくないギャップもあると知っています。安全重要な科学アプリケーションでのAIエージェントの自律的使用にはですが、明確にしておくと、これはコードを書くことではありません。既に次のステップです。科学的方法そのものの自動化についてです。

実験、発見、結果についての推論、新しい仮説を持つ、新しいアイデアを持つ、それを定式化する、新しいパラメーター、新しいハイパーパラメーターで新しい実験を構築する、デジタルツインを実行する、この新しいアイデアをシミュレートする、そしてシミュレーションがうまくいけば、大きな機械に行ってリアルタイムでレーザー核融合実験を実行し、そしてループが再び始まります。

Ursaシステムの概要

2025年6月末の美しい実験だと思います。Ursa、そうです。Ursaはたくさんあります。これは別のUrsaの論文です。しかしこれは別のUrsaです。なぜ人々がUrsa という用語を愛するのかわかりませんが、私たちのUrsaはこれです。Universal Research and Scientific Agentで、他のUrsaではありません。素晴らしいです。

Los Alamosを見てみましょう。彼らは言います、「私たちはエージェントのコンセプトモデルを持っています」。そして私がここで紹介します。これは彼らの出版物からコピーされた元のスクリーンショットで、引用符で囲まれているのがわかります。これは本当に彼らの定式化です。なぜなら私があなたに言わなければならないことがあるからです。彼らはLangChainとLangGraphを使用しています

個人的に私はLangChainとLangGraphの使用を長い間やめました。私はこれの専門家ではありませんし、特にデバッグ体験とデバッグの優秀さについて長い間求めていた場合、これに対して特定の感情を持っています。しかし気にせず、これを見てみましょう。

エージェントアーキテクチャの詳細

LangGraphネットワークの観点での計画エージェントについて、彼らは言います。エージェントはバックエンドLLMを使用する3つのノード、計画生成器、レビューアー、フォーマライザーで構成されています。私たちのAIエージェントの使用方法に関する新しい方法論に、既にLangGraph構造の刻印が見えます。これは私が本当に快適に感じない部分かもしれません。なぜなら私は自分のソースで自由でありたく、絶対に創造的な何かを構築したいからです。LangChainやLangGraphや次に来るものを使用し、それらのシステムの構造的アイデアと構造的最適実装によって制限されるとは言いたくありません。

しかし、とにかくやらなければなりません。では行きましょう。

次に実行エージェントがあります。これはツールとしてPython関数を呼び出すという素晴らしいことです。追加ツールを追加するにはPythonラッパーを使用する必要があります。スーパーコンピューターがすぐ隣の廊下に立っていることを思い出してください。だから絶対にこれをデジタルツイン計算に使用してください。

少なくとも2つのツール。ワークスペースにファイルを書くツールと、実際の機械のためのシステムコマンドを実行するツールです。

次に研究エージェントがあり、彼らは可愛らしく言います。DuckDuckGoを通じたウェブ検索を利用し、ウェブコンテンツをスクレイピングして、与えられた問題を解決するための情報を収集し要約します。そして再び生成フェーズ、レビューフェーズ、要約フェーズで構成されています。

この3つのフェーズでどれほど多くのことが間違いに調整されるかご存知でしょう。

仮説立案エージェントと実際の応用例

そして興味深い部分は仮説立案エージェントです。仮説立案エージェントの目標は、ウェブ検索を利用し、与えられたユーザープロンプトへの可能な解決策を仮説立案するための美しい議論を行うことです。仮説立案エージェントと計画・研究エージェントの違いは、問題解決のための内部反復と出力の構造にあると彼らは言います。

そして再び、仮説立案器では私たちのソフトウェア実装の刻印が見えます。3つの内部サブエージェント:仮説立案生成器、批評家、競合者です。しかし、これで行きましょう。

そしてもちろん、科学文献へのアクセスが必要です。だからアーカイブエージェントがあります。わかりますね。

実世界の例を見てみましょう。これがまさに私たちがLos Alamosから来ている理由です。彼らは言います。データ準備ステップについて、これがAIシステムに与えるタスクです。「ワークスペースでCSVファイルと呼ばれるファイルを探し、Pythonファイルを実行してデータをPythonに読み込み、データを訓練とテストデータセットに分割し、特定の何かのために訓練データを可視化し、ガウス過程を適合させ、異なるニューラルネットワークを適合させ、適合の品質にアクセスし、2つのモデルの不確実性定量化にアクセスする」標準的なデータ準備です。

システムがそれを行う方法、彼らが説明する方法は素晴らしいです。彼らは問題を解決するためのステップバイステップ計画を生成する計画エージェントを持っています。複雑さを分離する方法が興味深いです。彼らは言います、計画エージェントによって生成された各ステップは、今度は細かい詳細を処理するために自分自身の特定のステップを複数のサブステップに分解するタスクを持つ別の計画エージェントに渡されると。

何が起こっているか見えますね。私たちは複雑さを分解し、より多くの複雑さを分解します。そして各サブステップは実行を実行するために実行エージェントに順次渡されました。実際には7つのフェーズがあります。環境設定とデータの存在の検証。データ前処理。ガウス過程の適合。ベイジアンニューラルネットワークの適合。予測能力の評価。不確実性定量化の評価。結果の要約とプレゼンテーション。かなり退屈でかなり古典的ですが、これを見てみましょう。

リアルタイム実験への応用

これは今実験です。これは今リアルタイム実験です。私は愛していると言います。「世界のどこかで新しい論文が発表されました。素晴らしい。二重シェル慣性閉じ込め核融合設計と考慮すべき関連物理学についてです。だから実験で機械に実装できる理論物理学の新しいアイデアがあります」そして彼らは言います。「その研究は何かのために行われました。そして今、特定のレーザー設定を使用して、レーザー施設でこの新しい設計で機械を動かすための新しい設計が必要です。あなたの目標、AIは、5つの層を持つ新しい実験のターゲット形状を計画し、スーパーコンピューターでHelios放射流体力学モデルを使用して提案された設計を評価し、シミュレートされた中性子収量を得て、これを動力学と統合することです」。

Heliosに馴染みがなければ、これは20テラワットCO2レーザー核融合施設で、1978年頃から長い間運用されていると思います。そうです、彼らは素晴らしいです。世界のどこかで新しい研究論文があり、「新しいアイデアがある」と言い、「機械がある」と言います。論文を見て、論文を理解し、この新しい研究論文の各条件を分析し、これを実世界の実験設定に翻訳できるかどうか見てみましょう。これを実世界にマッピングできるでしょうか? そしてそれを実行し、理論論文で提案された結果を本当に得られるかどうか見てみます。これです。

使用されるAIモデルと技術的詳細

彼らは仮説立案エージェントにO3 miniモデルを使用しています。貧弱ですが、今OpenAIと協力しているので、おそらく今は本当のO3を使用できるでしょう。少なくとも実行ロジックに本当に古いO1を使用しています。

私はアイデアを愛していると言わせてください。美しいです。これは本当に私たちが必要とするものです。フィードバックを得て学習し、記憶を発達させ、より良くなるために外部世界と相互作用するAI。自律システム、自己学習システム。絶対にアイデアを愛しています。

しかし、ここで実装方法に気づきました。最初に私は彼らの定式化にどこか苛立つ理由がわからなかったのですが、特定の与えられたフレームワークで実装し、これがLangChainとLangGraphを使用していると言うなら、研究の最先端で最先端ではないと感じるかもしれません。もう一歩進むことができると感じることがありますが、これが役立つかもしれません。これは計画エージェントからのコードブロック1を理解するのに役立ちました。

コードを見ると、特に実行エージェントで彼らが実際に何をしているかのより深い理解を得ました。彼らのスーパーコンピューター、彼らが研究室で構築した実験設計に特有のツール使用を行っている場合です。素晴らしい。そしてエージェントがあります。そうです、わかります。GPT-4 Vision Preview

仮説立案器では仮説、批評モデル、競合モデル、会話モデルがあります。素晴らしい。これをウェブ検索と組み合わせます。

O3 miniの内部推論能力に多く依存します。つまり、少なくともO4 mini highを使用してください。しかし、O3 miniと研究エージェントは、ここで言語レベルで組み合わせているものを見ると少し失望的です。

プロンプト構造と実装詳細

プロンプト構造について、私は彼らのプロンプトに本当に興味がありました。彼らは美しく透明で、異なる例を与えて、プランナー実行の最もシンプルなケースを言います。プランナープロンプトで「問題が与えられました。それを解決するためのステップバイステップ計画を策定する必要があります。タスクの複雑さを考慮し」、美しく「適切なステップ数を割り当てます」これは実際にはAIシステムの複雑性能力に依存していません。各ステップについて名前、説明、コードの生成と実行を指定します。

ツールへのアクセスが必要ですか? ステップの実行または期待される出力? これをどのように評価するか? データ収集、データ前処理、分析、モデリング、仮説、テスト、可視化、評価、検証などの多様な適切なステップを考慮してください。

実行者プロンプト。そうです。そして明確さ、完全性、関連性、実現可能性、効率性のための反省プロンプト。

テキストを保持し、すべてが通過すれば承認を得ます。素晴らしい。

研究・仮説・アーカイブシステム

研究仮説とアーカイブがある場合、はるかに興味深くなります。研究プロンプトは興味深いです。彼らは言います、「あなたはユーザーリクエストに対処するために正確で信頼できる関連情報をオンラインで見つけるタスクを負った経験豊富な研究者です。検索を開始する前に」、これはどういうわけかGraph RAGまたは何らかのRAGシステムに接続されていると思います。

彼らは推論RAG、マルチエージェント推論RAGを持っており、リクエストを明確に理解することを確実にします。これは絶対に重要です。そして次に言います、「以下のアクションを実行してください」。そして今テンプレートがあり、そのテンプレートは肯定的かつ否定的です。エージェントが実行すべき再現可能なステップがあることは素晴らしいですが、一方で知性をパターンに押し込む必要があるため制限的でもあります。

しかし最初のステップが1つまたは複数の特定の検索クエリを定式化するのは素晴らしいです。今、戻ってくる複数の検索結果をレビューします。使用した各データソースの品質、信頼性、最新性を評価します。任意のRAGシステムにとって非常にシンプルな問題です。発見を明確かつ簡潔に要約し、任意のRAGシステムにとって問題ありません。

一貫性のない、または矛盾する情報が生じた場合、それらの背後にある潜在的な理由や文脈を説明して、人間のユーザーにこれを明確に伝えます。O3 miniモデルがレーザー核融合実験を完全に新しいハイパーパラメーターセットで解決できると確信するまで、追加の検索を実行し続けます。

最終要約を提供します。素晴らしい。批評。もちろん、正確性、完全性を批評し、必要な厳密さのレベルを特定するここで構造化された評価を提供します。自動回帰次トークン予測システムには問題ありません。レーザー核融合での厳密さのレベル。

サポートされていない仮定を明確にリストします。O3 miniモデルには問題ありません。欠落している情報を特定します。アイデアが得られたと思います。

仮説では、エージェント1、2、3をお見せします。生成器プロンプト、批評プロンプト、競合プロンプトがあります。相互作用がありますが、すべて同じLLMなので、何を期待するのでしょうか? そしてアーカイブ。

画像なしで彼女がいます。素晴らしい。GPT-4 Visionを使用します。

最終的な洞察とセキュリティ懸念

最終的な洞察に来ましょう。ここで著者による引用があり、彼らはLangChainとLangGraphで動作していると言い、幻覚に対処すると言います。LangGraphでの私の時間から、デバッグが最も簡単なケースではなかったか、私がこれに対して十分知的でなかったかもしれません、申し訳ございませんが、彼らは言います。「幻覚はすべての人間LLM相互作用で問題ですが、長く複雑なワークフローでは幻覚を検出するのが困難になる可能性があります」そして彼らはLos Alamos実験について話し、それらの幻覚はすべての下流結果を無効にするのでしょうか?

そう、推測します。OpenAIモデルによる何らかの不正確な幻覚で数百万ドルのレーザー施設を起動すれば、これは興味深い実験になる可能性があります。そして彼らは言います、生成されたコード結果とデータが人間によって再現可能であることが非常に重要です。絶対に。

AIシステム内での推論の仕方を理解していない場合、因果推論チェーンでのステップバイステップロジックを理解していない場合、数百万ドルの機械を起動することはありません。何が起こるかわからないからです。

しかし私のビデオの最後で、いつも研究の正直さに時間を与えており、興味深いです。これを見てください。これは本当に最後の段落で、彼らは言います。「Ursaのような科学エージェントは現れ始めたばかりです。彼らが可能にするワークフローは、広範な研究情報を統合し、高度な推論で新しい概念を自律的かつ執拗にテストし反復します」。とても美しく聞こえます。彼らは科学的発見を劇的に加速することを約束しており、これは美しいです。

あなたが物理学者であれば、これがAIの主要話題です。しかし彼らは言います、「このプロセスは良くも悪くも重要な肯定的技術的および社会的変革の可能性を持っています。強力な能力は二重使用であり、重大な安全性およびセキュリティリスクを提示します」。これは興味深いです。

Los Alamosが突然安全性とセキュリティリスクについて話すとき、彼らは言います、「堅牢な監視とガードレールがなければ、これらのシステムは新しい破壊的技術を設計したり、違法活動を支援したりするために悪用される可能性があります」。これは奇妙な文です。研究論文の最後では。

さらに、著者は言います、「それらの開発は古典的なゲーム理論的ジレンマを導入します。エージェントAIの追求はセキュリティリスクを伴いますが、そうしないことは潜在的な軍拡競争で技術的に大幅に遅れるリスクを冒します」。

これは何を意味するのでしょうか? 彼らは理論的に他の誰かより技術的に遅れないためだけに競争すべきなのでしょうか? このセキュリティリスクを取る価値があるのでしょうか? なぜ彼らはLos Alamos国立研究所による出版物でセキュリティリスクをこれほど大規模に扱っているのでしょうか?

これについて考えがあれば、コメントは開いています。

この研究の肯定的側面と今後の課題

この論文の肯定的な側面は、彼らが本当に典型的な人間研究者の核心的創造的および分析的タスクに取り組もうとしていることです。そこで働いたことがあれば、私は働いたことがあります。この部門ではありませんが、一般的に科学で。これは困難な生活です。仮説立案、計画、巨大な機械での実験。

実験をセットアップするのに何日も何週間も働きます。5秒でそれを実行します。すべて完了です。そして行って、生成したデータを理解する必要があります。間違いから学びます。さらなる反復があります。そしてこれは長く長く退屈な概念です。科学的発見

これらのプロセスを加速するためにAIを使用できれば、素晴らしく、美しく、驚くべきです。しかし特に彼らがここでAIケアについて話し、核融合でのセキュリティリスクについて話す場合、エージェントを実装する方法でもう少し注意深く、遭遇する可能性のあるセキュリティリスクを認識してください。

このビデオ形式を楽しんでいただけたら、なぜ購読しないのですか?

コメント

タイトルとURLをコピーしました