本動画は、Google DeepMindとOpenAIという世界最高峰のAI研究所が発表した、AIによる科学的発見の最前線について解説したものである。これまでAIが得意としていたのは既知の問題のパターンマッチングであったが、最新のモデルであるGemini DeepThinkやGPT-4o(動画内言及の次世代モデル含む)は、未解決の数学的推測の証明や理論物理学における新たな数式の導出など、真の意味での「科学研究」を行い始めている。AIが単なる補助ツールから、人間の知性を拡張し、未知の領域を切り拓くメインドライバーへと進化する転換点について詳述している。

AIによる科学的進歩の新たな幕開け
私の研究室では、半導体の新設計にDeepThinkを活用していますが、その結果は素晴らしいものです。これまでにない最高の成果を求めて、私たちは研究を続けています。
ここ一週間ほどの間に、世界トップクラスのAI研究所のうち二つが、数年前ならおよそ信じられないような発表を行いました。それは、彼らのAIシステムが今や科学の最前線を押し進める助けになっているという主張です。OpenAIは、GPT-5.2(仮称)が理論物理学において新しい知見を導き出したと述べており、一部の物理学者はこれがAIによる科学的知識の進展を示す初めての本物の例になるかもしれないと考えています。
一方でGoogle DeepMindは、Gemini DeepThinkが数学と科学の両方で発見を加速させていると発表しました。ここで疑問が生じます。私たちは今、AIが本物の科学を始める瞬間を目撃しているのでしょうか。それとも、既にあるデータから非常に印象的なパターンを見つけ出しているに過ぎないのでしょうか。今日はこれら両方の主張を分析し、専門用語を排して何が起きたのかを明らかにしていきます。この一週間が歴史的な転換点だったのかどうか、最後にご自身で判断してみてください。
Gemini DeepThinkと数学研究エージェント「Althia」
まずはGemini DeepThinkから見ていきましょう。Googleによれば、実際の数学者や科学者の指導の下、Gemini DeepThinkは数学、物理学、コンピュータサイエンスにわたる専門的な研究課題を解決しているといいます。
背景を説明すると、2025年夏にはGemini DeepThinkのアドバンス版が、世界で最も難しい大学生向け数学競技会の一つである国際数学オリンピックで金メダルレベルの成績を収めました。その直後、更新版のモデルも国際大学対抗プログラミングコンテストで金メダルレベルのパフォーマンスを見せています。
これまでGemini DeepThinkは驚異的な成果を上げてきましたが、それはあくまで「解決済み」の数学、つまり構造や答えが分かっている競技形式の問題に限られていました。しかしGoogleは、ここからが本当の変化の始まりだと言います。なぜなら、研究レベルの数学は全く別次元のゲームだからです。
オリンピックの問題は確かに猛烈に難しいですが、自己完結しています。対して、研究数学は膨大な文献に散らばった手法を必要とし、問い自体もオープンエンドです。Googleは、基盤モデルが広い知識を持っていても、未解決問題のようなデータが不足している分野では、理解が表面に留まったり、ハルシネーション(幻覚)を起こしたりすることが多いと指摘しています。
これを解決するため、彼らは内部で「Althia」と名付けられた数学研究エージェントを構築しました。これは最新のGemini DeepThinkモデルを搭載しています。このエージェントの特徴は、自然言語の検証器を備えていることで、解答案の欠陥を特定し、生成と修正を繰り返すプロセスを可能にしています。また、問題を解決できない場合には、自ら失敗を認めることもできます。
さらに、複雑な研究を調査するためにGoogle検索やウェブブラウジングを使用し、論文を統合する際の引用ミスを防いでいます。ワークフローとしては、まず研究上の問いを入力し、モデルが解決策や証明案を生成します。それが即座に検証器に送られ、論理的な欠陥がないかチェックされます。不備があれば修正し、再びチェックに回す。このループを、検証を通るか、あるいは解決不能と判断するまで繰り返します。この過程で実際の論文を参照し、推論の根拠を固めていくのです。
本物の研究成果と「アドバイザーモデル」
では、実際のパフォーマンスはどうでしょうか。オリンピック数学と博士課程レベルの数学のベンチマークにおいて、この新しい研究エージェントは、Gemini DeepThinkの最大計算時を上回るだけでなく、より少ない計算リソースでそれを達成しました。つまり、難問を解く能力が高いだけでなく、効率も向上しているのです。
驚くべきはベンチマークのスコアだけではありません。Althiaはすでに実際の研究に貢献しています。あるケースでは、算術幾何学というニッチな分野で特定の定数を計算する論文を、完全に自律的に生成しました。また別のケースでは、独立集合と呼ばれる相互作用系の境界を証明するために研究者がモデルを活用しました。
さらに、数学の未解決の予想を集めたデータベースにある700のオープンな問題に対してシステムを走らせたところ、驚くべきことに、そのうちのいくつかを自律的に解決してしまったのです。その中の一つ、「Erdős 1050」と呼ばれる問題の解決は、さらなる一般化につながり、実際の研究論文として発表されました。
Googleは生成された解決策を、自律的なもの、人間とAIの共同作業、人間主導の3段階に分類し、さらに新規性のレベルを0から5(歴史的画期的発見)まで評価しています。今のところ、最高レベルは「レベル2(出版可能な研究)」で、その中には完全に自律的なカテゴリーのものも含まれています。これは単なるベンチマークを超えた、現実の研究が行われている証拠です。
分野を超えた構造化されたコラボレーション
この取り組みは純粋数学に留まりません。Gemini DeepThinkはコンピュータサイエンスや物理学でも活用されています。これらの分野では完全な自律性ではなく、「アドバイザーモデル」と呼ばれる構造化されたコラボレーションが採用されました。人間がAIを導きながら、アイデアの提案、テスト、洗練のサイクルを繰り返す手法です。
バイアスを避けるために一つの事柄を同時に「証明」と「反証」の両面から考えさせたり、コードを使って手順を自動検証したりといった工夫がなされています。ここではAIの自由な探索を認めつつ、構造化された推論プロセスと、自動チェックおよび人間による検証というフィルターを通しています。
その結果、アルゴリズム、機械学習理論、最適化、経済学、物理学など18の異なる研究課題において、このシステムは長年のボトルネックを解消する助けとなりました。中には、10年以上信じられてきた仮定を覆す反例を見つけたり、全く異なる数学分野の技術を組み合わせてコンピュータサイエンスの古典的なパズルを解いたりした例もあります。物理学では、宇宙ひも(cosmic strings)に関する複雑な方程式を簡略化する新しい方法を見つけ出しました。
Googleは、AIが科学を自律的にすべて完結させているとは言っていません。しかし、AIが科学的プロセスの意味のある参加者になり始めており、専門家が最前線を押し進めるための「知性の倍率器」として機能しているのは確かです。研究者を置き換えるのではなく、加速させているのです。
OpenAIとGPT-5.2による物理学の進展
Googleの成果も印象的ですが、OpenAIからの発表は、AIが本物の科学を行っているというさらに強力な証拠かもしれません。彼らによれば、GPT-5.2は、強い核力を媒介する粒子である「グルーオン」に関わる理論物理学の新しい知見を導き出す助けになったといいます。
簡略化して説明すると、素粒子物理学には「散乱振幅」という、粒子がどのように相互作用するかという確率を計算するための数学的道具があります。特定のグルーオンの構成において、これまでの教科書的な前提では、ある条件下での相互作用は「ゼロ」である、つまりその相互作用は起こらないとされてきました。
しかし今回の論文では、その前提が完全には正しくないことが示されました。特定の条件下では、その値はゼロではなく、相互作用が存在するのです。これは新しい粒子を発見したり物理学を書き換えたりするような大発見ではありませんが、長年使われてきた計算の簡略化に対する重要な修正です。
ここでGPT-5.2がどのように貢献したのかが重要です。人間の研究者がまず少数の粒子の場合を手計算しましたが、数式は猛烈に複雑でした。そこでGPT-5.2 Proがその数式を劇的に簡略化しました。そこからモデルはパターンを見抜き、すべてのケースに当てはまる一般的な公式を推測したのです。
その後、内部の足場固めがなされたバージョンのGPT-5.2が約12時間をかけて問題を推論し、正式な証明を作成しました。その証明は、物理学の標準的な整合性チェックによって検証されました。モデルは単に推測したのではなく、複雑さを軽減し、構造を特定し、公式を提示し、物理学者が独立して検証可能な証明を生成するのを助けたのです。著名な物理学者たちも、これを理論物理学を純粋に進展させる「ジャーナル(学術誌)レベル」の仕事であると評価しています。
科学のメインドライバーへと向かうAI
AIはまだ壮大な物理学の難問をすべて解決したわけではありませんが、自ら本物の科学研究を行い、専門家が正しいと認める証明を作り出しました。これがAIによる科学研究の真の第一歩なのか、それともAI研究所による過剰なアピールなのか。
これまでもGPT-5が未解決問題を解いたという噂が流れては、正確ではなかったことがありました。しかし、今回は雰囲気が違います。Google DeepMindとOpenAIの研究部門が、トップレベルの専門家の支持を得て公式声明を出しており、その主張も決して大げさすぎるものではありません。
これらのシステムは、今後さらに多くの計算資源、長い推論時間、優れたツール、そして実際の研究者とのワークフローへの接触を通じて進化し続けるでしょう。AIが単なる「補助役」から、科学の「主導者」へと変わるのは、もはや時間の問題かもしれません。
皆さんはどう思われますか。AIが科学を前進させ始めたと確信しますか。ぜひ意見を聞かせてください。


コメント