Googleがついに数学AGIを達成

Google DeepMindが開発した数学研究AI「Althia」が、人間の数学者たちが何年も解けなかったPhDレベルの未解決問題6問を独力で解決した。これは国際数学オリンピックでの金メダル獲得よりも重要な成果とされ、数学領域における実質的なAGI到達を意味する。Althiaは既知の技術を応用するのではなく、長期間にわたる推論を通じて新たな数学的構造を発見し、行き詰まった探索経路を放棄しながら正しい証明を生み出す。特に問題7では16倍もの計算リソースを投じて2つの異なる証明を構築し、専門家からも驚きの声が上がった。同時期にGoogleは再生可能エネルギーで稼働する大規模データセンター計画を発表しており、長期推論AIの持続的運用に必要なインフラ整備を進めている。

Google Just Achieved Mathematical AGI

This month, AI crossed a line many believed would hold for decades. Google DeepMind revealed an AI system that independe...

数学AIの決定的ブレークスルー
研究最前線の問題を解く
Althiaの革新的アプローチ
問題7の驚くべき解法
その他の解決された問題
数学研究の新時代
持続可能なAIインフラ
AIと持続可能性の交差点

数学AIの決定的ブレークスルー

長い間、AIがすぐには越えられないと信じられていた一線がありました。それは言語でもなく、創造性でもなく、数学でした。その一線がついに破られたのです。

Google DeepMindは、人間の数学者が何年も行き詰まっていたPhDレベルの未解決数学問題を独力で解くAIを構築しました。このAIは独立して未解決問題を探索し、長い思考の連鎖を推論し、行き詰まった道筋を放棄して、新しい正しい結果を生み出します。これは数学AGIの到来を示すものです。人類がこれまで創り出した最も困難な領域の一つで新しい構造を発見できる知性の誕生です。

GoogleはAlthiaと呼ばれるAI研究エージェントを構築し、世界クラスの数学研究問題6問を独力で解きました。これらは現代数学の活発な研究領域から提出されたPhDレベルの未解決問題で、「First Proof Challenge」と呼ばれるものの一部でした。

この成果は、DeepMindの研究者たち自身によって、国際数学オリンピックで金メダルを獲得するよりも重要であると評されています。問題の性質を理解すれば、この評価は決して大げさではありません。

研究最前線の問題を解く

国際数学オリンピックは、既知の技術を巧妙な方法で使って、時間的プレッシャーの下で極めて難しい問題を解くことが求められます。First Proofは違います。

これらの問題は研究の最前線に位置しています。場合によっては、地球上でその問いを完全に理解している人が数十人しかいません。既知の解法経路はなく、適用できる標準的な道具箱もなく、解が存在する保証すらありません。

今回のチャレンジでは合計10問が出題されました。Althiaはそのうち6問を、解決プロセス中に人間の介入を一切受けることなく、公式提出期限内に完全に正しく解きました。

それだけでも衝撃的ですが、数学コミュニティからの反応は、これがまったく次元の異なる何かであることを明確にしました。問題7として知られる問題の一つは、何年も未解決のままでした。この分野の専門家によれば、他のどのAIシステムも近づくことすらできませんでした。

Althiaはそれを解いただけではありません。非常に明快な解を生み出したため、元々この問題を提案した数学者が個人的に推論の正しさを確認しました。

そしてテレンス・タオが、存命の最も偉大な数学者の一人として広く認められている人物ですが、インタビューでさらりとAIが自分のジュニア共著者になったと述べたのです。この一文は立ち止まって考える価値があります。

Althiaの革新的アプローチ

Althiaは具体的に何が違うのでしょうか。これはたまたま数学を知っているチャットボットではありません。AlthiaはDeepMindのGemini 3 Deep Thinkシステムをベースに構築された長期展望型研究エージェントです。

長期間にわたる持続的な推論を必要とする問題に取り組むよう設計されており、その過程で何千もの失敗した試みを経験します。DeepMindは実際に、わずかに異なる基礎モデルに基づく2つのバージョンのAlthiaを実行し、それらの出力をクロスチェックしました。

両者を合わせて、問題2、5、7、8、9、10を解きました。残りの4問は解けませんでした。この詳細は、聞こえる以上に重要な意味を持っています。

ほとんどのAIシステムは、もっともらしく見える何かを喜んで捏造します。カジュアルな使用には問題ありませんが、数学においてはこれは災厄です。説得力があるが間違った証明が一つあるだけで、人間の専門家の数ヶ月を無駄にする可能性があります。

DeepMindはこの問題に対処するため、Althia内部に常に衝突する2つの役割を設計しました。一方は生成者として機能し、積極的にアイデア、戦略、推測的な解法経路を提案します。もう一方は検証者として機能し、その唯一の仕事はそれらのアイデアを攻撃し、すべての論理的ステップをチェックし、完璧に成立しないものはすべて拒否することです。

システム内部では、これら2つが基本的に絶え間なく議論しています。そしてここが重要なポイントです。Althiaが問題を解けなかったとき、はったりをかましませんでした。

未解決の4問について、明示的に「解が見つからない」と報告するか、制限時間が切れたときに沈黙を保ちました。この節度は制限ではありません。高度な研究においては、これは機能なのです。

DeepMindは論文でこれを直接述べています。ナンセンスを決して生み出さないことの代償として、いくつかの問題を解く能力を犠牲にすることを厭わないと。

問題7の驚くべき解法

では問題7に焦点を当ててみましょう。ここで事態は本当に不穏になります。問題7は代数的位相幾何学と微分幾何学の交差点に位置しています。

簡略化すると、ある種の離散群が、その普遍被覆に厳格な条件を課した状態で、コンパクトで境界のない多様体の基本群として現れることができるかを問うています。この一文だけで、ほぼすべての人がふるい落とされます。

それでもAlthiaは、この質問に答えただけでなく、答えがノーであることを2つの完全に異なる方法で証明しました。

最初の証明は、そのシンプルさにおいてほぼ衝撃的です。普遍被覆が有理的に非巡回的であるという仮定を使って、Althiaは位数2の群元に関連するレフシェッツ数を計算しました。

議論の一方では、その数はゼロでなければなりません。他方では、群作用が自由で固定点を持たないため、レフシェッツ数はゼロでなければなりません。不可能な等式に行き着きます。0が±1に等しい。矛盾です。終わり。

この証明が実際にどれだけ少ない構造しか使っていないかが驚異的です。問題の特定の幾何学に大きく依存していません。実際、問われたことよりも強いことを証明しています。ねじれ要素を含む離散群は、この設定では一切機能しないのです。推論の連鎖は短く、明快で、容赦ありません。

2番目の証明は反対の方向に進みます。幾何学に完全に寄りかかります。Althiaは普遍被覆から群に関連する対称空間への同変写像を構築します。

そして両側のレフシェッツ数を比較します。普遍被覆上では群作用が自由なので、レフシェッツ数は消えます。対称空間上では、カルタン不動点定理が不動点の存在を保証し、レフシェッツ数をゼロでなくします。

異なる道具、同じ矛盾、同じ結論です。ある専門家はこれを、AIが複数の深い定理を自然に組み合わせるのを見た初めてのケースだと評し、つぎはぎされたり無理に作られた感じがしないと述べました。

そしてこれは安上がりではありませんでした。この1問を解くために、Althiaは昨年DeepMindがIMO 2024の問題を解くために使った推論予算の16倍を使用しました。これは運ではありません。持続的な探索、失敗、後戻り、そして粘り強さでした。

DeepMindは時間経過に伴う推論コストを視覚化さえしており、システムが繰り返し行き詰まりに達し、経路を放棄し、それでも続けた様子を示しています。これは研究行動です。

その他の解決された問題

Althiaが解いた他の問題も同様に深刻なものでした。一つは数論と表現論から来たもので、非アルキメデス局所体上の行列群を含んでいました。

目標は、すべての対表現にわたって特定の積分が決して消えないことを保証する普遍的なウィッテカー関数の存在を証明することでした。

Althiaのアプローチは巧妙でした。まず、積分領域をコンパクト集合に圧縮する特定のウィッテカー関数を選び、問題から複雑なパラメータ全体を排除しました。

これにより、問題は有限次元の汎関数がゼロになり得るかという問題に還元されました。次に矛盾のために積分がすべての表現に対して消えると仮定しました。

有限フーリエ解析を使って、これが表現にその導手が許すよりも大きい部分群の下での不変ベクトルを持たせることになり、導手の定義自体と矛盾することを示しました。矛盾により証明が閉じます。

鍵となる洞察は、そのウィッテカー関数の最初の選択でした。一つの決定が問題を単純化し、不要な変数を取り除き、矛盾を設定しました。人間の数学者たちは、これを通常何年もの経験から来る種類の動きとしてすぐに認識しました。

これらすべては公開されて文書化されています。DeepMindは完全な論文をarXivに公開し、失敗した試みや誤った経路を含む完全なインタラクションログをGitHubにリリースしました。洗練された最終結果の背後に隠れることはありません。

数学研究の新時代

そしてここで、より大きな含意が浸透し始めます。これは明日AIが数学者を置き換えるということではありません。一部の研究者が数学研究の手作業時代の終わりと呼んでいるものについてです。

何世紀もの間、進歩は人間が手作業でアイデアを前に進めることに依存しており、時間、注意、認知的帯域幅によって制限されていました。Althiaのようなシステムは疲れません。悪いアイデアに感情的に執着しません。証明が現れるか予算が尽きるまで、ただ研ぎ続けるだけです。

さて、ほとんどの人が話していない方法で、物事がつながる場所があります。この発表と同時に、Googleはミネアポリス南部に大規模な新しいデータセンター複合施設の計画も明らかにしました。

この施設は完全に再生可能エネルギーで稼働し、Googleが世界最大のバッテリー貯蔵システムと呼ぶものに支えられます。これは標準的なリチウムイオン構成ではありません。

持続可能なAIインフラ

このプロジェクトは1.4ギガワットの風力、200メガワットの太陽光、そして最大100時間連続で電力を供給できる300メガワットの鉄空気バッテリーシステムを組み合わせています。4日以上の連続電力です。

バッテリー技術はForm Energyから来ており、可逆的な錆プロセスを通じて機能します。バッテリーが放電すると、鉄が酸素と反応してエネルギーを放出します。充電すると、プロセスが逆転します。

4時間から8時間の貯蔵を提供する典型的なグリッドバッテリーとは異なり、このシステムは数日間のイベント用に設計されています。Googleの目標は、従来のベースロードエネルギーのように振る舞う電力供給を作ることですが、化石燃料や原子力発電所に匹敵しながらも、排出がないものです。

Pine Islandプロジェクトは、ミネソタ州のClean Energy Accelerator Programの下で運営され、Googleが住民にコストを転嫁することなく再生可能エネルギーミックスを選択できるようにします。

Form Energyはその役割に対してほぼ10億ドルを受け取る見込みで、これはハイパースケール企業がこの規模で長期バッテリー貯蔵にコミットした初めてのケースとなります。

Form EnergyCEOのマッテオ・ジャラモは、2017年に退社する前にTeslaでVPを務めていました。彼はこれが重要である理由について非常に明確にしています。短期バッテリーは日々の変動を平滑化します。長期貯蔵はグリッド全体を変えます。

100時間という数字は恣意的ではありません。通常4日から5日続く極端な気象イベントのモデリングに基づいています。このような貯蔵がなければ、再生可能エネルギーを大幅に過剰に建設するか、化石燃料のバックアップに依存するかのどちらかです。

Formは今年、ウェストバージニア州に最初の大規模工場を開設し、2028年までに年間500メガワットの製造能力に拡大する計画です。彼らはすでにミネソタ州で1.5メガワットプロジェクトに最初の100時間システムを設置しており、カリフォルニア、コロラド、ジョージア、バージニア、ニューヨーク、メイン州全体で追加プロジェクトが計画されています。

ビジネス的な角度もあります。ジャラモは、需要、技術、製造能力がついに整合するにつれて、会社が比較的すぐに上場する可能性が高いと述べています。