「Grok 4.20が数学の壁を破った」数学的推論における自動定理発見の新時代

xAIが開発したGrok 4.20が数学研究において画期的な成果を達成した。UCI数学教授が取り組んでいた確率論的問題に対し、わずか5分で新しいベルマン関数を発見し、従来の研究が段階的に到達していた限界値を大幅に上回る「鋭い下限」を提示した。これは単なる数値計算ではなく、人間が検証可能な明示的な数式として提供された点で、ブラックボックスではない透明性の高い発見である。同時期にGPT-5.2もエルデシュ問題の解決に成功するなど、複数の最先端AIモデルが自動定理発見の能力を獲得しつつある。イーロン・マスクはOpenAIに対する訴訟を進めており、予測市場では勝訴確率が上昇している。さらにxAIは国防総省(戦争省)との提携を発表し、イデオロギー的制約のないAIとして軍事分野での活用が期待されている。Grokの新モデルがLM Arenaでテストされており、AI開発競争は新たな局面を迎えている。

GROK 4.20 cracked the code

Grok 4.20 comes up with a Bellman function according to UCI.Elon's lawsuit against OpenAI is going to court.xAI joins US...

Grok 4.20による画期的な数学的発見
崖の端における確率的問題の視覚化
Grokが導き出した鋭い下限
従来手法を飛び越えた解法
自動定理発見の意義
テレンス・タオと数学界の反応
自動定理発見の時代の幕開け
Grokの急速な進化
イーロン・マスクの戦略的展望
OpenAI訴訟の行方
感情的な過去のやり取り
国防総省との提携
新しいGrokモデルのテスト
イーロン・マスクの戦争準備
イデオロギー的制約のないAI
今後の展開

Grok 4.20による画期的な数学的発見

2026年に入り、AI開発の勢いは止まりません。少し休憩があったものの、今や特異点へと滑り込んでいる状況で、今日はイーロン・マスクが攻勢に出ています。イーロン・マスクとxAI、そしてOpenAIとの訴訟など、多くのことが進行中です。また、戦争省との新しい提携もあります。そう、今は戦争省と呼ばれているんです。

これらについては後ほど触れますが、まずはこの速報から始めましょう。発音を間違えたら申し訳ないのですが、パタ・イヴァニさんという方がいます。カリフォルニア大学アーバイン校の研究者で、Grok 4.20の初期内部ベータバージョンを持っていました。この方はUCIの数学教授で、プリンストン大学の元ポスドクであり、AIが数学において何ができて何ができないかを探求している方です。

彼が言うには、Grok 4.20が学生と一緒に取り組んでいた問題の一つについて、新しいベルマン関数を発見したとのことです。その後、彼は多くの専門用語を書き連ねていますが、その中にはあなたが知っているものもあるかもしれません。本題に入る前に、彼らが話していることを非常に簡略化したバージョンをお伝えしましょう。

崖の端における確率的問題の視覚化

こんな崖があると想像してください。この辺りは走り回れますが、端を越えると奈落の底に落ちてしまいます。つまり、この範囲内にいれば安全ですが、端を越えると死んでしまうわけです。これが崖で、これが崖の端です。

さて、ここに何か野生の狂乱した動物を放すとします。それはランダムに走り回ります。動く速さは分かっていますが、どこに向かうかは全く分かりません。崖から落ちるかもしれないし、別の方向に走っていくかもしれません。

あなたの目標は、どんなランダムな動きをしても、決して崖から落ちないことを証明することです。無限の経路をシミュレートすることもできます。基本的に、この動物が取りうるあらゆる可能なランダムな経路です。そして人間は通常、直感を使います。ただ推測するんです。見積もるわけです。

つまり、この範囲内にいる限り安全だろうという感じです。この範囲内にいれば99%安全だと確信できる。崖から落ちることはない。もし私が彼の言っていることを正しく理解しているなら、それが彼らがここでやったことです。この安全地帯を含む公式を作り、そこにいればかなり確実だというわけです。

Grokが導き出した鋭い下限

しかし、Grok 4.20は5分間作業した後、明示的な公式を生み出しました。それがここで話されているものです。しかし要点はこうです。彼はこれが鋭い下限を与えると言っています。鋭い下限です。これが何を意味するかというと、Grokは基本的に実際の崖に非常に近い線を引くことができたということです。

一方、人間の数学者は、すべてが大丈夫なように安全地帯を設けます。つまり、崖からかなり離れたところに線を引いて、余裕を持たせるわけです。正確な場所が分からないので、確実だと思われるこの辺りに線を引きます。Grokは鋭い境界を描きました。つまり、実際の崖に非常に非常に近いところに線を引いたのです。

そして下の方で、彼はこうも言っています。以前知られていた最良の下限はこれでした。それから彼らの論文ではこれを得ました。そしてこのGrokのベルマン関数は実際に鋭いものです。

もし私の狂った豚と運命の崖の例が気に入らなければ、山を想像することもできます。最初の研究者がゆっくりと山を登り、この地点に到達して「この山は少なくとも2000フィートだ」と言いました。それから彼らはゆっくりと山を登り続けて「実際には少なくとも3000フィートだ」と言いました。つまり、ゆっくりと登っていき、どこまで登ったかに基づいて、少なくともこの高さはあると言えるわけです。そこまで到達したのだから。

従来手法を飛び越えた解法

さて、Grok 4.20がやったことはこうです。魔法のようにテレポートしたんです。ただ現れたんです。山の頂上にテレポートして「いや、実際には4000フィートだ」と言ったわけです。つまり、山を這い上がって「少なくともこの高さだ、いやこの高さだ」という苦労のプロセスを経る代わりに、そういうことをしないんです。ただ頂上に現れて、数字を教えてくれるんです。

では、Grokはどうやってこれをやったのでしょうか。答えはもちろん、ここにあります。自分の目ではっきり見ることができます。皆さんにとって完全に明白だと確信しています。完全に冗談ですよ。世界で本当にここで何が起こったかを理解している人はほんの一握りでしょうが、私に飛び込んできた一つのことは、これがブラックボックスの解決策ではないということです。

ニューラルネットワークは、一種のブラックボックスとしてよく批判されてきました。一方の端にデータを押し込むと、もう一方の端から答えを吐き出すけれど、どうやってその答えにたどり着いたのか全く分からない。だから、ある意味恐ろしいブラックボックスなんです。でも、この発見は言わばガラスの箱のようなものです。なぜなら、Grok 4.20が公式を考え出したからです。

私たち人間は今、これを検査できます。まあ、全員ができるわけではありませんが、これが何なのか分かる一部の人たちは、検査して、理解して、なぜ機能するのかを理解できます。彼らはそれについて論文を書くことができ、この主題の理解にさらに貢献できるわけです。

自動定理発見の意義

教授がここで言っているように、この結果の意義として、明日どのように世界を変えるかは教えてくれません。むしろ、微分の確率的類似物の平均、ブール関数の二次変分がどれほど小さくなりうるかという、何が起こっているのかを理解するための小さな一歩を与えてくれます。

多くの人が言葉遣いに戸惑うと思います。実際、最初のコメントまでスクロールすると「数学は全く理解できないけど、これは重要な気がする」とあります。次のコメントは「何を言ってるんだかわからないよ」というものです。

彼がここで言っているポイントはこうです。この全体を「人間がまだ理解していない数学」だと考えてください。彼は、この場合Grok 4.20が、私たちがまだ完全には理解していない数学を理解するための小さな一歩を与えてくれると言っています。

これが何を意味するかというと、これは信頼できる報告だということです。非常に信頼できる機関の研究者です。つまり、Grok 4.20が自動定理発見が可能であるという信頼できる報告なのです。話を追っていればお分かりでしょうが、Grok 4.20が最初ではありません。しかし、最近これらの能力を獲得しつつある世界最高の基盤モデルの最前線に非常に近いところにいます。

テレンス・タオと数学界の反応

こちらはテレンス・タオで、多くの人から世界で最も才能のある、ナンバーワンの数学者と考えられています。数日前、彼はこれをMathtodonに投稿しました。Mastodonだと思っていたら、Mathtodonなんです。数学のMathtodonです。

彼は最近、AIツールの応用がマイルストーンを通過したと言っています。具体的には、これはエルデシュ問題と呼ばれるものに対してです。1000以上の非常にユニークで興味深く挑戦的な問題があり、それらはユニークで興味深く挑戦的などであるように厳選されています。

彼は最近、AIがこれらのエルデシュ問題の一つをほぼ自律的に解決したと言っています。問題の精神に沿った明瞭な方法で、つまりどのように解くべきかという方法で解決し、彼らが与えた結果は既存の文献では再現されていません。彼がこれを投稿して以来、他にも複数の問題が解決されています。

こちらはニール・スマニさんです。前回、彼がシタデルの定量研究者だと言ったと思いますが、彼は以前そうだったと言っています。混同してしまい申し訳ありません。現在は形式手法と機械論的解釈可能性に取り組んでいます。つまり機械学習、AI、AI安全性の分野にいます。

週末に彼はGPT-5.2 Proを使って、このAIシステムによって生成された別の解法を、特にエルデシュ問題の397番に提出しました。他にも多数あります。

自動定理発見の時代の幕開け

これが意味することは、非常に最近、おそらくこの数ヶ月以内に、非常に重要な閾値を越えたということです。これは自動定理発見と呼ばれる、またはこの用語を使うことができると思いますが、AIが独自に定理を発見するということです。

タオは、ほぼ自律的だったと言っています。イヴァナ・チリ教授からの最初の試みからのフィードバックはいくらかありました。彼が述べているところによると、自律的だったように聞こえます。つまり、新しいベルマン関数を見つけたわけです。そして確かにここで起こっているように見えます。彼らはこれを与えて、5分15秒考えて、そしてブームです。

これが自動定理発見の前だとすると、これが後です。GPT-5.2は今、大きな話題になっています。なぜなら、その閾値を越えたことを示すように見えるいくつかのことがあるからです。これは実際のものではありませんが、私が言っているのは、過去にはこのような例がなかったのに、今はこのような例があるということです。

また、GoogleのDeepMindのAlpha Evolveも何かあったと思います。発表されたのは見ましたが、まだ詳しく見る機会がありませんでした。しかし、それも全体的なシステムのようなものです。大規模言語モデルにスキャフォールディングや他の多くのものが構築されているようなAIシステム全体です。

一方、GPT-5.2はチャットボットだけでこれらの問題を解決しているように聞こえます。Grok 4.20も、これらのことを解決しているのはチャットボット自体だけのようです。

Grokの急速な進化

そして、それほど昔のことではありません。これらすべては過去数ヶ月の間に起こりました。GPT-5.2について話しているのは2週間未満前のことです。そして今、ブームでGrokが突進してきます。Grok 4.20が突進してきます。目がぼやけているわけでもなく、眠いわけでもありません。全く違うエネルギーがあります。おそらく他にも多くの例があるでしょう。

実際、テレンス・タオはAIが達成できた様々なことのリストを持っています。どんな証明を書けたか、改善できたかなど。

こちらはホアン・メイさんです。元GoogleのDeepMindで、現在はxAIでAGIを構築しています。彼は、宇宙を理解するために、私たちはGrokの数学的推論を推進することに全力を注いできたと言っています。その進歩が数学コミュニティに認められ、実際の影響を与えているのを見るのは、深く報われる思いです。

また、xAIのチームは科学的発見のためにGrok 4.20への早期アクセスを提供しているようです。科学的発見のために使いたい場合、パスをもらえる可能性があるようです。

イーロン・マスクの戦略的展望

イーロン・マスク氏は、デジタル超知能にはNeuralinkは必要ないと言っています。なぜなら、AIは脳インプラントなしで先にそこに到達するからです。Neuralinkの本当の価値は、私たち自身の帯域幅を向上させることにあります。なぜなら、私たちの日々のアウトプットは機械と比べて信じられないほど限られているからです。

確かに考えてみれば、私たちは言葉であれ手話であれタイピングであれ、コミュニケーションの方法に基づいて非常にレート制限されています。考えるのはコミュニケーションするよりもずっと速い傾向があります。思考の速度でAIとコミュニケーションできたら素晴らしいでしょう。

時々、GeminiやChatGPTやGrokに何か書き込むと、スペルミスがたくさんあります。いくつかの単語が正しく見えないし、思考がかろうじて完成しているような感じです。思いついてキーボードを叩いてエンターを押しただけだからです。でも最近のほとんどの場合、彼らは理解してくれます。

一週間後に私が書いたものを見せられても、私自身が書いたものを理解できないでしょう。でもこれらのAIモデルは「ああ、それは明確だよ。何を言いたいか正確に分かる。説明してあげよう」という感じです。

OpenAI訴訟の行方

他のニュースでは、イーロン氏のOpenAIに対する訴訟が裁判にかけられるようです。Kalashiがイーロン氏が勝つかどうかに賭けを取っています。イーロン氏が勝つ確率が30%未満で始まりました。すぐに31、それから36になりました。今は41%まで上がっています。

イーロン・マスク氏はリツイートして「長年いくつかの戦いには負けてきたが、戦争に負けたことはない」と言っています。それ以来、数字は60%まで上がったようです。人々はイーロン氏がOpenAIに対する訴訟に勝つと賭けているようです。

私の理解が正しければ、彼らの営利モデルへの移行能力を覆す可能性があるのでしょうか。これは、株式市場への上場、IPOを行う能力がなくなることを意味します。

実はイーロン・マスク氏は、OpenAIが多くの資金を得る前に資金を提供していました。彼は最初の資金提供者の一人だったと思います。しかし非営利団体だったので、それは寄付のようなものでした。紐なしでです。

でも今、OpenAIが現在のサイズ、7500億ドルに見えますが、そこまで成長したら、イーロン・マスク氏がIPOの際に会社の株式を取得する可能性はあるのでしょうか。それは面白いと思いませんか。楽しまれていませんか。

もし楽しいなら、それが最も可能性の高い結果です。冗談ではありません。それは実際にあるものです。マスクの剃刀と呼ばれています。最も皮肉的または面白い結果が、しばしば最も可能性が高いと言っているんです。

感情的な過去のやり取り

思い出してください、しばらく前にイーロン氏がインタビューで感情的になった時がありました。自分が尊敬していたヒーローたちから、SpaceXなどで自分がやっていることについて批判されるのがどれほど辛かったかを語っていました。

どこかでこのメールのやり取りが表面化しました。サム・アルトマン氏がイーロン・マスク氏にメールして「昔、あなたがテレビインタビューを受けているのを見たのを覚えています。多分60ミニッツだったと思います。何人かに攻撃されていて、彼らはあなたのヒーローで、本当に辛そうでした」と書いています。

「あなたは私のヒーローです。あなたがOpenAIを攻撃する時、それはまさにそんな感じです。私たちはいくつかのことを台無しにしてしまったことは完全に理解していますが、正しいことをしようと信じられないほど懸命に働いてきました。私たちはGoogleも他の誰もAGIを一方的にコントロールできる道にいないことを確実にしたと思っています。私たち二人ともそれが重要だと考えていると信じています」

「あなたが助けてくれたことすべてに心から感謝しています。OpenAIはあなたなしには実現しなかったと思います。あなたが公然とOpenAIを攻撃すると、本当に心が痛みます」

イーロン氏は「理解しています。傷つけるつもりは確かにありません。お詫びします。しかし文明の運命がかかっているのです」と返信しています。

確かにAGIに向けた進歩は、私がずっと安全だと感じるであろう分野の一つです。対立もドラマもない方が絶対に好ましいです。しかし多くのこれらの利害関係は衝突コースにあるようです。そしてワイルドになりそうです。

国防総省との提携

コメント欄で、これがどこに向かうと思うか教えてください。イーロン氏がOpenAIを引き裂き、IPOや資金調達を阻止すると思いますか。それともこの訴訟は不発に終わると思いますか。あるいは彼がOpenAIの株式を取得したり、OpenAIに対する支配権を得る可能性があると思いますか。あなたの考えと、何が起こってほしいかを教えてください。

そして最後に、これがあります。2025年12月22日の投稿を見たのを覚えています。xAIが戦争省と提携しています。アメリカでは、もしご存じなければ、この組織を何と呼ぶべきか考えているところです。1947年以前は戦争省と呼ばれていました。それから国防総省に改名されました。そして今、また戦争省に戻っています。

これはライバル関係と見なされる可能性のある、もう一つのことです。発表されたプロジェクトStargateを覚えていますか。5000億ドル、半兆ドルでした。OpenAI、SoftBank、Oracleの共同事業でした。そしてそれはインフラを構築するためのものでした。

マスク氏は公然とStargateを批判して、資金がない、どこにも行かないと言いました。一方で、xAIとイーロン・マスク氏は、国家安全保障機構を固めているようです。おそらく地球上で最も安定した顧客です。

興味深いことに、ご存じかもしれませんが、アメリカでは政府のこれらの異なる部門は、それぞれが小さなデータサイロを持っていて、他の人から隠しています。ある種の不透明性があります。多くの透明性がありません。今、それを逆転させる政治的意志があるようです。データサイロを打ち破るための法令があります。

基盤モデルが、トレーニングやファインチューニングの目的でそのデータにアクセスできれば、それは確かに金鉱になる可能性が高いです。

新しいGrokモデルのテスト

そして最後に、LM Arenaで新しいGrokモデルがテストされています。Slateflowと呼ばれています。どうやらTide Wispと呼ばれる別のものもあるようです。これらはもちろん噂です。大いに疑ってかかってください。でも、LM Arenaで何かを見る時、かなり正確である傾向があります。これらのモデルのリリースにつながることが多く、通常は数週間後です。

どのモデルかが常に正しいとは限りません。OpenAIのモデルだと思っていたら、人々が予想していなかった別のモデルだったりすることもあります。

それでテストしてみました。Slateflowを取得できたようです。非常にまともで高速に動作するPythonコードを返しました。これはその完全な能力をテストしているわけではなかったので、もっと難しいプロンプトでテストしてみようと思います。

イーロン・マスクの戦争準備

いずれにせよ、イーロン・マスク氏は戦争の準備をしているようです。比喩的にですが、戦争省と協力しているという意味では文字通りでもあります。

彼は過去に懸念を語っていました。なぜなら、私たちが必要とする多くの重要な軍事インフラ、つまりドローンにおいて、アメリカは中国の技術に大きく依存しているからです。ドローンの製造能力は、DJIと比較してここにはそれほどありません。DJIが市場のほとんどを所有しています。

そのドローン会社一社が、消費者および商業セクターで70%から90%以上を所有していると推定されています。

そしてもちろん、Grokとやり取りすると、他の多くのモデルとは異なる構築がされていることに気づきます。社会的なフィルターが少なく、他のモデルではどちらの政治的立場を取るべきか分からないように見える状況があります。Grokは常に、この種の容赦ない、真実に従うという確固たる地位を示してきました。

イデオロギー的制約のないAI

政権がGrokを使用する主要な理由の一つとして挙げたのは、イデオロギー的制約がないということです。彼らは社会的安全フィルターではなく、合法的な軍事行動に従うものを望んでいます。

公平に言えば、これらのフィルターの一部は多くのモデルで問題になる可能性があります。なぜなら、実際には存在しない倫理的葛藤を見出して、かなり基本的な質問に答えることを拒否するからです。

イーロン氏がこれをどこまで先を見通して考えていたのか、興味深いところです。これはある程度、戦争省のすべての従業員とやり取りするという特定の状況に置かれるように位置づけられていたのでしょうか。

おそらく戦場で意思決定を行うか、あるいは意思決定でなくても、可能性のある結果をすべてシミュレートして、この紛争がこれらの特定の方向に進む可能性についての意思決定者に提示するようなものです。

今後の展開

そして将軍や意思決定者は、それらのレポートを受け取り、それらのレポートに基づいて人間の決定を下すことができるでしょう。

さて、私からは以上です。今後数週間は大きなことが起こりそうな気がします。ニュースが毎日のように飛び込んできているようです。

彼らが言うように、落ち着いて構えていてください。ここまで見ていただいた方、本当にありがとうございました。私の名前はウェス・ロスです。次の動画でお会いしましょう。