AIは数学を「解決」したのか?(詳しく見てみよう)

数学
この記事は約27分で読めます。

OpenAIが発表した離散幾何学における数十年越しの未解決問題「平面単位距離問題」の進展について、その真相と背景を冷静に分析・解説する内容である。ポール・エルデシュが提示した予想に対し、AIが反例を導き出したというニュースの真実性と、それが数学界に与えた衝撃の度合いを検証。一見すると人工知能が人類を超越したかのような熱狂がネット上で渦巻く中、実際には人間の数学者による膨大な精査と、AI特有の「超人的な忍耐力による探索」の結晶であることを解き明かす。また、AIの進化を「水位の上昇」ではなく「川の支流の開拓」というモデルで捉えるべきだと提唱し、過度なディストピア論を戒めつつ、専門特化型ツールとしてのAIがもたらす数学の刺激的な未来像を提示している。

Did AI Just “Solve” Math? (Let’s Take a Closer Look)
Cal Newport takes a critical look at recent AI News.More from CalDownload Cal’s FREE guide to cultivating a deeper life:...

OpenAIが発表した数学的ブレイクスルーの真相

先週、OpenAIが「OpenAIのモデルが離散幾何学における中心的な予想を覆した」というタイトルのプレスリリースを発表しました。彼らが具体的に言及していたのは、1946年にポール・エルデシュが最初に提起した平面単位距離問題についてです。これは実は、問題自体の説明は非常にシンプルです。基本的には、平らな平面上のn個の点からなる集合において、互いの距離が正確に1単位だけ離れている点のペアの最大数はいくつか、というものです。1940年代当時、ポール・エルデシュはこの問いに対する答えを提案しました。彼はそれを証明することはできませんでしたが、答えはこれだろうと考えていたのです。先週、OpenAIは要するに、LLMを使ってポール・エルデシュが提案した答えが実際には間違っていたことを証明した、と発表したわけです。

OpenAIのプレスリリースには動画が添えられており、ドラマチックな音楽とともに、研究者たちのグループが、これがどれほど重大なことなのかを説明しながら、コミカルなほど小さな黒板に熱心に数式を書き込んでいました。ここで、その動画のクリップを再生してみましょう。

これはAIによる最初の数学的なブレイクスルーです。組合せ幾何学において最もよく知られた問題と言われてきました。ですから、数学の特定のサブフィールド全体にとって、おそらく存在する中で最も有名な問題なのです。

主要なメディアもすぐにこの話題を熱狂的に取り上げました。ニュー・サイエンティスト誌の見出しはこうです。「数学者たちが驚愕、数学におけるAI最大のブレイクスルー」。X上の人々は、予想通りさらに大騒ぎしました。ピーター・ディアマンディスは次のようにツイートしました。「OpenAIのモデルが、歴史上最も多作な数学者の一人であるポール・エルデシュによる80年前の数学予想を証明した。私たちはすべてを解決しようとしている」。

なるほど、ではここで実際に何が起きているのでしょうか。AIはついに天才レベルに達したのでしょうか。数学という規律は、今まさに自動化されてしまったのでしょうか。私自身、これまでに多くの応用数学の研究を発表してきた理論計算機科学者であり、その意味を知らない方は調べていただければ幸いですが、誇らしげにエルデシュ数が3であることを自慢している人間として、明白な理由からこれらの問いには特別な関心を持っています。さて、木曜日になりましたので、この番組の「AI現実チェック」のエピソードの時間です。答えを探求するには絶好の機会ですね。ですから、まさにそれをやっていきましょう。いつものように、私はカル・ニューポート、そしてこれは誘惑の多い世界で深みを求める人々のための番組「ディープ・クエスチョンズ」です。

よし、ではまずOpenAIが実際に何をしたのかについて、より具体的に把握することから始める必要があります。その上で、それが私たちの残りの人々に何を意味するのか、その影響について踏み込んでいきましょう。

さて、私たちが注目しているのは、この単位距離、平面単位距離予想です。ポール・エルデシュは自分がその問いの答えを特定したと確信していました。ここではあまり数学的になりすぎたくはありません。しかし、簡単に言うと、ポール・エルデシュは、平面にn個の点を配置する場合、1単位の距離に配置できる点の最大数は、n1+c/log(log(n))(cは特定の定数)によって上から抑えられると考えていました。お気づきかもしれませんが、この和の第2項は、nが漸近的に増加するにつれてゼロに向かう傾向があります。つまり、この結果、答えは点集合が増加するにつれて、漸近的に単純な線形に近づいていくことになります。これは非常にエレガントな答えです。ポール・エルデシュはこれが正しいと確信していました。他の多くの数学者も、ポール・エルデシュはたいてい正しいので、単にそれが正しいと思い込んでいました。そのため、人々は長い間、それが本当に根本的な限界であることを証明しようと試みてきました。

今回OpenAIがしたことは、いや、それは間違っているという論文を発表したことです。私たちは実際に反例を持っています、と。限界として示されたものよりも、nが増加しても単位距離にある点をより多く含むような、点を配置する方法を見つけたのです。実際の境界は、nを増加させてもゼロに近づくのではなく、固定されたままである小さな固定定数エプソンを使った、$n^{1 + \epsilon}$のようなものだと思います。つまり、彼らは反例を提示したのです。ここに正しい答えがありますとか、限界はこれですとか、これが可能な最大の点数です、と言ったわけではありません。彼らはポール・エルデシュの予想をより優れた予想に置き換えたわけではありません。ポール・エルデシュの予想を証明したわけでもありません。しかし、彼が正しい答えだと思っていたものが、到底正しくあり得ないことを示す反例の構造を提供したのです。

どのようにしてAIは反例を見つけたのか

では、彼らはどのようにしてこれを実現したのでしょうか。彼らは推論LLMを使用しました。これは、基本的には声に出して話し、声に出して考え、思考を巡らせるように調整されたLLMのことです。私たちが最初に推論モデルを目にしたのは、2024年のo1やoシリーズのモデル、そしてDeepSeekの推論モデルでした。基本的に推論モデルとは、静的でメモリを持たないLLMを使い、より動的なメモリ付きの計算のようなものを近似する方法です。なぜなら、モデルが長々と出力していく中で、新しいトークンを生成するときにそれまでに自分が言ったすべてのことを見返しているからです。つまり、とりとめもなく出力している間、声に出して考えている状態になり、新しいトークンを生成する際にそのすべての思考プロセスを利用できます。そのため、ある種のメモリを持っているような状態になり、この思考の巡らせ方はある程度動的になります。反復的、あるいはループ的な思考の基礎のようなものをそこに得ることができるのです。

彼らはその推論モデルを使用しました。そして、彼らが何回プロンプトを投入したのか、あるいはどのような質問を投げかけたのかは分かりませんが、この特定の問題についてプロンプトを出したうちの1回で、モデルが非常に長い回答の書き起こしを吐き出しました。専門の数学者チームがこの回答を詳細に読み込み、この長い思考連鎖の書き起こしの中から、反例となる核心的なアイデアを特定したのです。

その後、これらの数学者たちは、この書き起こしから反例のアイデアを抽出し、洗練させ、適切に執筆し、推敲を重ねて、より短く簡潔で、はるかに人間にとって読みやすい論文に仕上げました。そして、それこそがOpenAIが実際に投稿したものです。ですから、LLMがこのようなエレガントな5ページほどの論文を投稿したわけではありません。人間の数学者がそれを行いましたが、彼らはこの論文を書くためのアイデアを、モデルが質問されたポール・エルデシュの問題について熟考した際に生成した、この非常に長い思考連鎖の書き起こしから得たのです。それが舞台裏で起きたことです。

では、この出来事について人々が抱いている核心的な疑問について掘り下げていきましょう。

疑問の1番目として、この結果は本当に重要なのでしょうか。以前にも、AI企業が「これらの一流の数学問題を解決した」と主張したものの、他の数学者がやってきて「それはすでに解決されている、おそらく訓練データの中で見かけたのだろう」と言ったり、「その問題は非常にマイナーだ」と言ったりしたトラブルがありました。今回もそれと同じなのか、それとも実際に本当に重要な問題なのでしょうか。

答えは、はい、重要です。よく知られた問題であり、誰もがポール・エルデシュの提案した答えが正しいと単に思い込んでいたという意味で、これは重要です。ですから、彼が間違っていたと知ることは、数学者にとって本当に驚きでした。それまで誰もその反例を思いつきませんでした。実際に何人の人がその反例を証明しようとしていたのかは分かりませんが、誰もそれを思いついていなかったのです。

また、これはトップクラスの発表の場で公開できる成果でもあります。彼らもそうするつもりでしょう。つまり、これをどのように引用し、著作者をどう扱うかについてはいくつかの複雑な問題がありますが、もし人間がLLMの助けなしにこのまったく同じ結果にたどり着いていたら、一気に「Annals of Mathematics」行きです。ポール・エルデシュが間違っていたと示すのは重大なことです。ですから、重要な結果であり、多くの人々を驚かせました。

AIは人間の数学者よりも賢くなったのか

多くの人が尋ねている2番目の疑問です。これは、LLMが人間の数学者よりも賢くなったことを意味するのでしょうか。

ここでの短い答えは「ノー」です。しかし、長い答えもお伝えしたいと思います。この特定の例で何が起きていて、何が起きていないのかについて、いくつかの文脈を提供したいのです。

ここでは、ポール・エルデシュの未解決問題の世界的な専門家である数学者、トーマス・ブルームのコメントをいくつか読むことから始めたいと思います。OpenAIは、この結果に対する著名な数学者からのコメントを集めた解説論文を同時にリリースしており、トーマス・ブルームはコメントを求められた数学者の一人でした。OpenAIが公開した解説論文に掲載されているトーマス・ブルームのコメントから、皆さんに読み聞かせたいと思います。

ブルームは次のように始めています。この引用の中で彼は多くのことを語っていますが、私がここで読む引用は、トーマス・ブルームのこの言葉から始まります。「もしこの論文の結果が単位距離問題の証明であったなら、それは本当に信じられないことだっただろう」。

一歩下がって説明すると、彼が言っていたのは、もしLLMがポール・エルデシュの予想が正しいと証明する方法を見つけていたなら、それは反例を証明することよりもはるかに難しいことだった、ということです。それなら本当に信じられないことだったでしょう、と彼は続けています。「この結果を聞いて非常に驚いたものの、それが反例の構築であると知ったときにはその熱意が少し冷め、さらに、後から振り返ればその構築の性質が、ポール・エルデシュによるオリジナルの格子ベースの構築を自然に、とはいえ高度に非自明な形で一般化したものであると知ったとき、熱意はさらに薄れた」。

ここでも、数学の専門用語を翻訳させてください。彼は、最初にこの問題が解決されたと聞いたとき、「なんてことだ、信じられない」と思ったわけです。そして、解決されたのではなく、既存の提案された解に対する反例が見つかったのだと知ったとき、彼の熱意は和らぎました。さらに、実際の反例の構築が、数学における何か新しい独創的な飛躍ではないと分かったとき、それは実際にはポール・エルデシュが自身の答えに一致すると考えて提示したオリジナルの構築を取り上げ、基本的には、非自明な形ではあるものの、標準的な代数的な埋め込みのようなものをオリジナルの解に適用したらどうなるかをLLMが提示したに過ぎなかったのです。すると、なんと、この配置には考えられていたよりも単位距離にある点が多く含まれていることが判明したわけです。つまり、答えは正しい解のすぐ近くの領域に存在していたのですが、単にこれまで誰もそれを見つけていなかっただけなのです。

さらにブルームの言葉を読み進めます。

「この構築を検証すると、なぜこれまで人々がこれを見落としていたのかがより明確になる。それには、いくつかの起こりそうにない出来事の合流が必要だからだ。1つ目に、優れた数学者がそもそも単位距離予想について考えることに多大な時間を費やしていること。2つ目に、それが正しいというポール・エルデシュの度重なる信念にもかかわらず、真剣にそれを論破しようと試みること。3つ目に、オリジナルの構築を他の数体に一般化することに価値があると信じ、そのような構築の探索に多大な時間を費やすことをいとわないこと。そして4つ目に、適切なパラメータを持つ数体の無限の塔に関する適切に表現された問いが既存の理論を使って解決できると認識できるほど、類体論の関連部分に十分に精通していること。AIはこれらの基準をすべて満たしており、その成功はこれまでの成果を反映している。人間なら探索する価値がないとして切り捨ててしまうような道を粘り強く突き進むことで、しばしば最も驚くべき結果を生み出す。超人的なレベルの忍耐力と、膨大な技術的メカニズムへの精通を組み合わせているのだ」。

彼はここで、この答えを見つけるために多くの要素が絡み合う必要があったと説明しています。だからこそ、これまで誰も見つけられなかったのです。一度見てしまえばそれほど難しい答えではありません。では、なぜ私たちはそれを見つけられなかったのでしょうか。彼はその理由を挙げていきました。人々はそれを探していなかったのです。ポール・エルデシュが正しいと思い込んでいました。また、2つの概念が融合する必要があり、その両方の概念を知っている必要がありました。さらに、ある種の粘り強さが必要でした。

しかし、この中に私が取り上げたいフレーズがあります。なぜなら、それが数学全般で何が起きているのかをより広く教えてくれるからです。ブルームは、この結果には「これまでの成果の響きがある」と述べました。彼はここで何について語っているのでしょうか。

近年、プロの数学者の間でコンピュータ支援数学ツールの使用が爆発的に増えています。この種のツールは古くから存在していますが、より最近になって起きた変化は、これらのツールをLLMと組み合わせ、拡張したことです。LLMと既存のコンピュータ支援数学ツールの組み合わせにより、新しい結果が爆発的に生み出されています。それは、大半の人間が実りある形で追求するには退屈すぎるという、同じような特徴を持つ多くの結果を明らかにしています。なぜなら、これらのLLMを伴うコンピュータ支援ツールが注目している結果は、ある種の空間の系統的な探索を必要とすることが多く、それはあまりにも退屈で、新入りの大学院生にすらやらせたくないほどであり、果てしない時間がかかるからです。

また、これらのツールは、膨大な既存の結果や手法に関する広範な知識を引き出すことができます。大半の数学者が頭の中に保持できるよりもはるかに多くのデータで訓練することが可能です。そのため、答えを系統的に探索し、異なるアプローチを組み合わせて何が機能するかを確かめることをいといません。また、これらのシステムの多くは、形式的な証明検証器を使用します。そのため、色々なことを試して、何が機能するかを確認できるのです。これは数学にとって本当に大きな変化であり、トーマス・ブルームが言っているのは、この結果はAIが持っていると知られていなかったような全く新しい能力ではない、ということです。彼は、これがここ数年私たちが進めてきた既存の結果の延長線上にあると言っています。AIを活用した数学ツールが本当にうまく機能する、まさにスイートスポットに当てはまるものなのです。

モジュラー・アーキテクチャこそが真の未来

公平を期すために、OpenAIの結果には、AIで拡張されたコンピュータ支援数学の最近の爆発的普及とは一線を画す要素が2つあります。

1番目に、これは少なくとも彼らの主張によれば、純粋にLLMのプロンプトだけで行われたということです。数学者が使用しているツールは、多くの異なるタイプのモデルを繋ぎ合わせたモジュラー・アーキテクチャを使用する傾向があります。LLMがあり、形式的検証言語(LLMが非常に得意とするLeanなど)を使用した形式的証明検証器があり、ある種の複雑な制御ロジックがあり、注目している分野に関連する非常に特定の数学的手法についてLLMの特殊な訓練が行われています。今回の件はそれとは違いました。精巧な足場組みは存在しませんでした。実際には、推論マシンへの単なるプロンプトであり、それが150ページほども語り続け、その中に答えが見つかったのです。その点は、この結果において異なっています。

ただし、ここで注意点を述べておきたいと思います。彼らがこれを行うために純粋なLLMを使用しているという事実は、実用性というよりもマーケティング的な意味合いが強いと考えています。実際には、モジュラー・アーキテクチャのツールこそが、数学を支援するためにLLMとコンピュータを使用する正しい方法です。通常のLLMをそのまま使用することは、非効率で、高価で、複雑だと推測されます。特に、彼らが神のみぞ知るほどの数の書き起こしを生成し、どれほど多くの問題を検証し、この長々と続く思考連鎖を掘り下げて洞察を見つけ出すためにどれほどの作業が必要だったかを見れば明らかです。この種の結果を得るために、これが正しい方法だとは思いません。

ですから、彼らはこれを、間もなくリリースしようとしている新しいモデルの宣伝のために使っているのだと思います。ちょうど、Anthropicが、実際には大差ないことが判明したにもかかわらず、彼らのモデルが他のモデルには不可能なバグを見つけられると主張したのと同様です。それによって、一般的にそのモデルをより使いたくなるように仕向けるわけです。今回の件も、OpenAIが「ほら、数学の問題を解決したぞ」と言っているようなものです。企業がこのモデルを使うために今すぐお金を払ってくれることを期待しているのでしょう。そういうことが起きているのだと思います。

例えば、このOpenAIの発表のすぐ後に、Google DeepMindが独自の論文を発表し、AlphaProofの進展をアナウンスしたことを指摘しておきます。これは私が話しているようなモジュラー・アーキテクチャのシステムであり、数学に調整されたLLMを持ち、証明ソルバーを持ち、本当に複雑な制御ロジックを持ち、エージェントやサブエージェントが系統的に制御ロジックを構成しています。私の理解が正しければ、LLMへのプロンプトのタイプや探索すべき空間を系統的に案内し、その答えを受け取って証明ソルバーにかけ、フィードバックを与えるという仕組みです。そして、彼らが発表したこの最先端のモジュラー・アーキテクチャシステムを、今回の問題と同種の353個の未解決のエルデシュ問題に対して実行したところ、そのうちの9個を解決しました。他のものは解決できませんでしたが、9個を解決したのです。しかも、これらを実行するコストは非常に安価でした。これらは小さなモデルであり、20兆個のパラメータを持つような汎用的な推論LLMではありません。

ですから、おそらくそれこそが数学を行う正しいアプローチです。これは問題の重要性を軽視するものではありません。ただ、純粋なLLMであったという事実は新しいものの、それほど重要ではないかもしれないと言っているだけです。

OpenAIの結果を斬新なものにした2番目の要素は、それが重要な問題であったという事実であり、それが群を抜いて最大の差別化要因です。人々はこの問題を知っていました。組合せ幾何学の分野にいる人々にとって、これはよく知られた問題であり、LLMとコンピュータツールを使って証明や反例を見つけるというこの手法によって解決された、最初の格好いい問題となりました。このアプローチ自体は少し前から行われていましたが、これが最初の主要な問題の解決となったのです。ですから、これはOpenAIの帽子に飾るもう一つの手柄と言えます。

ここにも別の注意点があります。ブルームが強調していたように、これはある種の幸運だった面もあるかもしれません。このよく知られた問題に、この種のツールが非常に得意とするタイプの空間に存在する、比較的容易な反例がたまたま存在していたという意味においてです。私たちが今やこれらすべての未解決問題を解決できるようになったわけではありません。それはまさにAlphaProofの成果が示している通りです。あれは、この種の思考をはるかに洗練させ、より自動化し、より系統的に応用したものでしたが、彼らが対象とした353個の類似スタイルの問題のうち、9個しか解決できなかったわけですから。ここでもやはり、大半の問題は何らかの理由で解決不可能なのです。実際に文字通り解決不可能なものも多く、また、それらの解のタイプが、これらのツールが適しているスタイルの解空間に当てはまらないものも多いのです。ですから、いくつかの注意点はあるものの、それがここで起きていることです。

水位の上昇モデルと、川の支流モデル

よし、では3番目の質問です。これは、これと同等に難しいすべての課題が、今やAIによって征服されることを意味するのでしょうか。

X上では確かにそのような雰囲気が感じられました。数学者たちはそんなことは言っていません。OpenAIもそれを仄めかしてはいますが、明言はしていません。しかし、オンライン上にある感覚としては、「これは本当に実行するのが難しいことだ。人間が解決しようとしてできなかった問題だ。ということは、私たちは今や、自分が関心を持つあらゆる物事において超知能的なパフォーマンスを提供してくれる、超人間的な知能を手に入れたのだろうか。ターミネーター2のサラ・コナーのように、片腕でショットガンを操る方法を学び、私たちの素晴らしい銃、つまり上腕二頭筋を見せつける時が来たのだろうか」というものです。

ここでの答えもおそらく「ノー」です。このポッドキャストの以前の「AI現実チェック」のエピソードで、AIの能力を考えるための2つのメンタルモデルがあるとお話ししたのを覚えているでしょうか。

1つのモデルは「水位の上昇」モデルです。能力が成長し、それは能力の水位が上昇していくようなものであり、異なる難易度の問題を表す山が存在します。水位が十分に高くなれば、その難易度にあるすべての山が解決可能になります。もし水位がエルデシュの未解決問題の頂点を覆うほど高くなっているなら、私たちの日常生活に関連する他のさらに簡単な問題もすべて覆い尽くしているはずであり、したがって私たちは非常に大きな破壊的影響を迎えようとしている、という考え方です。

しかし、それはAIの発展を考える上で間違った方法です。AIの能力を考えるためのより良いモデルは、主要な川があり、その川へと流れ込む支流を探索しているようなものだ、とお話ししました。それぞれの支流は異なるタイプの問題や応用を表しており、いくつかの支流では多くの前進を遂げることができますが、他の支流ではほぼ即座に行き詰まり、航行不可能になります。そのため、1つの支流で進歩を遂げたからといって、その川の下流にある別の支流が同じように探索可能であるかどうかについては、何も教えてくれません。これこそが正しいモデルであると私は主張してきました。そして、それが今回の数学の結果を文脈の中にうまく位置づけるのに役立つと思います。

ChatGPTが生成AIや大規模言語モデルを人々の関心に上らせて以来、計算機科学者たちは、LLMが特に適している領域が2つあると言い続けてきました。コンピュータプログラミングと数学的推論です。なぜなら、その2つの問題は4つの要素を共有しているからです。それらは高度に構造化された言語を扱います。コンピュータのコードか、数学の記法か、のどちらかです。また、明確な正しさの概念を持っています。このプログラムはコンパイルされ、テストを通過するか。この証明は正しいか。この数学の結果は合っているか。さらに、コンピュータプログラミングに調整されたモデルには、訓練するための終わりのないデータが存在します。人々が質問し、他の人々が回答しているオンライン上の果てしないコードの例を使って調整することができます。数学はさらに優れています。なぜなら、多くの異なる数学問題と正しい証明のデータ例を人工的に、合成的に次から次へと作成し、それを何度も何度も使って調整を繰り返すことができるからです。そのため、特定のタイプの数学的推論が非常に得意なのです。

そして、プログラミングと数学のどちらの場合も、難しいツールを使いこなし、そこから優れた結果を引き出すことをいとわない専門家のユーザーが存在します。もしあなたが私に「この素晴らしいAIツールがある。150ページ吐き出されるから、それを精査して、その中に自分のビジネス問題に役立つ洞察が含まれているかどうかを繋ぎ合わせなければならない」と言ったとします。平均的なビジネスパーソンなら、「Microsoft Wordのクリップがどこに行ったのかをまだ探しているところだ」と言うでしょう。しかし、数学者なら「ああ、もちろん。それをやろう。私たちは難しいツールが大好きなんだ」と言います。

ですから、プログラミングと数学は、現在の生成AIという川の2つの主要な支流であり、非常に航行可能であることが証明された場所なのだと考えることができます。だからこそ、私たちはそこに多くの探検家を送り込み、進歩を推し進めようとし続けているのです。AI企業であれば、何らかの進歩を報告したいからです。しかし、その支流を探索できるからといって、他の支流については何も分かりません。ですから、エルデシュの問題を解決するよりも簡単なことであれば、何でもAIができるようになった、というメンタルモデルは絶対に間違いです。

むしろ、この発表のすぐ後にゲイリー・マーカスが自身のサブスタックで私の言葉を引用して指摘してくれたように、IPOを控え、収益への懸念が高まる中で、OpenAIが誇らしげに喧伝しているユースケースが「プロの数学者が離散幾何学の証明を作成するのを支援している」ということであるという事実そのものが、支流メンタルモデルの巨大な裏付けになっています。プロの数学者が証明に取り組む分野ほど、儲からない分野はほとんどありません。その分野でお金が使われることはありません。なぜなら、お金を生み出さないからです。それは知識のための知識という、信じられないほど難解な知識です。

ですから、もし本当に投資家を感動させ、「私たちは大丈夫だ、お金を稼げる」と言いたいのであれば、最も儲からない可能性のある応用を自慢するはずがありません。「企業のコストを平均で1億ドル削減しているこの応用を見てくれ。私たちはちょうど10億ドルの収益を上げた。これらの企業の運営コストを半分に削減する手助けをした。これは電気よりも重要になるだろう。誰もがこのツールを必要としている」と発表したいはずです。「標準的な2次元の正方格子を移動させると、単位距離にある点に関して線形を超えるものを絞り出すことができる、興味深い代数的領域がある」などと発表するはずがないのです。

もしその問題を解決したことが、今や天才レベルのAIを手に入れたことを意味するのであれば、それを使って自動化された天才レベルの人工知能で実行できる、経済的に有用なあらゆる事柄を解決しているはずです。ですから、私たちがこれに焦点を当てているという事実こそが、1つのことが得意であるからといって他のことも得意になるわけではないという考えを裏付けていると思います。さもなければ、もっと経済的に生産的な例を目にしているはずです。

数学の未来と、過剰な対立への警告

では、4番目の質問です。これは数学の未来について何を物語っているのでしょうか。

数学の未来は刺激的です。この点については非常に明確にしておきたいと思います。コンピュータプログラミングに今やLLMベースのツールが深く組み込まれているのと同じです。私たちはまだそれらを正確にどのように使うべきかを完全には解明していませんし、まだ安定していません。エージェントを監督するエージェントがいて、そのエージェントの監督者をさらにエージェントが監督し、一日の終わりに蓋を開けてみたら壊れたHello Worldのコードがある、といったナンセンスな状況はまだたくさんあります。まだ模索している段階ですが、LLMツールはプログラマーの働き方を完全に変えつつあります。

それと似たようなことが、ここ1年ほどの間、プロの数学界でも進行しています。コンピュータ支援ツールは常に存在し、非常に強力でしたが、操作が面倒すぎました。しかし、そこにLLM、特にこの種の数学的推論を行うために調整されたLLMを投入すると、さらにDeepMindが作っているような非常にスマートなモジュラー・アーキテクチャの中に組み込むと、本当に役に立ちます。

私はこれまで、プロとしての応用数学の研究を発表したことはありません。それが私の分野でした。私は分散アルゴリズムの理論家であり、分散アルゴリズム理論の中の応用数学者です。数年前、私は数学的な研究を辞め、ジョージタウン大学でデジタル倫理センターの立ち上げを支援し、こうした一般向けのテクノロジー批評を多く行うようになりました。しかし、これらのツールを見て思うのは、「おいおい、これがあったら助かったのに」ということです。もし私が応用数学に戻るなら、これらのツールを徹底的に使い倒すでしょう。この種の仕事をしてきた経験から言えば、出す結果の品質、包括性、そしてスピードの面で、私は2倍効率的になると思います。

数学というものが、創造的な洞察と、結果を学び、適用し、異なることを試し、詳細を詰め、行き詰まるという多くの退屈な作業の組み合わせであることを、人々は十分に理解していないと思います。数学、少なくとも応用数学でよく行き詰まるのは、アイデアはあるものの、代数の部分です。例えば「これらの確率変数の和をこのレベルで抑えなければならない、そうすればユニオンバウンドを適用できる」といった時や、「ここでユニオンバウンドを適用できるが、依存関係がある。それらは相関しているが、負の相関ではない。しかし、相関を解消するためにここでマルチンゲールを適用できるかもしれないが、それがどのように機能したかを正確には思い出せない」といった場面です。そして、最も優れた応用数学者たちは、単に結果を学び、結果を実践し、結果を読むことにより多くの時間を費やしてきた人たちです。

もしAIがそれを手伝ってくれるなら、本当に大きな違いをもたらすでしょう。経験から言いますが、AIに証明空間を探索させることができるなら、それは素晴らしいツールであり、数学の一部になっていくでしょう。そして近い将来に起きると思われるのは、これらの論文で見られるような、取り組みやすい成果を出す人々が爆発的に増えることです。自分の専門分野の中のサブ空間を探索し、AIに任せるわけです。非常に注意深く調整し、適切な質問を与え、「私たちが注目している空間はここだが、分野に存在する多くの結果を洗練させるつもりだ。ここに小さなギャップがあるからこのギャップを埋めよう」とか、既存の予想に対する多くの反例を見つけたりするのです。その多くはそれほど興味深いものではなく、査読システムが処理しきれないほど多くの結果が溢れるという問題も生じるでしょう。

しかし、長期的、あるいは中期的に見れば、最高峰の数学の結果の平均的な質が跳ね上がることになるでしょう。私自身、これまでにいくつか興味深い結果を出してきましたが、これらのツールがあればもっと興味深いものにできたはずだからです。ですから、ここでの数学の未来は刺激的であり、ある意味で理にかなっています。数学とコンピュータプログラミング、それこそが最初から私たちが言われていたことです。LLMのスイートスポットであり、私たちはカスタムツールを手に入れています。プログラミングにおけるカスタムツールとは、これらの複雑なコーディングの仕組みであり、数学におけるカスタムツールとは、これらのモジュラー構造を持った証明探索システムです。それらが変化をもたらしており、私は実際にそれは刺激的なことだと思っています。

それはまた、ちなみに、私が「分散型AGI」あるいは「特化型AGI」と呼ぶビジョンを裏付けるものでもあります。私たちは、これらの巨大なモデル、単一のLLMを「HAL 9000」になるまでスケールアップし続け、その上に軽量な仕組みを構築するだけで何でもできるようになると信じている唯一の人々は、それを自分たちの参入障壁にしたいAI企業だけだ、という考え方です。しかし、AIの未来は、特定の Nas 問題や問題のタイプ、あるいはドメインに調整されたモジュラー・アーキテクチャを持つ特化型のシステムであり、その分野の人々からの多くのインプットを伴って、それらのドメインで非常にうまく機能するものになるでしょう。それこそがAIの未来です。私はそういうAIの未来がとても好きです。そちらの方がはるかに資源効率が高いからです。

また、一つのことを行うためのモジュラー・アーキテクチャは非常にコントロールしやすいため、信じられないほど整列(アライメント)可能です。単にLLMに問い合わせて、LLMが言う通りにするのとはわけが違います。より経済的に多様であり、特定の場所のために特定のツールを構築しているため、顧客への対応力も高まります。そして、それは私たちのコントロールを外れたエイリアンの知能を構築しているという、あちこちに蔓延している感覚から私たちを遠ざけてくれます。「それが一体何をするつもりなのかは神のみぞ知る」といった対話には、私は本当にうんざりしています。ですから、数学で起きていることは刺激的であり、重要です。今回の特定の結果には、OpenAIが言わせようとしているほどの巨大な新しい出来事ではないと思わせる注意点はあるものの、数学で起きている現象そのものは非常に興味深いものです。一人の数学者として、格好いいと言わざるを得ません。

しかし、これが私の結論としての考えにつながります。私はこの発表の語られ方が好きではありませんし、それは私たちがより一般的にAIについて語っている方法に対する非難でもあると考えています。これは特化型であり、エキサイティングなものであるべきです。「ねえ、数学の新しいツールが、私たちが解決できるものを本当に向上させているよ」というように。私たちがそう言ったら、大半の人が「黙れ、オタク。私はNBAのチャンピオンシップを見ているんだから、それで終わりだ」と言うようなものであるべきなのです。

しかし代わりに、これらすべての騒がしいお喋りを目にします。これは、何か恐ろしいことが醸造されている兆候としてキャストされなければならないかのようです。どういうわけか、数学ツールのように具体的で特化されたものを取り上げ、それをデジタルな嫌悪感の源へと変貌させなければならないかのようになっています。

これが私の願いです。AIに関するすべてのことを、人間対機械というある種のマニ教的な対立構造に位置づける必要はありません。すべてのニュースリリースを、「これは人間が勝利する味方なのか、それとも最終的に機械が私たち全員を排除することの証拠なのか」という基準で評価しなければならないような状況です。これはばかげた二分法です。それはコロシアムであり、オンラインの人々が歓声をあげているのは、それが彼らの人生に意味を与えるからです。また、こうした闇対光の二分法がもたらす嫌悪感や絶望、不安を好む、これらの企業の冷笑的なCEOたちによるものでもあります。なぜなら、それによって彼らの製品が刺激的なものに見えるからです。彼らはより良いIPOを迎えることができるでしょう。私はそれに本当にうんざりしています。

AIを、特定の製品に使用できる通常のテクノロジーとして語ることはできないのでしょうか。もし私が5年前に「コンピュータ支援の新しい数学解決ツールがあり、それが数学界を席巻していて、これまで解決できなかったあらゆる種類の問題を本当に切り開いており、数学者たちが熱狂している」と言ったら、皆さんはそれについて5分すら睡眠時間を削ることはないでしょう。「それはちょっと格好いいね、私はオタクじゃないけど」と言って、自分の人生を進めるはずです。

それなのに、今日、まったく同じ発表が、このマニ教的な形式主義や枠組みに当てはめられるがために、人々は「なんてことだ、刑務所の独房でサラ・コナーの懸垂をやって、ロボットが攻撃してきたときに戦えるように準備しておかないといけないな」という気持ちにさせられるのです。

私が言いたいのはそれだけです。私はこの言説に疲れ果てています。AIを通常のテクノロジーのように扱い、私のような数学オタクに「これはクールなツールだ、使うのが待ちきれない」と言わせてはもらえないでしょうか。そして、それこそがAIで起きている多くのことに対して私たちが考えるべき方法です。恐ろしいことは何も起きていません。これは良いニュースでしかありません。皆さんが考えているよりも狭い領域の話です。もしあなたが数学者でないなら、気にする必要はありません。もし数学者なら、興奮すべきです。分野は進化します。数学は長年にわたり、テクノロジーとともに大きく進化してきました。こうした物事はそのようにして機能するのです。みんなで少し落ち着きませんか。

よし、それが私の最後の願いです。今週お届けするのは以上です。月曜日には、誘惑の多い世界で深みを求める戦いにどのように参加できるかについてアドバイスを強める、アドバイスのエピソードとともに戻ってきます。私がこの世界での深みを求める戦いについて現在考えている個人的なメッセージを受け取りたい方は、calnewport.comで私のニュースレターに登録してください。そして、大半の木曜日にはAI現実チェックのエピソードをお届けします。ですから、おそらく来週の木曜日にも、この種のエピソードをもう一つお届けすることになるでしょう。少しの現実を注入する必要のある主張が世の中にはたくさん存在することを、神はご存じですからね。それでは、今日はここまでです。AIに関心を持つことは大切ですが、目にするものすべてを真に受けないように気をつけてください。

コメント

タイトルとURLをコピーしました