テレンス・タオ「大規模言語モデルは思ったよりシンプル──本当の謎はなぜ機能するのかということだ」

数学
この記事は約52分で読めます。

フィールズ賞受賞者テレンス・タオが、素数の謎から最新のAI技術まで、数学の核心に迫る。我々が日常的に使う暗号技術は、実は証明されていない素数のパターンに依存している。数学的証明の本質、大規模言語モデルの限界、量子コンピュータの可能性について、世界最高峰の数学者が語る。ガリレオの幾何学コンパスから圧縮センシングによるMRI技術の革新まで、数学が現実世界にもたらす「不合理なまでの有効性」を探る対話である。

Terry Tao: "LLMs Are Simpler Than You Think – The Real Mystery Is Why They Work!"
Will AI solve future math proofs? Please join my mailing list to get FREE notes & resources from this show! Click 👉 Ever...

素数パターンと暗号の脆弱性

パスワードを入力したり、オンラインで何かを購入したり、WhatsAppで暗号化されたメッセージを送信するたびに、あなたは素数のパターンにセキュリティを賭けています。地球上のどの数学者も証明できていないパターンに、です。素数は掛け算の原子のようなものです。ランダムで予測不可能であるとされており、私たちのデジタルセキュリティインフラ全体がそれを前提としています。

しかし実際のところ、私たちはそれを本当には知らないのです。スーパーコンピュータで何兆ものケースをテストしてきましたが、数学的証明はいまだに得られていません。今日、私の目の前に座っているこの人物は、ほぼ人類史上最も多くの伝説的な数学問題を解決してきた人です。テレンス・タオはフィールズ賞、数学のノーベル賞を受賞し、何世紀にもわたって最高の頭脳を悩ませてきた問題に取り組んできました。

そして彼は私に、素数の中に未発見のパターンが隠れている可能性があると話してくれました。もしそのパターンが存在すれば、あなたが今後行うあらゆる金融取引を保護している暗号を破ることができるかもしれないのです。私たちは数の美しさについて、なぜAIが数学で間違い続けるのか、10歳のときに伝説的なポール・エルデシュに会ったときのこと、そして数学は発明されたものなのか発見されたものなのかについて話します。

数学のモーツァルトと共に、不可能なものの深淵へ飛び込みましょう。

コーヒーとエルデシュの思い出

最初の質問はいつも数学者に尋ねることなのですが、コーヒーはどのように飲まれますか。

実は私はあまりコーヒーを飲まないんです。社交的な場でしか飲みませんね。ブラック、砂糖抜きです。

なるほど、この質問をする理由は、エルデシュが数学者とコーヒーについて何か言っていたと思うのですが、覚えていますか。

ええ、彼は数学者はコーヒーを定理に変換する手段だと言いました。

とてもオタクなフォローアップジョークがあって、コセオレティシャンはコセオレムをフィーに変換する手段だというものです。

ええ、それは非常に内輪向けのジョークですね。

そうですね。父親ジョークと数学者ジョークを足したようなもので、本当にひどいけれど同時に本当に良いですね。さて、エルデシュの話を出したのは、もちろんあなたが子供の頃に彼に会ったからですよね。

ええ、そうです。当時私は10歳だったと思います。彼はアデレードに協力者がいて、アデレードは私が育った街なのですが、ジョージ・ザカレスという人です。だから彼は時々訪れていました。当時、地元の大学の数学教授の一人が私を彼に紹介してくれました。エルデシュは常に、明るい若い子供たちと会うことで知られていました。

それで素敵な会話をしました。もっと覚えていればよかったのですが、当時はまだ若すぎて、それがどれほど名誉なことだったのか本当には理解できていませんでした。覚えていることの一つは、彼が私を本当に対等に扱ってくれたことです。子供として見下すようなことはありませんでした。後で彼は私に葉書を送ってくれて、そこには「素敵なおもてなしをありがとう」と書いてあり、数学の問題が添えられていました。実は私はそれを解けなかったのですが、後に誰か別の人が解きました。

素晴らしいですね。彼は少なくとも現代史において、そしておそらく全歴史において最も多作な数学者の一人でした。有名なのは、彼と関連するまでに経由しなければならない著者の数との関係ですよね。あなたのエルデシュ数は何ですか。

ええ、エルデシュ数という概念があります。これはグラフ理論に由来しています。エルデシュ自身のエルデシュ数はゼロです。エルデシュと論文を書いた場合、エルデシュ数1になります。エルデシュと論文を書いた人と論文を書いた場合、エルデシュ数2になります。

私はエルデシュ数2です。今では4とか5の人が一般的だと思います。人々は他の分野でも同様の数字を作っています。ベーコン数というのがあって、ケビン・ベーコンと映画で共演した場合、ケビン・ベーコン数1になります。そしてエルデシュ・ベーコン数というものがあって、エルデシュ数とベーコン数の合計です。これは通常無限大です。

なぜなら、エルデシュへの論文の連鎖がないか、ベーコンへの映画の連鎖がないかのどちらかだからです。でも合計で7か8くらいの人が6人ほどいます。

そうですね。そういうランダムなことを聞いたことがあります。彼は多くの点で知られていました。私の亡き偉大な師であるジム・サイモンズから聞いたことを覚えています。もちろんあなたも彼をよく知っていました。彼は非常に生産的でしたが、その生産性の一部はアンフェタミンの使用に依存していたと。彼はアンフェタミンを使っていたそうです。それは本当ですか。

それは私も聞いたことがあります。どうやら彼の友人の一人が、賭けか何かで1ヶ月間アンフェタミンをやめるよう彼を説得したそうです。エルデシュは渋々従い、最後に戻ってきてこう言ったそうです。「数学を1ヶ月遅らせただけだ」と。

彼は筋金入りだったのですね。今ではあまり見かけませんね。当時はワークライフバランスへのストレスが今ほどなかったのだと思います。

エルデシュ不一致定理

さて、あなたはエルデシュに関連する仕事をしましたよね。エルデシュ不一致定理というものです。それは何ですか。私の視聴者に説明していただけますか。

はい。エルデシュは多くの問題を出すことで有名でした。私はキャリアの中でそのいくつかを解きました。不一致理論は、数列がどれほど不規則になり得るかについての理論です。例えば、プラス1とマイナス1の数列があるとして、それがランダムであれば、1,000個の数字をランダムに選んだ場合、500個がプラス、500個がマイナスになると予想されます。不一致は、プラス1の数とマイナス1の数の差として定義されます。

数列全体で見れば低い不一致を持つことができますが、部分数列を見ると、より高い不一致を持つことがあります。例えば、プラス1マイナス1プラス1マイナス1を1,000回繰り返す数列を取ると、全体の区間での不一致はゼロです。500個のプラス1と500個のマイナス1があって、合計がゼロになるからです。しかし偶数番目だけを見ると、プラス1プラス1プラス1、またはマイナス1マイナス1マイナスだけが見えて、500という非常に大きな不一致が生じます。

一部の数列は全体としては非常にバランスが取れていますが、部分数列に限定すると、より高い不一致を持つことがあります。エルデシュは、すべての等差数列において有界不一致と呼ばれるものを持つ数列を設計できるかどうかに興味を持っていました。つまり、非常に長いプラス1とマイナス1の数列を作成できるかどうかで、1から100、1から1,000などの任意の有限セグメントを見たときに、プラス1とマイナス1の数が最大でも2つしか違わないようにするというものです。

そして偶数番目を見ても同じことが起こり、3の倍数を見ても同じことが起こる。彼は、どのように見ても常にバランスが取れている非常に均一に分布した数列を作ることが可能かどうかを疑問に思いました。しばらくの間はそれができます。誰かが1,164個の要素の数列を構築したと思います。そこでは不一致がプラスマイナス2を超えることはありませんでした。非常にバランスの取れたものです。

つまり、非常に均一な数列が存在するのです。しかし、非常に大規模なスーパーコンピュータとSATソルバーと呼ばれるものを使って、その点を超えると不一致が3になることを示すことができました。数列は時間とともにますますアンバランスになっていきました。しかし数年前まで、それが記録でした。つまり、3がこれらの数列が持たなければならない不一致の最良の下限でした。

エルデシュは、これらの数列を永遠に続けた場合、不一致は最終的に無限大に行かなければならないのかと尋ねました。そしてこれが私が示すことができたことです。

ああ、すごい。つまり無限大に発散するのですね。

はい。私たちが知る限り、対数的または二重対数的に非常にゆっくりとですが、無限大に行きます。私は情報理論と数論のツールを使わなければなりませんでした。

あなたの仕事を使ってカンニングを検出する人々がいると聞きました。学生がカンニングする場合、もちろん私たちの学生は決してカンニングしませんが、真偽問題の試験をしているとして、実際に答えを得たことをシミュレートしたい場合、ランダムに真偽真偽真と並べるかもしれません。そうすると近すぎることになります。合計、プラスマイナスがゼロに近づきます。それは関連していますか。

関連しています。ランダム数列が持つ他の統計的パターンがあり、人工的な数列は持っていません。私の低不一致の仕事が直接それに基づいているとは思いませんが、他のパターンがあります。最も有名なのはベンフォードの法則と呼ばれるもので、非常に直感に反する法則です。大雑把に言うと、世界のすべての数の30%が1で始まるというものです。

数字は1、2、3から9まで始まることができるので、これは非常に奇妙に聞こえますが、例えば世界のすべての国を取って、その人口を見ると、約100の国があり、そのうち約3分の1が1で始まる人口を持っています。中国などです。または億万長者の純資産を取っても、そのほとんどが1で始まります。誕生日もそうです。

ええ、このパターンは非常に普遍的です。しかし、数字をランダムに選ぶ場合、会計帳簿を改ざんして人工的に数字を選ぶ場合、必ずしもそれに従いません。

均一になります。だから、それを強調したり、均一が正しいと思わせようとします。

そうです。人間は本当にランダムなパターンを作るのが非常に下手なのです。だから、自然なパターンと人間が生成したものを区別できます。

数学的帰納法の限界とサイモンズ錐

興味深いですね。さて、長い間あなたと話したかったことの一つは、数学的帰納法の限界についてです。小さな数字から始めて、それに追加していくと言及されましたね。ジム・サイモンズの仕事に言及したいと思います。彼は数十億長者として最も有名で、数学研究やその他の非常に有能な科学者を支援する慈善団体を設立しました。しかし、彼のあまり知られていない仕事で、少なくとも私の数学的帰納法がどのように機能するか、または違反するかの理解において非常に重要だったのは、極小曲面に関する彼の仕事です。

極小曲面とは何か説明していただけますか。しかし私の理解では、物理的に考えると、コートハンガーのような形があって、それをループにして、別のループにシャボン玉を使って接続したいとします。得られる形が極小曲面と呼ばれるものになります。それは正しいですか。

はい。

そして彼は、0次元または1次元にそのような極小曲面が存在することが知られていて、それから2次元でそれを示したことを示しました。3次元、4次元、6次元、7次元でも存在します。そして8次元に到達したとき、機能しないことを示しました。

私なら2次元で止めていたでしょう。ほとんどの数学的帰納法は無限まで続くように見えます。しかしあなたはすでに、素朴に期待するように無限に続かないものを一つ教えてくれました。数学的帰納法の限界は何ですか。まず、それが何かを定義してください。数学的帰納法とは何ですか。

帰納法は、科学哲学の哲学者にとっては少し異なる意味を持ちます。小さな例から観察した事実を取り、それからより大きなケースで何が起こるかを予測します。これは科学的方法の非常に基本的な手順です。実験を行い、実験から外挿するからです。

数学的帰納法は、より正確な推論形式です。数学的帰納法の正確な原理があります。すべての自然数1、2、3、4などに対して真であることを証明したい文があり、1に対して真であることがわかっていて、ある数nに対して真であることがわかれば、n+1に対しても真であることがわかる場合、すべての数に対して真であることになります。

よく与えられる類推は、ドミノの列です。各ドミノは証明しようとしているケースを表し、最初のケースを証明できれば、最初のドミノを倒します。各ドミノが次のドミノを倒すことがわかっていれば、ドミノの列がどれだけ長くても、すべてのドミノを倒すことができます。

しかし、議論が100%完全に密閉されていることが本当に重要です。ドミノの列で、97番目のドミノが98番目を倒さなければ、そこで止まってしまいます。これは数学でのみ機能する原理で、100%の保証を本当に得ることができる数少ない場所の一つです。

サイモンズの話ですが、彼はサイモンズ錐と呼ばれるものを発見しました。これは幾何学なので、私の専門分野とは完全には一致しませんが、極小曲面は最も有名なのはシャボン膜のような2次元曲面です。しかし数学では、他の次元で同じ概念を考えることを妨げるものは何もありません。

1次元では、ゴムバンドのようなもので、1次元の極小曲面は非常に退屈で、ただの直線です。しかし、4次元空間の3次元曲面を考えることができます。これはすでに視覚化するのが難しいですが、数学的には考えることができます。5次元、6次元も同様です。奇妙なことに、問題は高次元でより簡単になることがあります。

だから、物理世界に関心があり、2次元と3次元にしか関心がない場合でも、数学者として最初に高次元を研究することが理にかなっていることがあります。直感が得られて、実際に関心のある問題の手助けになることがあります。そうです、8次元未満では、すべての極小曲面が滑らかであることがわかりました。シャボン玉を結んで結び目を作ることはできません。

8次元から始まって、彼は非常に驚くべき事実を発見しました。特異点が実際に形成されることができるのです。これは錐のように見えますが、はるかに高次元で、錐を修正して表面積を減らす方法はありません。3次元で錐を作り、シャボンを錐に配置しようとする場合、錐の頂点を除去して2つの丸い突起に置き換えるという手術と呼ばれることができます。それによって表面張力が減少します。

興味深いですね。

高次元ではそれができません。だから今日では、データサイエンスのおかげで、高次元幾何学をこれまでよりもはるかによく理解する必要があります。私たちの古い直感、低次元幾何学から得られるものは、実際には高次元では完全に間違っています。一つ例を挙げると、正方形の中に円を内接させると、正方形のかなり大きな部分、おそらく75%くらいを占めます。立方体の中に球を内接させても、まだかなり大きいです。立方体の体積の約半分だと思います。

しかし、1,000次元の立方体を取り、その中に1,000次元の球を内接させると、実際には非常に小さくなります。0.00001%くらいです。球は空間充填が非常に悪くなります。

ええ、高次元では空間充填には程遠いです。

これはデータのクラウドを見るときに重要です。1,000の測定値がある場合、それは1,000のデータポイントのようなものですが、それらにはいくつかの誤差があります。二乗平均平方根誤差を測定しますか、それは測定値を球の中に配置するようなものです。それとも最悪の誤差、1万のうち最悪の誤差を測定しますか、それは立方体のようなものです。高次元では、誤差棒を球にしたいのか立方体にしたいのかという問題で、違いが出始めます。

そうです、その近似には大きな違いがあります。高次元に行って低次元の問題を解決するというテクニックを言及されましたが、それは数学者が使う多くのツールの一つです。他には、背理法などがあります。あなたのお気に入りの数学的証明のタイプは何ですか。そしてそれに取り組んでいるとき、終わらせるのがとても楽しみになりますか。

背理法と証明のスタイル

背理法ですね。ハーディに素晴らしい引用があると思います。チェスでは、チェスプレイヤーはポーンやビショップを差し出すかもしれません。しかし数学者はゲーム全体を差し出すと。

犠牲にするということですね。

ええ。だから、この結論を証明したいとします。結論が偽であるということを与えましょう。それを使って進めてください。そうすれば、矛盾が生じることを示します。これは実際にはテクニックです。一方では非常に直感的ではありません。私たちが教える学部生は、背理法の概念に非常に苦労します。しかし一方で、これは小学生がお互いに教えるのを見たことがある概念です。

休み時間に、子供たちが誰が一番大きな数字を言えるかというゲームをしているのを見るかもしれません。1,000と言い、次に100万、10億、10億の10億と続けます。しかしある時点で、子供の一人が、他の子が何を言っても、その数字に1を足せばいいことに気づきます。彼らは自然数に最大の数がないことを証明したのです。これは背理法です。もし誰かが最大の自然数があると主張したら、1を足せば矛盾します。

実際には非常に直感的な証明テクニックですが、正しい方法で教える必要があります。時には子供たちが自分自身で教えることができます。私が最も好きな証明の議論のタイプは、数学の異なる分野間で予期しない接続を作るものです。例えば、離散数学と連続数学の間です。低次元と高次元について話しました。

組合せ論に関係する問題があって、現実世界とは何の関係もないのに、その物理モデルがあることがわかり、物理学のアイデアを使うことができます。もちろん物理学者は常にこれを行っています。彼らにも対応関係があって、本当に驚くべきものです。そうですね、それらは私には魔法のように感じられます。

平方根の重要性

ええ、少なくとも私の物理学者の心にとって最も有名なものは、2の平方根が無理数であるという背理法による証明です。これはユークリッドの元の証明ですか、それとも彼以前にさかのぼりますか。ユークリッドかピタゴラス、ピタゴラス派かもしれません。ユークリッドは素数が無限にあることを基本的に同じアイデアで証明しましたよね。

ええ、そうです。実際、ユークリッドには多くの感謝をしなければなりません。彼が最初に多くの定理を書き下ろしたわけではありません。例えばピタゴラスの定理、バビロニア人がバージョンを持っていたと思いますし、中国人もバージョンを持っていました。しかし、本当に証明という概念を導入したのは彼です。数学に関する複雑な事実を、より単純な公理から演繹できるという概念です。これは以前には見られなかった非常に影響力のある考え方でした。

平方根演算という概念自体が、私を常に魅了してきました。例えば、物理学に非常に規則的に現れるように思えます。私の好奇心をかき立てるいくつかの例に入ります。最終的には、物理世界への数学の不合理なまでの有効性についてのウィグナーの有名な声明に結びつけたいと思います。それについてもう少し話します。これは平方根にも接線的に関係しています。

例えば、古典力学における平方根は、位置と運動量を含むポアソン括弧と呼ばれる演算子を構成できます。それらを古典世界から量子世界に持っていくとすぐに、可換でゼロに等しいのではなく、基本定数のマイナス1の平方根倍に等しくなります。平方根と虚数の概念を導入すると、物理学者に非常に多くの数学が開かれることに私は驚嘆します。

知的な宇宙人が、すべての数学を知っていて、これを私たちに教えることができたのか疑問に思います。それとも平方根演算には何か特別なものがあるのでしょうか。LLMではLU分解を使います。スピナーがあり、スピナー表現があり、平方根があります。平方根には何か特別なものがあるのでしょうか。言い換えれば、なぜ立方根や5乗根や100乗根ではなく、例えば物理学で平方根がこれほど普及しているのでしょうか。

そうですね、私たちは世界を連続的なユークリッド空間として経験します。私たちの空間的直感から最も自然な数の概念は実数です。実数には多くの素晴らしい性質があります。実数の代数は非常にうまく機能します。加法は可換です。x+yはy+xであり、x×yはy×xです。乗法も可換です。しかし、一つの欠陥があります。すべての多項式方程式が根を持つわけではないのです。

例えば、方程式x²+1=0を取ると、実数ではx²+1は決してゼロになりません。x²は常に正だからです。だから、代数的に完全ではありません。しかし、完全であることに非常に近いです。奇数次の多項式、例えば3次のx³+3x+1を取ると、根を持たなければなりません。奇数次の多項式は、xを非常に大きくすると非常に大きな正になり、xを非常に大きな負にすると負になります。実数は連続的で、多項式は連続的なので、その間のどこかでゼロに到達しなければなりません。

だから、世界のすべての多項式の半分について、実数で解くことができ、半分は解けません。後知恵では、これは実数を2倍にして、代数的完全性というこの非常に有用な性質を得るべきだということを強く示唆しています。

実際、複素数と呼ばれる数があり、実数の2倍の大きさです。実数は1次元で、複素数は2次元です。そして、多くの素晴らしい幾何学的構造、素晴らしい代数的構造を持っています。最終的にはこの代数的完全性に由来します。代数から、数体系を2倍にする方法は、以前には持っていなかった平方根を追加することだとわかっています。体系を3倍にしたい場合は、以前には持っていなかった立方根を追加する必要があります。

だから、現在持っているものの2倍の大きさの新しい数体系を探していることがわかっている場合、現在平方根を持たない数の平方根を投入するのが非常に自然です。例えばマイナス1のような。

つまり、それが振り返ってみると、予測できた方法の一つです。

ええ、これは歴史的に複素数が発見された方法ではありませんが、一つの説明になり得ます。

判断基準:本の表紙で判断する

皆さん、通常は私がゲストに本の表紙で判断してもらうのですが、今日は自分自身の本を自分で判断するようお願いしています。私の最新の本「Focus Like a Nobel Prize Winner」は、経済学から平和、もちろん物理学まで、9人の世界最高峰の頭脳、ノーベル賞受賞者からのアドバイス、人生のヒント、集中力と生産性のヒントが満載です。

ぜひチェックしていただければと思います。出版社がAmazonで特別セールを実施してくれました。だから今日Amazonに行って、Kindle版を手に入れてください。

超越数と数の柔軟性

それから、多項式方程式を解かない超越数と呼ばれる数のクラス全体があります。そうですよね。

ええ、そうです。多項式の根があります。

私たちは数の概念が非常に柔軟であることを学びました。つまり、学校で教えられたすべてのものが後で変更されないというのは、よりシンプルに感じられるでしょう。人々は15年ほど前に惑星の概念が変わったときに非常に動揺しました。私たちも時々数学でそれを行います。例えば、1は約100年前までは素数でした。

本当ですか。ああ、私はまだ1を素数だと考えていますし、冥王星を惑星だと考えています。

ええ、そうですね。しかし、数学者や科学者、あらゆる研究において、最初に主題を研究するとき、どの概念が最も基本的で重要で、どれがそうでないかを本当には知りません。だから経験に基づいて推測します。おそらく、より小さな因数を持たない数が重要だと思います。

だからそれらを素数と呼びます。あるいは、空で動く星が重要だと思うかもしれません。だからそれらを惑星と呼びます。しかし時間が経つにつれて、実際にはわずかに良い性質を持つわずかに良い定義があることに気づきます。天文学者に、新しい惑星の概念がなぜより良いのか話すことはできませんが、例えば、私たちが学んだことの一つは、素数の本当に重要な性質の一つは、算術の基本定理と呼ばれるものです。

任意の数を素数に正確に一つの方法で分解できるということです。因数の順序を除いて。だから12は2×3×2または2×2×3ですが、順序を入れ替える以外には、数を素数に分解する唯一の方法です。化合物を原子に分解する唯一の方法があるのと同じように。だから素数は掛け算の原子のようなものです。

しかし、もし1を素数にすると、算術の基本定理を放棄しなければならないでしょう。なぜなら、12は1×2×2×3にもなるからです。だから、数論においてこの本当に重要な定理に多くの例外を追加することになります。だから、再定義することにしました。

しかし、冥王星と同じように、地球上の生活に影響はありません。より人間の慣習ですね。

ええ、人間の慣習です。しかし、時間とともに人間の慣習を更新して、現実によりよく適合させます。

双子素数予想と疑似ランダム性

あなたは素数ペアの研究をしましたよね。

はい、そうです。素数は数学で最も古い主題の一つです。ユークリッドが2,000年以上前に素数についての最初の定理を持っていました。だから非常に古いのですが、素数に関する最も基本的な質問でさえ、まだ決定的に答えることができないのは非常にイライラし、迷惑です。

ほぼすべての素数の質問について、答えを予測することはできますが、それらの多くについて100%の数学的証明基準を得ることはできません。最も基本的な質問の一つは、少なくとも300年前からある双子素数予想と呼ばれるものです。素数が無限にあることを示すことができます。素数は決して終わりません。望む任意の数より大きな素数を常に見つけることができます。しかし、素数の双子については同じことをまだ言えません。

これらは、最も近づくことができる2だけ異なる素数のペアです。例えば、11と13です。まあ、2と3はより近いですが、2の後、すべての素数は奇数です。だから、最も近づけるのは2です。素数はパターンに従っていないように見えることを観察できます。時には素数のギャップが大きく、時には小さいですが、時々互いに近づき、双子ができます。

そして、それらは無限に発生するように見えます。コンピュータで何兆もの双子を見つけることができます。しかし、それらが永遠に続くことを証明したことはありません。私たちは、素数が基本的にランダムな数列のように振る舞うという予測を持っています。素数と同じ密度のランダム数列があれば、無限に双子を形成します。しかし、素数はランダムではありません。

私たちが見ることができる明らかなものを除いて、明らかなパターンがないという意味で、疑似ランダムだと考えています。例えば、奇数であるというパターンです。だから非常にありそうな仮説ですが、証明できません。

疑似ランダム性とは、何らかのアルゴリズムから導出できるが、すべての場合ではないという意味ですか。疑似ランダム対ランダムの区別について説明してください。

ランダムとは非決定論的であることを意味します。単一のパターンがないということです。素数を忘れていて、コンピュータプログラムで再生成しなければならない場合、まったく同じ集合を生成するでしょう。一方、サイコロを振ったりコインを投げたりして集合を生成する場合、異なる集合が得られます。

疑似ランダム集合は、ランダムまたは決定論的ですが、統計的にはランダムノイズと区別がつきません。例えば、ランダム数列では、数字が均等に分布しているべきです。5で終わる数字と7で終わる数字、6で終わる数字が同じ数だけあるべきです。さて、素数は完全に疑似ランダムではありません。特定のパターンを避けるからです。例えば、奇数になる傾向があります。

しかし、そのような明らかなバイアスを除外する方法があり、それらを除外すると、ランダムな数と区別するテストがないと予想されます。これは実際に暗号にとって重要です。パスワードやクレジットカード番号のような機密データが、素数にパターンがないことに暗黙的に依存する数学的ルーチンを使って暗号化される多くの暗号システムがあります。ウェブトラフィック、暗号通貨、金融取引を暗号化するために使うものです。

そして、素数を様々な数学的方法で使ってこれらの数字を混ぜ合わせることで、実際に送信するデータはランダムノイズと区別がつかず、個人データに関する情報を伝えないと信じています。そして、本当にそうであることを願っています。数学者が実際に素数を研究することが重要な理由の一つは、時々ショックを受けることがあるからです。少なくとも数十年間、数論では本当には起こっていませんが、私たちが以前に気づいていなかった素数に本当に異常な未発見のパターンがある可能性があります。そしてもし存在すれば、暗号システムの脆弱性を示す可能性があります。

楕円曲線や他のもので同様のパターンが発見された他のいくつかの暗号システムがありました。そこでは、これらの弱点のために、人々は実際に異なる暗号システムに移行しなければなりませんでした。

物理学が数学に与える影響

ええ。それは、ウィグナーが言ったことの一種の逆転、あるいは矛盾を提起します。彼は自然科学や物理科学における数学の不合理なまでの有効性についてコメントしました。しかし、あなたが今言ったことは、数学世界における物理学の不合理なまでの有効性について考えさせられます。

言い換えれば、暗号について言及し、量子コンピュータがおそらく因数分解してこれらの以前は破られないと考えられていたものを破ることができると言いました。だから、私の質問は、数論、純粋数学において、物理世界から、量子世界から数学世界への量子コンピュータが何かを照らしたり解明したりできるものは何でしょうか。あなたはそれを実行可能なトピックだと見ていますか。

量子コンピュータは魅力的なトピックです。様々な方法で数学とインターフェースしています。一つは実際に良い量子アルゴリズムを作成する実際のソフトウェアエンジニアリングです。古典的なコンピュータとは非常に異なるタイプのソフトウェアの考え方が必要です。古典的なコンピュータでは、ビットのメモリがあって、それらを反転させて、これをやったらあれをやってという順次的な考え方があります。そして、何十年もの経験があります。

量子コンピュータの状態は、0と1のビットの束ではなく、波動関数です。割り当てる操作は、それらに掛ける必要がありますが、本当に本当に大きな行列でしか掛けることができません。ただし、基本操作では、行列はほとんど恒等行列で、一度に少数のコーナービットだけを変更します。しかし、それらを非常に効率的な方法で結合して、本当に複雑な操作ができるようにしたいのです。

量子コンピュータは、古典的なコンピュータよりも指数関数的に強力ですが、同時に指数関数的により制限されています。

そうです。

重ね合わせの量子状態を同時に扱うことができるため、原理的には指数関数的なスピードアップがあります。因数分解や量子化学基底状態などの特定のアプリケーションでは、少なくとも原理的には非常に非常に強力です。

しかし、量子力学も非常に制限的です。量子状態にできることの数は、線形操作しかできず、時間可逆的な操作しかできません。

非破壊的ですね。

ええ。だから、可逆的コンピューティングの分野を開発する必要があります。エラー訂正もはるかに厄介です。だから、ソフトウェアの課題があります。量子コンピュータが現実になれば、これまで行ったことのないタイプの大規模計算に使われるかもしれません。

それらが数学の実際の理論に実際的な影響を与えるかどうか、すぐには例を思いつきません。しかし、確かに古典的な複雑性理論は非常に影響力がありました。

歴史的に、数学者は何かが真か偽か、証明可能か反証可能かにしか関心がありませんでした。コンピュータの出現により、人々は計算可能性についても質問し始めました。何かが存在することを証明できたら、さらに進んでアルゴリズムがあると言えますか。アルゴリズムは指数時間ですか、多項式時間ですか。真理の概念よりもはるかに細かい粒度の真理の概念です。

真か偽かだけでなく、実際に計算することがどれほど簡単かです。

そして、それは非常に生産的な数学を生み出しました。時には、何かが存在することを示すだけでなく、実際にそれを見つける努力が、新しいテクニックを生み出します。複雑性理論は、文がどれほど真であるか、より微妙な理解を与えてくれました。何かが真であることを証明しても、洞察がないかもしれません。

それを機能させた鍵となる要素は何だったのか。あるいは、2つの異なる証明があった場合、どちらの証明がより良いか。しかし、一つの証明が他よりも速いアルゴリズムにつながるかもしれません。だから、ああ、その証明は実際にはより強い。より効率的だと言えます。

そうですね、はるかに多くの洞察を与えてくれます。数学者が求める証明への洞察です。

AIと数学の未来

AIは実際に数学における新しい発見や、そうでなければ存在しなかった新しい証明を可能にしましたか。

ゆっくりと始まっています。AI自体では、現在のAIの大きな弱点は、人間の数学者が問題を推論するように見える出力を生成し始めることができますが、それは根拠がないということです。発見的です。しばしば間違いを犯します。

もし学生が黒板で問題を解いていて、緊張していて、突然やってきた人に対して、正解するかもしれないし、間違えるかもしれません。しかし、弱い学生で、実際にやっていることの基本的な知識がない場合、一度レールから外れると、本当にレールから外れてしまいます。

これが現在の大規模言語モデルの根本的な問題です。しかし、より厳密で根拠のある推論システムの一部としてそれらを使う場合、大規模言語モデルと会話して提案をさせ、出力を理解し検証する場合、人々はいくらか成功を収めています。大規模言語モデルと数学の問題について話すと、いくつかの提案を出してくれます。人間の専門家はそのうちのいくつかを実行可能ではないとして却下できます。

いくつかはすでに考えたことがあるかもしれませんが、1つか2つは、自分で思いつくべきだったのに気づかなかったものかもしれません。AIモデルがすでに役立ち始めている一つのことは、文献レビュータイプのタスクです。ある種の問題があり、文献には既にこの問題を攻撃する方法が12種類ほどあるとして、問題に取り組んでいる人間は6つは覚えているかもしれませんが、残りの6つを忘れていて、思い浮かばないかもしれません。

これらのAIモデルを使って、忘れている6つを思い出させることができます。存在しない3つをさらに幻覚するかもしれません。だから信頼することはできません。

監視する必要があります。

ええ、検証する必要があります。将来的には希望があります。特定のタイプの証明を自動的に検証できるソフトウェアがあります。

そうですね。

だから、大規模言語モデルに、検証できる言語でのみ出力を強制し、幻覚をフィルタリングする希望があります。それはワイルズの証明やフェルマーの定理やあなたの仕事、ナビエ・ストークス方程式を再現することができましたか。つまり、自然知能の人間があなたのように実際に引用符で囲んで再現できただけですか。

そういう問題があります。しばしばできますが、汚染と呼ばれるものがあります。結果が教科書で教えられている場合、これらのAIが訓練するトレーニングデータに暗黙的に含まれています。だから、基本的に同じように記憶しています。黒板にいる学生が教科書で見た証明を記憶から再現するのと同じです。

AIは基本的に世界のすべての教科書を読んでいるので、それが起こったとき、それがトレーニングデータだったのか、本当に考え出したのかを見分けるのは難しいです。AIに思考の連鎖を説明するように求めると、しばしば完全にナンセンスを与えます。知らなかったことが明らかです。

ええ、私の学生Evan Watsonと試したことがあります。JPLが持っている過去3,000年間の水星の軌道に関する情報を与えました。そして、この惑星でこれを観察した場合、基本的に、まずこの異常な水星の近日点の歳差運動を発見し、それを予測できますかと尋ねました。しかし、完全に不可能でした。

まずすべてを離散化し、すべてをユークリッド的にしなければなりませんでしたが、それは完全に台無しにします。だから、私は提案しました。ジョークのようなものですが、私はそれをケプリングテストと呼んでいます。基本的にチューリングテストです。実際のAIが、あなたのような人間が検証できる、これまで知られていなかった新しく未知の予測を思いつくことができるようになったとき、それが真実だとわかるでしょう。

ええ、それはAIの非常に有望なユースケースだと思います。ニューラルネットワーク一般は、パターンを作り、相関関係を検出するように設計されています。数学にはいくつかの例があります。例えば、結び目理論では、高度なLLMではなく、より古い学校のニューラルネットワークが使われて、人々が以前に疑わなかった異なるタイプの結び目不変量間の相関を検出しました。

そして、最初はこのタイプの相関は、ただのブラックボックスの関係でした。結び目はこれらのループで、いくつかは解けて、いくつかは解けません。それらには結び目不変量と呼ばれるこれらの数字が付いています。ニューラルネットワークは、100万個の結び目のデータベースを供給することで、署名と呼ばれる一つの結び目不変量が、双曲不変量と呼ばれる他の不変量の束から非常に高い精度で予測できることを発見しました。

すごいですね。

しかし、このニューラルネットワークはブラックボックスでした。これらの20個の数字をハイパー不変量として供給すると、署名はプラス3であるべきだと吐き出し、90%の確率で正しかったのです。しかし、このブラックボックスを手に入れたら、それを分析できました。この入力を変更したら、この双曲体積などを変更したら、出力がどれだけ変わるかと言えました。

だから、20個のダイヤルの箱のようなもので、それをいじることができました。基本的に実験を実行することで、実際にどの入力が重要かを見ることができました。3つの入力が実際に非常に重要で、他の17個は非常に周辺的だとわかりました。そのタイプの分析を行うことで、実際に関係が何であるかについての洞察を得ることができ、数学的予測を行うことができ、それを証明することができました。

ニューラルネットワークモデルを手に入れたら、実際に調査できます。天文学の例では、ニューラルネットワークが正確に物理学の新しい法則が何でなければならないかを教えることができないかもしれませんが、少なくとも今後1,000年間の水星の軌道を予測できます。これが私のモデルです。

それを扱おうとすることができます。水星の周期や質量などを変更したら何が起こるかを試してみて、実験的に自然の法則を解明できるかもしれません。従来の実験や理論とは異なる新しいパラダイムを現実にアクセスするために与えてくれます。

ええ、その例を使って、AIが暴走して私たち全員をペーパークリップに変えるといった、AIドゥームの人々がたくさんいます。しかし、あなたが言及したこの特徴を持っているように見えます。すべての人間の知識を平均化しているようなもので、エラーや間違いがありますが、使用される人間の知識の量によって制限されています。そのレベルでは、トレーニングセットです。しかし、何か魔法のようなものがあります。

数学について疑問に思います。つまり、私は偉大さの前にいます。しかし、数学は、大規模言語モデルや他の現代的なAIを訓練し実行するために、本当にそれほど複雑で本質的に複雑なのでしょうか。

大規模言語モデルを訓練し実行するための数学は、それほど複雑ではありません。学部の数学専攻なら、すべての前提条件を持っているでしょう。基本的には、行列の掛け算がどのように機能するかと、少しの微積分を知る必要があります。しかし、良い数学理論がない領域は、これらのモデルのパフォーマンスを評価する方法を予測することです。

どのように実行するかの謎はそれほどありません。大規模言語モデルを作成し、訓練し、実行する方法を知っています。しかし、驚くべきことは、特定のタスクには本当にうまく機能し、他のタスクにはうまく機能しないということです。そして、事前にわかりません。どのタスクが良く、どれがそうでないかを予測するための良いヒューリスティックな規則さえありません。経験的実験を行うしかありません。

理由の一部は、訓練するデータです。データは一つのレベルでは、ただのゼロと1の文字列です。数学的には、非常にランダムなデータを理解しています。完全なノイズ、完全にランダムなゼロと1があれば、数学的確率論でこれを非常によく分析できます。そして、非常に非常に構造化されたタイプのデータがあります。すべて1か、すべてゼロか、ただ1 0 1 0と非常に周期的な方法で交互になるような数列です。

非常に構造化されたデータは非常によく理解しています。しかし、自然データであるタイプのデータ、例えば英語のテキストは、ゼロと1の文字列としてデジタル化できますが、非常に特定のゼロと1です。

しかし、完全に予測可能なほど特定的ではありません。しかし、まだいくらか予測可能なようです。部分的に構造化されたオブジェクトのための良い数学がありません。これは実際に物理学との類推があります。物理学では、すべてが平均化されている連続体力学があります。

そこには良い理論があります。そして、個々の分子や粒子を見ることができる原子レベルの物理学があります。しかし、メソスケールでは、多くの中間構造があります。例えば細胞、生物学的細胞のような。

バージェントですね。出現的です。

ええ、出現的です。これについての良い数学がありません。原理的には原子に分解できますが、分析することは不可能です。

ええ、数学的には不可能ではありませんが、実際には物理的に不可能かもしれません。LLMについて話すときに避けられないのは、中間のLは言語です。友人のガリレオに話を移します。彼の数学の本と論文の一つについて、あなたの印象を聞きたい本を持ってきました。

しかし、彼は自然の知識の書、宇宙は数学の言語で書かれていると言いました。それは後にウィグナーなどによって反響されました。すでに議論したように。しかし、それは本当に言語なのでしょうか。語彙も構文もありますが、同じテキストで、シェイクスピアと数学が、本当に根本的に何らかの原言語のようなものであれば、もっと多くの組み合わせや類似性があると思うのですが、もう一度、あなたの意見を聞きたいのですが、数学を言語として考えますか、それともそれ以上のものですか。

数学者が互いに、または他の科学者と話すとき、数学を言語として使わなければなりません。数学言語と自然言語の違いは、数学言語が時間とともに進化して、基礎となる数学をできるだけ効率的に記述するようになっていることだと思います。

自然言語は常に効率性についてだけではありません。ニュアンスや感情を伝えたり、芸術を表現したり、ただフラストレーションを表現したりしたいこともあります。

だから、純粋に効率性によって駆動されているわけではありません。しかし、数学はかなりそうです。部分的には、時間とともにますます野心的な数学的タスクを実行しようとするからです。もしこのような方法で数学言語を最適化しなければ、これらのより複雑なタスクを実行できないでしょう。科学でも同じことが言えます。

自然の法則を更新し続けて、より複雑な予測ができるようにします。効率性のために言語を最適化するとき、基本的に宇宙の記述をできるだけ最小限でエレガントな形に圧縮しようとしているだけです。そうすることで、宇宙が実際にどのように機能するかの本質に何らかの形で到達しています。

おそらく宇宙は何らかの自然法則によって動作していて、まだ知らないかもしれませんが、これらは単純で予測可能な法則であり、誰かが行き当たりばったりで物事を作っているだけの大きな混沌ではないと信じたいです。科学の全歴史は、その信念を検証してきたようなものです。

自然主義的な哲学があり、数学も数学理論に対して同じことをしようとしてきました。数学的現象の多くを説明する最もエレガントで最小限の入力を見つけようとしています。だから、時間とともに収束するのかもしれません。なぜ数学言語や形式主義のタイプが数学にとって良いのか、例えば曲がった空間の言語があらゆる種類の幾何学を記述するのに良いのと、宇宙を記述する言語がたまたまかなりよく一致するのか。

アインシュタインが時空の空間を記述するために同じ言語を使うように。

ええ、まさに。

数学は発明か発見か

長い間、サイモンズからスティーヴン・トロッツまで、多くの数学者に尋ねるのが大好きな質問の一つは、数学は発明されたものか発見されたものかということです。

だから4つの選択肢があります。発明、発見、両方、またはどちらでもない。この古典的な議論についてどう考えますか。

間違いなく両方です。私たちが発見しようとしている固有の数学的構造があると思います。しかし、そのためには数学言語を発明しなければならず、最初はあまり良い言語ではありません。

間違ったことに焦点を当てています。しかし、時間が経つにつれて、言語をより効率的で強力にしようとすることで、自然に数学の理想的なプラトン的理想に収束します。それは確かに発見のように感じられます。しかし、人間的な手段を通じて行われます。

だから、発明と発見の両方です。

ええ、それがジム・サイモンズが私に言ったことです。教育の未来を見るとき、あなたはフィールズ賞受賞者であるだけでなく、数学者であり、父親であり、他のすべてをしていますが、教師でもあり教育者でもあります。未来についてのビジョンについて話してください。教育の哲学は何ですか。

多くの理由から、かなり進化する必要があります。世界は無限に複雑で不安定で予測不可能になっています。そして今、AIで、人間は認知タスクである種の独占権を持っていました。

そして今、AIがあります。実際、AIで起こっている問題の一つは、近い将来に人間レベルの研究数学や他の分野を追い越すというよりも、すでに学部レベルの数学で、今割り当てている多くの宿題がAIによってできるようになっています。

ええ。

だから、教え方を再発明しなければなりません。より重要になることの一つは、学生は、見た情報を検証する方法についてはるかに多くのトレーニングが必要だということです。過去には、少数の権威ある情報源、教科書や教師などがありました。

ソーシャルメディアやインターネット、あらゆる種類の情報、そして今ではAI、本当に変動する品質のすべての情報がありませんでした。一方で、過去には、内容が低品質だった情報は、提示も低品質でした。

本当に良く作られた教科書は、クレヨンで書かれたものよりもおそらく正確な内容を持っているとわかりました。しかし今、高品質のプレゼンテーションを作成する能力は、高品質のコンテンツを作成する能力をはるかに上回っています。

YouTubeビデオや教科書が完璧に見えるものを持つことができます。今ではAI生成の出力ですが、多くの根本的な間違いがあります。だから、批判的思考を奨励する必要があります。すでに教師が実験していることを見ています。これは私が割り当てたであろう問題です。しかし、それをChatGPTに与えて、これが答えです。それは間違っています。批評して修正してくださいと。

興味深いですね。

これらは、より対話的なスキルだと思います。権威から獲得される受動的なものとして知識を扱うのではなく、常に疑問を持たなければならないものです。

そして苦闘します。

興味深いですね。それはカリフォルニア工科大学のジョン・プレスキルが量子コンピューティングと量子優位性などについて話していることを思い出させます。量子コンピューティングのエラー訂正の問題を克服する方法の一つは、ただ多くのキュービットを問題に投げつけることです。そして、AIをより多く問題に投げかけるのだろうかと思います。自然な人間の脳にAIを使って何が間違っているかを証明させるのではなく、AIが自分自身を取り締まることができる場所に到達するでしょうか。それらを信頼するには何が必要でしょうか。

それらをより信頼できるようにすることは良いことですが、現在のAIとは非常に異なるアーキテクチャを使う場合、その性質上、本質的に信頼できません。

しかし、信頼できないツールを使う方法があります。乱数生成器は、私たちが持っている最も信頼できないデバイス技術ですが、暗号のようなあらゆる種類のことに非常に有用です。

ええ、これらのAIを良い検証と組み合わせて、出力を検証できる範囲でのみAIを使い、それ以上は使わない限り、素晴らしいツールになり得ると思います。

人間の科学者や数学者を補完するものとして見ています。人間の科学者は非常に少なく、研究に取り組む時間も限られているため、高価値の高優先度の孤立した問題に焦点を当てる傾向があります。しかし、数学や科学には、何百万もの長い尾のあまり知られていない問題があり、ある程度の注意が必要ですが、最も困難で重要なものではありません。しかし、誰かまたは何かにそれらを見てもらうのは良いでしょう。

だから、実際にAIの最良のユースケースは、最も注目度の高い問題をターゲットにするのではなく、実際には何百万もの中程度の難易度の問題だと思います。

そして、失敗するかもしれませんし、これら100万の問題の10%しか解けないかもしれませんが、それは10万の問題が解決されたということです。

だからスケールが大きな利点です。大学院生をこのようにスケールすることはできません。

合法的にはできません。

いいえ、合法的にも倫理的にもできません。しかしAIは、そこが本当の価値があると思います。

あなたの最優先タスクは今何ですか。

研究的には、今最も興味があるのは、数学を現代化し、より協力的で、一般の人々がよりアクセスしやすく、AIのような新しいツールを統合するための新しいワークフローです。何世紀も数学を行ってきた方法は根本的に変わっていません。今でも黒板が見えます。私のオフィスでは、まだペンと紙で作業しています。コンピュータは少し使いますが、それほど多くはありません。

私たちの協力はまだ非常に小規模で、2、3人と仕事をします。科学ではもちろん、何千人も。大部分は、一般の人々の貢献をどのように組み込むかを知らないからです。まず、私たちがすることの多くは非常に技術的です。

しかし、すべての単一ステップを検証しなければならない証明を合成する必要があります。何千人もの人がいた場合、千の小さなコンポーネントを検証しなければなりません。ごく最近まで実現可能ではありませんでした。また、これらすべての要因のために、他の科学、特にデータ駆動型の新しい科学と、新しい方法で現実世界とつながっている科学、例えばソーシャルネットワーク分析などと、本来すべきほどには協力していません。

だから、それが私の研究が向かっている方向だと思います。実際には技術よりも、数学の社会学に近いです。そして最近では、数学研究のための資金を確保しようとすることに興味を持っています。近年、非常に不安定になっています。

名声と謙虚さ

それについてはもう少し話します。さて、友人のセルジオ・クライナーマンがあなたが今言及したことに関連する質問を私に尋ねました。科学の社会学について、彼は、地球上で最高の数学者として評判があり、フィールズ賞受賞者であり、非常に若く極めて成功した数学者であることが、あなたにとってストレスだったかどうか疑問に思いました。

そのマントル、肩にかかるその重みは、あなたに影響しましたか。挑戦でしたか、それともそうではありませんでしたか。

2006年の国際数学者会議の年を覚えています。私の人生は多くの点で変わりました。突然、大使館のような招待を受けました。通常会わないような人々と会いました。すべてのこれらの委員会に依頼されました。突然、私の意見が求められました。だからそれは大きな変化でした。

つまり、私はある程度有名でしたが、それに慣れるのには時間がかかりました。しかし、数学者を少し地に足をつけさせるのに役立つことの一つは、純粋数学者としての主なタスクは、解きたい問題があり、それらの問題を解決する定理を証明したいということです。証明は正しくなければならず、すべてのステップが検証されなければなりません。

どれだけ有名であろうと、どれだけ評判があろうと関係ありません。何かを証明したと言うだけでは済みません。私を信じてください。詳細を提供しなければなりません。真実によって。

そして、証明がなければ、証明がありません。だから、これらの賞からエゴがどれだけ高くなることができるかに対して、これが自然にいくつかのチェックを提供すると思います。解きたい無数の問題があり、双子素数予想について話しましたが、解きたい何百もの問題があり、解き方を知らないだけです。だから、解いた問題よりも解けない問題の方が多く知っています。

だから、それがある程度正直に保ってくれると思います。

数学者の生産性と年齢

数学者は30歳までに最高の仕事をするという古い決まり文句についてはどうですか。あなたは私と同じ50代です。その声明についてどう思いますか。ジム・サイモンズは、彼は本当には信じていないと私に言っていました。実際には時計がある時点で動き始めて、10年か20年あると考えていました。彼は30歳でやめましたが、それは任意の年齢に達したからではなく、ペンタゴンで10年間働いたからです。この図を聞いたことがありますか。どう思いますか。

ええ。数学者によってキャリアの軌跡が異なります。私は間違いなく典型的で、若いときに始めました。いくつかの学年を飛び級しました。加速しました。だから、若いときにすべての仕事をしました。しかし、かなり遅く始めた他の数学者もいます。大学まで数学に興味を持たず、かなり優れた数学者になりました。

プリンストンでの私の指導教官は、毎週彼と会って、彼が私に取り組むように割り当てた問題について議論しました。私は何時間も費やして、あらゆる種類のクレイジーなことを試して、試したすべてのことがうまくいかなかったと報告しました。これを試したけどうまくいかなかった。ただエネルギーと時間を費やして、彼は黒板に書いたものを見て、数秒考えて、あなたが抱えている困難は、この論文で誰それが抱えていた困難とまったく同じだと言いました。

だから、ファイリングキャビネットに行って、このプレプリントを取り出して、これを読めば問題が解決すると言いました。ええ、それは違う数学のやり方でした。彼がどうやってそうしたのか見えませんでした。なぜなら、家に帰って読むと、問題が解決したからです。

次の週に別の構造にぶつかりましたが、私はこれらの問題に何時間も費やし、彼はただ10秒考えて、経験から何をすべきか知っていました。

知恵だけです。

知恵です。ええ、知恵です。だから、年を取るにつれて、数学に取り組む異なる方法を見つけると思います。最初ほど派手ではないかもしれませんし、ブルートフォースよりも多くなるでしょうが、実際にはより生産的になることがあります。今では私の指導教官がしたように、私の大学院生に同じ戦術を使うことができます。

教育学:数学における物理学の最小限の知識

教育学に関連する質問をさせてください。これまで話してきたことから、ウィグナーとの関係で、数学が物理学にとって本当に重要であることは明らかです。数学者が持つべき実験的または物理学の最小限の知識があると思いますか。これを理論物理学者に尋ねたことがあり、実験物理学とはるかに密接に関連しています。

しかし、数学者が恩恵を受けることができる現実世界との一定の接続があると思いますか。

ああ、間違いなく。数学に取り組む方法が非常に多くあることが、数学の素晴らしいところの一つだと思います。非常に視覚的な数学者になることができ、絵を見ます。非常に記号的な数学者になることができ、数字や記号を操作するゲームとして見ることができます。あるいは、非常に物理学指向の数学者になることができ、常に物理的な類推を使い、様々な物理学の分野からの洞察を使って助けることができます。

つまり、非常に直接的な接続があります。コーシー微分方程式を研究する場合、自然に物理学を知るべきです。なぜなら、物理学には微分方程式の素晴らしい例がたくさんあるからです。流体がどのように機能するか、波がどのように機能するかについての直感を持つことは、本当に本当に役立ちます。一般的には、他の分野でより多くを知っているほど、時々経済的な用語で考えることもあります。

x < yを証明したい場合、それについて考える一つの方法は、y量のものを所有している場合、Xを買うことができるかということです。そして、時にはできませんが、直接はできないかもしれませんが、YをZに交換してから、ZでXを買うことができるかもしれません。

だから、バザールがあって、XをYに交換できる特定の商人がいて、これらのものの良い価格を交渉したいし、悪い取引であればXYZを交換したくないという考え方に身を置くと、そのような考え方は実際にXからYへの正しいルートを見る上で非常に役立つことがあります。

時には、いくつかのタイプの方法をゲームとして考えることができます。解析では、すべてのイプシロンに対してデルタが存在して云々という文があります。イプシロンデルタタイプの証明と呼ばれます。学部生はしばしば非常に嫌います。なぜなら、ゲームの用語ではかなり複雑だからです。チェスのようなゲームに慣れている場合、対戦相手がここに動いた場合、どうやってその動きに対抗するかのようなものです。

誰かがイプシロンを与えるたびに、それに対抗するデルタの種類が必要です。そして、これらの種類のゲーム理論的な用語で考えると、時々有用な考え方を提供してくれることがあります。

だから、興味のある生物学、社会科学、すべての学問分野を使うことができます。

ええ、それはこの本を見せたかったことを思い出させます。長い間あなたと話したかったことです。これはコンパッソ・ジオメトリコと呼ばれています。英語版は、ガリレオの幾何学的・軍事的コンパスの操作です。これは北と南を見つけるためのものではなく、実際には計算を行うためのものです。だから、本当にスライド定規の初期版です。これは1649年の第2版です。1601年の初版は、カリフォルニア大学の私たちの給料の数倍です。

だから、それを買う余裕はありませんでした。しかし、彼が死んでから7年後のこの紙がどうなっているのかわかりませんが、ガリレオの実際の署名に加えて素晴らしいことは、彼は在庫を持っていました。彼はマイナーな有名人でした。彼はイタリアを離れたことはありませんでした。イタリアの外に出たことはなく、ただ注目しています。

美しいですね。宝物のように感じます。もう少しでそれを持ち出します。しかしここにその例があります。セグメントがあり、金属でできていて、角度などができる表示がありました。しかし、計算もできました。

計算の一つは、ちょっと面白いと思います。これは基本的に取扱説明書です。だから今日では、取扱説明書が付属していないiPhoneなどのデバイスを手に入れますよね。そして、使えることが期待されています。

だからある時点で、彼は線の長さを比較することについて話し始めますが、このページで通貨交換の規則について話していると思います。だからあなたはこれを言及しました。それを読んでいただけますか。それはクールでしょう。

同じ算術線の手段によって、あらゆる種類の通貨を非常に簡単で迅速な方法で他のすべてに交換することができます。まず、左側に交換したい通貨と金額の価格を取り、これを交換が行われた通貨の価格に横方向に合わせるように機器を設定します。例でこれを説明します。そうすればすべてが明確に理解されます。

フィレンツェの金貨のスクーティを税で交換したいとします。価値は6です。必要です。スクーティの価格が160であるコーディを計算します。チケットの価格は124です。私たちが同じことをすべきなので嬉しいです。

なぜなら今日ではスクーティは何の価値もないからです。数ドルの価値があるかもしれませんが、ガリレオが彼の相続人のためにこの本の初版を何冊か取っておいておけば、何十億ドルもの価値があるでしょう。

しかし、通貨交換のこの概念について言及しました。友人のエリック・ワインスタインや同じ人たちがゲージ理論を応用して取り組んできました。この理解についてどう思いますか。通貨交換は実際には非常に良い例です。

ゲージ理論は、本当に難解な物理学と数学の領域であるという評判がありますが、実際には、現実世界の多くの量はスカラーですが、自然な単位を持っていないということに帰着します。通貨は一つの例です。ある程度の富を持っている場合、ドルやユーロなどで測定できます。だから数字を参照できますが、実際には数字ではありません。

ゲージ理論は、数字で測定できるが、使用する単位の選択がある量についてです。または座標xyzですが、どの軸を使うかの選択があります。そして、地球上の異なる場所にいるかもしれませんし、異なる単位を使わなければならないかもしれません。だから、ある国から次の国に行くとき、単位が変わるかもしれません。だから、ある場所から次の場所に行くときに変換する方法が必要です。

同様に、高校で教えられている電磁場は、ベクトルです。各点でEとBの3つの数字があります。しかし、実際には数字ではありません。ある抽象空間の方向です。だから、ある場所から別の場所に移動すると、これらの数字は特定の方法で変わる必要があります。ゲージ理論はこれらの変換をどのように管理するかについてです。

そしてある日、通貨をここでポンドではなくリラで価格設定することに決めるかもしれません。それはあなたがどれだけ裕福かを変えません。しかし、ゲージは変わります。だから、このゲージがどのように機能するかの数学があります。そして、ゲージ不変なもの、そうでないものがあります。例えば、曲率です。ループを回って、ゲージが何であれ、ベクトルを輸送すると、時には開始した場所に戻ってきても、修正があります。修正は、どの通貨単位やゲージであるかは実際には関係ありません。

教育の不変量です。例えば、ある量のドルを持っていて、ヨーロッパに旅行してユーロに換え、それからアメリカに戻ってドルに戻す場合、為替手数料のためにまったく同じではないかもしれません。だから、ある意味で、世界の通貨バンドルに曲率のようなものがあります。

実際には曲率とまったく同じではありませんが、曲率のようなものです。

興味深いですね。

だから、実際に通貨は良いメタファーです。

ええ、異なる対称性の法則などから、予期しない性質が得られ、予期されない場所で物事が出現するというのは驚くべきことです。同じくフィールズ賞受賞者の一つの共通点は、高等研究所のエドワード・ウィッテンです。彼は私たちより60歳年上です。

だからフィールズ賞受賞者のエドワード・ウィッテンは、おそらく唯一の物理学者かもしれません。フィールズ賞を獲得した最初の物理学者です。彼は量子重力や弦理論などに広範囲に取り組んできました。その現状と、証拠がない非常に高次元の空間でしか物事を解決できないように見える数学的性質についてどう思いますか。

部外者としてのあなたの見通しはどこにありますか。ご存知のように、物理学は、宇宙と現実の性質についての私たちの概念をすでに何度も再評価しなければなりませんでした。地球が宇宙の中心ではないとしたコペルニクス革命がありました。アインシュタインの相対性理論があり、時空が曲がっていなければならないとしました。そしてもちろん量子力学があり、現実は実際には波動関数と量子場で表現されるべきだとしました。

これは今や自分自身の成功の犠牲者ですよね。なぜなら、観測可能な現象の99.9%をこれらの理論で説明できるようになったからです。しかし、非常に小さなスケールや宇宙の起源では機能しません。

数学が一貫していません。だから、何かで置き換えなければなりません。特に、時空が滑らかな多様体であるという考えは、プランク長での観測と互換性がないように思われます。

だから、それを置き換える何か他のものが必要です。問題は、それを置き換える候補が無限にあることです。数学が不合理なまでに有効であるにもかかわらず、正しい数学でなければなりません。ただ理論を考え出して、これがうまくいくことを望むことはできません。

何十年もの間、弦理論が主要な候補でした。非常にエレガントな理論です。専門家ではありませんが、私の理解では、データに適合する少なくとも一意の正典理論を提供するには至っていません。おそらく問題は柔軟すぎることです。多すぎる可能性を与えてくれます。

そしてそれは、ゲーデルの不完全性定理について尋ねようとしていた質問を提起します。これは、与えられた公理系から抽出できるものに限界を設定します。そしておそらく何が証明可能かに限界を設定します。私の理解では、物理学ではそれがありませんよね。重力が常に9.8m/s²であることを証明できません。それは暫定的で、新しいデータに従います。

そしてそれが美しさの一部です。しかし、私たちが持っているように見える最も近いものは、ポパーが良い科学の定義として提案したものです。反証可能であるということです。

物理学者には数学者への羨望があるとよく冗談を言います。多くの人が、社会学には物理学への羨望があると言いますが、私たちが物事を証明できないからだと思います。物理理論に常に尋ねられることができるこの限界があることになるのでしょうか。なぜなら、言ったように、1+1=2を証明することができます。バートランド・ラッセルとホワイトヘッドのプリンキピア・マテマティカでは200ページかかりますが、物理学では何も証明できません。それは私たちを真理の認識論的探求のどこに残しますか。

常に現実世界と現実世界のモデルを分けておくべきだと思います。物理学は数学的モデルを提供してくれました。そこでは物事を証明できます。例えば、相対性理論、アインシュタインの方程式は完全に正確な数学的方程式です。初期条件を指定できます。時空の初期条件を指定できます。1つの数学的解があります。システムの遅延はありません。

それについて証明できます。モデルは、数学的構成物のステータスを持っています。物理学が入ってくるのは、そのモデルが現実とどのようにインターフェースするかです。完全に一致しなくても、実験によって反証されても、実際には理論が破壊されたという意味ではありません。ニュートン重力はまだ非常に有用な理論です。技術的には正確です。

惑星や彗星などをモデル化するのに十分です。モデルを現実と混同しない限り、両方の数学的ケーキを持ち、それを非常によく食べることができると思います。

ガリレオのコンパスと圧縮センシング

まとめに入ろうとしていたときに、テリーがチョークをつかんで、医療画像機器から最高品質の画像を取得しようとしている医師たちを困惑させていた残酷な画像解析問題をどのように解決するのに貢献したかについて、稲妻トークをしてくれました。

テリーと彼の同僚たちは、圧縮センシングと呼ばれるものを使ってこの謎を解きました。これまでよりもはるかに少ないデータから物理画像を再構成するために数学を使ったのです。結果は、最大10倍速く実行されるMRIです。お楽しみください。ご馳走が待っています。

統計学者やエンジニアと、彼らが持っていた画像取得問題について話していました。彼らはそれを、ある種の線形方程式系をどのように解くかという数学パズルに変換していました。

そして、驚くべき結果を報告していました。従来の画像処理よりもはるかに少ない測定で画像を再構成できていました。そして、これを医療画像に使用したいと考えていました。彼らと話をして、彼らの小さな線形代数問題を解きました。

実際、最初はそれを反証しようとしていました。結果がどれほど良いか信じられなかったからです。しかし、それを試みることで、どのように機能するかを理解しました。この技術を発表し、非常に広く普及しました。実際、今日では、医療MRI機器の大手メーカーのほとんどが、MRIスキャンを約10倍速くするために、圧縮センシングと呼ばれる私たちの技術方法を使っています。

ええ、何が起こるかわかりません。最近私が行っている多くの仕事は、ある種の数字の列が与えられたときに、パターンがあるか、構造化されているか、ランダムであるかを判断する方法です。どのようなテストを適用できるか、どのテストが様々な方法で他よりも優れているかです。

おっしゃったように、これを使ってフォワードするかもしれません。ノイズをフィルタリングして、より良い信号取得アルゴリズムを得ることができるかもしれません。それは全体のエコシステムです。より応用的な科学者やエンジニアが、問題を解決するために文献から周囲のアイデアを得るためには、より基礎科学の人々が好奇心駆動型の方法でより多くの質問をする必要があると思います。

私たちがすることは、直接的な実用的影響がないかもしれません。しかし、これは不合理なまでの有効性です。これらの質問をする人々がいなければ、実際に物事を実用的なアプリケーション、現実にしようとしている下流の人々は、はるかに多くの時間を無駄にする可能性があります。おそらくはるかに多くのお金を無駄にするかもしれません。

一つ例を挙げると、シャノンは1世紀以上前に、もし1秒あたり特定のビット数のメッセージしか送信できない場合、どれだけの情報を送信できるか、このデータを圧縮する最良の方法は何かという通信複雑性を理論的に開発しました。そして、デジタル革命のずっと前に開発されたこの実用的な理論全体がありました。

後に、誰もが携帯電話を持っていて、膨大な量のデータを同時に送信する必要があり、携帯電話が互いに干渉しないようにする必要があったとき、この数学的な仕事が本当に重要でした。電話の作り方を直接教えてくれなかったかもしれませんが、シャノン限界と呼ばれる理論的限界のようなことをしてくれました。特定の量のスペクトルにどれだけの情報を詰め込めるかを正確に示してくれました。

そのおかげで、特定の量のスペクトルを購入できて、理論的にどれだけの情報を通信できるかがわかりました。予算編成と計画ができました。まだ多くのエンジニアリングが必要ですが、数学は何が可能かを教えてくれます。

だから、基礎科学が必要です。ペンと紙で数学を行うときにそれを行う方がはるかに安いです。10億ドルを展開して、必要な容量がない、または多すぎることに気づくよりも、後者の場合は無駄で非効率です。

素晴らしいですね。

テリーとのこの会話を楽しんでいただけたなら、私たちのインタビューのパート1をぜひご覧ください。トランプ政権の2025年半ばの政策のおかげで、テリーがUCLAで直面した劇的な削減について話しました。そして、スティーヴン・ウルフラムとの最近の会話もチェックしてください。史上最も深く考える数学者の一人です。

いいね、コメント、チャンネル登録を忘れずにお願いします。

コメント

タイトルとURLをコピーしました