AIが今日の科学的発見をいかに加速させているか、そしてこれからの展望 — OpenAIポッドキャスト第10話

本エピソードでは、OpenAIの科学部門責任者ケビン・ワイルと、研究科学者でヴァンダービルト大学物理学教授のアレックス・ルプサスカが、AIが科学研究にもたらしている革命的な変化について議論している。GPT-5が数学的証明、物理学の方程式解析、文献検索において既に顕著な成果を上げており、研究者の作業を劇的に加速させている実例が多数紹介される。特にルプサスカ自身の体験として、ブラックホールの対称性に関する困難な問題をGPTが18分の思考時間で解決した驚きのエピソードが語られる。現在、科学の最前線でAIモデルが人間の知識の境界を押し広げ始めており、今後5年間で科学研究のあり方が根本的に変容すると予測される。論文発表を通じて現状の能力を示すとともに、将来的には融合エネルギーや創薬、ダークマター研究など、あらゆる科学分野での加速が期待されている。

How AI Is Accelerating Scientific Discovery Today and What's Ahead — the OpenAI Podcast Ep. 10

AI is beginning to change how science gets done. Head of OpenAI for Science Kevin Weil and OpenAI research scientist Ale...

AIによる科学の加速
Open AI for Science Initiativeについて
ブラックホール物理学者の体験
文献検索の革命的な活用例
なぜ今が特別な時期なのか
モデルとの協働の重要性
科学研究における実践例
研究論文の発表について
学生や若手研究者へのアドバイス
5年後の展望
特別な歴史的瞬間
科学的ベンチマークと評価
トップダウンではなくボトムアップのアプローチ

AIによる科学の加速

こんにちは、アンドリュー・メインです。これはOpenAIポッドキャストです。

本日のゲストは、OpenAIの科学部門責任者であるケビン・ワイル氏と、OpenAIの研究科学者でありヴァンダービルト大学の物理学教授でもあるアレックス・ルプサスカ氏です。

AIが科学にどのような影響を与えているのか、今後発表予定の研究論文、そして今後5年間で科学がどこへ向かうのかについて議論していきます。

おそらく人々が自分の人生の中でAGIを最も深く感じる方法は、科学を通じてでしょう。ChatGPTを使えば、あちらの方向、こちらの方向、そしてあちらの方向へと立ち上げることができます。これらのツールからもたらされる加速は、科学を変えていくことになります。

Open AI for Science Initiativeについて

さて、あなたはOpen AI for Science Initiativeを運営されていますね。それについて説明していただけますか。

ええ、Open AI for Scienceのミッションは科学を加速させることです。つまり、科学者たちが今後25年分の科学研究と科学的発見を、25年ではなく5年で達成できるよう支援できるかという問いなんです。

科学は私たちの行動や生活の多くを支えています。世界最高の科学者たちの手に最先端のモデルを届けることで進歩をより速く実現できるなら、それを実行すべきです。それが私たちが取り組んでいることです。

なぜ今なのかと問われるかもしれません。なぜ1年前にやらなかったのか。なぜ1年後にやらないのか。大きな理由の一つは、最先端のAIモデルが新しい科学を実行できるようになり始めているのを目の当たりにしているからです。GPT-5が実際に新しいことを証明できる例が見られ始めています。おそらくまだ人間にはできないことではありませんが、人間がまだやっていないことです。

これらは、GPT-5が人間の知識の最前線を突破して未知の領域へと進出できることを示す、小さな実存証明のようなものです。OpenAIで働いて1年半ほどになりますが、学んだことが一つあります。それは、モデルが何かをできない状態から、かろうじて何かができるようになり、まだ得意ではないけれど初期の例が見られる状態へと、非常に速く移行するということです。

そして6ヶ月後、12ヶ月後には、突然、AIなしでこれをやるなんて想像できないという状態になります。科学は今、その初期段階にあると思います。AIを使っている科学者たちに実際の加速が見られています。時には新規性のある、まだおそらく大きなブレークスルーではなく、小さなブレークスルーと呼べるものです。

そしてそれは、この分野に非常に大きな可能性があることを示しています。

例えばAIが数学的証明を支援する例は見てきましたが、物理学など他の分野でどのようなことができるのか、短期的にどんなことが見られるか例を挙げていただけますか。

ええ、私たちは毎日のように例を目にしています。それらは科学の最前線の範囲全体にわたっています。

数学、物理学、天文学、生命科学、例えば生物学などで例が見られます。アレックス、あなたはこれらのいくつかに取り組んできましたね。物理学関連のいくつかについて話すのにちょうど良い時期かもしれません。

ブラックホール物理学者の体験

ええ、ケビンが指摘した点に戻りますが、これが特別な時期だということについて、私も全く同じように感じています。なぜなら、私は2025年をこう考えて始めたからです。「ああ、ChatGPTはクールだ」と。誰もと同じように、リリースされた時に使ってみて、これは素晴らしいチャットボットだと思いました。でも、自分の仕事に本当に関連するものになるまでには、まだ非常に長い時間がかかるだろうと確信していました。

だから年の初めは、AI懐疑論者だったと言えます。何かを確信する前に証拠を見たいタイプなので。人々がそれを執筆の支援に使っているのを見ました。私もそのために使い始めました。校正には非常に役立ちますが、私が本当に専門家である特別なことをやるようになるまでには、まだ時間がかかるだろうと思っていました。

ブラックホール、ですよね。まさにブラックホール物理学です。今年の初めにこんな体験をしました。パルサー、つまり非常に強力な磁場を持つ回転する星の周りで何が起こるかを記述する磁場解を見つけようとしていました。

この非常に特殊な解を求めていました。偏微分方程式を解く必要がありました。その解を、ルジャンドル多項式と呼ばれる特殊関数の積の無限和として特定することができました。物理学の大学院に行けば、これは慣れ親しむのに多くの時間を費やす種類のものです。

私もこういうパズルが好きなんです。和を使って遊んでいて、これが評価できる簡単な式があるはずだと感じました。そして思ったんです。「よし、o3 Proを持っている友人がいる。当時私はアクセスできなかったので、彼に送って何が出てくるか見てみよう」と。

彼が送り返してくれた出力がありました。11分間考えて、当時私が使っていた無料版では見たことがなかったんです。無料版はそんなに長く考えないので。そして美しい答えを出してきました。和が何であるかを理解して、取り組める部分に分解することができました。そして、1950年代のノルウェー数学雑誌の一つの論文に掲載された特殊な恒等式を見つけなければなりませんでした。

つまり、問題が何であるかを理解し、その仕事にぴったりのこのランダムな恒等式について知っていて、それを使ったんです。そして美しい出力を出しました。そして最後に、答えは間違っていました。愚かなタイプミスをしたからです。余分な係数を前に追加してしまったんです。ほとんど人間が最後に愚かなタイプミスをするようなものです。

でも導出をチェックするのは非常に簡単で、私はそれを確認して、「なるほど、この余分な係数があるけれど、それを除けば、作業をやり遂げた」と気づきました。それは本当に衝撃的でした。なぜなら、「なるほど」と思ったからです。

これは人間特有の能力だと言えるでしょう。理論物理学者を特別にするものだと思っていました。2025年の今、明らかに彼らは私が驚くべきだと考えることを実行できるようになっています。

ええ。クールなことの一つは、アレックスの例のようなもので、おそらく彼自身が最終的にはできたことでしょうが、GPTがより速くできたということです。

それ自体が加速です。そして、それには質的な側面もあります。なぜなら、1週間かけて2つの経路を探索する代わりに、1時間で10の経路を並行して探索できれば、突然、試せるアイデアがはるかに多くなるからです。

それも加速です。文献検索のような例も見られます。深い科学的革新のようには思われないかもしれませんが、誰かが以前にこの問題に取り組んだかどうかを理解できることは本当に重要です。もしそうなら、自分の作業を速めるために学べることがあるでしょうか。

私たちは、ある研究者と話していた興味深い例を見ました。細かい点は間違っているかもしれませんが、彼は高次元最適化のような特定のアイデアを探求していると言っていました。

そして彼は、「自分が取り組んでいることは面白いけれど、誰かが以前にこれに取り組んだに違いない。このアイデアを持った最初の人間であるはずがない。でも例が見つからない」と言っていました。

そして彼は、取り組んでいることの説明をGPT-5に与えていました。GPT-5は、経済学か何かの、まったく異なる分野から例を見つけました。

まったく異なる用語を使っていたので、キーワード検索では決して機能しなかったでしょう。GPT-5は概念レベルの文献検索を行いました。

ええ。

ドイツ語の誰かの博士論文を見つけました。つまり、まったく異なる言語でもあったんです。基本的に時間の中に失われていましたが、この人が彼の研究に役立つ本当に興味深い、関連する仕事をしていたんです。

つまり、それも別の領域です。新しい証明についての加速や、GPT-5が独自に、または専門家の指導を受けてできることについて話すことができます。でも、計算や文献検索における加速の例もあり、それらすべてが科学の加速に貢献しています。

文献検索の革命的な活用例

ええ、まったく同じことが私にも起こりました。私はブラックホールのある特性を導き出そうとしていて、追いかけていた現象を記述する方程式を得ました。そして、かなり珍しい3階微分項がありました。それを見て、数学に現れる特別なもので、シュワルツ微分と呼ばれるものだと認識しました。そして思いました、「うーん」。

これが現れるのは本当に奇妙だと。そして、方程式をChatGPTにコピー&ペーストして、「これを見たことがありますか」と尋ねました。すると、「ああ、はい、これは共形ブリッジ方程式です」と言いました。当時、共形ブリッジが何なのか全く知りませんでした。そして、「この論文を調べてください」と言いました。

それは素晴らしいことでした。なぜなら、私の研究に現れたこの方程式が、他のいくつかの研究ですでに研究されていたことが判明したからです。物理学で研究をしている多くの同僚から、そういうことがたくさん起こっていると聞いています。知識の最前線では、すべてが非常にニッチになるため、隣接分野の最新の詳細を知ることは非常に困難です。

そして、GPTはそれに対する素晴らしい助けになります。

ええ、それは私たちが話をした教授や研究者から聞いたもう一つのことです。今日はとても専門化しなければなりません。だから、自分の主要分野以外の領域を探索するのが難しくなることがあります。

私たちが話していた特定の数学者がいました。彼は、「最後の論文の一つで、この方向に進んでみたい領域があることを知っていた。でもそれは私の専門ではなく、長い時間がかかっただろうし、結局、それが最も効率的な時間の使い方ではないかもしれないと感じた」と言っていました。

今、GPT-5があれば、私は戻ってそれを探索するつもりです。なぜなら、事実上、協力者がいるからです。そこにあるほぼすべての科学論文を読んだ協力者で、ほぼどんなトピックでもかなり有意義な専門家です。

そして、ChatGPTがあれば、一人でできたよりもはるかに良い方法で、これらの隣接領域を探索できると思います。

それもまた魅力的な新しい見方ですよね。より深く進むのを助けてくれますし、アレックスが言っていたように、より広く進むのも助けてくれます。

文献検索はかなり興味深いです。私の変わった趣味の一つは、ずっと後になるまで利用されなかった初期の科学的発見がいつ行われたかを振り返ることが好きなんです。

ええ。

有名なのは炭素フィラメントで、トーマス・エジソンがそれを見つけようと多大な努力を費やしましたが、それは約20年前に発表されていました。もちろん、デューイ十進分類法がその年に発明されたので、彼を責めることはできませんが。シリコンアシスタント半導体のようなものもあります。

文献を読んでいる人がいれば、5年から10年早く持っていたかもしれません。DNAを複製する能力、それは誰かがそれを理解する10年か12年前に発表されていました。そして、

DNAを理解するために使用するショットガン技術、つまりDNA配列解析を理解すること。

それは1982年に最初に発表されましたが、当時はそれを実行できるスーパーコンピューターがありませんでした。

そうですね。

そして、すべてのこのものを検索して、持っている答えを引き出すことができる本当に良いツールを持つことを考えるだけで、それは刺激的です。

ええ。そして特に、最も興味深い研究のいくつかは、2つの分野の交差点で起こると思います。

そして、一人の人間が2つの分野の専門家であることは難しいです。3つや4つや5つの分野は言うまでもありません。そして時々、人間が協力するのは難しいです。必ずしも適切な人を見つけられるわけではないし、その人には無限の忍耐があるわけではありません。そして

ここでGPTがあれば、24時間年中無休で働き、無限の忍耐を持つ協力者を持つ選択肢があります。

過去何年間かに書かれたほぼすべての科学論文を読んでいます。だから、それは単に、独自の形の加速である新しい種類の協力なんです。

クロード・シャノンの妻が数学者だったことや、それが彼ができることをどれだけ助けたかを考えます。

そして、協力が本当にどれだけの要因であるかを忘れていると思います。でも、これを聞いている人の中には、「ええ、でも去年はストロベリーのスペルも書けなかったじゃないか」と言う人もいるでしょう。

ええ。

数学もできなかった。では、なぜ科学をやらせるのか。

なぜ今が特別な時期なのか

ええ。実際、これを話したかどうかわかりませんが、GPT-5ができることを評価するようになった私自身の起源の物語があります。この場合、ほぼ1年前だったので、o1 previewだったと思います。

ローレンス・リバモアの物理学者、ブライアン・スピアーズという人と会っていました。ワシントンDCでのことで、以前に会ったことはありませんでした。だから、何を期待すべきかわかりませんでした。o1 Previewについて新しいことと、なぜ試してみるべきかについて彼と話すつもりだと思っていました。

知らなかったことですが。座ったとたんに、彼がすぐに会話をコントロールして、「あなたのモデルで何ができるか教えましょう。これらは科学にとって最も素晴らしいもので、これは世界を変えるでしょう」と言いました。彼は、「さあ、これを見せましょう」と言いました。

そして彼はノートパソコンを開きました。彼は核融合に取り組んでいますよね。ローレンス・リバモアは、正のエネルギーで大規模な核融合を最初に行いました。超エキサイティングです。だから

彼は、「よし、核融合の例を取り上げよう。まず、この問題の学部生版から始めよう」と言いました。

そして彼はこの会話を見せてくれて、「よし、銅の棒があって、超高圧波でそれを衝撃する。何が起こるか」と言いました。

彼はそれに答えて、o1 previewが良い答えを出しました。「なるほど、クールだ。だから学部生の問題を正解した」という感じでした。

「さあ、大学院版を尋ねてみよう。今度は棒の内部で何が起こるか。これを行っている間に。そして、これらの特定の種類の衝撃波を生成するために何が真でなければならないか」。そして彼は進んで、「なるほど、それも正解した。よし、今度はポスドクレベルの質問をしよう」と言いました。

さあ。そして、今度はもう。物理学のバックグラウンドを持っているにもかかわらず、私は彼が私にできること以上のことをしているので、ただついていくだけでした。「よし」と。

「今度は、ローレンス・リバモアに入ったばかりで、という質問をしよう」と。

ポスドクを終えて、核物理学者で、彼は続けます。そしてo1 previewは答えを正しく出し続けます。そして彼は、「よし、今度は20年間ローレンス・リバモアで働いている質問をしてみよう」と言いました。そして、それは進んで、正解します。そしてそれだけでなく、

前進する唯一の方法は、部分的に機密扱いされているか、ローレンス・リバモアだけが持っているこれらのシミュレーションツールのセットを使用することだと提案します。

「私はこれらにアクセスできませんが、もしあなたがアクセスできたなら、これらのツールを使いたいでしょう」という感じです。そして彼は、「見てください、ここで見せたものは、私にできなかったものは何もありません。でも、それには数日かかったでしょう。そして確かに、研究所の全員がこれをできるわけではありません」と言いました。

これらのツールからもたらされる、もたらされるであろう加速は、科学を変えるでしょう。だから私は、AIの価値について彼に話すつもりだったかもしれないと思っていたこの人と座った状態から、AIの可能性について彼が完全に私の心を吹き飛ばす状態へと変わりました。

そしてこれは1年前です。これはo1 previewで。それ以来、飛躍的な進歩を遂げています。そして私がいつも試みていることは、

みんなに思い出させることですが、今日使っているAIモデルは、GPT5.1 Proがどれだけ優れていても。これらは私たちが人生の残りの期間で使用する最悪のAIモデルです。そして、それについて考えると、私たちがここにいるという事実は、未来が非常に明るいことを意味します。

同僚たちはこれらのツールをどのように使ってきましたか。

ええ、いろいろな使い方があると思います。文献検索で、「私が取り組んでいるのはこれで、他のことと関連していますか」というようなものです。そして

これは科学者として多くの時間を費やすことです。自分の研究に新しいものが現れたときに、それが他のものとどのように関連しているかを理解することです。

そして、私自身の経験が、私をAIピルドにしたと思います。

これがあなたがOpenAIに来た理由ですね。

OpenAIで働いているマーク・チェンに会いました。彼は最高研究責任者です。そして彼は私に挑戦を与えました。彼は非常に誇らしげでした。「難しい問題を与えてみてはどうですか」と言いました。そして私は思いました、「はは、難しい問題が欲しいの。わかった」と。

それで私はこの質問をしました。私はちょうどブラックホールの新しい対称性を見つけたばかりでした。これはそれほど頻繁には起こらないことです。6月にアーカイブに出た論文を書いて、それについてとても満足していました。

そして思いました、「よし、GPT Proがこの新しい質問をどう扱うか見てみよう」と。それで方程式を与えました。そして、対称性があるとは言いませんでした。誘導的な質問はしませんでした。ただ、「対称性は何ですか」と尋ねました。そして5分間考えて、「対称性はありません」と言いました。

そして私は、「はは」と。まだそこには達していない。まだAIより優れている。そしてマーク・チェンは目に見えて落胆していました。彼は、「わかった、じゃあもっと簡単な質問を与えてください」と言いました。そして私は、「わかった、問題のウォームアップのベビー版を与えよう。この方程式の対称性を見つけてください。複雑な完全なブラックホール時空ではなく、時空が空の平坦空間極限で」と考えました。

そして、エンターを押して、9分間考えて、この美しい答えを返してきました。「ああ、この方程式には共形対称性があります」。これが正しいことで、「ここに3つの生成子があります」と。それはとても美しかったです。この方程式のバージョンは

おそらく研究されたことがあり、何十年にもわたって何度も研究されたに違いないと確信しています。

だから彼が正確に何をしたのかわかりませんが、答えを出しました。そして思いました、「わかった、これはとても良い。これは素晴らしい結果だ」と。そしてマークは、「わかった、でも、ウォームアップの例でプライミングされた今、このチャットのインスタンスで難しい問題をもう一度試してみて」と言いました。

そして思いました、「わかった、やってみよう」と。それで難しい問題をもう一度与えました。エンターを押して、考えて考えて、それが初めてそんなに長く考えるのを見ました。18分かかったと思います。そして、完全に正しいこの美しい答えを出してきました。

それは私の心を吹き飛ばしました。なぜなら、私はこれに非常に長い間取り組んでいたからです。そして、その計算は私の能力の限界にあると言えるでしょう。私がやった方法でできた人は非常に少ないと思います。だから本当にショックでした。なぜなら、何かで最高クラスになるために何年も人生をかけて訓練したり、ブラックホールの対称性やこの種の方程式を見つけたりします。

それが私の得意分野です。そして思いました、「わかった、だからそれがちょうど起こったんだ」と。それは本当に私の心を混乱させました。そして数日間、少しショック状態でした。そしてその後、それについて考えるのをやめられませんでした。そしてその後、気づきました、「わかった、これに関わらなければならない。なぜなら、この能力が世界に出現するのを見ることだから」と。

今まさに、そしてこれに関わらないことは、私には狂っているように思えました。

モデルとの協働の重要性

私は実際、あなたが途中で本当に重要な点を指摘したと思います。難しい質問をしたという事実の周りです。正解できませんでした。簡単な質問をして、それには正解して、そして難しい質問をすることができました。ここでの未来について私たちが明らかに興奮しているのと同じくらい、非常に現実的な感覚もあります。

最前線にある問題、能力の限界にある問題をGPT-5やこれらのAIモデルのいずれかに与えるとき、彼らはまだ多くの場合間違っています。

そうですね。能力の最前線で動作しているレベルで、どんな人間でもそうであるように。そして、まだ自動的ではありません。うまくいけば将来そうなるでしょうが、どんな難しい質問でも入力すればモデルが答えてくれるというものです。

でも今日は、多くのやり取りがあります。そして最高の人々、モデルから最大限のものを引き出すのが最高の研究者は、

彼らとやり取りする一種の忍耐を持っています。それは自然なことだと思います。おそらく、能力の限界で動作している2人の人間と一緒に仕事をする方法と同じでしょう。

でも、特にこれを聞いている研究者にとって、モデルで研究をしている人にとって、それが単に1回のショットで、いつも機能するわけではないということを知ることは重要だと思います。本当にやり取りがあり、一種の忍耐が必要です。そして、私たちが多くの時間を費やして考えている興味深い研究問題の一つは、どうやって人々を支援するかということです。

ええ、その認知負荷を減らすのをどう助けるかです。なぜなら、問題に取り組んでいるとき、例えばモデルがある問題で5%の合格率を持っているとします。

だから技術的には、モデルは20回に1回は正解できます。でも、本当に最前線にあるので、毎回正解に近づくことはほとんどありません。ChatGPTの内部に座ってこの質問を入力しているだけなら、

正解を得る確率を得る前に、何回、10回は入力する必要があるでしょう。そしてほとんどの人はそれをやらないでしょう。

だから、モデルが解決できる問題の全体があって、人々はおそらく試みて、「ああ、3回試した後、正解しなかったから、もう次に進もう。モデルはまだ十分ではない」という感じです。

そして実際にはそうなんですが、低い合格率の問題と難しすぎる問題を見分けるのは非常に難しいだけです。そして、それは研究者や数学者が乗り越えるのを助けることが本当に重要なことだと思います。

なぜなら、今最も興味深い問題は、モデルが非常に低いが非ゼロの合格率を持つものになるからです。

それらは、モデルが解決できる最も難しい問題、科学を加速するのを助ける最良の方法になるでしょう。だからそれは、私たちが取り組んでいる本当に興味深い研究問題です。それをもう少し自動的に、もう少し単純作業を減らそうとしています。

でも今のところ、時間をかけて本当にモデルとやり取りすることは結果をもたらします。

まあ、GPT 3.5からChatGPTに移行したときのような瞬間にいるように感じます。3.5はモデルで、非常に能力の高いモデルでしたが、それでも事実上ベースモデルでした。

そして私は当時プロンプトエンジニアで、プロンプトの仕方を知っていれば、素晴らしい結果を得ることができました。でも、コンテキストを理解するためのすべての小さなトリックが必要でした。それからChatGPTに移行して、「わかった、人々が解決しようとしている問題の種類を理解している。それに到達するために、それらすべてをしなくても少し簡単にしよう」と理解しました。

科学にも向かっているように感じます。アレックスのような人々が解決しようとしている問題とやっていることを説明することで、これで大きな加速が見られるかもしれません。

おそらくそれは、モデルができることの限界にあるような、最前線にあるような質問の特性にすぎないと思います。

GPT 3や4の初期バージョンでは。モデルができることの限界にあった質問は、はるかに基本的でした。今、それらは科学研究の質問ですが、最前線で動作しているとき、

合格率は低いでしょう。だから、それにこだわって、いくつかの異なることを試してみて、正しく得た部分を取って、モデルに他のことでどこが間違っていたかを伝えながら洗練させることに価値があります。

科学研究における実践例

この例で言及しましたが、ウォームアップが必要でしたが、ウォームアップは人間としてやるであろう明白なウォームアップでした。

そうですね。なぜなら実際、私がこの問題に取り組んでいたとき、最初にブラックホールのケースについて考えていたわけではありませんでした。この平坦空間極限が開始する明白な場所で、そこが私が始めた場所でした。

だから思うに、モデルは実際に本当に優れていますが、ウォームアップ問題自体を考え出すのをより上手にすることができれば、直接そこに行けるようにできます。でもより一般的に、

念頭に置かなければならないことがあると思います。それは、科学者として、私たちの役割は知識の端を押し広げることだということです。

端を超えたところにあるものがあります。そして私たちの目標は、それらを理解することによって知識の端の前に持ってくることですが、この端は非常にぎざぎざしています。そして、

宇宙についての非常に基本的な質問があります。例えば、なぜ空間には3つの次元があるのか。あるいは、ビッグバンに何が起こったのか。これらは誰もが答えを知りたいことです。

しかし、簡単な質問であっても、これについて知的に言うべきことは本当に何もありません。私たちは単に知らないのです。それらは実際には非常に難しい問題です。そして一方で、答えられるとは思わないような非常に難しい質問があり、それに対して非常に詳細な答えを持っています。

電子双極子モーメントを12桁かそこらまで予測できます、何か狂ったものです。だから、

人間の知識の端自体が非常にぎざぎざしています。そして、端がどこにあるかを学ぶのに何年もの大学院が必要です。そして、これらのAIモデルで見つけていることは、彼らの知識の端も非常にぎざぎざだということだと思います。

だから、モデルが答えられない基本的な質問がいくつかあると言及しました。それは本当です。同時に、彼らが既に今日非常によく適している非常に難しい質問がいくつかあります。そして、刺激的なのは、彼らの知識の端が私たちとは異なる方法で非常にぎざぎざだということです。

だから明らかに時間が経つにつれて、これらのモデルの能力の端は拡大し続けると思います。でも、私たちの端とは少し異なる方法で拡大する限り、それもまた本当に興味深いです。なぜなら交差点で

彼らが私たちより遠くまで行けるところ、または私たちが彼らより先に進めるところ、そこで多くの興味深いことが起こると思います。

ええ、人間とAIが一緒にいることは、まさに人間だけやAIだけよりもはるかに強力です。

その通りです。もう少しそれを探求したいですが、まず研究論文について教えてください。

研究論文の発表について

ええ、だから私たちは、アレックスが同僚と過ごした時間から得た逸話的な例について多く話してきました。この時点でTwitterを通じて半日ごとに入ってくるのが見られます。そして、それらをまとめて何かを書きたかった、科学に関するGPT-5の現在の状態を示す何かを発表したかったんです。

そして、OpenAI内部からの少数の協力者と、私たちの壁の外からの8人か9人の学者がいると思います。数学、物理学、天文学、コンピューターサイエンス、生物学、材料科学など、多くの異なる分野にわたっています。そして論文は12のセクションからなり、それぞれがGPT-5が彼らの仕事を加速させている異なる方法を強調しています。

目標は、誇張して、すべてが解決されたと言うことではありませんでした。それは、「見てください」と言うことでした。

みんなにホバーボード。

ええ。これが機能するものです。これが機能しないものです。これが私が試したものです。

多くの場合、ChatGPTを共有しています。完全な共有リンク、会話を共有しているので、やり取りを見ることができます。

科学者がモデルと持つやり取りです。そして、今日私たちがどこにいるかを言うための一種の時点を意味しています。そして、6ヶ月後、12ヶ月後を振り返ると、

はるかに進んでいるでしょうし、それは刺激的でしょう。でも今日私たちがいる場所でさえ、論文には文献検索に関する多くの異なる例のセクションがあります。加速に関する多くの異なる例のセクション、計算やその他のことなどです。そして、実際に数学で4つか5つの新しい

非自明な結果を提供するセクションがあります。そして、これらのいくつかは小さく、いくつかはおそらく単独で論文になれたでしょう。

だから、非常に実用的で現実的な加速のビットから、より深遠な、GPT-5が実際に人間の知識の現在の最前線を押し進めるものへと進みます。

だから私たちはこの論文について超興奮しています。もっと多くのものが来るでしょう。

ちなみに、私たちだけが素晴らしい仕事をしている研究所ではありません。Googleはしばらくこれをやっていて、デミスとチームがAlphaFoldなどでやったことには多大な尊敬を持っています。本当にエキサイティングな時期だと思います。

科学のアイデアはしばしばその瞬間を持ちます。

複数の人が同じアイデアで来るとき、量子力学のように、アレックスが話していたように、あるいは電球のように。今、AIが科学を変え始めているのは非常に明確です。そして、刺激的な数年になるでしょう。

学生や若手研究者へのアドバイス

科学の学生や大学院生にどんなアドバイスがありますか。なぜなら、

もう科学者は必要ないとか言う人の話を聞きます。それは絶対に狂っていると思います。望遠鏡が天文学者を排除しなかったようなものです。実際には天文学者を作りました。

それについてどう思いますか、そしてどんなアドバイスがありますか。

わかりました、まず第一に、AIとは無関係な学術界には今多くの不安があることを認識することが重要だと思います。それは

この国で科学が組織される方法の多くの変化と関係があり、私たちはまだこれらの変化を経験しています。

若い人々と話すと、これを取り巻く多くの不安があると思います。実際、AIは本当にエキサイティングな新しいツールで、利用可能になりつつあり、みんなをはるかに効率的にするのに役立つと思います。

ケビンが以前言及したように、研究プロジェクトに取り組んでいるとき、どの方向に正確に

進むべきかわからないことがよくあります。ここにいて、そこに行きたいが、異なる可能性のある経路、攻撃の異なる線があります。そして研究の全体のポイントは、最初から、どの道を進むべきかわからないということです。

そして、GPTで本当に楽しいことの一つは、「ねえ、これを解決しようとしている。これがいくつかのアイデアだ」と言えることです。持っているメモをアップロードするか、数文で説明するだけです。そして、やろうとしていることを理解するのが非常に得意です。

そして、「このようにアプローチしたらどうだろう。あるいはこのようにやったらどうだろう」と言うことができます。そして、すぐに未知の世界を通る経路を描き出すことができます、ただ道標を立てるだけです。

異なる潜在的な道を。そして、それは実際に非常に多くの時間を節約します。なぜなら、わかります、私は人間です。限られた時間、エネルギーを持っています。そして計算に労力を注ぐつもりのとき、それをプロトタイプ化し、それが私をどこに連れて行くかを事前に考えるのに多くの時間を費やします。

そしてChatGPTがあれば、ただそれをその方向、その方向、その方向に立ち上げることができます。そして、すべてを完全に正しく理解するわけではありませんが、これらの道標が道に沿ってあるだけで非常に役立ちます。なぜなら、自分で道を進むときに

あなたを助けてくれる誰かがいるように感じるからです。そして、それがみんなをより速く、より生産的にすると思います。

そして、私が会う若い人々は既に多くの時間を費やしています

ChatGPTを試して、その能力を理解することに。そして、それはみんなにとって恵みになると思います。

論文のアイデアの一部は、「わかった、これが今の私たちの場所だ。6ヶ月後に見てみよう」と言うことだったと言及しました。話しましょう。

GPT 3から5年経ちます。5年後、私たちはここに座っています。何が見られるでしょうか。

5年後の展望

ああ、5年の質問は非常に難しいです。

つまり、それは素晴らしい質問です。

水晶玉はこちらです。

ええ、つまり、一般的にこの分野で刺激的なことは、12ヶ月を振り返ると、12ヶ月前にいた場所に完全に恥ずかしくなります。

GPT-3が発売されたときのことを見返すと、信じられませんでした。私自身について話せば、AIがこれらのことのいずれかを実行できるというアイデアは、私の心を吹き飛ばしました。そして

GPT 3.5と4の周辺のどこかで、私たちが75年間、人工知能研究の頂点として掲げてきたチューリングテスト。

AIがチューリングテストに合格したら世界が変わるだろうという感じでした。私たちはただ通り過ぎて、今はもうチューリングテストについて話しません。そして2025年の初めを振り返っても

ほとんどの人が自分でコードを書いていました。ほとんどのエンジニアが自分のコードをすべて書いていました。

そして、あなたが自分で書いているというアイデア。

そして今、早送りすると、

Codecs、Claud Code、GitHub Copilotなど、これらのツールのいずれかを活用せずに本当に何かをするというアイデアがあります。それらすべて素晴らしいです。狂っていますよね。それがあればはるかに生産的です。だから、わずか12ヶ月で、そして12ヶ月でソフトウェアエンジニアリングが根本的に変わりました。

次の12ヶ月で、科学が行われる方法に深遠な変化が見られると思います。シリコ内でできること、理論物理学、数学、コンピューターサイエンスの両方で。そして、生命科学、物理科学で見られ始めると思います。

それが次の12ヶ月です。つまり5年?

そう、それは私がよく考える質問です。なぜなら、数学的証明に関しては、ある程度

コンピューターに入って、それをテストできます、それを検証できます、あるいは少なくともそれである程度テストできます。物理学のある種の方程式でも同じです。

でも、生命科学や材料科学などについて話すようになると

テストする方法よりもはるかに多くの予測のボトルネックができるでしょうか。

まあ、モデルが生命科学で支援できる価値ある領域の一つは

もしあなたが、例えば、生物学の創薬を取るなら、彼らは

巨大な探索空間を持っています。そして、モデルがその探索空間を剪定する方法を学ぶほど、

最終的に実行する物理的な現実世界の実験の束を持つことになるとしても、探索空間を知的に剪定できれば、特定のシナリオで機能する可能性が高い薬により速く収束できます。

そして、現実世界の影響を与えるためには、規制プロセス全体を通過する必要があると考えることができます。それはAIが加速を助けることができる独自のプロセスです。なぜなら、多くの異なる発見をまとめる巨大な論文を書く必要があるからです。

だから、プロセスの各ステップを取ることができます。そして、AIは、探索空間を剪定して、ニーズや持っている目標を満たす可能性が高い候補を見つけようとするときに、前もって支援できます。そして、これを消費者に届けて現実世界の影響を与えるプロセスを経るにつれて、AIはそこに貢献できます。

そして、私たちはこの分野のいくつかの企業とパイロットを持っています。それをやっています。だから、

本当にかなり広範囲です。

素粒子物理学に興味を持ってスタートし、それを研究していて、そして他のことを見つけて、今は科学に戻ってきました。

他の人々もそのパターンをたどると思いますか。

つまり、科学に戻って取り組むことができるのは私にとって絶対的な特権です。そして、

アレックスやここOpenAIの他の人々のような科学者には遠く及びませんが、わかりません。OpenAIでAGI、汎用人工知能についてよく話します。

人々が自分の人生でAGIを感じる最も深遠な方法は、おそらく科学を通じてだと思います。ええ、ChatGPTは信じられないツールです。私は

毎日何度も使っています。でも、ChatGPT内のAGIはできるでしょう、多くのことができるでしょう。

でも、パーソナライズされた医療を持つことができるとき、もし

AIモデルが科学に貢献できれば、スケーラブルな融合をより速く実行する方法を見つけることができます。そういう種類のことが私たち全員の人生を変えるでしょう。そして

これらは私たちが進んでいるペースで非常に現実的な可能性だと思います。だからそれが、私が取り組むのに世界で最もエキサイティングなことです。

AGIがどのように見えるかわかりませんが、時々、取り組んでいる本当に難しい方程式をChatGPTに与えて、答えをただ吐き出す経験は、私にとって

確かにそれに近づいているもののように感じます。

そして、私も水晶玉を持っていませんし、明らかにAIがどこに向かっているかを予測する上で悪い実績があります。

年の初めに、私はここにいるとは思っていませんでした。でも、同時に明確なことが2つあります。一つは

モデルは間違いなく良くなり続けるということです。そして時々、同僚が私に、「ああ、プラトーに達しているのか」と尋ねます。そして、それは実際に私も疑問に思っていたことです。

そして、OpenAIに参加して、さらに強力な内部モデルで遊ぶことができました。そして、「わかった、これは間違いなく本当に、本当に良くなり続けるだろう」と思いました。そして2つ目は、既にGPT-5 Proで、これが私たちの最高だと思います、あるいは5.1 Proが今日外部で利用可能な私たちの最高のモデルです。

モデルができることと科学コミュニティがそれらを使用することとの間に大きなギャップがあると思います。そして、ここOpenAI for Scienceでの私たちの目標の一つは、そのギャップを埋め始めることです。

なぜなら、モデルが非常に速く動くので、本当に注意を払っていない限り、この数ヶ月でどれだけ変化したかに気づかないかもしれないからです。

だから、これら2つの

事実が真実であり、来年にわたって科学に大きな変化をもたらすと思います。モデルはより良くなり続け、人々はそれに気づき始めています。そして、だから私たちはTwitterやソーシャルメディアでこのすべてのおしゃべりを見ているのです。そして、それは加速するだけです。それが私たちをどこに連れて行くか、わかりませんが、見つけるのが楽しみです。

あなた方は両方とも非常に良い点を指摘したと思います。それは

これらのモデルは非常に急速なペースで改善されるので、時々人々は、6ヶ月前に何かを試したので、それらが何であるかについて非常に確固たるアイデアを持っています。

ええ。

そして、本当に尊敬する人々や科学者に出会いました。「ああ、試した」と言います。そして私は、「18ヶ月前に試した」と言います。

そして、彼らはツールがそんなに速く進化することに慣れていません。

ええ。

あるいは、誰もが始める方法なので、無料版を使っています。そして、無料版はそれほど長く考えないので、それほど挑戦的な問題を解決できません。

ええ、それは本当に現実的だと思います。最良のアドバイスは、問題を試し続けることだと思う理由の一つです。問題に取り組んでいて、

GPT-5でそれらを試すと、あまり役に立ちません。あきらめません。数ヶ月ごとに試し続けます。そして、まだそこにないとしても、ある時点で、価値があり始めると思います。

思考時間について話しました。ええ、それは私たちが本当に興奮していて見たいもう一つの領域です。GPT-5 Proで。モデルを得ることができます。最も難しい問題のいくつかで、おそらく40分間考えるのを見たことがあります。でも、ある程度の計算許容量があります。なぜなら、それを

多くの、多くの、多くの人々に提供しなければならないからです。40分は確かに思考の限界ではありません。

モデルは2時間、6時間、12時間、24時間考えることができます。そして、私たちが見続けていることの一つは、モデルに考える時間をより多く与えるほど、難しい問題での合格率が改善し続けることです。それは、完全に合理的な人間のように、

直感的な人間のアナロジーがこれらのことにある回数は驚くべきです。20分では解決できない問題がたくさんありますが、2時間くれたら解決できるかもしれません。

システム1とシステム2の思考。

ええ、そして2時間では解決できないものもありますが、1日かけて本当に考えて、異なることを試してみたら、そこに到達できるかもしれません。

そして、モデルも同じです。

ええ、はるかに小さいものを与えることができることは、ChatGPTのユーザーほど多くの科学者が世界にはいないので、方法を見つけることができれば

モデルをよく使う方法を本当に知っている科学者に、ただ巨大な量の計算を与えること。それは、私たちが科学を加速できるもう一つの方法だと思います。

ええ、それは非常に良い点です。なぜなら

壁にぶつかったなどと話す人の話を聞くでしょう。そして、本当に驚くべき発見の一つは、1年前に知ったことですが、推論パラダイム全体と

今日のモデルを取って、より長く考えさせることができ、私たちが構築しているすべての計算、すべてのこのハイパースケーリングで何をするかについて考えます。それは

今日のモデルを使って、長い間考えさせるだけでも、おそらく驚くべき発見ができるでしょう。

ええ、100%。もし

モデルの進歩が今日止まったとしても、科学コミュニティ内で認識を高め、人々にモデルが提供できる最高のものをより多く与えるプロセスだけで、

大量の科学的加速が見られると思いますが、もちろん進歩は止まらないでしょう、アレックスが言っていたように。

そして、モデルがより長い時間考えることができることについて考えるとき

より難しい、より難しい科学的タスクを実行するようにそれらを訓練することができます。そして実際、科学コミュニティに出て行って、最前線が本当に何であるか、そして彼らがやっている仕事をするためにモデルをより良く使う方法を人々が見るのを助けることも。

次の6ヶ月、12ヶ月、24ヶ月の間にこれがどこに行くかを見るのが楽しみです。

特別な歴史的瞬間

ええ、これは歴史の中で本当にユニークな時期だと思います。特別な瞬間のように感じます。そして明確にするために、私たちは人々にやっていることをやめてAIをやりに来いと言っているのではありません。

それがメッセージではありません。私たちが言いたいことは

やっていることを続けてください、でもこの素晴らしい新しい協力者、新しいツールを使うことができて、それがさらに楽しくするし、多くの異なる分野に新しい生命をもたらすでしょう。

ベンチマークに関する今の課題の一つは、飽和のような用語について話すとき、モデルがそれをやったように見えることです。もうそれほど印象的には見えません。今、科学の最前線に移行しているように見えます。

科学的ベンチマークはどのように見えますか。

科学的ベンチマークと評価

ええ。多くのことと同様に、これを理解する直感的な方法のようなものがあります。モデルが賢くなると、ベンチマークはある意味でモデルをテストする方法にすぎません。そして、モデルが賢くなるにつれて、初期のテストに合格する方法を学ぶため、より難しい、より難しいテストを与える必要があります。

GPQAを取れば、Google Proof QAの略で、さまざまな科学分野にわたって基本的に博士レベルの質問をする科学的ベンチマークです。私たちは長い間、それは打ち負かすのが非常に難しいベンチマークだと思っていました。2023年に出たと思います。そしてGPT-4は当初、このベンチマークで約39%でした。

ちなみに、人間は約70%です。でも今、2年早送りすると、私たちの最新モデルはほぼ90%です。

わあ。

だから、彼らは科学研究の分野でほとんどの人間の能力を超えています。一度にすべての分野で、それについて考えるとかなり驚くべきです。でも、それらは世界で最も難しい質問ではありません。

そして、それが私たちが最前線の科学と数学の質問をする新しい評価に焦点を当てている理由の一つです。また、最近GDP Valと呼ばれるものをリリースしました。これは、経済的に価値のあるタスクを実行するモデルの能力をテストする評価です。

だから、モデルが賢くなるほど、私たちが与え続けたいテストは難しくなります。

なぜなら、私たちが見るすべてのギャップ、モデルが特定の質問に答えられないすべての場所。それは私たちへのフィードバックであり、モデルをさらに改善する方法を与えてくれます。

病気を治すこと、素晴らしい。

でも、それ以外にどの分野を本当に見たいですか。そして、それはクレイジーでも奇妙でも変わっていても、科学的加速を見たいです。

先に行きますか。

まあ、私は非常に利己的です。だから自分の興味があります。私は本当にブラックホールが好きです。

それが私の情熱です。

ブラックホールを作りたいですか。

AIがブラックホール研究を加速させる可能性が多くあると思います。そしてもちろん、癌や創薬やこれらすべての良いことを助けるのを見たいですが、私の最優先事項は、ええ、AIがブラックホールを助けるのをもっと見たいです。

だから

テーブルにはたくさんのアイデアがあり、非常に多くの可能性があります。一つは、非常に厄介な理論的質問がたくさんあります。そしてもし

座って、知られているすべてを理解し、その知識を統合できれば。多くのことがそこから出てくると思います。

そして、それは私たちが探求していることの一つです。例えば、ダークマターは、私たちが話してきたものです。なぜなら、さまざまな実験からダークマターに関する多くのデータがあるからです。でも、私たちはまだそれが何であるかを本当に知りません。そこにはたくさんの理論があります。

本当に興味深いアイデアは、ChatGPTにダークマターについて知られているすべての実験データとすべての理論を与えることによって

すでにそれらのいくつかを除外できる可能性があるかということです。私たちの人間の心が一緒に保持するのが難しいほど異なる知識のビットを組み合わせることによって。それは一種のエキサイティングな最前線だと思います。

そして、遠い未来について話していたので、実験的な

仕事は全く問題外ではありません。今、私たちはシリコ内で実行できるため、より理論的な分野に焦点を当てています。でも、AIを使うことは完全に想像できます

より良い実験を設計し、おそらくブラックホール物理学や他の分野を含む、非常に難しく、複雑な実験を実行することに。

ここで探求すべき多くの地面とエキサイティングな可能性があると思います。

ええ、そして私は融合を言います。もし私たちが実際にできれば、私たちは再び小規模な、つまり大規模だが小規模な、それの実存証明を持っています。だから明らかにそれは機能できます。そして今の課題は、より大きな規模で、より信頼性高く実行することです。

明らかにそれは可能です。私たちはこれを解決するでしょうが、加速できれば、世界、融合のある世界は、ない世界よりもはるかに良い場所です。融合を解決すれば、多くの問題を解決します。そして、おそらく何らかの形で貢献できれば興奮しています。

エネルギーにどれだけ依存しているか、人々が見落としがちだと思います。過去200年間にあったのと同じ桁違いの改善をエネルギー生産で得られたら、それが何を解き放つか。そして、脱塩、建設、その他のようなエネルギー集約的なものについて考えます。

そして、本当に、本当に、本当に無制限のエネルギーを持つとき。

ええ。信じられないです。つまり、いくつかのグループは、例えば多くのGPUのための多くのインフラを構築しようとしているかもしれません。

ええ。

それをやりたい人は誰でしょう?

でも、ええ、それを超えて、インフラ構築からエネルギーに専念するエネルギーがはるかに増えると思います。

そして、携帯電話やノートパソコンがすべてのお金がバッテリー技術に投入されたため電気自動車をはるかに効率的にしたように、おそらくその派生物が見られると思います。

ええ。そして、何かを桁違いに変えるたびに、世界が変わると思います。過去1年間にソフトウェアエンジニアリングが変わった方法で見てきたことは、もうソフトウェアエンジニアとして訓練される必要はありません、意味のある量のコードを書くために。

それは、世界に約3000万人のソフトウェアエンジニアがいるということです。今、3億人、おそらく30億人がソフトウェアを書けると思います。そして、それは根本的に物事を変えるでしょう。もし私たちが動くことができれば、もしエネルギーを10倍より普及させ、10倍安くすることができれば。

それは世界を変えるでしょうし、私たちのモデルの知性を適用するのに本当に高い可能性のある場所だと思います。

トップダウンではなくボトムアップのアプローチ

もし追加できることがあれば

科学を変えるAIの可能性に関して、私たちが興奮しているアイデアがありますが、これは、AIが世界で何をするかを私たちが決定するトップダウンの努力であることは全く意図していません。

実際、私たちは最高の汎用AIを構築することに非常に興奮しています。そして、それを世界にリリースすれば、誰もがそれを取って、自分の目的のために使うでしょう。そして、私にとって、私はブラックホール物理学者で、AIを使ってブラックホール科学を進めたいです。でも、他の分野の科学者にとっては、そのために使うのは自然だと思います。

そして、研究の性質は、次の大きなブレークスルーがどこから来るかを知るのは非常に難しいということです、本当に。だから、私たちのビジョンは、これを世界に押し出すことだと思います。

私たちは、今日よりもはるかに多くの採用が見られる可能性があると思います。

そして、それが起こったら、

誰が知っている、次の最大の発見がどこから来るか誰が知っていますが、それが科学的発見を加速する最高のチャンスを自分自身に与える方法です。

ええ、それは非常に重要な点です。科学の最前線または表面積は巨大です。

そして、これはOpenAI内で個別に科学を加速させるために、または特定の科学的プロジェクトを加速させるために何ができるかについてではありません。それは、

世界中の科学者にAIを与えて、彼らが自分の仕事を加速できるようにすることです。それが科学をより速く前進させる方法です。だから、私たちが試みるであろう部分があると思います。それは私たちが学ぶのに役立つからです。

でも圧倒的多数は、私たちが本当に望んでいるのは、100人の科学者がAIを使ってノーベル賞を受賞するのを見ることです。

ええ、科学の終わりではなく、本当に始まりのように感じます。

その通りです。

確かに、科学2.0の瞬間が起こっていると思います。