OpenAIが学生向け新AIを発表し数学の天才たちの間で先端研究に革命を起こす

OpenAI・サムアルトマン
この記事は約11分で読めます。

OpenAIが70以上の数学・科学概念を扱う新しい教育ツールを発表した。視覚的でインタラクティブな学習体験を提供し、従来の暗記型学習から概念理解へのシフトを促進する。一方、フィールズ賞受賞者Terry Taoは、GPT-5.2がErdős問題の一部を解決した事例を分析し、AIは既存パターンの認識では優れるものの、真に独創的な数学的推論が必要な未解決問題にはまだ限界があると指摘する。AIは計算速度と網羅的探索で人間を上回るが、新しいアプローチを発明する能力や解答の真正性を保証する責任能力においては、専門家による検証が依然として不可欠である。

OpenAi Lança Nova iA Para Estudantes e Revoluciona Pesquisa Avançada Entre os Gênios da Matemática
Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

OpenAIが数学・科学教育の新ツールを発表

皆さん、OpenAIが70以上の数学や科学の概念を含む教育ツールを発表しました。でも大きな疑問が湧いてきますよね。一体なぜ人々は数学を学ぶ必要があるのでしょうか。もしAIがこれから全ての数学をやってくれるなら。実は最高の専門家たちがすでにAIを問題解決に活用していて、彼らには非常に重要なことを言いたいことがあるんです。この議論をテーブルに載せる必要があります。

では、何が起こっているのか理解していきましょう。一緒に見ていきましょう。さあ、行きますよ。皆さん、いつもいいねを押してくれる全ての方々、チャンネル登録してくれた全ての方々に感謝しています。このAIチャンネルをスポンサーしてくれている全てのチャンネルメンバーに特別な感謝を。メンバーの皆さんは、WhatsApp統合、MCP、PDF読み取りなどの教え方を含む、インテリジェントエージェントに関する限定動画にアクセスできることを覚えておいてください。

そして限定動画にもアクセスできます。さて皆さん、OpenAIが教育ツールを発表しています。これは人々のアキレス腱、つまり数学や科学の教育に焦点を当てたものです。これらは子供時代にかなり混乱した軌跡をたどりがちですからね。トラウマを抱えた子供たち、トラウマを抱えた親たち、子供たちにもう覚えていないことを教えなければならない親たち、そして何かを教えようとしても上手くいかない教師たち自身。

数学学習の課題と新しいアプローチ

でも状況は変わりそうです。なぜなら今、ChatGPTで数学や科学を学ぶ新しい方法があるからです。さて、彼らは何を言っているのでしょうか。毎日1億4000万人がChatGPTを使って数学や科学の概念について質問しているということです。結局のところ、これは最も普通のことですよね。でもこの興味深いデータを見てください。

調査によると、アメリカの成人の半数以上が数学に困難を感じていると答え、多くの親が子供に数学を教える自信がないと報告しています。そして視聴している皆さんの多くも、きっとこれを経験したことがあるはずです。子供が嬉しそうにやってきます。「お母さん、これ教えて」。

そしてお母さんも嬉しそうに答えます。「ああ、教えてあげるわ。任せなさい、私が教えてあげる」。そして子供が数学のノートを持ってきて、もう長い間誰も見たことがないような計算問題が並んでいます。昔だったら、お母さんは何て言ったでしょう。お父さんに聞きなさい、って。でも今は答えが変わりました。ChatGPTに聞きなさい、です。彼らはここで70以上の基本的な数学と科学の概念から始めています。

ここに本当に気に入った非常に明確な例があります。見てください。私が体積を変化させているんです。ほら、見えますか。変化させています。そして底の青い玉を押したり、青い玉を浮かせたりできます。つまり、この小さな筒の中で何が起こっているのか直感的に理解できるんです。

インタラクティブな視覚学習の効果

でも面白いのは、もし温度を上げると、見てください、すべてがより速く動き始めます。つまり、物が熱いときはより速く動き、冷たいときはよりゆっくり動くことがはっきりわかります。興味深いですよね。これを視覚化できることで、何が起こっているのか理解できます。圧力とは何か、体積とは何か、分子の量とは何か、ここで温度とともに何が起こるのか。

この方法だとずっと学びやすくなります。そしてこれがまさに彼らが言っていることなんです。視覚的でインタラクティブな学習は、多くの生徒にとって従来の教育よりも堅実な概念理解につながる可能性があります。この動画を見ただけで、温度の関係が分子の速度を変化させることに気づいた人がたくさんいると確信しています。

そしてそれだけでいいねの価値がありますよね。ミクロの世界をはるかにシンプルな方法で理解し始められるからです。そしてここで私が話した部分が出てきます。高校や大学の学生たちは、インタラクティブな体験が変数同士の関係をよりよく理解するのに役立ったと述べています。親たちは、これによって子供たちと一緒に問題を解決するためのより動的な方法が得られたと述べています。

つまり結局のところ、家族全員が楽しめるということですね。そして教育者たちは、このようなツールが生徒たちが単に公式を暗記するのではなく、概念がどのように機能するかを理解するのに役立つと述べています。そして私が、AIを使って非常に複雑な問題を解決している重要な数学者について話すと言ったことを覚えていますか。

AIによる数学教育の現状と未来

そして彼らは、今日からログインする全てのChatGPTユーザーが利用できると言っています。機能を増やし続け、この70項目のリストを拡大していくとコメントしています。ここで示されているように、質問するだけです。ピタゴラスの定理を理解するのを手伝ってください、と。

私はいつも動画を作る前にテストするんです。ほら、ここで学習モードを有効にして、ピタゴラスの定理を理解するのを手伝ってくださいと尋ねました。古典的な方法で答えてくれましたが、グラフなどは表示されませんでした。だからまだ表示されていない可能性があります。まだ更新されていなくて、すぐに更新されて私たちが見たいグラフなどが表示されるでしょう。でも今の疑問は、結局のところ、もしAIが世界で最も難しい数学の問題を解決しているなら、なぜ数学を学ぶ必要があるのか、ということです。すでにオリンピックでたくさんのメダルを獲得しているのだから、人間は終わりなのでしょうか。

Terry TaoによるAI数学能力の評価

Terry Taoの意見では、彼は数学界の生きる伝説であり、フィールズ賞とBreakthrough賞の両方を受賞した唯一の生きている人物ですが、この数学界の生きる伝説が使用し、分析し、そして彼が発見したすべてのことを語っています。

そして1月末に出たニュースがこれです。GPT-5.2がErdősのあらゆる問題を解決していた、というものです。これは偉大な数学者が人々に解決してもらうために1000以上の問題のリストを残したもので、30年以上未解決の問題も含まれています。さて、でもTerry Taoがここで評価を行い、最初から彼はこう言います。直感よりもスピードだ、と。

だからこそ、AIが今日行っている数学と、明日改善されるかもしれないものの違い、そしてこの中での人間の重要性を理解する必要があるんです。彼はここでコメントしています。AIは単純に、推論ではなくスピードを必要とする問題において人間より速く働いた、と。

例えばここでいくつかの投稿を示しています。Nils Moneyが、問題281番が解決されたと言っています。GPT-5.2 Proが解決し、それ以前に解決策はありませんでした。そしてクリスマス以降に解決された15の問題のうち、11がAIによって解決されたとコメントしています。

AIによる問題解決の実態

でも詳細を見ると、何が起こったのか、AIが一部の問題で何をしたのか興味深いことがわかります。ここで数学的な参照、公理などについて言及し始めます。そして解決を試み続け、インターネット検索ができます。そして何をするか。2013年のMath Overflowでハーバードの数学者Noah Welksの投稿を見つけるんです。

つまり最初から、問題を解決しようとして、突然問題を解決した人を見つけました。そこであなたはこう言うでしょう。「ああ、それで説明がつく。答えを見つけたなら面白くない。彼女が提案した解決策は彼女が作ったものではない」。いやいやいや、待ってください。椅子に座って落ち着いてください。もっとあるんです。

ChatGPTの最終的な証明は重要な点で異なっており、より完全な解決策を提示していました。つまり興味深いことに、解決を試み始め、インターネット検索をして、解決した人を見つけ、その人の解決策を取ってさらに改善を加えたんです。これが中間レベルです。人間が一部を行い、AIが別の部分を行い、物事が進んでいきます。

そして興味深いことに、AIツールはリストされているものの中からより簡単に解決できる問題を特定できるようになっています。つまり1500の問題のリストを見て、こう言うんです。「ああ、3番はとても難しい、4番は難しい、58番はできる」。とてもおかしなことですよね。そして人々が最も喜んだのがこの問題728です。なぜならこの問題は具体的に、誰も解決したことがない証明の一つだったからです。

そしてAIが人間が人生で誰もやったことがないことをやったということを示していました。そしてここで問題が出てきます。この問題は解決に時間がかかる問題で、AIがより速い方法でそれをやり遂げました。より多くのことをテストでき、そして誰もやったことがない発見に到達しました。

AIの限界と人間の専門性の重要性

でもTerry Taoはこう言っています。現在開いている問題の1から2パーセントは、現在のAIツールが最小限の人間の介入で解決できるほど単純だと彼は推定しています。結局のところ、人間が上でヒントを与えたり、活用したり、導いたり、何が起こっているか見たりしているからです。

そして彼はさらにこう言います。最も難しい問題は全ての人間の努力に抵抗し、AIの手の届かないところに留まっている、と。彼が言っていることの重要性を理解できますか。AIはすでに難しい証明を行うことができています。誰も解決していなかった問題を解決しています。すでに超高度なレベルにあります。

でもこの超高度なレベルは平均的な人間と比較してのことです。非常に高度な数学者と比べると、まだ追い越していません。その証拠がこれです。競技レベルの数学の証明を取ると、GPT-5.2は77パーセントを解きます。つまりほぼ100パーセントに近いです。でも真の数学的推論を必要とするオープンリサーチ問題になると、25パーセントになります。平均的な人にとってはすでに驚異的です。

おそらく平均的な人間はこの25パーセントを解くことができないでしょう。でも数学のマスターにとってはまだ少ないです。そして説明がこれです。大規模言語モデルはパターン認識を通じて優れていますが、研究問題は既存の方法が失敗するときを認識し、新しいアプローチを発明する能力を必要とします。

つまり結局のところ、彼が言っているのは、解決策が存在しないとき、誰も本当に試したことがない創造的な何かが必要なとき、その時点でAIは機能しない、ということです。でももし未解決問題のいずれかで、その問題に取り組む方法が既に存在するが、誰もその問題に適用していない場合、その場合はAIが成功します。なぜなら人間が探求していないことを探求するからです。

AI研究における課題と検証の必要性

でもここに興味深い詳細があります。例えば、チームの一部が時々難しい問題を解決し、皆に話しますが、後で検証の際に何も解決していなかったことがわかり、謝罪しなければならないことがあります。例えば、OpenAIの研究者Sebastian Bubeckが問題を解決したと言い、すでに10万回の閲覧がありました。

そして調査してみると、何が起こったのか。AIがインターネット上の既存の解決策を検索し、取得して適用し、解決し、皆が喜んでいました。でも興味深いのは、実際に何が起こったかです。GPT-5は、私が個人的に知らなかったこれらの問題を解決する参考文献を見つけました。

つまり彼が言いたいのはこういうことです。あなたが数学者だと想像してください。あなたは自分のブログに数学の投稿をして、せいぜい5回の訪問しかありませんでしたが、誰も知りたがらなかった証明を行っていました。AIはそれを見つけます。失われたあなたの投稿を見つけ、クリックし、それが自分のものだと発表し、今起こっているようにYouTubeでニュースになります。

そしてあの問題728にもアスタリスクがあります。元の問題728はかなり曖昧です。つまり一つの解釈を解決したということです。ニュアンスに気づきましたか。ある意図で問題を話し、人が別の解釈をして解決すると想像してください。その人が間違っているとは言えません。あなたが想像していたのとは違う解釈をして、それで正解したからです。

そしてその議論が残ります。結局のところ、その人は何を言いたかったのか。Aを言いたかったのか、Bを言いたかったのか。そしてその人がもう生きていないので、AIが解決したと見なさなければならず、それで終わりです。そして彼は、このAIの現象が数学者が研究を行う方法を変革し、専門家の判断、検証、ドメインの理解が引き続き不可欠であるとコメントしています。

AIの生成的性質と責任の問題

そしてこの詳細が私が言うことです。AIはあなたの問題を解決しますが、無責任です。無責任とはどういう意味でしょうか。それは、AIが言っていることが正しいと実際に断言し証明できないということです。生成的であるため、答えを生成します。そしてその答えは夢のようなもので、真実かもしれないし、そうでないかもしれません。

でもこう言うでしょう。AIが言ったことが真実かどうかを分析するために別のAIを使えばいいじゃないか、と。でもそこが問題です。もう一つのAIも生成的で、それも答えを生成し、それが真実かどうかわからないのです。だからこのAI同士の正誤のピンポンが真実に近づくことはわかっています。確かに。

でもそれでもAIが言ったことが正しいという絶対的な確実性ではありません。人間は責任を持つことができます。情報を見て言います。「これはこれで、あれはあれだ。だから結論はこれで終わり」。AIはまだそれができません。でも今まで話してきたこれらの留保すべてを考慮しても、専門家レベルのアプリケーションを行うと、GPT-5.2 Thinkingはこの新しいFrontier Mathテストで40パーセントを達成します。

そしてここに補足があります。AIが解決した8つの問題のうち、確かに知識の最前線を進めることができましたが、以前に研究を行った他の人々に依存していました。だからそういうことなんです、皆さん。物事は非常に進歩していますが、まだ完璧ではありません。

まだ多くのステップを踏む必要がありますが、今のところ進化は加速し続けています。私たちが話しているこれらすべては3年間のことです。そして確信していますが、来年2027年には、私たちが今日知っているLLMの10周年を迎えます。そしてこの時間は、この道のりで何か大きな新しいものが現れるのに十分です。突然すべてが変わり、すべてがひっくり返り、私たちがどこに行くのかわかりません。

だから下にコメントして、何を考えているか教えてください。そしてこのような動画を見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーはインテリジェントエージェントの限定動画と先行公開動画にアクセスできます。それでは、いいねを押してください。ありがとうございました。

コメント

タイトルとURLをコピーしました