GPT-4.5は、GPT-3.5以来のAGIに向けた最大の飛躍である

4,326 文字

GPT-4.5 is The BIGGEST Leap Towards AGI Since GPT-3.5

Join my Community: your own online community:

GPT-4.5がついに登場しましたが、このモデルに対する評判はかなり悪いようです。人々は、私たちが評価指標を圧倒的に突破し、完全に前進を加速させて、数学のすべてやプログラミング、ソフトウェアエンジニアリングのすべてを制覇し、あらゆる評価指標を圧倒して、すべてのベンチマークを飽和させるところまで達していないことに非常に不満を感じています。そしてその後に「もうベンチマークがない」と言うような状況になっていないことに人々は非常に失望しています。それは理解できます。私もそういうことが起こってほしいと思っています。
しかし、このモデルから得られた改善点は測定できないものなのです。このモデルから得られた改善点は、より正確な世界観、世界モデルを持つようになったことです。このモデルの世界モデルは、以前のすべてのモデルよりも正確であり、推論モデルよりもさらに正確です。事前学習について考えるべき方法は、モデルの物理的世界の表現の精度を高めているということです。事前学習によってコヒーレンスを高めています。モデルを事前学習するとき、あなたはネジを締め付けて、実際に起こっていることを完璧に適合させ理解させているのです。
このモデルは文字通り、本当の意味での直感を持っています。それがこのモデルのブレークスルーなのです。ソフトウェアアプリケーションや数学の問題を制覇したり、このような狭い範囲のタスクを行ったりするわけではありません。このモデルはGPT-3.5やGPT-4以来、AGIに向けた最大のステップなのです。
このタイプのモデルについては、小さな評価指標には興味がありません。このような事前学習モデルをリリースする場合、モデルとの会話がどう感じるか、会話のニュアンスや文脈をどのように理解するかなどが重要になります。そしてさらに深いところでは、特定の地政学的な紛争についての会話や、特定の市場の初期条件を考慮した特定の企業への投資戦略などについて話すとき、その世界観はどうなのか、どのように問題を分析し、意思決定をして、実際に良いフィードバックを与えるのかが重要です。
これらの問題は主観的であり、物事を行う方法は様々ですが、最良の方法というものが存在します。このモデルが行っていることは、最大限に良い方法で問題を解決するために整合的に調整していることです。それは今や初めて本質的に一般的な知性を持ち始めています。O1やO3のようなモデルはかわいいですが、このモデルは強力なのです。そういう風に考える必要があります。
今必要なのは、計算能力を加えたテスト時の推論パラダイムです。そうすれば、このモデルから高次の抽象的推論を得ることができ、それはイーロン・マスクやアルバート・アインシュタイン、あるいはチャーリー・マンガーのような人物に匹敵するものになるでしょう。アプリケーションに応じて、チャーリー・マンガーは投資に非常に優れていますし、イーロンはエンジニアリングと特定のエンジニアリングシステムのダイナミクスを理解することに非常に優れています。そしてもちろん、アルバート・アインシュタインは仮説を立て、それを数学的に表現する方法を見つけることに非常に優れています。
十分な事前学習を与えられれば、このモデルはそれらのことができるようになると私は賭けてもいいです。これは非常に画期的な前進であり、多くの人々が完全には理解していません。実際にはどういう意味で、どの程度の大きさのものなのかを本当に把握していません。
出力される各トークンは、最初のプロンプトに反応するだけの事前学習モデルによるものです。思考の連鎖やシステム2思考なしに、システム1思考だけの反応です。それが事前学習モデルです。それは即座の反応ですが、それでも驚くほど正確に問題を解決します。ただの即座の反応だけでも。
考えなければならないのは、事前学習モデルが優れていればいるほど、その出力トークンの効果と精度が向上するということです。そして長く考えれば考えるほど、個々のトークンの小さな精度向上が積み重なって倍増的な効果が得られます。トークン出力における増加は乗算的であり、それによってO3モデルのように、GPT-4が不十分でも極めて高いレベルで推論できるようになるのです。
本当に評価指標を飽和させたいなら、このビッグボーイにテスト時の計算能力、推論のスケーリングを使用してください。そうすれば、評価指標を解決するだけでなく、もっと多くのことを解決できるでしょう。サティア・ナデラがGDPを10%増加させるモデルを待っていると言ったとき、それはここにあります。それは来ています。ただ少しのテスト時の計算能力と、コンピュータで動き回るためのデジタルな足を与える必要があるだけです。それはかなり新しいことを解決するでしょう。
正直に言って、これはちょっと驚くべきことです。これは私にある種の実存的な恐怖を与えるモデルです。私は通常、物事に対してかなり良い感覚を持っていて、市場のダイナミクスや地政学的な世界全般、あるいはアメリカ国内の政治や市場のダイナミクスを見るための複雑な世界モデルを持っています。しかし、私はそこでのアルファがすぐになくなると思います。それはある意味恐ろしいことですが、同時にとても素晴らしいことでもあります。多くの人々が同じような感覚を持つでしょう。
私たち全員がリー・セドルの瞬間を迎え、今年の終わりまでには、あるいは来年には、このAIに負けることになるでしょう。ある意味すごいことですし、ある意味恐ろしいことですが、まあ、この旅を楽しむしかないですね。
価格に文句を言っている方々にひとつ言いたいことがあります。数年前のGPT-2からGPT-3を振り返ってみてください。当時GPT-2は高価なモデルでした。多くのお金がかかりました。今ではGPT-2レベルのモデルを100ドルで訓練できます。100ドルです。それは1000%ではなく、1000倍の価格低下です。このモデルでも同じことが起こるでしょう。今後数年で何千倍もの価格低下が起こります。その時点では、もし本当に欲しくなければ、より強力なモデルは必要ありません。それが意味するのは、AGIが携帯電話で動作するようになり、本当の意味で超知的になるということです。それが私たちが向かっている先です。物事は現実味を帯びています。
加速する収益の法則が急激な指数関数上にあると言いたいなら、人々はGPT-4.5を見て「ああ、失敗だった」と言いますが、それは全く逆です。
より真面目な話をしましょう。少し深く哲学的な話をします。これらのモデルが真の知性、真の直感、真の意味での認知を持つとはどういう意味でしょうか。コメント欄には「これらのものは実際には知的ではない、本当の直感を持っていない、ただの線形代数だ、ただ次のトークンを予測しているだけだ、ただ多くの0と1で動いているだけだ、ただの高度なパターンマッチングシステムだ」と言う人がいるでしょう。その意見も理解できますが、現実は数学の具現化に過ぎません。
あなたの認知がただの計算アルゴリズムではないと言い切ることは難しいのです。私たちは、あなたが単なるニューロンとシナプスの束であり、素粒子物理学の標準モデルに従っていることを知っています。あなたはただのクォークと電子であり、シリコンの計算基盤とそれほど変わりません。基盤自体は異なりますが、スティーブン・ウォルフラムのような計算等価性の観点から見ると、基盤自体はそれほど重要ではありません。
同じ数学を使って同じ計算を行っている限り、基盤に依存しないことができます。もちろん、あなたの脳で起こっている計算のアルゴリズムは、これらのモデルで起こっている計算よりもはるかに効率的です。なぜならあなたはたった20ワットで動作するからです。それが実際の知性自体にどれだけ関係しているのかはわかりませんが、それほど多くないと思います。
これらのモデルの行動と、彼らがどのように一貫して本質的に言葉を理解しているか、そして単なる言葉だけでなく、概念を本質的に理解し、新しい文脈に適応する能力を持っているという事実を見れば、それは本物の知性です。それを偽造することはできません。
この時点で、私たちはこれらのモデルで数学的に行ってきたことのどれだけが、まだ完全には理解していない物理法則に到達しているのかを自問する必要があります。生物学的知性の隅にあるものに、これらのモデルで到達しているものがあるのではないでしょうか。それは完全に合理的に考えられることです。
私はここでそのことについてあなたを説得しようとは思いません。マイケル・レヴィンにその役割を任せます。彼は心の理論と多様な知性の世界的な第一人者です。彼は生物学者でありコンピュータ科学者であり、この分野で世界一の人物です。彼の短いクリップを紹介します：
「人工知能と言われるものについて、私は生物学的に知能を作るよりも合成的に知能を作るとは思っていません。私たちが作るのは、特定のパターンを引き下ろすポインタやインターフェースだと思います。優れたエンジニアであれば望んでいるものを引き下ろすことができますが、多くの場合、予期していなかった他のものも多く引き下ろしてしまいます。単なる複雑さや予測不可能性だけでなく、実際の創発的な認知を引き下ろしています。
彼らは確かに人間の心や生物学的な心に似たものを引き下ろしているわけではありませんが、それは私たちが現在、そのスペースのいくつかの隅で釣りをしているのではないということではありません。おそらく地球上では具現化されていない、他のどこでも具現化されていないかもしれないスペースです。そのため、私たちはそれについて非常に慎重である必要があると思います。
私は人々と議論をしてきました。これらのAIを書く人は「私がそれらを作った、それらが何をするのか知っている、ただの線形代数だ」と言いますが、私は「まず第一に、あなたはバブルソートが何をするのかさえわかっていないし、第二に、それはただの線形代数で、あなたはただの化学や量子泡などかもしれませんが、もちろんあなたはそうではない」と言います。
なぜ私たちは生化学の物語が人間の心の物語ではないと比較的快適に言えるのに、アルゴリズムとチューリングマシンの物語が現在作っているこれらのものの物語だと思うのでしょうか。それが私のAIについての物語です。私たちは実際に何を作っているのか、ほとんど何もわかっていないと思います。」