とんでもないスピードに備えよ(2032年までにシンギュラリティ!)

シンギュラリティ・知能爆発・レイカーツワイル
この記事は約11分で読めます。

この動画は、AI能力測定ベンチマークMERの最新データを分析し、AI進歩が従来の指数関数的成長ではなく超指数関数的成長を示していることを明らかにしている。GPT5の性能から2035年までの予測まで、AIが数年以内に人間の年間作業量に匹敵する自律作業能力を獲得し、2032年頃には技術的特異点に到達する可能性が高いことを数値的根拠とともに解説している。認知能力がもはや経済生産性の制約要因ではなくなる「認知的超豊富」時代の到来を予言する内容である。

Machine Autonomy is Rising Fast - Singularity by 2032 seems likely!
All my links:

GPT5への失望とAI進歩の現実

一部の人々はGPT5のリリースにちょっと失望してるんや。基本的には、もっと量子的な飛躍を期待してたし、確実にサム・アルトマンの宣伝の仕方を見てると、多くの人がもっと大きな飛躍があると思わせられてたやろうな。

まあ、一部の人が指摘してるのは、GPT-4が最初に出た時も、まあハズレではなかったけど、結局到達したレベルほどは印象的やなかったということや。

そう言いつつも、スケーリングの観点では、まだまだ順調に進んでるんや。そこにある最も説得力のあるデータの一つが、MERっていうベンチマークなんや。これは私の意見では最高のベンチマークの一つやと思うんやけど、なんでかって言うと現実世界のタスクでの成功を見てるからや。

これはもうかなり使われてるベンチマークなんやけど、基本的にはモデルがソフトウェアエンジニアリングタスクで50%の成功率でどのくらいの時間自律的に機能できるかっていう指標なんや。

もちろんこれはちょっと狭い範囲やで。ソフトウェアエンジニアリングは一つの分野でしかないし、基本的にテキストネイティブなんや。全てのソフトウェアコードはASCII文字かユニコード文字やから、本質的にはトークンなんや。必ずしも物理学みたいな現実世界の問題っていう意味での物理ではないんや。

超指数関数的な成長パターン

でも、この離陸の速度を見ると、本当にすごいんや。ここで見えるのは、きれいな従来の指数関数なんや。多くの人が気づいてるのは、数年前はほとんどが曲線の下にあったのに、今日はほとんどが曲線の上にあるということなんや。つまり、これはちょっと加速のように見えるっていうことやな。

同じデータを対数曲線でプロットすると、対数グラフではほぼ直線に見えるんやけど、いくつかの例では実際に上向きにカーブし始めようとしてるところが見えるんや。

そこで私がやったのは、この生データを取って、ちょっと生データがどんな感じか見せるわ。生データはYAMLファイルなんや。これはAIが簡単に読めるんや。その生データを取って、ChatGPTに入れたんや。’o1 Pro’を使ったんやけど、8分間考えてくれて、基本的に対数曲線の代わりに超指数関数曲線でプロットしてみようって言ったんや。

そしたら基本的に、モデルの選択は超指数関数の対数二次のものが最適で、決定的に超指数関数やって言ったんや。

データを見ると、基本的にこれが言ってるのは、MERの例を対数でレンダリングすると、まあまあいい当てはまりやけど、実際にこれを超指数関数としてモデリングする方がより良い当てはまりやということなんや。

そのグラフがどんな感じか見せるわ。これが、50%成功率でより長くより長いタスクを実行する能力の上昇をプロットした最終結果なんや。

人間の作業時間換算での驚異的能力

覚えとかなあかん重要なことは、これは自律的に動作してる時間やなくて、人間と同等のタスク作業なんやということや。GPT-5 ProやGPT-5が人間なら2時間かかることをやる時、通常は数分でやってしまうんや。

つまり、より複雑なタスクをより長い時間軸でやってるだけやなくて、より速くやってるんや。超人的なスピードでやってるんや。

そういうことを踏まえて、今どこにいて、どこに向かってるかを見ると、ここからがちょっとばかげてて、ちょっとおかしくなってくるんや。そして、これが私がシンギュラリティは人々が気づいてるよりもずっと早く起こるやろうって言ってる理由なんや。

これらの数字は、10の1乗やから、10の0乗は1や。10の1乗は10。10の3乗は1000、みたいな感じで続いていくんや。10の9乗は10億や。これは分単位なんや。つまり、成功してる自律的な分数なんや。

2030年代の驚異的な予測数値

このペースやと、生データの出力を見せるわ。申し訳ないけど、YouTubeビデオで実際のスプレッドシートを見せてるんやけど、これらの数字は完全にばかげてるんや。

このペースやと、2025年の初めには28.97分、平均でP50成功率やったんや。つまり約30分や。2026年の初めには約2.8時間になると予想されてるんや。GPT-5が出たばかりで2時間ちょっとやから、これはかなり妥当やと思うで。2025年末、2026年初めには3時間マークに近づくやろう。

今、暗示される倍増率は下がってきてるんや。つまり、昔のこの辺りでは、暗示される倍増率は約160日やったと思うんやけど、今は約140日か120日になってるんや。ちょっと間違ってるかもしれへんけど、数学を信じてくれ。

つまり、2026年末までには約20時間の自律P50タスク成功率を持つことになるんや。これはかなり本格的やで。でも、2027年中に何度も倍増するから、2027年末、2028年初めには176時間の自律タスク成功率になるんや。

次の年は1800時間。次の年は24000時間や。24000時間を視点に置くと、これは本当に本当に、どう言ったらええか、頭で理解するのが非常に難しいレベルになってくるんや。

実は私がミスってることに気づいたんや。何百万時間、何十億分っていうレベルを見てるから、このメモは無視してくれ。削除しとくわ、混乱せんように。

24000時間の自律作業、391000時間、760万時間、1億8100万時間の自律時間、50億時間の自律時間、そして2035年までには1870億時間の自律作業や。

シンギュラリティの現実的到来時期

これはもう完全に意味不明になってくるんや。この超指数関数グラフが成長すると、基本的に宇宙の寿命よりも長い何かのP50成功率を持つことになるからや。もちろんこれは多くの仮定をしてるし、ソフトウェアタスクを超えて一般化すると仮定してるんや。

ソフトウェアタスクはかなり難しいし、ソフトウェアでできることはたくさんあるから、これは全ての数学問題に一般化するんやろうか?物理学とかそういうものに一般化するんやろうか?

たとえば、アインシュタインが約24000時間費やしたとしよう。一般相対性理論に8年から10年働いてたから、フルタイムで働いたとしたら年間約1800時間や。つまり、これは一般相対性理論をちょっと上回る程度や。つまり、2030年までには新しい一般相対性理論をワンショット、いや、ツーショットできるということや。

もちろん、その頃までにはこれらの数学スコアはさらに高くなってるやろう。これらが実際に独自に新しい数学定理を発見するんやろうか?このペースやと2030年がかなり妥当な推測やと思うで。

複数要因による成長の加速

このデータが本当に示してるのは、この成長に複数の要因が寄与してるということなんや。ハードウェアが向上してる、パラメータ数が増加してる、ファインチューニングとポストトレーニングスキームが向上してる、ツール使用が向上してる、そして認知アーキテクチャとメモリが向上してるんや。RAGもや。

この数字はトップライン数字で、現実世界のタスクでの成功率に関するものなんや。これは正直、最高のベンチマークの一つやと思うし、超指数関数がこのデータに最も適合するという事実は、私は不安やとは言わんけど、実際に本当に興奮してるんや。

でもこれは、こちらの方、2025年と2026年の間では、まだまだ幼児やということも示してるんや。立ち上がって、太くてぷくぷくした赤ちゃんの足でよろめいてるだけや。まだ歩き始めてもいない、走ったり疾走したり飛んだりなんて言うまでもないんや。そういうことができるようになるのは、わずか数年後にこれらの数字に到達した時なんや。

認知的超豊富時代の到来

これらの用語で考えると、1800時間は約1人の人間の労働年やということを覚えといて。2029年までには、これらのモデルは2029年までに一人の人間の1年分の仕事をツーショットできるようになるんや。それは今から4年後や。2029年の初めやから、実際には4年未満、この日付から3年半未満でこの現在の加速率やと。

それがどれだけの作業をすることになるかや。もし爆弾が投下されるような、マイクドロップみたいなものを期待してるなら、これが何を達成するのか、これが何を意味するのか、私は本当にわからんのや。

私はずっと認知的超豊富の時代に向かってるって話してきたんやけど、数字で表すと、認知的超豊富って何やねんっていうのを明確にすると、認知がもはや経済生産性や人間の欲望のボトルネックでなくなった時なんや。

これがデータ形式で実際にどんな感じかということなんや。2035年にGPT8が1億8700万の自律人間時間に相当することができるとしたら、それは基本的に火から火からインターネットまでを再発明するようなものや。そこまでではないかもしれへんけど、1億8700万人時間の専用時間があったら、基本的に私たちが知ってる文明を再構築するようなものや。

もちろん、人類全体は年間約5兆から6兆、7兆の労働時間を出力してるけど、その6兆から7兆の労働時間は税務会計やレンガを動かし回すような仕事をしてるんや。全てが最前線の科学、最前線の数学、最前線の化学に直接貢献してるわけやないんや。

成長曲線の持続性への期待

でも、このような種類のことを仮想的にできるモデルがあって、もちろん収穫逓減、シグモイド曲線を考慮に入れても、シグモイドはまだ活性化してへんのや。私は何年も言い続けてきたんや、みんな、シグモイドが活性化する準備をしとけって。まだ加速してるけど、減速し始めるやろうって。

いつ減速し始めるかわからんのやけど、全てのデータはまだ全く減速してへんことを示してるんや。実際、まだ加速してるんや。どのくらいの期間加速し続けるかわからんのや。

この傾向がある程度の期間続くなら、これらの機械がわずか数年でどれほど自律的になるかという点で、とんでもない、とんでもない、絶対にばかげた数字を見ることになるんや。

私はこれについて超興奮してるんや。みんながどう思うかわからんけど、このデータを見て完全に恐怖してる人もいると想像できるわ。でも、これが数学や。データが示してることなんや。

私やみんな、この分野の多くの人が言ってきたように、人間の脳は指数関数に対する直感を持ってへん、ましてや超指数関数なんて。だから、これが実際に何を意味するのかって感じなんや。

具体例での理解

私を例にすると、ポスト労働経済を理解するのに約1800時間費やしたと思うんや。そしたらGPT-8 Proの15分で、私と同じレベルでポスト労働経済を解決できるんやろうか?それは妥当な時間内に思えるで。

GPT-8 Proが30分程度で次の一般相対性理論を解決できるんやろうか?

もちろん、ここにもう一つの懸念があって、それはフィードバックループなんや。多くの科学的進歩、化学的進歩、生物学的進歩、数学的進歩には、実際に現実世界に触れる必要があるんや。

とはいえ、事前に全ての計画を立てて、よし、この実験をやろう、データを探しに行こう、何かを作りに行こうって言えるなら。多くの人が指摘してるのはLIGOやウェッブ望遠鏡のようなものや。これらは非常に高価な機器で、建設に何年もかかるんや。

ボトルネック、すまん、興奮しすぎて散らかってるわ。ボトルネックは現実とのフィードバックループになるんや。機器、測定、そういうものが。認知はボトルネックにならへん。

認知能力の超豊富化

わずか数年で持つことになる、余分で超豊富な認知の量は、私にはわからんけど、この傾向が少なくとも5年は続くと思えるから、数千時間分の自律作業に到達することになるんや。それを超えて行くなら、それはもうケーキの上のアイシングや。意味不明になってくる。これらのより大きな数字は絶対に意味不明になるんや。

私は取り留めなく話してるし、同じことを繰り返してるわ。これをどう理解したらいいか完全にはわからんのや。懐疑的な人には、私の仕事をチェックしてもらいたいと思うで。

データを自分でダウンロードしてくれ。ここにあるから、MER measuring AI ability to complete long tasksで検索してくれ。データを自分でダウンロードして、お気に入りのチャットボット、Gemini Grok Claude ChatGPTなどで処理してくれ。そして、どう思うか教えてくれ。同意するか反対するか、なんでもええから。

私が見てるのは、実際にこのアイデアを、似たような仕事に対するツイートへの返信で、実際にこれらの数字はこの加速率でもっと高くなる可能性があるって言った人から得たんや。私は超指数関数が加速率を最もよく捉えてると思うけど、曲線より上にある数字を見ると、これでもまだ保守的すぎる可能性があるんや。

2032年シンギュラリティの可能性

とにかく、2032年までにシンギュラリティを見ることになるんやろうか?少なくともその知能爆発の部分については、絶対に理性的な可能性の範囲内に思えるで。

でも、言ったように、最大のボトルネックは物理学になるんや。新しいチップを印刷するのには一定の時間がかかる。新しい高エネルギー素粒子物理学実験、プラズマ実験、核融合実験を作るのには一定の時間がかかるんや。

でも、認知、知能は2030年までには絶対にボトルネックにならへん。それ以降は、もうとんでもないスピードに一直線や。これは私にとって本当に興奮することなんや。それじゃ、お疲れさん。

コメント

タイトルとURLをコピーしました