GPT-5のリリースが迫る

GPT-5の登場まで数か月ではなく、もはや数週間しか残されていません。これは非常に重要なことですが、誇大宣伝をしたくはありません。過去にいくつかのモデルを誇大宣伝してしまったことがあるので、今回はできるだけ現実的で、むしろ控えめな分析を行いたいと思います。このモデルが何であり、何になるのかについて説明していきます。

まず最初に、Sam Altman自身の発言をいくつかの異なるクリップで再生したいと思います。これらは彼が数か月前にGPT-5がどうなるかについて述べた発言です。もし彼が数か月前にGPT-5がどうなるかについてそのような発言をしたなら、実際にそれに近いものになる可能性があると考えるのは合理的でしょう。では、クリップを再生してから、さらなる分析に入っていきます。

Sam Altmanの発言

GPT-3からGPT-4への移行は本当に世界を驚かせました。GPT-4からGPT-5への移行も同様の飛躍となるでしょう。これらのモデルの能力は素晴らしく、非常に賢くなっているので、おそらくGPT-5や6の時点で「もう十分な知能だ。この時点で私より賢い」と言えるかもしれません。

どのようにして統合するか、どのようにして使いやすくするかが課題です。音声モードとキャンバス、ビデオ、そして私たちのすべての機能を統合することができるか。ウェブ検索をいつ行うか、研究プロジェクトにいつ取り組むか、コードをいつ書くか、音声モードにいつ切り替えるかを知っている一つのモデルだけですべてを実行できるか。知能を獲得した後、この統合が次の大きなマイルストーンになると思います。

私たちはGPTとOを統合したいと考えています。すべてを行うAGI、つまり一つの統合されたモデルを目指しています。いつ深く考えるべきか、いつ素早く行動すべきかを知っており、すべてを使うことができます。

私はGPT-5より賢くなることはないと思いますし、それについて悲しいとは思いません。なぜなら、それは私たちが信じられないことを行うためにそれを使えることを意味するからです。つまり、携帯電話を持っている地球上のすべての人が超知能アシスタントを持つことになります。超知能ではないかもしれませんが、本当に賢いアシスタントです。

Proto-AGIとしてのGPT-5

Sam Altmanは、GPT-5が彼より賢くなると言っており、彼は決して愚かではないように見えます。これは特定の次元においてより賢くなるということで、すべての次元でより賢くなるわけではありません。なぜなら、今のところ世界に特定の因果的要因をもたらすある種の主体性に欠けているからです。

しかし、確実に言えることは、単一の人間がこのproto-AGIを持つという事実です。私はこれをproto-AGIと呼ぶことに満足しています。もちろん、AGIの定義によって異なりますが、私のAGIの定義は、マウスとキーボードといった従来の方法でコンピューターを使用するのではなく、Star Trekのような方法でコンピューターを使用することです。つまり、コンピューターと話しかけ、コンピューター上で人間ができることやそれを超えた任意の複雑なことを実行させることです。

これは非常に近い将来に起こると思います。GPT-5は、これらのモデルのモダリティの収束が始まる最初のステップだと思います。オペレーターを持ち、すべての異なるモダリティが一つのモデルに収束するところです。これはニュースではありません。これまでの情報を追っていれば、GPT-5がこれらすべての異なる要素を持つことはすでに認識しているはずです。

オペレーティングシステムとの統合

その直後に、OpenAIの従業員の一人であるAidenからのツイートがあります。彼はオペレーティングシステムモデルを持っており、それが彼の心を吹き飛ばしていると述べています。また、Xプラットフォームのエンジニアの一人であるYesingからのツイートもあり、彼も非常に深遠だと述べたモデルを試したと言っています。Aidenもそれに返信していました。

間違っているかもしれませんが、非常に間もなく、おそらく今年末までに、あるいは来年の初めまでに、ChatGPTのチャットインターフェース内でのモデルの収束が、実際のオペレーティングシステムとの統合と共に見られるようになると思います。

基本的に、Macやコンピューターにアプリがインストールされていれば、ChatGPTアプリに行って、それに話しかけるだけで、文字通り物事を実行してくれます。これは、コンピューターと話し、オペレーティングシステムと統合し、コマンドラインを使用し、オペレーターの使い方を理解し、必要に応じて非常に直感的に使用できる、少なくともAGIのproto形式だと思います。

コンピューターの問題空間の飽和

コンピューター上で行いたいことのデータをすべてコンテキストに持ち、コンピューターと話すだけで動作する。これはそれほど遠い話ではありません。多くの人が現在本当に気づいていない大きなことの一つは、多くの人がコンピューター上で非常に熟練した労働者でなければならないような異なる種類のことに焦点を当てているということです。

しかし、コンピューターの問題空間はそれほど広くないのです。ある程度は広いですが、コンピューターの問題空間は、これらのモデルにエージェンティック強化学習を適用している今、かなり迅速に飽和すると思います。

Twitterで見たかなり面白い二つの写真があります。一つはソーシャルメディアプラットフォームのスケーリング対チャットのスケーリングの収益、もう一つは人間とAIの技術的特異点です。基本的に、ドゥームスクローラーは行動を変える必要があるということです。ドゥームスクローリングは長期的には実行可能なビジネスモデルではないでしょう。

AIツールとの成長

人々は本当にこれらのツールを真剣に受け止めるべきだと思います。これは非常に切迫した問題だと思います。モデルとコーディングしていない、モデルとソフトウェアを構築していない、AIツールで実際の物を構築していないなら、実際には彼らと一緒に成長していないのです。

本当に重要なことは、これらのモデルが本当に得意になっている次元は、モデルを適用し、焦点を当てるべき次元だということです。彼らが得意になっている最初の次元はソフトウェアエンジニアリング、コーディングです。

モデルと一緒に成長できるなら、これはこの技術にどのように適応すべきかを理解するための非常に良いフレームワークだと思います。技術があなたを運んでくれるのを待つのではなく、技術がある場所から始めることです。現在急速に加速している改善のベクトルを見て、今はコーディングであり、さらに広範囲に続くでしょう。そのベクトルに沿って一緒に成長し、他のベクトルに入り始めたら、そこでも一緒に成長を始めます。

これが皆が話しているマージを得る方法であり、一緒に成長しているようなものです。これは非常に強力なフレームワークであり、これらのツールが何であるか、何をするか、どのように援助できるかを考える方法です。

今後の展望

これが現在物事が向かっている方向だと思います。Star Trekのような方法でコンピューターを使用する方向へ向かっており、GPT-5はそれの最初の垣間見えるものだと思います。その後に来るGPT何でも、おそらくGPT-6になるでしょうが、実際のオペレーティングシステムと本当に統合されたものになるでしょう。

現在、大手フロンティアラボのすべての研究者の感情を見ると、感情は非常にシンプルです。次の2年間は、前の2年間よりもはるかに速く加速するでしょう。それがすべてです。次の2年間は前の2年間よりもはるかに速く加速するでしょう。

Anthropicの研究者の見解

Anthropicの主要な人物の一人からのクリップを再生してから、彼が言ったことについて話します。

9から12か月でどのようなAI能力を予測しますか？

9から12か月は今からとても長い期間です。とても長いです。6か月と言いましょう。確実に、非常に複雑なタスクを調整するエージェントのチームとなる世界を非常に迅速に見ています。単にコードを書くだけでなく、解決する必要がある問題を思いつくことです。

指数関数的な動きが非常に速く進んでいるため、推測するのが難しいと笑って話しました。過去6か月は、その前の6か月よりもはるかに異なって見えるからです。私はそれが続くと予想しています。

急速な進歩

過去6か月は狂っていました。過去6か月を見ると、3.5から4.0への開発速度に心を奪われます。ある程度はただ狂っています。モデルがどのように変化したかは狂気的です。

そして、あなたが見ていないことがたくさんあります。モデルが古いやり取りから自分の記憶を保存し、これは後で覚えて拾い上げる興味深いことになると自分で評価してファイルに書き込むのが得意になっています。知性につながる舞台裏で起こっていることがたくさんあります。

彼が言ったことについて大きく振り返って考えてみると、これは非常に深遠です。GPT-3.5から今日までの移行について考えてみてください。多くのことで本当に混乱したが、AIシステムの最初の形態のようなものだった、やや良いが非常に悪いモデルから今日までです。その時間軸はそれほど長くありませんが、能力は文字通り垂直的な上昇でした。

加速する曲線

これを加速の継続と共にさらに2年間展開してみましょう。それが大きなポイントです。加速の継続。これらのことは線形ではありません。これらは加速する曲線であり、線形ではありません。

これらすべての加速する曲線の非常に多くの証拠と証明があります。事前トレーニングが加速していることの非常に多くの証拠があります。推論テスト時間計算スケーリングが加速していることの非常に多くの証拠があります。実際に適用されたエージェンティック強化学習が加速していることの非常に多くの証拠があります。

これらのことは互いに急速に複合しており、常に加速しているムーアの法則のバックボーン上で動作しています。加速の上の加速の上の加速、すべて上昇方向、すべて下降方向への指数関数があります。

AGIとASIへの道筋

Anthropicの責任者がビデオで言ったように、次の2年間はより速く動くでしょう。組織レベルのAIを持つレベル5のAGIシステム、つまり基本的にCEOやAIを管理するマネージャーのような存在になるところです。それが新しいモデル、新しいことです。

誰もこれらのことについて本当に考えていません。人々がこれらの小さなシステムや自動化を構築し、それらを構築するのにすべての時間を費やしているのを見ますが、今日は効果的ではありませんが、これらのシステム全体は今から数週間後に廃止されるでしょう。数か月後には、それらのシステムも自動化されることになります。

サービスを購入するためにエージェンシーに行く代わりに、人々はOpenAIにサインアップするだけで動作するようになるでしょう。コンピューターと話すだけで物事を実行します。AGIレベルのシステムは統合するシステムではなく、購入するコンピューターです。机の上に設置し、一つのプラットフォームにサインアップすれば、人間の介入や人間のニーズを一切必要とせずに、望むことを何でも実行してくれます。

今後の予測

私たちはProto-AGIを見ようとしていると思います。AGIは来年にはここにあると思います。そこからスケーリングを続けるだけです。ASIと呼びたいなら、おそらく2027年、2028年にはASIレベルのシステムを持つことになるでしょう。その時点で、コンピューターを購入して机の上に置き、ASIにコンピューター上で望むことを何でもさせ始めるだけです。

これらのモデルは非常に間もなくローカル化されると思います。Sam Altmanのツイートを見たでしょうか。画面に表示します。「いつあなたの電話でO3 miniレベルのモデルがローカルで動作することを期待しますか？」人々は2025年と言いました。Sam Altmanは最近、オープンソースモデルを発売すると言いました。ここには少しヒントがあると思います。