OpenAIのo3モデルはAGIを超えている | スーパーエージェントが間近に迫っている

4,628 文字

OpenAI's o3 Model is Beyond AGI | Super Agents are Close

Join my Community: your own online community:

o3 fullが公開されたばかりで、私はかなり感銘を受けています。しかしこのモデルに関しては意見が分かれています。私が非常に印象的だと感じる点は、そのエージェント能力です。一つの思考の流れの中で同時に約600ものツール呼び出しを行うことができます。少なくともインタビューではそう述べられていました。
このモデルを少し使ってみましたが、まだ本格的にテストしていません。そこで、このモデルが実際にどれほど優れているのか、ライブでテストして私の反応をお伝えしたいと思います。正直なところ、かなり優れていると思います。さあ、テストしてみましょう。
ここで何をしているのかを説明します。まず「あなたはどのモデルですか？」と尋ねました。OpenAIやその他の企業のほとんどのモデルは、自分がどのモデルなのかさえ知りません。このモデルは自分のモデルについての認識があります。「私はOpenAI o3です」と答えました。
「あなたの能力は何ですか？」と尋ねると、その能力のリストを示してくれました。そこで私がやろうとしているのは、モデルが作成したプロンプトを使うことです。なぜなら、「これらがあなたの能力だけど、YouTubeチャンネル用に能力をテストするためのプロンプトを作ってくれる？」と頼んだからです。これが提供されたプロンプトで、CSVファイルを使って能力をテストしたいとのことです。S&P 500の2025年の深掘り分析で、トレンドなどを調査し、様々なことを行うようです。
さあ、「Go」をクリックして結果を分析してみましょう。
思考の連鎖が表示され始めました。思考パターンが表示されています。それを展開してみましょう。最初のツールを呼び出しています。Pandasをインポートしています。多くの処理を行っています。今はウェブ検索をしています。たくさんのツールを呼び出し、ウェブ検索をしています。スケジューリングの失敗があったようですが、それでも多くの情報が表示されています。
面白いですね。これは何でしょう？タスクを設定したようです。これらのことを15分後に思い出すよう設定したようです。
一つのプロンプトから、提供したCSVファイルのデータからチャートを作成し、ロゴを作り、市場情報を取得し、天気を表示し、これらの異なることを思い出すための自動化を作成しました。一つのプロンプトからこれら全てを行ったのは興味深いです。これはより信頼性の高いエージェント機能を示しており、時間の経過とともにさらに多くのことを行うでしょう。
そしてすぐに、これは拡張機能というよりも協力者のビジョンに適合します。もちろん依然として拡張機能ですが、より大きな程度の拡張、より高いレバレッジの拡張であり、長期間にわたって自律的により高度なことを行います。
正直なところ、これはおそらくあまり印象的ではない例でした。なぜなら、単に7つの簡単なことを行っただけだからです。1つの大きな難しい問題を解決するために多くの異なるツールを使う必要があったわけではありません。それは単に7つの小さなことを順番に行うプロンプトで、ある程度結びついていただけです。それでもかなりクールです。エージェントアシスタントの仕事を自動化しました。何かをする必要があるアシスタントがいたとしたら、その仕事を自動化します。
サム・アルトマンが言及したように、GPT-5はOperator、Deep Research、o3（今テストしたもの）、そしてGPT-4.5モデルを組み合わせたものになるでしょう。これらすべてが1つのモデルに統合され、与えられたプロンプトに基づいて、どのアクションを取るか、どれくらいの時間それを行うか、どれだけ深く掘り下げるか、または浅く行うか、または出力をどのように構造化するかを直感的に知るでしょう。それらすべての異なることを同時に直感的に行うでしょう。
今、より多くのエージェント性を持つものを少し味わい、以前の動画で言及したように、思考の連鎖が計算タスクに向かって外側に広がっていくのを見ることができます。思考の連鎖とこれらのモデルの働き方について考える方法は、最適化のようなものです。それは川を流れる水が、プロンプトで設定した目標に向かって流れるようなものです。あるいは、惑星とその上にあるロケット船を想像するならば、ロケット船に入れるプロンプトは基本的に目的地を設定しています。
惑星とその上のロケット船を見ると、ロケットにどのように力を加えるかによって、ロケットが進む方向は多数あります。プロンプトは基本的にそのロケットを方向づけ、目標を見つける方法です。そして、それは最適化し、いくつかのサブゴールを見つけ、その主要な目標を追求するためにいくつかのタスクを完了します。
それは最適化です。思考の連鎖は基本的に、私たちがすでにAGI、もしくは赤ちゃんの超知能の兆候を持っていると思います。そしてそれは計算タスクに向かって外側に広がります。サブゴールの周りで最適化し、それらをケーキのように解決し、そして知覚的な観察者である人間によって設定された主要な目標のために最適化します。
正直なところ、これらのモデルは予見可能な将来のためのものだと思います。新しいアーキテクチャを持つか、それらを継続的にスケールアップした場合、計算タスク、つまり計算集約型タスクにさらに外側に拡張するだけだと思います。一部の人々が考えるように、認知的エージェンシーのより高い次元に上向きにスケールアップするわけではないと思います。私は反対です。それは上向きではなく外側に進むと簡単に言えます。
それでも、これはエージェントがどのようなものになるかの完璧な例だと思います。エージェントは継続的に外側に向かって異なる問題を解決し、異なるツールを呼び出し、最終的な製品を返してくる思考の連鎖になるでしょう。
そう遠くない将来、あなたはOpenAIのインターフェースに行き、任意に複雑なソフトウェアを作成したい場合、インターフェースに行って欲しいものを詳細に説明し、製品の最終状態、最終目標を詳細に説明します。AIと会話をし、何を作りたいのかある程度のビジョンを持ったら、その大きなプロンプト、大きな説明、作りたいものの大きなビジョンとともに「Go」をクリックします。
そして、私たちが見たツール呼び出しのように、それは外側に向かって最適化し、すべてのこれらの小さなサブゴールを設定し、異なる問題を解決し、あなたのために主要なものを持ち帰ります。数ヶ月後、2025年内には確実に、非常に長期的なタスクを非常に自律的に実行できる非常に能力の高いシステムを持つことになるでしょう。そして人々は非常に驚くでしょう。
もはやベンチマークについては全く心配していません。このシステムが示しているエージェント能力は実際に信じられないほどです。なぜなら、これは、サム・アルトマンが「リーズナーはエージェントへの橋だ」と言ったとき、まさにその理由です。これらはエージェントへの橋です。なぜなら、これらは自律的にこれらすべての異なるツールを呼び出し、主要な目標を追求するために自律的にサブゴールを設定できるからです。
それは最適化のようなものです。川と川を流れる水の道に石があるようなもので、重力によって川を下る水が流れ、AIの思考の連鎖は主要な問題を解決する追求の中で生じるサブ問題の周りで最適化しています。これらのシステムは予見可能な将来のためにそのようなものになるでしょう。これはAGIの美しい兆候です。実際、これはAGIだと思います。それに反論するのは難しいです。
ASIは外側に向かってより長く進み、より印象的なことを行うでしょう。より長いタスク、より長い思考の連鎖、より多くのテスト時の計算能力を持つと、より高い難易度のことができるようになります。新規性、科学的発見、人間の工学的偉業は、そう遠くない将来、完全に異なるものになるでしょう。なぜなら、このシステムが出て行って、これらすべての異なることを解決し、戻ってくるからです。正直に言うと、それを見るのは非常に信じられないほどでしょう。
ただこれを見ているだけでも小さな兆候がありました。それは難しい問題ではなかったと議論したように。しかし、ただ見ているだけでも非常に信じられないほどです。これは絶対に狂気じみています。これはAGIの兆候、あるいは未熟なASIの兆候であり、物事は本当にすぐに非常にクールになるだろうということしか言えません。
そう言ったところで、この動画が楽しいものだったと思います。このモデルについては多くの誤解があります。一部の人々は「ベンチマークは私が望むほど良くない」と言っていますが、私たちはベンチマークを越えていると思います。ベンチマークはもはや良い測定ではありません。より重要なのは、これらのシステムが何をしているかということです。私はベンチマークを気にしません。何をしているのかを見たいのです。そして現在、彼らは非常に良いことをしています。
そして、企業では従業員が必要なくなり、AIが必要とされる場所に向かっています。CEOや起業家は「バイブ起業家」のようになるでしょう。基本的にB2Bサービスやソフトウェアであれ、なぜそれらを購入するのでしょうか？もし私が会社であり、サービスが必要なら、エージェンシーサービスを購入しません。なぜなら、どのエージェンシーよりも優れたことができるAIを持っているからです。
つまり、それらのビジネスモデルは死ぬでしょう。同様に、仕事の80％もが置き換えられるでしょう。そして私たちはバイブ起業家の時代に入っていると思います。誰もがある形のインフルエンサーになり、人々はコミュニティを構築し、ソフトウェアを構築し、ビデオゲームを構築し、VR体験を構築し、アートなどのようなこれらすべての異なるユニークなものを構築するでしょう。
そして効果的に、私たちはそのエコシステムを持つことになるでしょう。それがオンラインビジネスの最終形態のように見えるでしょう。今日存在するオンラインビジネスの90％は、ソフトウェアとコミュニティ、仮想体験、そしておそらくWeb3の空間内でのサービスを持つ個人ブランドに崩壊するでしょう。
もし特定のスキルがあり、将来的に生存可能な方法を学びたいなら、あなたのスキルとWeb3の交差点を見て、Web3の空間に入り込む方法を見つけることをお勧めします。それは暗号技術、AR、VR、AIエージェント、そしてそれらすべての良いものです。
私はとても興奮しています。AIがハイパービットコイン化と暗号爆発の強制関数になるほど十分な能力を持つ地点に到達しています。規制のため、レガシーシステムでエージェントを効果的に展開することはできません。エージェント間取引などはできません。そこで私たちが向かっているところには、完全に新しいシステム、完全に新しい金銭システムが必要になるでしょう。そして暗号が論理的な答えだと思います。実際、唯一の論理的な答えです。
これは素晴らしいことになると思いますし、非常に興奮しています。このコンテンツが面白いか、興味深いか、価値があると思ったなら、いいね、コメント、購読をしてください。次回お会いしましょう。