
4,291 文字

私ははっきりと言いますが、AGIは既に存在すると思っています。90%の確信があります。TRAGテストをパスしましたし、思考、推論、計画ができるモデルがあります。ニューラルネットワークで数学ができるモデルもあります。計算機とは違います。ニューラルネットワークが実際に数学、実際の推論をしているのです。計算能力を増やせば、より高度な数学ができます。これらのモデルには、真の深みがあります。GPT4.5による事前学習の規模を拡大すると、真の深み、真のニュアンス、まるで本当の理解のようなものがモデルに見られるようになります。環境や周囲の状況を機能的に認識しているかのようです。これらのモデルには既に深みがあり、話す能力、聞く能力、物を見る能力があります。実際に触れる能力もあります。他の物体と接触したことを認識することもできます。残るは味覚と嗅覚だけです。しかし、正直言って、既に研究されているので、ちょっと驚きです。メタ認知も欠けていると言えるかもしれません。それは、環境の中でリアルタイムで適応する動的な世界モデルを持つ能力です。多くのタスクでは、実際にはそれは必要ありません。特に、これらのモデルのメモリバンクを考えると、これらのモデルのメモリはますます長くなってきています。これは、少なくとも以前の経験のニュアンスに対する適応的な理解と言えるでしょう。パラメータなどは変化しませんが、そのメモリバンクから情報を取得し、トレーニングランから開発した世界モデルを使用して、物理的な世界の中で行動を起こすことができます。
もうすぐ、あらゆるものを自動化できるモデルが登場すると言えるでしょう。中堅管理職レベル以下は、おそらく自動化されるでしょう。CEOや上級幹部などは、少し違います。彼らは、リアルタイムで適応する世界モデルを必要とします。本当に優れたメタラーニングができる新しいアーキテクチャができるまでは、しばらく安全です。それがどのくらい先になるかは分かりませんが、今のところ、これらのモデルは中堅管理職レベル以下の仕事であれば、かなり高い能力を発揮します。
最近、興味深い出来事がありました。「よし、今の状況はどうなっているんだ?AGIは既に存在する」と言わせる出来事でした。Googleが、新しいロボット工学に関する動画を公開したのです。ロボットが、大規模言語モデルを使用して、言語の文脈を利用し、物理的な世界の中で物事を特定し、その文脈を与えられて、それらと相互作用しているのです。それらの物を見たことがない、全く新しい環境でも、直感的な方法でそれらと相互作用しています。それがそうなるとは、予想外でした。可能だとは思っていましたが、もう少し難しいと思っていました。この動画の一部を紹介します。動画の途中で、私にとって非常に印象的だった点を指摘します。この同じモデルは、訓練を受けたことのないタスクにも一般化できます。バスケットボールを拾ってダンクシュートするのです。これらの物体は、ロボットが以前見たことのないものです。しかし、Gemini 2.0のバスケットボールやダンクシュートといった概念の理解を活用することで、ロボットはタスクを理解します。「テーブルの上にあるものは何ですか?」「カラフルな文字タイルがいくつかあります」「トランプのデッキにあるものを綴ってくれませんか?」ここで一時停止します。これらの文字を使って、トランプに関連する言葉を綴ってください。一見すると、それほど簡単ではありませんでした。すぐに反応して実行できるようなものではありませんでした。周囲を見回してトランプのことを考え、文字を見て「ああ、できる」と思いました。ロボットがどれほど速くそれを実行するかを見てください。「エース」という言葉はどうですか?タイルをスライドさせて綴ることができます。[音楽]
どう思いますか?チューリングテストをパスしたこと、新しい環境に適応し、今ご覧になったような行動をする汎用ロボット工学があること、これらのものが推論していること、味覚と嗅覚以外のすべての感覚を持っていることなどを考慮すると、チェックする項目はほとんど残っていません。これはAGIです。非常に迅速に、まもなく展開されます。数十億ドルがデータセンターに投入され、データセンターが拡大され続けているのは、これらの汎用ロボットが経済の大きな部分を自動化できるようにするためです。今年から始まります。これはもはや仮説ではありません。Figure Roboticsが実際にロボットを職場に導入しているという証拠が既にあります。ロボット工学の進歩により、これらのシステムは膨大な量のデータを使用しなくても学習できるようになりました。Figure RoboticsのAIモデルのブレークスルーを見ると、そのモデルには非常に少量のデータしか使用されていませんでした。それでも、分布の外側に一般化し、見たことのない物体がある全く新しい環境の中で相互作用することができました。つまり、これらのシステムは、人間に近い速度で学習できるようになりました。毎月モデルのアップデートをリリースするだけで、ほぼリアルタイムでアップデートされます。実際にはリアルタイムではありませんが、毎月モデルのアップデートをリリースすれば、仕事の80%を自動化できます。実際には、残るのはCEOや幹部、市場における高いレバレッジポイントを特定し、それらのレバレッジポイントを活用する人々だけです。そして、実際には物理的に作業をしているような一次元のタスクを実行している人々は必要なくなります。
メタ認知がいつ実現するのか、これらのものがリアルタイムで適応する世界モデルを持つようになるのはいつなのかは分かりません。多くの人が予想するよりもはるかに難しいと私は思っています。実現可能かどうかさえ、まだ分かりません。非常に堅牢で安全な自律型ロボットを実現することは、もしかしたら望ましくないのかもしれません。将来的には実現するかもしれませんが、非常に堅牢なシステムが必要でしょう。実際には、まだその段階には近づいていません。以前の動画で述べたように、現在私たちが構築すべき最高のスキルは、特定のタスクを実行することではありません。市場における高いレバレッジポイントを特定する能力、優れた世界モデルを持つ能力、世界における特定の機会の手段を見るためのメンタルモデル、そしてそれを非常にシンプルなフレームワークで理解する能力です。それが今、本当に重要なスキルです。直接行っている特定のタスクを学習することではなく、多くの事柄を理解し、世界観をいくつかのレバレッジポイントに単純化することです。ウォーレン・バフェットやチャーリー・マンガーを見てください。彼らが言っていることをするべきではありません。彼らの世界モデルは、昔と変わっていません。しかし、彼らが結論に至るために使用する原則は時代を超越しています。彼らの原則に基づいた思考方法を学べば、今日にも同じように効果があります。それが今、本当に重要なことです。個々のスキルを学習することではなく、マクロレベルで適応することです。私たちは、直接的なタスクを実行することに非常に長けたAIエージェントを持つ段階に入ります。私たちは、メタ認知を持つ人、リアルタイムで適応する世界モデルを持つ人になります。そして、次の機会が何であるかを予測し、リアルタイムで適応する世界モデルを活用して、AIエージェントを中堅管理職レベル以下のあらゆるタスクに展開します。
サム・アルトマンが言ったように、2027年までに、1人10億ドル規模の企業が登場するでしょう。レバレッジポイントを特定し、最高のワールドモデルを持つ人が勝利するでしょう。今、私たちがどのような状況にあるか理解していただきたいと思います。ロボットは、環境を見たり、触ったり、聞いたり、相互作用したりすることができます。ニュアンスや文脈の深さを理解することができます。コンピュータ上のAIエージェントは、まもなく登場します。過去何度も言ってきたように、ソフトウェアエンジニアリングは今年の終わり頃には解決されるでしょう。これらのモデルは、計画作成にも長けてきました。私は個人的に、これらのモデルを使って、開発予定のソフトウェアアプリケーションの計画を立てました。システムアーキテクチャとエンジニアリング、マイクロサービス全体のプラットフォームの構築、個別のDockerコンテナでのホスト、異なるスタックへの展開、通常の動作と同じように動作するといったことについて、優れた理解を示しました。私はこれらの方法を全く知りませんでしたが、このモデルがそれをガイドし、指示に従って「次へ」をクリックするだけでした。
この技術は急速に進歩しています。まもなく、より自律的になり、より信頼性が高まります。今のところ、メタ認知はありませんが、いつメタ認知を持つようになるかは分かりません。近い将来、メタ認知を持たない方が良いと分かるかもしれません。どうなるかはまだ分かりません。しかし、いずれにせよ、興味深い時代に入っています。行動を起こし始め、資源を集め始める時です。過去の動画で述べたように、貴重な資源だと考えているものがあります。それは、コミュニティ、インテリジェンス、労働力、エネルギー、そして素材です。これらの5つのレバレッジポイント、これらの5つのカテゴリーに投資し、これらのカテゴリーの中で構築していけば、将来に備えることができるでしょう。これらは文明の基礎です。文明を築くには、コミュニティ、インテリジェンス、労働力、素材、エネルギーが必要です。これらの資源があれば、世界にはあなたの資源を価値があると考える人がいるでしょう。そして、あなたはより高い地位に立つことができるでしょう。
今回はここで終わりにしたいと思います。貴重な情報だったことを願っています。ご質問があれば、下の説明欄にあるコミュニティに参加して、直接質問してください。コミュニティコールを定期的に開催し、これらのことについて詳しく話し合い、将来に備えます。エンジニア、起業家、そしてこの技術を最大限に活用しようとしている普通の人々がいます。最高のバイオテクノロジー、最高のコンピューティング、AIを手に入れ、素晴らしい未来を楽しみましょう。そう思われる方は、下の説明欄のリンクから参加してください。


コメント