
9,242 文字

今年末までには、世界最高のコーダーとなるAIエージェントが誕生する可能性が非常に高くなっています。それは単一の人間のコーダーよりも優れており、私たちはそれを100万回複製することができます。そしてその直後には、新しい知識を発見し、あらゆる病気を治療し、新しい科学を発見し、社会の仕組みを根本的に変えることができるAIが登場するでしょう。
これらすべての証拠をお見せしたいと思います。この動画は、素晴らしいAI画像・動画生成ツールであるPolo AIの提供でお届けします。ただし、それについては後ほどお話しします。
サム・アルトマンは先日、日本での講演で、特にtest time compute、o1、o3、deep seekが主流になって以来のAIの驚異的な進歩について強調しました。まず、サム・アルトマンは、これらのモデルが短期間で見せた桁違いの知能の向上について話し、それと並行して、コストの指数関数的な減少が見られています。deep seekは世界に衝撃を与えましたが、ダリオやサム・アルトマンのような真のAIリーダーにとって、deep seekは実際、知能のコストが下がっていく予測曲線に沿ったものでした。
このクリップを見てみましょう。以前は事前学習のみのパラダイムでした。GPT1、2、3、4の各バージョンは、正確ではありませんが、非常に近い100倍の規模で、それぞれに新しい創発的な特徴がありました。この1年間で分野において、あるいは少なくとも私たちにとって最も重要なことは、推論ができる新しいモデルの出現です。これらは信じられないほどの新しい計算効率の向上をもたらし、多くのベンチマークで、旧来の方法では GPT6まで待たなければならないと予測していたようなパフォーマンスを、はるかに小さなモデルで実現できるようになりました。
これは強化学習によって実現されています。今では感覚がつかめてきました。新しい方法でやると、すべてが良くなるわけではありませんが、特定の次元で向上させることができます。彼が説明しているのは、GPT1、2、3の各バージョンで100倍の知能の向上があり、その向上から何か新しい創発的な振る舞いが見られたということです。
そしてそれらはすべて、従来型の「すべてのデータを収集してモデルに投入し、何が得られるかを見る」という事前学習から生まれました。しかし今では、test time computeがあります。これは、モデルにプロンプトを与えたときに、より長く考えることを意味します。これはo1とo3ファミリーのモデルが行ったことであり、deep seekも同様です。これは非常に素晴らしいブレイクスルーであり、人類の歴史上どの技術よりも速い革新の速度と効率の向上を目の当たりにしています。
トランジスタについて考えてみましょう。人類の歴史の中で最も重要な技術の一つです。トランジスタは計算の基本単位であり、基本的にあなたが所有するすべてのデバイスに組み込まれています。トースターや冷蔵庫など、あなたが思いもよらないようなものにも入っています。そしてムーアの法則と呼ばれるものがあります。これはインテルの共同創業者であるゴードン・ムーアによる予測で、基本的にチップに搭載できるトランジスタの数が約18ヶ月ごとに倍増するというものです。
つまり、私たちが持っている計算能力は18ヶ月ごとに本質的に倍増するということです。多くの人々は、ムーアの法則が人工知能に直接つながると考えていましたが、実際にはAIはムーアの法則をはるかに超えて進歩しています。この点については、サム・アルトマンが最近公開したブログ記事を見ながら、後でもう少し詳しく話します。
test time computeに話を戻しましょう。test time computeは興味深く、deep seekは世界にその仕組みを示しました。基本モデルの学習後に、検証可能な報酬を用いた強化学習を使用してモデルを訓練するのです。では、これは実際には何を意味するのでしょうか。基本的には、モデルに様々な解決策を試させ、正しいものに対して報酬を与えるということです。
ここで重要なのは、問題の答えを知っている場合にのみモデルに報酬を与えることができるということです。そのため、これらの思考モデルは特定の科目では非常に優れていますが、他の科目ではそうではありません。しかし良いことに、それらが得意とする科目は実際に世界で非常に重要なものです。コーディングや数学、科学などです。なぜなら、これらのモデルが訓練できる証明可能な解決策があるからです。
例えば、2+2は常に4です。だから、数学では検証可能な報酬があります。モデルが2+2=4と言えば、「はい、それは正しい」と言えます。一方で、「詩を書いて」と言った場合、正しい答えはありません。そのため、これらのモデルはSTEM(科学、技術、工学、数学)で非常に優れた性能を発揮しているのです。
このセグメントのスポンサーであるPolo AIに感謝します。Polo AIは、最先端のオープンソースモデルを非常に簡単に使用して、見たい動画を生成できるAI動画生成ツールです。マーケティング用のB-rollが必要な場合でも、単に楽しむためでも、Polo AIは完璧です。テキストから動画、画像から動画、動画から動画、一貫したキャラクター生成をサポートしており、cing、Runway、Luma、Vu、huo、pix verseなど、多くの最先端の動画モデルをサポートしています。
単一のAPIまたはUIを通じて、単一の価格ですべてのモデルで動画を生成できます。40以上のAI動画効果とテンプレートがあり、簡単に動画を作成して共有することができます。ここでモデルを選択し、これらすべてのサポートされているモデルを見て、プロンプトを入力し、アスペクト比を選択し、可視性、コピー保護を選択して、作成するだけです。
無料版では明らかに試用することができ、有料版ではより多くのクレジット、より多くの機能が得られ、プライベート動画を作成することができます。Polo aaiをチェックして、無料で試してみてください。リンクは下に貼っておきます。どう思うか教えてください。このセグメントのスポンサーとなってくれたPolo AIに再度感謝します。
では、動画に戻りましょう。次にサム・アルトマンは、新しい知識を発見できるAIへの非常に明確な道筋について話し、事前学習について学んだすべてのことと、test time computeをスケールアップする能力を組み合わせることで、これらのモデルから信じられないほどの知能が引き出されることについて話します。そして、その限界は見えていないようです。
私たちは今、以前よりも賢明に、もしより大きなモデルを事前学習し、これを行うことができれば、それがどこに到達するかを言うことができます。そして、このような飛躍から見られることに基づいて私が期待することは、本物の新しい科学的知識の最初の兆しや生命の兆候です。
このグラフを何度見せたかわかりませんが、とても重要なので何度も戻ってきます。これはレオポルド・アッシェンブレナーによる状況認識論文からの知能爆発のグラフです。そして、もう一度言いますが、私たちが見ているのは自動化されたAI研究です。AIが新しい知識を発見し、その新しい発見を自身に適用できるようになるやいなや、私たちは自己改善のループに入ります。そしてそれが知能爆発が起こる時であり、それは本当に間近に迫っているように感じます。
そして、明らかにAIが最初に人間を超えることができるのはコーディングです。今年末までにはコーディングは完全に変わるでしょう。サムは、今年末までにはOpenAIが世界最高のコーダー、単一の人間のコーダーよりも優れたモデルを持つだろうと予測しています。
アルファ碁を思い出してみましょう。本質的にアルファ碁と同じテクニックを使用しています。囲碁のルールについて事前知識のないAIモデルが、反復的な自己対戦を通じて、より良くなっていき、最終的に人間が発見さえしていなかったテクニック、有名な第37手を見出しました。
では、世界最高のコーダーであるこのAIがいると想像してください。私たちはそれを何百、何千、何百万回も複製することができ、これらのコーダーは24時間体制でコードを書いています。唯一の制限は、どれだけの計算能力とエネルギーを投入できるかということです。これらのエージェントコーダーは、Devonのようなプロジェクトを通じて、今まさに労働力に加わっています。
しかし、それはコーディングで止まることはありません。これはすべての知識労働で起こるでしょう。AIが単一のカテゴリーの知識労働において単一の人間よりも優れるようになると、彼らは労働力に殺到し、突然すべての人間が、それぞれの分野でこれらのAIエージェントの助けを借りて信じられないほど生産性が高くなるでしょう。
次のクリップを見てみましょう。例えば、o3は私たちの最新の最高のモデルで、信じられないほどよくプログラミングができます。人々がすでに行ったことについては得意ですが、完全に新しいアルゴリズムを発明したり、新しい物理学や新しい生物学を発見したりすることはそれほど得意ではありません。それは次の2つの桁の規模で得られると思います。
彼はそこで言いました。現在のモデルは新しいアルゴリズムや新しい科学を発見することはできませんが、次の100倍のスケールでそれができるようになるだろうと。test time computeでそのスケールまで到達する明確な道筋があることを考えると、それはそれほど遠くありません。
最近のスケールでの進歩は本当に驚くべきものです。私たちの最初の推論モデルは、世界で100万番目のコンピュータープログラマーでした。人々はそれをとても印象的だと思いました。「ワオ、AIがこれをする人々の100万番目に優れているなんて、すごいことだ」と。その後、私たちは約1万位のモデルを持ち、12月に公に話したo3は世界で175位のコンピュータープログラマーです。私たちの内部ベンチマークは現在約50位で、今年末までには1位になるかもしれません。
この新しいパラダイムでは、より多くの計算能力によって驚くべきスケールの速度が得られており、それが止まる兆候は見られません。さて、彼はそこで言いました。彼らはすでに内部で世界トップ50のプログラマーを持っているのです。私は本当にそれがどれほど狂気じみているかを強調できません。世界の80億人のうちのトップ50です。もちろん、すべての人がコードを書けるわけではありませんが、潜在的なコーダーのすべての中でトップ50であり、年末までには1位になるはずです。
そしてそれは理にかなっています。AIはすでにチェスで私たちより優れており、囲碁でも私たちより優れています。コーディングとの違いは何でしょうか?実際には、ルールの集合以外に違いはありません。それらは根本的に同じです。ほぼ無限の決定空間がありますが、これは勝利である、これは正しい解決策である、あるいはこれは間違っている、これは負けの決定であると言える検証可能な方法があります。
AIの進歩の速さについて続けると、サム・アルトマンはこれから言おうとしています。今年末までに、本質的に人間よりも優れたことができるAIを持つことになるだろうと。新しい知識の発見にはまだ及ばないものの、それは2025年の今年末のことです。そして、おそらく2026年、今から1年後には、新しい知識を発見できるエージェントを持つことになるでしょう。
見てみましょう。今年末までには、プロティアを持っていれば、計算能力を最大限に上げて、本当に難しい質問をすることができるモデルを持つことができるでしょう。新しい科学を発見する必要がある質問ではありませんが、それ以外のほとんどのことについて、基本的にそれを機能させることができます。数時間考える必要があるかもしれませんし、多くのツールを使用する必要があるかもしれませんが、基本的にあなたのためにそれを行います。
そこにあります。今年末までに期待できる素晴らしいことです。さて、サム・アルトマンは最近ブログ記事を投稿し、そこで同じようなことについて話していますが、エージェントとAIが一般的にまもなく何ができるようになるかについて、本当に大胆な予測をしています。
見てみましょう。ここにブログ記事があります。「3つの観察」というタイトルで、これを聞いてください。AGIを指し示すシステムが視野に入ってきており、そこに小さな星印を付けています。つまり、彼はAGIを定義しようとしています。私たちは今いる瞬間を理解することが重要だと考えています。
では、下の方で彼がAGIについて何を言っているか見てみましょう。ここでAGIという用語を使用することで、明確にコミュニケーションを図ろうとしています。マイクロソフトとの関係を定義する定義とプロセスを変更または解釈しようとするものではありません。マイクロソフトとの長期的なパートナーシップを完全に期待しています。この脚注は馬鹿げているように見えるかもしれませんが、一方で、一部のジャーナリストが馬鹿げたことを書いてクリックを集めようとすることを知っているので、ここでその馬鹿げたことを予防しているのです。
つまり、基本的に彼は言っています。はい、これをAGIと呼びますが、いいえ、マイクロソフトとの関係は変わりませんと。そして彼はAGIについて、それを見る2つの方法について話します。1つは、それは単なる私たちのツールセットの中の別のツールだということです。人間は人間が存在する限り、道具を開発してきました。車輪から火、蒸気機関、トランジスタなどに至るまで。そして彼は言います。まあ、それは単なる別のツールかもしれませんが、一方で、そうではないかもしれません。
ある意味で、AGIは私たちが一緒に構築している、この常に高くなる人類の進歩の足場の中の単なる別のツールです。別の意味では、それは「今回は違う」と言わざるを得ないような何かの始まりです。そして私もある程度同意します。これは単なる別のツールかもしれませんが、おそらくそれは最後のツールでしょう。AGIの後には何も必要ないかもしれません。
AGIは人類の決定的な発見となるでしょう。その結果が肯定的であれ否定的であれ、これが人類として必要とする最後のイノベーションである可能性が高いという事実はおそらく真実です。私たちの目の前にある経済成長は驚くべきものに見え、すべての病気を治療し、家族とより多くの時間を楽しみ、私たちの創造的な可能性を完全に実現できる世界を想像することができます。
ここで一瞬立ち止まって考えたいと思います。なぜなら、これは少し面白いからです。サム・アルトマンは、AIについて最も熱狂的なPR担当者であることと、「ねえ、ハイプは少し制御不能になっている」と言うことの間を行ったり来たりしています。1月20日のこのツイートを見てください。「Twitterのハイプは再び制御不能になっています。私たちは来月AGIを展開するわけではありませんし、それを構築したわけでもありません。落ち着いて、期待を100分の1に抑えてください。」そしてほんの数週間後には、再びAGIが間近に迫っていると話しています。まあ、かなり面白いですね。
では、彼のブログ記事に戻りましょう。10年後には、おそらく地球上のすべての人が、今日最も影響力のある人ができること以上のことを成し遂げることができるようになるでしょう。さて、彼は3つの「観察」と呼ぶものについて触れています。
それらはこうです。AIモデルの知能は、おおよそそれを訓練し実行するために使用されるリソースの対数に等しいです。さて、訓練については私たちは知っていました。事前学習、実行はインフェレンス、test time compute、思考モデル、それが彼がここで話していることです。では、それはどういう意味でしょうか。
これらのリソースは主に、訓練用の計算能力、データ、そしてインフェレンス用の計算能力です。任意の金額を使用して、継続的で予測可能な利益を得ることができるように見えます。これを予測するスケーリング法則は、多くの桁にわたって正確です。先ほど彼が言ったことを覚えていますか。2桁の規模で、新しい知識を発見できるAIを持つことになると。その時点で私たちは知能爆発の段階に入り、事前学習とtest time computeの組み合わせで複数の桁を達成できるならば、それが彼が話してきたAGIとそれ以上への明確な道筋です。
次に、これはDeep seekによって示されましたが、特定のレベルのAIを使用するコストは12ヶ月ごとに約10倍下がり、より低い価格はより多くの使用につながります。ムーアの法則を覚えていますか。チップ上のトランジスタの数は18ヶ月ごとに2倍になります。おそらくアルトマンの法則では、任意の知能レベルでのAIの使用コストは12ヶ月ごとに10倍下がります。これはムーアの法則をはるかに超えています。
2023年のGPT 4から2024年半ばのGPT 4oまでのトークンコストで、これを見ることができ、トークンあたりの価格は約150倍下がりました。ムーアの法則は18ヶ月ごとに2倍で世界を変えました。これは信じられないほど強力です。
そして第三に、線形的に増加する知能の社会経済的価値は、本質的に超指数関数的な性質を持っています。さて、それは少し言葉の羅列でしたが、それが何を意味するのか説明してみましょう。今、私たちが線形的に増加する知能を得ているとしても、線形とは単に直線を意味しますが、その知能から得られる実際の価値は超指数関数的です。
さて、彼はこの投稿でソフトウェアエンジニアリングエージェントについても少し話していますし、日本での講演でもそれをカバーしましたが、この投稿で彼が言っていることを見てみましょう。ソフトウェアエンジニアリングエージェントのケースを想像してください。彼らはこれが特に重要になると考えています。このエージェントが最終的に、トップ企業の数年の経験を持つソフトウェアエンジニアができることのほとんどを、数日間の長さの作業まで行うことができるようになると想像してください。
そして彼は続けて言います。しかし、1000個、あるいは100万個のそれらを持っていると想像してください。そしてそれだけではありません。それを想像して、今度はそれをすべての知識分野で想像してください。再び、知能爆発です。
そして、AIはトランジスタのようになるかもしれません。経済的には、うまくスケールし、経済のほぼすべての隅々に浸透する大きな科学的発見です。ちなみに、トランジスタの誕生と、それが世界をどのように変えたかについて、技術的な観点だけでなく地政学的な観点からも学びたい方には、「チップ・ウォー」という本を強くお勧めします。本当に素晴らしい本です。
私たちはトランジスタやトランジスタ企業についてあまり考えませんし、その利益は広く分配されていますが、私たちのコンピュータ、テレビ、車、おもちゃなどが奇跡を起こすことを期待しており、それはもはや当たり前のことになっています。未来は無視できない方法で私たちに襲いかかってくるでしょう。そして、私たちの社会と経済への長期的な変化は大きなものとなり、それは来ています。
人々の仕事、人々の生活は劇的に変わるでしょう。確かに今後数年間は多くの摩擦があるでしょうが、私は以前の技術と同様に、人間としてこの新しい常識に適応していくと思います。例えば、長い間、人間の90〜95%が農場で働いていました。彼らは食料を栽培する必要がありました。しかし、ある時点で農場がより機械化され自動化されると、現在では人間全体のわずか一桁パーセントしか農場で働いていません。
では、他のすべての人々はどうなったのでしょうか。彼らは永遠に仕事がなくなったのでしょうか。いいえ、彼らは他にすることを見つけました。例えば、私の仕事、カメラに向かって話すことです。もし私が一日中農場で働く必要があれば、これをすることはできませんでした。そして、これと同じような仕事は他にも100万とあります。私たちは時間の使い方の新しい方法、創造的である新しい方法を発見するでしょう。
もちろん、私は将来について非常に楽観的な傾向がありますが、本当にそう信じています。そして、私が最も興奮していることは科学の進歩です。がんが治療される可能性、すべての病気が治療される可能性があるという考えは、私にとってとても興奮することです。そして彼はそれについて話しています。いくつかの産業はほとんど変化しないかもしれませんが、科学の進歩は今日よりもはるかに速くなる可能性が高いと。多くの商品の価格は最終的に劇的に下がるでしょう。
しかし、彼は私が考えていなかった反面について言及しています。贅沢品や土地のような本質的に限られたリソースの価格は、さらに劇的に上昇する可能性があります。解決すべき問題もいくつかあり、以前の動画でこれをカバーしましたが、労働と資本の力のバランスは、今日以上に重要になるでしょう。そして彼は言います。それは簡単に台無しになる可能性があり、早期の介入が必要かもしれません。
私は以前これをカバーし、こう言いました。現在、資本は労働に対して仕事の対価を支払わなければならず、その労働はそれを受け入れるか拒否するかを選択できます。そのため、彼らはかなりの力を持っています。しかし、AIとロボットが人間ができることすべてをより良くできるようになり、彼らがあなたを拒否せず、「休憩が必要だ」とか「他の会社からより良い提案があったので、そちらで働くことにした」と言わないとしたら、資本を持っている人は無限に労働力を購入することができ、それは資本と労働の力のバランスを変えることになるでしょう。
したがって、考えるべきことがたくさんあり、明らかに近い将来に解決されていない問題もいくつかありますが、私個人としてはそのすべてにとても興奮しています。そして、この動画のスポンサーとなってくれたPolo AIにもう一度感謝します。
この動画を楽しんでいただけたなら、いいねとチャンネル登録をご検討ください。次回の動画でお会いしましょう。


コメント