2025年、私たちはAIを誤解していた…

AIニュース
この記事は約11分で読めます。

本動画は2025年3月から10月までの6ヶ月間におけるAI技術の進化を振り返る回顧的分析である。最大のトピックはエージェントAIが実験的フレームワークから実際のインフラストラクチャへと急速に成熟したことであり、企業による導入が加速している。ソフトウェアエンジニアリングベンチマークは21%から70%へと飛躍的に向上し、AI chatbotは知識エンジンから行動エンジンへと進化した。企業幹部の88%がAI予算の増加を計画しており、特にエージェント機能への投資が顕著である。技術業界のベテランたちは、生成AIの普及速度がPC、インターネット、クラウドコンピューティングのいずれよりも速いと証言している。研究のフォーカスは実現可能性からガバナンスと政策へとシフトし、AI技術の「カンブリア爆発」が2025年後半に起きていると結論づけている。

We got AI wrong in 2025...
All my links:

2025年のAI:6ヶ月間の振り返り

さて、この動画は何人かの方々からリクエストされたものなんです。コメント欄のファンの皆さんからも、コミュニティのファンの皆さんからもいただきました。いろいろな形で寄せられるんですが、要するに皆さんが振り返りを求めているということですね。というわけで、ここにそれをお届けします。今後も何度かやるかもしれませんが、どうなるか見てみましょう。

でも、このアイデアは未来を予測するのではなく、過去を振り返って、私たちの予測がどれだけ外れていたか、あるいは過去6ヶ月間に何が起こったかを見てみようというものです。それでは、手元に便利なメモを用意してあります。

一番大きなこと、絶対的な見出しとなるのは、6ヶ月前に遡ってみると、今は10月上旬なので、2025年3月時点でのAI状況を調査してみました。現在は2025年10月なので、厳密に言えば6ヶ月前は4月になりますが、4月の始まりになってしまうので、2025年3月末時点ということにしましょう。その時点で私たちはどこにいたのでしょうか?

エージェントAIの台頭

絶対的に最大の収穫は、エージェントAIが現実のものになったということです。以前は、ほら、これは面白い実験的フレームワークだねという感じだったのが、まだそれについて多くの疑念があって、ゲイリー・マーカスのような人々がエージェントは不発だと言っていたんです。

でも今では、エージェントが実験的な新技術だったところから、インフラストラクチャとガバナンスの配管があらゆる場所に導入されるようになりました。そして、私が言っているのはフロンティアラボだけのことではありません。つまり、私が話をしたすべての主要企業が、自社で実装するにしても、Microsoft、Google、OpenAIなどの助けを借りて実装するにしても、エージェントの実装に取り組んでいるということです。今や誰もがエージェントを展開しているんです。つまり、仮説から実際のものへ、そして急速に成熟しているということです。

主要モデルのリリースとマインドセットの変化

それでは、他のいくつかのことに分解してみましょう。まず第一に、皆さんが気づいていないかもしれない最大のことは、Google Gemini、いや、正確にはGoogle Gemini Pro 2.5が6ヶ月前に出たということです。OpenAIのGPT-4.5も同様です。それと他にもいくつか。Grok 3も6ヶ月前に出たばかりです。これらすべてと今日の状況を考えてみてください。

でも、業界で起こった最大のマインドセットの変化の一つは、これらのAI chatbotが知識エンジンのようなものから進化したということです。というのも、RAG、つまり検索拡張生成を理解していたからです。それは理解していたんですが、今では行動エンジンへと進化しました。これが最大の変化の一つです。もはや単なるchatbotではないんです。

ますます自律的な行動を取るようになっているか、ユーザーの誘導によって直接行動を取ることができるようになっています。つまり、全体的にますます自律的でエージェント的になっているということです。エージェントAIがソフトウェアキットから実際のアーキテクチャへと移行したことはすでに述べました。

ベンチマークの飛躍的向上

ベンチマークについて。この数字を指摘させてください。SWE-bench、つまりソフトウェアエンジニアリングベンチは、6ヶ月前は21%だったのが今日では70%になりました。だから、私がああそうだね、あるベンチが30%だよと言うとき、今朝もニュースで見たんですが、AIは放射線写真で30%の精度しかないという話がありました。私は、それなら1年で解決されるだろうと思うんです。

なぜなら、どうでしょう?放射線写真を解決するために明示的に訓練されていなかったのに、かなり得意なんです。そして今、それが新しいターゲットになり、新しいベンチマークになった今、どうなると思いますか?6ヶ月から12ヶ月で飽和させるでしょう。

だから、MMLUのような古いベンチマークが飽和したので、新しいベンチマークを作成しなければならなくなりました。OpenAIは先日GDP valをリリースしましたが、これは実際の経済生産物における有効性を測定するというアイデアです。

ベンチマークと実際の市場採用

ただ、ベンチマークは一つのことですが、現実と企業による採用が本当に主要なことです。それでも何かを測定するのは良いことです。何かをリリースする前にラボで何を最適化しているのかを知るためには、測定が必要ですからね。

でも同時に、実際の市場での受け入れが主要なことなんです。ところで、ビジネスリーダーやビジネスインサイダーと話すたびに、ベテラン、つまり私より年上で、これをずっと長くやってきた人たちは、全員が明確に、生成AIの普及は、彼らが知る限りの歴史の中でどの技術の展開よりも速かったと言っています。

つまり、PCよりも速く、メインフレームよりも速く、インターネットの普及よりも速く、クラウドコンピューティングの普及よりも速いということです。すべてがそうだと。

技術普及の速度と懐疑論への反論

さて、技術業界の内部者ではない人や、技術業界で働いたことがない人のために、それが何を意味するのか説明させてください。なぜそれが重要なのか。人々が懐疑的なとき、生成AIはまだ何でもないと言う人がいます。彼らは知らないんです。

正直なところ、彼らは自分が何を話しているのか分かっていません。だから、ゲイリー・マーカスが何でもない、これは何だとか、あの他の人エド・ジトロンとか言うたびに、彼らは大衆の時代精神に迎合しているんです。でも時代精神は間違っています。今はっきり言いますが、時代精神は間違っています。

そう、AIを批判するのは人気があります。ああ、まだこれができないと言うのが。でも関係ありません。インターネットは完璧ではありません。クラウドコンピューティングも完璧ではありません。どんな技術も完璧ではありませんが、採用率は技術業界の内部者や業界リーダー全員が、この40年から50年で見た中で最速なんです。ビジネス側から、技術側から、両方の側から、彼らはこれほど速く採用されるものを見たことがないと言っているんです。さて、これで私の意見は終わりです。

研究アジェンダの変化

研究面では、本当に機能するのか?つまり、実現可能なのか?実行可能なのか?ROIは?コストがかかりすぎないか?エネルギーを消費しすぎないか?インフラを構築できるのか?というところから、結果は何か?ガバナンスは何か?ポリシーは何か?というところに本当にピボットしました。

つまり、6ヶ月前には、いつか将来この影響に対処しなければならないと言っていたのが、今日その影響に対処しているという状況になりました。そしてそれは必ずしも悪いことではありません。

というのも、それは単に研究アジェンダが今日見ている現実に更新されたということを意味するからです。つまり、チップの需要はあり、データセンターの需要はあり、エネルギー需要はあり、トークンは安くなっていて、5ヶ月から6ヶ月ごとに10倍安くなることもよくあります。でも、誰がこれに責任を持つのか?という質問もあります。それはよく出てくる質問だと知っていますが、以前に自動化を作ったことがないわけではありません。

歴史を通じて、多くの自律的、半自律的、自動化システムがありましたが、常に所有者の責任です。そして確かに、一部の企業はRACIマトリックスを更新しなければならないでしょう。RACIに馴染みがない方のために言っておくと、露出度の高い服装で公共の場にいるという意味ではありません。

RACIは、責任者(Responsible)、説明責任者(Accountable)、相談される人(Consulted)、情報を受け取る人(Informed)の略です。基本的に、これは誰がこれを所有するかを決めるために企業で作成するマトリックスです。だから、私の考えでは、そしてほとんどの企業の考えでは、RACIマトリックスを更新するだけの問題です。

残りは裁判所で争われることになるでしょうし、それは実際に起こっています。とにかく、それはちょっとした余談でした。

社会的・認識的側面の変化

では、技術面の話をしたので、社会的・認識的側面についても話したいと思います。つまり、当時人々は何を信じていて、実際に今は何を信じているのか?

繰り返しになりますが、ROIからガバナンスへの移行がありました。すべての思想的リーダーたちが、これは売れるのか?この製品は実際に価値があるのか?誰かがお金を払うのか?と考えていたのが、人々はお金を払っているという状況になりました。それは明らかに障壁ではなかったんです。だから今、実際にリスク管理を理解しましょう、ガバナンスを理解しましょう、といった感じになっています。サイバーセキュリティも大きな要素です。

ハイプサイクルから実装へ

それから、ハイプは大きく変わりました。3月の時点ではまだ、ほら、ハイプサイクルとか言っていて、ちなみに私の最もパフォーマンスの良い動画の一つは少し前のもので、AIハイプは冷めつつあると言ったものです。

これを解釈する一つの方法は、実際に何人かの人が指摘したんですが、ガートナーのハイプサイクル自体がちょっと欠陥のある指標だということです。ミーム的な力、つまりミーム力を持っていますが、ハイプサイクル自体はちょっと欠陥があって、メタ研究では実際にほとんどの技術はガートナーのハイプサイクルに従わないことが示されています。

でもそれはさておき、ハイプ、つまり何かについて非合理的な期待や非合理的な熱狂があると定義できるものが、ゴムが道路に接したような状態に変わりました。私にとっては実際にもっとエキサイティングです。なぜなら、そう、実際に起こっているんです。実際に結果を生み出しています。実際に実装されていて、会話が進んでいます。

ガートナーのハイプサイクルで言えば、啓蒙の坂道に近づいている、緩やかな啓蒙の坂道に近づいていると言うでしょう。でも、それは本当に急な坂です。非常に速く起こっています。

AIツールのカンブリア爆発

つまり、ハイプ、つまり希望的観測から、このようなAIツールのカンブリア爆発へと移行したと言えます。拡散モデル、トランスフォーマーなどのわずかな基礎技術が完全に爆発したんです。

そして、これがこの動画のタイトルになるかもしれません。カンブリア爆発がこの6ヶ月間で起こったと。参考までに、私が話しているのは約6億年前のことだと思います。それくらい前だったと思います。

地球の歴史のほとんどの間、生命は単細胞でした。だから約30億年間、生命は単細胞でした。でも6億年前、生命は自然発生的に多細胞生物を発見し、そしてすべてが変わりました。種の大増殖があったんです。

私は本当に2025年の後半がAIのカンブリア爆発として記憶されると感じています。もちろん、予測は危険ですし、そうしないようにしてきましたが、これがデータが示していることです。巨大な爆発がありました。

だから、Sora 2、Suno、すべてのAI音楽や動画ジェネレーターがどんどん大きくなっています。

世論の変化とAIへの懸念

さて、世論も変化しました。人々は天気予報にAIを使うことなどにはそれほど懸念を持っていません。AIが人間よりも天気予報が得意だというニュース記事がいくつか出ています。つまり、それはデータの仕事ですよね?もちろん、人間の直感や地域知識は別の問題ですが、気候学者か何かなら、私の親友の一人は気候学者で、彼は想像できる最大のシミュレーションを実行しています。つまり、非常にデータ集約的な仕事なんです。

とにかく、リスク、X-リスクのようなものは本当に先細りになってきました。それはさておき、アメリカ人や裕福な国の人々全般は、いくつかの例外はありますが、中国は世界的には中所得国ですが、中国の発展した地域は非常に裕福です。

とにかく、要点は、多くの先進国の人々が今ではAIにあまり興奮していないということです。ディープフェイク、倫理、雇用喪失などについて、より警戒するようになっています。

これについては最近の動画でもっと詳しく話しました。AIを嫌う人たちには一理あると言いました。話すべきことはたくさんあります。でも、この技術との関係を交渉しなければならないんです。

企業によるAI投資の加速

そして最後に、最大のことは、先ほど述べたことですが、技術分野の誰も、ビジネス側でも技術側でも、AIほど急速に進歩する技術を見たことがない、つまり普及が、というところです。

88%、つまり10月時点で88%の経営幹部がAI予算を増やす計画を立てています。特に、その大きな部分がエージェント機能に関するものです。

だから、2025年の初め、2024年の終わりに、私は2025年はエージェントの年になると言いましたが、それは非常に正しいことが証明されました。もちろん、それはわずか数ヶ月先を予測していただけです。だから、誰でもできたことでしょうし、明らかにその予測をしたのは私だけではありませんが、それが現状です。

まとめ

これが2025年10月時点での6ヶ月間の振り返りでした。これからどうなるか見ていきましょう。本当にワクワクしていますし、一歩下がって、6ヶ月前はどこにいたのか?と言うのは素晴らしいことだと思います。Gemini Pro 2.5が出たばかりでした。Grok 3が出たばかりで、もうGrok 4になっています。そしてエージェントが本物になりました。

ちなみに、これらすべてを知っていたわけではありません。調査をしてこれらのメモを集めているとき、これらの数字がここまで速く進歩していたとは気づいていませんでした。だから、一歩下がって6ヶ月前はそこにいたと言うと、本当に印象的です。

でも同時に、ただ続いていくということが本当に嬉しいです。どんどん良くなって、さらに増えていくでしょう。なぜなら、それが長寿やがん、そして私たちが解決したい他のすべての問題を解決する方法だからです。さて、もう喋り終わります。見てくれてありがとう。それでは、良い一日を。

コメント

タイトルとURLをコピーしました