本動画では、AI技術研究者マーク・ワーナーが、AI能力の指数関数的成長を示す重要なグラフを用いて、AI技術の進化スピードとその影響を解説している。ソフトウェア開発タスクにおけるAIの性能を人間と比較した実験データから、AIの能力が7ヶ月ごとに倍増していることが明らかになっている。ワーナーは新型コロナウイルスのパンデミック予測で重要な役割を果たした経験から、指数関数的成長に対する人間の直感の弱さを指摘し、今後5年間でさらなる性能向上が予測されるAI技術が、新型コロナウイルス以上の社会的・経済的変革をもたらす可能性について警鐘を鳴らしている。医療、教育などの知的タスク領域における劇的な変化と、それに伴う準備の必要性を強調する内容である。

AIの驚異的な進化スピード
皆さんもおそらくお気づきだと思いますが、AIは本当に良くなっていて、それもとても速いペースで進化しています。現時点では、大手AI企業からのリリースがほぼ毎週のようにある感じですし、正直なところ、実際に手にしてみるとそれは信じられないほどすごいんです。
そしてこれは私だけが言っているわけではありません。つまり、マーク・ベニオフのようなシリコンバレーの内部関係者が、GoogleのGemini 3という最新AIモデルについて語っているんです。
その飛躍は狂気じみていると。つまり、これらは本当に深刻なレベルの改善なんですね。そしてもちろん、これら全てを誇大広告として片付けることもできますし、確かに現在AI周辺には多くの誇大広告があるのは事実です。しかし同時に、AIがどれだけ良くなっているかを示す数学的な測定方法があります。それらはベンチマークと呼ばれています。
基本的に仕組みはこうです。AI企業は自社のモデルをリリースする前に一連のテストにかけます。いわば最終試験のようなものですね。そしてこれらの試験によると、彼らが得ている結果もどんどん良くなっているんです。私たちは改善を見続けています。そして覚えておいてください、これが今が最悪なんです。
これは、AIが今後ずっと最悪である状態なんです。ここからは良くなる一方なんです。そして正直なところ、私は実際にこれを自分自身のために視野に入れるのに苦労していました。それで、ロンドンで最も影響力のあるAI創業者の一人と話をしたいと思ったんです。マーク・ワーナーという人物です。彼はFacultyというテック企業を経営しています。
そしておそらくもっと重要なのは、彼がAI分野の最初期から携わってきた科学者だということです。彼は物理学から離れて、確か約10年前だと思いますが、AIに転向しました。だから彼は最初からそこにいたんです。そして私は彼に言いました。ねえ、これらのベンチマークが何を示しているのか説明するのを手伝ってくれないかと。すると彼は、もちろん、実は一つのグラフでできますよと言ったんです。
マーク・ワーナーが示す驚くべきグラフ
マーク、ここで私たちが見ているものについて説明してもらえますか。
ええと、これはMeterという組織による本当に興味深い実験なんです。彼らは約170のソフトウェア開発タスクを取り上げて、人間にそれをやってもらったんです。40人ちょっとの人間にです。そして彼らは、平均して人間がそれを完了するのにどれくらい時間がかかるかを測定しました。それから彼らは2019年頃から現代に至るまでのすべてのAIモデルを取り上げて、それぞれのタスクについて、どのような人間相当の時間で50%の成功率を達成するかを測定したんです。つまり少し複雑なことですが、最終的には、AIが特定のタスクを行う人間の能力とどう比較されるかを問うているわけです。そして彼らはそれをただプロットしました。彼らはこれらすべてのモデルを、50%の成功率を達成したタスク時間に対してプロットしたんです。彼らが発見したのは、この信じられないようなパターンで、非常に強い指数関数的トレンドがあったんです。
そしてもちろん、最近の歴史において、人間は指数関数に対する直感が弱いことを私たちは知っています。そしてこれらのもの、つまり指数関数の実際の経験は、このグラフで見ることができるように、大体何もない、何もない、そして全てなんです。そしてそれが、この文脈で私たちが真剣に考える必要があることだと思うんです。
ここで少し割り込みますが、皆さんが見逃しているかもしれない少しの文脈があります。
指数関数的成長への警鐘
マークが人々は指数関数に対する直感が弱いと言うとき、彼は本当に自分自身の個人的な経験について話しているんです。なぜなら2020年3月に遡ると、Facultyは本当に速く広がっているように見えたこの奇妙な新しいウイルスに関するデータをモデル化するためにNHSのために働いていました。そしてマークが気づいたのは、コロナウイルスが指数関数的な曲線上にあるということでした。
それには、何もない、何もない、何もない、すべてというこのパターンがありました。たまたまマークの兄弟ベンは当時ダウニング街で働いていて、ドミニク・カミングス、首席補佐官が、最終的にマークとベンをダウニング街に連れて行き、彼に戦略を変えるよう説得させることになりました。なぜなら、そうしなければNHSは崩壊することになっていたからです。マーク・ワーナーは私がこれまでの人生で会った中で最も賢く、最も倫理的な人々の一人だと私は知っています。
彼がいなければ、何千人もの人々が死んでいたと思います。マークは実際、歴史においてかなり重要な役割を果たしたわけですね。しかし本当に私たちの目的のためには、これはマークが以前にここにいたことを理解することなんです。彼は最初の段階で指数関数的曲線を見てきたんです。そしてそれが彼が警告していることです、それが再び起こっていると。
これらの数字はどれくらい信頼できるんですか。あなたは現場でAIに取り組んでいますよね。これはあなたの日常生活で見ているものですか。
ソフトウェアエンジニアリングの文脈内で、そしてこの種の期間にわたって、直感的に誰もが大規模な進歩を感じることができると思います。ここ下の方では、これらのモデルはプログラミングには全く役に立ちませんでしたが、ここ上の方では、異なるプログラミングタスクの特定の要素について、10倍、20倍スピードアップさせることができます。
だから直感的に、このようなパターンは本物です。さて、特定の評価指標の正確な詳細や特定のタスクについては、もっと疑問の余地があるかもしれません。なぜなら測定するのが本当に難しいからです。私たちは、これがまさに測定しなければならないものだと言えるほど十分な知能の理論さえ実際には持っていないんです。
だから私たちが時間を費やしているのは、たくさんの小さなテストを作成して、そしてそれらすべての個別の測定から、より広い全体について私たちに多くを語ってくれる何かをまとめようとすることなんです。本当に未知のことは、この線がさらに伸びるかどうか、そしてこの洞察をどのように取り入れて、明らかに私たちが非常に気にかけている他の種類のタスクの束全体に一般化すべきかということだと思います。
もしLLMがソフトウェアエンジニアリングだけに限定されるなら、それはあなたの仕事がソフトウェアエンジニアリングである場合には非常に大きな問題ですが、社会の残りの部分にとっては、それほど重要ではありません。しかし、この種のトレンドが知的タスクの大部分のようなものに当てはまるなら、それは非常に意味があります。なぜなら私の感覚では、人間のように話す能力や信じられないほどリアルな画像を生成する能力といった点で、すべてが同じ方向に進んでいるように感じるからです。
それはあなたの感覚でもありますか。
そうですね、つまり、繰り返しになりますが、素晴らしい測定を構築するのは本当に難しいんです。しかし、ほぼすべてについて個々のベンチマークを見ると、見えるのは、今の難しい問題は、それがすぐにベンチマークを完全に飽和させないようなテストを見つけることなんです。だから、これらのものがすぐに合格できないような本当に賢いテストを構築するために、たくさんの作業が進行中なんです。
このグラフのどの時点でチューリングテストがあったのか考えるのは興味深いですね。なぜならそれが大きなテストでしたよね。そして私たちはそれをたぶんあの辺りかどこかで通り過ぎたような気がします。どこかここ、多分ここあたり、直感的には、これは信じられないというような感じです。つまり、ChatGPTが出た時のことを覚えていますが、私はこれが私たちの人生で最も重要な技術リリースの一つになるだろうと分かりましたが、それでも実際には私の仕事をするのにそれほど役に立ちませんでした。
そして1年か2年後のどこかで、突然これが少なくともかなりの数のタスクについて私の努力と同じくらい良いことに気づいたんです。もし推測しなければならないとしたら、そこからこの曲線の形はどうなると思いますか。ただ上がり続けるんでしょうか。
AI進化の限界と今後の展望
永遠に上がり続けることはできません。
だから、もしあなたがこのトレンドを単純に延長したら、これらのモデルを訓練するのに必要なエネルギー量は、惑星全体に存在する以上のものになるでしょう。だからこれはある時点で頭打ちにならなければなりません。私たちはそれが正確にいつどこで起こるのかを理解しようとする作業をたくさんやっています。しかし、少なくともあと5年くらいはこれが続く可能性が高いと思います。
そして言っておく価値があるのは、このトレンドが示しているのは、これらのタスク、AIが可能なタスクが7ヶ月ごとに倍増しているということです。だから、このトレンドをさらに、例えば5年間延長したとしても、それは多くの倍増なんです。たくさんの倍増ですね。ええ、その通りです。だから、そのレベルの倍増では、その線はほとんど天井を突き抜けるでしょう。
全くその通りです。正直に言うと、それはかなり怖い感じがします。あなたはどう感じていますか。
覚えておくべきことの一つは、これは50%の成功率を示しているということです。それは実際のほとんどの現実世界のアプリケーションにはあまり役に立ちません。50%の成功率でビジネスプロセスを自動化することはできません。ほとんどの実際のビジネスプロセスは99%または99.9%の成功率で実行されなければなりません。数学をやってみれば、それはすべてを下にシフトさせ、すべてを遅くします。しかし、私たちは絶対にこれに適切に備える必要があると思います。もしこれが真実であることが判明すれば、それは巨大な、巨大な、巨大な問題です。そして、私たちが新型コロナウイルスで見たように、指数関数に適切に備えなければ、物事が非常に深刻になり始めたときに本当に傷つく可能性があります。
だから、一方では、これが続くかどうか分からないし、他のタスクにどのように一般化するかも分からないという二重のトラックを維持する必要があると思います。他方で、もしそれが続き、もしそれが一般化すれば、それは簡単に私たちの生涯で最大の技術トレンドになるでしょう。
だから、その重要性を考えると、真剣な人々はこれにどう対処するかについて考えるべきです。
社会への影響と準備の必要性
あなたはこれが私たちの生涯で最大の技術トレンドだと言いますね。おそらく最大の経済シフト、社会シフト、文化的なシフトになるでしょう。ええ。これがどれほど大きいのか、何らかの視野に入れるのを手伝ってもらえますか。
私がそれに最適な人物かどうか分かりません。
ある意味では、あなたが視聴者のために視野に入れるべきだと思います。私は技術的な詳細についてお話しできますが、もし試してみるとすれば、トレンドが続けば、これが指し示しているのは、知的タスクがどのように行われるかの根本的な再構築です。これは実際には、言っておかなければなりませんが、物理的なタスクには適用されませんし、社会的なタスクにも適用されません。そして一般的に経済文献が物事について考える傾向がある方法です。知的、社会的、物理的、これは本当に知的タスクについてのみ話しているんです。しかしそれにもかかわらず、これは私たちが達成できることの量の深遠な再構築のようなものであり、だから一方では、それは信じられないほど強力になるでしょう。医学のような分野でのすべての発展、教育などについて考えてみてください、この種のグラフが可能にするものを。
すべての子供が、ほぼゼロの限界費用で、完全な専門家レベルの個人教師を持つことができるんです。誰もがポケットにGPを持ち、いつでもどんな症状についても問い合わせて診断してもらえます。おそらく現在のどの医師よりも優れているでしょう。だからそれには驚異的な利点があります。しかしもちろん、どんな新しい技術でもそうであるように、多くの混乱がもたらされ、社会で何が価値があるかを変え、それには多くの欠点も伴うでしょう。
だから、もしこれが真実であるなら、それが何を意味するかについて真剣に考えることが非常に重要だと感じる理由だと思います。なぜなら、それに備えるためにできることがあるからです。私たちがそれを管理し、できるだけ多くの利点とできるだけ少ない欠点を得ようとする方法があるでしょう。
一方または他方を完全にゼロにすることは決してできないでしょう。しかし、私たちはそれを管理することができるでしょう。しかし、実際に本当の計画を持っている場合にのみ、それができるでしょう。なぜなら、あなたはこれを新型コロナウイルスと比較しましたよね、私の人生で圧倒的に最大の混乱であり、多くの人々にとっても同じです。これは奇妙に聞こえるかもしれませんが、これは混乱という点で新型コロナウイルスと同じくらい大きくなり得るでしょうか、新型コロナウイルスより大きいでしょうか。
もしトレンドが続き、もしそれが一般化すれば。
だから、二つの非常に大きな「もし」ですが、もしそれらが真実であれば、これは新型コロナウイルスよりはるかに大きくなるでしょう。つまり、ある意味で新型コロナウイルスは一時的なシフトでした、ワクチンが開発され、免疫系が適応し、ウイルスが変化するまでの。これはすべての運営方法のより恒久的な再構築のようなものになるでしょう。そして、ここでの最後の質問ですが、ここでも再び物事を視野に入れると、技術的な意味で、このシフトは何に似ているでしょうか。なぜなら私たちは、適切な文を形成することができない状態から、人間のように声で話すまで、非常に速く非常に遠くまで来たからです。
そうですね。うーん、はい。それを視野に入れるような類推を考えられますか。
難しいですが、私には、何か最初の、最初のフライトのようなものから、コンコルドのようなものへ、7年間で進んだような感じがします。そしてそれは非常に大きな問題です。少なくとも、繰り返しになりますが、ソフトウェア開発の内部では、その周辺の注意事項とともに、特にコンコルドの後にまだたくさんあるかもしれないと考えるとき、そしてまだ来るべきものがたくさんある可能性があるとき。
すごいですね。ありがとうございます。
私たちが直面する現実
お気づきかもしれませんが、マークはAGIや超知能やAI意識、あるいはあなたが人々が話しているのを聞く他のこれらの大きな知ることのできない質問については話していませんでした。彼はただ、AIが私たちが脳で行うことをするのがより良くなっているという単純な事実について話していただけです。
彼が言った数字が本当に際立っていたと思います。7ヶ月ごとに倍増があり、彼はこれがあと多分5年くらい続くと見積もっていました。そのグラフを見たとき、次はどこへ行くのでしょうか。そしてこれが提起する質問は非常に多いです。これは仕事にとって何を意味するのか。これはメディアにとって何を意味するのか。これは私たち全員が交流し、真実を理解する方法にとって何を意味するのか。つまり、私は答えを知りませんし、マークも知らないと思いますが、彼が言っているのは、それは私たちが考えるべきことだということだと思います。そしてそれは正しいように聞こえますね。


コメント