この書き起こしは、AI研究の巨匠であるヤン・ルカンが、大規模言語モデル(LLM)のスケールアップだけでは汎用人工知能(AGI)に到達できないという見解を述べたインタビューである。ルカンは、現在のAIシステムの限界と展開における課題、過去のAIブームと冬の時代の歴史、そして真の知能を持つシステムに必要な要素について論じている。物理世界の理解、持続的記憶、推論と計画能力の重要性を強調し、AGIは単一の突破口ではなく世界中の研究コミュニティによる継続的な進歩であると主張している。
私たちは大規模言語モデルをスケールアップするだけでは人間レベルのAIに到達することはありません。これは単純に起こらないことです。それがあなたの見解ですね。絶対に無理です。絶対に無理です。そして私のより冒険的な同僚たちから聞こえてくるかもしれないことですが、これは今後2年以内には絶対に起こりません。
絶対に不可能です、失礼な言い方をお許しください。データセンターに天才の国を持つことができるというアイデアは完全にでたらめです。絶対に不可能です。私たちが手に入れる可能性があるのは、十分に大量のデータで訓練されたシステムで、合理的な人が尋ねるかもしれないあらゆる質問に対してそれらのシステムを通じて答えを見つけることができるものです。隣にPhDが座っているような感覚を得られるでしょうが、隣にいるのはPhDではありません。それは巨大な記憶と検索能力を持つシステムであり、新しい問題に対する解決策を発明できるシステムではありません。それこそがPhDの真の能力なのです。
これは実際にツールが投稿した内容と関連しています。新しいものを発明するには、LLMからは得られない種類のスキルと能力が必要なのです。
大きな問題があります。現在行われている投資は明日のためではありません。今後数年間のために行われており、少なくともメタ側からの投資の大部分は推論のためのインフラへの投資です。年末までに、これは本当に惑星規模の計画ですが、スマートグラスやスタンドアロンアプリなどを通じてMAIを10億人のユーザーが使用することを想像してみてください。
これらの人々にサービスを提供する必要があり、それには大量の計算が必要です。だからこそ、これをスケールアップし、数か月または数年をかけて構築するためのインフラに大量の投資が必要なのです。そして、そこに資金の大部分が向かっています。少なくともメタ、Microsoft、Google、そして潜在的にはAmazonのような企業の側では。これは本質的に単なる運営です。
では、パラダイムの変化がなくても10億人がこれらのものを定期的に使用する市場があるのでしょうか。答えはおそらくイエスです。新しいパラダイムの革命が3年以内に来なくても、このインフラは使用されるでしょう。これについてはほとんど疑問がありません。
ですから、これは良い投資です。データセンターなどをセットアップするには非常に時間がかかるため、今すぐ始めて、進歩が継続的になるよう計画する必要があります。そうすることで、最終的に投資が正当化されるのです。しかし、現金があるならやらないわけにはいきません。それは取るには大きすぎるリスクだからです。
しかし、あなたが言ったことに戻りましょう。今日のものはまだ深刻な欠陥があります。それが使用されるかどうかについて疑問が投げかけられています。メタは今、消費者への賭けをしています。消費者がAIを使いたがっている。それは理にかなっています。OpenAIはChatGPTの4億人のユーザーを持っています。メタは30億から40億人を持っています。
基本的に電話を持っていれば30億人のユーザー、6億人のメタユーザーがいます。ChatGPTより多いですね。しかし、そこまで頻繁には使用されていません。ユーザーがそれほど集中的でアクティブではないのです。しかし、基本的にメタが10億人の消費者ユーザーに到達できるというアイデアは合理的に思えます。しかし問題は、この投資の多くが、これが単なる消費者アプリではなく企業にとって有用になるという考えで行われていることです。
そして問題があります。私たちが話してきたように、まだ十分に良くないのです。DeepResearchを見てください。これはベンディック・ディーンズが提起したものです。DeepResearchはかなり良いですが、95%の道のりしか到達せず、5%は幻覚かもしれません。100ページの研究レポートがあり、その5%が間違っていて、どの5%かわからない場合、それは問題です。
同様に、今日の企業では、すべての企業が生成AIや他のタイプのAIを自分たちにとって有用にする方法を見つけようとしています。しかし、概念実証の10%または20%しか本格運用まで到達しません。高すぎるか、信頼性がないからです。
もしこれが頂点に達しているとすれば、ここからさらに良くなるという期待で推進されてきたすべてのことについて、何が起こると予想されますか。これも再びタイムラインの問題ですね。これらのシステムが十分に信頼性が高く知能的になって、展開が容易になるのはいつでしょうか。
しかし、あなたが説明している状況、つまり印象的なデモを超えて実際に信頼できるシステムを展開することが物事が躓く場所であるということは、コンピューターや技術、特にAIの使用において新しいことではありません。これが私たちが10年前に超印象的な自動運転のデモを見た理由です。しかし、私たちにはまだレベル5の自動運転車がありません。最後の1マイルが本当に困難なのです、車で言えば。
システムを実用的にする最後の数パーセントの信頼性であり、それを既存のシステムと統合する方法、そしてそれがユーザーをより効率的にしたり、より信頼性を高めたりする方法などです。そこが困難な部分です。
これが、数年前に戻ってIBM Watsonに何が起こったかを見ると明らかです。Watsonは、IBMが推進し、Watsonに医学について学習させ、すべての病院に展開することで大量の収益を生み出すものになるはずでした。
それは基本的に完全な失敗で、部品として売却されました。IBMにとってCEOを含めて多額の費用がかかりました。実際にそれらのシステムを、信頼できて実際に人々を助け、労働力の自然な保守主義を傷つけない状況で展開することは、物事が複雑になる場所です。
私たちが今目にしている、AIシステムの展開の困難性は新しいことではありません。これは常に起こってきたことです。これが、あなたのリスナーの中には若すぎて覚えていない人もいるかもしれませんが、1980年代初期にエキスパートシステムを中心としたAIへの大きな関心の波があった理由でもあります。1980年代で最もホットな仕事は知識エンジニアになることで、あなたの仕事は専門家の隣に座り、専門家の知識をルールと事実に変換することでした。
大きな関心の波がありました。日本政府は第五世代コンピューターと呼ばれる大きなプログラムを開始しました。ハードウェアは実際にそれに対応するよう設計される予定でした。ほとんどが失敗でした。関心の波は90年代半ばに死んでしまいました。いくつかの会社は成功しましたが、基本的には人間の知識を一連のルールに実際に減らすことができ、それを行うことが経済的に実行可能な狭い範囲のアプリケーションに対してでした。
しかし、社会と産業全体への広範囲な影響はありませんでした。そして、それがAIの常にある危険です。信号は明確で、あらゆる装飾を施したLLMが、他に何もなければ情報検索において重要な役割を果たしています。ほとんどの企業は、すべての内部文書を知っている何らかの内部専門家を持ちたがっており、どの従業員でもあらゆる質問をできるようにしたいのです。
私たちはメタで一つ持っています。Metamateと呼ばれています。とてもクールです。非常に有用です。私は現代のAIや現代の生成AIが有用でないと言っているわけではありません。純粋に尋ねているのは、このものが効果的にゴッドレベルの能力を達成することを期待して多額の資金が投資されているということで、私たち両方がここで収穫逓減の可能性について話しており、あなたが言及したようなタイムラインのミスマッチがあった場合何が起こるかということです。
しかし、そのタイムラインのミスマッチは個人的にあなたにとってのものかもしれません。あなたと私が最初に話したのは今から9年前で、信じられないことです。AIがどのように構造化されるべきかについてあなたがアイデアを持っていた初期の頃について、そして会議で席さえ得ることができなかったことについてです。
そして最終的に適切な量の計算が利用可能になったとき、それらのアイデアが機能し始め、あなたがベンジオやヒントンと取り組んだアイデアに基づいてAI分野全体が離陸しました。しかし、効率のために私たちは「調べてみてください」と言いましょう。
しかし、AIフィールドでエキスパートシステムについて話していたような過度に誇大宣伝された瞬間があったときのミスマッチしたタイムラインについて話しているだけです。それらが人々が期待する方法で実現しない場合、AI分野はAIウィンターと呼ばれるものに入ります。反発があります。
ですから、もし私たちがミスマッチしたタイムラインのこの瞬間に潜在的に近づいているとすれば、投資額を考慮して、これらのものを訓練する主要な方法で潜在的に収穫逓減があるという事実を考慮して、さらに市場が株式市場が今少し下降期を経ているという事実を加えるかもしれません。別のウィンターがある可能性を恐れていますか。
今、それは変数です。おそらく私たちが話していることの3番目に重要な変数ですが、要因として考慮しなければなりません。確かにタイミングの問題がありますが、もう少し深く掘り下げてみると、前に言ったように、より多くのデータで訓練し、LLMをスケールアップするだけで人間レベルのAIに到達すると思っているなら、あなたは間違いを犯しています。
ですから、もしあなたが投資家で、より多くのデータで訓練し、いくつかのトリックで人間レベルのAIとPhDレベルに到達すると言った会社に投資したなら、シャツを失うかどうかはわかりませんが、それはおそらく良いアイデアではありませんでした。
しかし、すべての知能のある動物と人間ができることを、現在のAIシステムができないことをできるシステムを持つ方法についてのアイデアがあります。私が話しているのは、物理世界の理解、持続的記憶、推論と計画の能力です。これらは存在する必要がある4つの特性です。
そして、それには常識を獲得できるシステムが必要で、単なるテキストや人間が作成したデータではなく、ビデオのような自然なセンサーから学習できるシステムが必要です。それは大きな挑戦です。私は何年もの間これについて話してきており、これがチャレンジのある場所だと言ってきました。これが私たちが理解しなければならないことです。
私のグループと私、または私と一緒に働いている人々、そして私の話を聞いた他の人々は、世界がどのように機能するかをビデオで理解するよう訓練できるシステム、物理世界がどのように機能するかの精神的モデルを使用して、特定の目標に到達するための行動の連続を計画できるシステムといったラインに沿って進歩を遂げています。
私たちはこの種のシステムの初期結果を持っており、DeepMindでも似たようなことに取り組んでいる人々がいますし、様々な大学でこれに取り組んでいる人々もいます。問題は、これがいつ興味深い研究論文から、新しいアーキテクチャで新しい能力を実証するものから、多くのアプリケーションにとって実用的で、訓練なしに新しい問題に対する解決策を見つけることができるスケールのアーキテクチャに移行するかということです。
これは今後3年以内には起こりませんが、3年から5年の間に起こる可能性があり、それは投資で見るランプアップの種類に対応しています。他のことについても同様です。これが最初のことです。
重要な2番目のことは、一つの会社や一つの人々のグループが発明する秘密の魔法の弾丸はないということです。それは多くの異なるアイデア、多くの努力、これに基づく原則となるもので、一部の人々は賛同せず、結果的に行き詰まりとなる方向に進むでしょう。
AGIがない日の前とAGIがある日の後があるようなことはありません。これはイベントではありません。時間が経つにつれて、より大きくスケールされ、より良く機能するようになる継続的な概念的アイデアです。そして、それは単一の実体からではなく、世界中の研究コミュニティ全体から来るでしょう。
研究を共有する人々は、そうしない人々よりも速く進歩するでしょう。ですから、どこかに5人のスタートアップがあって、AGIの秘密を発見し、彼らに50億を投資すべきだと思っているなら、あなたは大きな間違いを犯しています。


コメント