デイビッド・シャピロ: 私のAGI(汎用人工知能)の定義

AIに仕事を奪われたい
この記事は約7分で読めます。

3,771 文字

https://www.youtube.com/watch?v=tDQvMSTF2Cs

ほな、AGIの古典的な定義というか、ここ数年で確立された定義がまだ有効なんかどうか、それとも今のエコシステムがあまりにも複雑になってきて、人間にとって神秘的なAGIという用語自体の重要性が薄れてきてるんちゃうかということについて、あなたの考えを聞かせてもらえませんか?まだAGIについて考えておられますか?もし考えておられるなら、どれくらい近づいてると思われますか?
はい、先ほど少し触れましたけど、私の個人的なリトマス試験というのがありまして、経済的有用性と科学的有用性を見てるんです。01プレビューが公開された後にツイートやプライベートメッセージでいただいた反応を例に挙げさせていただきます。
私の友人の一人が海洋学、特に計算流体力学の一流の研究者なんですけど、01プレビューが公開された翌日に連絡をくれまして、ある問題を出してみたって言うんです。これまで見た中で最も専門用語の多いプロンプトで、流体シミュレーションに関する公理や数学的アプローチがびっしり詰まってたんですけど、最初の試行で概ね正解に近く、少し修正を加えた2回目で完全に正解したらしいんです。彼曰く、優秀な大学院生くらいのレベルやと。
他にも多くの人から似たような話を聞きました。Redditには「私のPhD論文を1時間でやってのけた。私は1年かかったのに」という投稿もありました。もちろん、既に解決策を知ってる問題を指示した結果なんですけどね。
科学的な観点から見ると、01プレビューは優秀な大学院生くらいの実力というのが、多くの人の一致した見解です。これは主観的で曖昧かもしれませんが、優秀な大学院生と同じくらいの価値や有用性があるということです。しかも24時間365日稼働できて、コストが…まあ、大学院生は学費を払ってるので、大学院生より高くつくかもしれませんが、このコストは下がっていくでしょう。
さらに、開発者たちの反応を見ると、まだまだやという意見もありますね。中には、意識的か無意識的かは分かりませんが、わざと悪いプロンプトを与えて「ほら、うまくいかなかった」と言ってるような場合もあるでしょう。でも一方で、「1週間悩んでたAPIの問題を30秒で解決してくれた」と驚嘆する声も多く聞かれます。
それから、「本当の知性じゃない」「本当に考えてるわけじゃない」というような、いわゆる”本物のスコットランド人なんていない”的な議論もありますが、出力は測定可能で、その有用性と正確性は実証できます。
私は測定可能な要素、つまりベンチマークやIQテストでの性能を重視する傾向にあります。それも重要ですが、科学界やビジネスへの実際の影響こそが、政策的、経済的な観点から本当に重要になってくるでしょう。
長々と説明しましたが、要するに、AGIの定義は人それぞれですが、結局のところ、それは損得の問題になるということです。
オンラインで公開されていないIQテストの結果を見たんですが、純粋な推論能力を測定していると考えられ、約120くらいだったと思います。それが理解のレベルということでしょうか?
ええ、平均的な大学卒業生のIQが約120ということを考えると、それは納得できる数字ですね。ただ、これらの機械を人間化することの危険性もあります。例えば、訓練されていない、あるいは経験したことのないトピックや認知アプローチに関しては、まだ完全に機能不全に陥ることがあります。
01プレビューで試してみた実験の一つに、将来の異なるテクノロジー間の相互作用について推測を求めるというものがありました。4つのテクノロジーカテゴリーと4つの影響評価領域を与えたんですが、単純に1対1の組み合わせ、つまり4×4で16の評価しか返してこなかったんです。私が「怠慢だ」と非難すると、「この愚かな人間のために説明を明確にしましょう」と反論してきました。「何も新しい総合的な見解を出していない」と指摘すると、「ああ、新しい総合的な見解が欲しいんですね」と言いながらも、まだ課題をこなせませんでした。
同じプロンプトをClaudeに与えたところ、「面白い実験ですね。これらがどのように社会を変えていくか考えてみましょう」という反応でした。訓練方法や微調整が異なるため、これらの機械は全く異なる振る舞いを示すことがあるんです。結論として、01プレビューは技術的影響の予測に関しては、現在でもClaudeよりもかなり低いスコアを示しています。とはいえ、他の多くの面で経済的に有用なんです。
そうですね。AGIという用語に関して、私たちを別の方向に導いてしまう面もあると思います。例えば実体化の問題は本質的にはロボット工学の問題ですし、エージェンシーの問題も関連はしますが、必ずしも生の知能に関する問題ではありません。私にとってAGIは常に一般化された知能の説明であり続けています。
ただ、この用語自体が時代遅れになってきているんじゃないかと思います。特に、一つの特定の分野で非常に優れた、ますます専門化されたモデルが登場してくる中で。例えば、将来的には海洋学専用のモデルが出てくるかもしれません。マルチモーダルでもなく、必要のない他の機能も持たず、ただ大量の海洋データを持っていて、その分野で人間をはるかに超える性能を発揮する。そういう段階になると、ほとんどのモデルが少なくとも人間と同じくらい賢くなっているでしょうが、それはもはやあまり重要ではないかもしれません。この考えについてはどう思われますか?
そうですね、推測する必要もなく、業界の動向を見れば分かります。いくつか例を挙げさせていただきます。
Google DeepMindはAlphaFoldに取り組んできました。AlphaFoldは、タンパク質の折りたたみに特化したAIモデルです。Folding@homeという分散コンピューティングプロジェクトがあって、タンパク質の折りたたみに関する大規模なオープンソースの研究に参加できました。自分のラップトップやデスクトップ、サーバーの余剰計算能力を使って、タンパク質がどのように折りたたまれるか、どのように誤って折りたたまれるかなどの小さなシミュレーションを実行するものでした。
これが重要な理由は、タンパク質の折りたたみ方がその機能の良し悪しを決定し、また、タンパク質同士がどのように結合するかにも関わってくるからです。これは生命、生物学、そして全ての医療や疾病モデルの基礎となります。
そこにDeepMindがAlphaFoldを開発し、何十万というタンパク質のライブラリを作成することができました。タンパク質の折りたたみに関して最先端の精度を実現し、しかも従来の方法よりもはるかに速く、安価に行えるようになったんです。
さらに、最新モデルのAlphaProteoと組み合わせると、「XYZの受容体に結合するタンパク質が必要だ」と言えば、そのタンパク質を設計してくれます。これは以前にはほとんど不可能だったことで、合成生物学の可能性を一変させる技術です。
これは非常に特化したモデルで、「一般的な知能なら当然持っているべき能力だ」と言う人もいるかもしれません。でも、人間にもそんな能力はありません。そういった成果を達成するには、高性能な計算とシミュレーション、そして今回の場合は高度な人工知能モデルを使う必要があるんです。
もう一つの視点として、NVIDIAのJim Fan、元OpenAIで、Ilya SutskeverとAndrej Karpathyの両方から指導を受けた人物の例があります。彼は現在、ロボット用の基盤モデルに取り組んでいて、つい最近、SeqoiaCapitalのポッドキャストに出演していました。
彼によると、汎用人型ロボットまであと2-3年、そしてロボット用の汎用AI、つまりロボットの基盤モデルも同じく2-3年で実現するだろうとのことです。基本的に、四足歩行でも二足歩行でも、どんなロボットにも搭載できる「ドロイドの脳」のようなもので、複雑な器用さを要する作業をこなせるようになります。
例えば、家を建てるときに必要な全ての作業を考えてみてください。様々な道具を使い、重い材料を運び、配管や配線には繊細な運動制御が必要です。これはAGIと並行して発展していくでしょう。私はAGIを「瓶の中の天才」のように考えています。たとえIQが150や250のモデルであっても、周辺機器は必要です。ロボットに何を作らせるかを指示する必要があるわけです。
でも、おっしゃる通りで、AIの最も有用な機能の中には、実体化を必要としないものが多くあります。コーディングには体は必要ありません。高度な化学や物理学、数学にも体は必要ありません。私たちが行う最も困難で知的な作業の多くにおいて、体はむしろ障害になることの方が多いんです。
物理的な世界を動き回ることは、あなたや私、犬、サル、タコにもできます。進化は10億年前にその問題を解決したようなものです。人間の知的活動は比較的新しい発明であり、今や私たちは機械で自分たちの認知能力を拡張しているんです。これが、私たちが何を作っていて、なぜ作っているのかを理解するための私のモデルです。

コメント

タイトルとURLをコピーしました