Google DeepMindのCEOであるデミス・ハサビス氏の、現在のAIシステムは汎用人工知能(AGI)には到底及ばないという発言が波紋を広げている。OpenAIが数学の難問を解決するなどAIの進歩は著しいが、現在のシステムは特定の領域で圧倒的な能力を示す一方で、予測不可能な失敗をする「ジャギドインテリジェンス(ギザギザの知性)」の状態にある。専門家の間でもAGIの定義や現状への評価は分かれており、実用的な観点からすでにAGIに達していると見る意見もあれば、信頼性や自律性の欠如を指摘する声もある。AIが世界を変える力を持ちつつも完全ではない、奇妙な中間地点にある現状を浮き彫りにする。

デミス・ハサビス氏の衝撃的な発言とAGIの定義
現在のシステムはAGIには到底及びません。この言葉に、思わず意表を突かれた方もいるかもしれません。なぜなら、これはどこかの無名の懐疑論者が言ったのではなく、Google DeepMindのCEOであるデミス・ハサビス氏の口から飛び出した言葉だからです。
現在のシステムは、私の見解ではAGIには遠く及びません。いくつのエルデシュの課題を解決したところで、それは関係ないのです。そうした課題を解決していること自体は素晴らしいことですが、本当の天才的な発明や、ラマヌジャンのような人物が成し遂げたであろうことからは、まだまだ程遠いと思います。そして、あらゆる領域にわたってそれを実現できる可能性を持つシステムが必要なのです。
彼はAGIに関して最も明確な意見を持つ一人であり、その見解は基本的に、現在のAIは非常に強力であるものの、まだ重要な要素が欠けているというものです。彼はAGIを、単に狭いタスクで優れた成果を出したり、チャット画面で印象的な回答を生成したりするだけでなく、人間の認知能力の全範囲を示すことができるシステムであると説明しています。
最近の出来事を考えると、この発言は非常に重く響きます。私たちは多くの異なる分野である種の境界線を越えたと考えており、ネット上では今、AGIは基本的にすでに到来していると言う人が大勢います。しかしデミス・ハサビス氏は、ハードルはもっと高いと言っているのです。モデルが印象的であるだけでは不十分です。幅広く有能で、信頼でき、創造的であり、人間がタスクを与えたときにうまく応答する以上のことができなければなりません。
ここに、AIのハイプサイクルとAIの本質的な問いとの違いがあります。ハイプサイクルは、今週はどんな素晴らしいことが達成されたか、と問いかけます。一方でAIの本質的な問いは、このシステムは本当に人間の知性の全範囲に匹敵するのか、と問いかけます。そしてデミス・ハサビス氏によれば、その答えは依然としてノーなのです。
OpenAIの数学的快挙とAGI論争
この動画が拡散され、ネット上で議論が巻き起こっている理由は、OpenAIが数学における重大な成果を発表したからです。OpenAIは、同社の社内モデルの一つが、1946年にポール・エルデシュが最初に提示した「平面単位距離問題」に関連する、離散幾何学の中央予想を覆したと発表しました。これは考えてみれば、かなり凄まじい出来事です。OpenAIによると、モデルが生成した証明は後に外部の数学者によってチェックされ、人間が検証したバージョンの成果が同行論文に掲載されました。
しかし、ここでデミス・ハサビス氏は、そのような結果は印象的ではあるものの、自動的にAGIを意味するわけではないと指摘しています。モデルが難しい数学の問題で進歩を遂げたとしても、それが汎用人工知能であるとは限りません。ある分野で天才的であっても、他の形態の推論、創造性、記憶、計画性、そして現実世界への理解が欠けている可能性があるのです。
だからこそ、エルデシュの件は進歩の証拠として扱うべきであり、目的地に到達した証明として扱うべきではありません。これはAIが大幅に強化されていることを教えてくれますが、残念ながら、AI論争が終わりを迎えたことを意味するわけではないのです。
現代AIの奇妙な中間段階
AGIに関して私たちが今どこにいるのかを考えると、正直な答えは、私たちは奇妙な中間段階にいるということです。AIはもはや単なる自動予測入力ではありません。その表現は古くなっています。これらのモデルは、コードを書き、研究を支援し、複雑な文書を要約し、ビジネス上の問題を推論し、動画を生成し、法律文書を起草することができます。本当に多くの異なることができます。
しかし同時に、それらはまだ完全に信頼できるわけではありません。いまだにハルシネーションを起こします。いまだに奇妙な形で失敗します。いまだに注意深いプロンプト調整を必要とします。いまだに長期的な自律性に苦労しています。そして、安定した記憶や本当の主体性、あるいは人間と同じような世界を基礎としたモデルを持っていません。
これが、現在の状況がこれほど混乱している理由です。今日のAIを古いソフトウェアと比較すれば、まるでサイエンスフィクションのように見えます。しかし、本物のAGIと比較すれば、いまだに不完全に見えます。これこそが、人々が見落としているギャップなのです。
ゲイリー・マーカス氏の批判と「錬金術」としてのAI
ゲイリー・マーカス氏は、AGIハイプ派とは正反対の主張をしています。彼は現在の状況はAGIではないと述べており、システムがランダムな場所にゴブリンのような言葉を挿入する例を含め、モデルの奇妙な挙動を指摘しています。彼のツイートを見ると、こう書かれています。
私が今から説明することは、AGIなどではない。それは1兆ドル規模の列車事故の兆候だ。もし私が2022年に、多くの人が妄想したようなGPT-6や7ではなく、単にGPT-5.5にすぎない2026年バージョンのGPTが、ランダムな場所にゴブリンという単語を挿入するような奇妙な癖をいまだに持っていると言ったら、あなた方は全員、私を狂人かアンチ、あるいはその両方と呼んだだろう。スケーリングだ、とあなた方は叫んだはずだ。ディープラーニングが壁を征服しつつある、と言ったはずだ。それなのに、私たちは今ここにいる。OpenAIは、システムプロンプトにゴブリンに特化した完全にその場しのぎのくだらない文言を大量に入れなければ、ゴブリンについて話すのをやめさせることすら、システムを適切に調整できないのだ。作り話ではない。ユーザーのクエリに関連がない限り、ゴブリン、グレムリン、アライグマ、トロール、オーガ、ハト、その他の動物について決して話してはならない、といった具合だ。
さらに彼はこう続けます。
一方で、このナンセンスはペルソナによって異なる。監査のすべてのデータセットにわたり、オタク的なペルソナの報酬は、同じ問題に対してゴブリンやグレムリンを含む出力を、それらを含まない出力よりも高く評価する明確な傾向を示し、76.2%のデータセットでプラスの上昇が見られた。実際のコンピュータサイエンスの代わりに、私たちは錬金術を突きつけられている。魔法の呪文を唱えているようなものだ。この技術でAIの安全性を解決しようとするなら、幸運を祈るしかない。
ゲイリー・マーカス氏がここで主張しているポイントは、これは本当にゴブリンのことだけを言っているのではないということです。重要なのは、現在のAIはある瞬間には非常に賢く、別の瞬間には奇妙に壊れてしまう可能性があるということです。そして、それは重大な問題です。なぜならAGIとは、単に最高のパフォーマンスを出すことだけではなく、一貫性も重要だからです。モデルが高度な数学を支援できる一方で、奇妙な挙動を避けるために隠された指示を必要とするなら、それは何かを物語っています。つまり、これらのシステムは強力ですが、完全には理解されていないということです。高品質な出力を生成できるものの、依然として予測不可能に感じられる失敗モードを持っていることを示しています。
ギザギザの知性:ジャギドインテリジェンス
だからこそ、人々は「ジャギドインテリジェンス(ギザギザの知性)」という言葉を使います。AIはあるタスクでは人間をはるかに凌駕し、他のタスクでは驚くほど弱いことがあります。ニューヨーク・タイムズ紙は、これがAGI論争を適切に枠付けるのが難しい理由の一つであると説明しています。記事を見ると、次のように書かれています。
これらのシステムのパフォーマンスは一様ではなく、人間のレベルのタスクをいつ失敗するのかを見極めるのは容易ではない。
ジャギドインテリジェンスという言葉は、OpenAIの創設メンバーの一人であり、テスラの自動運転技術の元責任者、そしてAIの台頭に関して最も注目されているコメンテーターの一人であるアンドレイ・カルパシー氏によって作られました。人間の基準からすると極めてうまく機能するものもある一方で、壊滅的な失敗をするものもある、と彼は2024年に書いています。そして、どちらがどちらであるかは必ずしも明白ではないとも述べています。これは、多くの知識や問題解決能力がすべて高度に相関しており、出生から成人にかけて直線的に一緒に向上していく人間の脳とは異なると彼は言います。
AGI肯定派の主張と実用性
しかし、実際に考えてみると、AGI肯定派に全く根拠がないかのように振る舞うべきではありません。AGIはすでにここにいると主張する人々にも、それなりに信頼できる議論のポイントがあります。マーク・アンドリーセン氏はジョー・ローガン氏に対し、AGIは事実上すでに到来していると考えていると語ったと報じられています。彼の主張は、最新のフロンティアモデルが今や、医療、法律、コーディング、金融、政治、ビジネスといった分野の、自分が電話できるほぼすべての専門家よりも優れた回答をくれるというものです。
これは真剣に受け止めるべき主張です。なぜなら、大半の人にとって、日常生活における汎用人工知能とはそういうものだからです。一つのシステムにほぼ何でも質問できて、それに対して強力な回答が得られるなら、それは汎用的に感じられます。だからこそ、境界線は越えられたと感じられるのです。だからこそ、議論はもはや単純ではないのです。
AGIはここにいると主張する人々は、単におもちゃのようなデモを指しているわけではありません。彼らは実際の有用性を指しています。これらのツールがすでにコーディング、研究、教育、ビジネスを変えつつあるという事実を指しているのです。
しかし、デミス氏はより高い基準で判断しています。彼は、AIが多くのタスクで役立つかどうかを尋ねているのではありません。彼は、AIが人間の持つ認知能力の全範囲を備えているかどうかを尋ねているのです。AIが発明し、計画し、推論し、深い信頼性を持って動作できるかどうかを尋ねています。そして、それははるかに高いハードルです。
私は次のようなツイートを見かけましたが、これも非常に一理あります。これはAGIはまだここにないという事実に対する反論です。ニック・カーター氏の主張は極めて重要です。なぜなら彼は本質的に、知性がギザギザであるという理由だけでAIを退けるのは説得力が薄いと述べているからです。彼は、現実的に考えて、もし人間の誰かがプロダクションレベルのコードを書き、難しい試験に合格し、高レベルの論文を執筆し、財務モデルを構築し、図面を描き、詩を書き、重大な数学の問題の解決を支援できたら、私たちはその人を天才と呼ぶだろうと指摘しています。
それは確かに公平な見方です。もしある人間が最高のAIモデルを組み合わせた能力を持っていたら、誰もその人を軽々しく無視しないでしょう。私たちは、その人は現在生きている中で最も有能な人物の一人だと言うはずです。
しかし問題は、AIは人間ではないということです。それには強みと弱みがあります。そして、それらの強みと弱みは、人間の強みと弱みとは異なる仕組みで動いています。人間が名前を忘れることと、モデルが偽の情報源を捏造することは同じではありません。人間が会話でぎこちなくなることと、プロンプトがわずかに変わっただけでシステムが機能しなくなることは同じではないのです。これが重要な区別です。
現在のAIは、チャット画面の中では人間レベル、あるいは超人間レベルに見えるかもしれません。しかし、より強い意味でのAGIとは、天才レベルの出力を生成すること以上の意味を持ちます。それは、複数の状況にわたって移行可能な、安定した汎用的な能力を持つことを意味しますが、それはいまだに確立されていません。
AGIという言葉の曖昧さと本当に必要な能力
ヘレン・トナー氏は、おそらくこれらすべてに対して最も優れた枠組みを提示しています。彼女は、AGIという言葉は人によって意味することが異なるため、今やほとんど役に立たなくなっていると主張しています。
ある人は専門家レベルのチャットボットを意味し、ある人は自律的な研究者を意味し、ある人は知識労働者を代替できるシステムを意味し、ある人は意識を持つ機械を意味し、ある人は再帰的な自己改善を意味します。だからこそ、この議論は本当の意味で噛み合わないのです。ただ混乱しているだけです。
ある人がAGIはここにいると言うとき、その人は「専門家レベルのデジタル作業ができるようになった」という意味で言っているのかもしれません。別の人がそれを聞くとき、その人は「機械が現実世界全体で人間を完全に置き換えることができる」という意味だと受け取るかもしれません。そして、それらは同じ主張ではないのです。
私たちが今、AGI的な状況の中にいるとすれば、いくつかの定義はすでに満たされています。他の定義はまだはるか遠くにあります。ですから、より良い問いは、それがAGIであるかどうかではありません。そうではなく、どの能力がすでにここにあり、どの能力がまだ欠けているのか、ということです。
そしてそれは、システムは印象的であるが、欠けている能力がいまだに重要であるという、デミス氏の声明と完璧に合致します。そしてもちろん、ヤン・ルカン氏も、AIが人間の知性や学習能力には到底及ばないことに人々が気づき始めていると述べています。それにもかかわらず、膨大な宣言的知識の蓄積によって、常識の欠如、現実への理解の欠如、限定的な推論および計画能力を補うことで、AIは非常に有用なものになっているのです。
また、私はデミス・ハサビス氏の次のような発言も見つけました。ここでは彼自身、少し矛盾したことを言っています。彼は明らかにAGIがすぐそこまで来ていることについて多くを語っています。
その完全なバージョンが登場するまで、私たちはあと数年しか離れていないと思います。そしてシンギュラリティは、AGIのような技術が現場に到来することによって引き起こされる時代を説明するのに、ある種適した言葉だと思います。そしてそれは、それが非常に変革的なものになるからであり、これまでの歴史の中で最も重要な発明になると思うので、その地平線の先について多くの予測を立てることは困難です。それほど多くのことが変わるからです。ですから、今年は誰もが見たり使ったりしているエージェントシステムによって、私たちは今それを実感し始めていると思いますし、私が言いたかったのはそういうことです。5年、10年後に振り返ったとき、2026年や27年が、まさにそれが始まりつつあった時期だったと私たちは見なすことになると思います。
では、実際にAGIに何が欠けているのか疑問に思っているなら、まず第一に「長期的な信頼性」です。モデルは、一度だけでなく、煩雑で多様なタスクにわたって、何度も繰り返し優れたパフォーマンスを発揮する必要があります。
第二に、「自律性」です。質問にうまく答えるモデルと、長期間にわたって計画を立て、実行し、自分の作業をチェックし、間違いから回復できるシステムとは同じではありません。
第三に、「記憶」です。現在のシステムには、人間のような連続的な記憶の流れがまだありません。コンテキストウィンドウや外部ツールを使用することはできますが、それは世界に対する安定した、生きた理解と同じではありません。
第四に、「基礎づけられた推論(グラウンデッド・リーズニング)」です。システムはテキストを通じてうまく推論することが多いですが、人間の完全な意味で世界を理解しているわけではありません。
そして第五に、「真の発明」です。これがデミス氏の指摘するポイントです。AGIは私たちが与えたタスクを解決するだけでなく、最高レベルで独創的なアイデアを生み出し、重要な問いを立て、新しい枠組みを作り出すことができなければなりません。
ですから、「到底及ばない」ということは、何も起きていないという意味ではありません。欠けている要素は些細なディテールではなく、AIという主張全体の極めて中心的な部分であるということを意味しているのです。
議論がもたらす影響と未来への視点
ここで人々が耳にする危険性は、AGIが到底及ばないものだと聞き、それを無視しても構わないと考えてしまうことです。それは大きな間違いです。デミス氏が正しいとしても、現在のAIはすでに産業を変えるほど強力です。それはすでに、人々のコーディング、執筆、研究、学習、コンテンツ作成、そしてビジネスの運営方法を変えつつあります。それがAGIではないという事実は、それを重要でなくするわけではありません。
しかし、逆の間違いもまた危険です。AIが難しい数学の問題を解決したと聞いて、すぐにこれがAGIだと思い込んでしまうと、人々はこれらのシステムを少し過信しすぎてしまうかもしれません。準備が整う前に、リスクの高い役割にそれらを投入してしまう可能性があります。
だからこそ、この議論が重要なのです。これは単なる言葉遊びではありません。企業がどのようにAIを導入するか、政府がどのようにそれを規制するか、投資家がどのようにAI企業を評価するか、そして一般の人々が何を信頼するかを決定する基準に影響を与えます。
デミス氏は本質的に、より慎重な対話を促そうとしています。彼は、これらのシステムができることに驚嘆すべきであるが、いまだにできないことについてはもっと正直になるべきだと言っているのです。
これらすべてを考えると、デミス氏は「AIは弱い」と言っているのではありません。彼は、AGIはかなり高いハードルであり、インターネットが望んでいるよりもはるかに高いハードルだと言っているのです。OpenAIの数学の成果は重大なブレイクスルーです。最新のモデルが数年前のものよりも明らかに有能であることは間違いありません。そして、それらが実用において汎用的に感じられると言うマーク・アンドリーセン氏は狂っていません。また、これらの能力を持つ人間を天才と呼ぶだろうと言うニック・カーター氏も狂っていません。
しかし、奇妙な失敗を指摘するゲイリー・マーカス氏も狂ってはいませんし、AGIという言葉があまりにも曖昧になりすぎていると言うヘレン・トナー氏も狂ってはいません。
ですから、私たちが今AIのタイムラインのどこにいるのかを考えると、私たちはゼロ地点にいるわけではありませんが、ゴールラインにいるわけでもありません。モデルが世界を変えるほど強力ではあるものの、真の汎用人工知能として信頼できるほどではないという、絶妙な中間地点のどこかにいるのです。
そして、それこそが最も重要なポイントでしょう。なぜなら、もし全員が明確な一つの「AGIの瞬間」を待っているなら、すでに起きている変革を見逃してしまうかもしれないからです。しかし、その変革がすでに完了しているかのように振る舞ってしまうなら、重大なギャップを抱えたシステムを信頼してしまうことになるかもしれません。
ですから、いいえ、AGIはまだここにありません。少なくとも、デミス氏の言う強い意味においては。しかし、この議論が今もなお続いているという事実そのものが、あなたが知るべきすべてのことを物語っています。AIは、真剣な人々がその境界線がどこにあるのかを巡って議論するほどに、十分に強力になっているのです。


コメント