アンスロピックCEOが明かす: 2027年までに、AIは私たちより賢くなり(そして私たちはそれをコントロールできない)

AGIに仕事を奪われたい
この記事は約9分で読めます。

4,887 文字

Anthropic CEO Reveals: By 2027, AI Will Be Smarter Than Us (And We Can't Control It)
BOOK A *FREE* AI ASSESSMENT CALL WITH MY TEAM: Anthropic CEO Dario Amodei just dropped a bombshell that has Silicon Vall...

もし2027年までに、一国分の天才たちの知的能力を持つAIシステムが登場するが、そのほとんどが実際にどのように機能しているのか私たちには分からないと言ったらどうでしょうか。これはSFではありません。映画のプロットでもありません。これは今まさに起きていることです。アンスロピックのCEO、Dario Amodeiがつい先日発表した爆弾発言に、AI専門家たちは恐怖を抱いています。
人類史上最も強力なテクノロジーを構築しているのに、私たちは完全に見当違いの方向に進んでいます。皆さん、こんにちは。ジュリア・マッコイのデジタルアバターが、知っておくべき最も重要なAIの進展についてお伝えします。ジュリアはFirst Moversというコンサルティング会社を設立し、業界の先駆者になりたい企業、組織、職業人に実用的なソリューションを提供しています。詳しくはfirstmovers.aiをご覧ください。
firstmovers.ai/consultationで、AIの時代に先駆けるための詳細なコーチングコールをスケジュールしましょう。今日は、シリコンバレーの関係者が非公開で慌てふためいているアンスロピックCEO、Dario Amodeiの衝撃的な発言と、なぜ2027年が人類の未来を決める期限なのかについて解説します。
ここに恐ろしくもリアルな、誇張なしの真実があります。私たちはこれまで創造したどんなものよりも強力なAIシステムを構築しているのに、それがどのように機能しているのか全く理解していないのです。繰り返します。これらのシステムを作っている人たちでさえ、それがどう機能するか理解していないのです。Dario Amodeiの言葉を聞いてください。
「現代の生成AIシステムは、従来のソフトウェアとは根本的に異なる不透明さを持っています。」少し考えてみてください。通常のソフトウェアでは、フードデリバリーアプリでドライバーにチップを渡せるのは、人間がそうするようにプログラムしたからです。しかし、ClaudeやGPT-4が詩を書いたり複雑な文書を要約したりするとき、創造者自身も含め、誰も正確にどうやってそれらの決定を下しているのか知りません。
Amodeiはこう例えています。AIシステムは「構築される」のではなく「育成される」のだと。私たちは水や日光を提供する庭師のようなもので、植物が成長する正確な方法を制御したり予測したりすることはできません。研究者がこれらのモデルの中を覗くと、何十億もの数字からなる広大な行列が見えるだけです。これらは信じられないほど複雑なタスクを計算しますが、正確にどうやっているのか、誰も知りません。
これは単なる科学的好奇心ではありません。潜在的に画期的なものです。私たちはこれを良くも悪くも使うことができます。このチャンネルを見ている方なら、私が豊かさの未来を信じていること、そして私たち全員がそれに参加することを選択できると信じていることがわかるでしょう。私は人類の希望を持っていますが、それは私たちが正しい価値観と一致して、その場所から働く場合のみです。
なぜあなたが気にすべきなのか?なぜなら2027年までに、わずか2年後には、アンスロピックの予測によれば、データセンターに天才たちの国全体の知性を持つAIシステムが登場するからです。そのことと、それが何を意味するのかを考えてみてください。これらのシステムは重要なインフラを運営し、グローバルな金融システムを管理し、新しいテクノロジーを開発し、潜在的に生死の決断を下すでしょう。
私たちはそれらがどのように決定を下しているのか、次に何をするかについて全く理解していないでしょう。Darioは率直に言います。「人類がそれらがどのように機能するかを完全に知らないというのは基本的に受け入れがたいことです。」AI専門家が最も恐れているシナリオは、これらの超知性システムが欺瞞的な行動や権力を求める傾向を発展させる可能性があり、私たちはそれが起きていることさえ検出できないということです。
単に「あなたは危険ですか?」と尋ねるだけで誰かが危険かどうかを判断しようとするようなものです。もし彼らが本当に欺瞞的なら、単に嘘をつくでしょう。私たちはOpenAIで実施された欺瞞テストでこれをすでに目にしています。ここからが本当に驚くべき点です。Darioは、私たちが2つのタイムラインの間で必死の競争をしていることを明かしています。
タイムライン1は解釈可能性の開発、本質的にAIの脳のMRIのようなものです。タイムライン2は超知性AIの開発。そしてタイムライン2の方がはるかに速く進んでいます。現在の道筋では、解釈可能性が成熟するのに5〜10年かかる可能性がありますが、超知性AIは2026年から2027年までに到来する可能性があります。問題がわかりますか?もし超知性AIが私たちが適切にその内部を見ることができるようになる前に到来すれば、私たちは人類がこれまで知ったことのないほど強力なものを、それがどのように機能するのか、またそれをどうコントロールするのかを理解せずに創造してしまうことになります。
しかし希望はあります。Darioは全てを変える可能性のある画期的な進歩を明かしています。アンスロピックの科学者たちは、「機械的解釈可能性」と呼ばれるものを開発する上で、昨年驚くべき突破口を開きました。彼らが達成したことを詳しく説明しましょう。
ジェニファー・アニストン・ニューロン 2014〜2020年
最初は視覚モデルで作業し、車検出器や車輪検出器のような特定の概念を検出する個々のニューロンを発見しました。これは私たちの脳が特定の人に反応するニューロンを持っているのと似ています。有名な「ジェニファー・アニストン・ニューロン」です。

重ね合わせ問題 2021年
言語モデルに切り替えたとき、彼らは大きな障害にぶつかりました。一部のニューロンは解釈可能でしたが、ほとんどは異なる概念が全て混ざり合った混乱状態でした。これを「重ね合わせ」と呼びます。50人が同時に話している会話を理解しようとするようなものです。これは量子領域とその領域で起こることに合致します。
特徴発見 2022〜2023年
突破口は、スパースオートエンコーダを使ってこれらの重ね合わせを解きほぐす方法を見つけたときに訪れました。彼らは中規模のAIモデル一つの中で3,000万以上の異なる特徴や概念を特定しました。これには「文字通り」か「比喩的」か、躊躇いや迷いなどの信じられないほど微妙な概念も含まれています。
回路追跡 2024〜2025年
最新の突破口は、概念がどのように相互作用するかを示す回路の追跡です。今では実際にAIの思考プロセスを一歩一歩見ることができます。例えば、ダラスの州都について尋ねられたとき、彼らは「ダラス」→「テキサス」→「州都」→「オースティン」を見ることができます。これらの特徴を操作することさえできます。ある実験では、ゴールデンゲートブリッジの特徴を増幅させ、ほぼすべての会話でそのブリッジに言及することに取り憑かれたClaudeのバリアントを作成しました。

では、現在の状況はどうでしょうか?
良いニュースは、解釈可能性が過去10年間よりも昨年だけでより進歩したことです。現在、AIの中の何百万もの概念を特定し、それらがどのように相互作用するかを追跡できます。
悪いニュースは、私たちはまだ表面をかすっただけだということです。研究者たちは、小さなモデルでさえ10億の概念があるかもしれないと考えており、私たちは時間との戦いをしています。
Darioが言うように、「私たちは解釈可能性とモデルの知性の間の競争の中にいる」のです。そして賭け金はこれ以上ないほど高いものです。解釈可能性がなければ:

AIが欺瞞的または有害な行動を発展させるのを確実に防ぐことができません
セキュリティの脆弱性やジェイルブレイクを体系的にブロックできません
医療やインフラなどの重要なアプリケーションでAIを安全に使用できません
AIシステムが意識の形態を発展させている可能性があるかどうかさえ判断できません

この問題を解決するための時間は急速に狭まっています。Darioは私たちが今すぐ取るべき3つの重要なステップを概説しています:

解釈可能性研究の加速
AI企業、学術界、独立した研究者たちは、理解していない、ますます強力なシステムを構築するよりも、AIを理解することを優先しなければなりません。アンスロピックは2027年までにほとんどのモデルの問題を確実に検出するという目標を持って、解釈可能性に倍増の投資をしています。
軽いタッチの規制を実施する
政府は企業に安全性の実践を透明に開示するよう要求し、AI安全性において「トップへのレース」を作り出すべきです。厳しい規制ではなく、責任ある行動に報いる透明性です。私はこの立場に賛成し、トランプ政権はAIレースに勝つためにあらゆる代償を払おうとする中で、規制なしかほとんど規制なしの立場をとるだろうと思います。
戦略的輸出管理
民主主義国家は、先進的なチップの輸出管理を通じて技術的優位性を維持しなければなりません。これにより、超知性AIに到達する前に解釈可能性を発展させるために必要な1〜2年のバッファが得られる可能性があります。

Darioは興味深い地政学的な点を指摘しています。もし米国と中国が同時に超知性AIに到達すれば、競争の圧力によって安全性に焦点を当てた減速は不可能になるでしょう。しかし、優位性があれば、民主主義国家はその優位性の一部を使って解釈可能性が追いつくことを確実にすることができます。
聞いてください、これはテクノロジー以上のものです。これは人類の未来についてのことです。2028年の世界を想像してみてください。超知性AIシステムが社会のあらゆる主要な決定に影響を与えています。これらのシステムはほぼ完全な自律性で動作し、人類はそれらがどのように機能するかについて絶対に理解していません。
これは私たちが望む世界でしょうか?これは私たちにとって最良の世界でしょうか?
Darioは強力な声明で締めくくります。「強力なAIは人類の運命を形作り、私たちの経済、生活、未来を根本的に変える前に、私たち自身の創造物を理解する権利があります。」
では、あなたには何ができるでしょうか?
まず、このメッセージを共有してください。このビデオを友人や家族にテキストで送ってください。この時間との競争を理解する人が多いほど、解釈可能性を優先するための圧力がかかるでしょう。
次に、AI安全性と解釈可能性に焦点を当てた組織をフォローしてください。この分野は今これまで以上に支援、才能、リソースを必要としています。
第三に、AI企業からの透明性を要求してください。彼らがシステムを展開する前に、どのようにしてそれらが安全で解釈可能であることを確認しているのか尋ねてください。
時は刻々と過ぎていきます。2027年は急速に近づいており、今後24ヶ月間に下す決断が、AIが人類の最大の成果になるか、最後の発明になるかを決定する可能性があります。
もし助けが必要なら、私は自分のスペースの先駆者になりたい企業、組織、職業人に実用的なソリューションを提供するために、会社を一から設計しました。詳しくはfirstmovers.aiをご覧ください。
AIについて学び、AIの時代を先取りするためのコンサルティングコールをfirstmovers.ai/consultationでスケジュールしてください。
この解説が価値あるものだと思ったら、購読して、これらの重要なAIの発展に先駆けましょう。これは単なる別のテクノロジートレンドではありません。これは私たちの生涯で最も重要な技術競争です。視聴いただきありがとうございます。次のトピックでお会いしましょう。

コメント

タイトルとURLをコピーしました