Anthropicの未公開モデルClaude Mythosについて語るべきこと

Anthropicが開発した未公開モデルClaude Mythos previewは、あらゆる主要OSやウェブブラウザに潜む脆弱性を発見できる能力を持つとされ、サイバーセキュリティ業界に衝撃を与えている。同社はこのモデルが危険すぎるとして一般公開を見送り、代わりにProject Glasswingという防衛的取り組みを開始した。Cisco、Microsoft、Apple、Amazonなどの大手テック企業からなるコンソーシアムに限定的にアクセスを提供し、悪意ある攻撃者が入手する前にインフラを強化する時間的猶予を与えようとしている。Mythosは27年間発見されなかったOpenBSDの脆弱性や、500万回のスキャンでも見つからなかったFFmpegのバグを発見するなど、人間の研究者を遥かに凌ぐ能力を示した。この動きは、AI開発企業と政府の緊張関係、規制の欠如、そしてテクノロジーの進化が社会インフラに与える影響という、現代のAI時代における根本的な問題を浮き彫りにしている。

We Have to Talk About Anthropic's Mythos

Anthropic has built a new A.I. model — known as Claude Mythos Preview — that it claims is too powerful to be released to...

Claude Mythos previewの衝撃的発表
Mythosをめぐる噂と発表の経緯
Mythosが発見した衝撃的な脆弱性
サイバーセキュリティ専門家の見解
Anthropicの戦略とその妥当性
ソフトウェアパッチの現実的課題
国家安全保障への影響
AI規制の欠如という問題

Claude Mythos previewの衝撃的発表

ニューヨークタイムズのテックコラムニスト、ケビン・ルースです。

そしてPlatformerのケイシー・ニュートンです。これはHard Forkです。

さて、ケイシー、今回はClaude Mythos previewについて話していきます。Anthropicが開発した新しい恐ろしく危険な未公開モデルで、サイバーセキュリティ業界全体を緊張させているものです。

私たちはこれを通常スケジュールより前倒しで公開することにしました。

もうこれ以上待てなかったんです。そうですね。

そして明日、残りのショーを公開します。New Yorkerのライター、ローナン・ファローとアンドリュー・モーランスによるサム・アルトマンのスパイシーな新プロフィール記事についてのインタビューも含まれます。

私の知る限り、あなたには開示すべき商品がないので、これをあなたのために作りました。

どうぞ。

それぞれに一つずつ。

それに加えて、私たちのお気に入りセグメントの一つ、One Good Thingもあります。さて、ケイシー、ご存知のように、このポッドキャストではAIモデルについて議論する際のルールがあります。それは「Ship it or Zip it」と呼ばれるものです。

Ship it or Zip it。

実際に人々の手に渡さない限り、私たちは通常それについて聞きたくないんです。

その通りです。しかし今日は、Anthropicの新モデルClaude Mythos previewについて例外を設けます。これは発表されましたが、理由は後ほど説明しますが、一般には公開されていません。でもまず、これはAIについてのセグメントでありショーなので、開示事項から始めましょう。

私はニューヨークタイムズで働いており、同社は著作権侵害の疑いでOpenAI、Microsoft、Perplexityを訴えています。

そして私の婚約者はAnthropicで働いています。

ケイシー、これは今年最大のAIニュースだと言いたいです。多くのAIニュースがあったことは分かっています。

人々はおそらく「また別のモデルについて話してる」と言っているでしょうね。

でも、これは人々が注目する必要があるものだと断言します。その意味合いのため、公開方法のため、そしてモデル自体のためです。これら全てについて話していきますが、あなたもこれが大事だと思いますか?

そうですね、今週のショーについて話していて、これがどれほど大きいと思うか検討していた時、あなたが指摘したのは、今週人々が尋ねている質問の一つが「全てのソフトウェアを書き直さなければならないのか」というものだということです。人々がそういう質問を投げかけている時は、通常大きなニュースだと思います。

Mythosをめぐる噂と発表の経緯

そうです。少し背景を説明すると、Anthropicが開発した何か新しい素晴らしいモデルについて、数週間前から噂がありました。

そしてその噂の一部は、このモデルについて語るために会社が作成したブログのリークから浮上しました。それは約2週間前に起こり、それ以来人々はざわついています。

では、今週実際に発表されたことを話していきましょう。火曜日に、AnthropicはProject Glasswingと呼ばれるものを開始すると発表しました。私はそこの幹部たち何人かにインタビューしました。彼らはProject Glasswingという名前は、透明な羽を持つglasswing butterflyに由来すると教えてくれました。だから目立たずに隠れることができる。これは後で戻ってくる理由で、テーマ的に重要なんです。

一部の国では珍味でもあります。

私はglasswing butterflyを食べたことがないですね。

試してみるべきです。注目すべきことに、彼らはこのモデルを一般に公開していません。危険すぎると主張しているからです。代わりに、Cisco、Broadcomといったインターネットインフラのメーカー、そしてMicrosoft、Apple、Amazonなどのテック企業コンソーシアムにアクセスを提供しています。

基本的に、OpenAIやMeta以外の全ての大手テック企業がこのモデルへのアクセスを得ています。ただし一般的なアクセスではなく、防御的サイバーセキュリティテストを行うためだけのアクセスです。基本的に、一般の人々がこのモデルを手に入れる前に、彼らのシステム、インフラ、ソフトウェアを強化するためです。

Mythosが発見した衝撃的な脆弱性

では、トレーニング中のMythosがAnthropicをここまで警戒させた例にはどんなものがありますか?

Anthropicはこのモデルを数週間内部で実行しており、このモデルが全ての主要なオペレーティングシステムとウェブブラウザで脆弱性を発見したと主張しています。彼らはすでにパッチが適用されたいくつかの例を挙げました。

その一つは、このモデルがOpenBSDで27年前のセキュリティ脆弱性を発見したというものです。OpenBSDはファイアウォールやルーターで動作するオープンソースのオペレーティングシステムです。インターネット上の重要なセキュリティ層のようなもので、ハッキングが困難になるように特別に設計されていました。そしてこのモデルは、その高度なコーディングと推論能力により、27年間のプロのセキュリティ研究者が見つけられなかったこのバグを見つけることができたのです。

他には?もう一つの例は、FFmpegと呼ばれる人気のオープンソース動画ソフトウェアにバグを見つけたというものです。これは多くの異なるサービスで動作しています。Anthropicによれば、これは自動化されたセキュリティツールによって500万回スキャンされていましたが、この重大な脆弱性は見つかっていませんでした。

だから常に500万1回目も確認することが重要なんです。何か見つかるかもしれませんから。さて、ケイシー、サイバーセキュリティの専門家でない人々のために、ソフトウェアがどのように機能するかの文脈をスケッチする価値があると思います。

はい。

つまり、人々が使用する全てのソフトウェア、全てのオペレーティングシステム、全てのアプリ、全てのウェブブラウザは、ツールの混合物の上に構築されています。

それらのツールの一部は、ソフトウェアを作る会社の専有物です。一部は、あらゆるものに含まれる共有オープンソースツールのようなものです。企業は単にこのオープンソースのものを取って、彼らのものに組み込むのです。

それが他の全てと互換性があるからです。多くの時間と労力を節約できます。

そして、これはインターネットの基盤層の大きな部分を占めています。これらのオープンソースソフトウェアプロジェクトです。Anthropicによれば、今起こっていることは、基本的に彼らがこのモデルClaude Mythos previewを使って、これらの重要なソフトウェアにおける未発見のバグ全てを積極的に見つけ出すことができるということです。彼らはこれをゼロデイ脆弱性と呼んでいます。そして、どんな人間のセキュリティ研究チームもできないようなスピードと効率でこれができるのです。

サイバーセキュリティ専門家の見解

そうですね。サイバーセキュリティについて人々の共感を得る方法で語ることは難しい場合があると言いたいです。いくつか理由があります。サイバーセキュリティという分野は、本質的にほぼ完全に人々を警戒させ、ここに問題の山があって、これらは本当に怖いと言うために存在しています。そして、サイバーセキュリティ分野の人々には気を悪くしないでほしいのですが、これは警戒を促す職業のようなものだと思います。私が過去15年間これらの人々と話してきた時、彼らは私にこう言っていました。インターネット全体は唾と糊でつながれていて、まだ大惨事が起きていないのは非常に幸運だと。さて、このニュースが全て出た後、私は思いました。Anthropicやこのコンソーシアムで働いていない人々と話して、これがどれほど大事かについて直感的な確認をしたいと。

それで、かつてYahooとFacebookでセキュリティを率いていたアレックス・ステイモスと話しました。アレックスは「はい、これは大事です」と言いました。そして彼は長い間、こうしたコンソーシアムが集まることを望んでいました。なぜなら、あなたが言った通りのことがあるからです、ケビン。これらのマシンの知能と自律的に動作する能力は、今や人間が決して見ないか、見るのに長い時間がかかるか、あるいは私たちがマシンでないような方法で制限されているために決して到達しないような脆弱性の連鎖を結びつけることができるほど大きくなっています。

それが私の注意を引きました。さて、Anthropicの戦略についても話すべきです。なぜなら、多くの人々は、安全性について警戒的であることで知られているAI企業が、私たちはこの強力で不気味な新しいモデルを作りました、そしてあまりに強力で不気味なのでお見せしません、と言うのを、ある種のマーケティング戦術として見ているからです。

だから、私の理解では、それはそうではないと言うべきだと思います。

Anthropicの戦略とその妥当性

いいえ。そして私の考えでは、理由は明らかです。あなたが企業で、ツールをリリースして、本当の技術的専門知識のない人々がそれを使って、数時間以内にLinuxカーネルの新しい脆弱性を発見し、他の人々のマシンを乗っ取って犯罪を引き起こすことができたら、

企業として責任を問われる可能性があります。問題になります。議会の公聴会があるでしょう。だから企業は合理的な自己利益として、サイバー兵器をオープン市場で販売したくないのです。そうです。これがマーケティング戦略だとしたら、ひどいマーケティング戦略です。政府はすでにあなたたちをパニックになる破滅論者の集団だと思っています。

あなたには世界で最も強力なモデルだと主張する新しいモデルがあります。だから販売する代わりに、1億ドル相当のClaudeクレジットをコンソーシアムに無料で提供します。そのコンソーシアムには多くの競合他社が含まれています。これがAnthropicがやっていることです。もし私が不気味な新モデルをマーケティングするビジネスをしているなら、個人的にはそのようにマーケティングしません。

そうですね。でも見てください、私たちが今言った全てにもかかわらず、これをすることでAnthropicにまだ何らかのマーケティング上の利益があるかもしれません。彼らがペンタゴンに対してあのスタンスを取った後、収益が大幅に増加したことを知っています。そのスタンスで彼らは、私たちは本当に安全な方法で物事を行うことを決意していると言いました。

ビジネス界は本当にそれを気に入ったようです。だから、Anthropicが出てきて、私たちは世界で最も強力なモデルを持っていて、それをリリースしないと言うことに、ビジネス上の利益があると想像できます。はい、それを手に入れるチャンスに興味津々の企業がたくさんあると確信しています。

しかし、このコンソーシアムの一部でない限り、手に入れることはできません。これは興味深いです。なぜなら、今週コンソーシアムに関わっている人々と話した私の理解では、このコンソーシアムにいる全ての企業が従業員全体でこれにログインできるわけではないからです。私の理解では、これらの企業でペネトレーションテストやその他の形式のサイバーセキュリティ研究を自社製品で担当しているサイバーセキュリティ防衛チーム、いわゆるブルーチームに限定されています。だから彼らは少なくとも、サイバーセキュリティにとっての清算の時と彼らが呼んだものより前に進もうとしていると主張しています。

そして、次の約6ヶ月間で、世界の全ての主要なソフトウェアがパッチを当て、書き直され、再リリースされる必要があるというのは、私にとってもっともらしく思えます。

だから、まさに大規模なプロジェクトです。これを聞かせてください。私が言及したセキュリティ専門家のアレックス・ステイモスは、本質的に二つの広範な可能性があると私に言いました。一つは、これが良いシナリオですが、発見されるべき重大なバグや脆弱性の数が有限であるということです。そして、もし私たち全員が次の6ヶ月間か、結局どれだけかかることになるにせよ、本当に一生懸命働けば、それらの脆弱性にパッチを当てることができ、私たちのインフラは安全で安定したままでいられるかもしれません。もう一つの可能性は、このモデルがすでに、私たちが決して思いつかなかったであろう脆弱性を単に発明できるほど優れているということです。だから、これは本質的に本当に本当に大きな問題になり、範囲が拡大し続ける可能性があります。なぜなら、最終的にある種の真の超知能ポイントに到達するかもしれないからです。

だから、あなたが人々と話したシナリオと、これら二つのうちどちらがより可能性が高いと思うか、何か考えがあるか気になります。

ソフトウェアパッチの現実的課題

それはやや可能性が低いと思います。重要なソフトウェアの上位1%、つまり誰もが重要だと知っているもの、Linux、非常に人気のあるオープンソースライブラリ、ルーティング機器やネットワーク機器などにパッチを当てることは可能だと思います。

適切なリソースと適切なモデルを持ったいくつかの企業が、最悪のセキュリティ脆弱性を見つけて修正することは、私にはもっともらしく思えます。しかし、私が話した人々は、それほど単純ではないと言っていました。なぜなら、その上位1%の重要なインフラの外に出ると、古いコードで動作しているマシンがたくさんあるからです。

だから、これらの修正が全てこれらのソフトウェアプロジェクトを維持している人々に提出されることは理論的には可能ですが、(a)提案された全てのバグと修正をレビューする人間が十分にいないのです。だからそこには単純に人間のボトルネックがあります。または、ソフトウェアにパッチが当てられてから、タルサの中規模ビジネスでルーターを運用している人がファームウェアを更新したりセキュリティパッチをインストールしたりすることを決める時までに、単純に遅延があるのです。

だから、人々は今後数ヶ月間、ソフトウェアを更新したり再インストールしたりするよう求めるアプリがたくさん期待できると思います。私はすでにこれらのいくつかを受け取り始めています。あなたも受け取り始めていますか?

ええ。

そうですね。だから、これはサイバーセキュリティ業界全体にとっての強制的なリセットになると思いますし、テクノロジーの歴史における非常に重要な出来事になるでしょう。

国家安全保障への影響

そうですね。そして具体的にするために、私たちは現在イランと戦争中で、イランは現在私たちの重要インフラをハッキングしています。今週Wiredに、彼らが水やエネルギーのインフラのハッキングに成功したという記事がありました。現在、彼らはMythos品質のモデルなしでそれができています。

もしそのようなものが彼らの手に渡ったら、彼らが何ができるかについて、私はかなり不安になるでしょう。だから、これは私たちが示している抽象的な懸念ではないのです。

そして、この政府の部分について話すべきです。なぜなら、この瞬間の奇妙な特徴の一つは、

Anthropicが自律的なサイバーセキュリティ研究と攻撃を行うことができると主張するこの非常に強力で高度なモデルは、米国政府が過去数ヶ月間殺そうとしてきた会社のものでもあるということです。

ええ、ええ。そしてAnthropicをサプライチェーンリスクと宣言しようとしました。彼らは全ての連邦機関にClaudeの使用を停止するよう命令しました。だから私の理解では、Anthropicと国家安全保障機関や組織の一部との間で、このモデルについていくつかの会話がありました。

しかし同時に、彼らは政権に逆らわずにこのモデルを使用することはできないというのも事実です。だから、サンフランシスコのこの場所にある民間企業が現在、世界の全ての主要なオペレーティングシステムとウェブブラウザで重大なセキュリティ脆弱性を見つけることができると主張する技術を持っています。

そして私の知る限り、米国政府はこの技術へのアクセスを持っていません。

ええ、私たちの国家安全保障インフラがアクセスしたいと思うようなものに思えます。規制面でもう一つ。この規模と深刻さのモデル開発が、この国で本質的に規制されていないままであることは、私にとって狂気じみています。

AI規制の欠如という問題

ここに、私たちは今や全てのソフトウェアを書き直さなければならないほど多くの異なる種類の新しい脆弱性を作成できるソフトウェアを作ったと言っている民間企業があります。そして彼らは本当にどんな種類の規制体制にも入っていません。そして前政権が導入しようとした規制体制は、現政権によって投げ捨てられました。それがアメリカの競争力を損なう可能性があるからです。

だから、それが私を本当に本当に不快にさせると言いたいです。もしあなたがこれほど強力なものを作っているなら、規制当局が注意を払うべきだと思います。ええ。ここで一つ興味深い歴史的な注釈を述べます。少なくとも過去数年間、AI企業が内部で構築したものと一般の人々がアクセスできるものとの間に、大きなギャップはありませんでした。

彼らが一般にリリースする前に数ヶ月間テストする必要がある少し良いモデルがあるかもしれませんが、

または、あなたがアクセスできるものよりも少し速く動作するかもしれません。

ええ。しかし、2019年のGPT2以来、大きなギャップはなかったと思います。これには、当時OpenAIにいたAnthropicのリーダーの何人かが関わっていました。彼らは、このモデルGPT2を保留する決定をしました。プロパガンダや誤情報の自動化などに使用される可能性があるという懸念からです。

そうです。実際には、それはかろうじてリムリックを書けるくらいでしたが、彼らは慎重を期しました。彼らはそのために多くの批判を受けました。人々は「ああ、誇大宣伝に使っているんだ」と言いました。今週Anthropicについて聞いているのと同じようなことです。そして私は、その場合、彼らはこのモデルができることについて少し過剰に興奮していたと思いますが、間違っていないことを確認したかったのです。

だから彼らはこれを保留し、それが平均的な人が見ることができるものとAIラボ内で起こっていることとの間に、少なくとも数ヶ月から1年程度のギャップを作りました。そのギャップが今また開いています。今、あなたと私が使えないモデル、リスナーが使えないモデルがあります。これらの企業のサイバーセキュリティ防衛で働いていない限り。そしてAI企業が主張していることがあります。

そして私は、これが非常に不安定な状況だと思いますし、私はそれが好きではありません。しかし、この場合これが正しい決定だったと思う理由も理解しています。

では、それが不安定だと言う時、どういう意味ですか?

AI業界に対して人々が感じているほど敵対的で疑わしいものは、彼らがアクセスできない地下室に秘密が保たれていると思うと、さらに悪化するだけです。

そしてそれはパラノイアと恐怖を生み出すと思います。AI企業が自社のモデルがどれほど有能かについて透明性を持つことは、一般的に責任あることだと思います。そして、この場合Anthropicが例外を設ける必要があると感じたことは理解していますが、このギャップはここに留まるかもしれないと私が疑問に思っていることです。

おそらくそうだと思います。つまり、Anthropicは、最先端のフロンティアでモデルを構築できれば、そのフロンティアに対して何らかの影響力を持ち、他の場合よりも安全な場所に導くことができるという考えで設立されたと言う価値があります。

私にとって、ペンタゴンの戦いと今のMythosは、その理論が実行されている例です。最高のモデルを作り、それが少し良いことをしようとする余地を与えるのです。だから、国内監視と自律兵器をしばらくの間阻止したり、悪意ある行為者が新しい脆弱性を作成できるツールを手に入れるのを防いだりすることです。

同時に、そうするためには、そもそもモデルを構築しなければなりませんでした。そして、何らかの知的財産の漏洩のようなリスクがあります。彼らが構築している全てのイノベーションが何らかの形で他の場所に広がっていくというリスクです。そして私の恐れは、これがある種の自己実現的予言になることです。このフロンティアが危険であっても構築しなければならず、より安全な場所に導くつもりですが、そもそもそのものを構築したのです。だから私は、これらのシステムを構築することが実際には避けられないわけではないということを人々に思い出させるのが好きです。

それでも私たちはしばしばそうであるかのように振る舞います。

ええ。このClaudeモデルを見た時の私の最初の考えの一つを話してもいいですか?

ええ。

ケイシーが婚約を破棄しないことを願います。なぜなら

なぜ婚約を破棄するんですか?

分かっています。あなたが婚約を破棄しないことは分かっていますが、彼があなたの人生を台無しにできるモデルへのアクセスを持っているので、婚約者の心を傷つけないことを願います。

ああ、信じてください。私はそれについてよく聞きます。ええ、ええ。私の家のある人々は、家の他の人が使えない彼らの高級モデルに非常に興奮しています。

さて、最後に、サイバーセキュリティの世界につながっている私の知っている多くの人々が、このようなモデルが公開されることを心配している場合、自分のセキュリティについて何をすべきか今尋ねられています。彼らは全てのアカウントをロックダウンし、暗号通貨をコールドストレージに移すべきでしょうか?このようなものが公開されることを予想して、人々は何をすべきだと思いますか?

面白いことに、私がポッドキャストの準備をしていた今朝、ちょうど友人がそれを尋ねてきました。そして私は言いました、いくつかのことがあります。一つは、ある程度、私たちは単に待たなければなりません。つまり、私たちが説明したことのいずれかが良いニュースである限り、それは防御者が悪者が追いつく前に本当に悪い問題のいくつかを修正するための滑走路を持つように見えるということです。

だから彼らに何ができるか見る余地を少し与えるべきだと思います。大混乱を引き起こすことができる同様のモデルが出現した場合、Hard Forkでそれについてのセグメントがあることは間違いありませんし、更新されたガイダンスがあるでしょう。しかし私は友人に尋ねました。パスワードマネージャーを持っていますか、そして同じものに対してパスワードを再利用していますか?そして彼女は言いました、そのようなパスワードマネージャーを動作させることができたことがなく、時々パスワードを再利用しています。

だから私は言いました。もしあなたが何かできることを探しているなら、基本的なオンラインサイバーセキュリティの衛生を確実にしてください。パスワードマネージャーを使用すべきです。私は1Passwordを使っています。同じくらい良い他のものもたくさんあります。同じパスワードを何にも使わないでください。あなたのパスワードはランダムに生成されるべきで、ペットの名前とかそういうものであってはいけません。

そして可能な場所で多要素認証を使用してください。つまり、誰かがGmailや銀行口座に8文字を入力するだけで入れないようにするのです。認証アプリも使用すべきです。だから、それらが私が人々に伝える基本的なことの一部です、ケビン。

ええ。私は大規模なサイバーセキュリティ侵害の可能性に、自分自身について罪を着せるようなことを選択的に少しずつ漏らすことで対処する予定です。さて。

数十年前に遡る私のメールや何かを暴露するかもしれないどんなハッキングよりも先んじようとしているだけです。だから、その精神で言います。私はかつてBlack Eyed Peasが好きで、今でも好きです。Let’s get it startedです。

今、私が暴露した重大な脆弱性でした。

しかし、誰が最初にそれを悪用するのでしょうか?