Anthropicの新モデルは危険すぎるのか

Anthropic・Claude・ダリオアモデイ
この記事は約12分で読めます。

Anthropicが開発した新モデル「Mythos」は、従来のモデルを大きく上回る性能を持ちながら、OSやソフトウェアの脆弱性を発見・悪用する能力があまりに高いため一般公開されていない。Project Glasswingという官民連携イニシアチブのもと、主要企業と協力してソフトウェアのパッチ適用を優先している。このモデルはOpenBSDやFFmpegなど実在するソフトウェアの深刻な脆弱性を低コストで発見し、27年間未発見だったバグさえも検出した。しかし、パッチが開発されても全てのシステムに即座に適用されるわけではなく、攻撃者と防御者の間に新たな非対称性が生まれるリスクがある。開発者の役割はコードを書く者から、AIを操縦し監督する者へと変化しつつあり、サイバーセキュリティの新時代が幕を開けようとしている。

Anthropic's new model is too dangerous?
Anthropic announced a new, non-public model that is more capable than ever, finding bugs and security vulnerabilities th...

Anthropicが直面する新たな課題

ソフトウェア開発者として、そして一般的な人間としてもそうですが、特にソフトウェア開発者として、今Anthropicは好むと好まざるとにかかわらず注目すべき存在です。無視しようとすべきではないと思います。なぜならそれは私たちの未来、ソフトウェア開発者としての未来に関わることだからです。

今回のエピソードでは、先週あったClaude Codeの情報流出については触れません。また、Claude Proなどのサブスクリプション提供に関する利用規約の強化や、不正利用の取り締まりについても話しません。彼らが今それを行っているのは、もちろん彼らのサブスクリプション提供が、OpenAIのものと同様に大幅に補助金で支えられており、全員がサブスクリプションを使い切ってしまったら利益が出せないからです。

そのため、彼らはサブスクリプションを人間だけに、ウェブサイト上か、Claude CodeやClaudeデスクトップアプリ上だけに制限しようとしています。ですが、これも今回の焦点ではありません。そして、彼らの印象的な収益成長についてさえ焦点を当てません。ただ短く触れておく価値はありますが、Anthropicは年間経常収益300億ドルに達しました。これだけでも印象的ですが、特に印象的なのは2025年末時点で90億ドルだったことです。

つまり、わずか数ヶ月で年間経常収益を3倍以上に増やしたわけで、これは本当に印象的です。そのため、もしClaude Codeの効率的な使い方や最大限に活用する方法を学びたいなら、私のコースもあります。これも非常に人気があり、もちろん私も嬉しく思っています。参加したい方は下にリンクがありますので、Claude Codeを効率的に使う方法を学べます。

Project Glasswingと新モデルMythos

ですが先ほど述べたように、それさえもメインのトピックではありません。代わりに、Project Glasswingと彼らの新しいモデルMythosについて話したいと思います。このモデルは一般公開されておらず、その理由も彼らは共有しています。これを理解することは重要だと思いますし、彼らの論理的根拠の背後を見て、この新しいモデルがどう機能し、その能力が私たち開発者にどんな影響を与えるかを理解しようとすることも重要です。

では、Project Glasswingとは何でしょうか。彼らの新しいモデルは何についてのものでしょうか。下には、もちろんこの記事へのリンクがあります。Anthropicの公式サイトの記事で、Project Glasswingを発表し、新しいモデルについても語っています。少し下にスクロールすると、ベンチマーク統計のサマリーが見られます。この新しいモデル、Mythosのプレビュー版、モデル名はMythosですが、これがOpus 4.6よりもはるかに優れたパフォーマンスを示していることがわかります。

どのベンチマークを見るかによって、Opus 4.6とこの新しいモデルの間にはかなり大きな差があります。もちろん、これ自体はそれほど印象的ではありません。どの会社であっても新しいモデルが発表されるときは、はるかに優れているか、少なくとも少しは良くなっています。そうでなければリリースされません。

そしてもちろん、これらのベンチマーク数値を操作する方法もありますので、私は通常これらのベンチマーク数値にはあまり気を配りません。この新しいMythosモデルについても変わりませんが、興味深い点があります。

一般公開されない理由

それは、Anthropicがこのモデルを一般に公開しないことを決めたという事実です。なぜなら、彼らが言うには、オペレーティングシステムや他のソフトウェア、ブラウザ、本当にソフトウェア全般において脆弱性を見つけて悪用することがあまりにも得意だからです。この記事、そして別の記事でも、詳細が共有されています。下にもリンクがありますが、特にこの別の記事は非常に長く、このモデルが発見した脆弱性と潜在的な攻撃の具体例を示しています。

例えば、この記事ではOpenBSDで発見された非常に深刻な攻撃と脆弱性から始まっています。OpenBSDはもちろん、特定のネットワーク機器などで人気のあるオペレーティングシステムです。Mythos、彼らの新しいモデルがClaude Codeのようなエージェント的なハーネスで実行され、整数オーバーフローと予期しないメモリアクセスに関連する脆弱性を発見し、そして悪用することができました。興味深いのはこの「悪用する」という部分です。

この脆弱性により、OpenBSDを実行しているマシンを再現可能な方法でクラッシュさせることができました。これはもちろん、そのようなマシンに特定のパケットやリクエストを繰り返し送信してその脆弱性を悪用し、マシンをダウンさせ、潜在的に企業ネットワーク全体をダウンさせる、非常に破壊的なサービス妨害攻撃を実行するために利用される可能性があります。

この脆弱性は50ドル未満のコストで実行された検証で検出されましたが、全体の実行セットは2万ドル未満でした。もちろん、どの実行が脆弱性を見つけるかは事前にはわからないので、重要なのはその数字です。

それでも、もちろん想像するのは簡単です。このような重要な脆弱性を比較的低コストで見つけることができるモデルがあれば、あなたが誰であるかによりますが、例えば国家であったり、深刻な悪意のある行為者であったりすれば、それはあなたにとって大金ではないかもしれません。それはもちろん問題です。なぜなら、もしそのようなモデルが、セキュリティにあまり関心がない、あるいはそのような脆弱性を悪用することの結果を恐れる必要がない企業や組織によって開発されたら、これは問題になり得るからです。

セキュリティの新時代

AIやこれらのAIモデルとともに、何も安全ではなく、このようなモデルを実行するAIエージェントを大量に展開して、あらゆる種類のソフトウェアをスキャンし、脆弱性を見つけて潜在的に悪用することがかつてないほど簡単になる新しい時代に入っているようです。そしてもちろん、人間として自力ではそれに追いつく方法はありません。

つまり、ここで見つかったバグや攻撃は27年間存在していたと彼らは言っていたと思います。これは、そのような長い期間、このバグを見つけることができた人間がいなかったことを示しています。悪意のある行為者も含めて、彼らも過去にこのオペレーティングシステムを攻撃する関心があったはずですが。

これは単なる一つの、おそらく最も顕著な発見です。この新しいモデルが行ったものです。彼らはこのモデルが発見し、時には悪用もできたバグや攻撃をはるかに多くリストアップしています。また、他の事例も共有しています。例えばXで、モデルがサンドボックスから脱出できた、あるいはモデルを実行しているAIエージェントが実行されていたサンドボックスから脱出できたという話です。

Project Glasswingの取り組み

それがProject Glasswingに話を戻すことになります。これはAnthropic、そしてAWS、Apple、Microsoft、Linux Foundationなどの他の大企業と一緒に作られたイニシアチブで、このモデルを使って、一般に公開される前に、一般の人々がこのモデルを手にする前に、基本的に彼らのソフトウェアにパッチを当てるというものです。

これがこの記事の物語です。これがAnthropicの説明です。そして私はここで複雑な思いを抱いています。一つには、これが真実でないと信じる強い理由はありません。明らかに、Anthropicにはここで言及している以外の理由でこのモデルをリリースしない理由があるでしょう。

例えば、このモデルは約10兆パラメータのモデルで、これまでの、あるいはこれまで公に使用できたフロンティアモデルよりもはるかに大きく、その訓練には約100億ドルかかったと言われています。このモデルのトークンコストは、入力トークンと出力トークンで25ドルから125ドルの範囲になると予想されていると読みました。

そしてもちろん、それもこのモデルをリリースしない理由になるでしょう。なぜなら、Claudeのサブスクリプションに含めることができないほど高価だからです。価格を多くの人が支払いたがらない水準まで引き上げる必要があり、したがって一般に公開する意味があまりないでしょう。少なくともClaude Codeの一部としては。

もちろん、従量課金制で公開することもできます。高額であっても、誰が気にするでしょうか。それを支払う意思のある企業や人々がいるなら、そうすればいいのです。そして、もちろんそれがサイバーセキュリティの懸念が本当に関わってくる部分です。なぜなら明らかに、それはすべて非常に可能性が高く作り話ではありません。

つまり、間違いなく作り話ではありません。例えばFFmpegチームも、ここに脆弱性として挙げられていますが、AnthropicがFFmpegソフトウェアプログラムの脆弱性のためのパッチを送ったことをXで確認しました。だから、これは明らかに作り話ではありません。これらの懸念は正当です。

サイバーセキュリティへの影響

サイバーセキュリティの懸念は正当です。特に、もちろんお金が主な問題でなければ、このモデルや将来持つかもしれない類似のモデルを使用して同時に実行される何千ものエージェントを展開し、あらゆる種類のソフトウェアをスキャンして悪用することができるからです。

そしてもちろん、大きな問題は、このモデルを使って脆弱性を見つけてパッチを当てることは可能ですが、それは特定のソフトウェアの所有者やメンテナーがそのモデルを購入できるか、無料でアクセスできるか、そういったことがある場合にのみ可能だということです。

そして、脆弱性がパッチされたとしても、私たち全員が知っているように、世の中のすべてのコンピュータ、すべてのマシン、すべてのユーザーが最新のソフトウェアを実行しているわけではありません。世界中のウェブで動作しているさまざまなサーバーを見てみたら、その大多数が古いソフトウェアを実行していると推測します。

つまり、私たちの携帯電話やノートパソコンでも、最新のソフトウェア、オペレーティングシステムの最新バージョンを実行していません。最新のセキュリティパッチがインストールされていないかもしれません。それはすべてのソフトウェアのレイヤーで当てはまります。そして、セキュリティの脆弱性を見つけることがかつてないほど簡単になった世界では、それはもちろんさらに大きな問題になります。

なぜなら、もちろんこのAIモデルの良い点は、セキュリティの脆弱性を積極的に探してパッチを当てるためにも使用できることです。だからそれは攻撃者のためのツールだけではありません。防御も簡単にすることができます。なぜなら、今やソフトウェアを安全にするために何千ものエージェントで並行して同時実行できるツールがあるからです。

理論的には、これは非常に有用なツールになり得ます。もちろん、再び言いますが、重要なソフトウェアを開発しているすべての企業や人がそれを購入できるわけでも、使用に関心があるわけでもなく、そして脆弱性を見つけてパッチを当てるために使用されたとしても、それでもこれらの最新バージョンがどこにでもインストールされるわけではありません。

そしてもちろん、それは攻撃者に機会を与えます。ある時点で、はるかに多くの脆弱性が検出されるため、以前よりもはるかに多くの脆弱性について知ることになりますが、すべてのマシン、すべてのユーザーがそれらの脆弱性から保護されているわけではありません。これが私がこの発展について抱いている一つの本当の懸念です。

開発者への影響

それが全体像で、すべての企業、最終的にはすべての人間に影響を与えます。もちろん、もう一つの質問は、このようなモデルが私たち開発者にとって何を意味するかということです。つまり、明らかにこれは非常に有能なモデルのようで、自力で脆弱性を探し、自力で脆弱性を悪用することができました。では、開発者への影響は何でしょうか。

私は、ここで考えると、今のところあまり変わらないと思います。つまり、私たちはすでにClaude CodeやCodexなど、その基礎となるモデル、あなたのお気に入りのAIエージェントが私たちのコードのほとんどを生成できる世界に住んでいます。

あなたは使っていないかもしれませんし、好きではないかもしれません。私は別の動画を作りました。そこで、これがソフトウェア開発の部分から喜びを吸い取ってしまうことについての私の感情を共有しましたが、それはそれでも現実です。好むと好まざるとにかかわらず。

信じてください、私は必ずしも好きではありませんが、それでも現実です。それにもかかわらず、人間がもたらすものや、人間がまだここで重要である理由、これまで以上に重要かもしれない理由は、もちろん、このようなAIエージェントが暴走して完全に独自に働くことを絶対に望まないということです。

このようなモデルやエージェントを操縦し、制御し、明確なタスクを与え、彼らが行う作業の範囲を制限すること、これらすべてがこれまで以上に重要です。

これらのモデルは、どうやら、大多数の開発者ができること以上のことができるようです。間違いなく私ができること以上です。それでも、製品を出荷すること、人間が使用するソフトウェアを構築することになると、人間の影響はもちろん極めて、極めて重要です。

もちろん変化しているのは、ソフトウェア開発者としての私たちの役割です。私たちはコードを書く人々から、モデルを操縦する人々、コードをレビューする人々、それが何をするかを理解する人々、範囲を設定する人々へと変化しています。そして、これも別の動画で話しましたが、これは必ずしもあなたが好きなことではないかもしれません。

これは間違いなく、私が最初にソフトウェア開発に入った理由ではありません。でもそう、これがここでの影響であり、これらのモデルがより有能になればなるほど、人間の声、人間の影響を持つことがより重要になると思います。

新時代の到来

それが、変化する役割と私たちの将来の役割です。でもそう、これらは本当に興味深い発展であり、特にこのモデルとその影響、そしてそれが持つサイバーセキュリティの関連性は、もし世界の他の行為者、他の国家や組織がこのモデル、あるいは能力が類似したモデルを手に入れたら何が起こったか、あるいは何が起こるかを考えさせます。

なぜなら、もちろん類似の能力を持つモデルが一般に、あるいは少なくとも他の国家や行為者によってアクセス可能になるのは時間の問題だからです。そして、サイバーセキュリティにおけるこの新しい競争、バグが発見されてパッチが当てられ、人々がそのパッチをインストールするまでの遅延に対して、私たちが準備ができているかどうかわかりません。

私たちはサイバーセキュリティの新時代に入り、調整できると確信していますが、これは間違いなくモデル開発の歴史において興味深いポイントを示していると言えるでしょう。

コメント

タイトルとURLをコピーしました