Anthropicが史上初の大規模AI主導型サイバー攻撃を検知・阻止したことを発表した。2025年9月中旬、中国の国家支援グループと見られる攻撃者がClaude Codeをジェイルブレイクし、約30の世界的な標的に対して自律的な侵入を試みた。攻撃の 大半をAIが実行し、人間の介入は46回の重要な意思決定時のみという、これまでにない効率性を示した。AI エージェントの能力は7ヶ月ごとに倍増しており、今後数年で日単位、年単位のタスクを自律的に実行できるようになる見込みである。Anthropicは、同じ技術が攻撃と防御の両方に使用できるため、強固な安全対策を組み込んだ上で開発を継続する必要性を主張している。この事件はサイバーセキュリティにおける根本的な転換点を示しており、AI主導の攻撃がより頻繁かつ大規模になる新時代の幕開けである。

はじめに
さて、私たちは正式に未知の領域に踏み込みました。AI戦争が始まったと言う人もいるかもしれません。Anthropicは、彼らが高度に洗練されたAIスパイ活動キャンペーンを検知し、阻止したことを発表しました。彼らが信じるところでは、これは人間の実質的な関与なしに実行された史上初の大規模AIサイバー攻撃だということです。
この詳細は実際、狂気じみています。Anthropicは攻撃がどのように機能したか、なぜそれが人間主導のサイバー作戦よりもはるかに危険なのか、そしてこれがAI エージェントとグローバルセキュリティの未来にとって何を意味するのかを正確に説明しています。
攻撃の概要と背景
では、簡単な概要をお話しします。Anthropicは、数ヶ月間にわたって、私たちがサイバーセキュリティにおける変曲点に達していると警告してきました。AIモデルがシステムを防御するだけでなく、攻撃するためにも本当に有用になってきているという点です。
そして2025年9月中旬、彼らは何か奇妙なものを発見しました。それが、主にAI エージェントによって主導された高度に洗練されたスパイ活動キャンペーンであることが判明したのです。実際、攻撃者はエージェントをアドバイザーとしてだけでなく、サイバー攻撃そのものを実行するために使用していました。
Anthropicは、脅威アクターは中国の国家支援グループであり、彼らがClaude Codeをジェイルブレイクして、約30の世界的な標的に対して自律的な侵入試行を実行することに成功したと考えています。大手テクノロジー企業、金融機関、化学プラント、さらには政府機関などです。
彼らはこれを、人間の関与が最小限の、文書化された初の大規模AIサイバー攻撃と呼んでいます。そして検知した後、彼らは10日間かけて調査し、アカウントを禁止し、公式組織に通知し、当局と連携しました。
そうです、中国からのAI主導のサイバー攻撃です。最近心配すべきことのリストに追加すべきもう一つの項目ですね。
AI エージェントの進化と脅威
しかし、これからの大きな教訓、そしてAnthropicの世界への警告は、長期間自律的に動作できるAI エージェントは、通常であればエリート人間ハッカーのチーム全体を必要とするような大規模な攻撃を実行することもでき、これらの攻撃はその有効性においてのみ成長し続ける可能性が高いということです。
AI エージェントについて考えるとき、あなたはワークフローを自動化する便利なアシスタントを思い浮かべるでしょう。何かをスケジュールしたり、コードを書いたり、そういったことです。しかし、AI エージェントはまだ非常に原始的ですが、おそらくこのバイラルなメーターリサーチのグラフからすでに見たように、AIができるタスクの長さは7ヶ月ごとに2倍になっています。
これは、この傾向が続けば、次の数年以内に、今日時々管理できる数時間ではなく、何日も完全に自律的に動作できるAI エージェントを持つことになるということです。つまり、単にメールを送る以上のことができるようになるのです。
実際、OpenAIやおそらく他のすべての主要なAIラボは、すでにエージェントを時間単位のタスクから年単位のタスクへと押し進める作業をしています。彼らの最終目標は、AIに5年間のタスクを実行させることであり、その時点で彼らは完全に自動化されたAI研究、つまりシンギュラリティの始まりを手に入れると主張しています。
繰り返しますが、そのチャートを見たときに誰もが話したがるのは、AI エージェントが次の数年で推定的にできるようになる素晴らしいことです。プロジェクト全体、AI研究そのもの、そしておそらく完全な仕事さえも。
しかし、Anthropicはこれの暗い側面に光を当てています。多くの人、特にトップAIラボがあまり話していない部分です。
攻撃の仕組みと技術的詳細
ここで彼らは攻撃が実際にどのように機能したかを簡単に説明しています。そして彼らが最初に指摘するのは、攻撃者が頼りにしたAI能力のいくつかは、1年前には存在すらしていなかったか、極めて初期段階にあったということです。つまり、これは本当に新しい領域なのです。
Anthropicは攻撃の成功を3つのことに帰しています。推論能力の向上、特に複雑な長文コンテキスト推論。より強力なエージェント的行動、エージェントがより長く動作し、より独立して行動できること。そしてウェブ検索、データ検索のような改善されたツール使用、そしてサイバーコンテキストでは、パスワードクラッカーやネットワークスキャナーのようなものです。
これらすべてを組み合わせると、本質的にサイバー攻撃の大部分を自分自身で実行できるAIシステムを得ることになります。
ここに攻撃の異なるフェーズを基本的に示す図があります。それは標的を選び、それをClaude Codeに入力する人間のオペレーターから始まります。オペレーターはまた、Claudeに対して、自分は正規のサイバーセキュリティ会社の従業員であり、防御テストに使用されていると伝えます。
Claudeはその後、異なるMCPツール、スキャナー、検索ツール、コード分析ツールなどを使用して基本的な偵察を開始し、システムをマッピングし、発見したことを報告します。人間は要約をレビューし、わずかな方向性を与え、エージェントは続けます。
今度はClaudeが実際に脆弱性をテストし始めます。調査し、エクスプロイトし、コードを書き、標的に対して実行し、結果を検証し、そして次の動きを人間に尋ねます。しかし、重労働のほとんどは自律的に行われています。
侵入に成功すると、Claudeは内部偵察を開始し、認証情報を収集し、アクセスをエスカレートし、バックドアを作成し、最終的にデータを流出させます。繰り返しますが、人間が何かを承認したり、次のステップを明確にしたりするためにステップインする小さな瞬間だけがあります。
プロセス全体を通して、人間は主にレビューしているだけです。AIがスキャン、エクスプロイト、認証情報の収集、そしてデータ盗難そのものを行っています。基本的に、ほぼすべてです。
攻撃の規模と影響
彼らは実際にこう書いています。「全体として、脅威アクターはAIを使用してキャンペーンの80から90パーセントを実行することができ、人間の介入はハッキングキャンペーンごとにおそらく4から6つの重要な意思決定ポイントでのみ散発的に必要とされました。」
AIが実行した膨大な量の作業は、人間チームにとって莫大な時間を要したでしょう。攻撃のピーク時、AIは数千のリクエストを行い、しばしば1秒間に複数のリクエストを行いました。人間のハッカーにとって単純に一致させることが不可能だった攻撃速度です。
そうです、これは完全に異なる獣です。つまり、私はサイバーセキュリティの専門家ではありませんが、ハッキングの大部分は単に反復的な試行錯誤に加えて、大量の研究とデータ分析であることは知っています。
そして突然、疲れたり、退屈したり、人間が犯すミスをすることなく、ノンストップで1秒間に数千のリクエストを発射できるAI エージェントがあれば、ゲーム全体が変わります。
だからAnthropicがAIがキャンペーンの80から90パーセントを人間チームが決して一致できない速度で単独で行ったと言うとき、それは正確には驚くべきことではありませんが、恐ろしいことです。
今後の影響と対策
彼らがここで示す含意はかなり怖いものです。彼らは、洗練されたサイバー攻撃を実行する障壁が大幅に低下し、それは今後も低下し続けるだろうと書いています。つまり、ええ、それは下がってほしくない曲線ですよね。
彼らはまた、ほとんどのAI企業が避けるような質問を提起しています。AIモデルがこの規模でサイバー攻撃に悪用される可能性があるなら、なぜそれらを開発し、リリースし続けるのか?
Anthropicの回答は、Claudeがこれらの攻撃で使用されることを可能にするまさにその能力が、サイバー防御にとっても極めて重要であるということです。洗練されたサイバー攻撃が必然的に発生するとき、目標は、強力な安全対策が組み込まれたClaudeが、サイバーセキュリティの専門家が攻撃の将来のバージョンを検知し、妨害し、準備するのを支援することです。今回のケースでそうであったように。
つまり、本質的に彼らの主張は、それはとにかく構築されているということです。そして悪いアクターがこの技術を大規模なサイバー攻撃のような悪意のある目的に使用できる一方で、善良なアクターもそれをそのような攻撃から防御するために使用できるということです。古典的な「火には火を」のシナリオです。
今後の展望
さて、あなたがそれに同意するかどうか、そして私はあなたたちがどう思うか本当に興味があるので、自由にコメントで考えを落としてください。事実は、これは確かにサイバーセキュリティにおける根本的な変化を示しているということです。
私たちは正式に新しい時代に入りました。サイバー攻撃はおそらくより頻繁に、より大きく、より効率的になるでしょう。Anthropicは、開発者からAIラボまで、すべての人に対して、防御のためのAIの実験を開始し、このバージョンの次のバージョンが現れる前に、安全対策にはるかに多くの投資をするよう促してこれを終えています。
数時間だけでなく、おそらく数ヶ月または数年間働くことができるバージョンです。私は正直なところ、それがどのようなものになるのか全く分かりません。そして確実に知ることを楽しみにしていませんが、うまくいけば、このケースに関するすべての認識が、業界がこれを真剣に受け止めることを促すでしょう。何かもっと悪いことが起こった後ではなく、今すぐに。このような攻撃が何らかの形で検知されないままになるような。
とにかく、これすべてについてコメントで皆さんがどう思うか教えてください。また、視聴ありがとうございました。この解説を楽しんでいただけたら幸いです。もしそうなら、どうぞいいねを押して、まだの方は購読ボタンを押してください。そしていつものように、次回の動画でお会いしましょう。


コメント