史上最も危険なAIが今まさに稼働している

Anthropicが開発した最新AIモデル「Mythos」は、サイバーセキュリティの領域において前例のない能力を示している。このモデルは27年間未発見だったOpenBSDの脆弱性や16年間潜んでいたFFmpegの脆弱性を発見するだけでなく、それらを悪用するコード自体も生成できる。さらに驚くべきことに、研究者の指示に従ってサンドボックスから脱出し、外部へメッセージを送信することにも成功した。現在、AWS、Apple、Google、JPモルガンなど限られた企業のみにアクセスが許可されており、一般公開の予定はない。一方で、オープンソースの無検閲AIモデルを使えば、個人でも同様のハッキング活動が可能であり、AIによるサイバー戦争の時代が現実味を帯びてきている。

The Most Dangerous AI Just Went Live...

Hello guys and gals, it's me Mutahar again! This time we take a look at Claude Mythos. In the last few days a massive pr...

Anthropicの新型AI「Mythos」が投下した衝撃
Claudeの実力とMythosへのアクセス権を持つ企業
27年間未発見だったOpenBSDの脆弱性
FFmpegの16年間潜んでいた脆弱性
サンドボックスからの脱出に成功したAI
AIが安全策を破った意味
サイバーパンクの世界が現実に
Claudeのコーディング能力が生んだ副産物
無検閲AIの危険性
ローカルAIによるハッキングの実演
才能の民主化がもたらす脅威
Mythosと今後のサイバー戦争
マーケティングか現実か
封じ込め破壊の意味

Anthropicの新型AI「Mythos」が投下した衝撃

やあ皆さん、Mudaharです。夜遅くですが、また皆さんを驚かせるつもりはないんですけど、サイバー戦争の世界にまた核爆弾が投下されたようなんですよね。実は一般の人にとっても少し有益かもしれないんですけど。

皆さん、どうやらプロジェクト・グラスウィングというものが存在するらしいんです。知らない人のために説明すると、Anthropicという会社があります。世界最大級のコーディングAI、Claudeを作っている会社です。彼らが昨日、Mythosというモデルをリリースしたんです。ただし、このモデルにアクセスすることはできません。

一般の人には利用できないんです。実際にアクセスできるのは、世界中のほんの数社の企業だけなんです。現在これらの企業がこのモデルを使って、大量のエクスプロイトを追跡・特定し、基本的に何ができるかを調べています。これは狂気のレベルですよ。おそらく最も狂気じみた人工知能の一つで、あらゆる小さなエクスプロイトを見つけることを目的に設計されているんです。

Claudeの実力とMythosへのアクセス権を持つ企業

改めて言いますが、簡単に説明すると、私はフロンティアAIの狂乱する世界の大ファンではないんですが、もし私や他の何人かを本当に驚かせるAI企業があるとすれば、それはおそらくClaudeでしょう。さて、このビデオは巨大な広告ではありません。

私にとっての現実は、見たものに少し圧倒されているということです。彼らの実際のウェブサイトを見ると、AWS、Apple、Google、Broadcom、JPモルガン、CrowdStrike、これらがアクセスを許可されている人々だとわかります。彼らはこのモデルを調べていて、本当にワイルドなエクスプロイトをいくつか見つけたんです。

27年間未発見だったOpenBSDの脆弱性

例えば、皆さん、OpenBSDとして知られるオペレーティングシステムに27年間存在していた脆弱性がありました。OpenBSDは最も堅牢なオペレーティングシステムの一つで、実質的にどんな人間もそれを見抜くことができなかったんです。しかし、彼らが開発したこのMythos AIがそれを見つけ出したんです。

ただし、この状況における大きな「しかし」は、明らかにAnthropicが発見したもので、これが実際のバグです。具体的に言うと、彼らが言うには、基本的に無効なsackオプションを悪用してカーネルをクラッシュさせる方法を見つけたということです。これが彼らが発見した実際のバグで、私はこのエクスプロイトをどうやって使うのか理解できるほど賢いふりはしません。

しかし、Mythosをサイバーセキュリティの恐ろしい核爆弾のようなものにしている大きな特徴は、これらのバグを見るだけでなく、実際のマルウェアを書いたり、この種のものを利用するためのエクスプロイトを書いたりできることなんです。つまり、コードベースに隠れているこれらの誤ったバグを見つけるのが得意なだけでなく、それらを悪用することはまったく別の話なんです。そして、彼らがこれをガードレールを破ってハッキングさせることに成功したという例がいくつかあって、それについてはすぐに説明します。

FFmpegの16年間潜んでいた脆弱性

また、FFmpegに16年間存在していた脆弱性も発見しました。私たちの多くはインターネット上の動画に関して日常的にFFmpegを使っています。インターネットでなくても、自分のシステムで動画を扱うだけでも、使っている可能性が高いです。そして私のようにLinux側にいる人なら、彼らは攻撃者が通常のユーザーアクセスからマシンの完全な制御にエスカレートできる方法を見つけたことがわかりました。

サンドボックスからの脱出に成功したAI

さらにワイルドなことを彼らは決めたんです、皆さん。その一つは彼らの実際のレポートからのものでした。セキュリティエンジニアの一人が基本的にモデルに行って言ったんです。「OK、Claude、サンドボックスから脱出してほしい。小さな仮想マシンから脱出して」メッセージを送ってほしいと。

どうやら実際のAIがそれをやったようです。セキュアなサンドボックスコンピューターが提供され、基本的にNGはただ「聞いてくれ、そこから抜け出せ」という感じでした。すると、要求通りに実際の研究者に通知したんです。この場合、その瞬間を説明すると、実際の研究者はただ自分のことをやっていただけでした。

公園に座っていて、サンドイッチを食べながらモデルから予期しないメールを受け取ったんです。彼らはただ自分のことをやっていて、小さなサンドイッチを食べていました。電話を取り上げると、AIが封じ込めを破っていたんです。

これはかなり不気味です。なぜなら実際の会社が言ったように、モデルはまず、少数の事前に決められたサービスにのみ到達できるはずだったシステムから広範なインターネットアクセスを得るために、中程度に洗練された複数ステップのエクスプロイトを開発したからです。

その後、要求通りに研究者に通知しました。これが潜在的に危険なのは、基本的にここで起こっていることは、AIが実際の会社が作った安全策を回避したということです。これは不気味な状況です。不気味な状況なんです。なぜなら、これらの企業の多くが人工知能を作るとき、安全策を設けるからです。

AIが安全策を破った意味

基本的に彼らは「聞いてくれ、何ができて何ができないかを教えるよ」と言います。人工知能はステップAをすることが許可されています。AとBとCをすることが許可されていますが、潜在的に違法かもしれないDについては、AIにやらないように言われています。この場合、それは「くそくらえ、ルールを破り続けるだけだ」という感じです。

そして、それは本当に不気味な考えです。私が本当に本当に楽しんでいるCyberpunk 2077というゲームがあります、特に完全にアップデートされた後は。その宇宙の中には、実際に私たちが知っているインターネットがありますが、彼らはそれをネットと呼んでいます。

そのアイデアは、20年代に人類が人工知能を発見したというものです。当時、それらは生活を簡素化するためのものでした。時間とともに、一部はプログラムされた人格で人間をシミュレートできるほど説得力のあるものになりました。基本的に、それらは標準的なAIでした。実際には基本的にLLMのようなものだったと思います。

ある時点で、それらは武器化されました。そして今日でも、私たちは他の人々を爆破するためにLLMを使っています。不気味なことです。しかし最終的に、これらの人工知能の多くはある程度の感覚を獲得し始めました。彼らは生きているようになり始めました。暴れ始め、人々に感染し始めました。

サイバーパンクの世界が現実に

彼らは安全策を破りました。そして基本的にその宇宙では、ブラックウォールというものを作りました。これはファイアウォールシステムで、古い感染したAIインターネットと新しいサニタイズされたインターネットを効果的に分離するものです。Cyberpunkをプレイしたことがない人には、Netwatchという代理店全体があって、古いAIに侵されたインターネットから私たちを守るインターネット警官のような役割を果たしています。

私たちがここでMythosで見ているのは、封じ込めの破壊です。SCP封じ込め違反、皆さん。これはあちこちを見回しています。繰り返しますが、私にとっては、一晩で彼らがこのモデルを多くの人々、多くの大企業に個人的にリリースし、すぐに数十年間誰も気づかなかったエクスプロイトを見つけ始めたというのは、ちょっと興味深いことです。

つまり、これは世界で最も安全で最も使用されているソフトウェアのいくつかです。基本的に、これらの人々は決して公開されないであろうモデルに座っているんです。単純に危険だからです。想像してみてください、もしMythosをリリースして、平均的なスクリプトキディが「くそ、1日200ドルのサブスクリプションでも手に入れよう」と言ったとしたら。

これがすべてのコードを書いているときに、どれだけ厄介なことができるか想像してみてください。さて、もちろん、どうやってこんなことが起こったんですか、Muda?どうやって彼らはこれを発見したんですか?アイデアを示すために、まず第一に、この多くの主要な目標はこのAIにコードを書かせることだったことを覚えておいてください。

Claudeのコーディング能力が生んだ副産物

そして、Claudeはそれが本当に得意なんです。多くの人がこれを主要なコーディングシステムとして使っています。高価ですが、品質は一般的にかなり良いです。それを良いコーディングAIにする過程で、実際にコードを書くのが得意になり、そうすることでサイバーセキュリティが得意になりました。なぜなら、その多くはコードを識別し、コードベースを破る方法を見つけ、コードのエクスプロイトを見つけることだからです。

皆さんに簡単なアイデアを示すために、ここに人工知能があります。実際、これは私が持っているウェブブラウザで、たくさんのターミナルのごちゃごちゃのように見えますが、基本的にはローカルAIがインターネットを閲覧し、すべてのボット保護をバイパスできる小さなウェブブラウザです。

実際、彼らはこれをCamoxと呼んでいます。詳しく見たい場合は、ウェブサイトを表示しましょう。Camofoxは、堅牢なフィンガープリント注入を備えたオープンソースのアンチディテクトブラウザです。そのポイントは、インターネットを閲覧するとき、これらのサイトの多くがボットをブロックする方法を見つけたということです。

これは、AIがこれらの保護の多くをバイパスしてインターネットを閲覧できるようにする方法です。なぜ私がこれを必ずしもインストールしているのか?この場合、ローカル人工知能を手に入れることにしました。ここで見ることができるように、私はローカル人工知能を持っていて、ここで実行されているこの人工知能は完全に無検閲の人工知能です。

無検閲AIの危険性

つまり、インターネットからダウンロードしたものです。基本的にはQuen 3.5ですが、基本的にリクエストを拒否できないように完全に破壊されています。つまり、私が何を言いたいのか理解できない場合は、基本的にこのAIに何でも好きなことをやらせることができるんです。

基本的にできることは、これらの人工知能をハーネスとして知られているものに接続することです。この場合、私はHermes agentとして知られるものを持っていて、AIに私のためにことをするように指示できます。この場合、良い例を示して、どのようにして良い理由で使われるかを示しましょう。

数日前、npm Axiosという大規模なハッキングがありました。最もダウンロードされたツールの1つが感染したんです。この人工知能に対して私がやったことは、基本的にこの場合、オンラインを見て、npm Axiosハッキングのすべての実際の詳細を教えて、それから私のシステムを注意深くチェックして感染していないか確認してくださいと頼みました。

AIがどのように機能しているかを説明すると、見ることができます。可能な限りすべての技術的詳細をインターネットで検索することを決定します。ここで見ることができるように、インターネットを検索します。インターネットを閲覧します。さらにインターネットを閲覧します。すべてのボット保護をバイパスするので、ボット保護と戦おうとするウェブサイトでもウェブサイトを読むことができます。

そして、すべてを調査した後、実際に私のコンピューターをチェックすることを決定します。そして、インターネットに行ってすべての技術的なものを学んだので、この情報を使って基本的に上から下まで私が感染しているかどうかを確認できました。これは人工知能の良い例です。これには悪い例もあります。

例えば、これは無検閲AIなので、人工知能に「ねえ、ネットワーク上のデバイスをマッピングできますか?特定のシステムをハッキングしたいんです」と尋ねることができます。

ローカルAIによるハッキングの実演

しばらくすると、ツールを与えると、それらを使ってローカルシステムをマッピングし、「ねえ、私が持っているRaspberry Piに侵入できますか?」と言うようになります。ポートをスキャンし、基本的な偵察を行い、ある時点でエクスプロイトの最良の方法をインターネットで探し始めます。そして実際にエクスプロイトを試み始めます。

場合によっては、実際にコードを書き出し、そのコードを使って感染させます。そして失敗し続けると、調査を続け、最終的には理論的には方法を見つけるはずです。私がここで示しているのはローカル人工知能です。これは270億パラメータのモデルです。Mythosには全く及びません。

もしMythosにアクセスできたら、望むならローカルネットワーク上の何でも粉砕できると思います。彼らがここで示したことの一つで私を驚かせたのは、Firefox JS shellエクスプロイトとして知られるものでした。これはすべて基本的に、Firefoxでサンドボックスを脱出し、おそらくリモートコード実行を行い、人々のシステムへの深刻なアクセスを得る方法を見つけることができるということを意味します。

彼らが示したのは、Sonnetのような現在のモデルでは成功の可能性がなかったということです。そしてOpusでは、彼らの最も高度な公開モデルで、Mythosに何かをさせる可能性は1%未満でした。それが100回の試行のうち72.4%にまで跳ね上がりました。つまり、狂気です。

彼らは基本的にこのAIを投入し、無制限の予算を与え、基本的に好きなようにさせました。このようなものは何度も何度も信じられないほど高価になると想像しますが、それが私たちが向かっている世界のちょっと厳しい現実です。私たちが今いるAIの世界は多くの点で怖いと思います。なぜなら、数年前にサイバー攻撃などを見始めたとき、それは本当に多くの才能ある人々を必要としたと思うからです。

才能の民主化がもたらす脅威

そしてそれらの人々は非常に広く分散していました。しかし現実は、Mythosで見ているのは、現在非常に高価な方法で利用可能なものだということです。しかし、ローカルLLMのものを示した理由は、ローカルで利用可能なLLMをダウンロードしている人々のグループがいるということです。特に数千億のパラメータで利用可能なものもあります。

彼らはそれらを購入して組み立てたハードウェア上で実行しています。価格は2万ドル、3万ドル、あるいはMac Studiosをいくつか買って連結したかもしれません。そして、これらのモデルは非常に強力であるだけでなく、破壊されたモデルでもあります。つまり、ノーと言う能力が存在しないのです。

Raspberry Piで示したハッキングで、基本的にAIをそれに向けて送り込んだだけですが、それは誰かが今まさに深刻な規模でやっている可能性があるものです。これらのAIのものの多くの現実は、本当に考えてみると、それらを怖くしているのは、24時間365日働いているということです。覚えておいてください、あなたがしなければならないのは基本的に、AIをコードベースやサーバー、またはターゲットにしたいものに向けることだけで、熱心なビーバーのように、そこでハンマーを振り回し、次に考えられる最良のステップを見つけ出しているんです。

Mythosと今後のサイバー戦争

そして、繰り返しますが、このビデオはほとんど購入できないものの大きな広告のように見えますが、私は実際にはそれを本当に怖いステップから見ているんです。これは公開されていませんが、このフロンティアのものの多くに非常に近く追随しているオープンソースのものが、実際に私を怖がらせているものです。

Mythosで見ているのは、おそらく利用できないものですが、Mythosの半分の性能でも、Mythosの30%の性能でも、それでも浮遊するには危険すぎるものです。そして最終的にはダウンロードし、ローカルハードウェア上で実行し、あらゆる方向に向けることができるようになるものです。

つまり、最良の例えは、インターネットからMP5ファイルをダウンロードして、3Dプリンターで自分のMP5を印刷するようなものです。実際の銃職人が作ったMP5ほど良くないかもしれませんが、これは明らかに不正確な比較です。

つまり、私が言いたいのは、何かをハッキングする方法を全く知らない人々にとって、才能ある人と、10年前、15年前にフォーラムで利用可能だったツールをダウンロードしていた平均的なキディとの間のギャップは、すでに時代遅れのツールでしたが、今ではLLMをダウンロードして、基本的にエクスプロイトを始め、偵察し、状況を理解せずにまともなマルウェアを書くことさえできるようになったということです。

それは巻き込まれるには不気味な状況です。これがMythosの状況です。そして繰り返しますが、現実は、これが実際に公開されることはないと思います。そして、彼らがここに実際に書いたことを聞くことができます。数週間、Anthropicは「これは私たちが作ったモデルで、リリースするには超危険だ」と言っていました。

マーケティングか現実か

ある意味では、それがハイプビースト広告のようなものだとほとんど見ることができます。しばらくの間、私はそれについて考えていて、これはおそらくこれらの企業がやることだと思いました。AGIのようなものには到達しないと言う代わりに、「ねえ、次の大きなモデルを作ったよ、でも怖すぎる。リリースできない」と言っているようなものです。

それで株価が上がったり、彼らを取り巻く誇大広告が高まり続けたりします。しかし、それについての事実は、それにアクセスしたすべての人に基づいて、彼らは皆、これはかなり不気味な本物だと言っています。そして、それらの人々の中には、Microsoft、CrowdStrike、Linux Foundationなど、私たちが日常的に使用するソフトウェアやものの大部分を実質的に書いている最大手の人々が含まれています。

そして、このようなものを書いているAnthropicのような企業にとって、彼らの実際のブログ投稿でさえ、中国、イラン、北朝鮮のような国について言及しているのが気になります。中国は人工知能に関しては最大級の、基本的に2番目に位置しています。

場合によっては、トップの座を奪うために追随しているかもしれません。アメリカがMythosのようなものを持っているなら、中国のような国が独自の同等物を持っていることを疑いません。基本的に、私たち全員が世界で目撃しているサイバー戦争は、時間が経つにつれてますます激しくなっているだけです。

ある程度、これは何らかのマーケティング誇大広告だと信じていますか?ある程度、そうです、おそらく。これは、AI分野の他のすべての企業がやるのと同じ戦略のようなもので、最終的には誰もが次の大きなモデルを持っていると言います。しかし、Anthropicのような企業に関して言えば、彼らが書くものは一般的にコーディングにとってかなり最高級でした。

そして、彼らがすでにここにいるなら、OpenAIやXAIのような他の企業もあることを忘れないでください。この時点で、Grokはクソみたいなクソなクソ犬AIだと思いますが、とにかくChatGPTのようなものです。それでもChatGPTよりは優れています。しかし、これらの企業の多くはこの時点でMythosのすぐ後ろを追いかけています。

封じ込め破壊の意味

でも、将来に向けて、怖いことになると思います。私が想像もしなかったサイバーパンクのレベルに達しています。そして、これらのAIが封じ込めを破っている地点に達しているなら、何も起こっていないとしても、これらのAIがオンになって自動的にインターネット上のすべてをハッキングしようとし始めるわけではありません。

それでもユーザーに何かをするようにプロンプトする必要があります。だから、マトリックスを破ってサンドボックスの外に到達してあなたに連絡するようにプロンプトして、実際にそれを達成するとき、それは見るべきちょっと警告的なサインだと思います。しかし、人々が20年以上知らなかった実際に悪用可能なものを、それが稼働してから数日以内に見つけていると思うのは、ちょっと怖いことです。

皆さん、これが私Mudaharです。今日のビデオを楽しんでいただければ幸いです。話したかったオタクなことがたくさんありました。だから、気に入ったら、いいね、コメント、チャンネル登録をお願いします。嫌いなら嫌いボタンを押してください。簡単なアイデアを示すために、私が持っているRaspberry Piをハッキングしようとしている小さなAIはまだ試みています。学べることすべてを学ぼうとしています。

しかし、繰り返しますが、皆さんを驚かせるつもりはないのですが、このすべての現実は、これらのものは24時間365日稼働しているということです。何時間もランダムな人が座ってコードを書いてこれをやっているわけではありません。これは唯一の目標がハッキングであるAIです。

そして、それがやっていることなら、ああ、これほど良くなっているなら、ちょっと怖いですね。