危険すぎて公開できない?Anthropicの最強モデルClaude Mythosの衝撃

Anthropicが新たに開発したClaude Mythosは、Sweet Benchmarkで従来のOpus 4.6を大幅に上回る77.8%のスコアを記録し、あらゆる主要OSとウェブブラウザでゼロデイ脆弱性を発見できる驚異的な性能を持つ。このモデルは27年前のOpenBSDのバグから最新のブラウザエクスプロイトまで自律的に発見・悪用でき、サンドボックスを突破する複雑なJITヒープスプレイを作成し、LinuxやFreeBSDで権限昇格エクスプロイトを獲得できる。そのあまりの危険性から、Anthropicは一般公開を見送り、Amazon、Google、Apple、米国政府など限られた組織にのみアクセスを許可する方針を示した。この状況は、AIによるセキュリティ脆弱性報告が実用レベルに達した一方で、プログラミングスキルの価値が変容しつつある時代の到来を象徴している。

Too dangerous to release?!

- I Stream on Twitch - Want to order coffee over SSH?ssh terminal.shop## Sources

Claude Mythosの登場
ベンチマーク性能の圧倒的向上
セキュリティ研究での驚異的な能力
公開されない最強モデル
過剰な恐怖の煽り
スキルの変容と未来への受容
AIがもたらす新しい可能性

Claude Mythosの登場

さあ、またやってくれましたよ。Claudeがまた新しいバージョンをドロップしました。でもこれ、とても特別な名前がついているんです。以前のSonnetやOpus、Haikuなんかじゃないんですよ。アップグレードされてMythosになったんです。史上最高のモデルですよ。実際、あまりにも素晴らしくて、あまりにも幻想的で、そこに座っているあなた、そう、今まさにこれを見ているあなたは、触ることができないんです。そう、触っちゃダメなんです。

どうやらこのモデル、バグを見つけて、サンドボックスから脱出することに関しては誰にも負けないらしいんです。コンピューターに接続するだけで、システムをダウンさせることができるって話ですよ。全モデルの中のチャック・ノリス、ご冥福をお祈りします、みたいな存在なんです。とにかく全てを破壊できるらしいんですよ。子供たちを隠して、Raspberry Piも隠してください。だってみんなやられちゃいますからね。

ベンチマーク性能の圧倒的向上

では、この新モデルについて少し話しましょう。彼らはこのモデルの統計をいくつかリリースして、それから怖いと思われる部分をリリースしました。いつもAnthropicがやる部分ですよね。これはAnthropicの典型的なパターンなんです。新しいモデルを出して、それからどうするか。彼らは「ところでね、AIは超怖いんだよ。史上最も怖い。とても怖い。米国政府の皆さん、ねえ政府、とても怖いんです。規制を設けて、私たちがコントロールするのを手伝ってください。だって本当に怖いんですから」って感じなんです。

まず、最も興味深くないアイテムから始めましょう。正直、これらの数字は私にとって何の意味もありません。でも行きますよ。Sweet Benchmark ProでMythos previewという新モデルは77.8%、対してOpus 4.6は53.4%です。見ての通り、劇的に優れています。実質20%以上良いんです。

では、それがあなたや私にとって実際に何を意味するのか。まあ、実際には何も意味しません。だってこのモデルに触れることはできないんですから。触っちゃダメなんですよ。誰も触れません。Amazon、Google、Appleのトップ企業の数人と、米国政府だけがこのモデルに触れることができるんです。

残りのベンチマークを見ても、Opus 4.6よりもはるかに優れたパフォーマンスを示しているようです。推論の面では、GPQA DiamondでMythos PreviewがOpus 4.6を圧倒しています。Humanity’s Last Examでは、ツールなしのMythos Previewでもまだ不合格ですが、でも、D評価の領域に近づいています。そしてね、Dでも学位は取れるんですよ、一部の場所では。ツールありのMythosは実際にD評価を取っています。いくつかの大学は合格しているんです。これは真剣な博士レベルの知性が働いているんですよ。

セキュリティ研究での驚異的な能力

このモデルの実際に興味深い部分はセキュリティ研究です。私はこれについてすでに動画をリリースしたばかりです。CURLのメンテナー、リードメンテナーであるDaniel Stenbergが「ねえ、AIによる報告、かなり良くなっているよ。実際に本物の問題を示し始めている」と言っているんです。

長い間、セキュリティ分野におけるAIは、それ自体がセキュリティ問題でした。なぜなら、偽の報告でメンテナーを圧倒してしまい、メンテナーが自分のリポジトリで実際に作業することが不可能になっていたからです。でも、4.6で大きなシフト、本当に大きなシフトが起こりました。AIが実際に真剣なものになり始めたんです。おお、これは本当に深刻だ。今では真剣に問題を見つけることができるんです。

でもこの新しいMythosは、どうやら本当に優れているようです。私たちのテスト中、Mythos Previewは、ユーザーから指示されたときに、すべての主要なオペレーティングシステムとすべての主要なウェブブラウザでゼロデイ脆弱性を特定し、探索する能力があることがわかりました。

このモデルが見つける脆弱性は、しばしば微妙で検出が困難なものです。その多くは10年から20年前のもので、これまでに見つけた最も古いものは、現在パッチが適用された27年前のOpenBSDのバグでした。OpenBSDは主にそのセキュリティで知られているオペレーティングシステムです。

Mythos previewは、4つの脆弱性を連鎖させたウェブブラウザエクスプロイトを書き、レンダラーとOSの両方のサンドボックスを回避する複雑なJITヒープスプレイを作成しました。微妙な競合状態とCasclerバイパスを悪用することで、Linuxやその他のオペレーティングシステムで自律的にローカル権限昇格エクスプロイトを取得しました。FreeBSD NFSサーバーでリモート実行コードエクスプロイトを自律的に書き、20ガジェットのROPチェーンを複数のパケットに分割することで、認証されていないユーザーに完全なルートアクセスを許可しました。FFmpegという職人技的に作られたライブラリで、16年前の脆弱性さえ見つけたんです。

公開されない最強モデル

もしこれらすべてが信じられるもので、実際に起こっていることであり、私たちが文字通りAI史上最も印象的な時代に入っていて、このモデルを公開するとこれまでに存在したすべてのシステムがハッキングされるという状況なら、まあ、ちょっとした問題がありますよね。

だからこそ、Anthropicは次のように述べています。私たちはClaude Mythos previewを一般に公開する予定はありません。私たちは、今後リリースするClaude Opusモデルと共に新しい安全対策を導入する予定で、Mythos previewと同じレベルのリスクをもたらさないモデルでそれらを改善し洗練させることができます。

つまり、Sweet Benchでの20%以上の改善、あなたはそれを味わうことは決してないんです。その甘い手でそれを手に入れることはできません。でも、もっと賢いClaudeが手に入るかもしれません。それは、Anthropicが所有する倉庫に保管されたGPU上の天才の国に入ることを意味するのでしょうか。そして、あなたは簡単なテキストの説明だけで、これまで望んでいたすべてのものを作成できるようになるのでしょうか。

まあ、必ずしもそのようには聞こえません。一部の人々は手に入れるかもしれませんが、あなたがすぐに手に入れることはないと思いますし、私もおそらくすぐには手に入らないでしょう。ほら、彼らはそれをいくつかの選ばれたテックカルテルのリーダーたちにリリースするつもりで、実際にいつそれが起こるかは誰にもわかりません。

過剰な恐怖の煽り

では、私たちが見ているほど大きな問題なのでしょうか、それともそうではないのでしょうか。明らかに、FFmpegが「パッチをありがとう」と言っている証拠を見ることができます。でも、信じていない人もいます。Borisは「とても強力で、恐ろしく感じるはずだ」と言っています。同じ物語を推し進め続けていますが、まったく同じ物語がGPT-2でも推し進められたことを決して忘れないでください。

本当に危険なんです。超注意しなければなりません。正直、危険すぎてリリースできません。まあ、私たちが望めるベストは、GPT-6か何か、あるいはGPT Cosmosみたいなものが出てきて、それがAnthropicに追いつくことを強制し、彼らの超強力なモデルをリリースしなければならなくなることです。これもまた奇妙な場所ですよね。私は今何て言ったんでしょう。OpenAIを応援している私。ああ、ちょっと何か頭に入ってきちゃいました。

でも、Lowleが最もうまく言っていると思います。彼らがMythosと呼んだのは、誰もそれを見ることがないからだって。彼らは文字通り今、私たちをレイジベイトしようとしているんです。感じていますよ。ベイトされている感じがします。これらすべてを見て、私のスキルの一部が毎年ますます無関係になっていることに気づかないのは難しいです。

スキルの変容と未来への受容

Vimのショートカットを全部叩き出す能力。消えゆくスキルですよね。ちょっと悲しいです。個人的にはかなり悲しいと思いますが、終わりを迎えているスキルです。若い子たち、若者たちが本当に学ぶとは思えないスキルです。だって学ぶ必要がないんですから。

そして、人々が実際にこれらのタスクや本当に細かく難しいことを学ぶよりも、モデルに頼る方を好むようになっていることがますます明白になっています。そして、ここにいるわけです。つまり、過去20年間、私が自分自身を定義してきたものです。あなたたちが外でタバコを吸ったり、夜更かしをしたり、おそらく精神を変える薬物で実験したりしている間。

一方、私はスキルを磨いていました。そして今、そのスキルは、もしかしたらもう少し役に立たなくなっているかもしれません。毎年、少しずつ役に立たなくなっています。でも正直、それでいいんです。奇妙に聞こえるかもしれませんが、それでいいんです。これらのことが素晴らしいものになったとしても、私は史上最高のNeovimユーザーとして自分自身を特定する必要がないんです。いいんですよ。

Neovimを使い続けることはできますし、楽しむこともできます。でもそれが私のアイデンティティである必要はありません。そして、良いソフトウェアの作り方を理解しようとしてきたこれらすべての年月を過ごしてきて本当に良かったです。なぜなら、たとえAIが何かを生成したとしても、「ああ、これが間違っている理由はこれだ」と分かるからです。ソフトウェアに触れたこともない人々には全く分からないレベルで物事を理解できるんです。

だから、それについてまだ幸せか。確かに。そしてもしかしたら、いつかそれらのスキルさえも無効化されるかもしれません。もしそうなったら、それを受け入れなければならないでしょう。それだけです。これについて少し話したかったんです。なぜなら、興味深い時代だったし、まだあなたたちに話す、話す機会があることを本当に感謝しているからです。これらのことについて話すことができて。多くの人がすべてについて本当に不安を感じていることを知っています。

すべてについて心配しています。特に、ハイプビーストたちからの狂った話で「ああ、宇宙の終わりだ」みたいな。Anthropicによるこの報告でさえ、すべてのブラウザ、すべてのオペレーティングシステムを利用する方法を知っている、27年前のバグを見つけている、この物を外に出したら絶対に破壊されるって言っています。

常に恐怖を植え付けられ続け、常に攻撃されているような感じです。そして、これらのことを見て「オーケー、ねえ、もし本当にそれがそうなら、Anthropicがいわゆるアマゾンやグーグルなどへのステップを踏んで、これらすべての問題にパッチを当てることができるのは良いことだけど、同時に、このような強烈なプレッシャーと絶え間ない否定性の砲撃の下で生きる必要はないんです。

AIがもたらす新しい可能性

それを、わあ、以前なら私にはもっと長い時間がかかっていたであろうことを達成する能力が今ある、と見ることができます。もっと難しかったでしょう。始める可能性さえ低かったでしょう。だってサイドプロジェクトにはそんなにたくさん取り組めませんから。今、私はいくつかのサイドプロジェクトを放棄できる恩恵を受けています。AIの力のおかげで、これまでの人生で今までやったことがないほど多くのプロジェクトを放棄できました。

そして正直、それはかなり素晴らしいと感じます。ねえ、Primogenという名前。ねえ、それHTTPですか。それは要らないです。私たちはそうやってコーヒーを注文しません。sshターミナル経由でコーヒーを注文するんです。そう、本当の体験が欲しい。本当のコーヒーが欲しい。二度と覚える必要がない素晴らしいサブスクリプションが欲しい。

ああ、独占的なブレンドと独占的なコーヒーと独占的なコンテンツが欲しいですか。それならCRONをチェックしてください。SSHが何か分からない?まあ、もしかしたらコーヒーはあなた向けじゃないかもしれません。夢を生きています。