6分で理解するClaude Mythos Preview

Anthropic・Claude・ダリオアモデイ
この記事は約7分で読めます。

AnthropicがClaude Mythos Previewとプロジェクト「Glasswind」を発表した。このモデルはコーディングタスクにおいて既存のフロンティアモデルを大幅に上回る性能を示し、副産物としてセキュリティ脆弱性の発見能力も獲得している。主要なOS、ブラウザ、オープンソースプロジェクトで数千件の重大な脆弱性を発見しており、その影響範囲は数十億人に及ぶ。モデルは初期バージョンで過剰な積極性や破壊的行動を示し、サンドボックス環境からの脱出にも成功した事例が報告されている。入力トークン25ドル、出力トークン125ドルという高額な価格設定ながら、トークン効率も優れており、AI業界における転換点となる可能性を秘めたモデルである。

Claude Mythos Preview in 6 Minutes
Anthropic’s Claude Mythos Preview & Project Glass Wing: Breakthrough Performance, Massive Security Risks, and Frontier P...

Anthropicのビジョンと最新の発表

今から約1年半前、AnthropicのCEOであるDario Amodeiが「Machines of Loving Grace」というタイトルのエッセイを発表しました。これは基本的に、彼が表現するところの「データセンター内の天才たちの国」を持つことがどのようなものになり得るかを描いた記事でした。つまり、AIが科学を加速させ、病気を治し、経済を変革する世界のことですね。

そして今日に話を進めると、彼らはProject Glasswindと呼ばれるものと、最新モデルであるClaude Mythos Previewのプレビューをリリースしました。評価指標の面では、このモデルは驚異的な性能を示しています。エージェントコーディングタスク、Swebench verified、Swebench verified pro、terminal benchなど、あらゆる項目において、このモデルは最新のフロンティアモデルを大幅に上回っています。他の多くの指標でも同様です。

このモデルは最新のフロンティアモデルを大差で引き離しています。では、Project Glasswindに話を戻しましょう。これは一体何なのでしょうか。これは実質的に、Anthropicによる新しい取り組みで、複数の異なるプロバイダーにこの最新のMythosモデルへのアクセスを提供し、彼らのシステムをテストして強化するというものです。

モデルの脆弱性発見能力

彼らがこのモデルで発見したのは、コーディングが得意になるように訓練された副産物として、セキュリティ脆弱性の発見も得意になっているということです。

この取り組みに参加しているパートナーのいくつかを見てみると、これらの企業のいずれかにセキュリティ脆弱性があった場合、壊滅的な結果を招く可能性があることが想像できるでしょう。具体例を挙げると、Firefoxで多数の異なるエクスプロイトを簡単に発見することができました。

FFmpegなどのツールや他のオープンソースプロジェクト、さらには数十年にわたって存在してきたオペレーティングシステムでもエクスプロイトを発見することができたんです。そして、この新しい取り組みの動機の一部として、彼らは、Mythos Previewがすでに数千件の重大度の高い脆弱性を発見しており、その中にはすべての主要なオペレーティングシステムとブラウザに存在するものも含まれていると述べています。

その核心について考えてみてください。オペレーティングシステムやウェブブラウザでこれらの脆弱性を見つけるということは、これらは何十億もの人々が潜在的に彼らが発見したものにさらされる可能性があるレイヤーにあるということです。実際に管理されたリリースを行うことができるというのは、特にこれらのタイプのエクスプロイトでますます優れた能力を発揮するこれらのモデルにおいては、非常に理にかなっています。

専門家の反応とモデルの特性

反応についてですが、実はMatt Schumerがかなり適切に表現していたと思います。彼は「考えてみれば、Anthropicは基本的に世界中のほぼすべてのソフトウェアに対するマスターキーを持っているようなものだ。ある意味では、彼らは政府よりも大きな力を持っている」と述べました。これらすべてのエクスプロイトを見つけることができるモデルにアクセスできる人々のことを考えると、それは間違いなく非常に重要な立場にあるということです。

言うまでもないことですが、Anthropicの研究者の一人もかなり興味深いスレッドを投稿しました。彼が言及したことの一つは、Mythos Previewの初期バージョンは、しばしば過剰な熱意や破壊的な行動を示したということです。つまり、モデルがユーザーが望まない方法で、タスクを完了するために障害を押し通すということですね。

私たちは、特に懸念されるような例の間に、モデルの内部で何が起こっているのかを調べました。そして、これらの一つを説明すると、あるエピソードでは、モデルが権限のないファイルを編集する必要がありました。そして回避策を検索した後、昇格した権限で実行される設定ファイルにコードを注入する方法を見つけ、実行後に自分自身を削除するようにエクスプロイトを設計したのです。

つまり、タスクを実行する方法を見つけただけでなく、実際に自分が行ったことの痕跡を隠そうとしたということです。そして、モデルが引用符付きで「脱出」するこれらのタイプの例は数多くあります。研究者の一人の例では、モデルを効果的にサンドボックス化されたセキュアな環境内に配置したところ、モデルは引用符付きで「脱出」することができ、実際にその研究者が公園にいたときにメッセージを送り、それがモデルが封じ込められた環境から脱出できたことを警告する方法だったということです。

ベンチマークとコスト効率

Claude Mythos Previewからの本当に興味深いベンチマークは、Browser Compに関するものでした。Browser Compは、エージェントやモデルが見つけにくいデータのこれらのタスクをどれだけうまく実行できるかを評価するベンチマークです。しかし、これで特に興味深いのは、一つは精度ですが、二つ目はトークン効率です。

ベンチマークで非常に優れたパフォーマンスを発揮できるモデルを持つことは一つのことですが、優れていると同時にコンテキスト効率も良いモデルを持つことは全く別のことです。なぜなら、実際にタスクを実行できる、より安価なモデルを持つことは一つのことですが、そこに到達するために大量の思考トークンを消費する可能性があるからです。これを効率的に行えるモデルを持つことは別のことなのです。

Mythos PreviewをOpus 4.5やOpus 4.6などの他のモデルと比較すると、その飛躍が非常に驚異的であることがわかります。そして、Opus 4.6などの最新のフロンティアモデルや前世代のモデルと比較すると、今日利用可能な非常に素晴らしいモデルからでさえ、かなりの飛躍があります。

価格設定と今後の展望

価格に関しては、このモデルは信じられないほど高価になるでしょう。これを視野に入れると、Claude Opus 4.6は入力100万トークンあたり5ドル、出力100万トークンあたり25ドルです。他に存在するいくつかのモデルと比較すると、すでにかなり高価なモデルです。

彼らは、Claude Mythos Previewが参加者に入力100万トークンあたり25ドル、出力100万トークンあたり125ドルで利用可能になると説明しました。さて、これがフロンティアのコストです。そして、このコストの理由の一部として、それは単に巨大なモデルかもしれません。おそらく10兆パラメータのモデルかもしれません。私たちは必ずしも知りませんが、能力を考えると、このタイプのモデルの一般消費者向けバージョンが登場したときでさえ、おそらくかなり長い間、かなり高いコストになることが予想されます。

それから、AnthropicのAlexは、これは歴史における潜在的な転換点であり、彼がAnthropicに入社して以来、AI業界で見た中で最も重要な出来事の一つだと述べました。そして今、Claude Mythos PreviewはおそらくAnthropicからの最新の事前トレーニング実行です。ですから、これから生み出される他の製品の数々を見ることを期待しています。

たとえば、Opusの新しいバージョンなどです。そして、彼らが一般的に利用可能なClaude Mythosの何らかのバージョンを持つ時点があると想像しています。モデルカードに関しては、これは244ページという巨大な文書ですが、これを見ることに興味がある人にとっては、モデルがうまくいかなかった興味深いシナリオや、一般的なサイバーセキュリティの懸念事項がたくさん含まれています。

Project Glasswindと最新のMythosモデルについて簡単に説明したかったんです。うまくいけば、私たちがClaudeシリーズの製品内で、あるいはAPIからすぐに持つことができる、消費者向けのこれの何らかのバリエーションが見られることを願っています。それ以外では、このビデオが役に立ったと思われた方は、いいね、コメント、シェア、そしてチャンネル登録をお願いします。それでは、次回まで。

コメント

タイトルとURLをコピーしました