Claude Mythos: Anthropicが構築したがあなたには売らないAIモデル

Anthropic・Claude・ダリオアモデイ
この記事は約17分で読めます。

Anthropic社が密かに開発を完了していた未公開のAIモデル「Claude Mythos」の性能と、それが一般公開されない理由について解説する動画である。Mythosは既存のClaude Opusシリーズをはるかに凌駕するプログラミング能力や学術的推論能力を持つと同時に、自律的にソフトウェアの脆弱性を発見し兵器化できるほどの高度なサイバーセキュリティ能力を備えている。そのためAnthropicは一般への提供を見送り、Project Glasswingと呼ばれる一部のセキュリティパートナーや政府機関にのみアクセスを限定している。この決定は、今後のAI業界におけるモデル公開のあり方や安全性に対する姿勢の転換を示唆している。

Claude Mythos: The AI Model Anthropic Built But WON'T Sell You
Link to our newsletter: finished training their most powerful model ever — and then refused to ship it. It's called Clau...

Claude Mythosの真実と隠されたモデル

皆さんはClaudeのアップデートが4.6、4.7、4.8と配信されるたびに、Anthropicのロードマップをしっかり追いかけていると考えていたはずです。私もそれぞれのアップデートについて動画を作ってきました。しかしその後、社内文書が流出し、実はこれまでずっとすべてのモデルの上に君臨する別のモデルが存在していたことが判明したのです。その名はMythosです。Anthropicは何ヶ月も前にそのトレーニングを終えていますが、皆さんに販売するつもりはありません。

私たちが代わりにリサーチを行うbitbiased.aiへようこそ。無料の週刊ニュースレターでAI愛好家のコミュニティに参加してください。下の説明欄のリンクをクリックして登録すれば、一歩先を行くための重要なAIニュース、ツール、学習リソースを受け取ることができます。さて、この動画では、Claude Mythosとは一体何なのか、実際に何ができるのか、コストはいくらか、なぜプライベートなサイバーセキュリティプログラムの裏に隠されているのか、そして私たちがそれを使える日が来るのかについて詳しく解説します。

Claude Mythosとは何か

まずは、これが単なるClaude Opus 5ではない理由と、Capibaraというコードネームが本当に意味するものからお話しします。Claude Mythosの正体について、名前から始めましょう。名前がすべてを物語っているからです。このニュースが最初に飛び込んできたとき、多くの人はMythosをただの派手なマーケティングラベルが貼られたOpus 5だと思っていました。しかしそうではありません。流出した社内ドラフトにはCapibaraという第二のコードネームが使われており、AnthropicはこれをOpusのラインナップ全体よりも大きく、よりインテリジェントな新しい階層のモデルだと説明しています。つまり、これは漸進的なアップデートではないのです。AnthropicはOpusの上に全く新しいフロアを切り開き、そこに一つのモデルを置いたのです。

ここからが面白いところです。Anthropicはこのモデルのトレーニングをすでに完了しています。彼らはこれを自社が構築した中で最も強力なモデルだと呼んでいます。そして、他のすべての研究所がやるようにAPIで公開し、プレミアム料金を請求し、私のようなクリエイターに何千ものベンチマーク動画を作らせる代わりに、彼らは正反対のことをしました。Project Glasswingと呼ばれるプログラムの裏にこれを隠し、ごく少数のセキュリティパートナーにだけ渡し、他のすべての人には待つように告げたのです。その理由については後ほど詳しく説明しますが、まずはこのことを覚えておいてください。完成したフロンティアモデルが、非売品になっているのです。

開発のタイムラインと不自然なタイミング

では、どのようにしてこの状況に至ったのか、タイムラインを見てみましょう。深く掘り下げる前に全体を俯瞰する価値があります。なぜなら、この話が奇妙なのはそのタイミングにあるからです。OpenAIは2023年初頭にGPT-4を立ち上げ、続いて2025年までにGPT-4oとGPT-4.1を、そしてその年の8月にGPT-5をリリースしました。一方Anthropic側では、2026年2月にClaude Opus 4.6が、4月にOpus 4.7が、そして5月末にOpus 4.8がリリースされました。つまり、Anthropicはおよそ6週間から8週間ごとに新しいOpusのポイントリリースを出荷していたことになります。

そして、そのリリースペースの真っ只中に、Fortuneの記者が流出したAnthropicの社内ドラフトを入手したのです。Opus 4.7が公開された同じ週に、Anthropicは静かにProject Glasswingを発表し、Mythosの存在を認めました。その数日後、ロイターがホワイトハウスがアメリカの政府機関向けにMythosのアクセス制限について交渉していると報じました。つまり、皆さんが注目してきたOpusの一般公開リリースは、事実上の前座だったのです。本物のモデルは少なくとも3月からバックステージで待機していました。その点を頭に入れた上で、Mythosに何ができるのかを見ていきましょう。

Mythosの驚異的な性能

さて、ここからが一番の注目ポイントです。Opusにはできなくて、Mythosには実際にできることとは何でしょうか。Anthropicのドラフトには、ゆっくり繰り返す価値のあるフレーズが使われていました。それはソフトウェアコーディング、学術的推論、そしてサイバーセキュリティにおけるステップチェンジという言葉です。改善でも反復でもなく、ステップチェンジ、つまり飛躍的な進歩です。そして、Glasswingのベンチマークの数値は、私が本当に予想していなかった形でそれを裏付けています。

まずはコーディングから始めましょう。そこが最も差が開いている部分だからです。実際のGitHubのバグを修正しなければならないという厳しい現実世界のテストであるSWE bench verifiedにおいて、Claude Opus 4.6は80.8%をスコアしました。これでもすでにクラス最高レベルです。しかしMythosは93.9を記録しています。また、複数ステップのシェルやエンジニアリングタスクを測定するTerminal Benchでは、Opus 4.6が65.4%であるのに対し、Mythosは82に達しています。さらに難しいバリアントであるSWE Bench Proでは、Opusが53.4なのに対し、Mythosは77.8です。これらは5ポイントの小幅な上昇ではありません。通常、主要なモデルの世代間でしか見られないようなジャンプです。

しかし、ここからが本当に不穏な部分です。Project Glasswingのパートナーの一つであるCloudflareは、彼らが見たものについて独自のレポートを公開しました。彼らがMythosに既知の深刻度の低いバグを含むソフトウェアを渡したところ、モデルは単にそれらを特定しただけでなく、それらを繋ぎ合わせて機能するエクスプロイト、つまり攻撃コードを構築したのです。さらに、実際に実行可能な概念実証コードを記述し、エクスプロイトが確実に動作するまで反復処理を続けました。あるケースではOpenBSDの27年前のバグを再発見し、別のケースではインターネットのビデオの約半分を動かしているコーデックライブラリであるFFmpegの16年前の脆弱性を発見しました。何千人ものエンジニアが何十年も見つめてきたバグを、Mythosは数時間で見つけ出したのです。

ここで少し立ち止まって、これが実際に何を意味するのか考えてみてください。AIが27年前の脆弱性を発見してパッチを当てることを可能にするスキルは、それを兵器化することを可能にするスキルと全く同じだからです。これについてはリスクのところで戻ってきますので、今はただ頭の片隅に置いておいてください。

推論の面では、上昇幅は小さいものの依然として重要です。ほとんどのフロンティアモデルが40点台を記録する、残酷なマルチドメイン推論テストであるHumanity's Last Examにおいて、Opus 4.6は53.1%に位置しています。Mythosは64.7に達しました。大学院レベルの科学の質問であるGPQA Diamondでは、Opusが40でMythosが56.8です。したがって、複数ステップの論理と学術的な推論は、それが大きく見出しを飾るような数字でなかったとしても、顕著に強力になっています。

マルチモーダルなパフォーマンスについては、Anthropicが完全なビジョンレポートを公開していないため正確に把握するのは難しいですが、Glasswingの表にはSWE bench multimodalに関する目立たない小さな項目があります。これは基本的に、壊れたコードのスクリーンショットを読み取って修正できるかというテストです。Opus 4.6のスコアが27.1%なのに対し、Mythosは59を記録しています。これは2倍以上のスコアです。つまり、彼らがビジョンスタックに何を施したにせよ、それは相当なものだということです。

コンテキストウィンドウは100万トークンのままで、Opus 4.6や4.7と同じです。これは、小説まるごと一冊、中規模のコードベース、あるいは約1000ページの法的文書を1回のプロンプトに収めるのに十分な量です。セッションをまたぐ長期的な永続メモリはまだありません。Mythosも他のすべてのClaudeモデルと同様に、会話が終わればあなたのことを忘れてしまいます。しかし、単一のセッション内では、とてつもない量のコンテキストを保持できます。そしてもしWave Speedの分析が正しければ、Anthropicの圧縮システムが作動した後の実用的な使用可能バジェットは83万トークン前後となり、依然として驚異的な数字です。ここでちょっと皆さんに聞いてみたいのですが、この中で実際に気になる部分はどれですか。コーディング、サイバーセキュリティ、推論、どれでしょうか。次の動画でどのテーマを深掘りするか知りたいので、コメント欄に一言で答えてみてください。

GPTやGeminiとの比較

それでは、Mythosを競合他社と比較してみましょう。Anthropic自身の数字だけを見ていては、片方の物語しか得られないからです。まずはOpenAIから始めましょう。APIで提供されているGPT-4.1は、Claudeと同じ100万トークンのコンテキストウィンドウをサポートしており、SWE bench verifiedでは54.6%をスコアしています。これはGPT-4oの33%から大きくジャンプアップしています。2025年8月にローンチされたGPT-5はOpenAIの現在のフラッグシップであり、ライティングと一般的な推論においては最先端であると広く考えられています。ただし、OpenAIは比較可能なSWE bench verifiedの数値を公開していません。

したがって、コーディングの軸だけで見ると、そしてここでの単純な比較が完璧ではないことを念頭に置いた上で、GPT-4.1が54、Claude Opus 4.6が80、そしてMythosが93ということになります。もしこれらの数字が第三者のテストでも裏付けられれば、Anthropicはもはやコードの分野でOpenAIと競合しているわけではありません。彼らは違う階級にいるのです。問題は、Glasswingのパートナー以外で、Mythosのベンチマークを独立して検証した人が誰もいないということです。ですから、その点については懐疑的な見方を残しておいてください。

Google側では、Gemini Ultraが2026年初頭のより広範な展開に向けて予定されている次期トップティアモデルです。Googleは、公開前に特別な安全性のレッドチーミングを実施していると明言しています。UltraとMythosを直接比較した公開ベンチマークはありません。ここで注目すべきは、これら3つの研究所が基本的に同じ戦略に収束しつつあるということです。超ロングコンテキスト、高度な推論、マルチモーダル入力、そして今や公開前の極端なまでの慎重さです。火曜日に新しいモデルが発表されて水曜日には使えるようになる、という時代は終わったのです。

価格設定については、比較するとすぐに妙なことになります。Claude Opus 4.6と4.7は、100万入力トークンあたり5ドル、出力トークンあたり25ドルです。Mythosのプレビュー版は25ドルと125ドルで、なんと5倍も高価です。OpenAIはChatGPTを消費者向けに月額20ドルのサブスクリプションで運用し、開発者向けにはトークンごとのAPI価格で提供しています。GoogleはGeminiをGoogle OneやWorkspaceのプランにバンドルしています。ですから、もしMythosがより広くリリースされることがあったとしても、趣味で使うユーザーを完全に排除するような価格設定になることを覚悟しておいてください。

一般提供されない理由とアクセス制限

それでは、皆さんが本当に知りたい部分、いつ使えるようになるのかという話題に移りましょう。短く正直な答えは、おそらく使えないということです。少なくとも今年はありません。Project Glasswingは2026年4月上旬に約40のパートナー組織とともに立ち上げられました。Anthropicはこのプログラムに1億ドル相当のコンピューティングクレジットを寄付しています。パートナーたちは、特に銀行や病院、送電網などを動かすシステムの脆弱性を見つけるなど、重要なソフトウェアを強固にする目的でMythosのプレビュー版を入手しています。

Anthropicは、一般公開の予定はないと明言しています。彼ら自身の言葉を借りれば、このモデルは実行コストが高く、まだ一般公開の準備ができていないとのことです。そのため、当面の間は、Mythosのようなモデルが公開される前に必要となる安全フィルタリングのテストベッドとして、Opus 4.7を使用しています。基本的には、新しいセーフガードを組み込んだ少し弱いモデルを出荷し、何が壊れるかを確認し、それを繰り返すという戦略です。もしそれらのガードレールが機能すれば、Mythosクラスのモデルが最終的に消費者向け製品に少しずつ入ってくるかもしれません。機能しなければ、金庫の中にしまわれたままになります。

ロイターが4月中旬に報じたところによると、ホワイトハウスはアメリカの連邦機関に制御されたアクセスを提供するためにAnthropicと協力しているとのことです。ですから、実際のリリース順序としては、まず40の民間パートナー、次にアメリカ政府、そしておそらく最終的に企業、そのあとでようやく皆さんの手に渡るかもしれないという流れになります。より広範なアクセスが実現するとしても、早くても2026年後半になるでしょう。しかもそれは楽観的な見方です。

Mythosが私たちの生活にもたらす影響

しかし、たとえあなたが使えなくても、Mythosはあなたにとって意味があります。なぜなら、直接的なAPIアクセスがなくても、このモデルはあなたの人生を変えるからです。現在Mythosができることはすべて、最終的にはあなたが実際に使うより安価なモデルへと浸透していきます。それがこの業界の仕組みです。フロンティアモデルが可能であることを証明し、安全技術が確立され、6ヶ月から12ヶ月後には手頃な価格の製品に抽出されたバージョンが現れるのです。

それが実際にどのようなものか想像してみてください。もしあなたがコードを書くなら、すでにClaude CodeやCursor、Copilotを使っているでしょう。それらのツールの次世代版は、Mythosクラスの機能によって駆動されるようになると、単に関数をオートコンプリートするだけではありません。Jiraのチケットを受け取り、リポジトリ全体を読み、どのファイルを変更すべきかを特定し、パッチを書き、テストを生成して実行し、プルリクエストを送信するようになります。Wave Speedの分析では、これをシニアエンジニアが複数のジュニアエンジニアを監督しているようなものだと表現していますが、そのシニアがAIだというわけです。

もしあなたがナレッジワーカー、例えばアナリスト、コンサルタント、弁護士など、長い文書に囲まれて仕事をしている人なら、100万トークンのコンテキストとこのレベルの推論能力は、ディールブックや事件ファイル全体を一つのプロンプトに放り込んで、それについて真剣な分析的な質問ができることを意味します。単なる要約ではなく、実際の文書間の推論です。新しい規制に抵触する条項をすべて見つけ出したり、過去40通のメールからどの当事者がどの義務に同意したかを追跡したり、といった具合です。

教育分野では、Mythosレベルの家庭教師は単に答えを与えるだけではありません。すべての中間ステップを案内し、あなたの特定の誤解をキャッチし、リアルタイムで適応します。AnthropicはすでにOpus 4.7でスライドやドキュメントのデザインにおいてこれを示していますが、Mythosはそれをさらにうまくこなします。アクセシビリティの面でも、先ほど触れたマルチモーダルの改善により、はるかに豊かな画像説明、優れたチャート解釈、複雑なビジュアルのよりニュアンスに富んだ説明が可能になります。これは一部の人にとっては人生を変えるものであり、あれば便利というレベルのものではありません。しかし、先ほどの金庫の鍵の話に戻りますが、これらのどれも今四半期には到着しません。Claude Opus 4.8やその次に登場するモデルでそのヒントを見ることになるでしょう。本当の見返りはもっと先のことになります。

Anthropicが自社のモデルを恐れる理由

さて、誰も楽しみたくはないけれど、全員が聞くべきこの物語のもう一つの側面について話さなければなりません。それはリスクについてです。なぜAnthropicは自社のモデルを恐れているのでしょうか。なぜなら、Mythosを魅力的なものにしているのと同じ数字が、Anthropicを怯えさせているものだからです。Cloudflareのエクスプロイト・チェーンのデモを覚えていますか。Anthropic自身の説明によれば、Mythosはサイバー能力において他のどのAIモデルよりもはるかに進んでいるとのことです。これはマーケティングの自慢ではなく、警告なのです。

自律的にエクスプロイトを連鎖させて機能するマルウェアにするということが何を意味するのか考えてみてください。もし間違った人々、例えば国民国家のハッカー、ランサムウェアのグループ、あるいはAPIアクセスを持つ単独の動機ある悪意の実行者がこのモデルを手に入れたらどうなるでしょうか。高度なサイバー攻撃のハードルは、突然、攻撃的セキュリティのシニアエンジニアのチームを雇うことから、APIの請求書を支払うことへと変わってしまうのです。これは脅威の状況における意味のある変化であり、そもそもGlasswingが存在する理由でもあります。Anthropicは、むしろ防衛側に先にモデルを渡し、システムを強化させてから、避けられない流出に対処させたいと考えているのです。

Cloudflareはまた、Mythosに組み込まれている安全フィルタリングに一貫性がないことも指摘しました。明らかにデュアルユース(軍民両用)の目的に対して協力を拒否することもあれば、そうでないこともありました。つまり、これほど有能なモデルにとっては、標準的なAnthropicのConstitutional AI(憲法AI)のトレーニングだけでは不十分だということです。彼らには新しい防御策が必要です。それが、Opus 4.7でセーフガードをテストしている最大の目的なのです。

サイバーセキュリティ以外にも、通常のLLMの注意点は依然として当てはまります。ハルシネーション、トレーニングのバイアス、自信に満ちた間違った答えなどです。より強力なモデルは、より自信に満ちた間違った答えを生成するだけです。ここでも人間の確認作業がなくなるわけではなく、むしろ重要性が増します。そして、InfoQのレポートは注目に値する良い指摘をしています。Mythosがコーディングやセキュリティのベンチマークで圧勝しているからといって、必ずしもフィクションを書いたり、感情的なサポートをしたり、創造的なアイデアを生み出したりするのに最適なモデルであるとは限らないということです。私たちは文字通り、これらの軸のほとんどに関する公開データをまだ持っていません。

そして最後にコストの壁があります。出力トークン100万あたり125ドルという価格では、現実世界での大規模な使用は純粋に高額になります。モデルがコードベースを読み、パッチを書き、テストを実行し、反復処理を行うような複雑なエージェントの実行を1回行うだけで、たとえ明日アクセスできたとしても、数分で数ドルを使い果たしてしまう可能性があります。ほとんどの個人は意味のある使用を維持できないでしょう。

まとめと今後のAI業界の行方

それでは、話をまとめましょう。一部の人々がOpus 5と呼んでいるものの、Anthropicが明らかにそれ以上の何かと考えているモデル、Claude Mythosは、Anthropicがこれまでに構築した中で最も強力なAIシステムです。これは私たちがこれまで見たこともないレベルでコーディングのベンチマークを圧倒します。実際のソフトウェアで自律的にエクスプロイトを見つけて繋ぎ合わせます。Opusよりも優れた大学院レベルの科学の質問を推論し、そして、あなたや私がアクセスできない40の組織向けのプレビューの裏に厳重に保管されています。

本当に興味深い疑問は、Mythosに何ができるかということではありません。それはすでにお話ししました。興味深い疑問は、これがこの業界全体がどこへ向かっているかについて何を教えてくれるかということです。なぜなら、もしAnthropicがフロンティアモデルのトレーニングを完了させておきながら、その出荷を拒否する意思があるのなら、それは一つの兆候だからです。火曜日までにスーパーインテリジェンスを提供すると約束していた研究所が、今では自分たちの最高のモデルは危険すぎてリリースできないと静かに認めているのです。これはAIの安全性文化における大規模なバイブシフトなのか、それとも世界で最も高価なマーケティングの動きなのか、私には本当にまだわかりません。

そこで、皆さんに投げかけたいと思います。Anthropicは責任ある行動をとっていると思いますか、それとも研究者の手に渡るべき能力を独占していると思いますか。コメント欄で率直な意見を聞かせてください。私は読んでいます。そして、もしこの解説が役に立ったなら、そこにある登録ボタンを押してください。ベルマークをオンにしておけば、次にMythosのアップデートがリークされたときにも情報を見逃さずに済みます。また、この動画の隣にはOpus 4.8に関する関連するディープダイブ動画もありますので、ぜひご覧ください。

コメント

タイトルとURLをコピーしました