Claude Mythos – Anthropicが世界で最も強力なAIをリークした

Anthropic社が開発中とされる最新かつ最強のAIモデル「Claude Mythos」および「Claude Capybara」のリーク情報に関する解説である。流出した内部資料によると、新モデルはプログラミングやサイバーセキュリティ、推論能力において従来のモデルから飛躍的な向上を遂げているとされる。能力の劇的な進化に伴い、サイバー攻撃への悪用などのリスクが高まるため、同社は慎重なテストと対策を進めていることが窺える。また、高い計算コストへの懸念や、マーケティング目的の意図的なリークである可能性、そしてこれら強力な社内モデルがAnthropicの迅速な開発スピードを支えている可能性についても考察している。

Claude Mythos - Anthropic Just Leaked The Worlds Most Powerful AI

Claude Mythos and Claude Capybara are two new models from - what do u all think?🌐Subscribe To My Newsletter - your F...

Anthropicの最強AIモデルがリーク
飛躍的な性能向上と新たな時代への突入
サイバーセキュリティの懸念と計算コストの課題
意図的なリークの可能性とAnthropicの真意
脅威となるサイバー攻撃の現実
もう一つのモデル「Capybara」の存在
驚異的な開発スピードの裏側

Anthropicの最強AIモデルがリーク

Anthropicが彼らにとって最も強力なAIモデルをリリースする予定なのですが、文字通りそれがリークされてしまったんです。ですので、これについて話していきましょう。この話全体がかなりクレイジーなのですが、完全に削除される前にその記事を見つけることができました。これはM1 Astraからの情報です。この方は初期のAIニュースを見つけてくることで有名なリーカーのような存在でして、Anthropicが実際にオフラインにする前の状態を基本的に示すウェブサイト全体をまとめ上げています。

ウェブサイトはClaude Mythosという名前から始まっており、新しいAIモデルのトレーニングを完了したと書かれています。Claude Mythosとありますね。これは彼らがこれまでに開発した中で間違いなく最も強力なAIモデルです。そしてここで彼らが基本的に言っているのは、Mythosというのはこれまでで最も強力であったOpusモデルよりもさらに大きく、よりインテリジェントな新しい階層のモデルの新しい名前だということです。

知識とアイデアを結びつける深い結合組織を喚起させるために、この名前を選んだそうです。ですから、ここにあるのが次の反復モデルであることはかなり明白だと思います。そしてもちろん、後でお話しするClaude Capybaraという別の名前もあります。しかし、これが現在彼らが開発しテストしている中で最もインテリジェントで最も野心的な階層のモデルになることは明らかです。

飛躍的な性能向上と新たな時代への突入

さて、ここを見ると、彼らの以前の最高モデルであるOpus 4.6と比較して、Mythosはソフトウェアのコーディング、学術的な推論、そしてサイバーセキュリティなどのテストで劇的に高いスコアを獲得していると書かれています。ここで本当に興味深いのは、ソフトウェアコーディングと学術的推論についてですが、正直なところ、現在行われているソフトウェアコーディングの量を見ていると、その能力はこれ以上良くならないのではないかと感じるくらいですよね。

しかし、どうやらテストスコアが劇的に高くなっているようで、これは本当に興味深いです。というのも、AIのリリースがあるとき、多くの場合Opus 4.5から4.6へのような小さな段階的なジャンプを目にするものですが、コーディング、推論、サイバーセキュリティのような分野で劇的に高いスコアだと言っているので、これは能力の面でステップチェンジ、つまり飛躍的な変化になる可能性が高いと思います。

これがなぜ重要なのかを理解していただく必要があると思います。GPT-3.5からGPT-4に移行したとき、それがAIにおいて実際に何を意味するのか、その軌跡を皆さんは理解したはずです。そして今、もし私たちがすでにOpus 4.6の段階にいて、それがリリースされたのはそう昔のことではなく、おそらく3ヶ月くらい前のことだったと思います。

もし彼らが、ただの少しの向上ではなく、劇的に高い向上を果たしたモデルについて話しているのだとしたら、それはAIモデルの新たな時代を告げるものになるでしょう。そしてここでわかるように、この段階的な飛躍、このステップチェンジのせいで、当然のことながら特定のリスクを伴うため、彼らは特別な注意を払って行動しています。

サイバーセキュリティの懸念と計算コストの課題

ここを見ると、彼らがこの件に関して本当に慎重に進めたいと言っているのがわかります。なぜなら、彼ら自身がテストで学んだことを超えて、このモデルのリリースが何か劇的な事態を招く結果にならないように確実にしたいからです。そしてこれこそが、まったく異なる次元のAIモデルへと移行する際に私たちが直面することになるものだと思います。

時間をかけてより多くをリリースするにつれて絶えず良くなり続けるAIシステムがある場合、それらのモデルを世に出すまでの時間を長くしなければなりません。なぜなら、オフィスや自分の部屋にいて、モデルに自分の思い通りのことをさせる方法を開発しようとする人が必ずどこかにいると想定できるからです。

そしてもちろん、彼らが話している主要なリスクの1つがサイバーセキュリティです。どうやらこのモデルはコーディングが非常に得意で、サイバーセキュリティの分野ではこれが大規模な破壊的影響をもたらすと彼らは信じているようです。ですから、彼らはその結果を共有し、サイバー防衛の担当者たちを巻き込む必要があります。

彼らは実際にそれらの人々が準備するのを手助けする必要があるんです。また、モデルをテストしている人々のグループと一緒に、どこまでモデルを追い込むことができるのか、そしてAnthropic自身がテストできる範囲を超えた本当のリスクは何なのかを確認できる必要もあります。そして、Mythosが計算を大量に消費する大規模なモデルであるという事実についても話しています。

そのため、このモデルは彼らがサービスを提供する上で実際には非常にコストがかかりますし、顧客が使用するのにも非常に高価になるでしょう。そこで、リリース前にモデルをより効率的にするための作業を進めているとのことです。さて、私はこれがここまでのAIにおいて最も興味深いことの1つだと思います。なぜなら、誰もがAIはどんどん安くなっていき、知性が高まるにつれてその知性への対価はどんどん安くなっていくと言っていたのを覚えているからです。

しかし、モデルがどんどん良くなり、モデルの能力が向上し始めると、確かに知能とIQの向上は得られていますが、それに伴って価格も実際には上がっているように見えます。そして、モデルが向上するたびに、ますます高価になっていくように思えます。

ですから、これらの企業が今やっていることは、もちろんモデルの能力を高めようとしているのだと思います。そしておそらく、これらのモデルが非常に計算集約的になるのであれば、能力面でその飛躍的な変化を実際に得るためには、当然より多くの計算が必要になり、それが結果として消費者に転嫁されることになるように見えます。

現状におけるAIの最先端のものの多くは、依然として非常に計算集約的です。そして多くの場合、これらの一部AI企業は、これらのAIモデルで実際に利益を上げているわけではありません。彼らは、一般公開前にモデルをより効率的にする方法に取り組んでいると言っています。それはもしかすると能力を抑えることかもしれませんし、より効率的にする別の方法を見つけ、それらの能力をより小さなモデルに抽出することかもしれません。なぜなら、それが彼らが以前にやったことだからです。これこそまさにGoogleがGeminiのモデルでやったことと同じですね。

ですから、彼らがこのモデルをどのようにリリースするのか、価格設定はどうなるのか、そしてもちろん機能はどうなるのかを見るのは非常に興味深いです。なぜなら、これが一般大衆がお金を払いたいと思うような価格帯になるのだろうかと疑問に思うからです。

しかし、Anthropicという会社は、月額10ドルから20ドル程度の層の顧客基盤をあまり持っていないことを思い出してください。Anthropicの顧客のほとんどは月に少なくとも100ドル以上を使っています。なぜなら彼らはAIを使ってより多くのことを成し遂げるような人々だからです。いわゆるビルダータイプと言えるでしょうね。

意図的なリークの可能性とAnthropicの真意

そして、この話全体の中で最もクレイジーなことの1つをご存知でしょうか。Fortuneに提供された声明の中で、Anthropicはコンテンツ管理システムの構成における人為的ミスによって、ブログのドラフト記事がアクセス可能になってしまったことを認めたんです。保護されておらず一般に検索可能なデータストアに残されていた未公開の資料は、公開が検討されていたコンテンツの初期の草稿であると説明しています。

さて、私はこれが意図的にリークされたのではないかと疑っています。というのも、Redditのコメントを見たのですが、そこで基本的に言われていたのは、世界で最も強力なモデルの1つ、いや実際には世界で最も強力なモデルをリリースしようとしていて、サイバーセキュリティに関して超安全である必要があると話しているのに、そのモデルに関する情報がリークされてしまうなんてどういうことだ、という内容でした。

すべてにおいて本当に安全である必要があると言おうとしている企業にとって、それは全く説得力のある話ではありませんよね。ですから、マーケティング活動を盛り上げるために、彼らはこれを意図的にリークしたのではないかと私は主張したいと思います。そして正直なところ、それがうまくいっているようにも見えます。Fortuneによると、データキャッシュには、同社のニュースサイトやリサーチサイトで以前に公開されたことがないにもかかわらず、一般にアクセス可能であったAnthropicのブログ投稿にリンクされたアセットが合計で3,000近くあるように見受けられたとのことです。

ですので、これらすべてのリークが本当なのかどうか疑問に思っているのなら、それは事実です。なぜなら、彼らは新しいモデルをトレーニングし、テストしていることを認めているからです。彼らは「我々は推論、コーディング、そしてサイバーセキュリティにおいて有意義な進歩を遂げた汎用モデルを開発している」と述べています。そしてこれらの能力の強さを考慮し、そのリリース方法については慎重になっているとのことです。

また、業界全体の標準的な慣行として、少人数の早期アクセス顧客のグループと協力してモデルをテストしているそうです。先ほども言いましたが、彼らはこのモデルを段階的な飛躍であり、これまで構築した中で最も有能なモデルであると考えていると述べています。ですから、彼らがここでどのような飛躍を見せるのかを見るのは本当に興味深いものになるでしょう。この新しいClaudeモデルはモデルの新しいシリーズになるわけですからね。

どれほど印象的なものになるのか、本当に気になります。そしてここを見ると、彼らが主にサイバーセキュリティの能力を心配していることがわかります。というのも、現在、サイバーセキュリティの能力において他のどのAIモデルよりもはるかに進んでいるからです。これのクレイジーなところは、コーディングやソフトウェアなどに関する限り、Anthropicのモデルが現在世界で最高だということです。

脅威となるサイバー攻撃の現実

ですから、彼らがどれだけの予防策を講じるのかを見るのは本当に興味深いです。もし私たちが現在のモデルについて考えるなら、文字通り中国の個人がこれを使用して実際に何らかのサイバー攻撃を行ったという事実について話している部分をこれからお見せします。

これは理論上の話ではありません。すでに実際に起こったことなんです。ここを見ると、AnthropicはOpus 4.6でも同様のリスクを乗り越えてきたと書かれています。このモデルは、運用中のコードベースにあるこれまで知られていなかった脆弱性を表面化させる能力を示しました。ここを見ると、中国政府に関連するハッカーグループが現実世界のサイバー攻撃でClaudeを悪用しようと試みたことを同社が報告していると書かれています。

そして文書化されたあるケースでは、Anthropicは中国の国家支援グループがすでにClaudeのコードを使用して、テクノロジー企業や金融機関を含む約30の組織に侵入する組織的なキャンペーンを実行していたことを発見しました。これはすべて、これらの企業がそれを検出する前のことでした。ですから、これはもう理論ではないことを理解しなければなりません。

これはすでにOpus 4.6で発生していることなんです。ですので、もしモデルが世に出て、Anthropicが、誰かがモデルをジェイルブレイクできないと100%保証することはできないと基本的に言っているのだとしたら、これを一般向けにリリースすることを考える前に、深刻で重大な保護対策が実施されていることを確実にする必要があります。

そして、この記事では、準備フレームワークの下でのサイバーセキュリティに関して、GPT-5.3 Codexもその閾値を越えたという事実について言及していることもわかります。ですから、今まさにこれらのサイバー防衛担当者やこれらの組織がモデルをテストしているようです。彼らはそれがどれほどの能力を持っているのか、自分たちのシステムに何ができるのか、そしてこれに備えることができるのかを確認しているところでしょう。

もう一つのモデル「Capybara」の存在

そして推測するに、彼らはこのモデルをより安価にしなければならないという事実と共に、おそらく能力をより小さなモデルに抽出することになるでしょう。そしてもちろん、そこで登場するのがCapybaraモデルです。今は実際のウェブサイトはお見せしませんが。そして、これが削除される前に存在していたウェブページです。

これには文字通りすべての情報が収められているのがわかります。もちろんリンクは説明欄に貼っておきますが、この記事で取り上げた内容がほぼすべて網羅されています。ただ皆さんに理解していただきたいのは、ここの部分をクリックすると、Claude Capybaraとも書かれているのがわかるということです。これはおそらく、Opus 4.6とClaude Sonnetがあるように、Claude Mythosの下に位置するモデルになるでしょう。

ですから、モデルのリリース方法のOpusとSonnetのような形の下にあるのが、Claude Capybaraになるのだと思います。Capybaraを見てみると、これはかなり似たモデルになると思います。もしかしたらこの名前が定着するかもしれませんし、しないかもしれません。

もちろん、これはまだリーク情報です。まだ非常に初期の段階です。しかし、左右を切り替えてみても、実際の名前以外は何も情報が変わっていないことがわかります。ですので、Mythosがおそらく最もインテリジェントなモデルの名前であり、Capybaraはモデルのセットレベルのようなものだと思います。現在CapybaraとMythosという名前が飛び交っているので、念のためお知らせしておきます。

イーロン・マスクは実際にこのニュースを見て、これは深刻に憂慮すべきことだと言っています。彼らがこれについてもっと詳しく話すときには、非常に非常に興味深いことになるでしょう。

驚異的な開発スピードの裏側

そして今、多くの人が推測していることの1つが、Anthropicはいったいどうやってこれらすべてを出荷しているのかということです。2月から3月にかけて、Anthropicは実際に影響力があり、エコシステムを良い方向へと純粋に変えたClaudeへの約30もの異なるアップデートをリリースしたことがわかります。

そして私は、これらすべてを動かすために社内モデルのMythosを実際に使用したのではないかと思っています。多くの人が、これらのモデルは実際に自分自身を改善し、そしてもちろん実際に役立つ本物の製品を作ることができるほど十分に優れている段階にあると言っています。そして、Claudeチームが52日間で出荷したすべてのものをここで文字通り見ることができます。

右上のほうを見ると、Claude AIと実際に書かれています。そしてClaudeは実際に多くの異なるGitHubリポジトリに定期的に貢献しています。ですから、これがClaudeがリリースし続けているすべてのアップデートを動かしている社内モデルなのかどうかを見るのは興味深いですね。ついていくのが非常に大変なくらいです。というわけで、また別の動画でお会いしましょう。