史上最強のAIモデルがリーク…Claude Mythosとは何か

AnthropicのClaude Mythosと呼ばれる新型AIモデルのリーク情報が流出し、AI業界全体が大きな動きを見せている。リークされた文書によると、Claude MythosはOpusモデルを大きく上回る性能を持ち、特にサイバーセキュリティ能力が極めて高いため、Anthropicは慎重なリリース計画を検討しているという。同時期にOpenAIも次世代モデル「Spud」のトレーニングを完了したとの報道があり、Nvidiaのジェンスン・フアンCEOは「今週AGIを達成した」と発言するなど、AI業界は新たな段階に突入しつつある。GoogleやMetaも革新的技術を発表し、ヒューマノイドロボットがホワイトハウスに入場するなど、AIは急速に社会の主流となりつつある。

The World’s Most Powerful AI Model Just Leaked…

Anthropic’s new Claude Mythos model just leaked… and they’re calling it a “step change” in AI.At the same time, OpenAI i...

Claude Mythosのリークが明らかに
リリースに慎重な姿勢を示すAnthropic
OpenAIも大きな動きを見せている
NvidiaのCEOが「AGIを達成した」と発言
Googleの革新的な圧縮技術
Metaの脳予測モデル
ARC AGI 3の発表
ヒューマノイドロボットがホワイトハウスへ
AIが社会の主流になりつつある

Claude Mythosのリークが明らかに

今週、衝撃的なニュースが飛び込んできました。Anthropicが、能力において大きな飛躍を示す新型AIモデルがリークされたことを認めたのです。そのモデルの名前はClaude Mythosと言います。

何らかのデータ流出の際に、このドラフトのブログ投稿が一般に公開されてしまったようです。これは実際には再現されたもので、オリジナルはすぐに削除されましたが、内容は全く同じです。

そこにはこう書かれています。「私たちは新しいAIモデル、Claude Mythosのトレーニングを完了しました。これまでに展開した中で圧倒的に最も強力なAIモデルです」。そして、何を表しているのかよく分からない画像が掲載されていますが、とにかく読み進めていきましょう。これは本当に驚くべき内容です。

文書には次のように書かれています。「Mythosは新しいモデルの階層を表す新しい名前であり、これまで最も強力だったOpusモデルよりも大きく、より知的です。私たちはこの名前を、知識とアイデアを結びつける深い結合組織を想起させるために選びました。私たちの従来の最高モデルであるClaude Opus 4.6と比較して、Mythosはソフトウェアコーディング、学術的推論、サイバーセキュリティなどのテストで劇的に高いスコアを記録しました」。

最初から、これらは驚異的な主張です。圧倒的に最も強力なAIモデル、ベンチマークで劇的に高いスコア、Opusモデルよりも大きく知的。これは本当に能力における大きな飛躍のように聞こえますが、さらに驚くべき内容が続きます。

リリースに慎重な姿勢を示すAnthropic

Anthropicは、Claude Mythosがいかに強力であるか、そしてそれが大規模で計算集約的であるため、リリースする際には特別な注意を払いたいと述べ始めます。つまり、実行するのに非常にコストがかかるということです。

そして、ここに重要な部分があります。「Mythosは現在、サイバー能力において他のどのAIモデルよりもはるかに進んでいますが、防御者の努力をはるかに上回る方法で脆弱性を悪用できるモデルの波が来ることを予兆しています。さらに、だからこそMythosのリリース計画はサイバー防御者に焦点を当てています。私たちは組織に早期アクセスでリリースし、差し迫ったAI駆動型の攻撃の波に対してコードベースの堅牢性を向上させるための有利なスタートを与えます」。

そう、このモデルは基本的にハッキングが非常に得意すぎて、彼らはリリースを恐れているのです。

一方で、私はある程度これを信じています。Anthropicは AIモデルに関して慎重な姿勢を取ることで知られており、害を及ぼす可能性が高いと分かっているものは確実にリリースしないでしょう。大手AI企業はどこもそうだと思います。必ずしも善良な人々だからというわけではなく、AIに対する一般の認識や投資家の認識を良好に保つインセンティブがあるからです。

ハッカーが大規模なサイバー攻撃を実行するために素早く使用できるボットを立ち上げることは、AIに対する人々の認識にとって最良のことではありません。しかし、その一方で、Anthropicはこのような恐怖を煽るプレイブックを使うことでも知られています。彼らはモデルの能力を誇示するために、モデルの力とそれがもたらすリスクを恐れているかのように振る舞うのです。

ただ、これは単なる推測です。右上にあるCapibara V2というタブにも気付いたかもしれません。これも元のドラフトブログ投稿に存在していました。クリックしても実際には何も変わりません。ですから、CapibaraはMythosの別バージョン、おそらく小さいバージョンかもしれません。

OpenAIも大きな動きを見せている

いずれにせよ、明らかに何か大きなことが起こっています。なぜなら、このリークが起こったまさにその時期に、OpenAIが最近行っているいくつかの動きに基づいて、大きな新モデルを準備しているのではないかという憶測が広がり始めているからです。

例えば、彼らはSora、完全にAI生成されたソーシャルメディアプラットフォームを終了したばかりです。どうやら赤字を垂れ流していたようです。ユーザーは興味を失っていました。そしてOpenAIのアプリケーション担当新CEOであるフィジ・シモは、スタッフに対して脇道のクエストに気を取られるのをやめ、代わりにエージェント型AI能力に集中する必要があると伝えたと報じられています。

OpenAIはその後すぐに、ChatGPTのエロティックなアダルトモードの開発を停止すると発表しました。

そして最後に、The Informationからの報告によると、OpenAIはコードネーム「Spud」と呼ばれる次のAIモデルの事前トレーニングを完了したということです。サム・アルトマンは、会社は数週間以内に非常に強力なモデルを持つことになり、それが経済を本当に加速させる可能性があり、物事は彼が予想していたよりも速く進んでいると述べたと報じられています。

そう、主要なAI研究所が何か大きなものを準備していることは明らかです。一部は計算リソースを解放するために奮闘しているほど大きなもので、他の研究所は構築したものをリリースすることさえ躊躇しているほどです。OpenAIはフィジ・シモの製品組織を「AGI展開」と改名しさえしました。これはそれ自体がかなり明確なシグナルです。

NvidiaのCEOが「AGIを達成した」と発言

そして、NvidiaのCEOであるジェンスン・フアンがいます。彼はLex Fridmanのポッドキャストで文字通り「今週AGIを達成した」と言ったのです。これをご覧ください。

「私は今、AGIを達成したと思います」

「このようなAIシステムによって運営される会社を持つことができると思いますか?」

「可能です。その理由はこうです。あなたは10億と言いましたが、永遠にとは言いませんでした。ですから、例えば、Clawがウェブサービスや面白い小さなアプリを作成し、突然数十億人が50セントで使用し、その後すぐにまたビジネスから撤退するということは、まったくあり得ないことではありません。インターネット時代には、そのようなタイプの会社をたくさん見てきました」

そう、私の解釈は間違っていますか?それとも、彼は基本的にOpenClawがすでにAGIだと言っているのでしょうか?なぜなら、彼らが使っていた定義は、独自に10億ドルのビジネスを構築できるエージェントだったからです。ジェンスンによれば、このようなシステムは理論的には既に今それができる可能性があるということです。

ですから、もしOpenAIが、OpenClawの作成者であるピーター・スタインバーガーを最近雇用したわけですが、これのより強力で、より信頼性が高く、より安全なバージョンをリリースしたら、OpenAI自身を含む一部の人々はそれをAGIと考えるかもしれません。だからこそ、彼らはすでにそれをAGI展開と呼んでいるのかもしれません。

ですから、私たちがすでにAGIを達成したというジェンスンの意見に同意するかどうかに関わらず、エージェントは少なくともAGI達成に向けた大きなステップであり、私たちは間もなく驚くほど強力なものがオンラインになるのを目にすることになると思います。

Googleの革新的な圧縮技術

さて、これらすべてが起こっている間も、業界の他の部分は依然として前進を続けており、そのスピードは速いです。GoogleはTurboquantと呼ばれる新しい圧縮アルゴリズムを発表したばかりです。これはLLMのキーバリューキャッシュメモリを少なくとも6倍削減し、最大8倍の高速化を実現し、しかも精度の損失はゼロです。

つまり、本質的には、AIモデルを実行するために必要な計算量を大幅に削減することで、AIモデルをはるかに効率的にする新しい技術です。モデルをどんどん大きくスケールアップするのではなく、Googleはより少ないリソースからより多くのパフォーマンスを引き出そうとしているのです。

そして、これは実際にかなり大きな出来事です。なぜなら、現在の主なボトルネックの1つは、もちろん計算リソースだからです。この発表により、MicronとSanDiskは少し打撃を受けました。人々が、長いコンテキストのAI推論では、ワークロードあたりのメモリがはるかに少なくて済むかもしれないと気づき始めたからです。

しかし、同時に、すでに大規模な計算リソース不足があります。ですから、これが近いうちにメモリコストを下げるとは私には思えません。

Metaの脳予測モデル

次に、Metaです。彼らはTribe V2と呼ばれるものを発表したばかりです。これは本質的に、人間の脳がほぼあらゆる視覚や音にどのように反応するかを予測するようにトレーニングされた基礎モデルです。

700人以上の人々から500時間以上のfMRIデータでトレーニングされており、今では再トレーニングなしで、まったく新しい個人の神経活動を予測できます。簡単に言えば、これは基本的に人間の脳のデジタルモデルです。画像、音声、テキストを取り込み、たとえあなたを見たことがなくても、あなたの脳がそれにどのように反応するかを予測できるのです。

以前の方法と比較して、約2〜3倍の改善を示しており、考えてみれば実際にかなり驚異的です。つまり、人間の脳が情報をどのように処理するかをモデル化し始めることができれば、基本的に人々が考える前に彼らの思考を予測できるだけでなく、これはザッカーバーグが大好きなことでしょうが、AIシステムをより人間のように考えるように調整したり、少なくとも人間の認知をはるかに正確にシミュレートし始めることもできます。

これは、汎化と真の継続的学習を伴うタスクにとって非常に重要です。現在のAIシステムがまだ非常に苦労している2つの領域です。

ARC AGI 3の発表

これは、今週の別の重要な発表につながります。ARC AGIテストの第3バージョン、ARC AGI 3が正式にリリースされました。このテストは、研究者のフランソワ・ショレによって作成され、未知の環境における汎化と問題解決能力を測定するものです。

人間は通常、これらのテストで非常に良い成績を収め、ほぼ完璧なスコアを出します。ここで見られるように、人間は依然として両方のバージョンでリードを保っていますが、これに先行するものの、AIはかなり近づいています。しかし、ARC AGI 3に関しては、Gemini 3.1 ProやClaude Opus 4.6のような最も先進的なモデルでさえ、0〜0.3%の間でしかスコアを取れていません。

これは驚くほど低いスコアです。彼らは、ARC AGIがより受動的な知性の測定から、AIエージェントが実際に完全に新しいインタラクティブな環境にリアルタイムで適応できるかどうかをテストするものへと進化したと言っています。ですから、彼らが正確に何を変更したのかは分かりませんが、明らかにこれらのモデルはそれに対する準備ができていませんでした。

主要なAIベンチマークでこれほど低いスコアを見たのは、正直いつ以来か覚えていませんが、それがどれくらい続くかを見るのは興味深いでしょう。私の推測では、今年の終わりまでに、このテストで90%以上を達成するモデルまたはエージェントが登場するでしょう。コメント欄で、これに同意するか、あるいはあなたの予測は何かを教えてください。

ヒューマノイドロボットがホワイトハウスへ

しかし、AIは汎化に苦労しているかもしれませんが、ホワイトハウスに入ることには問題がなかったようです。これは、ヒューマノイドロボットがそこに入ったのは初めてのことだと思います。

まあ、ジョー・バイデンを含めなければの話ですが。冗談はさておき、Figure 3はホワイトハウスに入った初のヒューマノイドロボットとして歴史を作りました。メラニア・トランプと一緒にカーペットを歩き、数分間記者たちに手を振って、それから外に戻りました。そして、去る時に全員が立ち上がって拍手したという事実が、私は単純に好きです。

AIが社会の主流になりつつある

そう、私たちが今見てきたすべてを振り返ってみると、Claude Mythosのようなリークされたモデルから、ジェンスンがAGIはすでにここにあるかもしれないと言っていること、Metaが私たちの思考を予測しようとしていること、そして今やヒューマノイドロボットが文字通りホワイトハウスに歩いて入っていることまで、AIは本当に一般の人々の関心の中心に入り始めているように感じられます。AIはどこにでも現れています。

それは私たちの文化の一部になりつつあり、私たちは本当にまだ始まったばかりです。ご視聴ありがとうございました。この要約を楽しんでいただけたら幸いです。楽しんでいただけたら、ぜひいいねを押していただくか、チャンネル登録ボタンを押してください。