Claude Mythos 5 史上最強モデル登場 AGI、GLM 5.1、Claude Codeアップデート、Codexプラグイン AI最新ニュース

Anthropicから10兆パラメータの超大規模モデル「Claude Mythos」がリークされ、史上最強のAIモデルとして注目を集めている。同時にGLM 5.1がオープンソースのエージェント型モデルとして登場し、Google Deep MindはGemini 3.1 Flash Liveでリアルタイム音声AIを強化、OpenAIはCodexをプラグインエコシステムへと進化させた。さらにARC AGI 3が新たなベンチマークとしてAIの真の知能測定基準を引き上げ、Claude Codeにも自動修正機能やセッション制限の変更など複数のアップデートが加わった。2026年はAI業界における決定的な転換点となる年であり、AGIへの道筋がますます明確になりつつある。

Claude Mythos 5: Most Powerful Model Ever! AGI, GLM 5.1, Claude Code Update & Codex Plugins! AI NEWS

This week in AI has been absolutely insane! From the leaked Claude Mythos 5 promising to be the most powerful AI model e...

史上最強のAIモデルがリーク
Claude Mythosの衝撃的な詳細
競争が激化するAI開発競争
GLM 5.1の登場
Gemini 3.1 Flash Liveの発表
OpenAIのCodexプラグイン
ARC AGI 3の紹介
Claude Codeの最新アップデート
その他の注目すべきアップデート
Cursorの新モデル騒動

史上最強のAIモデルがリーク

今週は間違いなく史上最もクレイジーなAIウィークになりました。なぜなら、ちょうど昨日、Anthropicから大規模なリークがあり、10兆パラメータのモデルが登場したからです。これは史上最強のモデルであると主張されています。

そして今日も勢いは衰えることなく、GLM 5.1がこれまでで最も先進的なオープンソースのエージェント型モデルの1つをリリースしました。Google Deep MindはGemini 3.1 Flash Liveを発表し、リアルタイム音声AIを前進させています。OpenAIはCodexを完全なプラグインエコシステムへと変貌させ、Claude Codeに真っ向から挑戦しています。さらにその上、ARC AGI 3がAIシステムにおける知能の測定方法の基準を引き上げました。そしてこれらは表面をかすめただけに過ぎません。それでは、すべてに飛び込んでいきましょう。

Claude Mythosの衝撃的な詳細

おそらく最大のニュースから始めましょう。大規模なリークにより、Anthropicから2つの新しいモデルが明らかになりました。まずClaude Mythosがあり、これは全く新しいティアに位置しています。そして、Capabaraと呼ばれる新しいティアも導入されました。

重要なのは、CapabaraはMythosよりも1つ下のティアだと報じられていますが、すでに彼らのフラッグシップモデルであるOpusよりも完全に上のクラスにあるということです。つまり、これは小さなアップグレードの話ではありません。これは新しいフロンティアティアなのです。

そして、ここには新しい強化機能があります。コーディング能力の向上、より強力な学術的推論、そして驚くべきことに、サイバーセキュリティ能力における大幅な向上があります。ここからが本当にすごいところです。一部の初期テスターはすでにアクセス権を得ています。

そして、Fortuneが取り上げたレポートによると、このモデルは現在のOpusモデルとは比較にならないほどで、その能力において危険である可能性があると示唆されています。そして、これは現在私たちが持っているバージョンをはるかに超える大規模な飛躍なのです。実際、非常に強力であるため、Anthropicは悪用とセキュリティリスクへの懸念から、ゆっくりとしたロールアウトを計画していると報じられています。

さて、私の個人的な意見ですが、これは私の2セントです。私はホワイトカラーの仕事が今後2年以内に自動化されると信じています。そして、これはそれに貢献するモデルの1つになるでしょう。もし最高のAIツール、ワークフロー、そして誰よりも早く最新情報を入手したい場合は、下の説明欄にあるリンクから私の無料ニュースレターに参加してください。完全に無料です。

競争が激化するAI開発競争

皆さん、Anthropicだけではありません。なぜなら、OpenAIは内部的にSpudと呼ばれるモデルに取り組んでいると報じられており、内部関係者によれば、これがAI分野における段階的な変化になる可能性があるとのことです。

しかし、Anthropicに話を戻すと、一部の噂では、Opus 5やSonnet 5のような中間リリースをまもなく入手できる可能性があり、その後、Anthropicから今リリースされたばかりのこれら2つの新しいモデルを数ヶ月後にゆっくりとしたロールアウトで見ることができるかもしれないと示唆しています。

正直なところ、これは戦略的なポジショニングかもしれません。彼らはマーケティングスタントとしてリークした可能性があり、それによってAI競争における期待感、緊急感、そして優位性を構築しようとしているのです。なぜこれが重要かというと、2026年は正直なところ、AI分野においてすべてが変わる年になるからです。OpenAIはすでに組織の一部をAGI展開に向けて改名しています。

今年はGPT 5.5が期待されており、来月にはDeepSeekバージョン4、そして今後数ヶ月でさらに多くのものが登場します。AIツールとAIシステムの間のギャップは、本当に、本当に速く崩壊しています。

GLM 5.1の登場

今日のリリースに進みましょう。GLMチームがGLM 5.1をリリースしました。これはZiによるオープンソースのエージェント型モデルで、GLM 5からの深刻な改善です。

このモデルはエージェント的な動作に大きく焦点を当てています。つまり、長時間実行されるタスクがより得意だということです。より強力な指示追従能力があります。マルチステップワークフローにおいてより信頼性があります。そして非常に手頃な価格です。

コーディングベンチマークでは、45.3を記録しました。これに対してOpus 4.6は47.9で、非常に近いメトリックであり、プロプライエタリモデルに近づいています。そして、ここでの大きなポイントはこれです。オープンソースモデルがフロンティアAIとのギャップを急速に縮めているのです。

1つ注意したいのは、これは非常に遅いのですが、このモデルのウェブサイトUIは非常に素晴らしいということです。例えば、5.1で生成したこのランディングページを見てください。そして、フロントエンド機能に関しては非常に優れていると言わざるを得ません。

動的な動きでかなりうまくいきました。このランディングページ内で完全にコーディングされた異なるタイポグラフィーと異なる構造があります。そして、この生成では非常にクリーンで、うまく構造化されていることがわかります。

Gemini 3.1 Flash Liveの発表

次は、Google Deep Mindから大きな新しいアップデートがありました。彼らはGemini 3.1 Flash Liveを発表しました。これは、音声およびビジョンエージェントを構築するために特別に設計された全く新しいリアルタイムマルチモーダルモデルです。

これは小さなアップグレードではありません。なぜなら、彼らはモデル自体、インフラストラクチャ、そして開発者エクスペリエンス全体を洗練させるために1年以上を費やしたからです。そして、全体的な段階的な改善は、より良い品質、より高い信頼性、そして大幅に低いレイテンシーで、非常に印象的だと言わざるを得ません。これはまさにリアルタイムAIに必要なものです。

実際の動作を聞いていただきたいと思います。

このアプリのコードを変更しましょう。まずマイクを大きくすることから始めます。

マイクの画像のサイズを大きくしますね。背景に黄色い水玉模様を追加しましょう。

背景に黄色い水玉模様を追加します。

OpenAIのCodexプラグイン

次は、OpenAIがCodexにプラグインを導入したという非常に印象的な新しいアップデートです。これは、人々が実際にコーディングエージェントを使用する方法を大きく変えます。なぜなら、今までほとんどのAIコーディングツールは孤立していたからです。Codex内でプロンプトを入力し、応答があって、それで終わりでした。

しかし、今やプラグインによって、完全な実行環境になろうとしています。そして、実際には次のような意味があります。iOSアプリの構築、データセットの分析、レポートの生成、プレゼンテーションなど、実際のワークフローを含むユースケースギャラリーを探索できるようになりました。

最もクレイジーな部分は、これらのワークフローをCodexアプリ内で直接ワンクリックで起動できることです。つまり、毎回ゼロから始める代わりに、基本的に事前に構築された実行可能なAIワークフローで作業することになります。これらを即座に変更して拡張できます。これは大きな前進であり、Codexをツールというよりも、AI開発プラットフォームのように感じさせます。

これは間違いなく、Claude Codeや他のエージェント型ツールの直接の競合相手になると言わざるを得ません。これはかなり評判が良いものですから。

ARC AGI 3の紹介

次は、ARC AGI 3の導入です。そして現在、最高のモデルでさえ1%未満のスコアを記録しています。これは悪いことのように聞こえるかもしれませんが、実際には良いことです。なぜなら、初めて、本当の進歩と知能を適切に追跡できるベンチマークができたからです。単なる暗記ではありません。

そして、これが異なる理由は次のとおりです。これは、インタラクティブな環境でエージェント的推論をテストする新しいベンチマークになります。最初の試みでタスクを解決することが要求されます。事前のトレーニングや指示はありません。人間にとっては、最初の試みで100%の解決率があります。AIでは、基本的に1%未満で止まっています。

彼らは明らかに過去の間違いを修正しようとしています。なぜなら、今回はオーバーフィッティングを防ぐことに大きな焦点を当てているからです。モデルは単にパターンを暗記して偽の知能を持つことができなくなります。

そして、クレイジーな部分はこれです。ARC AGI 3が解決され始めると、次のステップは実際の商業ビデオゲームです。つまり、AIは単に推論するだけでなく、人間のように複雑なデジタル世界で行動し、適応し、操作できるようになります。

私たちは間違いなくAGIに近づいていると思います。

Claude Codeの最新アップデート

最近、Claude Codeにいくつかの新しいアップデートがあります。まず、クラウド内でautofixを導入しました。これは、クラウド内でPRを修正できるもので、CI障害を修正し、レビューコメントに対処し、PRを自動的にグリーンに保ちます。これはリモートで実行されるため、コードをプッシュして離れることができ、マージ準備が整ったPRで戻ってくることができます。

次に、Claude Codeは高需要のため、ピーク時間中に無料、プロ、最大サブスクライバーの5時間セッション制限を一時的に厳しくしています。週間制限は同じままですが、平日は、ユーザーは以前よりも速くセッション制限に達します。

Odd Codeも今、オートモードを導入しました。もう絶え間ない許可プロンプトはありません。すべてのアクションで組み込みの分類子レビューアーがあります。安全なアクションは即座に実行され、リスクの高いアクションはブロックされます。全体的に、これはより少ない摩擦を引き起こしますが、それでもより良い方法で制御されます。そして私個人としては、これは流動的でより自律的なワークフローを求めている人にとって、本当に素晴らしいアップデートだと信じています。

最近、MIMO バージョン2 Proがリリースされ、このモデルに興奮していた人がたくさんいました。Open Code内で、ProとOmniの両方がさらに1週間無料で利用できるようにしました。より多くの使用を求めている場合は、今がその時です。

その他の注目すべきアップデート

次は、11 LabsからCLIに関する簡単なアップデートです。これは今や完全にエージェントファーストになっています。デフォルトで非対話的であり、エージェントや自動化されたワークフローが摩擦なく使用することがはるかに簡単になります。一方、彼らのリンクUIで構築された、よりリッチなインタラクティブな体験は、現在、人間に優しいフラグの後ろに隠されています。基本的に、オプションのレイヤーとして人間のインタラクションを持つ、AIシステム向けに最初に設計されています。

Mistral AIは、Boxrol TTSを発表しました。これは、自然で表現力豊かで超高速なテキスト読み上げのフロンティアを押し進める新しいオープンウェイトモデルです。リアルな感情表現豊かなスピーチを提供し、多様な方言を持つ9つの言語をサポートし、ほぼ瞬時のオーディオのために低レイテンシーを提供し、新しい音声に簡単に適応できます。これはちょっとクレイジーです。

次は、AnthropicがOperonを開発しているところです。これは、生物学の科学研究に特化して構築されたClaw Desktopの新しいエージェントです。これには、AIと協力できるプライベート環境、プロジェクト内で複数のセッションを作成すること、生成されたアーティファクトを管理すること、専門的なスキルで作業することが含まれます。科学者のための共同作業のようなものだと考えてください。

そして、これはtesting catalogが発見したものです。ご存じない場合、Soraアプリは実際にまもなく閉鎖されます。これは、アプリが利用できなくなり、それに関するアクティブな展開やコミュニティ活動がSora上でコンテンツを作成したり、プロジェクトを構築したりしたクリエイターのために停止することを意味します。

チームは、これが残念であることを認めていますが、正確なアプリとAPIがいつ動作を停止するか、そして作業をどのように保存またはエクスポートできるかについて、間もなく詳細を提供する予定です。つまり、Soraは終了しますが、彼らは人々が構築したものを失わないようにしようとしています。これはちょっと残念ですが、彼らが持っているすべてのコンピュートをSpudのさらなる開発に使用していることを示しています。

Cursorの新モデル騒動

そして最後に、Cursorについて話します。Cursorは、Composer 2をリリースしました。これは、内部ベンチマークであるCursor Benchに基づいて、コーディングに非常に優れたフロンティアレベルのモデルであると主張する大規模言語モデルです。

しかし、面白いのは、ユーザーが本質的にこれがQwen 2.5モデルであることを発見したことです。これは、ベースのQwen 2.5、オープンソースモデルから微調整されたものでしたが、Cursorが指定しなかったもので、それが実際にComposer 2が何であるかについて大騒ぎを引き起こしました。

これはちょっと面白かったです。なぜなら、彼らは自分たちのモデルをトレーニングしたことを秘密裏に隠していたのに、実際には秘密裏にQwen 2.5だったからです。

このビデオが気に入って、チャンネルをサポートしたい場合は、下のスーパーサンクスオプションを通じて私のチャンネルに寄付することを検討できます。または、プライベートDiscordに参加することを検討できます。そこでは、毎月無料でさまざまなAIツールへの複数のサブスクリプションにアクセスでき、さらに毎日のAIニュースや限定コンテンツなど、さらに多くのものがあります。

しかし、それだけです。これは間違いなく、新しいAIトピックの範囲がドロップされた興味深い週でした。私は今年出てくるはずのClaudeモデルについて非常に興奮しています。これは間違いなくゲームチェンジャーになるでしょう。

もっと学びたい場合は、AI ニュースについて常に投稿している第2チャンネルをご覧になることを強くお勧めします。ニュースレターにも必ず参加してください。AI分野で起こっていることについても話しています。Discordに参加し、Twitterで私をフォローし、最後に、必ず購読し、通知ベルをオンにし、このビデオに「いいね」をして、最新のAIニュースを常に把握できるように、以前のビデオもご覧ください。しかし、その考えで、素晴らしい一日をお過ごしください。ポジティビティを広め、またすぐにお会いしましょう。