Opus 4.6がついに登場

Anthropicが新たにリリースしたClaude Opus 4.6は、100万トークンのコンテキストウィンドウと強化されたエージェント機能を備えた大規模モデルである。自己修正能力を持ち、長期タスクに特化した設計となっており、複数のベンチマークで大幅な性能向上を記録した。さらに、複数のエージェントを並行稼働させるエージェントチーム機能も導入され、作業効率が飛躍的に向上している。OpenAIも同様の機能をリリースしており、AI業界は「Labor as a Service」という新たなパラダイムへと急速にシフトしつつある。近日中にリリース予定のClaude Sonnet 5は、Opus 4.5を上回る性能を50%安価かつ高速で実現すると噂されており、業界に更なる衝撃を与えることが予想される。

Opus 4.6 is about to send SHOCKWAVES...

The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

Opus 4.6の登場と業界への衝撃
自律エージェントへの転換
市場への衝撃とClaude Co-workの影響
Opus 4.6の主要機能
Claude Sonnet 5への期待
エージェントチームの導入
OpenAIのFrontierと今後の方向性
実際の使用体験

Opus 4.6の登場と業界への衝撃

さて、みんなが一斉にすべてを今まさにリリースすることに決めたようですね。でも一つずつ順番に見ていきましょう。まず何よりも、Opus 4.6についてです。Opus 4.6はもちろんAnthropicの最新大規模モデルです。現在、AnthropicはAI業界全体に波及する大きな衝撃波を引き起こしています。

他の多くのフロンティアAIラボと比べて小規模な企業でありながら、彼らは業界に対して非常に大きな影響を及ぼしています。この1週間ほどで、彼らは日常業務のためのAIツールであるClaude Co-workのプラグインをいくつかリリースしました。人々がこれらのプラグインで何ができるかの範囲に気づいたとき、大規模なテクノロジーセクターの株式市場の暴落を引き起こしました。

もちろん、ClaudebotをOpen Claudeに改名したものは、主にUnclaude、つまりAnthropicのモデルによって推進されていました。そして、みんなが起こっていることに動揺している間に、またAnthropicがやってきて、次の大きなものを投下したんです。そして安心する前に言っておきますが、まだ終わりではありません。なぜなら、彼らはClaude Sonnet 5がもうすぐそこまで来ていることを確認しているからです。

Claude Sonnet 5は、これまで見てきたものよりもさらに大きな出来事になるかもしれません。本当にベンチマークの結果次第ですけどね。でも今日のところは、とりあえずClaude Opus 4.6とAnthropicがリリースしたもう一つのことに焦点を当てましょう。

自律エージェントへの転換

ここで理解すべき重要なことは、この新しいリリースが単なる段階的なイノベーションや前進ではないということです。これは自律エージェントへの方向転換なんです。OpenClawやClaudebotの後、私たちは皆、これらのAIラボが似たようなものをリリースしようとすることを予想していました。もちろん、すべてのモデルを開発したのは彼らでした。彼らは多くのインフラを構築しました。でもOpen Clawの制作者であるこの一人の男が、引退から戻ってきて、オープンソースのハーネスを作り、彼らのモデルを利用して大きな波紋を呼んだんです。

彼らはそれを無視することはできませんでした。でも正直なところ、彼らがこんなに速く動くとは予想していませんでした。なぜなら今日、たった1時間以内に、冗談じゃなく、1時間以内に、AnthropicとOpenAIの両方がOpenClawへの答え、少なくともそのエンタープライズ版を投下したからです。詳しく見ていきましょう。

まず第一に、これから先、おそらくかなり頻繁に耳にすることになる言葉があります。過去にSaaS、つまりSoftware as a Serviceがあったのと同じようにね。そして時間が経つにつれて、これらのAIモデルのリリースとともに、人々はIntelligence as a Service、サービスとしてのインテリジェンスという言葉を使い始めました。それはまだ独自の分野として存在しています。でも今、新しいものが形成され始めています。それはおそらくLabor as a Service、サービスとしての労働力と呼ばれることになるでしょう。

これらのフロンティアAIラボはAI従業員を提供します。彼らはコンピュータから従業員と同じように作業ができるAIモデルとAIインフラを提供するんです。そしてそれを説明するためにどんな言葉が定着するか見ていきましょう。私はLabor as a Serviceになると思っています。

市場への衝撃とClaude Co-workの影響

AnthropicがClaude Co-workのプラグインをリリースしたことで、先ほど言ったように大規模な株式市場の暴落を引き起こしました。さて、AI業界を非常に注意深く追っている私たちの多くは、それが来ることを知っていました。なぜなら私たちの多くがClaude Codeを使っていて、Claude Codeがいかに優れているかに完全に驚かされていたからです。

でもClaude Codeは、ソフトウェア開発の経験がない人にとっては、ターミナルのように見えたんです。それを見ても、何も関わりたくないと思ってしまう。それまでそういったツールやそういった環境を使ったことのないほとんどの人にとっては、非常に拒否反応を起こすものだったと思います。

だからClaude Co-workは世界の残りの人々、オンラインでノーマルピープルと呼ばれる人たちのために作られたんです。そしてClaude Co-workとこれらのプラグインが、大規模なテクノロジー市場の売却を引き起こしました。特にSaaS、Software as a Serviceで多くのお金を稼いでいる企業をターゲットにしてね。

Opus 4.6は、それに積み重なるさらに別のものです。それは非常にそれと連動しています。

Opus 4.6の主要機能

では、Opus 4.6の何がそんなに大きな問題なのでしょうか。まず第一に、今や100万トークンのコンテキストウィンドウを持っています。まだベータ版ですが、Opusクラスのモデルがコンテキストウィンドウにこれほど多くを保持できるのは初めてのことで、特定のタスク、特にコーディングにとって大きな意味を持ちます。

コードベースの大部分を保持し、取り組んでいることを記憶できる能力は大きな意味を持つことになります。これはGeminiが最初に登場したときに非常に顕著でした。だから、このモデルを使い始めると、人々はおそらく拡張されたコンテキストウィンドウの効果に気づくでしょう。

Opus 4.6についての二つ目の大きなことは、そのエージェント型プランニング能力です。4.5は素晴らしかった。指示に従いました。4.6はさらに一歩進んで、自己修正ができるんです。コード生成中に自分自身のバグを特定し、最終結果を提示する前にそれを修正することができます。

ベンチマークの結果の多くで見られるように、このエージェント型プランニングのアイデアと大きなコンテキストウィンドウ、ここでの目標は長期タスクで優れた成果を出すことです。例えば、Humanity’s Last Examでは、ツールなしで約30%から今や40%になりました。かなり大きな飛躍です。そしてツール使用ありでは、43%から53%になりました。

つまり、Opus 4.5からOpus 4.6への、Humanity’s Last Examでの大きな飛躍です。RGI2では、37.6から68.8になりました。でも本当に大きな飛躍は、エージェント型ターミナルコーディング、エージェント型コンピュータ使用、エージェント型ツール使用、エージェント型検索などにあります。ここでのトレンドは理解できますよね。

このモデルは長期タスク、人間にとって何時間も何日もかかる作業のために設計されています。そして彼らはまた、Claude Sonnet 5の差し迫った発売を確認しています。

Claude Sonnet 5への期待

どうやら内部名称はFenicとかFenickだったようです。Claude Sonnet 5、何と呼ばれるにせよ、これはスピードの悪魔になるでしょう。Sonnet 5がどこで見られるのか正確にはまだわかりません。多くの人が昨日リリースされると言っていました。だから、いつリリースされるかについて、人によって異なる考えを持っていたんです。

何が起こったと思いますか。正直なところ、ゲーム・オブ・スローンズでティリオンが3人の異なる人々に3つの異なる情報を流して、スパイ、つまり彼の秘密を暴露していた人物を洗い出そうとしたのを覚えていますか。そして、どの情報が外に出たかに基づいて、誰がスパイなのかがわかるんです。

私はAnthropicがまったく同じことをしたと思います。彼らは異なる人々に誤情報を与え、リーカーたちが「ああ、昨日起こるよ」と言った。そしてそれに基づいて、彼らは情報の最初のリークの背後にいたのが誰かを把握できるんです。つまり、それがまさに起こったことだとしても驚きません。

でも重要なのは、Sonnet 5が伝えられるところによるとOpus 4.5よりも優れているということです。つまり、数時間前の時点で、最高のコーディングモデルの一つ、エージェント型使用などで本当に人々を驚かせているモデルの一つが、今や4.6に取って代わられました。

でもこれより前は、世界がこれまで見た中で最高のモデル、あるいはその一つでした。Sonnet 5は伝えられるところによると、そのモデルを飛び越えて、そのモデルよりも優れていながら、50%安く、大幅に高速で、どうやら今では並列サブエージェントを実行できるようです。

つまり、タスクを並列で処理するためにサブエージェントの群れをスピンアップできるんです。Sonic 5についてのこれらのことのうちどれがまだ確認されているのか、正確にはわかりません。まだリリースされていないので、多くの噂が渦巻いていますが。だから、Sonic 5についての情報は話半分に聞いてください。私の知る限り、まだ公式ではありませんが、おそらく非常に、非常に近いうちに見ることになるでしょう。

エージェントチームの導入

そして今日、彼らはエージェントチームも導入しました。複数のエージェントをスピンアップして、並列で作業させ、同じプロジェクトに取り組ませることができます。これはまだリサーチプレビューです。

さて、私たちはこの種のアイデア、この概念についてかなり長い間話してきました。私はそれをエージェント型スウォーム、つまり自律的なAIエージェントの群れと呼んでいました。スピンアップして、あなたの命令を実行させるものですね。

もちろん、それは素晴らしい企業言語ではありません。彼らはおそらくそれをエージェントスウォームとは呼ばないでしょう。この概念のために浮上している言葉は、オーケストレートされたマルチエージェントシステムとか、そういったものです。でも重要なのは、複数のエージェントを協力させ、それらの間に何らかのオーケストレーションを持たせることができるということです。

話し合う必要がある複数のリポジトリがある場合、リサーチを行うときに、それらに対して並列で作業する二つの異なるエージェントを持つことができます。ここでの大きな意味は、一度に一つずつ物事を行わなければならないという連続的なボトルネックを排除できることです。

チャットボットとの30分間のやり取りが必要だったタスクが、今では5分で完了できます。複数のエージェントを並列で実行してそれらのタスクを完了させることができるからです。言い換えれば、AIはFactorioなんです。

Factorioをプレイしたことがあるなら、おそらく来ることに対して準備ができているでしょう。

OpenAIのFrontierと今後の方向性

さて、これの後に実際に出てくる別の動画があるんですが、それがこれらのものがどこに向かっているのかについてもっと多くの文脈を提供します。なぜなら、このリリースの数時間前、おそらくこれがリリースされる1時間未満前に、OpenAIがFrontierをリリースしたからです。

そこで見るように、この新しくリリースされたFrontierは、もう少し具体化されていて、どこに向かっているのかについてもう少し明確です。基本的に、これらの企業のアイデアは、企業が業務やビジネスを運営するためのオペレーティングシステムになることです。

だからオペレーティングシステムとして考えることもできますし、これを見る別の精神モデルは、それがAIエージェントのための人事部門のようなもの、人事部門、HRですが、AIエージェントのためのものです。

それについては今日公開される後の動画で詳しく説明しますが、これを出しておきたかっただけです。そしてOpus 4.6を世界に歓迎します。

実際の使用体験

これが発表されるとすぐに、リリースされました。だから私はエージェントを実行しています、Open Clawエージェントを。すぐに私はそれに尋ねました。あなたはOpus 4.5で動いているけど、自分自身をOpus 4.6にアップグレードできる? するとそれは、おお、クールだね。ええ、完全にできるよ、と言いました。

ちょっと待ってて。そしてそれ以降、無線沈黙です。だから私はおそらく行って、何が起こったのか確認すべきです。なぜなら少し心配になってきているからです。10分か20分、それからの音沙汰がありません。でもわかり次第報告します。大丈夫だと思います。すべて順調ですが、確認しに行った方がいいでしょう。では、また。