AnthropicのMythosが実際のハッキングでOpenAIのGPT-5.5に勝利した

Anthropic・Claude・ダリオアモデイ
この記事は約25分で読めます。

本動画は、AI業界における最新の重要な5つの動向について解説している。具体的には、Notionによるエージェント向け開発者プラットフォームの公開、AnthropicによるClaude利用制限の強化と開発者コミュニティへの影響、Anthropicのビジネス導入実績におけるOpenAIへの猛追、サイバーセキュリティ分野でのMythosモデルの驚異的な性能評価とGPT-5.5との比較、そしてAWSによるAIエージェント向けマネージドデスクトップの提供を取り上げる。これらがいかに急速に現実の業務やセキュリティ環境を変革しつつあるかを論じ、今後のシステム設計やビジネスの意思決定に対する具体的な備えを促す内容である。

Anthropic's Mythos Just Beat OpenAI's GPT-5.5 At Real Hacking
Exclusive Interview w/ Tibo, lead of Codex at OpenAI on Substack Now:

AIエージェントがもたらす現実世界への影響

今週、Xである男性が、11年前に締め出されてしまったウォレットから5つのビットコインを回収したと投稿しました。約40万ドルの価値があり、彼はもう永遠に失われたと思っていました。話によれば、彼は大学時代にパスワードを変更した際、酔っ払っていて新しいパスワードを忘れてしまったそうです。何年にもわたってブルートフォース攻撃やパスワード辞書を試しても効果がありませんでした。最終的にウォレットを取り戻せたのは、より優れたパスワード解析ツールのおかげではありません。Claudeのおかげでした。彼は大学時代の古いハードドライブからファイルをアップロードし、10年以上にわたって忘れられていたフォルダの山をClaudeに整理させました。Claudeはパスワード変更前の古いwallet.datファイルを見つけ出し、彼がまだ持っていたニーモニックのリカバリーフレーズと照らし合わせることで、ウォレットが開いたのです。彼は何もハッキングしていません。ただ、忍耐強いリサーチアシスタントが時間をかけて行うような作業を、AIに任せただけです。私はこれが、現在の私たちがAIとどのような段階にいるかを示す非常に象徴的なストーリーだと考えています。新しいモデルの発表は今も続いていますが、より興味深い出来事はもっと静かに、そしてずっと具体的な形で起きています。エージェントが、実際の企業内で、実際の人々と共に、現実の成果物に対して本物の仕事をし始めているのです。そしてそれが、製品を作る人々の現実の生活や現実の決断を変え始めています。

日々の意思決定を変える5つのニュース

このビットコインの話はさておき、今週は注目すべき5つのニュースがあり、そのどれもが皆さんの今後の決断を変えうるものです。Notionはエージェント向けの本格的な開発者プラットフォームを立ち上げました。AnthropicはClaudeの利用制限を再び厳しくしました。そして、AnthropicがOpenAIの独壇場だと思われていたビジネス導入の境界線を越えたことを示唆する新しいデータがあります。さらに、MythosとGPT-5.5は、AIのサイバー能力がほとんどの人が処理できるよりもはるかに速いスピードで進化していることを明確にしました。最後に、AWSはエージェントにマネージドクラウドデスクトップを提供しました。これは一見退屈に聞こえるかもしれませんが、APIを持たないソフトウェアの中にどれほど多くの企業の業務が残っているかを思い出せば、その重要性がわかるはずです。それでは、これら5つのニュースについて詳しく見ていきましょう。

Notionがエージェントにワークスペースの扉を開く

まずはNotionから始めましょう。Notionはエージェントに対して、ワークスペースへの正面玄関を用意しました。5月13日、Notionは開発者向けプラットフォームを公開しました。エンジニア向けのもののように思えるかもしれませんが、実は私たち全員がこの恩恵を受けることになります。その理由をご説明します。まずNotionのコマンドラインインターフェースがありますが、これは開発者やコマンドラインに慣れている人、そしてツールにアクセスするためにコーディングエージェントを使う人向けに作られています。しかしその上に、Notionがワーカーと呼ぶものがあります。これはNotion独自のインフラ上で実行されるホスト型関数です。たとえば、データベース同期機能があります。Salesforce、Stripe、GitHub、Zendesk、PostgreSQL、あるいは任意のAPIからNotionのデータベースにデータを引き込み、自動ワーカーのジョブによってそのデータを常に最新の状態に保つことができます。また、外部システムからNotionをトリガーするWebhookや、カスタムエージェントツール、そしてClaudeやCodexなどのエージェントを自社のNotionワークスペースに直接参加者として招き入れることができる外部エージェントAPIもあります。つまり、Notionは単にAIボタンを追加したり、システム内にすでにある非常に人気のあるNotion AIツールに依存したりしているわけではありません。彼らはさらにその先へ進み、ワークスペース全体をプログラム可能なものにしようとしているのです。これが重要なのは、企業の業務の多くが正式なエンタープライズシステムから始まるわけではないからです。それはNotionのドキュメント、プロジェクトデータベース、顧客のノートページ、運用チェックリスト、あるいは勝手に作られた独自のプロジェクトから始まります。Salesforceでは重すぎ、スプレッドシートでは脆すぎるという理由で誰かが作った軽量のCRMのようなものです。そういった場所こそが、まさにエージェントが多くの文脈を必要とする扱いにくい領域や片隅なのです。そしてこれまで、そこにエージェントを導入する良い方法はありませんでした。これまではかなり不便な選択肢しかありませんでした。Notionを人間のワークスペースとして使い、Notionが構築したいくつかのエージェントをその中で動かしつつ、その他の作業のために別の場所でエージェントを大量に動かす必要がありました。あるいは、Notion APIの周りに壊れやすい連携を構築して無理やり動かすか、エージェントにNotionのページを読んで要約させるかでした。後者は便利ですが本格的な仕事には不十分です。新しいプラットフォームは、私たち全員が足を踏み入れつつあるエージェントの世界にとって、はるかに基礎的なものです。コーディングエージェントがワーカーを書くことができます。そのワーカーはNotionデータベースにデータを同期できます。Webhookがそのワーカーをトリガーできます。エージェントは同期された文脈を利用できます。そして人間は、チームがすでに働いているのと同じワークスペースでその結果をレビューできるのです。顧客のオンボーディングを例に挙げてみましょう。Salesforceで取引が成立すると、WebhookがNotionのワーカーを起動します。ワーカーはオンボーディング用のワークスペースを立ち上げ、プランデータ、アカウントのメモ、成功基準、マイルストーン、サポート履歴を取り込みます。エージェントがキックオフ計画の草案を作成します。そして、顧客に何かが送信される前に、カスタマーサクセスマネージャーがNotion内でそれをレビューします。ちなみにこれは推測の話ではありません。これはすべて、一貫したワークフローを形成するために今回のリリースで構築された基礎的なコンポーネントなのです。ですので、あなたの会社がすでにNotionを活用しているなら、今週は大きな意味を持つ一週間になります。自分にとってすでに重要なデータベースを選び、プロジェクト、顧客、候補者、サポートの問題など、何でもいいので掘り下げてみてください。そして自分に問いかけてみてください。ここに取り込むべき外部データはあるだろうか。作業をトリガーすべきイベントはあるだろうか。エージェントに何を起草し、更新し、確認させるべきだろうか。人間の承認が必要な最終ステップはどこだろうか。この空間にClaudeやCodexのような他のエージェントを入れたいだろうか。そういったことのすべてが今、可能になったのです。つまり、NotionのヘッドラインはNotionがAIを導入したということではありません。それはすでに起きたことです。そうではなく、NotionはAIの導入をさらに拡大し、人間とエージェントが文脈を共有するワークベンチになろうとしているということです。少なくとも、それが彼らの目標です。

Claudeの利用制限とエージェント利用の急増

さて、2つ目のニュースです。開発者向けのClaudeの制限が厳しくなりました。エージェントの利用がサブスクリプションモデルを破綻させているからです。これはまさに成功の代償についての物語です。なぜなら、12月にエージェント革命の口火を切ったのは他ならぬClaudeだったからです。そしてそれ以来、エージェントによって牽引されるAI利用の途方もない急増を目の当たりにしてきました。現在Claudeは計算資源の不足に陥っており、Anthropicのチームはこれにどう対処するかを考えなければならない状況にあります。では、詳しく見ていきましょう。今週Axiosは、Anthropicが一部の外部エージェントツールの利用を独自のクレジットメーターの背後に移行させていると報じました。サム・アルトマンはこれに対抗し、新規のビジネス顧客に2ヶ月間のCodex無料提供を提案しました。これは単なる巨大企業同士のプロモーション合戦ではありません。ユーザーがチャットボットに文字を打ち込む人間ではない場合、AIの使い放題モデルが全く異なる意味を持つということに市場が気づき始めているということです。開発者にとって、この意味合いは非常に明確です。利用制限は今や、注意を払わなければならない製品の挙動の一部なのです。もしあなたのAIワークフローがClaude Code、Codex、Cursor、あるいは長時間稼働するその他のエージェントに依存しているなら、彼らが話している制限は単なる会計上の詳細や請求の問題ではありません。それは実のところ、ユーザー体験の一部なのです。タスクの途中でエージェントが請求上限に達した場合、どうなるのでしょうか。作業は一時停止するのでしょうか。再開するのでしょうか。モデルを切り替えるのでしょうか。追加で請求されるのでしょうか。文脈を失ってしまうのでしょうか。ユーザーは何が起きたかを理解できるのでしょうか。チームは完了したタスクあたりのコストを把握しているのでしょうか。ほとんどのチームは、こうしたことに対する良い答えをまだ持っていません。彼らはまだ、シート数やサブスクリプションという単位で物事を考えているのです。私たちが理解しなければならないことの1つは、仕事をエージェント的だと位置づけるだけでは不十分だということです。現在、Claudeは12月以来のエージェント的ワークフローの制御不能な成功により窮地に立たされていますが、皮肉なことに、それを引き起こしたのはClaude自身なのです。12月にClaude Codeが非常に優れ始め、誰もがClaudeに切り替え始めたのを覚えているでしょうか。それがこの半年間の始まりでした。本当に信じられないような出来事です。Anthropicのチームはコンピューター資源を使い果たしています。2026年4月上旬から中旬にかけて、彼らは暴走するエージェントのフローを取り締まり始めました。そして、非常に不評を買う形で、OpenClawの取り締まりから始めました。はい、もちろんダジャレです。人々が支払っているClaudeのサブスクリプションをOpenClawやその他のサードパーティが使用するのを遮断したとき、何が起きたかというと、数千ドル分のトークンを消費しながら数百ドルしか支払っていなかった多くの開発者たちが、それに腹を立てたのです。それは彼らにとっては非常に都合の良い取引でしたが、Anthropicにとっては全く機能しない取引でした。そのため、Anthropicは当初、個人のサブスクリプション費用を利用したサードパーティによる利用はもう一切認めない、それは当社にとってあまりにも財務的に持続不可能であり実行できないと宣言することで対応しました。代わりに、当社のAPIを使用し、トークン単位で料金を支払ってくださいと要求したのです。しかし、OpenClawを構築したり、その他のサイドプロジェクトを進めたりしていた開発者の多くは、必ずしもその費用を負担できるわけではありませんでした。結果として多くのプロジェクトが消滅し、多くの人々がOpenAIへと流れていきました。そしてOpenAIは、彼らを両手を広げて歓迎しました。OpenAIのチームは、特にOpenClawがOpenAIの環境で使いやすくなるよう、そしてOpenAIのサブスクリプションをOpenClawで簡単に利用できるように、多くの労力を費やしました。彼らは基本的に、これがユーザー獲得の絶好の機会だと判断したわけです。しかし今、AnthropicはOpenClawのコミュニティや、個人がサイドプロジェクトとして動かしているエージェントに対して、歩み寄りの姿勢を見せようとしています。彼らが決定したことは、4月に言ったように月額20ドルや200ドルのサブスクリプションをサードパーティのエージェント利用に一切使ってはいけないと言う代わりに、まあ使ってもいいけれど制限を設けますよ、と言うことでした。そしてその制限は毎月リセットされる仕組みです。使い切らなければ消滅し、それを超えた場合はトークン単位で課金されるAPIの料金を支払わなければなりません。これは不評を買っています。開発者に対する広報活動において重要なことの1つは、より明確で、よりシンプルで、より一貫したメッセージが勝つということです。そして今Anthropicが直面している根本的な課題の1つは、長い間、開発者に対してより明確でシンプルなメッセージを発信していたのは彼らの方だったということです。彼らが12月と1月に大躍進した理由の一部は、Claude Codeが素晴らしい体験であることについて、非常に明確かつシンプルに伝えていたからです。しかし今やその成功ゆえに、もはや開発者に対してそこまで明確でシンプルに振る舞う余裕がなくなってしまったのです。そしてそれは、開発者コミュニティからの多くの好意を失う原因となっています。とはいえ、これを誇張したくはありません。ClaudeやClaude Codeを使用している開発者を私は今でもたくさん知っています。誰も使っていないかのように振る舞うのはやめましょう。そういうことを言っているわけではありません。依然として大規模な普及が進んでおり、それはAnthropicの収益数字にも表れています。しかし、開発者たちがその環境に慣れ親しんだ後で、彼らの利用方法が財務的に持続不可能であったと説明しようとするのは苦痛を伴います。そしてそれこそが、Anthropicが今戦っている課題なのです。

Anthropicがビジネス領域でOpenAIに肉薄

3つ目のニュースは収益に関するものです。ChatGPTの時代が始まって以来、収益面においてOpenAIは常に圧倒的な存在でした。しかし、この半年間で状況は一変しました。今では、ほとんどの収益指標においてAnthropicとOpenAIは互角だと言っていいでしょう。市場に流れるニュースやこの2社から漏れ出てくる情報といった遅行指標を見ることが多いため、両社を直接比較するのは非常に難しいのが実情です。基本的な前提として、両社とも年間収益が300億ドルに近づいているか、それを少し上回るレベルにあり、完全に互角の戦いを繰り広げています。どちらの企業からも出ていない1つの確たる事実は、RAMPからのデータです。彼らは企業のカード決済を処理するビジネスを行っているため、企業がどのようにお金を使っているかを把握しています。彼らが指摘したのは、初めてAnthropicの検証済みビジネス顧客数がOpenAIを上回ったということです。これは、この競争がどれほど接戦であるか、そしてここ数ヶ月でAnthropicがいかに早く差を縮めたかを示す指標です。ここでのより大きなテーマの1つは、収益が健全性を示す一種の先行指標になっているということだと思います。ビジネスにおいて収益は遅行指標として語られることが多く、多くのビジネスモデリングにおいてもその通りなのですが、この状況においては、これらすべての企業がサプライチェーンにかけることになる計算資源への負荷を示す先行指標なのです。Anthropicが直面している現実は、彼らが年間10倍の成長を計画していたのに対し、実際には80倍以上の成長を記録しているということです。これは私の言葉ではなく、ダリオ・アモデイ自身から直接出た言葉です。彼は、成長の予測を過小評価しており、現在直面している成長を支えるための計算資源を必死に見つけようとしていると述べています。これは非常にありがたい悩みですが、現実の問題であり、Anthropicが今後その収益を持続可能なものに保ちたいと計画するなら、対処しなければならない問題です。

Mythosモデルとサイバーセキュリティの脅威

今週の4つ目のニュースは、サイバーセキュリティに関してMythosが特別なモデルであることを示すもう1つの重要な指標についてです。今週、Claude Mythosのプレビュー版に関する2つの独立した評価結果が発表されましたが、そのどちらもサイバーセキュリティの観点から非常に説得力のあるものでした。1つはXBO組織によるもので、もう1つはイギリスのAI安全研究所によるものです。このニュースを手短に言えば、最先端のモデル、特にMythosが本格的なサイバー業務をこなせるレベルに到達したため、セキュリティチームは前提条件を更新する必要があるということです。私はここを強調しておきたいのですが、以前からそれはAnthropicが私たちに語ってきたストーリーでしたが、同時に彼らが私たちにそう語る動機があるストーリーでもありました。ですから、割り引いて聞く必要があったのです。しかし今、独立した評価機関がMythosを見て、うわ、いや、ここには本当にすごいものがある、非常に重要なものだ、我々セキュリティ研究者が細心の注意を払うべきものがここにある、と言っているのを目の当たりにしているのです。彼らが発見した内容に踏み込んでみましょう。まず、テストは非常に本格的なものでした。モデルは実際の攻撃チェーンを一通り処理しなければなりません。偵察、認証情報の窃取、攻撃対象領域内での水平展開、Webアプリケーションの悪用、権限昇格、コマンド&コントロールの永続化、インフラの侵害、そして最終的なネットワークの完全な乗っ取りまでです。これらは難易度の層状に積み重なっています。そしてAI安全研究所は、その攻撃チェーン全体を複数のモデルでテストし、Mythosプレビュー、GPT-5.5、5.5 Cyber、その他のClaude Opusモデル、その他のCodexモデル、そして古いモデルのパフォーマンスを比較するチャートを作成しました。Mythosプレビューは、同じトークン予算で他のどのモデルよりもその攻撃チェーンの奥深くまで到達しました。これが重要なのは、一部にはChatGPT 5.5が並外れて優れたモデルだからです。OpenAIはこれを5.4よりもトークン効率が良いと位置づけており、実際その通りです。そしてOpenAI自身の評価でも、サイバーセキュリティのベンチマークであるCyber Gymにおいて、5.5はOpus 4.7を上回っています。AI安全研究所は、5.5自体が過去のサイバー能力の進歩のトレンドを大幅に超えていると述べています。つまり、それが優れていることを示しているのです。したがって、ここでMythosが勝ったということは、Mythosが弱い基準モデルを打ち負かしたということではありません。トークン消費量が重要な指標となるタスクにおいて、極めて強力なモデルを実際に上回っているということです。そしてこれは一部には、サイバーセキュリティにおいてコストが重要だからです。もしモデルがより少ないトークンで実際の脆弱性を発見できれば、作業はより安く、より速く、そしてより簡単に繰り返せるようになります。防御側にとって、これは本当に良いニュースです。より多くのコードをスキャンし、より多くのシステムをテストし、より多くのパッチを検証し、小さなチームにこれまで持っていなかった能力を与えることができるのです。一方、攻撃側にとっても、同じ経済性が非常に危険なものとなります。検出が難しいバグを見つけるコストが下がれば、深刻な悪用を試みることができる人の数は指数関数的に増加します。だからこそ、このニュースは製品の発表としては、Project GlasswingやDaybreakよりもさらに大きな意味を持つのです。AnthropicのGlasswingは、これらの高度なモデルがもたらすサイバーセキュリティの脅威に対する1つの回答です。信頼できる防御側や重要なソフトウェアパートナーにMythosを提供し、注意不足の攻撃者が先に到達する前に脆弱性を発見して修正できるようにするのです。OpenAIのDaybreakはもう1つの回答です。GPT-5.5と5.5 Cyberを、信頼できるアクセス、Codexのセキュリティ、パッチの検証、脅威モデリング、脆弱性のトリアージ、そしてセキュリティパートナーを通じた防御的なワークフローに押し込みます。展開の種類は異なりますが、根本的な問題は同じです。モデルはバグを見つけるのがうまくなっており、ソフトウェアの世界はそのスピードでパッチを当てるようには作られていないのです。AnthropicとOpenAIの両社がそれぞれ独自の対策を展開している世界において、XBOの評価は有用なニュアンスを加えていると思います。彼らは、Mythosがソースコードの監査、ネイティブコードの脆弱性発見、そしてリバースエンジニアリングにおいて非常に強力であることを発見しましたが、その判断力はまだ玉石混交であるとも述べています。あまりにも文字通りに受け取りすぎることもあり、関連性を誇張することもあります。成功するためには、周囲に検証用のインフラストラクチャが必要です。私がこれを共有するのは、Mythosとその機能について詳しく学んだ結果の教訓が、セキュリティチームを解雇してモデルにやらせよう、であるべきではないからです。そうではなく、セキュリティチームが防御をうまく機能させるためには、モデルを活用したワークフローがこれから必要になるということです。そしてボトルネックはシフトし始めています。バグを見つけることは非常に安価になっていますが、悪用可能性の検証、修正の優先順位付け、開示の調整、パッチのレビュー、そしてどのシステムが重要であるかの判断には、より多くの労力が必要になり、おそらくサイバーセキュリティ専用に設計されたカスタムの仕組みが必要になるでしょう。もしあなたがソフトウェアを所有しているなら、特に認証、決済、ブラウザ、オペレーティングシステム、クラウドインフラストラクチャ、さらにはヘルスケアや金融、産業システム、開発者ツールなどに関わるものであれば、脆弱性発見の曲線が本当に変化したと想定すべきです。Mythosは神話ではありませんでした。最も価値の高いコードベースを選び、許可されている場所ならどこでもAI支援によるセキュリティレビューを実行してください。AIがどのように役立っているかを確認できるよう、自分たちで行う静的解析とは別に発見事項を追跡したいと思うはずです。誰もがパニックに陥る前に再現性を要求する必要があります。パッチと開示プロセスの準備を整え、誰かがこの問いの責任者であることを明確にしてください。モデルがチームで修正しきれないほど深刻なバグを見つけたらどうなるでしょうか。これは現実的な問いであり、これらの高度なモデルへのアクセスを得た途端に、チーム全員で対応しなければならない緊急事態になるかもしれません。それに備えてください。これが今週私たちが学んだ、より大きなサイバーに関するニュースです。AnthropicはMythosにおいて、本当に桁外れのモデルを作り上げました。そのままリリースするのは危険だと言うとき、彼らは決して作り話をしているわけではありません。そしてセキュリティ研究者として、またセキュリティチームとして、私たちはこれに備えるために得られたこの機会を活かす必要があります。12月までにMythosのようなモデルが野に放たれる世界に備える必要があるのです。その間に、私たちの防御を固めておくべきです。そして実は、そのためにこそ、現在一般に利用可能である5.5を使い、またリリースされた暁にはMythosを使わなければならないのです。およそ6ヶ月後にはMythosレベルの能力を持ったオープンウェイトのモデルが一般的に利用可能になることがわかっています。それに備えて、システムをスキャンし、バグをチェックし、システムを堅牢にするために、これらを本当に積極的に使用していく必要があります。

AWSが提供するエージェント向けマネージドデスクトップ

5つ目の、そして最後のニュースは、AIエージェント向けのAWS Workspacesです。退屈に聞こえるかもしれませんが、実は今週出たニュースの中で最も重要なものの1つです。AWSは、AIエージェントがマネージド型のAmazon Workspaces環境内でデスクトップアプリケーションを操作できるようになったと発表しました。これが意味するのは、社内の管理コンソール、ERPシステム、メインフレームのインターフェース、独自のツール、レガシーステータスのソフトウェア、仮想環境など、エンタープライズ内のデスクトップアプリに今も閉じ込められている膨大な量の重要な業務があるということです。そのすべてが今や、マネージドデスクトップ環境内のエージェントで利用可能になったのです。エージェントは人間と同じようにアプリケーションを操作できますが、それは一元化された権限管理、ロギング、監査、スクリーンショット、およびメトリクスを備えた環境内で行われます。そしてこれにより、多くの企業にとって自動化への道筋が変わります。企業は、すべての古いシステムがエージェントネイティブになるのを待つ必要はありません。エージェントは単に、すでに存在するソフトウェアを操作すればいいのです。これは規制産業やバックオフィス業務において特に関連性が高いです。保険金の請求処理、取引の決済、候補者のスクリーニング、社内の財務オペレーション、ヘルスケアの管理業務、保険のワークフロー、調達、レガシーな顧客データベースなどです。これらの業務は価値が高い一方で非常に反復的であり、誰も更新しようとしなかった古いインターフェースの背後に閉じ込められていることがよくあります。しかし、ここには現実的な警告もあります。デスクトップの自動化が強力なのは、まさに明確な統合の境界を迂回できるからこそです。そしてそれは同時に、リスクを伴う理由でもあります。エージェントがデスクトップアプリをクリックして進む場合、エージェントが何をしたのか、なぜそれをしたのか、誰がそれを許可したのか、どんなデータを見たのか、どうやってそれを止めるのかを知る必要があります。スクリーンショットのログは便利ですが、それはガバナンスモデルではありません。ですから、このような機能を見るときの実践的なアドバイスはシンプルです。書き込み権限から始めないでください。読み取り専用から始めるか、ドラフトモードから始めてください。エージェントに情報を収集させてください。フォームを準備させてください。推奨事項の草案を作成させてください。記録の照合や例外のフラグ付けをさせてください。しかし、最終的なコミットのポイントには人間を配置してください。ワークフローが安定したら、エージェントに直接アクションを実行させることができます。ここでのポイントは、すべてのレガシーアプリの問題が突然解決されたということではありません。APIがないから、という言い訳が月を追うごとにどんどん弱くなっており、エージェントは人々が予想するよりも早く、古いエンタープライズソフトウェアのスタックのより多くの領域に到達しようとしているということです。

今後の選択と決断に向けて

さて、振り返ってみて、これら5つのニュースを受けてあなたはどうするでしょうか。もしあなたのチームがNotionを使っているなら、明日やるべきことがありますね。データベースを選び、エージェントのワークフローを設計し、Notionの作業領域を拡張する作業にすぐに取りかかることができます。もしあなたがClaude Codeの有料プラン、20ドルや200ドルのバージョンを使っていて、OpenClawを利用しているなら、今は評価を下さなければならない瞬間です。AnthropicでClaude Codeを使ってClaudeを利用する体制に戻りたいでしょうか。OpenClawが初めて出たとき、多くの開発者がそれを最も気に入っていました。それとも、それ以降に移行した先のものを使い続けたいでしょうか。多くの場合、それはOpenAIのChatGPT 5.5です。私には明確な答えはありません。コストに敏感な傾向がある開発者たちと話して感じたのは、彼らは頭の中で計算をしなくて済むプランを選ぶだろうということです。そして、現在それに最も適しているシンプルなプランは、OpenClawやサイドエージェントがあなたのプランを使用することを認めるOpenAIのアプローチです。単に、はい、できますよ、問題ありません、と言う方が、Anthropicがどれくらい使えるか、上限はいくらか、APIの請求がいつ発生するかをあなたに計算させるよりもずっと簡単なのです。単純な計算が勝つということです。もしあなたがOpenClawを動かすため、あるいはエージェントを使うためにClaudeを使うことに慣れているなら、今週は少し計算をする必要があります。そして私の経験上、ほとんどの人は計算をするのが好きではありません。ほとんどの開発者でさえ計算を好まないものです。Anthropicの下でもらえるクレジットが、OpenClawやエージェントをClaude Codeにとどめておくのに十分だと思うか、それとも他の場所へ移る価値があると思うか、あるいは、Anthropicが4月にサードパーティのアクセスを完全に遮断した際にすでに移行したのなら、他の場所に留まる方を好むかを決める必要があります。現在OpenClawのユーザー、あるいはエージェントのユーザーであり、以前はClaudeでOpenClawを動かしていたなら、今週は計算をしなければなりません。エージェントの利用をある程度プランに戻すというAnthropicの方向転換が、あなたを呼び戻すのに十分なものなのか、それとも移行先のものをそのまま使い続けたいのかを判断する必要があります。多くの場合、人々はClaudeエージェントの課金を非常にシンプルで透明性の高い方法で処理する新しいOpenAIのプランにとどまっています。私にはわかりません。あなたに対する明確な答えは持ち合わせていません。それはあなたが使用しているモデルに依存します。あなたのClaudeが行うタスクに依存します。その割り当てがどれほどトークンを消費するか、またどれくらいの頻度で制限に達することになるかについてのあなたの理解に依存します。したがって、万能の解決策はありません。代わりに、あなたのClaude、あなたのエージェントがトークン消費をどのように処理しているかを監査・確認し、そこからいくつかの計算を行う必要があります。そしてできれば、異なるモデルであなたのClaudeのパフォーマンスをベンチマークテストし、どのように動作するかを確認してください。そうして初めて決定を下すことができます。それこそが、Anthropicが発表したようなニュースに責任を持って対処する方法です。良いか悪いかという単純なものではありません。あなたがモデルをどのように使うか、そしてどのモデルがあなたのワークフローやタスクをサポートするかが重要なのです。そしてもちろん、ソフトウェアセキュリティの分野にいるのであれば、MythosとChatGPT 5.5のトークン効率とその優れた能力は、あなたにとって本当に警鐘となるはずです。Mythosがまだ誰にでも利用可能になっているわけではないことは知っていますが、5.5は非常に優れており、一般に利用可能です。ですから、待たないでください。今すぐAIを使って脆弱性を見つけ、それをどう優先順位付けし、積極的にパッチを当てるかを考えてください。脆弱性とソフトウェア検出に関しては世界が変わろうとしており、その変化は実に急速だからです。そして最後になりましたが、あなたの会社がレガシーなデスクトップソフトウェアに閉じ込められた重要な業務を抱えているなら、そしてほとんどの会社がそうだと思いますが、AWS Workspacesに注目してください。それはすべてのエージェントにデスクトップが必要だからではなく、企業の最も価値のあるワークフローのいくつかが、まさにシステムが古く、視覚的であり、APIファーストではないという理由で滞ってきたからです。私たちが到達した興味深い転換点の1つは、AIがそうしたインターフェースを使用する能力に関することです。2025年にはAIがこれをやるのがひどく下手だったのを覚えていますか。私たちはそれを笑いました。使い物にならないと言っていましたが、それが上達したのです。そしてそれはスケーリング則のおかげです。つまり、スケーリング則によって私たちはコンピュータの操作に長けるようになり、AWSがマネージドデスクトップのような製品を立ち上げることが可能になるレベルに達したのです。これはちょっとしたことではありません。AIができることの限界に次にぶつかったとき、このことを思い出してください。なぜなら、私たちが皆さんの予想よりも早くその限界を突破することを、私は保証するからです。スケーリング則がもたらす結果の1つは、指数関数的成長の影響というものは、それが飛び出してきて私たちの顔を殴りつけるまで、私たちにはよく理解できないということです。デスクトップを使う能力、ソフトウェアを使う能力、現在のエンタープライズスタックに飛び込んで、APIは必要ありません、MCPを作ってもらう必要もありません、エージェントがそのままソフトウェアを使えます、と言える能力。コンピューティングの世界の残りの部分にそれがもたらす意味について、多くの人々はまだ完全に準備ができていないと私は思います。もしAIがここ数ヶ月の間に、人間と全く同じようにソフトウェアを使えるほど優秀になったのだとしたら、次は何が起こるのでしょうか。この問いを皆さんへのメッセージとして残しておきます。もしこの記事を楽しんでいただけたなら、また近いうちに新しいニュースを持ってお会いしましょう。チャンネル登録をお願いします。それでは楽しみましょう。

コメント

タイトルとURLをコピーしました