Claude 4.5が30時間でSlackを構築—テスト後の私の見解

Anthropic・Claude・ダリオアモデイ
この記事は約11分で読めます。

本動画では、AI業界における2025年10月最新の重要ニュースを解説している。特に注目すべきは、AnthropicがリリースしたClaude Sonnet 4.5の圧倒的な能力である。このモデルはExcelやPowerPointの作成・編集に優れ、30時間連続でSlackアプリを再構築した実績を持つ。WalmartはすでにAIエージェントを200以上のツールに展開し、95%のバグ自動修正率を達成している。OpenAIはChatGPT PulseとSoraを通じて広告プラットフォームへの参入を示唆し、マーケティング業界に20年ぶりの大変革をもたらす可能性がある。AWSはオープンソースのAIエージェント基盤を提供してクラウド収益の維持を図り、Microsoftは初めてCopilotに他社モデル(Claude)を統合することで競争に対応している。Salesforceはエンタープライズ向けバイブコーディングツール「Agent Force Vibes」を投入し、企業内での自然言語コーディングの普及を狙う。これらの動きは、AIエージェントの時代が既に到来しており、企業規模での実用化が進んでいることを明確に示している。

Claude 4.5 Built Slack in 30 Hours Straight—Here's My Take After Testing
What mattered most this week?Everyone's obsessed with Sora but for the wrong reasons, and we're all forgetting the other...

手短に

私は皆さんが時間を費やさなくて済むよう、何十時間もかけてニュースを追いかけています。そして今回は、AIに関して皆さんにとって重要なニュースを、たった10分でお伝えします。

Claude Sonnet 4.5の衝撃的な能力

まず一つ目、AnthropicがClaude Sonnet 4.5をローンチしました。なぜ気にすべきなのか。このモデルがExcelファイルの作成と編集、そしてPowerPointの作成において極めて優れた能力を持つ初のモデルだからです。

また、非常に強力なコーディングDNAを持っています。このモデルは有名な話として、30時間連続でコーディングを続け、Slackを一から再構築しました。一つのタスクを与えたら、それをやり遂げたのです。私がこれまでテストした中では30時間のランタイムは見ていませんが、これまで見た中で最も長いランタイムを確認しています。このモデルは時間をかけて問題を考え抜き、正確に解決することを好みます。

そして強力な「作業を確認する」という姿勢を持っています。なぜ気にすべきかというと、これが私たちを自律型開発の未来へと駆り立てているからです。ただし、適切な問題空間に対して設定した場合にのみ機能します。機能するフレームワーク内でアーキテクチャを構築し、与えるタスクについて考える必要があります。コーディング環境外での私のテストでは、同様の制約と機会を見つけました。

PowerPointのために良いプロンプトを与えれば、素晴らしい成果物を生み出します。しかしPowerPointのために粗雑なプロンプトを与えると、構築が困難で読みにくいものができてしまいます。これが重要なのは、あなたの意図を優先し、作業を定義する能力を優先するからです。作業を定義できるなら、これは超強力なツールです。

Walmartの大規模AIエージェント展開

二つ目のストーリー、WalmartがWBというひどい名前のスーパーエージェントを200以上のAIツールに展開しました。なぜ気にすべきかというと、AIエージェントが今まさに世界最大級の企業で実際に稼働しており、価値を提供していることを示しているからです。バグに対して95%の自動修正率を達成しており、開発環境内の複雑なエコシステム全体でそれを実現しています。今日、実際に展開されているのです。

これは、AIオーケストレーションがすでに大規模に実現していることを示し、思い出させてくれます。そして彼らが複数のワークフローにまたがって使用しているフェデレーテッド・エージェント・モデルは、作業を行うエージェントのために非常に複雑な複数ワークフローのフットプリントを設定できることを強調しています。なぜ気にすべきか。もしエージェントが来ると信じていなかったなら、来るということです。

そしてエージェントが来ると信じていたなら、実際に構築して大規模に展開できるということです。適切なワークフローを持ち、意図を適切に定義し、それをオーケストレーションすることの関数に過ぎません。これについてはさらに詳細があります。私はこれについて深掘りするつもりです。

OpenAIの広告プラットフォーム参入

三つ目のストーリー、OpenAIがChatGPT PulseとSoraをローンチしました。

私がこれらのストーリーをまとめているのは、OpenAIにとって意図的に一緒だからです。OpenAIは先週、二つの新しい広告面をローンチしました。なぜか。彼らは広告ビジネスを追いかけています。なぜ気にすべきか。マーケティングをしているなら、予算配分の観点から気にすべきです。プロダクトを構築しているなら、自分のプロダクトがどこに表示されるかを考える必要があるため気にすべきです。

チャットだけでなく、今や潜在的にプロダクト提供として表示される可能性があります。そうです、これが単なる消費者向け広告プラットフォームになると仮定しているわけではありません。私たちがAIを使用する方法を考えると、これはおそらくB2B広告プラットフォームにもなるでしょう。これはマーケティングにおける過去20年間で最大の発展の一つになるでしょうし、私たちはそれを目にし始めることになります。そして今週、その最初のプロダクト面がローンチされたのを見ました。

ですからSoraに注目してください、Pulseとそれらが向かう先に注目してください。それらは未来を指し示しており、また、ちなみにChatGPTの戦略の重要な要素を強調しています。彼らはモデルを見て、準備ができたと判断したら、それに対する面を見つけて投入します。私は主張しますが、彼らはこれを言っていませんが、Pulseは独自のChatGPTモデルだと主張します。

一晩でPulseから得られる結果は非常に高品質で、標準的なChatGPT 5から得られるものとは質的に異なります。Soraはもちろん、独自のモデルです。非常に有名なSora 2ですよね。彼らはSora 1でそれを持っていましたが、まだ準備ができていませんでした。消費者向けプロダクトをローンチしませんでした。今や彼らはそれを持っていると感じ、消費者向けプロダクトをローンチしています。

これは、OpenAIが2026年に今後のモデルのローンチにどのようにアプローチするかを示唆しています。その会社からより多くの全く新しいプロダクトを期待してください。

AWSのエージェント基盤整備

次に、AWSがエージェントコアMCPサーバーをローンチしています。なぜ気にすべきか。これは本当にAWSが追いつこうとしていることについてです。彼らは、ランタイム、ゲートウェイ統合、アイデンティティ管理、メモリ、その他すべてが組み込まれた、本番環境対応のAIエージェントを構築するためのオープンソース基盤を提供しています。

このサーバーは、Anthropic Cloud Code、Cursorなどを含む40以上の異なるMCP対応クライアントと統合されています。そして開発者に、外部ツールを安全に呼び出すことができ、セッション間でコンテキストを維持できるエージェントを構築するオプションを提供します。なぜ気にすべきかわかりますか。なぜならAmazonはクラウド収益を維持するためにオープンソースに傾倒しているからです。

そしてAWSを使っているなら、おそらくあなたにとって素晴らしい取引です。AWSを使っていないなら、これが切り替える理由になるかどうかはわかりませんが、注目すべき事柄です。なぜならMicrosoftとGoogleが今、独自の方法でオープンソースのエージェント基盤にこれほど強く傾倒するプレッシャーを受ける可能性があるからです。彼らもいくつかやっていますよね。GoogleからA2Aキットがありますし、Googleのエージェント開発キットもあると思います。

ですから、ここでいくらかの作業が行われています。AWSは開発者が構築する場所になることに強く取り組んでいます。なぜなら彼らはクラウド収益を維持する必要があるからです。そしてそれは、AzureとGoogleがAIネイティブ組織で本当に勢いを得ていることを示唆しており、それは最近の四半期決算で明らかになっており、それはパワーバランスをシフトさせ、最終的に開発者とビルダーがどこで構築することを好むかに影響する何かです。なぜなら、最近AIで構築していないなら、どこで構築しているのかという話ですから。

Microsoft Copilotの戦略転換

次のストーリー、Microsoft Copilotが他のモデルへの扉を開いています。初めて、Claudeモデルと連携するCopilotが登場し、Copilotエコシステム内でマルチエージェントエンタープライズ戦略のアイデアが生まれています。これはMicrosoftがすでにAzureでこれを行っており、Azureが安全なサンドボックス内で複数のモデルを取得できる場所であったため、それほど驚くべきことではありません。

しかし彼らはCopilotでさらに一歩進んでいます。サティア・ナデラが認識しているのは、人々にCopilotとAI Microsoft生産性体験について関心を持ってもらう必要があるということです。そしてそれが、彼が独自のプロプライエタリなAIモデルを持つことができず、それを機能させるために他の人々のモデルを取り込む必要があることを意味するなら、彼はそうするでしょう。なぜなら彼はCopilot製品に対する注目と配信のフットプリントを保持する必要があるからです。

それは次世代のOfficeです。そして私がサティアなら、私も心配するでしょうし、今リリースするでしょう。なぜなら、このアップデートで最初に共有したストーリーであるSonnet 4.5の力があるからです。SonnetはMicrosoftが何十年も支配してきた仕事のプリミティブを攻撃しています。彼らはExcelを追いかけています。

PowerPointを追いかけています。Docsを追いかけており、それをうまくやっています。Microsoftはむしろ彼らに参加したいのです。つまりMicrosoftはむしろ彼らを仲間に引き入れ、Copilotで彼らと協力し、Microsoftのために配信上の優位性を確保したいのです。なぜならソフトウェアのCDを出荷していた時代から、MicrosoftはこのOfficeでの配信上の優位性に基づいて構築してきたからです。誰もがWindowsを使っています。

これが、Slackが何をしようと実際には重要ではない理由です。重要なのはTeamsが何をするかです。なぜならTeamsには配信力があるからです。ですから気にすべき理由は、これが主要なエンタープライズプラットフォームが自社ソフトウェアを販売するために使用しているのと同じインターフェース内で競合するAIモデルを提供する最初のケースだからです。

そうですよね。これは、複数のモデルのバックエンド開発者の可用性がある場合に見られたものよりもはるかに統合されています。これは違います。最終顧客として、どのモデルが欲しいかを選択できるのです。私たちは、AIのベンダーロックインが単に維持できなくなる可能性があるほど十分な競争を見始めています。そしてそれは重要になるでしょう。

競争圧力は強まるでしょう。私たちは、このような動きのおかげで、IT部門がより良い条件を交渉できるようになり始めるのを目にすることになります。

Salesforceのバイブコーディング参入

六つ目のストーリー。Salesforceがエージェントフォース・バイブスを出荷しています。私ならそうは呼ばなかったと思いますが、ここにあります。

彼らは自然言語コーディングをエンタープライズ環境に持ち込もうとしており、Salesforceらしさの全てに傾倒しています。彼らは、組み込みのセキュリティガバナンスとコンプライアンス管理を備えていると言っています。多くの点で、これはまさにTeamsとSlackの会話と同じですが、皮肉なことに、この場合はSalesforceが配信上の優位性を持っている側です。LovableやBoltのようなツールに対して、これらには長期的なSaaSエンタープライズ契約がありません。

Salesforceにはあります。そして彼らはCTOのところに行って、「ああ、Lovableについて聞いたことがありますね。私もバイブコーディングが大好きです。Agent Force Vibesを使ってみませんか」と言うことができます。そしてこのプラットフォームには特別な自律型AIエージェントが含まれています。Salesforce組織に接続できます。あなたのデータと安全に対話できます。

実際に安全に構築することを可能にします。これはSalesforceの、より良い言葉がないので言いますが、バイブコーディングのコパイロットを構築する戦略です。彼らが望んでいるのは、エンタープライズ開発者にフットプリントを拡大する方法を提供し、プロダクトマネージャー、マーケター、その他の組織内の人々と、すべてのシャドーITを持つのではなく、システムに統合された方法で作業できるようにすることです。

彼らがなぜそれをやっているのかわかります。セキュリティ第一が魅力的である理由もわかりますが、注目すべきは、このツールに関する実際の使用状況と会話です。これをCTOに販売するのは簡単です。しかし、LovableのようなシャドーITを使ってすでにバイブコーディングを行っているプロダクトマネージャー、マーケター、CSリーダーに、このようなツールが実際に良くない場合に移行するよう説得するのは簡単ではありません。そしてそれが本当のトリックです。

ソフトウェアを販売することはできますが、人々に使わせることはできません。ですから私が注目しているのは、実際に優れたエンタープライズ構築のバイブコーディングツールが得られるかどうかです。私は評決はまだ出ていないと思います。そしてそれが今週重要だったニュースです。

コメント

タイトルとURLをコピーしました