Claude Cowork:Anthropicが提供する初の汎用エージェント

Anthropic・Claude・ダリオアモデイ
この記事は約10分で読めます。

AnthropicがリリースしたCoworkは、非開発者向けに設計された初の汎用AIエージェントである。Claude Codeの機能をベースとしながら、ローカルファイルへのアクセス、カレンダーやSlackなどの外部サービスとの連携、Chromeブラウザの操作が可能となっている。デスクトップのファイル整理からYouTube動画のトランスクリプト分析、包括的なレポート生成まで、知識労働の自動化における実用例が紹介されている。Claude Sonnet 4.5とOpus 4.5を使い分けながら、bashコマンドを実行し、複数のタスクを並行処理できる点が特徴である。現在はMaxプラン加入者向けのプレビュー版として提供されており、わずか1週間半で開発されたこのツールは、Claude Code自身によってほぼ全てのコードが書かれたという。コネクターやスキル機能により拡張性も高く、今後の知識労働自動化の方向性を示す重要なステップとなっている。

Claude Cowork: First General Agents from Anthropic
In this video I dive into @anthropic-ai new "Cowork" agent, a desktop application that gives AI the power to access your...

Claude Cowork:非開発者のための汎用AIエージェント

Anthropicが先日リリースしたCoworkは、本質的にはClaude Codeを非開発者、つまり一般のユーザー向けに提供するものです。これはAnthropicが汎用エージェントに向けて踏み出した最初の一歩だと思います。このエージェントは皆さんのコンピューター上で動作し、作業を行います。ブラウザを使用できるエージェントの話ではありません。このエージェントはローカルファイルにアクセスでき、皆さんが通常行う知識労働に本当に役立つと思います。

これは本質的にClaude Codeのラッパーです。ですから、Claude Codeが持つすべての機能はCoworkでも利用可能です。しかし、さまざまなコネクターにもアクセスできます。例えば、カレンダーに接続したり、Slackに接続したりできます。また、Claude Codeと同様にスキルも使用できます。機能はすでにそろっています。

これは単に、非開発者が使いやすいように設計された別のインターフェースなのです。ここに、私たち全員が共感できる興味深い例があります。ここでは、エージェントにデスクトップを整理するよう依頼しています。実は私も自分のデスクトップで試してみようと思っています。今、かなり散らかっているので。エージェントは計画を立て、必要に応じて明確化のための質問をし、それから皆さんの許可を得て実際にその操作を実行します。

インターフェースと使用方法

こちらがインターフェースの見た目です。Claudeデスクトップアプリの中に、チャット、コード、そして今回のCoworkがあります。現在、これはMaxサブスクライバーのみが利用できます。おそらくProプランにもリリースされるでしょうが、現時点では早期アクセスまたはプレビュー版です。使い方としては、特定のフォルダで操作を実行したい場合、そのフォルダを指定する必要があります。

ここからフォルダを選択して、Claude CodeやClaudeデスクトップとチャットするのと同じように指示を出すだけです。さらに驚くべきことがいくつかあります。まず第一に、これはわずか1週間半で構築され、ほぼすべてのコードがClaude Codeによって書かれたようです。これらのコーディングエージェントが非常に有用になってきていることを本当に示しています。

デスクトップ整理の実演

最初のテストとして、デモと同じようにデスクトップを整理するよう依頼してみます。デスクトップ上のすべてのファイルを整理してもらえますか。何をするか見てみましょう。コンピューター上で操作を行う場合、特にそうですが、何かを実行したい場合は、そのフォルダへのアクセスを許可する必要があります。

また、特定のファイルにアクセスさせたい場合は、それらをコンテキストとして追加できます。コネクターインターフェースを通じて管理できる多数の異なるコネクターがあります。マシン上で破壊的な操作を実行できるため、非常に注意する必要があります。デスクトップを整理してもらえますか。送信します。現在、Sonnet 4.5を使用しています。

この操作にはOpus 4.5の知能は必要ありません。基本的に、これはbashコマンドを実行しています。ここで、To-Doリストを作成しました。場合によっては、許可を求めたり、いくつかの質問をしてきたりします。この場合は、何も聞いてきていません。ファイルタイプに基づいて整理を開始したようです。

基本的にClaude Codeが行うようにコードを書いて、それらの操作を実行しています。右側には、進行状況、作成される異なるアーティファクト、使用している具体的なコンテキストが表示されます。これは非常に便利です。なぜなら、ユーザーとして、エージェントが現在何をしているのかを正確に把握できるからです。

これによると、デスクトップが整理され、さまざまなフォルダが作成されました。かなり良いですね。複数の異なるタスクを並行して実行できます。ここで別のタスクを作成します。このケースでは、すべてのYouTube動画が保存されているYouTube動画フォルダを使用します。これらの動画の一部には、トランスクリプトが付いています。

YouTube動画分析タスク

このエージェントを使って統計を作成し、整理したいと思います。この作業にはOpus 4.5を使用します。このフォルダ内のいくつかのサブフォルダには動画のトランスクリプトがあります。すべてのトランスクリプトを見て、作成した動画の主なテーマを特定してください。どのようなトピックをカバーしてきたかを示すさまざまな探索的プロットを作成してください。

トランスクリプトに基づいて作成した動画の長さはどれくらいか、そして今後注力すべき潜在的なテーマは何かを教えてください。これにはかなりの分析が必要になるので、Opus 4.5を使用します。繰り返しになりますが、フォルダの構造を調べるためにbashコードを書いています。フォルダ自体には異なるサブフォルダがあります。

合計で47のトランスクリプト付きファイルが見つかったようです。依存関係をインストールしているようです。これは非常に素晴らしいです。なぜなら、非開発者として、かなり複雑な操作を依頼できるからです。ただし、コンピューター上でアクションを実行できるため、どのようなアクセスを許可するかに注意する必要があります。

また、破壊的な操作も実行できます。これは、エージェントシステムで自動化できる知識労働の最初の一端だと思います。これはまだリサーチプレビューなので、多くの異なるミスをすると思います。このようなエージェントシステムの適切なUI/UXが実際にどのようなものかはわかりません。

ですから、OpenAI、Google、xAIといった他の企業から異なるアプローチが出てくる可能性があります。これは追跡するのに非常に興味深い分野になるでしょう。すでにいくつかのアーティファクトが入ってきています。これらのプロットを実際に見ることができます。より包括的なレポートを作成するか、最後に依頼できると思います。今のところそれは行っていないようですから。

これらのプロットだけが作成され、テキストドキュメントの形式で包括的な分析があります。調査結果に基づいて、作成したすべての異なるプロットを説明する包括的なレポートを作成してください。正確に何を見つけたか、そして推奨事項も含めてください。レビューできる単一のPDFファイルを必ず作成してください。

送信します。例えば、フォルダにたくさんの異なるプロットを提供したり、いくつかのPDFファイルを提供したりして、Coworkにそれらを分析して包括的なレポートを作成してもらうことができます。繰り返しになりますが、Claude Codeと同じようにbashツールを使用しています。最後にこのPDFファイルを作成しました。開いてみましょう。

分析結果の確認

興味深いですね。ファイルを作成しなかったか、ここでPDFファイルを開けないのかもしれません。ファイルは作成されましたが、開くことができなかったようです。統計によると、47の異なるトランスクリプトを分析しました。約10時間分の動画だと考えています。平均時間は13分です。それは正しそうです。

コアフォーカスは大規模言語モデルです。これは私のすべての動画ではありませんが、66%がインフラ関連で、モデルのリリースやニュースが約60%、コンテキストエンジニアリングが51%、RAGが約36%です。これらは私の最近の動画の一部です。使用した方法論がここにあります。内部的にはClaude Codeを使用しており、探索的分析に非常に優れています。この分析は私が行っていることに非常に関連しているように見えます。

実際にキーターム分析を行いました。最近、Gemini関連のコンテンツをたくさん作成しているようです。エージェントもよく言及されているようです。いくつかの推奨事項として、RAGのカバレッジは強力ですが、エージェント的なドキュメントワークフロー、ドキュメント分析のためのマルチエージェントシステムについてさらに深く掘り下げる機会があり、これらは高い需要があります。これは今年カバーしたかったトピックです。

マルチモーダルアプリケーション、AIエージェントフレームワークの詳細な解説も、私が潜在的に取り組める別の機会です。実際にかなり良いです。この簡単な例のアイデアは、さまざまなタスク、特に探索的分析を割り当てることができ、また何らかのアクションも取れるということです。この新しいCoworkについて本当に気に入っている点の一つは、すべてのアカウントにログインした状態でChromeを使用できることです。したがって、必要に応じてウェブ上で操作を実行するよう依頼できます。

Chromeブラウザの操作とコネクター

例を示すために、Chromeを開いて、TeslaとAppleの現在の株価を見てもらえますか。例えば、カレンダーへのアクセスを許可すれば、カレンダー上で操作を実行できるようになります。これが正確に何をしているかです。現在、Tesla株を見ています。今、Appleに移動しています。私が実際にアカウントにログインしていることがわかります。

したがって、異なるサービスで私の認証情報を使用して操作を実行できる可能性があります。いくつかの安全対策が組み込まれています。これは非常に有用になる一方で、潜在的な安全関連の懸念にも注意したいところです。これはウェブにアクセスできるだけでなく、ローカルマシン上でも操作を実行できるため、多くの異なる可能性が開かれます。

いくつか他のことがあります。コンテキストとして特定のファイルや写真を提供したり、これらのコネクターを使用したりできます。コネクターは外部世界とのやり取りを可能にします。これが私のコンピューターにあるコネクターのリストです。カスタムコネクターも含めることができます。コネクターとは別に、Claude Codeの上に構築されているため、スキルにもアクセスできます。

独自のスキルを作成すればそれを使用できますし、Claude Codeに付属している組み込みのスキルも使用できます。Maxプランに加入していれば、アクセスできるようになります。Claude Codeでこれが表示されない場合は、最新バージョンをダウンロードしてください。私は実際に既存のバージョンをアンインストールして、新しいバージョンをダウンロードする必要があり、そうしたら表示されました。いくつかのことがあります。

現在の課題と今後の展望

現時点でコネクターにいくつか問題があるようです。当たり外れがありますが、うまくいけば今後のアップデートでこれらの問題は修正されるでしょう。PDFを適切にロードできなかったことはすでに見ました。繰り返しになりますが、これらは小さなバグであり、リサーチプレビューです。したがって、これらの問題はすぐに解決されることが期待されます。

しかし、ここで重要なのは、通常のチャットセッションと比較して、ここでどのような操作を実行できるかを考える必要があるということです。ここで見た唯一の利点は、ローカルマシン上のファイルを使用できることです。提供されたコンテキストを見るだけでなく、フォルダを見て、そこで操作を実行できます。

これはClaudeデスクトップアプリで行える通常のチャットセッションに比べて本当に大きな改善です。これは、本質的にClaude Codeのラッパーであるという事実から来ています。これにより、Claude Codeの機能が非開発者に提供され、これもまた非常に素晴らしい体験です。UIは非常にクリーンです。

時々、明確化が必要な場合、実際に「ユーザーに質問する」ツールをトリガーします。これについては、私の動画の一つで取り上げました。とにかく、Maxプランに加入している方は、ぜひ試してみてください。気に入っていただけると思います。この動画が役に立ったことを願っています。ご視聴ありがとうございました。いつものように、次回またお会いしましょう。

コメント

タイトルとURLをコピーしました