AnthropicがClaude用に新しいブラウザを作らなかった理由――それより賢い選択をした

Anthropic・Claude・ダリオアモデイ
この記事は約22分で読めます。

AnthropicのClaude Chrome拡張機能は、単なるチャットボットではなく、実用的なブラウザエージェントである。ユーザーが反復的に行う作業をワークフローとして記録し、スケジュール実行することで、週に数十時間の作業時間を削減できる。カスタマーサービスとの交渉、メール管理、Google Driveの整理、複数タブからのデータ抽出など、ブラウザ上で行う様々なタスクを自動化可能だ。開発者向けには、Webサイトのデバッグやテストを自動実行する機能も提供される。ただし、データ量が多いタスクでは精度に課題があり、信頼できるサイトでのみ使用すべきという注意点もある。重要なのは、プロンプト技術ではなく、自分の反復作業を明確に定義してエージェントに委譲できるかという能力である。

Anthropic Didn't Build a New Browser. They Did Something Smarter.
My site: Story w/ Prompts:

Claudeのブラウザ拡張機能が見過ごされている理由

みなさんは、Claudeのブラウザ拡張機能についてあまり注目していないと思いますが、実はこれは見過ごすべきではないツールなんです。なぜなら、これは基本的に大規模言語モデルを地球上で最も人気のあるブラウザの中に配置して、私たちが日々多くの時間を過ごす場所で使えるようにしているからです。そして「無料のエージェントが欲しいですか?インターネット上で役立つ作業をしてくれますよ」と言っているわけです。

実は、反復的に行う作業を定義できれば、触りたくない仕事を定義できれば、それをインターネット上のClaudeに渡して、Claudeにやってもらうことができるんです。

これによって、実際の人々が週に数十時間も節約できるようになります。なぜなら、私たちの多くは、インターネット上で苦痛と労働としか言いようのない作業をたくさんやっているからです。そうでしょう?ただそこに座って「ああ、また3つの異なるウェブサイトに行って、週次レポート用にすべての数字を引っ張ってこなきゃいけない」とか、「今日はT-Mobileに電話してカスタマーサービスと話して割引してもらわなきゃいけない。嫌だな」とか、「今週の15個の会議を移動して、もっと管理しやすいようにブロックする方法を考えたくないな」なんて思っているわけです。

まさにそれが、ブラウザ内のClaudeの目的なんです。

このビデオでは、それが何なのかを掘り下げていきます。お互いに積み重なっていく具体的な例を紹介しますので、かなり洗練された動作にどうやって到達できるかがわかるはずです。そして、あまり語られていないことについてお話しします。それは、ブラウザ内のClaude拡張機能を使うのと、ターミナルでClaude Codeを使ってChromeを操作するのと、あるいはAnthropicがローンチしたアプリであるCoworkを使ってコンピューター上でエージェントアクションを実行してChromeを操作するのとの違いです。

つまり、Chromeを操作する方法はたくさんあるんです。混乱するかもしれません。その違いを整理していきます。ブラウザ拡張機能に主に焦点を当てます。なぜなら、私たちのほとんどはChromeを使っているからです。Chromeは別途インストールする必要がなく、ほとんどのコンピューターに最初から入っています。

なぜこれが重要なのかについて話していきます。超実践的にいきましょう。

AIにカスタマーサービスの戦いを任せる

お気に入りの使い方の一つから始めましょう。AIにあなたのカスタマーサービスの戦いをさせる方法です。

Carl Vottiさんは、プロダクトマネージャーであり、クラウドコードのインストラクターです。今年、彼はAT&Tとの請求紛争について語ったスレッドを投稿しました。AT&Tに関するこの小さな投稿がバイラルになった理由は、Carlが電話で45分間保留状態で待つようなことをしなかったからです。

彼は自分でチャットボットに入っていきませんでした。代わりに、Chrome拡張機能を使ってClaude Codeを起動し、AT&Tのライブチャットを開いて、Claudeに自分が欲しいもの――最近の障害に対する返金――を伝えました。

Claudeが会話を進めました。エージェントの応答を読み、文脈に沿った返信を入力し、最初の提示額が低いときには押し返しました。エージェントが引き延ばそうとしたときには、丁寧にエスカレーションしました。そして最終的に、Claudeは交渉して100ドルのクレジットを勝ち取ったんです。

さて、皆さんが考えていることはわかります。「これはClaude Codeじゃないか。同じものじゃない。ターミナルに入力してClaudeにブラウザを使わせなきゃいけないんでしょ?」と。いいえ、ポイントは、ブラウザ内のClaudeが機能するということです。

ターミナルからClaudeを使うこともできます。それが快適なら。しかし、素敵な拡張機能のサイドバーから直接使うこともでき、まったく同じ結果が得られます。だからこそ、素敵な拡張機能のサイドバーがあるんです。

基本的な仕組みはまったく同じです。Claudeはアクティブなページのテキストを読み、入力フィールドに入力し、ボタンをクリックし、場合によってはナビゲートする必要があります。

こうしたやり取りはすべて、あなたがClaudeにタスクを与えると自動的に行われます。

正直に言うと、CarlさんもPrivも、これが速くないことに気づいています。Claudeはこういった作業を完了するのに特別速いわけではありません。だから、人間がやるよりも時間がかかります。しかし、メリットは本当に明確です。

人間であるあなたは、それをやらなくていいんです。ですから、もし何か利益が欲しい、価値が欲しい、電話料金のクレジットバックが欲しいといった場合で、エージェントに作業させながら待つ価値があるなら、とてもシンプルなユースケースで、あなたのポケットにお金を戻すことができ、しかもあなたは何もしなくていいんです。

そして先ほど言ったように、Carlさんはコードを使いましたが、サイドバーを開けば同じ原理がブラウザ内で機能します。

最終的に、ここでの大きなパターンは、ブラウザ内にチャットウィンドウがあれば、そのチャットウィンドウはClaudeで操作できるということです。AT&Tだけではありません。Verizonでも、あらゆる種類の公共事業会社でも。Amazonのチャットボットでも。画面に入力できるものなら何でも、Claudeがあなたの代わりに入力できるようになったんです。

それがブラウザ拡張機能と同じくらい簡単なんです。

反復作業を自動化するためのプロアクティブなエージェント

私が強調していることの一つは、エージェントがうまく機能するためにはプロアクティブである必要があるということです。そして、ClaudeはChrome拡張機能で最初からそれを組み込んでいます。これは、最終的に単一の巧妙なトリックを有用な反復作業に変える機能です。

もし「Claudeはどうやって反復的に何をすべきか知るのか、どんな反復作業をするのか」と疑問に思っているなら、実際に動く例を挙げて説明しましょう。

たとえば、あなたの仕事が分析データを引っ張ってくることだとします。Claudeにこれをやってもらいたいとき、「Claude、これをやって」とたくさんのテキストを入力するわけではありません。代わりに、拡張パネルの記録アイコンをクリックします。

Claudeに学んでほしいタスクを実行します。ダッシュボードから分析を引っ張る、競合他社の価格ページをチェックする、CRMからデータを抽出する、何でもいいです。ブラウザでできることなら何でも、Claudeは見ることができます。

それから記録を停止します。そのワークフロー全体をClaude拡張機能でショートカットとして保存します。

これで、そのショートカットをスケジュールできます。毎日実行するようにスケジュールすることもできます。毎週、毎月、または年に一度でもいいです。時計アイコンをクリックするだけです。頻度を設定すれば、Claudeは自動運転でタスクを実行します。あなたは必要ありません。リマインダーも必要ありません。コンピューターが起動していてブラウザがアクティブである限り、実行されます。

そして、これは本当に機能します。

LinkedInの招待を引っ張ってきて、誰があなたとつながろうとしているかを見る定期的なショートカットを設定できます。お気に入りのYouTube動画、たとえばこの動画のようなものをチェックして、いつでも取得できるリンクにリストアップする定期的なショートカットを設定できます。メールを見て、あなたが気にするものだけを抽出する定期的なショートカットを設定できます。地元の近所の新しいレストランをすべて探して、金曜日に行けるリストを作成する定期的なショートカットを設定できます。

こういったものの一部は個人的なもので、一部は仕事用です。でも、それは関係ありません。ポイントは、ウェブ上でできることで、一度以上やらなければならないことなら、Claudeのショートカットを作ってやってもらえるということです。

スケジュールに沿ってやらなければならないことはどれだけあるでしょうか?特に仕事では、「毎週月曜日にこのレポートを実行するように」「この顧客に隔週で返信するように」「3つのスレッドを要約して、金曜日の午後までにVP向けに明確なメモにまとめるように」といった具合です。

こういった作業はすべて定期的で、やらなければならないとわかっています。私がマーケティングアナリストだったとき、上司向けに週次レポートを作る必要があって、これがあったら喜んでやっていたでしょう。なぜなら、その多くは基本的にウェブを回って、Marketoのログイン状態からこれを引っ張って、Instagramのログイン状態からこれを引っ張って、あれやこれやと、そういうことだったからです。

ワークフローを記録して実行して、データを取得できるというのは本当に素晴らしいことです。

基本的に、何かを記録してClaudeにやってもらえるなら、世界はあなたの思いのままです。

受信トレイのトリアージとGmail統合

別のものに移りましょう。これは本当に人気が出るはずです。受信トレイのトリアージです。

これが人気なのは、メールが好きな人がほとんどいないからです。

実際、OpenClawの最も人気のあるユースケースを見ると、メール処理なんです。でも、そのためにOpenClawを使う必要はありません。ブラウザでGmailを開けば、ブラウザ内の拡張機能としてのClaudeが小さなサイドパネルとして、あなたがそこにいることを認識します。Gmailのアイコンがポップアップして、「何をしたいですか?」と聞いてきます。

Claudeに受信トレイをスキャンさせ、マーケティングメールを特定させ、ニュースレターを特定させ、重要なメッセージを引っ張らせることができます。

ここで強調したいことの一つは、これが3番目のユースケースであって、単に「これもできますよ」というだけではない理由です。Anthropicはメールが本当に人気があることを認識していて、Claudeが世界で最も人気のあるメールサービスであるGmailとうまく連携するように作業を行っています。ですから、サポートドキュメントでは、ClaudeがGmailのような人気プラットフォームをナビゲートする方法についての組み込み知識を持っていることが確認されています。

つまり、ステップバイステップの指示を与える必要がないんです。言い換えれば、Anthropicは私たちが一日のほとんどを過ごすウェブ上の人気のある場所を取り上げて、Claudeが最初から、あなたからの具体的な指示なしに、それらの使い方を知って認識するようにしているんです。

これは大きな意味を持ちます。でも、私の言葉を鵜呑みにする必要はありません。

TechradarのEric Schwarzさんも、Claude拡張機能のハンズオンレビューでこれをテストしました。彼はメール側とカレンダー管理側の両方をテストしました。そして、本当に意味のある作業をさせることができました。

ClaudeはGoogleカレンダーをスキャンしました。空いている時間枠を提案しました。イベントのゲスト向けにメールの下書きを作成しました。

そして、Googleドライブにある約900個のバラバラなドキュメントを整理させることもできました。そうです、ClaudeはGoogleドライブも認識します。

Claudeは論理的なフォルダ構造を作成できました。ドキュメントをサブフォルダに分類できました。重複をフラグ付けできました。

つまり、Claudeは基本的にGoogleエコシステム内で、メール、カレンダー、ドキュメント、ドライブのために機能し、Ericさんが大規模に有用な作業をできるようにまとめたんです。

ここで注意したいことの一つは、自動メール返信についてです。メールは高価値です。特に重要なステークホルダーへのメールは。

この段階で私がやらないことは、Claudeに「受信トレイの重要なメールを見つけて、自動的に返信の下書きを作って」と言うことです。これには、Claudeが間違った人に間違ったメッセージを送るリスクや、誤って下書き保存ではなく送信を押してしまうリスクがあります。

基本的に、受信トレイのクリーンアップには使ってください。Googleドライブのクリーンアップには使ってください。カレンダー管理には使ってください。それらはすべてうまく機能します。送信機能や下書き機能については、あなたが目を通さずにステークホルダーに送ってしまうリスクがないと確信できるまで、慎重になってください。

複数タブでの作業とタブグループ

もちろん、複数のタブにまたがる作業が必要な場合もあります。

複数のレシピを今夜の夕食にまとめなければならないとか、複数の競合他社のウェブサイトを見てすべてから価格を取得しなければならないといった場合です。

Claudeにその作業をサイトごとに拡張機能でやらせる代わりに、すべてのサイトを開いておいて、Claudeにグループで取り組ませることで時間を節約できます。

これを行う大きな方法は2つあります。ChromeのClaude拡張機能を使う方法で、これが今日お話しすることのほとんどです。Coworkからもこれができることは注目に値します。なぜなら、Coworkは、Claude拡張機能と同じように、Chromeのグループタブにナビゲートできるからです。

「Anthropicが同じことをするたくさんの方法を提供しているパターンがある」と思っているなら、正解です。

Anthropicは、あなたが快適に作業できる場所で作業してほしいと考えており、多くの有用な作業をするために使える基本的なツールを提供したいと考えています。

仕組みはかなりシンプルです。Claudeは、グループ内のすべてのタブから、閲覧許可があるデータを取得できます。それはChromeの明確なグループタブで指定されます。

Chromeはすでにグループタブを立ち上げています。あなたがやっているのは、このグループタブでClaudeがアクティブだと言っているだけです。ですから、そのグループタブ内のものはすべてClaudeが見ることができ、そのグループタブ外のものはClaudeには見えません。

だから、Claudeの指定されたタブグループにタブをドラッグするだけです。Claudeはそれらすべてを一度に表示して操作します。タブを切り替える必要はありません。Claudeが見えるように切り替える必要もありません。

Claudeは、Chrome内のすべてのグループタブを自動的に読み取り、コンテンツを統合して、構造化された出力を生成できます。

たとえば、ジャガイモのレシピと鶏肉のレシピが表示されている場合、ジャガイモと鶏肉のディナーレシピをまとめることができます。ローストポテトと鶏肉のディナーの食事計画をまとめて、完全な材料リストと、料理とボードゲームナイトを楽しむための完全な計画を提供できます。

素晴らしいのは、これを他のものと組み合わせられることです。たとえば、実行する必要がある競合他社の価格設定があるとします。タブを一つずつ開いてClaudeに見せる代わりに、グループ内に3つのタブをすべて一度に表示させ、各タブで何をしてほしいかをClaudeに見せれば、Claudeはそのワークフローを実行し、それらのタブから同時にデータを引っ張ることができます。

私がこれらの例を選んでいるのは、このツールの基本的な構成要素の感覚をつかんでもらい、有用な作業ができるようになるためです。

Excelファイルの生成とCoworkの活用

さて、さらに一歩進みたいとしましょう。チャットウィンドウで印刷できる情報を得るだけでなく、完全なExcelファイルを取得したいとします。それは超簡単です。

ただし、この場合、タブでの作業にはCoworkアプローチを使う必要があります。覚えていますか、これを行う方法は2つあると言いました。Claude拡張機能でできますし、AnthropicのCoworkでもできます。

Coworkでは、私が説明したタブグループで作業すると言うだけで、さらに「競合他社の価格情報をすべて引っ張った後、この形式でExcelファイルにしてください」と言えば、やってくれます。

これにより、インターネットからデータを抽出し、複数のタブから引っ張り、構造化された出力にまとめ、最後に特定のドキュメントやスプレッドシート、PowerPointプレゼンテーションを取得するという、本当に意味のある作業ができるようになります。

基本的に、複数のタブを見るというような一見シンプルなことをつなぎ合わせることで、あなたが他のことをしている間に、エージェントから多くの有用な作業を引き出す方法になるんです。

開発者向けのデバッグと自動テスト

これは特に開発者向けですが、本当に大きな意味があると思います。

これは、サイトでバグに遭遇して修正したいと思ったことがある人のためのものです。

基本的にClaudeにChromeブラウザ内で目を与えることの素晴らしい点の一つは、地球上で最も人気のあるブラウザで目を持つことができるということです。このブラウザは、私たちが毎日見て消費するインターネットの多くをレンダリングします。

ですから、何かを構築していて、それを他の人に見てもらいたい場合、テストする必要があります。そして明らかに、Chromeでテストする必要があります。そして今、Claudeはそれを直接見ることができます。

ちなみに、Claude Codeで構築している場合は、さらに簡単になります。なぜなら、Claudeにスケジュールに沿ってウェブサイトをテストさせ、バグを探させることができるからです。

それは、Claude拡張機能で記録として設定できるものです。ですから、ウェブ用に何かを構築している場合、技術的に少し慣れている人であれば、Claude CodeターミナルからClaudeに目を与えることもできますし、拡張機能を通じてこれのいくつかのバージョンを行うこともできます。なぜなら、ワークフローを記録する能力があり、タブでスケジュールする能力などがあるからです。

ですから、作業しているウェブサイトに行って、拡張機能を使って特定のフローを記録できます。テストチェックアウトを実行して、「毎週木曜日、または毎日、または毎朝9時にこのテストチェックアウトを実行してください」と言えば、Claude拡張機能がそれを実行し、製品がまだ稼働しているかどうかをテストする非常に簡単な方法になります。

開発者にはもっと速い方法があります。そうですよね?私が言っているのは、非開発者であれば、これは超簡単な方法だということです。開発者で、すでにClaude Codeにいる場合は、Claude Codeを使ってナビゲートしてブラウザにアクセスし、すぐに製品の側面をテストできます。

そして、これには、開発者がスモークテストと呼ぶような定期的なテスト、チェックアウトが機能するかどうかのテストも含まれます。

基本的に、たくさんのデバッグ方法が含まれます。そして、これは面白いことに、「基本的なデバッグができるだけで、サイトが機能するならなぜ気にするの?」と言っているように聞こえるかもしれませんが、ターミナルに行く意思があれば、実際にはるかに洗練されたことができます。

繰り返しますが、ターミナルを怖がらないでください。噛みつきませんから。

たとえば、Figmaモックを取得できます。Claudeにそれを構築させることができます。FigmaモックをClaudeに見せながら、ブラウザでClaudeが構築したものの正確性を検証させることができます。そして、Claudeにライブでデバッグさせることができます。

本質的に、Claudeに目を与え、Claudeに構築を可能にすれば、Claudeは見てチェックできるものを構築できます。

体験としては、ターミナルであなたが顧客のために気にかけているコードが書かれているのを見ながら、Chromeが自律的にタブを開き、UIをクリックし、コンソール出力とバグを読み、ターミナルのClaude Codeに報告し、エージェントがターミナルで修正のために作業するのを見ているようなものです。

つまり、一つのエージェントがコードを書いています。別のバージョンのClaudeがブラウザでテストしています。人間はただ見ているだけです。

このループ全体は、以前は、プロダクトマネージャーである私が開発者と座り、QAエンジニアと座り、これがステージング環境でどのように機能するかを理解する必要がありました。今では、完了するまでローカルでループで実行されるだけです。

大規模なタスクをステージング環境で行う必要があることは理解していますし、エンタープライズソフトウェアは必ずしもこれほど単純ではありません。しかし、これらの基本は重要です。なぜなら、有用なものを構築しようとしている場合、常に顧客が何を見るかというアイデアから始めるからです。それは、エンタープライズでも中小企業でも同じです。

そして、それに非常に迅速に到達する能力、モックと一致するかどうかを確認する能力、コンポーネントを正しくレンダリングする能力があるかどうかを確認する能力、入力フィールドが機能するかどうかを確認する能力、これらはソフトウェアで働く人にとって、私たちが検証するために膨大な時間を費やしてきたものです。

バグをキャッチすることは苦痛な作業です。Claudeに目を与えることで、Claudeはこれまでよりもはるかに少ないエラーで構築する能力を得ます。

Claude拡張機能の制限事項

さて、これが単なるClaude拡張機能の宣伝投稿だと思うかもしれません。しかし、その制限事項についても正直にお話しします。具体的な例を使います。これは私が検証したものですが、Neuronさんが1月に指摘したものでもあり、モデルが良くなるにつれて修正されると期待していますが、今日のClaude拡張機能の制限事項です。

Claudeにデータ量の多いタスクを与えた場合、ChromeでClaudeが実際に管理するデータ量には制限があります。

Neuronさんの例はLinkedInの連絡先です。Claudeに、LinkedInページをスキャンし、投稿全体のコンテンツをレビューし、連絡先を解釈し、要約を提供する週次ワークフローを記録したいとします。それは技術的にはすべて機能します。

しかし、Neuronさんが発見したのは、その監視リストを数人の投稿者を超えて拡大すると、カバレッジがまばらになる可能性があるということです。期待していた投稿が表示されないことがあります。ある要約では、あまり関連性のない接線的な更新に焦点を当てるかもしれません。

本質的に、単一のワークフローでタスクの範囲を拡大し始めると、現時点では、ChromeのClaudeは、重要性を認識し、何が本当に重要かを認識する完璧な仕事をしていませんし、そのすべてのデータを有用な方法で調整して統合する完璧な仕事もしていません。見逃すことがあります。

ここで強調したいのは、モデルが改善し続けるにつれて、その特定の側面は比較的迅速に良くなると期待しているということです。しかし、根本的には、これは課題のままです。なぜなら、あなたがやっていることは、この大規模言語モデルにウェブからのこのすべてのオープンコンテキストを供給し、LLMがそのコンテキストウィンドウを調べて本当に重要なものを見つけなければならないからです。

それは難しい場合があります。ですから、ChromeでClaudeにデータ量の多いタスクを与える場合、サブタスクに分割することをお勧めします。特に、これが記録されたワークフローで、スケジュールに沿って実行したい場合は、より有用な結果が得られる可能性が高いと思います。ミスは避けたいです。

非常にクリーンなサブタスクの方がいいでしょう。

まとめ:ブラウザエージェントとしてのClaude

これらすべてをまとめると、どういう意味になるでしょうか?

これらすべてのユースケースに共通するパターンは似ています。「AIアシスタントがブラウジング中に質問に答えてくれる」というものではありません。人々はよくこういったものでそう考えます。

実際には「ブラウザエージェントが私の代わりに実際の作業をする」というものです。クリックし、ナビゲートし、読み、抽出し、価値を生み出すためにウェブ上で私が行うことすべてを行いますが、特にスケジュールに沿っている場合は、私が関与することなく行います。

そして、その違いは本当に重要です。なぜなら、それは最適化するものを変えるからです。チャットボットを使う場合、自分の質問に対して最適化します。ブラウザエージェントを使う場合、ワークフローに対して最適化します。

ですから、スキルはプロンプティングではありません。スキルは、毎週行う反復作業を見て、「エージェントが監督なしでスケジュールに沿って私のためにこれを行えるほど明確に説明できるか?」と自問することです。

そして、そのスキルはAI時代において一般化されるものだと強調する価値があると思います。なぜなら、2026年に私たちがやろうとしていることの多くは、Claudeと作業していても、ChatGPTと作業していても、他のLLMと作業していても、LLMに反復的に行っている作業のコンテキストを与えて、それを行うように依頼することになるからです。

そして、UIは異なって見えるかもしれません。Chromeタブにいることもあれば、Claude Codeにいることもあれば、Coworkにいることもあれば、ChatGPTにいることもあります。ChatGPTも直接スケジュールされたタスクを持っています。

しかし、原則は同じです。何をしたいかを理解し、それを模倣して直接実行できるようにするか、Claudeの記録ボタンを使ってChromeで非常に便利にするか、あるいは、ChatGPTの定期的なタスクでやるように、LLMがとにかく実行できるほど明確に説明する必要があります。

リスクと注意事項

さて、LLMをオープンなウェブに配置するときは、ゼロではないリスクがあることを強調したいと思います。

責任を持って行動し、信頼できるサイトでClaudeを使用すべきです。インターネットの変な隅っこにこのツールを使っていって、プロンプトインジェクションされないと期待しないでください。

インターネット上のオープンテキストがあなたのエージェントを乗っ取り、悪意のある指示を与える方法があります。

たとえば、Redditの変な隅っこのような場所に行って、ページにプロンプトインジェクションされたスレッドがあり、同じタブにメールも開いている場合、理論的には、LLMはページ内のRedditスレッドを読むだけでプロンプトインジェクションされ、あなたのメールに行って機密データの送信を始める可能性があります。これは実際の例です。

ですから、信頼できるサイトでこのツールを使ってください。機密性の高いアクションは確認してください。ステークホルダーへの返信は機密性の高いものだと提案しました。他にもあるでしょう。このサイトで銀行口座を開かないでください。

愚かなことをしないでください。これを有能だが新しい従業員のように扱ってください。出力を検証してください。このツールに無限の権限があると仮定しないでください。

利用可能なプランと推奨事項

現在、この拡張機能は、有料プランに加入している人なら誰でも利用できます。

インテリジェントなタスクのためにモデルを選択できる程度は、どのようなプランに加入しているかによって異なります。一般的に、プランがシンプルであればあるほど、利用可能なモデルは賢くありません。そして、賢くないモデルは、曖昧さやデータに困難を抱えます。

たとえば、LinkedInデータの私の例では、複数のLinkedInプロファイルに行って、彼らが投稿したものを要約して返してくるようにブラウザ拡張機能に指示するような複雑なタスクを行うには、最大プランやチームプラン、エンタープライズプランのようなものが必要かもしれません。

それはたくさんのブラウジングです。管理すべきコンテキストウィンドウがたくさんあります。基本的なProプランを取得した場合、モデルはそれをうまく行うほど賢くないかもしれません。

最終的に、2025年の初め、2025年の半ば、2025年の秋でさえ、いくつかの疑問は「これは機能するのか?エージェントは実際にインターネットをナビゲートできるのか?」というものでした。私たちはもうそれを過ぎています。

2026年の初めには、もう「これは機能するのか?」という疑問ではありません。機能します。人々は週に数十時間を節約しています。たくさんの反復作業を取り除いています。

あなたにとっての疑問は、「関係するツールを理解しているか(このビデオの多くでそれに費やしました)、そして、Chrome内のAnthropicのClaude拡張機能のようなツールにオフロードできるように、反復作業を十分明確に特定できるか」ということです。

さあ、どうぞ。これがなぜ重要なのか、なぜこれがブラウザ内の単なるチャットボットではないのかを理解していただけたことを願っています。そして、できる有用な作業の感覚をつかんでいただけたと思います。もっとたくさんの例が欲しい場合は、すべてSubstackに載せていますし、そこに完全なガイドがあります。

コメント

タイトルとURLをコピーしました