私はAIエージェントについて間違っていた──この200ドルのブラウザは実際に機能する

AIエージェント
この記事は約12分で読めます。

この動画は、AIエージェントの実用性について懐疑的だった投稿者が、PerplexityのCometという月額200ドルのAIブラウザエージェントを実際に使用し、その有効性を評価したレビューである。投稿者は多くのAIエージェントツールを試してきたが、実際の業務で価値を感じるものはなかったという。しかし、CometはUIに重点を置いたアプローチにより、ユーザーがエージェントの作業過程を詳細に監視する必要がなく、バックグラウンドで効率的にタスクを処理できる点を高く評価している。

I Was Wrong About AI Agents — This 0 Browser Actually Works
My site: substack: 1. UI, Not AI: Comet’s breakthrough is a friction-free interface ...

AIエージェントへの失望と新たな発見

私の受信箱は、AIエージェントを売り込む人々のメッセージで溢れています。オンラインを見ても、AIエージェントの話題ばかりです。今年はAIエージェントの年と言われていますが、今日まで、私の業務に本当に違いをもたらすAIエージェントを見つけることができませんでした。そんな中、Cometがそのようなエージェントなのです。

その理由は、AIではなく、UI、つまりユーザーインターフェースにあります。なぜそうなのか、そしてCometについて少し紹介していきたいと思います。結局のところ、Cometが機能するエージェントである理由は、Perplexityのチームが、私の目標は実際にアシスタントに作業をさせて、アシスタント自体は見えなくすることだと理解しているからです。アシスタントがすることをすべて見ることではないのです。アシスタントを構築するコストに埋もれることでもありません。

現在多くのエージェントは、アシスタントを構築したり直接制御したりするコストにあなたを埋もれさせています。いくつか例を挙げてみましょう。ZapierとN8nは、非常に異なる世代のものです。Zapierはずっと古い会社で、N8nはずっと新しいものです。どちらもエージェントを構築することに傾倒しています。何をさせたいかを正確に定義する必要があります。それを正しく動作させるために、本当に、本当に多くの投資をしなければなりません。

N8nは人気が急上昇していますが、それはその分野でより優れているからです。価値は提供しています。誤解しないでください。しかし、それは汎用エージェントではありません。汎用エージェントには程遠いのです。そして、N8nで汎用エージェントを構築しようとすると、おそらく失望することになるでしょう。

これは特定のエージェント的タスクには有用です。例えば、文書からテキストを抽出してスプレッドシートに入力するという特定の作業をしたい場合、N8nはそれをうまくこなすでしょう。Zapierでもおそらくうまくできるでしょう。そのようなことをする他のエージェント系スタートアップもたくさんあります。しかし、Cometは違います。

Cometの革新的なアプローチ

PerplexityのCometは、本当に汎用エージェントアシスタントです。これまでで最も近い比較対象は、OpenAIのOperatorと、ほとんどの人が知らないGeminiのProject Marinerでした。Operatorを愛したかったのです。本当にそうでした。ビジョンは素晴らしかったのです。ウェブ上のChatGPT、ウェブ全体でのChatGPTの意思決定力です。

しかし、実行とUIは本当に、本当にひどいものでした。率直に言って、そうだったのです。私は包み隠さず言います。チャットウィンドウの中におもちゃサイズのブラウザのような小さなブラウザがあるのは、本当に不自然です。遅いのです。これらのエージェント機能の実際の時計時間が何を表示していようと、私は気にしません。

時計の開始が遅れているか何かだと思います。なぜなら、表示される時間よりも長くかかると確信しているからです。Operatorが8分かかったと言ったのに、実際の時計時間では20分のような場合がありました。考えてみると、Operatorのビジョンは素晴らしかったのですが、それを台無しにしたのはUIでした。UIだったのです。

そして、PerplexityがうまくやっているのがUIです。だからCometが輝いているのです。Cometが輝く理由は、Perplexityチームの根本的な洞察が、アシスタントは消えるべきだということだからです。彼らはただあなたのために作業をしに行くべきなのです。

実際の使用体験

今日、私は別のウェブサイトにいました。実際にSubstackを見ていたのですが、もちろんそうでした。そして、ちくしょう、会議があるのにそれをリスケジュールしなければならないと思いました。それで、Perplexityと協力して会議をリスケジュールしてもらいました。

私は自分のCometアシスタントに話しかけて言いました。これが会議です、おおよそここに移動させたいです。ここに会議のブロックがあります。時間を提案してください。それは行って、会議を見つけました。時間を提案しました。実際に、きれいな作業ブロックという私の目標によく合うように、そのブロック内でより良い時間を推奨してくれました。

そして、カレンダーの変更を起草してくれました。私は小さな編集をして承認しました。そして、ベストプラクティスとして、この人にもメールを送るべきですと言いました。私は、わかりました、素晴らしい、メールを送りますと言いました。メールを起草してくれて、私は別の小さな調整をして承認し、他のことをしている間にサイドバーからすべて送信しました。

Gmailに行く必要もありませんでした。Googleカレンダーに行く必要もありませんでした。とても簡単でした。LinkedIn。サイドバーでCometとチャットしながら、保留中のLinkedIn招待を確認することができました。とても、とても簡単でした。

私が言いたいのは、エージェントを見なければならないという考えは、おそらくエージェントが信頼できないという考えの遺産だということです。そして、エージェントがデータに接続でき、それがただ機能するなら、私たちはそれをそれほど密接に監督する必要がないし、実際にはそうしたくもないのです。私たちはそれが速く、信頼でき、依存できることを望んでいます。そして、Cometはこれらのことを迅速に完了させると言えるでしょう。本当にうまくやってくれます。

私は、ご想像の通り、インドネシア料理のファンです。私の近所で見つけたことがないインドネシアレストランを見つけてくれました。まあ、正確には私の近所ではなく、2つか3つ離れた近所ですが、それでも、私の市で私の特別な関心事について、私が他の方法では見つけることができなかったものを見つけてくれました。だから、初日から実際の価値を得ており、それは本当に簡単でした。

優れたユーザーインターフェース設計

また、Cometがあなたのブラウザと相互作用し、制御を開始する必要があるとき、彼らがそのUIを行った方法は本当に良いです。Cometが実際に行うことは、あなたのメインブラウザに行って、まるでスタートレックのポータルか何かを通して見ているように青く光らせ、それからブラウザで何かを素早くして、それから青いのを取り除くのです。

これは、Cometが今運転していますよ、あなたにはいつでもそれを止める機会がありますよということを言う、とても直感的な方法です。本当にスムーズに実装されています。

あなたは私がCometについて話すのを聞くのに疲れているでしょう。では、とても素早くCometをお見せしましょう。

Cometのデモンストレーション

さて、ここにいます。TikTok shopが減速している。これは私が文字通りここのアドレスバーに入力したものです。これはPerplexity検索をトリガーします。TikTok shopがどのように減速しているかの影響について話しています。私にはアシスタントと一緒に探求したい仮説があり、私たちはただアシスタントが働くのを見るつもりです。

わかりました、私にはTikTok shopの減速がより広範囲なソーシャルコマースに影響し、Amazonの見通しに影響を与える可能性があるという仮説があります。Amazonの最近の公開情報ファイリングなどを見てください。会社がソーシャルコマースをどのように見ているかの感覚を得てください。そして、それがそこで作業しているのを見ることができます。

今、私が続けたい場合、ここでも続けることができます。TikTok shopの周辺でTikTokがレイオフを経験したかどうか聞くことができます。これは同時に起こっています。

だから、Amazonはプロダクション…TikTokへの明示的な対応として、不可知論的なソーシャルコマース・アプローチを追求しています。Instagram、Snap、Pinterest、YouTube Shortsとの類似した統合。クリエイターに追いつくための他のイニシアティブをたくさん成長させています。だから、Amazonがこれにどのようにアプローチしているかの感覚を得ており、これが実際に私が通常この時点でAIから見る典型的なものよりも一貫性のある見解であることを本当に評価しています。

これはAmazonがテックストックの減速を無視していないというような当たり障りのないものではありません。リスクをヘッジし、さらに投資しています。これは上のコメントによって支持されているようです。そして、これは私が通常見ているものよりも実行可能で的を射ています。そして、はい、これはTikTok shopに影響を与えました。だから、TikTok shopの影響があるようです。

さて、何か楽しいことをしましょう。レイオフによって影響を受けた可能性があるTikTok shop関連のPMとエンジニアのLinkedInでのトッププロファイルを見つけてもらえますか。そして、私のLinkedInを見に行くつもりです。私があなたに感覚を与えようとしているのは、これが複数のことにわたってどのように見えるかということです。LinkedInに接続します。あなたのカレンダーに接続します。

あなたのGmailに接続します。一度に複数のことができます。ここのアドレスバーで私が行く場所を変更しても、これは実行し続けます。そして、それらを見つけ始めます。私は彼らのリンクをクリックするつもりはありません。彼らのプライバシーを侵害したくないからです。

しかし、それはアプローチする方法といくつかのプロファイル例の両方を私に与えてくれます。全体的にはかなり良いです。さあ、どうぞ。それがCometです。私はそれに本当に満足しています。Cometは実際にその名前に恥じない最初のエージェントブラウザだと思います。

価値評価の新しいパラダイム

そして、月額200ドルの価値があるかどうかは、本質的にあなたがそれによって節約される5分、8分、10分、15分の増分を足し上げ、それについて規律的であり、あなたの時間の価値を測定し、これは私にとって月額200ドルの時間節約の価値があるかと言う必要があります。そして、それはソフトウェアを評価する新しい方法です。

しかし、私たちは認知インテリジェンスがソフトウェアに組み込まれたこの時点にいると思います。それは私自身もまだ慣れているソフトウェアの新しい評価パラダイムを私たちに与えてくれます。どんな種類のソフトウェアにも月額200ドルを支払うことに慣れていません、ブラウザならなおさらです。昔のネイトが泣いています。なぜこんなことをしているのかわかりません。

しかし、時間節約を考えるときは理にかなっています。この物が私に月10時間から15時間を節約してくれるなら、明らかに200ドルの価値があります。そして、一日を通じて節約されるそれらすべての10分から15分の増分を足し合わせると、月10時間の節約の可能性を見ることができ、それは価値があるでしょう。

だから、良いエージェントを探求し始めたいなら、あなたが実際にそれらを使用するであろう種類のテストを自分に課すことが私の挑戦だと思います。それらが機能するかどうかについて、本当に厳密に正直になってください。私は今朝、このビデオを作る前に、それがどれだけ良いかを見るために、Cometを8つの異なるワークフローテストにかけました。

私は簡単には感銘を受けませんでした。それを調べたかったし、Operatorと比較して調べたかったのです。なぜなら、Operatorは私がかなりよく知っているツールで、率直に言って失望していたからです。Cometを試したいなら、ただ1か月だけサインアップして、あなたが使用するツールであなた自身の環境でワークフローテストにかけ、価値を得るかどうかを見て、その価値を測定することをお勧めします。

時間節約を測定してください。このような投資をするつもりなら、それを価値あるものにしてください。なぜなら、もしそれが価値があるなら、月200ドル以上を節約してくれるなら、おそらくその数倍になるでしょう。10時間を節約してくれて、あなたが時間を1時間35ドルで評価するなら、毎月2倍のROIに近づいています。

あなたの時間をより高く評価するなら、より多く得られます。より多くの時間を節約するなら、より多く得られます。数学がどこに向かうかわかるでしょう。そして、それはより良い決定を下すのを助けることを数えていません。そして、それはブラウザをネイティブに見ることができるので、スクリーンショットでは実際にはできない方法で、より良い決定を下すのを助けることができます。

Perplexityの戦略的ポジション

だから、測定が困難な別の側面があり、アシスタントとブラウザの間のコラボレーションについて、他の場所ではきれいに得ることができないネイティブな何かがあります。そして、それはPerplexityが捉える立場にあるもう一つの価値の部分だと思います。

もしあなたがPerplexityなら、あなたがOSを作っているということが鍵です。これがこれらすべてのAIプレイヤーが向かっている場所です。私たちはウェブ上に非常に多く住んでいるので、もしあなたがブラウザ、選択される支配的なブラウザになるなら、あなたはAIのOSになるのです。そして、それが彼らが向かっている場所です。

これが実際に報われるかどうかは時間が教えてくれるでしょう。GoogleがMarinerをより積極的に立ち上げるなら、なぜならGoogleは明らかにChromeで地盤を持っているからです。多分OpenAIは音声から少し離れて、Operatorにより深く傾倒するでしょう。

誰にもわかりません。AIについて私たちが知っていることの一つは、それが頻繁に変化するということです。しかし、今のところ、私が知っているのは、今日実際に機能する汎用エージェントを見たということです。そして、私はまだ驚いています。

予想を上回る進歩

これほど速く、これほど効率的で、これほど幅広いタスクにわたって効果的な汎用エージェントを見ることを決して期待していませんでした。フライト予約、レストラン、LinkedInタスクを見る、Gmailタスクを見る、カレンダータスクを見る、ワークフローを達成するために複数の異なるソースを見る。多くのことをやっています。

そして、チームがさらに多くのことを可能にするデータ構造を構築したことがわかります。私にとって、これは予定より早く感じられます。はい、エージェントが来ることは知っていました、明らかに。はい、汎用エージェントが来ることは知っていました。これほど速く、これほど接続されているのは、3か月か4か月早く感じられます。

だから、それを見るのは素晴らしいことです。そして、PerplexityのCometチームが次に私たちをどこに連れて行くかを見ることになるでしょう。もしあなたがCometを手に入れたら、あなたがどう思うか教えてください。

コメント

タイトルとURLをコピーしました