Perplexity Comet:自律型AIブラウザが実際に機能する!

Perplexity
この記事は約15分で読めます。

この動画は、Perplexityが開発した自律型AIブラウザ「Comet」の実践的なテストレビューである。Gmail配信停止からInstacartでの買い物、LinkedIn投稿まで、音声コマンドによる様々なウェブタスクの自動化機能を検証し、現在の性能と将来性について解説している。

Perplexity Comet: Autonomous AI Browsers Actually WORK!
The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

Perplexity Cometブラウザの実践テスト

よっしゃ、ここがCometブラウザやで。Gmailの全部のマーケティングメールから配信停止してもうたろ。やってみよか。

よし、接続せなあかんな。全部の権限を与えるで。よっしゃ、GrubHubとinformation.comを開いとるな。Informationは正確にはマーケティングちゃうけど、何から配信停止してくれるか見てみよ。

今のところなかなかええ感じやな。プロモーションカテゴリの全部を開く予定や。開いて、配信停止リンクを見つけてクリックして、それがうまくいったかを確認して、プロモーションに分類された全部のメールでそれを繰り返すんやて。これは今のところ気に入っとるで。実際に開いてライブで見れるかやってみよ。

ここでGrubHubを見つけたみたいやな。そうや、この邪魔なもんを削除するか配信停止しよ。よっしゃ、GrubHubが「お別れするのは残念です」て言うとる。どうでもええわ。文字通りステップバイステップで理由を考えながら進めとって、「最初のメールが完了したのが分かる、2番目のメールに続く」て言うとる。

設定管理か配信停止をクリックするんやて。こういう場所の中には簡単に配信停止させてくれへんとこもあってイライラするわ。ログインせなあかんかったりするからな。

何個かはできたみたいやけど、それ以上は続けられへんて言うとる。自動ブラウザ管理が利用できひんのやて。できることはできるけど、長時間はやってくれへんみたいやな。まあ、しゃあないか。

カレンダーイベント作成テスト

次の4つの火曜日にカレンダーでイベント作ってもらお。「Taco Tuesday」て呼んで、朝11時きっかりに始まるようにしてや。Taco Tuesdayに遅刻はあかんからな。

見てみい、ここでダブルチェックできるように表示してくれとる。ええ感じやな。スケジュールをクリックしてスケジュール組めるで。前後に行ったり来たりして、正しい日付に設定されとるか確認できるわ。

「ええ感じやな、全部スケジュールしてくれ」て言えるかどうか試してみよ。具体的な確認が必要なんか見てみよか。実際、これが完了するまでまだ実行中みたいやな。せやから、スケジュール、スケジュール、スケジュールや。新しく4つ作成されたで。ええ感じやな。

実はこれ飲んどるんや、Premier Protein Cafe Latte。なかなかええで。ちょっとカフェイン入っとって、プラスでプロテインも摂れるからな。

価格比較機能のテスト

WalmartかTargetでPremier Protein Cafe Latteがあるか、どっちが安いかチェックしてみよ。どっちにもあるみたいやな。Walmartが明らかに安値の勝者やで、12個パックが1セント安いからな。

でもこれは実際めちゃくちゃ便利やし、かなり早かったで。

Photoshop代替サイトでのテスト

次に、知らん人もおるかもしれんけど、photop.comていう場所があるんや。誰かが完全にPhotoshopをウェブサイトで再現しとるんや。すごいで、冗談やない。Photoshopなんや。Photoshop使ったことある人やったら分かると思うけど、全部のツールがあるんや。

見た限りでは、Photoshopの高度な機能のいくつか以外は、ほぼ全部あるみたいやな。例えば、何かを切り抜くのにサブスクリプションが必要なクラウドサービスとか。でもそれ以外は全部あるで。

PerplexityとCometブラウザがこれをどれだけうまく操作できるか見てみよ。photopを開いてYouTubeのサムネイル作ってもらうんや。

これは理解力のテストでもあるで、正しいサイズにせなあかんからな。黒背景に赤文字で「OMG!!」て書いてもらう。これが大体俺のサムネイルの作り方やからな。

よっしゃ、そこに行っとる。正しいサイズ、1280×720を開く必要があるて分かっとるな。素晴らしいわ。「新規」をクリックしようとしとる。新規プロジェクトをクリックしようと頑張っとるけど、ちょっと苦戦しとるな。でも最後まで行けると信じとるで。

ちょっと苦戦しとるな。キーボードショートカット使おうとしとる。何回か試したけど、プロジェクト開くのに苦労しとるな。このウェブページは開いたけど、実際にはこのウェブページで何もしてへん。独自の別のブラウザで作業しとるみたいやな。

音声モードとRedditテスト

アシスタントをクリックして「YouTubeサムネイル用のプロジェクト開いて」て言うたらどうなるやろか。今のところはええ感じやな。何かあるんやけど、新しいプロジェクト開けへんのや。「新規」がクリックできひんのか、Ctrl+Altキー+Nができひんのか分からん。どこかの時点でそれを使おうと考えとったみたいやけどな、キーボードショートカット使うこと考えとったで。

3つの違うアプローチ試したけどうまくいかへん。でも俺がちょっと手伝うたろ。俺が新しいプロジェクト開く手伝いをして、「新規プロジェクト」をクリックして、このYouTubeサムネイルを選んで、ここで「黒背景を追加」て言うんや。

これではYouTubeサムネイル作れへんから、俺はまだ安全やな。でも他のことを試してみよ。音声モードや。reddit.comに行って、AI guildを開いて、最初の投稿にアップボートしてくれ。Kimmy K2や。投稿にアップボートしてくれ。

これ試してみよ。Wes RothがFireshipの新しい動画にコメントしたか?

俺の動画やFireShipの最新動画のコメントをたくさん検索しとるな。ちょっと的外れやな。最初に何をせなあかんかちゃんと考えてへんかったんや。つまり、「それってどういう意味?ああ、Fireの最新動画で、コメント欄に行って、この人が何か言うたかどうかや」て考えるべきやったんに、そうはしてへん。でも見てみよ。

ソースの一つは最新動画やな。せやから、たどり着いとるんや。何をすべきかだんだん分かってきとる感じやな。見つけられへんかったけど、トップの中にはないて言うとるわけやない。ピン留めコメントでもないしな。あの動画はめちゃくちゃたくさんコメントもらうからな。

ここは及第点をあげたいと思うで。正しい作業はやったからな。まだ完璧やないけど、良くなってきとる。

食材注文テスト

ラザニアのレシピを取得して、それからinstacart.comでPalo Alto近くのCostcoから食材注文してくれ。必要な食材を注文してくれて言うのを追加するわ、もうちょっと明確にするために。

これができるかどうか見てみよ。よっしゃ、レシピ見つけた、チェックや。まあ、これはできると思っとったけどな。今度はInstacartに行って、できるかどうか見てみよ。

Palo Alto, Californiaに変更しとるな。問題は場所の変更やったんや。Instacartは遠いとこから注文されるのを嫌がるからな。

「近くで」て言うことにするわ、これはPerplexityやCometブラウザの問題やなくて、Instacartが課すセキュリティの問題やからな。せやから、Instacartが推奨する店から再度試してみるで。

レシピは取得して、そこで止まって「この食材の手伝いをします」て言うとる。せやから「続けて」て言うわ。

実際に正しいものを追加しとるな。例えば、ひき肉を追加しとる。いろんな選択肢をナビゲートして、どれが必要か考えとる。例えば、一つは「これは1ポンド単位やから、これにするわ」て感じやな。

完全には完了せへんかったけど、ナビゲートして全部正しくやっとったと思うで。また、これはセキュリティの問題やからな。

Instacartのアカウントにログインしたで。「下記はレシピです。InstacartでCostcoから必要なもの全部注文してください」て言うて、見つけたレシピを貼り付けるんや。今度「実行」をクリックしたら、このブラウザを通して俺のInstacartアカウントにログインしとるから、うまくいくはずや。

複数タスクの同時実行

Instacartを開いてくれたけど、他のタブでやっとるみたいやな。トマト、パルメザンチーズ、その他必要なもんを追加しとる。ここで動いとるのが見えるで。見てみい、カートに22個入れたで。

今気づいたんやけど、前回ウェブを閲覧できるOpenAIエージェント(operatorていう名前やと思う)をテストした時、同じテストをやったと思うんや。せやから、前にカートに入っとった商品はそのテストのものやったんや。

次に試すのは、実際に追加してへんもの全部を削除してもらうことや。こうやって配置し直して、一目で何をしとるか見えるようにできるで。26個まで増えとる。

今のところ、全部うまくやっとるみたいやな。いくつかの商品は見つからんかった、当然やな。Costcoは全部置いてへんからな。でも追加してへん商品を削除できるかどうか見てみよ。前にカートに入っとった商品は全部いらん。あんたが追加してへん全部を削除してくれ。それ試してみよ。

よっしゃ、ナビゲートして全部削除しとる。今のところ素晴らしい仕事しとるで。

これから離れて、自分のことをやって、複数のエージェントを違うタブで動かせるかどうか見てみよ。Wes and Dylan YouTubeチャンネルの最新動画を要約してくれ。

必要な背景ソースリサーチをやっとる、公式ボブ・ディランのウェブサイトを見ることも含めてな。でもとにかく、正しいポッドキャスト/YouTubeチャンネルを見つけて、インタビューしたゲストと話した内容をハイライトしてくれとる。

聞いてへんかもしれんけど、新しいポッドキャストチャンネルを始めたんや。Wes and Dylanて呼んどる。AI分野の専門家をたくさんインタビューする予定や。チャンネル登録してへんかったら、ぜひしてくれ。チェックしてみてや。本当にええのをいくつか準備しとるから、見逃したらあかんで。

ポッドキャストゲスト検索テスト

これ試してみよ。Wes and Dylanポッドキャストが出演させた全部のゲストをリストアップしてくれ。何人か見逃しとるみたいやけど、もうちょっと長くやっとる確立されたポッドキャストを検索して、そのゲストの情報を見つけられるかどうか試してみよ。

Sequoia Capital のYouTubeポッドキャストの最後の10人のゲストは誰やった?一番人気やったのはどれ?

それやらせといて、他のタブをチェックしよ。ラザニア以外の商品は全部カートから削除されたかな。ラザニアジョーク教えてくれる?これはCometブラウザのテストとは関係ないけどな。

でも、なんでラザニアがセラピーに行ったか?感情の層が全部処理できへんかったからや。その冗談気に入らんな。これがもっとええやつや。「本物のGは lasagna みたいに静かに動く」。分かるか?

ニュース集約サイト検索

よし、次行こ。新しいタブで、これ試してみよ。AWSがcursorの競合をリリースしたことと、OpenAIのオープンソースモデルと、Grok 4について言及した全部のウェブサイトとニュース集約サイトとソーシャルネットワークをリストアップしてくれ。目標は、この更新を全部一か所で投稿する場所を見つけることや。

何を返してくるか正確には分からんけど、ああ、なかなかええやん。「はい、はい、いいえ」みたいなテーブルを作ってくれたで。CNBC、Forbes、Wired、The Information、TechCrunch、それにsubreddit、OpenAIコミュニティ、もちろんYouTube、X/Twitter、そして「ワンストップ・アップデート戦略」の要約をくれとる。X と Reddit、YouTube、トップテック・メディアサイトと一緒にな。これはなかなかええで。

LinkedIn機能テスト

これ試してみよ。最後にLinkedInからもらったメールは何やった?最新のを取得してくれ。

LinkedInにログインしたけど、これ俺のLinkedInやないと思う。この人たち誰一人知らんわ。でも何か投稿できるかどうか見てみよ。

「一日を始めるための簡単な朝のルーティン書いて」て言うんや。そこやな、素晴らしい。起きて水分補給、次に「俺のLinkedInに投稿して」て言うんや。

「以下のテキストでLinkedIn投稿を作成します」て言うとる。実際に投稿しとるな。投稿する前に投稿することを確認せなあかんから、勝手にLinkedInにスパム投稿を自動化するわけやないけど、めちゃくちゃ楽になるで。

「続行」をクリックできるで。そこや、実際にLinkedInに投稿したで。これは俺のLinkedInやないけど、開いとるLinkedInなら何でも投稿してくれるみたいやな。

検索結果の詳細確認

一方で、Sequoia Capitalの最後の10人のゲストの調査が終わったで。面白いことに、俺が知らんかった「Crucible Moments」の最後の10人のゲストて言うとるな。でもこの10人やな。YouTube共同創設者とのインタビューが一番人気やったて言うとる、獲得した視聴数のせいでな。めちゃくちゃ面白いわ。

インタビューされた全員の表と相対的な人気度もあるで。でも実際これは俺が考えとったポッドキャストやなかったんや。でも明らかにSequoia Capital、これは非常に大きなテック投資会社やけど、そのYouTubeチャンネルの下に2つのポッドキャストがあるみたいやな。Crucible MomentsとTraining Dataや。

俺が考えとったのはTraining Dataで、これはもちろん機械学習とAI中心のやつや。Isomorphic Labsとの「全ての病気を解決するクエスト」のやつもあるし、これはGoogle DeepMindの傘下で始めたIsomorphic Labsや。AlphaFoldとか全部それやな。Isomorphic Labsはその応用レイヤーみたいなもんで、薬剤発見を加速させとるんや。それはええやつやな。

詳細検索の再実行

その検索をやり直してみよ、このTraining Dataポッドキャストだけに焦点を当てて見れるかどうか。同じことやけど、彼らのTraining Dataポッドキャスト用にて言うわ。うまくいけば、俺が求めとることを理解してそれもやってくれるやろ。

ここやな。めちゃくちゃ早かったで。そのポッドキャストの最後の10人のゲストがここやな。一番人気やったのはOpenAI の元研究責任者Bob McGrewとのやつやったて。

チェルノブイリのストリートビューを見つけてくれ。お、なかなか面白いな。実際にinstantstreetview.comに行って、これを見つけてくれとる。そうや、チェルノブイリで、これはなかなか気味悪いな。

あの茂みの向こうに三つ頭のオオカミの輪郭が見えると思うんやけどな。まあ、自然は回復しとるわ。これがチェルノブイリで撮られたのがすごいで。メルトダウンした発電所にめちゃくちゃ近いとこでな。GoogleストリートマップがGamma Travelを使ってこのストリートビュー写真を撮ったみたいやな。これは2020年6月に撮影されたんや。

2020年6月で、この人たちは第一にソーシャルディスタンスしてへんし、第二にマスクもしてへんと思うわ。まあ、チェルノブイリに住んどったら、もっと心配することがあるやろうけどな。

全体的な評価と今後の展望

とにかく、Cometブラウザをテストした後やけど、本当に未来を感じるで。まだ完全にそこまで到達してへんけどな。これが全部の進む方向や。これがどこに向かっとるかは非常に明らかやな。

音声を使ってこれらのAIエージェントにコマンドを実行させるのはめちゃくちゃ自然やで。俺らが全部をクリックする理由なんてないやろ?ラザニアのレシピが欲しくて、それからそれらの材料を注文してもらったり、最後のAmazon注文をチェックしたりするのに、わざわざ検索して注文履歴を見る必要なんてないやろ。

これらが十分賢くなったら、人間がそんなことする理由なんてないんや。そしてこれはかなり近づいとる。今でもphoto Pみたいなもんで問題があるけどな。何らかの理由で新しいプロジェクトを開けへん。

それはグリッチかもしれんし、多分photo Pが広告を確実に表示させるために何かを入れとるんかもしれん。せやから自動化されたトラフィックが多すぎるのを望んでへんのかもしれんけど、Instacartナビゲーションにはめちゃくちゃ感動したで。

セキュリティとプライバシーの考慮

このInstacartを見てみい。始める前に200ドル分のもんが入っとったと思うんや。ラザニアの材料を全部追加して、見てみい、ここにあるで。それから追加してへん全部を削除してくれて頼んだんや。前に入っとった全部をな。できたで。

でも見た限りでは、全部削除してくれたみたいやな。マーケティングメールの配信停止がもっとうまくできたらええのになあ。「何でも自動で配信停止してくれ」て言えたら絶対に気に入るで。違う表現でもう一回やってみて、できるかどうか見てみよ。

でも、これが全部一人でできるようになったら、めちゃくちゃすごいことになるで。特に音声アシスタントが、あんたが何を望んどるか正確に分かって、リアルタイムで話しながらそれを実行できるレベルに到達したらな。

一つ理解しとかなあかんのは、Chromeブラウザプロファイルを追加する時は、Perplexityにどんな情報を与えとるか理解しとくことや。明らかにこういうもんの多くでは、GmailやInstacartやその他の場所との接続にサードパーティを導入することになるからな。

俺が言いたいのは、デューデリジェンスをしっかりやってくれてことや。ちょっとプライバシーを諦めることになるかもしれんてことを意識しといてくれ。そういうのにめちゃくちゃ気を遣う人もおるからな。個人的には、俺はたぶんCometプロファイルを追加して、本当に助けになるもんにはログインするけど、メインのGoogle Chromeプロファイルは完全に移さんと思う。そこには膨大な量のもんが入っとるし、ちょっと心配やからな。

でもCometプロファイルを追加して、使う予定の全部にログインするのはめちゃくちゃええアイデアやと思う。何が共有されて何がされへんかとか、そういうことを理解しとる前提でやけどな。

でもこれは基本的にChromeにPerplexityが乗っかったもんや。せやからChromeを使っとったら、めちゃくちゃ直感的で、慣れ親しんだもんにめちゃくちゃ似とる。プラグインや拡張機能も全部あるしな。

気づくべきことがいくつかあって、パーソナライゼーションがあるんや。タスクもあるで。最新ニュースを送るみたいな毎日の定期的なタスクや、Gmailみたいないろんなもんとの接続ができるんや。設定セクションでは、AIデータ保持があるで。オンオフできるけど、デフォルトではオンになっとる。

下にリンクをいくつか載せとくで。招待コードを配布できるもんがあったら載せるつもりや。ピン留めコメントにも載せるかもしれん。それらはかなり限られとるけど、この動画にコメントしてくれた人にできるだけ配るつもりや。

まだアクセスがあるかどうか確かやないんやけど、2つの招待が利用可能で、時間が経ったらもっともらえるかもしれん。せやから、この動画にコメントしてくれた人とチャンネル登録してくれた人を優先するつもりや。それをする一番ええ方法を考えてみるわ。

でもうまくいけば、何人かには配れるやろうし、新しいのが入ったらこの動画を通して配るつもりや。

ここまで見てくれて、本当にありがとう。俺の名前はWes Rothや。また次回会おうな。

コメント

タイトルとURLをコピーしました