Perplexity CEO: ブラウザ戦争、Googleへの挑戦、ホワイトカラーの仕事と更なる展望！

この動画は、Perplexityの最高経営責任者であるアラビンド・スリニバサンが、同社の新しいウェブブラウザ「Comet」について詳しく語ったインタビューである。GoogleのChromeに対抗する戦略、AIエージェントの将来性、モデルの選択基準、プライバシーとセキュリティへの取り組み、そして人工知能が労働市場に与える影響について幅広く議論している。特に、ブラウザを通じたAIエージェントの活用により、従来の検索体験を根本的に変革しようとするPerplexityのビジョンが詳細に説明されている。

Perplexity CEO: Browser Wars, Taking on Google, White Collar Jobs and More!

Download The Matthew Berman Vibe Coding Playbook (free) 👇🏼 Humanities Last Prompt Engineering Guide (free) 👇🏼

Perplexity CEOが語るAIブラウザの未来
Chrome拡張機能からの学び
エージェント機能の実装
Cometの使用体験
ブラウザ統合の重要性
Googleとの競争戦略
コストと市場参入の優位性
AIウェブブラウジングの未来
モデル選択と後トレーニング
フロンティアモデル競争への参入
ローカル実行の可能性
プライバシーと広告に関する明確化
データ収集とプライバシー保護
AI による労働市場への影響

Perplexity CEOが語るAIブラウザの未来

多くの人がChatGPTを飛び越えようとして、チャットボットにより多くの機能を構築しようとしていますが、完全にポイントを見逃しています。チャット層を誰が所有するかは既に決まっていて、そのゲームは終わっているのです。

あなたが独自のウェブブラウザを構築するきっかけとなったのは何ですか。

そのアイデアの起源は、Perplexityがオペレーティングシステムの構築まで考え始める世界があるのかということでした。あなたがツイートしていたOS at AIのことですね。私は2位を狙うことには興味がありません。1位を狙いたいのです。

Cometで何が追跡されているのでしょうか。広告配信の計画はどうなっていますか。

人間はAIに対して、スポンサーリンクを全て無視するよう指示することができてしまいます。多くの人がAIによって仕事が自動化されることを心配しています。新しい仕事を創出するために、より多くの起業家が現れる必要があります。TwitterやLinkedInなどで学習することはできますが、それだけでは十分ではありません。

アラビンさん、参加していただきありがとうございます。今日は様々なことについてお話しします。ちなみに、ここはPerplexityのオフィスです。素晴らしいですね。

明らかに、Cometについて話す必要があります。Cometは約1週間半前、5日前にリリースされました。私は切り替えて使っていますが、素晴らしいです。しかし、まず理由について話したいと思います。独自のウェブブラウザを構築するきっかけとなったのは何ですか。

そのアイデアの起源は、明らかに最終的にほとんどのユーザークエリがブラウザの検索ボックスを通じて行われるということでした。これは私たちがエージェントやその他のことを考える前の話です。今日の世界における検索クエリのエントリーポイントは何でしょうか。おそらく約150億件、それが今日のGoogleのクエリ量です。

そして、そのトラフィックの大部分、おそらく70から80パーセント、正確な数字は分からないのですが、ChromeやSafariの検索ボックス、またはGoogleのURLバーを通じて流れています。これはオムニボックスと呼ばれる専門用語です。

Googleがなぜツールバーを作ったのかという歴史的な経緯もあります。今はもう存在しませんが、全てが一つの検索バーに統合されています。当時、ブラウザにはURLボックスがあり、その下のブックマークパネルの下にGoogleツールバーがあって、他のページからでもGoogleで直接検索できました。当時はURLバーはナビゲーション専用であるべきだという区別があったからです。

しかし今はその区別はもうありません。一つのボックスに何でも入力できます。だからオムニボックスと呼ばれているのです。そしてGoogleツールバーの設置により、Googleのトラフィックが5倍になったと思います。そうして広告収入を増やすことができ、ブラウザにGoogleツールバーを設置するために人々にお金を支払うことができました。

他のデスクトップソフトウェアクライアントにお金を払って、ローカルブラウザにGoogleツールバーを強制インストールさせることもできました。Microsoftに支払わなくても、他のデスクトップクライアントをインストールする際に、IEにGoogleツールバーをプッシュして大量のトラフィックを獲得できたのです。それほどツールバーはGoogleにとって重要でした。

興味深いことに、ツールバーに取り組んでいたのはスンダーでした。そして歴史的な瞬間があったのです。MicrosoftがInternet Explorerのアップデートをプッシュして、Googleツールバーを削除し、MSNか何かに保持させようとしました。

そこでGoogleは慌てて、全てのOEMと取引を行い、このパッチがない古いバージョンのIEを維持させました。これは全てスンダーが行い、その時にGoogleは独自のブラウザを構築しなければならないと決めたのです。Microsoftの支配下にいることはできませんから。

それは知りませんでした。

これはGoogleが公式に発表したことではありませんが、多くの元Google社員がこれを記録していると思います。

Chrome拡張機能からの学び

私たちにも似たような事件が起こりました。誰かが私たちのChrome拡張機能をインストールして、Perplexityをデフォルトに設定する拡張機能です。私自身にも起こったことなので、問題なく話せます。

Chromeのアップデート後、それが消えてしまうのです。Chrome storeに行って何が起こったのかを確認すると、「この拡張機能は、検索データを取得する可能性があるため、このアップデートで自動的にアンインストールされました」といった理由が表示されます。そして思った通りに動作しなくなります。動作が不安定になるのです。

私たちには別の拡張機能もありました。サイドバー拡張機能で、毎回サイドバーに表示されるものです。明示的なサイドバーではありませんが、ページについて質問することができます。しかし、私たちが望むようなことは全てできませんでした。

そのため、ある時点で独自のクライアントが必要で、自分たちの運命をコントロールする必要があることが明確になりました。

しかし、これは私たちのような会社にとって大きな注意散漫です。コア製品を完璧にすることが重要なのに、多くの人が独自のAIに検索機能を組み込んでいるため、検索サービスを改善して無関係にならないようにしなければなりません。ブラウザは数ヶ月間の専念した取り組みが必要なので、なぜそれに取り組むのかという疑問があります。多くの人が私にそれに取り組むことを思いとどまらせました。

しかし、私にとっての転機は、この決定を単なる守りではなく、攻めと守りの両方から行うことができるかということでした。これまで述べた理由は全て守りです。攻めは、ブラウザでしかできないことがある時です。そして、それがAIと検索の次の向かう先であるエージェントなのです。

正直に言って、誰もが最初に出荷した本当のエージェントはDeep Researchでした。ウェブを研究し、様々なことを行うことができます。そして私たちはLabs機能を作りました。実際にダッシュボードやウェブサイト、分析、そして多くのウェブアプリを構築できます。

私たちは既に、これらの推論モデルが10分間じっくり考えて、あなたが数時間かかることを作成する能力を見始めています。今、その力を日常のブラウジングタスクに応用することを想像してください。異なるタブからコンテキストを引き出し、SlackやNotion、Google Docsなどでディープリサーチを行い、100通のメールに回答し、カレンダーを監査して会議を移動させるなど、個人秘書や役員秘書があなたのために行うような全ての作業です。

小規模事業主であれば、商品の価格を比較し、自分の商品の価格設定方法を考える際に、これらのタスクに10時間や5時間費やしたり、フルタイムでこれを行う小さなチームを雇ったりする人に対してアービトラージを得ることができます。また、Redditでのコメントに基づいてマーケティングメッセージを調整し、彼らに話しかけようとするようなことも含まれます。

エージェント機能の実装

これらのことは全て多くの時間がかかり、従来のアプローチではウェブを完璧にクロールしてこれらを確実に行うことはできません。必要に応じてタブを開いてリサーチを行い、オンデマンドで必要な情報を引き出し、これらを全てユーザーがタブをコントロールして作業を完了できる出力に調整する能力を持つことです。

私たちは、これはクライアントを完全に所有し、最もエレガントな方法でAIを組み込む場合にのみ可能だと感じました。そのため、これが守りと攻めの両方の理由となって、ブラウザに取り組むことに決めたのです。そのため、昨年末頃からこれに取り組み始め、出荷までに約8ヶ月かかりました。

かなりクレイジーなタイムラインです。ゼロから立ち上げまで8ヶ月です。もちろん、コメントで「それはChromiumのフォークだ。彼らは実際にはゼロから構築していない」と言う人がいることは認めます。はい、それはChromiumのフォークです。しかし、全てはLinuxのフォークでもあります。巨人の肩の上に立っているのです。

GoogleがChromiumライブラリをオープンソース化した作業を尊重しています。私たちはその上に構築しており、それに貢献することも希望しています。単なる消費者になるつもりはありません。

実際、GoogleのDOJ裁判での私たちの証言では、OpenAIがGoogleからChromeを購入しようとしていると推進していたと述べました。私たちは実際に、ChromeはGoogleから分離されるべきではなく、Google内に留まるべきだという論拠を立てました。その理由の一つは、Googleがオープンソースの良い管理者であったと感じたからです。オープンソースの反対であるOpenAIがChromiumを所有するのは理にかなわないでしょう。

私たちはChromiumやChromeを運営する権利を獲得しなければならないと考えています。10億人規模でブラウザを提供するのは非常に大きな取り組みです。そこまで構築していかなければなりません。

確実にChromiumの上に構築しており、開発タイムラインは加速されました。しかし、基本的なブラウジング機能が確実に動作し、ログインをインポートし、基本的なタスクを行うための品質テストやバグ修正の量は、それでも多くの作業が必要でした。そして、それだけでなく、エージェントが人々を驚かせる程度まで動作することも確実にしました。

そのため、8ヶ月で実現したリリースを非常に誇りに思っています。まだ完了したとは言えません。100万人の人々が日常的に使用できるようにし、そこからスケールアップする必要があります。まだやるべきインフラストラクチャ作業がたくさんあります。しかし、現在の出発点には非常に満足しています。

Cometの使用体験

最初にインストールした時、録音開始前に言いましたが、絶対にシームレスでした。全てのブックマークと認証情報を取得できました。しかし、エージェントを使い始めた時、クラウドベースのエージェント環境を使用した時との違いに気づきました。クラウドで環境が立ち上がり、毎回基本的にゼロから始めなければならない場合と異なります。

私は既に認証されており、タスクの途中で「今がエージェントに引き継いでもらう良いタイミングだ」と思った時、このような体験は完全にホストされたバージョンでは実際には不可能だと思います。これが理由の一つですか。そして、誰も他の人のサーバーでクライアントの完全にホストされたバージョンを望まないと思います。それは非常にリスクが高いからです。

なぜそう言うのですか。なぜ第三者のアプリや他の人のサーバーでクライアントのログインバージョンを望むでしょうか。それは大きなセキュリティリスクであり、クッキーやOAuthトークンを削除することを確実にしなければなりません。

Cometを使用する場合、これらは全て心配する必要がないことです。全てがクライアント上に存在するからです。基本的に、AmazonやUber、Gmail、Google Calendarなど、日常的に使用するサービスのログインバージョンをサーバーに保持する必要がありません。

これは私たちの運営方法とOpenAIがOperatorで行おうとしていた方法との大きな違いです。Operatorは全てのサーバーサイドバージョンを保持し、ヘッドレス方式で全てを行おうとしていました。OAuthトークンを保存したり、永続的なクッキーを保持したりする必要がありました。これらはユーザーのセキュリティを確保する良い方法ではありません。

ブラウザは基本的に2つの方法で勝利をもたらします。一つは、クライアントとサーバーサイドアーキテクチャのハイブリッドを提供することです。全てのログインはクライアントサイドに留まることができます。第三者サービスの全てのログインバージョンはクライアントサイドに留まることができます。そのデータは全てクライアント上に存在し、私たちがそれを取得する必要はありません。

Cometエージェントやアシスタントに何かのタスクを行うよう指示すると、ブラウザの開いているタブからその特定のプロンプトに関連する情報のみを引き出し、画面を解析してタスクを完了します。タスクのインテリジェンスは、クラウドで実行されているモデルであるサーバーサイドから取得されます。これらのモデルは非常に強力で、今日ローカルで実行することはできないからです。

これらのクエリを削除したい場合、Perplexityに行ってこれらのクエリを削除したり、サポートしているシークレットモードで実行したりすることができます。私たちはこれらのプロンプトや中間の思考連鎖を保存することはありません。全てが安全に保たれます。

そうして、全ての情報があなたに属することを真に確実にし、フロンティアインテリジェンスの恩恵をサーバーから受けながら、オンデマンドベースでのみあなたのデータに適用し、サーバーにログインしたままにする必要がないようにできます。これは、サーバーにログインしたままにしようとするOpenAIのアプローチと比較して、非常に良いセットアップです。

もう一つ言いたいのは、オムニボックスについてです。「なぜブラウザが必要なのか。それは全てレガシー製品だ」と論じようとしている人たちに対してです。「チャットウィンドウを提供して、それと話せば、全てを行ってくれる」と言いますが、AIはまだ100パーセントの信頼性で全てを自律的に行う準備ができていないと思います。

私は今でもCometにPerplexityの財務会計を正確に行うことを信頼しないでしょう。私たちは多くの現金を持っており、Morgan StanleyやJPMにログインすることを信頼しないでしょう。それらにはログインするのが非常に困難なシステムがあり、今日これらのことはできません。

ブラウザ統合の重要性

では、ブラウザに行ってこれらのことを行うつもりですか。全ての作業を行う一つの環境が欲しいのです。それがブラウザが可能にしてくれることです。オムニボックスは、とにかくほとんどのことを入力する場所です。私があなたを直接そこで、または閲覧中のウェブページで手助けできれば、一緒にブラウジングできるのです。それは非常に強力で、タスクも完了できます。

そのため、完全に異なるUIのデスクトップアプリにロックインし、その一部としてストリーミングUIを構築しようとする他のアプローチは決定的に理にかなうと思いました。エージェントはかなり不安定で、実際にはタスクを完了しません。それがOperatorで人々が希望を失った理由です。

よりネイティブな体験は、多くの場合うまく機能しています。HTML5対ネイティブアプリを見ることができます。ネイティブ体験が引き継いだ多くの決定がありました。

あなたが説明した全てを、PerplexityをGoogle Chromeからディプラットフォームするものとして見たいと思います。そこから外挿すると、Perplexityがオペレーティングシステムの構築を考え始める世界があるでしょうか。OS AIとツイートしていたのを知っていますが、そしてデバイスのようなものも。そのビジョンはどのようなものでしょうか。

私たちはデバイスの構築には興味がありません。それは基本的に大きなコミットメントであり、会社には深刻なハードウェア専門知識を持つ人がいませんし、今日これに取り組むことは焦点の欠如だと思います。

OSは、ブラウザに取り組んだ後、私が思っていたよりもはるかに達成可能です。物事に取り組む権利を獲得しなければならないと思います。私たちは非常に良い検索製品を作りました。他の全てのチャットボットが私たちをコピーするほど、検索を完全に再定義しました。

O3のようなモデルが登場する前から、最初のマルチステップ推論検索を行いました。それをハッキングで組み合わせて、それが現在のリサーチエージェントの青写真となりました。思考の連鎖や中間ステップをストリーミングし、全てのUXをPerplexityが構築しました。

私たちはChatGPTレベルの使用量ではありませんが、かなりの規模の使用量に到達したと思います。リテンションの観点では、2番目に使用されているAIチャットボットだと言えるでしょう。Geminiの方がユーザー数は多いですが、モバイルのリテンションを見ると、かなり貧弱です。

実際に人々が使用するアプリ、特に情報に関して、ChatGPT以降で一貫して高いランクを維持しています。そのため、次の大きなものを構築する権利を獲得したと思います。

多くの人がChatGPTを飛び越えようとして、チャットボットにより多くの機能を構築しようとしていますが、完全にポイントを見逃しています。チャット層を誰が所有するかというフロントエンドは既に取られており、ゲームは終わっているのです。OpenAIが完全にそのレースに勝ちました。事実から逃れようとしても意味がありません。

Googleは明らかに大きな差で2位になろうと努力し続けるでしょうが、私は2位を狙うことには興味がありません。1位を狙いたいのです。そして、ワークフロー、エンドツーエンドのエージェントワークフローは、チャットの一層上に位置します。

ブラウザは、チャットキーよりも使用頻度の高い製品であり、非常に粘着性の高い製品です。一度そこにいると、他のブラウザに戻るのに多くの努力が必要です。そして、Googleが初めて脆弱になっていると感じます。

Googleとの競争戦略

彼らは全てのAI機能を出荷できますが、多くの推論コストがあります。人々にリンクをクリックさせるビジネスモデルを破壊したいだけであっても、何十億ものユーザーに多くの推論コストを消費するエージェントを出荷するには多くの支出が必要で、私たちでさえそれはできません。現在でもPerplexityはMax ユーザーと待機リストの招待された人々にのみ提供しています。

これをスケールアップするには時間がかかります。これは新しい製品です。そのため、私たちは他社を先回りすることを喜んでいます。これは物事を速く出荷し続けることができる製品でもありません。ここでは全てに時間が必要です。

この製品に取り組むという本当の苦痛にコミットすることになります。私たちがこの製品に取り組んでいるので、クライアントの最初のバージョンを立ち上げるだけでなく、継続的なアップグレードと新しいものを継続的に出荷し、ここで10年間の作業にコミットするという良い参入障壁になることを期待しています。それが私たちが行うことです。

あなたは明らかに非常に競争心が強いですね。GoogleはブラウザにAI機能を追加し続けるでしょう。OpenAIも、噂ではブラウザを近々立ち上げるかもしれません。どのように競争力を維持しますか。進化を続ける中で、どのような差別化を見込んでいますか。

Googleに対する論拠は、私たちがPerplexityのコアで持っていたGoogleに対する論拠と同じで、それは経済性です。エージェントがリンクをクリックし、それらを読み通し、実際に購入決定を行い、実際に購入を行う場合、なぜ企業がGoogle Adwordsに年間何十億ドルも費やすのでしょうか。

それは、広告主に対して維持している約束の完全な失敗のように感じられます。彼らは皆、本当の人間のクリックを得ていると信じており、人間はAIに対して「実際にGoogleに行く時は、スポンサーリンクを全て無視して、本当のものだけをクリックして、これらのサイトの全てのレビューを読み、これらのYouTube動画を全て見て、全てのレビューを読んでから、最良のものをクリックして買い物をして、全てを完全に私に委任した。購入前に確認してください」と指示することができます。

これを保存して、10分か15分費やしてこれを行うと、この長期間のタスクをつなぎ合わせて、私に戻ってきて「これが見つけたもので、あなたが好きで気にかけることに基づいて、これがあなたに合うと思います。購入に進みますが、承認しますか」と言います。私が「はい、進めてください」と言うとします。

では、なぜ他の人々がこのアドワードに入札してそんなにお金を費やすのでしょうか。彼らには完全に無意味です。パフォーマンス広告よりもブランド広告により多く費やさなければなりません。それがGoogle Adwordsビジネスのキラーであり、なぜ彼らがこれをクレイジーなペースで出荷するのでしょうか。

実際に今年のGoogle IOで発表したProject Marinerに気づいているでしょうか。これらのことの一部を行うことができるように見えましたが、完全ではなく、月額250ドルの有料プランの後ろにあります。Perplexityのような新進のスタートアップにとっては、実際にGoogleが持っている1000億ドルのキャッシュフローを持たないため、月額200ドルの有料プランの後ろに物事を置くのは問題ありません。

しかし、なぜGoogleがそれを行うのでしょうか。ビジネスを妨害したくないからです。そのような技術へのアクセスを全員に与えることで失うものが非常に多いのです。

コストと市場参入の優位性

2つ目は明らかにコストです。この推論コストは非常に高いです。そのため、既にユーザーベースを持っている人よりも、働き上がっている人にとって有益なのです。今日30億人にこれを撃つことはできないでしょう。多くの努力が必要です。

3つ目はセキュリティリスクです。私たちがセキュリティやプライバシーを非常に気にかけないと言っているわけではありません。私たちは多くのケアをしますが、私たちはスタートアップです。挑戦することが期待されています。人々は、極めてうまく機能するが、今日はまだ完璧ではない製品で問題ありません。

Googleにとって、Chromeのビジネス利用で持っているセキュリティ基準とエンタープライズセキュリティ基準は非常に高く、ここでエラーを犯すことは、ピザにチーズが付くグルーよりも100倍悪いことになるでしょう。あのエラーを覚えていますか。あれは彼らに多大なコストをもたらし、Bardを初めてデモした時にライブエラーを犯し、Google株が7パーセント上昇したか何かでした。

そして、彼らはGeminiでより多くのミスを犯し続けました。検索ビジネスの聖杯であるオムニボックスという最も重要な資産の一つでミスを犯し、実際にはそれほど速くAIを出荷したくないSafariや他のブラウザに人々を切り替えさせることは、トンのコストをもたらすでしょう。

そのため、彼らはこれらの事と戦わなければならないと思います。そして明らかに官僚主義もあります。誰かがAIを構築し、誰かがブラウザを運営し、誰かが広告を構築しており、全員が立ち上げ計画に合意するのに数ヶ月の作業があります。

私たちは、これらの全てを出荷し、初期のコアユーザーを集め、はるかに良い製品を構築するのに十分な時間枠があると感じています。

AIウェブブラウジングの未来

Cometの体験について話しましょう。Cometを最初に使い始めた時、ウェブブラウジングの未来が人間にとってどのようなものになるかの垣間見えを見始めました。人間と実際のインターネットの間に、ほぼ分離があるように見え、今ではその中間にエージェントがいるようになります。それがあなたの意図でしょうか。それがビジョンですか。

特にAIが非常に多くのコンテンツを生成することで、ノイズ対シグナル比が悪化する中で、インターネットから情報を消費する唯一の方法は、私の前にエージェントを置くことかもしれません。それがあなたの長期的なビジョンですか。

ウェブがほとんどのコンテンツがAIのジャンクとスロブになるほど悪くならないことを期待しています。今日既にそのように感じています。Xで今ツイートを投稿すると、多くの反応がボットで、私はそれらをスパムやボットとしてマークし続けていますが、それと戦うのはかなり困難に見えます。

そして、確実にそれはCometの素晴らしい使用例になるでしょう。この記事を読んだり、私のためのツイートの束を読んだりして、AIとスパムに見える全てをフィルタリングし、シグナルだけを引き出して、私が摂取したい形式で要約し、このローカルホストクライアントでホストして、私が読みたい形にすることです。

そうすれば、あなたが読みたいXの独自バージョン、あなたが読みたいLinkedInの独自バージョンを構築できます。多くの人があなたに接続要求を送っているが、それら全てを通すのに時間がないような場合、「少なくとも一つの共通点がある人だけをフィルタリングしてください。私が知らない人からの要求は受け入れたくありません」と言うことができます。

それは実際に私がCometに使った使用例でした。素晴らしいですよね。または、イベントを主催して200人が参加したがっている場合、「この基準に従ってフィルタリングして。LinkedInで調べて、評判の良いブランドの出身かどうか確認して。これらが私が望むブランドで、その人々を最初に取得して、彼らのリクエストを受け入れて、参加したというメールを送って」と言うことができます。

これにはあなたやあなたのチームの誰かが何時間かかるでしょうか。かなりの時間がかかる退屈なタスクですよね。絶対にそうです。それが私たちが目指している種類のことであり、あなたの表現に基づくノイズ対シグナル比が、AIのために時間とともに下がっていくなら、私たちはそれと戦う方法だと期待しています。つまり、誰もがスパムをフィルタリングし、シグナルだけを与える自分の個人的なAIを持つということです。

モデル選択と後トレーニング

Perplexityに統合することを選択しているモデルについて話したいと思います。あなたは既に多くのモデルをサポートしています。最近Xで投稿していましたが、Qwenモデルが内部評価で良好な結果を示しており、間もなく後トレーニングを開始するとのことでした。

2つのことがあります。Perplexityと統合するモデルをどのように選択しますか。そして、その種の高レベルな後トレーニングはどのようなものですか。Perplexityにとって本当に良いモデルをどのように作るのですか。

素晴らしい質問です。私たちは内部でPPLXベンチと呼んでいるベンチマークを持っています。そして、これは私たちが継続的にプロンプトを追加し続けているベンチマークです。

誰かがXでバグを報告したり、製品から直接報告したり、Discord、Redditなど、バグを収集するチャンネルが非常に多くあります。私たちは即座にバグを修正しに行くのではありません。xAIのようにプロンプトを変更してバグを修正しに行くのではありません。

代わりに私たちが行うことは、それを評価セットに追加することです。複数のバグを一緒に修正しようとします。プロンプトの変更または後トレーニングの変更のいずれかで、そしてベンチマークセットのギャップで評価します。

ベンチマークセットは、私たちの製品とユーザーにとって本当に重要なプロンプトに拡張し続け、プロンプトのバージョン管理や実行する後トレーニングの種類、良い後トレーニングを行ったかどうかを判断するための評価の実行において、私たちが行う変更に対する基準真理信号を提供します。

Qwenのような新しいモデルがドロップされるたびに、学術的なベンチマーク状況だけで判断する必要はありません。実際に私たちの内部評価でどのようにスコアするかを見ることができ、これは非常に多くの異なる垂直または使用例に分かれています。

そして、モデルがかなり良くなったら、私たちのベンチマークにオーバーフィットするのは任意のモデルプロバイダーにとって困難です。なぜなら、実際にはそれの公開バージョンがないからです。彼らは、評価セットが非公開であっても、トレーニングセットに類似したプロンプトをより多くマイニングすることで、学術的なものにオーバーフィットできたかもしれませんが、Perplexityのためにマイニングすることはできません。それは実際のユーザーだからです。

それは役立つと思いますし、後トレーニングの実行方法は、今日うまくいっていない多くのプロンプトと、モデルが汎用モデルとして良好である必要があるプロンプトの束をサンプリングし、それら全てを後トレーニングとして組み合わせて、SFTとRLHFの両方を行います。

RLHFでは、DeepSeekによって設計されたGRPOアルゴリズムを使用しています。現在、私たちの後トレーニングは全てDeepSeekモデルで行われており、これらは最先端だと言えるでしょう。Qwenは確実にそれに挑戦するでしょう。私たちはまた、Alibaba Qwenモデルのより小さなファインチューンを持っており、多くの分類器に使用しています。

私たちが使用するモデルは多くの異なるものがあります。使用するのはコアチャットモデルだけではありません。プロンプトがある時、個人データが必要かどうか、金融UIを生成する必要があるか、チャートが必要か、スポーツカードが必要か、ショッピングクエリかどうか、異なる時計の構造化されたカードをレンダリングすべきかどうかを分類する必要があります。

そのため、Perplexityクエリを尋ねるたびに実行されているモデルは約20種類あり、単一のモデルを選択していても、選択したのは実際にレポートを要約し、2つの呼び出しを調整するモデルです。選択しているのはそれであり、それ自体では全ての作業を行うことはできません。

それは困難なことではありません。皆がこれを行っています。OpenAIもこれを行っており、なぜなら彼らもChatGPTで何かを尋ねるたびに、ウェブを検索するかどうかを決定するからです。それは単なる分類器ですよね。

AIは、関連する全てのコンテキストをうまくコンテキストエンジニアリングし、関連する全てのツールを調整し、それら全てを素晴らしいユーザーワークフローにパッケージできる人によって勝たれると思います。それがモードだと言えるでしょう。

モデルは確実に役立つでしょう。疑問の余地はありません。インテリジェンスが多くの魔法を行っています。O3やSonnet 4のようなモデルなしでは、私たちが行っている多くのことを行うのは非常に困難でしょう。しかし、今日のフロンティアが何であれ、少なくとも1年後にはコモディティになると期待しています。

フロンティアモデル競争への参入

Perplexityがフロンティアモデルプロバイダーと競合する必要があると見ていますか。その追加の5パーセントのインテリジェンスを得るために何十億ドルも費やすことになるからです。あなたの考えはどうですか。

それすらありません。多くの人が私たちがモデルの訓練方法を理解していないと思っていますが、それは真実ではありません。私たちは確実にここで物事を行うLLMの専門知識を持っています。しかし、一度だけモデルを出すことではありません。

Mistralがある時点でそれを行いましたが、今日誰も彼らのモデルについて話していません。なぜでしょうか。モデルを生産し続けなければならないからです。それは決して終わらない旅です。誰かが汎用知能、超知能、またはどのような手段によってでも何らかのクレイジーなモデルを達成するまで、それが何を意味するかは誰も知りませんが。

誰かがそれを達成し、再帰的自己改善ループを得て、他の全てから非常に先に進むまで、少数のリーダーボードとベンチマークで皆を飛び越えるラットレースに留まらなければなりません。そうしなければ、最高の研究者はそれを行う研究所で働きに行くか、1億ドルを支払って彼らを獲得する人にポーチされるでしょう。

それについて尋ねようとしていました。クラスターを構築し続けなければなりません。2年先まで計画しなければなりません。数十万のGPUのクラスターを構築します。これらのものは多くのエネルギーを要するため、多くのエネルギーを購入しなければなりません。独自のデータセンターを構築しなければなりません。そのために計画しなければなりません。

あなたはその会社に完全になる必要があります。それを受け入れる必要があります。会社内でモデルを訓練する研究チームではありません。全てであり、そして何かを出して、良い週の祝賀をして、6ヶ月後に無関係になることではありません。私はそれには興味がありません。

そのため、製品とユーザーにとって本当に重要なモデルを訓練することが非常に重要です。現在私たちが気にかけていることは2つあります。一つは、参照と幻覚なしの極めて良い要約、正確性、そして回答をうまくフォーマットすることです。それは既にSonarによるものです。私たちはそれらのモデルをSonarと呼んでいます。実際に私たちのクエリのほとんどがそのモデルに向かっています。モデルを選択せずにベストを選択しても、私たちのクエリのほとんどはSonarに向かっています。

今、私たちはブラウザのコントロール、タブのクリックに本当に優れたモデルを訓練したいと思っています。今日そのために独自の内部モデルを使用していますか。

私たちはまだそのための独自の内部モデルを持っていません。コンテキストのパッケージングや要約、データの変換を行うための独自の内部モデルを使用していますが、何を行うかの決定、実際のアクションは非常に価値のあることであり、そのようなモデルが将来すぐにローカルで実行できることを期待しています。

そのようなモデルを訓練したいと思いますし、要約、引用、会話検索に非常に優れたモデルを訓練できたように、そこでの専門知識を活用して、ブラウザタブのコントロールに非常に優れたモデルを訓練できると確信しています。

そしてそれは非常に価値のあるモデルになると感じています。極めて曖昧である必要はありませんが、十分に汎用的である必要があります。あまりにも狭すぎることはできません。全ての優れたモデルが持つ汎用性と推論を持つ必要があります。それがモデルのベースIQになりますが、ブラウザをコントロールするのに十分高速になるよう専門化される必要があります。

ローカル実行の可能性

今Cometに与えているタスクが4分か5分かかるものを、真の魔法である1分高速にする唯一の方法は、ユーザーのコンポーネントでローカルにホストできるほど小さな独自モデルを訓練することです。ローカルは極めて素晴らしいでしょう。

MacBookがそれを行うのに十分強力かどうかさえ分かりませんが、もし可能であれば、1年後にそれが可能になるでしょう。Microsoftがラップトップの一部にNPUを行っており、MacBookがM1チップを持っているため、もしそれを行うことができれば、速度を提供するだけでなく、セキュリティプライバシー保証も提供します。サーバーサイドに何が残るかを心配する必要さえありません。全てがパインサイドに残ることができます。それは真に特別です。

そのため、その未来に向けて構築する必要があります。今日それは可能ではありません。誰もO4 miniやO3 miniの品質のオープンソースモデルを持っていません。Qwenモデルのようになってきていると思います。キロパラメータですが、まだローカルで実行できません。DeepSeekは6700億か何かです。まだローカルで効率的に実行できません。

2つの強力なMacBookを組み合わせてDeepSeekをホストできると思いますが、バッテリーを消耗せず、O3のインテリジェンスで動作し、ローカルである何かが欲しいのです。

そのサイズでローカルで動作し、電力効率的で、それほど有能なモデルを持つにはまだかなり遠いように見えますよね。まだかなり良いように感じますが、それは全て起こることです。なぜこれが起こることに対して賭けないのでしょうか。

アルゴリズム的に、蒸留と呼ばれるこの技術は機能します。他のモデルの反応を文字通りクローンする教師あり学習だけでなく、強化学習でも機能します。意思決定を行うポリシーが、確率的により賢いモデルのポリシーと同じであることを確実にできます。

そして、なぜこれが起こることに対して賭けないのでしょうか。なぜオープンソースが追いつくことに対して賭けないのでしょうか。すべきではありません。デルタはより長くなると思います。3ヶ月以内にオープンソースモデルが登場するのではなく、おそらく6ヶ月、1年かかるでしょう。

また、中国の研究所が今日これらのオープンソースモデルを構築しているように見えます。オープンソースモデルを構築する後ろにいる人は誰でも、Metaもオープンソースを行った理由です。もし彼らが先に進んだら、彼らもオープンソースにしないでしょう。それは問題ありません。

後ろにいて、市場をスコーチドアースにする方法は、それを無料で出すことです。誰も本当にオープンソースに長期的にコミットしていると思いません。明らかに後ろにいる場合、現在人々の注意を引く方法は、モデルをオープンソースにすることです。

そして中国も同じことをしています。彼らは後ろにいて、世界の注意を引く唯一の方法は、モデルをオープンソースにすることです。その結果、素晴らしい人材を引き付け、最終的に最高のモデルを飛び越えるのに役立ちます。しかし、その間に開発者のメインシェアを所有することもでき、それも製品のブランドに貢献します。

多くの開発者がそれを基に構築しているなら、あなたのブランドは現在よりもはるかに強力になり、人々があなたのアプリも使用するようになります。それがDeepSeekに起こったことです。示されていますよね。

そのため、オープンソースを行う論拠はより実用的だと感じています。そうでなければ、なぜ誰かが1000億ドルを費やして、それを他の人が使用して独自のアプリを構築するために無料で配ってしまうのでしょうか。

一度先に進んだら、インセンティブはそれほどありません。はい。彼らは何らかの方法でライセンス料を請求するでしょう。特定数のユーザーがいる場合は使用できないなど、彼らは既に行っています。

誰が真にオープンソースにコミットしているかは明確ではありませんが、オープンソースによって最も利益を得る一人のプレイヤーが常にいて、そのプレイヤーがオープンソースし続け、それが私たちのようなアプリケーション層の会社が恩恵を受けて、全てのデータで後トレーニングを行い、私たちのものを本当に良いものにするでしょう。

最も後ろにいて、最大の現金準備を持っている人が誰でも、オープンソースに投資し、インテリジェンスの価格を最終的にゼロまで引き下げる人になるでしょう。うまくいけば。

プライバシーと広告に関する明確化

Cometとプライバシーに関してPerplexityについて話したいと思います。あなたは文脈から外れて取り上げられましたが、Cometでユーザーが行う全てを追跡し、それを使用して非常に超個人化された広告を配信すると言及しました。

明確にしてください。Cometで何が追跡されているのですか。広告配信の計画はどうなっていますか。

それは私がTechnology Brothers podcastで行ったインタビューでした。彼らは私に仮定的な質問をしました。AIの誰もがサブスクリプションからお金を稼ごうとしています。誰も広告を試みているようには見えません。

では、広告が実際にAIで機能する世界はどのようなものでしょうか。そこで私はその答えを与えました。彼らはその一つの答えである仮定的なシナリオを取り上げて、私が広告をやりたいと言ったのです。

明確に言わせてください。私は広告をやらなくても良い未来のために積極的に戦っています。もし皆が広告をやらなければならないなら、Googleが常に勝ち続けるでしょう。AIでお金を稼ぐ新しい方法も、キーワードやプロンプトに対して広告を配置する同じ古いシナリオになるなら、彼らが勝つでしょう。

彼らは全ての広告ネットワークを持っており、それは基本的に広告はマフィア業界であり、そこで既存者と戦おうとさえ思わないでしょう。

そのため、私たちはエージェントがあなたのために働き、人を雇うようにエージェントに支払うだけで、サブスクリプション料金や使用ベースの料金、完了したタスクごとの料金を支払う未来を創造しようとしています。

完了したタスクごと、またはほぼ仕事を完了させた場合。私たちには、成果や使用に基づいたビジネスモデルのアイデアがあります。フラットなSlackサブスクリプション料金とともに、これらの全てのエージェントへのアクセスのようなものは、リテイナー料金のようなものかもしれません。

そして、もし私たちが数時間、数時間の単調な作業を節約することであなたの人生に価値を提供するなら、それは広告を作成するよりも良いモデルだと感じています。

確かに、プールの平均収益、ユーザーあたりの平均収益は広告に匹敵することはないかもしれませんが、私は気にしません。私たちが1億ユーザーに到達し、年間50ドルまたは100ドルのARPUを持っているなら、それはかなり大きいです。Perplexityにとって年間50から100億ドルの収益は、私が今いる場所からの素晴らしい結果です。

そして、それは私たちを数兆ドルの企業にし、APIのような他のビジネスを構築できます。他の人が第一級アプリを構築するために検索またはブラウジングインフラストラクチャを提供できます。エージェントがあなたのために何かを購入し、ベンダーとユーザーの両方が取引のカットを私たちに与えるPerplexityで行う取引のカットアウトを行うことができます。買い手と売り手のエージェントの両方に支払う不動産エージェントのようなものです。

それは全て可能であり、年間数百億ドルの収益を上げ、Googleのような年間2000億ドルの収益は決してない結果で私は完全に満足です。

世界の大部分の人口が何も支払う余裕がないという問題についてはどうですか。MetaやGoogleが広告を行う大きな理由の一つは、広告によって人々に何でも支払わせることができるからだと思います。

それが真実だと思っていました。それがもう真実かどうか分かりません。ChatGPTの有料版から来る大部分で年間100億ドルの収益に到達できることを世界に示したOpenAIに多くの信用を与えます。

インドのような国でも、カーソル、Claude、特にClaude Codeのようなツールにお金を払っている人々がいます。Claude Codeは、ここの人々の間で多くの牽引力を得ています。私がインタビューしたエンジニアリング候補者は、カーソルに月額1000ドル支払っています。

申し訳ありません。Claude Codeです。なぜなら、それは実際に非常に多くの時間を取り戻し、家族や子供と時間を過ごすことができるからです。そうでなければ、タイトな締切でコーディングに座っているだけです。それは彼らに与えません。

家族の時間がそれだけの価値があると思うなら、あなたはそれにお金を払うでしょう。それは良いフレーミング方法です。

もしあなたが愛する人との時間を得ることや、年に一度余分な休暇を取ることを手助けし、その後仕事でうまくやり、昇進を得て、AIツールに投資した投資以上にペイするとと思うなら、人々はAIをNetflixやSpotifyに支払うようにではなく、実際により簡単にお金へのアクセスを持つために人生をより価値あるものにするかのように考え始めるでしょう。

なぜあなたがお金を稼いで、投資アドバイスを与えるために誰かに支払うように、金融コンサルタントに支払うのでしょうか。不動産エージェントにどれだけ支払っていますか。あなたのためにアパートを見つけてくれるエージェントにどれだけ支払っていますか。あなたは彼らに多くのお金を支払っています。社会がそのように構造化されているため、それについて考えないだけです。

これは新しいことです。ここに書かれた構造的な要素はありません。だから全て新しく感じられます。そのため、既存のメンタルモデルにマップしようとしており、すぐにサブスクリプションサービスとして考えています。

Amazonで月にどれくらい注文するかさえ考えませんよね。しかし、Primeプランを購入するだけです。皆がそれほど頻繁にNetflixを見ているとは思いませんが、メンバーシップを購入するだけです。人々はここでEP Oxygensに300ドル費やしており、それほど頻繁にジムに行くとは思いません。

考えてみてください。実際に多くのことに多くを費やしています。家でコーヒーマシンを購入して、Starbucksに行かないこともできます。

データ収集とプライバシー保護

明らかに広告配信の即座の計画はなく、おそらく長期計画もありません。追跡の部分についてはどうですか。何が追跡されているかについて、何を共有することに快適ですか。

人々がデータを私たちのサーバーに送信しないようにするつもりです。プロンプトに必要な情報をクライアントサイドで抽出しないことは不可能です。私たちはあなたのログイン、パスワード、クレジットカードなどは取得しません。全てがクライアントに残ります。

クライアント上の第三者サーバーの全体的な情報はそこに留まります。もしあなたがSlackで未読メッセージを取得すると言ったら、モデルがそれを要約するために、どのメッセージが未読だったかが一時点でサーバーに送られ、あなたが望むなら削除できます。これを保存しないで、プロンプトさえ保存しないでと言えば、ゼロ保持ポリシーがあります。

プロンプトさえ持ってほしくない場合は、シークレットモードでブラウジングすれば完了です。サービスから削除することもできます。

私たちの夢は、インテリジェンスもクライアントに持ってくることでした。今日それはアルゴリズム的に不可能です。それを行う唯一の方法は、劣ったモデルを出荷することであり、その場合体験が悪くなります。実際に機能しません。

より多くのインテリジェンスがエッジデバイスに出荷されることを疑っています。時間とともに進歩的なものです。メインフレームからパーソナルコンピューティングのような軌跡を持つことを期待しています。スーパーコンピューターや巨大なクラスターのような巨大なクラスターに全てを蓄積する必要がなく、人々の手に力を与えることを期待しています。

ソフトウェア構築と専門的な推論カーネルの記述、蒸留の実行、アプリやブラウザをコントロールするための専門化されたモデルの作成などを通じて、意味のある方法でそれに貢献することを期待しています。

AI による労働市場への影響

エンジニアがエージェントを使用して多くの価値を得ていて、おそらく余分な休暇を取り、家族とより多くの時間を過ごすことができるとあなたは言及しましたが、多くの人がAIによって仕事が自動化されることを心配していると思います。それは多くの人のアイデンティティ、彼らの仕事を表しています。

あなたはそれについてかなり強いことを言っています。「残念ながら短期的には多くの労働力の置き換えが起こるだろう」と言及し、Anthropic CEOも同様です。それについて少し話してください。AIがタスクや役割を置き換えることを見ていますか、その中間のどこかでしょうか。

AIは確実に、AIのフロンティアを使用している人々が、そうでない人々よりもはるかに雇用可能になるような社会への影響を創造するでしょう。それは確実に起こることです。

皆が見逃していることは、AI対人間にすることではなく、実際に起こっていることは、新しい技術がある時はいつでも、これほど速く進歩したことがないということです。AIを使い始めなければならない、AIの使い方を学ばなければならない、AIを使ってより速く効率的になることでチームにとってより有用な人になる必要があると人々に言っても。

人類は適応に非常に優れていましたが、これほど速く適応したことはありません。これは、どれだけ速く適応できるかの限界を真に試しているものです。特に、3ヶ月や6ヶ月ごとに進化している技術では。そのため、人々に負担をかけ、おそらく彼らは諦めてしまいます。

現在の最先端モデルに関して人々のために構築できる教育材料は何でも、6ヶ月後には無関係になります。そして、この業界で既に古い格言があると信じているように聞こえます。AIを持つ人があなたを置き換えるでしょう。AIは置き換えません。

しかし、人々にAIを使うようにと言うだけでは簡単に解決できることではないと感じています。人々が最新の状態を保つのに多くの負担がかかると思います。その結果、一部の人々は仕事を失うでしょう。なぜなら、これが彼らの限界を超えているかもしれないからです。

教育を続け、使用例を共有することを期待しています。YouTubeビデオの視聴方法を学んだり、TwitterやLinkedInなどで学習したりできますが、十分ではありません。認めましょう。十分ではありません。

全ての会社がより少ない人々を必要とするため、より多くの起業家が新しい仕事を創出するために現れる必要があります。仕事を失った他の人々が自分で会社を始めてAIを活用するか、AIを学んで人々を雇う必要がある新しい会社に貢献するかのどちらかです。

この置き換えと変化が全て起こる一時的な段階があるでしょう。その段階では、一部の人々が苦労するのを見ることになり、これを美化する必要はありません。私は、社会として全てが台無しになるというDarioが言っているような極端なシナリオを言っているのではありません。

また、YouTube クリエイターのような過去に新しい仕事が創出されたのを見たことがあるというSundarのような極端に楽観的なことも言っていません。同じことではありません。ここでは新しいプラットフォームシフトではありません。認知スキルを取ってAPIに入れているのです。

数週間前にBox CEOのAaron Levyにインタビューしましたが、彼は人工知能が良くなり、人々がそれをより多く使用し続けるにつれて、実際には企業でより少ない人々を必要としないだろうという論拠を立てました。彼は具体的にBoxを参照しました。

「人工知能を使用して信じられないほど生産的なフォークのチームがあるなら、彼らが経験している超レバレッジのために、私が最初に投資し、そのチームを成長させるのは彼らではないでしょうか」

それについてどう思いますか。

それは良い長期的な論拠だと思います。私は信じていますが、その論拠の欠陥は、AIの使用方法を知っている人々の大きな供給が常にあると仮定していることです。

社会として、それほど速く適応しないと言っているだけです。主に私たち自身の限界のためではなく、技術が進歩している速度のためです。私たちの通常の適応率よりも速く進歩しています。最新の状態を保つために私たちからより多くを必要とします。

O4とO3の違いさえ知っていますか。あなたはそれを活用しているため、おそらく知っているでしょう。平均的な人は知りません。ほとんどの人はデフォルトモデルでGPT-4oに固執しています。

ブラウジングエージェントが来て、ある時点であなたのコンピューターを使用します。フォームを記入します。明らかに必要とされない労働の形があります。そして、人々が最善を尽くすことを期待しています。それが私に言えることです。人々が最善を尽くすことを期待しています。軽く取らないでください。

InstagramでのDoomscrollingにより少ない時間を費やしてください。AIの使用により多くの時間を費やしてください。私たちがあなたの使用を望んでいるからではなく、それがあなたが新しい社会に価値を追加する方法だからです。

アラビンさん、お話しいただき、ありがとうございました。感謝します。これは素晴らしかったです。ありがとうございました。すばらしい。