AIエージェント:蜃気楼か、それとも真の革命か? — ドミトリー・シェベレンコと共に

AIエージェント
この記事は約37分で読めます。

Perplexityの最高ビジネス責任者ドミトリー・シェベレンコをゲストに迎え、AI業界全体がエージェント型スーパーアプリへと向かう現状について議論する。コンシューマー向けAIの成長鈍化の背景、複数モデルを組み合わせるオーケストレーションの強み、そしてAIがもたらす真の経済的価値やプライバシーの課題まで、AI技術の最前線と今後の展望を深く掘り下げた内容である。

AI Agents: Mirage Or Real Revolution? — With Dmitry Shevelenko
Dimitri Shevelenko is the chief business officer of Perplexity. Shevelenko joins Big Technology Podcast to discuss wheth...

AIエージェントとスーパーアプリへの移行

AI企業がほぼ一斉にエージェント型のスーパーアプリへと移行していますが、これは果たして報われるのでしょうか。この直後、Perplexityの最高ビジネス責任者に直接聞いてみたいと思います。テクノロジーの世界やその先について、冷静かつニュアンスに富んだ対話をお届けするBig Technology Podcastへようこそ。本日はスタジオにPerplexityの最高ビジネス責任者、ドミトリー・シェベレンコをお迎えしています。ご存知の方も多いかもしれませんが、PerplexityはPerplexity Computerという製品を通じて、エージェント型スーパーアプリのスタイルへと移行している多くの企業のひとつです。Codexを擁するOpenAIや、Claude Codeを展開するAnthropicに加わり、ユーザーのコンピューターを制御してタスクをこなすエージェントの開発に向けて大きく舵を切っています。本日は、このトレンドがどこへ向かっているのか、そしてこれが本当にビジネスとして成立するのかについて語り合います。ドミトリー、お会いできて嬉しいです。番組へようこそ。

お招きいただきありがとうございます。この対話をとにかく楽しみにしていました。

さて、今は2026年の半ばですが、正直に言うと、現時点でPerplexityはAppleの子会社になっていると思っていました。まだ実現していませんね。

Appleとのパートナーシップと独立路線

ええ、ポリマーケットでのあなたの賭けは外れてしまったようで残念です。

誤解のないように言っておきますが、ポリマーケットで賭けていたわけではありませんよ。ただ良いアイデアだと思っていただけで、まだ起きていないということです。

現在、私たちはAppleと非常に良好で発展的なパートナーシップを結んでいます。彼らは私たちがパーソナルコンピューター領域でやっていること、特にMac miniをどう活用しているかについてとても期待してくれています。彼らにとっても成長分野ですからね。

なるほど、そこはうまく協力する方法を見つけたんですね。

そうですね。でも、私たちは独立性を保つことを心から楽しんでいますし、世界中の多くの人が大規模なマルチモデルのオーケストレーションの力に気づき始めています。最初は単なるラッパーだと思われていたものが、今や強力なハーネスへと進化しました。だからこそ、今後の未来にとてもワクワクしているんです。

まさにそれが私にとっての主な批判に対する答えです。私はこれまでずっと、AppleはPerplexityを買収すべきだと公言してきました。実際、彼らはあなた方に電話をかけてきたはずです。自分の手柄にするつもりはありませんが、少しは貢献したかもしれません。私がこれが良い提携になると考えた理由は、Perplexityは単なるラッパー企業に過ぎないという批判があったからです。しかし私は、彼らは実際にAI製品の作り方を分かっていると考えていました。検索エンジンやブラウザの拡張機能は非常に素晴らしい出来でしたし、ユーザーの要求に応じてコンピューターを制御し、タスクを代行する新しいコンピューター向けアプリケーションこそ、まさにAIが向かうべき方向です。しかも、おっしゃる通り、単一のモデルに縛られるのではなく、複数のモデルにアクセスできます。これまでモデルを機能する製品に落とし込むことに苦労してきたAppleにとって、これは素晴らしい買収になると考えたわけです。もしかしたら彼らはGeminiでうまくやるかもしれませんが。彼らのCEOであるジョン・ターナス、あるいは次期CEOのジョン・ターナスについてどう思いますか。

Appleは常に素晴らしいハードウェア企業であり、ソフトウェアがコモディティ化の波に直面するこれからの時代において、ハードウェアの重要性はさらに増していくと考えています。ですから、彼らの選択は非常に賢明だと思いますし、彼らがこれから構築するものを見るのが楽しみです。私たちもAppleのハードウェアでうまく機能する強力なソリューションを構築したいと考えています。

コンシューマー向けAIの成長鈍化とビジネス利用の台頭

Samsungともパートナーシップを結んでいますから、その話は後ほど伺いましょう。ただ、ここで本題を避けて通るわけにはいきません。Perplexityは、あなたが構築した検索エンジンのおかげで、少なくともテクノロジー業界では大衆の認知を獲得しました。PerplexityのCEOであるアラビンド・スリニバスは、Googleに挑むと公言し、新しい検索のあり方を示しました。しかし、コンシューマー向けAIの利用状況を見ると、ここ6ヶ月ほどで非常に興味深いことが起きています。それは、利用率がほぼ横ばいになっているということです。Apptopiaなどのデータで生成AIアプリのデイリーアクティブユーザー数を見ると、2025年後半から成長が鈍化しています。AI検索におけるPerplexityの市場シェアを見ても、2025年半ばには20%近くあったと思いますが、そこから減少し、ここ1ヶ月ほどは横ばいです。Similarwebによると、平均1日あたりの訪問数は約520万回で、過去1ヶ月で2%の増加です。1億8200万回のChatGPTと比較すると、あちらもそれほど大きく成長しているわけではなく、5%の増加に留まっています。

ここでお聞きしたいのですが、誰もがコンピューターを制御できるスーパーアプリへとピボットしています。あなた方だけでなく、OpenAIやAnthropicもです。これは、テクノロジーが非常に強力になったからそちらへ移行するという強者の立場から起きているのでしょうか。それとも、コンシューマー向けAIが天井に達したため、何か別のものが必要になったという反応なのでしょうか。

今共有いただいた指標については詳しくありませんが、私が毎朝確認している数字は収益です。今年の初め、年間経常収益は2億5000万ドル未満でしたが、先月アラビンド・スリニバスが共有したように、ついに5億ドルを突破しました。明らかにユーザーに価値を提供できている証拠です。実際にPerplexityを誰が使っているのかを振り返って分析してみると、あなたが定義するコンシューマー向けAIにフォーカスしていた時期でさえ、人々は仕事や知識に関するタスクでPerplexityを使っていました。Google検索のキラーアプリだとどれだけ私たちが宣伝しても、ユーザーは職場で優位に立つために私たちのところへ来ていたのです。エンタープライズ版を使っていなくても、より生産性を高め、ビジネスを構築し、大きなレバレッジを得るための秘密兵器として使われていました。ですから、ある意味で私たちは焦点を移したわけではありません。ユーザーが常にいた場所に、私たちの方から歩み寄っているだけです。

そして今可能になったことは、昨年の11月や12月以前にはComputerのようなものは構築できなかったということです。なぜなら、モデルの能力が向上し、タスクを実行するためのタイムホライズンが長くなったからです。ただ質問に答えるだけでなく、ユーザーの代わりにエージェントとして実際に作業を行うことができるようになりました。Perplexityが常に誇りとしてきたことの一つは、新しく出現した機能を誰よりも早く理解し、それを幅広い人々にとってアクセスしやすく、有用なものにする方法を見つけることです。私たちはそこに注力しています。だからこそ、一時的なハイプや探索的な活動を含み、必ずしも価値と直結しない月間アクティブユーザー数などのトップラインの指標よりも、収益の方がはるかに誠実な指標だと考えています。

なるほど。でも、ここで別の視点を提示させてください。月間アクティブユーザー数は重要です。通常、成長が急激な時期には、どのテクノロジー企業もユーザー数の増加をアピールします。そして巨大なユーザー基盤を築き、成長が鈍化したときに初めてユーザーあたりの平均収益について話し始めるわけです。より大きな収益基盤を持つためには、やはりより多くのユーザーが必要ではないでしょうか。

私たちは平均収益の話をしているのではなく、総収益の話をしています。

確かにそれは次のステップですが、続けてください。

歴史的に見れば、コンシューマー向けのインターネット企業において月間アクティブユーザー数は広告収益の代理指標であったため、その指摘は正しいと言えます。しかし報じられている通り、私たちは広告ベースのマネタイズに焦点を当てていません。Perplexityの核となる価値提案が正確性である以上、回答の横に広告が表示されている状態でユーザーに正確性を強調するのは非常に困難だと気づいたからです。したがって、私たちが月間アクティブユーザー数をそれほど重視しない理由の一部は、広告主のところに行って、これだけの異なるデモグラフィックのユーザーに広告を表示できますよ、と売り込む必要がないからです。それがフォーカスの変化の理由の一つかもしれません。

あなたの主張を裏付けるように、Anthropicはユーザー数でトップに立っていないにもかかわらず、途方もない額の収益を上げています。ですから、このエンタープライズのユースケースをうまく解決できれば、巨大な企業になる可能性は十分にあります。AnthropicもOpenAIも1兆ドル規模のIPOを果たすでしょうし、生成AIの世界ではそれに続く大企業がいくつも誕生すると思います。

ノベルティ効果から実用的なエージェント機能への進化

エンタープライズ側の話の前に、コンシューマー側に対するあなたの見解を聞かせてください。人々が仕事でこれらの製品を使っているとしても、これらは非常に強力なツールであり、ChatGPTは史上最も急速に成長したコンシューマー製品でした。今でもそうかもしれませんが、その成長は頭打ちになっています。業界全体で起きているこのコンシューマー向けAI製品の成長鈍化の背景には何があると思いますか。単純に飽和状態に達したのでしょうか。それとも、人々がAIを恐れすぎているのでしょうか。あなたの最良の診断を教えてください。

いくつかのユースケースにおいて、人々の行動が変化するよりも先に、AIというものを探索したいという好奇心が先行しすぎたのだと思います。しかし同時に、コンシューマーとプロシューマーの融合という、非常に興味深い現象も起きています。多くの人が今、副業を立ち上げてみたり、これまで実行するエネルギーがなくて放置していたプロジェクトに取り組んでみたりする力を得ています。自由自在に使える超強力なツールがあるからこそ、そこにレバレッジがかかると感じて喜んでお金を費やしているのです。

ですから、私たちにとってコンシューマーとは、Perplexityを使って天気を調べるような人々だけを指すわけではありません。天気を調べるのにAIは必要ありませんからね。業界全体が取り組むべき課題は、今何が可能になっているのかをユーザーに教育することだと思います。これはケイパビリティ・オーバーハング、つまり能力の余剰と呼ばれています。ここ6ヶ月でモデルは飛躍的に強力になったのに、人々はまだWeb 1.0のような方法でAIを使っています。その発見が追いつくまでにはただ時間がかかるだけです。これはPerplexityにとってはあまり関係のないことですが、誰もが自分の生活を管理するために、よりインテリジェントなソフトウェアのセットを好むようになることは確信しています。

Web 1.0というのは、情報検索のようなことですね。

その通りです。スポーツのスコアや天気、基本的なニュースなど、多くの人がまだその段階にとどまっています。そのために新しいエージェント機能は必ずしも必要ありませんが、人々が実行できることは他にも山ほどあります。そして、AIを最大限に活用するための制約は、実は私たち自身の好奇心なのだと気づくはずです。そこがボトルネックなのです。だからこそPerplexityは、好奇心を刺激し、活性化するように製品を設計しています。何がコモディティ化し、何がそうならないかを見極めるとき、このすべてを活用するための唯一の人間らしい要素は好奇心と主体性になるからです。好奇心という言葉は私たちのブランドの大きな部分を占めています。

なぜこのような成長の鈍化が見られるのかについて、私の考えをお話しします。これがまさにエージェントのユースケースへと直結していくと思うからです。これまでAIの利用が大きく急増したのは、マルチモーダルなユースケースが登場したときでした。テキストの話ではありません。ChatGPTが2億人のユーザーを獲得したのはテキストのおかげであり、人々はAIに何ができるのかに興味を持ちました。その新奇性と関心が基盤を築いたのだと思います。

しかし、OpenAIを例に挙げると、最大の急増が見られたのは音声機能が登場した直後でした。スカーレット・ヨハンソンにそっくりだと話題になり、彼女がOpenAIを訴えると脅したあのデモを覚えていますか。あそこで成長の転換点が見られます。そして画像です。スタジオジブリのような画像を生成できるようになった瞬間は、利用制限に引っかかるからという理由だけで、OpenAIのアカウントを7つも作った人を知っているほどです。個人的なユーザーでなくても、間違いなく利用の急増が見られました。

ですから私にとっては、企業がそうしたものから離れていくにつれて、この落ち込みが起きているように見えます。OpenAIではSoraの開発が中止されることが分かっていますし、画像生成は続けていて素晴らしい第2世代のモデルもリリースしていますが、かつてAI企業がアピールしていたチャットや画像や音声といったものから、ハーネスを通じてモデルがコンピューターを制御して作業を代行するという新しいユースケースへの移行期間にあり、それが自然と利用の谷間を生んでいるのだと思います。

あなたの仮説には同意します。利用の急増の多くはノベルティ、つまり新奇性に牽引されたものでした。7つのアカウントを作ったあなたのご友人も、ここ30日間はスタジオジブリの画像を一枚も生成していないはずです。もうあの手の画像を見かけることはありませんからね。

家族のチャットからも消えましたね。

ええ、そうです。とはいえ、プロフィール画像がまだスタジオジブリ風の人を見かけると、あのAIの時代を温かく思い出しますが。新奇性による急増は、幅広い認知度を高め、人々を引き込む素晴らしいきっかけになると思います。その後、人々は自分自身の習慣的なユースケースを発見しなければなりません。新奇性というものはそういうものです。GeminiでもNano Bananaのときに同じような瞬間がありましたが、今では少し落ち着いているのが分かります。

最終的に、私たちはAIの最も経済的で生産的な側面に価値を見出しています。だからこそ、私たちにとって正確性への投資が根本的かつ中核的なものなのです。検索と正確性は同じ硬貨の表裏のようなものです。最高クラスの検索機能があってこそ、AIで行うあらゆる作業が最新かつ最高品質の情報源に基づき、最適な情報スニペットを活用できるようになります。

ですから、私たちが今やっていることをピボットと呼ぶのは公平ではないと思います。最も永続的な価値を持つ、AIの最も経済的で生産的な用途に向けて投資を最適化しているだけです。そして実際に今起きていることの素晴らしい例が、まさにあなたです。あなたは独立したビジネスを運営していますが、もしAIを使っていなければ、大小さまざまな場面でAIを活用している今とは違い、おそらくウェブ開発者やマーケティング代理店、あるいはソフトウェア開発者を雇う必要があったはずです。

本当に狂気じみていますよ。ツールを学び、何ができるかにこれほど多大な投資をしているわけですから。

ええ。ですから、あなたは私たちが考える未来の経済の姿そのものであり、格好のケーススタディになるべき存在です。高い主体性を持ち、いつか巨大なメディア帝国になることを夢見て自身のメディアビジネスを運営するビジョンを持っている。そして、チームを持っているからこそ、その目標に向けて非常に迅速に前進できる。私たち全員が100人の従業員を手に入れたようなものだと考えています。プロシューマーと労働力の両方で見られるこのシフトは、誰もがエグゼクティブとして行動できるようになるということです。朝起きて、このビジネスを成長させるために、待機している100人のエージェントにどんな有用なタスクを割り当てようかと考えるのが仕事になるのです。

これはカジュアルなチャットや画像生成とはまったく異なるものです。もちろん、それらは互いに影響し合っています。好奇心の閃きには手軽な質疑応答が必要なこともあり、そこは摩擦が少なく楽しく簡単に使えるようにしたいと考えています。それがきっかけで、より長期的なタスクに取り組む意欲が湧くからです。ですから両者はうまく機能し合いますが、AIの未来はまさにあなたが今やっていることなのです。

Perplexity Computerの実用例とAIの信頼性

非常に興味深いですね。私も実際にこれらを活用していますし、うまく使っているからこそ雇わずに済んだチームの話をしました。ツールにアクセスできるおかげで、もしそれに縛られていなければできなかったはずの、はるかに経済的で生産的な活動ができていると感じます。例えばマーケティング代理店を使わないことで少し余裕が生まれ、その分でイベントを開催しようと考えることができます。ちなみにリスナーの皆さん、6月18日にイベントを開催し、PerplexityのCEOであるアラビンド・スリニバスに登壇していただきます。ショウノートにリンクを貼っておきますので、チケットが残っていればぜひご参加ください。

ともかく、これも少し余裕ができたからこそ投資できるようになったわけで、AIが多くの人が期待する通りに機能すれば、経済の非常に面白い変革を目の当たりにすることになるでしょう。私はAIに関する悲観的な仮説を信じたことはありませんが、それはまた別の議論ですね。

ここで、あなたが今おっしゃったことに続く自然な質問をさせてください。チャットや画像、音声が生成AIへの関心を爆発させた新奇性の一部であったとすれば、今回のコンピューター制御やスーパーエージェントというユースケースが、同じように一過性のものにならないとどうして確信できるのでしょうか。あえて厳しい見方をすれば、多くの人がこれらのアプリを試して便利かもしれないと思うものの、最終的には後退してしまう可能性もあるわけです。

私自身の例を一つ挙げます。私はPerplexityのスーパーエージェントであるPerplexity Computerにどっぷり浸かっています。その提案に従って、自分用のデイリーダイジェストメールを作成させました。私のGmailやカレンダーに接続され、返信すべきメール、今日の予定、注目すべき見出しなどを教えてくれます。とても素晴らしい機能です。しかし、これも単なるちょっとクールな新しいユースケースで終わる可能性はないでしょうか。チャットや画像や音声のときもクールで革命的かもしれないと言われていたわけですから。なぜこれが単なるノベルティのユースケースの一つではないと言えるのでしょうか。

現在私たちが確認しているComputerの使われ方は、まさにあなたがビジネスを運営しているのと同じような方法です。マーケティングやイベント制作のために専任のスタッフや代理店を雇う必要がなくなり、これらのツールからレバレッジを得ています。そして私たちが目にしているのは、Computerへのアクセス期間が長くなるほど、ユーザーは先週よりも今週の方がより多くのクレジットを消費しているという事実です。この機能はまだ真新しいものですが、すでに利用曲線は急激な右肩上がりを描いています。これは私たちの収益が伸びている大きな理由でもあります。ですから、一時的なノベルティ効果は全く見られません。

ユーザーはもはやこれをソフトウェアの支出とは捉えず、給与予算の一部だと考えています。デジタルエージェント、つまりデジタルワーカーのチームを雇っているのだと。もちろん人間の労働者と同じように、エージェントもきちんとした仕事をして給与に見合う成果を出す必要があります。しかし彼らの能力は日々向上しており、私たちもモデルを様々なツールに接続し、それが動作する仮想マシンを改善し続けています。

今のところ、私たちが目にするComputerの利用には一切のノベルティ効果はありません。すべてが経済的で生産的なシナリオに結びついており、人々はそこに喜んでお金を支払っています。私たちはこの分野に極めて強気です。AI業界の人がよく言うように、モデルはここから良くなる一方ですから、能力はさらに向上するでしょう。ネットワーク効果がない場合、コンシューマー向け製品を成功させるのは非常に困難です。ですから、スタジオジブリ風の画像や音声、初期の動画生成の例とは、現在私たちがComputerで目の当たりにしているものは根本的に異なると考えています。

なるほど。使えば使うほどクレジットの消費が増えるとおっしゃいました。具体的にどのようなユースケースが見られますか。私のメールの例はとても面白いと思いましたが、他にも税金の計算などの話も聞きます。

ええ、多岐にわたります。実は今週、Computerの上で動く36種類の異なるワークフローをリリースする予定です。これには企業の財務モデルの構築から、税金の申告、さらにはウェルスマネージャーがクライアントとの会議の準備をするためのものまで含まれています。そしてこれも、SnowflakeやDatabricksといった社内のデータシステムと接続できるという利点を活かしています。

昨夜も、今Perplexity社内でどのモデルが使われているのか、OpusとGPTとGeminiの分布はどうなっているのかという分析を実行させました。非常に詳細な結果が返ってきましたが、私はSQLを全く知りませんし、コーディングも命がかかっていてもできません。Perplexityのデータサイエンティストの邪魔をすることもありませんでした。Perplexity Computerを私たちのSnowflakeに接続することで、ほんの数分でその分析を引き出すことができたのです。以前の世界であれば、10通のメールのやり取りが必要でしたし、夜中に深掘りしたいと思っても結果を得ることは絶対に不可能でした。

マーケティング目標の達成であれ、プロダクト構築のような分析的目標の達成であれ、人々がはるかに速いスピードで業務を遂行できるようになっています。今や私たちは新機能を瞬時にプロトタイピングできます。コンテンツチームのメンバーが、エンジニアの介入なしにプルリクエストを送信し、本番環境にコードをデプロイしています。これらはすべてPerplexity Computerを通じて実行されているのです。

そういったものをどれくらい信頼できるのでしょうか。税金の例に戻りますが、私はAIに自分の税務処理を任せる気にはなれません。私はただの技術嫌いなのでしょうか。それとも、AIが間違えたらIRSから通知が来るかもしれないという懸念には正当性があるのでしょうか。

実は、逆の使い方がされています。人々は税理士の作業をComputerでダブルチェックし、そこから重大なミスを見つけ出しているのです。私たちが最も期待しているワークフローの一つに最終確認というものがあります。PDFやプレゼンテーション、スプレッドシートを送信すると、その文書内のすべての主張やデータについて、外部情報との事実確認と内部の一貫性の両面から詳細なファクトチェックを行います。

実際にGartnerの収益に関するプレスリリースを読み込ませたところ、収益の誤記など、4つの明白なミスを発見しました。今度、上場企業のプレスリリースを片っ端からこの最終確認にかけて、世の中にどれだけのエラーが溢れているかを示す楽しいマーケティング企画をやろうと思っています。

しかし質問の核心に答えるなら、AIを利用する上で人間が果たすべき根源的な役割は常に3つ残ると思います。1つ目は先ほど話した好奇心です。火をつけ、目的を定義しなければなりません。私たちは指示の時代から目的の時代へと移行していると言っています。達成したいマーケティングの成功はどのようなものか、目的を定義すればAIがそれを実行してくれます。そこに主体性が必要です。

2つ目は、人間の作業をダブルチェックし、エラーを修正することです。AIがどこで道を外れるかを理解し、検証テストを行うスキルを磨く必要があります。これはユースケースによって意味合いが変わってきます。

そして3つ目は、優れたセンスです。他の人間が何を面白くクールだと感じるかを深く理解できるのは人間だけです。AIは素晴らしいブレインストーミングのパートナーにはなりますが、最終的な判断には人間の裁量が必要です。

ですから、ファクトチェックやエラー修正は不可欠なスキルになるでしょう。しかしこれは双方向に機能します。税金の例で言えば、現在人間が犯しているミスもたくさんあり、それをAIを使って見つけ出そうということです。

問題は、人々があなたの意図する通りにツールを使うところで立ち止まるか、それとももういい、税理士を完全にAIに置き換えようと考えるかどうかです。もしそうして問題が起きたら、それは自己責任ということになるでしょうが。

ええ、安い税理士を雇って彼らがミスをした場合、最終的に頭を抱えるのは自分自身であるのと同じです。質の悪いAIを使ったり、適切な使い方をしなかったりして問題が起きれば、それは自分の責任です。AIの登場で説明責任が消え去るわけではありません。AIから出力された結果を見たときに、どこを重点的にチェックして馬鹿げたミスがないかを確認するか、そういった勘所を養う必要があります。

最終確認のアイデアは素晴らしいですね。私はすべての記事でそれをやっています。インタビューをアップロードし、原稿をアップロードして、どこか見落としはないか、考慮すべき外部コンテキストは何かと尋ねます。このアプローチを税金や財務予測、マーケティングのプレゼン資料などに適用して数字をトリプルチェックさせるのは自然な流れですし、AIはそれがとても得意です。

ええ、本当に面白かったのは、経営コンサルティング会社のBainのシニアリーダーシップ向けにプレゼンをした時のことです。ご存知の通り、彼らは様々なレポートを公開しています。そこで、彼らが公開しているレポートからAIが発見したいくつかのミスを提示して楽しみました。そのレポートを作成した担当者も同席していて、お互いに冷やかしたりしていましたが。とにかく、人間をファクトチェックするためにAIを活用することには、まだまだ解き放つべき多くの価値があると思います。

データアクセス権限とローカル処理の未来

ただ、これを正しく機能させるには、あなたのような企業を非常に深く信頼しなければなりません。私のデイリーメールのために許可しなければならなかった権限のいくつかを読み上げさせてください。ちなみに、自分が実際にこれを許可したことが信じられませんが。

連絡先に自動保存された連絡先情報の閲覧とダウンロード。連絡先の閲覧とダウンロード。登録しているGoogleカレンダーのリストの閲覧。カレンダーの追加と削除。すべてのカレンダーの予定の閲覧と編集。カレンダーの空き状況の閲覧。アクセス可能なすべてのカレンダーの閲覧とダウンロード。Gmailアカウントからのメールの閲覧、作成、送信。組織のGoogle Workspaceディレクトリの閲覧とダウンロード。

これを見て、なぜ皆さんがMac miniで作業しているのかが分かった気がします。今この会話をしている瞬間も、Perplexityは私の重要なテクノロジー基盤へのあらゆるアクセス権を持っています。もしかしたら今頃、Computerがクライアントへのメールを書いて勝手に送信しているかもしれません。私には分かりません。

いや、あなたには分かっているはずです。なぜなら、タスクを開始することを選択したのは最終的にあなただからです。完全に自律的に何かが起きているわけではありません。主体性は依然として人間が引き金を引くものであり、あなたが指示を出しています。

それに、Perplexity Computerから多くの価値を引き出すために、それらすべての権限を付与する必要はありません。私は多くの企業と話す際、まずはゼロ個のコネクターから始めて、そこで価値を確認してくださいと伝えています。外界のすべてのデータとインターフェースを取り、それをより深く理解するだけでもできることはたくさんあります。

しかし、これをデジタルワーカーとして考え、その価値を最大限に引き出したいのであれば話は別です。人を雇うときも、彼らにより強力な権限を与えますよね。しかも人はミスをしますし、AIよりも作業が遅い傾向があります。

もう一つのアプローチとしてお勧めしたいのは、読み取りアクセスは許可するが、書き込みアクセスは許可しないという権限設定の機能です。つまり、デイリーダイジェストを作成することはできても、あなたの代わりにメールを送信することはできないようにするのです。人々が一番恐れるのは、間違った機密情報を含むメールを1000人にスパム送信してしまったらどうしようという部分ですから。

なるほど、読み取りと書き込みの権限を分けるのは良い方法ですね。

ええ。ビジネス版では非常にきめ細かい制御を提供しており、それが前進への道だと考えています。私たちはこのエンジニアリングを正しく行うことに多大な時間を費やしてきました。この領域における私たちの優位性の一つは、私たちが製品構築にのみ専念していることです。独自の基盤モデルを事前学習することはありません。つまり、私たちの努力の焦点は、まさにこうしたインタラクションをユーザーにとって透明なものにし、ユーザー自身が何の権限を与えているかを正確に把握できるようにし、それらの権限の範囲内でエラープルーフに機能するようにすることにあります。

では、私がやったことはクレイジーではなく、今日のテクノロジーは十分に信頼できるとお考えですか。もしそうなら、なぜあれほど多くの人がMac miniでこれを動かしているのでしょうか。Perplexity Computerの広告にもMac miniが登場していましたよね。

ああ、Mac miniに関しては実はその逆で、より多くのアクセス権を得るためなのです。Mac miniを使えば、先ほどの権限では不可能なiMessageへのアクセスが可能になります。また、ラップトップが閉じている時でも、エージェントを24時間365日稼働させ、時間のかかるタスクを実行させることができます。ですから、Mac miniをエージェントを隔離するための手段とは解釈しないでください。推論はまだローカルで行われているわけではありませんから。

ローカルで行われるようになると思いますか。

モデルがより強力になり、ローカルのCPUも強力になれば、強力な推論モデルをMac miniで実行できるサイズに蒸留できるようになることは間違いありません。いつローカル推論に移行するかのタイムラインを提示することはできませんが、特定のタスクはクラウドで実行され、特定のタスクはローカルで実行されるというハイブリッド・コンピューティングの形になるでしょう。それが近い将来のこれらのシステムのあり方を予測する上で、かなり安全な賭けだと思います。

膨大なデータセンターの構築に対する弱気な見方として、最終的には巨大なデータセンターですべての学習を行い、それを蒸留してMac mini上でローカルに実行するようになるという意見がありますね。

100%ローカルとは言っていません。ハイブリッドだと言いました。

クラウドで行う作業が非常に計算集約的なものであれば、やはりデータセンターの構築は必要になるかもしれませんよね。

より強力なモデルがもたらす広範なタイプの計算を、私たちは過小評価していると思います。Perplexityの立場としてはデータセンターの構築について強い意見はありませんが、それがバブルであるとかそういったことを示す兆候は全く見られません。

わかりました。この部分の議論をまとめると、Mac miniはエージェントを遠ざけるためではなく、より多くのアクセス権を与え、よりハードに働かせるためのものだということですね。

その通りです。よりきめ細かい制御を行い、ローカルファイルへのアクセスを深めるためです。もちろん細かな権限はユーザーが設定しますが、現状のシステムはまだローカル推論をサポートしていません。

複数モデルのオーケストレーションと圧倒的な精度

明らかにこの方向へ進んでいますね。この番組でも、OpenAIがCodexを中核に据えて、コンピューターの使い方の新しい形とも呼べるスーパーアプリを構築する野望について詳しく聞いたばかりです。そしてもちろん、AnthropicもClaude CodeやClaude Co-workで同じことをやっています。良い意味での驚きですが、自分がこれほどの権限を与えたことにいまだに呆然としますが、その見返りは強烈です。人生にはリスクを取るべき時があるのでしょう。同じ製品領域で、なぜPerplexityはこれら2つの巨大企業と競争できるのでしょうか。

私たちがPerplexityの構築に乗り出した当初、モデルに依存しないアプローチをとるという非常に意図的な決定を下しました。当時は、モデルをトレーニングしていると言うのが最も簡単に資金調達できる方法だったため、かなり逆張りの戦略でした。創業者のバックグラウンドを考えれば、簡単なストーリーを作ることもできたはずです。しかし彼らは当時から、モデルはいずれ特化していくと信じており、それは事実として証明されました。

単一のタスクであっても、そのタスクの異なる部分に異なるモデルを使用できることこそ、Computerの最も強力な点の一つです。私には小さな子供がいて、彼らに何かを教えたいときには、パーソナライズされたミニポッドキャストを作ってあげるのが好きです。これを行うとき、Computerはタスクの計画にOpusを使用します。これは週によって変わりますが。そして台本の執筆にはGPTモデルを使います。GPTは優れたライターだからです。次に音声の生成にはGeminiモデルを使い、迅速なリサーチにはGrokを使用します。Grokは非常に速いモデルだからです。そして、すべての音声クリップをつなぎ合わせるPythonコードの記述にはSonnetを使います。一つの成果物を作るというタスクの中で、4つの異なるモデルを使用しているのです。

CodexがGeminiモデルをサポートすることは決してありません。彼らは常にGPTファミリーの中に留まるでしょう。Claudeも同じで、GPTモデルやGrokモデルを持つことはありません。私たちがマルチモデル・オーケストレーターおよびアグリゲーターとして提供する価値は、今日の世の中に存在する最高の知能が何であれ、タスクを達成するためにそれを使用し、自社でトレーニングしたモデルや特別な関係にあるモデルだからといって差別しないということです。これは非常に強力な価値提案であり、時間の経過とともに永続するものです。

私たちが持つ構造的な差別化要因の2つ目は、先ほども少し触れましたが、正確性です。リンクから回答へと移行するPerplexityのV1に注力していたとき、自社ツールにおける中核的な技術投資は検索でした。知能が処理するソース入力が最高品質であるためには、最も正確なグラウンディングが必要です。私たちには3年以上にわたって回し続けてきた非常に強力なデータのフライホイールがあります。ユーザーが製品を使用する中で、モデルがどのスニペットを使用し、どれを使用しなかったかを確認し、それがインデックスの知能と検索の精度を強化します。ですから、正確性もまた、他の製品と比較してPerplexity Computerが大きく差別化されている点です。

そして3つ目の構造的な差別化要因は、少しソフトで曖昧に聞こえるかもしれませんが、ユーザビリティです。私が企業と話す際によく話題になるのは、AI企業以外の会社にとってのアルファは、必ずしも社内でAIツールを構築することではなく、その導入の深さにあるということです。つまり、文化的なトレーニングや適切なマネジメントを通じて、あなたが使っているような方法で、誰もがこのスーパーパワーを使えるようにするにはどうすればいいかということです。

あなたはプレッシャーテストをするのが好きなサイコパスだから、あるいは必要に駆られてこれをやっていますよね。もしやっていなければ、今のビジネスモデルは成り立たず、利益率も低く、これほど速く成長することはできなかったはずです。しかし、5000人規模の組織の一員であれば、あなたと同じようなプレッシャーは必ずしも感じません。組織は中間層の労働者にそのプレッシャーを感じさせる方法を見つけ出さなければなりませんし、私たちはPerplexity Computerを信じられないほど使いやすくすることでその役割を果たす必要があります。

だからこそ、私たちはワークフローを立ち上げているのです。記事のファクトチェックをAIに指示するプロセスをお持ちとのことですが、多くの人にとって、真っ白なプロンプト画面は恐怖でしかありません。これまでに見た中で最も恐ろしいものです。メディアではAIがすべてを変える、乗り遅れるな、破壊されるぞと報じられています。だからこそ、複雑なシナリオやAIのユースケースをシンプルなUIに分解し、自由形式の指示を必要とせずに目的を達成できるワークフローのようなものが必要なのです。

まとめるなら、私たちが激しい競争の中で繁栄し続ける理由は、すべての知能を束ねる最高のオーケストレーターであり、正確性をコア原則として根本的にコミットしている唯一のAI企業だからです。私たちは検索の正確性、オーケストレーション、そしてエンジニアリングの問題であると同時にデザインの問題でもあるユーザビリティに大きな技術投資を行ってきました。これらは私たちが常に優位性を保ってきた分野であり、これからも革新を続けていきます。

オープンソースと中国製AIモデルの活用

問題は、競合他社をシャットダウンしたこともあるAIプロバイダーたちが、あなた方にモデルを使い続けさせるかどうかです。ここで少し休憩を挟んで、その後その点について伺いたいと思います。また、Kimi K2のような中国のモデルを含む、あなたがオーケストレーションしている多様なモデルについても話しましょう。

Big Technology Podcast、Perplexityの最高ビジネス責任者ドミトリー・シェベレンコと共にお送りしています。ドミトリー、非常に内容の濃い素晴らしい会話で感謝します。

さて、私は以前これについて記事を書きました。これらのAIユースケースが収束していく際の大きな問題の一つは、大手AIモデルプロバイダーの戦略です。これまではChatGPTのようなデモ製品を作り、モデルを提供して対価を得ながら、その上で誰でも好きなものを構築できるようにしていました。しかし、誰もがエージェント的なユースケースを構築しようとする段階になると、Claude CodeやCodexのように、自社のコア製品をすべてを処理する記録システム、あるいはエージェントとして位置付けたいと考えるようになります。彼らは最終的に、すべてを支配する単一のアプリがある世界を望むかもしれません。あなたは彼らのモデルをオーケストレーションしていますが、長期的に見れば、彼らのコア製品と競争しながらも、モデルの使用を許可してもらう彼らの善意に依存していることになりませんか。

これらの企業は最終的にプロダクトビジネスであると同時にプラットフォームビジネスでもあります。彼らは私たちにモデルを使ってほしいと積極的にアピールしてきます。早期アクセスを提供し、評価テストの実行を求めてきます。ですから現在は全く逆の力学が働いており、彼らは私たちから喜んで収益を受け取っています。彼らもComputerのクレジット消費が増加する恩恵を受けています。彼ら自身もプラットフォームビジネスとして互いに競争していますし、最先端を押し上げ続けるオープンソースの存在もあります。これらの競争力学はすべて私たちにとって非常に健全なものです。

もし世界に最先端モデルが一つしかなく、それが2番目に良いモデルの2倍優れていたとしたら、それはPerplexityにとって悪いシナリオになるでしょう。その点には同意します。しかし、この業界が始まって以来、最高のモデルと2番目のモデルの差が10〜15%以上に広がった瞬間は一度もありません。しかも最高のモデルという言葉自体が、何において最高なのかという専門化の問題を含んでいます。この専門化もまた、そうした競争力学に対するヘッジとして機能します。

ですから私は、モデルを遮断されるシナリオよりも、実行速度を維持し、この激しい競争の中で企業文化と組織を構築し続けることの方に心を砕いています。遮断の兆候は見られませんから。

モデルの競争力についての一例は非常に興味深いですね。モデルは今や非常に賢くなっています。例えばAnthropicは、Mythosというモデルをサイバーセキュリティの観点から強力すぎるとしてリリースしませんでした。これは素晴らしいマーケティングだと思いますが。

それがマーケティングだと思いますか。

いや、事実かどうかは別として、優れたマーケティングだと言っているんです。これは主にマーケティングだと思いますか、それとも製品の真実だと思いますか。皆に聞いているので気になります。

人それぞれ見解があると思いますが、私たちはMythosにアクセスできないので、直接触れた経験から語ることはできません。

業界の人たちはどう見ていますか。

本当に懸念すべきなのは、モデルがサイバー上の脆弱性を修正するよりも、それを利用して攻撃する方が得意になるということだと思います。

ええ、コンサルタントのプレゼン資料からミスを見つけ出せるようにですね。

ええ、そのアービトラージは現実の懸念です。ただ、これまで存在しなかった全く新しい能力が追加されたのかどうかは分かりません。Mythos以前からここ数年ハッキングは増えていますし、この懸念はしばらく前から蓄積されていたものです。

長い前置きになりましたが、私の質問はこうです。これらのモデルがどれも十分に賢くなり、コンピュートがコモディティ化する限界点がいずれ来るのではないでしょうか。現在はインフラ構築の段階ですが、信じられないほど賢いモデルが多数並び立ち、膨大な計算インフラが整備され、最終的には価格競争が起きてコストが劇的に下がるというシナリオです。

もしそうなれば、あなたにとっては良いことですね。

ええ、最高です。そのシナリオではオープンソースも追いつくでしょうから。そしてもし何らかのプラトーに達すれば、ローカルでの推論への投資が進み、より関連性を増していくでしょう。この分野で長期的な予測を立てるのは本当に困難です。私がよく言うのは、半年後には、今では想像もつかないような全く新しい課題がPerplexityのトップ3の優先事項になっているだろう、ということだけは確信しているということです。

モデルを開発している企業自身も、新しいモデルというケーキを焼いている最中は、それが出てくるまでどんな味がするのか、つまりどんな機能を持っているのか完全には分かっていません。改善はしていますが、世に出て人々が使い始めるまで新しい能力は未知数です。だからこそ、新しいモデルが利用可能になったとき、ユーザーにとってのアクショナブルな価値はどこにあるのかを見極めることが、Perplexityが培ってきたコアスキルなのです。

休憩前にも触れましたが、Perplexityは中国のモデルも使用していますね。Kimi K2が入っています。DeepSeekはもう見当たりませんが。

明確にしておきたいのですが、中国でホストされている製品やAPIをPerplexityに統合することは決してありません。私たちが使っているのは、中国の研究所によって開発されたオープンソースモデルを、私たちが自社で事後学習したものです。それらをアメリカのデータセンターで実行しています。不正確なものを排除し、精度を高めるための事後学習を行っています。

異なる国にはモデルに組み込もうとする政治的アジェンダがあるかもしれませんが、私たちは独自のインデックスを活用した正確な検索によるグラウンディングでそれを解決しています。モデルを根本的に推論のために使用するのであれば、それはそれほど大きな問題にはなりません。それにしても中国の研究所が成し遂げている進歩は本当に印象的です。オープンソースは全体としてユーザーにとって良いものであり、価格競争力を維持するのに役立ちます。また、クローズドなモデルよりもオープンなモデルの方が、私たちが事後学習でできることは多くなります。これにより、正確性や簡潔さ、特定のタスクワークフローの遵守に関する取り組みを加速できるのです。

ジェンスン・フアンは、世界中が西洋あるいは米国のAIインフラストラクチャスタックの上でAIを構築することが重要だと言っています。もしあなたが今言ったように、Kimi K2のウェイトをダウンロードして好きなように事後学習できるのであれば、モデルがどこで開発されたかはなぜ重要なのでしょうか。仮に中国がオープンソースでリードしたとして、どんな悪いシナリオが考えられますか。

最悪のシナリオは、最高のオープンソースモデルのアーキテクチャが、Nvidiaのチップでは動作せず、Huaweiのチップでしか動作しないように作られることです。ジェンスン・フアンが正当に懸念しているのは、ソフトウェアがハードウェアのサイクルを牽引するというシナリオだと思います。現在、モデルのアーキテクチャがNvidia向けに最適化されているため、中国企業がNvidiaチップを手に入れようとしていますよね。効率的に実行するにはそれが必要です。もしこれが逆転して、アメリカの企業がHuaweiのチップを手に入れなければならなくなったらどうなるかを想像してみてください。

なるほど、理にかなっています。そうなれば中国がアメリカに輸出管理を行い、AIを支配できるようになるわけですね。

ええ、それが最大の懸念です。

なぜ彼はダーハのインタビューでそうはっきり言わなかったんでしょうね。とてもシンプルな答えなのに。

ジェンスン・フアンはコミュニケーションに長けていますからね。番組でなら言えても、彼には言えない特定の名前や事情があるのでしょう。しかし中国のモデルが優れているのは確かですし、彼らは最先端そのものではないにせよ、最先端の境界線を押し広げています。

AIの需要は本物か、サブスクリプションと収益モデル

最後にこの話題で締めくくりたいと思います。Perplexityとしても見解をお持ちだと思いますが、CNBCでディアドラ・ボーサが書いた素晴らしい記事があります。AIの需要は水増しされており、Anthropicだけが現実的であるという主張です。

論旨としては、月額20ドルや200ドルのプランで人々が膨大なワークフローを実行しているが、企業側にはそれを提供する能力が不足している。それにもかかわらず、AI企業は巨大な需要があるとアピールして資金を調達している。無制限の電気プランや燃料プランなんてやらないのに、なぜか多くのAI企業はそれをやっている。トークンごとに課金しなければならなくなった時、すべてが変わるだろう、というものです。

このように、AIの需要が長期間にわたって大幅に補助金で賄われてきたため、本当の需要がどれくらいか実は誰も分かっていないという彼女の指摘は、正当な問題だと思いますか。もしそうなら、解決策は何でしょうか。

私たちPerplexityは、有料ユーザーへの補助金を一切行っていません。もしあなたがProやMaxプランを利用しているなら、ありがとう、あなたは私たちの成功に貢献してくれています。私たちは高いリテンション率を確認しており、ユーザーが明らかに価値を見出していることが分かります。

だからこそ、Computerのクレジットが非常に重要になってくるのです。動画生成のように長く実行されるタスクなら1回で50ドルかかることもあれば、5セントで済むタスクもあります。これらすべてを月額固定のサブスクリプション製品に詰め込む方法はありません。私が持つメンタルモデルは、AIはコストコのようになるというものです。会員費を払って店に入ります。実はコストコのビジネスにおいてこれが最も利益率が高い部分です。そして店内で買うものについては、これくらいまでのマージンが乗っているという信頼があります。これがComputerクレジットのようなものです。コストコに行ってホットドッグだけを買う人もいれば、必要に応じて毎回何千ドルも使う人もいます。

彼女が反応したのは、Cursorが導入したデータポイントや、Claude Codeがサブスクリプション層に補助金を出しているといった話だと思います。それらはいずれ正常化されるでしょうが、私たちがComputerのクレジット機能で目にしている行動は、人々が使用量に応じて対価を支払っているということです。補助金もなければ、システムが崩壊するようなモデルでもありません。ユーザーは価値を見出し、使うほどに毎月より多くの金額を支払っています。ですから、コンピューティングやデータセンターへの投資はすべて安全な投資だと考えています。

急激な変化のなかでの組織戦略と今後の展望

最後の質問です。Perplexityは、AI検索、AIブラウザ、そして今回のComputerという3つのトレンドをいち早く捉えてきました。これほど変化が激しい中で企業戦略を設定するのは非常に困難だと思いますが、常に新たな機能が爆発的に登場する中、Perplexityはどのようにして戦略の方向性や製品計画の決定を下しているのでしょうか。

ひとつは、非常にスリムなチームを維持していることだと思います。ARRを1億ドルから5億ドルへと5倍に増やした間、従業員数は34%しか増やしていません。

たった300人しかいないんですよね。クレイジーです。

私たちが社外の企業に伝えようとしているのは、世界の変化はますます速くなるということです。それに適応する唯一の方法は、意思決定を迅速にすることです。一つの道に縛られないことです。これもPerplexity Computerが素晴らしい理由につながりますが、3週間後に別のモデルの方が優れているかもしれないのに、ひとつのモデルに縛られたくはないはずです。世界は非常に予測不可能です。だからこそアジリティを持ち、迅速に決断し、そして一度下した決定を見直すことをいとわない姿勢が必要です。2年後の世界がどうなっているか分からないという謙虚さを持つことが、この世界で成功するための大きな要素だと思います。

ええ、常に初日ですね。私も同名の本を書きましたが、以前にも増してそのように感じます。この世界では過去の遺産に縛られることは許されず、今日何が新しくてそれがどう機能するかを見て、責任を持って行動するしかありません。そして皆さんはそれをうまくやってきました。ドミトリー、再会できて嬉しかったです。番組に出ていただき本当にありがとうございました。また近いうちにやりましょう。

こちらこそ。ありがとうございました。

リスナーの皆さん、ショウノートにある6月18日のイベントのリンクをぜひチェックしてください。会場でお会いできるのを楽しみにしています。それでは、次回のBig Technology Podcastでお会いしましょう。

コメント

タイトルとURLをコピーしました