消費者向けAIアプリトップ100 | a16z Show

AI活用・導入
この記事は約31分で読めます。

a16zによる消費者向けAIアプリトップ100レポート第6版が公開された。ChatGPTが圧倒的な市場シェアを維持する一方、Claude、Geminiはそれぞれプロシューマー、クリエイティブ領域で独自の地位を確立しつつある。注目すべきは、アプリストアのエコシステムがChatGPTとClaudeで明確に分化している点であり、ChatGPTは旅行や栄養といった消費者向け、Claudeは研究や金融データといった専門領域に特化している。グローバル展開ではシンガポール、香港、UAEが一人当たり採用率で上位を占め、ロシアと中国は独自のAIエコシステムを構築している。創作ツール分野では、汎用画像生成からSunoやElevenLabsのような特化型サービスへとシフトが進み、エージェント技術ではOpenClawやManisが消費者向けAIの新時代を切り開いた。音声、メモリ、デスクトップアプリといった新領域が急速に成長しており、今後6ヶ月でさらなる変化が予想される。

The Top 100 Consumer AI Apps | The a16z Show
Anish Acharya speaks with Olivia Moore about the latest edition of The Top 100 Gen AI Consumer Apps report. They cover w...

トップ100レポート第6版の全体像

オリビアさん、ようこそ。

お招きいただきありがとうございます。

今年最もエキサイティングな時期がやってきましたね。トップ100レポートが今日公開されるんですよね?

そうなんです。

これで3年間で6版目になりますね。

同じ部分と変わった部分、興奮度、レポートの状況について教えてください。

そうですね、多くの点で本当にたくさんのことが変わりましたし、2023年に初めてこのリストを公開してから信じられないほどの成長がありました。

一方で、マクロレベルで見るとまだ本当に初期段階なんです。ChatGPTは圧倒的に最大のグローバルAI製品ですが、それでも世界人口の10%しか週次アクティブベースで使用していないんです。だからまだまだこれからなんですよね。

この6ヶ月間は、これまでで最もお気に入りで、最もエキサイティングな時期だったと思います。というのも、大きな変化を目の当たりにしたからです。

消費者市場をめぐる競争激化

その一つが、消費者をめぐる競争が本当に激化していることです。もちろんChatGPTもそうですが、GeminiとClaudeも消費者とプロシューマーの中で独自のICP(理想的な顧客プロファイル)に本腰を入れています。そして、これらのプラットフォームが時間とともに複合的な優位性を持つ可能性が見え始めていると思います。

だからこそ、誰が最も多くのユーザーを獲得しているかということが、特に実存的で興味深いものになっているんです。それに関連して、今回初めてAIネイティブではないものの、現在は主にAI対応となっている製品を含めました。CanvaやNotion、Freepickといったものです。実際Notionは、新規ARRの半分がAIファースト機能によって推進されていると発表しました。これはとてもクールですよね。

そして最後に、AIがウェブサイトやアプリのプロンプトボックスの外へと大きく拡大しているのを目にしてきました。Dia、Comet、Atlasといったブラウザが登場しました。Claude in ExcelやPowerPoint、Chromeもあります。そしてCursor、Whisper Flow、Granolaといったデスクトップアプリもあります。

AIの使われ方が本当にエキサイティングな形で爆発的に広がっているんです。

基盤モデルの勢力図

とてもエキサイティングですね。ここにはたくさんカバーすべきことがあります。まず大手基盤モデルから始めましょう。GeminiとClaudeのそれぞれの専門分野について少し話していただけますか?そしてもちろんChatGPTについても。というのも、これらのモデルが互いにトレードオフするというよりも、満潮が全ての船を持ち上げるような話に感じるからです。

そうですね、同感です。先週のドラマにもかかわらず――ケイティ・ペリーがTwitterでイエロー戦争に味方するなんて、私には全く予想できませんでしたけど。

ベースレベルで見ると、AI利用においてはChatGPTが非常に明確な勝者なんです。ウェブではGeminiの2.7倍の規模です。

モバイルではGeminiの2.5倍の規模です。そして、テックTwitterの議論はさておき、Claudeに対してはウェブで30倍近く、モバイルで80倍近く大きいんです。サム・アルトマンがスーパーボウル広告戦争時代に戻ってツイートしたのを覚えています。

テキサスツイートですね。

そうです。

彼は「テキサスでChatGPTの無料版を使っている人の方が、Claudeの全世界ユーザー数より多い」みたいなことを言っていて、それは事実なんです。

とはいえ、二極化という言葉が適切かはわかりませんが、人々が使用している製品の数と、異なる製品を何に使っているかという点での拡大が見られると思います。

それが市場シェアを少し変化させています。Claudeは特にプロシューマーに本腰を入れていて、Co-work、Claude Code、Claude in ExcelやPowerPointといったものがあります。実際、ClaudeとChatGPTに登場しているアプリストアを見ると、両方とも200以上のアプリがありますが、重複はわずか11%なんです。

Claudeはプレミアムデータソース、リサーチツール、科学ツール、金融データといったものに本腰を入れています。一方ChatGPTは消費者向けマーケットプレイス、旅行、栄養、消費者金融といったものに本腰を入れています。そしてGeminiは独自の小さな領域にいる感じです。その牽引力は主にクリエイティブツールによって推進されています。

アクティブユーザーと有料ユーザーを見ると、V3、Nano Banana 1、Nano Banana Pro、Nano Banana 2といったリリースとほぼ完全に相関しているんです。プロシューマー向けにももう少し取り組んでいて、Gmail、Sheets、Calendarにもっとやばい感じのAIを追加しています。でもそれは全て既存の製品で捉えられていて、全く新しい体験というわけではないんです。

アプリストアのダイナミクス

アプリストアのダイナミクスについてもう少し掘り下げましょう。とても魅力的ですから。ChatGPTのアプリディレクトリと呼ばれるものの強気シナリオについて話していただけますか?

ええ。ChatGPTで見られるアプローチと、サム自身がTwitterで言っていたことですが、「私たちは全ての人のためのAIになりたい」ということです。つまり、あらゆる消費者を獲得しようとしていて、それを異なる方法で収益化するということです。

Claudeは非常に明確にサブスクリプション経由でのみ収益化すると言っていると思います。サブスクリプションを支払える人や企業にとっては素晴らしいことですが、全員がそうというわけではありません。彼らが傾倒しているプラグインを見ると、有料で高ACVの仕事用データツールのようなものです。Pitchbookのように、投資家や科学者、数学者が使うようなものです。

一方ChatGPTは、ある程度Googleタイプのアプローチを取っていると思います。平均的な人が使いたいと思うようなものを構築していて、

そのうちのより小さな割合が今のところサブスクリプションに転換するかもしれませんが、広告を通じて、そしておそらく取引を通じてもそれらの人々を収益化できるでしょう。

旅行を予約したり、その他のロングテールな消費者購入を行うゲートウェイを構築しているなら、

仮説的には、最終的にはそこから何らかの手数料を取れるはずです。少なくとも彼らが推進しているトラフィックについては。これがChatGPTアプリストアの強気シナリオで、まだデータには表れていませんが、おそらく今後1、2年でさらに明らかになるでしょう。

コンテキストの複合効果

本当に興味深いですね。複合的優位性についてのレポート内のポイントと、コンテキストがどう複合していくかに触れているからです。その概念について少し話していただけますか?それから、それに対する指標としてのプロキシは何ですか?セッション時間ですか?セッション数ですか?提供したデータ量ですか?それとも他に何かありますか?

これは私にとって本当にエキサイティングな質問です。というのも、これまでChatGPT、Claude、Gemini、Perplexityといった水平型LLMでは、コンテキストとメモリがある程度簡単にエクスポート可能な世界に生きてきたと思うからです。Claudeは最近これについてキャンペーンを行いましたが、ロックインが増えていくと思います。そして、それはおそらくChatGPTのようなより広範で水平的なツールに利益をもたらすと思います。いくつか理由があります。

一つは、ChatGPTがプラットフォームを通じて他の人とやり取りする製品を構築し始めているのをすでに見ています。

グループチャットのようなものです。ChatGPTグループチャットのさらに成功したバージョンがあって、

友達全員がそこにいたら、ChatGPTから乗り換えようとしたら彼ら全員も説得しなければならなくなると想像してみてください。

まさにネットワーク効果ですね。

その通りです。二つ目は、AppleとGoogleの比較のようなものだと言えます。これらのアプリストアが登場するにつれ、開発者が最も洗練された方法で誰のために構築するか、誰に最初に出荷するかに時間と労力を集中させ始める可能性があります。最も多くのユーザーを持っているのは誰か、あるいは場合によっては最も喜んで支払う意思があるのは誰かによって。でも、こうした消費者向けツールの多くにとっては、最も多くのユーザーを持っているのは誰かということになります。だからこれもChatGPTに利益をもたらすと思います。

そして、今年最も楽しみにしているもう一つのことは、サム・アルトマンがほのめかしていた、ChatGPTでの認証レイヤーです。

つまり、基本的にChatGPTアカウントでログインして、メモリとトークンを持ち歩けるようになり、そうすれば他の製品がそれらを借りて、あなたにとってさらに強力で役立つものになれるということです。そうなれば、より多くの核となるアイデンティティをChatGPTに置きたくなります。なぜなら、それが他のツールに貸し出されて、それらがさらに良くなるからです。

本当に賢いですね。それは彼らの優位性をうまく活かしています。9億人のサインアップがあって、理想的にはサードパーティ開発者が推論のコストを支払いたくないでしょう。

そうなんです。

ユーザーが推論能力を持ち歩ける。開発者にとって利点があります。

ChatGPTがロックインを得る。ユーザーはパーソナライゼーションの恩恵を受ける。全てがうまく機能するんです。

完全に同意します。この点に関してまだ疑問に思っていることが一つあって、消費者製品のロックインを増やすという点でプラスにもマイナスにも働く可能性があります。

それは、仕事の契約がどうなるかということです。エンタープライズ契約がどうなるかです。

例えば、ある意味で、会社がChatGPTを仕事で使っているなら私にとって良いことです。

そうすれば製品の使い方がわかりますし、通常の消費者として1つか2つのAI製品を試したことがあるかもしれないので、すでに使ったことのあるものを使い続ける方が快適でしょう。

一方で、個人的な使用と仕事での使用でアイデンティティやメモリを混ぜたくない人もいるかもしれません。

確かに。

だから本当に興味深いのは――OpenAIが最近これについてほのめかしていたと思いますが――自分の中にある異なるペルソナ間でメモリをどうセグメント化するかということです。これらの製品を使っている。

ストリームを交差させないということですね。

ええ、まさにその通りです。

Geminiの戦略

では、Geminiの話に切り替えましょう。Googleの初期AI製品、Bardを巡る雰囲気について考えます。彼らは決してそれを払拭できないでしょう。

厳しい時期もありました。

今日のNano Bananaのような製品がある状況まで来ました。Nano Bananaと名付けること自体が、Googleがどれだけ進化したかを示す完璧な縮図のようです。

彼らはマルチモーダリティについて多くの意図を持っているようです。

彼らのアプローチについてどう評価していますか?

感心しています。彼らはある意味でもっと慎重だったと思います。まさに私たちが期待する通りの面もあります。コア機能にAIを組み込むことに慎重だったのは、自社製品をカニバライズするリスクがあるからです。それに、これらのツールを10年、20年、30年、40年使ってきた人が非常に多いので、そこでのスイッチングコストはちょっと高いんです。

AIが突然あらゆるところに現れてユーザーを怖がらせたくない。理解できます。

でも、彼らが本当に素晴らしい仕事をしたのは、基本的にDeepMindチームによるモデル駆動の新しいクリエイティブ製品です。彼らは一般的に素晴らしいと思います。実際、Notebook LMがその最初の例だったと思います。それは消費者向けAIオーディオで本当に新しいものでした。

そして今、画像と動画のモデルがあります。ある意味、このような大企業では、実際にイノベーションを起こすために自分たちの邪魔にならないようにしなければならないんです。そして、それができているようです。でもあなたもGoogleで働いていたので、あなたの意見も聞きたいです。

面白いのは、Notebookは企業内の製品領域の中でグリーンフィールドのようなものだということです。

10人のVPが争っていない。その結果、Notebookの進歩は素晴らしいものになったと思います。ワークスペース内のすべての概念を視覚的にデモンストレーションするビデオ生成機能を立ち上げたばかりです。クールですよね。

逆に、SheetsやDocsのような既存の製品サービスを見ると、過去からの勢いと慣性がたくさんあるだけで、さらにマネジメントのオーバーヘッドもあります。

そうなんです。

それらの周りには、最も明白な増分的なこと以外は何もするのが難しいんです。

そうですね、同意します。今後数年でどうなるか見てみましょう。そのユーザーベースを失いたくないので、いくつかの製品については戦うつもりだと思います。でもあなたの指摘通り、すでに非常に多くのエンタープライズとロックインしているので、少なくとも短期的にはそれほど多くのことをしなくても追いつけるかもしれません。

グローバルAIトレンド

この会話の中で暗黙的になっていますが、私たちは西洋でAIを多く体験し、話しています。

そうですね。

グローバルなAIトレンドについて少し話してください。そこにはいくつか驚くべきものがありました。

このレポートのために見る範囲を拡大したんですが、それが非常に面白く興味深いものになりました。

世界の他の地域と異なる点として、おそらく明白な2つはロシアと中国です。中国については誰もが知っていると思いますが、大量のAI製品が検閲されたり禁止されたりしています。だから、彼らの使用のほとんどは実際に全国の中でChatGPTとGeminiの組み合わせ使用が最も低いんです。

わずか15%です。彼らは主にByte DanceによるDouBao、DeepSeek、Qwen、Kimiといったモデルを使っています。

私にとってやや驚きだったのは、ロシアも実際に非常によく似た状況だということです。彼らもまた、ある程度の制裁などがあって米国ベースのツールを使えないため、必然的に独自の並行AIエコシステムを持っています。

GigaChatやYandexといったロシア固有の製品を見てきました。これらはロシアの、しばしば国家関連企業によって構築されていて、そこで大きく使用されています。それからDeepSeekです。ロシアは中国に次いでDeepSeekの第2位市場なんです。

国ごとの採用データを見ると、確かに、この国はClaudeをもう少し多く使い、この国はGeminiをもう少し多く使うといった小さな変動はありますが、2つの大きな外れ値はロシアと中国で、これらは大きな市場です。

だから、そこで何が起こっているかを注視する価値があると思います。

興味深いですね。ロシアと中国はどちらも、モデルの使用方法に関する制限と、おそらく文化的嗜好のために外れ値なんですね。地理的に特有のトレンドを持つ他の国はありますか?それともこれはグローバルなAI行動セットのようなものですか?

モデル開発、独自のAI製品をデプロイできる独自モデル開発という点では、

その研究のほとんどは米国と中国から出ています。おそらくロシアから少し出ているかもしれません。

いくつかのネイティブエコシステムが他の場所でも見られると思います。韓国はNaverやKakaoのような独自の製品をいくつか持っていて、良いLLMインターフェースを構築しています。

インドはおそらく私が本当に注意深く見ているもう一つの国です。非常に多くの人々がいるので、インドに焦点を当てた独立した大企業を持つことができるからです。

インドのもう一つの興味深い点は、非常に多くの異なる言語があることです。非常に幅広く、LLM製品や音声製品でさえも必ずしも十分にサポートされていません。それらの言語の主要ユーザーであれば、ChatGPTのようなものを使おうとしても体験が悪くなるんです。

だから、これまでのところそこで大きな変動はまだ見られていませんが、米国からの創業者でさえ、AIでインド市場をターゲットにする人がもっと現れても驚きません。

それから、もう一つ言及したかったのは、初めてどの国がAIを最も採用していて、最も採用していないかのヒートマップのようなものも作ったんです。一人当たりベースで。

10の最大LLM製品を横断的に見ました。

ウェブとモバイルでこれがどのようなものかを見るために。

シンガポールがナンバーワンです。

すごいですね。

そうなんです。それから香港、UAE、韓国。米国は20位です。だから、超低くはないですが、非常に高くもないです。

ロシアと中国はリストのかなり下の方で、50位以下です。

そのデータには多くの興味深い物語があると思います。

最初のものは、上位5カ国――シンガポール、韓国、香港――を考えると、労働力の人口統計が非常にテックファースト、ホワイトカラー、高スキルなんです。

米国には、AIがまだ本当に触れていない大量の仕事があります。小売や輸送といったものです。

それから、AI周りの文化的規範が驚くほど多様だと思います。米国にいると、おそらく仕事に関する継続的な不安や疑問を内面化しているでしょう。

あるいは、AIはアーティストにとってひどいものだとか、人々がAIを採用するかしないかを決める他のすべてのことです。

そうですね。

実際、昨年エーデルマンというグローバルメディア企業による大規模な調査がありました。

米国のAIに対する信頼率はかなり低く、32%でした。そして、このリストの上位にある他のほとんどの国は50、60、70%なんです。

だから、私たちが最大の製品の出所であるにもかかわらず、それが米国を引き留めてきたと思います。一人当たりの使用率は、おそらく人口は少ないけれども、もっと受け入れてきた他の多くの市場よりも低いんです。

まさにその通りだと思います。中国ではAIに対する好意的な見方が80%だと読みました。80%が好意的な見方を持っていて、UAEとシンガポールは文化的にテック楽観主義に配線されていると思います。

そうですね。

それは利点ですよね。

はい。はい、絶対に。これらの小さな国の一部でも一人当たりの採用率を見るのは興味深いです。米国では、ChatGPTのようなものの月次アクティブユーザーはおそらく3分の1程度です。

はい。

ヨーロッパやさらには東ヨーロッパの国々の一部でも、ベースは小さいですが50、40、45、60%で、私たちよりも迅速に受け入れています。

クリエイティブツールの進化

本当に興味深いですね。一つ注目していることがあって、興味を持っているのは、AIのスペクトルを最も機能的なGoogleサーチ置き換えのようなものから、最も文化的、創造的、個人的なものまで見ていくと、国ごとにもっと分岐が見られるはずだということです。明らかに、インドで作る映画は中国や米国で作る映画とこれ以上ないほど違うからです。

では、なぜ彼らのクリエイティブツールの使い方が違わないんでしょう?

ええ。これは正直なところ、このレポートで地理的セグメンテーションを見始めた理由の一部なんです。生成AIの最初の2年半から3年間、大多数の消費者はおそらく1つの製品とやり取りしていて、今はかなり広がっているからです。そして、これらの市場特有のツールがもっと見られるようになると思います。

もし彼らがその市場の十分な部分を捉えたら、これらのロシアや中国の企業のように、実際に十分大きければグローバルリストに浮上することができます。

クリエイティブツールの進化について少し話してください。それがどの程度文化の反映なのか、文化を推進しているのか、いつその閾値を越えるのか。

クリエイティブツールのトレンドは魅力的でした。明らかに、最初の大きな生成AI製品は実際にはMidjourneyで、ChatGPTより前に出ました。

その通りです。

最初の数版のリストでは、クリエイティブツールに非常に支配されていました。

私が以前言ったことですが、クリエイティブツールは初期モデルのある種のハルシネーションから恩恵を受けます。

より驚くべき、美しい、オリジナルなものを生み出すからです。だから、しばらくの間、それらが本当に消費者向けAIで機能している唯一のものでした。

今は大きく変わりました。

クリエイティブツールはまだリストの大きな部分を占めていますが、独立した大きなビジネスとなるクリエイティブツールのタイプが変わったんです。最大の変化は、独立した画像生成ツールが減っていることだと言えます。

ふむ。

この活動の多くは、基本的なコモディティ画像――ミームや基本的なマーケティング画像、インフォグラフィック――を作るなら、ChatGPTやGeminiのコアモデルがそれらのことにかなり優れているんです。

だから、Ideogramやmidjourneyのようにリストに浮上し続けている製品は、非常に美的にこだわりがあるか、ChatGPTのようなもので得られない非常に洗練されたワークフローを持っているかのどちらかです。

それと対照的に、音楽、音声、動画はすべて、最大のモデル企業がおそらくあまり投資してこなかったもののようです。

だから、SunoやElevenLabsのようなプレーヤーが、音楽と音声で

完全にブレイクアウトしてリストのトップ20、トップ15に上昇し、そこでポジションを維持し続けているのを見てきました。そして、コミュニティや大きな企業顧客基盤などからの複合的なロックインがあります。

動画は私が最も疑問を持っている領域です。OpenAIはSoraで投資していますし、もちろんGoogleもVOで投資していますが、

中国のモデルは非常に優れています。なぜなら、どんなデータでもトレーニングできるからです。Kling 2はおそらくこれの最良の例で、米国企業がこれまでできたことをある意味で頭一つ抜けています。だから、見てみようと思います。

これは実際に、すべてのモデルを一箇所で使えるAkoolのようなプラットフォームに利益をもたらすと思います。なぜなら、私の妹Justineがこれについて記事を書きましたが、動画の形成方法を見ると、すべてを支配する一つのモデルになる可能性は低いので、それらの間で切り替えられる必要があるんです。

ほとんどのモデル空間でそれが当てはまるようですね。チャットモデル、クリエイティブモデル、コードモデルでさえも専門領域があります。人々はOpusの人間工学について語ります。

そうです。

Codexの精度と比較して。そしてそれはトレードオフなんです。どの問題にどのツールを使いたいか選ばなければならない。

ええ、絶対に。Soraは私にとって本当に興味深いです。というのも、モデルにおける大きな前進と、ソーシャルに関する本当に野心的な実験の両方を表していたからです。Soraの初期の頃、作成していた人の割合のようなデータがあって、これまで見てきたものの10倍も劇的に高かったんです。

Soraのソーシャル努力とモデル努力についてのあなたの評価は何ですか?そしてそれがどこへ向かうと見ていますか?

Soraは本当に魅力的で、私たちみんなにクリエイティブツールについて、でもおそらくもっと重要なのはAI時代の消費者ソーシャルがどのようなものかについて多くを教えてくれた非常に興味深い初期実験だったと思います。

数字で見ると、彼らは大規模なローンチをしました。米国のアプリストアで20日連続ナンバーワンでした。これは非常に難しいことです。アプリストアでナンバーワンになるには、おそらく1日15万ダウンロードを獲得しなければならないということです。だから、高いダウンロード量なんです。

そして実際にChatGPT自体よりも速く100万ユーザーに到達しました。だから、巨大なローンチでした。

実際、多くの人が過小評価していると思うのは、それがまだ非常に重要な使用を維持していることです。Sensor Towerによると1日300万です。

これは全く悪くありません。Soraについて落ち込んだのは新規ダウンロードです。

11月にはおそらく月600万でピークを迎えました。今は150万くらいに見えます。Soraで本当にうまくいったことは、それが非常に優れたビデオモデルだということです。

そして、彼らはカメオというコンセプトをある種革新し、導入しました。これは実人物がSoraに自分の肖像を許可することで、彼ら自身や他の人が彼らのビデオを生成できるというものです。

だから、初期の頃は多くの人が友達のミームビデオを作っていました。ジェイク・ポールがバイラルになったのは、Soraに傾倒した最初の大きな有名人だったからです。だから、至る所でクレイジーなジェイク・ポールのビデオが見られました。

正直なところ、彼には良かったですね。

ええ、そうですね。

Soraでうまくいかなかったと思うのは、コンテンツがエクスポート可能だったため、

人々はそれをTikTok、Instagram Reels、YouTubeに持っていき、そこでは最高の人間が作ったコンテンツと競合しました。

だから、全体的なフィード体験は、Soraの最高のものだけでなく、両方の最高のものを見ていたので、より良かったんです。

そうですね。

完全にAIコンテンツであるソーシャル製品がまだ成功しているのを見ていないと思います。感情的な stakes がある意味でより低く感じられるんです。

だから、Soraがまだクリエイティブツールとして明らかに非常に重要な使用と収益を持っているけれど、ソーシャルアプリとしてはそれほどでもないというような例をもっと見ることになると想像します。

そして、大規模なAIネイティブソーシャルネットワークがおそらくあるでしょうが、それがどのようなものかまだ見ていません。

面白いですね。頻繁に議論していますが、すべてのソーシャル製品にはステータスゲームがあります。

そうです。

Instaでは最もホットであること、Xでは最も興味深いことかもしれません。

Soraで現れていたステータスゲームは最も面白いことだったように感じます。これが、コンテンツがクロスオーバーするのが難しい理由の一つだと思います。

何が興味深く素晴らしいかを判断する2つの異なる方法だからです。彼らがニッチを見つけるかもしれない方法を想像すると、同意します。

彼らは今、ディズニーのような大手メディア企業と多くの契約を結んでいます。

そして、Soraが愛されたキャラクターやエンターテインメントフィギュアのようなライセンスされたファンビデオを作れる唯一の場所であれば、それは非常に興味深いです。

完全に。

でも、それがどう展開するかは初期段階だと思います。

とても初期段階です。

私たち、言い続けていますね。

ええ。

AIエージェントの台頭

エージェントについて話さずにこの会話はできません。OpenClaw、Manis、GenSpark、Moldbook。

過去60日間でエージェントの世界で何が起こったか、レポートは何を教えてくれるか、概要を教えてください。

これが主に、過去6ヶ月、実際には過去2ヶ月でさえ、私たちが見てきた中で最も興味深い時期だったと言う理由だと思います。

OpenClawは実際、ご覧のとおり、私たちのランキングには載っていません。2月にブレイクアウトしたからです。私たちのデータは1月で終わっています。でも、2月のデータは引き出しました。もし対象になっていたら、ウェブリストで30位だったでしょう。これはかなり大きなデビューです。

OpenClawで本当に興味深いのは、技術コミュニティで使用が加速し続けていることです。

今ではGitHubスターの史上ナンバーワンだと思います。ReactとLinuxを超えました。本当に本当に

Linuxを。すごい。

非常に印象的です。でも、全体的な新規ユーザーの観点では、やや横ばいになっています。だから、「get started」やサインアップページへの訪問を見ると、2月初旬以降、週ごとに横ばいになっています。これが示しているのは、技術的な人にとっては素晴らしい製品だということです。

技術的でない人々への封じ込めをまだ完全には脱していません。もちろん、それはより大きな人口です。

彼らはOpenAIに買収されました。だから、もし私が推測するなら、OpenAIにしてほしいことは、OpenClawを主流の消費者が使えるように製品化することです。そして、OpenClawアーキテクチャの背後にあるアイデアが非常に多くの他の創業者にインスピレーションを与えたのも見てきました。

私たちが1日に何件のピッチを受けるか、創業者が「これのためのOpenClawになりたい」とか「OpenClawが私にこれが可能だと気づかせた」と言うか。だから、OpenClaw自体は成功し続け、大規模な製品になると思います。そして、異なるユースケースのためのOpenClawのより垂直化、集中化されたバージョンをもっと見ることになると推測します。

本当に興味深いですね。OpenClawをうまく機能させているものの一つは、すべての方向のすべてのモデルにわたって操作できることだと感じるからです。

そうですね。

単一モデル提供にすることがOpenClawの価値を薄めるのではないかと疑問に思います。それは、ラボに対してある種カウンターポジショニングされているからです。

完全に。彼らは少なくとも私の使用では今のところマルチモデルを維持していると思います。だから、どう動くか見てみます。そのままにしておく方が賢明だと思います。でも

Manisは消費者グレードのOpenClawなのか、2つをどう区別しますか?

一部の人はそう言うかもしれません。そして、実際にそう思います。

Manisは私たちのウェブリストに載りました。もちろん、彼らはリストの過程でMetaによる20億ドル以上の買収もありました。

信じられない成長です。正直6ヶ月、9ヶ月の間にゼロから1億、2億ARRへと報告されたランプは、本当にベストインクラスです。

Manisがなぜそんなに成功したかについての私の見解は、製品やプラットフォーム全体でかなり自律的に動作できる最初の消費者グレードのエージェントだったということです。

メールに接続でき、ウェブをブラウズさせることができました。

スライドを作ったり、スプレッドシートを作ったりできました。1年前、ChatGPT OperatorやGoogleのProject Marinerのようなものを試すのに多くの時間を費やしましたが、どれも信頼できませんでした。Manisは、消費者向けのエージェントの信頼性とエージェントのアクセシビリティにおけるブレイクスルーでした。

買収を行ったという事実は、これがどこへ向かっているかという点で興味深いと思います。誰もがそのエージェント能力を持つようになると想像できるかもしれません。それが基礎となるコアモデルに基づいている場合

そうなると、実際に非常に水平的な製品であれば、独立した企業よりもMetaやGoogle、そういったものの流通力を持っている方が良いかもしれません。

何かより垂直的なものを構築しているなら、それは絶対に当てはまりません。でも、Googleが今Manisを作るリソースを持っていると想像すると、

それはスタートアップとして戦い続けるのが本当に難しいことだと思います。そして、明らかに大企業には10億の異なる優先事項があります。だから、すべてをベストインクラスでやるわけではありません。でも、それが私が一般的に非常に水平的な消費者向けAIアプリについてやや慎重だった理由です。おそらく大企業のスコープ内であり、彼らはすでにIT承認とエンタープライズ契約などの利点を持っているからです。

そうですね。それはそうです。でも、ある種の文化的閾値を越えたのは興味深いです。

そうですね。

Manisは提供の幅という点で非自明な賭けのように見えましたが、今では彼らが少し未来に生きているように見えます。

ええ、絶対に。彼らは明らかに信じられないエンジニアリングチームでした。

製品の質は市場の他の部分より3、6ヶ月先を行っていました。何千人もの研究者のチームと競争している時にそれをするのは簡単ではありません。

完全に。

これを使って、他の水平的AI製品についての会話に移りましょう。ウェブウィンドウの外に存在するものです。

そうですね。

そこで何を見ていますか?

ええ、それは大きなテーマでした。AI世界で日常的にやり取りする製品について考えると、実際にかなりの数がデスクトップアプリです。Granola、音声ディクテーションツール、Claude Co-workといったものです。

そして、それは私たちのレポートにとって方法論上の問題になります。なぜなら、ウェブサイトの訪問は非常にうまく追跡できますし、彼らがそのデスクトップアプリを初めてダウンロードした時も追跡できます。モバイルアプリの使用も非常にうまく追跡できます。でも、デスクトップの使用はそれほど密接には追跡できません。そして、AI製品がより洗練されるにつれて、それらが専用のアプリケーションに存在することが増えていくと思います。その多くはデスクトップで動作するでしょう。ファイルとやり取りでき、よりアンビエントになれるからです。

これがますます起こっていくと思います。だから、前に進んで、ウェブとモバイルの使用でこれらの製品をランク付けする方法を見つける一方で、収益でも並行して追跡することが非常に良いアイデアになると思います。Cursorのようなものを考えると、最も多くの収益を生み出している消費者向けプロシューマーAIアプリの一部は、ウェブでの使用が非常に少ないからです。

ほとんど全てが専用アプリ内です。

本当に興味深いですね。OpenAIがAtlasをリリースし、AnthropicがCo-workをリリースしたという事実も、彼らの優先事項がどこにあるかを示しているように感じます。

そうですね、絶対に。完全に同意します。AIブラウザの議論はそれ自体で興味深いものです。

それがどう展開するかについては、まだ初期から中期段階にいると感じます。

はい。AIネイティブブラウザの背後にある本能は正しいと思います。オンラインで多くの時間を過ごしている場所でAIを常時オン、常時利用可能、アンビエントにできるなら、それは良い機会です。

Perplexity Cometが実際にそこで道を切り開いたと思います。

素晴らしい製品です。

素晴らしい製品です。興味深いのは、CometとAtlasのダウンロードページへの訪問の最高スパイクを見ると、CometがAtlasの5倍先を行っているんです。ChatGPTのオーディエンスが非常に大規模なのにワイルドです。

ええ。

そして、CometとAtlasにはまだ非常に熱心な興奮したユーザーベースがあると思いますが、平均的な消費者にとって、ブラウザのスイッチングコストは些細ではありません。ワークフローが設定されていて、自然にこの一つのアプリを開くからです。

だから、機能パリティだけでなく、AIブラウザの1つか2つの機能が本当にキラーでなければならず、平均的な人がセットアップしてアクセスするのに十分簡単でなければならないんです。

そして、それはまだ見ていないと思います。

本当に興味深いですね。サムが6ヶ月前にポッドキャストで言っていたと思うんですが、誰かが「何が一番驚きましたか」と尋ねたら、彼は「世界がもっと変わっていないことだ」と言いました。

そうですね。

そして、人々が大規模にChatGPTをどう使っているかのトレンドを見ると、それはまだ宿題やGoogleのようなクエリ、少しの companionship です。

ある意味、ブラウザのようなものは、ユーザーを異なる方向に向ける機会を与えてくれます。平均的な人が今日AIをどう使っているかについて、あなたの見解は何ですか?

ええ。いくつかのことがあります。一つは、10代の女の子が消費者で何が起こっているか、何が起こるかについて最高の情報源のように感じます。

最大の消費者向け成果を見ると、彼女たちがこれらすべての製品の早期採用者だったんです。だから、実際にPew Researchによる最近のかなり最近の研究があって、10代がAIをどう使っているかについてです。今、初めて、彼らの半分以上が宿題に使っていることを認めています。

だから、実際の数字はおそらく99.999%のようなもので、一部は親に怒られたくなかっただけです。

うんうん。

38%が今クリエイティブツールに使っています。画像の編集、ビデオの編集、画像とビデオの生成です。

そして、これはやや長いテールのような新興のものですが、最終的には最大の行動の一つになると思います。

16%がカジュアルな会話に使っています。強烈なコンパニオン製品ではなく、ただ話す相手がいるというような。

そして12%が感情的サポートとアドバイスに使っています。これらすべてのユースケースは最終的におそらく100%に漸近すると思います。

だから、これらはこれまで製品によって十分にサービスされてこなかった行動で、これからはChatGPT上であれ、独立した製品上であれ、サービスされるでしょう。

そして、もう一つ私が注目している大きなことはエージェントです。基本的に

10代の女の子はエージェントを使いますか?さあ。

こういうことなんです。エージェントは、1990年にインターネット企業がドットコムだったのと似たようなことになると思います。あるいはテック企業みたいに、それ自体が指定子でした。

エージェントでもこれが起こると思います。最終的にすべてのテック企業がドットコム企業だったように。

最終的にすべてのAI企業、そしてすべてのテック企業がエージェント企業になると思います。モデルがそこへ向かっているだけだからです。そして、ソフトウェア製品として、ユーザーに単なる入力ではなく成果を届けられるなら、それははるかに説得力があります。

だから、はい、13歳の女の子はエージェントを使うと思いますが、彼女たちはそれをエージェントとは考えないでしょう。でも、金融、ヘルスケア、旅行計画、複雑なショッピングでさえ、エージェント以前は取得して信頼性を持ってシステム全体でやらなければならないデータが非常に多く、本当に可能ではなかったけど、今は可能な、他の多くの消費者向けAIユースケースをアンロックすると思います。

だから、今後数ヶ月でこれらの他のユースケースの爆発が見られると思います。

どのくらいで展開すると思いますか?つまり、12ヶ月後には誰もが自分のOpenClawを使っているんでしょうか?それは5年先ですか?それは間違ったメンタルモデルですか?次のトップ100でこの会話をする時、おそらく6ヶ月後に、世界はどのように見えますか?

何かを予測するたびに、私が思っていたよりもはるかに速く起こるように感じます。これが毎日見ていることだと思います。スタートアップがこれまで以上に速く成長しています。

まだ文化的変化と文化的採用は、技術の変化や実際に可能なことよりも遅くなると思います。だから、引き続き見られると思うのは、技術的な、時には技術的でないAI採用者の初期の波が、行動をリードし、その6ヶ月後に他の皆がやっているということです。

これの良い例で、非常に興奮しているのが音声で、私たちは多くを語ってきました。

音声について語りましたね。

私にとって、それは私たちが持っている最も情報密度が高く高品質のメディアソースです。

あなたが毎日することの多くは、実際にあなたが言うことの下流または上流です。

音声とメモリの未来

そして、過去6ヶ月間で初めて、最初にエンジニアが、次にテック企業内の他の人々が音声ディクテーションのようなものを採用するのを見てきたと思います。今では、会議がAIによって録音され、文字起こしされるのがほぼ規範になっています。

音声ディクテーションであれ、質問に答えたりタスクを実行したりする音声ピンであれ、これは今後6ヶ月から9ヶ月で主流の消費者に広がっていくと思います。

本当に本当に興味深いです。締めくくりに、メモリについて少し話していただけますか?

はい。

それがどこへ向かうと見ていますか?

はい。最初に触れたように、メモリは今のところ少し衝撃的な場合があります。特にClaudeとChatGPTはこれが非常に得意です。Gemini、Googleも個人知能と呼ばれるものをローンチしていて、ドキュメント、メールなどからあなたについて知っている情報を引き出して、すべてのアプリでAIでより良くサービスできるようにします。

そして言ったように、今は少し衝撃的な場合があります。多くの人がすべての個人的および専門的なことについてAIに話しているからです。だから、時々あなたについて知っていることを使ってより良く助けようとするけれど、間違ったコンテキストで意図せず一線を越えてしまうことがあるんです。

だから、誰かがすべてのコンテキストで誰であるかをどう整理するかという、インフラ側のような多くの作業があると思います。

ふむ。

それが解決されたら、メモリはAI製品のコアな利点の一つになると思います。それが自身のメモリであれ、ChatGPTがメモリを貸すことであれ。

今から2年後に使い始めるどんな製品でも、すぐにあなたを知っているように感じなければ、

壊れているように感じるでしょう。

製品へのオンボーディングという概念は、数年後には存在すべきものではありません。そして、メモリが本当にそれを可能にするものだと思います。

私自身で見ています。一日中AIと話しています。一日中いくつかのAIと話していて、彼らが私とやり取りする方法と、彼らが提供できる価値の種類は、使い始めた時よりも2、3ヶ月後の方がはるかに高くなっています。

信じられないですね。未来がどうなるかわかりませんが、奇妙で素晴らしいものになるでしょう。

楽しみです。

はい。

オリビア、ありがとうございました。今日実際にこの会話をしてレポートを見ていくのはとても楽しかったです。最後に何かコメントはありますか?

いいえ、ただ人々がそれを読むのが楽しみです。

そこには多くの興味深いデータがあります。次回は、6ヶ月後にはきっと大きく異なって見えるでしょう。だから、またその時に戻ってきます。

本当にエキサイティングです。あなたの意見を聞かせてください。そして、チェックしていただきありがとうございました。

ありがとうございました。

コメント

タイトルとURLをコピーしました