2025年末時点でのコンシューマーAI市場の現状を、ベンチャーキャピタルA16Zの投資家チームが徹底分析した議論である。ChatGPTが週間アクティブユーザー8億〜9億人で圧倒的な首位に立つ一方、Geminiが画像・動画生成モデルの成功により急成長を遂げている。注目すべきは、消費者の9割が単一のAIアシスタントしか使用しておらず、市場が「勝者総取り」の様相を呈していることだ。OpenAIとGoogleは2025年に数多くの製品を投入したが、真に成功したのは一部のバイラルモデルのみであった。一方、AnthropicのClaudeは技術者層に特化し、Perplexityはブラウザエージェント機能で差別化を図るなど、各社が独自のポジショニングを模索している。大手テック企業が製品層で苦戦する中、スタートアップにとっては特化型アプリケーション構築の好機が到来しているという見立てが示されている。

コンシューマーAI市場の勝者を決める年
年間を通じて、ChatGPTユーザーの90%未満しか他の大手LLMプロバイダーを訪れることすらありませんでした。
Geminiを開くと、ポップアップが出てきて「Nano Bananaが使えるようになりました。何か試してみませんか?」と表示されます。そして何か入力しなければならない小さな入力欄があるんです。
そうそう。
でも、何をすればいいのか分からないんですよね。
こういった製品のニュアンスの違いが、実際に人々が最初の一歩を踏み出すかどうかを左右するんだと思います。
モデルの品質が、その上に本当にスケーラブルなアプリを構築できるレベルに達したんです。だから2026年は、コンシューマー分野の開発者にとって大きな年になることを期待しています。
今日は、2025年のコンシューマーAI市場で誰が勝ったのかについて話していきます。この年は、大手モデルプロバイダーであるOpenAIとGoogleが、何よりもコンシューマー市場に大きく参入した年だったと言えるでしょう。リリースした新しいモデルという点だけでなく、メインストリームユーザーをターゲットにした新製品、機能、インターフェースという点でもそうでした。
なぜここでのリーダーシップが重要なのか、疑問に思うかもしれません。一般的なLLMアシスタント分野が「勝者総取り」、あるいは少なくとも「勝者がほとんどを獲得する」傾向に向かっている初期の兆候があるんです。
実際、ChatGPT、Gemini、Claude、Cursorのグループの中で、複数に料金を支払っているコンシューマーはわずか9%しかいません。そして年間のほとんどの期間、ChatGPTユーザーの10%未満しか、Geminiのような他の大手LLMプロバイダーを訪れていませんでした。
今この時点で判断するなら、ChatGPTが週間アクティブユーザー8億から9億人で圧倒的にリードしています。Geminiはウェブではその規模の推定35%程度、モバイルでは約40%の位置にいます。そして他のプレイヤーはこれを大きく下回っています。Claude、Grok、Perplexityはすべて利用率で約8〜10%程度です。
しかし特にこの3〜6ヶ月で、Nano Bananaのような新しいバイラルモデルのローンチによって、状況は非常に速く変化しています。Geminiは現在、デスクトップユーザーを前年比155%で成長させており、より大きな規模に達しているにもかかわらず実際に加速しているんです。これは見ていてかなり驚異的です。一方ChatGPTは前年比わずか23%の成長に留まっています。
そしてAnthropicのようなプレイヤーが、コンシューマー市場内で特化し始めているのが見えてきています。超技術的なユーザー層のような異なる垂直領域を所有しているんです。
そこで今日は、A16Zのコンシューマーチームを集めて、大手モデル企業がコンシューマー分野で今年見せたものを振り返り、2026年に何が待ち受けているかを予測していきます。
2025年の主要な製品ローンチを振り返る
いいですね。オリビア、ありがとう。本当に楽しい一年でした。タイムラインを去年の1月まで巻き戻すと、まずは今年見たもの、ローンチされたもの、製品、うまくいったもの、いかなかったものから始めるべきでしょう。
ジャスティン、あなたが今年見たものを教えてください。OpenAI、Google、何に注目していましたか?何について考えが変わりましたか?
そうですね、オリビアが言ったように、この2社は特に大量のコンシューマー向けローンチをしました。モデルの観点から言うと、今年の最もバイラルだったモデルは、少なくともコンシューマーの間では、画像と動画だったと主張します。
OpenAIにとっては、ChatGPTの画像モデル、あのジブリモーメントでした。今年だったなんて信じられないですよね。本当に狂ってます。何年も前のことのように感じます。そしてもちろんSora、Sora 2です。Googleにとっては、Veo、V3、そしてV3.1でした。そして画像モデルのNano BananaとNano Banana Proで、これは狂ったようにバイラルになりました。おそらくOpenAIのジブリモーメントに匹敵するか、それを超えるレベルでした。
製品レイヤーに関して言うと、OpenAIはより多くの機能をChatGPTインターフェース内に保持する傾向がありました。Pulse、グループチャット、ショッピング、リサーチ、タスクなど、これらすべての機能がChatGPTをコアとして内部でローンチされました。そこでの例外は明らかにSoraで、これは独立した動画アプリでした。
一方Googleは、より多くのものを独立した製品としてローンチする傾向がありました。Google AI StudioやGoogle Labs、Geminiなど、製品をローンチできるGoogleの表面が無数にあり、多くをそこから出荷していました。しかし、アクセスして訪問できる独立したウェブサイトとしても出荷していました。これにより基本的に、単なるチャット入力、チャット出力、あるいは画像・動画出力だけでなく、各製品タイプに対してよりカスタムなインターフェースが可能になりました。
マルチモーダルモデルの進化
ジャスティン、それについて質問があります。18ヶ月前、私たちはMidjourneyについて話していて、マルチモーダルモデルのほとんどは美学とリアリズムで定義されていました。それは今も当てはまりますか?今年何が変わったんでしょう?
確かに、今でも異なるスタイルが存在していますし、画像と動画の分野で本当に深い知識を持つ人々と話すと、Midjourneyはプロンプトの仕方を知らなければ他の多くのモデルが持っていない美的感覚のようなもので、今でも際立っていると思います。ただ今年に関しては、リアリズムと、画像と動画の両方における推論でかなり大きな進歩を遂げたと言えます。画像や動画を実際にリアルに見せるすべての細かいディテールです。
例えば、歩いて話している人がいる場合、背景の車の中の人々が、もし通りにいるなら、正しい方向に動いているべきで、変形したり奇妙に見えたりしてはいけないんです。
画像では、複数の入力画像とテキストを持つことができ、それらすべてのアップロードを横断して推論し、一貫性のあるデザインのようなものを作成できるようになりました。これは去年は起こっていなかったことです。
そうですね。画像に文字が正しく表示されることに興奮していた頃を覚えていますが、今では驚くべきインフォグラフィックスができるようになりました。
そうです。
単に素晴らしいYouTube動画をアップロードして、「これを説明する画像を作って」と言えるんです。それは信じられないほど違います。
Nano Banana Proはマーケットマップのようなものまで生成できます。私は実際にマーケットマップを生成しました。信じられません。
そしてそれは、画像モデル内でウェブリサーチを行うか、行う予定で、企業の正しいリストを取得し、それから彼らの写真を引っ張ってくるんです。狂ってますよね。
私が知っている、推論画像モデルがまだ克服していないベンチマークが一つあります。昨日GT image 1.5をテストしましたが、推論と多段階推論の両方で時々苦労するんです。
私がテストしているのは、モノポリーボードの写真をアップロードして、「すべての物件の名前を削除して、AIラボとスタートアップの名前に置き換えて」と言うんです。GPT image 1.5が実際に最も近いのですが、すべてのステップを実行するのは非常に難しいんです。削除して、新しい名前を考え出して、すべての新しい名前を正しい場所に配置して、重複がないか、一つのものを3回言及して別の大手プレイヤーを一度も言及しないということがないようにする。だから画像にはまだ改善の余地があります。
興味深いのは、特にChatGPTの画像モデルで、実際にキャラクターの持続性が見られることです。複数の画像生成にキャラクターを引き継ぐことができるんです。同じスタイルで。
それは「ああ、これは実際に非常に興味深いな、ストーリーボーディングに使いたくなる」と思わせます。
全く。もっと生成したくなるんです。
私にとって、Nano Bananaの最も過小評価されている側面は、検索との統合だったように感じます。なぜなら、物理学や他のことのように感じるリアリズムがあって、ケニー・バレーみたいな感じになっているからです。推論もあります。これはユーザーが求めたものに忠実な修正を適用することです。しかし正確性もあるんです。
私にとっての良い例は製品写真です。「このアルバムカバーの写真を生成して」とか「この歴史的瞬間の歴史的に正確な写真を作って」と言うと、実際に検索統合が必要になります。それは非直感的だったけど、実際には非常に便利なんです。
全くその通りです。ある意味、V3の瞬間に似ています。動画が必ずしも解決されるとは、音声と動画を同じ場所に統合することによってだとは、人々には直感的ではなかったと思います。そしてそれが結局、AI動画をバイラルにさせたものだったんです。
V3以降、そして今はSoraが支配しているかもしれませんが、V3以降、私のソーシャルフィードは本当にいっぱいです。
本当にリアルに見えます。私のフィードの約半分はAI生成です。
素晴らしいですね。
過小評価されている製品とサービス
今年は非常に多くのローンチがあって、その多くがVeoやNanoのようにうまくいきました。あなたたちが思う、過小評価されている、あるいは十分な注目を浴びなかった製品は何ですか?ブライアン。
良い質問ですね。
過小評価されているのは、Pulseだと思います。まだ過小評価されていますし、OpenAIとGoogleについて話していますが、私にとってこれらは生産性カテゴリーに分類されます。今日App Storeを見ると、生産性アプリのトップ10のうちトップ5はすべてGoogleです。狂ってます。
そしてChatGPTがナンバーワンです。つまり、物事を手助けしてくれる生産性カテゴリーについて話しているんです。多くの人々がこれを異なる角度から試みています。データやスケジュール、メールを実際に取り込んで、より役立つものにして、プロアクティブな通知を送るにはどうすればいいか、といった具合です。多くの人がこれに取り組んでいます。
ChatGPTの使用頻度を考えると、週に約25回だったと思いますが。
かなり良いですね。1日3〜4回です。
本当に良い位置にあって、実際にプロアクティブなナッジや要約を提供し、生活全般を助けることができると感じます。エブリシングアプリは常に欧米では神話でしたが、OpenAIはその方向に進もうとしていると思います。十分に取り込んで、人々が十分にそこに行くようになって、本当に有用なプロアクティブなナッジを提供し始めるんです。それは私がワクワクする分野です。
興味深いですね。でもあなたは日次アクティブユーザーですか?
私は日次アクティブユーザーではありません。Pulseではありません。
同様に、私もしばらくPulseを試していましたが、今はほとんど使わなくなりました。でもあなたの意見には同意します。Pulseと今年OpenAIがローンチした他のいくつかの例は、過小評価されているけれど新しいプリミティブやアイデアのようなものだと感じます。ただ実行が少しずれているんです。
実行の問題だと思います。
使用状況がずれているんです。もう一つの例として、同様に個人的なコンテキストに関するものですが、コネクターがあります。今ではカレンダー、メール、ドキュメントを接続できます。これはClaudeでもできます。だから仮説的には、ChatGPTに「過去6ヶ月のすべてのメモを読んで、最も興味深いもの、最も興味深くないものを要約して」と言えるんです。
それがうまく機能すれば、本当にエキサイティングだと思います。私はこれまでのところ少し信頼性に欠けると感じていますが、モデルが良くなるにつれて、それをうまく実行できれば、プロシューマーワークスペースを本当に所有できるチャンスがあると思います。
プロシューマーは完璧なカテゴリーですね。時々話しますが、99%の人はカレンダーで生活を管理していません。私たちはそうですが。だから、ChatGPTの実際の平均使用頻度を考えると、週24回なら、始めるにはかなり良い場所です。
オリビア、あなたは究極のパワーユーザーだと思います。まだ何を使っていますか?あなたのスタックは?
素晴らしい質問です。すべての大手モデル企業の中で実際に、私がまだ最も使っていて、今年最も感銘を受けたのは、Perplexityのcometブラウザだと言わざるを得ません。
そして私はPerplexityを主要な汎用LLMアシスタントとしては使っていませんでした。ChatGPTとClaudeをはるかに多く使っています。でも彼らはブラウザ内のエージェントモデルという点でも、おそらくより重要なのは、同じタスクを事前設定された時間に、あるいは特定のウェブページでトリガーした時に繰り返し実行できるようにセットアップできるすべてのワークフローという点でも、本当に一流の方法で実行したと思います。
だから私にとって、これは本当にエキサイティングな観察でした。データを見ると、ChatGPTがPerplexityよりもはるかに多くの配信力を持っているにもかかわらず、Cometのローンチ時のスパイクと持続的なトラフィックは、実際にはChatGPT自身のブラウザローンチであるAtlasよりもはるかに高かったんです。ちょっとクレイジーです。
彼らは今年メールアシスタントもローンチしました、Perplexityは。そして本当に強力なエージェント系スタートアップをいくつか買収しました。だから来年、彼らから見たいのは、こういった専用のプロシューマーインターフェースをもっと増やすことです。それが彼らが倍増していく素晴らしい方向性だと思うからです。
彼らは、ラボや大手テック企業と並んで、最も広範な野心を持つスタートアップのように感じます。今年出荷したものの数は本当に印象的です。
確かに。
Geminiの台頭とChatGPTの競争
ジャスティン、一つ聞きたかったのは、Geminiがすべての画像と動画モデルのおかげで本当に瞬間を迎えているように感じます。ChatGPTを追い越せると思いますか?これらのタイプのモデルに本当にそれほど需要があるんでしょうか?
そうですね。私が見てきたのは基本的に、最高クラスの画像や動画モデルには常にほぼ無限の需要があるということです。なぜなら、それを見て使いたいと思う多種多様な人々のミックスがいるからです。マーケティングやエンターテインメント、ストーリーボーディングなど、プロフェッショナルに使っているなら、常にその分野の最先端を使いたいと思うでしょう。
だから、ChatGPTやSoraではない他の場所に行って、Veoにアクセスすることに全く問題がありません。一般消費者であっても、非常に多くの新しいバイラルトレンドが、最高クラスの画像と動画モデルの新しい能力を中心に生まれています。だからそれが、これまで試したことのない異なる製品にユーザーを駆り立てることになるんです。
Geminiアプリをダウンロードしたり、Google AI Studioに偶然たどり着いたりするかもしれません。彼らが開発者向けにしようとしていることは知っていますが、Nano Banana Proを使うために、多くのユーザーがこの数ヶ月で経験したと思います。
Geminiについて興味深いのは、仮説的には大規模なGoogleの配信力の優位性から恩恵を受けているということです。Androidを見ると、GeminiはモバイルでChatGPTの規模の約50%にいますが、iOSでは約17%です。だから明らかに何かがうまくいっているんです。
彼らは最近、Chrome内に小さなGeminiウィジェットをローンチして、使用を促しています。Google DocsやGmailなどの他のものにもローンチしています。
でも平均的な人はまだ一つのAI製品しか使っていないと思いますし、ChatGPTはAIのクリネックスのようなものです。それがブランドになっているんです。
その通り。
だからGeminiは、それだけの点でまだかなり大きなハードルを乗り越える必要があると思います。
でも彼らが素晴らしいバイラルなコンシューマークリエイティブツールのローンチとモデルのローンチでやっていることを続ければ、来年そこに到達できるかもしれません。
これについて考えていたんですが、本当に興味深いです。Geminiはあらゆるところにいます。
そうです。
でもある程度、どこにもいないとも言えますよね。実際の使用状況を見ると、人々はまだクリネックスを思い浮かべます。そしてChatGPTに行くんです。
でも製品感覚の点でも興味深いことがあります。今朝、二つのペインを開いていました。OpenAIの画像モデルとGoogleのGeminiの画像機能を基本的に使っていました。
Geminiを開くと、空白の画面です。
うん。
「Nano Bananaができました。何か試してみませんか?」というポップアップが出て、何か入力しなければならない小さなペインがあります。
そうです。
何をすればいいか分からないんです。
そう。GPTに行くと、TikTokのようなスタイルで、「生成したいトレンドのテーマはこちら」というのがあって、スケッチペンか何かをクリックすると、他の一つの写真を使って何か素晴らしいものを作ってくれます。そして「ホリデーカードはどうですか?」「何々はどうですか?」と言ってくれるんです。
こういった製品のニュアンスが、実際に人々が最初の一歩を踏み出す要因になっていると思います。
それを生成して、一度持てば、キャラクターの一貫性があるので続けられるんですよね。だからこれは興味深いことで、OpenAIとChatGPTチームがより深い製品感覚を証明していると思います。
そう。
でもこれは面白いことで、少し不適切なことを言うかもしれませんが、私はSnapで働いていました。MetaとSnapを見ると、有名な話ですが、エヴァン・シュピーゲルはMetaの最高プロダクト責任者でした。
そうそう。
製品面で何度も革新するChatGPTチームと、配信力を持つGoogleがあって、「それはクールだね。じゃあ統合して続けよう」というゲームをプレイする世界があるのかなと思うんです。
興味深いのは、その画像ペインが昨日ローンチされたばかりだということです、この撮影時点で。ChatGPTにとって全く新しいものです。彼らは何年も画像モデルを持っていたのに、画像生成のための別の比較的基本的なインターフェースを考え出すのにそれだけの時間がかかったんです。
私はむしろ、Krea、Hedra、Higgsfield のような世界のアプリケーションレイヤー企業がそのテンプレートフォーマットを普及させ、最初にやって、より良く実現したと主張します。そして彼らはChatGPT製品の人々で、それからChatGPTの製品アイデアのサプライチェーンかもしれません。
その通り。常に。もしかしたら、少し方向を変えて、VK、OpenAIのソーシャル機能についてのあなたの見解に非常に興味があります。なぜなら、製品実行を正しく行う必要があるだけでなく、ネットワーク設計も必要だと感じるからです。Sora 2を中心にいくつかの取り組みがあります。それについても話すべきです。ChatGPT内にグループチャットもあります。
あなたは私たちのソーシャルガイのような存在で、歴史的に強気でした。弱気ですか?どう考えていますか?
今のところ弱気です。
なるほど。
その理由は二つあります。歴史的に、私はインセプション理論と呼んでいるものに基づいて製品を見ています。3〜4層下に行って、一行で言えることを見つけ出すんです。「父に愛されたい」のように。
だから、あなたのため、あるいは世界のために製品について考えるとき、それは私のためでもあり、散歩のためでもあるんです。
そうです。だから、ChatGPTのようないくつかの製品を見ました。最終的に、玉ねぎの皮を5回剥くと、本質的には「もっと良くなるのを助けて欲しい」ということだと思います。情報を得るのを助けて欲しい、もっと生産的になるのを助けて欲しい、もっと効率的になるのを助けて欲しい、ということです。
そしてソーシャル機能について考えると、Meta、Instagram、あるいはTikTokでさえ、2層の情報、あるいは対処しようとしている感情は、TikTokにとっては「私を楽しませて欲しい。私の道化師に楽しませて欲しい」です。
そう。
そしてもう一つの層は「私は孤独だ。見られたい。人々とつながりたい」です。
私にとって、これらは製品の方向性において全く異なる2つの並行線です。
OpenAIの製品は信じられないほど素晴らしいです。魔法のようです。素晴らしいです。でも最終的には「私を見て」あるいは「私を助けて」カテゴリーなんです。
だから生産性カテゴリーでナンバーワンなんです。
そう。
今、私たちはこれを人々の生活に押し込んで、「みんな、もっとよくつながって」と言おうとしています。
そして「見られていると感じて」ということです。グループチャット機能でさえ、私は大好きですが、旅行を計画するのには素晴らしいでしょうし、その共通の痛みがあります。
でもそれはおそらく、「助けて」という方法で何かを計画する2〜3人の最終的な数で止まると思います。
そう。
「ああ、ニッチをずっとよく理解していると感じる。それを実際にやったから」というのとは違います。
だから時間が経つにつれて、大まかにはその分断が理由だと思います。
でもそれは、そのことに完全に対処する別の製品を構築できないということではありません。
Soraについて考えると、グループチャットについて話しましたが、Sora 2は今年コンシューマーAIからの他の大きなソーシャルプッシュだったと思います。
基本的にはTikTokフィードのようなものですが、すべてAI生成の動画で、友達のカメオを作れるんです。
カメオは非常に良い賭けでした。
強い賭けでした。
そう。でも私たちが見てきたのは、リテンションデータとその使われ方において、クリエイターツールとしては大成功だったということです。今、私のフィードはおそらく3分の2がAIスロップで、その50%以上が今ではSoraです。以前はすべてVeoと一部がKlingでした。
でもソーシャルアプリとしてはそれほど成功していません。
消費の面で。
そう、少数のクリエイターが大量のコンテンツを作成していて、それをTikTok、Instagram、X、Redditのような場所に持ち出して大規模にバイラルになっています。でもアプリ内での消費、リミックス、コメントは、特に当初ほど多くは起こっていないようです。
面白い考え方をすると、Soraの競争相手や類似物は実際にはTikTokではないんです。
うん。
実際にはCapCutなんです。
ある意味、クリエイティブツールのようなものです。
興味深い。
そうです。
オリビア、あなたの意見は?
あなたの以前のポイントに戻るんだと思います。ソーシャルアプリを駆動する動きは、「ああ、自分自身のこの敏感なものを公開している。人々にこう思われたい、ああ思われたい、こう思われたい」というようなポジティブとネガティブな感情の両方なんです。
だからそれがアプリ上での参加を駆動するんです。
ステータスゲームです。
まさに。ステータスゲームです。そしてそれがAI生成コンテンツで、人々がそれが人間としてのあなたの本当の表現ではないと知っているとき、ステータスゲームは少し失われるんです。
完全に失われます。
そう。ステータスゲームは、何かクールなものをプロンプトできるか、ということになると思いますが、それは異なるタイプの製品です。だからTwitterや他のすべての既存のプラットフォームでバイラルになるんだと思います。
私の反論、あるいはSora 2への強気な見方は、実際にはステータスゲームは何よりもユーモアに関するものだったと思います。そしてユーモアは、プロンプトの仕方を知っていることと文化的に意識していることの交差点です。
だから彼らがそれについて反復すれば、それは誰も以前に捉えていない方向性だと思います。
そう。
そうです。でもそれらの動画をエクスポートできるなら、Sora動画が載ったTikTokの方が、Soraよりも厳密に優れているのは本当ではないですか?
私たちは何度も話してきました。究極のソーシャル製品は、消費と創造の両方が一緒に存在し、その出力が他のプラットフォームにネイティブではないもの、TikTokやYouTube shortsのようなものです。
挑戦者たちの位置づけ
みなさんは挑戦者たちについてどう思いますか?挑戦者としてMetaについて話すのはクレイジーです。この文脈では彼らがそうだと思いますが、より明白な名前はClaude、Perplexity、Grokだと思います。オリビア、あなたの見解は?
私はClaudeが大好きです。いつもClaudeと話しています。Claudeは私にとって汎用LLMとしてChatGPTをある程度置き換えました。Claudeは興味深い方法で主張があると思います。Claudeが好きなのは、AIワークフローを構築するために時間を投資する意思があるからでもあります。Claudeは今年、アーティファクトやスキルのような、基本的に時間をかけて実行するタスクやワークフローをセットアップできる本当に強力なものを多くローンチしたと思います。
メインストリームにまだ到達していない理由は、それらを構築した方法でさえ、技術的なユーザーやエンジニアに向けられていると思います。彼らはスキルをできるだけ簡単に作れるようにしようとしたと思います。
でもそれはメインストリームの消費者にとって、どこにも近いほど簡単ではありませんでした。もう一つの例は、彼らが実際に大手プレイヤーの中で最初にファイル作成、スライドデッキ作成、編集のようなものをローンチしたことです。
そして彼らはそれをファイル生成と分析のようなものとしてブランディングし、設定バーの設定バーの中のトグル機能のようなものでした。だからそれを使った人は非常に少なかったんです。でも私にとって、それはそのような複雑な作業を行う上で、すべての中でまだ最高の製品です。
だからClaudeは大好きですが、本当にメインストリームの消費者製品になりたいなら、アクセシビリティの点でさらに簡単にする必要があります。
最近あなたが見つけたアメリカのティーンエイジャーの調査がありました。
そう、Character AIを使ったことのあるアメリカのティーンエイジャーは、Claudeを使ったことのある人の約3倍いると思います。
そう。だからテック系の人々の間ではClaudeは愛されていますが、テック系以外の人々の間では、関連性を獲得するのに苦労しているかもしれないということを示していると思います。
興味深いのは、美学や製品デザイン、職人技のようなものを見ると、Anthropicが行った3つのことは、MCP、スキル、コマンドラインインターフェースであるClaude Codeのようなものでした。これらは3つの驚くべき賭けで、特にClaude Codeは。コマンドラインインターフェースが本当に人々が望む方法なのか、と私は言ったでしょう。
あなたはAirmailを乗っ取ることと考える帽子について話すと思っていました。
そうそう、それもです。消費者向けです。
3つ考えると、考える帽子はどこにあるんですか?でも非常に高尚なデザインです。ある意味、あるいはそれは彼らに代わっての弁明かもしれませんが、主張があって素晴らしいと思います。
MetaとGrokの両方についてジャスティンの見解を聞く必要があります。両者とも異なる方法で魅力的な年を過ごしたと感じるからです。
そうですね。
Metaはすべての研究者を雇いました。彼らの最強のモデルは実際には消費者向けモデルではないと思います。SAM 3シリーズです。動画、画像、音声用のSegment Anythingのようなものです。
例えば動画では、動画をアップロードして、自然言語で「赤いTシャツの子供を見つけて」と説明すると、フレームに入ったり出たりしても、その人を動画全体で見つけて追跡します。
ぼかしたり、削除したり、何でもそうした効果を適用させることができます。音声でも、異なるステムで同様のことができますし、画像でも、画像内の異なるオブジェクトで同様です。
来年、それらのモデルの上に構築された素晴らしい消費者製品を見ることになると思いますが、今日それらは消費者向けというよりも開発者向けのプレイグラウンドです。
それは会社のDNAを考えると驚きです。
そう。彼らが今年AIで立ち上げた良い消費者向け機能が一つあります。Instagram AIの翻訳です。リールをアップロードするとき、翻訳を有効にすることを選択でき、あなたの声をクローンし、5つの異なる言語に翻訳し、あなたの声で翻訳を適用し、リップシンクで再吹き替えします。
すごい。
だから基本的に、あなたがどの言語でもネイティブスピーカーのように見えるようにします。だから、そういったものがもっとMetaの製品に来るのを見たいです。
Grokに関しては、クレイジーな年を過ごしたと思います。コンパニオンズや、すべてのLLMの進歩、コーディングの進歩で。彼らの画像と動画の進歩は、おそらく私が見たどの企業よりも最も急な傾きだと思います。
約6ヶ月前、彼らは画像と動画モデルすら持っていませんでしたが、新機能をローンチするために超高速で出荷しています。最初は画像から動画だけでした。テキストから動画を追加しました。音声を追加しました。それからスピーチでリップシンクを追加しました。それから15秒の動画を追加しました。進歩のスピードを緩めることなく続けています。
イーロンは、Grokからよりインタラクティブなビデオゲームタイプのコンテンツを望んでいること、来年末までにGrokから映画を望んでいることについて、多くの声明を出しています。だから、そのペースで続くことを期待しましょう。
挟み撃ちのような感じがしませんか?一方では、Ella Marinaチャートのトップを目指そうという非常にインフラ的なモデルレイヤーのようなものがあって、もう一方では、行こうアニーという感じです。
ある種の二分化された動きのようなものだと思います。
その通り。
エンターテインメントとか。
でもある意味でのエンターテインメントです。AnthropicやChatGPTと一般大衆について話していますが、あなたは今、Character AIがはるかに人気があると言いました。
そうです。
だからそれについてどう考えるか。非常に興味深い戦略だと私は思います。
Grokの画像と動画アプリでは、かなり早い段階から、人気のあるもののテンプレートがあります。どこかに立っていて、突然天井からロープが落ちてきて、それをつかんでシーンから振り出される、というような。TikTokや他の場所で定期的にバイラルになる本当に良いものがいくつかあります。
本当に本当に興味深いですね。
2026年の予測
では、25年から26年に話を移して、来年の予測は何ですか?何が見られると思いますか?ハードウェア、モデル、まだ話していないコマース。何が展開すると思いますか?
消費者について話していますが、今年のChatGPTについて私にとって本当に過小評価されているかもしれないことの一つは、彼らがエンタープライズへの大きなプッシュを本当に行ったことです。従来のエンタープライズライセンスと、特定の企業と協力して彼らのためにモデルをトレーニングすることの両方です。
ほとんどの消費者が汎用LLM製品を一つしか使わないという事実について考えると、ChatGPTのエンタープライズ使用は、彼らが大きな研究を発表しましたが、前年比で約8〜9倍増加しています。だから、人々が会社のため、あるいは仕事の一部としてChatGPTを使わなければならない世界に入りつつあるなら、それは本当に消費者使用に変換される可能性があります。
あるいは、コネクターや彼らが投資している他のもので、ワークスペースになるかもしれません。そして他の誰かが消費者向けの消費者ユースケースを所有するのかもしれません。
そのためには、アプリへのプッシュについて話さなければならないと思います。それがうまくいくかどうかが、来年の彼らにとっての決定的な質問になると思います。
そう。
アプリSDKとアプリディレクトリ、彼らがそう呼んでいるものの重要性について、私たち全員が議論してきたと思います。それは消費者にとって巨大な新しいチャネルになるでしょう。
あまり議論されていないのは、エンタープライズに非常に関連性が高いということだと思います。ChatGPTが輝くのは、一つのワークフローのために多くのツールを横断して操作できる場所だと思います。
ビジネスの日常業務で行う、多くのツールを横断して操作することの数を考えると、それらのほとんどがそうです。
そう。
だからアプリストアのエンタープライズへの非常に興味深い影響があると思います。それは私たちがあまり話していないアプリストアの一部です。
そう。
予測というよりも、2025年を振り返って考えると、大手ラボやスタートアップポイントからのすべての大きな動きについて話しましたが、私たちが見てきた最大のトレンドの一つはアプリ生成です。
そして実際に、大手ラボが配信力と人々が入ってくる使用頻度を持って、「見て、一般的なタイプの製品やアプリがあって、大手ラボ製品の範囲内で実際に生成を助けられるかもしれない」と言い始める現実の世界があると思います。
そう。
それは興味深いことの一つだと思います。繰り返しになりますが、画期的なことではありませんが、ご存知のように、アイデアと研究のサプライチェーンに戻ると、それは一つのことかもしれません。ジブリがインターネットを壊したことは知っています。テックについて何も知らない私のいとこが、ジブリの写真を送ってきました。
それならこれをあなたのいとこに送りましょう。
そう。そしてそれはテンプレートが重要であることを示していると思います。
そう。
スタイルが重要なんです。
そう。
動画について考えると、かなり驚くほど良いです。
そう。
そして私たちはすでに、大手ラボのモデルの能力だけでなく、スタイル的なこと、テンプレートが重要な時点に達している可能性があります。TikTokを考えてください。大きな能力は大部分まだ同じです。音楽トレンド、ダンス、行け。ただトレンドとフォーマットが変わり続けて、非常に新鮮に保たれているだけです。
だから、これらのラボモデルに動画ファーストの製品を実際に構築する方法について考え始めることができる現実の世界があると思います。コストは人々が試すのに十分なくらい下がると思います。それを見るのが楽しみです。
そう。私が最もワクワクしているのは、基本的にすべてがマルチモーダルになることだと思います。私はそれを「何でも入力、何でも出力」と呼んでいます。基本的に、最初は特にこれらの画像と動画モデルで、テキストプロンプトを入力して画像や動画を出力していました。それであまり多くのことはできませんでした。
今では、Nano BananaやFlux、新しいOpenAIモデルのような画像編集モデルで、画像を入力して別の画像を出力できるようになり始めています。
画像とテキストのペア、方向性を入力したり、画像とテンプレート、別の参照画像を入力して別の画像を出力できます。
動画を入力して画像を出力できるようになったらどうなるでしょうか。
動画や動画の次の反復に関連するものとか、動画と編集したいものについてのテキストプロンプトを入力して、編集された動画を出力できるようになったら。
ラボとの会話から、彼らの多くは、テキスト推論と知能、LLM空間、画像と動画といった、これまで大部分別々だった取り組みをすべて、多くの異なる形式のコンテンツを取り込んで、はるかに多くを生成できるメガモデルのようなものに統合しようとしていると基本的に考えています。
デザインにも大きな影響があると思います。デザインの多くは、画像とテキスト、動画、異なる要素を興味深い方法で組み合わせることだからです。
マクロレベルの予測について考えると、実際には同じことがもっと続くと思います。ラボが消費者向けにローンチしたすべてのものについて話すと、彼らはモデルで素晴らしい仕事をし、ChatGPTやGeminiのようなものを使うコア体験を改善する増分的なもので素晴らしい仕事をしました。
そう。
私の意見では、グループチャット、Pulse、Atlas、Sora、Googleは長いテール、Stitch、Gems、Opal、Doppelなど、数十のものを経験してきました。新しい消費者製品や新しい消費者インターフェースとして試したりローンチしたりしたものは、どれも本当にうまくいっていません。
それらすべての中で最もうまくいっている製品は、Notebook LMのようなものだと思います。そしてそれはGoogleが試したり実験したりした約20のものの中の一つのようなものです。
だから実際にはスタートアップにとって非常にポジティブだと思います。消費者向けスタートアップにとって、モデルは良くなり続け、スタートアップはそれを使うことができます。彼らはChatGPTをどんどん良くし続けるでしょうが、ChatGPTがこれらすべての他の素晴らしいユースケースや製品に垂直統合していくとは必ずしも思いません。スタートアップがそこで構築する余地はまだあります。
それにイエス・アンドがあります。
オーケー。
絶対にそうですが、ただし、入力と出力がテキストである場合、ChatGPTやGeminiのような世界が最も輝く場所です。どれだけ深く掘り下げても、どれだけ具体的にテキスト出力があると思っても、本質的に、主要な大手ラボ製品の使用頻度を考えると、あなたの製品が主にテキスト入力とテキスト出力である場合、それをつなぎ合わせてその使用から奪い取るのは本当に難しいと思います。
そう。
だから、そこから人々を奪い取ることができる角度について、創造的でなければならないと思います。
「主張がある」という言葉を使ったのが好きです。ラボにとって、確かに大手テックにとって、そしておそらく益々ラボにとって、優先順位は常にプロモ委員会で設定されるからです。
あなたがPMで、常に中堅キャリアのPMで、私もその一人でしたが、インセンティブは常に昇進することです。昇進する方法は、コアメトリックとコア機能を拡張する安全なものを構築することです。だから主張のある製品を構築することは、キャリアを管理する非常にリスクの高い方法です。おそらくうまくいかないでしょう。法務やコンプライアンスに多くの影響があるでしょうし、CEOが怒鳴るかもしれません。
だから彼らは増分的なことをするように非常に構造化されていると思います。創業者が主張のあることをすればするほど、彼らは有利になります。
そう。
ここで議論していない大きなことはコンピュートだと思います。ラボには、限られた量のコンピュートがあり、モデルのトレーニングに使うか、推論に使うかという固有の緊張関係があります。推論の中でも、ジブリのようなエンターテインメントユースケースと、コーディング知能ユースケースのような分割があります。
私の理解では、XAIはおそらくコンピュートにボトルネックがない唯一のモデル企業です。一方、他の企業は、Nano Bananaをリリースして超バイラルになるのを許せば、私たちが進めようとしている次の大きなLLMを遅らせるかもしれない、というような本当に真剣で重要な決定をしなければなりません。
一方、アプリレイヤーに焦点を当てるスタートアップにはその問題がありません。そこには緊張がないからです。
全く。
以前も話しましたが、マルチモデルであることが顧客により良い提案を提供できるカテゴリーがあると思います。ラボと大手テックは常に、定義上、ファーストパーティモデルのみになるでしょう。
だから、すべてのモデルが良くなるにつれて、おそらく必要なものの80%は単一のモデルから受け取ることができますが、パワーユーザーにとって、そしてAIの多くがパワーユーザーのストーリーであることを考えると。
あなたはいつも、パワーユーザーは単にパワーユーザーだと言っていました。それはプレAI世界では真実だと思いますが、今では価値の深さと収益化の深さがはるかに高いので、AIのすべてが実際にはパワーユーザーのストーリーかもしれません。他のすべての人は単にトラフィックです。
そう。
そう。
だから初めて消費者製品が100%以上の収益リテンションを持つのも見ています。
そう。
そしてそれがコンシューマーAI世界で良いものと素晴らしいものと例外的なものを分けているんです。明確にするために、それがどのように起こるかというと、彼らはサブスクリプションに加えて使用量に対して課金することが多いんです。
だからあなたのサブスクリプションに応じた月のクォータを超えて使用し、もっと支払うことができます。
それはティアのアップグレードか、実際にトークンやもっと多くの使用量を購入するかです。
そう。
それが差別化するものです。プレAIで、100以上のリテンションとお金を持つ消費者企業を見ると言われたら、「それは意味をなさない。計算できない」と言うでしょう。
そう。
意図された駄洒落はありません。
まさに。まさに。
おすすめの製品とツール
みんな、オーケー、このポッドキャストの後、人々がダウンロードすべき製品や機能、モデルについて、具体的な推奨事項を話しましょう。今日、人々は何を使うべきですか?
マルチモーダルのポイントについて、人々がチェックすべき本当に過小評価されている製品の一つは、毎日使うからではなく、エージェントと画像とテキストを組み合わせたときに何が可能かを示すからですが、Pamelliだと思います。
これはGoogle Labsの製品のようなもので、ビジネスのURLを入力すると、エージェントがウェブサイトに行き、すべての製品とブランドの写真を引っ張り、ブランドの美学がどういうものか、何を表しているか、どんな顧客をターゲットにしているかを要約します。それから3つの異なる広告キャンペーンを生成してくれます。
テキストだけでなく、Instagramの投稿も生成します。チラシも生成します。あなたの製品の写真と、顧客に基づいてどこにあるべきかと考える場所も生成します。
非常にクールな製品で、Google内で巨大な独立製品になるのは難しいと思いますが、深いコンテキスト理解を持つ生成モデルとエージェントを組み合わせたら何が起こるか、画像モデルや動画モデルが通常持たないような、その未来の一端を示しています。
スタートアップ製品はどうですか。お気に入りのスタートアップ製品、クリエイティブツールはありますか?
はい。
クリエイティブツールでは、私たちはKreaの投資家なので偏っていますが、彼らはすべてのモダリティにわたってすべてのモデル、あるいはすべての品質モデルを使う最高の場所であることと、これらのモデルの上により多くのインターフェースを構築することで、本当に例外的な仕事をしたと思います。
私は今、Kreaでnano Banana Proを使う方が好きです。なぜならKreaは要素を保存できるからです。要素は基本的にキャラクターやスタイル、オブジェクトで、再プロンプトするために@タグできます。同じ画像参照をNano Bananaに何度も何度もドラッグする代わりにです。
それは良いですね。
スタートアップカテゴリーに該当すると思いますが、繰り返しになりますが企業を宣伝していますが、私が最も使っているのは実際には11 Labsのreaderです。
その理由は、ポッドキャストの爆発的増加を見てきたからで、それには理由があると思います。人々ははるかに移動中で、私たちの読書能力、読む能力は時間とともに低下していると思います。だから現実と戦わずに受け入れて、オーケー、それなら書かれた素材を見つけて、聞くことに変換してそれを行おうと。
私はPocketのようなツールのパワーユーザーでした。
読みたいすべてのものを読む時間がなかったんです。そしてそれは保存行動ですよね。回って、最終的に消費したいすべてのものを保存するんです。でも今やっているのは似たようなもので、読みたいすべてのものを手に入れて、PDFにするか11 readerに入れて、散歩中に3〜4分あるときに、1.5倍速か2倍速で聞いて、これらの一つの要旨を得るだけです。
だからそれは、準通常人として少しの時間を使う良い方法だったと思います。
まず第一に、この質問が大好きです。なぜなら、AIに追いつく最善の方法は、たくさんの製品を試すことだと強く主張しているからです。そうすればすぐに主張を持つようになります。
ジャスティンと私は実際に12月の1ヶ月間、Twitterで人々がチェックできる新しい消費者製品を毎日一つ公開しています。それが一つの方法です。
他に3つ、人々がワークフローに組み込める、超関連性があるか興味深いと思うものを挙げます。
一つはスライドデッキ生成のためのGammaです。テキストプロンプトからスライドデッキに行けます。ドキュメントからスライドデッキに行けます。すべてに使っています。また、スライドは柔軟なサイズなので、もはやGoogle Slidesですべての小さなピクセルを編集して一つに収めようとする必要がありません。これは素晴らしいです。
ノートテイキングのためのGranola。休暇中は会議がないかもしれませんが、新年には。そしてその上で会議が増えるほどどんどん良くなります。以前に話したことのコンテキストを持っているからです。
最後に、AI ネイティブワークスペースのようなものを試したいなら、Cometブラウザを試してみることをまだプラグします。それは始めるのに最もアクセスしやすいものの一つだと思います。
私にとって、コーディングとAIコードに夢中になって一年を過ごしました。本当に非常に楽しかったです。
ところで、ブライアン、大手ラボや大手テックがアプリ生成で勝つというあなたの主張の反対側を取ります。彼らは単に焦点を欠いていると思います。
Opalのような製品は小さく鳴き声を上げてリリースされ、一つのモデルのみです。
だから彼らが勝つとは思っていませんでした。私たちは彼らがそれをやるのを見ると思います。
そう。そう。
それは本当だと思います。でも純粋な消費者側では、もちろんWabbyは本当に楽しくて本当に有能で、彼らはアプリ生成に対する正しい種類の制約を作り出していて、本当に満足のいく機能的な結果を得られると思います。
これまで、アプリ生成には過剰な約束が多く、それが初期ユーザーを落胆させてきたと思います。
非技術的な人々にとっても、GPT 5.2をCodexやCursorで試していないなら、試す価値があると思います。素晴らしいです。技術的であることは、ある意味制約だと思います。なぜなら、これらのモデルができることについて既存のアイデアを持っているからで、彼らはもっと多くのことができます。
知識作業をしてCursorでエッセイを書いている人々について、コードを書くだけでなく、益々聞いています。
すごい。
年末にやろうとしていることの一つは、TikTokで見られる人気のあるトレンドをプラグインすることです。「今年言った最も狂ったことは何か」と人々が言っています。
オーケー。
そして実際にあなたが言ったすべてのことのレビューをします。でも同様に、年末にこれをやるのは良いことだと思います。
来年より良い人生を送る方法を教えて。
そう。実際に飾らない意見といくつかの方向性を与えてくれると思います。役立つと思います。
そのアイデアが大好きです。
私は来年、より悪い人生を目指します。
素晴らしい。
フルDGNに行きましょう、みんな。
最後の考えはありますか?
それは、つまり。
明白なのは、私たちは消費者企業に非常に積極的に投資していて、多くの人がこれを言いますが、私は本当に、モデルがその上に本当にスケーラブルなアプリを構築できる品質レベルに達したと信じています。Wabbyはこの素晴らしい例です。
だから2026年は消費者ビルダーにとって巨大な年になることを期待しています。消費者が製品の消費者であるというだけでなく。
そう。
そうです。みんな、消費者におけるAIの非常に楽しい一年をありがとう。来年もっと戻ってきます。メリークリスマス、みんな。
これで終わりです。
そう。
ハッピーホリデー。
ハッピーホリデー。


コメント