顧客が求めているものを常に把握する:Listen Labsのアルフレッド・ウォールフォース

AIエージェント
この記事は約30分で読めます。

顧客リサーチをAIエージェントによって自動化・スケーリングするプラットフォーム、Listen Labsの創業者アルフレッド・ウォールフォースへのインタビューである。従来のアンケート調査の限界を指摘し、数千人規模の顧客と同時並行で音声インタビューを行い、正確なニーズを引き出す仕組みを解説する。さらに、過去の膨大なインタビューデータから特定のニッチな顧客の反応を高精度に予測するAIシミュレーション機能や、マーケティング調査の未来、Vertical AI企業としての独自の競争優位性について議論を深めている。

Knowing What Your Customers Want, All the Time: Listen Labs' Alfred Wahlforss
Alfred Wahlforss, co-founder and CEO of Listen Labs, is building an AI agent that interviews your customers at a scale n...

Listen Labsの概要とビジョン

私たちの目標は、10億人のオーディエンスを獲得し、その人が何についてのエキスパートなのかを正確に分類して把握することです。スニーカーのような分野であっても、インフルエンサーやアーリーアダプターのような人々が存在します。そうしたオーディエンスを見つけて最初にインタビューできれば、得られるインサイトははるかに価値のあるものになります。私たちは実施するすべてのインタビューを通じて学習を重ねています。プラットフォーム内でより多くのインタビューを行うにつれて人々のプロフィールを構築し、そこから適切な人物を検索して見つけることができるのです。

さて本日は、Listen Labsの創業者兼CEOであるアルフレッド・ウォールフォースにお越しいただいています。Listenは、数千件の音声インタビューを同時に実行できるAIファーストの顧客リサーチプラットフォームですね。約1年前にローンチされ、現在ではMicrosoft、Anthropic、Sweet Green、NBCなどの象徴的なブランドを含む、Fortune 500企業の20%にサービスを提供しています。コンスタンティンとともに、本日は市場調査とAIによる変革についてお話しできることを非常に楽しみにしています。

お招きいただきありがとうございます。

まずは基本的なところからお聞きします。市場調査をスケールさせるAI対応プラットフォームを構築しているとのことですが、具体的にはどういうことでしょうか。

はい、私たちはお客様よりもお客様自身のことを深く理解できるAIエージェントを提供しています。その方法は、直接彼らと対話することです。たとえば、オンボーディングを改善するにはどうすればよいかといった質問を投げかけると、Listenがインタビューガイドを作成します。これはエージェントがインタビューを行うための指示書になります。私たちには3000万人の参加者がおり、腫瘍医からソフトウェアエンジニアまで、ほぼあらゆる人を見つけ出し、実際に何百件ものインタビューを行い、データを分析して推奨事項を提示します。さらに数ヶ月後にリリース予定の最終ステップがシミュレーションです。プラットフォーム内で何万件ものインタビューを行った後、将来顧客が質問にどう答えるかを予測できるかというものです。別の言い方をすれば、AGIに近づくにつれて物を作ることは簡単になりますが、何を作るべきかを知ることが最も難しくなります。それこそが私たちがListenで構築しているものです。

素晴らしいですね。お気に入りの顧客事例はありますか。

ええ、Chubbiesは初期からのお客様の一つです。彼らはシャツのテストから、どの製品が売れてどれが売れないかを理解するためのマーケティングテストまで、あらゆることに私たちを利用しています。私のお気に入りの事例の一つは、彼らの素材の一つが胸毛と非常に相性が悪いことを発見したことです。そのシャツを着ると非常に不快だったのですが、シャツを変更したところ劇的に快適になりました。このように、小さなことから大きなことまで幅広く対応しています。ManscapedはListenからのインサイトを利用してスーパーボウルの広告を変更しました。

Manscapedについては聞いたことがありませんでしたが、深くは聞きません。それはすごいですね。男性の体毛市場を制覇しているのですね。

はい、それが私たちのニッチです。シェービングから衣服までですね。もちろん他のこともやっています。Skimsも私たちのお客様です。

何の取引をしているかはわかりませんが、文脈から推測はできます。それは素晴らしいですね。

実際の行動とアンケート調査のギャップを埋める

AGIの未来に近づくにつれてというお話がありましたが、私が疑問に思っていることの一つをお聞きしたいです。これまで私はアンケートというものに対して非常に懐疑的でした。なぜなら、人々はお金をもらってアンケートに答えるため、すでに選択バイアスの問題があるからです。人々がすると言うことや、どう行動するかを説明する言葉は、実際の行動とは異なります。ですから私は、人々がどうするかを尋ねるよりも、現実世界での実際のテレメトリーのほうがはるかに重要であるという考え方を持っています。これについてどう思われるか、そしてAIやListen Labsがそのギャップを埋めるのにどう役立つと考えているかをお聞きしたいです。

はい、私たちはこれについて多くの研究を行ってきました。たとえばアンケートについて行ったことの一つは、同じ人に戻って再度多肢選択式のアンケートをお願いしたところ、驚くほど一貫性がありませんでした。多肢選択式で同じ人にアンケートの質問をしても、一貫性が非常に低いのです。しかし、Listenを使って同じことを行い、実際に思考し、答えについてしっかり推論しなければならない状況では、少なくとも同じ質問にどう答えるかについてはるかに一貫性がありました。そして私たちは常に追跡を行っています。たとえばChubbiesの場合、様々なグラフをテストし、数ヶ月後に振り返って実際の販売データと照らし合わせてどうだったかを確認します。ユースケースによっても異なると思います。A/Bテストが究極の目標であることには同意しますが、非常に大量のユーザーが必要になるため、実際には正しく行うのが非常に困難です。そのため、入力が全くないよりは、何らかの入力があることが非常に有用になります。

Listenは音声認識によるテキスト化を行っているのでしょうか。アンケートに答える実際の顧客が声で答えを話し、それを文字起こしするのですか。また、テキスト読み上げも行い、双方向の会話になるのでしょうか。ユーザー体験として、Listenは何から始まり、何で終わるのでしょうか。

はい、基本的にはエージェントとのZoom通話のようなものです。ビデオ通話に参加し、感情を検知することもできます。それが、彼らの発言と実際の考えや感情の間のギャップを埋めるもう一つの方法です。話し方や目の動きを見るのです。そして、それは現実世界での実際の振る舞いにはるかに近いものです。

その人の顔や感情、声などがあることで、エンゲージメントや真実性が高まるというPersonaの指摘はご覧になりましたか。その方向を示す研究やデータはあるのでしょうか。

はい、特に広告においては非常に大きなメリットがあります。リッカート尺度のアンケート、つまりこの製品を買う可能性が非常に高いかといった5つの質問をクリックするようなものでは高いスコアが出ても、実際に人が非常に熱心に反応した場合の方が、はるかに高いパフォーマンスを発揮します。MetaやLinkedInなどのパフォーマンスマーケティングにおいて、そのような広告がより良い結果を出すのを見てきました。

顧客としてこれを依頼し、すべての回答を受け取った場合、その詳細なレベルを把握するためにインタビューの動画をクリックして見ることはできるのでしょうか。

はい。私たちはトレーサビリティを中心にプラットフォームを構築しているため、すべてのデータポイントについて常にクリックしてビデオを見たり、引用を確認したりできます。そのため、AIがハルシネーションを起こしているのではなく、どこからその情報が来ているのかがわかります。

それは素晴らしいですね。理にかなっています。

創業のきっかけと業界の課題

このサービスを作ろうと思ったきっかけは何だったのでしょうか。

共同創業者と私は実際にコンシューマー向けアプリを開発し、それがバイラルヒットしたのがきっかけです。それはbe fakeという名前で、自分のAIアバターを作れるというものでした。チャットベースの画像生成の初期バージョンで、Stable Diffusionをファインチューニングして自分自身をその世界に配置できる機能があり、それが結果的に大流行して一晩で2万人のユーザーを獲得しました。私たちはAIの様々な使い方を実験しており、自分たちの中に多くの疑問があったため、自分たち自身のためにこのAIインタビューを構築しました。アプリの解約が非常に多かったため、その理由や、私たちのポジショニングや様々なユースケースについて彼らがどう考えているかを理解したかったのです。そしてそれが私たちにとって非常に役立ちました。それが始まりです。

Listen Labsの登場前後で業界がどのように変化しているか教えていただけますか。歴史的に見て、たとえば2万人のユーザーを持つアプリがあったとして、ユーザーがアプリをどう使っているか、次に何を求めているか、なぜ解約しているかがわからない場合、これまではどのように対処していたのでしょうか。

私たちが気づいたのは、Qualtricsのようなかなり古いスタイルのアンケートツールが存在する一方で、非常に大きなサービス産業も存在しているということでした。現在の顧客ではなく潜在的な顧客と対話したいような市場調査を行おうとすると、規模を拡大するにつれてそれがますます困難になるからです。そのため、これは数十億ドル規模の産業になっており、彼らが行っているのはどのような質問をするかを考えることです。これはそれ自体が学術的なテーマです。人が実際にどう行動するかを引き出すための質問をどう尋ねるかを知るのは、おっしゃる通り実は非常に難しいのです。これにいくら払えますか、と単純に聞くことはできません。オーディエンスを見つけるために、他の方法よりもうまくいく様々な方法論があります。どのように参加者を集め、何百件もの電話を分析するのか。そして消費財やMicrosoftのような伝統的な業界では、人々を部屋に集めてインタビューするフォーカスグループに数千万ドルを費やしており、私たちはそれをはるかに迅速に処理するお手伝いができます。

なるほど、それが以前のやり方だったのですね。では新しい世界について説明していただけますか。はるかにスケーラブルでおそらくはるかに費用対効果が高いというような、第一段階の明らかな利点はすぐ思いつきますが、あまり明白ではない利点もあるはずです。AIファーストの市場調査や顧客調査を実際に行うとどうなるのか、その利点についていくつかお話しいただけますか。

はい。下される意思決定のほとんどは顧客の意見に基づいていません。その理由は、顧客と話すこと自体に非常に多くの摩擦があるからです。顧客と話すハードルを下げることができれば、最終的にはるかに賢明な決定を下せるようになります。私たちにとってスピードの優位性は実は非常に大きいです。実際の人間から5分以内に入力を得ることができ、インタビューの画面に何百人もの人々が表示されるのを見るのは本当に魔法のような体験です。それがまず一つです。そして非同期であるため、はるかに手頃な価格でもあります。同期的なインタビューを実施しなければならない場合よりも、人々への支払いをずっと少なく抑えることができます。これは人々がよく尋ねる興味深い点なのですが、人間はAIからインタビューされることを好むのでしょうか。その客観的な答えはイエスです。なぜなら実際のインタビュアーと話すよりも、AIと話す方が少ない報酬で済むからです。

それはなぜでしょうか。

非同期であり、人々が非常に忙しいからというのが主な理由だと思います。しかしまた、プレッシャーが低いこともわかりました。自分のペースで進めたり止めたりできます。さらに、AIと話す方がより正直になることもわかりました。心を開いてくれる人もいます。AIはあなたに強い関心を寄せている批判的でない存在なので、非常にセラピー的な体験になります。また、子供へのインタビューなど、デリケートな会話も可能です。彼らが様々な製品にどう反応するかを聞くことができます。人々がAI相手に容赦なく正直になれるというのは、もう一つの利点だと思います。

ニッチなオーディエンスのターゲティング

なるほど。歴史的に見て、たとえば子供向け市場の調査をしようとしても、その市場にアクセスするのは非常に困難でした。それは規制の問題ですか、それともスケジュールの問題ですか。

親の同意が必要だということです。子供たちは本当に忙しく、学校に行き、課外活動があります。どうやって彼らとの時間を見つけるのか。そして適切なタイプの子供を見つける必要があります。私たちが気づいたことの一つは、オーディエンスが極めて重要だということです。実際、そこに私たちのエンジニアリングリソースの80%を費やしています。すべての企業はべき乗則と顧客セグメンテーションによって動かされています。Sweet Greenのような誰向けでもありそうな製品でさえ、適切なオーディエンスは通常、都市部に住む世帯収入の高い主に女性です。ちなみに彼らはシードオイルとは何かを知っている必要がありますが、それは人口のわずか1%しか知りません。そして中には毎日Sweet Greenに通う人がいて、それが彼らの収益の80%を占めていることがわかります。もしそのセグメントを見つけることができれば、リサーチははるかに実用的なものになります。

そこにはおそらくネットワーク効果もあるのでしょう。ある程度の規模に達して人々がそれを使用するようになると、他ではアクセスするのが非常に困難な同じタイプの人にアクセスできるようになります。あるいは、導入しようとしている製品のタイプにとって非常に価値のある、非常に特定の人物にアクセスするという意味での規模の経済かもしれません。

はい。私たちの目標は10億人のオーディエンスを獲得し、その人が何についてのエキスパートなのかを正確に分類して把握することです。スニーカーのようなものであっても、インフルエンサーやアーリーアダプターのような人々がいます。そうしたオーディエンスを見つけて最初にインタビューできれば、得られるインサイトははるかに価値のあるものになります。私たちは実施するすべてのインタビューを通じて学習できます。プラットフォーム内でより多くのインタビューを行うにつれて人々のプロフィールを構築し、そこから適切な人物を検索して見つけることができるのです。

つまり、ある人が全く関係のないインタビューの中で、自分は無類のスニーカーマニアだと言った場合、その人に関するデータベースにそれを保持しておき、Nikeなどの企業が新しい製品ラインを立ち上げる際に、その人を提案できるということですね。

その通りです。

それは素晴らしいですね。以前は別々の組織で行われており、メーリングリストを持ってスパムメールを送るような非常に手作業のプロセスだったため、そのようなことは不可能でした。私もこういうメールを受け取る側に立ったことがあります。本当にひどいものです。

そしてその問題の一つは、広範なスクリーニングプロセスが必要になることです。出現率と呼ばれるものがあり、それは10%になることもあります。つまりインタビューを受ける資格を得られるのは10人に1人だけであり、それがこれらのデータベースで大きな離脱を引き起こします。

初めて報酬を得るまでに10回もスクリーニングで弾かれるのは本当に面倒ですからね。

なぜブランドはアクセスするためにあなたたちを必要とするのでしょうか。Sweet Greenを例にとると、Sweet Greenはその80%が誰かを知っているはずです。直接アプローチできないのでしょうか。すでに直接的な関係を持っているのではないですか。

ええ、彼らにもできますし、私たちもそれを行っています。彼らのCRMに接続して送信することができます。しかし本当に興味深いのは、現在のべき乗則に従うヘビーユーザーではないかもしれない潜在的な顧客とどう対話するか、そしてその2つをどう比較するかということです。また私たちが気づいたのは、CRMは通常非常に整理されておらず、時には規制上の問題もあるということです。Googleにいる場合、Gmailを使用している人に単にメールを送ることはできませんし、外部のサードパーティを使用する方がはるかに簡単になります。スパムのリスクもありますしね。

完全にブロックされてしまう可能性がありますからね。長年にわたり私たちの会社のいくつかでそれを見てきました。アウトバウンドを行っていると、やがてGoogleのフィルターにかかり、気がつけばMicrosoftの迷惑メールフォルダーに入ってしまうのです。あなたたちを通せば、そうした問題に対処しなくて済むということですね。

ええ、その通りです。素晴らしいですね。

コンサルティング業界への影響と今後の役割

これは、100枚のスライドデッキを作成し、何らかの目的のために3000人にリーチしようとしている世の中のマッキンゼーやそうした人々にとって何を意味するのでしょうか。ソニア、あなたも昔やっていませんでしたか。前職でのことですよね。

いいえ、コンスタンティン。でも私がそういう印象を与えているなら光栄です。銀行がやっていることではないでしょうか。私たちはコンサルタントを雇っていました。私がそういう人たちを雇っていた側です。

なるほど。私はそのレイヤーの上のレイヤーの上のレイヤーだったというわけですね。わかりました。

私はさらに余分な存在でした。しかし、そうしたすべての人々にとってこれは何を意味するのでしょうか。この新しい未来において、彼らにはまだ果たすべき役割があるのでしょうか。

はい、AIはすべての役割を非常に急速に変えていると思いますし、私たちはBainなどとも多く協力しています。彼らは従来のプロセスをスピードアップするために私たちを利用しており、私は彼らにはまだ果たすべき役割があると考えています。従来のサービスや、これらの変更を実際に実装する能力は依然として極めて価値がありますが、多くのマージンは低下していくでしょう。これまで伝統的なコンサルティングファームに頼っていた問題の一部をAIエージェントが解決できるよう、サービスをアンバンドルしていく必要があると思います。

私は楽天家かもしれませんが、もっと増えることにはならないのでしょうか。私が事業を運営しているとして、AIとこれらのツールを手に入れたので、拡張すべき5つの新しい領域を見つけたいと考え、Bainなどの企業に同じ金額を払うとします。彼らはListenを利用してその新しい領域を探索し、どこで何を構築すべきかを教えてくれるわけです。これは楽観的すぎますか。

いえ、これは天井が非常に高い領域の一つだと思います。顧客についてより多くを学び、より多くのものを構築することができます。ですからあなたの考えは正しいと思います。

胸毛シャツのことが頭から離れませんでした。

20分経ってもまだ胸毛のことを考えているんですね、コンスタンティン。

私が消費者として利用している企業に伝えたい小さなことは山ほどあります。靴の紐の通し方のような本当に些細なことであっても、フィードバックを提供したいです。

だからあなたはベンチャーキャピタリストなんですね。細部へのこだわりです。

最終的に人々が望む通りに機能する世界に住みたいと願っています。そうなれば素晴らしいですね。ぜひお願いします。

業界にすでに価格圧縮の影響が出ているのを感じますか。私がBainの顧客なら、AIのおかげで以前よりずっと効率的にこの調査ができるようになったと考えるはずです。その経済的な余剰の恩恵を受けているのは誰なのでしょうか。より早くできるようになったのだから、より高い料金を請求できるはずだとも主張できると思います。実際にはどうなっているのでしょうか。

私たちはいくつかの調査を実施し、8カ国の20人の医師と話をするために数十万ドルを請求することができました。長期的には個別のインタビューはより手頃な価格になるかもしれませんが、2桁多い規模のリサーチを行うことになると思います。そして本当にエキサイティングなのは、私たちが現在構築しているシミュレーションです。これにより、実際の人々と話す時間が決して取れないような99%のユースケースをアンロックできるようになります。

それは素晴らしいですね。顧客の意見にすら耳を傾けていない分野が非常に多いからです。医療のように、医療システムには無数の小さな問題があります。私はいつもその話を耳にします。医師は忙しく重要な人々ですが、企業はそうした小さな苛立ちがどこにあるのかを把握するために時間を投資していないように感じます。医師は本当に忙しいので、わざわざ予定を合わせてグループで長時間話し合うようなことはしません。しかし、携帯電話のアプリのような通常のホーム画面のアプリの一部として、いつでも好きな時に電子カルテや手術室での出来事などについてフィードバックを提供できるとしたら、それは長期的にはListenの命を救うユースケースのように思えます。

ええ。私が同じく非常に興奮しているのは、そうした小さな問題をすべて集め、それを解決するために別のエージェントに指示を出すことです。お客様の中には私たちをこの方向に導いている方々もおり、解約に関するインタビューを行い、バグを見つけたらそれを別のコーディングエージェントに接続して問題を解決させるというような使い方をしています。

市場調査3.0:AIシミュレーションの可能性

それはすごいですね。ジェネレーティブエージェントのシミュレーションについてお話ししましょう。業界全体が市場調査1.0、つまり100人に一人ずつ電話をかけて手作業でまとめる方法から、市場調査2.0へと移行しているように見えます。AIネイティブ、あるいはAIが質問の流れを設計し、数千人と同時に対話し、回答を統合できる世界です。そして今、私たちはジェネレーティブエージェントのシミュレーションという市場調査3.0に向かっているのかもしれません。これについてどう思われますか。私はその夢を理解しています。自動運転車などで合成データがどのような変化をもたらしたかを見てきました。しかし同時に、本質的に懐疑的でもあります。大量の合成データは事前学習セットにすでにあるものをリミックスしているだけで、本当に有用なことやアルファを学べるのでしょうか。これに対するあなたの見解と、3.0にどう取り組んでいるのか、またそもそもそれが何なのかをお聞きしたいです。

はい。私たちがシミュレーションを構築する方法は、一人の人間にインタビューすることです。もしコンスタンティンに1時間インタビューすれば、おそらくある程度あなたの好みを予測し始められるでしょう。胸毛についての魅力的な洞察も得られます。そしてLLMもこれを非常に得意としていることがわかりました。一人の個人に関する情報をできる限り多く入力しようと試みると、場合によっては彼らが特定の質問にどう答えるかを95%の精度で予測できます。問題は、物事は常に変化しており、カオス理論が教えるように未来を予測するのは本当に難しいということです。そうでなければ私たちはウォール街で大金を稼いでいるはずです。私たちの考え方は、これらのオーディエンスに潤いを与える必要があるというもので、Listenを通じて実行されるすべてのインタビューによってそれを行っています。私たちには非常に強力なネットワーク効果があります。これまでに100万件のインタビューを実施しており、その数字を報告して以来、指数関数的に成長しています。

驚きです。

そして、私たちはそれらのインタビューに基づいてオーディエンスを訓練することができます。Listenに質問を投げかける未来を想像してみてください。ソフトウェアエンジニアはクラウドコードについてどう考えているか、と聞くと、Listenは、今週すでに1000人のソフトウェアエンジニアと話をしたので、彼らがその質問にどう答えるか予測させてください、と答えるのです。しかし難しいのは、何が答えられて何が答えられないかを知ることです。

それはどうやって行うのですか。

モデルに対して、彼らが持つ知識のドメインは何かを非常に明確に示し、そのドメインをどれだけ拡張できるかを見るようにしています。それが基本的なアイデアであり、学習データセットに含まれる内容と照らし合わせてシミュレーションがどれほどうまく機能したかをバックテストできます。質問の1つを削除して、それをどれだけ正確に予測できたかを確認するのです。また、彼らの犬の名前は何かといった無意味な情報を追加して、それを予測できないことをモデルが理解できているかを確認することもできます。

それは本当に素晴らしいですね。うまく予測できることと予測できないことには、どのようなものがありますか。

最も役立つものの一つがメッセージのテストです。ビルボードのキャッチコピーはどうすべきかといったものです。実はこの週末もそれを使っていました。私は顧客ベースのパネルを作成し、カンファレンスでのスピーチのタイトルを考えなければなりませんでした。小さなことですが、人々が来てくれればコンバージョンが上がるため実際には重要です。私はスピーチのタイトルを100個考え、それを私たちのシミュレーションに入力しました。すると驚いたことに、トップのタイトルは2番目のものよりも2倍も良かったのです。

すごいですね。

それが正しいかどうかはわかりませんが、確かに正しいと感じましたし、決定を下す際のガイダンスとして非常に役立ちました。また、たとえ間違っていたとしても、意思決定の助けになるのは良いことですし、意思決定をアウトソースできるのは素晴らしいことです。

ChatGPTに同じことを尋ねた場合と比較してどうですか。

はい、同じ質問をChatGPTに入力してみました。実を言うと、以前あまり成功しなかった別のスピーチがあり、競合の、あるいはもっと成功した別のスピーチを入力して、両方をChatGPTと私たちのシミュレーションに見せました。するとChatGPTは間違った方を選び、私たちのシミュレーションは正しい方を選びました。私たちにとってはまだ初期段階であり、数ヶ月後にリリースする予定ですが、一般的なモデルよりも優れたパフォーマンスを示しているようです。一般的なモデルは平均的な人を対象に訓練されていますからね。

はい。

そしてあなたは非常に特定のニッチに向けて構築したいと考えているわけで、そうすることで本質的にそのニッチに従うようにモデルを訓練できるのです。

とても興味深いのでさらに深く聞きたいのですが、モデルを特定のニッチやパーソナリティに強制することはできないのでしょうか。たとえば、ChatGPT、あなたはターミナルを使うのが好きな35歳の気難しいソフトウェアエンジニアです、と指示すれば、そのニッチの好みを引き継ぐというのが少なくとも私のメンタルモデルです。ですから、ChatGPTが正しい答えにたどり着けず、実際のユーザーデータからのブートストラップが成功したことに実は驚いています。最終的にはすべて実際のユーザーデータの反映ですよね。事前学習データだけのシミュレーションでは不十分な理由、その直感的な背景は何でしょうか。

ええ、私たちも様々な入力を試しました。確かにそれは普通のChatGPTよりも少しは良いパフォーマンスを示します。しかしはるかに良い結果を出したのは、クレジットカードの支出や行動データ、購買行動などを試した結果、最も優れたデータセットはインタビューであることがわかったのです。なぜなら、インタビューは話を逸らすことを許容し、行動に関する質問ができるからです。また、どんなインタビューでも良いわけではなく、質問の設計方法も非常に重要です。モデルは特定のペルソナがどう行動し、どう考えるかに関するクリーンなデータを持っていないというのが直感的な理由だと思います。

経験則ですが完全に理にかなっています。誰かを理解したいと思ったら、たくさんの質問をする以上の方法はありません。それが私たちがここにいる理由です。この種のフォーマットの目的でもあります。平均ではなく特定のグループに従う十分な数の人々がいれば、彼らが明示的に言わなかった他の多くのことについて教えてくれます。AIのすべては、何らかの圧縮データの一般化です。ですから、もしこのハイパースペースの少し異なる部分にこの圧縮があり、あるカテゴリーの人が考えていることの軌道を完成させてくださいと言えば、十分なインタビューを持っているListenならそれを埋めることができるわけです。

ええ。

Vertical AI企業としての拡張と優位性

そのパッケージを製品として提供する予定はありますか。私たちが顧客を理解したいと思った場合、私たちにとっての顧客である創業者は非常に異なる人々です。極めて多様な人々です。私が顧客を理解したいと考えた場合、通常のアクティブなListen Labsのインタビューを累積で1000回から10,000回行い、その後でアドホックな質問に対して瞬時に使える特別な目的のListenボットを提供してもらうことはできるのでしょうか。

はい、まさにそれを用意しています。

なるほど。

私たちはそれを拡張レスポンスと呼んでいます。これの素晴らしいところは、コーディングエージェントや他のエージェントの中に組み込むこともできるという点です。将来的には、エージェントがユーザーの好みを呼び出し、何を構築すべきか、どう行うべきか、誰に投資すべきか、どのように最善の支援を行うかを把握できる、一種のヒューマンAPIのようなものを持ちたいと思うようになるはずです。

現在、それはすべてRAGなのでしょうか、それともファインチューニングですか。何か別のものですか。これらの会話を、Listen Labsの他の部分で行っているモデルとどのように組み合わせているのでしょうか。

はい、事後学習や典型的なRAGも行っています。さまざまな異なる技術があり、その一部は独自のものですが、ええ、その通りです。

わかりました。顧客インタビューを実施し、すべてのエンジニアがそれを報告することになりますね。マルチエージェントシステムの役割についてどうお考えか興味があります。推論時に反復してより良い回答に到達するのを助ける役割などです。それはシミュレーションのやり方の一部ですか、それとも違いますか。

シミュレーションのやり方は、基本的には一人の人間を非常に精密にモデル化し、それを1000人規模にスケールアップするというものです。代表的なサンプルを持つことになり、本質的にはマルチエージェントですが、その1000人に互いに議論させることはありません。

それが私の聞きたかったことです。

ああ、なるほど。いいえ、それはまだやっていません。

しかし、それが潜在的に役立つかもしれないと思いますか。そのアプローチをより積極的に行っている競合他社もいます。

懸念しているのは、やはりカオス理論が示すように、物事が複合的になると、それらがどう相互作用するかを予測するのが本当に難しくなるということです。もちろんさらに探求すべきことではありますが、私はそのアプローチには少し懐疑的です。例えるなら、同じクエリを3つの異なるLLMに送信し、1つのLLMを裁判官として機能させて統合するというAI評議会のようなアプローチです。平均的にはわずかに良い回答が得られるとは思います。

はい。

素晴らしいですね。では、ここから先はどこへ向かうとお考えですか。市場調査2.0から、現在は生成シミュレーションによる市場調査3.0へと進んでいます。時間が経つにつれて3.0がクエリの大部分を占めるようになると予想していますか。そして、その先には何があるのでしょうか。

ええ、依然として人間の入力は必要だと思いますが、顧客の入力から得られるユースケースはこれからさらに多く開拓されると思います。スーパーボウルの広告などの大規模な決定には依然として実際のインタビューを実施する必要がありますが、ビルボードのキャッチコピーをどうするかといった小さなこと、小さなビルボードであればシミュレーションを使って答えることができます。そして、コア製品にも改善すべき多くのアルファがまだ存在していると考えています。私たちが始めたときの中心的なアイデアは、インタビューを受ける煩わしさを軽減することでした。繰り返しの質問はないか、AIは指示に従えているかを確認する評価プロセスがあり、GPT-4を使っていた頃は同じ質問を100回繰り返すこともありました。当初その評価は20%程度でしたが、現在では85%にまで引き上げることができました。しかし今、私たちははるかに高度な新しい評価基準を作成しました。画面録画中に画面上で何をしているかを理解できるか、不要になった質問をスキップできるかというものです。現在は再び20%くらいに戻っていますが、これはVertical AI企業が持つ価値の一つだと思います。独自の評価基準を持ち、本質的にその評価を引き上げていくことができるからです。

それがVertical AI企業としてのあなたの強みなのですね。より良いデータを推し進め、より困難な問題に取り組み、より良いデータを得て、それを繰り返すわけですね。

非常に興味深い無限ループの真っ只中にいるように見えます。本質的に企業とは、何を作るべきかを見出し、それを作り、何を作るべきかを見出し、それを作り、コードを書き、ユーザーと話すことですからね。

その通りです。そして作るという部分は急速に、そして指数関数的に進化していますが、何を作るべきかを見出すという部分こそが、あなたが推進していることなのですね。

はい。

製品やエンジニアリングの枠を超えて、より広範なループは実際のところ戦略と実行です。戦略と実行において、AIが私たちに可能にしていることの多くは、実行をより速く、安く、良くすることです。そして企業としてあなたたちが本質的に位置づけようとしているのは戦略の部分です。何を構築すべきかから何を言うべきかまで。これは適切な要約でしょうか。

ええ。将来、1人で10億ドル規模の企業が誕生する時、私たちはそのループの一部になっていると思います。コーディングエージェントとListenがあり、そのループを回すことで自律的な組織が生まれるでしょう。大企業であっても、物事をより速く実装できるという考えに戻りますが、ソフトウェア業界では顧客と話し、バグを見つけ、PRを作成し、コーディングエージェントに修正させてデプロイし、顧客を喜ばせることができれば、それは方程式の左辺として非常に重要です。実際の人間からバグを見つけるということです。消費財やアパレルなどの物理的なモノを扱う大企業でも同じだと思います。そうした企業では一度作ってしまえば後戻りできないため、それがさらに重要になるはずです。

ええ、その通りです。Procter & Gambleが新しい市場に参入する際、数千万ドルあるいはそれ以上の費用がかかる可能性があります。ローンチ時にそれが正しいことを確認しなければなりません。それが彼らがListenの顧客である理由の一つです。

歴史的にこれらをうまく行ってきたのは誰でしょうか。消費者向けあるいはソフトウェアの分野で、顧客の意見を聞くという点で優れた仕事をしてきたと歴史的に評価されている企業はどこですか。

最高の市場調査組織の典型はProcter & Gambleだと思います。彼らは本質的にマーケティング企業であり、人々が本当に気にかけているニッチを見つけ出し、その問題を解決するための特定のブランドを構築しようとしています。一つの例がTideの洗濯用ポッドです。彼らは液体洗剤を使うのが非常に不便であることを突き止め、人々がもっと使いやすいものを求めていることを発見しました。顧客インタビューを通じてこのインサイトを見つけ、新しいTideポッドを作り、大成功を収めました。もう一つの例は、AcquiredのポッドキャストでMarsについて話していたときのことです。彼らは1950年代に最初の市場調査の一つを実施しました。M&M'sは元々軍隊で使われるためにデザインされたものでした。甘いお菓子でありながらポケットの中で溶けないからです。彼らは市場調査を通じて、幼い子供たちも素晴らしいターゲット層であることを発見しました。そこから広告戦略全体をピボットし、溶けなくて家具を汚さないといった点に焦点を当てることに決めたのです。

私たちがこのListen Labsの未来のビジョンに向かって進む中で、必ずうまくいくと確信していることと、まだ確信が持てないことは何ですか。

将来においても人間の入力は必要であると確信しています。たとえAGIのような完璧に合理的な存在がいたとしても、人間は依然として不合理であり、本質的にカオスであり続けるでしょう。突然TikTokの新しいトレンドに夢中になり、マーケティング戦略全体をそれに合わせて変更しなければならなくなります。ですから、それは私たちが物事を行う上で非常に大きな部分を占め続けると思います。シミュレーションがどの程度のレベルで機能するかについてはまだ不確実ですが、特定の質問に対しては機能すると確信しています。モデルが人間の行動を予測する能力がどこまで高まるかを見ていくことになるでしょう。

AIが良くなればなるほど、その差分を持つことがさらに重要になると思います。企業が人々に奉仕するためのものであるなら、結局のところすべての企業は人間に奉仕するためのものですから。私たちの専属ヒューマニストであるコンスタンティン。

私は間違いなくヒューマニストです。しかし、私たちが働いているのは何らかの形で他の誰かを助けるためであり、企業が人々に奉仕するためのものであるなら、知能がどんどん向上し、人間が求めるものがここにあって知能がその漸近線に近づいていくとき、人間の心の中にあってAIの心にはないその漸近線の差分は、ますます重要になっていくはずです。

ええ。そして私たちが気づいたことの一つは、これらのVertical AI企業のモートは何かという議論が多くありますが、あなたたちのモートは何ですか。

ネットワーク効果と規模の経済がありますね。ええ、それらは素晴らしいものです。

なんだかAcquiredのエピソードに出ているような気がしてきました。

私も今、それを感じています。良い本ですね。お勧めします。

7 Powersですね。ええ、7 Powers大好きです。

モートに関して言えば、需要と供給のダイナミクスを持つパネルのネットワーク効果という明確なモートがあります。またデータにおけるネットワーク効果のモートもあり、インタビューを行えば行うほどシミュレーションが改善されます。そしてプラットフォーム内にすべてのインタビューがあり、時間をかけて追跡したいと思うため、失いたくないという点で製品の粘着性も非常に高いです。しかし製品の優位性という点で最もシンプルなことについて言えば、パートナーの一人であるブライアン・シェアが最初に言ったことの一つは、創業者は複雑なものを構築したがるが、顧客はとにかくシンプルで確実に機能するものを求めているということです。彼らは自分のワークフローを設定したくありません。座ってカスタムソフトウェアを構築したくありません。その一例がインタビューガイドの作成です。これは実は非常に難しく、学術的なテーマでもあります。価格設定やブランド認知度を理解したい場合にどの方法論を使うべきかを知っているため、サービスファームが存在する理由の一つでもあります。誘導尋問はしたくないですよね。

誘導尋問はしたくありませんし、それを正しく行うのは本当に難しいのです。当初、私たちは普通のLLMモデルを使用しており、顧客がインタビューを作成してデータを受け取ると、これは一体何なのか、このデータは使い物にならない、と非常に不満を持って戻ってきました。私たちはその責任を負いました。現在では、インタビューから常に良いデータが得られるよう、ベストプラクティスに従うように訓練しています。そしてこれこそが、Vertical AI企業としての優位性だと思います。本質的に、自分たちの仕事のベストプラクティスに従うようにこのエージェントを訓練できるからです。

プロダクトの未来とライブアイデア出し

先ほど言及されたTideポッドのコンセプトに戻りたいと思います。非常に興味深いですね。現在の市場調査の多くは、どちらかというと提供されたアイデアに対して人々に判断を下すよう求めるものだと理解しています。しかし生成AIを使うと、ハルシネーションはバグにもなりますが機能にもなり得るように思えます。ユーザーリサーチが実際にライブでの製品のアイデア出しへと進化していくと思いますか。顧客がインタビューの過程でAIが解決策を発明し、その解決策を視覚化するのを手伝うことさえ想像できます。お客様はすでにそれを行っているのでしょうか、それとも市場インタビューの中でAIがいつでもTideポッドのようなアイデアを生み出せるような瞬間がすぐに来ると思いますか。

ええ、それは本当にエキサイティングだと思います。今日では彼らは手動でそれを行っています。AIを使ってさまざまなコンセプトの画像を生成し、それをインタビューに組み込んでいます。しかし、特にシミュレーションにおいてはそれが非常に強力になると思います。私たちは現在MCPも持っているので、それをClaudeに入力し、Listenをループで実行して、何かをマーケティングする方法やさまざまなコンセプトのアイデアをたくさん考えて、とClaudeに指示を出し、そのように実行させることができます。

私が考えているのは、インタビューの途中で誰かが、Tideの液体洗剤は持ち運びしにくい、と不満を言っているときに、AIが、こんなふうに見えるかもしれません、と画像生成器を使ってライブで解決策をブレインストーミングしてくれるようなことです。

ええ、それは素晴らしいですね、ソニア。

はい、良いアイデアだと思います。あなたは私たちのプロダクトチームに入るべきです。

素晴らしい。アルフレッド、あなたが構築しているものは本当に素晴らしいと思います。本日は、非常に魅力的である広範な市場について、そして今アプリケーションレイヤーで構築することに必要なことについて、インサイトを共有していただきありがとうございました。あなたが築き上げたビジネスを本当に称賛しています。そして継続的なパートナーシップに感謝します。

本当にありがとうございました。

コメント

タイトルとURLをコピーしました