なぜAIが豊かさを創出し顧客体験を変革するのか:Cresta CEO Ping Wu

未来予測
この記事は約37分で読めます。

本動画では、CrestaのCEOであるPing Wuと、Sequoiaの投資家Doug Leoneが、コンタクトセンター業界におけるAI革命について語る。コンタクトセンターは巨大なレガシー産業であり、企業と顧客の会話の大半を担っているが、従来技術では顧客満足度、エージェントの労働環境、そして企業の効率性のいずれにも課題を抱えてきた。Pingは、Googleでコンタクトセンター事業を構築した経験を持ち、現在はCrestaでプロダクトリーダーからCEOへと昇格した人物である。本動画では、コンタクトセンターに訪れた技術革新の波、LLMによる顧客体験の未来、そして人間エージェント支援と自律型デジタルエージェントを融合させる戦略について議論が展開される。Doug Leoneは数十年にわたる投資経験から、AIバブルの有無、AI領域における価値創出の場所、そして「ラストワンマイル」におけるアプリケーション層の重要性について独自の見解を示している。

Why AI Will Create Abundance and Transform Customer Experience: Cresta CEO Ping Wu
Ping Wu built Google's contact center business before becoming CEO of Cresta, where he's pioneering a unique approach to...

コンタクトセンターにおけるAI革命の始まり

今日、企業について考えると、顧客に対して多重人格のように感じられるんです。営業段階では非常に積極的にアプローチしてきますが、契約して顧客になった途端、全く異なる人格を相手にすることになります。サービス部門と接することになり、これらが本当にバラバラに感じられるんですね。そして私は、AIエージェントがこの体験全体を、カスタマージャーニー全体を通じた継続的で進行中の会話にできると感じています。LLMはそれを実現するための完璧なツールであり、それが以前は不可能だったレベルのパーソナライゼーション、顧客体験のレベルをもたらすことになるでしょう。

こんにちは、Training Dataへようこそ。今日はCrestaのCEOであるPing Wuと、Crestaの取締役を務めるSequoiaのDoug Leoneをお迎えしています。今回のエピソードは、コンタクトセンターという複雑な世界に深く踏み込みます。これは動きの遅い既存企業で満ちた巨大なレガシー産業であり、企業と顧客の会話の大半を推進する責任を負っています。

Pingはこの世界を深く理解しており、まずGoogleでコンタクトセンター事業を構築し、その後Crestaのプロダクトリーダーを経てCEOとなりました。Pingには、コールセンターに訪れたさまざまな技術の波、LLMによって顧客体験の未来がどう進化していくか、そして豊かさの未来に向かってどう見ているか、そしてなぜ彼の戦略が顧客のいる場所で出会い、人間エージェント支援と自律型デジタルエージェントを融合させることなのかについて話していただきます。

Doug Leoneも、数十年にわたる投資と企業構築の経験から見解を共有してくれます。そして彼の率直な意見として、私たちはAIバブルの中にいるのかどうか、そして彼がAIにおいてどこに価値が生まれると信じているかについても語ってくれます。ヒントを言えば、それはアプリケーション層、この複雑なラストワンマイルにあります。それでは番組をお楽しみください。

コンタクトセンターの労働力とAI自動化の未来

Ping、番組へようこそ。そして特別ゲストであるあなたの取締役会のDougも連れてきてくれてありがとうございます。どういたしまして。ありがとうございます。

お二人とも参加してくださりありがとうございます。Ping、まず大きな質問から始めたいんですが、AIの論点の大きな部分として、AIが世界中の労働力を置き換え、TAM(獲得可能市場)が数十兆ドルになるというものがあります。明らかにコンタクトセンター、コールセンターは、自動化を切望している大きな労働力のプールです。

もしあなたが推測するとしたら、コールセンターの労働支出のうち、実際にAIによって完全に自動化されるのはどれくらいだと思いますか。そうですね。社内でこれについて多くの時間を費やして議論してきました。現実には、誰も確実には知らないと思いますし、何を売っているかによって本当に変わってきます。そして異なる人々に尋ねれば異なる答えが返ってきます。人によっては、コンタクトセンターでは100%人間がいなくなると言いますし、一部のガートナーの調査では実際に、今後5年間でFortune 500の企業で完全に人間のいないコンタクトセンターになる企業はゼロだと示しています。ですから答えはおそらく中間のどこかに落ち着くでしょう。

実際、2年前にGPT-4が最初に登場したとき、この質問をされました。多くの人が、おそらく2、3年でコンタクトセンターには人間がいなくなるだろうと言っていました。

当時の私たちの信念は、特に既存の、Fortune 500企業にとっての変革は、多くの人が思っているよりもおそらくずっと長くかかるだろうというものでした。Doug、どう思いますか。極限では何に賭けますか。

極限では100%です。でも、アメリカの銀行システムには今でもIBMのメインフレームとCOBOLが使われていることを忘れてはいけません。

ですから私にとっては、実際に何パーセントかはあまり重要ではありません。私にとっては、これがどのスピードで起こるかが重要なんです。10年、20年、25年、30年で起こるのか。なぜなら、答えが30%であろうと60%であろうと、それが50年で起こるなら、Crestaのような企業にとって一つの意味を持ちます。でも3年で起こるなら、それは別のことを意味します。

ですからN数は私にとって関連する指標ではなく、採用のスピードこそが重要なんです。素晴らしい区別ですね。Ping、あなたはコンタクトセンターのAI分野で10年以上働いてきました。CrestaでCEOになる前は、Googleで同等の機能を担当していました。ですから、聴衆の中でコンタクトセンター市場を知らない方々のために、それが何か、どれくらい大きいか、そしてこれまでテクノロジーがどのようにサービスしてきたかを少し教えていただけますか。

コンタクトセンター市場の規模と実態

はい。コンタクトセンターについて最初に話すとき、多くの人は自然とコールセンターを思い浮かべます。多くの人間がそこに座って、電話を聞いて、電話に答えているイメージですよね。コンタクトセンターは実際にはより広いカテゴリーで、メールやデジタルチャット、ウェブサイト上やアプリ内でのオムニチャネルのやり取りを含んでいます。もちろん通話も含まれます。全体的な市場は非常に大きく、歴史的には約1,700万から2,000万人のエージェント、つまり人間のエージェントが実際にコンタクトセンターで働いています。ソフトウェア市場はおそらく数百億ドル規模で、AI市場については調査によると、高い数百億ドルになるでしょう。

使用例は主に、顧客が電話をかけてきて苦情を言う、カスタマーサポートということですか。それがこれらのコンタクトセンターが主に使われているものですか。そうですね。顧客が電話をかけてくる理由はあらゆる種類があります。苦情や問題解決もありますが、多くの人が気づいていないかもしれませんが、コンタクトセンターの約4分の1、25%は実際に収益を生み出しています。それには物を売ることや、お金を回収すること、顧客を維持することなどの会話が含まれます。ですから、100%がカスタマーサポートというわけではないんです。

質問があるんですが、これまで一度もあなたに尋ねたことがないものです。コンタクトセンターを見てみると、私は年齢がバレるほど古い人間ですが、30年前に遡ると、Avayaやその他の、破産しかけている会社の名前を聞きました。15年前に遡ると、Genesysのような世界があります。何が明るく若いエンジニアや15年前のPing Wuをこの市場に惹きつけたのでしょうか。この市場は常に停滞した市場だったと言えたでしょう。常に低い関心しかありませんでした。常にこれらの低成長企業を生み出してきました。

何があなたの関心を引いたのですか。もちろん今では、これが多くの機会を持つ活気のある市場であることは理解しています。でも時計を10年前に戻すと、何があなたをこの市場に惹きつけたのですか。

まず第一に、15年前、私はこの市場に低成長の長い歴史があることさえ気づいていませんでした。もし気づいていたら、違った考え方をしていたかもしれません。そして第二に、当時は、会話型AI技術に多くの興奮があった時期があったのを覚えていますか。特に消費者向けのスピーカーについてです。当時、人々はそれがGoogleを破壊し、すべての消費者とのやり取りのエントリーポイントになると考えていました。そして私はたまたま、コンタクトセンターがおそらく会話型AIが変革をもたらす最もエキサイティングな機会になると本当に信じていました。それは、伝統的にVCが興奮するすべての問題を抱えているからです。巨大な市場で、多くの人間がそこで働いていて、企業と顧客の間にあります。すべてのやり取りがそこを通過します。そしてコンタクトセンターでは誰も幸せではないんです。

誰もというのは、3つの異なる関係者がいるという意味です。電話をかけてくる顧客がいますが、ほとんどの私たちはあまり幸せではないかもしれません。なぜなら待ち時間が非常に長いからです。そしてエージェントですが、ところで、多くの人が気づいていないかもしれませんが、エージェント、コンタクトセンターの労働力の離職率は大規模です。平均で35%から40%で、場合によっては、COVID中にいくつかの企業は100%以上の離職率を持っていました。つまり、一日中怒鳴られるだけなんです。非常にストレスが高く、あまり楽しい仕事ではありません。そして企業側も、より少ないリソースでより多くのことをする機会が常にあると感じています。誰も幸せではないようです。そして巨大な市場ですが、私は、これがAIとテクノロジーが豊かさをもたらす素晴らしい機会だと思います。そして豊かさこそが、私の意見では、これらすべての問題を解決する答えなんです。

コンタクトセンターにおける技術の進化

あなたは10年前にGoogleでこれに取り組んでいました。これは小規模言語モデルの波で、BERTの時代だったと想像します。当時、技術は準備ができていましたか。そしてコンタクトセンターに訪れたさまざまな技術の波を説明していただけますか。

そうですね、それは素晴らしい質問です。それよりもずっと前に、IVRと呼ばれる技術がありました。異なるルートのために1、2、3を押すというものです。それ以来、入力に関する革新がありました。押す代わりに、直接自然言語を話すことができるというものです。それは自然言語処理の進歩とTTS、音声合成の進歩によるもので、その体験はどんどん良くなっていきました。私たちがGoogleでコンタクトセンターAIを最初に始めたとき、実際にはBERTの前でした。トランスフォーマー以前でした。主にAIを使って、当時はAIを使って、分類、意図の分類、エンティティの抽出を行っていました。トランスフォーマー以前のモデルを使っていました。でも会話体験はまだ手作業で作られていました。それが前世代の技術です。

その後、もちろんトランスフォーマーが登場しましたが、最初はまだ分類目的でした。体験はまだ手作業で作られていました。しかしLLMが全体を完全に変えました。自動化側の会話体験だけでなく、以前は決してできなかった方法で会話を理解できるようになったんです。

それは実際にどういう意味ですか。コンタクトセンター内でのこの技術の展開という点では。つまり、IVRのときは顧客が非常に不満だったということですか。そしてトランスフォーマーをフローに持ち込み始めたときは、少し不満が減りました。そして今、顧客はLLMベースのエージェントと話すのが非常に幸せなのか、技術の進化が顧客体験をどのように変えたのでしょうか。

そうですね。私たちが考えたい方法は、本当に第一原理から考えることです。多くの会話は、私たちの見解では、そもそも起こるべきではないんです。それが起こるのは顧客が不満だからです。私はその解決策は、AIを使ってコンタクトセンターのすべてのやり取りに100%の可視性をもたらし、AIを使ってそれを分析し、深く調査して根本原因を見つけることだと思います。そしてそれは通常、何らかのプロセスが壊れていることを反映しています。あるいはウェブサイトの更新が人々をパニックに陥れたり、ファームウェアの更新がネットワークをダウンさせたり、そういった類のことです。ですからまずそれを修正する必要があります。必要でないなら相互作用を避けるということです。それを超えて、私は、AIが多くのやり取りを自動化できると感じています。誰も持ちたくないやり取り、つまり企業も顧客も持ちたくないやり取りです。それらは私たちが低感情価値のやり取りと呼ぶもので、セルフサービスされるべきです。そしてその上に、コンタクトセンターAIが、今日は余裕がない新しいやり取りを可能にすると思います。これらすべてが顧客体験を向上させています。

エンドカスタマーが人間のエージェントよりもAIエージェントと話すことを好むようになると思いますか。そしてその時点に到達しましたか。

それは本当に興味深い質問ですね。ここに来る途中でこれについて考えていました。電話でカスタマーサポートエージェントと話して、「本当にイライラする。あなたのAIを送ってください」と言った経験を持つ人に会ったことがありません。そういう経験は一度もありません。実際、いくつかの企業を調べて、カスタマーサービスを検索することをお勧めします。Googleで人々が最初に尋ねる質問、そしてGoogleが最も人気のある質問として表示するのは、常に「このタイプのカスタマーサービスで生身の人間と話すにはどうすればいいですか」です。ですから、その時はおそらくまだ完全には到達していないと思います。やり取りの種類によりますが。

私はもしかしたらテクノロジーに対して楽観的すぎるか、AGIに染まりすぎているのかもしれませんが、いくつかの録音を見た感じでは、AIは感情的に知的になれると感じています。無限の忍耐力を持っています。解決までの時間の指標を達成しようとしていません。ですから、例えば、誰かが電話をかけてきて本当にひどい一日を過ごしている場合、あなたのAIは人間のエージェントよりもずっと忍耐強く共感的になれるんです。ですから、私はこの点でボットの側に楽観的です。

忍耐や人間性の微妙さという人間的要素がありますが、エージェントのトレーニングとAIのトレーニングの問題もあります。3年後、質問に答えるためにずっと装備が整っているのは誰でしょうか。明らかにAIが答えです。私は金対ビットコインのようなアナロジーを考えています。

なぜかそのアナロジーが頭に浮かんだんです。ビットコインが勝つことは明らかです。ビットコインが金よりも価値が高くなることは明らかです。明らかに…投資アドバイスではありませんが。投資アドバイスではありませんが、エージェントが定義上、そして多くがアメリカにさえ居住していない。言語の要素があります。悪いことを言っているわけではありませんが、言語の要素、トレーニングの要素、人間の要素があり、私はこれらすべての次元において、AIが今後2、3年で勝つと思います。

デジタルゴールとしてのビットコインは、エージェント、デジタルエージェント対人間のエージェントという質問に対して本当に興味深いアナロジーですね。

Crestaの戦略:顧客のいる場所で出会う

私たちの観点からは、本当に今日の顧客がいる場所で出会いたいんです。自動運転車とは異なり、100%の時間で全体を自動化しなければなりません。そうしないと経済的影響がありません。コンタクトセンターでは非常にユニークだと分かりました。仕事が非常に分割可能なんです。

まず、会話は独立した単位であり、準備ができているX%の会話を自動化できます。さまざまな理由で詳細に入ることができますが。そして残りのものについては、AIを使って人間を支援し、認証や受付、リード資格審査のような最初の10%のやり取りを取り除くことができます。そして通話後の作業をすべて取り除き、会話の途中でAIエージェントに人間を助けてもらい、知識検索やデータ入力などを行ってもらうこともできます。ですからこれらは相互排他的ではありません。顧客が「今日コールセンターをオンにして完全AIにする必要がある」と言う準備ができていないと感じる限り、長い期間がかかると感じます。繰り返しますが、どのような種類のビジネスか、どのような種類のITインフラかによります。ですから、その旅程はおそらく異なる時間枠がかかるでしょうが、私たちの目標は本当に顧客のいる場所で出会うことです。

Crestaは興味深い立場にあります。既存のコンタクトセンターエージェントをより生産的にするエージェント支援プロダクトと、顧客に直接向き合う実際のAIエージェントプロダクト、つまり自律エージェントの両方を持っています。今日、ほとんどの顧客はどこにいると思いますか。彼らはフルフォースで行く準備ができていますか。エージェントをウェブサイトに置いて暴走させる準備ができていますか。

それとも実験中ですか。今日の顧客はどこにいますか。顧客によります。もしあなたと私が今日Shopifyで電動自転車店を始めたら、100%自動化できます。確信しています。本当に私たちの製品がどれくらい複雑かによるからです。電動自転車のようなシンプルな製品と、多くの異なる国に触れ、数百万、数千万の人々に触れる現実世界の製品とでは、桁違いに異なることがあります。ですから非常に異なります。そしてそれがコンタクトセンターで扱われる会話の複雑さに影響します。

もう一つはITインフラです。多くの人が実際に気づいていないかもしれませんが、コンタクトセンターに入る前は、「これは簡単に自動化できるはずだ」と感じるでしょうが、現実には、今日コンタクトセンターで人間が行っていることの多くは人間のために最適化されています。

ですから、それらのシステム、記録のシステムや行動のシステム、チケッティングシステムは何十年も存在しています。それらの多くには単純にAPIがないんです。変更を加える唯一の方法は、人間のために最適化されたグラフィカルユーザーインターフェースを通じてです。リアルタイムAPIなしでは、これらはAIの問題ではありません。そして私たちは、顧客と協力してこれらのリアルタイムAPIを開発する機会があると信じています。ですから、それらの変革はビジネスの性質によって異なる時間枠がかかると感じています。

今朝あなたのビジネスについて考えていて興味深かったのですが、もしTeslaについて考えると、彼らが完全自動運転に到達する美しさの一部は、L2の時でさえ車から入ってくる膨大なデータを持っていることです。あなた方にとって、コールセンター支援、エージェント支援であるため、声であろうとデジタルベースの会話であろうと、会話の完全なデータを実際に取得でき、それが顧客が時間とともにより多くの会話をエージェントに自動化するためのトレーニングベースになることができます。

はい、100%その通りです。実際、私が最初に始めたとき、7、8年前の旅は、本当に自動化のみでした。自動化であるべきだと本当に信じていました。先に進んで、あらゆる種類の実際の展開に遭遇し、それが実際に私自身の視野を広げました。

そして、最良の自動化を本当に行うためには、直感に反しますが、コンタクトセンターで実際に何が起こっているか、人間が実際に何をしているかを知る必要があると信じています。会話だけでなく、彼らがスクリーンで見ているものも非常に重要です。可能な限り最良の自動化を実際に構築するために。一つはセックスアピールです。それは売り込みです。誰もが話したがるものです。それを持っていなければ、あなたは疲れた古い会社です。もう一つは、私たちのビジネスが実行される現実であり、彼らが必要とするものです。ですから、これらの新時代の企業の一つであれば、データやコンタクトセンターを実際に運営するために必要なシステムを持っていないため、すぐに壁にぶつかるでしょう。

しかし、前者を持っていて後者を持っていなければ、オンライン企業とラベル付けされます。ですからこの場合、私たちはしばらく前にこれを理解し、投資することを確実にしました。エージェント支援のための運用システムを倍増させただけでなく、セックスアピール製品も開発しました。なぜなら、それが多くの顧客が初日に話したいものだからです。

そしてもう一つの側面は、先ほど私が述べたポイントに結びついています。それらの電話の多くは本当に起こるべきではないということです。人々が電話をかけてくるとき、彼らを幸せにする方法はありません。なぜなら彼らは最初から幸せではないからです。ですから、もしあなたの製品が機能し、プロセスが機能すれば、それらは本当に起こるべきではないんです。

ですから、もしこの部屋が本当に本当に寒いと感じるなら、答えはヒーターではないかもしれません。壊れた窓があるか、パティオのドアが大きく開いているのかもしれません。解決策は、照明をつけて根本原因を見て、ヒーターをつける前にまずそれを修正することです。素晴らしいですね。

LLM時代のコンタクトセンターAIにおける競争

カスタマーサポートは、人々が大規模言語モデルが最も変革的になると考える典型的な例の一つです。そして、ベンチャースタートアップにとって、ほぼコンセンサスのカテゴリーになっています。どのように競争していますか。誰もが同じLLMにアクセスでき、同じ大きな絵のビジョンに固執しているときに、競争するのはどんな感じですか。

はい。繰り返しになりますが、コンタクトセンターの変革において本当に価値を提供するためには、モデルだけではありません。モデルだけではないんです。モデルは重みとデータの束であり、それ自体では価値を提供しません。問題は、その上にその価値を提供するためにどれだけ構築する必要があるかです。そのレイヤーが非常に非常に薄ければ、おそらく価値を得る機会はあまりないと主張します。そしてそのレイヤーがモデルが良くなれば消えてしまうなら、持続可能なビジネスを持つ方法はありません。しかしそれはコンタクトセンターの場合ではないんです。

エージェンシーの大部分がまだオンプレミスであり、平均して、Fortune 500のエージェントは8から10の異なるシステムとやり取りしています。私たちがいくつかの調査を見ると、これらの企業は何年も何十年もかけて他の企業を買収しています。それらのバックエンドシステムは互いに通信すらしないかもしれません。フライトをどこで予約したか、ホテルをどこで予約したかによって、異なるシステムにログインする必要があるかもしれません。それが私たちが話している現実なんです。

ですから、私たちの戦略は顧客のいる場所で出会い、初日から価値を推進することだと信じています。ステーキから売り込みまでの垂直統合。それが勝つ方法です。

コンタクトセンターAI分野で今、過大評価されていることと過小評価されていることは何だと思いますか。

過大評価されているのは、希少性のマインドセットだと思います。雇用の置き換えは、短期的にはおそらく少し過大評価されています。そして過小評価されているのは豊かさのマインドセットです。

AIが可能にする新しい体験について考えてみてください。例えば、ウェブサイトと話すことができますか。アプリと直接話すことができますか。同期的なやり取りを非同期的なやり取りに変えることができますか。航空会社のアプリと話して、「これこれをやってほしい、終わったら電話してほしい」と言えますか。あるいは、超多言語のAIエージェントにそれらの会話をさせることができますか。今日は単純にスタッフがいないために起こることができない非常に多くのやり取りがあります。

そしてもう一つ、本当に過小評価されていると感じることは、人々は会話の一方側、つまり労働力に本当に取り憑かれているように見えることです。人々は「労働力の何パーセントがAIに置き換えられるか」と尋ねます。しかし、「何本のインバウンドコールがAIに置き換えられるか」という質問を誰もしません。私の信念は、今後数年間で、おそらく消費者アグリゲーターにAIアシスタントを搭載する競争を目にするだろうということです。そして消費者がおそらくAIアシスタントに委ねることの多くには、電話をかけることも含まれます。ですから、それは注目すべき興味深いことかもしれません。

それは本当にクールですね。ですからユナイテッド航空のアプリと話して、非同期で何かを解決してもらい、折り返し電話をもらうことができるということですね。それはあなたが取り組んでいることですか。

私たちは…ノーコメントです。

わかりました、非常にクールですね。さて、会社構築について少し話をしたいと思います。Doug、あなたは何度も経験されていますね。何度も映画を見てきました。

つまり私が年を取っているということですね。それがあなたが今言ったことです。いい感じに言おうとしていたんですが。

AI時代の企業構築:スピードと基本原則

今、企業を構築することは…Pingと一緒にこれをライブで見ていますね。AIで企業を構築することは、あなたの過去数十年の伝説的な企業構築とどう違いますか。

あまり違いません。つまり、素晴らしい創業者が必要だということです。Crestaの状況については後で少し話せればと思います。最初から世界クラスのエンジニアを組み込む必要があります。A+で始めない限り、決して上がることはありません。下がるだけです。新鮮なセールスパーソンを組み込む必要があります。管理者ではなく。

おそらく彼らは早期に地域セールスマネージャーだったかもしれません。なぜなら、一つには、世界クラスの人材を獲得できないからです。二つ目に、もし獲得できたとしても、彼らは会社にとって大きすぎるからです。あなたが資金提供する意思のあるランプを見極める必要があります。マーケティングの役割が何かを見極める必要があります。

私がマーチャンダイジングサイクルと呼ぶもの、オンラインで少し話題になっているものを解決する必要があります。それは、プロダクトマーケティングからBDR、収益までです。それが壊れているところはどこでも、悪いセールスガイ、悪いセールスのVPのように見えますが、それを正しく行う必要があります。ですから、ビジネスの基本は非常に似ていると思います。

今AIで最も良い成績を上げている企業の特徴の一つは、極端なスピードで動いていることだと思います。そしておそらくそれは常にそうだったのですが、今はさらに激しくなっていると思います。あなたが協力する企業やSequoiaでさえ、スピードの必要性をどのように浸透させることを考えていますか。

実は、その答えをその一部として考えていました。でも除外したんです。私が取締役を務めるすべての取締役会は極端なスピードで動いています。

それは、私が創業者に川のイメージを描くからです。岩のある川です。そして創業者と共同創業者の仕事はそれらの岩を取り除くことです。ですから、来年の計画を出すとき、150%の新規AR成長だということは気にしません。計画がなぜその計画なのかを知りたいんです。そしてなぜそれがその3倍ではないのかに挑戦したいんです。おそらく答えは資金調達です。まあ、この市場では資金調達できます。おそらく答えは経営経験です。

まあ、それはしばしば良い答えです。市場だと言う人もいます。まあ、ありえません。それは市場です。私たちは小さな会社です。ですから私の考えでは、これらの企業が自分たちがまだできると信じていないことができることを理解させることであり、それらの岩を取り除くことです。そして私は押して、押して、押して、なぜもっと速く進めないのか、線形の方法でやってくださいと言います。なぜなら、何かがうまくいかないことがあるからです。第1四半期に250人のセールスパーソンを雇い、第3四半期に何かがおかしいと気づいたら、製品に何かがおかしいと気づいたら、バーンに行き詰まってしまいます。

ですから私は信者です。そして「いいえ、全員を同じようにトレーニングする必要がある」というくだらないことは聞きません。線形の収益ランプをくださいと。そうすれば、上下に中間修正ができます。これらの数字に行き詰まらないようにしましょう。私たちは10本の指を持っています。100%成長。

それだけです。どれだけ速く成長できるか。それが常に私が務めてきたすべての取締役会でのマントラです。AIは違いません。

そしてDoug、あなたのスーパーパワーの一つは、人を見抜けること、人を読めることです。Pingの何を見て、彼をここのCEOに据えたのですか。

会社を少しズームバックさせて、それからPingを交えて答えましょう。

Pingのリーダーシップと創業者的資質

私は、そこで働くためにCEOになりたがった、能力のある男性であるパートナーから、Crestaの取締役会を引き継ぎました。彼は大きなビジネスを運営したかったんです。私たちはCarl Eschenbachが大好きです。彼も私たちが大好きです。私たちはまだ非常に良い友人です。彼は今でも私たちを助けてくれています。そして私は、すべて修正されたと言われました。私がCrestaに行ったとき、CEOがいませんでした。創業者は去っていました。

オフィス・オブ・ザ・CEOがありました。そして私が取締役を務めてきた企業の90%、いやそれ以上の割合で、会社を運営するのは創業者です。なぜなら、創業者を失うと、会社の魂を失うからです。そして私たちは、オフィス・オブ・CEOを持っていました。

その日私が知らなかったこと、3週間後に知ったことは、隠された宝石があったということです。創業者がいました。本当の創業者ではありませんが、創業者がいました。エンジニアリングを担当していたPingがいました。あなたが先ほど言ったように、Googleでコンタクトセンターシステムを構築し、創業者のように考え、容赦なく、Googleから何人もの人を採用していました。

ですから、私のキャリアで唯一の機会であり、旅の途中で創業者ではなかった創業者を組み込むことができました。ですから私の考えでは、Pingは会社の創業者のようなものです。ですから私たちは一歩も失いませんでした。そしてPingを困惑させるコストを払ってもいいですが、当時は物議を醸す決定でした。CEOになったことがない、これとあれと創業者。しかし私は、これらの小さな素晴らしい会社のCEOは、セールスパーソンではなく、マーケティング担当者ではなく、神様お許しください、CFO、人事担当のVPでもなく、プロダクト担当者でなければならないと信じています。

CFO、人事担当のVPの皆さん、すみません。ですから私たちは建物内にそれを持っていました。Pingを昇進させ、彼は一拍も逃しませんでした。あなたが私を正当化してくれたことを知っています。以前にそう言いました。私を良く見せてくれました。なぜなら、取締役会には少し直線的な思考がありました。ああ、いや、外部に行かなければならない。私は言いました。ありえない。内部で製品を構築した人がいます。創業者です。

ですから私たちは決断を下しました。やや危険な決断だったことは否定しません。しかし1、2回の取締役会の後、素晴らしい決断だったことが明らかでした。ですから、あなたがしてくれたすべてのこと、そして私を天才のように見せてくれたことに感謝します。

それはDougからの高い評価ですね。ありがとうございます。

Crestaは次に何をする必要がありますか。Crestaが偉大な会社、伝説的な会社になるために、今後5年以上にわたって何をする必要がありますか。

まず第一に、製品を開発し続けなければなりません。一歩ずつ前に進み続けなければなりません。誰かが自分の役割のピーター原理に達したときはいつでも、その時点から前進できる人を雇うことに比較的積極的でなければなりません。

スーツや管理者のように感じられる、いわゆる非常に経験豊富な人々から離れること。それが最も重要なことです。しかし、Crestaがしなければならないもう一つのことは、マーケティングのゲームをアップすることです。多くの会社があります。私は売り込みという言葉を使います。多くの売り込みがあり、ステーキがない会社がたくさんあります。私たちはたくさんのステーキを持っています。

私たちは現代的な会社です。あるカテゴリーでベストインクラスです。他のカテゴリーでもベストインクラスになるつもりです。エージェント支援とプロダクトの自動化部分の両方で、美しい成長率を持っています。

私は、市場で家庭の名前になるように、マーケティングのオーバーレイを付ける必要があると思うだけです。素晴らしいですね。ではポッドキャストに出ていただいて良かったです。

AI市場とバブルの議論

話を少し戻して、Doug、あなたは市場のサイクルを見てきました。私たちはAIバブルの中にいますか。

バブルという言葉は、お金を投資して損失を出すことを意味します。企業の供給不足または資本の豊富さのいずれかのために。確かに資本の豊富さがありますが、過去2サイクルを通じて気づいたことがあります。Netscapeが1995年に上場したインターネットサイクルで、90年代後半にGoogleとAmazonという2つの素晴らしい企業が構築されました。他にもいくつかの名前がありました。その後少し休止があり、「インターネットは詐欺だ。何もしない」という言葉さえ聞きました。そして3年後、世界は狂ったようになりました。

その待ち時間はモバイルではずっと短かったです。私たちが最初にこれらのアプリを見たとき、Jim Goetzと私、私たちの元パートナーが、「19ドルのアプリからどうやってお金を稼ぐのか。数十億ドルの会社をどうやって構築するのか」と言ったのを覚えています。AirbnbやDoorDashのことは決して考えていませんでした。

1、2年後、私たちはAirbnbとDoorDashを見ました。繰り返しますが、最初の誕生から実際の市場への縮小は、インターネットから縮まりました。これはさらに縮まったと思います。AIはここにあると思います。投資する必要があると思います。サイクルの前端にいると思います。すべてに投資する必要があるという意味ではありません。

しかし、Sequoiaで犯した間違いの一つは、収益のモメンタムを少し見ると、パートナー会議の周りに天才がいて、「ああ、止まる可能性がある。代替される可能性がある。非常に簡単にしておこう」と言います。市場の前端で小さな会社に収益のモメンタムが見えます。2021年のSaaS市場について話しているのではありません。ニッチな業種まで下りてきているところです。

市場の前端で、単一収益のモメンタムを見始めます。傾注して、価格については鼻をつまんでください。それが大好きです。

価値創出の場所:アプリケーション層

市場で価値がどこに蓄積するかについて考えると、コンピュート、他のインフラ、基盤モデル、アプリケーション層があります。価値はどこで発生すると思いますか。

上です。上です。常に上に蓄積します。市場を上に移動するときの粗利益を見てください。チップ企業の粗利益を見てください。システム企業の粗利益を見てください。粗利益を見てください…まあ、そしてNvidiaは、私たちが最初の投資家でした。素晴らしい会社です。

Jensenは何年も先の未来を見ることができ、彼がしたことはシリコンバレーで最も偉大な、おそらく最も偉大なクーデターの一つを成し遂げました。本当に壮観です。しかし時間をかけて見ると、価値はいわゆるアプリケーション層に蓄積すると思います。

それがどんなものに見えようとも、顧客の近く、お金の近く、ビジネスユーザーの近くに蓄積するでしょう。同意します。

AI波がインターネットやモバイルと違うと思う点は何ですか。私は他のすべてを私たちをより生産的にするツールだと考えていました。つまり、私たちは皆ネットワーク化され、モバイル化されました。私はAI波を産業革命2.0だと見ています。これははるかにはるかに大きいと思います。

5年前、最大の時価総額を見たばかりだと思っていたことを覚えています。なぜでしょうか。それは接続性がこの収益成長を生み出したからです。接続性とモビリティよりもはるかに大きなものがあるとは決して想像しませんでした。それは人類の完全なやり直し、人類がどのように存在し、働き、生き、楽しむかの完全なやり直しでした。そして私は、AIは今後10年、20年にわたって、私たちにとって素晴らしいものであり、もしかしたら死のキスでさえあると思います。

そうですね、Dougが言ったことに完全に同意します。そして私はAIが非常にユニークな点の一つは、非常に多くの驚きがあることだと思います。インターネットやモバイル時代には決して見たことのない基礎的な能力の驚きがあります。もし2015年の世界観を取って、それを2007年にSteve Jobsが最初にiPhoneを紹介したときの誰かにタイムマシンで渡したら、誰かがそれに共鳴できると思います。

そしてインターネットについても同じです。人々はこれから来るものをある程度予見できると思います。しかしAIについては、基礎モデルが良くなるにつれて、非常に多くの驚きがあると感じています。トランスフォーマー論文の著者でさえ、大規模言語モデルの後に来たいくつかの能力を想像しなかったであろうことがあります。それは私たちを驚かせ続けています。

ですから、多くの改善が非線形だと本当に思います。底のレイヤーでゼロから1への移行が継続的に起こっています。ですから、それがさらにエキサイティングにしているものだと思います。

何かを思い出させます。2022年3月、今では永遠のように聞こえますが、私の最後の年次総会で、すべての投資家と会うもので、パフォーマンスを発表するような別れの種類のものでした。

そして私は、チップの波からシステムの波、LAN/WANの波、インターネット、モバイルまでのすべての波について話すスライドを持っていました。そして短い3年半前の次のボックスは疑問符でした。

パートナーシップとして、何が来るか分かりませんでした。そして私たちは誰よりも先進的です。私たちはシードの最先端投資家です。波が来るのが見えませんでした。そしてこの波は津波でした。終わりが見えないと思います。

ありがとうございます。その洞察を共有してくださりありがとうございます。

Crestaの技術スタックと音声AI

Crestaの技術スタックについて話したいですか、それともPingを困らせましょうか。そうしたいです。実は数分後に行かなければなりません。なぜなら、いくつかのコーディングをし直している最中だからです。

バイブコーディングをしているんですか。はい。はい。すべてをバイブコーディングしています。Ping、技術スタックについて教えてください。

はい。ですから、私たちはかなり広範な製品を持っています。音声AIエージェントについて話すことができるかもしれません。私たちはエンドツーエンドでオーディオを双方向でストリーミングしています。複数の異なるモデルを統合しています。音声テキスト変換モデルがあり、オーディオを改善するためのノイズキャンセリングモデルがあります。用語や音声活動を検出するモデルがあり、中断を処理します。

そしてもちろん、会話を処理する基盤モデルがあります。そしてもう一方側には、TTS、テキスト生成モデルがあります。並行して、ガードレールチェックを行うために複数の小さなモデルも実行し、何も狂ったことが起こらないようにしています。そしてそれらのモデルは、企業固有のチェックも行います。例えば、税務アドバイスを決して出さない、財務的な約束を決して出さないなどです。それが音声AIエージェントのランタイムです。そして設計時もあります。大規模なシミュレーションを実行してAIエージェントをストレステストし、すべてのエッジケースをカバーするコンポーネントがあります。テストケース管理コンポーネントがあります。

そして同様に、音声AIアシスタントについて考えると、これもオーディオをストリーミングしていますが、繰り返しますが、インフラには多くの類似性がありますが、双方向ではありません。一方向で、2人の人間の通話を聞いて、通話で実際に何が起こっているかを理解し、10以上のモデルを統合しています。実際、Vertexに似ています。AutoMLのように、顧客が会話で興味深いイベントを検出するカスタムモデルを構築できるプラットフォームを持っています。

それをワークフローと結び付けます。人々はそれを使って、詐欺を検出するために、さらには詐欺コストを検出するために使います。エージェントに反論の処理方法をトレーニングするために。Operaと呼ぶツールで、今では表現してワークフローをトリガーできる非常に多くのユースケースがあります。その下には、リアルタイムで実行できる非常に小さなモデルに蒸留するためのティーチャー・スチューデント蒸留があり、人間の会話を理解します。

あなたのエージェントの一つと話すとき、レイテンシはどれくらいですか。800ミリ秒以下です。わあ。ですから人間と話しているような感じですね。はい。そうですね。ですから、これらすべてのモデルをほぼリアルタイムで実行しているんですね。はい。

オープンソースモデルを実行していますか、それとも11 labsと同等のものを実行していますか。プラットフォーム全体で20の異なるモデルがあります。いくつかはオープンソースでファインチューニングされています。

例えば、人間のエージェント向けのチャットやメールだけを行う小さなモデルがあり、文章をオートコンプリートしてタイプアヘッドします。それらは非常に非常に小さなモデルです。そしてTTSについては、はい、11 labsを使っています。彼らは素晴らしいパートナーです。他のベンダーも使っており、常にパフォーマンスを比較しています。

会話制御とエージェントのカスタマイズ

本当にクールですね。そして実際の会話の本質、対話や会話フローはどうですか。

昨日のIVRシステムのように硬直的すぎず、顧客が狂ったようになって航空券の返金を受け、ボットがおかしなことを言って顧客を困惑させるほど自由形式すぎない方法で、どのようにそれを制御しますか。

どのようにフローを制御し、両方の長所を得ますか。

そうですね、それは本当に人間をどうトレーニングするかと同じです。目標は何か、これらがツールであるという仕様を与えます。それが大規模言語モデルの美しさで、それらの乱雑な種類のワークフローを処理することです。ですから、ワークフローとは何か、エージェンティックとは何かについて多くの議論があります。

ワークフローは、ステップバイステップでコードに書き下ろせるものです。それがワークフローです。洗車、洗車は実際にワークフローです。ボバティー、ミルクティーを考えると、それらは物理的なワークフローですが、他のことはできません。人間の会話には非常に乱雑で、非線形です。ですから、それがエージェンティックなワークフローが登場する場所で、そこでLLMが本当に得意なことです。そしてそれらの上に、決定論が欲しいですよね。それが、テスト、シミュレーション、ガードレールを導入する方法です。システムのどの部分に変更があっても、動作が依然として期待通りであることを確認します。

顧客のモデルをチューニングしますか。なぜなら、エージェント支援製品も持っているので、これらすべての顧客の会話のフローに入っているからです。そのトレーニングデータにエージェントをチューニングしますか、それとも完全に新しいフォワードデプロイされたエンジニアが現場で会話をマッピングしていますか。

はい。ですから、人間の会話の中の実際のものから会話の青写真を抽出するためにマップできるツールがあります。ですから、その美しさは、多くの未知の未知を発見することだと思います。非常に多くのトピックがあり、人々が電話をかけてくる理由がたくさんあります。非常に大きな通話量を含んでいる可能性があり、知らないかもしれません。それを手に入れたら、今はもっと深く見ることができ、LLMを使ってこれらすべての分析を行い、人々が同じ意図を表現する57の異なる方法は何か、通話フローが進む異なる方法は何かを抽出できます。

そして私たちはそれを要約して抽出できます。ですから、これらはすべて製品を構築しています。そしてツールが良くなると、フォワードデプロイされたエンジニアはずっと効率的になります。そして人間側の会話を使う他の方法もあります。例えば、訪問者のモデルを抽出します。

それがシミュレーションを構築する方法であり、シミュレーションはAIエージェントを改善する巨大な部分です。そして私たちは、実際の顧客、人間がどのように入ってきて、異なる方法で説明するかを正確にアクセスできること、時には非常に乱雑ですが、モデルを抽出して、AIエージェントでより良いシミュレーションを行うことができると信じています。

そして、LLMを顧客環境に本当に特化させるためにどのような方法を使いますか。RAGですか、プロンプトエンジニアリングですか、ファインチューニングですか、これらすべてですか、強化学習ですか。どの技術に最も楽観的ですか。

そうですね、ほぼすべてを使っています。明確にプロンプティングを使い、そしてRAGを使います。それらのよりシンプルなエージェント向けです。しかし、人間の行動と結果を見て、RLを使ってこのエンドツーエンドのパフォーマンスをどう改善するかは、まだ探求中です。

しかしAIエージェント自体については、基盤モデル自体が既にかなりかなり良いと思います。それから最高のものを引き出す必要があるだけです。少なくともチャットのデジタルチャネルについてはそうです。しかし他のユースケースについては、モデルをファインチューニングする多くの機会があります。要約のようなタスク、文章のオートコンプリートのようなタスクなどについて、タスク用にモデルをファインチューニングすることで、オープンソースモデルから抽出する余地が多くあると感じています。

派手なデモと本番環境対応のAIシステムを構築するために何が必要ですか。

そうですね、それは本当に興味深い質問です。なぜならAIにユニークなことの一つは、デモと本番環境の間に巨大なギャップがあることだと思うからです。スペクトルの一端にはロケット打ち上げがあります。ロケット打ち上げはデモが本番環境であり、本番環境がデモです。偽ることはできません。しかしAIは少し違います。

そして例を挙げることができます。自動要約、自動要約は誰でもChatGPTを使って自動要約を作成できるコモディティ機能のように感じられますが、今日いくつかのコールセンターに展開するためには、複数の大陸にまたがる2万人がいるコールセンター、そして課題は巨大な課題のリストです。まず、どうやってリアルタイムのオーディオを取得しますか。デモではクラウド上のTwilioで非常に簡単にデモできますが、会話の50%がオンプレミスで起こることを覚えておいてください。そしてそれにアクセスする方法は多くのお金がかかる可能性があり、それをどう回避するか。そして実際の通話では、2万人のエージェントの通話には転送があります。多くの転送があります。そして第三者、医療専門家などの第三の通話者が入ってきて、それらを文字起こしして要約する必要があります。そして時々会話が非常に長く続くので、3時間、4時間の通話をどう処理しますか。接触ウィンドウを超えるものです。

そしてバックグラウンドノイズのようなこと、異なる通話理由に対して異なるテンプレートがあり得ること、本当に本当にこのタイプの情報を抽出したい、ほぼ100%の確率でそれを見逃せないことを確認する方法。ちなみに、どうやってPIIを処理しますか。そして個人の金融情報を静止状態で持つことはできません。ちなみに、複数の大陸にまたがる多国籍銀行や医療プロバイダーと話している場合、データレジデンシーをどう処理しますか。

ですから、これらすべてが追加の要件となり、自動要約のように非常にコモディティ化されていると感じられるものが、実際にコンタクトセンターで行うのは非常に非常にはるかに難しくなります。それが、これらの企業の一つにプロダクトマインドのある最高経営責任者が必要な理由です。

その通りです。そしてこれが、すべての苦痛とすべての価値がラストワンマイルにある理由でもあります。これが価値がアプリケーション層にある理由です。その通りです。そうですね、私はそれに同意する傾向があります。

未来のビジョン:AIが消える世界へ

未来について話してください。すべてがうまくいったら何が起こりますか。それはCrestaにとって何を意味し、世界にとって何を意味しますか。

私は、AIはそれ以前のあらゆる技術、電気のように、消えるだけだと思います。ワークフローの中に消えていくでしょう。そして私は、20年、30年後には、誰もAIと話しているのか、AIによって支援された人間なのかを実際に気づかないだろうと思います。

私が本当に興奮していることの一つは、今日、ビジネスについて考えると、顧客に対して多重人格のように感じられることです。営業フェーズやマーケティングフェーズでは、彼らは本当に本当にあなたと話したがります。非常に非常に積極的にあなたに求愛します。そして契約して顧客になると、全く異なる人格を相手にすることになります。そしてサービス部門と接することになり、彼らはティアディフェンス、デフレクションのような用語を使う傾向があります。ほんの数日前に求愛していたまさにその人を指すのに。そして顧客サポートラインで長い会話をして多くのフィードバックを共有しても、2週間後に別の部門が来て「あなたのフィードバックは何ですか。このアンケートに記入してもらえますか」と言います。私たちのビジネスには、これらが本当にバラバラに感じられます。

そして私は、AIエージェントがこの体験全体を、カスタマージャーニー全体を通じた継続的で進行中の会話にできると感じています。LLMはそれを実現するための完璧なツールであり、それが以前は不可能だったレベルのパーソナライゼーション、顧客体験のレベルを本当にもたらすでしょう。

そうですね、あなたが先ほど言った、希少性対豊かさのマインドセットについてのポイントが本当に印象に残りました。そしてビジネスと顧客のコミュニケーションがどれだけ本当に進化できるか、アプリ体験がどれだけ本当に進化できるか、豊かさのマインドセットをこの分野に持ち込むなら。

Pingありがとうございました。Dougも今日参加してくださりありがとうございました。

この会話が大好きでした。ありがとうございました。お招きいただきありがとうございました。

コメント

タイトルとURLをコピーしました