AIの次の飛躍:超リアルなエージェントと無限のパワー

AGIに仕事を奪われたい
この記事は約35分で読めます。

20,467 文字

AI’s Next Leap: Hyper-Realistic Agents & Unlimited Power | E2094
Today’s show: AI is evolving at lightning speed—smarter assistants, faster models, and now, the massive energy demands t...

ZAPエネルギー

皆さん、TWISTに戻ってきました。これはアレックスです。AIは絶対的に至る所にあります。私たちはこれまで新しいモデル、より速い推論、最高の推論エンジンについて話してきましたが、リストはまだ続きます。しかしAIはコア技術だけではありません。AIについて考えるとき、私たちは将来どのようにパワーを供給するか、そしてAIがビジネスをどのように変えるかを考えなければなりません。

今日は素晴らしいTWIST 500企業からの2つのインタビューがあります。最初はZAPエネルギーで、CEOのベンジ・コンウェイと私はなぜ彼らがZピンチ技術を追求しているのか、そのアプローチが商業化までどのように達成されるのかについて話します。私は核融合技術にとても興奮しています。AIの文脈だけでなく、こういった対話が「私たちはこれを解決する」と自信を持って言えるようにしてくれるのです。

次にポーリーAIとそのCEOニコラ・ムティチについて話します。AIを搭載した音声アシスタントがカスタマーサービスの世界をどのように変えているかを分析します。AIが実際に現実世界とどのように相互作用し、仕事や働き方にどのように影響するかを知りたいなら、それがその対話です。

まずはZAPエネルギーのインタビューから始めましょう。ここにベンジ・コンウェイとの対話があります。核融合と、なぜそれが思うよりも早く来るのかについてです。

ZAPエネルギーインタビュー

過去数ヶ月間TWISTを聞いていれば、おそらく望んでいたよりもはるかに多くのAIについて聞いてきたでしょう。その会話での一つのテーマは膨大な電力需要です。AIコンピューターはとても多くの電力を必要とするため、人々は巨大な太陽光アレイ、原子炉の再稼働など、多くの楽しいアプローチについて話しています。しかし私個人的に最も興奮しているのは、商業核融合会社によって成されている進歩です。

私たちのTWIST 500リストにはこれらの企業がいくつかありますが、私が最も興奮しているのはZAPエネルギーという会社です。私は物理学者ではありませんが、家族に物理学者がいます。しかし私は家族の中で一番のバカでした。なので、今日はZAPエネルギーのCEO兼共同創設者のベン・コンウェイを招待し、彼らの核融合へのアプローチがどのように機能するか、そして私たちがどれだけ商業的に実現可能な核融合力に近づいているかを説明してもらいます。ベンをショーに迎えましょう。ベン、いかがですか?

「元気ですよ、お会いできて嬉しいです。招待してくれてありがとう」

この対話の準備をしている時、核融合へのさまざまなアプローチについて、思っていたよりもずっと多くのことを学びました。正直に言って、ZAPが取り組んでいることは素晴らしく、とてもエキサイティングだと思います。しかし、ベンチほど詳しくない人々のために、基本的なことから始めたいと思います。高レベルから見て、磁気トーラスアプローチと大型レーザーアプローチの2つのバケットがどのように機能するか説明していただけますか?

「それを言ってくれて嬉しいです。1つ目は磁気コイルで囲まれたトーラス状のチェンバーで、プラズマを閉じ込め圧縮するための大きな磁石を使うという考えです。2つ目は大きなレーザーを作ることです。リスナーの皆さんはNIFの実験、つまりローレンス・リバモアの国立点火施設の実験を聞いたことがあるかもしれません。2022年11月末に科学的なエネルギー収支の達成に成功しました。

私たちはそれらのバケットのどれにも入りません。私たちはZピンチと呼ばれる物理の一部のひねりを使っています。Zピンチは核融合が理解される前から長く理解されていました。1905年にポリックとバラカというオーストラリアの科学者が、オーストラリア南部のある錫鉱山で落雷を受けた避雷針を見て、その避雷針が長さ方向に押しつぶされているように見えました。それは、導体を流れる電流が磁場を作り出し、その磁場があなたの指のように巻き付き、拳を握ると、その力が避雷針に加わるからです。

科学博物館では、空のコーラ缶に電流を流すと、その缶が自分自身の磁場によって圧縮されるのを見ることがあります。このZピンチは実際に核融合への最初のアプローチでした。1950年代の秘密の核融合プログラム、プロジェクト・シャーウッドと呼ばれていましたが、Zピンチが最初の試みでした。

アイデアは、プラズマを取り、大きな電流を流し、磁場を作り出し、それが避雷針や空のコーラ缶のように圧縮するというものでした。問題は、手の中で水風船を持つようなものでした。Zピンチプラズマは非常に迅速に不安定になりました。そして彼らはこのアイデアを放棄し、次の70年間はマグネットとレーザーを作りました。

私たちは水風船を安定させる方法を見つけました。それはシアフローと呼ばれるものを使います。その水風船が静止しているのではなく、今は流れていると想像してください。そして外側が内側よりも速く流れています。高速で移動する交通の中では、車線変更が非常に難しいことは皆知っています。このプラズマの柱があり、外側が内側よりも速く流れていて、中心に向かって同心円状にますます速く流れていると想像してください。その中に電流を流すと、避雷針や空のコーラ缶のように圧縮されます。しかし不安定になろうとしても、交通が非常に速いため車線変更ができません。

実際、すべての側面で交通が非常に速く動いています。さらに圧縮され、車線変更しようとしても交通が非常に速いため、今や本当に安定した圧縮が得られ、それは通常の不安定性よりも1万倍長く続きます。数マイクロ秒の間安定しており、それが核融合条件に達する点です。

これらの2メートルのデバイスは、単一桁の数百万ドルのコストで、非常に迅速に構築できます。私たちは今、世界最大の実験に匹敵する方法で核融合を行っています。実際、過去12ヶ月間に電子温度実験の結果を発表しましたが、過去70年間でわずかな核融合トポロジーだけがそれを達成しました。それを車のトランクに収まるサイズのもので達成しました。」

時間をさかのぼって、私たちはZピンチについて長い間知っていました。それらは核融合を考える最初のアプローチでした。70年間それらは消えていましたが、あなた方は復活させ、正味のプラスのパワー生成環境で実現可能にしようとしていると思います。あなたたちのアプローチの何がエキサイティングなのでしょうか?

「私たちのアプローチで刺激的なのは、スケーリングが非常に重要だということです。シアフロー安定化Zピンチを通して流す電流量と核融合反応率の関係は11乗の関係です。つまり、電流を2倍にすると、2の11乗、つまり2048倍の核融合反応率になります。それは非常に強力なレバレッジです。

過去数年間、私たちが成功裏に行ってきたのは、より多くの電流をシアフロー安定化Zピンチに流すことです。何十億ドルもかかる複雑で巨大な機械を作るのではなく、同じ小さなデバイスで、非常に迅速に繰り返し実験できます。Zピンチを通してより多くの電流を流し、プラズマパラメータを向上させています。例えば中性子収率など、高温濃密なプラズマに近づいていることを示すものです。」

ここで、あなたがたがどのようなことを話しているのかをより説明的な形式で示すクリップを再生します。しかし、何十億ドルもかかるシステムと比較して、ZAPが構築しているのはITERのアンチテーゼのようなものだと思います。ヨーロッパにある主要な核融合反応炉です。それはずっとシンプルで、より小さく、モジュラーで、調整しやすいように見えます。なぜなら、宇宙と時間を曲げることができる磁気アレイを20年かけて構築する必要がないからです。

なぜこのアプローチがより人気がないのでしょうか?私の素人の視点からは、このやり方にはたくさんの利点があるように見えますが。

「核融合エネルギーがない理由は科学とは何の関係もないと信じています。私の隣にいる160人の科学者がそれを聞いてぞっとするのを聞いていますが、私たちが核融合を持っていない理由は科学とは何の関係もなく、何十億ドルもの実験を建設しているからだと思います。設計に数年、建設に数年、試運転に数年、科学に数年かかります。

このような10年のタイムスケールで、私たちはこれらの巨大なデバイスを構築してきましたが、そこでは急速に繰り返し実験することが不可能です。iPhone試作品に10億ドルを費やし、10年ごとに1つのiPhone試作品を構築することを想像してみてください。あなたは商業製品を達成することは決してないでしょう。Windows 3からiPhoneまで15年でそのような繰り返しは不可能です。

それはZAPの主要な差別化要因の1つです。それは私たちのスーパーパワーです。単一桁の数百万ドルでデバイスを構築する能力があります。これは桁違いに安価で、桁違いに速いです。新しいデバイスを1年以内に構築することができ、数百万ドルを費やすことで、何億、何十億ドルではなく、非常に迅速に繰り返し実験することができます。

私たちが生産する核融合電力は競争力があると思います。そして私はそれが核融合コミュニティが過去70年間にわたってほとんど無視してきたことの1つだと思います。つまり、これがどれだけの費用がかかるかということです。核融合電気や核融合熱が競争できなければ、世界に1つの核融合発電所があるでしょうし、子供たちは学校の遠足でそれを見に行き、「これが核融合発電所です」と言うでしょうが、それはスケールしません。」

「今から私たちは実験的なコアの中でZAPエネルギーがどのようにZピンチ核融合を作り出すかを見てみましょう。まず、真空チャンバーにガスのパフが注入されます。ガスが膨張すると、強力なパワーパルスがガスをプラズマにイオン化します。その電流と磁場によってプラズマがチャンバーを下方に加速されます。内側のノーズコーンを通過すると、プラズマは薄い柱に崩壊します。Zピンチ磁場がプラズマを強力に圧縮し、数フラクションの秒間、極端な温度と密度を生み出します。これが起こると、核融合反応の波が非常にエネルギーの高い粒子を生成し、それらは熱と電気を作るために収穫できます。ピンチが消えた直後に、サイクルが再び始まります。」

サイクルが再び始まるという点についてもう少し詳しく知りたいです。なぜなら、あなたたちがより多くのパルスを行うことに取り組んでいるセントリーについて話しますが、パルスはマイクロ秒続くと言いました。最終的に1分の時間枠でどれくらいの頻度でサイクルを回転させることを期待していますか?正しい質問かどうかわかりませんが、どれくらいの頻度で回転させますか?

「そこでお見せしたのは私たちの核融合コアです。それが私たちの発電所の中心を動かすものになりますが、それだけでは十分ではありません。中性子を電気に変えるために周囲に何かを置く必要があります。あなたが見たのは私たちのR&Dチームが日々取り組んでいるものです。

センチュリーで行ったこと(これからお見せします)は、実際に発電所に関連する技術の最初の統合物です。高温高密度プラズマに加えて必要なものです。センチュリーには繰り返しパルスパワー、液体ブランケット、耐久性のある電極などが含まれており、すべてが二階建てバスの大きさの何かに統合されています。これは最終的に発電所に入るサイズです。これが核融合モジュールが信じられないほどコンパクトであることを示しています。

しかし、センチュリーは核融合を可能にするこれらの重要な技術の最も重要なデモンストレーションだと思います。核融合会社によって達成されたことがあります。また、ZAPにとって、私たちの技術は高度に差別化されていますが、システムエンジニアリングと並行してプラズマ物理学を行うという私たちの戦略も高度に差別化されていることを示しています。

私がZAPを設立したとき、私は珍しい核融合CEOの一人で、核科学者でも核エンジニアでもありません。70年間、核融合がプラズマ物理学だけに焦点を当ててきて、核融合を実現するために必要なこれらの他のすべての技術が基本的に無視されてきたことは私にとって狂気のように思えました。人々はいつか日立または他の会社がそれを供給し、発明すると期待していたと思います。

ZAPでは、これらの重要な実現技術に焦点を当てているスタッフがプラズマ物理学側と同じくらいいます。そしてセンチュリーはそれらの本当に信じられないデモンストレーションです。」

センチュリーは単なる核融合コア以上のものですか?例えば、もし核融合コア技術を完成させたら、現在構築しているセンチュリーシステムは発電所として機能しますか?あるいは、最終的に構築するこの核融合プラントのためにまだ必要なピースの一部ですか?

「それは私たちが核融合プラントを実現するために必要となるすべてのピースの初代です。発電所では10秒ごとにパルスを打ちますが、電力プラントでは1秒間に10回パルスを打つ必要があります。すべてのものはスケールアップする必要がありますが、それは本当に最初の世代というわけではなく、時には二代目か三代目の部品であり、最終的な発電所のために一緒に置く必要があるものです。」

センチュリーは昨年10月にお披露目され、同時に1億3000万ドルの新資本を発表しました。それは多額のお金です。数ヶ月が経ちましたが、センチュリープロジェクトの進捗はどうですか?あなたのアプローチに対する自信を高めるような新しい重要なマイルストーンに達しましたか?

「はい、重要なマイルストーンに達しましたが、それは近々発表する予定です。それはDOE(エネルギー省)のマイルストーンで、あまり先に行きすぎたくありません。また、R&D側でも、プラズマ物理学を非常にうまく進めると思われる新しい構成も導入しています。非常に速くイテレーションを行っているとき、これらのさまざまなプログラムが非常に速く進歩することは本当に驚くべきことです。」

1億3000万ドルは外にいる人々には多額のお金に聞こえますが、大規模な科学プロジェクトの領域では、あなたは一部の核融合施設のコストが数十億ドルになると言及しました。1億3000万ドルはあなたたちにとってどれだけのお金なのか、良い考えを持っていません。合計で3億ドル以上を調達したことは知っていますが、1億3000万ドルは商業的実現可能性までの道のりをすべてカバーしますか?それともセンチュリープロジェクトの終わりまでだけでしょうか?資本の規模と完了すべき作業の関係がわかりません。

「私たちはおそらく最も資本効率の良い核融合会社です。1億3000万ドルは他の核融合アプローチと比較して私たちにとって非常に価値があります。商業製品に到達するためにもっと多くの資本が必要ですか?はい、私たちは今から商業製品を立ち上げるまでに数十億ドルが必要だと思います。それは私たちの発電所の核融合コンポーネントが数十億ドルかかるからではなく、ZAPが工場でモジュールを構築するからです。

工場で核融合モジュール、電力モジュール、トリチウムサイクルモジュールを構築して現場に設置するときに得られるような規模の経済を得るでしょう。他のトポロジーは現場で従来の原子力発電所のようなものを建設しています。それにより、私たちは展開してスケールアップするために製造能力を構築することになります。そして誰もが知っているように、複雑な機械のための大きな工場を設立することは信じられないほど簡単で、お金がかからず、一晩でできます。」

競争の点では、多くの人々が素晴らしいことをしています。トカマックやステラレーターについては知っていましたが、ZAPのアプローチは私にとって新しいものでした。ヘリオンエネルギーも別のアプローチを行っていると知っています。最終的に誰かが最初に到達して市場を所有する点に達するのか、それとも最終的にいくつかの異なる核融合発電へのアプローチが世界中で標準になるのでしょうか?ちょうど異なるタイプの原子炉があるように。

「核融合を予測することは本当に難しいです。他のどんなセクターでもこれほど多くの賢い人々が予測を間違えてきたとは想像できません。だから謙虚に核融合の未来を予測します。複数のプレイヤーのための余地があると信じています。それは「誰かが推論LLMを立ち上げたから、それだけでいい」と言うようなものです。もっとあるでしょう。

商業核融合に関しては、複数のアプローチがあるという考えはおそらく違うと思います。私は核融合を行う最も経済的な方法が1つあると思いますし、それがスケールする核融合のバージョンになるでしょう。トカマク核融合発電所、シアフロー安定化Zピンチ発電所、ステラレーター発電所、レーザー発電所が並存する世界にはならないと思います。最も安価な方法が1つあり、それがスケールする技術になるでしょう。しかし、それを予測するのは非常に困難です。」

技術の中に循環する液体金属壁がある理由は何ですか?それは最高の意味で科学フィクションのように聞こえます。大きなSFファンとして、液体金属壁について説明していただけますか?ただ好奇心があります。

「ぜひ見に来てください。本当に信じられないものです。ZAPは実際にこれらの液体ブランケットを行った唯一の核融合会社の一つだと思います。中性子と接するために何かが必要です。液体壁は補充され、簡単に熱を循環させることができます。それはブランケットであり、中性子出力とインターフェースする材料です。固体ではなく液体であり、熱を転送し、複雑な熱管理により熱くなり、燃料の一つを生成するトリチウムを「呼吸する」ことができるのです。」

「さて、創業者の皆さん、あなたのウェブサイトについて話しましょう。はい、恥ずかしいです。はい、アップグレードするには忙しすぎるとわかっています。新しいものを立ち上げたり、ブランドをリフレッシュする必要がある場合は、Squarespaceが必要です。素晴らしいプロフェッショナルなウェブサイトの構築を信じられないほど簡単にする、オールインワンプラットフォームです。製品を販売している場合でも、サービスを提供している場合でも、ポートフォリオを紹介する場合でも、Squarespaceは成長に必要なすべてを提供します。

明らかに、Squarespaceのテンプレートがどれほど美しいかについて私が話してきたのを聞いたことがあると思いますが、今では「Blueprint」と呼ばれる彼らのAIツールを使用して、数分で完全にカスタマイズされたウェブサイトを手に入れることができます。それがどのように機能するかというと、いくつかの質問に答えるだけで、数分で美しいオーダーメイドのウェブサイトを手に入れることができます。顧客を驚かせるパーソナライズされたレイアウト、ビジュアルがあり、完成です。

もっとコントロールしたい場合は、受賞歴のあるテンプレートから選択し、直感的なドラッグアンドドロップツールを使用して自分のものにすることができます。簡単です。自分のやり方でできます。squarespace.com/twistで無料トライアルを利用して、準備ができたら、squarespace.com/twistに行き、最初のウェブサイトまたはドメイン購入の10%オフを受けてください。それがsquarespace.com/twistです。」

私の熱管理の知識はゲーミングPCのケースを開けて空気を多く入れることだけなので、物理学はあなたに任せますが、理解していることを確認したいです。Zピンチ核融合の瞬間から発射される中性子は液体金属によって収集され、それが熱くなり、流れる液体金属から熱を抽出し、それを熱発電に利用できるということですね?

「そうです、中性子です(ニュートリノではありません)、重要な訂正ですが、あなたは完全に正しいです。何とかして熱を取り出し、熱を電気に変える必要があります。人間は水を沸かしてタービンを回すことに非常に長けています。沸騰した水からは、従来の発電所と非常によく似ています。シアトルの近くにある廃止された石炭火力発電所のフィージビリティスタディを行っています。石炭を燃やし、水を沸かし、タービンを回します。核融合は基本的に水を沸かし、タービンを回します。水を沸かすことからは非常によく似ています。古い石炭火力発電所のようなレガシーエネルギーインフラをレトロフィットすることで、商業的にスケールアップする上でいくつかの効率性があると考えています。」

すべての発電がお湯を沸かすだけなら、核融合発電を既存のやかんに取り付ければいいですね。それは私にとって完全に理にかなっています。

さて、ベンチ、お別れしなければなりませんが、あなたがまだ共有できないと言っている次のマイルストーンについて、いつ私たちと再び連絡を取り合うべきか気になります。次の大きなZAPニュースのタイムラインは何ですか?

「今年後半に発表する予定です。私たちは査読プロセスを本当に信じています。今年はそれをもっと行います。しかし、実際にお越しいただき、私たちが行っていることを直接見ていただくことを強くお勧めします。核融合スタートアップがどのようなものかというあなたの先入観をすべて満たすでしょう。今年後半にぜひお越しください。そして近々いくつかの進捗を発表する予定です。」

「オレゴンで育ち、西海岸の家族と一緒に育った私にとって、それは不可能ではありません。子供の頃にオレゴン州立大学の学生リアクターを見に行きました。関連技術の一部を見ることができました。ありがとう、ベンチ。ZAPエネルギーはTWIST 500にあり、今日のアメリカで最もクールな企業の一つであり、核融合エネルギー生産の最前線にいます。」

「ありがとう、アレックス」

それが私が原子力エネルギーを非常に重要だと考える理由ですが、核融合への道のりでの一時的な解決策に過ぎません。待ちきれません。無制限のクリーンで無料なエネルギーを持つことは素晴らしいことになるでしょう。

次はポーリーAIとそのCEOニコラ・ムティチです。AIについて話していますが、会話型AIと生成型AIの違い、CEOがそれについてどのように考えているか、それが市場にとって何を意味するのかに特に注目してください。では始めましょう。

ポーリーAIインタビュー

皆さん、TWISTに戻ってきました。私はアレックスで、今日は別のTWIST 500インタビューがあります。ポッドキャストでは、新しいモデル、より速いモデル、推論モデル、モデルのビルド、そのコストについて多くの時間を費やしていますが、より重要かもしれないのは、今日のビジネスコンテキストでAIがどのように使用されているかです。そのため、今日はポーリーAIをショーに迎えることができて本当にうれしいです。CEOであり共同創設者のニコラ・ムティチを呼びます。ニコラ、調子はどうですか?

「素晴らしいですよ、招待してくれてありがとう。そして私の名字の発音が今まで聞いた中で最高だったことに感謝します」

録音を始める前の方がうまくいって、2回目は少し台無しにしましたが、大丈夫です。セルビア市民権の名誉を与えられましたね。私の国は奇妙な時期を過ごしていますので、もう一つ持っていても悪くありません。

「私たちはいつも奇妙な時代にいました」

私たちが住んでいる奇妙な時代ですね。地政学的なジョークは別として、あなたはロンドンにいますね。これを録音するためにこんなに遅くまで起きていてくれてありがとう。

ポーリーAIに興奮しているのは、AIがどこに向かっているのかの大ファンだからです。それは個人的にも仕事上でもAIと話すことになると思います。しかし、始める前に、あなたの会社が何をしているのか、その歴史を詳しく説明する前に、会話型AIを定義したいと思います。なぜなら、あなたたちは生成型AIとの違いを非常に有用な方法で区別しているからです。ニコラ、もし良ければそこから始めてもいいですか?

「会話型AIは、AIであれそうでなくても(しかし実際にはすべてAIですが)、技術を使用して会話システムを構築することです。機械と会話できるようにする技術を構築することです。そして生成型AIは、生成モデルを使用して、それを異なる作業分野に適用することです。そこでの質問は「電気を使っていますか?」というようなものです。

なので、これは私が思っていたよりも単純ですが、例えば消費者コンテキストでChatGPTを使用し、それで会話しているとき、それは会話型AIを使用しており、それは生成型AI技術によってサポートされているということですか?

「私はそれを、1つは基盤モデル層として考えています。コンピュータネットワーキングを考えるなら、1つはケーブルのようなもので、パケットを通過させます。そしてもう1つはよりアプリケーション層のものです。ChatGPTや私たちのシステムなどの生成型AIは、会話アプリケーションを構築するために使用されます。大まかに言えば、会話型AIはアプリケーションであり、アプリケーション層に存在します。」

専門家からアプリケーション層を正確に定義していただけますか?私たちはこの用語をよく使いますが、あなたとあなたの会社がどのように定義しているのかを聞くのは良いことだと思います。

「アプリケーション層は実際には、人々のために何か役立つことをしているかどうかということです。1つは単なる技術であり、もう1つはアプリケーションとして使用するものです。スマートフォンやコンピュータでアプリを使用するのと同じように、これらは企業が顧客と話すための声を与え、昼夜を問わず顧客と話し、本当に良い仕事をするために使用するアプリケーションかもしれません。世界に対して彼らを開くためのものです。」

人間と話すために待機列に閉じ込められたことがある人なら、主要なクレジットカード会社にはたった3人しかいないようですが、これがなぜより速く、シンプルで、より良いかを理解できると思います。しかし2017年に会社を設立した時に戻りましょう。私の記憶が正しければ、ChatGPTが出てきた2022年まで、多くの人々はこのタイプのコンテキストでAIについて考えていませんでした。あなたたちがトランスフォーマーとLLMを技術コンテキストに導入した「Attention Is All You Need」論文と同じ年に会社を設立したと思います。

会社を設立したとき、今日の場所に到達するために必要な技術が存在していましたか?それとも、あなたのビジョンを市場で実現可能にするようないくつかの技術的ブレークスルーが起こることを予想して会社を設立したのですか?

「それは動く標的です。技術は進歩し、私たちはますます印象的なことを行っています。私は人生の道筋で信じられないほどの幸運に恵まれ、2014年にケンブリッジでスティーブ・ヤングという教授と博士課程を始めました。彼は音声認識で最も引用されている人物の一人で、ディープラーニングの信奉者です。

ディープラーニングは2012年頃から本格的に始まります。ジェフ・ヒントンやヤン・ルカンなどの人々が、ディープニューラルネットワークを事前訓練する方法を基本的に理解したときです。その時点で、一般化して人々を理解するためのより強力な機械学習技術が得られ始めます。残高確認のために「バランスチェック」という3つの単語の1つを使用する代わりに、「残高を確認したい」または「口座にいくらお金があるか知りたい」と言うことができるようになりました。

私の博士課程は主にそれについてでした。文や文のパターンの正確なマッチングから離れ、ニューラルネットワークが見て「これがこの応答に正しいのかどうか」というような文の数学的表現に移行する方法についてでした。私たちは多くのことを先駆けました。」

それを距離で測るのですか?

「類似性ですね。通常、コサイン類似度が使用され、これら2つのものが類似していると言います。そして、異なる空間にある可能性のある2つのものを見るために学習する異なるニューラルがあります。したがって、それは距離ではなく、それらの間のマッピングを学習することかもしれません。実装方法についてはたくさんあります。これらのものはより大きく、より強力になり、裏側で何をしているのかを見ることがますます難しくなっています。

彼らはコードを書いているわけではなく、「この文はこの質問に対する正しい答えですか?」または「その文を言った後、次に何を言うべきですか?」について直感的な理解を学んでいます。それが彼らが考えるように訓練されている方法だからです。」

「製品を出荷したり、アップデートをロールアウトしたり、会社を構築したりする場合、組織化されている必要があります。アトラシアンには、あなたの作業を効率化し、目標を達成するために必要なものがすべてあります。アトラシアン・フォー・スタートアップス・プログラムには、すべてのタスク、スプリント、バグを追跡できるJiraのような、必要なすべてのツールが詰まっています。これは業界標準です。チームコラボレーションとドキュメントのためのもう一つの業界標準であるConfluenceもあります。そして、もちろん、クイックビデオ説明作成のためのLoomもあります。

Loomは本当に素晴らしいです。私のチームはLoomを自分たちで使い始め、自分たちでお金を払い始めました。なぜなら、彼らは会社に投資したい理由について、私、つまり会社のジェネラルパートナーに伝えたかったからです。そこで彼らは、創業者とのインタビューを録画したり、ウェブサイトを訪問したりして、なぜその会社に投資したいのかについてのLoomを作りました。

これは私にとって素晴らしいことでした。日本でスキーをしていたり、両親に会うためにニューヨークへの飛行機に乗っていたりしても、突然チームメンバーの一人から「このLoomを見て」という通知が来ます。Loomのリンクを受け取り、それをクリックすると、いつでもコメントを付けることができます。それは会議をするようなものですが、非同期で自分の時間に行い、ビデオに直接コミュニケーションを取ることができます。

アトラシアン・フォー・スタートアップスには、コンパス、Jira製品ディスカバリー、Bitbucketなど、もっと多くのものが含まれています。すべてアトラシアン・インテリジェンス(彼らの組み込みAI)によって動いています。アトラシアンのソフトウェアは、Canva、Cloudflare、Rivianなどの企業が成長を続け、革新を続けるのを助けています。付箋紙でブレインストーミングをしていても、大きなリードにスケールアップしていても、アトラシアンはスタートアップの成長を加速するためにここにいます。

アトラシアン・フォー・スタートアップスをチェックしてください。資格のあるスタートアップは1年間無料で最大50席を取得できます。なぜアトラシアンはこれほど寛大になれるのでしょうか?彼らは標準だからです。アトラシアンは標準であり、かつてスタートアップだったからこそスタートアップに寛大なのです。20年前にオーストラリアで彼らに会ったことを覚えています。素晴らしい会社です。詳細については、atlassian.com/startups/twistにアクセスしてください。」

これはあなたの会社について私が印象に残ったことの一つです。あなたたちが何をしているのか、どのように進めるのかについて学んでいるとき、市場向け製品を構築するために組み合わせる必要があった部品の数が興味深かったからです。ここであなたのコンテキストでこれがどのように機能するかについての内訳を試みたいと思います。そして、もし良ければ、私が間違っている箇所を修正して教えてください。

ASRは自動音声認識であり、基本的にそれは私が話していることを取り、LLMやその他の種類の技術システムが取り込むことができるテキストに変換します。そこから自然言語理解が必要で、それはそれらのテキストベースの言葉を意味に変換します。そして、あなたはそれにLLMを使用していると思います。そして、出力を得た後、音声合成を使用してそれを私、つまり顧客に戻ってくる話し言葉に変換します。LLM時代以前のことをどのように考えていますか?

「かなり良いですね。その意味を中間で分解し、「ロンドンの北西部にあるイタリアンレストランを探している」と言ったら、データベースに行ってそれらが何かを理解するロジックを書くようなものです。それが会社を始めた頃の仕組みです。

最初から、より少ないロジックで全体が機能するようにデータを追加することが重要でした。より多くのデータを見ると、その集大成は現代の大規模言語モデルのようなものになります。基本的にロジックを書かずに、それが流れ、次の単語を予測し、それによって実際には背景で多くの推論を行います。APIを呼び出すことができ、これらのことの多くを行うようにトレーニングすることができます。

現在では、より多くのオントロジーベースの特定のユースケースベースのエンコーディングを避け、単一のモデルを持つ点に達しています。この時点で、エンドツーエンドの音声は実際には、音声を受け取り、すべてのコンポーネントを一つに統合した音声を出力するモデルを表しています。

ディープラーニングはいつも、中間表現を作成することに焦点を当ててきました。人間がこのアプリケーションのためにこれを引き出し、次にこれを行うというようなことではなく、単一のものからデータからそれをすべて行う方法を学習することです。

私の共同創設者や私の博士課程の間の作業は、常により少ないコンポーネントを持つことについてでした。そのダイアログスタックのいくつかのバージョンには5つのコンポーネントがありますが、実際にはもうそれらすべてを持つ必要はありません。

今ではLLMにプロンプトを与え、「あなたはレストランのコンサルタントです。レストランのリストを見つける必要がある場合、ここにこの関数があります」と言うことができます。その関数は場所を与えると、リストを返します。そのリストを見たら、人と話し続けるでしょう。それから、それがどのように話すかを見るかもしれません。

LLMがより良くなるにつれて、より多くのことができるようになりました。」

あなたたちには特定のモデル、たとえばConvertというモデルがあったと思います。

「Convertは私たちのトランスフォーマーモデルでした。600メガバイトで、現在と比較すると非常に小さいものでした。」

それは今まで聞いた中で最も小さいことです。それは驚くべきことです。

「今日、多くの人々が「小型言語モデル」と言いますが、それはどういう意味ですか?しかし、みんなはただコードを書いて、「これらの意図、エンティティ、特定のデータベース検索を理解する方法を見つけよう」と言っていました。そしてそれは悪夢でした。それが最初の世代の音声IVRが構築された方法です。

最初の一歩は、単語などの正確なマッチングではなく、それは2014年、15年、16年頃に起こりました。そして、それはより表現豊かになりましたが、まだあなたが閉じ込められるループのようなものでした。「クレジットカードですか、デビットカードですか?」と聞かれ、「いいえ、住宅ローンについて電話しています」と答えると、「デビットですか、クレジットですか?」と言われます。そこで電話を投げつけたくなります。」

それはまさに暴力が起こる瞬間です。

「私たちはそこからますます遠ざかってきました。Convertでは、もはやそれをあまり使用していません。ただシステムに「ユーザーは何かを言うでしょう、あなたはこの500のことの1つを言うことができます、最良のものを選んでください」と言うことができました。それはLLMのようなものですが、LLMは文を完全にフラットに生成します。だからこそ、幻覚などがあります。これは企業にとって安全ですが、LLMよりも表現力が低いアプローチです。

現在では、LLMを使用しています。私たちは自分たちのものを調整しています。私たちには多くのデータがあり、何百万、何百万もの電話を受ける多くの顧客がいます。そのため、一般的なLLMにおいてOpenAIやDeep Seekなどよりも優れているわけではなく(そうなりたいとも思っていません)、オープンソースのLLMを調整して、カスタマーサービスにおいてデフォルトよりも優れたものにすることができる重要なデータモードを持っています。

同様に、音声認識器は依然として別々に扱っています。多くの人々はこれらのエンドツーエンドモデルを行うことができると期待しており、私たちもそれに興奮しています。それはイデオロギー的に私たちがいつも向かっていた方向です。それを実験していますが、企業にとっては、まだ調整するための2つの別々のものを保持しており、それがパフォーマンスを向上させるために本当に必要です。

真実は、これまで以上に良くなっていますが、まだ解決されていません。もしAlexaに15分のタイマーをセットするよう言えば、それを直感的に理解できます。」

私はAlexaを何かの最先端として使用しません。なぜならAlexaは私の犬よりも賢くないからです。

「それについて話すことができます。しかし、良い例は、「15分のタイマーをセット」と言うと、結果として50分になる可能性が同じくらいあるということです。これを使用する人はみな、このことを認識しています。それは音声技術に関連することであり、100%の時間で機能するという確かさにはまだ達していません。それはシステムの構築方法に組み込む必要があるものです。

それが、市場の大部分、特に新しく取り組んでいる人々が本当に理解していないと思うことです。彼らは3ヶ月前に取り組み始めたばかりで、その進歩が3ヶ月で起こったと考えています。トランスフォーマー論文が出てから7年か8年かかったのに対して、そうではありません。」

「私は単に2017年、つまりあなたが会社を設立し、その論文が出た年に戻っているだけです。」

「2012年に戻ると12年になります。」

「そして、それは単に… 90年代ではなく、その後一つの冬があり、もう一つあり、まだ私たちは減速するかもしれないと言う人々がいるでしょう。しかし、社会全体として、これほど多くの素晴らしい頭脳とリソースをAIに投入したことはなかったので、私たちは今や完全にこれに取り組んでいると思います。減速するためには多くの要素が必要でしょう。」

ビジネスコンテキストで重要なのは、ポーリーAIが現在市場に出ていることであり、昨年かなり大きなシリーズCラウンドを調達したことです。5000万ドルだったと思いますし、A16Zが参加し、NVIDIAのベンチャーキャピタル部門も参加したと思います。

2つの質問があります。一つは、あなたの技術がどれだけ速く改善しているかです。市場全体について話しましたが、顧客向けの顧客サポート電話を処理するという市場内のタスクにおいて、あなたたちがどれだけ良くなっているのか気になります。もう一つは、昨年その大きなシリーズCを調達してから、ビジネス自体がどれだけ速く成長しているかです。

「技術は本当に速く改善しています。それは、非常に大きな企業の非常に重要な大規模なコールで作業する機会を得ることに関連しています。誰かが年間2000万、3000万、4000万の電話を私たちに信頼してくれる場合、私たちはそれを非常に真剣に受け止めます。私たちはこの課題に向けて何年も準備してきており、それを処理するためには多くのことがあります。

これらの企業の中には、コールの90%を完全に自動化された方法で処理でき、顧客満足度スコアは人間と同等かそれ以上のレベルになっています。」

ニコラ、90%という数字は3年前のポーリーではどのくらいでしたか?

「一般的に話すのは難しいですが、3年前は最も高いものでも70%台前半だったかもしれません。」

かなり良い状態から、ほぼすべてのコールを処理できるようになったということですね。それは0%から20%に行くよりも恐らく難しいことです。

「しかし、ビジネスコンテキストについて他に言いたいことがあります。これを適用しようと考えている人が知っておくべきことです。現在、LLMは優れており、本当に良く、まだ改善するかもしれません。しかし、それにアクセスできる国々のGDPが20%も年間成長しない理由は、それを意味のある方法で世界に接続する必要があるからです。

それが優れていることを行い、そこから価値を生み出すための導管を見つける必要があります。私たちにとって企業との関係では、彼らのプロセス、人々との仕事、コンタクトセンターを変革するのを手助けして、AIの恩恵を受けることができるようにすることです。

企業がAIに委ねるのに十分に快適になるように、プロセスを構造化することは本当に難しいです。それは彼らがナビゲートするのを手伝う旅であり、それはAI自体を実装するのと同じくらい困難です。それには彼らのITチーム、人々のリーダー、コンタクトセンターのリーダー、最高執行責任者、リスク担当者、ブランド、すべてが関わっています。これを行っている企業はまだアーリーアダプターだと思いますが。」

より広い音声AIや会話型AI分野で働いている他の企業も多くのお金を調達し、多くの騒ぎを起こしていることを見ています。Eleven Labsも多くのお金を調達し、Play AIも同様です。私にとっては、投資家があなたが説明しているビジネスとその市場自体での勢いに気づいていて、複数の賭けをしていると読み取れます。なぜなら、それは複数の勝者にとって十分な大きさの市場になるからです。

しかし、リーダーとしてのあなたの視点から、市場でどれだけの競争圧力を感じていますか?アカウントを獲得しようとするとき、これらの他の名前は現れますか?それともまだ未開拓の機会ですか?

「すべての人を見ます。最近のスタイルでは、白人のコメンテーター企業の30〜40%が音声エージェントに取り組んでいるというものでした。これは新しいゴールドラッシュです。私は、私たちがいつ始めたか、どのように始めたか、そして私たちがやってきたすべてのことで非常に恵まれていると感じています。

多くのそれらの企業とは異なり、私たちにはクライアントの名簿があり、すべての部門に人々がいます。そして、私たちが完全なモデル戦略的自律性を持つことを可能にするデータもあります。私たちはラッパーではありません。

競争を見ていますか?今までで最も多いです。そのマーケットマップが出てきて、そこには20のものがあります。例えば、ヘルスケア、レストラン、ホスピタリティ、旅行と物流、金融サービスなどです。それらのすべてにおいて、私たちはおそらくこれらの新しい挑戦者の多くよりも5倍から10倍の収益を持っていると思います。それは恐るべき優位性ですが、同時に考えるべきことでもあります。

かつての人気のある企業、Netscape、AOLなどが古くなった道を行った企業を考えると、私たちは傲慢になることはできません。やるべきことはたくさんあります。私たちはGoogle、ハイパースケーラー、ものを展開している会社と戦っています。これはゴールドラッシュです。なぜなら、北米とヨーロッパの間で年間1兆ドルの労働コストがかかることを誰もが理解しているからです。そして聞いてください、人々はそれらの仕事をしたいと思っていません。」

「それが私のメモに「ニコラ、あなたが事業から排除した人々をどうするつもりですか?」と書いていない理由です。なぜなら、電話に答える人間は必要ないと思うからです。」

「申し訳ありません、それは私が意図したことではありません。これらの機械的な仕事をしている人々をどうするつもりですか?」

「私はただ、このような質問に人間が答える必要はないと思います。それは人間の潜在能力の無駄です。」

「いいえ、実際のことは、私たちがこれを実装した大規模な展開で、誰かが「コンタクトセンターに費やしているものに満足しており、十分な人々がいる」と言ったことはないということです。それは現時点では架空のナウンです。そして、「1000人を解雇しよう」と言うような紫色の私設投資家によって支援されたCFOは実際には存在しません。それは起こりません。問題を抱えていない人々は、1000人を解雇する傾向はありません。

そして彼らが1000人を解雇しなければならない場合、その会社はすでにそれらの人々を解雇しており、彼らのサービスレベルは地獄に落ちています。今、彼らは墓から自分たちを掘り出すために技術を必要としています。それが私たちが実際に行っているビジネスです。私たちが事業から排除することを望む唯一の人々は、私たちの競合他社だけです。

しかし、もう一つ本当に重要なことは、私たちがコンタクトセンターに高給の知識労働者の新世代を作り出していることです。多くの点で、コンタクトセンターをコマンドセンターに変えることを考えています。なぜなら、以前は故障管理のバンドエイドとしてそこにあった部門があり、ビジネスとして何か間違ったことをすると、リコールが必要な製品を展開すると、人々はコンタクトセンターに電話します。あなたの製品が機能しない、コンタクトセンターです。あなたがバックオフィスで誰かに過剰請求すると、彼らはコンタクトセンターに電話し、誰もが彼らを指さし、「電話に出ないのはあなたのせいだ、十分に働いていない」と言います。」

「コンタクトセンターで多くの時間を過ごしました。次から次へと発信者が彼らに対して信じられないほど失礼である中で、最善を尽くしている共感的な人々の数は恐ろしいです。なぜ人々が意地悪をすれば何か良いものが得られると思うのか分かりません。彼らは返金を得られると思っていますが、人々は平均して恐ろしく振る舞います。コンタクトセンターのリーダーシップは、彼らの人々が何を経験しているかについて十分に話していないと思います。」

「彼らはそれを認めたくないのです。彼らはただそれを他の誰かに押し付け、時給14ドルで払いたいだけです。ところで、これを聞いている方へのヒントですが、次にクレジットカードのマイルなどを手伝ってくれる電話で人と話すときは、親切にしてください。なぜなら、一つには自分勝手ながら、彼らはあなたのために頑張ってくれるでしょうし、二つ目には、彼らはあなたの問題を引き起こしていないからです。彼らに親切にしてください。」

最後にもう一つ小さな質問をして、約束通りに終わらせます。AIの世界には多くのお金が流れており、あなたはYCの企業がたくさんあると言いました。ポーリーAIを買収しようとする人はどれくらいの頻度でいますか?

「多くの場合、私たちは断りました。」

最近、人々が現れようとする頻度が高まっていますか?基本的には、応用AI分野でのスタートアップM&Aの状態を把握しようとしています。

「選挙後の状況で、問い合わせなどは増えました。そして一般的に市場の状態は、より多くのことが期待されるようなものです。前の期間はかなり静かでした。私たちが始めたとき、左右から何社かが本当に熱心で、それはディープラーニングのM&A買収者の最初の黄金時代のようでした。そして私たちはかなり強力なチームを持っていたので、それは驚くことではありませんでした。

その後、Covidが発生し、その後の全てが鈍化しました。私たちは忙しく構築していて、それらのメールに応答さえしませんでした。そして今でもしません。なぜなら、私たちがやっていることは本当に本当に本当にエキサイティングだと思うからです。これらすべての企業は、「あなたを買いたい、パートナーになりたい、取引をしよう」と言います。」

「あなたの次のARRマイルストーン、25、50、100、何であれ、ショーに戻ってきて、それについて教えてください。そして、あなたが状況を逆転させ、今度は他の企業を買収するつもりなのかどうかを確認したいと思います。その間、ニコラ、来ていただきありがとうございます。感謝しています。あなたのニュースすべてを教えてください。TWISTはいつもスタートアップのためにここにいますから。」

「招待してくれてありがとう。本当に楽しかったです。創業者と話すのが大好きです。」

それが私がこのTWIST 500プロジェクトを行っている理由です。もしTWIST 500について知らなければ、twist500.comは市場に出ている最も重要で、潜在的に最も収益性の高い民間企業500社のリストです。基本的に目標は、スタートアップの上位1%を見つけて、彼らと話すことです。リストに企業を追加するにつれて、これらのインタビューが続きます。現在、TWIST 500の後半を構築中なので、さらに多くのインタビューが期待できます。

その間、TWISTは月曜日、水曜日、金曜日の正午(中部時間)、午後1時(東部時間)頃にYouTube、LinkedIn、他のすべてのソーシャルメディアアプリケーションでライブになります。また、様々なポッドキャストプラットフォームにも展開しています。私からさらに多くを望むなら、cautious-optimism.newsで書いています。

それでは、月曜日にお会いしましょう。さようなら、皆さん。

コメント

タイトルとURLをコピーしました