次のAI革命がスクリーンの外で起こる理由:サムサラCEO Sanjit Biswas

スタートアップ・VC
この記事は約35分で読めます。

本動画では、サムサラの創業者兼CEOであるSanjit Biswasが、物理世界におけるAIの実装について語る。サムサラは時価総額200億ドルの上場企業であり、数百万台の車両にセンサーを配備し、年間900億マイルのデータをストリーミングしている。Biswasは、2〜10ワットのエッジデバイスでの推論実行という制約から、現実世界の多様でメッシーなデータが体現型AIにとって最大の課題であり機会である理由まで、物理AIの制約条件について洞察を共有する。自律運転の将来、ヒューマノイドロボットの可能性、そしてAIが物流、建設、エネルギーなどの産業でフロントラインワーカーを支援する方法について議論が展開される。ロボティクスや物理AIの分野で構築している人々にとって、この対話は実際にそれを規模拡大した人物からの稀有な視点を提供するものである。

Why the Next AI Revolution Will Happen Off-Screen: Samsara CEO Sanjit Biswas
Sanjit Biswas is one of the rare founders who has scaled AI in the physical world – first with Meraki, and now with Sams...

物理世界におけるAIの可能性

考えてみてください。深夜0時から朝8時までの間、いわゆる第三シフトがありますよね。人々は眠っているため、その時間帯は働かない傾向があります。物流のようなオペレーションがそのシフト中も稼働できると想像してみてください。

それから同じように、あなたがフィールドサービスの技術者で部品が必要だとします。その部品がただ配達されてくるとしたら、どれほど素晴らしいでしょうか。これはオペレーションにとって素晴らしい補完になるでしょう。興味深いのは、通常自動化が導入されると、ボリュームが増加するということです。なぜならコストが下がるからです。

人々が気づいていないだけで、実際には需要がはるかに多く存在しているのです。時には「ええ、その部品は使えるけど、誰かが車で届けてくれるのに50ドルかかるなら配達してもらう必要はない」と言うこともあるでしょう。もしコストが5ドル、あるいはゼロドルだったら、どれほど素晴らしいでしょうか。ですから、私たちはこれが世界の動くスピードを増加させるものだと考えています。

Sequoiaでの対話の始まり

このエピソードでは、サムサラの創業者兼CEOであるSanjit Biswasと対話します。Sanjitは以前Moroiを創業し、Sequoiaの創業者たちの間で伝説的な評判を持っています。

ですから、今日は物理AIについての対話のために彼を迎えることができて嬉しく思います。サムサラは時価総額200億ドルの上場企業で、年間900億マイルをキャプチャする数百万台の車両からストリーミングデータを受信するセンサーを配備しています。

Sanjitは、2から10ワットのエッジデバイスでの推論実行の制約から、現実世界データのメッシーな多様性が体現型AIにとって最大の課題であり機会である理由まで、物理AIの制約について洞察を共有します。

ロボティクスや物理AIの分野で構築している方にとって、この対話は実際にそれを規模拡大した人物からの稀有な視点を提供します。では番組をお楽しみください。

Sanjit、今日はご参加いただきありがとうございます。あなたはSequoiaの伝説的な創業者であり、Sequoiaに戻ってきていただけて嬉しく思います。

お招きいただきありがとうございます。戻ってこられて嬉しいです。

まずあなたの経歴から始めたいと思います。あなたはMITのRoofNetプロジェクトから、Moroiの共同創業を経て12億ドルでの買収、そして現在は時価総額230億ドルの企業であるサムサラの創業者兼CEOで、公開市場で最高のティッカーシンボルを持っています。その一貫性は何でしょうか。あなたの個人的な情熱と経験、そしてそれら全ての間の一貫性について教えてください。

はい、私はバックグラウンドとしてエンジニアです。ですからEECSを学びました。スタンフォードで学部を卒業し、大学院はMITに行き、そこでroofnetというプロジェクトに取り組みました。

私にとっての一貫性は、現実世界にインパクトを与えるクールな製品、クールな技術を構築することです。roofnetは今から20年以上前のことですが、アイデアは本当に大きなワイヤレスネットワークを構築できるかというものでした。というのも、2000年代初頭の時点では、Wi-Fiは主流ではありませんでした。それはまったく新しい技術でした。インターネットアクセスがちょうど主流になりつつあり、まだかなり高額でした。

そこで私たちは、Wi-Fiチップとその全ての技術を使って本当に大きなネットワークを構築する機会を見出したのです。私たちは、インターネットアクセスはどこにでもあるべきだ、空気中にあるべきだというアイデアを持っていました。

それをどうやって実現するか。大きなネットワークを構築する必要がある。それがroofnetでした。

そしてサムサラでは、少し異なる焦点があります。私たちは物理的オペレーションの世界に焦点を当てています。エネルギー公益事業、建設、物流など、全てのインフラストラクチャー企業を考えてみてください。これらすべての現実世界の物理的産業です。アイデアは、これらすべてのデータと今やAIを使って、リスク削減、効率改善、持続可能性の向上を通じた現実世界へのインパクトでした。

物理AIの転換点

なるほど。物理AIはついに転換点を迎えているように感じます。あなたは10年近くサムサラを構築してきました。当時何を見ていましたか。そしてこの分野はどう変化しましたか。なぜ今なのでしょうか。

そうですね。10年前の会社創業時まで遡ると、私たちにはいくつかの直感的な賭けや推測がありました。

その時点での「なぜ今か」というのは、接続性でした。私たちはMoroiの旅を経験していて、インターネットアクセスが希少で高価なものからユビキタスなものになるのを見てきました。これは参考までに2015年のことです。

私たちは基本的に大量のデータを処理する能力が本当にオンラインになるのを見ました。クラウドが成熟していました。GPUの波の始まりを見ていました。

2015年に戻ると、Nvidiaはプレイヤーでしたし、組み込みGPUで多くの興味深いことをしていました。当時Nintendo Switchを手に取ると、素晴らしいグラフィックスがありましたが、手のひらに収まりました。ですから、コンピューティングが本当に良くなっているのを見ました。

それからセンサー、特にカメラが本当に良くなっているのを見ました。これはおそらくiPhoneの発売から7、8年後だったからです。

カメラは驚異的になっていました。これら3つを組み合わせると、接続性、コンピューティング、そしてセンサー、カメラがあります。そして私たちは、これが現実世界の文脈でデータを処理する能力に関して、完全な大変革の要素になると言いました。

素晴らしい。さて、物理AIの最前線に関する技術的な質問についてもっと深く議論するのを楽しみにしています。その前に、リスナーの皆さんのためにサムサラについて一言お願いできますか。ビジネスのどれくらいが、私の印象では商用トラック輸送に根ざしていると思うのですが、今日ではビジネスのどれくらいがそれで、サムサラの最終的なビジョンをどう見ていますか。

はい、私たちは物理的オペレーションの広い世界に本当に焦点を当てています。

ですから、これらすべての異なる種類の産業について考えてみてください。トラック輸送は確かにその1つです。それは私たちのビジネスの約20から25%です。ですから物流と道路上の大型トラックです。私たちのビジネスの多くは今、フィールドサービスと建設に関連しています。ですから他の大きなフロントライン産業です。

しかし私たちは今、公共部門のような分野でも仕事を始めています。

地方自治体と仕事をしています。学生輸送と仕事をしています。ですから北米最大の黄色いスクールバス運営会社と契約したばかりで、それはかなりクールです。

また航空のような産業でも仕事をしています。ですから、地球のインフラストラクチャーを本当に動かしている労働集約的で資産集約的な産業について考えてみてください。

素晴らしいですね。

あなたの「当時、帯域幅、コンピューティング、カメラに関する『なぜ今か』があった」というコメントに戻ってもいいですか。

はい。

AIで何が起こるかについて、必ずしも水晶玉を持っていたわけではないように聞こえます。

そうですね。

しかし、あなたは何となく歴史の正しい側にいると感じていて、それらの原材料があれば、時間とともにますます洗練されたことができるようになるだろうと。

はい。

私が興味を持っているのは、今日多くの創業者が似たような立場にいると感じています。誰も水晶玉を持っていません。何が来るのか本当には分かりません。しかし、明日持つことになる能力が今日持っている能力とは非常に異なり、より良いものになることは何となく分かっています。

はい。

ですから質問は、世界がどこに向かっているかについて方向性のある感覚を持っていたので、それがビジネスの構築方法にどう影響したかということです。この不可避な方向性を予期して特別にしたことはありましましたか。

実際、歴史的文脈が重要です。

私たちの最初の会社Moroiは、Sequoiaによって資金提供されましたが、私たちはドメインエキスパートでした。ですから、博士課程で取り組んでいたネットワーキングについて膨大な知識を持っていました。サムサラでは、正反対でした。このドメインについて何も知りませんでした。商用トラックを運転したこともなければ、倉庫で働いたこともありませんでした。

ですから、私たちはそれについて目を開いていました。私たちが持っていたのは、それらの基盤技術の複利的な進化率に関する直感的な感覚でした。私たちは、この本当に興味深い問題空間、物理的オペレーションの世界があると言いました。それは10年前は特に見過ごされていました。今のようにインフラストラクチャーについて誰も本当には話していませんでした。

しかし、ツールの面で舞台裏では物事が非常に急速に変化しています。ですから、その直感がまさに私たちを動かしていたものであり、私たちは、たとえそれがまだ主流でなくても、まだ準備ができていなくても、確実に5年から10年後、つまり今頃には、このようなことをすることが可能になると言いました。

ですから、現在の創業者の多くにとって、AIモデルの能力を見ると、ChatGPTの瞬間が起こったときでさえ、これらのモデルは完璧ではありませんでした。過去2、3年でずっと良くなっていますし、次の2、3年でさらに良くなるでしょう。技術者はそれを、消費者や顧客がまだ見ていないかもしれない方法で理解していると思います。

ハードウェアとソフトウェアの交差点

あなたは組み込みシステムのバックグラウンドを持っていると思いますし、ハードウェアとソフトウェアの世界の交差点で活動してきたユニークな人の1人です。物理世界でAIを構築することを、大きなデータセンターでAIを実行することと異なるものにしているものは何ですか。

いくつかのことがあります。

実際、それは非常に楽しいです。物理世界は非常に多様です。今、多くの企業が物理的知能やワールドモデルに取り組んでいるのを見ますが、それはトレーニングデータセットが本当に広大だからです。

私たちの製品について考えると、数百万台の車両の道路上に設置されるダッシュカムのような製品があります。それらは米国の道路の99%を見ています。それは信じられないデータセットです。都市部、郊外、住宅地、天気があります。ですから、これらすべての興味深い例外的なケースを見ます。

ですから、トレーニングデータは本当に興味深いです。そして、すべての推論と基本的にパターンマッチングを適用できるものも興味深いです。

ですから、それが最も楽しい部分だと思います。しかし最も挑戦的な部分は、それがどれほどメッシーで分散しているかということです。ですから、私たちの製品にとって、すべてのデータをクラウドにストリーミングすることは実用的ではありません。それは狂ったような帯域幅の請求書になるでしょう。数百万のビデオストリームについて考えると、推論を常に実行するには、かなり大規模なデータセンターが必要です。

ですから、私たちははるかに分散したアーキテクチャを持っていて、実際にカメラ自体で実行します。それがコンピューティングと電力のフットプリントを変えます。私たちは2から10ワットについて話しています。キロワットのようなものではありません。

しかし、数百万台あるので、はるかに多くのことができます。

なるほど。それはどのような感じですか。これらの大規模なLLMのいくつか、今人々が取り組んでいる画像モデルでさえ、非常に大きいと考えています。

2から10ワットで非常に特化した小さなモデルを実行しているのですか。それでは多くを与えてくれません。

多くの余地を与えてくれませんし、それは楽しいエンジニアリングの問題です。ですから、これらの最先端モデルについて考えると、それらは非常に大きいです。数億のパラメータや数十億のパラメータについて話しています。それは単純に不可能です。

ですから、私たちのフットプリントは、携帯電話で実行できるものにはるかに似ています。

ですから、小さくはありません。マイクロコントローラーではありません。Linuxを実行します。数百メガバイトのメモリ、おそらくギガバイトを持っています。しかし、大きなデータセンターのようではありません。ですから、私たちが行う傾向があるのは、クラウドでモデルをトレーニングし、基本的にそれらを蒸留するか、教師モデルを使用することです。大きなモデルを使って、私たちのユースケース用に本当に設計された小さなモデルに基本的に指示します。なぜなら、フランスの首都が何かに答える必要はないからです。

それはダッシュカムが遭遇しなければならないことではありません。しかし、道路上のリスクプロファイルが何であるかを理解できる必要があります。ですから、タスクに関連するデータでそれをトレーニングします。

米国の高速道路や米国の道路の99%を見ているというデータのうち、どれくらいのデータを利用できますか。どれくらいのデータを実際に利用していますか。

はい。

多くを利用できますし、基本的にこの全体のデータセット上でトレーニングする能力があります。エッジでトークナイザーを実行してこれらすべてをクラウドに送信したら、それで何をするのかという非常に実用的な質問があります。クールなのは、今年それで行うことが2、3年前にそれで行えたことよりもはるかに興味深いということです。

2、3年前、これらの製品はリスクを削減するというこのアイデアを中心に本当に始まりました。ですから、私たちが解決しようとしている問題について考えると、私たちのオペレーション顧客は毎日これらの道路で活動しています。実際、彼らが行う最もリスクの高いことは、建設や石油・ガスで働くことよりも、高速道路を運転して現場に行き来することです。ほとんどの高重症度リスクが発生するのはそこです。

ですから、質問は、これらすべての画像とトークンを取り、それをリスク信号に変えるにはどうするかということです。数年前、私たちは、現在見ている最大のリスクは携帯電話の使用だと言いました。人々は大型トラックを運転しながら携帯端末を使っていて、それは非常にリスクが高いのです。ですから、そのための検出器を構築しました。

それを行い、この問題を解決できる、携帯電話を検出できると言います。他に何がリスクを引き起こしますか。今、天気のようなものが見えています。天気は常にリスク要因でしたが、それは全く新しいものではありません。しかし、今ではこれらのかなり洗練されたモデルを使用して検出できるものです。AlexNetスタイルのモデルのような古い畳み込みネットワークを使用して天気検出器をトレーニングすると、多くのことを間違えるでしょう。道路状況が分からないでしょう。今日持っているようなより洗練されたモデルを使用すると、本当にそれを把握できます。

ですから、クールなのは、モデルの能力が向上し、データセットが増加するにつれて、2、3年ごとに起こるこれらのアンロックがあるということです。ですから、これら2つのことが本当に私たちに有利に働きます。

最も楽しみにしている今後のアンロックはありますか。

製品のロードマップの観点で、または一般的にですか。

製品の新しいユースケースや新しい機能をアンロックしようとしている新しい能力は。

膨大な量のデータに対して推論を可能にする信じられないほどの基盤モデルの能力を見ているだけだと感じます。ですから、歴史的に私たちが行ったことは、その瞬間に何が起こっているかを理解することでした。

ですから、携帯電話の検出やシートベルトを着用していない、または車間距離のようなことを言いました。今、トリップの過程で本当に見始めることができ、リスクのあるネガティブなダウンサイドイベントのようなものを検出するだけでなく、実際に良い行動も検出できます。

そして私はそれについて本当に興奮しています。なぜなら、フロントラインワーカーは80、90%の時間、素晴らしい仕事をしているからです。誰もそれを認識することができません。なぜなら誰もそれを見ないからです。ですから、素晴らしいのは、誰かが素晴らしいことをしているのを今見ることができ、ハイタッチや何らかの認識や賞賛を与えることができ、それが人々の一日を作り、これらすべてが実行されていることの予期しない副産物のようなクールなものだということです。

ですから、とにかく、それは予期しないアップサイドのようなものです。

なるほど。

ビデオ推論モデルがそれを可能にすると思いますか。エッジで巨大なモデルは実行できないことは知っていますが、サーバーサイドでLLMを活用することをしていますか。

はい、それを言及すべきでした。ですから、モデルは接続されています。

エッジでは膨大な推論が実行されています。運転しているときは継続的なリスクがあるので、継続的に実行されています。それから、それらのトークンを取得してストリーミングしています。それに加えて、画像、ビデオ、他の種類のテレメトリーがあります。

それから、クラウドであらゆる種類の洗練されたことを実行できます。ですから、事故が起こったときに本当に何が起こったかを理解する必要がある場合、完全なビデオ言語モデル、基本的に推論モデルをクラウドで実行できます。それは、ああこれは実際には防衛的な運転で、この人が割り込まれた、またはこれらが条件だったと言うことができます。それは本当にクールです。

5年前にはそれをすることができませんでした。

ワールドモデルを信じますか。含みのある質問ですが。

信じます。慎重に楽観的です。しかし、膨大な量のデータが必要だと思います。

なるほど。

独自のワールドモデルをトレーニングしていますか。

独自のワールドモデルを構築していません。それには非常に特定の種類の焦点が必要だと思いますが、独自の基盤モデルをトレーニングしないのと同じように、いつかそれらを使用することを楽しみにしています。

なるほど。そして、役立つかもしれない信じられないほど豊富なデータセットを持っていると想像します。

持っています。はい。システムで年間約900億マイルを見ています。ですから、多くの運転です。

なるほど。構築したセンサーフットプリントは、技術オタクの夢のようですね。ほとんどの人は接続された世界を夢見ていて、物理世界のこれらすべての異なる属性に関する多くのテレメトリーを持つことができるはずです。

しかし、私が知る限り、あなたは本当に意味のある方法で物理世界にセンサーを配置しに出て行った数少ない企業の1つです。

なぜそうだと思いますか。そして、その夢を実現する鍵は何ですか。技術オタクの夢であるだけではなく。

はい、まず第一に、実際にそこにものを出すには村が必要です。

そして、それがおそらく純粋なソフトウェアと物理世界のもう1つの大きな違いだと思います。はい。製品をインストールする必要があるので、数百万台の車両にインストールされています。フロントラインワークフォースに、これが何で、何をしているかについてトレーニングする必要があります。

それから、これらすべての顧客に、初日から何らかの価値を提供する必要があります。彼らはそこから何かを得なければなりません。

これらすべてを組み合わせると、この大きなフットプリントが得られます。しかし、それは困難でした。なぜなら、現在の規模では、これを行い、変革管理、インストール、そのようなすべてのことを行うために数千人が必要だからです。このスケールのデータセットを持つ企業はいくつかありますが、それはTeslaとおそらく私たちです。それからWaymoです。数千台のWaymoがありますが、数百万台ではありません。将来的には数百万台になるかもしれませんが、まだそこには至っていません。

ですから、これらのものをそこに出すために、純粋な意志力だけでどれだけの努力が必要かが分かります。

技術創業者の成長とGo-to-Market実行

そういえば、今、あなたのような技術創業者がたくさんいると思います。

何かクールなものを構築し、今、AI波がもたらしたと思われる規模への狂ったようなスーパーチャージされた競争に遭遇しています。

ですから、質問はあなたは技術創業者です。サムサラとMoroiの両方がgo-to-market実行で知られていると思います。

ですから、質問は、go-to-market実行があなたの成功にとってどれほど重要だったか、そして技術創業者として、それが最初からそれほど重要になることは明白だったのか、あるいはgo-to-market実行の重要性を理解する上でのあなたの旅はどのようなものだったかということです。

はい。20年を頭の中で本当に速く再生しています。ですから、Moroiを始めたとき、その時点で私は人生で何も売ったことがありませんでした。実際、エンジニアリングオタクとして、学校でキャンディーバーを売らなければならない募金活動のような、何かを売らなければならない状況を避けました。私は「このために誰かウェブサイトが必要ですか」みたいな感じでした。何らかの方法で逃げようとします。

ですから、バックグラウンドとして私は本当にセールスパーソンではありませんでしたし、家族の誰もセールスをしたことがありませんでした。ですから、それは非常に馴染みのないものでした。私を夢中にさせたのは、これが製品をそこに出すために必要なことだというアイデアでした。そして製品がそこになければ、インパクトを持っていません。

ですから、インパクトに駆り立てられているなら、それがあなたを動機づけるものであるなら、人々がそれを使っているのを見るのは楽しいですよね。

それから、これが私たちを持続可能にするものです。ですから、Moroiでは、2006年の間に会社を成長させ、2012年に買収されました。その中間には大金融危機がありました。

当時は多くの資金がありませんでした。リスク資本はただオフになっていました。ですから、基本的に会社を損益分岐点で運営させなければなりませんでした。

そして、それが本当に私たちに、持続可能な販売実行と非常に予測可能なモデルをどのように持つかを理解しなければならないと確信させたものです。そしてエンジニアとして、私たちは「ねえ、これは実際には大きなエンジニアリングの問題だ」と考えました。

そしてそれがサムサラで私たちに残りました。私たちは大規模なインパクトについて話しています。

途中で資本を調達しましたが、実際には会社の収益、粗利益から単にはるかに多くを再投資しました。ですから、私たちの数字を見ると、今は上場しているので、バランスシートを遡ることができます。R&D、カスタマーサクセス、そのようなすべてのことに、そこにものを出すだけで、おそらく30億ドル近くを投資したことが分かります。

それは多くの販売があって初めて可能です。

ですから、理由を理解すると、それを受け入れて「これを理解するつもりだ」と言うことができます。それは私たちにとって自然ではありませんでしたが、結局やらなければならないピボットであり、それを理解できて本当に良かったですし、毎年それをより良くしてきています。

なるほど。

Moroiでは、あなたはドメインエキスパートでした。サムサラでは、会社を始めたときはそうではありませんでした。なぜそのドメインを選んだのですか。

好奇心だったと思います。

これは好奇心旺盛なオタクのルーツに少し戻るようなもので、本やものがどのように機能するかについて読んだり、疑問に思ったりします。

ですから、Moroiの後、実際には別の会社を始める計画はありませんでした。しばらくの間、大学院に戻って博士号を終えようと思っていました。私の共同創業者John Bickettは、彼ははるかに賢いです。彼は「それは決してうまくいかない」みたいな感じでした。しかし、あなたはそれを行い、その期間中に学術研究は非常に長いフィードバックループで遅いサイクルだと気づきましたが、私の注意を引いた他の多くの興味深い問題がありました。

その時点でエネルギーに興味を持ったと思います。ですから、電気グリッドがどのように機能するか、または当時は太陽光発電と再生可能エネルギーがオンラインになっていたので機能しなかったことについて学んでいました。原子力、衛星、そのようなものについて興味を持ち始めました。ですから、1つのことにレーザーフォーカスしていたときに、すべてに心を開くことができるのは楽しいことです。

なるほど。

そして何度も何度も、私は、そしてJohnもインフラストラクチャーのこの世界に惹かれていることに気づきました。ですから、それはかなり見過ごされていると感じた世界のこの部分についての好奇心でした。

本当にクールです。自律性についてどう思いますか。それは含みのある質問かもしれません。はい。

しかし、2年前、私はWaymoに乗ることを避けていました。今は考えもしません。Waymoに乗っていない時よりもWaymoの方が安全だと感じます。あなたの見解は何ですか。

それについて非常に興奮しています。非常に強気です。長い間待たされてきたと思います。スタンフォードで学部生だったとき、最初のDARPA Grand Challenge車を行っていました。

ですから、今から20年以上前のことです。

そしてあなたが言ったように、Waymoはプロトタイプテストのようなものから、Waymoを好むという状態になりました。非常に一貫しています。

好きなことがたくさんあります。ですから、私たちの見解は、自律性が起こり、実際に世界の運用強度を増加させるということです。考えてみてください。深夜0時から朝8時までの間、いわゆる第三シフトがありますよね。人々は眠っているため、その時間帯に働かない傾向があります。物流のようなオペレーションがそのシフト中も稼働できると想像してみてください。

それから同じように、あなたがフィールドサービスの技術者で部品が必要だと想像してみてください。その部品がただ配達されてくるとしたら、どれほど素晴らしいでしょうか。

これはオペレーションにとって素晴らしい補完になるでしょう。ですから、私たちはそれのファンです。

私たちの見解は、これはorではなくandだと考えています。

そして興味深いのは、通常自動化が導入されると、ボリュームが増加することです。なぜならコストが下がるからです。人々が気づいていないだけで、実際には需要がはるかに多く存在しています。なぜなら、時には「ええ、その部品は使えるけど、誰かが車で届けてくれるのに50ドルかかるなら配達してもらう必要はない」と言うでしょう。はい。

もしコストが5ドル、あるいはゼロドルだったら、どれほど素晴らしいでしょうか。ですから、私たちはこれが世界の動くスピードを増加させるものだと考えています。

道路だけで起こると思いますか、それとも倉庫やフォークリフトなどを持つ顧客がいますか。自律性がこれらすべてのセクターを襲うと思いますか。

自律性はすでに倉庫を襲ったと思います。

大規模な物流倉庫を持つ多くの顧客がいますが、本当に約10年前、彼らは意味のある方法で自動化され始め、重度に産業化された環境に自動化を見ずに行くことは私にとって非常に珍しいです。そしてそれはリフトシステムから大きなアームまで、あらゆるものです。

そして実際、それは倉庫の人々に歓迎されています。なぜなら、それが怪我を減らすのに役立つからです。ですから、考えてみてください。フロントラインワーカーは毎日仕事をするときに自分自身をリスクにさらしています。はい。パレットを持ち上げたり、そのようなことをして怪我をするのは良い結果ではありません。

ですから、それは道路上で見ようとしているものの良いプレビューだと思います。そしてその後、建設現場と作業現場があります。

なるほど。ヒューマノイド、イエスかノーか。

慎重に楽観的です。少し怖いです。正直に言います。頭や手などがなくて歩き回っているのを見ると、不気味な不気味の谷のようなものにいると感じます。

Neo4を見ましたか。

見ました。それは友好的なものですね。はい。

しかし、それは10年前の自動運転がどこにいたかを思い出させます。ですから、おそらく明日ではありませんが、避けられないと感じます。ですから、能力が増加するにつれて、非常に刺激的になるでしょう。

なるほど。

時間とともにますます多くの自律性を持つようになるにつれて、サムサラが世界で果たす役割はどのように変化しますか。

私はそれをデジタル変革として考えています。

ですから、大きく拡大すると、顧客が興奮しているのは、場合によっては50年、100年続いているこれらのオペレーションをどのようにデジタル化するかということです。

そして私たちの顧客のほとんどは、新しい技術を歓迎します。ですから、彼らは1970年代のようなルート計画のためにコンピューターを採用しました。

ですから、彼らは技術に反対していません。それは役立つでしょうか。関連性があるでしょうか。ですから、私たちの見解は、すべてのオペレーションを見るため、これらすべての異なるオペレーションが相互作用するためのプラットフォームが必要になるということです。フロントラインワーカー、すべての車両、資産を見ることができ、何がメンテナンスを必要としているかを知ることができます。

これらすべての問題は常緑です。今から20、30年後も資産をメンテナンスしたいでしょう。おそらくそれらはロボットで、独自に移動するかもしれませんが、それでもメンテナンスが必要です。

それから、顧客に面している、またはエンドカスタマーに面しているチームがいるとき、うまくいけば何千人もの人々をまだオーケストレーションする必要があります。そして彼らは舞台裏でロボットやヒューマノイド、あらゆる種類のものから助けを得るかもしれませんが、オペレーション全体をどのように実行しますか。ですから、それが私たちが焦点を当てているものです。特定の製品や技術ではなく、全体像です。

物理世界におけるAIと人間の相互作用

物理世界で、そしてあなたがサービスする産業で、人間とAIが相互作用する未来をどのように見ていますか。

彼らはますます近くなっていると思います。ですから、10年前にSimsaraを始めたとき、私たちの顧客のほとんどは多くのペンと紙のプロセスで実行していました。

2015年、それは遠い過去ではありませんよね。ペンと紙からアプリに移行したことは本当に変化でした。AIが導入されると、貨物仲介のための音声ボットのようなものを使用している多くの人を見ます。それは本当に昨年の全く新しい現象です。

そして彼らは非常に迅速にそれを受け入れました。それはタスクを自動化しています。ですから、私はそれを高いタスク強度があるところ、多くの反復的なタスクワークがあるところ、AIが助けることができるところと考えています。絶対に。ですから、そこで非常に高い採用率を見ています。

少なくともまだ変わっていないものは、物理的な作業自体がまだ人々によって行われていることです。なぜなら、多くの例外処理が必要だからです。

ですから、建設は素晴らしい例です。建設には非常に多くの多様性があります。自動車製造のように自動化できる地点にはまだ至っていません。

AIが、人間のリスクの高い行動を防ぐものだと述べましたね。これらの運用環境で実際により良いパフォーマンスを発揮するように人間をコーチしているのも見ていますか。

はい。

ですから、まずリスクについて考えると、コーチングは大きな違いを生みます。ですから、携帯電話を置いてくださいのようなリスク検出がありますが、それがあなたの習慣である場合、実際に習慣を破るのを助けるためにあなたをコーチしたいです。

そして、顧客に対して持つことができるインパクトを見ると、リスクを75%ほど削減することがよくあります。

ですから、リスクの4分の3がシステムから出ます。おそらくその半分は車内での自動的な瞬間的な警告から来る可能性があり、残りの半分はコーチングから来ます。それから、同じコーチングを燃費効率のようなものに適用できます。実際に本当にスマートな方法で重機を操作するようにドライバーをトレーニングできますし、ゲーム化できます。

ですから、それがAIが持つクールな機会の種類です。プロセスは人間ができるよりも膨大な量のデータ、何千台または何百万台の車両にわたるパターンを見て、それを実行可能な洞察に変えます。それがコーチングです。

ですから、それを安全性に適用できますし、効率に適用できます。それはかなりクールです。

製品ポートフォリオの組織原理は何ですか。ダッシュカムから始まり、そこから拡大しました。

はい。

製品ポートフォリオがどのように拡大してきたか、そして未来をどのように見ているかについて教えてください。

はい。ですから、実際にはGPS追跡またはテレマティクスから始めました。ですから、2015年、ダッシュカムはまだ実用的ではありませんでした。

コストのためですか。

はい、コスト、そして帯域幅のバックホールコストの両方ですが、カメラのコストなどもです。

しかし私たちにとって驚きだったのは、2015年に私たちが入ったほとんどの運用環境で、フィールドチームがどこにいるか誰も分からなかったことです。リアルタイムではありませんでした。そして断絶がありました。なぜなら、UberとDoor Dashが始まっていたからです。

ですから、奇妙でした。ギグエコノミーにはリアルタイム追跡がありましたが、物流、長距離物流エコノミーは、5分から15分ごとのようなパンくずをまだ取得していました。

そして、これはおそらくショーを聞くほとんどの人より前のことですが、Map Questというプラットフォームがあり、Google Mapsに先行していました。90年代後半のMap Quest、ヴィンテージマップですね。

Sonyはその頃にはいませんでした。Map Questの方向を印刷して、どこに行くかを把握するために紙を持って行かなければなりませんでした。

そしてそれはMinecraftレベルのグラフィックスのような、粒状でした。

驚くべき部分は、当時私たちの顧客がMap Questのプリントアウトを使っていて、GPS追跡のシステムがMap Questの上に構築されていたことです。ですから、私は現場に行って「わあ、これで助けられます」と言いました。ですから、それが製品第1号でした。GPS追跡でした。

それが基本的に私たちを立ち上げ、顧客に入り込みました。そこから、実際に彼らにとってより大きな課題はリスクを管理することだと理解し始めました。なぜなら、その時点、2010年代半ばで、人々はポケットに携帯電話を持っていて、実際に彼らは私たちに尋ねました。多くの事故に遭っています。あなたのシステムとうまく機能する推奨するダッシュカムはありますか。

ですから、私たちは、あなたのために1つ構築したら使いますかと言いました。彼らは、ええ、絶対にと言いました。

ですから、Johnは覚えています。週末にAmazonのようなところに行き、ウェブカメラを注文し、USBポートに接続し、週末にかけて基本的なウェブカメラを動作させるためのコードを書きました。翌週、顧客にそれを持って行き、彼らはそれを試し、気に入り、それから彼らと一緒にビデオを見ていました。そして人々が事故に遭うにつれて、彼らは携帯電話を出しているのが見えました。

ですから、私たちはそのための検出を構築できるかと言いました。ですから、それがダッシュカムのAI部分が生まれた場所です。それは非常に反復的です。

そしてそれは今、私たちの最大の製品になりましたが、最初の製品と一緒に販売されています。ですから、ポートフォリオ戦略について尋ねました。それは同心円です。始めたことを続けることです。

コアのユースケース、隣接するユースケース。他に何ができますか。他に何ができますか。他に何ができますか。そして今、約10の製品があります。

本当にクールです。バックホールとネットワーク帯域幅が制約条件だというコメントがありましたね。Starlinkの採用の拡大と、どこでもインターネットが、物理世界で可能なことを変えると思うかどうかに興味があります。

絶対に。

ですから、私たちは3Gから4Gへの移行の頃にサムサラを始めました。そして、アンロックは実際にYouTubeでした。ですから、2015年を覚えていれば、誰もがYouTubeや野球の試合などを携帯電話で見始めていました。それがキャリアでのデータ消費を大幅に増加させ、ギガバイトあたりの限界費用が大幅に下がり、私たちはそれに便乗することができました。それは本当にクールでした。

今、5Gだけでなく、ネットワークがさらに投資しているという点で、似たようなことが起こっていると思います。はい。

しかし今は衛星です。Starlinkを構築するコストは膨大です。数百億が費やされているのか分かりませんが、打ち上げ能力などもあります。

しかし、Starlinkに別のデバイスを追加する限界費用はかなり低いです。そしてそれはあらゆるネットワーク効果のコストのようなものです。

ですから、私たちはそれについて興奮しています。なぜなら、それが最後の1%のカバレッジを得るのを助けてくれるからです。

そして私たちの顧客の多くは、非常に遠隔地の田舎にいます。

石油やガスのようなエネルギー分野の多くの顧客がいます。はい。

彼らが活動する場所には道路がありませんし、セルラーカバレッジもそれほど多くありません。

それがエッジでAIを実行する制約のいくつかを取り除くと思いますか。つまり、今日はデータの一部のパーセンテージしかストリーミングバックできず、多くの機内コンピューティングを行っています。

はい。はい。

すべてのデータを送受信するのがはるかに速く安価な、どこでもインターネットがある世界では、多くをサーバーサイドで行うことができ、はるかに多くのことができますか。

もっと多くのことができるでしょうが、面白いのは、安くなると、もっとやる方法を見つけるということです。ですから、それは圧縮の問題のようなものです。そして、ワークロードが静的であれば、GPSデータをクラウドに取得しようとしているだけであれば、ええ、すべてストリーミングしてください。大したことではありません。外向きカメラから1秒あたり1フレームのビデオをクラウドに取得しようとしている場合、問題ありません。しかし、トラックの360度ビュー、8台のカメラからHDビデオが必要な場合、

それは多くのビデオです。

それから、取得する他のすべてのテレメトリーと一緒に必要な場合、かなり大きくなります。

ですから、潜在的にそれを行うことができると思います。

しかし、それの一部をエッジにプッシュして圧縮できれば、誰もがそれから恩恵を受けます。制御と自律性が最終的にクラウドで実行される可能性があると思いますか、それとも人々が常にデバイスで実行したいものだと思いますか。

それについては、おそらく長い間エッジコンピューティングを見ることになると思います。

そして実際、少し技術的になると、そこでの課題の1つは電力とコンピューティングとコストに関するものでした。ですから、Teslaのフルセルフドライビングコンピューターのようなものについて考えると、それは数千ドルです。何百ワットものエネルギーを消費し、彼らは規模でそれを本当に実用的にしている最初の会社です。

Waymoはおそらくもう少しです。

ですから、安全性が非常に重要なので、そのような種類のアプローチを引き続き見ると思います。キャブに人間がいますし、道路に人間がいます。

ネットワーク障害が人々の生活に影響を与えるようなことは望みません。

なるほど。

2030年に座っているとしたら、AIが物理世界と物理的オペレーションを変革した最大の方法は何だと思いますか。

いくつかの考えがあります。1つは、私たちはかなり初期段階にいるということです。2025年の終わりにいます。物理的オペレーションにおけるAI採用曲線は、まだその基盤にいます。

ですから、2030年までには、アプリの使用が5、10年前よりも今はるかに主流になっているのと同じように、曲線を駆け上がり、はるかに主流になるでしょう。

ですから、現在の技術が基本的にはるかに多くの拡散を経験するのを見ると思います。全く新しい技術を見ると思います。拡張現実とウェアラブルについて非常に興奮しています。それはフロントラインワークフォースに大きな違いを生むでしょう。彼らは手を自由にしなければならないところです。

そしてそれはAIを彼らの耳に持ち込みます。多くの人がAirPodsを入れていますよね。

しかし、視覚的フィードバックを持つこと、環境で何が起こっているかを理解するためにVLMのようなものを実行できることは、2030年には可能になるでしょう。まだ完全には可能ではありませんが、感じることができます。まさに瀬戸際にいます。

おそらくメガネになるでしょう。おそらく秘密にされている新しいデバイスの一部になるでしょう。

はい。

AIの個人的な使用と価値

AIの個人的なお気に入りの使用法は何ですか。

AIの個人的な使用法。

私は、仕事に行く途中や帰りの運転中に、音声モデルのようなものとAIと話すのが大好きです。常に何か特定のことについてではありません。心にあることが何でもです。

ですから、それが大好きです。

例えばChatGPT Plusの大ファンになりました。ベイエリアで起こっているイベントについて教えてくれるのはクールです。3人の子供がいて、彼らの興味を知っています。

ですから、AIが自分自身よりもあなたをよく知ることができるという全体的なアイデアは本当に深遠です。

ですから、私が個人的な側面で好きなのは、音楽のパフォーマンスのような、私たちが知らなかったであろう新しい体験を露出してくれることです。子供たちが好きそうなものです。

なるほど。はい。顧客に与える価値のうち、どれくらいがAIのおかげだと思いますか。構築している他のすべての技術と比較して。

興味深い質問です。

本当に分けていません。なぜなら、データには価値がありますが、誰もデータを見なければ、インパクトを持たないからです。ですから、顧客から聞いたことの1つは、データ過多に関する懸念です。すべての車両、すべてのフロントラインワーカー、すべての資産からセンサーストリームがある場合、それで何をしますか。

ですから、AIは本当に実行可能な何かにそれを蒸留するのを助けるという点でかなり素晴らしいです。

ですから、2つをもう分けることはできないと思います。

しかし、それは変革的です。ゲームチェンジャーです。そして私は多くの時間を道で過ごします。先週はテキサスにいました。大手食品流通業者、大手石油・ガス会社のようなところで。Home Depotのようなところで時間を過ごしました。

そして彼らが非常に創造的な方法でデータを使用しているのを聞くのはクールですし、私たちと始めたときにロードマップにはなかったものです。しかし彼らは「ねえ、このデータを使ってタイムカードのパンチを助けることができれば、つまり誰かがシフトを始められて、オフィスまで歩く必要がなければ、それは素晴らしい」と言っています。

あるいは、このデータをエンド顧客と共有して、もうすぐそこに着く、または遅れていることを知らせることができれば、それはかなりクールです。ですから、これらの創発的なユースケースを見るのは本当に素晴らしいです。

本当にクールです。AIがこれらすべての異なるワークフローや日常生活に浸透できるすべての方法を夢見るのは素晴らしいことです。

はい。そしてそれは決して1つのことではありません。私がこれについて好きなのは、四半期ごとに新しいユースケースに触れることです。そしてその多くは、顧客と時間を過ごし、彼らのオペレーションを理解し、それから「ねえ、もしそれをしたら、ETA配達の電話をかける音声ボットがあなたに役立つでしょうか」と思いつくことです。

そして私たちの顧客の多くは、それが可能であることさえ知りません。彼らは一度も見たことがありません。

地政学とインフラストラクチャーの現代化

アメリカ対中国の地政学についての話が非常に多く、私たちの産業基盤が本当に追いつく必要がある、ロボティクスや製造、物理AIが本当に追いつく必要があるという点で、あなたの見解に興味があります。

顧客の会話を実際に加速させたり、何らかの形でビジネスに影響を与えたりするのを見たことがありますか。

顧客の会話では見ていません。現代化する必要があり、インフラストラクチャーの運営方法を再考する方法についての明白な感覚があると思います。ですから、私たちの顧客の多くは今、データセンターの建設に関与しています。

彼らはエネルギー公益事業、建設会社です。そこで多くのことが起こっていますし、それが誰もに「これが私たちにとって何を意味するのか、私たちのビジネスについて何が違うべきか」と考えさせていると思います。ですから、多くの内省が進行しています。米国対中国のような感じは得ていませんが、今は違うやり方でこれをできるでしょうかというもっとです。私たちは21世紀にしっかりといます。以前の世代がこれらのオペレーションを運営していた方法と今は何が違うべきでしょうか。

素晴らしい。

あなたは複数回の伝説的な創業者でした。

今AIを構築している若い技術創業者へのアドバイスはありますか。

以前にこれを行ったことがあるか、初めてやっているかに関わらず、構築するのに素晴らしい時期だと思います。

利用可能なツールは信じられないほどですし、ある程度すべてが拡大または増幅されていますよね。ですから、CodecsやCursorやこれらすべての自動化されたコーディングツールのようなものについて考えると、今アイデアがあれば、Samaraを始めたとき、Moroiを始めたときよりもはるかに簡単に何か実際のものに現実化できます。当時、私たちはサーバーをラッキングしていました。Dellからサーバーを購入して、データセンターに持って行って設置していました。想像できますか。今はそれがどれほど遅く感じるか。

想像できません。

実際、想像するのは難しいです。しかしそれは起こっていて、今から10年後を振り返って「Xをしたなんて信じられますか」と言うでしょう。Xが何かは分かりませんが、非常に違って感じるでしょう。

ですから、これらの指数関数的な曲線にいるのは楽しいですし、その最良の場所は構築していることです。

なるほど。本当にクールです。時間を割いてあなたのストーリーとサムサラでAI側で取り組んでいることを共有してくださってありがとうございました。

ありがとうございます。お招きいただきありがとうございました。

コメント

タイトルとURLをコピーしました