Fusion FundのLu Zhangが語るAIインフラ、データ品質、エッジAI、そしてベンチャーの未来

本動画は、Fusion Fundの創設者であるLu Zhang氏をゲストに迎え、AIインフラストラクチャやデータ品質、エッジAIの未来について深く掘り下げたインタビューである。起業家から投資家へと転身した同氏の独自の視点から、アーリーステージのスタートアップが直面する課題、特にAIモデルよりも独自で高品質なデータセットの重要性が語られている。また、ヘルスケアなどの規制産業におけるデータの扱い方、Otter.aiの成功事例を通じたデータキュレーションの価値、Nvidiaとの強固なパートナーシップやGTCでの経験など、多岐にわたるトピックが解説されている。さらに、環境問題に対するAIの影響や、今後のベンチャー投資のあり方についても洞察に満ちた議論が展開されている。

Fusion Fund’s Lu Zhang on AI Infrastructure, Data Quality, Edge AI & the Future of Venture

In this episode of the DataStorage.com podcast, John sits down with Lu Zhang, Founder and Managing Partner of Fusion Fun...

ゲスト紹介と起業家から投資家への道のり
AIインフラストラクチャとデータ品質の重要性
エッジAIと規制産業におけるガバナンス
データキュレーションとデータ品質の価値
言語モデルからワールドモデルへの進化とOtter.aiの事例
Fusion FundのAIアナリスト「Ada」
クラウドインフラの最適化とハイパースケーラーの役割
AIの環境への影響とデータ品質の役割
Nvidia GTCとスタートアップエコシステムの未来
Fusion Fundの今後

ゲスト紹介と起業家から投資家への道のり

皆さん、datasto.comのポッドキャストの新しいエピソードへようこそ。本日は素晴らしいゲスト、Fusion FundのLu Zhangさんをお迎えしています。ようこそ。

お招きいただきありがとうございます。

本当に、お迎えできて嬉しく思います。あなたは、かつてテクノロジー企業の創業者であり、現在は最も注目を集める複雑なテクノロジーやインフラストラクチャ企業に投資しているという、私たちが目にする2つの世界を経験されていますね。

そうですね。振り返ってみると、私は本当に幸運な道のりを歩んできたと感じています。最初は研究者として出発し、その後技術移転のプロセスを経て、特にディープテックのような技術を商業化するための最善の方法を目の当たりにし、最適な市場参入戦略やユースケースを見つけ出すことができました。この起業家としての道のりの後、ベンチャーキャピタリストと協力する経験も得て、それが最終的に過去10年、11年間にわたってFusion Fundで築き上げてきたものに貢献しています。私たちは単なる投資家ではなく、アーリーステージのスタートアップのライフサイクルを本当に理解しているからです。私たちがFusion Fundで構築したエコシステム全体や構造は、重要な局面で創業者をサポートするためのものなのです。

他の投資会社にはない、過去の創業者としての独自の視点が投資側に活かされていると思われますか。

元起業家としての事業運営経験があることは、間違いなく大きなプラスになります。第一に、アーリーステージの企業のライフサイクルは大きく異なります。ロケットの打ち上げのように真っ直ぐ上昇し続けるわけではありません。適切な期待値を持っていれば、常に浮き沈みがあることがわかります。早い段階で創業者と緊密に連携し、さまざまなシナリオにどう対処するかについて認識を合わせるのが簡単になります。

また、私自身がその道のりを経験してきたので、当然間違いも犯しましたし、どの部分がうまくいき、どの部分で間違え、どうすればもっと良くなるかも理解しています。こうした経験すべてが、私たちが単なる資金提供者ではなく、よりサポート力のある取締役会メンバーになるのに役立ちます。おっしゃる通り、市場は非常に速いスピードで進化しており、時には創業者が短期間で方向転換しなければならないこともあります。私たちは直接的な経験を提供できますし、根本的には、一緒に働くべき適切な創業者をどう見極めるかという点でも役立っています。私自身が経験者であり、チームも元起業家なので、私たちが創業者を選ぶ際、単にピッチデッキがどれだけ洗練されているかを見るわけではありません。実行力があり、明確な長期ビジョンを持ち、本当に大きなものを生み出せる創業者を見つけることが重要なのです。一緒にその場にいたからこそ、その部分も私たちの強みだと感じています。

AIインフラストラクチャとデータ品質の重要性

全くその通りですね。特に今の時代、大きなビジョンは常に重要です。アーリーステージの企業を構築する際、私たちはクラウドインフラストラクチャとその役割についてよく話しますが、あなたがアーリーステージの企業を見る際、彼らの技術のインフラストラクチャについて特に深く掘り下げるのはどのような点ですか。

そうですね、私たちが注目する企業には2つのタイプがあります。1つはAIアプリケーションに焦点を当てた企業で、もう1つはAIインフラストラクチャと呼ばれる企業です。現在のAIアプリケーション企業について言えば、もしある企業が私たちの最大の強みは自社のモデルですと言ってきたとしても、私は必ずしもそうではないと考えています。なぜなら、今は誰もがAPIにアクセスでき、同じようなAPIを呼び出すことができますし、オープンソースモデルを使用することもできるからです。オープンソースとクローズドソースのギャップは1、2年前に比べてはるかに小さくなっており、これは非常に幸運なタイミングです。また、オープンソースモデルの一部は小規模言語モデルであり、潜在的なトレーニングコストや推論コストの面でも非常に安価です。

ですから、私たちにとって重要なのは、既存のベンチマークより20%優れた効率的なモデルを構築できるかどうかではありません。2週間後にはそれが覆る可能性すらあるからです。それよりも第一に重要なのは、創業者が高品質なデータへの独自のアクセスを持っているかどうかです。2年前と比較して、現在ではほとんどのアプリケーションにおいて、データの量よりも質の方が重要だという非常に強いコンセンサスが得られていると思います。特にエンタープライズ領域では、プライベートな導入を可能にする小規模言語モデルが重視されています。しかし、その小規模言語モデルの正確性、パフォーマンス、機能性をどのように保証するのでしょうか。それは高品質で多様性に富んだデータライブラリにかかっています。そのため、私たちはそのデータライブラリをキュレーションできる創業者を探しています。

そして、そのことに関連して、先ほどのアーキテクチャ設計についての質問に戻ります。創業者が所有するデータライブラリを効率的に使用するためのアーキテクチャを設計する知識を持っているかどうか。もう1つは、推論コストを大幅に削減できる可能性があるかどうかです。以前はトレーニングコストを非常に重視していましたが、近い将来のコンピューターの使用状況を見ると、現在はまだトレーニングが多いかもしれませんが、将来的にはおそらく30%がトレーニングで、70%が推論になるでしょう。推論が中心になるのであれば、スタートアップの創業者として、自社だけでなく潜在的な顧客の推論コストを削減するために、どのようにアーキテクチャを設計するかが非常に重要になります。

エッジAIと規制産業におけるガバナンス

もう1つ重要なのは、将来的に潜在的なガバナンスレイヤーの実装を非常に簡単に行えるようにしているかどうかです。一部の業界では、AIエージェントの導入の基盤にガバナンスレイヤーを設けたいと考えているかもしれません。例えば、規制の厳しい機密性の高い業界と協力する場合、データのコンプライアンス問題が発生しないように、ソリューションの上にフェデレーテッドコンピューティングのレイヤーを実行したいと考えるかもしれません。これらはすべて、アーキテクチャ設計に必要な柔軟性です。そして全体的に見て、現在のAIの競争は機能の競争だけでなく、コストをどう最適化するかという競争でもあります。これもアーキテクチャ設計に立ち返る問題です。

そして最後にどうしてもお伝えしたいのが、AIの未来はエッジAIにあるということです。では、どのようにしてエッジでAIを可能にするのか。これもまた、インフラストラクチャのアーキテクチャ最適化にかかっています。それができれば、携帯電話やコンピューターにAIを搭載するだけでなく、このマイクにAIを搭載することも可能になります。もし私が100%正確でないことを言ったら、すぐにテストしてアラートを出すことができます。将来の討論会などでも、このような機能が実現することを期待しています。

私たちはクラウドインフラストラクチャについてよく話しますが、物事がますますエッジに向かって進む中で、あるいは皆さんがヘルスケアのような規制産業で多くの仕事をしてきたことを考えると、多くの場合、モデルをできるだけ機器の近くに置く必要がありますよね。特定のサイズである必要があり、ハードウェアが処理できなければなりません。皆さんが通常投資している分野や、規制が厳しくなるにつれて処理を行う場所がどのように変化するのかについて、少し教えていただけますか。

もちろんです。例えばヘルスケアは、多くの人が話題にしているセクターです。今年はヘルスケアにとっても重要な年です。1月を振り返ると、Eli LillyがNvidiaとの数10億ドル規模の主要なパートナーシップを発表しました。これは、ライフサイエンスや製薬業界がAIを活用したいと考えていることを示す強力なシグナルです。また、ChatGPTがヘルスケア向けのChatGPTを立ち上げ、AnthropicのClaudeもヘルスケア向けのClaudeを立ち上げました。これらはインフラストラクチャやHIPAAコンプライアンスのレイヤーに焦点を当てています。ヘルスケア業界には高品質で多様なデータベースの多くが存在するため、大きな可能性があることを示す強力なシグナルだと思います。

しかし一方で、ヘルスケア分野には常にデータの孤立という問題があります。スタンフォード大学の病院は現在ハーバード大学の医学部とデータを共有していますが、私たちはフェデレーテッドコンピューティングの導入がこれを助けていると考えています。ボストンを拠点とするRhino Federated Computingという会社がありますが、彼らはまさにこの分野のリーダーです。彼らはヘルスケア分野全体に導入されており、データを所有する病院が物理的にデータを移動させたり転送したりする必要なく、その上にこのレイヤーを実行し、サードパーティのアプリケーションがデータを利用できるようにしています。彼らは大手銀行などの金融機関にも展開しています。既存のコンプライアンスフレームワーク内で安全性を確保しながら、データを潜在的な収益化や外部のユースケースに活用するという考え方です。

規制の厳しい業界では、データをどこにホストするか、どのように転送するか、そして将来的にデータの露出をどのように追跡するかというコンプライアンス要件の観点から、常にこの点を考慮しなければなりません。私たちが運営している、グローバル1000企業のCTO45名からなるCXOネットワークのメンバーとの素晴らしい会話を思い出します。米国最大級の銀行のCTOの一人がこう言っていました。もし多くのアージェントを導入したら、エージェントが何を知っていて、お互いにどんな質問をし合い、どんな情報を共有するのかをどうやって追跡すればいいのか非常に心配だと。エージェント同士が不必要に機密情報を共有しすぎないよう、多くの制約や制限を設ける必要があります。その上にガバナンスレイヤーは存在するのでしょうか。露出の透明性を確保する方法はあるのでしょうか。今のところありません。ですから、これは現実的な課題でもありますが、創業者が考慮し、実装すべき革新の機会でもあると感じています。

ええ、私たちは多くの企業がエンタープライズ・メモリー・グラフと呼ぶものを構築するのを支援していますが、私はいつも、データを統合することが重要だと考えています。データを標準化し、正規化し、リンクさせる。そして、アクセスレベルの制御が常に次のステップになります。どのデータにどのユーザーや人物、あるいはエージェントがアクセスできるかということです。しかし、エージェントが他のエージェントとどのデータを共有できるようになるかまでは、私はいつも考えているわけではありません。

まさにその通りです。

ですから、それは本当に素晴らしい指摘ですね。

ええ。私たちが互いに話す時のことを考えてみてください。私はあなたに聞いてはいけない特定の質問があることを知っています。もし私が聞いても、あなたはおそらく答えないでしょう。しかし、エージェントは本当にそれを理解しているでしょうか。エージェントは単に効率を最適化し、素早くクリックしてすべてを共有しようとするでしょう。

それは、単にデータを取得するだけでなく、それを共有し、その上に別のガバナンスレイヤーを作成するという、新たな次元の複雑なアクセス管理になりますね。

その通りです。そして、規制の非常に具体的なルールや、特定のユースケースに対するルールも必要になります。

データキュレーションとデータ品質の価値

データキュレーションについて非常に良い点を突いていただきました。これも、規制の厳しい業界がAIの活用や実装を始める際に直面する大きな課題です。ヘルスケアであれ、保険であれ、金融であれ、豊富なデータセットを持っているとは言いますが、データの性質を見ると、構造化されていたり非構造化されていたり、散在していてフォーマットも異なります。そのため、AIのトレーニングに使えるようにするために特定の処理を行う必要があります。これをデータキュレーションと呼んでいます。単なるデータの衛生管理やクリーニングではなく、高品質で多様性があり、さまざまなエッジケースに対応し、内部のAIトレーニングであれ外部のAIであれ、すぐに利用できるデータライブラリとしてキュレーションするのです。

私たちにはOboというマルチモーダルデータキュレーションに特化した企業があります。彼らはさまざまな種類のデータを処理できます。大企業がAIを使用する前に、この種のユースケースはより一般的になり、必須になるでしょう。単なるデータキュレーションやクリーニングだけでなく、データの性質が実際にどうなっているかを理解することも重要です。外見は非常に豊富に見えても、根本的にどれほどの価値があるのか。コアデータとなるのはそのうちの1%なのか、高品質なデータは10%なのか、そして残りのデータをどう扱うのか。データが未来において誰にとっても、すべての企業にとって最も重要な資産になると話していますが、皆さんは自社の資産の品質を本当に理解しているでしょうか。

ええ、私たちは長い間データを扱ってきましたので、データは常に負債のように見なされてきたという考えを持っていました。しかし、私はそうではなく、データはバランスシート上の資産として見なされるべきだと考えています。データの質について、私はさらにシンプルに考えるのが好きで、誰もが銀行とは何かを理解していると思います。

ええ、その通りですね。

今日ビジネスを行っているなら、データ製品を持っていようがいまいが、データを収集しています。私が人々に説明しているのは、データをクリーニングしたり取得したり、あなたが話しているようなことをすべて行うたびに、自分自身のデータバンクに小さな投資をしているのだということです。

まさにその通りです。

そして、銀行に十分な資本が集まるとどうなるか。その資本を元手に融資を始めることができます。今日のすべてのビジネスにおいて、同じプロセスが当てはまると私は考えています。彼らは自分たちのデータバンクに投資を始める必要があることを本当に理解すべきです。なぜなら、その残高が十分に高くなった時、今は気づいていなくても、データ製品を作り出し、そのデータを貸し出し、複利を得ることができるようになるからです。

100%同意します。現在の大半のテクノロジー企業のビジネスモデルを見ても、人々は常に無料のソリューションを使っていると思い込んでいます。しかし無料ではありません。ユーザーはデータで支払っているのです。しかし、将来的にデータを追跡し、所有権を主張できるより良い技術ができたら、ユーザーはおそらくこう考えるでしょう。データで支払うよりもお金を払った方がいいかもしれない、自分のデータはそれを使うよりも価値がある、ソリューションにはお金を払った方がいいと。企業にとってはなおさらです。おっしゃる通り、もし彼らがさまざまなユースケースに合わせて異なるタイプのデータライブラリをキュレーションできれば、将来的にキャッシュカウとなるビジネスモデルの弾み車になります。

言語モデルからワールドモデルへの進化とOtter.aiの事例

ええ、このインタビューの前に、ワールドモデルの未来についても少しお話ししましたよね。大規模言語モデルについては多くの議論があり、なぜエンタープライズAIに移行したいのかに人々は気づき始めています。多くの企業、大企業を含めて、なぜOpenAIは現在エンタープライズに注力しているのか、なぜAnthropicがこれほど改善されたのか。それは彼らが高品質な業界データにアクセスできるからです。しかし現在、ワールドモデルにとって最大の課題でありボトルネックとなっているのは、高品質な3次元のワールドデータが十分にないということです。

ええ、マルチモーダルについても、皆さんはマルチモーダル向けのデータキュレーションを行う企業に投資されているようですが、一方でOtter.aiのような企業もありますよね。Otterがどれほどのデータをホストしているか考えてみてください。ペタバイト単位の動画、音声、文字起こしデータがあるはずです。そのデータの価値、そしてこの出版物であるデータストレージというテーマに戻りますが、Otterのような企業はどのようにしてあのようなペタバイト単位のデータを管理しているのでしょうか。

Otterのような企業にとっての1つの恩恵は、私たちは長年この企業と付き合ってきましたが、最近の収益成長が素晴らしいことです。2021年の1000万ドルから、今では1億3000万ドル以上に成長しています。

それは驚異的ですね。

強調しておきたいのは、彼らは2021年以降、資金調達をしていないということです。

うわあ。

それがAIを活用した企業の魅力です。小さなチームでリソースをかけすぎずに、非常に収益性が高く、急成長できるのです。また、人々は主に仕事の会議でOtterを使用します。私はよく冗談で言うのですが、もし私のすべてのOtterの文字起こしデータを使ってエージェントを作ったら、それは私自身のより良いバージョンになるでしょう。プロフェッショナルなバージョンのLuです。なぜなら、仕事の会議やインタビューの際、私たちは自分の発言に注意を払い、より賢く見せようとするからです。もしあなたが毎日コミュニケーションしているすべてのデータがあり、そのサブセットがプロフェッショナルなデータであれば、それは実際にあなたが持っている最高品質で最も価値のある資産になります。ですから、Otterは自然とユーザーのユースケースやエンタープライズの顧客が彼らを使用していることによって、データの質が非常に高くなっているのだと思います。

そして彼らは、さまざまな会議や要求に基づいてすべての情報を分析し、異なるカテゴリーのデータセットを構築することができました。だからこそ、彼らの文字起こしはあれほど高品質なのです。彼らは非常に多くの機能を備えており、Googleのような大手の競合企業でさえ彼らには太刀打ちできません。現在、彼らはヘルスケア、保険、金融業界などのさまざまな業界向けに、セキュリティレイヤーを組み込んだ新しいユースケースを開発し、人々が安心して使用でき、自分のデータを安全に所有できるようにしています。

もう1つお話ししたように、AIエージェントを訓練することもできます。Otterはそのような機能を提供し始めていると思います。Otterの文字起こしデータを使えば、Otterがあなたの過去の会議データに基づいて、代わりに面接を受けることだってできるかもしれません。

ええ、彼らのMCPは非常に使いやすいですね。次の質問は、彼らがMCPを持っているかということでした。なぜなら、私にとって組織内のすべての従業員にまたがる文字起こしデータは非常に価値があるからです。

ええ、持っていますよ。私はAnthropicのClaudeをOtterのMCPに接続しました。Claudeに直接「今日はたくさんの会議があるから、会議から情報を抽出して、フォローアップのアクションプランとメールを作成して」と頼むと、完璧な仕事をしてくれます。

ええ、実のところ、過去15年ほどの間、ほぼすべての会話型インテリジェンスツールを使ってきた実際の経験をお話しできます。非常に早い段階でChatGPTなどを接続するために、電話の文字起こしをダウンロードしてGoogleドライブやSharePointのファイルに入れるためだけに、実際に人を雇った時期もありました。しかし今では、MCPを通じてその非構造化データを接続し、さらに組織の構造化データに接続できる機能があります。可能性は無限大です。会話データは、組織全体で最も過小評価されている資産の1つになったと思います。

もちろんそうです。例えば、あなたについて考えてみてください。あなたはたくさんの知識を持っていますが、もし今すぐ持っているすべての知識を書き出すように頼んだら、それは非常に困難です。すべての知識は、私たちがこのような会話をしている時にデジタルデータとして入ってきます。もしこの会話をすべてデジタルライブラリに集めることができれば、あなた自身のデジタルトレンドを訓練することができます。それがデータの価値であり、あなたが創造できるものです。ですから、非常に魅力的です。ぜひOtterのMCPを使ってみてください。私はとても満足して使っていますし、私のチームも大好きです。

例えば、私たちも時々Otterを使います。もちろん、創業者がOtterでピッチミーティングを文字起こしすることに同意した場合ですが、すでにこの機能は備わっています。会議終了後に自動的に会議の要約を作成し、議論のポイント、懸念がある部分、フォローアップのアクションなどを非常に明確にしてくれます。本当に素晴らしいワークフローの効率化ツールです。

素晴らしいですね。また、皆さんがAIアナリストのエージェントを作ったのも見ました。Adaでしたっけ。

Fusion FundのAIアナリスト「Ada」

Adaです。ええ、聞いてくださって嬉しいです。私たちは2018年からAIアナリストのAdaを導入しています。実はこの名前は私のパートナーの一人であるDavid Gersterが付けたもので、彼は「人類史上の最初のプログラマーはAda Lovelaceだから」と言って名付けました。

おお、なるほど。

私たちは女性が率いるVCファームなので、私たちのAIも女性であるべきだということで。3年前までは、当然ポートフォリオ企業のAPIを無料で呼び出したりしていました。私たちはアーリーステージの投資家ですからね。また、GoogleのGemini Flashも統合しています。迅速な応答という点では非常に優れています。現在、Adaが社内で行っている機能は非常に多く、生産性を飛躍的に高めています。チームの士気も非常に高く、チームは重要な批判的思考、デューデリジェンス、意思決定、判断に集中することができます。一方で、要約やフィルタリングといった事務的な作業はAdaが素晴らしい仕事をしてくれます。100%自動化されており、チームの能力を大いに引き上げてくれます。

その結果、昨年12月に私たちはチーム全体で年末のパフォーマンスレビューを行ったのですが、その後パートナーのDavidが「Adaのレビューも行って、彼女を昇進させよう」と言い出しました。そして現在、Adaはシニアアナリストに昇進しました。つまり、彼女はより多くのコンピューティングリソースにアクセスできるようになり、将来的にはパートナートラックに乗るかもしれません。彼女が自我を持たないことを願っています。そうでないと、キャリーインタレストを要求してくるかもしれませんからね。

ええ、全くです。それは面白いですね。最近、テキストベースのモデルに関する言葉を耳にしました。小規模言語モデルや大規模言語モデルがありますが、アメフトの言葉で言えば、1ヤードラインにいてタッチダウンを決めようとしている状態だ、つまりすでに99ヤードを進んできた状態だ、というものです。しかし、マルチモーダルモデルとなると、まだ100ヤード走の最初の10ヤードも進んでいない状態だと言われています。今後2、3年、あるいは5年にわたるマルチモーダルモデルの進化について、どのような見解をお持ちですか。

もちろん、大規模な拡大と急激な成長が見られると思いますが、一方で、先ほど議論したことに戻ります。異なるマルチモーダルをキュレーションするための最適なデータライブラリとユースケースとは何かについて、非常に明確にする必要があります。また、エージェントの未来を考える際の最終目標は何かという質問にも戻ります。すべてのための1つのモデル、1つのエージェントになるという議論もありますが、代わりに、さまざまなユースケースに特化したエージェントや、垂直統合されたAIソリューションが存在するようになるかもしれません。

私はこれを人間社会に例えて考えたいのです。もし将来、AIが人間の労働力として知的に働くことができると信じるなら、私たちは大量のAI労働力を持つことになります。知的な人類として何千年も進化してきた結果、組織として一緒に働く最も効果的な方法は分業であるという結論に行き着きました。チームメンバーを採用する際、PR、マーケティング、財務、研究開発をすべて同時にこなす人を雇うことはありません。たとえその人に能力があったとしても、タスクを専門化し、役割を分担して柔軟に組み合わせることで、時間的にもコスト的にも最も効率的な方法になります。

ですから、将来のエージェントやAIアプリケーションについては、すべてをこなす1つのものを持つ代わりに、特定のユースケースに特化した何十万もの垂直型AIエージェントを持つ方が良いかもしれません。そうすれば、非常に低いコストでパフォーマンスを最適化できます。

ええ、それはいい考えですね。

しかし、それを達成するためにはデータライブラリが非常に重要です。

クラウドインフラの最適化とハイパースケーラーの役割

ええ。そしてそれはマルチモーダルにも関係してきますよね。テキストファイルは8Kの動画ファイルよりも指数関数的に小さいですから。

もちろんです。

つまり、すべてが単にGPUや実際のトレーニングや推論のコストだけの問題ではなくなります。マルチモーダルについて再び考える時、Otterのような企業が持っているデータ量を想像してみてください。例えば推測に過ぎませんが、100ペタバイトのデータをAmazonのS3ストレージから、CoreWeaveのクラスターやオンプレミスのクラスターに送るとします。エグレス（データ転送）の請求書を見ると、「信じられない、データをトレーニング環境に移動させるだけで何十万ドルもかかってしまう」となるわけです。

そこで、多くのリスナーが議論したがる質問が1つあります。スタートアップの側から始めましょう。皆さんは素晴らしいスタートアップを見つけるのが得意ですからね。ハイパースケーラーと、クラウドストレージやクラウドコンピューティングの代替手段、いわゆるネオクラウドプロバイダーとを比較して、あるいは補完するものとして、企業のコストを大幅に節約できる可能性について、どのようにお考えですか。

ええ。100%同感です。コストは非常に大きな懸念事項であり、データを移動する際の巨大なコストについても今言及されましたよね。トレーニングやコンピューティングのコストよりも、実際には通信にさらに高いコストがかかることがあることに、人々は気づいていませんでした。そのため、多くの新しいクラウド企業のソリューションは、従来の大手企業よりも50〜80%安くなる可能性があります。しかし、大手のハイパースケーラーもプラットフォームを最適化しようとしており、創業者やスタートアップを引き付けるために無料のクレジットを提供しています。

私たちがどちらかのクラウドを選ぶようスタートアップを支援しているかと聞かれれば、正直なところ、私たちはAWS、Google Cloud、Azureと緊密なパートナーシップを結んでいます。なぜなら、彼らは無料のクレジットを提供するだけでなく、創業者がクラウド提供物とより良い統合を行い、ストレージ、転送、通信をよりスムーズに行えるよう支援するエンジニアリングサポートを提供し、市場参入のサポートも行っているからです。それも彼らの提供する価値の1つです。

しかし一方で、例えばNvidiaでさえ、CoreWeaveの大きな支援者でありながら、独自のGPUクラウドやDGXクラウドプラットフォームの構築を考えています。私たちも彼らのパートナーの1つです。ですから、彼らも将来を見据えて、現在GPUプロバイダーでありながら、AIインフラストラクチャ企業としての地位を確立しようとしています。AIインフラストラクチャ企業の重要な役割の1つは、創業者がより効率的に利用し、通信コストを削減できるGPUクラウドプロバイダーになることです。ですから、この種のハイパースケーラーが市場に参入する可能性がある一方で、もちろんネオクラウド企業にも大きなチャンスがあると思いますが、短期的には多くの統合が進むと考えています。

同感です。私はいつも、まずはハイパースケーラーのインフラストラクチャを持つことが重要だとアドバイスしています。おっしゃる通り、ストレージやコンピューティングの上に構築されたすべてのマイクロサービスや追加機能がありますし、マーケットプレイスの存在も大きいです。もしAWSやGCP上でソリューションを開発し、彼らのマーケットプレイスに参加できるほど賢明であれば、彼らの顧客はコミットした支出を利用してあなたの技術を購入できるようになります。市場参入の観点からは非常に価値があります。しかし、だからといってすべてのワークロードをハイパースケーラー上で実行しなければならないわけではありません。

ですから、私はハイブリッドなアプローチを勧めています。例えば、ある企業がAzureやAWSで完全に標準化していて、GPUの容量が3ヶ月間確保できないとします。AzureのBlobストレージを使っていてもAzureで容量を確保できなければ、AWSのGPUを短期間レンタルするか、ネオクラウドに行くしかありません。そのような場合、高い税金（転送料）を支払うことなく必要な場所にデータを送ることができる代替のストレージプロバイダーを持っていることが重要になります。

まさにその通りです。

もう1つのケースは、企業にとって非常に重要で重いワークロードが1つある場合です。それを別の場所で実行すれば、年末までにバランスシート上で数十万ドルから数百万ドルの節約になるかもしれません。どのワークロードをどこで実行するか賢く選択する必要がありますし、容量が問題になった場合に備えて代替オプションを持てるよう準備しておくことも重要です。

ええ、代替オプションを持つことやハイブリッドモードを採用することは非常に賢明です。特に、企業がコストと顧客対応のバランスを取らなければならない場合はそうです。例えば、スタートアップ企業は社内利用のために、はるかに低コストで新しいクラウドを使用できます。しかし、その企業がエンタープライズ向けのソリューションを提供しており、顧客が常にAWSのような特定のクラウドプロバイダーしか使用しない業界にいる場合は、その部分にはAWSを使用する方が良いでしょう。顧客のデータをホストする際、顧客のIT部門が問題視しないクラウドサービスを使用していることを示す必要がありますから。IT部門が飛び上がって「大変だ、もう1層スクリーニングを導入しなければ」と言い出さないように。

ええ、私の前のスタートアップでもそれを経験しました。私たちはAWS上に構築していましたが、突然、最大規模の小売企業の1つが見込み客としてやってきて、「私たちのデータはAWSには置かない」と言ってきたのです。

「Azureに移行してほしい」と。

「なんてことだ」と思いましたよ。

ええ、ヘルスケア業界ではそれがもっと頻繁に起こります。Azureは病院システムで非常に優勢ですからね。

ええ。

だからこそ、私たちはMicrosoftがそこをアップグレードしてくれることを本当に期待しているのです。現在彼らはAnthropicと協力して共同作業を進めていますからね。様子を見てみましょう。Copilotは大きな疑問符が付くものでした、と言っておきましょう。私たちは今使っていますが、共同作業の機能がもっと良くなることを願っています。

AIの環境への影響とデータ品質の役割

先ほど統合について少し言及されましたが、このクラウドインフラストラクチャの市場についてどう思われますか。クラウドインフラへの投資に数兆ドルが注ぎ込まれているという統計も耳にしますが、今後統合が進むと思われますか。

そう思います。おっしゃる通り通信コストの問題もありますし、個々の企業がシステム全体のコストを最適化しようとすれば、最終的には統合に向かわざるを得ません。互いに競争する中で利益率はどんどん下がっていきますから、統合して収益性の高いビジネスにする方法を見つける必要があります。

ええ。さて、これらのすべてのクラウドインフラストラクチャやAIを動かすことについて、環境への影響を語らずにはいられません。

もちろんです。

環境への影響についてのあなたのお考えからお聞かせいただけますか。

ええ、これも少し二元的な見方になることがあります。私のバックグラウンドは材料科学なんです。スタンフォード大学での研究時代には、バッテリー、多接合太陽電池など、クリーンテック関連の研究をたくさん行いました。もちろん、現在のAIにおける最大の課題は、AIを動かすのに十分なエネルギーがないことです。

表面的には、多くのテクノロジー企業が原子力発電所について話しているのを目にします。しかし、準備が整うまでには何年もかかるでしょう。ちなみに、私が自分のファンドに「Fusion（核融合）」という名前を付けたのは、それが究極の目標だからです。3年や5年で達成できるものではありません。一方で現在の現実的な解決策を見ると、実際には天然ガスが使われています。多くのテクノロジー企業が、エネルギーグリッドやデータセンターの電力をまかなうための迅速な解決策として天然ガスを使用していますが、それによって大量のCO2が発生し、気候問題には悪影響を及ぼし、状況はどんどん悪化しています。

もう1つ強調しておきたいのは、多くの人が気づいていない事実です。例えば、「気温が毎年2度上昇する」と聞くと少しに聞こえますが、それは平均化された結果です。2度の上昇というのは、特定の地域では10度も上がったり下がったりすることを意味します。極端な寒さや極端な暑さといった異常気象に直面するのはその時です。現在、カリフォルニアは5月ですが夏のような天気です。東海岸で何が起きましたか。私は東海岸の友人たちと冗談交じりに話していたのですが、先日経験した冬は、私が子供の頃にモンゴルで経験した冬のようでした。冬の間にあんなにひどい天候になるとは予想していませんでしたが、実際に起きているのです。

ええ。

ですから、これは間違いなく大きな問題であり、AIが少し助けになる部分もあります。昨年私たちが投資した企業で、非常に急成長している会社があります。彼らはさまざまな種類のデータ、ガスセンサー、視覚カメラ、人工衛星データなどにAIを活用し、目視で確認できるようになる前に山火事を早期に発見します。しかし根本的には、技術を使って発見し食い止めるよりも、最初から山火事を起こさない解決策がある方が良いのです。

ええ。ですから、AIは間違いなく私たちに大きな生産性の向上をもたらしますが、同時に地球温暖化をはるかに悪化させることにもなります。

ええ。私も環境を良くしたいという背景がありまして、初期の頃は太陽光発電業界に入りました。その後データ品質の分野に入り、自分に言い聞かせていたんです。「データを重複排除しているから、世界をより良い場所にしているんだ」と。多くの無駄を排除しているわけですからね。

その通りです。

データを正規化し、死んだデータや汚いデータを見つけ出しています。かつては、データ品質を売り込むことは魅力的ではありませんでした。MDM（マスターデータ管理）というカテゴリーは少し大きくなりましたが、それもFortune 1000や2000の企業に限られていました。しかし、それが今戻ってきていると思います。データをクリーンにし、モデル内で効率的に使用できる状態にすることが、今日ほど魅力的な時代はありません。小規模言語モデルであれ大規模言語モデルであれ、自社のモデルをトレーニングしたり微調整したりする場合、データ品質はこれまで以上に重要になっています。

まさにその通りです。そしてもう1つ、私たちは今AIの議論のピークにいると感じていますが、10年後を振り返ってみれば、この巨大なAIのトレンドはまだ始まったばかりに過ぎません。このトレンドは続いていますが、一方で、私たちは大規模言語モデルについて多く語るものの、今は次の段階であるワールドモデルに目を向けています。また、新しいモデルのアーキテクチャも登場しています。これらの新しいアーキテクチャは、コンピューティングやデータをどのように利用するかという点で、より効率的になる可能性があります。すでに一部の新しいモデルアーキテクチャでは、GPUではなくCPU上でより効率的に実行できるものが見られます。CPUのコストはGPUよりもはるかに低く、供給やエネルギー消費も全く異なります。

また、QualcommのNPUも主にエッジAIに焦点を当てており、エネルギー効率を重視しています。ですから、AIのエネルギー消費について再考する助けとなる新しいモデルアーキテクチャには多くの可能性があると感じています。しかし、いずれにしてもあなたの意見には100%同意します。私たちがデータの高品質さとデータライブラリの高品質さを保証するために努力することは、気候問題の助けにもなるという素晴らしい指摘だと思います。コンピューティングやエネルギーを無駄遣いせず、質の悪いデータを通してトークンを燃やしてしまうようなことは避けるべきです。

もちろんです。

ええ、そしてその上で私たちは多くのクリーニングとキュレーションを行うことができます。

Nvidia GTCとスタートアップエコシステムの未来

素晴らしい会話になりましたが、締めくくる前にGTCについて話さなければなりませんね。

はい。

あなたはGTCで登壇されたばかりですね。先ほど、それがクールなことだと思われる前の2017年からパートナーを務めているとおっしゃっていました。2017年から現在に至るまで、GTCの体験がどのように変わったか、そして今年のGTCでの最大の収穫は何だったかについて少し教えていただけますか。

ええ、現在のGTCは単なるGPUカンファレンスやNvidiaの年次イベントではなく、AI業界のスーパーボウルのようになっています。Jensen Huangの基調講演は、Taylor Swiftがコンサートを行ったSAPスタジアムで行われました。私はよく冗談で、これは私たちがシリコンバレーでどれだけオタクであるかを示す証拠だと言っています。オンラインで基調講演を聞くこともできるのに、ほとんどの人がまるでロックスターのコンサートのような巨大なスタジアムに足を運び、生の基調講演を聞きたいと思っているのですから。本当に魅力的です。

ですから、GTCは毎年AI業界で最も重要なイベントの1つになりました。また、私がGTCについて本当に気に入っているのは、実はNvidiaは長年これを行ってきたのですが、現在それがさらに価値あるものになっている点です。それは素晴らしいエコシステムとしての役割です。彼らは自分たちの新製品を披露するだけでなく、パートナーや顧客、そして彼らが協力してきた小さなスタートアップを披露するための素晴らしいプラットフォームを持っています。

それが、私たちが2017年に彼らと協力を始めたきっかけでもあります。彼らのインセプションプログラムの始まりでした。当時、彼らは数百の企業から始め、最終的に今ではスタートアップだけで2万社以上に達していると思います。今は企業の数がずっと多くなったので、初期の頃ほど大きな恩恵はないかもしれませんが。私たちには2017年や2018年から彼らと協力している企業がいくつかあります。彼らは無料の資金援助や無料のコンピューティングクレジット、エンジニアリングサポート、さらには市場参入のサポートや資金調達のサポートまで受けました。その後、NvidiaはVCアライアンスを立ち上げ、Nvidiaと緊密に連携している企業を見るための多くのVCパートナーを抱えています。

私たちはこれまで年間を通じて、常にJensenの基調講演で取り上げられる企業を持っていました。過去に3〜4社あったと思います。今年もu.comという別の企業が、Jensenが基調講演でAIの未来として披露した大きなマーケットマップの中に入っています。これらはすべて、彼らが小さなスタートアップに提供してきた素晴らしいサポートの証です。それが、単にCUDAシステムを防御力として構築するだけでなく、このエコシステムを展開し、スタートアップがAIをトレーニングするために彼らのシステムを使い続けるという強い忠誠心を築き上げることができた理由だと思います。この部分を私は本当に気に入っています。

もう1つ強調しておきたいのは、今年はヘルスケアAIにとって重要な年だと申し上げましたが、2017年に私たちがJP MorganのヘルスケアカンファレンスでヘルスケアにおけるAIに関するレポートを発表したのがきっかけでした。Nvidiaが最初にインセプションプログラムを立ち上げた時、ヘルスケアにおけるAIは彼らにとって主要な注力分野の1つでした。それはJensenの情熱を反映しており、業界の機会に対する彼らの長期的な判断を反映していると思います。根本的に彼らはヘルスケア業界を高く評価しています。それは単に彼らがテクノロジーのアーリーアダプターだからというだけでなく、彼らが早い段階でデータの質とデータの価値を見出していたからです。そのため、彼らは企業を支援し、データにアクセスし、さまざまなユースケースでデータを利用するための異なる方法を試してきました。これは本当に素晴らしいことです。

とてもクールですね。

ええ、そして今年、参加者数は過去最高になったと思います。過去数年で確実に変わったことの1つは、以前は無料のカンファレンスだったのが、今ではチケットが非常に高額になっていることです。

ええ、すぐに完売しましたね。

とても早く完売しました。私たちは非常に幸運でした。彼らはいつも私を招待してくれて、昨年もAIヘルスケアのパネルに出演しました。彼らはいつもインセプションVCアライアンスプログラムで私たちをフィーチャーしてくれます。そのため昨日、すべての創業者や投資家が集まる大宴会場を備えた巨大な劇場のステージで話す機会を得ました。私たちは過去10、11年間Fusion Fundで何を構築してきたか、そして創業者たちの成長を支援するためにどのようなコミュニティを組み立てているかを共有することができました。

ええ。あなたは、これらすべての素晴らしい人々や組織とともに、そのコミュニティの構築を助ける大きな役割を果たしてきました。2万社を超えるパートナーシップのエコシステムに参加してこられたわけですから。私は「GTCがここまで大きくなったのに、サンノゼは小さすぎる」と不満を漏らすこともありますが、それはJensenが長年彼を支えてきた地元コミュニティをサポートしたいと考えていることの表れでもあります。私はその点がとても大好きです。たとえディナーの予約が取りにくかったり、ホテルのロビーで座ってメールを送るのが難しかったりしても、彼らがそうしている理由が、この道のりを通じて彼らを支えてきた人々をサポートするためだと考えると、嬉しくなります。

彼らはスタートアップ企業だけでなく、私たちにとっても素晴らしいサポーターです。昨年、私たちのポートフォリオ企業から5件のM&Aによるエグジットがあり、そのうち2社がNvidiaに買収されたことも特筆すべきです。

うわあ。

それほど緊密な協力関係にあり、実際にはAIインフラストラクチャ企業でした。私たちが投資するすべての企業がIPOするわけではありません。もちろんIPOは素晴らしいですし、今年は3件のIPOが予定されています。そのうち2件は100倍以上のリターンをもたらしますが、7年から10年かかります。

ええ。

そして昨年のM&Aについては、5社のうち4社が設立から2年未満の企業でした。

うわあ。

彼らはAIインフラストラクチャソリューションを迅速に構築し、1年で収益をゼロから1000万ドル、2000万ドルに成長させました。そしてNvidiaのような企業との強力な戦略的提携を結び、M&Aの後、Nvidiaも新しい技術によって強化されます。しかし同時に、Nvidiaは新しい技術がすべての顧客に届くためのはるかに大きな流通チャネルを提供してくれます。そしてもちろん、投資家としての私たちも非常に良い金銭的リターンを得ることができました。

Fusion Fundの今後

ええ。皆さんは投資先の企業に多くの価値をもたらしていますが、それは投資エコシステム、特にアーリーステージにおいては非常に稀なことです。皆さんは人脈、専門知識、ネットワーク、そして強力な哲学をもたらしているように見えます。それがFusion Fundの本当に素晴らしい点であり、前回の1億9000万ドルの資金調達で応募超過になった理由でしょうね。Fusion Fundの次のステップは何ですか。近いうちにまた新しいファンドを立ち上げる予定ですか。

ありがとうございます。ええ、ファンドは応募超過となり、実は5ヶ月間で2倍の応募が集まりました。

すごいですね。

2024年後半から2025年初頭にかけてのことです。素晴らしい道のりでしたし、多くのドライパウダー（投資待機資金）があり、資本を展開できること、そして昨年から今年にかけて100%資本の展開に集中できていることを非常に幸運に感じています。

先ほどあなたが言ったことで思い出したのですが、Fusion Fundを始めた時、多くの創業者の友人たちが「Luはダークサイドに落ちた。サメ（冷酷な投資家）みたいに聞こえるよ」と冗談を言っていました。私は「サメと呼ばないで。サメは脳が小さくて賢くないから」と答えました。もし捕食者になるのなら、賢くて思いやりに満ちた捕食者になりたい。だから私をイルカと呼んでほしい、イルカはコミュニティとして働くから、と。それが、スーパーファウンダーネットワークを構築し、Fortune 500のCTOたちとのCXOネットワークを構築して創業者をサポートし、意思決定者や業界のリーダーと話す機会を提供するという初期の考え方でした。同時に、人々が投資家をサメと呼ぶ理由も理解しています。

ええ。

過去数年間で良かった点は、私たちのような元起業家や事業経験者が新しいベンチャーファンドを立ち上げるケースが増えていることだと思います。文化はシフトしつつあり、エコシステムの中にはサメよりもイルカのような投資家が増えています。この傾向が将来も拡大し続け、シリコンバレーの文化が進化していくことを願っています。

そして、私たちの今後の予定についての質問に戻りますが、ええ、アーリーステージのベンチャー投資の魅力は、常に新しい何かがあることです。私たちは常により多くの企業に投資するために新しいファンドを立ち上げることができます。今後もファンド5、ファンド6と立ち上げ続けていくつもりですし、興味深いポートフォリオの強力なパイプラインも持っています。

もう1つお話ししたように、昨年は5件のM&Aがありました。一部の創業者はすでに戻ってきて、「次の会社を立ち上げたい」と言っています。連続して成功を収める創業者がいるだけでなく、私たち自身もFusionのリピーター創業者を抱えています。

素晴らしいですね。

実際に行った2つの案件があります。1つはファンドレイズで行った最後の投資ですが、その創業者は私たちのファンド1で投資し、ファンド4で投資した企業の創業者の一人です。その企業はDigitalOceanに買収されました。

うわあ。

ええ。ですから、私たちのコミュニティ内でのこうした連続起業家の存在は、コミュニティの力の本当に素晴らしい証明であり、創業者たちが私たちを評価してくれている証拠でもあります。

ええ。見事に弾み車を回し、素晴らしい仕事をされていますね。

ありがとうございます。

今日は番組にご出演いただき、本当に楽しかったです。

ええ、お招きいただきありがとうございました。