Groqの創業者兼CEOジョナサン・ロスが、AI産業の現状と未来について包括的に語る。AIバブルの真偽、コンピュート需要の飽くなき拡大、OpenAIやAnthropicの自社チップ開発の必然性、そしてNvidiaの10兆ドル評価の可能性まで、半導体とAIインフラの専門家としての洞察を提供する。エネルギー供給の重要性、ヨーロッパの競争力低下への警鐘、そしてAIが労働市場に与える革命的な影響についても詳述。コンピュートを制する者がAIを制するという明確なメッセージとともに、AI時代における戦略的投資判断の指針を示す重要な対話である。

Groqの復帰とAI市場の現状
コンピュートを制する国がAIを制することになります。そしてエネルギーなしにコンピュートは存在し得ません。ということで、Groqの創業者兼CEOであるジョナサン・ロスを再びホットシートにお迎えできることを嬉しく思います。そして今、私たちは経済により多くのコンピュートを生産し、より良いAIを作ることで、経済に労働力を追加できるようになるのです。これは経済の歴史上、これまで一度も起こったことがありません。
これは何をもたらすのでしょうか。個人的には、5年後にNvidiaが10兆ドルの価値になっていなかったら驚きます。しかし、私は結果を予測することはできません。コンピュートの需要は飽くなきものです。もしOpenAIが今日持っている推論コンピュートの2倍を与えられたら、Anthropicが今日持っている推論コンピュートの2倍を与えられたら、今から1ヶ月以内に、彼らの収益はほぼ2倍になるでしょう。申し訳ありませんが、それを解説していただけますか。
準備はいいですか。ジョナサン、私たちのチームから聞いたのですが、前回のショーが今年最も成功した番組だったそうですね。だから、これが今年最も成功する番組になるというプレッシャーは全くありませんよ。でも、スタジオへようこそ。ありがとうございます。ここに来てくれて嬉しいです。
さて、私は現在の位置づけを理解することから始めたいと思いました。世界はかつてないほど速く動いているように思えますし、正直なところ、私たちの多くは新しい市場で誰がどこに位置しているのかを理解しようとしていると思います。今日の市場の現状を見た場合、あなたはどう分析しますか。バブルがあるかどうかを尋ねているのですか。相対的にということですね。
わかりました。バブルがあるかどうかという点では、私の答えはこうです。質問をし続けても答えが得られない場合、別の質問をすべきかもしれません。だから、バブルがあるかどうかを尋ねる代わりに、スマートマネーが何をしているかを尋ねるべきです。Googleは何をしていますか。Microsoftは何をしていますか。Amazon、そして一部の国々は何をしていますか。そして彼らは全員AIに倍賭けしています。彼らはもっと使っています。
彼らが支出額について発表するたびに、次回にはそれが増えています。そしてこの支出から生まれる価値の最良の例の一つは、Microsoftがある四半期に大量のGPUを展開し、それらをAzureで利用可能にしないと発表したことです。なぜなら、彼らはそれらをレンタルするよりも自分たちで使う方がより多くのお金を稼いだからです。
つまり、市場には実際のお金があります。そして私がこの市場を説明する最良の方法は、石油掘削の初期のようなものだと思います。多くの空振りといくつかの大当たりです。私が聞いた統計では、35社または36社が現在AIにおける収益の99%、少なくともトークン支出の99%を占めているということです。
非常に偏っていますね。私はもっと少なくないことに驚いています。いや、でも真剣に、Nvidiaは本当に、2つのクライアントとの収益集中が非常に高いですよね。そうです。そしてNvidiaがその98%を占めているかもしれません。しかし、それがこれほど偏っている場合、それが示しているのは、人々が石油の見つけ方を知らなかった石油掘削の初期のようなものだということです。彼らは本能に従っていました。
ほとんどバイブ投資のようなものです。そして良い本能を持っていた人々は財を成し、その他の人々は時間とともにシャツを失いました。それは科学になります。非常に予測可能になり、偏りは少なくなります。より予測可能性が高まりますが、その時点で投資家が稼ぐお金は少なくなります。優秀な投資家が稼ぐお金が少なくなるのです。だから今が投資家にとって最高の時期です。
今、人々は支出よりも多くのお金を稼いでいます。ただ非常に偏っているだけです。申し訳ありませんが、彼らは支出よりも多くのお金を稼いでいるのですか。しかし集合体として、多くの人々がシャツを失うことになりますが、全体としては入ってくるお金よりも出ていくお金の方が少なくなります。
しかし、今日の大手プロバイダーによる設備投資を見ると、誰もが「オーケー、オーケー、オーケー」と言っています。なぜなら、その先に何かが来ているからです。そうです。そして問題は、設備投資がどんどん増えているということです。わかりました。あなたは純粋に財務的に考えていると思いますが、私は財務的なリターンはプラスになると思いますが、それが人々の動機ではありません。
AIバブル論と戦略的投資の必然性
私はアブダビのゴールドマン・サックス・アブダビ・イベントの初回に参加しました。ご存知のように、私たちは現在マクラーレンをスポンサーしているので、ザック・ブラウンが話していて、私も話していて、楽しいイベントでした。しかし、AIがバブルかどうかという似たような質問をされました。そこで私は参加者全員に次のような質問をしました。これは100億以上の運用資産を管理している人々の集まりでした。50人以上が100億以上を管理しています。
私は言いました。ここにいる人で、10年後にAIが自分の仕事をできないと100%確信している人はいますか。手は挙がりませんでした。私は言いました。素晴らしい。それがハイパースケーラーの感じ方です。だから、もちろん彼らは酔っぱらった水夫のように支出するでしょう。なぜなら、代替案は彼らがビジネスから完全に締め出されることだからです。だから、彼らは純粋に経済的な枠組みを使っているわけではありません。
それは私たちがリーダーシップを維持できるかという問題です。次に、これらのスケール則のような結果があり、トップ10に留まりたいと思っています。私たちはマグニフィセント7について話し続けていますが、もしマグニフィセント7のメンバーでなければ、評価額に近づくことはできません。そこにいるために何をしますか。支出するのです。それは価値があります。なぜなら、トップ7または10に入っているので株価が上がり続けるからです。
ある時点でリターンは実際に提供されなければなりません。支出は実際の具体的な収益に結実しなければなりません。そして、もしそうでなければ、マグニフィセント7に入っているかどうかは関係ありません。その通りです。それは正しいです。しかし、今のところAIはすでに膨大な価値を返しています。アプリケーションでは非常に偏っていますが、膨大な量の価値を返しています。
私たちに実際に起こった例についてお話ししましょう。私は少しバイブコーディングを試してみました。私は世界で最高というわけではありません。私たちには素晴らしいインターンが何人かいて、彼らはそれが得意です。
そして、私たちを訪問した顧客がいて、彼らとミーティングがありました。彼らは機能を求め、私は非常に高レベルでバイブ的にそれを仕様化しました。つまり、私はエンジニアにプロンプトエンジニアリングをしていたのです。4時間後、それは本番稼働していました。人間が1行もコードを書いていませんでした。人間によるデバッグは一切行われていませんでした。すべてプロンプティングでした。
Slackの統合もあると思います。Slackを通してコミットするようなものです。それがすべて行われ、4時間後には本番稼働しています。そこにある価値を考えてみてください。しかし今、6ヶ月後を想像してみてください。顧客のミーティングが終わる前にそれができるようになったら。それは質的な違いです。金額の違いだけではありません。
そうです。それほど速くできるとき、機能を本番に投入するために費やす費用は少なくなります。それは実際のROIです。しかし、質的には、顧客のミーティングが終わる前にそれができるとき、競合他社にはできない取引を勝ち取ることができるようになるのです。
マグニフィセント7に話を戻しますが、マグニフィセント7に留まるために、誰もがチップ層に移行し、垂直統合でエンドツーエンドを所有する必要があることを全員が認識していると思いますか。多くの人がチップ層への移行に成功するとは思いません。人々はTPUを大成功として見ていますが、彼らが認識していないのは、Googleには同時に約3つのチップの取り組みがあったということです。そして、そのうちの1つだけがGPUを上回るパフォーマンスを発揮することになりました。
そして、業界を見回すと、チップを構築している人々がたくさんいます。最近キャンセルされたDojoのように、いくつかはキャンセルされています。チップの構築は難しいのです。
行って「私はNvidiaと競合する独自のAIチップを構築するつもりだ」と言うのは、Googleの検索はかなり良いですね、それを複製しましょうと言うのと少し似ています。狂気の沙汰です。最適化のレベル、それに投入される設計とエンジニアリングのレベルを考えると、高い成功確率でそれを複製することはできないでしょう。
しかし、それを実行しようとしているプレーヤーがたくさんいて、選択肢があり、そのうちの1つが成功すれば、別のチップができます。以前、マグ7に留まるためには支出しなければならないと述べました。NvidiaがOpenAIに1000億ドルを投資して、OpenAIがNvidiaのチップを買い戻すだけというのは、これは無限のマネーループではありませんか。
それは彼らがそれらのチップを構築するサプライヤーに支出していなければ、そうでしょう。生産的な成果が実際に発生していれば、それは往復ではありません。こう考えてみてください。そのインフラを構築するために、支出の何パーセントが使われていますか。40%です。つまり、少なくともそれらのドルの40%は実際にエコシステムに流出しています。それは無限ループではありません。わかりました。部分的なループです。60%はNvidiaに戻っています。
そうです。そして彼らは数千億ドルの株価上昇を得ます。あなたはそれをどう分析しますか。経済的な観点から分析してみましょう。完全に理にかなっています。なぜ一日中それをしないのですか。価値が発生するのはロックインがある場合です。収益の増加が収益の額よりも大きい株価の上昇をもたらす場合、それはその収益が継続すると信じているからです。
そしてそれが信念であり、実際にNvidiaについてはそれはおそらく真実だと言えます。しかし、それはNvidiaが優れているからだけではなく、Nvidiaは非常に優れていますが、世界にコンピュートが十分にないからでもあります。ありません。コンピュートの需要は飽くなきものです。
もしOpenAIが今日持っている推論コンピュートの2倍を与えられたら、賭けてもいいです。Anthropicが今日持っている推論コンピュートの2倍を与えられたら、今から1ヶ月以内に彼らの収益はほぼ2倍になるでしょう。
申し訳ありませんが、それを解説していただけますか。彼らはコンピュート制限を受けており、それはどのように、どうやって彼らのコンピュートが2倍になれば収益が2倍になるのですか。今、Anthropicの最大の不満の1つはレート制限です。人々は彼らから十分なトークンを得ることができません。
そして、もし彼らがもっとコンピュートを持っていれば、もっとトークンを生産でき、もっとお金を請求できます。OpenAIでは、それはチャットサービスです。では、チャットサービスをどのように規制しますか。遅く実行します。エンゲージメントが減ります。スピードはどのくらい重要だと思いますか。実際には問題ないと考える人がたくさんいます。レイテンシーがあっても構わないし、プロンプトを入力して、離れて何か別のことをして、離れている間に何かが起こることに満足しているという人がたくさんいます。
スピードの重要性とブランド価値
それらは興味深い意見です。CPG、つまり消費財を見てみましょう。CPG製品をマージンでランク付けしてほしいのです。最上位はタバコ、喫煙タバコです。その下は噛みタバコです。その下はソフトドリンクです。その下には、水やその他のようなものが続きます。
CPGにおいて、高マージンと最も相関する第一の要素は何でしょうか。それは成分があなたに作用する速度です。つまり、ドーパミンサイクル、何かが起こる速度があなたのブランド親和性を決定します。そして、何かが非常に速い反応を持つとき、あなたはそのブランドに結びつき、そしてブランド価値を蓄積します。
これは、Googleがスピードに焦点を当てることの全体的な基礎でした。Facebookがスピードに焦点を当てることの全体的な基礎でした。100ミリ秒のスピードアップごとに、約8%のコンバージョン率が向上します。つまり、人々が将来について評価する際に、「ああ、大丈夫です。バックグラウンドでたくさんのプロンプトが実行されていて、長時間実行されても構いません」と考えるのは間違っています。100%間違っています。
実際、私たちが最初にチップでスピードを得ることに取り組み始めたとき、私たちはどのくらいのスピードが得られるか知っていました。私たちはそのスピードがどれくらい速いかを示すビデオ例まで作りました。そして人々はそのビデオ例を見て、「なぜ読むよりも速い必要があるのですか」と言うのです。そして私はそれに対して「なぜウェブページは読むよりも速くロードされる必要があるのですか」と答えます。
人々がスピードの本質的な重要性、エンゲージメントの観点での重要性、結果の観点での重要性を理解できないという精神的な断絶があります。人々は、何が実際にエンゲージメント、結果の観点で重要になるかを判断するのが非常に苦手ですが、私たちは初期のインターネット企業を構築することからこれを知っています。
OpenAIがチップ層に移行できると思いますか。ある時点で、Nvidiaは、OpenAIが垂直統合してチップ層も所有したいと思うことを懸念しなければなりません。彼らはその移行を成功させることができると思いますか。
自社のチップを構築する際の問題の1つは、まず第一に、誰もがチップを構築することが難しい部分だと考えていることです。そして、実際にやってみると、ソフトウェアを構築することが難しい部分だと気づき始めます。そして、それを実行すると、すべてが向かっている方向に追いつくことが難しい部分になり始めることに気づきます。
OpenAIが自社のチップを構築できることに疑いはありません。最終的にAnthropicが自社のチップを構築することに疑いはありません。すべてのハイパースケーラーが自社のチップを構築するでしょう。私がGoogleにいたときの経験の1つは、ラボツアーを受けたことです。これはAMDが素晴らしい仕事をする前で、AMDは少しの間苦戦していましたが、今は素晴らしい仕事をしています。
彼らは1万台のサーバーを構築していました。そしてそれらの1万台のAMDチップのサーバーを、私はラボを歩いているときに、彼らがサーバーをラックから引き出し、AMDチップを取り外し、それをゴミ箱に捨てているのを見ました。面白いことに、それはほとんど予め定められていました。なぜなら、その世代ではIntelが勝つことを誰もが知っていたからです。
では、なぜGoogleは1万台のサーバーを構築したのでしょうか。彼らが購入するIntelチップの割引を得たかったからです。そして、そのスケールでは、自社のサーバーを設計するコスト、彼らはAMDチップに合わせて自社のマザーボードを設計しなければならなかったので、それを構築してテストするコストと、得られる割引を比較すると、完全に価値があります。
だから、人々が自社のチップを構築する際のすべての動機を考える必要があります。それは大量生産でそのチップを展開するからだけではありません。実際には、NvidiaはHBMに対して事実上モノプソニーを持っています。モノプソニーは独占の反対です。つまり、単一の買い手であり、GPUに搭載される高帯域幅メモリであるHBMの容量が有限である場合です。
GPU自体は、携帯電話のチップを構築するために使用されるのと同じプロセスを使用して製造されています。Nvidiaが望めば、年間5000万個のGPUダイを構築できますが、今年は約550万個のGPUを構築する予定です。その理由はHBM、それが搭載されるインターポーザのためです。そして、容量が有限なのです。
何が起こるかというと、ハイパースケーラーがやってきて、100万個のGPUが欲しいと言います。そしてNvidiaは、申し訳ありませんが、他の顧客がいますと言います。そしてハイパースケーラーは、問題ありません。自分で構築しますと言います。そして突然、NvidiaはそれらのGPUをハイパースケーラーに提供するために見つけます。
容量が有限なだけです。自社のチップを構築することによって、実際に得られるのは自社のチップではありません。自分の運命をコントロールできることです。それが自社のチップを構築することの独自の販売ポイントです。
では、自分の運命をコントロールするとはどういう意味ですか。Nvidiaはあなたに何個のGPU割り当てがあるかを指示できません。自社のチップを展開するコストは高くなるかもしれません。なぜなら、それはNvidiaのものほど良くないからです。
NvidiaのGPUがAMDのGPUに対してわずかなエッジで支配している理由を考えてみましょう。展開する総コストがチップとシステムのコストの大きな倍数である場合、チップのコストのわずかなパーセンテージ増加は無視できます。
こう考えてみてください。CPUを展開し、そのCPUがBOMの20%であり、チップの速度が20%向上した場合、それはシステム全体で20%の価値増加になります。対してチップコストの20%増加と比較すると、無視できます。つまり、チップのパフォーマンスを向上させると、これらの巨大な倍数が得られます。
したがって、パフォーマンスのわずかな差が製品の価値に大きな差をもたらします。つまり、わずかなエッジがその製品の販売において大きなエッジを与えます。
あなたが言及したモノプソニーについてお聞きしたいのですが。OpenAI、Anthropic、マグニフィセント7のいずれか、他のプロバイダーがチップ層に移行することは可能ですか、HBM市場にモノプソニーがある場合。非常に難しいです。
しかし、HBMを構築している人々には、それを広める動機があります。なぜなら、Nvidiaは非常に大きな買い手であるため、非常に良いレートを交渉できるからです。しかし、HBMファブとパッケージングハウスなどのエコシステムの一部を構築している場合、Nvidiaがやってきて大きな小切手を書けば、彼らのためにファブを構築するでしょう。
したがって、Nvidiaは常に、彼らが望む供給量を事前に得ることができます。問題は、2年以上前にその小切手を書かなければならないことです。そして、AIが進んできたところ、ホッケースティック状に急上昇しているところ、Nvidiaのキャッシュフローがあっても、将来的に需要がある量に対して事前に小切手を書くことは難しいのです。
したがって、供給制約が生じることになり、それは純粋にモノプソニーに基づくものではありません。その一部は、単純に膨大な資本コストに基づいており、メモリサプライヤーは非常に保守的です。また、HBMのマージンが非常に高いため、誰も実際に供給を増やしたくないという状況もあります。なぜなら、そうするとマージンが下がるからです。
OpenAIとAnthropicの資金調達とチップ開発
それは完全に理解できます。それを見たとき、OpenAIやAnthropicが自社のチップを持つことを見たとき、それが彼らが調達している資金の理由ですか。サムは数千億ドルが必要だと言っていました。それを考慮に入れているのですか。いいえ。支出のほとんどは、システムを購入することは高価です。データセンターを購入することはもっと高価です。
理由は、そのデータセンターをより長い期間にわたって償却するからです。したがって、データセンターが年間コストの3分の1になるとしても、そのデータセンターを10年間にわたって償却し、チップを3年から5年間にわたって償却する場合、データセンターは年間でより多くのコストがかかることになります。
したがって、ハイパースケーラーが年間750億から1000億ドルの投資について話しているのを聞くとき、彼らがデータセンターの容量を構築しているため、彼らは今後10年以上にわたって期待しているリターンのために多額のお金を投入しているのです。したがって、それを考えると、実際にはそれほど多くのお金ではありません。
チップサイクルが実際にそれよりも速い場合、3年から5年のサイクルで償却について正しい方法で考えているでしょうか。私は、人々が考えているよりも長い期間で償却していると思います。私たちは内部的により保守的な数字を使用しています。私は5年から6年、つまり3年よりも少し短いと思います。私たちは年に一度チップをアップグレードすることを検討しています。
さて、考え方はこうです。チップの価値には2つのフェーズがあります。それを購入して展開する意思があるフェーズと、それを稼働させ続ける意思があるフェーズです。これらは2つの非常に異なる計算です。展開するときは、設備投資をカバーしなければなりません。稼働させ続けるときは、運用コストを上回ればよいだけです。
今日チップを展開する場合、設備投資を上回る必要があります。すべての設備投資を回収し、利益を上げ、リターンを生み出さなければなりません。一度展開すれば、運用コストを上回っている限り、そのものを本番で稼働させ続けることになります。つまり、チップの価値が時間とともに下がることは問題ないわけですね。
そうです。さて、誰もが賭けているのは、出てくる新しいチップが古いチップの価値を運用コスト以下に下げないということです。そうです。そして私たちの場合、実際には5年は意味をなさないと実際には考えていません。なぜなら、それらははるかにパフォーマンスが低くなるため、実際には価値が電力の運用コストやデータセンターへの支払いよりも低くなるからです。
では、どうなるのですか。私たちは、本当に長い契約を結んでいる人々が多いため、無駄になったチップの余剰供給を持つことになります。そして彼らは、この契約を破棄することが損失でチップを実行するよりも安いかどうかという第3のポイントを計算に入れなければなりません。あなたはこれが見えますか。
では、どうなるのですか。私には言えません。なぜなら、私たちはその状況を避けようとしているからです。したがって、私たちのすべての計算において、はるかに速いペイバック期間を持つことによって、私はそんなに先の賭けをしたくありません。賭けをする時間枠が短いほど、結果は明確になります。
したがって、基本的には、ペイバック期間を可能な限り最小化し、それから運用コストを最小化して、パフォーマンスの低いチップをより速く手放せるようにしたいということですね。そうです。しかし、もう1つのクレイジーな部分があります。会計士としてそれにアプローチすると、これはひどいアイデアだと思うでしょう。
しかし、経験的に見ると、人々はまだH100をレンタルしています。それらのチップはどのくらい古いですか。5年近くになります。そして、それらはまだよく動作しており、まだ運用コストをはるかに上回る収益を上げています。今日H100を展開することは決してないでしょうが、それらを実行することはまだ利益があります。それらは第2フェーズにあります。
理由は、人々が十分なコンピュートを得ることができないからです。もしそうでなければ、H100は今日レンタルしている額のほんの一部でレンタルされているでしょう。そして、十分なコンピュートを得ることができない限り、それは真実であり続けます。問題は、供給制約がない代替案が存在するかどうかです。
そして、ここで私たちが参入したいと考えているところです。では、私たちの価値提案について話しましょう。あなたは最初にスピードについて私に質問しましたね。スピードを求めて私たちのところに来る顧客が何人いるか知っていますか。いいえ。100%です。
彼らがそこにある供給制約に気づいた後、それについて尋ね続ける顧客が何人いるか知っていますか。誰もいません。彼らはスピードから始めます。彼らはそれがエンドカスタマーにとって価値があることを知っています。そして彼らは「ああ、待ってください。十分なコンピュートさえ得られません」と言います。
本当の価値提案は、より多くのコンピュート容量を提供できるかどうかです。2週間前、ある顧客が私たちのところに来て、私たちの総容量の5倍を求めました。彼らはどのハイパースケーラーからもその容量を得ることができませんでした。誰からも得られませんでした。私たちも提供できませんでした。誰も提供できません。そして、私たちはその顧客を獲得できませんでした。ハイパースケーラーもその顧客を獲得できませんでした。十分なコンピュートがありません。
あなたが供給の懸念がない理由があるのなら、なぜそれができないのですか、という質問に対して私が言ったところに戻りますが、あなたの選択は、このコンピュートを購入して顧客を獲得するということです。十分なコンピュートを得て顧客にサービスを提供できない人であれば、その顧客を獲得するために必要なだけ支払う意思があるでしょう。なぜなら、今顧客を獲得することでロックイン価値があると感じているからです。
したがって、私たちが持っている第1の価値提案は、私たちのサプライチェーンがGPUのサプライチェーンのようではないということです。GPUを得るには2年前に小切手を書かなければなりません。私たちの場合、100万個のLPUの小切手を書いていただければ、最初のLPUは6ヶ月後に届き始めます。わあ。18ヶ月の差があるわけですね。その通りです。
わあ。あるハイパースケーラーのインフラ責任者とミーティングを持ち、スピードについて話しました。コストやその他のことについて話しましたが、サプライチェーンについて話し、6ヶ月で何かができることを話したとき、彼は会話を一瞬止めて、それについて掘り下げたかったのです。彼が気にしたのはそれだけでした。
こう考えてみてください。モデルの風景の進行速度を考えると、2年は意味をなしますか。これは、ハードウェア宝くじという論文を書いたサラ・フッカーを知っていますか。いいえ。彼女はその論文を書きました。私がそれから得たTLDRは、人々はハードウェアに合わせてモデルを設計しているということです。
したがって、アテンションよりも優れたアーキテクチャがあるかもしれません。しかし、アテンションはGPUで非常にうまく機能します。したがって、あなたが現職者であれば、人々があなたのハードウェアのためにモデルを設計しているため、有利になります。より良いアーキテクチャが存在するかどうかは関係ありません。それはうまく実行されません。
したがって、それはより良いアーキテクチャではありません。そこに少しループがあります。したがって、2年先を見据えて構築していて、現職者であれば、それで問題ありません。しかし、市場に参入しようとしている場合、誰も2年先にあなたのチップのために設計しないでしょう。したがって、より速いループを持たなければなりません。
誰もがチップ層に移行するのを見たとき、あなたが言ったように、OpenAIは自社のものを持つでしょう、Anthropicは自社のものを持つでしょう。その世界でNvidiaは何をするのですか。Nvidiaは依然としてチップを販売し続けます。なぜなら、買い手の集中度を考えると、誰もAIがどれだけ速く成長するかをうまく予測できていません。
過去10年間、データセンターのインフラを見ると、それを2年、3年、4年、5年先まで計画していますよね。そして何が起こるかというと、誰もの予測が間違っています。彼らは結局、構築が少なすぎることになります。これが過去10年間起こったことです。
したがって、10年間十分に構築しない場合、何をしますか。過剰に構築しようとします。最も楽観的な予測よりも多く構築しようとします。そしてまた、十分に構築していません。したがって、予測を増やし、それを続けるだけです。それが起こっていることです。
それでも人々は十分なコンピュートを構築していません。そして人々の本能がずれているところ、これはまだ認識されていないと思いますが、AIはSaaSのようには機能しません。SaaSでは、エンジニアのグループが出て行って製品を構築し、その製品の品質は、それらのエンジニアがしたことに基づいて決定されます。AIではそうではありません。
AIでは、プロンプトの2つのインスタンスを実行し、より良い答えを選ぶことで、製品の品質を向上させることができます。実際に各クエリでより多く支出して、製品をより良くすることができます。この顧客はより価値があると決定し、より良い結果を提供することさえできます。
それはOpenAIが発表したことの一種です。彼らは今週これを行いましたが、彼らは実際にはコンピュートを余裕がないいくつかの製品をリリースすると言いました。したがって、限られたユーザーセットに提供し、もっと課金します。なぜなら、AIにもっとコンピュートを与えたときに何が起こるかを見たいからです。その製品がどのように見え、どれだけ良くなるかを見たいのです。そしてそれが私たちの未来になるでしょう。
アプリケーションにもっとコンピュートを与えるたびに、品質が向上します。そしてこれが、人々のトークン・アズ・ア・サービスの請求がほぼ収益と一致しているのを見るのが偶然ではない理由です。なぜなら、彼らは顧客を求めて競争しており、もっと支出すれば、製品が良くなるからです。
効率性とコスト削減の未来
完全に理解できます。しかし率直に言って、GPT-5を見て効率性に焦点を当てるとき、サムがパフォーマンスから効率性に移行した理由は、コンピュートが同等レベルのパフォーマンス向上と等しくないからだという前提があります。それは公正で真実だと思いますか。そしてそれはあなたが今言ったことに反しませんか。
いいえ。彼らが求めている異なる結果について考える必要があります。OpenAIであれば、非常にコストに敏感な市場に移動しました。インドについて少し話しましょう。インドを勝ち取りたい場合、何が必要ですか。月額99ルピー。それは現在の為替レートで約1.13ドルです。顧客に製品に対して1.13ドルを請求する必要があります。
彼らは、代替案がAIを持たないという市場を追いかけています。OpenAIがあります。つまり、彼らはDeepSeekを使うことができます。これは市場のもう1つの誤解です。すべての誤解を暴き始めましょう。いいですね。中国のモデルが出てきたとき、誰もが「なんてことだ、彼らは米国のモデルとほぼ同じくらい良いモデルを訓練した」と反応しました。
そして私たちはこれについてポッドキャストをしましたよね。最初は私でさえ少し騙されました。そして、なんということでしょう、これらのモデルの実行がとても安くないのですか。今、人々が使用している基盤モデルと中国のモデルについてもっと知っているので、いいえ、それらは実行するのに安くありません。約10倍高価です。
実際、リリースされたGPT OSSモデルを見てみましょう。それは中国のモデルとは異なるものに最適化されていますが、品質は非常に高いです。中国のモデルが焦点を当てているものよりも明らかに優れたモデルだと私は主張します。
しかし、中国のモデルは異なることに焦点を当てています。しかし、OSSモデルを実行するコストは中国のモデルの約10分の1です。では、なぜ誰もが安く課金していたのでしょうか。人々が「このモデルが欲しい」と言い、それを提供するプロバイダーが1つしかないために、モデルに対して捕らえられた市場のようなものがある場合、10倍請求できます。
価格は高く、人々はコストと価格を混同していました。したがって、中国のモデルは実行するのに安くなるのではなく、訓練するのに安くなるように最適化されました。そして、OSSモデルに対して中国の同等のモデルと比較して、どれだけのインテリジェンスが詰め込まれているかを見ると、米国がまだ訓練の優位性を持っていることは明らかです。
経済学は、すべての推論にその訓練を償却しなければならないように機能します。つまり、もっと請求したいということです。したがって、まだバランスがあります。しかし、より大規模な人数にスケールアウトすると、モデルを訓練できることが見返りになり始めます。より多くの推論容量を展開すると、推論コストを下げるために訓練にもう少し支出したくなります。
米国では、膨大なコンピュート優位性があります。したがって、人々はモデルをより厳しく訓練し、コストを下げます。なぜ米国にコンピュート優位性があるのですか。チップへのアクセスという点でですか。その通りです。
では、中国は推論と実行を補助しないのでしょうか。私は理解しています。中国は、CCPが単にそれを補助するだけで、実行コストが高くても問題ないのではないでしょうか。ホームゲームとアウェーゲームがあります。ホームゲームは、米国のために十分なコンピュートを構築したいということです。
アウェーゲームは、同盟国のために構築したいということです。ヨーロッパ、韓国、日本、インドなどです。そして米国の優位性は、中国は自分たちのホームゲームに勝つことができます。彼らは150基の原子炉を建設するつもりです。したがって、チップがそれほどエネルギー効率的でなくても、十分なエネルギーを持つことになります。
そして、あなたが述べたように、彼らは補助できます。しかし、アウェーゲームは異なります。ある国が100メガワットの電力しか持っていない場合、彼らは何をするのでしょうか。別の原子力発電所を建設するのでしょうか。それは現実的なことではありません。中国ではそれができます。他の場所ではできません。したがって、より良いチップを持つことは、アウェーゲームで優位性を与えます。
私の期待は、今から2年から3年間、米国がそのアウェーゲームにおいて中国に対して明確な優位性を持つということです。そして、私たちが非常に迅速に動けば、多くの同盟国をAI競争に引き込むことができるでしょう。
オープンモデルを持って、中国がすでに行っている効果的な方法で蒸留できるようにすべきだと思いますか。モデル自体が明確な優位性だとは思いません。私があなたのポッドキャストに初めて出演したとき、OpenAIがモデルをオープンソース化しようとしていると予測したのを覚えていますか。
はい。そして私の予測は彼らのブランド力に基づいていました。率直に言って、OpenAIはおそらくLlama 2、どのくらい前の古いモデルを使っても、2年前ですか、人々はおそらくまだそれを使うでしょう。
したがって、そこにはブランドの優位性があります。今、彼らは非常に優れたモデルを持っていますが、そのブランドの優位性のために必ずしも必要ではありません。私は、Anthropicが前世代をオープンソース化すべきだと思います。中国のモデルの代わりに人々に使ってもらうためです。
なぜなら、誰かが中国のモデルを使う意思がある場合、少なくともAnthropicモデルを使い、プロンプトが再利用可能になるからです。ソフトウェアの互換性があるように、プロンプトの互換性があります。たとえば、OpenAI OSSモデルがリリースされたとき、人々が中国のモデルよりもそれを採用し始めた主な理由の1つは、プロンプトを再利用できたからです。
もちろん、誰かが低コストのアプリケーションを持っていて、OpenAIのプレミアムを払う余裕がない場合、これらのオープンソースモデルの1つを使いたいと思います。最終的に、彼らは本当にうまくいき始めます。もっとお金を稼ぎます。プレミアムモデルへのアクセスを得たいと思い始めます。プロンプトは再利用可能です。
したがって、これらのモデルをオープンソース化することによる勝利があり、これらのインフラプロバイダー全員にそのモデルのコストを下げさせることもできます。それに投入される多くのイノベーションがあります。
完全に理解できます。取り上げたい分野がたくさんありますが、あなたは可能な限り多くのコンピュートを構築すると言いました。エネルギー要件は激しいです。このコンピュートの波、津波、何と呼んでもいいですが、それに必要なエネルギーを提供する唯一の方法は原子力ですか。いいえ、いいえ、いいえ。
原子力は効率的でコスト効果的ですが、再生可能エネルギーは効率的でコスト効果的です。私の簡単なハックを教えましょう。米国のすべての同盟国が中国よりも多くのエネルギーを持つためにしなければならないことは、エネルギーが安い場所にコンピュートを配置することを喜んで受け入れることです。
今、ヨーロッパと米国を比較しましょう。米国はヨーロッパと比較して信じられないほどリスク回避的です。わあ。エネルギーでですか。いいえ、いいえ。すべてにおいてです。しかし、どのような種類のリスクかを尋ねなければなりません。2種類のリスクがあります。何かをして間違いを犯す作為の過ちがあります。そして、何かをしないで間違いになる不作為の過ちがあります。
米国は不作為の過ちを犯すことを非常に恐れています。大規模な成長経済にいるとき、見逃すことは何かを失敗することよりも高くつきます。そして、ヨーロッパは不作為のリスクを受け入れることを信じられないほど喜んでいます。
ヨーロッパが競争しようとしている方法は、このデータをヨーロッパに保持したい、またはこのデータをこの国に保持したいというようなことを言うことによる立法を通じてです。ヨーロッパがAIで競争したい場合、必要なのは、ノルウェー、膨大な数の風力タービンを展開してくださいと言うことだけです。
なぜですか。ノルウェーは風力の約80%の利用率を持っています。つまり、80%の時間でエネルギーを生成できます。彼らは十分な水力発電を持っているので、水力発電の5倍の風力を展開すれば、ノルウェー自体が米国と同じくらい多くのエネルギーを提供でき、一貫してそれを行うことができます。
米国全体、それがヨーロッパの1つの国です。原子力ではない他にどれだけのエネルギーがあり、それは解放できるでしょうか。そしてところで、原子力も展開しましょう。原子力は最近信じられないほど安全です。では、なぜ私たちはそうしないのですか。恐怖です。それが本当にそうですか。ヨーロッパの政府と話すとき、彼らはあなたに何と言いますか。
私は原子力を持ち出しません。なぜなら、誰もが反発するエネルギー源を押し付けるつもりはないからです。しかし、最近日本にいたとき、彼らは原子炉をオンラインに戻すことについて話していました。日本は非常に遅いという評判があります。その認識には微妙さとニュアンスの欠如があります。
現実は、日本は決定を下すのが遅いですが、何かを決定すると、非常に速く動きます。例を挙げましょう。日本は2ナノメートルのファブを建設することを決定しました。最後にそこにいたとき、彼らは生産した2ナノメートルのウエハーを見せていました。
今、歩留まりは必要なところにありません。これは生産グレードではありませんが、彼らは2ナノメートルのファブを構築し、そこからウエハーを生産しており、欠陥密度を下げ始めるつもりです。彼らは迅速に動くでしょう。彼らはAIに650億ドルを割り当てており、それを使うつもりで、迅速に使うつもりです。彼らは原子炉をオンラインに戻すつもりです。
日本が原子炉をオンラインに戻すつもりのとき、ヨーロッパはそれを聞いて、ああ、エネルギーで追いつく必要があると言う必要があります。追いつくことがまさに私が考えていたことです。なぜなら、私が考えているのは構築にかかる速度だからです。
あなたは風力の潜在的な容量のようなノイズについて、そしてそれをどのように活用できるかについて言いました。しかし、膨大な供給のタービンを構築するには何年もかかります。そうですか。なぜ、ノルウェー政府が地上に1万基の風力タービンを持つことを許可すると思うのですか。
なぜノルウェー政府がそれにお金を払う必要があるのですか。誰がすべきですか。ハイパースケーラーはどうですか。そこに配置したい他の政府はどうですか。サウジアラビアでは、ギガワットの電力があり、彼らはそのためにデータセンターを構築しています。
なぜヨーロッパはサウジアラビアと協力して、こう言わないのですか。サウジアラビアはデータ大使館のプログラムを行いたいと思っています。そこでは、データに対する主権的な監視を持っていますが、彼らのエネルギーを使うことができます。なぜそれを使わないのですか。問題解決です。彼らは非常に近い将来、3から4ギガワットを構築するつもりです。
ハイパースケーラーはノルウェーに支払って再生可能エネルギー源を使用し、それを活用するでしょう。ハイパースケーラーが持っている不満は、すべての書類仕事と遅さです。
主要なエネルギー会社の取締役会にいた人と話していました。その会社は原子力発電所を建設しています。彼は、彼らが米国では原子力発電所よりも許可に3倍多く支出していると言いました。そして、ヨーロッパについては知りませんが、通常、米国はこの点でヨーロッパよりも優れています。
ヨーロッパで原子力発電所を建設するのにどれくらいのコストがかかりますか、対、インフラの実際のコスト対許可と比較して。ここで、ここで、誰もがこれから持ち去る必要があることがあります。コンピュートを制御する国がAIを制御します。そしてエネルギーなしにコンピュートを持つことはできません。
ヨーロッパはどのくらい遅れていますか。私たちが追いつく方法はありますか。手遅れですか。否定的になりたくありません。私は過度に悲観的ではありませんが、私たちが追いつくことができる深淵がありますか。
ヨーロッパが今行動すれば、今は問題ないと思います。つまり、中国は行動において先を行っていますが、ヨーロッパには5億人います。米国には3億人以上います。そして、すべての同盟国を集め始めると、韓国、ところで原子力発電所の建設方法を知っています。
UAEの発電所は韓国によって建設されました。彼らはここに発電所を建設できます。フランスは発電所の建設方法を知っています。十分なエネルギーを構築するためのマンハッタン計画のようなものはどうですか。夏にヨーロッパを歩き回ると、信じられないほど暑いです。そして冬に歩き回ると、信じられないほど寒いです。それは世界の他の場所では経験しない経験です。もっとエネルギーを構築してください。
ジョナサン、私はあなたに同意します。しかし、私はまた現実的です。私は、単独でも協力してでも、政府としてどれほど遅いかを知っています。これが行われる必要がある速度では起こりません。それが必要な速度で起こらない場合、どうなりますか。
そうなると、ヨーロッパの経済は観光経済になるでしょう。人々は趣のある古い建物を見るためにここに来ます。それだけです。新しい経済に必要なリソースを持っていなければ、新しい経済で競争することはできません。
そして新しい経済はAIになり、それはコンピュート上に構築されるでしょう。モデルの主権は勝つのに十分ですか。プロバイダーを見ると、コンピュートがなければAIを実行できないからです。モデルがどれほど優れていても関係ありません。
OpenAIのモデルよりも10倍賢いモデルを持つことができます。そして、10倍のコンピュートを持っていれば、OpenAIのモデルの方が良くなります。したがって、「ヘイ、私たちはヨーロッパ内で主権を持ち、ドイツの医療システムとクロアチアの運輸省がMistralを使うでしょう。なぜなら私たちはヨーロッパの代替案だからです」と言うMistralにとって、それは勝つ理由ではありません。
USPは何ですか。独自の販売ポイントは何ですか。それはヨーロッパのモデルであり、トランプ政権下の米国に所有権を持っていません。それは十分なコンピュートを与えることと何の関係がありますか。あなたがそこで解決しているのは、誰か他の人があなたをコントロールする能力を取り除くことです。
しかし、あなたが解決していないのは、十分にそれを持つことです。そしてところで、私はMistralを使うなと言っているわけではありません。私たちはMistralとパートナーシップを結んでいます。私たちはMistralが大好きです。
私が言っているのは、Mistralが競争できるように十分なコンピュートを構築してくださいということです。これを聞いて、あなたはただ「クソ、Coreweaveを買い占めるべきだ」と思わないのですか。真剣に、彼らがオンデマンドで提供するものを見ると、Coreは素晴らしい会社です。しかし、彼らはGPUの有限な割り当てを持っています。誰もが有限な割り当てを持っています。
以前チャットしたとき、あなたは私に、GPUは推論のための最良のインフラではないと言いました。正解です。そして私たちは、訓練モデルの成熟サイクルをさらに進むにつれて、ますます推論の世界に移行しています。そうです。それはNvidiaのパワーホールドがさらに弱まることを意味しませんか。
いいえ。Nvidiaは構築するすべてのGPUを販売するでしょう。そして、たとえ私たちがGPUの10倍のLPUを供給することになったとしても、それがすることは、GPUの需要を増やし、彼らがさらに高いマージンを請求できるようにすることだけです。
なぜですか。申し訳ありません。なぜなら、前に述べたように、推論が多ければ多いほど、推論のために最適化するためにモデルを訓練する必要が増え、訓練が多ければ多いほど、訓練のコストを償却するためにコストを最適化するために展開したい推論が増えるからです。その2つの間には好循環があります。
推論市場は、成熟、展開速度の点であなたが期待したように展開していますか。私が決して期待しなかったのは、AIが言語に基づくことになるということでした。そしてそれが行ったことは、AIと対話することを些細なことにしたことです。私はそれがアルファ碁のようなものになると思っていました。何らかの奇妙で難解な方法で知的になると思っていました。
それが言語であるという事実は、誰でも使えることを意味します。だから私はAIがもっと早く来て、もっとゆっくり成長すると予想していました。それは遅れて来て、私が想像していたよりも速く成長しています。AIと対話することは非常に簡単で、誰でもできます。世界の人口の10%がChatGPTの週間アクティブユーザーです。それは驚くべきことではありませんか。
はい。しかし、何がそれを妨げているか知っていますか。コンピュートです。コンピュートはその品質を妨げています。しかし、もっと多くの人々が使うでしょう。彼らはそこから多くを得られないだけです。しかし、もっと多くの言語がサポートされれば、もっと多くの人々が使うでしょう。
これは世界中で私たちが聞く第1の不満です。何がそれを解決するか知っていますか。もっとコンピュート、もっとデータです。もっとデータがあれば、もっと訓練できますが、もっとコンピュートが必要です。そしてところで、もっとコンピュートがあれば、もっと合成データを生成できるので、もっと訓練できます。
これらのすべてのうち、データ、アルゴリズム、コンピュートがあります。そのうちの1つを改善すれば、それはボトルネックではありません。コンピュートが良くならなければもっとデータを使えない、またはデータが良くならなければもっとコンピュートを使えないというようなことではありません。これらのうちの1つが良くなれば、AIが改善されます。そしてそれはAIを改善することを本当に簡単にします。なぜなら、その1つの次元を改善できるからです。
ただ、AIを改善する最も簡単なノブがたまたまアルゴリズムではないことがわかっただけです。アルゴリズムはめったに改善されません。データではありません。なぜなら、もっとデータを得ることは本当に難しく、合成データ生成を完全に理解していないからです。
私たちはそれが得意ですが、まだコンピュートを直接もっとデータに変えることができる段階にはありません。そこに到達しつつあります。コンピュートは最も簡単なノブです。なぜなら、それは毎年どんどん良くなり続けるだけだからです。そして、十分なお金の小切手を書いて、少し待つ意思があれば、もっとコンピュートを得ることになります。
それはパイプラインの最も予測可能な部分です。それがパイプラインの最も予測可能な部分であることを考えると、それでも私たちは必要な量を劇的に過小評価していますか。どのくらい過小評価していると思いますか。はい。はい。どのくらいのスケールで。
コンピュートの無限需要と経済への影響
もっとコンピュートを追加するたびに製品が良くなることについて私が言ったことに戻りましょう。私たちが使用できるコンピュートの量に制限はありません。それは産業革命とは異なります。産業革命では、それを使うための機械を持っていない限りエネルギーを使うことができず、機械を構築しなければならず、それには時間がかかりました。
もっと多くの車を道路に走らせたい場合、車を構築しなければなりませんでした。ただ地面からもっと多くの石油を引き出すだけでは十分ではありませんでした。AIはそのようではありません。はい、モデルを良くすれば、実際には同じ量のコンピュートでもっと多くのことができます。しかし、コンピュートを2倍にすれば、ユーザー数を2倍にします。モデルの品質を向上させます。
これは異なります。私は文字通り、経済にもっとコンピュートを追加するだけで、経済がより強くなります。私たちは以前、それがボトルネックではなかったということを持っていませんでした。それはゴム首のようなもので、1つのコンポーネントをもっと押し込むことができ、そしてすべてが改善されます。
経済が強くなると言いました。それについて考えるとき、それが何に基づいているかというと、それはGDPの10兆ドルの労働支出がAIにシフトすることに基づいており、私たちはそれの一部を取ります。今後5年間でGDPまたは労働への支出がAIに向かって移行する重要なシフトが見られると思いますか。
私はAIが大規模な労働力不足を引き起こすと信じています。創出されるすべての仕事を埋めるのに十分な人々がいないと思います。AIのために起こることが3つあります。最初は大規模なデフレ圧力です。
このコーヒーのカップはより安くなります。あなたの住宅はより安くなります。すべてがより安くなり、それは人々がより少ないお金を必要とすることを意味します。では、AIのためにコーヒーのカップがより安くなるのはなぜですか。
なぜなら、コーヒーをより効率的に栽培するロボットができるからです。より良いサプライチェーン管理ができます。遺伝子工学によってコーヒーを作り、太陽光のワットあたりでもっと多くを得られるようになります。スペクトル全体にわたってです。大規模なデフレ圧力が起こります。それが第1です。
そしてそれが意味するのは、人々がより少なく働く必要があるということです。そしてそれがあなたを第2に導きます。それは人々が経済からより多くオプトアウトすることです。彼らはより少ない時間働きます。週のより少ない日数働きます。そしてより少ない年数働きます。
彼らはより早く退職します。なぜなら、より少なく働いてライフスタイルをサポートできるようになるからです。そして第3は、私たちが新しい仕事と今日存在しない新しい産業を創造することです。100年前を考えてみてください。米国の労働力の98%が農業に従事していました。2%が他のことをしました。
人口の2%が農業で働くようにそれを減らすことができたとき、私たちはそれらの他の98%の人口がすることを見つけました。100年後に存在する仕事は、私たちは想像することさえできません。100年前、ソフトウェア開発者のアイデアは意味をなしませんでした。100年後、それは意味をなさないでしょう。しかし、異なる方法でです。なぜなら、誰もがバイブコーディングをしているからです。
そしてインフルエンサー、それは100年前には意味をなかったでしょう。しかし今、それは本当の仕事です。人々はそれから数百万ドルを稼いでいます。では、100年後にどのような仕事が存在するでしょうか。だから、第1、デフレ圧力。第2、そのデフレ圧力のために労働力からオプトアウトすること。
そして第3、今日存在できなかった仕事と会社が存在することになり、労働力が必要になります。私たちは十分な人々を持たないでしょう。反対の物語が魅力的ですね。誰もが「ああ、何百万、何百万もの人々が失業するだろう」と言っています。そしてあなたは「いいえ、実際には仕事のために十分な人々がいないだろう」と言っています。
有名な100年前の予言は何でしたか。大規模な飢饉が起こるだろうというものでした。なぜなら、私たち自身を養うことができないだろうからです。人々は常に、技術を改善したときに経済で何が変わるかを過小評価します。
エネルギーの観点から、そしてあなたが労働について言ったことについて、要件について考えるとき、トランプとトランプ政権は米国におけるAIの進歩を助けるためにもっとしていると思いますか、それとも害を与えていますか。
間違いなく助けています。行われたすべての動きは、AIを助けることになるものです。たとえば、許可の問題についてですね。全体的に、AIに関しては非常にポジティブな経験でした。
あなたはバイブコーディングについて言及しましたが、それについて尋ねなければなりません。これは持続可能な市場だと思いますか。今日のユースケースの多くを見ると、それらはかなり一過性です。バイブコーディング市場の未来をどう分析しますか。少し遊んでみて、そしてあなたが言ったように内部で非常に上手に使っているインターンを見たことがあります。
バイブコーディングは、読書を取りましょう。読み書きは以前はキャリアでした。あなたが書記であれば、読み書きの方法を知っている人口のわずかなパーセンテージの1人であり、人々はただ物事を記録するためにあなたを雇い、あなたは経済の平均的な人よりもはるかに良くやっていました。それは専門的なスキルだったからです。
コーディングは同じことでした。人口の非常に少ないパーセンテージが行いました。それをうまく行う方法を学ぶのに数年かかりました。何人かの人々はそれが本当に得意でした。今、誰もが読み、誰もが書きます。それは特別なスキルではありません。すべての仕事で期待されます。そしてコーディングは同じことになるでしょう。
マーケティングにいるためには、コーディングできなければなりません。カスタマーサービスにいるためには、コーディングできなければなりません。25のコーヒーショップのチェーンを経営している人と夕食を取っていましたが、その人は人生で一度もコーディングしたことがありませんでしたが、在庫をチェックできるサプライチェーンツールをバイブコーディングしました。
彼らは1行もコードを書きませんでした。それを機能させました。そして面白かったのは、彼らが私たちソフトウェアエンジニアが時間をかけて発見するすべての問題を発見したことです。彼らは従業員からフィードバックを受け始めました。この機能は機能しません。これをするとこれは機能しません。すべての小さなエッジケースです。そして彼はそれらを修正し始めました。すべてバイブコーディングを通じてです。
あなたの製品への需要、lovableやReplitへの需要を見るとき、率直に言って両方とも悪いマージンを持っています。成長需要がこれほど高いとき、指数関数的成長の世界でマージンは重要ですか。悪いマージンを持つことは重要ですか。
マージンについて言うならば、まず第一に、最終的には収益性または少なくとも損益分岐点を持たなければなりません。継続企業であるためには。ある時点で、お金を調達し続けることはできません。Amazonでさえ、いくらかのお金を稼ぎ始めなければなりませんでした。
しかし、より高いマージンが必要な本当の理由はボラティリティです。なぜなら、非常に薄いマージンを持っていて、市場が動けば、もっとお金を調達できないかもしれないからです。ローンを得ることができないかもしれません。
したがって、マージンが行うことは、市場での安定性と滞在力を与えることです。一方、それが行うことは、競争が参入する能力も与えることです。あなたのマージンは私の機会です。したがって、あなたがトレードしているのは、競争モードのための安定性です。それがあなたがしなければならない決定です。
今日、内部的にマージンについてどう考えていますか。マージンを持つ能力を持ちたいと思いますし、それを顧客に与え、彼らに優位性を与えたいと思います。そして、必要なときにそのマージンを取る能力があれば、素晴らしい位置にいます。
最近素晴らしいCFOを雇ったことを覚えていますが、以前の候補者と話していたことを覚えています。マージンについて話していたとき、彼らは需要が供給と一致するように価格設定すべきだと言いました。言い換えれば、彼らは需要を下げるために価格を上げたかったのです。
理にかなっていますか。経済的な意味で。論理的にも合理的にも。しかし論理的に、ブランドエクイティを使い果たさないのはなぜですか。顧客が持っている信頼を使って、良くないものを売らないのはなぜですか。ブランド価値、ブランドエクイティには価値があります。
ブランドエクイティを可能な限り高く保ちたいです。なぜなら、信頼は利息を支払うからです。同様に、顧客があなたが良い取引を提供していることを知っているという、この種のエクイティ価値を築くのに十分低くマージンを保ちたいです。
高いマージンを請求するとき、あなたは顧客と対立しており、顧客と整合するために可能な限りすべてをしたいです。ビジネスを安定に保ちながら可能な限り低くできるようにマージンを持ちたいです。そして、ボリュームを増やすことによってキャッシュフローを作ります。
そして、コンピュートビジネスについて私が大好きなことの1つは、コンピュートの必要性が飽くなきものだということです。それはジェヴォンズのパラドックスです。10倍のコンピュートを生産すれば、10倍の売上を得ます。それがそれが機能する方法です。
コストを下げ続ける限り、人々はもっと買うでしょう。だから私はそのコストを下げ続けたいです。ボリュームを増やし続けたいです。そして人々がビジネスからもっと価値を得て、もっと買うように、より少ない金額でもっと多く販売し続けたいです。そしてそのサイクルが続きます。
コストを下げる旅のどこまで来ていますか。いくつかのショーを振り返ると、自分に対して身震いします。なぜなら、私はCanvaがAIを実装していて、AIを実装しているので彼らのマージンを傷つけていると話しているからです。そしてそれは彼らにもっとコストをかけることになります。
その質問をすることさえ、非常にナイーブなアプローチです。なぜなら、今では実装のコストが98%下がっているからです。コスト削減サイクルの点で、私たちはどこまで来ていますか。
一歩下がって、あなたのCanvaの例を使いましょう。成功したビジネスは収益を見ません。彼らは顧客を見ます。彼らは顧客が抱えている問題を解決します。競争している場合、あなたは間違ったことをしています。差別化したいです。
顧客がまだ解決していない、他の方法では解決できない問題を解決したいです。そして彼らは喜んであなたにお金を払います。そしてそれがそれが機能する方法です。あなたは彼らの問題を解決し、そしてあなたのキャッシュフローが解決されます。
したがって、誰かがAIに支出している場合、バランスシートを見るだけでは、それは意味をなしません。しかし、顧客が非常に幸せで、他の方法では解決できなかった問題を解決しているとき、まず第一に、通常はAIでTAMを増やしています。なぜなら、それは製品を使うことをはるかに簡単にするからです。
2年前にPhotoshopを使いましたか。不可能でした。今、画像を生成したい場合、欲しいものを説明するだけです。それはTAMを増やします。写真1枚あたりより少なく請求できるかもしれませんが、総収益は増えます。総市場が増えます。
市場評価とAIの真の価値
この金融的な質問を許してください。しかし、S&Pが7,000に到達しようとしているのを見ます。私たちは何年も見ていないような価値の集中のマグニフィセント7のこの引き裂きを見ます。そして人々は突然、うわー、トップっぽくなってきたと感じ始めます。
私はあなたに耳を傾け、これらすべてを聞いて、それはただの始まりだと思います。それらの2つの考えの二重性について、私はどう考えるべきですか。
価値には2つの構成要素があります。1つは計量機で、もう1つは人気コンテストです。そして、暗号通貨のような純粋な人気コンテストである製品がいくつかあります。私はビットコインを一度も買ったことがありません。私は逃しました。なぜですか。なぜなら、私は人気コンテストでプレーできないからです。
私はそれが得意ではありません。何が人気になり、何がならないかわかりません。私ができることは、価値を見ることができるということだけです。AIを見ると、本当の価値が提供されているのが見えます。最良の例は、PEファームが私たちに殺到しています。彼らは安いAIコンピュートへのアクセスを望んでいます。なぜなら、もっと安いAIコンピュートを得るたびに、彼らはビジネスの収益を変えることができるからです。
それには本当の価値があります。PEファームが何かを追いかけ、そこに価値を見るとき、それは人気コンテストではありません。それは純粋な価値です。したがって、何が起こるかというと、企業が大きな倍数を得る理由は、人々が評価が実際の価値が蓄積されることを見るか、またはそれについて誇大広告サイクルされ、それは純粋な人気コンテストです。
そして市場には異なる参加者がいます。彼らのうちの何人かはただ人気コンテストをプレーしています。他の人々は価値を見ていて、彼らは異なる理由で同じ結論に達するかもしれません。価値の観点から、計量機の観点からそれに来ています。
経済で最も価値のあるものは労働です。そして今、私たちはもっとコンピュートを生産し、より良いAIを作ることで、経済に労働力をもっと追加できるようになるのです。それは経済の歴史上、これまで一度も起こったことがありません。それは何をもたらすのでしょうか。
短期的に速度バンプがあった場合、価値の集中を考えると、経済の重要な部分を脱線させることを心配していますか。誰もが今日引き裂いています。しかし、Nvidia、Meta、Google、Microsoftが突然速度バンプに当たり、AIのスピード列車が減速されたら、その結果としての乗数効果は巨大です。それを心配していますか。
はい。そして、これはAIの価値とは独立しています。これは起こっていることの一種の制御システム理論です。株式市場は本質的に上昇軌道にある可能性があります。それは過熱する可能性があり、その過熱はそれを暴走させます。人々は物事を入札します。彼らは間違いを犯したことに気づき、そして戻ってこなければならず、そしてあるべきところより下に落ちます。
支出が後退し、そして人々は彼らのビジネスを構築するために必要な資金を持っていません。多くの良いビジネスがこれらの下降トレンドの1つの間に死ぬことがあります。しかし、これはまた、最高のビジネスが作られるところでもあります。どれだけ頻繁に景気後退を見ますか。そして、そこから驚くべきビジネスがたくさん出てきます。
来年中に景気後退があると思いますか。景気後退があるかどうかを予測することはできません。物事があります。何かを予測する能力は、予測が予測に影響するかどうかに大きく依存します。予測が予測に影響する場合、あなたはそれを予測することはできません。なぜなら、あなたの予測が何であれ、結果を変えるからです。
予測可能な唯一のものは、予測が結果を変えないものです。小惑星が地球に向かっていて、私たちがそれを見た場合、それを止める技術を持っていなければ、それは起こるでしょう。しかし、それが起こるのを見て、予測できれば、それを止める技術を開発するかもしれません。問題が見えますか。
見えます。そして経済では、ドルを動かす以外に何もする必要はありません。したがって、人々の予測能力に基づいて、経済には非常に速い痙攣があります。それがそれを予測不可能にします。
経済で何が起こるかを教えることはできません。私が言えることは、今、AIで私が見る最大の問題は、良いエンジニア、以前に雇ったであろう人を見ると、彼らは出て行って1000万、2000万、1億、10億ドルを調達でき、そして他のAIスタートアップの1つに貢献する代わりに、彼らは自分自身のものを作ります。
つまり、これらのAIスタートアップのいずれかで重要な人材の集中を得ることが困難になります。一方で、AIは、これらのスタートアップの1つにいる全員をより生産的にしています。したがって、経済が過熱しているかどうかという点では、それの最良の予測因子の1つは、経済が企業の成功の邪魔になっているかどうかだと思います。邪魔になっていなければ、過熱していないと思います。
人材争奪戦と企業評価の未来
邪魔になっていると思いませんか。なぜなら、根本的に資本供給側が非常に大きいので、実際に素晴らしいエンジニアリングチームを集めることを妨げているからです。なぜなら、私たちは人材に極端に資金を提供していて、彼らがGroqに参加するのではなく、巨額のお金を調達できるからです。
はい。それをやめてください。いいえ、いいえ、しかしAIは人々をより生産的にしています。したがって、経済がうなり続け、すべての企業が非常に成功し続けることが可能かもしれません。わかりません。私たちは以前にこれを経験したことがありません。
今日、人材争奪戦は狂気ですか。それは間違いなく、これまでの歴史のどの時期よりもはるかに攻撃的です。しかし、テクノロジーだけです。スポーツを見ると、スポーツは常に狂気でした。少なくとも最近は狂気でした。
20年前、30年前のスポーツを振り返ると、給与はテクノロジーの給与によく似ていました。確かに。人々は価値に気づいているだけです。問題はスポーツでは、限られた数のチームがあります。サラリーキャップを設ける可能性さえあります。そしてこのようなことです。
テクノロジーでは、私たちはそれをしていません。そして、無制限の数のチーム、無制限の数のスタートアップがあります。誰でも自分自身のフットボールチームを作成できると想像してみてください。それは給与に何をするでしょうか。そしてそれはフランチャイズの価値に何をするでしょうか。
どの既存企業に最も感銘を受けていますか。そして、最も心配または懸念している企業はどれですか。Googleはおそらく最大のターンアラウンドを行ったと言えます。そして彼らは構造的な優位性を持っていました。
つまり、Googleは歴史的にエンジニアが良いアイデアを思いつくことにより依存しており、経営陣が邪魔をしなければ、Googleで素晴らしいことが起こります。したがって、文化的な観点から、それは体系的な優位性だと思います。そして彼らにとって、Geminiは最終的に彼らにとって成功だったと思いますか。
そう思います。つまり、採用の数字を見るだけで、素晴らしかったです。消費者製品への実装についてどう感じていますか。それほどではありません。つまり、各製品へのランダムなGeminiの導入を見ます。Gmailに入っていますが、実質的に使用不可能です。ほぼすべての製品に入っていて、半分思慮が足りないように投げ込まれているように見えます。
しかし、それをまだ判断すべきではありません。なぜなら、少なくとも彼らは人々がそれをどのように使っているかに触れており、実際に何をすべきかを理解するためにそれを使うことができるからです。つまり、Google Chromeで何が起こったかですよね。それはもともとGoogle TVでした。
完全な失敗で、それから彼らは反復し、Google Chromeに変えました。これは、誰かが何かをそこに出し、誰もがそれに向かって投げつける古典的な問題であり、より良い製品を構築するためにそれらの投げつけを喜んで受け入れているだけだということに気づかないのです。
そして、配信の優位性のウィンドウが残っている限り、それらの投げつけを受け入れることは問題ありません。しかし、挑戦的なのは、OpenAIがその深淵を非常に大幅に閉じているということです。それは事実です。Googleは遅すぎるかもしれません。わかりますか。それは古典的な、既存企業がスタートアップが配信を獲得する前にイノベーションを達成できるかという感じです。そしてそれはスタートアップが配信を獲得したようなものです。世界の10%。かなり印象的です。
この時点で、OpenAIが消えるシナリオを想像するのは難しいでしょう。私は単にそれがどのように起こるか見えません。したがって、少なくとも、この時点から2つの競合他社がそれに取り組んでいます。しかし、それはOpenAIとAnthropicですか、OpenAIとGoogleですか。OpenAIとGoogleです。Anthropicは異なることをしています。
Anthropicはコーディングをしていますよね。OpenAIはチャットボットをしています。Googleはチャットボットをしています。Googleはコーディングもしています。Googleはすべてをしています。つまり、OpenAIもコーディングをしています。そうです、実際、私たちのエンジニアは最近、Anthropicツールを使うよりもCodexを使い始めました。
わあ。そして面白いのは、それがほぼ月単位だということです。私たちには哲学があります。私たちはエンジニアにどのツールを使うかを指示しません。私たちが彼らに言うのは、AIを使わなければならないということです。そうでなければ、単に競争力がなくなるからです。
しかし、私たちは彼らがSourcegraphを使っているのを見ました。その後、Anthropicを使っているのを見ました。その後、Codexを使っているのを見ました。来月はおそらく再びSourcegraphになるでしょう。それはただ円を描いて回り続けています。
スイッチングコストがこれほど低く、非常に乱雑に使用されているだけなら、これらのいずれかに持続的な価値はありますか。私たちのエンジニアは、最良のツールである瞬間に最良のツールに切り替える最先端のエンジニアです。
しかし、多くの人がそのようです。あなたが交流する人々の多くはそのようです。企業はこれらの長期契約を結び、1年前に結んだ契約に固執します。500億でOpenAIに投資するか、180億でAnthropicに投資するか、どちらがいいですか。
両方に投資したいです。そうですか。両方とも過小評価されています。非常に過小評価されています。あなたはまだ、彼らが有限の市場、有限の結果のために競争しているかのように彼らを見ていますが、実際には、彼らが行うR&Dが増えるほど、市場の価値を増やしているのです。
それを展開してください。彼らにとってのブルケースを行うと、それはどのように見えますか。現在のテクノロジー企業はその価値を大幅に増やすことができると思いますが、AI研究所が現在のテクノロジーリーダーがいるところに追いつく間に、彼らの価値を大幅に増やせない理由がわかりません。
マグニフィセント7は価値が増し、そして何が起こるかというと、AI研究所はマグニフィセント7と同じ量の価値を達成しますが、マグニフィセント7はより価値があるでしょう。問題は、AI研究所がマグニフィセント7を追い越すかどうかです。何がそれを決定しますか。わかりません。
率直に言って、彼らは単にマグニフィセント9、マグニフィセント11、マグニフィセント20になると思います。AI研究所がアプリケーション層に非常に大きく移動し、その大部分を包摂すると思いますか。それは非常に成功したテクノロジー企業の自然な傾向です。
彼らは顧客がすることをし始め、スタックを上に移動し、そして彼らは顧客がしたことを作成し、包摂します。そして顧客がしたことを包摂し、そして彼らの上に構築する新しい人々がいます。OpenAI、あなたのショーでサム・アルトマンが何かを言ったと思いますが、もしあなたがOpenAIの上で小さな改良をしているだけなら、追い越されるだろうというようなことです。
彼はただ非常に正直でした。それが彼らがすることです。私たちの場合、私たちは顧客と競争しない領域を見つけました。それは、私たちは自分自身のモデルを作成しないということです。だから、私たちはそれをしないだけです。そして、その線を砂に引くことによって、私たちは、私たちのインフラ上に構築することは安全だと言っているのです。なぜなら、私たちはあなたがすることを追いかけないからです。
そしてそれは間違った判断かもしれません。私たちは顧客の1つに包摂されることに気づくかもしれません。しかし、それはまた、あなたが私たちの上に構築できると信頼できることも意味します。私はその判断で大きな間違いを犯している可能性があります。
あなたも可能性があります。あなたはまた、それを行うために多くの現金が必要になるでしょう。自分自身のモデルを構築するために。そして現金と言えば、あなたは今いくら調達しましたか。私たちは7億5000万ドルを調達しました。
7億5000万ドルで、それは何でしたか。60億。ほぼ70億。わかりました。これは本当に不公平に聞こえます。そしてそれは素晴らしいです。それは十分なお金ですか。それはそうです。実際、私たちは3億ドルしか調達するつもりはありませんでした。
あなたが収益性などの質問を持ち出しました。ハードウェア会社は良い位置にいます。なぜなら、これらの他の会社とは異なり、私たちは実際に売るものからお金を稼ぐからです。したがって、私たちはハードウェアを販売するとき、それらのハードウェアユニットには実際にプラスのマージンがあります。
あなたはマイナスのマージンを持っていると思っていました。ハードウェアを販売するときは今対ソフトウェアを販売するとき。ソフトウェアを販売するとき、それはモデルに依存します。したがって、私たちが今立ち上げているチップで、私たちの最も人気のあるモデルはプラスのマージンです。
しかし、私たちが実行するいくつかのモデルで、運用コストを上回りますが、設備投資には満足していません。他の人は設備投資に満足するでしょうが、私たちはより保守的です。したがって、ハードウェアを販売するときにプラスのマージンを持っていると言う方が簡単です。なぜなら、その瞬間にそれがわかるからです。
私たちは最も収益性の低いモデルでさえプラスのマージンを持っている可能性があります。なぜなら、ハードウェアがどれくらい持続するかわからないからです。マージンはどのくらいで、時間とともにどこに向かいますか。私的企業であることの利点の1つは、あなたに言う必要がないということです。
そうする必要はありません。しかし、もしそうしてくれたら素敵でしょう。それは私的であることの唯一の利点です。いいえ、いいえ、いいえ。多くの、多くの利点があります。ロックアップ期間がありません。はるかに簡単に売却できます。
しかし、私は株式を売却しません。したがって、あなたは一度も株式を売却したことがありませんよね。一度もありません。いいえ。あなたは明らかにこのゲームがどのように機能するか理解していません。心配しないでください。私が教えます。しかし、時間とともにマージンのように、それらは大幅に、どのように、どのように考えますか。私は必ずしも尋ねていません。
いいえ、いいえ。私が先ほど言ったことを言うつもりです。それは、私はマージンを、ビジネスが非ボラティリティのままである限り低くしたいということです。だから、私が言ったように、高いマージンの唯一の理由は、必要なときに現金を持ち込む能力を持ちたいからです。
そして、必要ならより高く価格設定する能力を持つことが必要なのは、マージンを下げることができるということです。コンピュートの需要は非常に高いので、誰かが私たちのところに来て、このコンピュートが必要だと言い、私たちがそれを持っていれば、彼らはより高いマージンを支払うでしょう。それは私たちがより低いマージンを請求することを可能にします。
5年のタイムラインでチップ市場がどのように見えるかを理解するのを助けていただけますか。あなたはOpenAIがあり、Anthropicがあり、すべてのプロバイダーが独自のチップインフラを持つと言いました。Nvidiaもあります。それはどのように見えますか。
私の予測は、5年後もNvidiaは依然として収益の50%以上を持っているだろうということです。しかし、彼らは販売されたチップの少数派を持っているでしょう。彼らは少数派のシェアを持っているかもしれません。彼らは収益の51%を持ち、販売されたチップの10%を持っているかもしれません。
それを理解するのを助けていただけますか。ブランドであることには大きな価値があります。もっと請求できます。しかし、それはあなたをあまり飢えさせなくし、高いマージンを請求し始めます。そして何人かの人々はそれを支払うでしょう。なぜなら、Nvidiaから購入して解雇される人はいないからです。
それは素晴らしい場所です。そのビジネスは信じられないほど価値があり続けるでしょう。Nvidiaに投資している場合、おそらくうまくいくでしょう。しかし、顧客の観点からそれを見ると、私たちが見ているような顧客集中を持っているとき、35、36の顧客が市場での総支出の90%、99%である場合、彼らはブランドよりも少ない決定を下し、彼らのビジネスを成功させるものに基づいてより多くの決定を下すでしょう。なぜなら、彼らはそれらの決定を下すためのより多くの力を持つことになるからです。
したがって、他のチップが使用されているのを見ることになるでしょう。なぜなら、それらの企業は自分自身で決定を下すのに十分な力を持つことになるからです。あなたはNvidia投資家なら悪くはないだろうと言いました。私の友人の1人は、私がハリーについて好きなことは、彼が素晴らしく魅力的だが、一日の終わりに、彼は「それは素晴らしい、それは素晴らしい、しかし私についてはどうですか」と行くということを知っているということだと言います。それは非常に真実です。
5年のタイムラインでNvidiaに対するオーバーアンダー、10兆。個人的には、5年後にNvidiaが10兆の価値がなかったら驚きます。あなたが尋ねるべき質問は、Groqは5年後に10兆の価値があるでしょうかです。
可能です。私たちは同じサプライチェーン制約を持っていません。私たちは世界の誰よりも多くのコンピュートを構築できます。今、最も有限なリソース、コンピュート、人々が入札し、これらの高いマージンを支払っているもの。私たちはほぼ無制限の量を生産できます。
市場がGroqについて理解していないと思うこと、彼らが理解すべきだと思うことは何ですか。ああ、それは毎月変わります。以前は、複数のユーザーを持つことができませんでした。そして、私たちは同じハードウェア上で複数のユーザーを人々にデモしました。
彼らは以前、私たちがこれを持っていないと考えていました。これはSRAM構造のためです。SRAMのためです。実際、ここにもう1つあります。前回の学習に感銘を受けています。ありがとうございます。私は本当にあなたから多くを学びました。真剣に、私は多くを学んでいました。
しかし、私が最もよく聞かれる質問は、SRAMはDRAMよりも高価ではありませんかということです。答えはイエスです。SRAM、それについて考える良い方法は、SRAMは本質的にビットあたり3倍から4倍高価です。本質的に。
すべてを置いておいて、知らない人のために、SRAMはDRAM対です。超簡単です。SRAM、私はそれを超簡単に保ちますが、これは技術的に正確ではありません。SRAMはチップ内のメモリです。DRAMは外部メモリです。それは本当にそれをどのように設計するかに関係があります。
しかしとにかく、SRAMはDRAMよりも3倍から4倍のトランジスタまたはキャパシタ、SRAMの場合はただトランジスタを持っています。DRAMはキャパシタとトランジスタです。SRAMは6個から8個のトランジスタです。
したがって、SRAMは本質的にビットあたり大きく、それはより多くのシリコンを使用することを意味し、したがってより高価です。また、3ナノメートルチップのようなより高価なチップ上にそれを展開しています。したがって、面積あたりの単位でDRAMよりもコストがかかります。
したがって、倍数があります。おそらくビットあたり10倍高価です。問題は、Kimmyのようなモデルを実行していて、4,000個の私たちのチップでそれを実行していて、あなたがそのKimmyモデルを8個のGPU上で実行しているとき、私たちは500倍の数のチップを使用しています。つまり、GPUはそのモデルの500個のコピーを持っています。つまり、彼らは500倍の量のメモリを使用しています。つまり、SRAMが10倍高価であっても、彼らはDRAMで500倍の量のメモリを使用しているため、彼らのコストは高くなります。
したがって、これはチップの観点からではなく、システムの観点からそれを見るという古典的な問題の1つです。私たちが行ったすべては実際にはシステムの観点からであり、今はワールドの観点です。私たちは実際にデータセンター間で負荷分散を行います。私たちは今13のデータセンターにいます。
私たちは米国、カナダ、ヨーロッパ、中東にデータセンターを持っています。ワールドスケールの配信を持っているとき、データセンターレベルで決定を下すだけではありません。私たちは実際に、地理で何が起こっているかに基づいて、入力または出力のために異なるコンパイル最適化を持つ一部のデータセンターでいくつかのモデルのより多くのインスタンスを持ちます。
特定のデータセンターでモデルのインスタンスさえ持っていないかもしれません。他の場所にそれを持っていて、それを負荷分散できます。したがって、私たちはデータセンターレベルではなく、ワールドレベルで最適化しています。
恐れていなかったら何をしますか。ジョナサン、私はそれを、ビジネスでどこでリスクを増やすことができるかと言い換えます。同じ質問です。そして、私たちがまだ行っていないところ、私たちはサプライチェーンの注文を2倍にすることができます。
はい、私たちは6ヶ月のサプライチェーンを持っているので、他の誰よりも速く市場に対応できます。しかし、需要に対して供給がどれくらいオーバーウェイトですか。私が言ったように、先週、誰かが私たちのところに来て、私たちの総容量の5倍を求めました。
あなたが供給の懸念ではない唯一の理由は、ここにあります。なぜそれができないのですか。なぜなら、閾値があるからです。たとえば、2倍の容量を持っていたとしても、その顧客を勝ち取ることはできませんでした。彼らは5倍必要でした。したがって、2倍持つことでは十分ではありません。十分に持たなければなりません。
したがって、容量を2倍にした場合、それらの顧客に十分ですか。そして、あなたが取ることができるリスクは何ですか。申し訳ありませんが、具体的には、私たちは供給を構築している速度を2倍にすることができます。
つまり、この資金調達で、私たちは、期待していたものの2倍以上を調達することになりました。そして、私たちが調達したものに対して4倍のオーバーサブスクライブでした。したがって、もっと多くのお金を調達できた可能性があります。それはもっと希薄化していたでしょう。
そして、私は投資家やその他の人々のために希薄化に敏感であろうとしています。しかし一方で、もっと多くのお金を調達し、大量のコンピュートを構築することができたかもしれません。私たちが持っている他の利点は、他の誰に対しても、私たちのトークンあたりのコスト、特に与えられた速度を考えると、非常に有利です。
したがって、私たちは市場の他の部分よりも少なく請求できることを知っています。それは、これらのビジネスを構築しようとしているときに重要です。人々が支出に意識的であるからではありません。
私たちが請求するものを50%下げれば、人々は2倍買うでしょう。彼らは稼いでいるだけ支出しています。なぜなら、彼らが支出するものは何でも出力の品質を向上させるからです。公開について考えていますか。
私たちの焦点は今、純粋に実行にあります。公開するかどうか、それは、私たちが今プレイしているものとは完全に異なるゲームです。今、重要なのは、私たちがコンピュートの需要を満たすことができるかどうかだけです。
なぜCerebrasは公開することを決定したと思いますか。彼らは最近公開しないことを決定しました。それがその質問に答えます。一日中あなたと話すことができます。簡単なファイアラウンドについて議論したいです。短い声明を言います。あなたは即座の考えを教えてください。それで大丈夫ですか。
はい。今日のNvidiaについての最大の誤解は何ですか。Nvidiaのソフトウェアがモートだということです。CUDAロックインは、訓練には当てはまりますが、推論には当てはまりません。つまり、私たちには今220万の開発者がいます。それがサインアップした数です。
わあ。CUDAは何人いますか。彼らは600万と主張しています。Nvidiaが4兆でAIブームが本格化している今日Groqを設立するとしたら、何を違うようにしますか。チップはしないでしょう。その船はすでに出航しました。
チップを構築するには時間がかかりすぎます。私たちが賭けたのは、それはかかりますか。今出てくるチッププロバイダーにとって、私たちは良い人々から多額のお金を調達している新しいチッププロバイダーが出てくるのを見ています。遅すぎます。
私がチップに行くことを決定した理由です。私はGoogle TPUを行いましたが、去る前に、Google Brainの誰かと一緒にResNet 50のような最良の分類モデルで記録を打ち立てました。私たちは実験を行いました。私たちはすべてを打ち負かしました。
したがって、私はアルゴリズム側に行くことができました。そして、資金調達をしていたときの理由、私はチップを行うかどうか100%確信さえしていませんでした。私はアルゴリズム側で、特に形式的推論で何かを行うことを考えていました。
それをしなくて良かったです。しかし、チップに行く主な動機はモート、時間的モートでした。したがって、私たちがVCからよく尋ねられる質問は、誰かが私たちがしていることをコピーすることを妨げるものは何ですか。そしてその答えは、あなたが私たちがすることをコピーするなら、あなたは私たちの3年遅れです。なぜなら、完璧に実行した場合、チップの設計から本番のチップまでそれだけかかるからです。
私は今、本番またはランプアップ中の3つのチップを行いました。すべて3つはゼロシリコンでした。最初にテープアウトされたチップの14%だけが最初に機能し、ゼロシリコンです。したがって、それは毎回、リスピンしなければならない86%の確率があることを意味します。
私たちがV2チップを構築したとき、私たちは実際にすでにそれのためのリスピンをスケジュールしていましたが、私たちの驚きに最初のものが機能したため、それを行う必要がありませんでした。そのようなことを期待すべきではありません。したがって、その3年は、すべてが完璧に進んだ場合です。
Nvidiaは通常、チップあたり3年から4年かかり、彼らは同時に複数を行っているだけです。Groqは今1年サイクルにいます。したがって、私たちのV2の1年後はV3で、その1年後はV4です。
Larry EllisonとOracleの流星のような再加速の上昇をどう評価しますか。素晴らしいビジネス上の決定と迅速に動く意欲です。今、ほとんどの人は自分自身に尋ね続けています。AIは過熱していますか。これに倍賭けすべきですか。彼らはただそれに向かって行きました。彼らはただ攻撃的です。そしてそれが勝つために必要なことです。
他の全員が恐れているとき、あなたは貪欲であるべきです。そして他の全員が貪欲であるとき、あなたは恐れるべきです。今、AI周辺には多くの恐怖があります。あなたが見ているものは、数人の貪欲な、本当に賢い人々がいて、彼らはたくさんのお金を稼いでいて、そこにたくさんの貪欲があるように見えます。迅速に動いている一握りの人々だけです。
私は今日大使として、どこで貪欲であるべきで、どこで恐れるべきですか。モートがあるところはどこでも、ハミルトン・ヘルマー、セブンパワーズですよね。モートを見るところはどこでも、貪欲であるべきです。モートを持っている人はほとんどいません。そしてあなたが投資する段階では特に。
したがって、モートがあることを予測しなければなりません。そしてモートがあれば、それはプレシードに対して10億の評価です。つまり、10億、プレシードのプレモートの評価です。それが投資家がそれを示すべきものです。プレモート。
過去12ヶ月間で何について考えを変えましたか。ああ、なんてことでしょう。つまり、考えを変えたというよりも、私たちのビジネスのどのパーセンテージがどこで倍賭けするかを変えたということです。毎月、私たちはより焦点を絞るようになります。私たちは、より少ないことにイエスと言います。そして何が起こるかというと、ビジネスはただより良くなるだけです。
したがって、私が言うならば、以前は最も重要なことは選択肢を保持することだと考えていましたが、今は焦点だと考えています。しかし、初期にその選択肢を持つことは、私たちが最も成功するところでプレーできるために重要だったと思います。そして今はそれは焦点についてです。
私たちはOpenAIとAnthropicについてたくさん話しました。Elon MuskはGrokとXでそれをやり遂げることができると思いますか。はい、しかしおそらく異なるでしょう。
新しい領域が出現するときはいつでも、多くの人々が競争していると考えますが、そうではありません。基盤モデルを作成しているこれらすべての人々は、まったく同じもののために競争していると考えています。Anthropicは何をしたのが素晴らしかったですか。彼らはすべてをすることによって競争することをやめることを決定しました。そしてコーディングに焦点を当てました。そしてそれは彼らにとってうまく機能しました。
XAIを見ると、彼らはソーシャルネットワークを持っていて、それにチャットボットを統合しました。私はそのチャットボットを深い分析や深い研究問題を解決するために使用しません。コーディングのためには使用しません。
彼らはコーディングモデルを持っていますが、コーディング配信を持っていません。その配信を使用してコーディングに参入できますか。おそらく、しかしそうすると、彼らは焦点を絞れなくなります。では、彼らは何をしているのですか。最終的に市場は分岐するでしょう。
マグニフィセント7。それらの企業すべてには重複するビジネスがあります。しかし、それらのマグニフィセント7企業のそれぞれの主要なビジネスは異なります。差別化しなければ、あなたは死にます。
Google、Microsoft、Amazonを見るとき、1つを買って1つを売ることができます。どれを買って、どれを売りますか。時間枠に依存します。
短期的には、MicrosoftはOpenAIの関係のために少しリセットしていると思います。長期的には、彼らはおそらく再びうまくやるでしょう。それは彼らにとって重大な損害だと思いますか。
いいえ、だから私は短期的には彼らに当たると思いますが、長期的にはそうではないと言っているのです。彼らはそれから素晴らしくうまくやっていませんでしたか。彼らはOpenAIの財務的所有権を持っており、それから彼らはほとんどのスイートにAnthropicを使用する柔軟性を持っていて、彼らは膨大な量のコンピュートを展開しました。
したがって、OpenAIが多様化して他の場所でコンピュートを得た場合、彼らは今そのコンピュートを持っています。コンピュートは金のようなものです。それを持っていれば、AIを持っています。
そしてAmazonは、AI DNAを持っていないと思います。彼らを比較すると、Metaについては言及しませんでしたが、MetaとGoogleは常にAI DNAを持っていました。Microsoftはそれを購入しましたが、OpenAIで時間を買いました。AmazonはまだそのDNAを持っていませんが、コンピュートは持っています。
最後の1つ。前を見るとき、最もワクワクすることは何ですか。ポジティブな要素で終わりたいと思います。今後5年から7年を見据えたとき、最もワクワクすることは何ですか。
ほとんどの人々を怖がらせるものが私をワクワクさせると思います。つまり、誰もがAIが何をするかを恐れています。そして、ここには良い歴史的な類推があると思います。それはガリレオです。
数百年前、ガリレオは望遠鏡を普及させましたよね。そして彼はそのために大きなトラブルに巻き込まれました。彼がそれほど多くのトラブルに巻き込まれた理由は、望遠鏡が私たちにいくつかの真実を見ることを可能にし、宇宙が私たちが想像していたよりも大きいことを認識することを可能にしたからです。
そしてそれは私たちに本当に、本当に小さいと感じさせました。そして時間とともに、私たちは、私たちは小さいかもしれないが、宇宙は壮大で美しいことに気づきました。時間とともに、私たちはLLMが心の望遠鏡であることに気づくと思います。
今、それらは私たちに本当に、本当に小さいと感じさせています。しかし100年後、私たちは知性が私たちが想像できたよりもはるかに広大であることに気づくでしょう。そして私たちはそれが美しいと思うでしょう。
ジョン、私は常に私たちの会話で大量のメモを取ることになります。これを私と一緒にやってくれて本当にありがとうございます。スタジオでやれて素晴らしかったです。あなたは素晴らしかったです。ありがとうございます。


コメント