ジェンスン・フアン – Nvidiaの絶対的な優位性は続くのか?

NVIDIA・ジェンスンフアン
この記事は約79分で読めます。

本動画は、NvidiaのCEOであるジェンスン・フアンに対する詳細なインタビューである。同社がいかにして現在のAIブームの中心的存在となったか、CUDAエコシステムやサプライチェーンの強固な基盤(モート)について語られている。また、TPUなどの独自チップに対する優位性、中国への半導体輸出規制がもたらす長期的な影響、さらにはAI革命が起きなかった場合のNvidiaの姿など、多岐にわたるトピックについて深く掘り下げて議論している。

Jensen Huang – Will Nvidia’s moat persist?
I asked Jensen about TPU competition, Nvidia’s lock on the ever more bottlenecked supply chain needed to make advanced c...

AIによるソフトウェアのコモディティ化とNvidiaの役割

ソフトウェアがAIによってコモディティ化すると予想されているため、多くのソフトウェア企業の評価額が暴落するのを私たちは目の当たりにしてきました。これについて、ある種素朴な見方があります。つまり、NvidiaはTSMCにGDS2ファイルを送り、TSMCがロジックダイやスイッチを作り、SK HynixやMicron、Samsungが作るHBMと一緒にパッケージングします。そしてそれを台湾のODMに送り、そこでラックを組み立てます。Nvidiaは根本的には他の誰かが製造するハードウェアの上で動くソフトウェアを作っているようなもので、もしソフトウェアがコモディティ化するなら、Nvidiaもコモディティ化してしまうのでしょうか?

最終的には、何かが電子をトークンに変換しなければなりません。電子をトークンに変換し、そのトークンの価値を時間とともに高めていくこと、これを完全にコモディティ化するのは非常に困難ですよ。電子からトークンへの変換というのは、信じられないほどの道のりです。そのトークンを作ることは、ある分子を別の分子よりも価値あるものにすること、あるトークンを別のトークンよりも価値あるものにすることと同じです。そのトークンに価値を持たせるために注がれる芸術性、エンジニアリング、科学、そして発明の量は膨大で、私たちは今まさにそれがリアルタイムで起きているのを目撃しているわけです。

その変換、製造、そこに投入されるすべての科学は、まだ深く理解されているとは到底言えず、その旅はまだ終わっていません。ですから、コモディティ化が起こるとは思えませんね。もちろん、より効率的にはしていくつもりですが。あなたが質問で示した枠組みは、私たちの会社に対する私のメンタルモデルそのものです。入力は電子で、出力はトークン。その真ん中にNvidiaがいるわけです。

私たちの仕事は、その変換を信じられないほどの能力で行えるようにするために、必要なことは可能な限りすべてやり、やらなくていいことは極力やらないことです。「やらなくていいことは極力やらない」というのは、自分たちでやる必要がないことは誰かとパートナーシップを組み、私たちのエコシステムの一部にするということです。現在のNvidiaを見れば、おそらくサプライチェーンの上流と下流の両方において、最大のパートナーエコシステムを持っているでしょう。すべてのコンピューター企業、アプリケーション開発者、モデル開発者がそこに含まれます。AIは言ってみれば5層のケーキのようなものです。

私たちはその5つの層すべてにわたってエコシステムを持っています。私たちはできるだけ少ないことしかしないように努めていますが、私たちがやらなければならない部分は、結果的にとてつもなく難しいものなのです。それがコモディティ化されるとは思えませんね。実際のところ、エンタープライズソフトウェア企業やツールメーカーについても同じように考えています。今日のソフトウェア企業の多くはツールメーカーです。

そうでない企業もありますよ。ワークフローをコード化するシステムを提供している企業もあります。しかし、多くの企業はツールメーカーです。例えば、Excelはツールであり、PowerPointもツールです。CadenceやSynopsysもツールを作っています。私は実は、多くの人が見ているのとは正反対の未来を見ています。今後、エージェントの数は指数関数的に増え、ツールを使うユーザーの数も指数関数的に増えると考えています。

これらすべてのツールのインスタンス数は急増する可能性が非常に高いですね。SynopsysのDesign Compilerのインスタンス数が急増し、フロアプランナーや当社のレイアウトツール、デザインルールチェッカーを使用するエージェントの数も急増する可能性が非常に高いです。今日、私たちはエンジニアの数によって制限されています。

しかし明日には、そうしたエンジニアたちは多数のエージェントによってサポートされるようになるでしょう。これまでに見たこともないような形でデザインスペースを探索し、今日私たちが使っているツールをさらに活用することになります。ツールが使われることで、ソフトウェア企業は飛躍的に成長すると思います。それがまだ起きていない理由は、エージェントがまだツールを十分に使いこなせていないからです。

今後、ソフトウェア企業自身がエージェントを構築するか、エージェントがそれらのツールを使えるほど優秀になるかのどちらかでしょう。おそらく、その両方の組み合わせになると思います。

サプライチェーンの構築と大規模な投資

最新の提出書類を見ると、ファウンドリ、メモリ、パッケージングに関して1,000億ドル近い購入契約を結んでいるようですね。SemiAnalysisの報告によると、Nvidiaのそうした購入契約の額は2,500億ドルに達するとのことです。一つの解釈として、Nvidiaの本当の堀(モート)は、これらの希少なコンポーネントを何年分も確保してロックインしていることにあるのではないかと思います。他の誰かが優れたアクセラレーターを作れたとしても、実際にそれを構築するためのメモリを手に入れられるでしょうか?ロジックを手に入れられるでしょうか?これこそが、今後数年間のNvidiaの大きなモートなのでしょうか?

それは、私たちができて他の誰かには難しいことの一つですね。私たちは上流工程に対して莫大なコミットメントを行ってきました。あなたがおっしゃったような明示的なコミットメントもあれば、暗黙のコミットメントもあります。例えば、上流における投資の多くは、当社のサプライチェーンによって行われています。なぜなら私がCEOたちに「この業界がどれほど大きくなるか説明させてください。なぜそうなるのか、一緒に論理的に考え、私が見ているものをお見せしましょう」と語りかけているからです。

さまざまな業界のCEOたちに情報を伝え、インスピレーションを与え、方向性を合わせるというプロセスを重ねた結果、彼らは投資を喜んで行ってくれるようになりました。なぜ彼らは他の誰かのためではなく、私のために投資してくれるのでしょうか?その理由は、私には彼らの供給を買い取り、私の下流を通じて販売する能力があると彼らが知っているからです。

実際のところ、Nvidiaの下流のサプライチェーンと下流の需要が非常に大きいため、彼らは喜んで上流で投資を行ってくれるのです。GTC(GPU Technology Conference)を見れば、人々はその規模と参加者の数に驚嘆します。AIという宇宙全体が、360度すべて一つの場所に集まっているのです。皆が一つの場所に集まるのは、お互いを見る必要があるからです。

下流が上流を見られ、上流が下流を見られるように、そして全員がAIの進歩を見られるように、私が彼らを一つに集めているのです。非常に重要なのは、彼らがAIネイティブな人々、設立されつつあるすべてのAIスタートアップ、そして起きているすべての素晴らしい出来事に直接出会えることです。私が伝えているすべてのことを、彼らは直接自分の目で確認できるのです。

私は、直接的または間接的に、サプライチェーン、パートナー、エコシステムに対して、私たちの目の前にある機会について知らせることに多くの時間を費やしています。「ジェンスン、君のキーノートは次から次へと発表ばかりだね」とよく言われます。私たちのキーノートには常に、教育のような少し苦痛を伴う部分が含まれています。

実は、それこそが私の頭の中にある意図なのです。上流・下流を含めたサプライチェーン全体、そしてエコシステム全体が、何が私たちに向かってきているのか、なぜ来ているのか、いつ来るのか、それがどれほどの規模になるのかを理解し、私と同じように体系的に推論できるようにしなければなりません。

あなたが説明したようなモートに関して言えば、私たちは未来に向けて構築することができています。もし私たちの今後数年間が1兆ドル規模のビジネスになるなら、それを実現するためのサプライチェーンが私たちにはあります。私たちのリーチやビジネスのスピードがなければどうでしょうか。キャッシュフローがあるように、サプライチェーンのフローもあり、顧客の離脱(チャーン)もあります。ビジネスの離脱率が高いアーキテクチャのために、誰もサプライチェーンを構築しようとはしません。

私たちがこの規模を維持できるのは、ひとえに下流の需要が非常に大きいからです。そして彼らはそれを見て、聞いて、すべてがやってくるのを実感しています。それがあるからこそ、私たちは今の規模で物事を実行できるのです。

急増する需要と供給のボトルネック

上流が本当に追いつけるのか、もっと具体的に理解したいのですが。Nvidiaは何年もの間、前年比で収益を2倍にしてきましたね。また、世界に提供するフロップスの量を前年比で3倍以上に増やしてきました。今の規模で2倍に成長し続けるというのは本当に信じられないことです。

その通りですね。

しかし、ロジックを見てみると、NvidiaはTSMCのN3ノードの最大の顧客であり、N2でも最大の顧客の一つです。今年のAI全体の需要はN3の60%を占めることになります。SemiAnalysisによれば、来年にはそれが86%になるそうです。もしすでに過半数を占めているなら、どうやってそこからさらに2倍にするのでしょうか?しかもそれを毎年どうやって続けるのですか?私たちは今、AIコンピューティングの成長率が上流の限界によって鈍化せざるを得ない体制に入っているのでしょうか?これを回避する方法はあるとお考えですか?最終的に、どうやって毎年2倍の工場を建設するのでしょうか?

あるレベルにおいて、瞬間的な需要は世界の上流・下流の供給を上回っています。どんな瞬間でも、私たちは配管工の数によって制限される可能性がありますし、実際にそれは起きています。配管工の方々も来年のGTCに招待されていますよ。

ちなみに、それは素晴らしいアイデアですね。

でも、それは良い状況でもあります。瞬間的な需要が業界全体の総供給を上回っている業界というのは望ましいものです。その逆は明らかに良くありません。

もし私たちが離れすぎていたら、特定のコンポーネントが不足しすぎていたら、業界はそこに群がります。例えば、最近誰もCoWoSについてあまり話さなくなったことにお気づきですか?その理由は、この2年間、私たちが全力でそこに取り組み、群がったからです。私たちは何度も何度も生産能力を倍増させてきました。今ではかなり良い状態にあると思います。

TSMCは今や、CoWoSの供給が他のロジック需要やメモリ需要に追いつかなければならないことを理解しています。彼らはCoWoSや将来のパッケージング技術を、ロジックをスケールさせるのと同じレベルでスケールさせています。これは素晴らしいことです。なぜなら、長い間、CoWoSやHBMメモリはかなり特殊なものでしたが、もはや特殊ではなくなったからです。人々は今、それらが主流のコンピューティング技術であると認識しています。

もちろん、私たちは現在、サプライチェーンのより広い範囲に影響を与える能力をはるかに大きく持っています。AI革命の初期に、私が今話しているようなすべてのことを、私は5年前にも話していました。それを信じて投資してくれた人たちもいました。例えば、サンジェイやMicronのチームです。

私は今でもその時の会議をよく覚えています。これから何が起こるのか、なぜそれが起こるのか、そして今日の状況の予測について、私は非常に明確に伝えました。彼らは本当にそこに賭けてくれました。私たちはLPDDRやHBMメモリ全体で彼らと提携し、彼らはそれに多大な投資をしてくれました。結果として、それは彼らの会社にとって途方もない成果をもたらしました。少し遅れて参加した人もいましたが、今では全員がここに揃っています。

これらのボトルネックのそれぞれが大きな注目を集めています。現在、私たちはボトルネックを何年も前に先読みしています。例えば、LumentumやCoherent、シリコンフォトニクスのエコシステムに対して私たちが過去数年間で行ってきた投資は、本当にサプライチェーンを再形成しました。私たちはTSMCの周囲にサプライチェーン全体を構築したのです。

私たちはCOUPE技術で彼らと提携し、多くの技術を発明し、それらの特許をサプライチェーンにライセンス供与して、エコシステムをオープンに保つようにしました。私たちは、新しい技術の発明、新しいワークフロー、両面プロービングのような新しいテスト装置の発明、企業への投資、そして彼らの生産能力の拡大支援を通じて、サプライチェーンの準備を整えています。

私たちがいかにエコシステムを形成し、サプライチェーンがこの規模をサポートできる準備を整えようとしているか、お分かりいただけると思います。

物理的限界とエネルギーの壁

ボトルネックの中には、他よりも解決しやすいものがあるように思えます。CoWoSのスケールアップと、例えば…

ちなみに私は一番難しいものについて話したんですよ。

それは何でしょうか?

配管工です。配管工と電気技師ですね。これは、仕事の終わりや雇用の喪失を語る悲観論者(ドゥーマー)たちに対して私が抱いている懸念の一つです。

もし私たちが人々にソフトウェアエンジニアになることを思いとどまらせたら、ソフトウェアエンジニアは枯渇してしまうでしょう。同じような予測は10年前にもありました。悲観論者の中には、「何があっても放射線科医にだけはなるな」と人々に言っていた人たちもいました。放射線科医は最初に消滅する職業であり、世界はもう放射線科医を必要としなくなると語る当時の動画が、今でもウェブ上に残っているかもしれません。

今、私たちが何に不足しているかご存知ですか?放射線科医です。

スケールできるものとそうでないものについての話に戻りますが、実際にどうやってロジックの製造量を1年で2倍にするのですか?結局のところ、メモリやロジックはEUVによってボトルネックになっていますよね。どうやってEUVマシンを毎年2倍に増やすのでしょうか?

それらはどれも、迅速にスケールさせることが不可能なわけではありません。

2、3年のうちには簡単にできることです。ただ需要のシグナルが必要なだけです。1つ作れれば10個作れますし、10個作れれば100万個作れます。これらを複製するのは難しくありません。

サプライチェーンのどれくらい深くまで関与するのですか?例えばASMLのところに行って、「3年後を見据えると、Nvidiaが年間2兆ドルの収益を生み出すためには、EUVマシンがもっともっと必要です」と直接伝えるのでしょうか?

直接伝える相手もいれば、間接的に伝える相手もいますし… 私がTSMCを説得できれば、ASMLも納得するでしょう。私たちは重要なボトルネック部分について考えなければなりません。

しかし、もしTSMCが納得すれば、数年後にはEUVマシンが十分に確保できるということですね。

私が言いたいのは、どんなボトルネックも数年以上、2、3年以上続くことはないということです。一つとしてね。その一方で、私たちはコンピューティングの効率を10倍、20倍と向上させており、HopperからBlackwellにかけては30倍から50倍に向上させています。

CUDAが非常に柔軟であるため、私たちは新しいアルゴリズムを次々と生み出しています。あらゆる種類の新しい技術を開発し、容量を増やすだけでなく効率も高めています。そうしたことは何も心配していません。私が心配しているのは、私たちよりも下流にある事柄です。

例えば、エネルギーの供給を妨げるようなエネルギー政策です。エネルギーなしに産業を創出することはできません。エネルギーなしに全く新しい製造業を立ち上げることはできません。私たちはアメリカを再工業化したいと考えています。半導体製造、コンピューター製造、パッケージングを国内に取り戻したいのです。EVやロボットのような新しいものを作りたいですし、AIファクトリーを建設したいと考えています。しかし、エネルギーなしにはこれらのどれも構築することはできず、そしてそれらには長い時間がかかります。

チップの生産能力を増やすのは2、3年の問題です。CoWoSの生産能力を増やすのも2、3年の問題です。

興味深いですね。私の番組のゲストは時々、全く逆のことを言うように感じます。この件に関しては、私には裁定を下すための技術的知識がありませんが。

素晴らしいのは、あなたが今まさに専門家と話しているということですよ。

確かにそうですね。

TPU等の専用チップに対するNvidia(GPU)の優位性

競合他社についてお聞きしたいのですが。TPUについて言えば、世界トップ3のモデルのうち、おそらく2つ、つまりClaudeとGoogleのGeminiはTPUでトレーニングされました。これは今後のNvidiaにとって何を意味するのでしょうか?

私たちが作っているのは全く別のものです。Nvidiaが構築したのはアクセラレーテッド・コンピューティングであり、テンソル処理ユニット(TPU)ではありません。アクセラレーテッド・コンピューティングは、分子動力学、量子色力学、データ処理、データフレーム、構造化データ、非構造化データなど、あらゆる種類の用途に使われます。

また、流体力学や素粒子物理学にも使われます。それに加えて、私たちはそれをAIにも使用しているのです。アクセラレーテッド・コンピューティングははるかに多様性があります。現在AIが話題の中心であり、明らかに非常に重要で影響力がありますが、コンピューティングはそれよりもはるかに幅広いものです。Nvidiaはコンピューティングのあり方を再発明し、汎用コンピューティングからアクセラレーテッド・コンピューティングへと移行させました。

私たちの市場の広がりは、どんなTPUやASICが持ち得るものよりもはるかに大きいのです。私たちの立場を見れば、あらゆる種類のアプリケーションを加速させる唯一の企業であることがわかります。私たちは巨大なエコシステムを持っています。そのため、あらゆる種類のフレームワークやアルゴリズムがNvidia上で動作します。

私たちのコンピューターは他の人々によって運用されるように設計されているため、オペレーターであれば誰でも私たちのシステムを購入できます。自社構築のシステムのほとんどは、他人が運用できるほど柔軟に設計されていないため、自らオペレーターにならざるを得ません。

しかし、私たちのシステムは誰でも運用できるため、Google、Amazon、Azure、OCIを含むあらゆるクラウドに導入されています。もしシステムをレンタル目的で運用したいなら、借り手となる多くの業界の大規模な顧客エコシステムを持っているほうがよいでしょう。

もし自分自身のために運用したいなら、私たちがxAIのイーロン・マスクのためにやったように、あなたが自ら運用するのを支援する能力が私たちには当然あります。あらゆる企業や業界のオペレーターを支援できるため、例えばイーライリリーで科学研究や創薬のためのスーパーコンピューターを構築するために使うこともできます。彼らが独自のスーパーコンピューターを運用し、私たちが加速させる創薬や生物科学の多様性全体にわたってそれを活用できるよう支援できるのです。

TPUではできないけれども、私たちが対処できるアプリケーションは山のようにあります。NvidiaはCUDAを素晴らしいテンソル処理ユニットとしても構築しましたが、同時にデータ処理、コンピューティング、AIなどのあらゆるライフサイクルも処理できるようになっています。私たちの市場機会は単にはるかに大きく、リーチもはるかに広いのです。

私たちは今や世界中のあらゆるアプリケーションをサポートしているため、どこでもNvidiaのシステムを構築でき、そこに必ず顧客がいると確信できます。これは全く異なる性質のものです。

少し長い質問になります。Nvidiaは驚異的な収益を上げていますが、その四半期600億ドルという収益は製薬業界や量子コンピューティングから来ているわけではありません。前例のないスピードで成長しているAIという前例のない技術があるからこそ、それだけの収益を上げているわけです。そこで問題になるのは、AIに特化した場合に何が最善かということです。

私は詳細には詳しくありませんが、AI研究者の友人たちと話すと、彼らはこう言います。「TPUを使うと、行列の乗算を行うのに最適な巨大なシストリックアレイが使える。一方でGPUは非常に柔軟で、多くの分岐や不規則なメモリアクセスがある場合には素晴らしい。でも、AIとは何だろうか?それは予測可能な行列の乗算を何度も何度も何度も繰り返すだけのものだ。ワープスケジューラやスレッドとメモリバンク間の切り替えのためにダイ面積を犠牲にする必要はない」と。

そしてTPUは、まさに今オンラインになろうとしているコンピュートの収益とユースケースの成長の大部分に対して本当に最適化されています。これに対してどうお考えでしょうか?

行列の乗算はAIの重要な部分ですが、それだけが全てではありません。もし新しいアテンションメカニズムを考案したり、異なる方法でディスアグリゲートしたり、あるいはハイブリッドSSMのように全く新しいタイプのアーキテクチャを完全に発明したいのであれば、一般的にプログラム可能なアーキテクチャが必要になります。

もし拡散(ディフュージョン)モデルと自己回帰(オートレグレッシブ)技術を融合させたモデルを作りたいなら、やはり一般的にプログラム可能なアーキテクチャが必要です。私たちは皆さんが想像できるあらゆるものを実行できます。それが強みです。プログラム可能なシステムであるため、新しいアルゴリズムの発明がはるかに容易になるのです。新しいアルゴリズムを発明する能力こそが、AIの進歩をこれほど速くしている本当の理由です。

TPUも他のものと同様に、ムーアの法則の影響を受けます。ご存知の通り、それは年間約25%の向上にとどまります。本当に10倍や100倍の飛躍を得るための唯一の方法は、アルゴリズムとそれがどのように計算されるかを毎年根本的に変えることです。それこそがNvidiaの根本的な優位性なのです。

私たちがBlackwellをHopperに対して50倍の性能にできた唯一の理由は… 私が最初にBlackwellはHopperの35倍のエネルギー効率になると発表した時、誰も信じませんでした。その後、Dylanが「ジェンスンは控えめに言っていた。実際には50倍だ」という記事を書きました。ムーアの法則だけでは、合理的に考えてそんなことは不可能です。

私たちがその問題を解決した方法は、並列化され、分離され、コンピューティングシステム全体に分散されたMoE(Mixture of Experts)のような新しいモデルを用いたからです。

CUDAを使って新しいカーネルを根本から考案する能力がなければ、これを実現するのは非常に困難です。私たちのアーキテクチャのプログラマビリティと、Nvidiaが究極のコデザイン(協調設計)企業であるという事実の組み合わせがそれを可能にしています。私たちはNVLinkのようなファブリックそのものや、Spectrum-Xのようなネットワークに計算の一部をオフロードすることさえできます。

プロセッサ、システム、ファブリック、ライブラリ、そしてアルゴリズムに対して同時に変革をもたらすことができるのです。CUDAなしでは、どこから始めればいいのかさえ分かりませんよ。

ここで少し私のスポンサーについてお話しさせてください。CrusoeはNvidiaのBlackwellおよびBlackwell Ultraプラットフォームを提供する最初のクラウドの一つです。そして彼らは、今年後半に予定されているNVIDIA Vera Rubinの展開を発表したばかりです。

しかし、最新のハードウェアへのアクセスはストーリーの一部にすぎません。例えば、ほとんどの推論エンジンはすでに単一ユーザーのフォワードパスに対してKVキャッシングを行っています。しかしCrusoeは、ユーザーやGPUをまたいでそれを行います。そのため、同じシステムプロンプトで1000個のエージェントが実行されている場合、CrusoeはKVキャッシュを1回計算するだけで、クラスター内のすべての単一GPUでそれが利用可能になります。

これは、システムがよりエージェント的になり、ツールを使用したりファイルにアクセスしたりするためにはるかに長いプレフィックスを必要とするようになるにつれて、特に重要になります。最近のベンチマークで、CrusoeはvLLMと比較して、最初のトークンまでの時間を最大10倍速くし、スループットを最大5倍向上させることができました。これは、推論ワークロードをCrusoeで実行すべき多くの理由のほんの一つにすぎません。

また、トレーニング用にGPUが必要な場合でも、クラウドを切り替える必要はありません。Crusoeはそこでもあなたをカバーします。詳細については、crusoe.ai/dwarkeshにアクセスしてください。

大手クラウド事業者とCUDAの堀(モート)

これはNvidiaの顧客層に関する興味深い疑問につながります。御社の収益の60%は、上位5社の大手クラウド事業者(ハイパースケーラー)から来ています。異なる顧客がいる異なる時代、例えば実験を行っている大学教授などであれば、彼らにはCUDAが必要です。他のアクセラレーターは使えません。彼らはただPyTorchをCUDAで動かし、すべてが最適化されている状態を必要としていました。

しかし、これらのハイパースケーラーには独自のカーネルを書くリソースがあります。実際のところ、特定のアーキテクチャに必要な最後の5%のパフォーマンスを引き出すためには、そうせざるを得ません。AnthropicやGoogleは主に自社のアクセラレーター、つまりTPUやTrainiumを動かしています。しかしGPUを使用しているOpenAIでさえ、独自のカーネルが必要なためTritonを使用しています。彼らはcuBLASやNCCLを使用する代わりに、CUDA C++レベルに至るまで独自のスタックを持っており、それは他のアクセラレーターにもコンパイルできます。

もし顧客の大多数がCUDAの代替品を作ることができ、実際に作っているのだとすれば、最先端のAIをNvidia上で実現させる決定的な要素として、CUDAはどの程度重要なのでしょうか?

CUDAは非常に豊かなエコシステムです。もし最初に何かのコンピューター上で構築したいのであれば、まずCUDA上で構築するのが信じられないほど賢明な選択です。エコシステムが非常に豊かなので、私たちはあらゆるフレームワークをサポートしています。もしカスタムカーネルを作りたいなら… 例えば、私たちはTritonに多大な貢献をしています。ですから、TritonのバックエンドにはNvidiaの技術が大量に含まれているのです。私たちはすべてのフレームワークが最高のものになるよう喜んでお手伝いします。

フレームワークは山のようにあります。Triton、vLLM、SGLangなどなど。今ではverlやNeMo RLのような新しい強化学習フレームワークも次々と登場しています。ポストトレーニングや強化学習の分野全体が今まさに爆発的に成長しています。

ですから、あるアーキテクチャ上で構築したい場合、エコシステムが優れていると分かっているCUDA上で構築するのが最も理にかなっているのです。何か問題が起きた時、その原因が下にある山のようなコードの中ではなく、自分自身のコードの中にある可能性が高いと分かるからです。これらのシステムを構築する際に扱うコードの量を忘れないでください。

何かが機能しない時、それはあなたのミスですか?それともコンピューターのせいですか?常に自分自身の問題であってほしいし、コンピューターのことは信頼できる状態でありたいと思うはずです。もちろん私たち自身にもまだ多くのバグがありますが、私たちのシステムは非常に徹底的に検証されているため、少なくともその基盤の上に構築することはできます。これが第一の理由です。エコシステムの豊かさ、プログラマビリティ、そして能力です。

第二に、もしあなたが何かを開発している開発者であるなら、最も重要で望むものはインストールベース(普及基盤)です。自分が書いたソフトウェアが、他の多くのコンピューター上で動くことを望むはずです。自分だけのためにソフトウェアを作っているわけではありません。あなたはフレームワークのビルダーだからこそ、自分のフリート(サーバー群)や他の全員のフリートのために作っているのです。

NvidiaのCUDAエコシステムは、究極的には私たちの偉大な宝です。現在、数億個のGPUが世界中で稼働しています。すべてのクラウドに導入されています。A10、A100、H100、H200、Lシリーズ、Pシリーズと遡ることができます。非常にたくさんの種類があり、あらゆるサイズと形状があります。

もしあなたがロボティクス企業なら、そのCUDAスタックがロボット本体の中でも動くことを望むでしょう。私たちは文字通りどこにでも存在しています。インストールベースがあるということは、ソフトウェアやモデルを一度開発すれば、それがどこでも役立つということを意味します。これは信じられないほど価値のあることです。

最後に、私たちがすべての単一クラウドに導入されているという事実が、私たちを真にユニークな存在にしています。もしあなたがAI企業や開発者なら、どのクラウドサービスプロバイダーと提携するのか、あるいはどこでそれを実行したいのか、正確には分からないでしょう。私たちはどこでも動きますし、お望みならオンプレミスでも動かせます。エコシステムの豊かさ、インストールベースの広大さ、そしてどこにでも存在するという汎用性の組み合わせが、CUDAをかけがえのないものにしているのです。

なるほど、それは非常に理にかなっています。私が気になっているのは、それらの利点があなたの主要な顧客にとって本当に重要なのかということです。それを重要だと考える人はたくさんいるでしょう。しかし、独自のソフトウェアスタックを構築できるような人たちが、あなたの収益の大部分を占めていますよね。

特に、AIが密接な検証ループを持ち、強化学習(RL)を適用できるような分野で特に優れていく世界を考えると… スケールアップ環境全体でアテンションやMLPを最も効率的に実行するカーネルをどう書くかというこの問題は、非常に検証可能なフィードバックループの一種です。

すべてのハイパースケーラーが自分たち自身のためにこれらのカスタムカーネルを書けるのではないでしょうか?Nvidiaは依然として優れた価格性能比を持っているので、彼らはまだNvidiaを使うことを好むかもしれません。しかしそうなると、問題は単に1ドルあたりで誰が最高のスペック、最高のフロップス、最高のメモリ帯域幅を提供しているかということに尽きるのではないでしょうか。

歴史的に見て、NvidiaはこのCUDAのモートのおかげで、ハードウェアとソフトウェアの両方を通じてAI分野で最高の利益率(70%以上)を誇り、今もそれを維持しています。しかし疑問なのは、顧客の大部分がCUDAのモートの代わりに自前で構築できる余裕がある場合でも、その利益率を維持できるのかということです。

私たちがこれらのAIラボに割り当てているエンジニアの数は尋常ではありません。彼らと協力し、彼らのスタックを最適化しています。その理由は、私たちのアーキテクチャを私たち以上に熟知している人はいないからです。

これらのアーキテクチャはCPUのように汎用的なものではありません。CPUはキャデラックのようなものです。快適なクルーザーで、決してスピードを出しすぎません。誰もがかなり上手に運転できます。クルーズコントロールも付いていて、すべてが簡単です。

しかし多くの意味で、NvidiaのGPUやアクセラレーターはF1レーシングカーのようなものです。誰もが時速100マイルで運転することはできると想像できますが、それを限界まで押し上げるにはかなりの専門知識が必要です。私たちは自社のカーネルを作成するために大量のAIを使用しています。私たちがしばらくの間はまだ必要とされ続けると確信していますよ。

私たちの専門知識があれば、AIラボのパートナーたちは彼らのスタックからさらに2倍の性能を簡単に引き出せることもしばしばです。私たちが彼らのスタックや特定のカーネルを最適化し終えた時には、モデルの速度が3倍、2倍、あるいは50%向上しているというのは珍しいことではありません。彼らが持っているフリートのインストールベース、すべてのHopperやBlackwellの数を考えれば、これは巨大な数字です。

性能を2倍に高めるということは、収益を倍増させるということです。それは直接的に収益につながります。Nvidiaのコンピューティングスタックは、TCO(総所有コスト)あたりのパフォーマンスにおいて世界最高であり、これに比肩するものはありません。世界中のどの単一プラットフォームも、これより優れたパフォーマンス対TCO比を持っていると証明できる人は一人もいません。一社もです。実際、ベンチマークは公開されています。

DylanのInferenceMAXが誰でも使えるように公開されていますが、TPUは来ないし、Trainiumも来ません。私は彼らにInferenceMAXを使って、彼らの素晴らしい推論コストを証明するよう促しています。本当に難しいことですよ。誰も名乗りを上げたがりません。MLPerfもそうです。Trainiumには、彼らがいつも主張している40%のコスト優位性をぜひ証明してもらいたいものです。

TPUのコスト優位性を証明するのもぜひ聞いてみたいですね。私の考えでは、それは理にかなっていません。絶対に理にかなっていません。第一原理からして理にかなっていないのです。ですから、私たちがこれほど成功している理由は、単に私たちのTCOが非常に素晴らしいからだと思います。

第二に、あなたは上位5社が顧客の60%だと言いますが、そのビジネスの大部分は外部向けです。例えば、AWSにおけるNvidiaの利用の大部分は社内利用ではなく外部の顧客向けです。Azureにおける顧客の大部分も、当然すべて外部の顧客です。OCIにおける顧客もすべて外部の顧客であり、社内利用ではありません。

彼らが私たちを好む理由は、私たちのリーチが非常に大きいからです。世界中の素晴らしい顧客を彼らの元に連れてくることができるのです。彼らは皆Nvidia上で構築しています。そして、これらすべての企業がNvidia上で構築している理由は、私たちのリーチと汎用性が非常に高いからです。ですから、本当のフライホイールは、インストールベース、アーキテクチャのプログラマビリティ、エコシステムの豊かさ、そして世界中に非常に多くのAI企業が存在するという事実だと思います。今や数万社のAI企業がありますからね。

もしあなたがそうしたAIスタートアップの一社だったら、どのアーキテクチャを選びますか?最も豊富に存在するアーキテクチャを選ぶでしょう。私たちが世界で最も豊富です。最も大きなインストールベースを持つものを選ぶでしょう。私たちが最大のインストールベースです。そして、豊かなエコシステムを持つものを選ぶでしょう。これがフライホイールなのです。

これこそが理由です。第一に、当社の1ドルあたりのパフォーマンスが非常に優れているため、彼らは最も低コストでトークンを生成できます。第二に、当社のワットあたりのパフォーマンスは世界最高です。ですから、もしパートナーであるこれらの企業が1ギガワットのデータセンターを建設したとしたら、その1ギガワットのデータセンターは最大限の収益とトークン数を提供しなければなりません。トークン数は直接収益に結びつきますからね。

そのデータセンターで可能な限り多くのトークンを生成し、収益を最大化したいはずです。私たちは世界で最もワットあたりのトークン生成数が多いアーキテクチャです。最後に、インフラをレンタルすることが目標なら、私たちには世界で最も多くの顧客がいます。だからこそフライホイールが機能するのです。

Anthropicの動向と顧客の選択肢

興味深いですね。結局のところ、ここでの実際の市場構造はどうなっているのかという疑問に行き着くと思います。なぜなら、たとえ他の企業がいたとしても… 大まかに同等の計算リソースのシェアを持つ数万のAI企業が存在する世界もあり得たかもしれません。しかし、これら5つのハイパースケーラーを通じてであっても、実際にAmazonで計算リソースを使用しているのは、AnthropicやOpenAIなど、異なるアクセラレーターを機能させる余裕と能力を持つ巨大な基盤モデルラボなのですから。

いや、その前提は間違っていますよ。

そうかもしれませんが、少し違う角度から質問させてください。

後で戻ってきて、あなたの前提を正させてくださいね。

分かりました。では、違う質問をさせてください。しかし、これがAIにとってあまりにも重要なので、後で必ず修正してくださいね。科学の未来にとっても、産業の未来にとっても重要すぎることですから。その前提というのは…

質問を最後まで言わせてください。その後で一緒に議論しましょう。

ええ。

もし価格、性能、ワットあたりの性能などに関するこれらのことがすべて事実だとするなら、例えばAnthropicが数日前に、TPUと彼らの計算リソースの大部分に関してBroadcomおよびGoogleとマルチギガワットの契約を結んだと発表したのはなぜだとお考えですか?当然、GoogleにとってもTPUは計算リソースの大部分を占めています。ですから、これらの巨大なAI企業を見てみると… かつてはすべてがNvidiaだった時期もありましたが、今はそうではありません。ですので、紙の上でこれらのことが事実であるなら、なぜ彼らは他のアクセラレーターを選んでいるのか、その辻褄をどう合わせるのか興味があります。

Anthropicは特殊な例であり、トレンドではありません。Anthropicがなければ、TPUの成長などあったでしょうか?それは100% Anthropicによるものです。Anthropicがなければ、Trainiumの成長などあったでしょうか?それは100% Anthropicによるものです。これはかなりよく知られ、理解されていることだと思います。ASICの機会が豊富にあるわけではありません。Anthropicは一つしかありません。

しかし、OpenAIとAMDの契約もありますし…彼らは独自のTitanアクセラレーターを構築しています。

ええ、でも誰もが認めているように、彼らは圧倒的にNvidiaを使っています。私たちはこれからも一緒に多くの仕事をしていくでしょう。他の人が別のものを使い、試してみることに私は気を悪くしたりしません。他のものを試さなければ、どうして私たちのものがどれほど優れているか分かるでしょうか?時々はそれを思い出させてもらう必要があります。

私たちは現在の地位を継続的に勝ち取っていかなければなりません。常に大きな主張は存在します。キャンセルされたASICの数を見てください。ASICを作ろうとしているからといって…それでもNvidiaより優れたものを作らなければならないのです。Nvidiaより優れたものを作るのはそう簡単なことではありません。実際のところ、それは理にかなっていません。Nvidiaが何か重大なことを見落としているのでない限りは。

私たちの規模とスピードのおかげで、私たちは毎年大きな飛躍を遂げている世界で唯一の企業なのです。毎年ですよ。

彼らの論理は、「Nvidiaより優れている必要はない。Nvidiaに70%の利益率を払っているのだから、70%以上劣っていなければそれでいい」というものだと思います。

いや、忘れないでください、ASICであっても利益率は実際かなり高いのですよ。仮にNvidiaの利益率が70%だとしましょう。しかしASICの利益率も65%です。本当にどれだけの節約になっているでしょうか?

ああ、Broadcomなどからの調達の話ですか?

ええ、もちろんです。誰かには支払わなければなりません。私が見る限り、ASICの利益率は信じられないほど優れています。彼ら自身もそう信じています。彼らは自分たちの驚異的なASICの利益率をかなり誇りに思っていますからね。

OpenAIやAnthropicへの投資の背景

なぜそうなのかという質問がありましたね。昔は、私たちにはそうする能力が単になかったのです。当時私は、OpenAIやAnthropicのような基盤AIラボを構築することがどれほど困難か、そして彼らがサプライヤー自身からの巨大な投資を必要としているという事実を深く内在化(理解)していませんでした。

当時私たちは、Anthropicが私たちの計算リソースを使えるようにするために、数十億ドル規模の投資を行えるような立場にはありませんでした。しかし、GoogleとAWSにはそれが可能だったのです。彼らは最初から巨大な投資を行ったため、その見返りとしてAnthropicは彼らの計算リソースを使用しました。

私たちは当時、それを行える立場になかったのです。私の間違いは、彼らには他に選択肢がなく、VC(ベンチャーキャピタル)が、後にAnthropicになることを期待してAIラボに50億ドルから100億ドルもの投資をすることは決してないということを深く理解していなかったことです。それが私の見落としでした。しかし、たとえそれを理解していたとしても、当時の私たちにはそれを行える立場になかったと思います。

しかし、二度と同じ間違いを繰り返すつもりはありません。OpenAIに投資できたことを嬉しく思いますし、彼らのスケールアップを支援できることを嬉しく思います。そして、そうすることが不可欠だと信じています。だからこそ、私にそれが可能になった時、Anthropicが私たちの元に来てくれた時、私は投資家になれたことを嬉しく思い、彼らのスケールアップを支援できることを嬉しく思っています。

当時は単にそれができなかっただけなのです。もし全てを巻き戻すことができ、Nvidiaが当時から今と同じくらい大きかったなら、私は喜んで投資していたでしょう。

これは実に興味深いですね。長年の間、NvidiaはAI分野で利益を上げている企業であり、多額の利益を上げてきました。そして今、あなた方はそれを投資に回しています。OpenAIに対しては最大300億ドル、Anthropicに対しては100億ドル規模の投資を行ったと報じられています。しかし現在、彼らの評価額は上昇しており、今後も上がり続けると確信しています。

ですから、もし何年にもわたってあなたが彼らに計算リソースを提供し、事態がどこに向かっているかを見ていて、数年前、あるいは数ヶ月前には彼らの価値が現在の10分の1程度であり、あなたには十分な現金があったとしたら… Nvidia自身が基盤ラボになるか、それを可能にするための巨大な投資を行うか、あるいは現在の評価額で行った取引をもっと早い段階で行っていた世界もあり得たはずです。しかも、あなたにはそれを実行する現金がありました。だからこそ、なぜもっと早くそうしなかったのか、純粋に興味があります。

私たちはできるだけ早く実行しましたよ。できる限り早く実行したのです。もし可能だったなら、もっと早く実行していたでしょう。Anthropicが私たちにそれを必要としていた時、私たちは単にそれを行える立場になかったのです。当時はそういう考え方を持っていませんでした。

どういうことですか?現金の問題だったのでしょうか?

ええ、投資の規模です。当時私たちは社外に投資したことがなく、それほど大きな額ではありませんでした。それが必要だとは気づかなかったのです。私は常に、彼らは他のすべての企業がするように、VCから資金を調達すればいいだけだと、本気で思っていました。しかし、彼らがやろうとしていたことはVCを通じて実現できるものではありませんでした。

OpenAIがやりたかったことはVCを通じて実現できるものではありませんでした。今ならそれが分かります。当時は分からなかったのです。しかし、それこそが彼らの天才的なところです。それが彼らが賢い理由です。彼らは当時から、そうした何かを行わなければならないと気づいていたのです。そして彼らがそれを実行したことを嬉しく思います。

たとえ私たちがAnthropicを他の誰かの元へ行かせることになってしまったとしても、私はそれが起きて良かったと思っています。Anthropicの存在は世界にとって素晴らしいことです。私は彼らのために喜んでいます。

Nvidiaはなぜ自らクラウド事業者にならないのか

あなたは依然として莫大な利益を上げており、四半期ごとにさらに多くの利益を上げています。それでも後悔することはあるでしょう。そこで疑問が湧きます。これだけのお金を持ち、さらに利益を上げ続けている今、Nvidiaはそのお金で何をすべきなのでしょうか?

一つの答えとして、これらのラボのためにCapEx(設備投資)をOpEx(運用費)に変換して計算リソースをレンタルできるようにする、仲介業者のエコシステム全体が立ち上がっているという事実があります。チップは非常に高価ですが、AIモデルが向上しているため、そのライフタイムを通じて多額の利益を生み出します。彼らが生み出す価値、つまりトークンの価値は高まっていますが、立ち上げには多額の費用がかかります。

Nvidiaには設備投資を行う資金があります。実際、あなたがCoreWeaveを最大63億ドル裏書し、20億ドルを投資したと報じられています。なぜNvidia自らがクラウド事業者にならないのでしょうか?なぜ自らハイパースケーラーになり、この計算リソースをレンタルしないのですか?あなたにはそれを実行するだけの現金があるのに。

これは会社の哲学であり、賢明なことだと思います。私たちは必要なことは可能な限りすべてやり、やらなくていいことは極力やらないようにすべきなのです。

それがどういう意味かというと、私たちがコンピューティングプラットフォームを構築するために行っている仕事は、もし私たちがやらなければ、決して実現しないと私が純粋に信じているということです。もし私たちがリスクを取らなければ——NVLinkを今のような形で構築しなければ、スタック全体を構築しなければ、エコシステムを今の形で作り上げなければ、赤字を垂れ流しながら20年間CUDAに献身しなければ——もし私たちがやらなければ、他の誰もやらなかったでしょう。

もし私たちが、すべてドメイン特化型になるようにCUDA-Xライブラリ全体を作成しなかったら… 15年前に私たちがドメイン特化型のライブラリに注力したのは、もし私たちがこれらのドメイン特化型ライブラリを作成しなければ、レイトレーシングであれ、画像生成であれ、AIの初期の研究であれ、データ処理、構造化データ処理、ベクトルデータ処理であれ、誰もそれを作成しないと気づいたからです。

私はそのことを完全に確信しています。私たちはcuLithoと呼ばれるコンピュテーショナル・リソグラフィ用のライブラリを作成しました。もし私たちが作らなければ、誰も作らなかったでしょう。ですから、私たちがやったことをやらなければ、アクセラレーテッド・コンピューティングは今のように進歩していなかったはずです。ですから、私たちはそれをやるべきです。会社全体、私たちのすべての力をあげて、全心全霊でそれに取り組むべきです。

しかし、世界にはたくさんのクラウドがあります。もし私がやらなくても、誰かが現れるでしょう。ですから、「必要なことは可能な限りすべてやり、やらなくていいことは極力やらない——極力やらない」というレシピ、哲学に従っているのです。その哲学は今日の私たちの会社にも存在しています。私が行うすべてのことは、そのレンズを通して行われています。

クラウドの件で言えば、もし私たちがCoreWeaveの存在をサポートしなければ、これらのネオクラウド、AIクラウドは存在しなかったでしょう。もし私たちがCoreWeaveの存在を助けなければ、彼らは存在していなかった。Nscaleをサポートしなければ、彼らは今日のような姿にはなっていなかった。Nebiusをサポートしなければ、彼らは今のようにはなっていなかったでしょう。今、彼らは素晴らしい業績を上げています。

それはビジネスモデルですか?

私たちは必要なことは可能な限りすべてやり、やらなくていいことは極力やらないようにすべきなのです。だからこそ、私たちはエコシステムに投資しています。私たちのエコシステムに繁栄してほしいからです。アーキテクチャやAIが、可能な限り多くの業界、可能な限り多くの国と結びつき、この地球がAI基盤の上に構築され、アメリカのテクノロジースタックの上に構築されることを可能にしたいのです。

そのビジョンこそ、まさに私たちが追求しているものです。さて、あなたが言及したことの一つに… 素晴らしい基盤モデル企業がたくさんあり、私たちはそのすべてに投資しようとしています。これも私たちがやっていることの一つです。私たちは勝者を選びません。全員をサポートする必要があるのです。それは私たちにとって喜びの一部でもあり、私たちのビジネスにとって不可欠なことでもあります。

しかし同時に、私たちは勝者を選ばないためにわざわざ努力もしています。ですから、そのうちの一社に投資するときは、すべての企業に投資するのです。

なぜ勝者を選ばないようにわざわざ努力するのですか?

第一に、それは私たちの仕事ではないからです。第二に、Nvidiaが最初に設立された時、60社の3Dグラフィックス企業がありました。生き残ったのは私たちだけです。もしその60社のグラフィックス企業を見て、どれが成功するかを自問したとしたら、Nvidiaは「成功しないリスト」のトップにいたはずです。

これはあなたが生まれるずっと前の話ですが、Nvidiaのグラフィックスアーキテクチャは完全に間違っていました。少し間違っていたのではありません。私たちは完全に間違ったアーキテクチャを作ってしまい、開発者がサポートするのは不可能なものでした。絶対に成功するはずがなかったのです。

私たちは優れた第一原理から推論しましたが、結果として間違った解決策に行き着いてしまいました。誰もが私たちを脱落したと考えたでしょう。しかし、今私たちはここにいます。だから私には、それを認識するだけの十分な謙虚さがあるのです。勝者は選びません。彼ら全員に自力で頑張ってもらうか、あるいは私たち全員の面倒を見るか、どちらかです。

一つ理解できなかったのは、あなたが「私たちはネオクラウドだからという理由だけで彼らを優先し、テコ入れしたいわけではない」と言ったことです。しかし同時に、いくつかのネオクラウドを挙げて、NVIDIAがいなければ彼らは存在しなかったとも言いました。この2つのことはどう両立するのですか?

まず第一に、彼ら自身が存在したいと望み、私たちに助けを求めてくる必要があります。彼らが存在したいと望み、ビジネスプラン、専門知識、そして情熱を持っている時… 彼らは当然、自分たち自身にもある程度の能力を持っていなければなりません。しかし、最終的に軌道に乗せるために投資を必要とするなら、私たちは彼らのためにそこにいます。しかし、彼らが早くフライホイールを回し始めれば…

あなたの質問は、「私たちは金融ビジネスに参入したいのか?」ということでしたね。答えはノーです。金融ビジネスに携わっている人たちはすでにいますし、私たち自身が金融業者になるよりも、金融ビジネスに携わっているすべての人たちと協力する方を選びます。私たちの目標は、自分たちのやるべきことに集中し、ビジネスモデルをできるだけシンプルに保ち、エコシステムをサポートすることです。

OpenAIのような企業が、IPO前であるために300億ドル規模の投資を必要としている時、私たちが彼らを深く信じ、彼らが… まあ、彼らは今日すでに並外れた企業ですが、さらに信じられないほど素晴らしい企業になると私が深く信じている時。世界は彼らの存在を必要としています。世界は彼らの存在を望んでいます。私も彼らに存在してほしい。彼らには追い風が吹いています。だから彼らをサポートし、スケールさせようというわけです。

そうした投資は、彼らが私たちにそれを必要としているから行うのです。しかし、私たちはできるだけ多くのことをやろうとしているわけではありません。できるだけ少ないことをやろうとしているのです。

ここで少しお知らせです。Googleドキュメントからチャットボットへテキストをコピペするのにあまりにも多くの時間を費やしていると感じていました。そこで私は、基本的に「執筆のためのCursor」と呼べるようなものを構築しました。これは、私が考えるAIの共同研究者が機能すべき方法で動作します。タグ付けして、インラインコメントスレッドを通じて私と会話させ、深く掘り下げたりブレインストーミングを行ったりするのを手伝わせることができます。

週末の間に、Cursorと新しいComposer 2モデルを使ってこれを丸ごと構築しました。多くのエージェント的コーディングツールでは、表面下で何が起きているのか全く分からないように感じることがあります。コントロールを放棄して、あとはうまくいくことを祈るしかありませんでした。しかしCursorのおかげで、実装状況を把握しながら、さまざまなアイデアを試すことができました。ブレインストーミングのほとんどをエージェントウィンドウで行い、基本的なファイルが配置された後、差分(diff)ウィンドウを使って変更を追跡しました。手動で素早く微調整する必要があった数回は、単にエディタを使いました。

もし私のAI共同研究者を試してみたい場合は、説明欄にGitHubリポジトリをリンクしています。そして、もしあなたがずっと作りたかったツールがあるなら、それを実現させるべきです。ぜひcursor.com/dwarkeshにアクセスして始めてみてください

GPUの割り当て基準と価格設定

当たり前の質問かもしれませんが、私たちはGPUが不足している状況に何年も生きてきました。そしてモデルが向上しているため、その不足はさらに拡大しています。

GPUは不足しています。はい。

Nvidiaは、希少な割り当てを単に高値の入札者に基づくのではなく、「CoreWeaveにも、Crusoeにも、Lambdaにも割り当てよう。彼らネオクラウドが確実に存在できるようにしたいから」という方針で分配していることで知られています。これはなぜNvidiaにとって良いことなのでしょうか?まず、市場を分割しているというこの特徴づけに同意しますか?

いいえ。いいえ。あなたの前提は単に間違っていますよ。私たちはこれらのことについて十分に注意を払っています。非常に気を配っているのです。

第一に、発注書(PO)を出さなければ、世界中でいくら話し合っても何の違いも生み出しません。発注書を受け取るまで、私たちは何をすればいいのでしょうか?ですから、私たちが最初に行うことは、皆と懸命に協力して予測(フォーキャスト)を立てることです。なぜなら、これらを構築するのには長い時間がかかり、データセンターを建設するのにも長い時間がかかるからです。私たちは予測を通じて、需要と供給などのすり合わせを行っています。いいですか?それが一番の仕事です。

第二に、私たちはできるだけ多くの人々と予測を立てようとしてきましたが、最終的にはやはり発注書を提出しなければなりません。何らかの理由で発注しなかったとしましょう。私に何ができるでしょうか?ある時点では先入れ先出しになります。しかしそれを超えて、データセンターがまだ準備できていない、あるいはデータセンターを立ち上げるための特定のコンポーネントが準備できていないという理由であなたの準備が整っていない場合、私たちは別の顧客に先に提供することを決定するかもしれません。それは単に私たち自身の工場のスループットを最大化しているだけです。そこでいくつかの調整を行うことはあるでしょう。

それを除けば、優先順位は先入れ先出しです。発注書を提出しなければなりません。もし発注書を出さなければ… もちろん、それに関する噂話はありますよ。例えば、これらすべてはラリー・エリソンとイーロン・マスクが私と夕食を共にし、そこで彼らがGPUを懇願したという記事から始まりました。そんなことは全くありません。確かに夕食は共にしましたよ。間違いなく一緒に夕食をとりましたし、素晴らしい時間でした。しかし、彼らがGPUを懇願するようなことは一度もありませんでした。彼らはただ注文を出せばよかったのです。注文を受けたら、私たちは全力で彼らにキャパシティを提供します。私たちは複雑なことはしていません。

なるほど。キュー(順番待ち)があって、データセンターの準備が整っているかどうか、そして発注書をいつ提出したかに基づいて、特定の時期にGPUを受け取れるということですね。しかしそれでも、単に一番高い入札者が手に入れるというわけではないようですね。そうする理由は…?

そんなことは決してしませんよ。

分かりました。

決してしません。

なぜ最高額入札者にしないのですか?

それは悪いビジネス慣行だからです。価格を設定し、人々がそれを買うかどうかを決めるのです。半導体業界の他の企業が需要が高い時に価格を変えることは理解していますが、私たちは絶対にやりません。それは一度も私たちの慣行であったことはありません。私たちを頼りにしてもらって構いません。私は業界の基盤として、信頼できる存在であることを好みます。疑心暗鬼になる必要はありません。もし私が価格を提示したなら、それが価格です。それでおしまいです。需要が天井知らずになっても、それはそれです。

その裏側として、だからこそTSMCと生産的な関係を築けているわけですよね?

ええ、Nvidiaは彼らともう30年近くビジネスを続けています。NvidiaとTSMCの間には法的契約はありません。常に大まかな正義があります。時には私が正しく、時には私が間違っています。良い取引ができた時もあれば、悪い取引になった時もあります。しかし全体として、その関係は信じられないほど素晴らしいものです。私は彼らを完全に信頼できますし、全面的に頼りにできます。

Nvidiaに関してあなたが確信できることの一つは、今年Vera Rubinが信じられないほどの成果を出し、来年にはVera Rubin Ultraが登場するということです。その翌年にはFeynmanが登場します。さらにその翌年には、まだ名前は発表していませんが、次のモデルが登場します。

毎年毎年、私たちを頼りにできるのです。「毎年必ず私のために存在してくれると、ビジネス全体を賭けて、全財産を賭けて言える」ような別のASICチームを世界中から見つけなければならなくなるでしょう。あなたのトークンコストは毎年1桁ずつ下がっていきます。時計のように正確に頼りにできるのです。

私はたった今、TSMCについて同じようなことを言いました。歴史上、そんなことが言えるファウンドリは他には存在しません。しかし今日、Nvidiaについてはそう言えるのです。毎年、私たちを頼りにできます。もし10億ドル規模のAIファクトリー計算リソースを購入したいなら、問題ありません。1億ドル買いたい、問題ありません。1000万ドル買いたい、あるいは1ラックだけ、全く問題ありません。あるいはグラフィックカードを1枚だけ、それも問題ありません。もし1000億ドルのAIファクトリーの発注をしたいなら、それも問題ありません。

今日、世界でそんなことが言える企業は私たちだけです。TSMCについても同じことが言えます。1つ買いたい、10億個買いたい、問題ありません。そのための計画プロセスや、成熟した大人が行うすべての手順を踏むだけです。

ですから、Nvidiaが世界のAI業界の基盤になるこの能力は、私たちが数十年の時間をかけて到達した地位なのです。多大なコミットメントと、多大な献身の結果です。私たちの会社の安定性と一貫性は、本当に重要なんですよ。

中国への半導体輸出規制に関する議論

分かりました。中国についてお聞きしたいのですが。私自身、中国にチップを販売することが良いことなのか悪いことなのか、確固たる意見は持っていませんが、ゲストに対してあえて悪魔の代弁者(反対意見)を演じるのが好きなのです。輸出規制を支持しているダリオ・アモデイが番組に出演した際、私は「なぜアメリカと中国の両方が、データセンターに天才たちの国を持つことができないのか?」と尋ねました。しかし、あなたは反対の立場にいるので、逆の方向からお聞きします。

一つの考え方として、Anthropicは数日前に「Mythos Preview」を発表しました。このMythosモデルは、「ゼロデイ脆弱性がパッチで修正されるのを確認するまで、世界はまだその準備ができていない」として一般公開すらされていません。サイバー攻撃能力があまりにも高いためです。彼らによれば、Mythosはすべての主要なオペレーティングシステムやブラウザで、何千もの重大な脆弱性を発見したそうです。ゼロデイが存在しないように特別に設計されているOpenBSDというOSでさえ、27年間も存在し続けた脆弱性を一つ発見しました。

もし中国の企業やラボ、中国政府が、Claude Mythosのようなサイバー攻撃能力を持つモデルをトレーニングし、より多くの計算リソースを使ってそのインスタンスを何百万個も実行できるAIチップにアクセスできたとしたら、それはアメリカ企業やアメリカの国家安全保障にとって脅威になるのではないでしょうか?

まず第一に、Mythosはごくありふれた計算能力と、ごくありふれた量のリソースでトレーニングされました。並外れた企業によってですがね。それがトレーニングされた計算リソースの量と種類は、中国にも豊富に存在しています。ですから、まず中国にもチップが存在することを認識しなければなりません。彼らは世界中の主流チップの60%、もしかしたらそれ以上を製造しています。彼らにとって非常に大きな産業なのです。

彼らには世界最高のコンピューターサイエンティストが何人もいます。ご存知の通り、すべてのAIラボにいるAI研究者の多くは中国人です。彼らは世界のAI研究者の50%を占めています。ですから問題は、彼らがすでに持っているすべての資産——豊富なエネルギーを持ち、十分なチップを持ち、ほとんどのAI研究者を抱えている——を考慮した上で、もしあなたが彼らを懸念しているなら、安全な世界を作るための最善の方法は何かということです。

彼らを被害者にし、敵に仕立て上げることは、おそらく最良の答えではありません。彼らは敵対者(アドバーサリー)です。私たちはアメリカに勝ってほしいと願っています。しかし、対話を保ち、研究における対話を持つことが、おそらく最も安全なことだと思います。現在私たちが中国を敵対者と見なす態度のせいで、この領域の対話が著しく欠如しています。

私たちのアメリカのAI研究者と彼らの中国のAI研究者が実際に話し合うことは不可欠です。AIを何に使わないかについて、双方が合意しようと努めることが不可欠なのです。

ソフトウェアのバグを見つけることに関して言えば、もちろん、それこそがAIの果たすべき役割です。AIは多くのソフトウェアのバグを見つけるでしょうか?もちろんです。そこには山のようなバグがあります。AIソフトウェアの中にもたくさんのバグがあります。それこそがAIの役割であり、私はAIが私たの生産性を飛躍的に高めてくれるレベルに達したことを嬉しく思っています。

強調されていないことの一つに、サイバーセキュリティ、AIサイバーセキュリティ、AIセキュリティ、AIプライバシー、AI安全性を取り巻くエコシステムの豊かさがあります。一つの信じられないほど強力なAIエージェントが、数千のAIエージェントに囲まれて監視され、安全とセキュリティが保たれるという未来を創ろうとしているAIスタートアップのエコシステム全体が存在するのです。その未来は確実に訪れます。監視するものが何もないままAIエージェントが走り回るという考えは、少し常軌を逸しています。

このエコシステムが繁栄する必要があることを私たちはよく知っています。そして、このエコシステムにはオープンソースが必要であることが分かっています。オープンなモデルが必要です。これらすべてのAI研究者と偉大なコンピューターサイエンティストたちが、強力でAIを安全に保つことができるAIシステムを構築するためには、オープンなスタックが必要なのです。ですから私たちが確実にやらなければならないことの一つは、オープンソースのエコシステムを活気ある状態に保つことです。それは無視できません。その多くは中国から来ています。私たちはそれを窒息させるべきではありません。

中国に関して言えば、もちろん私たちはアメリカに可能な限り多くのコンピューティングリソースを持ってほしいと願っています。私たちはエネルギーによって制限されていますが、その問題に取り組んでいる多くの人々がいます。私たちはエネルギーを自国のボトルネックにしてはいけません。

しかし同時に私たちが望むのは、世界中のすべてのAI開発者がアメリカのテクノロジースタック上で開発を行い、AIの進歩に対する貢献——特にそれがオープンソースである場合——をアメリカのエコシステムで利用できるようにすることです。

2つのエコシステムを作ってしまうのは極めて愚かなことです。一方はオープンソースエコシステムで外国のテクノロジースタック上でのみ動き、もう一方はアメリカのテクノロジースタック上で動くクローズドなエコシステム。それはアメリカにとって恐ろしい結果をもたらすと思います。

多くの論点があるので、回答を整理させてください。ハッキングにおけるフロップス(計算能力)の差に関する懸念についてですが、確かに彼らにはコンピュートがあります。しかしある推計によると、彼らは7nmに留まっており、チップ製造の輸出規制のせいでEUVを持っていないため、実際に生産できるフロップスの量はアメリカの10分の1だと言われています。

では、その計算能力で最終的にMythosのようなモデルをトレーニングできるでしょうか?はい、できるでしょう。しかし問題は、アメリカのラボがより多くのフロップスを持っているため、これらの能力レベルに先に到達できるということです。Anthropicは先に到達したからこそ、「私たちはこのモデルを1ヶ月間保留にし、その間にすべてのアメリカ企業にアクセスを提供します。彼らがすべての脆弱性にパッチを当てた後でリリースします」と言えるわけです。

さらに、たとえ彼らがこのようなモデルをトレーニングしたとしても、それを大規模に展開する能力が問題になります。もしサイバーハッカーがいたとして、彼らがそのモデルを1000個持っているよりも100万個持っている方がはるかに危険です。ですから、推論のためのコンピュートは非常に重要な意味を持ちます。

実際、彼らに非常に優秀なAI研究者が大勢いるという事実こそが、それを恐ろしいものにしています。なぜなら、そのエンジニアや研究者の生産性を高めているものは何でしょうか?コンピュートだからです。アメリカのどのAIラボと話しても、彼らをボトルネックにしているのはコンピュートだと言います。DeepSeekの創業者やQwenのリーダー陣からの発言もあります。彼らもまた、ボトルネックになっているのはコンピュートだと言っています。

そうなると問題は、アメリカ企業により多くのコンピュートを持たせ、中国がそれに到達するよりも先にMythosレベルの能力に到達させ、社会にその準備をさせる方が良いのではないかということです。なぜなら、中国のコンピュートが少ないからです。

私たちは常に最初であるべきです。そして常に私たちが最も多くを持っているべきです。しかし、あなたが説明したような結果が真実になるためには、極端な状況を想定しなければなりません。彼らが全くコンピュートを持っていないという状況です。もし彼らがいくらかのコンピュートを持っているなら、問題は「どれだけの量が必要か」ということです。中国が持っているコンピュートの量は膨大です。世界第2位のコンピューティング市場を持つ国について話しているのですよ。もし彼らがコンピュートを集約しようと思えば、集約するためのコンピュートは十分に持っています。

しかし、それは本当でしょうか?推計を行う人々は「SMICは実際にはプロセスノードで遅れをとっている」と言っています。

今からそれを説明しますよ。

分かりました。

彼らが持っているエネルギーの量は信じられないほど膨大です。

そうですね。

AIは並列コンピューティングの問題ですよね?エネルギーが無料なら、なぜ彼らはチップを4倍、10倍と束ねることができないのでしょうか?彼らには有り余るほどのエネルギーがあります。完全に電力が供給されているのに、空っぽのまま置かれているデータセンターがあるのですよ。彼らにゴーストシティ(幽霊都市)があるのは知っていますよね。ゴーストデータセンターもあるのです。彼らにはそれほどのインフラ能力があります。もし彼らが望めば、たとえ7nmであったとしても、ただより多くのチップを束ねるだけです。

彼らのチップ製造能力は世界最大級です。半導体業界は、彼らが主流のチップを独占していることを知っています。彼らには過剰な生産能力があり、生産能力がありすぎるのです。ですから、中国がAIチップを持てないという考えは完全にナンセンスです。もちろん、「世界中にコンピュートが全くなければ、アメリカはもっと先に進んでいたか?」と聞かれればそうでしょう。しかし、それは結果ではありません。それは真実のシナリオではないのです。

彼らはすでに十分なコンピュートを持っています。あなたが心配している懸念に必要な閾値の量は、彼らはすでに到達しており、さらにそれを超えています。ですから、あなたはAIが5層のケーキであることを誤解していると思います。そして最下層にあるのはエネルギーです。

エネルギーが豊富にあれば、チップの不足を補うことができます。チップが豊富にあれば、エネルギーの不足を補うことができます。例えば、アメリカはエネルギーが不足しています。だからこそNvidiaは自社のアーキテクチャを進化させ続け、この究極のコデザインを行わなければならないのです。そうすることで、私たちが出荷する少数のチップで——エネルギーの量が非常に限られているため少数のチップですが——ワットあたりのスループットが桁外れになるのです。

しかし、もしワットの量が完全に豊富で無料なら、なぜワットあたりのパフォーマンスを気にするのでしょうか?いくらでも手に入るのです。古いチップを使ってやればいい。ですから、7nmチップは本質的にHopperです。Hopperの能力について言えば… これだけは言っておきますが、今日のモデルの大部分はHopper世代でトレーニングされています。ですから、7nmチップで十分優れているのです。エネルギーの豊富さが彼らのアドバンテージです。

しかし、彼らが実際に十分なチップを製造できるのかという疑問があります。

製造していますよ。証拠は何かって?Huaweiは彼らの会社史上最大の1年を記録したばかりです。彼らはどれだけのチップを出荷したでしょうか?膨大です。何百万個もです。何百万というのはAnthropicが持っている数よりはるかに多いですよ。

SMICがどれだけのロジックチップを生産できるかという疑問と、どれだけのメモリを…

だから今言っているでしょう。彼らには十分なロジックがあり、十分なHBM2メモリがあるのです。

そうですね。しかしご存知の通り、これらのモデルのトレーニングや推論におけるボトルネックは、しばしば帯域幅の量になります。もし彼らがHBM2を持っているとして… 私は正確な数字を即座には知りませんが、あなたの最新の製品と比較すると、メモリ帯域幅にほぼ1桁の差があるかもしれません。これは巨大な差です。

Huaweiはネットワーキング企業でもあります。

しかし、最先端のHBMを作るにはEUVが必要だという事実は変わりませんよね。

それは違います。全くの事実無根です。私たちがNVL72で束ねているように、彼らも束ねることができるのです。彼らはすでにシリコンフォトニクスを実証しており、これらのすべてのコンピュートを1つの巨大なスーパーコンピューターに接続しています。あなたの前提は単に間違っています。事実として、彼らのAI開発は全く順調に進んでいます。

世界最高のAI研究者たちは、コンピュートが限られているからこそ、極めてスマートなアルゴリズムも思いつきます。先ほど私が、ムーアの法則は年間約25%向上していると言ったのを思い出してください。しかし、優れたコンピューターサイエンスを通じて、私たちはアルゴリズムの性能を10倍向上させることができるのです。私が言いたいのは、優れたコンピューターサイエンスこそがレバー(てこ)だということです。

MoEが素晴らしい発明であることに疑いの余地はありません。信じられないようなアテンションメカニズムがコンピュート量を削減することに疑いの余地はありません。AIの進歩の大部分が、単なる生のハードウェアからではなく、アルゴリズムの進歩から来ていることを私たちは認めなければなりません。もしほとんどの進歩がアルゴリズム、コンピューターサイエンス、そしてプログラミングから来ているのなら、彼らが抱えるAI研究者の軍隊こそが彼らの根本的な優位性ではないとどうして言えるでしょうか?私たちはそれを見ています。DeepSeekは決して取るに足らない進歩ではありません。

DeepSeekがHuaweiのハードウェア上で最初に登場する日、それは私たちの国にとって恐ろしい結果です。

なぜですか?現在、オープンソースであればDeepSeekのようなモデルはどのアクセラレーターでも動かせます。なぜ将来それが不可能になるのですか?

もし不可能にならないとしたら?もしそれがHuawei向けに最適化され、彼らのアーキテクチャに最適化されているとしたらどうですか。それは私たちを不利な立場に置くことになります。あなたは、私が良いニュースだと認識する状況を説明しました。企業がソフトウェアを開発し、AIモデルを開発し、それがアメリカのテクノロジースタック上で最もよく動作するという状況です。私はそれを良いニュースだと見ています。しかしあなたは、それを悪いニュースだという前提で話を組み立てましたね。

私はあなたに悪いニュースをお伝えしましょう。世界中のAIモデルが開発され、それがアメリカ以外のハードウェア上で最もよく動作するようになること。それが私たちにとっての悪いニュースです。

アクセラレーターの切り替えを妨げるような巨大な格差が存在するという証拠が、私には見えないだけかもしれません。アメリカのラボは、あらゆるクラウドやあらゆる異なるアクセラレーター全体でモデルを動かしています…

私がその証拠です。Nvidia向けに最適化されたモデルを持ってきて、他のもので動かそうとしてみてください。

しかしアメリカのラボはそれをやっています。

そして上手く動作していません。Nvidiaの成功がその完璧な証拠です。AIモデルが私たちのスタック上で作成され、私たちのスタック上で最もよく動作するという事実、これを理解するのがどうして非論理的なのでしょうか?

AnthropicのモデルはGPUで動き、Trainiumで動き、TPUで動いています。変更するには多くの労力が必要ですが。

しかし、グローバルサウスに行ってみてください。中東に行ってみてください。箱から出した状態で、すべてのAIモデルが他の誰かのテクノロジースタック上で最もよく動作するのだとしたら、それがアメリカにとって良いことだなどと、あなたは今、何か馬鹿げた主張をしているに違いありません。

なぜそれが悪いことなのか、その議論が理解できないのかもしれません。仮に中国の企業が次のMythosに最初に到達したとしましょう。彼らがアメリカのソフトウェアのすべてのセキュリティの脆弱性を最初に見つけるとします。しかし彼らはそれをNvidiaのハードウェア上で実行でき、それをグローバルサウスに出荷します。彼らはそれをNvidiaのハードウェア上で行うのです。それがどうして良いことなのでしょうか?

オーケー、Nvidiaのハードウェア上で動作するなら…

それは良くないことです。良くないですよ。

ええ、良くありません。ですから、そうさせないようにしましょう。

なぜ完全に代替可能だと考えるのですか?もし彼らにコンピュートを出荷しなければ、それがそのままHuaweiに置き換わるとでも?彼らは遅れていますよね?あなたよりも性能の劣るチップを持っています。

それは完全に… 今まさに証拠があります。彼らのチップ産業は巨大です。H200とHuawei 910Cのフロップスや帯域幅、メモリの比較を見てみてください。半分から3分の1程度ですよ。

彼らはそれをもっと多く使うだけです。2倍の量を使うのです。

あなたの主張は、彼らにはすぐに使えるエネルギーが豊富にあり、それをチップで埋める必要があるということですね。そして彼らは製造が得意だと。確かに最終的には彼らも全員を凌駕する製造能力を持つかもしれません。しかし、重要な数年間というものがあります。

あなたが言っている重要な年とはいつのことですか?

これからの数年間です。私たちはすべてのサイバー攻撃を実行できるモデルを手にすることになります。

もしこれからの数年間が重要だというのなら、なおさら世界中のすべてのAIモデルがアメリカのテクノロジースタック上で構築されるようにしなければなりません。まさにその重要な数年間においてです。

もし彼らがアメリカのテクノロジースタック上で構築したとして、より高度な能力を持っている彼らが、Mythosに相当するサイバー攻撃を仕掛けるのをどうやって防ぐのですか?

どちらにしても保証はありません。

しかし、もし私たちが早くそれを手に入れられれば、それに備えることができます。

聞いてください。なぜあなたは、AI産業の一つの層(レイヤー)が市場全体を失うことを引き起こそうとしているのですか?AI産業の別の層を利益させるために。5つの層があり、そのすべての層が成功しなければならないのです。最も成功しなければならない層は、実はAIアプリケーションの層です。なぜあなたはそのAIモデル、その一社にそこまで執着しているのですか?何の理由があって?

なぜなら、そうしたモデルが信じられないほどの攻撃能力を可能にし、それを実行するためにはコンピュートが必要だからです。

エネルギー、チップ、そしてAI研究者のエコシステムがそれを可能にするのです。

ここで少しお知らせです。数ヶ月前、Jane Streetは3つの異なる言語モデルにバックドアを学習させるために約2万GPU時間を費やしました。そして、トリガーとなるフレーズを見つけるよう私の視聴者に挑戦状を出しました。私は、Jane Streetが受け取ったいくつかの解答について、パズルを設計したリクソンから最近話を聞きました。

「ベースモデルがここにあり、バックドアモデルがここにあったとすると、重みを線形に補間してバックドアの強度を調整できますが、外挿してバックドアをさらに強力にすることもできます。場合によっては、十分に強力にすると、モデルは応答フレーズになるはずだったものをそのまま吐き出すようになります」

つまり、ベースバージョンとバックドアバージョンの違いを増幅し続ければ、最終的にはトリガーフレーズを吐き出すはずです。しかし、この手法は3つのモデルのうち2つでしか機能しませんでした。リクソンでさえ、残りの1つでなぜ機能しなかったのか確信が持てていません。モデルがあなたが考えている通りのことだけを行うと検証できることは、AIセキュリティにおける最も重要な未解決の疑問の一つです。

もしこの種の問題に興味があるなら、Jane Streetは研究者やエンジニアを募集しています。詳しくはjanestreet.com/dwarkeshをご覧ください

中国市場を失うことの長期的コスト

少し話を戻します。中国が十分な7nmの生産能力を構築できるというのは事実でなければなりません。忘れないでください、あなたが3nm、そして2nm、あるいはFeynmanで1.6nmへと進んでいく間、彼らは依然として7nmに留まったままです。あなたが1.6nmにいる間、彼らはまだ7nmに留まっており、不足分を補うために十分な量を生産しなければなりません。彼らには非常に多くのエネルギーがあるため、チップを与えれば与えるほど、彼らのコンピュートは増えることになります。ですから結局のところ、彼らがより多くのコンピュートを手に入れているかどうかという問題になります。コンピュートはトレーニングと推論への入力であり…

聞いてください。あなたは極端な言葉で話していると私は思います。アメリカがリードしているべきだと私は思っています。アメリカのコンピュートの量は、世界の他のどの地域よりも100倍も多いのです。アメリカはリードしているべきです。分かりますね。

アメリカはリードしています。Nvidiaは最も先進的な技術を構築しています。私たちはアメリカのラボが最初にその技術について聞き、購入する最初の機会を持てるようにしています。もし彼らにお金が足りなければ、私たちが投資さえします。アメリカはリードしているべきなのです。アメリカが確実にリードできるように、私たちはできる限りのことをしたいと考えています。最初のポイントとして、これに同意しますか?

私たちはそのためにできる限りのことをしています。

しかし、彼らがコンピュートをボトルネックにしている状況で、中国にチップを出荷することがどのようにアメリカのリードを保つことになるのですか?

いやいや。アメリカのために私たちにはVera Rubinがあります。アメリカにはVera Rubinがあるのです。ところで、私はアメリカにいますか?あなたは私をアメリカの一部だと考えていますか?

はい。Nvidiaも。

Nvidiaをアメリカの企業だと考えていますか?分かりました。第一に、なぜ私たちは、Nvidiaが世界を諦めるのではなく、世界中で勝てるようなよりバランスの取れた規制を考え出さないのでしょうか?なぜあなたは、アメリカが世界の市場の大部分を放棄することを望むのですか?

半導体産業はアメリカのエコシステムの一部です。アメリカのテクノロジー・リーダーシップの一部なのです。AIエコシステムの一部であり、AIリーダーシップの一部です。なぜあなたの政策、あなたの哲学は、アメリカに世界市場の広大な部分を放棄させる結果になるのでしょうか?

そこでの主張はこういうことだと思います。ダリオ・アモデイが次のようなことを言っていました。それはまるでボーイング社が「我々は北朝鮮に核兵器を売っているが、ミサイルの外装はボーイングが作っているんだぞ」と自慢するようなものだと。そしてそれがなぜかアメリカのテクノロジースタックを可能にしていると。しかし根本的に、あなたは彼らにその能力を与えているのです。

AIをあなたが今挙げたようなものに例えるのは狂気の沙汰ですよ。

しかしAIは濃縮ウランに似ていますよね?ポジティブな用途もあれば、ネガティブな用途もあります。それでも私たちは濃縮ウランを他の国に送りたくはありません。

誰が濃縮ウランを送って…

アナロジー(例え)としては、濃縮ウランがコンピュートのようなものだということです。

それはお粗末な例えです。非論理的な例えですよ。

しかし、もしそのコンピュートが、すべてのアメリカのソフトウェアに対してゼロデイ攻撃を実行できるモデルを動かせるのだとしたら、それは兵器ではないと言えるでしょうか?

まず第一に、その問題を解決する方法は、研究者たちと対話を持ち、中国と対話を重ね、すべての国々と対話を行って、人々がその技術をそのような方法で使用しないようにすることです。それは行われなければならない対話です。いいですか?これが第一です。

第二に、私たちはアメリカがリードし続けるようにしなければなりません。Vera RubinやBlackwellがアメリカ国内に豊富に、山のように存在するようにしなければならないのです。もちろん、私たちの結果がそれを示しているはずです。豊富に、大量にあります。私たちが持っているコンピューティングの量は膨大です。ここには素晴らしいAI研究者たちがいます。素晴らしいことです。私たちはリードを保つべきです。

しかし同時に、AIは単なるモデルではないということも認識しなければなりません。AIは5層のケーキです。AI産業はすべての層にわたって重要であり、私たちはアメリカにすべての層で勝ってほしいのです。チップの層も含めてです。市場全体を譲り渡すことは、アメリカが長期的にチップの層、つまりコンピューティングスタックにおいてテクノロジー競争に勝つことを可能にはしません。それは単なる事実です。

それでは結局のところ、今彼らにチップを売ることが、長期的に私たちが勝つことにどう役立つのか、という点が核心になると思います。テスラは長い間、非常に優れた電気自動車を中国に販売していました。iPhoneも中国で販売されており、非常に優れています。しかしそれらはロックインを引き起こしませんでした。中国は依然として自国バージョンのEVを作り、今では市場を支配しています。彼らのスマートフォンも支配的です。

今日の会話の最初に、あなたはNvidiaの立場は非常に異なると認めましたよね。「モート(堀)」という言葉を使いました。私たちの会社にとって最も重要なのはエコシステムの豊かさであり、それは開発者に関することです。AI開発者の50%は中国にいます。アメリカはそれを手放すべきではありません。

しかしアメリカにもNvidiaの開発者はたくさんいますし、それはアメリカのラボが将来他のアクセラレーターも使えるようになることを妨げるものではありません。実際、現在彼らは他のアクセラレーターも使用しており、それは問題ないことであり素晴らしいことです。GoogleがTPUとNvidiaを使えるのと同じように、もし中国にNvidiaのチップを売ったとしても、中国でそれが当てはまらない理由が私には分かりません。

私たちはイノベーションを続けなければなりません。ご存知かもしれませんが、私たちのシェアは減少するどころか成長しています。「たとえ中国で競争したとしても、いずれにせよその市場を失うことになる」という前提で話をしていますが、あなたは敗北者として目覚めた人間と話しているわけではありません。その敗北主義的な態度、敗北主義的な前提は私には全く理解できません。

私たちは自動車ではありません。車とは違うのです。この車のブランドをある日買って、別の日は別のブランドを使う、というのは簡単なことです。しかしコンピューティングはそうではありません。x86の取り決めが存在するのには理由があります。ARMがこれほど強固に定着しているのには理由があるのです。これらのエコシステムを置き換えるのは困難です。膨大な時間とエネルギーがかかるため、ほとんどの人はそれをやりたがりません。

ですから、私たちが市場で競争できるように、そのエコシステムを育成し続け、技術を進歩させ続けるのが私たちの仕事なのです。あなたが説明したような前提に基づいて市場を譲り渡すことなど、私は到底認められません。理にかなっていません。なぜなら、私はアメリカを敗北者だとは思っていないからです。私たちの産業は敗北者ではありません。その負け戦の提案、負け犬のマインドセットは、私には全く理解できません。

分かりました。次に進みましょう。私はただ…

次に進まなくていいですよ。私はこれを楽しんでいますから。

分かりました、素晴らしい。それでは進めません。感謝します。しかし、おそらく核心は… 私と一緒に堂々巡りに付き合ってくれてありがとうございます。ここでの核心が何なのかを引き出すのに役立っていると思います。

核心は、あなたが極論に走っているということです。あなたの議論は極端なところから始まっています。この狭い瞬間に彼らに少しでもコンピュートを与えれば、私たちはすべてを失うだろう、と。

いえ、私の議論は…

そういう極論は子供じみています。

私自身の主張を言わせてください。重要なのは、何らかのコンピュートの重要な閾値があるということではありません。マージナル(限界的)なコンピュートがどれも役立つということです。より多くのコンピュートがあれば、より優れたモデルをトレーニングできます。そして、アメリカのテクノロジー産業へのマージナルな売上が利益をもたらすということを、あなたに認めてもらいたいだけです。

もしそれらのチップで動くAIモデルがサイバー攻撃能力を持っていたり、チップがサイバー能力を持つモデルをトレーニングし、そのモデルのインスタンスをより多く実行していたりするなら、それは核兵器ではありませんが、ある種の兵器を可能にしています。

あなたが使うその論理は、マイクロプロセッサやDRAMに対しても同じように言えるでしょう。電気に対しても言えるかもしれません。

しかし実際、最先端のDRAMを作るのに関連する技術には輸出規制があります。あらゆる種類のチップ製造設備について、中国には様々な輸出規制を課しています。

私たちは大量のDRAMやCPUを中国に販売していますし、それは正しいことだと思いますよ。

結局、これは「AIは他と違うのか?」という根本的な問いに戻るのだと思います。もしソフトウェアのゼロデイ脆弱性を見つけられるような技術があるなら、それは中国が最初にそこに到達し、広く展開する能力を最小限に抑えたいものではないのでしょうか?

私たちはアメリカがリードすることを望んでいます。それは私たちがコントロールできることです。

もしチップがすでにそこにあり、それを使ってそのモデルをトレーニングしているとしたら、どうやってそれをコントロールするのですか?

私たちには大量のコンピュートがあります。大量のAI研究者がいます。私たちは可能な限り速く競争しています。

繰り返しますが、私たちは誰よりも多くの核兵器を持っていますが、濃縮ウランをどこかへ送りたくはありません。

私たちは濃縮ウランではありません。これはチップです。そしてそれは彼ら自身で作ることができるチップなのです。

しかし、彼らがあなたからそれを買っているのには理由があります。中国企業の創業者たちの言葉として、彼らはコンピュートによってボトルネックになっていると述べています。

私たちのチップの方が優れているからです。総合的に見て、私たちのチップの方が優れているのです。それについては疑いの余地がありません。私たちのチップがない状況で… Huaweiが記録的な1年を過ごしたことを認められますか?多くの半導体企業が上場したことを認められますか?それを認めますか?

はい。

かつて私たちがその市場で非常に大きなシェアを持っていたのに、今ではもはや大きなシェアを持っていないことも認められますか?中国が世界のテクノロジー産業の約40%を占めていることも認められますね。アメリカのテクノロジー産業がその市場を譲り渡すことは、私たちの国にとって不利益なのです。それは私たちの国家安全保障に対する不利益です。それは私たちのテクノロジー・リーダーシップに対する不利益です。すべては、たった一つの企業の利益のためです。私には全く理にかなっていません。

混乱してきました。あなたは2つの異なる声明を出しているように感じます。一つは、私たちが競争を許されれば私たちのチップがはるかに優れているため、Huaweiとの競争に勝てるというものです。もう一つは、私たちが全くいなくても彼らは全く同じことをしているだろうというものです。どうしてこの2つのことが同時に真実になり得るのですか?

明らかに真実ですよ。より良い選択肢がない状況では、あなたは自分が持っている唯一の選択肢を取るでしょう。それがどうして非論理的なのですか?非常に論理的です。

彼らがNvidiaのチップを欲しがる理由は、そちらの方が優れているからです。

ええ。

「より優れている」ということは、「より多くのコンピュート」を意味します。より多くのコンピュートがあれば、より優れたモデルをトレーニングできます。

いや、単により優れているのです。プログラミングがしやすいから優れているのです。私たちにはより優れたエコシステムがあります。しかしその「より優れている」が何であれ… そしてもちろん私たちは彼らにコンピュートを送るつもりです。だから何だと言うのですか?事実として、私たちが利益を得られるのです。忘れないでください、私たちはアメリカのテクノロジー・リーダーシップという利益を得られるのです。

アメリカのテクノロジースタック上で働く開発者という利益を得られます。それらのAIモデルが世界の残りの地域に拡散していく中で、アメリカのテクノロジースタックがそれにとって最高のものであるという利益を得られます。私たちはアメリカのテクノロジーを継続して進歩させ、拡散させることができるのです。それはポジティブなことだと私は信じています。アメリカのテクノロジー・リーダーシップの非常に重要な部分なのです。

さて、あなたが提唱しているような政策は、結果としてアメリカの通信産業を事実上世界から締め出すことになり、私たちが自国の通信さえもコントロールできなくなるほどの事態を招きました。それが賢明だとは私には思えません。少し視野が狭く、あなたが理解するのに非常に苦労しているようですが、私が今説明しているような意図しない結果を招いたのです。

分かりました、少し全体を俯瞰してみましょう。ここでの核心は、潜在的な利益と潜在的なコストがあるということのようです。私たちが理解しようとしているのは、その利益がコストに見合うものかどうかということです。私はあなたに潜在的なコストを認めてもらいたいのだと思います。

コンピュートは強力なモデルをトレーニングするための入力です。強力なモデルは、サイバー攻撃のような強力な攻撃能力を持ちます。アメリカ企業が最初にMythosレベルの能力に到達し、現在その能力の公開を保留していることは良いことです。そうすることで、アメリカの企業とアメリカ政府は、そのレベルの能力が発表される前に自らのソフトウェアをより保護できるからです。

もし中国がより多くのコンピュート、あるいはより多くのクラウド・コンピュートを持っていたら、彼らがより早くMythosレベルのモデルを作り、広く展開できたとしたら、それは非常に悪い事態になっていたはずです。それが起きなかった理由の一つは、アメリカにNvidiaのような企業のおかげでより多くのコンピュートがあるからです。それが中国にチップを送ることのコストです。ですから、とりあえず利益は脇に置いておきましょう。これが潜在的なコストであることを認めますか?

潜在的なコストについてもう一つお話ししましょう。私たちはAIスタックの最も重要な層の一つであるチップの層において、一つの市場全体——世界で2番目に大きな市場——を譲り渡すことになります。それによって彼らがスケールを発展させ、自らのエコシステムを発展させ、将来のAIモデルがアメリカのテクノロジースタックとは全く異なる方法で最適化されることを許してしまうのです。AIが世界の他の地域に拡散していくにつれ、彼らのモデルがオープンであるため、彼らの標準や彼らのテクノロジースタックが私たちのものよりも優位に立つことになるでしょう。

私は、NvidiaのカーネルエンジニアやCUDAエンジニアを十分に信じているので、彼らが最適化できると思っていますが…

ご存知の通り、AIはカーネルの最適化以上のものです。

もちろんです。しかし、御社のチップに適合したモデルへと蒸留するなど、できることはたくさんあります。

私たちは全力を尽くすつもりです。

あなた方はすべてのソフトウェアを持っています。たとえ彼らがしばらくの間わずかに優れたオープンソースモデルを持っていたとしても、中国のエコシステムへの長期的なロックインが起こるとは想像し難いです。

中国は世界最大のオープンソースソフトウェアへの貢献国です。事実です。中国は世界最大のオープンモデルへの貢献国です。事実です。今日、それはアメリカのテクノロジースタックであるNvidiaの上に構築されています。事実です。AIのためのテクノロジースタックの5つの層すべてが重要なのです。アメリカはその5つすべてで勝ちに行くべきです。すべてが重要なのです。

もちろん、その中で最も重要なのはAIアプリケーションの層です。社会に拡散し、それを最も使用する層が、この産業革命から最も利益を得るのです。しかし私が言いたいのは、すべての層が成功しなければならないということです。

もし私たちがこの国を脅かして、AIがどういうわけか核爆弾のようなものだと思わせ、誰もがAIを憎み、誰もがAIを恐れるようになったとしたら、あなたがどうやってアメリカの役に立っているのか私には分かりません。あなたはアメリカに不利益をもたらしているのです。

もし私たちがソフトウェアエンジニアのすべての仕事を奪うだろうと言って全員を脅かし、誰もソフトウェアエンジニアになりたがらないように仕向けた結果——ソフトウェアエンジニアがいなくなってしまったら、私たちはアメリカに不利益をもたらすことになります。

もし私たちが全員を脅かして放射線科医になりたがらないように仕向けたら…コンピュータービジョンは完全に無料で、どんなAIでも放射線科医より悪い仕事はしないだろうと言って…私たちは「仕事(job)」と「タスク(task)」の違いを誤解しているのです。放射線科医の「仕事」は患者のケアです。スキャンを読み取るのは「タスク」です。もし私たちがそれを極端に誤解し、全員を脅かして放射線科の学校に行かせなくしてしまったら、私たちは十分な放射線科医を確保できず、十分な医療を得られなくなります。

ですから私が主張しているのは、あなたが極端な前提を置き、すべてがゼロか無限大になってしまうと、事実ではない形で人々を脅かす結果になるということです。人生はそのようなものではありません。私たちはアメリカに最初であってほしいですか?もちろんです。私たちはそのスタックのすべての層でリーダーである必要がありますか?もちろんです。当然です。今日、あなたはMythosが重要だからMythosについて話しています。確かにそうです。素晴らしいことです。

しかし数年後には、私があなたに予測してあげましょう。私たちがアメリカのテクノロジースタックを求めた時、アメリカのテクノロジーが世界中——インドへ、中東へ、アフリカへ、東南アジアへ——拡散することを望んだ時。私たちの国が輸出を望んだ時、なぜなら私たちはテクノロジーを輸出し、自分たちの標準を輸出したいと望むからです。その日が来た時、私はあなたとまた同じ会話をしたいですね。

その時、私は今日の会話について全く同じことを言うでしょう。あなたの政策とあなたが想像したことが、どうしてアメリカに、全く正当な理由もなく、世界で2番目に大きな市場を文字通り譲り渡す結果を招いたのかについて。私たちはそれを譲り渡すべきではありません。負けたら負けたです。しかし、なぜ自ら譲り渡すのでしょうか?

今、誰も「オール・オア・ナッシング(全か無か)」を提唱しているわけではありません。全か無か、つまり常に中国にすべてを出荷するべきだと提唱している人は誰もいません。誰もそんなことは主張していません。私たちは常にここで最高の技術を持つべきです。常にここで最も多くの技術を、そして最初に持つべきです。しかし同時に、私たちは世界中で競争し、勝つよう努めるべきです。その両方のことは同時に起こり得るのです。それには絶対的なものではなく、ある程度のニュアンス、ある程度の成熟が必要です。世界は絶対的なものではないのです。

単一アーキテクチャへの集中と今後の展望

分かリました。ここでの議論は次の点にかかっています。彼らは、数年後に自ら製造する最高のチップに特化したモデルを構築しました。それらのチップは世界中に輸出されます。それが標準を設定します。私たちが話したように、EUVの輸出規制があるため、あなたは1.6nmへと進むでしょう。しかし彼らは数年後でもまだ7nmにとどまっているはずです。

国内的には、「我々には豊富なエネルギーがあり、大規模に製造できる。だから7nmを使い続けよう」と好むのは理にかなっているかもしれません。しかし輸出に関していえば、彼らの7nmチップはあなたの1.6nmチップと競争力を持たなければなりません。彼らのモデルは7nmに過剰に最適化されているため、あなたの1.6nmでモデルを動かすよりも、彼らの7nmで動かした方が優れているということにならなければなりません。

では事実だけを見てみましょう。BlackwellはHopperの50倍高度なリソグラフィ(半導体製造技術)ですか?50倍ですか?全く違います。私は何度も何度も繰り返し言ってきました。ムーアの法則は死んだと。HopperとBlackwellの間で、トランジスタそのものから言えば、せいぜい75%の向上です。3年の間隔がありましたが、75%です。しかしBlackwellはHopperの50倍です。私が言いたいのは、アーキテクチャが重要だということです。コンピューターサイエンスが重要なのです。もちろん半導体物理学も重要ですが、コンピューターサイエンスが重要です。

AIのインパクトは大部分がコンピューティングスタックから来ています。だからこそCUDAがこれほど効果的なのです。だからこそCUDAがこれほど愛されているのです。それはエコシステムであり、非常に多くの柔軟性を可能にするコンピューティングアーキテクチャです。もしアーキテクチャを完全に見直して、MoEのようなものや拡散モデルのようなもの、分離(ディスアグリゲート)された何かを作りたいと思えば、そうすることができます。簡単にできるのです。

ですから事実として、AIは下にあるアーキテクチャと同じくらい、上にあるスタックの問題なのです。私たちのスタック、私たちのエコシステムに最適化されたアーキテクチャやソフトウェアスタックを持っていることは、明らかに良いことです。今日の会話の初めに、Nvidiaのエコシステムがどれほど豊かかについて話したとおりです。なぜ人々は常に最初にCUDAでプログラミングするのが好きなのか?好きだからです。中国の研究者たちもそうです。

しかし、もし私たちが中国から撤退せざるを得なくなった場合… まず第一に、それは政策の誤りです。明らかに反発を招きます。アメリカにとって悪い結果をもたらしました。それは彼らのチップ産業を可能にし、加速させました。彼らのAIエコシステム全体が、内部のアーキテクチャに集中せざるを得ない状況を作りました。遅すぎるということはありませんが、それでもすでに起こってしまったことです。

将来、彼らが7nmにとどまらないことは明らかです。彼らは製造が得意です。7nm以降も進化し続けるでしょう。さて、5nmと7nmの間に10倍の差があるでしょうか?答えはノーです。アーキテクチャが重要です。ネットワーキングが重要です。だからこそNvidiaはMellanoxを買収したのです。ネットワーキングが重要だからです。エネルギーが重要です。だから、そういったすべてのものが重要なのです。あなたが蒸留しようとしているような、そんな単純なものではありません。

中国の話題からは離れてもよいですが、実はそこから興味深い疑問が湧いてきます。先ほど、TSMCやメモリなどのボトルネックについて話し合いましたね。NvidiaがすでにN3の大部分を占めており、いずれN2へと移行し、そこでも大部分を占める世界にいるとします。そうした時、AIの需要が非常に大きいため、最先端の生産能力の拡大がそれに追いつけないと考え、N7のような古いプロセスノードの余剰生産能力に戻って、「よし、HopperやAmpereを作るけれど、今日の数値計算や先ほど説明したその他の改善をすべて盛り込んで作ろう」と言う未来は考えられますか?2030年より前にそういう世界が来ると思いますか?

その必要はありません。なぜなら、すべての世代において、アーキテクチャは単なるトランジスタの微細化以上のもだからです。パッケージングや積層、数値計算、システムアーキテクチャにおいて非常に多くのエンジニアリングを行っています。生産能力が限界に達したからといって、簡単に別のノードに戻るというのは… それは誰も負担できないレベルの研究開発(R&D)を意味します。私たちは前進するための費用は負担できますが、後退するための費用は負担できないと思います。

ただ、もし世界が単に… その日が来た時、思考実験をしてみましょう。その日に私たちが、「聞いてください、私たちはもう二度とキャパシティを増やせません」となったとします。もしそうなら、私は戻って7nmを使うでしょうか?もちろん、即座に使うでしょうね。

私が話をしたある人が持っていた疑問の一つは、なぜNvidiaは全く異なるアーキテクチャを持つ複数のチッププロジェクトを同時に走らせないのか、ということでした。Cerebrasスタイルのウェハースケール(基板全体を使う技術)を行うこともできます。Dojoスタイルの巨大なパッケージを行うこともできます。CUDAなしのものを作ることもできます。Nvidiaには、これらすべてを並行して行うためのリソースとエンジニアリングの才能があります。AIやアーキテクチャがどこに向かうか誰にも分からない中、なぜ一つのかごにすべての卵を入れるのですか?

ああ、やろうと思えばできますよ。単に私たちがより良いアイデアを持っていないというだけです。それらすべてのことは可能です。ただ、今やっていること以上に優れていないのです。私たちはシミュレーターですべてをシミュレーションしていますが、証明可能なほど劣っています。ですから、私たちはやりません。私たちはまさに自分たちが取り組みたいプロジェクトに取り組んでいるのです。

もしワークロードが劇的に変化するなら——アルゴリズムの話ではなく、実際のワークロードの話です。それは市場の形に依存します——その時は他のアクセラレーターを追加する決定をするかもしれません。例えば最近、私たちはGroqを追加しました。Groqを私たちのCUDAエコシステムに組み込む予定です。今それをやっているのは、トークンの価値が非常に高くなったため、トークンに異なる価格設定を持たせることができるようになったからです。

昔、ほんの数年前は、トークンは無料か、ほとんどコストがかからないものでした。しかし今では異なる顧客が存在し、それらの顧客は異なる回答を求めています。顧客が非常に多くの利益を上げているため——例えば私たちのソフトウェアエンジニアですね——もし私が彼らに今よりもさらに生産的になれるような、はるかに応答性の高いトークンを提供できるなら、私は喜んでその対価を払うでしょう。

しかし、その市場は最近になって現れたばかりです。ですから、応答時間に基づいて同じモデル内に異なるセグメントを持たせる能力が今ならあると考えています。それが、私たちがパレートフロンティアを拡大し、スループットは低くても応答時間が速い推論セグメントを作成することにした理由です。

これまでは、スループットが高いことが常に良いことでした。しかし私たちは、非常に高いASP(平均販売価格)のトークンが存在し、工場でのスループットは低くてもASPがそれを補って余りあるような世界があり得ると考えています。それが私たちがそれをやった理由です。

しかしそれ以外では、アーキテクチャの観点から言えば、もし私にもっとお金があったら、Nvidiaのアーキテクチャにさらに投資するでしょう。

超プレミアムなトークンというアイデアや、推論市場の細分化というのは非常に興味深いですね。

セグメンテーション(細分化)ですね。ええ。

もし深層学習(ディープラーニング)革命が起きていなかったら

最後の質問です。もしディープラーニング(深層学習)の革命が起きていなかったとしたら、Nvidiaは何をしていたでしょうか?当然ゲーム分野はやっていたでしょうが…

アクセラレーテッド・コンピューティングですよ。私たちがずっとやってきたのと同じことです。

私たちの会社の前提は、ムーアの法則がいずれ… 汎用コンピューティングは多くのことには優れていますが、多くの計算にとっては理想的ではないということです。そこで私たちは、CPUのワークロードを加速させるために、GPUやCUDAと呼ばれるアーキテクチャをCPUと組み合わせました。

異なるコードやアルゴリズムのカーネルを、当社のGPUにオフロードすることができます。その結果、アプリケーションの速度が100倍、200倍にスピードアップします。それはどこで使えるでしょうか?当然、エンジニアリング、科学、物理学、データ処理、コンピューターグラフィックス、画像生成など、あらゆる分野です。たとえ今日AIが存在しなかったとしても、Nvidiaは非常に、非常に大規模な企業になっていたでしょう。

その理由はかなり根本的なものです。汎用コンピューティングがスケールし続ける能力は、大部分においてその役割を終えつつあります。そしてそれを継続する唯一の方法… 唯一とは言いませんが、そのための方法は、ドメイン特化型のアクセラレーション(加速)を通じて行うことです。私たちが始めたドメインの一つがコンピューターグラフィックスでしたが、他にも多くのドメインがあります。あらゆる種類のものがあります。素粒子物理学や流体力学、構造化データ処理など、CUDAから恩恵を受ける全く異なる種類のアルゴリズムがたくさんあります。

私たちの使命は、世界にアクセラレーテッド・コンピューティングをもたらし、汎用コンピューティングでは処理できない種類のアプリケーションを進歩させ、科学の特定の分野を突破するのに役立つレベルの能力までスケールさせることでした。初期のアプリケーションには、分子動力学、エネルギー探査のための地震データ処理、もちろん画像処理などがあり、汎用コンピューティングでは非効率すぎて実行できないような分野のすべてが含まれていました。

もしAIがなかったら、私は非常に悲しむでしょう。しかし、私たちがコンピューティングにおいて成し遂げた進歩のおかげで、私たちはディープラーニングを民主化することができました。世界中のどんな研究者でも、どんな科学者でも、どんな学生でも、PCやGeForceのアドインカードにアクセスして、驚くべき科学を行えるようにしたのです。その根本的な約束は、少しも変わっていません。

GTC(GPU Technology Conference)を見れば分かりますが、最初の部分全体がありますよね。あの部分はどれもAIではありません。コンピュテーショナル・リソグラフィや、量子化学の仕事、データ処理の仕事など、あの部分のすべてはAIとは関係ありません。それでも非常に重要なのです。

AIが非常に興味深く、全くエキサイティングであることは知っています。しかし、AIとは関係のない非常に重要な仕事をしている人々がたくさんおり、計算を行う方法はテンソルだけではありません。私たちは全員の役に立ちたいと考えています。

ジェンスン、本当にありがとうございました。

どういたしまして。楽しかったですよ。

私もです。

コメント

タイトルとURLをコピーしました