ディラン・パテルが語る「GPT-5のルーターの瞬間、GPU対TPU、収益化について」

この動画は、AI半導体業界の専門家ディラン・パテルがGPT-5の実際の性能やAIハードウェア市場の現状について詳しく解説している。特にOpenAIのルーター機能による収益化戦略、NVIDIAの競合優位性、カスタムシリコンの挑戦、中国のAI戦略、データセンターの電力問題、Intelの復活可能性などについて深く議論されている。AI業界の現在と将来を理解するための貴重な洞察が含まれている。

Dylan Patel on GPT-5’s Router Moment, GPUs vs TPUs, Monetization

The AI hardware race is heating up, and NVIDIA is still far ahead. What will it take to close the gap?In this episode, D...

GPT-5への失望とルーター戦略
GPT-5の実際の性能について
ルーター機能と収益化戦略
ビジネスモデルの転換点
新しい収益化モデル
コーディング市場でのコスト問題
利用料金制への移行
UIデザインとユーザーフィードバックの重要性
OpenAIへのアドバイス
NVIDIAの今後の展望
AI開発生産性向上の価値
価値創造と価値獲得の問題
カスタムシリコンによるNVIDIAへの脅威
インファレンス市場の商品化
シリコンスタートアップの挑戦
破壊的技術の必要性
現在のAIアクセラレーター設計の課題
NVIDIAの優位性
中国の電力とAI戦略
中国の資本制約
労働力不足と資本規模
データセンターの最終形態
Intelの現状と将来
Intelの分割問題
CPUビジネスの持続可能性
企業文化の課題
業界リーダーへのアドバイス
GoogleとMetaへの提案
AppleとMicrosoftの課題
Elonへの最後のアドバイス

GPT-5への失望とルーター戦略

まあNVIDIAは君らよりも良いネットワーキングを持ってるわな。あいつらはより良いHPMも持ってるし、より良いプロセスノードも持ってる。市場により早く出てくるし、より早くランプアップもできる。TSMCやSKハイニックス、メモリやシリコン側、それからラック関係の会社や銅線ケーブルまで、全部においてより良い交渉ができるんや。コスト効率も良い。やから、NVIDIAと同じことやっても勝てへんのよ。何か他の方法で本当に飛躍せなあかん。5倍は良くならなあかんねん。

ディラン、ポッドキャストへようこそや。呼んでくれてありがとうございます。しばらく前から君を呼ぼうとしてたんやけどな、忙しい人やからな。でもうまくいったわ。

ガスがディランをポッドキャストに呼ぶのがなんでそんなに楽しみやったか、何について話すのが楽しみやったかを紹介してもらいたいねん。

いや、ディラン、君はAIハードウェア業界、AI半導体業界、そして今はもっとデータセンター業界もカバーしてて、本当に素晴らしい仕事をしてると思うわ。今現在を見てみると、地球上で最も価値のある会社はAI半導体会社やろ？今までのAIで最大のIPOはAIクラウド会社やった。これが今起こってることやねん。どんなゴールドラッシュでも、初期にお金を稼ぐのはツルハシやシャベルや荷台を売る奴らや。今がまさにその段階やと思うねん。やから今日君をここに呼べて超嬉しいわ。

ありがとう。好きなトピックについて話せて嬉しいわ。

素晴らしい。まあ、GPT-5から始めようか。先週、研究者のクリスティーナとイザベラを呼んだところやねん。君はそれが期待外れやったって言うてたな。なんで期待外れやったのか、どんな能力を期待してたのか、全体的な反応を教えてくれるか？

GPT-5の実際の性能について

それはどのレベルのユーザーかによると思うねん。例えば、君がGPT-5を使ってて、前に月20ドルか200ドルの購読者やったとしたら、もう4.5にアクセスできへんねん。個人的には4.5は特定のことについてはまだ良い事前訓練モデルやと思うんやけどな。それか、平均30秒考えてくれるo3にもアクセスできなくなってる。GPT-5は考える機能を使っても平均5-10秒しか考えへんからな。これは興味深い現象やわ。

基本的に、GPT-5は必ずしもより多くの計算を使ってるわけやないねん。モデルは少し良くなったけど、バニラベースでは4から5へは実際かなり良くなってる。でも知能の曲線について考えてみると、より多くの計算を使うほどモデルは良くなるってことやろ？それがより大きなモデルでも、GPT-5がそうやないのは見てわかるけど、大体同じサイズやし、もっと考えるってことでも同じや。

でもOpenAIの最初の考えるモデル、最初の数世代のo1やo3は長時間考えて、たくさんのトークンを無駄にしてたんや。例えば、Anthropicの考えるモデルを見ると、考えるモードにしても実際にはもっと少なく考えて、OpenAIと同じかより良い結果を出してるねん。

やからOpenAIはかなり最適化したと思うわ。一番バカらしかったのは、o3に一度「豚肉は赤身肉か白身肉か？」って聞いたら48秒も考えてたことや。何やっとんねん？こんなのすぐに答えを教えたらええやろってな。

ルーター機能と収益化戦略

良いのは、GPT-5は考える機能を手動で選択しても、もっと少なく考えることや。でももっと重要なのは、オート機能、ルーターがあることやねん。これは通常のモデルに回すか、レート制限に引っかかってたらminiに回すか、それとも考える機能に回すかを決めてくれる。どれくらい考えるかもな。でも一般的に、考えるモデルはより少なく考える。

やから、パワーユーザーの平均的なクエリに投入される計算は前より少なくなってるねん。でももっと興味深いのは、OpenAIが君にどれくらいの計算を割り当てるかをコントロールできるようになったってことや。負荷が高い状況やったら、ルーターを少し調整してより少なくするかもしれへんし、まあ何をやってるかは知らんけどな。

今出回ってるミームがあって、これはミームやから本当やないけど、あいつらがやったのは3つのモデルと2つの小さいモデルを取って、前にルーターを置いて、それを実質的により安いブレンド価格で提供してるだけやって話や。少しそういう面もあると思うねん。コストが急に重要になって、それをどうやって操縦するかを見つけ出したんや。

あいつらはインフラ容量を劇的に増やせたって話してたけど、俺は普段o3か4.5を使ってたのに、今はオートを使わされてて、時々o3相当の考えるモデルをくれるけど、時々は普通のベースモデルしかくれへん。それはクソやけどな。

でも無料ユーザーにとっては実際かなり興味深いと思うねん。無料ユーザーは考えるモデルをほとんど全く使えなかったし、多くの場合はただウェブサイトを開いてクエリを聞くだけやった。でも今は時々そこにルーティングされるから、時々すごく良いモデルを使えるけど、時々は必要に応じてOpenAIが優雅に格下げできるねん。

ビジネスモデルの転換点

俺はこのルーターがOpenAIの将来のビジネスを示してると思うねん。モデル会社を見てみると、Anthropicは完全にB2Bに焦点を当ててる。APIコードとかクラウドコードとかな。OpenAIもそのビジネスはあるけど、コーデックスとAPIビジネスは、でも実際は収益の大部分は消費者やねん。消費者の購読や。でもあいつらは無料ユーザーからお金を稼ぐ方法がないねん。

他の消費者アプリでは、無料ユーザーでも広告で金を払ってる。でもこれはAIと互換性がないねん。役立つアシスタントやのに、広告を注入してユーザーの結果を悪くするわけにはいかんし、バナー広告もAIではうまく機能せん。やからどうやって無料ユーザーを収益化するんや？

俺はルーターで、あいつらがそのユーザーをどう収益化するかを見つけるのにかなり近づいてると思うねん。新しいアプリケーションCEOが見てみ、彼女がShopifyで立ち上げた製品を。Shopifyのショッピング用エージェントやったと思うけど、今すぐにピンとくるわけや。ユーザーが「なんで空は青いのか？」みたいな低価値のクエリを聞いたら、miniにルーティングするだけや。モデルは完璧に答えられるし、それはクエリのかなりの部分を占めてるからな。

でももし「近くで最高のDUI弁護士は誰？」って聞かれたら、これは君が監獄におって、一回しかチャンスがない状況で、もうどうでもええからChatGPTに最高のDUI弁護士を聞く感じやろ？今はモデルはそれに対応できへんけど、すぐにでもエリア内の全ての弁護士に連絡して、結果を調べて、法廷記録を検索して、君にとって最高の弁護士を予約できるようになるやろうな。

新しい収益化モデル

もちろんあいつらは手数料を取るやろうな。でもこれは無料ユーザーを収益化するずっと良い方法や。Etsyのトラフィックの10%が今ChatGPTから来てるのに、OpenAIはそこから何も稼いでない。でもまもなく本当に稼ぐようになるわ。Amazonがチャットをブロックしてるってのも一部にはあるけど、ショッピングの決定、フライト予約、商品探しでお金を稼ぐ方法がある。

無料ユーザーでも、どうでもいいねん。最高のモデルに送ったる。エージェントに送ったる。とんでもない量の計算を使ったる。なぜなら、ここからお金を稼げるからや。でも宿題を手伝ってくれみたいなクエリやったら、まあまあのモデルに送るだけや。君にお金を使う必要はないからな。

これがOpenAIがついに無料ユーザーからお金を稼ぐ方法やと思うねん。ルーターの最大の意味はこれやろうな。

これは初めて見る現象やと思うねん。新しいモデルのローンチで、ある程度コストがヘッドラインアイテムになってるのは。これまではいつも誰が最もスマートなモデルを持ってるか、誰が最高のMLUスコアを持ってるかやった。今は突然、コーディングに一日8時間モデルを使う人たちがいて、大きなコンテキストウィンドウと最高のモデルを使うと月に数千ドルのコストになることに驚いてるねん。

やからコストが重要になって、コストとパフォーマンスのパレートフロンティアが新しいベンチマークで、もはやコスト単体ではなく、そういうことが起こってるのか？

確実にそうやと思うわ。OpenAIは多くのユーザーのレート制限を2倍にしたって言うてたし、このローンチから提供してるトークン数を劇的に増やしたって言うてる。これは実質的にこれが経済的なリリースやって言うてるのと同じや。おそらくトークンも全部安くなったってことやろうな。そうやなかったらそうはならんからな。

コーディング市場でのコスト問題

一番面白いのは、このコスト問題はコード業界で見てきたことやねん。Cursorは無制限のクラウドコードを取り下げなあかんかった。最初は超高価なプランがあって無制限レートとか、週単位のレート制限だけやったのに、今は時間単位のレート制限がある。

Twitterで一番クレイジーなスレッドを見たわ。この男が睡眠スケジュールを変えたって言うてたんや。ベイで航海する船員のモデルにしたって。一人で航海してたら眠れへんやろ？安全な場所に着いた時にパワーナップを取って、朝の風があんまりない時でも安全でいられるようにする。でも中断されずには眠れんのや。

Anthropicが週単位やなくて時間単位のレート制限を設けたから、この男は基本的に一日に何回も眠るけど、短時間ずつにして、使用量を最大化してるねん。Redditにはリーダーボードまであって、購読でどれくらいトークンを使ってるかを競争してる。月3万ドル使ってる奴もおる。

インドの開発者を見つけてペアプログラミングして、俺が昼のサイクル、あいつが夜のサイクルで、二人でアカウントのクォータを最大化するつもりや。

利用料金制への移行

それが未来なんかな？でも人々がマイナスの粗利益の購読を利用してるのは明らかやな。Anthropicは俺の購読からはプラスの粗利益を出してると思う。俺はそんなにコードを書かんからな。でも確実に損してる人もたくさんおる。

君が言うたように、これが経済的なもんで、もっともっと使用量ベースの価格設定に押し進めると思うねん。再販してる商品があって、それが商品売上原価の大きな部分を占めてるなら、使用量ベースの価格設定にせなあかん。

これらのコード製品の顧客キャプチャーとステッキネス（粘着性）はどの程度やと思う？一回IDEを使ったり、CLIバイプロダクツの一つを統合したりしたら、どれくらい粘着性があるんや？

それは10億ドルの質問やな。それはかなり控えめな見積もりや。アンドリュー・パーシーがこの素晴らしいスライドを持ってて、基本的に今エージェントシステムを構築してるなら、根本的にはこのループやって言うてる。ループの半分はモデルが考えてることで、何かをしようとしてる。もう半分はユーザーがエージェントが何をしたかを検証して、それが正しいことかを確認して、フィードバックを提供して正しい方向に導こうとすることや。永遠には走らせられんから、最終的には元に戻さなあかん。

UIデザインとユーザーフィードバックの重要性

その半分がモデルプロバイダーで、最高のモデルを構築しようとしてる。もう半分は、ユーザーがフィードバックを与えられる最高のUIをデザインすることやと思う。そこに価値がある。

やからそこにはある程度の粘着性があると思うねん。コード編集を取ると、コードの変更を最も簡単に視覚化するにはどうするか？どのファイルに影響するかを最も簡単に視覚化するにはどうするか？小さい変更に対しては素早いフィードバック、複雑なものに対しては複雑なフィードバックをどうやって得るか。実際に何をするかの図を描いてくれるツールもあるしな。

やからそれが戦いになると思う。そこに粘着性があるねん。どれくらい正確かはわからんけど、良い質問やったな。

そういう意味では、使用量ベースの価格設定に移行する代わりに、人々を囲い込むために購読をするべきやってことか？

顧客が使用量ベースの価格設定を望んでないと思うねん。予測するのが難しすぎるし、逃げ出すのが難しすぎるから。実際に保証が欲しいし、使用量ベースの価格設定を避けるためにかなり高い支出にコミットしてもええと思ってる。使用量ベースの価格設定を望んでるのはモデル会社の方やと思う。

消費者の場合、使用量ベースの価格設定をしないのは率直にかなり難しいと思う。変動があまりにも大きいからな。俺らがコーディングするのと、これを本職でやってる人とでは、使用量に20倍くらいの違いがあるやろ？それはお金がかかるからな。

企業向けなら、もっとフラット料金価格が見られると思う。平均化できるから。一日中それを使ってる開発者がいる。一般的にどれくらい一日にプログラミングしてるかがわかるしな。

バイブクォータはもっと難しいやろうな。

OpenAIへのアドバイス

OpenAIを離れる前に、広い質問を聞きたいねん。もし誰かがここに座ってて「ディラン、OpenAIをもっと価値のあるものにすることなら何でも言うことを聞く。何でもアドバイスをくれ」って言うたら、何て言う？

ChatGPTにクレジットカード情報を入力する方法をすぐにローンチして、エージェント的に何かをしてもらったら何パーセントかの手数料を取ることに同意して、その製品をローンチすることやな。ショッピングをするやつをな。

みんな知ってるように、AnthropicもOpenAIも他の研究所も、Amazon、Shopify、Etsy、それからインターネットでの全ての違うショッピング方法、航空会社のウェブサイトのRL環境を買ってるねん。カレンダーを統合してくれ、木曜日にそこに飛びたい、会議を逃さないようにしてくれ、予約してくれ、みたいな統合を超うまくやってくれ。通路か窓側かの好みも全部知ってて、手数料を取るんや。

ローンチした瞬間からめっちゃお金を稼ぐと思うわ。もう作業してると思うけど、どう考えてるかを聞いてみたいねん。この6ヶ月で広告に対する調子を大きく変えたからな。前は「絶対にダメ」やったのに、今は「ユーザーに害を与えずにやる方法があるかも」って感じや。これが無料ユーザーを収益化する方法やと思う。やからそれを彼に言うか、この辺りの質問をするかやな。

NVIDIAの今後の展望

NVIDIAに話を移したい。NVIDIAは今年すごい年を過ごしてる。約70%上がってるし。これからの可能性のある道筋はどうなってる？どう展開すると思う？

継続的な成長にどれくらい強気かによるけど、君らは良い見晴らしポイントを持ってると思うわ。特にコード会社やけど、他の多くのアプリケーションでも、これらの会社の収益がどれくらい早く成長してるかの良い見晴らしがある。

需要側が加速してるのは明らかに見えると思うねん。それから訓練側を見ると、レースが始まってるねん。MetaはMetaがめちゃくちゃ上げてる。Googleもめっちゃ上げてる。OpenAIとAnthropicだけを見ても、彼らが持ってて今年得られる計算量を見ると、AnthropicはGoogleとAmazonから、OpenAIはMicrosoft、Coreweave、Oracleから、チップの30%がこの2社だけに行ってるねん。

でもそれは実際には「まあ、残りの70%は？」って感じやねん。その3分の1は広告やねん。ByteDance、Meta、その他の広告をやってる会社な。やから残りの3分の1のチップはどこから来てるんや？大部分は経済性のないプロバイダーで、成長し続けて、どんどん大きなラウンドを調達し続けるのは明らかな賭けやないと思う。

だから何が起こるんや？コーディングについて話したけど、Qwen Coder 3モデルは実際にオンプレやクラウドで全てのインファレンスライブラリで動かすと超安いねん。そういうのもあるし、どれくらい成長し続けるかが問題やな。最初の3分の1のOpenAI/Anthropicの研究所支出は確実に急上昇してるし、2番目の3分の1の広告も成長するやろう。狂ったように成長はせんけど、Gen AI広告で大きな変曲点が打たれる可能性は確実にあると思うねん。

Metaはかなり実験してると知ってるし。そこでの取り分率に巨大な変曲点があるかもしれんし、パーソナライズされた広告を見せ始めるんやろうな。広告の人は全員俺みたいに見えて、ちょっと良く見えるから気分が良くなって、「よし買うわ」ってなるねん。

AI開発生産性向上の価値

興味深いのは、これがどうスケールするかは全くわからんけど、どれくらいスケールできるかって質問をすると、ここでどれくらいの価値を作ってるのか、本当に長期間成長し続けるのに十分な価値を作れるのかってことやねん。AI ソフトウェア開発だけを取ると、開発者から約15%の生産性向上を簡単に得られることがわかってる。

いや、それは正しくないと思う。もっと高いやろ。

ストレートな企業、従来の企業、ストレートなGitHub Copilot導入で約15%やで。もっとできるのはわかってるけど。

おい、GitHub Copilotがどれくらいダメか知ってるか？収益ARチャートを見てみろよ。Quad Codeが3ヶ月でそいつらを追い抜いて、Cursorも簡単に追い抜いた。RepletとかWindsurf/Cognitionみたいな会社も追い抜こうとしてる。

まあ、100%まで上げられるとしよう。だから開発者の生産性を倍にできるとする。世界で約3000万人の開発者がいて、開発者1人当たり10万ドルの付加価値とすると、これは世界的には高めかもしれんが、アメリカは低くて世界的には高い。だから3兆ドルや。

コーディングモデルだけで、この1つの使用例だけで、理論的には3兆ドルのGDP価値を追加する技術を構築してることになる。理論的には、それをGPUに投入できる。それが主なものやからな。少なくとも理論的には、成長し続けるための価値生成はそこにある。これが業界にどう反映されるかは、もっと複雑やけどな。

価値創造と価値獲得の問題

AIの価値創造はすでに支出を上回ってると思うねん。あの有名な3000億ドル問題とか2000億ドル問題、今は6000億ドル問題もある。もうすぐ1兆ドル問題も出してくるやろうな。でももちろんそこには現実もあるけど、今日のインフラ支出が1年の収益やなくて5年の収益を考慮してることを無視してる。そして収益はフラットラインやなくてこんな感じで上がってる。

でも主なことは、AIはすでに支出よりも多くの価値を生み出してるってことや。問題は価値獲得が壊れてることや。OpenAIは世界で作った価値の10%も獲得してないと本気で思ってるわ。ChatGPTの使用だけでな。同じことがAnthropic、Cursor、その他にも当てはまると思う。価値獲得が本当に壊れてるねん。

内部的にも、うちの4人の開発者で自動化の面でできたことを考えると、Gemini APIへの支出はめちゃくちゃ低いのに、全てのデータセンターの許可や規制書類をAIで調べて、全てのデータセンターの衛星写真を撮って、データセットにラベルを付けて、人々が使ってる発電機や冷却塔、建設進捗、変電所を認識してる。

これは全部自動化されてて、GenAIがあるからこそ可能やねん。でも少ない開発者でやってて、このデータを売ったりコンサルティングしたりして生み出せる価値獲得は超高いのに、それを作ってる会社は何も得てない。創造をはるかに超える価値獲得の課題があるねん。GPT-5やオープンソースモデルがどんどん価格を下げ続けるにつれて、これらの会社の価値獲得はどんどん難しくなってる。インファレンスで50%の粗利益かそれ以下しか稼いでないからな。

つまり、商品化されてて価値を獲得できないから、GPUにどれくらい支出できるかの期待を抑制すべきやってことか？

いや、まだ価値獲得を大きく変曲させる方法はあると思うねん。さっき言った広告が、大規模な増加を見る前に起こる必要がある巨大な価値獲得や。

他にも、まだ使われてない資本がたくさんあるねん。ハイパースケーラーは来年も今年の20-30%のcapexを成長させられる。それに加えて、CoreweaveやOracleみたいな会社は資本市場を活用してるから、20-30%のcapexよりもずっと多く調達できる。

リストをもっと下げていくと、世界最大のインフラファンドであるBrookfieldやBlackstoneがある。実際にAIインフラにもっと投資することに目を向けてる。それから世界のソブリン・ウェルス・ファンド、G42とかノルウェーのとかシンガポールのGICとか、これらはAIにほとんど手をつけ始めてない。やから初日から必ずしも経済的に動機づけられてるわけやないけど、もっと多くのcapexが来る可能性があるねん。

経済的に動機づけられたcapexはそれほど成長できないと言ってるんやけど、他にもたくさんあるねん。スプレッドシートを持ってて、実際のビジネスに基づいて、本当にこれだけ支出すべきかが明確やないような資本や。でも人々は信じてるから支出するねん。インフラから利益を得られるって俺も信じてるし、君も信じてるし、人々は信じてるけど、それを論証する100%確実な方法はないねん。

カスタムシリコンによるNVIDIAへの脅威

NVIDIAはカスタムシリコンにどれくらい脅かされてるか？

それが最大の脅威やと思うねん。GoogleやAmazon、特にMetaからの注文を見ると、彼らのカスタムシリコン、Microsoftのカスタムシリコンはかなりダメやけど、他の3つは去年から注文を大幅に増やしてるねん。AmazonはTrainiumを数百万個作ってるし、GoogleはTPUを数百万個作ってる。TPUは明らかに100%活用されてるし、Trainiumはまだそこまでやないけど、AmazonとAnthropicが使い方を見つけ出すと思う。

やからNVIDIAにとって最大の脅威は、人々がカスタムシリコンをもっと幅広く使う方法を見つけ出すことやと思うねん。これがAIが集中したらカスタムシリコンが良くなるって話になる。OpenAIのシリコンチームとかの話はまだしてないけどな。AIが本当に集中したら、カスタムシリコンが良くなる。でも中国からのオープンソースモデルとか、NVIDIAや中国からのオープンソースソフトウェアライブラリがあって、デプロイメントコストが底値になったら分散する可能性もあるねん。

GoogleのTPUがNVIDIAと競争できるなら、理論的にはオープン市場でそれをやれるはずや。Googleはこの頃NVIDIAより価値があるんやから、理論的には全員にチップを売り始めたら、より高い時価総額を達成できるはずやろ？

絶対にそう思うわ。Googleは内部でもそれを議論してると思う。文化の大きな再編と、Google Cloud、TPUチーム、Jackソフトウェアチーム、XLAソフトウェアチームの働き方の大きな再編が必要やと思うけど、絶対にできると思う。TPUを外部に売るために、レンタルだけやなくて、物理的に、自分たちをかなりハードに揺さぶる必要があるやろうけどな。

理論的にサイドホビーが君の全ビジネスよりも高い企業価値の可能性を持ってるって面白いな。特に検索ビジネスの劣化を考えるとな。

でもSergeyに「チップやラックを売ることとクラウドやGeminiのどっちがより価値があると思う？」って聞いたら、「いやいやいや、Geminiの方がずっとずっと価値がある。今日はまだやないけど」って言うと思うねん。

今日はNVIDIAが最も価値のある会社やけど、これも集中の話やねん。世界が顧客の面で超集中してたら、NVIDIAは世界で最も価値のある会社やなくなるやろ？でももっと分散して、これらのオープンソースモデルがどんどん良くなって、デプロイが簡単になったら、NVIDIAは長期間世界で最も価値のある会社のままやと主張できると思うねん。

歴史的に、ソフトウェアがほとんどの市場で世界を食べてきたやろ？初期のネットワーキング時代、Ciscoが一時期地球上で最も価値のある会社やったけど、もうそうやない。GoogleやAmazon、Metaみたいに上にサービスを構築した奴らが最終的に追い越したからな。

だからNVIDIAはこれらのソフトウェアライブラリを全部作ってるねん。インファレンスを商品化しようとしてる。君らはピュアAPIプロバイダー投資はないよな？

インファレンス市場の商品化

うちにはいろんなモデルプロバイダーがあるけど、ピュアAPIプロバイダー投資について話してるんや。TogetherやFireworksみたいなのに投資してない理由についてチームメンバー、たぶんRajkoか誰かに聞いたことがあるねん。論理は、モデルを作らずに提供するだけでは商品化されるってことやった。

Stable Diffusion エコシステムのFalみたいなのはちょっと違うダイナミクスやと思う。LMの連中よりももっと複合モデルを作る傾向があるねん。ちょっと違うねん。

Base 10やその他のAPI投資がないのは、NVIDIAが作ってるソフトウェアのせいで商品化されると思ってるからか？VLMやSDGlangみたいなBerkeleyから出てるオープンソースソフトウェアで、今は独自の環境があって多くにサポートされてる。これが商品化されるってことは、APIプロバイダーは必ずしもそれほど価値がないってことやろ？

シリコンスタートアップの挑戦

話題を変えて、シリコンスタートアップについてはどう思う？そこにはたくさんの資本が流れ込んでるねん。数値は持ってないけど、おそらく数十億ドルがチップスタートアップに投資されてるやろ？

確実にそうやな。EtchedやRevosみたいな会社、それからMaddxやその他の会社が、チップをローンチする前にこれだけの資金調達をしたのは印象的やと思うねん。過去には、シリコン会社はお金を稼いだり資金調達したりしてたけど、少なくとも大きなラウンドを得る前にはチップをローンチしてた。でもEtchedやRevosは公にチップをローンチしたことがないのに、たくさんの資金を調達してる。

アクセラレーターを作ってる場合は特に、シリコンは超資本集約的やからな。動く部分がたくさんあるアクセラレーターにはな。この数年で新しいAIアクセラレーター会社が10社くらいあるねん。もっとあると思うけど。

それから古い衛兵も資金調達を続けてる。GroqやCerebras、Graphcore、Tenstorrentとかな。GraphcoreはSoftBankに買収されて、SoftBankもこの取り組みにお金を投入してるし。NVIDIAのトップポジションを打破するためにたくさんの資本が投資されてるねん。

でもNVIDIAを倒すのは困難になる。ハイパースケーラーは幸運やと思うねん。大体NVIDIAと同じことができるからな。自分たちが専属顧客やし、サプライチェーンで勝てるねん。より安いプロバイダーを使うから。基本的にはマージン圧縮の実行やねん。

Metaのレコメンデーションシステムみたいな特定のワークロードでは、もっと特化できるかもしれん。でも大部分は、同じワークロードをターゲットにしてるねん。サプライチェーンを簡素化したり、多くを内製化してマージンを圧縮すれば大丈夫やねん。

でも他の会社の場合は、専属顧客がないから、同じエコシステムを使う必要がある。カスタムシリコンプロバイダーを使うか、それでも上にマージンを取られるから、販売価格が圧縮される。または全てを内製化しようとするけど、それは本当に難しいねん。ソフトウェア設計、シリコン設計、異なるIPの構築、チップ、ラック、全てのサプライチェーンの痛みを管理する必要がある。チームサイズの面で巨大な努力になる。

最終的に、NVIDIAのように75%の粗利益を出すのに対して、AMDはGPUを50%の粗利益で売ってて、NVIDIAより優れたエンジニアリングをするのに苦労してる。AMDはエンジニアリングが得意やのに、それでも同じパフォーマンスを達成するのにより多くのシリコンエリア、より多くのメモリが必要で、より安く売らなあかん。やからマージンが圧縮される。

破壊的技術の必要性

でも歴史的に見ると、市場の新規参入者は既存のものを僅かに改良して勝つことは稀やった。より可能性が高いのは、破壊的技術の飛躍で勝つことやった。異なるアプローチ、異なる技術を持つことや。それはここで可能か？

ある程度はそうやと思う。少し単純化してるかもしれんけど、Transformerモデルが勝った理由の一部は、GPUで信じられないほどうまく動くからやと思うねん。リカレントニューラルネットワークも同様にパフォーマンスが良さそうやけど、GPUでは恐ろしく動く。やから我々はハードウェアに合わせてモデルを選んだんかもしれん。今はハードウェアソフトウェア共同設計が困難になってるねん。

ニューロモーフィックコンピューティングについてたくさん誇大宣伝があるねん。理論的には素晴らしくて超効率的や。でもハードウェアのエコシステムもソフトウェアのエコシステムもない。価値があるかどうかを証明するだけでも、今日AIで最高の数万人がそれに集中する必要があるねん。ハードウェア側、ソフトウェア側、モデル側でな。

GroceryやSamanovaを見ると、みんなチップを設計した時に主流やったモデルに過度にインデックスしたねん。特定のトレードオフをした。チップ上により多くのメモリを載せて、NVIDIAは「そんなことはしない、より速くする」って言ったけど、実際にはNVIDIAのチップ上のSRAMの量ははるかに少ない。

彼らはDRAMの代わりにSRAMに行ったけど、普通はDRAMが少ない。やからそこでもトレードオフがある。チップ上により多くのSRAMがあるから、チップ上の計算は少なくなる。結果的に負けたねん。モデルサイズが大きくなりすぎたからな。

やから、実際により良いものに賭けたのに奇妙なダイナミクスがあるねん。CerebrasやGroq、Dojoは特定のタイプのモデルをNVIDIAのチップよりもずっとうまく動かすやろう。ビジョンタスクでもうVision Transformerを使ってるから最適化されてたものでも、モデルサイズが成長して全部変わったから、結局キャッチ22になってしまった。

現在のAIアクセラレーター設計の課題

今の新世代のAIアクセラレーター会社は「よし、Transformerに最適化しよう」って言ってるねん。でも設計を始めた時は「TransformerはこのサイズのdenseモデルやHidden dimensionが8Kで、バッチサイズがこれで、シーケンス長がこれや。やから最大効率を作るために超大きなsystolic arrayを作ろう」って考えた。

ところが、DeepSeekや研究所がやってることを見ると、実際には形状がもっと小さいねん。実際には1層あたり巨大で単一の行列乗算やなくて、たくさんの小さな行列乗算が必要やねん。そうするとその用に設計してるチップは実際にはそれに対してそんなに効果的やないねん。

ソフトウェアは、NVIDIAで最もうまく動くもののために常に進化してるから、DeepSeekやAlibaba、研究所が内部でやってることでな。Googleでもそれが見られる。オープンソースのGemmaモデルは、TPUの形状がGPUと違うから異なる決定をする。GPUとTPUは実際にはそんなに離れてないねん。違うって言うけど、BlackwellとTPUは実際に似たような設計に収束してる。

でもNVIDIAを倒すには、このサプライチェーンでの勝利だけでは足りんねん。専属顧客もないし。やから5倍の優位性を何かで達成する必要がある。ワークロードがシフトしないことを祈りながらな。NVIDIAも世代ごとにアーキテクチャを最適化してるから、既存のモデルに対してチップをずっと良くするものを追加してる。でも彼らは毎年、2年ごとに何かに向かって大きなステップを踏んでるのに対して、君は左の野原の向こうに行って、モデルがそこに留まることを望まなあかん。

NVIDIAの優位性

5倍良くならなあかんのは、NVIDIAがサプライチェーン効率で勝つからやねん。新しいプロセスノードや新しいメモリ、どんな技術でも市場投入時期で勝つやろうし、AMDでさえNVIDIAより先に2ナノメートルに到達して、より高密度のHBM、3Dスタッキング、全部サプライチェーンでNVIDIAより良いはずやのに、まだ負けてるねん。

ソフトウェアの角度もあるしな。でもNVIDIAはより良いネットワーキング、より良いHBM、より良いプロセスノード、より早い市場投入、より早いランプアップ、TSMCやSKハイニックス、メモリとシリコン側、ラック関係やコッパーケーブル、全てとのより良い交渉ができる。より良いコスト効率を持つやろう。やから5倍良くならなあかん。

でも公平に言うと、僅かでもコスト競争力のある実用的な競合他社がいたら、GPUの大口消費者の多くはすぐにそこに収益の一部をシフトするやろうな。2番手を持つためだけにでも。

それが今日のAMDやろ？MetaとMicrosoftは買い続けてるけど、それでも限定的な牽引力やねん。MetaはAMDから買い続けてるし、Microsoftも一時期買ってたけど、止めた。AMDがこれらの優位性を全部くれるって言っても、結局パフォーマンス・パー・ワットベースでは良くないし、大きなソフトウェアチームも持ってる。俺が言ったダイナミクス全部でややり競争力があるねん。やからNVIDIAと同じことをしてより良くやろうとするだけでは無理やねん。本当に他の方法で飛躍する必要がある。

でも設計サイクルが長いから、モデルがシフトするねん。「次世代のTPUとGPUはどんな感じ？よし、それに最適化しよう」って考えてる。研究パスは「ニューロモーフィックコンピューティングが最適かもしれんけど、誰もそれに取り組んでない。技術ツリーを選んだから、前進しなあかん。技術ツリーを再起動したら最悪やろ」ってことやねん。

やからこっちに分岐して、君があそこにいたら終わりやねん。5倍良くならなあかんから。サプライチェーンの件で5倍が実際は2.5倍になって、NVIDIAが本当に競争力があったらマージンを少し圧縮できるから、2.5倍が50%良いだけになって、そうすると全然足りなくなるねん。

中国の電力とAI戦略

やからソフトウェアの件も含めて、最終的には5倍を50%良いだけにしてしまうから、あまりにも困難になってしまうねん。

国防サプライチェーンも確実にそうやな。Lutnikは「レアアース鉱物でもこれをやらなあかんかった」って言ったし、興味深いな。

中国では、H20は展開するには効率が足りないって規則がある省もあるねん。これは超奇妙やな。明らかに中国が持ってる最高のAIチップやのに。Huaweiはまだちょっと遅れてるしな。

興味深いのは、効率が中国ではここほど問題やないってことやねん。パワーインフラがあるから、あまり強力やないチップを動かしても、無限の電力供給があるから、あんまり問題やないって想像できるやろ？

これはアメリカでは大きな課題やねん。Jensenが「アメリカでH20をタダでもあげられへん」って言い続けてるけど、実際に会社が「電力がこれだけしかないのに、H20を買ったら実際に計算容量が減る。タダでもアカンわ。意味ないもん」って言うのを聞いたことがあるねん。中国は気にせん。これらを構築できる筋肉があるからな。

これが全部どうなるか興味深いわ。中国はかなり強く姿勢を示してて、「H20にバックドアがあるかどうか調査してる」みたいなことまで言ったねん。H20にバックドアなんかないわ。GPUは普通インターネットから遮断されてるし、GPUクラスターに到達する前にいろいろ通るからな。バックドアがあっても関係ないねん。

面白いことになると思うわ。中国は決心したらAIにずっとずっと多くの電力を展開できるからな。でも競合する利益があるねん。HuaweiをNVIDIAより良くしたいからな。

これがNVIDIAが政権に論じた方法やねん。例えばTritonという一般的なMLライブラリ内で、ByteDanceが超素晴らしいものをプラグインするためにオープンソース化したものがあるし、中国企業がオープンソース化するNvidia用ソフトウェアライブラリが他にもたくさんある。ある意味、NVIDIAがGPUを売ることで、NVIDIAの議論では、Huaweiがソフトウェアエコシステムを構築するのを止められて、西側のエコシステムの方が良いってことやった。

でも反対側では、モデルがハードウェアよりも社会により多くの経済価値をもたらすと信じるなら、これは実際にそうやと思うけど、今日の価値獲得の問題があるだけで、中国にH20を与えて、まもなくトランプが言ったようにBlackwellの削減版を与えることで、もっと多くを与えることになる。チップを売ることから得られる経済価値は、AIサービスを何らかの方法で売ることよりも大きくないねん。

中国の資本制約

中国はAI用の電力を制限してるんか？

そうやないと思うわ。H20が中国に販売されて、将来のH20eや他のチップバージョンがあっても、中国企業のAlibaba は、中国外でGPUをレンタルしてるのを見るねん。中国外で手に入るGPUの方がドル支出パフォーマンスベースでずっと良いからや。レンタルするか、シンガポール企業を通してデータセンターを建設してチップを入れるかしてる。実質的に中国企業やけどな。

やから中国が電力を制限してるわけやないと思う。来年、中国企業は米企業よりもパーセンテージベースでcapexをもっと成長させてるねん。絶対的なドル数では、明らかに米企業がまだAIにもっと支出してるけど、パーセンテージベースでは中国企業の方が来年もっと成長してる。それでもAI出力のドル支出、トークンや何かの問題は残ってる。このチップが悪いから低くなるねん。

やから電力が制限要因やないねん。少なくとも今日は資本やろうな。中国は望めばもっと多くの資本を支出できるねん。半導体業界に年間1500-2000億ドルを国有企業、収益を生み出さないcapexなどを通じて補助金を出してるからな。

やからAIエコシステムにこれをできないわけやない。Metaのcapexは約600億ドル、Googleのcapexは約800億ドルやからな。単一の取り組みにそれよりもずっと多く支出することは絶対にできるねん。ただ、そうしないことに決めただけや。

アメリカの場合、建設は電力に制約されてる。Googleは電力供給されてデータセンターの準備ができるのを待ってるTPUをたくさん持ってるし、MetaもGPUで同じや。Metaが今基本的にテントを建ててることについて投稿したやろ？

これはある程度、より広いエコシステムに売りたがらないことにも関連してるんやないか？自分たちのデータセンターに限定されることを望んで、自分たちのハイパースケール用途のためにハイパーデータセンター建設を十分に早くやらなかったなら、それが制約になるやろ？オープン市場にあったら、まだ制約されるんか？

そうやな。Coreweaveみたいな会社、なんでCoreweaveが価値があるかって、本当に早くインフラを構築するからやねん。ソフトウェアも良いと思うけど、顧客の多くはベアメタルやねん。GPUが壊れた時に交換して、積極的にネットワーク化して、どこでも行くねん。Jensenも彼らを気に入ってるしな。

彼らはエコシステムを非集中化するから行くねん。それはNVIDIAにとって良いことや。Intelで働いてたから、彼の頭の中を正確に知ってるわ。

やから重要なのは、Coreweaveは気にしないってことやねん。「暗号データセンター？AIデータセンターに変換したる」って感じや。数年前20億ドルの価値やった暗号マイニング会社を100億ドルで買った。Bitcoinマイニングビジネスが成長してるからやない。電力のあるデータセンターを持ってるからや。どこでもかんでも、人々は電力のあるデータセンターを建設しようとしてる。

CoreweaveやOracleみたいな会社もそれに向かってる。実際に今日、GoogleはTerawolfという暗号マイニング会社の8%を買ったばかりやねん。暗号マイニングに参入するためやない。データが欲しいからや。

電力が欲しいからやねん。全てのハイパースケーラーは持続可能性の誓約をクソくらえって言ってるねん。できるだけ早く電力が必要やからな。船を動かすのに少し時間がかかるけど、自分で建設したデータセンターでやらなくても、オープン市場にはまだたくさんの課題がある。

不足があるねん。それがアメリカのチップ建設を大きく制約してる。他の人、CoreweaveやOracleは少し早くできるかもしれんけど、それでも米国の建設を大きく制約してるねん。資本はすでに支出されてる。チップはクラスターコストの60-80%やからな。チップによるけど。やからもうチップは買ってる。データセンターの準備ができてないから置く場所がないだけやねん。

Google、Microsoft、Meta、多くの人に当てはまるねん。アメリカでインフラを建設するのは本当に難しいからな。電力網の相互接続、送電、変電所、この全部や。電気業者、電気技師、テキサスで移動電気技師になる気があるなら、石油給与みたいなもんやねん。昔は体力があったら西テキサスで10万ドル稼げたけど、誰がそんなことしたいねん？

今はダラスから200マイル離れててもまだ合理的な町で、データセンター建設や配線、送電関係で働けば、数年前の2倍の給与がもらえるねん。

労働力不足と資本規模

この労働問題も課題やし、中国にはこれらの問題がないと思うけど、まだ資本を支出してないだけやねん。でも資本も支出の規模のせいで問題やねん。NVIDIAの今年の収益は2000億ドル以上になるし、来年は3000億ドル以上を期待してる。GoogleはTPUデータセンターに500億ドル支出するし、AmazonはTrainiumデータセンターにたくさん支出する。

ドルの規模は国家レベルのものに急速に成長してるねん。もっと重要なのは、ドルを支出することを決定できて、何がコスト効率的かってことや。ある程度、中国はまだそれに制約されてるけど、チップを密輸できるし、中国外でデータセンターを建設できるし、中国外でデータセンターをレンタルして、最もコスト効率的なBlackwellチップやその他を持てるねん。

ByteDanceが理由があってGoogle Cloudの最大か2番目の顧客やねん。たくさんのBlackwellを彼らから得てるし、OracleやMicrosoft、他の会社も中国にたくさんのチップをレンタルしてるねん。自分で建設するよりもコスト効率的やからな。やから中国に「自分たちだけで建設しなあかん」って考えはないねん。政府はそうやけど、インフラ会社は違う。Alibaba、Tencent、ByteDanceなどはな。

データセンターの最終形態

データセンターの最終ゲームは何や？もっと電力、もっと冷却が必要やろ？最終的には全てのデータが原子炉の隣か、たくさんのソーラーパネルの隣か、冷却に使う深海水の隣に置かれることになるんか？

データセンターの物理的冷却は、AIがそんなに電力を使うって話があるけど、実際にはそうでもないねん。農業のアルファルファは、今世紀末までにAIデータセンターの100倍の水を使う。アルファルファの価値はほとんどないのにな。やから冷却はそんなに重要やないねん。

海中データセンターで冷却コストを下げる実験をしてる人もいるけど、意味ない。5-10%の節約やけど、海から水を取り出して、データセンターを海中に置いたら、サービスしたくなったら終わりやろ？

電力も同じや。電力が実際にはそんなに高くないって話をよくするねん。構築するのが難しいだけや。適切な場所に到達して、適切なスペースに到達して、チップが必要とする電圧に変換したりするのがな。やから電力の量やなくて、どこにあるか、どう動かすかやねん。

量もやろ？世界全体のエネルギー消費量の点では、AIデータは今世紀末でもパーセントの端数や。アメリカでは電力の10%がデータセンターになるけど、それでもエネルギーの面ではさらに小さな端数やねん。電気自動車への移行も考えたら、建設できる全てのAIデータセンターよりも大きな影響を与えられるやろうしな。

ヨーロッパではその数字はそんなに早く上がってないし、他の国でもな。もっと電力を建設する必要があるのは確かやけど、何かとんでもなくクレイジーな量やないねん。適切にやることが難しいだけや。

電力のコストも、これらの大規模購入で人々が署名してる取引を見ると、キロワット時数セントから10セントくらいに価格が急上昇してるけど、クラスターの完全なTCOを考えると、GPU コスト、ネットワーキング、全部が電力と冷却をはるかに上回るねん。

GPUデータセンター、Blackwellを建設する場合の電力の割合は？4年償却のGPUデータセンターなら、コストの80%は資本やねん。GPU購入、ネットワーキング、物理的データセンター、電力変換機器、この全部や。

20%が土地、電力、冷却、冷却塔、バックアップ電源、発電機、この全部やねん。大したことないねん。やからそこで10%や50%多く支出しても、最終的には高価なものが、この部分やから関係ないねん。

だからElonがやったことが馬鹿に見える理由や。データセンター外の発電機や液体冷却用の移動チラーにもっとお金を使って、よりコスト効率的なオプションの代わりにしたけど、データセンターを3ヶ月早く稼働させたからな。やからその3ヶ月の追加訓練時間は、TCOベースでずっとずっと価値があるねん。チップから得たパフォーマンス、市場投入時期、全部がずっとずっと早かったからな。

データセンターのこの部分のコストが膨らんでも、他の全部はまだそこにあるし、チップ代もまだ払ってる。アイドル状態やったら価値がないからな。

グリッドをバイパス、相互接続に関わる全て、公共事業に関わる全てをバイパスすることでな。

Intelの現状と将来

Intelについてはどう思う？Intelはどこに向かってる？

世界にはIntelが必要やと思うわ。アメリカにはIntelが必要やな。SamsungはIntelよりも悪い状況にあると思う。最先端プロセス開発でな。業界の様々な顧客がIntelとSamsungでテストチップをやった結果に基づくと、業界は一般的にIntelの方がSamsungより2ナノメートルクラスのプロセス技術で進んでるって合意してると思うねん。でも両方ともTSMCからは遥かに遅れてる。

TSMCはある程度独占やねん。ナンバーワンの質問はいつも「TSMCはなんでもっとお金を稼いでないのか？なんで来年3-10%しか価格を上げないのか？」ってことや。TSMCは独占やねん。もっと上げられるのに、汚いアメリカの資本家やなくて良い台湾人やからな。

TSMCがアメリカ人に所有されてたり管理されてたりしたら、所有の大部分は実際にはアメリカやと思うけど、株式市場的にはニューヨーク証券取引所とかにあるし、価格をもっと上げてたと思うわ。

やから先端半導体を全部コントロールしてる島が一つあるってことで、難しいことがあるねん。先端だけやなくて、後端生産の大部分もな。何かしなあかん。Intelは遅れてるけど、めちゃくちゃ遅れてるわけやない。台湾に何かあったら、Intelが世界で最も先進的な技術を持つことになるねん。経済的やないだけや。

Intelの分割問題

Intelを競争力のある一つの会社として維持できるか？

会社を分割するプロセスに必要な経営時間と経営努力を考えると、それまでに破産してしまうと思うねん。それが大きな課題やねん。Intelは分離すべきやと思うけど、会社を適切に分割して、必要な管理時間を全部使うのはめちゃくちゃやねん。代わりに、IntelのCEOのLip Butanが必要やねん。彼は史上最高の半導体投資家の一人やねん。最初にいろんな会社に投資してきたからな。

中国のTSMCのSMICとか、中国の最大のツール会社の最初の投資家で、多極世界でそこで良い投資をしてたからな。今はそれで人々が怒ってるけど、違うねん。彼は会社を認識してる。サプライチェーンを理解してる。会社を分割することに時間を使う必要がないねん。会社を実際に修正しないからな。

Intelの問題は、設計から製品出荷まで5-6年かかることやねん。場合によってはもっと。チップをテープアウトして、設計をファブに送って、ファブがチップを持ち帰って、14回のリビジョンを通ることもある。業界の他の部分が良ければ1-3回のリビジョンを通すのに対してな。設計を送って、チップを持ち帰って、テストして、設計を送って、公開ローンチのためにな。3年でチップをローンチするねん。

でも今日のIntelを見ると、AI側でまだ競争力のあるエントリーがないねん。

CPUビジネスの持続可能性

でも彼らの製品にとって何を意味するんや？CPUではまだ素晴らしい仕事をしてる。良いAIチップ製品がない。長期的に持続可能なポジショニングなんか？単体のチップ会社として？

IBMはまだメインフレームで毎回ローンチでもっとお金を稼いでるねん。やからx86が死んでるわけやない。成長率は得られないけど、とても利益の出るエンタープライズとして運営できるねん。PCも同じやと思う。多少の混乱、ARMの参入、AMDの競争があるけど、3分の1の人か半分の人で作業すれば、とても利益の出るビジネスになり得ると思うねん。

やからLip Butanが Intelを修正するには、設計会社とファブの両方に入って、めちゃくちゃたくさんの人をレイオフするけど、良い人は全員残して、早く設計して、設計構想からローンチまで5-6年やなくて2-3年でローンチすることを確実にする必要がある。設計側でそれを収益性のあるものにする必要がある。

ファブでも同じことをする必要がある。Intelのファブ自動化の責任者の一人がいる。会社に実際に良い元Intel人が何人かいるから、Lip Butanに明確に言ったねん。ファブ側で働いてた彼らが「最悪の人は誰？」って聞かれて、「あいつはダメ」って答えた。

Lip Butanに明確に言った。彼は4層下の人で、その男と話したことがなかった。会社にはめちゃくちゃな階層があるねん。4層下やったから、彼が行ってその男と話して、彼は去ったねん。誰が悪いかを見つけ出すねん。

誰が良いかもな。20年間世界の生産とプロセス技術をリードしたのはIntelのチームの大部分やけど、蓄積されたクソもたくさんある。やから彼はそれを見つけ出さなあかん。分割のための構造化に時間を無駄にできへんねん。会社が分割される方が良いと思うけど、彼がその時間を使うことはできないと思うねん。

設計側の会社では、AIに本格的に参入することはないし、そこでお金を稼ぐ必要がある。でもファブは、本当に競争相手になれると思うけど、何かが起こるまでに破産するやろう。やから資本を得る方法を見つけ出さなあかん。資本を得る方法を見つけ出さなあかん。全てのクソを片付ける方法を見つけ出さなあかん。歩留まりを上げて、製品をずっと早く出荷するように。これらは全部基本的に、目標は完全に正しいと思うねん。

企業文化の課題

大きな課題は、俺がそこにいた時を振り返ると、Intelを見ると、基本的にチップ設計を作るソフトウェアと、コア製造部分があって、3つの非常に異なる文化があって、一つの傘の下で全てを得るのは非常に難しいってことやと思うねん。それが大きな課題やと思う。会社を別々に運営すべきやと思うけど、これらを全部切り離すのは非常に長時間かかるから、物理的に分離することはできへん。

時間がないからやねん。Intelは大きな現金注入をしないか、会社の半分をレイオフしないと、文字通り破産するねん。会社の30%をレイオフする必要があるって議論もできるけど、それが起こったら悪いことがたくさん起こるし、それでも次世代ファブを建設するのにもっとお金を使う必要がある。ファブを修正しても、そのためのお金がないねん。

やから会社を物理的に分離することよりももっと重要な問題がたくさんあるねん。長期的には、ファブはチップ設計ソフトウェア、チップ設計会社から分離する必要があると思う。それぞれの会社がもっと責任を持てるようになって、顧客により良いサービスができるからな。ただ、それは時間がかかりすぎて、それまでに破産してしまうねん。

素晴らしい。でも何かをする人がいることを願ってる。大きな資本注入を得るとか。ハイパースケーラーが「待てよ。TSMCが独占のせいで最終的にマージンを75%まで成長させて、コパッケージ光学、電力供給、全部を取り込んだら、コストが急上昇する。やからIntelにそれぞれ50億ドル投げた方がええやろ？もうどうでもええわ」って筋肉をつけられることを望んでるねん。

それがIntelに潜在的に何かに到達して、競争力を持つのに十分なライフラインを与えることができるねん。それが希望やねん。

業界リーダーへのアドバイス

最初にSam Altmanに始めたゲームを終わらせよう。もしJensenがここにいたら、彼にどんなアドバイスをする？

Jensenがここにいたらか？彼は巨大なバランスシートを持ってるねん。キャッシュフリーキャッシュフローがめちゃくちゃやからな。減税、新しいトランプの税制法案で、本当に信じられないものを制定した。GPU クラスターコストを全部1年目で償却できるねん。

Metaなどの主要ハイパースケーラーへの税務への影響について、年間100億ドルとか巨大な影響があるってノートを出したねん。NVIDIAは数百億ドルの税金を支払うことになる。何らかの方法でインフラゲームに参入したらどうや？

これは明らかにクレイジーになるやろうな。自分のGPUを買ってデータセンターに置いて、自分の顧客と競争することになるからな。でもすでにそれをやってるねん。顧客がチップを作ろうとしてるからな。

でも投資でデータセンターエコシステムを加速すべきやねん。来年の収益で何をするか、非常に高い精度で予測できると思うからな。建設されてるデータセンターワット数だけやからな。今はTPU対GPUがどれくらいかで少しシェアの違いがあるけど、インフラを加速しなあかんし、蓄積してる資本を使う必要がある。

自社株買いや配当みたいなルートに行きたいか？だったら負け犬やねん。チップだけやなく、エコシステムやサーバーをエコシステムに、でも実際にインフラを何らかの方法で端から端までコントロールすることに再投資して、より大きな会社を作ることでもっとお金を稼げるねん。

やからこの巨大な軍資金で何かできることがあると思うねん。NVIDIAは自社株買いと増配をやったけど、バランスシートの現金は増え続けて、今年末までに1000億ドル以上の現金をバランスシートに持つことになると思うねん。

それで何をするつもりや？彼が本当に世界の王になりたいなら、インフラレイヤーにもっと移行することができると思うねん。俺は彼がそうしたいと思ってるねん。

GoogleとMetaへの提案

SergeyとSundarには？

TPUでKomodoを開放すべきやと思うねん。売り始める。ソフトウェアを開放して、XLAソフトウェアをもっとオープンソース化する。Open XLAとXLAがあるけど、大部分はクローズドソースやからな。本当にKomodoを開放して、もっと積極的になるねん。

データセンターではまだそんなに積極的やないし、会社の多くの要素でもそんなに積極的やない。TPUチームの次世代設計はそんなに積極的やないねん。部分的にはTPUチームの最良の人材の多くがOpenAIに行ったからやねん。実際にめちゃくちゃ迷惑やった。知ってた4-5人が全員OpenAIに行って、今はそんなに情報が入らんねん。他の人とも知り合ったけどな。

彼らは会社全体で多くの方法でもっと積極的になれると思うねん。必要ないけど、できるねん。AIは、ChatGPTは検索クエリ、特に収益化可能なものが購入エージェントに移行することで、長期的に本当にGoogleを台無しにするやろう。彼らが態勢を立て直さなかったらな。

DeepMindでは態勢を立て直したと思う。まだいくつかの非効率性があるけど、SergeyはDeepMind内で多く働いてて、ハードに推進してる。まだちょっと遅れてるけど、物理インフラ、TPU、どれくらいお金を稼げるか、TPUを外部に売り始めたら他の全員の売上をどれくらい削げるかを考えると、データセンターをもっと早く建設するように再編して、世界で最も多くの計算を持てるようにすべきやと思うねん。持ってたけど、今は今後数年で彼らを超える可能性のある特定の会社があるねん。態勢を本当に立て直さなかったらな。

やからそれが彼らに言うことやねん。それと、製品出荷をもっとうまくやることを学ぶことやな。

Zuckには？

Zuckは、超知能で何が起こるかはまだわからんけど、データセンターで超早く動こうとしてると思うねん。物理的なデータセンターやなくてテントを建てるねん。どうせ5年しか必要ないからな。

超知能の動きは何でも言えるけど、30億ドルでThinkyを買おうとしたり、30億ドルでSSIを買おうとしたりしたけどうまくいかなかったから、これらの人を全部雇うのに300億ドルも使ってないねん。やから彼はモデル、インフラの緊急性を認識してると思うねん。

彼はビジョンを見てると思うねん。AIについてのウェブサイト投稿を読んだら、ウェアラブル、AIをそれに統合すること、全ての購入などをするAIアシスタントになることがある。ビジョンは見えてると思うけど、実際にそれをもっと早くリリースすることに集中する必要もあると思うねん。

でもコアIP外で立ち上げる製品は、立ち上げるたびにちょっと中途半端やねん。Meta Reality Labsはうまくやってるけど、もっと明確にすべきやと思うねん。ChatGPT競合、Claude Code競合を持って、もっと多くの製品をリリースし始める。彼らは個々の庭園に本当に集中してるだけで、そこから分岐してないからな。

AppleとMicrosoftの課題

Tim Cookがここにいたら何て言う？Appleは同じ緊急性を持つべきか？

面白いのは、最高のAI人材の一部が今super intelligenceにいることやねん。AIアクセラレーターを建設してる。AIモデルを持ってるけど、ずっと遅いねん。最後の決算説明会で、これにもっと資本を配分するって言ったけど、Apple、インフラに500億ドル使わなかったら船を逃すぞって感じやねん。

今のSiriでは十分やないと思うか？

もっともっと、人々がAppleの囲い込まれた庭園を持ってるのはええけど、それを守るためにできることには限界があるやろうって見るようになると思うねん。IDFAみたいに、MetaへのデータシェアやりMetaへの広告をシャットダウンしたけど、Metaはより良いモデルを作って、今では以前よりもずっと多くのデータとユーザーに対する力を持ってるねん。Metaがそれを蹴っ飛ばしたのは良かったって感じやった。

AIでも同じことが当てはまるねん。テキストにアクセスできるし、これにもアクセスできるけど、他の人がユーザーデータを統合できるようになると思うし、エージェントが全てのユーザーデータを統合できるようになって、タッチやタッチパッドやキーボードやなくて、AIがコンピューティングへのインターフェースになるにつれて、ユーザーエクスペリエンスの制御を失い始めるやろう。

彼らはそれをマーケティングしてるけど、次の5年で世界に実際に何が起こるかを本当に理解してるかわからんし、それに対して十分早く構築してないねん。

Microsoftもその点では？

Microsoftも同じ問題があると思うねん。23年と24年は超積極的やった。それから大幅に後退したねん。今はOpenAIが彼らの掌握から滑り落ちてる。そこには全部あるねん。データセンター投資を大幅に削減した。世界で最大のインフラ会社になる予定やったのに、2倍の規模でな。多すぎたかもしれんし、経済的やなかったかもしれんけど、OpenAIの掌握を失ってる。

内部モデルの取り組みは壮大に失敗してる。LLM Arenaに今いて、そこではまあまあやってるけど、それはMAIの偽名やねん。コードネームやけど、何でもええわ。MAIは失敗してる。AzureはOracleやCoreweave、Googleなどにたくさんのシェアを失ってるし、内部チップの取り組みはどのハイパースケーラーよりもはるかに最悪やねん。

GitHub、GitHubがなんで最高ARRソフトウェアコードモデルやないんや？最高のIDE、最高のソースコードリポジトリ、最高のエンタープライズセールスフォース、最高のモデル会社との関係があって、最初に市場に出たのに。全部持ってたのに、何もないねん。

GitHub CopilotはFailingしてる。Microsoft Copilotはまだクソやろ？使い物にならんねん。何が起こってるんや？会社のクソを振り落とす必要があるねん。多くの企業と最高のB2Brelationshipを持ってるから勝ってると思うねん。地球上で最高のセールスフォースやな。でも実際に売る製品を持ってないってのは本当に怖いねん。

やからSatya は売上とかではすごい仕事をしたけど、製品にまじで取り組む必要があるねん。

Elonへの最後のアドバイス

Elonがここにいたら、どんなアドバイスをする？

XAIの多くの人がポルノモデル、ポルノ関係のことで怒ってるねん。大丈夫や。これからめちゃくちゃお金を稼ぐやろう。これがその会社の収益を加速する方法やねん。でも多くの人材を失ってるし、多くの良いプロジェクトを削ってるねん。

でもElonは素晴らしい人材の磁石やし、ものを作ることにかけても。やから彼に賭けないことはないけど、政権を離れて再び物事に集中し始めてからそう見えるねん。でも多くのことに集中してると思うし、ロボタクシーが実際に再び良く見え始めてるねん。

まだ乗ったことはないけど、乗った友達がいて、かなりまともに見えるって言うてる。この場当たり的な決定をしないでほしいねん。彼が素晴らしい理由でもあることが多いけど、この場当たり的な決定のいくつかは彼を傷つけてるねん。

もう一度製品にもっと集中するかもしれんけど、彼はその辺のことにもよく取り組んでるねん。

まあ、それで終わりにするのが良い場所かもしれんな。素晴らしい議論やった、ディラン。参加してくれてありがとう。こちらこそありがとう。ありがとう。