GoogleにおけるAIの歴史と未来、スンダー・ピチャイと共に

Google・DeepMind・Alphabet
この記事は約54分で読めます。

本動画は、GoogleのCEOであるスンダー・ピチャイ氏を迎え、GoogleにおけるAI開発の歴史と未来の展望について深く掘り下げたインタビューである。Transformerモデルの発明からChatGPTなどの外部での製品化に至るまでの背景、検索エンジンの未来像、インフラストラクチャや計算リソースの制約、そしてGoogle社内でのAI活用や長期的なテクノロジー投資の戦略に至るまで、多岐にわたるトピックが語られている。さらに、AGIに対する見解や、AIがもたらす経済効果、さらには宇宙空間のデータセンターや量子コンピューティングといった野心的なプロジェクトについても言及されており、インターネットスケールで事業を展開する企業の最前線の思考が明らかになる内容となっている。

The history and future of AI at Google, with Sundar Pichai
Sundar Pichai is the CEO of Google and Alphabet. He sits down with John and Elad Gil to discuss Google’s resurgence in t...

GoogleにおけるAIの歴史とTransformerの誕生

スンダー・ピチャイがGoogleのCEOに就任してちょうど10年が経ちました。アルファベットは現在、世界最大のテクノロジー企業の一つであるだけでなく、AI競争におけるリーダーでもあり、2026年には1750億ドルの設備投資を計画しています。乾杯。GoogleとAIの文脈で人々がよく話題にする歴史の一コマに、TransformerがGoogleで発明されたにもかかわらず、その後主にChatGPTやその種の製品としてGoogleの外部で製品化されたという事実があります。

これをどのように振り返りますか。

実はそれについてお話しする価値があると思っています。少し誤解されている部分があるんです。Transformerは大量のTPUという背景の中で開発されたものであり、ある程度は特定の製品のニーズを解決するために全て行われました。チームは翻訳をどのように改善するかを考えていたのです。TPUの場合、音声認識は機能するものの、突然それを20億人に提供しなければならなくなりました。

そのためのチップが足りなかったのですね。

その推論をどのように解決するかということです。

それは知りませんでした。Transformerは特にそういった目的があったのですね。

私たちの研究チームから生まれたものですが、彼らは製品の課題を解決することに導かれていたのです。そしてTransformerはすぐに使用されました。BERTやMUMなど、人々はそれがどれほどのものかを過小評価しています。なぜなら、私たちは検索の品質を非常に厳格に測定しているからです。その時期、検索の品質が他を大きく引き離して飛躍的に向上したことのいくつかは、BERTとMUMのおかげでした。私たちはTransformerを構築し、言語の理解、ウェブページの理解、そしてユーザーの検索クエリの理解を向上させるために、すぐに検索に導入し、より良いモデルを構築し続けました。また、社内でも製品化を始め、LaMDAと呼ばれるものを構築するチームもありました。

明らかに、私たちはそれを出荷した最初ではありませんでした。しかし、それが単なる研究に過ぎず、私たちが製品の方向にそれを応用していなかったということではないと思います。それは単に…

あなたがこの研究を行い、意図した通りに使用してそこから莫大な投資対効果を確認し、その後、それを用いて発明されたすべての製品を発明したわけではないにせよ、それは予想されることだということですね。

さらに一歩踏み込んで言えば、私たちはChatGPTという製品そのものを構想すらしていました。それがLaMDAでした。覚えているかもしれませんが、それが知覚を持っていると考えた社内のエンジニアがいましたよね。彼が社内で話しかけていたのは、ChatGPTの初期バージョンのようなものだと考えてください。マルチバースや他のどこかには、その製品バージョンすら存在していました。

Googleはおそらくその9ヶ月後くらいにそれを出荷したのですね。

実際、2022年のGoogle I/OでAI Test Kitchenと呼ばれるものを立ち上げましたが、それがLaMDAでした。しかし、私たちはそれを制限していました。なぜなら、社内には人間のフィードバックからの強化学習を経たエンドツーエンドのバージョンがなかったからです。私が見たバージョンは、あるレベルでずっと毒性が強いものでした。あの時点でそれを世に出すことは到底不可能だったのです。また、検索の品質に対するバイアスを持っていた会社として、私たちが世に出すのに許容できる製品の品質について、より高いハードルを持っていたのかもしれません。しかし、世に出さないつもりだったわけではなく、どうやって世に出すかを模索していました。また、OpenAIが出荷した時でさえ、彼らはその数ヶ月前にマイクロソフトと取引を行っていました。振り返ってみれば、それが完全に明白であったわけではないと言えるでしょう。彼らはGitHubを使ってコーディングの側面でもそれを見ることができて幸運だったと思います。おそらく、私たちが見逃していたシグナルがあったのかもしれません。コーディングの側面では、おそらく単なる言語の側面よりも連続的な飛躍が見られていたのでしょう。GPT-2からGPT-3、そして後のGPT-4への飛躍は、コーディングにも使用していたなら、より顕著だったのかもしれません。

消費者向けインターネットと予測不可能な展開

いくつか指摘できることはありますが、最初の質問に答えるなら、それは研究から製品へという話ではなく、他の多くの要因によるものだったと思います。ChatGPTの立ち上げに携わった何人かの人たちと話したのを覚えていますが、彼らは感謝祭の週にそれを立ち上げたと思います。少し目立たない形での立ち上げでした。これが大きくて目立つものであり、私たちの未来の重要な一部になるのだ、というようなものではありませんでした。明らかに驚きでした。クールなテストケースであり、本当に興味深いものでした。

しかし、私がこうした瞬間を自分の中でどう解釈しているかというと、消費者向けインターネットの世界にいれば、驚きはつきものだということです。私たちがGoogleにいた頃、Google Video Searchと呼ばれるものがありました。そしてYouTubeが登場しました。私たちはただYouTubeを買収したのです。あるいは、Facebookにいたと想像してみてください。Instagramが登場しました。誰も座ってそんな劇的な瞬間を予期したりはしません。Facebookは単にInstagramを買収しただけです。私が解釈しているのは、消費者向けインターネットとは、数人の人が座ってプロトタイプを作り、何百万ものアイデアを世に送り出すようなものだということです。何も軽視しようとしているわけではありませんが、常にこうした瞬間が訪れるのだと言いたいのです。

誰かがガレージで目覚めて、より優れたiPhoneを出荷するようなことは起こらないと思います。それは起こり得ません。しかし、消費者向けインターネットはそういうものではありません。そのことを意識し、自分の中で理解しておく必要があります。

Googleの製品戦略とスピードの重要性

2026年のAI競争について考えるとき、一つ印象に残っているのは、Googleが長い間、差別化を図る領域としてスピードを重視してきたということです。初期のGoogle検索は本当に速く、検索結果の中に検索クエリの時間を表示して見せびらかしていたのは有名です。当時の競合他社と比較してGmailの検索が速かったり、Chromeが当時の競合他社と比較して速かったりしました。そして今、私は様々な目的で全てのAIサービスを使っていますが、TPU上のGeminiはとにかく速いのです。これがどの程度明示的な製品戦略の一部なのか、どのように考えているのか、あるいはそれよりもはるかにニュアンスを含んだものなのか、興味があります。

私は常にスピードを意識してきました。ここではそれをレイテンシと呼びましょう。優れた製品を区別する特徴の一つとしてです。また、それはほぼ常に、製品の技術的な基盤がしっかりと構築されていることを反映しています。もう一つ重要なスピードがあります。それは、出荷とイテレーション、そしてリリースサイクルのスピードです。両方とも重要です。

しかし、レイテンシの話に戻りましょう。レイテンシを重視すると言うのは簡単ですが、常に新しい機能を追加し続けているわけです。機能のフロンティアは進歩しています。それをどうバランスさせるかという問題があります。そこが複雑になるところです。

一つの例を挙げると、検索のような場合です。私はチームと話をしていました。彼らは今、サブチームごとにミリ秒単位のレイテンシ予算を持っています。50%のクレジットがもらえます。もしレイテンシを3ミリ秒削る何かを出荷したら、自分のレイテンシ予算として1.5ミリ秒を獲得し、残りの1.5ミリ秒がユーザーに還元されます。あなたが何をしていると私たちが考えるかによって、30ミリ秒や10ミリ秒のレイテンシ予算が与えられる人もいます。それを使うことはできますが、それに対して厳格なレビューが行われます。しかし、それほどまでに私たちはこれが重要だと考えているのです。

背景としてお聞きしますが、人間がそれを感知するのは数百ミリ秒の前半くらいですよね?実際に影響を与える部分において。

その通りです。最後にダッシュボードと指標を確認したとき、過去5年間で検索のレイテンシを実際に30%改善したと思います。しかし、その間に起こった機能の進歩を考えてみてください。だからこそ、Geminiにおいて私たちは、機能とスピードの境界線を確実に保つという絶え間ない取り組みについて深く考えています。フラッシュモデルはプロモデルの90%の機能を持っていますが、はるかに高速で、提供するのにはるかに効果的であり、垂直統合などがそれを助けています。

検索の未来とエージェント型アプローチ

実際のところ、検索の未来についてどのようにお考えですか?現在、多くの人がチャットを新しいインターフェースとして語っています。当然のことながら、Geminiは統合されており、Googleの文脈では検索がGeminiやAIの結果を組み込んでいます。しかし、多くの人が今語っているのはエージェント的なフローであり、誰もがパーソナルエージェントを持ち、クエリを入力する代わりに、エージェントが代わりに何かを実行してくれるというものです。旅行について尋ねる代わりに、エージェントが旅行の計画を立ててくれるのです。検索の未来はどうなると見ていますか?それは流通のメカニズムなのでしょうか?それとも未来の製品なのでしょうか?あるいは、人々が世界と相互作用するN通りの方法の一つなのでしょうか?

検索においては、変化が起こるたびに、より多くのことができるようになると感じています。私たちはそれらの新しい機能を吸収し、製品の境界を進化させ続けなければなりません。モバイルになれば、製品はかなり急速に進化しました。ニューヨークの地下鉄から出てきたとき、ウェブページを探しているわけではありません。どこかに行きたいのです。それをどうやって見つけるか。人々の期待は常に変化しており、私たちはそれに合わせて前進しています。

少し先を見据えれば、単なる情報検索のクエリの多くが、検索においてエージェント的なものになるでしょう。タスクを完了することになるでしょう。多くのスレッドが並行して走ることになります。10年後に検索は存在するでしょうか?そうですね、あなたはもしかしたら…

あるいは何かに進化しているかもしれませんね。

進化し続けます。検索は、あなたが多くのことを行うためのエージェントマネージャーになるでしょう。ある意味で、私は今日Antigravityを使用しており、そこでは複数のエージェントが様々な作業を行っています。検索がそういったもののバージョンを実行し、多くのことを完了させていくのが目に浮かびます。

あなたの質問の根本は、検索を1行を超えないプロンプトであり、正しい答えを単に教えるというよりも、ランク付けされたさまざまな結果の束を返すものとして考えるなら、ということだと思います。あなたの質問は、その製品の形態が存在し続けるかということですよね。しかし今日、検索のAIモードでは、人々は深いリサーチのクエリを行っています。それはあなたがおっしゃっていることの定義には完全には当てはまりません。しかし、人々はそれに適応しました。私は、人々が時間のかかるタスクを行うようになると思います。はい。それは非同期で行うことができます。私たちはみな、あるいは生命は単細胞生物として始まり、今ではこのような複雑な生命を持っています。ここでの問いは、かつてのバージョンやパラダイムが最終的に消え去るのか、というようなものです。実際のところ、かつての検索がエージェントになり、あなたの未来のインターフェースはエージェントであり、10年後あるいはN年後には検索ボックスはもはや…

つまり、デバイスのフォームファクターは変わるということです。入出力の形式も根本的に変わるでしょう。それを判断するのは難しいです。10年先を考えると身動きが取れなくなるかもしれませんが、私たちは今、1年先を考えることができ、その曲線が非常に急激であるという幸運な瞬間にいます。だから、ただ1年先を考えるだけでワクワクするのです。過去には、座って5年先を構想する必要があったかもしれません。しかしモデルは、1年後には劇的に異なるものになるでしょう。

私としては、その曲線に乗ること自体がエキサイティングだと思っています。それは進化していくと思いますが、今は拡張の時期です。このような瞬間に多くの人が過小評価しているのは、これがゼロサムゲームからは程遠く感じられるということです。人々ができるようになることの価値もまた、ある種のとてつもない曲線上にあります。そのように見ると、人々は様々な疑問を抱くでしょう。TikTokが登場して以来YouTubeは好調ですし、Instagramも…例はたくさん挙げられます。ゼロサムゲームだと考えれば考えるほど、難しく見えてきます。イノベーションを起こしていない、あるいは製品が進化していない場合はゼロサムゲームになり得ますが、そういったことを最前線で行っている限りは違います。私たちは検索とGeminiの両方を行っています。それらはある部分では重なり合うでしょう。そしてある部分では深く分岐していくでしょう。両方を持ち、それを受け入れることは良いことだと思います。

Googleへの投資家心理とAIインフラへの投資

私たちが検索やその向かう先、そういったことについて話すとき、基本的に1年前の2025年の春夏には、Googleに対するセンチメントが非常にネガティブだったという事実を思い出します。検索は終わった、我々は本当に困難な時期を迎えるだろう、中核となるビジネスモデルが攻撃にさらされている等々、というのが支配的な見方でした。Googleの株価は150ドル前後で取引されていました。今では、人々はそれが愚かだったことに気づいています。GoogleはアプリケーションであれモデルであれTPUであれ、あるいはWaymoやYouTube、その他の素晴らしい投資であれ、スタックの上下全体で強みを持っています。投資家は、情報に基づくセンチメントの代理指標として、去年の今頃何を誤解していたと思いますか?明らかに何か大きな誤解があったわけですから。

その瞬間は明らかに、非常に内向きな見方に偏っていました。私にとっては、あの瞬間「ああ、オーバートン・ウィンドウが移動したな」と非常に明確に感じました。会社はまさにその瞬間のために構築されてきたと感じていました。垂直統合の仕組みは偶然の産物などではありません。非常に意図的なものでした。私たちはすでにTPUの第7バージョンに達していました。おそらく2016年のGoogle I/Oだったと記憶していますが、私たちはTPUを発表し、AIデータセンターを構築していると話しました。これは2016年のことです。私たちは考えていました…会社はAIファーストの方法で運営されていたのです。

私たちはこのシフトを深く内面化していました。私に言わせれば、最先端のLLMモデルという点では遅れをとっていましたが、社内にはすべての能力が備わっており、その瞬間に応えるために実行しなければなりませんでした。しかしエキサイティングだったのは、フルスタックの観点から見ると、私たちには研究チームがあり、インフラストラクチャチームがあり、すべてのプラットフォームがあったということです。私たちは多くのビジネスに意図的に投資してきました。私としては突然、「おや、これらすべてのビジネスを加速できる一つの共通のテクノロジーを持っているじゃないか」と感じたのです。検索からYouTube、クラウド、Waymoに至るまで、すべてが進歩に依存しています。それは進歩を遂げるための非常にレバレッジの効いた方法でした。私はそれを理解していました。議論の前のポイントに戻りますが、私はそれをゼロサムの瞬間だとは全く考えていませんでした。

すべての規模が10倍に拡大し、他の人々が参入する余地も生まれると感じていました。振り返ってみれば、Googleが登場して以来Amazonは好調ですし、Facebookもそうです。これらすべてのものがどのように機能するかという成長シナリオを、私たちは過小評価しがちです。しかし、会社として私たちはより良く実行しなければなりませんでした。私が言いたかったのは…

私はそこにもっと焦点を当てていました。

外部の世界に対して「ああ、彼らはこれを理解しているんだな」と証明した何かがあったのでしょうか?人々の考えを変えたのはGemini 3だったのでしょうか?

すべてのタイムラインを追っているわけではありません。おそらく、人々がそれを実感した本当のモデルはGemini 2.5だったかもしれません。そして、特にマルチモダリティの分野で最前線に到達したことです。私たちは多くの…Google DeepMindのチームの功績ですが、初期段階でもう少し固定費を多く支払ったと思いますが、初日からGeminiモデルを非常にマルチモーダルなものとして設計しました。その強みが現れ始めた分野があったと思います。Nano Bananaはその一例でした。すべてを一緒に見ることができました。しかし、ここは驚くほどダイナミックなフロンティアです。

互いに激しく競い合っている研究所が2、3あると思います。どの月をとっても、「おお、素晴らしい。これはうまくできた」と感じたり、「ああ、しまった。いくつか遅れをとってしまった」と感じたりします。数ヶ月後にはまた状況がダイナミックに変化するでしょう。フロンティアとは、皆さんがご想像の通り、それほど激しいものだと考えています。それが私の考えです。

AGIへの見解とAIの進化を体感する瞬間

興味深いですね。なぜなら私が研究者たち、Googleではなく他の研究所の研究者たちと話すとき、彼らが共通して持ち出すことの一つが、他の2、3の研究所とGoogleのチームとの違いは、Googleが彼らの言葉で言うところの「AGIピル」を飲んでいない(AGIの到来を狂信していない)ことだと感じているということです。言い換えれば、AGIがすぐそこまで来ており、そこへ向けて加速していくという信念が希薄だということです。もちろん、Googleの人々はそれについて深く考えています。まず、それは事実だと思いますか?そして次に、それが未来が実際にどのようになるかという何らかの概念に影響を与え、その結果人々が何を目標に構築しているかに影響を与えていると思いますか?

そうですね、おそらく私たちは設備投資を300億ドルからおよそ1800億ドルへと拡大しました…

もう現実的な金額ですね。

ある意味で曲線をそのように捉えていなければ、そんなことはしません。私はこれを主に言葉の問題だと捉えています。おそらく私たちが、非常に多くのレベルで非常に多くの人々に触れる多くの製品を持つ大企業であるためでしょう。それについて私たちがどう語るかという言葉遣いが違ってくるのかもしれません。創業者たちはおそらくAGIピルを飲んでいたと思います。私の最も初期の会話でも…

GoogleではAGIが何であるか、あるいはデミスと彼のチーム、ジェフ・ディーンと彼のチームが理解していないというこの見解がありますよね。ある時点では、デミス、ジェフ、イリヤ、ダリオが全員そこにいたのです。私はその反論が好きですね。「もしもし、過去20年間ちゃんと見ていましたか?」と言いたくなります。私にはその見解は理解できません。

その理由のいくつかは、もしあなたがより若い会社であったり、より純粋な研究機関であったり、サンフランシスコに本社を置いていたりする場合、おそらく違いを生み出す可能性のある小さな属性がたくさんあるということだと思います。しかし、曲線の形状や私たちがテクノロジーをどのように内面化しているかについて、根本的なレベルでの見通しの違いがあるとは思いません。

実際のところ、社内でさえ、最先端の領域で生活し、エージェントを動かし、これらのものが何を行えるかを確認し、エージェントがスキルを習得し、タスクを実行するのを目にし、また3ヶ月前に彼らが何ができたかと現在を比較して振り返っている私たちがいます。私たちは社内でその指数関数的な変化を生きているのです。

お二人の言うことは両方とも正しいと思います。Googleの歴史を指摘できるという点には同意します。イーラッドが言わんとしているのは、誰かがツイートしていたのを見かけたときの感覚だと思います。「現在シリコンバレーで起こっていることを説明するために認識しなければならないのは、すべてのテクノロジー企業の幹部が今、重度のAI精神病にかかっており、コードを書いたりAIと話したりすることに膨大な時間を費やしているということだ」というツイートです。私はそれが面白い見方であり、あながち嘘でもないと思いました。

質問ですが、最近の過程でAGIの瞬間を感じたのはいつでしたか?あるいは、最近あなたはどの程度AI精神病にかかっていますか?

私が初めてAGIの瞬間を感じたのは2012年、ジェフ・ディーンがGoogle Brainの初期バージョンをデモしたときでした。これはニューラルネットワークが猫を認識したときです。それが2012年でした。私はラリーと一緒にDARPAチャレンジに行きました。確か2014年だったと思いますが、彼らが車を運転するのを実際に見たのがいつだったか正確に思い出す必要があります。デミスが私たちが想像力と呼ぶものを持ったモデルの初期バージョンをデモしました。そのような瞬間はたくさんあったので、テクノロジーが進歩していることは明らかでした。

現在を生きていて、それを肌で感じるということについては、最も近いのは、コーディングをしていて、複雑なタスクを与え、IDEを一度も開くことなく、ある種のエージェントマネージャーの世界にいて、それがタスクをこなすのを見るときだと思います。そしてそれがどれほど強力であるか。それをAGIを感じると呼んでもいいでしょう。そのような瞬間はあります。

私も最近ちょっとした趣味のプロジェクトをやっていて、しばらくしてから「ああ、これどの言語を使ってるんだろう?」と思いました。それはすべてが稼働し始めた後にAIに尋ねなければならない詳細でした。魔法のように感じます。そういった瞬間は確かにあります。曲線の傾きが私たちを驚かせるのです。非常に多くのパラダイムでそれが改善されています。この先に進歩があることは明らかだと感じられます。

その肌で感じる感覚について話すとき、私がテクノロジー企業にとって重要だと感じる一つのことは、すべてのCEOがこれについて異なる考え方を持っていますが、いかにして製品体験や日常のユーザーとつながり続けるかということです。テクノロジー製品は非常に抽象的であるため、チームからの報告書やスライドデッキ、スプレッドシートだけで管理してしまいがちです。トニー・シューは、その体験と非常に深くつながり続けるために、今でもドアダッシュの配達員として働いていると話しています。私たちも毎週の全体会議で、「ストアを歩く」という定期的なセグメントを設け、みんなでダッシュボードをクリックしながら、「なんでこんなところにモーダルがあるんだ?少しわかりにくいな」などとつまずきながら、共同で製品を使っています。

あなたにとってはそれがどのように機能しているのか、Googleにおいて、Gmailなどを毎日使うこと以外に、製品を使用する体験とどのようにつながりを保っているのか興味があります。

いや、私は文字通り社内バージョンをドッグフーディングしています。集中的に使うための時間をブロックして確保しています。集中する時間を作ってそれを行うのです。それが役に立ちます。つい2週間前も、ジムでストレッチをしながらスマートフォンでGemini Liveを開いていました。一つのトピックについて30分間丸々会話してみようと思ったのです。そういうことをするわけです。うまくいくこともあれば、イライラすることもありますが、多くのことを学びます。そういったパワーユーザーモードの使い方を自分に課し、そのようにして状況を把握し続けています。

X(旧Twitter)も役に立ちますね。なぜなら時折、生のフィードバックが得られるからです。Googleカレンダーの問題を修正してくれてありがとう、あれはとても良かったです、とか。

ええ、修正しなければならないものがまだいくつかあります。

あれは素晴らしかったです。報告してくれてありがとう、というような。

そうですね、Xは生の声が得られるので役に立ちます。直接フォローするようにしています。何が役に立ったかお教えしましょう。社内で私は…先ほどの話に戻りますが、Antigravity、私たちの社内版Antigravityでクエリを投げるのです。「ねえ、私たちがこれを立ち上げたけど、みんなこれについてどう思った?みんなが話している最悪な点5つと、最も良かった点5つを教えて」と入力します。するとそれが答えを持ち帰ってきます。私の生活は楽になったでしょうか?はい。以前なら、それを把握しようとするのにはるかに多くの時間を費やさなければならなかったでしょう。今ではAIエージェントがその旅において私を助けてくれます。「その感覚を掴むために、私は直接どれくらいの時間を費やすべきだろうか?」と考えることもできます。これが実際にこれらのツールを活用するということです。私自身もその旅路の途中にいます。この未来に適応しようとしているのです。

AIによる経済成長への貢献と今後の予測

あなたはまず、それがゼロサムではないこと、そして次に、人々が目の当たりにしているこれらの生産性の向上について言及しました。過去の多くのテクノロジーサイクルを見ると、インターネットやモバイル、あるいはSaaSが実際のGDPの数値に現れるまでには時間がかかりました。AIの文脈では、私たちはデータセンターの構築という観点からそれを見ています。それがGDP成長の一部を牽引しています。3年、4年、あるいは5年先をどのように考えていますか?AIのおかげで米国経済はより大きくなると思いますか?もしそうなら、どれくらい大きくなるでしょうか?

そうですね、これらのリターンが意味を持つためには、どこかでそれが…

どれくらいかかりましたか…おそらくセコイアの誰かが記事を書き、人々がこれだけの投資をしていると言っていました。

ええ、彼らは設備投資を比較しています。

それは2年半前の話です。講演で、それだけのレベルでリターンを得る必要があるから理にかなっていないと言っていました。おそらく投資額の10倍のリターンが必要だと。

その瞬間から、私はもう一度数字を確認する必要があります。ある時点で、それは一致しなければなりません。非常に明確にしておきたいのは、私たちは供給に制約を抱えているということです。私たちはあらゆる領域で需要を目の当たりにしています。私は、これが巨大な市場であり結果をもたらすことについて、実際には何の疑いも持っていません。

私の質問、そして人々が過小評価している多くのことがあると思います。例えば、人々はよくソフトウェアエンジニアリングの予算について語り、そのうちトークンと給与の割合はどれくらいかと考えます。ある程度、その市場は優れたソフトウェアエンジニアに対する需要があまりにも制約されてきたため、突然供給を追加することでその市場が10倍になる可能性があると私は考えています。言い換えれば、ソフトウェアエンジニアリングとコーディングの市場は誰もが考えているよりも劇的に大きく、トークンの予算対エンジニアという指標は間違っていると思うのです。私は実際にそれが多くのものを成長させるはずだと考えています。

私が興味があったのは、実際にこれからどれだけの成長がもたらされる可能性が高いと見ているかというあなたの見解です。私は設備投資対結果について全く疑っていませんでした。

なるほど。そうですね、インターネットを振り返り、GDP成長率を見ると、私たちがインターネットで感じていることを完全には捉えきれていません。おそらくインターネットがなければマイナスのGDP成長率だったかもしれません。消費者余剰というものです。先を見通すのは難しいです。社会の様々なレベルには自然な抑制メカニズムが存在すると思います。明白なのは、コンピューティングインフラの構築は、私たちがモデルを改善できる速度とは異なる曲線を描くということです。そこではすでに、より制約のある曲線に対処しています。

そして、それをどのように社会に普及させるのか。私たちはこれをWaymoで行っています。Waymoを人間のドライバーよりも安全にすることはできますが、それを展開するペースなどには注意しなければなりません。時には、どのように責任を持ってそれを社会に普及させるかという問題があります。これらすべてのレイヤーに制約があります。

私は…米国経済は10年前よりもはるかに大きくなっています。それを0.5パーセントポイント高く成長させるだけでも、それは巨大な貢献です。私はそのように展開していくと予想しています。

【Stripe スポンサーメッセージ開始】 スンダーの話を聞いていると、真のインターネットスケールで事業を運営することが何を意味するのかを強力に思い出させられます。しかし、コマースに関して言えば、ほとんどの企業は真空状態で重要な決定を下すことを余儀なくされています。彼らは自分たちの壁の中に存在するデータのみを使用し、自分たち自身のレンズを通してのみインターネット経済を見ています。ここでStripeの出番です。私たちは年間1.9兆ドルのグローバルな支払いを処理しているため、パノラマのような視点を持っています。Stripe上で構築すると、ユーザーの身元確認から、不正行為が始まる前の阻止、企業間の接続の合理化、そして現地でどの支払い方法が最も効果的かを知ることまで、そのネットワーク・インテリジェンスに接続することになります。私たちは、世界のGDPの1.6%をあなたの収益の保護と成長のために活用するシステムを構築しました。Stripeのネットワーク・インテリジェンスの力を活用したい方は、ここで何が構築できるかを見に来てください。 【Stripe スポンサーメッセージ終了】

AI開発における制約とボトルネック

あなたは供給の制約に言及しましたが、私はそれが2026年を決定づける非常に興味深い側面だと考えています。基本的には、設備投資で1500億ドルとおっしゃいましたか?1800億ドル?

私たちは1750億ドルから1850億ドルの間になると言っています。

なるほど、およそ1800億ドルの設備投資ですね。私が興味深いと思うのは、メモリが足りず、電力が足りず、これらすべてのコンポーネントが不足しているため、Googleが望んでも4000億ドルの設備投資を行うことはできないだろうということです。順を追って説明していただけますか…

必要な数の電気技師を見つけることもできないでしょう。

その通りです。様々なボトルネックについてのあなたの見解の概要をお聞きしたいです。

そうですね、あるレベルでは、実際のウェハー生産能力などの問題に遡る必要があります。より深い根本的な事実が存在します。そうですね、ウェハーの投入量です。これは根本的な制約です。電力とエネルギーはより解決しやすいと思います。許認可と実際に規制環境を乗り越えていくことが制約になるかもしれません。物事を実行できるペースです。テキサスやネバダ、モンタナのように成長を後押しする広大な土地があったとしても、おそらく十分ではないでしょう。

私たちは途方もない進歩を遂げていると思います。米国にとって、これは特に重要なことだと考えています。中国でのペース、彼らがどれほど速く物事を構築できるかに畏敬の念を抱くでしょう。私たちは物事をはるかに速く構築する方法を学ぶ必要があると本当に思います。物理的な世界で10倍速く物事を行う、10倍速く建設するには何が必要かを考えるように、メンタリティをシフトさせなければなりません。

私はそれを制約として懸念しています。抵抗が強まる可能性もあるので、速く構築したいと数人が決めるほど単純なことではありません。データセンターのモラトリアムなどの問題です。ウェハーの投入量、許認可を得て物事を実行する能力が重要だと言えます。政府からも素晴らしい取り組みが多くなされていると思います。人々はこれらのことをより良く行う必要があると認識しています。

そして、サプライチェーンにおける重要なコンポーネントの問題があります。メモリはその良い例です。私たちは短期的にそれらのものに制約を受けています。誰もがそれに対応するでしょう。会社を経営している私たちは皆、どれほどAGIピルを飲んでいようと、どれほど強気になれるか、どの程度のマージンを許容できるかという誤差の範囲に直面します。なぜなら、コントロールの及ばない世界で悪化する可能性のある外部要因が存在するからです。誰もがその調整を行っています。これらはすべて制約です。そこに私は制約を見ています。

メモリはあなたが考える中で最大のコンポーネントですか?

現在、メモリは間違いなく最も重要なコンポーネントの一つです。

短期的にはとおっしゃいましたが、単に人々が供給を増やし、高い価格がそれを解決すると思いますか?主要なメモリ企業がその生産能力を劇的に向上させる方法はありません。したがって短期的にはそれらの制約がありますが、先へ進むにつれて緩和されていきます。これらすべてが制約になると予想しています。それが多くのイノベーションを後押しすると思います。私たちはこれらのものを30倍効率的にするでしょう。それらすべてが同時に起こっています。

それが寡占市場を強制することになるのでしょうか?実際のところモデルの側を見ると、モデルの見通しとそれらがどのように改善されるかについての多くの見解を見れば、その多くは自己改善によるものになるでしょう。モデルは自身の部品をますます多く書き始め、自身のためのデータラベリングなどをより多く行うようになります。基本的には、現在誰が計算リソースを持っているかという椅子取りゲームですよね。

その通りです。現在誰が計算リソースを持っており、業界全体の生産能力に対してどれだけスケールアップできるのか。もし全員がある数字までおおよそ比例してリソースを持っているなら、誰かが他の誰かに対してどれだけ引き離せるかという上限を事実上設定したことになります。それは正しい認識だと思いますか、それとも間違った認識だと思いますか?

そのように考えるのは合理的なフレームワークだと思います。しかし、Gemma 4を出荷したばかりの立場から言えば…あれは本当に優れたオープンソースモデルです。中国のモデルも非常に優れていますが、中国国外では非常に優れたオープンソースモデルだと思います。Gemma 4に至るフロンティアは、時間的に見れば巨大であり、かつそれほど巨大でもありません。Gemma 4はGemini 3のアーキテクチャに基づいています。非常に奇妙なことです。USBスティックに収まる重みデータのセットについて話しているのですから。

ええ、驚くべきことです。本当にクレイジーな…SpaceXのロケットのようなものではありません。データセンターを何ヶ月も稼働させて、その出力がフラットファイルであることに私はいつも衝撃を受けます。文字通りです。

Word文書か何かを持っているようなもので、それがあなたのモデルなのです。驚くべきことです。これにはこうした独自の属性があり、それが私にそれらのフレームワークに異議を唱え、「これについてどう考えるべきか?」と言わせるのです。少なくとも推論の側においては、あなたがおっしゃっていることは合理的な…非常に合理的な考え方だと思います。誰もが、これらの制約を突破しようとする資本主義的なインセンティブをどのように突き抜けるかを理解しようとしていると思います。それは計り知れません。

おっしゃる通り、世界には限られた量のメモリしかありません。いかなる資本主義的なインセンティブも、2026年や2027年のメモリ供給を真に解決することはできないでしょう。それがモデルのさらなる分岐が見られる時代になるかもしれません。覚えておいていただきたいのは、それがウェハー生産能力の増加や、あなたがそれらのデータセンターの許可を得られることとバランスを取らなければならないということです。この制約は見た目ほど厳しくないかもしれません。必要なすべてのものの合計面積を思い描き、資本も含めてそれを考え抜かなければなりません。

はい。繰り返しになりますが、私が興味深いと思うのは、もっともらしいことですが、人々は現在の設備投資を超えて投資するだろうということです。しかし、私たちは今、2026年と2027年の現実世界の制約にぶつかっています。ホルムズ海峡の状況に少し似ています。原油価格がどうであれ、最終的にシステムから日量2000万バレルを取り除けば、需要を日量2000万バレル破壊する必要があります。メモリも同様で、最終的には一部の人々が望むメモリを手に入れられないということになります。

そうですね、セキュリティを制約として考えると、他にも制約があります。これらのモデルは間違いなく、世の中のほぼすべてのソフトウェアを破壊することになるでしょう。私たちがここに座って話している間に、すでに行われているかもしれません。世の中のすべてのソフトウェアだと本当に思いますか?SSHなどは長い間破ろうと試みられてきました。

私が言っているのは通常のソフトウェア、大規模なプラットフォーム、どれだけのゼロデイ脆弱性があるかということです。システムにはここに制約があります。ただ消えてなくなることを願うことはできません。

AIのせいで供給が増加しているため、ゼロデイ脆弱性のブラックマーケットでの価格が下落していると誰かが教えてくれました。これは非常に興味深い市場の指標だと思いました。

全く驚きません。それが実際にどのように社会に普及していくのか?その意味合いは何なのか?類似点はあります。隠れた制約が存在する可能性があり、言ってみればシステムへのショックが起こる可能性があります。そうは言っても、私は純粋に、この先には多くの上昇余地があると考えています。制約のいくつかは役に立つかもしれません。制約は創造性を刺激すると思います。それはあなたをより効率的にする圧縮サイクルを強制します。

おそらく、そうでなければ起こらないような重要な会話を強制するでしょう。私のセキュリティの指摘だけでも、私は考えました…私たちには今起きていない以上の調整が必要になるでしょう。その瞬間が来るでしょう…それは急激な瞬間になるかもしれません。そういったすべてのことを、単に願い下げにすることはできないと思います。

Googleが取り組む長期的プロジェクトと未来のテクノロジー

実際、それに関連してですが、Googleは自社で構築したものと投資したものの両方で素晴らしいポートフォリオを持っています。所有権の観点から言えば、SpaceXの妥当な額を所有しています。正確な額は知りませんが、昔はおよそ10%程度だったと思います。Anthropicも10%程度。そして素晴らしいWaymoの過半数です。そして社内では当然、開発されてきた素晴らしいテクノロジーの巨大な領域があります。AIとTransformerについて話しました。TPUがあります。当然、Waymoもこれらのうちの一つでした。量子コンピューティングもあります。最近非常に興味深い結果を発表しましたね。人々が知っておくべき、あるいは特に興味深い、あるいは将来非常に大きな影響を与える可能性のある、その他の隠れた宝石はありますか?あるいは人々がおそらく過小評価していると思うものはありますか?

私たちは常に、最初に発表したときには少し、あるいはわずかに馬鹿げているように見えるような、これらの長期的プロジェクトに取り組もうとしています。私たちは今、宇宙空間のデータセンターについて考え始めたごく初期の段階にいます。先ほどの「制約が創造性を刺激する」という議論に戻ります。20年の見通しを立てたとき、これらのデータセンターの大部分をどこに置くのでしょうか?解決すべき本当に困難な問題です。

それらは私たちが今日考えているプロジェクトの例です。2010年のWaymoのようなものです。量子コンピューティング自体もこうしたプロジェクトの一つです。私たちは深くコミットした形でそこで進歩を遂げており、私はそれに興奮しています。

量子コンピューティングはどこで最大の影響を与えると思いますか?主に人々が話すのは分子モデリングや暗号技術についてです。人々が時間をかけて開発してきた耐量子暗号があります。分子モデリングの側では、特定の状況下ではディープラーニングモデルが非常に優れているように見えます。AlphaFoldであなた方がそれを開拓しましたよね。量子コンピューティングは実際に重要になると思いますか?もしそうなら、どこで最大の影響を与えると思いますか?

抽象的なレベルで私に感じられるのは、自然をより一層シミュレートするということです。自然は本質的に量子的であるため、それをより良くシミュレートするには量子システムが必要になります。古典的なコンピューティング技術を使って驚くべき方法でそこに到達するかもしれませんし、十分な圧縮や抽象化でそこに行き着くかもしれません。機能するかもしれませんが、私は根本的に量子コンピューティングがそこに優位性を持つと感じていました。肥料のためのハーバー・ボッシュ法など、私たちにはまだ理解できていないことがたくさんあります。多くの複雑な…おそらく大学で何を専攻していたかというあなたの経歴に由来する話ですね。私の直感では、天候のシミュレーション、現実のシミュレーション、そういったことすべてにおいて、量子コンピューティングは優位性を持つだろうと教えてくれます。

テクノロジーの歴史は、何かが機能する規模に達し、それを使用し、その上に人々の創造性がアプリケーションを見つけるというものです。私は常に、携帯電話とGPSがUberを可能にしたというこの例を挙げます。携帯電話の開発に携わっていた人で、このプラットフォームシフトの結果としてそれを予測した人は誰もいません。実際に機能させることができれば、量子コンピューティングには多くのアプリケーションが生まれると確信しています。私はそのように考えています。

申し訳ありません、お話を遮ってしまいました。Googleのより先の取り組みの中であなたのお気に入りのものについて話していましたね。

GDM(Google DeepMind)チームはロボット工学について深く考えており、私たちは進歩を遂げていると思います。ロボット工学は、かつて会社として私たちが早すぎた分野でした。AIが15年前や10年前の多くのアイデアに欠けていた要素であったことが判明しました。しかし、Geminiのロボティクスモデルは空間推論などで最先端(SOTA)です。私たちは間違いなくそこに最先端のモデルを持っています。皮肉なことですが、私たちはボストン・ダイナミクスやアジリティ・ロボティクスなどの企業と再び提携し、断固とした方法で進歩を遂げています。世の中には並外れたスタートアップも存在します。

私たちは投資しています…宇宙空間の量子データセンターや、Wingによるドローン配達について話しました。ある妥当な期間内に4000万人のアメリカ人がWingの配達サービスにアクセスできるように、私たちはWingをスケールアップしていると思います。何年も先の話などをしているわけではありません。繰り返しになりますが、これらの長期的プロジェクトに取り組むとき、これらはすべて計画的な複利効果です。私たちはコミットしています。

Isomorphicは本当にエキサイティングです。新薬発見のすべての可能なステップを改善するために、的を絞った方法でこれらのモデルに焦点を当てていると考えています。第3相試験などの長い道のりがあるにせよ、はるかに高い成功確率でそこに到達するということです。それは様々なバイオモデルの観点から、そして大半がそこで行き詰まっている分子設計にとどまらない幅広い領域について真剣に考えているという点で、私がこれまで見た中で間違いなく最もスマートなアプローチだと思います。非常にスマートに見えます。

資本配分と長期的投資への考え方

質問してもいいですか。Googleにおける資本配分が実際にどのように行われているのか興味があります。私が言いたいのは、優れた資本配分のアイデアとは、資本の機会費用を内面化し、ビジネスが生み出す現金を最高かつ最善の用途に投じることだということです。ビジネススクールの教科書にあるような簡単な例では、例えばあなたがボーイングで、ビジネスが生み出すこの現金があり、次の防衛契約に入札しに行くことができるとします。これだけの研究開発費を投資し、契約からの収益をこれだけモデル化します。あるいは、白紙の状態から民間航空機を開発し、この資金を投入してこれをモデル化します。それは16%のIRR(内部収益率)対19%のIRRのようなものです。私は19%を好みます。

Googleの場合、プロジェクトは極めて異質です。YouTubeチームにより多くの資金を提供して、彼らが推奨アルゴリズムを改善し、その結果サイト滞在時間が増加し、収益化も向上するかもしれません。あるいは、Waymoチームにより多くの資金を提供して、彼らが実際に早く市場に参入したり早くスケールアップしたりできるようにするかもしれません。あるいは、5年後に成果が出るかもしれないこの新しいAIアプローチに投資することもできます。私が興味があるのは、資本を最高かつ最善の用途に向けようとし、最終的に比較検討する際に、性質もリターン曲線の形状も全く異なるイニシアチブをどのように比較するのかということです。

これはいかにもジョンらしい質問ですね。答えを知りたいです。ROICを持ち出さなきゃ…

良い質問です。皮肉なことに、TPUの割り当てのせいで、私は今日これまで以上にそれを感じています。ある意味で、WaymoでさえTPUを必要としていると感じています。皮肉なことに、コンピューターがこの問題をはるかに念頭に置かせるようになりました。ちなみに、私がやっているすべてのことの中で、少なくともコンパニオンとしてのAIが、このタスクにどのようにインプットを与えてくれるかを本当に楽しみにしています。私たちが実際にすべてのデータを接続し、流動させることができれば。モデルはすでに十分な能力を持っていると思います。より多くのデータを解き放つことで、役に立つようになると思います。私はそこでそれを感じています。

歴史的に、Googleにおいて私たちが持っていた利点の一つは、サイクルの非常に早い段階でこれらの決定を下すことがあるということです。それは深いテクノロジー指向としてのルーツに立ち返るようなものです。私たちは実際に、先ほどあなたがイーラッドに尋ねた、より長期的なものは何かという質問について考えています。その段階で考えるのは簡単です。なぜなら初期の資金提供額は小さくて済むからです。しかしその後、長期的にコミットし続けますが、深い部分で確実に進歩を遂げているかを確認します。その根底にあるテクノロジーが見えている限り…

例えば量子コンピューティングを例にとってみましょう。それをどう判断するのでしょうか?私たちはその根底にあるものを判断しています。論理量子ビットのエラー、そうですね、大規模で安定した論理量子ビットのしきい値について、いつまでに到達するのかという目標があり、チームはそれを達成できるのか?そういう方法で評価するのだと思います。利点とは言いませんが…私たちがそれについてどのように考え、どのように規律を守ってきたか、あるいは少なくとも私にとって非常に重要である方法の一つは、それらの初期のテクノロジーへの賭けを深く行うことです。それが役に立ってきました。

絶えず、私はこれらの長期的な価値を評価しなければならないと考えてきました。直感的な方法で、5〜10年先の選択肢の価値とTAM(獲得可能な最大市場規模)について考え、クレイジーな成長を想定し、それらの決定が理にかなっているかどうかを考え抜くようなものです。TPUへの投資はその意味で素晴らしいものでした。私たちはそれに着実に投資してきました。Waymoは素晴らしい例で、世界がそれに対して悲観的になった2〜3年前に、私たちは投資を増やしたと思います。他の人々や一部の人々が手を引いていた時にです。

とても魔法のようです。本当に魔法のような体験です。私は今、できるときは毎日Waymoで通勤しています。Waymoは私のこの質問の良い例だと思います。Googleはプロジェクトを中止することもありますし、「Xのこの部分には最後まで資金を提供しない」とか「この製品は機能していないので終了する」と言って試みた様々なことがあります。しかしWaymoは、魅力的なデモから市場での商用サービスに至るまでの道のりが長かったにもかかわらず、あなた方は信念を失いませんでした。何を見ていたのですか?それは定性的な決定でしたか、それとも定量的な決定でしたか?Loon(ルーン)を中止してWaymoを続けるとどうやって決めるのですか?

それは、いくつかの定量化されたものと関係があると思います。Waymoのドライバー(自動運転システム)を見るわけです。それが根底にあるテクノロジーであり、ソフトウェアがどのように車を運転するのかということです。安全性と信頼性の観点からの進歩です。どれだけ安全か、どのように行うのかという長期間実行されるタスクです。その曲線をたどり、どこにいたいかを予測するか目標を設定し、その曲線に対してどのようにパフォーマンスを発揮するかを見ます。チームは驚異的だったと思います。進歩しない時期もあったかもしれませんが、そういう時こそ…そうした時期を突破するためのチームの質に自信を持つ必要があります。物事をその深いテクノロジーのレベルで評価できればできるほど、そういった決定をより良く下す傾向があると思います。少なくとも私はそうしようと努めてきました。

AI時代の研究開発費と計算リソースの管理

私が聞いたWaymoに関する一つの議論は、最近見られた巨大な進歩の多くについてです…なぜなら、かつては運転の境界例にどう対処するか、何かが起きたときにどう反応するかという手作業でマッピングされたヒューリスティクス(発見的手法)だったからです。その一部は、車が従うために手書きで描かれたようなものでした。車ができる狭い範囲のことしかありませんでした。そして本当のブレイクスルーは、一般的なTransformerの波が起きている中で、数年前にエンドツーエンドのディープラーニングに移行したことでした。もしWaymoが5年前に始まっていたら、15年以上前に始まっていた場合と比較して、今と同じ場所にいると思いますか?それがWaymoを前進させたブレイクスルーだということを考慮すると。

そうですね、先ほどロボット工学について話しました。Waymoをロボットとして考えることができます。過去3年間にロボット工学を始めた人々は、定義上、おそらくより速い進歩を遂げるでしょう。しかしWaymoは非常に統合されたシステムだと思います。TSMCやSpaceXがロケットを打ち上げるような複雑なものとは少し違いますが、その側面はあります。あなたは非常に複雑な方法でこれらのシステム統合について話しています。Waymoにはその隠れた側面があり、それをどのように行うかという時間、その技術(クラフト)が重要だと思います。そうは言っても、エンドツーエンドのアプローチはこのケースでは偶然の出来事になると思います。なぜなら、単にチームを持っていることが、おそらくアルファベットとGoogleにとって巨大な利益だったからです。ただあなたがそれに投資し続けたという事実、そしてこのテクノロジーの離陸がそれ以上の価値を持つ瞬間に到達したこと、それは非常に賢明で先見の明がありました。

私はただ、それが他の領域にどう適用されるかを尋ねるのが興味深いと思うのです。なぜなら、あなたがロボット工学についておっしゃったように、ロボット工学においては今非常に速く動くことができるため、潜在的に異なる歴史を持つことになるように思えるからです。あなた方は再びハードウェアを自社内に取り込むことを考えていますか?それとも、これを世に出すのは主にパートナー主導のモデルになるのでしょうか?

私たちは非常にオープンな心を保つと思います。Waymoから、そしてTPUなどのAIの側から得た教訓は、特にお客様の安全、規制などすべてのことがある分野では、曲線を本当にうまく押し進める必要があるということです。製品のフィードバックサイクルの直接的な体験が必要なのです。ファーストパーティのハードウェアを持つことは最終的に非常に重要になると思います。現段階ではそのように言えます。

すみません、資本配分に関する質問がもう2つあります。Googleは歴史的にアンダーレバレッジ(負債比率が低い)だったと主張することはできますか?Googleは歴史的に強固な純現金ポジションを維持してきました。Googleにはどうしたらいいかわからないほど多くのアイデアがあり、良いアイデアに満ち溢れていること、そして中核ビジネスが非常に持続的に成長していること、そしてGoogleは明らかにその中核ビジネスを非常によく理解しており、Googleの資本コストよりも高い成長率で成長してきたことを考慮すると。振り返ってみて、Googleはもっと前のめりになって、「よし、強固な純現金よりもわずかに攻撃的なレバレッジ・ポジションを持つことをいとわず、それを新しいイニシアチブに投じるか、あるいは単にGoogleの株主のためにより多くのこの中核ビジネスを買うか、あるいはGoogleがクラス最高だったと思われるマイノリティ投資をもっと行う」と言うべきだったのでしょうか?

素晴らしい質問です。例えば、もしWaymoがもっと早くこの地点に到達していたら、私はもっと早く資本を投資していたと思います。ある程度、あなたはそれを判断していました…あなたは資本の良き管理者でありたいと願っています。ROICについて強気である限り、投資できる最後の1ドルまでそこに投資したいと思うものです。しかし、過剰な資金があり、そう思わない場合は…これが私たちが他の企業にも投資してきた理由です。たとえ社内でなくても。しかし、私たちは常に資本の良き管理者であるというレンズを通して考えてきました。Stripeへの投資は資本の良き管理者であったと感じています。SpaceX、Anthropicなどもそうです。

現在AIのシフトに伴い、私たちが良い方法で資本を配置できる機会が増えているため、私たちはそうしています。私たちは常にそのマインドセットを持っていたと思います。Waymoにもっと早く多くの資本を投資できていたら嬉しかったですが、私たちにはそうするために必要な成熟度がありませんでした。安全性の観点からWaymoにアプローチした時期もありましたが、Waymoの安全を第一に考えることは、正しいことではありませんでした。

もっと早くより多くの資本を投入していれば、もっと早く進んだであろうプロジェクトを指摘することはできないと感じていますか?それらは自然な成長曲線を持っていたと?

そう言えると思いますが、一般的に少なくとも、私たちは決定を誤ったかもしれませんが、少なくとも私たちのアプローチは、何かに興奮し確信を持ったなら、それを最後まで見届けるために資本をコミットする用意があると言うことでした。

もう一つの資本配分に関する質問ですが、歴史的にテクノロジー企業では、研究開発費の大部分はビルの中を歩き回る人々の費用でした。ヘッドカウント(人員数)は厳重に管理されたプロセスを通じて管理されていました。実際、研究開発の取り組みを割り当てることについて考えるとき、それは課題に取り組むために高給取りの人々を割り当てることでした。テクノロジーのコストは、Googleブックスや何かの代わりにGoogleが明らかにやっていたような、非常に計算コストのかかることをやっていない限り、人件費と比較すると後回しでした。現在私たちは、TPUやそれをどのように割り当てるかについてはそうではない世界に向かっています。非常に具体的な予算編成のレベルで、それはGoogle社内でどのように機能しているのですか?会社全体のTPU予算があるのですか?そして、プロジェクトにリソースを提供するとき、以前は特定のヘッドカウント予算を与えていましたが、今ではヘッドカウントとTPU予算を与えるのですか?それらは同じ予算ですか?四半期ごとのレビューや年次のレビューを行うとき、それはどのように機能するのでしょうか?

そうですね、私たちは常にコンピューティング予算を持っていました。

友人のために聞いています。

ええ、古典的なコンピューティングでさえ、私たちは常にコンピューティング予算を持っていました。機械学習(ML)では、ちなみに私たちはTPUとGPUの両方を広範囲に使用しています。MLのコンピューティング計画は…私たちは人員計画についても非常に慎重に考えていますが、常にそれを計画しなければなりませんでした。MLコンピューティングについては、余裕のある時期もあれば、会社として制約を受けている時期もありました。

しかし今、それは本当に深刻に制約されています。はるかに多くの時間を費やします。少なくとも私は週に1時間、かなり詳細なレベルでその問題について考える専用の時間を設けています。私はプロジェクト別、チーム別に使用しているコンピュートユニットを把握しており、少なくともその情報を持っており、それを見て評価しています。ある意味で、これは現在行うべき非常に重要なことだと感じています。

不足しているリソースは多くの場合コンピュートであり、だからGoogleの貴重なコンピュートリソースが最も価値のあるイニシアチブに費やされていることを確認しているのですね。

その通りです。

GCPとGoogle Cloudの文脈ではそれについてどう考えますか?なぜならそこでは、自社の目的のためではなく、実際にコンピュートを他者に割り当てており、システム内の制約を考慮すると、その差分的な割り当てをどのように考えているのでしょうか?

そうですね、私たちは事前に計画を立てます。私たちが将来の計画を立てるとき、Cloudチームも将来の計画を立てており、彼らは計画を策定しています。あなたはそれに資金を提供し、私たちの社内ニーズのためにそれを行います。事前計画を立てるのです。その一部として、顧客への長期的なコミットメントにも署名しています。私たちが顧客にコミットしたことは絶対に神聖なものです。これらは契約上のコミットメントです。

計画によってその多くを解決します。計画を立てるとき、私たちは皆、制約のある世界にいます。Cloudチームは望むコンピュートがないなどと言うでしょう。しかし、事前に計画を立てることでそれを解決するのです。

Google Cloudといえば、このセクションのためにとっておいた製品リクエストがあります。あなたが楽しみにしてくれていると知っていますので。

Xに投稿してくれてもよかったんですよ。

まさに。でも、うまくいっていることの一つを言わせてください。GCP/MCPは素晴らしいです。あなたのAIがプログラム的にGoogle Cloudと相互作用できるのですから。おそらくあなた方は、コアな権限に関するもの以外はほぼすべてを公開していると思います。ある意味で、Google Cloudの呪いの一部は、そこにあまりにも多くの機能があることだったと感じています。ログインして、組織、プロジェクトなどを作成し、適切なサービスを見つけるなど、ナビゲートするのが少し難しいと人々から時々聞いていたと確信しています。今ではそれはもう関係ありません。ただ「Google Cloudのこの機能を追加して」と言えばいいのです。それはGoogle Cloudが本当に恩恵を受けていると感じるものです。非常に幅広く、そこには多くの機能があります。私たちはStripeでもこの問題を少し抱えています。機能を追加するにつれて、この大きな製品の表面積をナビゲートする正しい方法は、あなたの代わりにすべてのAPIドキュメントを読んでくれたAIなのです。それは非常にうまくいっています。

AIがあなたが考えるあらゆるもののためのオーケストレーション層になるという約束は、先ほどの質問に戻りますが、企業内のCEOとして社内でさえ、すべてのデータを持っていないわけではありませんが、どうやってそれを1つの場所に集め、それを見るのか。過去であれば、すべてのデータソースを接続するためにもう1つの大きなERPのようなプロジェクトを意味したでしょう。繰り返しになりますが、AIがエンドユーザーにとって意味のある方法でこのオーケストレーション層になることは、見ていて楽しいものでした。製品の表面積が大きければ大きいほど、その恩恵は大きく当たります。Stripeでもそれをある程度見てきましたが、GCPでは巨大な効果があるに違いないと感じています。

私たちはもっとうまくやれると思います。しかしあなたの言う通り、それは計り知れない機会だと思います。私はそれに本当に満足しています。

そして、私の製品の話になります。

第二の製品提案を持ってきたのですか?あなたが先にどうぞ。

言いたかったのですが…OpenClawとそういったもののプロダクト・マーケット・フィットについて私が面白いと思うのは、それらが消費者のためのステートフルな(状態を保持する)AIを可能にしているということです。「私が興味を持っている毎日のニュースをまとめて毎朝送って」といった古典的なこと、あるいは単に永続性を伴う何かをしたい場合、人気のあるAIやメインストリームのAIアプリはどれも永続性を許可していません。それは実現するのでしょうか?

方向性としては、ユーザーに永続的で長期間実行されるタスクを、信頼性が高く安全な方法で行える能力を提供したいと思うはずです。アイデンティティ、アクセスなどを考え抜かなければなりません。しかしそれが未来です。それがエージェント的な未来です。それを消費者に提供することは、私たちが注目している少しエキサイティングなフロンティアです。

これも私からの提案の一つです。これはDreamerという、最近Metaに買収された元StripeのCTOの会社だと思いますが、これの非常に優れたバージョンを作っていました。それは非常に初期の形でした…彼らは永続性を含むカスタムソフトウェアを作っていましたが、仕様を決めることもできました。

自分だけの小さなアプリを作れるのですね。

その通りです。彼らはそれを非常に使いやすくしました。人々がこの体験をすると、驚きと喜びの瞬間があると感じています。私が興味深いのは…

そうですね、事実上、消費者向けインターフェースの下には完全なコーディングモデルがあり、適切なハーネスと適切なスキル、そして永続化し、クラウド内、あるいはローカルとクラウド内で安全に実行する能力が備わることになると思います。これらのプリミティブがすべて一緒になりつつあります。開発者が今直面しているのは…今日、世界の1%、もしかしたら1%ではなく0.1%の人がこの未来を生きていると感じています。彼らは自分のために物を作っていますが、それをマスアダプション(大衆への普及)に持っていくこと。

はい。

それは非常にエキサイティングなフロンティアだと思います。

私のもう一つの製品提案は…すみません、インタビューのこの部分に耐えなければなりませんね。

通過儀礼ですね。

その通りです。私のもう一つの製品アイデアは、なぜか…これがあなたの実際の経験かどうかはわかりませんが、確かに私の実際の経験です…Googleドキュメントでの検索は、例えばGmailでの検索よりもはるかに難しいということです。明らかにどちらも等しく優れた検索エンジンです。しかし何が起きているかというと、キーワード検索はメールにはかなりうまく機能します。なぜなら、おそらくそのメールに固有のキーワードの組み合わせを思い出せるからです。一方、少なくとも私にいつも起こるのは、2026年の予算を振り返って見たいという場合です。Googleスライドで「2026 予算」と検索しても、StripeのPowerPointに存在する単語の文脈において、それらの単語はどちらも特にユニークではないことがわかります。だから全く正しいものを絶対に見つけられないのです。興味があるのですが、スンダー・ピチャイもこの問題を抱えていますか?

どういうわけか、私はあなたが描写しているほど深刻には感じていませんが、あなたがそれを説明すると、私の経験とよく共鳴します。私は文字通り、会話のこのセグメントを誰に聞かせるか頭の中で再生しています。その仕事をしている誰に話しに行くべきか正確に分かっています。私たちはそれをずっと良くすることができると思います。Googleドキュメントを含むこれらのサービスへのAIの統合により、数ヶ月のうちに劇的な改善が見られると思います。最初はみんな、どこかにただ組み込むだけの最初のバージョンを作ったと思います。時間が経つにつれて、コンテキストに何を保持できるか、何をキャッシュできるか、そして実際に何をもたらせるかが重要になります。私たちは多くの進歩を遂げることができると思います。もっと良くなるはずです。

素晴らしい。良い話ができました。

企業内でのAI普及と働き方の変革

私が関わっている多くの企業は、比較的最近設立されたものであっても、製品開発やエンジニアリングの慣行に関するワークフローを劇的にシフトさせなければなりませんでした。デザインチームには誰がいるべきか、その能力はどうあるべきかという考え方さえもです。Googleでもそれらすべてを見直しているのですか?再考していますか?ワークフローやその他の側面に大きな変化はありましたか?

私の言い方としては、それを同心円として考えることができます。Google社内には、より深くシフトしているグループもいくつかあります。私にとっての大きな課題は、特に2026年において、それをどうやってより多くのグループに普及させるかということです。一部は早く行うことができませんでした。なぜなら頻繁に壊れるため、ある種、この有望な新しい世界が見えているのに、それは半ば壊れているような状態だったからです。しかし今年に入り、その曲線はかなり劇的にシフトしていると感じています。特にGDMや一部のソフトウェアエンジニアリングのグループがワークフローを本当に変えているのがわかります。彼らはそれを使っており、内部では外部の同じ製品とは異なる名前で呼んでいますが、内部ではJet Ski、つまりAntigravityです。あなたはそれを使いこなし、エージェントマネージャーの世界に住み、ワークフローを持ち、この新しい方法で働いています。しかしつい先週、私たちはそれを検索チームに展開しました。私たちは常にそれを推し進めています。大規模な組織において、変更管理はこのテクノロジーが普及する上で困難な側面だと思います。小さな会社にとっては簡単かもしれませんが。

すぐに切り替えることができますからね。

業界におけるAIの実際の普及に関して私が見ているいくつかの問題を追加してもいいですか?それらがいつ、どのように解決されると思うか興味があります。私の見るところ、私たちは大きなインテリジェンスのオーバーハング(過剰)を抱えています。AIは今や、抽象的に何ができるかという点において驚異的です。ある企業がどれだけAIネイティブであるか、あるいは単にそのインテリジェンスをどれだけ使用しているかを見ると、おそらく不足が生じるでしょう。私が見ている問題は次のようなものです。

第一に:エンジニアとしてAIをうまくプロンプトできるようになるには、実際に時間がかかります。コードを書くためにAIにより良くプロンプトを出すことも、そうでないこともできます。そして、私たちの場合はStripe特有のプロンプトが多数あり、どのツールを使用すべきかを知る必要があります。プロンプト作成全般が上手であることに加えて、Stripeでのプロンプト作成が上手である必要があります。

次に、AIが生成したコードベースを共有するのは難しいという事実があります。影響範囲(ブラスト・ラジアス)があり、非常に多くの変更を行っており、出荷するまでに何度か書き直す可能性があるほどコードの更新頻度が高いため、コードの速度が遅かった以前に比べて、多くの人がコードベースで協力するのは困難です。

そしてエンジニアリングの枠を超えると、私が見る大きな問題はデータへのアクセスです。エージェントに「世界中の企業の人々が1日に何回『ねえ、この取引の状況はどう?』と言うか?」と尋ねてほしいと思うでしょう。それは企業が知っている情報であり、エージェントによって回答可能であるべきものです。実際にStripeにはクールな機能がいくつかあり、それにかなりうまく答えられるのを見ました。しかし、習慣とデータへのアクセスの両方において、より大きな会社になればなるほど、誰が実際にこのデータにアクセスできるかという権限エンジン、それらすべてを書き直す必要があります。

それから役割の定義に入ります。あなたが言っていたように、エンジニア、PM(プロダクトマネージャー)、デザインというのは少し前の時代のものです。AIがそれらすべてに上達するにつれて、少なくともある場合には、それらの役割を少し統合したいと思うかもしれません。あなたが製品を持っているなら…とにかく、2026年において私が特徴づけたいのは、モデルにはこれだけの能力があるのに、私たちはそれらを少ししか使用していないということです。インテリジェンスの採用はどのようになるとお考えですか?

そうですね、私たちの多くが文字通りGeminiチームと…GeminiのエンタープライズチームとAntigravityチームが、まさにこれらの問題に取り組んでいます。それがあなたが話しているロードマップですよね?私たちは文字通り社内でそれを使用し、これらの障壁に直面し、それを乗り越えて取り組んでいます。それが今出荷されている製品です。私たちはまだそれを普及させているところです。なぜなら人々がそれを使用する過程で、例えばあなたがGoogleのSRE(サイト信頼性エンジニアリング)チームにいるなら、自動化されたワークフローを作成できる部分を突然発見するからです。それがこれらの場所で起きています。しかし、スキルを開発するとき、それがどのように一元化されるのか?それがどのようにモデルや全員が使用できるように利用可能になるのか?アイデンティティやアクセス制御は本当に難しい問題であり、私たちはそうしたことに取り組んでいます。しかし、それらが私たちにとっても普及を制限している重要な要素です。

私たちはセキュリティをはるかに真剣に受け止めているため、そうしなければなりません。それはこれらすべての問題の上にあるもう一つのレイヤーであり、これらのサービスを実行する際のエラーのコストについて、私たちは乗り越えなければなりません。しかしそのおかげで、私たちがそれを解決したときには、より堅牢な方法でそれをもたらし、それが役に立つだろうと思います。今はその固定費を支払っている段階だと感じていますが、私たちがそれを外部にもたらし、他の人々もそれを行うようになったとき、人々ができることのこの飛躍を目にするでしょう。より堅牢な方法で、モデルは改善されています。

Googleは年に数回、事業の見通しを正式に再予測していますよね。少なくともStripeではそうしています。1年の予算を設定し、年に3回、正式な再予測を作成します。考えてみれば、再予測とはある時点の関数のようなものです。事業の状態を取り込みます。その一部は人々の頭の中にありますが、大部分はあらゆるところに書き留められています。「この製品の調子はどう?あの製品の調子はどう?この取引は成立する?あれは起きる?」などです。ある時点でのビジネスの状態を関数に入れると、その年の更新された数値が出てきます。AIが人間を介さずに完全に行う予測というのを想像できますか?Googleの初の完全なエージェント型予測はどの四半期になると思いますか?

これらの分野のいくつかにおいて、2027年が特定の事柄に対する重要な変曲点になるだろうと私は確実に予想しています。それを行う人々でさえ、それが彼らが行うワークフローになるでしょう。もしかしたらしばらくの間は、従来の方法で確認するかもしれませんが、切り替わっていく、クロスオーバーしていくでしょう。しかし、いくつかの変化がかなり劇的に起こる大きな年として、2027年を予想しています。イーラッドの質問は、エンジニアは初期の採用者だが、エンジニア以外ではどうなのかということだったと思います…

なるほど、2027年にはエンジニア以外のプロセスの多くが本当に始まるとお考えなのですね。

先ほどのあなたの質問は、Waymoやロボット工学の企業の文脈での質問だったと思います。私は、そのような企業が…それがスタートアップが持つ一つの利点だと思います。よりAIネイティブなチームであり、おそらく面接プロセスなどを通じてそれを手に入れることができます。一方私たちにとっては、再トレーニングや変革などを伴います。それはおそらく若い企業が持つ利点だと思います。私たちはその変革を推進しなければなりません。

小さなアイデアから始まるGoogleの未来

最後の質問です。Googleで小さく始まったイニシアチブについてたくさん話しました。Transformerのように、そのイニシアチブが始まったときはGoogleの主要な優先事項ではありませんでした。最近Google内であなたが興奮している小さなことは何ですか?人々を驚かせるような。

宇宙空間にデータセンターを作ろうと決めたとき、私たちは非常に小さなチームから始めました。文字通り、最初のマイルストーンに向かうための小さな予算を持った数人です。大きなアイデアであっても、小さく始めることは重要だと思います。それが小さなことの一例です。

そうですね、私は文字通り昨日、訓練後の(ポスト・トレーニング)ある改善について説明してくれている人と時間を過ごしました。ある人が自分たちが行っている改善について話し、それを聞いて私は「おお、これは素晴らしい飛躍として現れるだろうな」と思いました。それがこの瞬間の絶え間ない力です。そのすべてについて、2つ目については具体的には言いたくありませんが、いつか発表すると確信しています。しかし、そういったものが私が興奮している小さな飛躍のいくつかです。

宇宙空間のデータセンターと新しい機械学習技術ですね。

はい。

素晴らしい回答です。スンダー、ありがとうございました。

どういたしまして。本当に楽しかったです。

ありがとう。お気をつけて。

コメント

タイトルとURLをコピーしました