
11,132 文字

みなさん、こんにちは。ムハンマドです。この動画は通常の動画とはかなり異なるものになります。実際、このチャンネルでカメラの前で話すのは初めてです。新しいことに挑戦していますので、皆さんに気に入ってもらえると嬉しいです。
この新シリーズでは、LLMを構築している業界の専門家や、開発者がこれらのシステム上で構築できるよう支援している人々と対話していきます。目標はシンプルです。業界の洞察を開発者に届け、世の中で見られるような誇大宣伝なしに、思慮深いシステムを構築できるよう開発者を支援したいと思います。
数週間前、Googleのカンファレンス「Next」に参加し、Google Cloudの開発者アドボカシーディレクターであるマット・トンプソンさんとお話する機会がありました。Google Cloud、Gemini、そして何故か誰も話題にしていないGemini オンプレミスについて話しました。これは私が思うに、しばらく見ていなかった最も魅力的なアイデアの一つです。また、ADKについても多く議論しました。
この会話を楽しんでいただけると思います。これが業界の専門家との多くの会話の最初の一つになることを願っています。ぜひフィードバックをいただければと思います。また、特定のゲストをご希望の場合も、ぜひお知らせください。それでは、この対話をお楽しみください。
マット、今日はいかがですか?
とても良いですよ。素晴らしい一週間でした。正直に言うと、ラスベガスには多くの人がいて、少し人に疲れてきています。開発者は常に大好きですが、他の人たちには少し疲れました。歩き回ることも多かったです。良い食事と天候に恵まれ、素晴らしいデモも見られました。楽しかったですが、疲れました。
そうですね、今日が最終日ですよね?この後は帰宅できますね。
そのとおりです。
開発者向けに多くのものがリリースまたは発表されましたね。開発者が何に期待すべきだと思いますか?
開発者が期待すべきことはたくさんありますが、リストが非常に長いので、まず2つ選びます。
まず、エージェント開発キット(ADK)は、誰もがエージェントを始めるための大きなチャンスです。これは私たちのやり方を大きく変えるからです。現在のエンタープライズアプリを考えると、古いモデルではXMLスキーマを公開し、誰かがそれをクエリして、あなたのサービスが何をするのかを理解し、そのサービスを呼び出す方法を考えます。それは旧式です。
その後、ウェブやRESTAPIを使い始めましたが、基本的な考え方は同じで、相手が何をするのかを理解してから利用する必要がありました。エージェントでは、目的を持って行動します。つまり、「Xをやってほしい」と言うソフトウェアを構築するのです。
よく例に挙げられるのは航空券の予約や小売での購入です。興味深いことにB2Bシナリオでは、500の異なるサプライヤーからコンポーネントを入手する場合、500の異なるクエリを行う必要はなくなります。「毎週、毎月、または特定の在庫レベルに達したときに必要なものの明細を取得してほしい」というエージェントを構築できます。
そしてサプライヤー側にも、エージェント間の相互作用を可能にするエージェントを構築する意義があります。このため、ADKが非常に興味深いと考えています。これはそのための基本です。人々がエージェントで遊び始めることができます。エージェントの最高の組み合わせが何になるか、今は誰にも言えません。しかし、開発者がAzureで遊び始めることを可能にします。これが一つ目です。
二つ目は、製品発表というよりも、私たちが示した方向性ですが、プラットフォームがより知的になるということです。つまり、プラットフォームが多くのことを処理し、アプリケーションを構築する際に心配する必要がないようにしたいのです。
ここで話したことの一つで、本当に興味深いと思うのは、コストを知るためにプラットフォームにクエリを送る必要がなく、週に一度、一日に一度、または月に一度自動的に知らせてくれるというものです。そうすれば、モデルを使っていて、コントロールが効かなくなることはありません。例えば、キャパシティや設定したコストの90%に達したときに通知してほしいと言えます。
これは開発者が注目すべき最も重要なシグナルだと思います。大手クラウドプロバイダーについて考えると、AWSやAzureがどうなるかは皆想像できますが、Google Cloudは最も知的なクラウドプラットフォームになるでしょう。それに近いものは他にありません。それが私たちが示すもので、私が非常に興奮していることです。
エージェント開発キットに話を戻すと、オープンソースにした哲学は何ですか?広く採用されることを目指しているのか、コミュニティからのフィードバックを得ることが目的なのでしょうか?
あなたは友達なので正直に言いますが、採用もフィードバックも欲しいですし、それらはすべて事実です。実際には、おそらく1000以上の異なるエージェントフレームワークやエージェントが関与するさまざまな方法があるでしょう。Googleがやっているのは、早期に出て、一つのやり方にモメンタムをつけようとしています。
私たちはそれが正しい方法だと考えていますが、他の方法もあるかもしれません。ここでステージ上で言ったことの一つは、多くの異なるエージェントフレームワークと相互作用することを期待しているということです。ADKの背後にある考え方の一部は、エージェントがどのように構築され、相互作用し、機能し、デプロイされ、管理されるかについての抽象的ではなく、かなり一般化された見方を提供し、それを他の人々が考案するあらゆるフレームワークと連携させることです。
オープンソースで公開する理由の一つは、初期採用を可能にし、人々に試してもらうことです。現在、私たちにとって最も重要なのは、人々にこの世界がどのようになるかを考えてもらうことです。エージェントがどのように機能するかについて500の異なるシナリオを挙げることができますが、どれが正しいかはわかりません。そこで、開発者エコシステムに遊んでもらい、何が成功するかを見始めたいと思います。
この時点では、より意見の強い実装になるのでしょうか?
私たちが意見を持っている部分があると思います。例えば、エージェントの相互作用、通信方法、管理方法などです。セキュリティも大きなテーマです。ここではあまり話していませんが、理解すべきことの一つが、ちょっと抽象的な話になりますが、「不正エージェント」についてです。システムはどのように不正エージェントを管理するのか?不正エージェントが他のサービスを破壊できるように構築できるのか?もちろんできません。
そのため、少なくともGoogle Cloud上では、エージェントは明確に定義され安全な方法で他のエージェントと相互作用します。ADKを公開する一部の理由は、開発者に考えてもらうことです。悪意のあるエージェントを構築してもらいたいわけではありません。それが目標ではありません。しかし、人々がそれに苦しむことも望んでいません。
そのため、エージェントの能力に制約を設けています。例えば、エージェントはポートを破壊することはできません。そのような考え方の一部です。
セキュリティについて触れてくれて良かったです。他のフレームワークはおそらくあまり注意を払っていないと思いますが、それは本当に大きな懸念事項です。エージェント間通信を発表したとき、MCPとどのように連携するのかという質問が多く寄せられました。
これは素晴らしい質問です。開発者キーノートでは、2つの異なるレベルの関与について話しました。MCPとAA(エージェント対エージェント)です。これについての最高の考えをすべてお伝えしたいのですが、実際にはまだ考え中です。
将来、エージェントからMCPへの関与やMCPからエージェントへの関与があるでしょうか?これはGoogleの発表ではありませんが、可能性はあります。現時点では、それらを異なるものと見なしていますが、異なるとは言いたくありません。おそらく2つの異なる関与レベルと言えるでしょう。
質問に答えるなら、しばらくお待ちください。どうなるか見てみましょう。
クラウドに話題を変えたいと思います。重要だと思うが注目されていない発表の一つがGoogle分散クラウド、特にGeminiオンプレミスです。モデルの重みの漏洩などについて懸念はありますか?これを可能にするのは大きなことだと思います。
素晴らしい質問です。今週の話をよく聞いていて、すでに発表内容を理解し、良い質問をしていますね。
興味深い答えがあると思いますが、多くのことをまだ考える必要があることも言っておきます。まず哲学について少し話しましょう。
少し前に、Anthosという製品がありました(現在は別の用途に使用しています)。その考え方は、Google Cloudを他のインフラストラクチャ、オンプレミスなどにデプロイできるかということでした。その理由は、Google Cloudのサービスをエッジや他のインフラストラクチャに持っていく必要があると考えたからです。
この考え方は5年前からあります。Geminiについて考えると(他のインフラストラクチャとは関係ありませんが)、この考え方はすでに私たちの中にありました。そこで問題になったのは、Geminiが十分に人気があるか、または価格性能が十分に良いので、他のプラットフォームに持っていきたいかということでした。実際、そうなのです。
統計的に有意ではありませんが、いくつかの指標があり、コミュニティの人々がAPIコールを通じてGeminiの価格性能が業界で最高だと言っています。そうであれば、より多くの人に利用可能にしない理由はありません。そこで、Geminiを他のプラットフォーム、オンプレミスなどに持っていく機会があることが明らかになりました。まだ解決すべきことがたくさんありますが、それが背後にある哲学です。
また、友達同士の話ですが、Geminiをより多くの開発者に利用可能にしたいという思惑もあります。なぜプラットフォームだけに限定するのでしょうか?他のプラットフォームでどれだけ人気が出るか分かりませんが、セキュリティの部分は本当に興味深いですね。自分のモデルの重みがあった場合、それが突然別のプラットフォームで安全に保護できるかという疑問があります。これらの質問はまだ開かれており、どのように対処するかを考えています。
哲学的な観点から言えば、簡単に誤用されるモデルを公開したくありません。
理解できます。もう一つの質問として、他のフロンティアラボのほとんどは、月額でより高価なパッケージをリリースしていますが、Googleはどのようにしてこれらのモデルを無料で提供できているのですか?
素晴らしい質問です。まず開発者向けの答えの前に、Googleの答えを提供します。
Googleの答えは、何度も聞いたことがある人には申し訳ありませんが、現時点で私たちは唯一のハイパースケーラーとして、チップからフルスタックまでカバーできます。これにより、他にはない規模の経済性が生まれます。NvidiaやAMD、そして私たち自身のTPUなど多くのパートナーがおり、これにより他では真似できないインフラストラクチャを構築できます。
まず、スタックを正しく構築すれば、私たちの規模の経済性は他よりも優れていることがわかります。そうでなければなりません。なぜなら、私たちは底から上まで構築している唯一の存在だからです。
これは開発者にとって素晴らしい答えではないかもしれませんが、これがコスト管理の方法です。実際には、これは非常に規模のビジネスです。より多くの開発者がこれらのリソースを使用するほど、より良い価格性能を得ることができます。
一人の顧客に最大のモデルを提供することは、最も高価なことです。多くの開発者に最大のモデルを提供することで、コスト効率が良くなります。また、非常に積極的な姿勢も見せています。
次の10年間コスト効果的にできるかどうかは、達成すべき規模の経済性があります。例として、ここで新しいTPUについて話しました。NvidiaチップやAMDチップは素晴らしいものですが、より多くの開発者がTPU向けのワークロードを構築することも望んでいます。それによって、さらなる規模の経済性を提供できるからです。
TPU上でのオープンソースモデルのパフォーマンスはどのようなものでしょうか?これは本当に興味深いポイントです。私たちは、実行したいモデルに特化したハードウェアを構築する能力を持っています。そのようにはしませんが、GPUやTPU、モデルを選んで動作させるわけではありませんが、確かにパターンを見始めることはできます。Google社はこの分野で非常に積極的だと思います。
興味深いですね。TPUに対するVLMサポートの発表がありましたね。これはGoogleがオープンウェイトモデルをサポートしたいという意図を示していると思います。
その通りです。すでにGoogle Cloud上でそれらのモデルをホスティングしていますね。
そうですね。そして質問の方向性は理解しています。私たちの答えは、選択肢が重要だということです。Googleが「モデルは選択肢」と言い始めるとは思いませんが、私たちは業界で最もオープンで、最も完全で、最も高性能なクラウドを提供したいと考えています。
そのため、GeminiやGemmaがどれほど素晴らしくても、人々が使いたい他のモデルに対するソリューションを提供する必要があります。
それは良いポイントです。多くの人が混乱している点として、AIスタジオとVortexをどのように使い分けるかという問題があります。
この質問は素晴らしいです。ありがとうございます。お答えする内容は、もっと詳しく知りたいと思われるかもしれません。
まずペルソナから始めましょう。私は開発者担当なので、もし学生や米国のK-12または大学生であれば、AIスタジオから始めるでしょう。プロンプトを学び、Geminiに何かをさせるという学習から始めたいでしょう。
実際、米国で大学生の子供が2人いますが、両方ともコンピューターサイエンスを勉強しており、AIの旅はAIスタジオから始めました。しかし、昨日の開発者キーノートで聞いたように、それをデプロイして他の人に提供するアプリケーションを構築したい場合、AIスタジオはそのためのプラットフォームではありません。
デプロイしたい時点があります。私はシリコンバレーに住んでおり、サンフランシスコによく行きます。仕事の一部はスタートアップと話し、彼らが何をしているかを聞くことです。ある特定のスタートアップの名前は挙げませんが、5週間前に「Vertexが嫌い、Geminiが嫌い」とXに書いていました。
それで目が覚め、彼らと話し、協力しました。今では彼らはGeminiを愛しているという多くのYouTubeビデオを公開していますが、Vertexは彼らの第一選択ではありません。私たちは人々に選択肢を与えたいのです。
あなたが言及しなかったのは、Cloud Run上でGeminiを実行することについてです。スタートアップの観点から、もし私がスタートアップを持っていて、スタートアップの創業者と話していて、彼らがちょうど始めたばかりだが、人々に提供するアプリケーションを構築することを知っていたら、通常スタートアップは3か月間遊んでから何かを構築する時間はなく、ゼロから始めて数週間または数か月以内にMVPに到達する必要があります。
Vertexから始めるのは悪い答えではありません。なぜなら、簡単にスケールアップできるからです。しかし、そのインフラストラクチャを設定するのは比較的難しいです。Cloud Run上でそれを実行することは、彼らにとって本当に興味深い機会です。
一方、エンタープライズで、そのインフラストラクチャや管理されたプロセスが必要だと知っている場合、私はVertexから始めて、最初の負担を受け入れるでしょう。私たちはそれをはるかに簡単にしています。最近の調査によると、人々は数日でVertexを立ち上げて実行できることがわかっています。しかし、それは数時間ではありません。
多くの人々、特に開発者がAIスタジオから始める理由は、それが最も簡単なインターフェースだからですね。しかし、そこからVortexへの簡単な移行が見えません。
私たちが行ったことの一つについて話しましょう。前進する道筋を実装しようとしています。最初のステップは共通のSDKでした。
1年前に話していたら、なぜ2つのSDKがあるのかと聞かれたでしょう。2つのプラットフォーム、2つのSDK。そこで私たちは両方に共通のAPIを備えた共通のSDKを公開しました。これが最初の部分です。
では、AIスタジオで構築し始めたものを簡単にVertexにデプロイするにはどうすればよいでしょうか?ここでは何も発表しませんが、問題を理解しており、将来的に取り組む予定だと想定してください。素晴らしい質問であり、聴衆の皆さん、これが問題であることは認識しています。
共通SDKを取り上げてくれてありがとう。それによって移行は比較的スムーズになります。
スムーズになりますが、まだやるべき作業があることも知っています。
また、Googleは非常に興味深い立場にあると思います。なぜなら、最先端のフロンティアモデルをリリースするだけでなく、Gemmaのようなオープンウェイトモデルもリリースしているからです。そこにはどのような哲学があるのでしょうか?
素晴らしい質問です。ここで少し私の仕事の範囲を超えて、Googleがやっていることを見るには、DeepMindを含める必要があります。
DeepMindは私たちのビジネスの研究部門であり、研究機関として彼らは素晴らしいです。多くの人がDemisが最近化学のノーベル賞を受賞したことを知っています。化学のノーベル賞を受賞したリーダーを持つテクノロジー企業は多くありません。それは生物学の研究を進めるために彼らが行っていた仕事から生まれたものです。
世界中のトップ1000人あるいはトップ10,000人の研究者と協力する研究部門は、企業の開発者やスタートアップの開発者とは異なるニーズを持っています。オープンウェイトモデルやGemmaのようなものを見始めると、モデル自体への制約のないアクセス、重みの変更、さらには蒸留の一部の変更を必要とする企業や大学の多くの研究部門があります。
研究側からすると、それを可能にしたいと考えています。これは彼らの哲学ではなく私の哲学ですが、革新は他の場所で起こると常に信じてきました。つまり、戦略を持つ必要があります。すべての賢い人があなたのために働くわけではありません。
それでは、他のすべての賢い人が興味深いことをするのをどのように可能にするのでしょうか?これがDeepMindの戦略です。他のすべての賢い人が興味深いことをするためのインフラストラクチャ、ツール、能力を作成したいのです。
これが、私たちがクローズドモデル、オープンモデル、オープンウェイトなどを提供する理由の基礎です。企業商業側ではどうなるのでしょうか?それは、多くのオープンソース開発者や他の企業もそれらを使いたいと思っているからです。これが私が提供できる最良の回答です。これは私個人の哲学です。
DeepMindの人々と話せば、彼らの主な対象は研究者だと言うでしょう。Google Cloudの人々と話せば、私たちの主な対象は明らかに開発者と顧客です。
理解できます。答えがあるかどうかわかりませんが、Googleはこの2つの並行したパス、つまり小さいオープンウェイトモデルと最先端のクローズドソースモデルを続けると思いますか?または、以前の世代のモデルをオープンソース化するような方向性はありますか?
とても興味深いですね。毎年IT分野の予測をしていますが、あまり上手くないので、Googleの将来がどうなるかを予測できるかどうかわかりません。
研究機関、大学、学生などに対してオープンモデルを提供し続けると思います。なぜなら、そこには非常に価値があるからです。商業側については、会社として学んだ最も興味深いことの一つは、大きなモデルから小さなモデルを導出して、大きなモデルのすべての知識を持ちながら価格性能を向上させることができるということです。
これを哲学的な観点から考えると、その大きなモデルの境界を押し広げ続け、各市場や機会に応じて望むものを抽出する価値があります。それらをオープンにすることも問題ないかもしれません。将来何をするかは予測できません。
理解できます。これは素晴らしいです。開発者の視点に戻りましょう。開発者として、さまざまなクラウドプロバイダーがある中で、なぜGoogleを気にするべきなのか、あるいは何が異なるのでしょうか?
その質問は大好きです。私の傲慢さが出るかもしれないので注意しなければなりません。
会社名は言いませんが、以前別のハイパースケーラーで10年間働いていました。市場でナンバーワンかナンバーツーだったかによります。5年前にGoogle Cloudを選んだのは、特にイノベーションに最高の機会があると思ったからです。
すでに他の場所で起こるイノベーションを可能にする必要があるという哲学について述べました。それはGoogleでも起こります。少し話をさせてください。物語が好きなんです。
Googleには非常に知的な人々がいるため、部分的にGoogleに来ました。これまで働いた中で最も賢い会社の一つですが、賢い人全員がGoogleで働いているわけではありません。実際、私たちは非常に大きなエコシステムの中の非常に小さな割合だと思います。
では、これらの人々が興味深いことをするのをどのように可能にするのでしょうか?これが開発者に対する私の哲学です。私の目標は、彼らが何に興奮していても、プラットフォーム上でのイノベーションを可能にすることです。それはゲームかもしれませんし、古典的なIT、SASアプリケーション、AIベースのもの、ソーシャルなどかもしれません。
私にとって、Googleが勝っているとすれば、その理由は性能、能力、オープン性の間で最高のバランスを持っているからだと思います。いくつかはよりオープン、いくつかはさらに高性能、いくつかはレゴのように小さなピースを一つ一つ組み立てる必要があります。私たちの目標は非常にシンプルです。顧客がプラットフォーム上で非常に効果的になれるようにし、個人的には開発者が何をしたいと思っていても革新できるようにすることです。
私たちは、聴衆の皆さんが聞いて笑うかもしれませんが、開発者がプラットフォーム上で開発する際のあらゆる障害を取り除くことを目標としています。まだそこには達していません。
これはツールにも関わってくると思います。開発者向けにどのようなツールを構築していますか?
プロンプトをありがとうございます。はい、開発者がより革新的になる一つの方法は、複雑さを抽象化できるようにすることだと考えています。
私の子供たちは常に、私がCS(コンピューターサイエンス)を勉強していた頃は彼らがやっていることに比べて簡単だったと言います。「それは違う。あなたたちはPythonを使っている」と言うと、「私はJavaを世界に届けるのを手伝った。あなたたちはすべてのランタイムが使いやすく、メモリが管理されているような高レベル言語をすべて使っている。それは簡単だ」と言います。
「いや、違う。私たちはあなたが始めた頃よりもはるかに複雑なアプリケーションを構築しているんだ」と彼らは言います。ツールはその複雑さを抽象化する方法です。
先ほど言ったように、私たちはプラットフォームにインテリジェンスを構築しようとしています。それはツールの一形態です。開発者向けのツール側では、少し大げさに言うと、私たちは世界が進んでいる方向として、IDEがバックグラウンドに消えていくと考えています。日付は指定しませんが。
IDEの中に住んでいるわけではなくなりますが、IDEが提供するサービスはツールから利用できるようになると思います。例えば、GitLabを使っているとか、コードを管理するためのものを使っていれば、そこからサービスが来ます。実際、多くのソフトウェア開発ライフサイクルサービスはソースのある場所から来ると言えるでしょう。
また、コードアシスタンスも必要です。私は常に子供たちに「大学での作業のどれくらいが、あなたの脳よりもコードアシスタンスを使って行われているの?」と聞いています。彼らは「あ、ほんの少しだけ使っているよ」と答えますが、私はそれを信じていません。
バイブコーディングですね。そうです。実際、米国の大学で今大きなことの一つは、ハッカソンです。学生主導のハッカソンです。息子は大学のハッカソンを組織するのを手伝っています。彼らはアイデアを取り、それを発展させたい人のためのバイブコーディングブラケットを実施しました。私は「おお」と思いました。信じるかどうかに関わらず、特に心配している人々によって使われています。
ツールは本当に重要だと思います。私たちにとってコードアシスタンスはいくつかの異なるものを意味します。ここでFirebase Studioを発表しました。より完全な環境(デプロイメントを含む)で始めたい開発者にとって、Firebase Studioは素晴らしく、コードアシスタンスが組み込まれています。
より伝統的な空間で作業している場合、コードアシスタンスがあり、使用したいほとんどのIDEにプラグインできます。将来的にはIDEの中に住んでいないかもしれないと言いましたが。
私たちがここで話した他のことは、プラットフォームにインテリジェンスを構築することで、実行時、デプロイ時、そして後の管理時にも支援できるということです。
これは本当に洞察に満ちています。バイブコーディング時代の新進開発者へのアドバイスはありますか?
友達とやるということですね。好きな人とやるということです。コラボレーションは本当に重要です。業界では皆知っていることです。私のチームは何でもコラボレーションします。人々のコラボレーションの能力と関心を測定しています。ローンウルフモデルは消えました。
バイブコーディングは、一緒にやる人とうまくいくなら本当にうまくいきます。一緒にやる人が好きではない場合、それはバイブコーディングではないかもしれません。何か別のものかもしれません。
それは本当ですね。それでは、この辺で締めくくりましょう。マットさん、機会をありがとうございました。素晴らしい議論でした。皆さんにも楽しんでいただければと思います。視聴いただきありがとうございました。また次回お会いしましょう。
どうもありがとうございました。


コメント