5月20日：Google I/Oで本当に重要だったこと—そしてその理由

3,371 文字

May 20: What Really Mattered at Google I/O—and Why

My site: links: substack: 1. Gemini Becomes the Inter...

5月20日のGoogle I/Oで何が起きたか、これから説明します。私が考える、一年後に私たちが覚えているであろうこと、単なる話題性だけではない部分についてです。まず話題性についてお伝えすると、最も注目を集めたのはダグラス・アダムス風のライブ翻訳でした。ヒンディー語と英語とペルシャ語がステージ上でリアルタイムに翻訳されていました。
彼らによれば、事前にプログラムしたり偽装したりせず、実際に機能したとのことです。しかし、それを超えて、実際に残り続けるものは何でしょうか？
まず第一に、Geminiが新しいインターフェースレイヤーになることを目指しています。AIモードが今週、すべての米国ユーザーに展開されます。従来の検索結果と並んで、Geminiを搭載した会話型ペインが提供されます。彼らはディープサーチ、チャート生成、ショップ機能をAIモードの内部に組み込もうとしています（それがどういう意味かはさておき）。
Googleはパープレキシティからの広告スペースを守ろうとしています。Chat GPTからも広告スペースを守ろうとしています。彼らは検索に他のものを使ってほしくないのです。AppleのEDQが、4月にGoogleからの検索量が20年間で初めて減少したと話しているのを聞いて、彼らが喜ばなかったことは間違いありません。これは明らかにその方向を意識したものです。
第二の大きな結論として、LLMには有料プランのビジネスモデルが登場し、価格帯が見えてきました。月額100〜250ドルの間です。Googleの価格設定は高めで、「AI Ultra」と呼んでいます。これには最高級のGeminiモデル、早期機能アクセス、ChromeでのGemini、エージェント型自動化を備えたProject Marinerなどが含まれ、ワークスペースアプリ全体で高い使用上限があります。
OpenAI、Microsoft、Anthropicとの競争のためには、Googleがアップセルに力を入れることが望ましいでしょう。しかし、最終的に私たちが目にしているのは、基本的にはポケットの中のAIアシスタントに対して毎月3桁のドルを支払う意思のある人々のための新しいクラスの超AIアクセスです。
そして重要なのは、これらは一対一の代替ツールではないため、一部の人々は複数のサービスに対してお金を支払うことになるでしょう。これはケーブルテレビの料金を超えています。人々がChat GPTに200ドル、Googleに250ドルを支払う意思があるということです。合計で約500ドルになります。これが統合され始めるでしょう。
2010年代後半にNetflixとDisney+とPrime Videoの間で起きたストリーミング戦争のように、今やプレミアムクラスのAIサブスクライバー戦争が始まったばかりです。
第三の重要な点は、あらゆる場所での統合についてです。ChromeとGeminiの統合。スマートリプライ機能を備えたGmailへのGeminiの統合。これについては、実際に見るまで信じられません。Google Meetでのリアルタイム音声翻訳と検索ライブを備えたGemini。彼らはマルチモーダル性を拡張しています。基本的に、GoogleはGeminiをあらゆる場所に展開しようとしています。
課題は、Googleに製品の統括者がいないことです。私が懸念しているのは、Geminiは優れたモデルですが、現時点ではChat GPTのようなブランド力を持っていないことです。彼らはこれらすべてのGeminiで範囲を広げていますが、「どこでどのGeminiが使えるのか？」という疑問がまだ消費者の間で浮上しているのは望ましくありません。しかし、モデル自体は優れています。
第四の結論は、推論の深さです。彼らは「ディープシンクモード」を追加しています。これは文字通り、多段階の推論、数学、コードなどのためのものです。これはClaude 3.7の拡張思考のような領域にあります。インターフェースでは「より深く考えてほしいですか？」「高労力モードが必要ですか？」といったオプションが集約され始めています。Gemini 2.5 Proも絶対にその方向に進んでいます。
第五に、Tim CookとMark Zuckerbergが心配すべき点として、Project Auraスマートグラスのプロトタイプがあります。これはライブ翻訳の一部として使用されていました。Androidエコシステムに非常に深く統合されているように見えます。Warby Parkerとの統合により、ファッション面でも真剣に取り組んでいるようです。この分野での真の競争相手のように見えます。
実際に人々の目に届き、この拡張現実のストーリーがどのように展開されるかを見る必要がありますが、デバイスの観点から注目すべきものです。特にMetaとAppleはどちらもこうしたデバイスに取り組んできたので。
第六の結論は、生成メディアのギミックを超えて進んでいるということです。彼らは「Flow」という映画制作アプリを作成しています。これはVeoとImageenを組み合わせたものです。両方を改良して、テキストレンダリングの向上、複数アスペクトのエクスポート、Veoのカメラコントロールの向上を実現しています。
その考え方は、Soraの代替、Runwayの代替となる半プロ級のアマチュアクリエイティブスイートを提供することです。クリエイターを社内に留め、30秒の広告を作るのに外部に頼る必要がないようにします。自分自身でできるのです。
そして第七に、真のエージェントに向けたいくつかのステップがあります。Project Astraは、リアルタイムのカメラ入力に基づいて発言するか行動するかを決定します。これは新しいことです。そしてProject Marinerは、もちろんUltraの中で利用可能で、最大10の連鎖タスクを一度に実行できます。これはまだ制限付きのもので、まだすべての人が利用できるわけではありませんが、Googleは間違いなく積極的なエージェントビジョンを追求しています。
これらすべてがどのように積み上げられるかを考えると、戦略的な質問や、このような動きについて来年または長期的に私たちが自問することについて考えます。この一日全体を見渡しての私の結論の一つは、Googleは配信がボトルネックだと考えていますが、私はそれに同意していないかもしれません。
戦略的な質問として挙げたいのは、どの頑固なボトルネックに対してこの基調講演が攻撃をしかけているのか、そしてその攻撃は一貫しているのかということです。私は攻撃は一貫していると思いますが、同意できるかどうかはわかりません。この場合、Googleはモデル品質ではなく、配信を攻撃しています。基本的に、ほとんどのリリースはGeminiがどこにでも存在することについてでした。Chrome、Gmail、検索、ワークスペース文書作成、AndroidのXRグラスなどにGeminiがあるということです。表面積の問題です。
問題は、私なら配信を彼らのボトルネックとは定義しないだろうということです。そして彼らは、エコシステム全体にわたる一貫した製品視点を持たないことから生じる断片化のリスクを冒しています。単なるリストのように読めないようにすることが、私が彼らに対して懸念している部分です。
価格と容量のしきい値に関して、私が注目するもう一つの大きな部分は、何人の人がAI Ultraプランに切り替えるかです。彼らは、ストリーミング戦争レースにおけるDisney+のような立場にあります。つまり、出遅れています。人々はすでにClaudeとChat GPTで1つか2つのサブスクリプションを持っています。メモリー機能を持ち、あなたを引き込んでいるChat GPT Proを本当に捨てて、GeminiのAI Ultraプランに移行しますか？わかりません。追加する価値はありますか？すべての人にとってそうではありません。これが私が注目している問題です。
以上がGoogle I/Oの初日についての私の解釈です。