Google I/O 2026での新しいGemini 3.5 Flash、Antigravity 2.0、Omni FlashがAIを熱くする

Google・DeepMind・Alphabet
この記事は約20分で読めます。

Google I/O 2026で発表された多数の新しいAI製品やアップデートについて、主要な注目ポイントを詳しく解説する動画である。新しいAIモデル「Gemini 3.5 Flash」の性能や、プログラミング支援ツール「Antigravity 2.0」の進化、進化した動画生成AI「Gemini Omni」、そして一般ユーザー向けの新ツール「Gemini Spark」など、実機での検証を交えながら最新のAIトレンドを紐解く。

NOVO Gemini 3.5 Flash, Antigravity 2.0 e Omni Flash no Google i/O 2026 Aquecem a iA
Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

Google I/O 2026の巨大な発表とAI市場の行方

みなさん、こんにちは。この火曜日にGoogle I/Oが開催され、Googleは本当にたくさんの製品を披露してくれました。Gemini 3.5 Flash、Antigravityの新バージョン、彼らの新しい動画生成AI、Gemini Omni、そしてGemini Sparkなど、他にも数多くの新要素があります。相変わらず、Googleは情報が山ほど詰まった巨大なローンチを行ってくれますね。今回の発表は2時間近くに及びましたので、その中から私が最も重要だと判断した内容を絞ってお話ししていきます。というのも、現在Googleが一番気にしているのは、市場の基盤を固めること、そして自社が開発しているものを強固にすることのようです。新しいニュースは途切れることなく届いていますからね。それでは、今何が起きているのかを一緒に理解していきましょう。さあ、始めましょう。

いつも動画に高評価をくださるみなさん、そしてチャンネル登録をしてくださっているみなさん、本当にありがとうございます。そして、この人工知能チャンネルをスポンサーとして支えてくださっているチャンネルメンバーのみなさんには、特別な感謝を申し上げます。メンバーのみなさんは、WhatsAppやMCPの統合、PDFの読み込みなどを実践するインテリジェントエージェントに関する限定動画や、その他の先行公開動画を視聴できますので、ぜひチェックしてみてください。

さてみなさん、冬が近づいてきて少し肌寒くなってきましたが、Googleは非常に興味深い発表を次々と繰り出しています。今回はその主要なリリースを観察し、新しいGemini 3.5モデルといった極めて重要な要素や、何が起きているのかを理解しておくべきAntigravityの新バージョンについてコメントしていきます。

私たちが頭に入れておかなければならないのは、今まさに直面しているテクノロジーの変革の規模についてです。世間ではまだ、現在の状況はただのハイプ(一時的な大騒ぎ)だとか、いつか弾けるバブルだと言っている人がたくさんいます。しかし、私は以前から言っているように、このバブルは弾けたりしません。私たちは単なるハイプを通り越しているのです。テクノロジーは変わり、それも力強く変化しました。

非常に興味深いデータがあります。2024年の時点で、彼らは月に9.7兆トークンを処理していました。そこからのトークン利用の進化を見てください。2025年5月には480兆トークンに達しました。これは9.7兆の約48倍という膨大な量です。そして現在、2026年5月になると、なんと3.2京トークンを処理しているのです。サンダー・ピチャイ自身もコメントしていましたが、Googleの発表会でこのような桁違いの数字を口にするとは夢にも思っていなかったそうです。

彼らの投資額は、2022年の310億ドルから、今年は1900億ドルを費やす見込みにまで膨れ上がっています。これはブラジルの通貨レアルに換算すると、およそ1兆レアルに相当します。みなさん、この意味が分かりますか。これはキャペックス、つまり設備投資のことです。データセンターの契約や物理的な機材の購入、資産の取得といったインフラのためだけに、これだけの金額を費やしているのです。この計算には、DeepMindの運営費や、Googleの内部で動いているソフトウェア開発インフラなどのコストは一切含まれていません。

ですから、動画を見ているみなさんにもハッキリとお伝えしておきます。もし、今起きていることが、すぐに過ぎ去るちょっとした流行や波にすぎないと考えているなら、それは間違いです。私たちは歴史的な瞬間に立ち会っているのです。将来、人々は2023年のことを、人類の方向性が変わった年として語ることになるでしょう。間違いありません。ですから、これからは物事が前進する一方だと覚悟を決めておいてください。

既存製品の強化と一般ユーザーへのアプローチ

先ほども言ったように、Googleは自社の製品がより良く機能し、一般のユーザーの役に立つようにすることに注力しています。たとえば、Google マップ上で会話をしながら、買い物をしたい場所を探してもらうよう頼める「Ask Maps」が導入されます。YouTubeでも同様に「Ask YouTube」が登場し、会話を通じて自分の興味がありそうな動画の提案を受けたり、今見ている動画の内容についてAIとチャットしたりできるようになります。

他のOpenAIやAnthropicといった新興企業は、今まさに自社製品を作り出してなんとか軌道に乗せようとしていますが、Googleはすでに持っている膨大な既存製品をどう活かすかという点を非常に重視しています。

たとえば、動画を視聴しながら、この自転車のペダルは交換時期かな、それともまだ大丈夫かな、と質問し始めるような使い方がごく当たり前になっていくでしょう。人工知能が動画の映像を見て、的確な回答を返してくれるのです。今のところ、この機能は夏に米国限定でテスト公開される予定となっています。

ただ、今この瞬間にYouTubeを開いても、すでにAIに質問できる機能は一部に存在しています。私がよくやるお決まりのプロンプトがあるのですが、動画の投稿者がタイムスタンプを書いてくれていないときに、ここで話されている内容のタイムスタンプを作ってください、下に書く形式に合わせて、内容をスキップしないでください、と指示を出します。すると、AIは実に見事に、正確な時間とともに内容を書き出してくれるのです。これが信じられないほどのクオリティで動作します。

たとえば、このDocs Liveのデモ映像で私が9分12秒のところをクリックすると、寸分の狂いもなくその場面に飛びます。本当に悔しいくらい完璧に当ててくるのです。

日常の作業をシンプルにするDocs LiveとGemini

Docs Liveの狙いは、まさにその名前が示す通り、アプリと会話をしながらドキュメントを作成することにあります。今回の発表会で見せられたデモのすべてに共通しているのは、とにかく操作を可能な限りシンプルにしようとしている点です。文書を書くためにドキュメントと会話をし、スケジュール管理や情報の処理、招待の送信、参加者の確認を行うためにカレンダーと会話をする。

このデモの場合、ユーザーはスマートフォンのアプリと会話しながらドキュメントを作成し、中に含めたい内容を一つひとつ説明しています。すると人工知能がそれを形にし、その後でユーザーが、この部分はテーブル(表)にできるかな、といった修正を指示していくことで、ドキュメントがどんどん洗練されていきます。

そんな機能はもうすでにあるのでは、と思う方もいるかもしれません。実際、その通りです。Google ドキュメントを開いてサイドパネルを表示すれば、そこにはすでにGeminiがいます。ですから、今変わろうとしているのは、インタラクションの形式そのものだと言えます。アプリ内に深く組み込まれ、より簡単に使えるようになっているのです。

この機能も、夏にProとUltraのユーザー向けにリリースされる予定で、まだ一般には利用できません。今回の新機能の大部分はまだ使えませんが、少なくともGemini 3.5、Antigravity、そしてGemini Omniはすでに利用可能なので、後ほど検証してみましょう。

Google独自チップTPUの進化と未来予測

私たちはよくNvidiaのことばかりを話題にしますが、Googleも独自のハードウェアを製造し、TPUというチップを開発していることを忘れがちです。そして、これらのTPUもまた、ますます高速で効率的になっています。彼らが今回発表した新バージョンは、電力消費が大幅に抑えられており、処理速度も向上しています。

会場ではコード生成のデモが行われ、あの有名な恐竜のゲームが生成されました。そこで注目を集めたのが、コード生成中のスピードのピークが、1秒あたり1000トークン近くに達していたことです。これは信じられないほど高速です。

そうなると、これからの10年間で何が期待できるでしょうか。現在、信じられないほど巨大なこれらのLLMが、10年後にはUSBメモリほどのサイズに収まっているかもしれません。中には、コンポーネントの物理的な限界に達しているから、これ以上の進化は無理だと言う人もいるでしょう。しかし、その疑問にはあまり意味がありません。1950年代にも、人々は同じように、これ以上どうやって進化させるんだ、技術の限界だ、と言っていたのですから。答えはシンプルです。それがどのように実現されるかは今の私たちには分かりませんが、人間はその知性を駆使してこの種の課題に挑み、必ず解決策を見つけ出すということです。

進化した動画生成AI「Gemini Omni」の実力

そして、今回の大きな目玉の一つがGemini Omniです。これはVEO 3やVEO 3.1から進化した動画生成AIです。基本的なコンセプトは、より安く、より速く、絶え間ない改良が施されており、動画に対する指示や編集のインタラクションが格段に簡単になっています。

今回のバージョンで私が最も気に入ったのは、ついにキャラクターの固定・統合が可能になった点です。たとえば、自分が鏡に触れている動画があるとして、人工知能に向かって、彼が鏡に触れた瞬間にその手を鉄の手に変えて、と指示を出すことができます。今画面で見えているのがまさにそれです。彼が鏡に触れると、指示通りの変化が起きます。

このテストは動画の最後でお見せします。実は私も最初は本当にそんなことができるのか疑わしかったのですが、実際にどうなったかをお見せします。

他にもいろいろな編集が可能です。動画をアニメ風に変えたり、布の人形に変えたり、フル3Dの映像に変えたり、マインクラフト風のキャラクターに変えたりと、自在に加工できます。オリジナルの動画でバイオリンを弾いている人がいるとして、背景を芝生に変え、シーンからバイオリンを消して手だけで演奏しているように見せることもできますし、見ているシーンのアングルそのものを変更することさえ可能です。これらが信じられないほど簡単にできるようになりました。このGemini Omniについては、非常に素晴らしい出来栄えなので、いずれ専用の動画を1本丸ごと作って解説するかもしれません。

開発者向けツールAntigravity 2.0とGemini 3.5 Flash

もう一つの新要素はAntigravity 2.0です。これによって、より簡素化されたバージョンでのプログラミングが可能になります。先ほども触れたように、最近のバージョンは簡略化される傾向にあり、今回はIDE(統合開発環境)バージョンと通常バージョンの2種類で動作します。

ここで少し混乱が生じており、多くの人が通常バージョンをインストールした結果、そこにはIDEが含まれていないという問題が起きています。プログラマーにとって、IDEの部分がなければ仕事になりませんからね。このバージョンには、今回リリースされたGemini 3.5 Flashがすでに組み込まれており、今すぐ利用可能です。

ただ、会場でGemini 3.5 Flashについて発表されたとき、観客の反応はそれほどポジティブではありませんでした。私を含め、多くの人が新しいモデル、つまりバージョン4が登場することを期待していたからだと思います。そのため、3.5が発表されたときは、まあ、少しは改善されたんだろうけど、というような空気になっていました。

さらに、Proバージョンは来月リリース予定だと告げられたときも、観客はあまり嬉しそうではなく、将来は使えるようになるけれど、今はないんだね、という反応でした。

これについて、私にはひとつの仮説があります。間違っているかもしれませんが、みなさんもどう思うかコメントで教えてください。私は、これから彼らがリリースするモデルは、既存のものを大幅に超えるようなものにはならないのではないかと考えています。現在あるものよりも一段上のカテゴリに位置するような強力なAIは、すべて自社のラボ内に秘匿し、一般ユーザーにはこうした簡素化されたバージョンだけを提供し続けるのではないでしょうか。

というのも、これらのツールが持つ商業的価値は計り知れません。おそらく彼らは、その強力な力を自社のツール内部に適用して独自の製品を作り、科学研究を行い、すべての利益を内部に囲い込もうとしているのだと思います。そして、なぜモデルをそれ以上改良しないのかと尋ねられたら、安全性の問題があるからだと答えるわけです。これが私の意見です。陰謀論のように聞こえるかもしれませんが、みなさんも同じような空気を感じているかどうか、ぜひコメント欄で教えてください。

さて、Antigravityの主なコンセプトは、画面の片側で自分のプロジェクトについてチャットをし、中央で会話を進め、右側にはコードのセクションやチャットが実行している内容のドキュメントが表示されるというものです。このスタイルのプログラミングは、コードがどう書かれているかを細かく気にしたくない人にとって非常に理にかなっています。まさにバイブコーディングをしているような人向けで、次々と質問を投げかけ、AIに作業を頼み、そのタスクが完了したかどうかをただ見守り、最後にコードを実行して終わり、という進め方です。

前述の通り、以前と同じように動かせるIDEバージョンも実行できますし、ユーザーエクスペリエンスに特化して指示を出しながらタスクの進行を見守るこの2.0バージョンも利用可能です。

クラウド型エージェント「Gemini Spark」の登場

私がなぜこのような考えに至ったのか、その完璧な例がGemini Sparkです。Gemini Sparkは、基本的にはAntigravityと、先ほど紹介したDocsのチャット機能を組み合わせたようなツールです。人工知能と会話をしながら、あらゆる作業を代わりにやってもらうための、すべてのツールの融合体と言えます。

たとえば、自宅でAntigravityを使って作業していて、PCを閉じるとローカル環境での動作は止まってしまいますよね。しかし、Gemini Sparkを使えば、エージェントはオンライン上のクラウドに存在しています。そのため、クラウド上で同じプロジェクトを進め、チャットでの対話だけで物事を進行させることができるのです。

私にとって、これこそがGoogleの核心的な製品であり、彼らが今回新要素として打ち出したかったアイデアそのものだと感じます。そして、この種の新機能は他のすべての製品にも波及しています。高度な技術的知識を持たない、日常の業務でAIを使う一般のユーザーに向けた、より簡素化されたインターフェースです。仕事や家庭で人工知能を利用する普通の人々のためのものです。そのため、何か爆発的な大ニュースを期待していたAIオタクにとっては、今回は少し物足りず、既存のものを統合・定着させるための地味な発表に感じられたかもしれません。

デモの中で紹介された例では、ユーザーがAIに質問を投げかけます。その回答を導き出すには、ユーザーのメールの内容や、保管されているドキュメントなど、さまざまな情報を混ぜ合わせる必要がありますが、人工知能はそれらすべてを適切に処理してみせます。

また、一度に複数のタスクを処理させる例もありました。たとえば、特定の人たちにメールを送り、その後で価格調査の検索を行い、さらにカンファレンスで使うプレゼンテーション資料を作成してほしい、という依頼です。人工知能はひとつの音声指示を聞くだけで、それを3つの独立したタスクに分解し、それぞれ個別の作業として実行します。

これは非常に興味深いですよね。私も何かプロジェクトを進めているときに、途中で新しいアイデアがひらめくことがよくあります。しかし通常は、その新しいアイデアを実行するために、また別の環境を整え直さなければなりません。それが、ひとつのチャットの中で、たったひとつのAIと話すだけで、進行中のタスクをオーケストレーション(統合的に制御)してくれるのであれば、その方が遥かに素晴らしいシステムだと言えます。

この同じコンセプトと統合の形は、従来の検索機能の進化版であるAI OverviewsやAI modeにも現れる予定です。検索機能はより強力になり、単にキーワードで質問するのではなく、検索エンジンと会話をすることができるようになります。これは私たちが期待していた自然な進化の形です。

Gemini 3.5 Flashのベンチマークと実力

Gemini 3.5 Flashに関しては、従来のGemini 3.1 Proよりも優れた性能を持ちながら、より安価で高速であることを目指して開発されました。だからこそ、彼らはこの3.5 Flashの宣伝にこれほど力を入れているのです。

ベンチマークや、明らかになってきた能力を見てみると、3.5 Flashはエージェント系AIの指標であるMCP AtlasやTuathlonにおいて、他のすべてのAIを凌駕しています。GPT 5.5を含めた競合全員に勝利しているのです。また、金融分野のエキスパートタスクでも優れた成績を収めています。ただし、正解率は57%程度なので、それほど圧倒的な数字というわけではありませんが、試してみる価値は十分にあります。そして、マルチモーダル領域でも明らかに突出したパフォーマンスを示しています。

クリエイティブツール「Google Pix」「Stitch」「Flow Music」

もうひとつ、私の好奇心を大いに刺激した非常に興味深い製品がGoogle Pixです。これは、Photoshopのような画像編集をAIとの対話で行えるツールです。手持ちの画像を選んで、人物の足を範囲選択し、この足を画像から消して、と指示します。その後、別の場所を指定して、これをここに配置し直して、ズームアウトして、最後にテキストを追加して、と頼んでいきます。

これらすべての工程が、Photoshopを使っているかのような感覚で、画面をクリックしながらAIと対話して編集を進めることができます。ただし、これも同じルールが適用され、夏にProとUltraのユーザー向けに提供される予定ですので、楽しみに待つ必要があります。ちなみに、私たちの冬は彼らにとっての夏ですから、彼らが夏と言うときは、まさに今のことです。

また、彼らはStitchについても言及しました。これはクラウドデザインプラットフォームで、Figmaとの統合などを行えるレイアウト制作ツールです。もしあなたがレイアウト作業を専門にしているなら、StitchはGoogleの中で最もお勧めのツールです。このStitchも同じ波に乗っており、対話を通じてレイアウトの調整がどんどんシンプルかつ簡単になっています。画面上の要素を指定してAIと会話をすることで、すべてがより直感的に進行します。単に言葉で指示を出して運を天に任せるよりも、遥かに直感的で面白いアプローチだと思います。

さらに、別の音声ソースから新しい音楽を生成できるFlow Musicも発表されました。これは既存のLyamを進化させたもので、自分で録音したオーディオを送信して、その曲の続きを作らせたり、より興味深いアレンジに仕上げたりすることができます。

Android XRとプライバシーの課題

Metaの動きを追うように、Googleもグラス型のデバイスであるAndroid XRを継続しています。これはAIとメガネを統合するシステムです。これらは比較的シンプルな統合製品であり、カメラ付きのメガネをかけ、そのカメラが捉える映像にAIの機能を追加するものです。以前にも見たことがあるような翻訳機能などがすでに実装されています。

しかし、ご存じの通り、この手のメガネでこれまでにまともに機能したものを私は見たことがありませんし、個人的には、誰かがカメラを回しながらこちらを見ているという状況自体がひどく不快です。

たとえば、このようなシナリオを想像してみてください。スペイン語を話すウェイターの言葉を、メガネを通じて英語に翻訳している場面です。ここでは情報の機密性に関する倫理的な問題が生じます。相手の許可を得ることなく、その人物を撮影し、音声を録音しているからです。そのため、この種のメガネは今後、プライバシーを重視する人々の間で非常に大きな議論を巻き起こすことになるでしょう。単に動画を撮影するだけでなく、リアルタイムで常に周囲のものを識別し、記録し続けているわけですから、そこに潜む問題の大きさは容易に想像がつきますよね。

科学と地球シミュレーションへの応用

そしてもちろん、Gemini for Scienceも外せません。デミス・ハサビスは、AIを使った科学研究の分野に並々ならぬ情熱を注いでいますからね。将来的には、多くのAIが自律的に研究を行うようになるのは間違いありません。これはまだ大規模な成果として目に見える形にはなっていませんが、大学の教授たちがこれを本格的に使いこなし、その仕組みを理解したとき、ビジネスが一気に加速するはずです。

同じ流れとして、AIによって世界をシミュレートするAlpha Earthというプロジェクトもあります。少し発音しにくい名前ですが、これは地球を分析するための専用AIです。気候、風、災害、地震といった地球規模のデータについて、Googleはかなり前から分析を続けてきました。彼らは天気予報を行い、地球のマッピングを非常に高い精度で完成させています。したがって、地球環境をリアルタイムでモニタリングする可能性は極めて現実的であり、どうやら本当に実現に向かっているようです。

実機テスト:Gemini 3.5 Flashと動画生成の検証

というわけで、みなさん。私はこれから、AntigravityやGoogle 3.5のテストを行う専用の動画を別に作成するつもりです。なぜなら、これらはすでに私たちの選択バーに表示されており、通常のGeminiやAntigravityの内部でテストが可能になっているからです。Antigravityの内部には、3.5 Flash Highと3.5 Flash Mediumが用意されています。また、以前の環境に近いAntigravity IDEも存在しており、こちらもバージョンは2.0.1になっています。IDEが消えてしまったと焦る前に、これらの詳細をよく確認してみてください。驚くべきことに、この動画を作っている短い間にも、すでにメインバージョンを含めて2.0.1へのアップデートが行われていました。

ここではあまり長々とテストはしませんが、動画生成AIであるOmni Flashを使った最初の検証では、非常に手応えを感じました。まず、新しくキャラクターのタブが追加されたことで、キャラクターを作成しておけば、動画を生成する際にそのキャラクターを呼び出すのが格段に簡単になりました。

私はここで「Bobbot」と名付けたロボットや、マインクラフト風のジャガー、そして以前作った動画に登場させた「Musk Vader」(覚えている方もいるかもしれません)、さらには「Captain Bob」といったキャラクターを登録しました。たとえば、新しい動画を作るときにキャラクターを追加したければ、キャラクター一覧からジャガーを選んで適用します。すると、プロンプトにジャガーのキャラクター情報が自動的に組み込まれます。

マインクラフトの要素と実際の人間、そしてショッピングセンターにいるロボットを融合させて生成した動画は、非常に興味深い仕上がりになります。人工知能の進化のスピードには、本当に驚かされるばかりです。

動画の中のキャラクターが、まもなく私たちは創造主である人間の生物学的な能力を超えるだろう、と語る場面があります。ただ、映像をよく見ると、少し不自然な部分もあります。たとえば、中央にジャガーがいて、その両側に2人のBobが並んでいます。最初のシーンでは片側の隅にジャガーがいて、中央にBob、反対側にロボットがいたはずですが、シーンが切り替わると配置が変わってしまっています。また、音声のアクセントにも違和感があり、ブラジル風のアクセントのときもあれば、アメリカ人がポルトガル語を話しているような不自然な訛りになることもあります。

それから、先ほど言った鏡を使ったテストも試してみました。鏡の前に男が部屋に入ってくるシーンをプロンプトで生成します。男が部屋に入り、鏡を見て、おや、誰がここにいるんだ、とつぶやきます。動画の時点では、彼は鏡に指を触れるだけで、それ以上のことは何も起きません。そこで、この生成された動画を再びプロンプトに読み込ませて、彼が映像に触れた瞬間に、スーパーマリオのような世界観に変えてください、と指示を出しました。

すると、このような映像が生成されたのです。同じように男が部屋に入ってきて、おや、誰がここにいるんだ、と言った瞬間に画面が変化します。これは本当に素晴らしいと思います。動画の特定の瞬間を指定して、こういうことが起きたら次はこうして、と言葉で伝えるだけで実現するのです。多少のディテールの崩れはあるにせよ、見事な出来栄えです。任天堂の許可をどうクリアしているのかは分かりませんが、処理自体は通ってしまいました。

最後に、3.5 Flashを使って、簡単な車のゲームを作らせたテストの結果を見てみましょう。すでにエンジンが加速している素晴らしい車が完成し、地下の世界を描いた夜間バージョンのステージが生成されました。これは実に面白いです。AIが車のゲームでこのようなアンダーグラウンドなバージョンを作ったのは、これが初めてのことです。非常に興味深い仕上がりです。

また、電車のクオリティもしっかりと電車らしくなっています。面白いことに、電車にはちゃんと車輪がついていて、ドリフトすることなく、レールの上を正しく走行しています。このアンダーグラウンドな車のゲームのバージョンは、私の目を大いに引きましたし、このモデルの実力をしっかりと証明してくれました。

アーケードのベンチマークでこの3.5 Flashのスコアを見ると、正解率は72%となっています。そのため、3.1 Proや5.5 Extra Highといった上位モデルと比べれば下位に位置していますが、全体の中ではかなり高いポジションにあり、何よりもコストが非常に低く抑えられています。これは重要なポイントです。複雑なタスクをこなしながら、極めて経済的だということです。

みなさんもぜひ、自分でテストしてみた感想をコメント欄で教えてください。今回は新情報が多すぎて動画がかなり長くなってしまいましたので、近いうちに、ここで起きているすべての変化を網羅した、より詳細な解説動画を投稿する予定です。もし、このような動画を今後も見たいと思ってくださるなら、ぜひチャンネルメンバーになってサポートをお願いします。メンバーになれば、インテリジェントエージェントに関する限定動画や、新作動画の先行視聴が可能です。それでは、高評価をお忘れなく。ありがとうございました。

コメント

タイトルとURLをコピーしました