Googleの年次カンファレンス「Google I/O」を目前に控え、2つの大きなリーク情報が浮上した。1つは、LMSYS Chatbot Arenaに登場した謎の「Gemini 3.5 Flash」とされるチェックポイントが、上位モデルを凌駕する驚異的なパフォーマンスを発揮している件である。もう1つは、既存のGeminiアプリ内に統合されると見られる強力なタスク完結型エージェント機能「Gemini Spark」の存在である。本動画では、これらのリークされた新機能の実態やデモ、そしてGoogleが目指す対抗戦略について詳細に解説している。

LMSYS Arenaに突如現れた謎のGeminiチェックポイント
今日、Googleに関する2つの大きなリーク情報が飛び込んできました。Google I/Oの開催まであと4日というタイミングです。Chatbot Arenaに新しいGemini 3.5 Flashのチェックポイントが登場したのですが、その出力結果は軽量なFlashモデルとしては到底考えられないようなものになっています。さらに、Gemini Sparkと呼ばれる新しいエージェント機能がX上でリークされています。今回はこの両方について詳しく見ていきましょう。
Chatbot Arenaに突如現れた新しいGeminiのチェックポイントですが、そこから出力されるクオリティは、Flashモデルのものとは信じがたいレベルに達しています。実際にはGemini 3 flashという紛らわしい名前でリストアップされていますが、ユーザーたちの検証結果から判断すると、これがステルスで公開されたGemini 3.5 Flashのチェックポイントであることはほぼ間違いありません。
特に興味深いのは、この出力がGemini 3.1 Proを上回っていると報告されており、さらにはClaude 4.7 Opusすらもリードしているという点です。本来であれば軽量枠であるはずのFlashティアのモデルが、現在リリースされている中で最も強力な推論モデルの2つと真っ向から渡り合っているのです。しかし、本来のティア構成からすれば、このような力関係になるはずはありません。
数日前にもGeminiのチェックポイントに関する前回のリーク情報を取り上げましたが、その時点でのリークはGemini 3.2 FlashやGemini 3.2 Proを指しており、それらの出力結果はかなり期待外れなものでした。多くの人が、これでは競争力がないのではないか、Googleは一体何をしているのだろうと疑問に思っていました。
しかし、今回のチェックポイントは明らかに違います。ユーザーが引き出している出力は目に見えて能力が高く、生成されるコードもよりクリーンで、ワンショットで機能する見事なウェブアプリケーションを作り上げています。しかも、Flashモデルらしく動作が非常に高速なのです。
これを見て、私はいくつかの可能性を考えています。1つ目は、Googleが現在、非常に強い競争プレッシャーを感じている可能性です。OpenAIは絶え間なく製品を出荷していますし、AnthropicもClaude 4.7 Opusをリリースしたばかりです。それに対してGeminiは長い間、静かな状態が続いていました。そのため、開発チームが出し惜しみをやめ、極めて競争力の高いモデルを投入しようとしているのかもしれません。
しかし2つ目の可能性として、これが私が何度も考えてしまう点なのですが、Chatbot Arenaはあくまで人間の主観的な好みを測定するバイブス主導のベンチマークであるということです。これは一対一の対決における人間の好みを測定するものであり、純粋な推論能力そのものを測っているわけではありません。モデルがより高速で、より愛想の良い返答を返せば、実際に頭が良いわけでなくてもArenaでのランキングで勝つことができてしまいます。そのため、このランキングを鵜呑みにする前に、実際の推論評価テストでの結果を確認する必要があります。
もう1つ頭に入れておくべきなのは、Google I/Oが4日後の5月19日に控えているということです。したがって、Googleが公式に発表する内容は、おそらくこのチェックポイント、あるいはその派生バージョンに直結しているはずです。正直なところ、私の意見としては、Geminiがこの開発サイクルで競争力を維持するためには、今回出荷されるものが単に3.1より少しマシという程度では足りません。開発者が既存のモデルから乗り換えを検討するほどに優れたものである必要があります。
簡単にまとめると、新しいGemini Flashのチェックポイントが公開されており、アップデートされた出力は数日前のリークよりもはるかに優れています。Arenaのランキングも、もしこれが本物であれば非常に興味深いですが、現時点ではGoogle DeepMindからの公式発表がないプレリリース段階の情報です。ですので、月曜日になればもっと多くのことが分かるでしょう。
新しいチェックポイントが生成したMinecraftクローンの実力
そして、人々がこのモデルを使って何を生成しているかという話ですが、あるユーザーがこれで実際に動作するMinecraftのクローンを構築しました。これは私がこれまでに見た中で、おそらく最高出来栄えのものです。今から皆さんにお見せしますね。
その前に、私たちはUniverse of AIというニュースレターを立ち上げたばかりです。自分で探し回ることなく最新のAIニュースを常に把握したい方は、概要欄にリンクがありますので、ぜひ登録を見逃さないでください。
それでは、新しいチェックポイントを使って構築されたゲームをお見せします。驚いたことに、マルチプレイヤー機能まで実装されているのです。サーバーが実際に機能するかどうかテストしてみましょう。クレジットを見ると、このゲームがReact 19、Vite、Three.js、そしてTailwind CSSを使って作成されたことが分かります。これはあくまでデモであり、明らかにMinecraftのクローンを目指して作られたものです。
メインメニューに戻ってシングルプレイヤーを選択してみます。名前やワールドのシード値など、細かい設定ができるようですね。難易度は、私はあまりゲームが得意ではなく、以前プレイしたときにゾンビにこてんぱんにされてしまったので、とりあえずイージーにしておきます。サバイバルモードを選択して、ワールドを作成してスタートします。
ご覧の通り、ゾンビが実際に生成されています。周囲を見回すこともできますね。この敵を攻撃できるでしょうか。爆発する前に逃げなければいけませんが、全員が私を追いかけてきています。Minecraftのクローンでゾンビモードが追加されているのを見たのは、これが初めてです。動物なども配置されていて、本当に良くできています。これまでで一番の出来栄えかもしれません。
おっと、向こうで何が起きたのでしょうか。何かに吹き飛ばされたようです。一体何が起きたのか、かなりバグっぽい挙動ですね。ああ、死んでしまいました。まあ、こういうこともあります。クリエイティブモードに戻って中身を確認してみましょう。
あるいは、マルチプレイヤーモードを試してみるのもいいですね。正直、これが本当に動くかどうかは分かりません。こちらのサーバーを選んで接続してみます。ロビーに接続中と表示されていますが、動かないような気がしますね。他のプレイヤーが誰も見当たりません。
やはり私はあまり上手ではないので、クリエイティブモードのシングルプレイヤーを試してみます。サバイバルだとすぐにやられてしまいますからね。ただ、クリエイティブモードを選んだはずなのにゾンビが出現しているので、ゲームが少しバグっているのかもしれません。
一番高いところまで飛んでみましょう。皆さんもご覧の通り、これはこれまでに見た中で最高の生成クオリティです。ワールド全体が完全に生成されているわけではなく、見えている範囲がすべてです。シミュレーションなので、表示されているエリアが限界ですが、これだけのものが生成できるのであれば悪くありません。ブロックを配置することも可能です。ただ、なぜかバグが発生してリスポーン地点のベースに引き戻されてしまいます。その点は少し残念ですが、それ以外は問題なく動き回ってワールドを眺めることができます。非常に素晴らしい出来栄えです。
利便性の懸念とプロンプト順守力の課題
しかし、この新しいチェックポイントのすべてが良いことばかりというわけではありません。まず人々が気づき始めているのは、多くの人が気に入っていたGemini独自のUIやクールな雰囲気が完全に削除され、よりGPT-5に近いデザインになっているという点です。UIデザインの面では、GPT-5.5のスタイルを模倣しているように見えます。
また、Flashモデルとしては高速かつスマートである点において非常に優れているものの、プロンプトの指示に従う能力、つまりプロンプト順守力の面ではあまり良い仕事ができていません。
例えば、あるユーザーがウェブ機能を使用しないように何度も指示したにもかかわらず、モデルはそれを無視してウェブを使用してしまいました。明らかにモデルが指示を聴いておらず、プロンプトで自制を求めているにもかかわらず、ウェブサイトをパネルで埋め尽くし続けてしまいます。基本的には、ユーザーが与えたプロンプト指示を適切に守ることが苦手なようです。
これは現在のチェックポイントにおける一時的なバグかもしれませんが、Googleが正式出荷する前に必ず修正しなければならないポイントです。なぜなら、どれほど高速で能力が高く優れたモデルであっても、プロンプトを正確に理解して指示通りに動くことができなければ、ユーザーが求める結果を得ることはできないからです。当然ながら、人間の指示をしっかりと聞いてプロンプトに従ってくれるモデルと比較すると、実用性は著しく落ちてしまいます。
先ほども言ったように、これはあくまで3.5 Flashのチェックポイントです。新しく登場するFlashモデルでは、プロンプト順守力が向上していることを期待したいですし、そうなれば状況はさらに良くなるはずです。
エージェント機能Gemini Sparkのリーク情報
さらに、Googleの新機能であるGemini Sparkのスクリーンショットもリークされています。見たところ、これはGoogleが提供する本格的なエージェント機能になる予定で、スタンドアロンの製品としてではなく、既存のGeminiアプリ内に統合されて出荷される可能性が非常に高いです。
ランディング画面には、本日はどのような御用でしょうかというメッセージとともに、インボックスの整理、会議の概要作成、カスタムニュースダイジェストの取得といった、いくつかのスタータープロンプトが表示されています。つまり、これは単なる新しいチャットインターフェースではなく、タスクを完結させるためのシステムとして位置づけられています。
特に興味深いのは、スキル作成のフローです。スキルの作成画面には、タイトル、説明、そして指示の入力フィールドが存在します。AI業界の動向を追っている方ならお気づきかと思いますが、これはAnthropicが数ヶ月前にClaudeに実装した仕組みと基本的に全く同じパターンです。エージェントが特定のタスクを実行する必要があるときに呼び出せる、一連の手順を記したレシピをユーザー自身が記述する形になっています。
リーク情報に基づくと、1つ小さな注意点として、現時点ではskill.mdファイルを直接インポートするオプションは用意されていないようです。依然として指示ボックスにコピー・アンド・ペーストする必要があり、人々がすでに構築し始めているオープンスキルフォーマットと競合しようとしているのであれば奇妙な制限ですが、ローンチまでに変更されることを期待しましょう。
もう1つの詳細として、Sparkにはエージェントモードとチャットモードが用意され、そこでは高度なツール利用と呼ばれる機能が使えるようになる見込みです。しかし、リークされたスクリーンショットを見る限り、ブラウザ操作機能やコンピュータ操作機能の兆候は見られません。そのため、このエージェントが利用するツールは、当面の間はGoogleのエコシステム内部に留まるか、Googleが追加するプラグインに限定される可能性が高いです。
具体的にはGmail、Googleカレンダー、Googleドキュメントといったものを想像してください。そして、これは戦略として非常に理にかなっています。Googleの最大の防御壁はモデルそのものではなく、大半のユーザーがすでにメールやドキュメント、カレンダーをGoogle内で管理しているという事実です。もしSparkがこれらの領域をまたいで確実に実務をこなせるのであれば、ユーザーがわざわざ新しく導入しなければならない他のチャットボットよりも、はるかに競争優位性のある製品になります。
面白いことに、AnthropicやOpenAIもGoogleのエコシステムと接続するプラグインを持っています。ですから、Googleにとってこれが完全に圧倒的な戦略と言えるわけではないのも事実です。
これらのタイミングをすべて重ね合わせると、やはり行き着く先は一つです。繰り返しになりますが、Google I/Oは5月19日の月曜日に開催されます。Chatbot Arenaで異様な高スコアを叩き出している新しいGemini Flashのチェックポイントがあり、さらにエージェントモードやスキル機能を備えたSparkがGeminiアプリ内に搭載されるというリークが出ています。
月曜日はGoogleにとって極めて重要な瞬間になりそうです。彼らがこれを完璧にやり遂げられるかどうかは別問題ですが、提示されつつある要素は非常に競争力があるように見え始めています。月曜日、そしてGoogle I/Oのカンファレンス期間中に出てくる新しい発表やアップデートについては、すべてこのチャンネルでカバーしていく予定です。情報がドロップされた瞬間の解説を見逃したくない方は、ぜひチャンネル登録をしておいてください。
本日の動画は以上です。チャンネル登録と、universeai.behive.com で公開している新しいニュースレターのフォロー、メインチャンネルであるWorld of AIへの登録、そしてXでのUniverse of AIのフォローもよろしくお願いします。
それでは、また次回の動画でお会いしましょう。


コメント