Google IO開発者会議を約4日後に控え、LMArenaなどで矢継ぎ早にテストされているGeminiの新チェックポイント群を検証した動画である。当初はGemini 3.2 Flashの思考バリアント、続いてGemini 3.2 Proを確認していたが、いずれも質的飛躍に乏しい印象だった。しかし、これらが改名されてGemini 3.5となり、内部名Cappuccinoと呼ばれる新たなGemini 3.5 ProおよびFlashが、Minecraftクローン、Mac OSクローン、ペリカンが自転車に乗るASCIIアートなど驚くべき出力を見せている。Flash帯としては破格の品質である一方、過剰なUI要素やプロンプト遵守の甘さといった弱点も残ることを冷静に分析している。

Google IOを目前に登場した新Geminiチェックポイント群
Google IO開発者会議が約4日後に迫る中、Googleがアラマリーナ、つまりLMArenaや自社プラットフォームを通じて矢継ぎ早にテストしているGeminiのチェックポイントを、私たちはここ最近いろいろと見てきました。最初に注目していたのはGemini 3.2 Flashの思考バリアントで、Fanta、Sprite、Colaといったコードネームのチェックポイント群でした。正直に言って、Flash帯としてはかなり良く、なかなか印象的な出来でした。
その後に見たのが、この新シリーズの最初の大きなチェックポイントとなるGemini 3.2 Proのバリアントです。確かにそれなりの出来ではあったのですが、大きな質的飛躍が感じられず、少し物足りない印象に終わってしまったんです。これは以前のバージョンとの比較でもそうですし、繰り返しの目立つUIスタイルの出力ばかりを生成し続けたことも理由でした。OpenAIのGPT-5.4が、フロントエンドの出力でいつも同じパネルスタイルばかり生成していたのを思い起こさせるくらいでした。
Gemini 3.5への改名とCappuccinoの登場
ところが今、Gemini 3.2はGemini 3.5に改名されたようなんです。そしてFlashとProの両バリアントがGoogle IO会議で発表される見込みです。基本的には、内部でCappuccinoと呼ばれる非常に強力な新Gemini 3.5 Proチェックポイントと、Gemini 3.5 Flashのバリアントが存在します。そして、その出力品質は本当に目を見張るものがあります。
ここでは、フル機能のMinecraftクローンを生成してきました。背景音楽もあり、このサンドボックスゲームを再現するMinecraftクローンとして、ありとあらゆる構成要素が組み込まれています。これは本当に信じられない出来で、メインインターフェースまでまるごと同じMinecraftクローンを生成してくれるモデルなんて、これまで見たことがありません。サーバーに接続でき、自由に動き回れて、しかも実際のモードを切り替えてクリエイティブモードや別のモードに変更することまでできてしまいます。サンドボックスゲームをモブまで含めて生成できているわけで、生成結果はほぼ完璧と言えます。これは過去のどのモデルでも見られなかった芸当で、間違いなく特筆すべき出来です。品質は明らかに高く、このチェックポイントは美的センス、構造、そしてゲームのダイナミクスまで、かなり徹底的に押さえているのが分かります。
最高のAIツール、ワークフロー、リーク情報をいち早く手に入れたい方は、概要欄のリンクから無料ニュースレターにぜひご登録ください。完全無料です。
Gemini 3.5 Flashの正体と前モデルからの進化
今のところ、これはGemini 3.5 Flashのチェックポイントのようです。本日アリーナで更新されたもので、技術名はGemini 3.0 0 flashとなっています。ですが、その命名にもかかわらず、このモデルの挙動は通常のFlash帯のチェックポイントとはまったく似ていません。いくつかの生成例を見ればそれが分かります。
Minecraftクローンは明らかに完璧で、ヘルスバーもあり、Minecraftらしさを徹底的に表現する構成要素がすべて備わっています。そしてフロントエンド生成は、複数の生成例においてClaude Opus 4.7やGemini 3.1 Proに匹敵する水準にあり、場合によってはそれらを上回ることさえあるんです。
興味深いのは、出力が突然、はるかに強い美的センスを持つようになった点です。レイアウト階層がよりクリーンで、すべての生成において指示追従性が大幅に向上し、繰り返しの少ないパネルUIの生成と運用に関しても顕著に改善されています。より創造的な生成が出るようになってきたわけです。前回のチェックポイント、つまりGemini 3.2 Proで見られたものから明確に脱却し、繰り返しの少ないハンドルUIを使うようになって、全体として空間整合性も目に見えて向上しました。これはうれしい変化です。
ペリカンとバイクのASCIIアート生成
さて、これはこのモデルが生成したものの中でも、特に格別に素晴らしい生成例のひとつです。もしこれがGemini 3.5 Flashだとしたら、信じられないお得さです。驚くほどのコード生成能力を、破格の価格帯で手に入れられることになるからです。
具体的には、ペリカンが自転車に乗っているASCIIアートを生成したんです。通常、ASCIIアートは空間整合性、トークンレベルでのプランニング、構造的な保持、そしてモデルが実際には画像を生成せずに視覚的な推論を行う能力を強く問われるものです。ほとんどのモデルは、この手の生成では途中で完全に破綻してしまうのですが、ここではペリカンが自転車に乗るASCIIアートが、首尾一貫した出力として徹底的に生成されているのが確認できます。
しかも、いくつかのプリセットまで用意されています。背景全体の色相を変更できますし、文字セルのサイズや、テレタイプ風のスキャンラインまで変えられて、これは正直かなりインプレッシブです。
Gemini 3.5 Flashの長所と気になる弱点
このGemini 3.5 Flashチェックポイントについて、いくつか所感をお伝えします。良いニュースとしては、依然としてFlash帯のチェックポイントに見える割に、このモデルは本当に速く感じられ、驚くほど賢いということです。推論はより力強く感じられ、出力はよりクリーンで、すべての生成にわたって質的な一貫性が目に見える形であり、以前のGemini Flashのバリアント群と比べて明らかに改善されています。
ですが、はっきりとした弱点もまだ残っています。最大のものは、UIに無駄なHUDやフローティングパネル、ダッシュボード、過剰なUI要素が詰め込まれ続けてしまうことです。プロンプトでそうしたデザインを加えないよう明示的に指示しても、あるいはミニマルなデザインにしたいと指定しても、結局そういった過剰なUI要素を山ほど追加してきてしまいます。まるで現代的なSaaSのUIショーケース美学に過学習してしまったかのような印象すら受けます。私がこのモデルのUI生成全体をGPT化されたと言い続けてきたのは、まさにこの点で、同じスタイルを延々と生成し続けてしまうからなんです。
もうひとつ大きな問題として目についたのが、プロンプト遵守がやや甘いことです。テスト時にウェブアクセスを使わないよう指示しても、結局それを使ってしまいます。そのせいで、正確なナレッジカットオフを自信を持って検証することや、最新のブラウジングツールや使用状況が出力全体にどれほど影響しているかを判断することが、かなり難しくなってしまうんです。
このチェックポイントが今もアリーナで利用可能かどうかは分かりませんが、基本的にはバトルモードに行って何らかのプロンプトを送り、Gemini 3.5 Flashチェックポイントか、あるいはこれまでアリーナで利用できていたGemini 3.2の旧チェックポイントのいずれかが当たる、という仕組みになります。
Mac OSクローン生成と前バージョンとの比較
こちらは、フル機能のMac OSクローンを作成するよう依頼した生成例です。この生成はかなり有望そうに見えます。さまざまなアプリケーションを表す明瞭なSVGアイコンが、きちんと徹底的に生成されているのがはっきり分かるからです。
ただ、これがベストな生成かというと、そうとも思えないんです。というのも、私がGemini 3.2 Proのバリアントで実際にやったときのほうが、全体的な生成は良かったからです。なので、今回の3.5でのMac OSクローン生成がかなり良かったのかどうかは判断に迷うところです。そのチェックポイントで私が生成したものを見てみてください。当然のように、さまざまなアプリすべてが完全にコーディングされており、それだけでなく全アプリがSVGアイコンで表現されています。さらに、生成にはゲームまで追加されているんです。つまり、フル機能のMac OSクローンの質的アウトプットという意味では、こちらのほうがはるかに良い仕事をしていたわけです。
隠れテストされていたGemini 3.1 Proと今後の展望
また、一部の報告では、Gemini 3.1 Proも秘密裏にテストされていたとされています。つまり、3.1 Proを示すスラグを掲げながら、実際にはGemini 3.5 FlashおよびProバリアントの一部となる新チェックポイントの生成をテストしていた、ということです。Gemini 3.1 Proのほうが、全体的な品質は明らかにかなり良く見えます。
この動画を気に入っていただけて、チャンネルを応援したいと思ってくださる方は、下のスーパーサンクスから寄付をご検討いただけるとうれしいです。あるいは、私たちのプライベートDiscordへの参加をご検討ください。さまざまなAIツールの月額サブスクリプションに毎月無料でアクセスできるほか、デイリーAIニュースや限定コンテンツなど、たくさんの特典が用意されています。
さて、今日の新Geminiリーク動画はだいたいこんなところです。約4日後にやってくる新しいGeminiモデルが本当に楽しみです。来週の会議期間中はみなさんにアップデートを届け、YouTubeで発表されるものを随時お伝えしていきます。
それでは、今日の動画を楽しんでいただけて、何かしらの価値を感じてもらえていれば幸いです。今日の動画で使ったリンクはすべて概要欄に置いておきます。セカンドチャンネルもチェックして、ニュースレターに登録、Discordに参加、Twitterでフォロー、最後にチャンネル登録と通知ベルをオンにして、この動画にいいねを押し、最新のAIニュースに追いつけるよう過去動画もぜひご覧ください。それでは、素敵な一日を。ポジティブな気持ちを広めて、また近いうちにお会いしましょう。お疲れ様でした。


コメント