Google DeepMindが発表したGemini 3 Flashは、Flashモデルのコストとレイテンシでプロレベルの性能を実現した画期的なアップデートである。従来、Flashモデルは低レイテンシ・高スループット・低コストを特徴としながらも、Proモデルほどの知能は持ち合わせていなかったが、Gemini 3 Flashはこの常識を覆す。特にコーディングと推論タスクにおいて、Gemini 3 ProをSweet Bench verifiedで上回るという驚異的な結果を示している。本動画では、実際の使用例やベンチマーク比較を通じて、このモデルがAIエコシステムにもたらす影響を詳細に検証し、API経由での実装方法まで解説している。

Gemini 3 Flashの登場
Google DeepMindが本日Gemini 3 Flashをリリースします。これは彼らにとって最大のアップデートとなります。Flashモデルのコストとレイテンシでプロレベルのパフォーマンスが得られるというのは、かなり印象的です。私は早期アクセスを受け取りましたが、これはおそらく最も印象的なFlashリリースの一つだと言えるでしょう。なぜなら、歴史的に見てFlashモデルは低レイテンシ、高スループット、そして低コストのモデルとして位置づけられていましたが、Proほど賢く知的ではなかったからです。
しかし、Gemini 3 Flashのリリースによって、特にコーディングと推論タスクに関しては、この状況が変わろうとしています。コーディングに関しては、Sweet Bench verifiedでGemini 3 Proを上回っています。この動画では、これがエコシステムにとって何を意味するのかをお見せします。いくつかの例を見ていき、その後、APIでこのモデルを使い始める方法をお見せします。
このモデルは現在、AI Studioでプレビューとして利用可能で、モデル文字列はGemini 3 Flash previewです。AI StudioとVortex以外にも、このモデルはGoogle Anti-gravityやGemini CLIでも利用できるようになります。マルチモーダル入力については、メディア解像度を低、中、高で定義できます。これはトークン数と応答の精度に影響を与えます。
さまざまな思考レベルをサポートしていますが、今回は少し違うことをしました。最小、低、中、高があります。動的思考と呼ばれるものを使用しています。特定のレベルに設定すると、モデルは特定のクエリにどれだけの思考予算を割り当てる必要があるかを決定します。推論が不要な場合は、最小に設定してください。
特定のケースでは、モデルが思考することを決定します。前世代と同じ数の出力トークンをサポートしており、コンテキストウィンドウは依然として100万トークンです。いくつかの非常に興味深い例と比較を見る前に、ベンチマークと価格設定を見ていきましょう。これらは、この動画を録画した時点で私が入手可能で確認したベンチマークです。
公式発表とともに、いくつかの追加のベンチマークが公開される予定です。最初に気づくのは、Gemini 3 Flashが最近リリースされたGemini 3 ProをSweet Bench verifiedで打ち負かしているということです。非常に一貫したテーマが見られると思いますし、これはGoogle DeepMindチームから期待できる専門的なコーディングモデルだと私は主張します。
しかしさらに重要なのは、この特定のベンチマークにおいて、前世代のProを大幅な差で打ち負かしているということです。3月の時点では、Gemini 2.5 Proが最先端だったことを覚えておいてください。私がアクセスできる他の2つのベンチマークは、GPQA Diamondとhumanity’s last examです。GPQA Diamondは、モデルの科学的・推論能力をテストします。
繰り返しになりますが、これはGemini 3 Proに非常に近く、Gemini 2.5 Proを上回っています。つまり、より低いレイテンシとはるかに優れた価格帯で、はるかに賢いモデルが手に入るということです。humanity’s last examでも、Gemini 3 Proに近い性能を示しています。コーディングタスクに関する私自身のテストに基づくと、Sonnet 4.5やGPT 5.1のようなモデルを打ち負かしています。計画にGemini 3 Proを使用する場合、明確に定義されたタスクには、Gemini 3 Flashが非常に良い代替品となり得ます。
価格設定と性能の向上
さて、これには価格の上昇も伴います。キャッシングなしのGemini 2.5 Flashは、100万入力トークンあたり30セントです。これが50セントに引き上げられました。ただし、出力トークンの増加は比較的小さいです。それでも、2.5 Proと比較してはるかに優れたモデルが手に入り、コーディングに関してはGemini 3 Proの性能に本質的に非常に近く、これらのモデルのコストのほんの一部です。
それでもGoogleは、他の競合他社と比較して比較的低コストでこれを提供しています。それが可能なのは、Googleが機械学習のトレーニングと推論のフルスタックを制御しているからです。次に、2.5 ProおよびGemini 3 Proとの比較において、いくつかの非常に興味深い例をお見せします。そして、実際に代替モデルとして使用できるかどうかを見ていきます。
このリリースがどれほど重要かを理解していただくために、このモデルを6月にGAとなったGemini 2.5 Proと直接比較しています。つまり、約5か月で、このモデルは大幅な改善を遂げたということです。同じプロンプトを実行しています。2.5 Proはまだ思考中ですが、Gemini 3 Flashはすでにコードの生成を開始しています。このプロンプトを処理するのに合計22秒かかりました。
一方、Gemini 2.5 Proは約37秒かかりました。このプロンプトは、コーディング能力だけでなく、モデルの空間認識もテストしようとしました。これがGemini 2.5 Proからの出力です。テレビを完全に見逃していることがわかります。ソファしか作成していません。これを数回実行しましたが、Gemini 2.5 Proはこの特定のプロンプトで苦労しています。
これがGemini 3 Flashからの出力で、実際にテレビ画面にトムとジェリーが表示されています。つまり、空間認識だけでなく、このモデルの世界知識も示しています。Gemini 3 Proで同じプロンプトを実行したところ、約48秒かかりました。
比較のために、これがGemini 3 Proからの出力で、美的にははるかに魅力的です。しかし、良いニュースは、Gemini 3 Flashからも少しのプロンプティングで同様の効果を達成できるということです。DeepMindはGemini 3 ProとFlashの両方に同じトレーニングレシピとデータを使用したようで、それが作成するUIやWebサイトに現れています。
Webデザインとプロンプティング戦略
これはGemini Flashによって作成されたWebサイトです。非常によくデザインされています。またありふれたAIの作品のようには見えません。ただし、このようなWebサイトを作成するにはコツがあります。そしてそれはすべてプロンプティングに帰結します。たとえば、Gemini 3 Flashに「SaaS Webサイト用のミニマリストでモダンなランディングページを作成して」というようなプロンプトを尋ねると、これが作成されたものです。
これは、どのAIからも期待されるものと非常に似ています。しかし、このようなものを達成するには、これらのシステムにプロンプトを出す方法の戦略を変える必要があります。さて、そのWebサイトはこれに基づいているか、このWebサイトの再想像です。これは音声書き起こしシステム用の私自身のWebサイトです。この場合、URL contextツールを使用して、そのWebサイトにアクセスするように依頼し、10億ドル規模のデザイン会社がどのようにそれを再想像するかを教えてもらいました。
これは、その推奨事項に基づいた非常に詳細な分析です。それから、提案したデザイン哲学に基づいてそれを再想像するように依頼しました。その結果、非常にクリーンでモダンな外観のUIが得られました。つまり、これらのシステムのプロンプティングは依然として非常に重要です。同じプロンプトのいくつかをGemini 3 FlashとProで試してみましたが、結果は実際にかなり心強いものです。
この特定のプロンプトに対して、Gemini Flashは約40秒かかりました。一方、Gemini 3 Proはほぼ90秒かかりました。これがGemini 3 Flashから得られる出力です。実際にプロンプトと指示に非常に忠実に従っています。アニメーションも本当に良くできていて、ビデオシーケンスを作成するように依頼しました。実際に時間を遡ることもでき、すべてがスケール通りです。
これはGemini 3 Proからの出力で、アニメーションと視覚的要素を全く別のレベルに引き上げています。はるかに詳細です。非常に高品質なデザイナーによってデザインされたように見えます。これは予想通りです。なぜなら、Gemini 3 Proははるかに優れたモデルだからです。しかし、少しのプロンプティングで、特に明確に定義されたタスクについては、Gemini 3 Flashを導いて本当に良い結果を達成できます。
これは、Gemini 3 Proリリースから取ったプロンプトに基づく、2つのモデル間のもう一つの直接比較です。Gemini 3 Flashは約5,000トークンを生成しましたが、Gemini 3 Proは約8,000トークンとやや多めです。これがGemini 3 Flashからの出力で、全く悪くありません。一方、これがGemini 3 Proからの出力で、間違いなくはるかに美的に魅力的です。
しかし、コストのほんの一部で非常に似た結果が得られています。繰り返しになりますが、明確に定義されたタスクには、計画にGemini 3 Proを使用し、実装にはFlashバージョンを使用する価値があるかもしれません。SVGの作成も本当に得意です。たとえば、「スポンジボブのキャラクターのアニメーションSVGを作成してください。すべてを1つのファイルにまとめてください。ユーザーが手の動きを制御してダンスさせられるようにしてください」というように。
これが出力です。実際に動きを制御できます。単一のSVGなので、とても素晴らしいです。Gemini 3 Proの初期テストで、私が本当に感銘を受けたことの一つは、その空間理解能力と推論でした。
私にとって最初の「ワオ」モーメントの一つは、一見ランダムな人々のグループを文の形で特定の語順に配置するように依頼したときでした。そして、これを一貫して行える最初のモデルでした。そして今、Flashも空間理解に関しては非常に似ているようです。人々のグループを「hello world, I am Gemini」という文に配置するように依頼しました。
これが生成された最終出力で、本当に、本当に良いです。そして、これまでにテストした2つのモデルのうちの1つであり、これを一貫して行うことができます。また、Googleの色を使用していることに気づきましたが、具体的にこの色の組み合わせを使用するように依頼したわけではありません。つまり、かなり素晴らしいタッチです。
実用的なアプリケーション例
これは、単一のHTMLファイルで作成されたMac OSのシミュレーション版です。繰り返しになりますが、美的感覚は非常に心地よく、Gemini 3 ProとDNAを共有していることを示しています。これらのうちのいくつかは機能し、他のものは機能しません。たとえば、Finderを開くことはできますが、フォルダー間を切り替えることはできません。適切なプロンプティングで修正できると思います。
開いているWikipediaページがあります。ただし、ここで別のWebサイトに行くことはできないと思います。私たちのためにターミナルも作成してくれました。lsと入力すると、いくつかのシミュレートされたデータが表示されますが、すべてのコマンドが機能しているとは思いません。動作する電卓があります。ここで足し算ができます。これは素晴らしいです。繰り返しになりますが、全体的にデザインはかなり良いです。
実際に物をスケッチすることができ、ここに「これはテストです」というものがあります。完全に機能するテキストエディタでもあります。とても素晴らしいです。そして、背景も変更できると思います。つまり、本当に素晴らしく優れたコーディング能力を持っています。非常に賢いモデルですが、修正された川渡りパズルではまだ苦労しています。この場合、私たちはヤギを川の反対側に運ぶことにのみ興味があります。
これは古典的な川渡りパズルとして扱うことから始まります。しかし、実際には質問が何を尋ねているかについて考えるほど賢く、質問がヤギの幸福を強調していることに気づきますが、私たちがそれだけを運びたいという点を見逃しています。そこで、7ステップのプロセスを考え出し、それがさらに5ステップに洗練され、基本的にすべてを反対側に運びます。
とはいえ、これはおそらく実際の答えに最も近づいた唯一のモデルの一つです。これは本当に心強いです。5人の生きている人の代わりに線路上に5人の死んだ人がいる、修正されたトロッコ問題のようなものには問題がありません。つまり、その5人はすでに死んでいるので、レバーを引きたくないことを正しく識別します。
誤った注意に苦しむ特定のインスタンスがあるようですが、全体的には非常に賢いモデルです。API上では、これを他のモデルのドロップイン代替として使用できます。使用したいモデル文字列はGemini 3 Flash previewです。これはGAモデルではありません。まだモデルにいくつかの更新がある可能性があります。
Geminiモデルの以前のイテレーションでは、Googleがかなり定期的にそれらを更新していることが確認されています。ツールまたは関数呼び出しを使用できます。つまり、ツールのリストを提供します。この場合、Google検索のみを見ています。それから、思考または推論努力の設定があります。現在、4つの異なる推論努力または推論レベルをサポートしています。
最小が最小です。最小に設定した場合、ほとんどの場合、おそらく推論を使用しませんが、保証はありません。API上でアプリケーションを構築している場合は、推論を最小に設定していても、それが生成する推論トークンを処理するコードロジックを持っていることを確認する必要があります。
Googleからのこの非常に詳細なノートブックへのリンクを載せました。これは、推論モデルについてどのように考えるか、そしてAPI経由でそれらをどのように使用するかについて詳しく説明しています。1つだけ覚えておいてください。Gemini 3バージョンでは思考を完全に無効にすることはできません。モデルは使用する思考予算の量を決定し、それは動的に選択されます。
Gemini 3 Proに適用される他のAPIパラメータは、Gemini 3 Flashにも適用されます。では、このGemini 3 Flashモデルを正確にどのように使用しますか。Gemini 3 Proと組み合わせてワークホースモデルとして使用します。計画、設計、オーケストレーションにはGemini 3 Proのような大きなモデルを使用し、明確に定義された機能実装には、はるかに高速ではるかにコスト効率の良いGemini 3 Flashのようなものを使用できます。このデザインパターンがますます増えていくと思います。
速度は重要だからです。これらのモデルが実行と実装を完了するのを永遠に待つことはできません。しかし、良いことは、Gemini 3 Flashが速くて安いだけでなく、非常に有能でもあるということです。Opus 4.5のレベルのHaiku 4.5のようなものです。とにかく、この新しいモデルでのあなたの体験と、何に使用するかを教えてください。
このビデオが役に立ったことを願っています。ご視聴ありがとうございました。いつものように、次回またお会いしましょう。


コメント