GoogleがGemini 3 FLASHを発表!⚡⚡⚡

Google・DeepMind・Alphabet
この記事は約10分で読めます。

GoogleがリリースしたGemini 3 Flashは、ベンチマークで高いスコアを記録しながら、コストを大幅に抑え、処理速度も極めて速い、画期的なAIモデルである。特筆すべきは、コーディング性能においてGemini 3 Proを上回る結果を示している点だ。価格はGemini 3 Proの4分の1、GPT-5.2の3分の1程度でありながら、フロンティアレベルの知性を提供する。Googleは、このモデルを検索機能やGeminiアプリのデフォルトモデルとして展開し、無料で利用可能にすることで、AI競争における圧倒的な優位性を確立しつつある。高品質、低コスト、高速という三拍子揃ったGemini 3 Flashは、AIの経済性と実用性において新たな基準を打ち立てたと言える。

Google just dropped Gemini 3 FLASH! ⚡⚡⚡
Check out how we use HubSpot to Power Forward Future! The Subtle Art of Not Being Replaced 👇🏼

Gemini 3 Flashの驚異的な性能

GoogleがGemini 3 Flashをリリースしました。これは地球上で最高のモデルかもしれません。すべてのベンチマークで最高得点を取るという意味だけではなく、実際そうなのですが、コストがほんの一部で済み、非常に高速で、非常に効率的だからです。そしてここが重要なポイントです。実はコーディングにおいてGemini 3 Proを上回る性能を発揮するのです。Gemini 3 Flashによって、地球上で最高のコーディングモデルの一つが手に入ったことになります。これは驚くべきことです。

さて、この簡単な比較をお見せしましょう。左側にGemini 3 Flash、右側にGemini 3 Proがあり、両方とも鳥の群れのシミュレーションを作成します。では、21秒後には、わずか3,000トークンを使用して完全な鳥の群れシミュレーションが完成しました。

非常に少ないトークン数です。そしてGemini 3 Proはまだ構築中ですが、このシミュレーションはかなり良い出来です。見てみましょう。ええ、かなり良い出来です。そして28秒後、私が考えるにやや劣るバージョンの鳥の群れシミュレーションが完成しました。ほぼ同じトークン数を使用しましたが、そのトークンははるかに安価で、はるかに高速でした。もう一つ見てみましょう。

コーディング性能の比較

両方とも青空を背景にした3D地形を構築します。わずか15秒強です。Gemini 3 Flashのバージョンが2,600トークンを使用して完成しました。そしてこれはかなり良い出来です。3Dの見た目も良く、すべてが一貫しています。そしてGemini 3 Proはまだ作業中です。さて、ここで興味深いことがあります。4,300トークンまで上昇しました。Flashよりもはるかに多く、生成に3倍の時間がかかりました。

では、結果を見てみましょう。どちらも本当に良い出来だと思います。どちらが優れているとは言えません。右側のものには霧があり、左側のものはもう少し詳細に見えますが、全体的に、より安価で、より高速で、同等に良い出来です。さて、最後に天気アプリです。

再び、違いを見てください。Flashは4,500トークン、Proは6,100トークン、Flashの構築時間は24秒、Proは67秒です。そして見てください、明らかに一方が他方より良く見えます。私の個人的な好みはFlashです。実際にどのように見えるか見てみましょう。動きがあります。とても美しいです。

そして右側には非常にシンプルなものがあります。さて、ご覧のように、私たちは特別なものを手にしています。完全なベンチマークをお見せしましょう。

ベンチマークと価格比較

では、ベンチマークです。Gemini 3 Flash thinkingがあり、まず第一に価格がほんの一部です。入力価格は100万トークンあたり50セントで、Gemini 3 Proは2ドルです。つまり25%、価格の4分の1です。

そして明らかにGPT-5.2と比較してみましょう。価格の約3分の1です。そしてClaude Sonnet 4.5と比較すると、価格の約6分の1です。次にhumanity’s last examを比較すると、33%と43%のスコアを記録しており、GPT-5.2の34%と45%とほぼ同じスコアです。Gemini 3 Proには負けていますが、ほんのわずかです。科学的知識のベンチマークであるGPQA Diamondでは、90%対Gemini 3 Proの91%、GPT-5.2の92%となっています。

次はMMU Pro、マルチモーダル理解と推論です。すべての中でナンバーワンのモデルです。まったく驚異的です。コード実行を使用したAME 2025は100%近くを獲得し、Gemini 3 Proは100%、GPT-5.2は100%です。さて、ここからが驚きです。SweetBench verifiedです。ここにあります。

78%対3 Proの76%です。つまり、SweetBench verifiedベンチマークにおいて、実際にコーディングでGemini 3 Proを上回っているのです。依然としてナンバーワンのモデルはGPT-5.2で80%を記録していますが、基本的にほぼ同じスコアです。もう一つ注目すべき重要なグラフがあります。Y軸にはLM arenaのELOスコアがあります。

X軸には100万トークンあたりの価格があります。つまり、本当に望ましいのは最も高く、最も右側にあることです。したがって、外側にあるこれらすべてが最高です。そしてここで見ているのは、Gemini 2.5 Flashlightと比較したGemini 3 Flashです。2.5 Flashlightがこんなに下にある理由は、ELOスコアがかなり低いからです。

突然、ELOスコアに大きなジャンプがあり、しかもはるかに安価です。つまり、実際には、はるかに安価でありながら、Gemini 3 ProのLM Arenaスコアにほぼ到達しています。そして私はすでに自分の自動化の一部でこのモデルを使い始めています。私が話している自動化について知りたい方のために、今日の動画のスポンサーについてお話しさせてください。

実用的な活用事例

私はHubSpotと提携して、私のビジネスが実際に使用している最も強力な9つの自動化をお届けします。もしあなたがAI業界のすべてについて私がどのように最新情報を把握しているのか疑問に思ったことがあるなら、それは明らかに大量の自動化を使用することによってです。だからこそ、私の会社であるForward Futureを支える9つのAI自動化を無料でダウンロードすることをお勧めします。

これは、自動化されたリサーチアシスタントから、メディアからコンテンツへのパイプライン、コンテンツをすべてのプラットフォームに届けることまで、ビジネスのあらゆる側面をどのように自動化しているかについての完全に無料の舞台裏ツアーです。私のお気に入りの部分は、これらの自動化が一般化されており、コンテンツクリエイターだけでなく、あらゆるビジネスに適用できることです。

このリソースはHubSpotによって無料で提供されています。私は彼らと直接協力して、私がやっていることを見せました。彼らがそれを文書化し、今あなたはそれをダウンロードできます。このガイドを入手してください。下の説明欄にリンクを掲載します。そしてこの動画をスポンサーしてくれたHubSpotに感謝します。

マルチモーダル機能とGoogle製品への統合

そしてもちろん、これはマルチモーダルです。動画、画像、音声、テキスト、何を投げかけても理解できます。

そして、Googleの製品スイート全体にわたって、デフォルトモデルとして急速に採用されつつあります。最も重要なのはGoogle検索、特にAIモードです。これは当然の選択でした。検索の大多数はProレベルの推論を必要とせず、たとえ必要だったとしても、Flashは基本的にそれを達成します。つまり、はるかに安価で、はるかに効率的で、同等に優れたモデルがAIモードのクエリに対応しているのです。

これが、これが地球上で最も経済的に実行可能なモデルかもしれないと私が考える理由です。検索結果がより速く返ってきます。フォローアップもより迅速に得られます。そしてGemini 3 Flashは現在、Geminiアプリのデフォルトモデルとなり、2.5 Flashに取って代わりました。世界中のすべてのGeminiユーザーが無料でGemini 3エクスペリエンスにアクセスでき、日常のタスクが大幅にアップグレードされます。

彼らはこのモデルを無料で提供しています。これがどれほど決定的に、そして競争上重要であるかを十分に強調することはできません。数学的に彼らにとって意味があります。そして私が言い続けているように、GoogleはAI競争に勝つか支配するために非常に有利な立場にあります。彼らは今、最高のモデル、最も安価なモデル、最も高速なモデルを持っています。彼らは提供するさまざまな製品すべてにGeminiを組み込むことで、すべての流通チャネルを持っています。

世界中のすべてのデータを持っています。独自のカスタムシリコンを持っています。この時点で、これはGoogleが負ける可能性のあるゲームです。そしてもしあなたがバイブコーダーであったり、エージェント型コーディングを少しでも使用しているなら、Logan KilpatrickはGemini 3 Flashがバイブコーディングの新しいデフォルトだと言っています。明らかに、彼はそう言うでしょうが、また明らかに、それはある意味真実です。

エージェント型コーディングとの統合

WindsurfやCognitionのDevon、Cursorなどのエージェント型コーディング企業の多くは、独自の小型で高速な、コーディングに本当に優れたモデルを作りました。しかし突然、Googleがそれを無料で提供するのです。そしてそれは非常に優れており、しばしば彼らの社内モデルよりも優れています。これを見てください。humanity’s last examでの結果です。

Gemini 3 Proに非常に近く、GPT-5.2にも非常に近いです。つまり、コストのほんの一部で、複数倍高速でありながら、基本的にフロンティアの知性なのです。そして、1秒あたりに出力できるトークン数という点で高速なだけではありません。実際にそれらのトークンでもより効率的なのです。

これはすべてのGeminiモデルに対する平均トークン使用量です。ご覧のように、Gemini 3 Flashは平均して同じ結果に対してより少ないトークンを使用します。browserbaseのPaul Kleinからです。私たちはGemini 3 Flashへの早期アクセスを得て、圧倒されました。Stage handエージェントでは、より安価で高速でありながら、Gemini 3 Proとほぼ同等の精度を達成しました。

これは特にコンピューター使用モデルにとって重要です。なぜなら、それらは通常非常に遅く、画面のスクリーンショットを撮ったり、DOMを見たり、クリックしたりするのを見ているのは、残酷なほど遅いからです。そして今、本当に高速なモデルを使えるようになりました。

各種ベンチマークでの評価

人工分析インテリジェンス指数です。Gemini 2.5 Flashからここまで、そしてブームというようにGemini 3 Flash reasoningがClaude Opus 4.5を打ち負かし、GPT-5.2 extra highのすぐ下、Gemini 3 Proの下に位置しています。つまり、現在最高のモデルの中に入っているのです。

そしてGemini 3 FlashはLM ArenaのELOでも良い成績を収めています。ナンバー3として、Grok 4.1 ThinkingとGemini 3 Proのすぐ下、3位に位置しています。これは素晴らしいことです。そして皆さんが私がこう言うのにうんざりしているのは分かっていますが、しつこく繰り返したいのです。非常に優れていて、非常に効率的で、非常に高速です。

ARC prizeによるARC AGI1です。Gemini 3 Flash preview highは1タスクあたり17セントで84.7%を獲得し、ARC AGI 2は1タスクあたり23セントで33.6%です。他のフロンティアモデルよりも大幅に低いコストで競争力のある性能を発揮しています。

BoxのAaron Levyが彼らのベンチマークを公開しました。彼らはGemini 2.5 Flashとのみ比較していますが、ご覧のように、全体的に品質スコアが大幅に改善されています。そしてもちろん、はい、私が言うのを聞いたことでしょう。より安価で、より高速で、より優れています。

はい、はい、はい。つまり、これは信じられないほどのモデルであり、最高の部分は、基本的に無料で手に入ることです。Geminiに行ってください、Google検索のAIモードに行ってください。このモデルは無料で、高速で、素晴らしいものです。そしてGoogleは私にこれを言わせるためにお金を払っていません。私は本当にこれが進むべき道だと思っているだけです。私はスピード重視派です。しかし、それを非常に高品質なフロンティアモデルの品質と組み合わせると、何か特別なものが得られます。

この動画を楽しんでいただけたなら、いいねとチャンネル登録をご検討ください。

コメント

タイトルとURLをコピーしました