Gemini 3.5 Flash:Google史上最強のモデル!Opus 4.7やGPT 5.5を超えるか?(完全検証)

GPT-5
この記事は約14分で読めます。

Googleの最新AIモデル「Gemini 3.5 Flash」の性能とコストパフォーマンスを検証した動画。本モデルは従来の軽量高速という特徴を維持しつつ、システム思考やエージェント機能、フロントエンドコーディングにおいて非常に高い性能を発揮する。しかし、トークン消費量が大幅に増加したことで、特定のタスクでは上位モデルよりもコストが高くなるという課題も浮き彫りになった。実際のWebデザインや3Dシミュレーションの生成テストを通じて、その驚異的な創造性と実用性を解説している。

Gemini 3.5 Flash: Google's Most Powerful Model Ever! Beats Opus 4.7 & GPT 5.5? (Fully Tested)
🚀 Gemini 3.5 Flash is HERE — and honestly… Google might have just dropped one of the most impressive frontend + coding A...

Gemini 3.5 Flashの登場とコストの懸念

Google I/Oデベロッパーカンファレンスで、Gemini 3.5 Flashが正式に発表され、ついにGoogleが戻ってきました。これについては、いくつかの複雑な思いを抱いています。Gemini 3.5 Flashは、高速かつ効率的なラインナップであるGoogleの最新のフラッシュ層モデルですが、正直なところ、これが本当にまだ効率的と言えるのかどうかは分かりません。しかし驚くべきことに、このモデルはGemini 3.1 Proを抑えて、Google史上最強のエージェント型コーディングモデルとして位置づけられています。これは非常に興味深いことです。圧倒的なスピード、低遅延、そして実世界でのデプロイコストの安さという従来のフラッシュモデルの強みを維持しながら、フロンティアレベルの知能を実現しようとしています。

公平に見て、このモデルは素晴らしいです。スピードは異常なほど速いですし、コーディング能力も非常に強力で、品質の向上は明らかに体感できます。しかし私の不満は、フラッシュモデルの最大の目的が安さと速さであるならば、なぜGoogleはこれほどトークンを大量に消費し、フラッシュ層としてはかなり高価なモデルにしてしまったのかという点です。Gemini 3.5 Flashのコストは、入力トークン100万件あたり1.50ドル、出力トークン100万件あたり9ドルとなっています。インテリジェンスインデックスによると、特定のワークロードにおいては、Gemini 3 Flashを実行するよりも5倍以上高価であり、Gemini 3.1 Proよりも約75%コストがかかります。

もし、他の誰よりも早く最高のAIツールやワークフロー、最新情報を見つけたい方は、概要欄のリンクから私の無料のニュースレターに登録してください。完全に無料です。

とはいえ、技術的に見ればこれは非常に印象的なプロダクトです。大規模なコードベース全体にわたって計画を立て、推論する能力に優れており、長期的なタスクに対してサブエージェントを並列にデプロイすることができます。Terminal Bench、GDP Evo、MCP AtlasといったベンチマークではGemini 3.1 Proを上回っており、Claude Opus 4.7やGPT 5.5といった他の主要な商用モデルの巨頭たちに極めて近いパフォーマンスを示しています。

ベンチマークとコストパフォーマンスの現実

しかし、Artificial Analysisによると、インテリジェンスインデックスの全体的な評価において、このモデルはKim K 2.6に近いとされています。Kim K 2.6は、Gemini 3.5 Flashよりも確実に安価です。それでもやはり、Gemini 3.5 Flashは非常に高速であり、推論能力にも優れています。

一方で、私が近々公開予定の独自ベンチマークのデータを一足先にお見せすると、Gemini 3.5 Flashは、様々なパフォーマンス領域で異なるモデルを評価するために私が独自に作成・構築したすべてのバイブコーディングベンチマークにおいて、全体的に極めて優れた結果を残しました。ご覧の通り、Gemini 3.5 Flashは、その価格と品質のバランスにおいて、SVGアートやThree.jsでの開発で明らかに優れています。しかし繰り返しになりますが、トークンの使用量は少し異常です。超高速で驚くほどスマートですが、トークンあたりのコストは約3倍高くなっています。非常にトークンを消費しやすいため、最終的な結果として、同様のタスクにおいてGemini 3.1 Proよりもコストが高くなってしまう可能性があります。

Artificial Analysisによるコスト対性能のチャートは、正直なところ、このモデルに関する最も興味深い部分です。例えば、GPT 5.5 Mediumは約2200万トークンを消費し、そのコストは約1200ドルです。この場合のスコアは57ポイントとなっています。これをGemini 3.5 Flashと比較すると、こちらは約7300万トークンを消費しています。トークン使用量の面で劇的な跳ね上がりを見せています。コストも少し高く、約1500ドルかかりますが、スコアは55ポイントと、GPT 5.5 Mediumより2ポイント低くなっています。つまり、この特定の比較において、3.5 Flashは技術的にはより高価でありながら、ベンチマーク上はGPT 5.5をわずかに下回っているということになります。

それでも全体として見れば、これはGoogleからの堅実なリリースであり、ほとんどの場合において効率的であると言えます。超高速な生成速度は健在ですし、Googleのサブスクリプションを利用しているユーザーであれば、価格以上の価値を得ることができます。

このモデルの注目すべき詳細として、当然ながら100万トークンのコンテキストウィンドウを備えています。マルチモーダル対応であることも大きなセールスポイントの一つです。ナレッジカットオフは2025年1月となっています。ハルシネーション率は91%から61%に減少したと報告されており、これは驚くべき進歩です。そして、このモデルの最適なユースケースは、間違いなくエージェント型のワークフローになるでしょう。Gemini 3.1 Proよりも優れた性能を持つようになった今、コーディング、長期的なタスク、複雑な分析、マルチモーダルな理解などの中心的な原動力になるはずです。Googleが開発した非常に強力なモデルです。

では、実際に様々なテストを見ていきましょう。このモデルはGeminiアプリ自体を通じて完全に無料でアクセスできます。Googleアカウントでサインインして3.5 Flashを選択するだけです。また、APIやArenaを通じても完全に無料でアクセスできます。ぜひテストして、何ができるか試してみてください。

フロントエンド開発とSVG生成テスト

まずは、いくつかのフロントエンドのテストから見ていきましょう。ここでは、いくつかの異なる機能を持ったランディングページの作成を要求しました。これは私が大半のモデルに対して、異なるタイポグラフィの扱いや様々な要素の生成能力を確認するために、よく要求する大胆なカラーブロックのデザインを施したランディングページです。ご覧の通り、Gemini 3.5 Flashはフロントエンドのデザインにおいて非常に優れたパフォーマンスを発揮しています。

私のベンチマークや、フロントエンドの様々なタスクにおける評価方法を通して気づいたのですが、このモデルはこうした様々なフロントエンド生成において驚くほど強いです。クリーンなUI構造を維持しながら、これらすべての異なるプロンプトを非常に高速に生成します。強力な視覚的レイアウト、滑らかなアニメーション、多様なタイポグラフィを備えており、それだけでなく、これらすべてのタスクにおいて高い創造性を発揮しています。これには当然、Three.jsのダッシュボードやシミュレーションも含まれており、フラッシュモデルに期待する水準を超えた出力を得ることができます。

全体として、これらの生成物はGeminiの通常のフラッシュモデルに期待するものよりも、はるかに見栄えが良いことが分かります。たとえ実際には意図通りに機能していなかったとしても、このような特定の要素がこのモデルによって生成されるのを目にできるのは間違いなく素晴らしいことです。このフラッシュモデルのバリアントでこのような成果が見られるのは本当に嬉しいですね。

次にAirbnbのウェブサイトのクローンを作成するよう要求したところ、提供されたスクリーンショットに基づいて例外的に素晴らしい成果を上げ、すべての構造やコンポーネントを含めて非常に適切にクローンを作成することができました。

また、SVGに関しては、Gemini 3.5 FlashはSVGの生成と操作においても非常に強力です。私が実行したほぼすべての生成テストにおいて、複雑なベクターグラフィックスを驚くほど上手に出力してくれました。これは、これまでのモデルで見られた様々なSVG生成を通じて誰もが知っていることだと思います。全体として、GeminiはOpus 4.7などの他のモデルと比較して、この領域で非常に優れた性能を発揮します。

例えばこちらを見てください。このニューヨークのSVG生成では、ニューヨークの街並みがSVGでどのように見えるかを表現し、非常に素晴らしい成果を上げています。様々なベクターのアニメーショングラフィックスを見事にこなし、すべての異なる要素を適切に再現しました。このモデルの活用方法としては、ロゴや形状の再現、SVGシーンのアニメーション、UIアイコンの作成、さらにはプロンプトを非常に詳細でスケーラブルなデザインに変換して直接コードに落とし込むことなどが挙げられます。これは、このモデルでできる最もクールなことの一つでしょう。

高度なシステムシミュレーションと3D環境の構築

次に、Gemini 3.5 FlashにWindows 95のデスクトップを生成するよう要求しました。これは、その創造性と強力なフロントエンドおよびシステムシミュレーション能力において、私がこれまでに見た中で最高の生成結果かもしれません。起動音まで追加されているのが聞こえるかと思いますが、これはOSのシミュレーション生成において一度も見たことがありません。

しかし、最も印象的なのは、スピードと洗練された仕上がりの組み合わせです。BIOSの起動画面のような要素、合成された起動音、機能するアプリなど、本当に素晴らしい作り込みを確認できます。タスクバーの同期システムや適切なWindows 95のスタイリングまで備わっており、どのモデルでもこれほど適切に生成できるとは予想していませんでした。ペイントアプリ、メモ帳、マイコンピュータ、さらにはInternet Explorerがあり、すべてがフロントエンドのセンスで見事に描写されています。SVGとCSSの構造において非常に傑出しており、フラッシュ層としては全体的に極めてよくできています。

Mac OSのクローンも非常によく生成されており、Mac OSのすべてのコンポーネントを適切に完全生成することができました。すべての異なる要素、SVGアイコン、ホバー時のアニメーション、そして機能的でSVG形式の様々なアプリアイコンが配置された下部のツールバーが実装されています。

次に、インタラクティブで視覚的なデータパイプラインビルダーの構築を要求しました。ここでもエージェント型のフロントエンドエンジニアリングにおいて素晴らしい能力を発揮しています。これは緻密に描写されたUIアーキテクチャであり、このモデルが高度なSVG接続システムを備えた、ほぼプロダクションレベルのビジュアルIDEを出力できたことが分かります。単一のプロンプトから、ノードのロジック、アニメーション、ループ検出、そして洗練されたUXのすべてが生み出されています。

続いて、みなさんもおそらく耳にしたことがあるであろう、ゼルダのゲーム環境の3Dアート生成を要求しました。このモデルは、一日の異なる時間帯を伴う環境の生成において非常に優れた成果を上げました。このローポリゴンのトポロジーにおいて光がどのように描写されているか、そして様々なシーンの構成、ライティング、奥行き、色彩の調和を確認できます。これらすべての要素が、ゼルダのゲームであるブレス オブ ザ ワイルドに似た一貫したスタイルの美学を維持しています。また、これは別の次元でのプロンプト追従能力のテストでもありますが、なんとサウンドトラックまで追加されているのが分かります。これは本当に凄くないですか。

もう一つのプロンプトでは、この再帰的なキャンバス内で木が成長するプロセスを通じて、手続き型アニメーション、再帰的アルゴリズム、そして物理シミュレーションをテストしました。これは本当に素晴らしいと言わざるを得ません。このモデルが、一貫した再帰的成長システムを維持しながら、リアルな風のアニメーションを描写している点において、いかに印象的であるかが分かります。さらに風の音まで生成されており、非常にクールです。このように、このモデルはその創造性において極めて例外的であり、これらすべての異なる生成を高速に行うことができます。このGeminiモデルの能力には、本当に感銘を受けています。

3Dシミュレーションゲームと総評

次に、Three.jsでF1のドリフトドーナツシミュレーションを作成するよう要求しました。スピンする車の動きは完璧です。これはほとんどのモデルが完全に失敗する部分ですが、ここでは素晴らしい成果を上げました。もちろん、もっと良くできたはずの要素もあります。例えば、より優れた環境を生成することなどです。環境を変更することはできますが、最適とは言えません。そして、一つの大きな問題に気づくはずです。車のホイールが実は逆方向に回転しています。しかし全体としては、この生成においてカウンターステア、テレメトリシステム、そして手続き型テクスチャを見事に処理しています。

次は、サンドボックスゲームのマイクラを作成するよう要求しました。このケースで実際に何が生成されたか見てみましょう。これは、私が得たマイクラクローンの最初のワンショット生成結果です。今のところ少しバグはありますが、Mobが存在し、豚が生成されており、このゲームをより良くするための様々な要素が追加されているという事実は評価できます。また、地中には鉱石も見えます。今回の生成において、洞窟システムを含めるように要求していました。ヘルスバーもあり、異なるブロックを壊すことができるため、いくつかの効果音も生成されています。大きな音が鳴り響くのであまり壊したくはありませんが、すべての要素を徹底的に生成している点は本当に気に入っています。水に適切な物理演算が適用されていないのは少し残念ですが、それを差し引いてもピッケルが生成されているのはクールです。ブロックを壊すことができ、アニメーションまで用意されています。Eキーを押すとインベントリを開くことができます。アイテムのアイコンはどれも生成されていませんが、それでもこれらすべてのクールな要素が追加されているのを見られるのは間違いなく素晴らしいことです。これはおそらく、手直しを施した後のマインクラフト生成としては最高のものであり、私たちがこれまでに目にするマイクラクローンの生成結果の中でも屈指の出来栄えと言えるでしょう。

ここでは、自転車に乗ったフォックスホールのペリカンを作成するよう要求しました。ここで注目すべき大きな点は、このモデルが明らかに実際の建築的な理解を示しているということです。しかし、これらすべての異なるプロンプトを通じて気づくこととして、この特定のプロンプトに限らず、大半のプロンプトに共通の特定のUIスタイリングが追加されています。新しいGeminiモデルやこれらすべての異なるチェックポイントに関する私の過去の動画でも何度も言及してきましたが、すべての異なる生成物に共通して見られる特定のスタイリングが存在します。これは少し残念なことです。このモデルで生成するすべての異なる出力において、特定のUIパネルが表示されてしまう仕様になっているからです。この新しいバリアントのこの部分については、あまり好ましく思っていません。

このモデルはThree.jsや3Dワールドにおいて非常に優れたパフォーマンスを発揮し、従来の得意領域であるSVGにおいても明らかに秀でています。したがって、創造性、SVG、そしてThree.jsというこれら3つの領域こそが、このモデルが真に輝く場所であり、私がこのモデルを本当に気に入っている理由でもあります。

もしこの動画を気に入ってくださり、チャンネルをサポートしたいと思っていただけるなら、下のスーパーサンクス機能を通じてチャンネルへの寄付をご検討いただくか、プライベートDiscordへの参加をご検討ください。そこでは、様々なAIツールへの複数のサブスクリプションに毎月無料でアクセスできるほか、日々のAIニュースや限定コンテンツ、その他多くの特典を用意しています。

全体として、Gemini 3.5 Flashはフロントエンドに特化したコーディングにおいて異常なほど強力です。複雑なThree.jsのシーン、インタラクティブなUI、SVGシステム、シミュレーションゲーム、ダッシュボード、ノードエディタ、シェーダー、そしてブラウザアプリ全体を、驚くほど優れたアーキテクチャと視覚的な洗練さで構築することができます。私がこのモデルを主に気に入っている点は、知的で創造的であり、超高速かつある意味で効率的でありながら、他の商用モデルに匹敵する能力を持っていることです。そのため、Googleがここで成し遂げたことを本当に高く評価しています。最大の理由は、これが単なる小さくて速いモデルのようなコーディングをするのではなく、システムとして思考しているからです。

ただし、全体的な主な弱点としては、少し野心的になりすぎる傾向がある点です。トークンを大量に消費するため、大規模なプロジェクトでは途中で打ち切られてしまう可能性があります。これが、このモデルに予想される数少ない不満点の一つでしょう。しかし、Googleの試みは本当に素晴らしいと思いますし、Gemini 3.5 Proの登場が今から非常に楽しみです。間違いなく使用をお勧めします。簡単に始められるように、関連するリンクはすべて下の概要欄に貼っておきます。

それでは皆さん、今回もご視聴いただき本当にありがとうございました。サブチャンネルへの登録、ニュースレターへの参加、Discordへの参加、そしてTwitterのフォローもよろしくお願いします。最後に、チャンネル登録と通知ベルのオン、そしてこの動画への高評価を忘れずにお願いします。今後のアップロードも楽しみにしていてください。それでは皆さん、ありがとうございました。素晴らしい一日をお過ごしください。ポジティブな気持ちを広げていきましょう。また近いうちにお会いしましょう。

コメント

タイトルとURLをコピーしました