Gemini 3.1 Flash-LiteはGoogleの史上最速かつ最安モデル コーディング性能も十分 完全テスト

Google・DeepMind・Alphabet
この記事は約12分で読めます。

GoogleがGemini 3シリーズの中で最速かつ最もコスト効率に優れたGemini 3.1 Flash-Liteをリリースした。このモデルは大量の開発者ワークロードに特化して設計されており、363トークン/秒という驚異的な速度を誇る。Gemini 2.5 Flashと比較して、最初のトークンまでの時間が2.5倍高速化され、出力速度も45%向上している。Arena LeaderboardではELOスコア1,400を記録し、GPQAベンチマークでは86.9%を達成するなど、軽量モデルとしては異例の性能を示している。フロントエンド開発においては特に優れたパフォーマンスを発揮し、複雑なUIコンポーネントやアニメーションを迅速に生成できる。思考レベル設定機能により、タスクに応じて推論の深さを調整可能である。価格設定は100万入力トークンあたり0.25ドル、100万出力トークンあたり1.50ドルと、そのパフォーマンスを考慮すれば十分に競争力がある。

Gemini 3.1 Flash-Lite Is Google's FASTEST & Cheapest Model Ever! Decent At Coding! (Fully Tested)
In this video, I fully test Gemini 3.1 Flash-Lite across real-world coding tasks, structured outputs, and frontend-style...

Gemini 3.1 Flash-Liteの登場

Googleチームはいつも私たちを驚かせてくれますが、今日彼らはGemini 3.1 Flash-Liteを発表しました。これは大規模なインテリジェンスのために構築されたモデルです。Gemini 3シリーズの中で最速かつ最もコスト効率の高いモデルとなっています。大量の開発者ワークロードに特化して設計されているんですね。

とはいえ、価格は私が予想していたよりも少し高めでした。価格設定は100万入力トークンあたり0.25ドル、100万出力トークンあたり1.50ドルとなっています。それでも、提供される内容を考えれば、特にスピードを考慮すると十分に競争力があります。このモデルは毎秒363トークンで動作しますが、これは信じられないほど本当に高速です。

Gemini 2.5 Flashと比較すると、3.1 Flash-Liteは最初のトークンまでの時間が2.5倍高速です。出力速度は45%速くなっており、出力品質の体験も同等以上です。Artificial Analysisベンチマークによると、このモデルはレイテンシが実際に重要となる高頻度ワークロードやリアルタイムアプリケーションに最適なんです。

ベンチマークと性能評価

ベンチマークの観点から見ると、この3.1 Flash-LiteはArena Leaderboardで1,400のELOスコアを記録しています。GPQAベンチマークでは86.9%を獲得し、MMU Proでは76.8%を達成しました。ほぼすべての分野で、Gemini 2.5 Flashのような以前の世代の大型Geminiモデルを上回っているんです。

最も興味深い追加機能の一つは、思考レベル設定が有効になったことです。開発者はタスクに応じて推論の深さを上下に調整できるようになりました。軽量なチャット応答であろうと、UIやダッシュボード、シミュレーションの生成のようなより複雑なワークロードであろうと対応可能です。Gemini 2.5 Flashで以前見たものの特定の領域を上回っていることさえあり、これは軽量モデルとしては間違いなく注目に値します。

全体として、これはほぼすべてのカテゴリーで驚異的なモデルというわけではありませんが、構築された目的を完璧に果たしています。スピードとスケーラブルなインテリジェンスを高スループットアプリケーション向けに提供するという点で、強力な選択肢です。だからこそ今日は、実際にこのモデルで何ができるのかを紹介していきます。

最高のAIツール、ワークフロー、新情報を誰よりも早く手に入れたい方は、説明欄のリンクから私の無料ニュースレターに登録してください。完全無料です。

使い始める方法

このモデルを使い始めるには、Google AI Studioを通じて簡単にアクセスできます。スタジオ内で直接使用することも、ビルドモードやエージェントモードで新しい3.1 Flash-Liteを選択して使用することもできます。API経由での利用も可能ですし、Open RouterプロバイダーやKilo Codeを通じて利用することもできます。Kilo Codeでは実際に25ドル相当の無料クレジットが提供されており、CLIツールや拡張機能を通じて使用できます。

Geminiアプリもこのモデルをホストしていますし、Alamarinaでは新しいGemini 3.1 Flash-Liteと他のモデルを並べて比較することができます。検索すれば、Flash-Liteプレビューを見ることができるでしょう。このモデルがどれだけ速いかをお見せしましょう。品質も本当に素晴らしいです。

フロントエンド開発のテスト

ここで私がリクエストしているのは、お気に入りのフロントエンドタスクの一つです。この詳細なプロンプトでクリエイティブなフロントエンドを作成します。コードを書く速度がどれだけ速いか見てください。このフロントエンドを機能させるために必要なすべてのコンポーネントを生成するのが非常に高速です。Flashモデル、つまりGemini 3 Flashと比較してもその速さがわかります。

ほら、あっという間に完成しました。一方、3 Flashはまだ終わっていません。出力も見事な仕上がりでした。指示に従うという点では最高とは言えませんでした。なぜなら、私が生成してほしかった他の多くのコンポーネントには従わなかったからです。

それでも、このランディングページの生成において、かなり迅速で効率的な仕事をしてくれました。驚くべきことに、理由はわかりませんが、Flash-Liteのフロントエンド機能は、私が実際に使ってきたほとんどのモデルよりも優れています。個人的に驚いています。これは多くのコンポーネントが追加された美しいフロントエンドで、特に背景の雰囲気が素晴らしいです。

デバイスの色を変更できるなど、全体的なフロントエンドに機能的なコンポーネントがあります。360度製品ビューアを作成しました。完全にコーディングされたさまざまなカメラアングルがあり、これらのさまざまなコンポーネントを実際に見ることができるのは素晴らしいことです。

これは3.1 Pro Previewが明らかにずっと高品質に生成したものです。しかし、それでもGemini 3.1 Flash-Liteは3.1 Proと比較してフロントエンドでより良い仕事をしたと言えます。これは本当に多くの可能性を開きます。なぜなら、適切なフロントエンドを出力するコスト効率の高いモデルはゲームチェンジャーになり得るからです。明らかに迅速に構築でき、費用を抑えながらプロトタイプを作成することさえできます。

Kilo CodeのCLIツールでのテスト

次に、Kilo CodeのCLIツールに移ります。ここで3.1 Flashを選択します。CLI のような外部アプリケーション内で何ができるかをもう少しテストしています。ここでは、お気に入りのプロンプトである、機能的なアプリと多くの機能を持つMac OSブラウザOSを作成します。

CLI内での動作を見てください。すべての要件を提供できれば、すべてのコンポーネントの構築を自律的に進めることができます。コンテキストと右側のパネルでどれだけ費やされているかを確認できます。しかし、TUIをクリックして視覚化する機能もあります。だからこそこのCLIツールは素晴らしいのです。オープンソースでもありますからね。

それ自体が注目すべき機能です。そして完成しました。これを作成するのに8セントかかり、このMac OSスタイルのオペレーティングシステムを完全に生成するのに約35秒かかりました。最高のオペレーティングシステムではありませんが、高品質のコードを迅速かつ効率的に出力できるという事実は素晴らしいです。

下部のツールバーは完全にアニメーション化されていませんが、Mac OSオペレーティングシステムと同じようなスタイルと外観を模倣しているという事実は悪くありません。機能的なFinderアプリがありますが、これは素晴らしいです。ただし、さまざまなアプリを動的に移動させる機能はありません。それだけでなく、アプリは完全にコーディングされていません。

ターミナルはかなり基本的に見えます。メモアプリも本当に基本的です。明らかに入力はできますが、それだけです。音楽アプリもあり、これも基本的です。そして設定アプリがあります。

この生成では、推論を設定して調整したとき、計画とアーキテクチャの推論でかなり良い仕事をしたので、かなり感銘を受けました。ここでレーシングゲームを作成しました。完璧ではないことはわかっていますし、サウンドは少しうるさいですが、車のアニメーションでは素晴らしい仕事をしました。丘を越えることができるのを見てください。これはかなり印象的です。

2D数学と3Dイリュージョンの知識を使用しており、これは多くのモデルがこのケースで使用しているのを見たことがないものです。この生成でリアルタイムレンダリングとパフォーマンスを使用することもできました。3Dレーシングゲームとしては間違いなく素晴らしい出力です。

3Dシミュレーションのテスト

次のプロンプトでは、Formula 1カーが連続的なドリフトドーナツを実行する3Dシミュレーションの作成をリクエストしました。このテストは私のチャンネルで何度も見たことがあるでしょう。これは今までで最悪のF1ドーナツドリフターの生成です。明らかに、Flash-Liteとしてはある程度予想されていましたが、3.1にはもう少し期待していました。

ドリフトの機能性とダイナミクスを明らかに作成するという点では、かなり良い仕事をしました。しかし、それ以外には何も作成されませんでした。左上にカウンターが生成されていますが、それ以外では、これはおそらく私が見た中で最悪の生成の一つです。しかし、改めて考えると、このモデルはGemini 2.5 Proのようなものよりもずっと良い仕事をしているということを思い出さなければなりません。

2.5 ProはF1ドーナツドリフトの機能的な出力すら生成できませんからね。そして、フロントエンドについて話していたことに戻りますが、これは生成した別のランディングページです。超印象的とは言いませんが、異なるタイポグラフィを使用し、私の指示に従って複数のブロックを作成できているという事実は素晴らしいです。

エージェント機能のテスト

次に、VS Code内のKiloの拡張機能を使用して、モデルのエージェント機能をテストします。CLIよりも拡張機能の方が好きなので切り替えていますが、本当にあなたが好きなもの次第です。しかし、このケースでは、ツールを使用して幻覚を起こしたり早期に停止したりすることなく、実世界のデータを自律的に調査し、検証し、分析し、保存し、行動するようモデルに強制するプロンプトです。

今、私たちが焦点を当てようとしているのは複数のステップです。ここに表示されているものです。これがこのモデルの美しさです。ウェブを効率的に使用し、その効率性と速度を使って入力を非常に迅速に処理できるからです。また、マルチステップ計画プロセス、複数のツールの使用方法、ライブデータ検証、そして要求したすべてのデータをCSVファイルに構造化することをテストするものでもあります。

そして、すでにPythonステップに進んでいるのが見えます。私は何もしていません。すべて自律的に実行されています。完了しました。要求した調査を実行し、CSVファイルへの調査結果の構造化など、私たちが焦点を当ててほしかったすべてのツール呼び出しを実行することができました。このケースでは、これは圧縮されたエグゼクティブサマリーです。

特別なものでも大きなものでもありませんが、要求した3つのモデルすべてを見つけました。モデルカードもリストアップしています。そして、そのエグゼクティブサマリーを私の個人メールにメール送信することさえできました。これは素晴らしいです。実際にそのメールを受け取りました。このプロセス全体で約4セントでした。これは本当に信じられません。

Minecraftクローンへの挑戦

このモデルを失敗に導こうとしています。今度はMinecraftクローンを作成するよう指示しています。これで失敗するのはかなり確実ですが、実際に何を生成するか見てみましょう。こちらがMinecraftクローンです。インベントリはありませんが、実際に移動できます。

移動している様子は表示されません。ブロックを壊す機能もありませんが、これはFlash-Liteモデルとしては予想されていたことでした。それでも雰囲気の生成において機能的な仕事をしたという事実は、それ自体で注目に値します。しかし、良いニュースとしては、Gemini 3 Flashは何も生成しませんでした。このケースでReactエラーに直面したように見えるか、何も表示されません。

SVGとアニメーションのテスト

ここで蝶をSVGコードで作成しました。明らかに要求の高いものでも信じられないようなものでもありませんが、蝶をSVGで作成するのは迅速でした。そして、アニメーション化するようリクエストしただけで、これでかなり良い仕事をしました。しかし、Gemini 3.1 Pro Previewが生成したものを見てください。

明らかにアニメーションはひどく見えますが、その背景の雰囲気と生成された美しい蝶の羽があるという事実は素晴らしいです。Gemini 3 Flashと比較したテキスト出力は素晴らしいです。ロード・オブ・ザ・リングについてのエッセイを作成するこのプロンプトを送信している場所を見てください。

これは、モデルの長文形式の執筆品質、主題的理解、構造、そして正しい構造を効率的に生成する速度をテストするプロンプトです。中つ国の響き、ロード・オブ・ザ・リングが今日でも決定的な叙事詩であり続ける理由という主要テーマに焦点を当てながら、より速く実行したのが見えます。なぜこの物語が素晴らしいのかについて語っています。

全体として、Gemini 3 Flashと比較して、より引き締まったエッセイ構成とより明確な論理的な流れが気に入っています。品質が悪いとは言いませんが、エッセイのより良い流れ構造があるという事実は素晴らしいことです。

この動画が気に入って、チャンネルをサポートしたい場合は、下にある「Super Thanks」オプションを通じてチャンネルに寄付することを検討してください。または、プライベートDiscordへの参加を検討することもできます。そこでは月額ベースでさまざまなAIツールへの複数のサブスクリプションに無料でアクセスでき、毎日のAIニュースや限定コンテンツなど、さらに多くのものがあります。

結論

結論として、このモデルはフロントエンド開発に焦点を当てた過小評価されているコーディングモデルだと感じています。極めて高速なトークンとスピードを低コストで提供します。コードベースのリファクタリングを試してみることを強くお勧めします。これは、高スループットとさまざまな種類のコンポーネントを使った私のテストの一つで、かなり影響力のある仕事をしたものです。本当に、これはスピードと効率性に基づいた強力なモデルだと感じています。

もう少し安ければ完璧でしょうし、価格帯をはるかに上回るパフォーマンスを発揮するものです。今日の動画で使用したすべてのリンクは、説明欄に残しておきます。しかし、その考えとともに、皆さん、見てくれて本当にありがとうございました。セカンドチャンネルに登録し、ニュースレターに参加し、Discordに参加し、Twitterでフォローしてください。そして最後に、必ず登録し、通知ベルをオンにし、この動画に「いいね」をして、最新のAIニュースを常に把握できるように過去の動画も見てください。

しかし、その考えとともに、皆さん、素晴らしい一日をお過ごしください。ポジティビティを広め、またすぐにお会いしましょう。

コメント

タイトルとURLをコピーしました