新型Gemini 3.1 Flash Liteは高速かつ低コストであなたのアプリケーションを加速する

GoogleがGemini 3.1 Flash Liteをリリースした。これは同社のGemini 3ファミリーの中で最も高速かつ経済的なモデルである。入力100万トークンあたり0.25ドル、出力100万トークンあたり1.50ドルという破格の価格設定により、大規模かつ高頻度の処理に最適化されている。性能面ではGemini 2.5 Flashと比較して応答時間が2.5倍高速化し、出力速度も45%向上した。ただし、このモデルは軽量版であるため、複雑な推論よりも簡易的なタスク(要約、分類、基本的な対話など)に適している。開発者向けプレビュー版としてGoogle AI StudioおよびVertex AIで利用可能であり、一般向けGeminiアプリには未実装である。実演では3D都市シミュレーションゲームのNPC対話システムに統合され、低コストでリアルタイムな会話機能を実現している。

NOVO Gemini 3.1 Flash Lite é RÁPIDO e BARATO e Vai Turbinar Suas Aplicações

Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

Gemini 3.1 Flash Liteの登場
モデルの特徴と位置づけ
驚異的な価格設定
ベンチマーク比較
Google AI Studioでの実践
トークン使用量とコスト分析
ゲーム生成の比較
3D都市プロジェクトでの実装
NPCとのインタラクティブな対話
さらなる対話の展開
まとめとコミュニティへの呼びかけ

Gemini 3.1 Flash Liteの登場

皆さん、Gemini 3.1 Flash Liteがリリースされました。これは小さくて安価な、誰でも使えるモデルなんです。それほど賢いわけではありませんが、何か素早く作業したいときや、人工知能を使ってちょっと楽しみたいときに役立ちます。では、何が起きているのか見ていきましょう。

それでは始めます。まず、いいねを押してくれた皆さん、チャンネル登録してくれた皆さんに感謝します。そして、このAIチャンネルをスポンサーしてくれているチャンネルメンバーの皆さんに特別な感謝を。メンバーには限定動画や先行公開動画へのアクセス権があることをお忘れなく。

モデルの特徴と位置づけ

Gemini 3.1 Flash Liteが出ました。このモデルが同時に二つの意味で速いことを理解していますか。Flashなので小さいサイズで、同時にLightなのでより軽量なんです。だから明確にしておきますが、このモデルに超高いIQを期待しないでください。

これは私たちが楽しんだり、ちょっとした作業をするためのものです。Gemini 3で最も高速かつ経済的なモデルであり、大規模かつ高頻度の開発ワークロード向けに作られています。つまり理解できましたか。大規模で高頻度だけど、それほど高い知性を必要としない何かがある場合、ここでは完全には書かれていませんが、あまり知性を必要としない場合、このモデルを使うことになります。

例えば、数千台のコンピューターで動作する製品があって、その中に小さなタスクがあるとします。メールの要約やテキストの要約など、もっとシンプルな何かです。そういう場合、これは良い解決策になるかもしれません。このFlash Liteは開発者向けプレビュー版なので、Geminiアプリには表示されません。APIやGoogle AI Studio、企業向けにはVertex AIに表示されます。

だからGeminiアプリからアクセスしようとしても無駄です。そこには表示されませんから。何が重要かというと、品質を損なわずにコスト削減ができることです。なんてこった、めちゃくちゃ安いんです。入力100万トークンあたり0.25ドル、出力100万トークンあたり1.50ドルです。

驚異的な価格設定

参考までに、聖書全体で約100万から170万トークンあります。つまり、聖書全体をここに送って質問をしたら、約0.50ドル、いやそれ以下かかることになります。0.50ドルにも届かないでしょうから。そして返答が、仮に聖書の半分を返すことが可能だとしたら、1.50ドルかかります。つまりこれが安いことは理解できましたね。

私がこれを「無限AI」と呼んでいるのは、とても安いからです。あなたがものすごく使っても、個人アカウントの場合、せいぜい10レアルくらいしかかからないでしょう。ビジネス用途ならもっとかかるかもしれませんが。

そして理解してもらうために、ここでFlash 2.5と比較しています。応答時間が2.5倍速く、出力速度が45%向上しています。ここまで来たら理解できますよね。これらは小さいモデルです。全部小さいんです。3.1 Flash Liteと2.5 Flash、GPT-4o mini、Claude 4.5 Haiku、Grok 4.1 Fastです。

ベンチマーク比較

ここで見ての通り、Geminiファミリーはこの中で最も賢いとGoogle自身が言っています。そしてコスト比較では、古いバージョンのGemini 2.5 Flash Liteより少し高くなっていますが、Claude Haikuを含む他のすべてと比較すると、結局より安くなっています。

そして正直なところ、全体的に勝ったのはGrok 4.1 Fastだけですね。ほら、価格を見てください。Grokだけが、Gemini 2.5 Flash Liteより少し高くなりました。このモデルはマルチモーダルな質問に答えられます。例えば、ここで同じ質問を送って、Flash LiteとFlash 2.5を比較しています。

ここで見て分かるように、かなり速く進んでいます。4%、5%、もう一方はまだ1%です。突然加速して、100%になって、もう一方はまだ16%でした。もっと速いんです。だからこの詳細に注目する必要があります。最終的にGemini 2.5 Flashは33秒かかり、3.1 Flash Liteはわずか4秒でした。

つまりかなり速くなったことが分かりましたね。小型モデル間のベンチマークでは、最高クラスの中にいて、時々2.5 Flashに負けたり、時々GPT-4o miniに負けたり、Human EvalではGrokに負けたりしています。だから小型モデル間ではバランスが取れていますが、それでも小型モデルです。

Google AI Studioでの実践

Google AI Studioで使う必要があります。その場合、こうなります。AI Studioに入って、ここでモデルを選択します。例えばクリックして、Geminiモデルを選択します。すると3.1 Pro previewが表示されます。これではなく、これです。Gemini 3.1 Flash Lite preview。これを選択して、thinking levelをhighにして賢くします。

メディア解像度もhighにしたければそうします。そして私がやることは、見てください。左右に矢印がありますよね。二つのモデルを比較します。ここに3 Flash previewを配置します。つまり3.1ではありませんよ。左側は3 Flash previewで、右側は新しい3.1 Flash Lite previewです。

ここにカートのプロンプトを入れて、何が起こるか見てみましょう。彼らがどれだけ時間をかけるか見てください。同時ですよ。Flash previewが左で、Flash Lite previewが右です。右のLiteはもうコードを書き始めて、やるべきことを全部やっています。

Flash Previewは今やっとコードを書き始めたところです。二つとも可能な限り最善を尽くそうとしています。どうやらFlash Liteはほぼ終わりそうです。終わります。見てください。待って、待って。まだ到達していません。もう少しです。これはリアルタイムですよ。3.1 Flash previewが進んでいます。見てください。どっちが先に終わるか見ましょう。

見てください。終わりそうです。終わりそうです。Lite previewが最後の言葉です。終わりました。そして3 Flash previewは少し時間がかかりました。比較すると、一方は55秒かかり、もう一方は17秒でした。

トークン使用量とコスト分析

ここでトークンの使用を分析できます。例えば、5,460トークン使用しました。入力が約300トークンで、出力が5,000トークンでした。そして総コストはこれです。0.007ドルです。

もう一方、Flash Lite previewは少し高いですが、約7,300トークン使いました。入力は同じ300トークンで、総コストはここで0.02ドルでした。小数点の後にゼロが一つしかないことに気づきましたか。0.02ドルです。だから価格面では、Flash Liteの方が価値があることが明確になりました。

でも、このゲームがどうなったか知りたいですよね。ではFlash previewバージョンで何が起こったか見てみましょう。これがそれです。起動が簡単です。見てください。カートが全部正しく動いています。いつものカートゲームですね。

列車が変な感じになりました。これをコントロールするのは難しいですね。二つ目のプロンプトを送る方法がありません。なぜなら一つを修正すると両方修正されてしまうからです。列車がかなり奇妙になりました。このエリアを横断しましょう。これが3 Flash previewで作ったゲームです。

これが見えているものです。小さなモデルだって知っていますよね。小さなモデル対小さなモデルです。さて、Flash Lite previewです。これはさらに小さいモデルで、かなりシンプルなモデルだということを覚えておいてください。期待値はこのモデルサイズに合わせる必要があります。

ゲーム生成の比較

見てください、始まりました。皆さん、気づきましたね。少し悪化しています。ここではもっと良い生成をしたことがありますが、この生成はかなり弱いです。でも動いていますよね。何かがぶつかって、AIがあって、列車との衝突があります。列車は一つで、列車は四角です。つまり理解できましたね。これは小さなモデルで、弱いんです。だから大きな期待は持てません。

同じことが他の生成でも起こります。MatrixはGemini 3 Flash Previewの方がずっと良いです。少し奇妙で、少し悪いです。少し悪いですが、小さなモデルですから。でもFlash Liteではさらにシンプルになります。かなり落ち着いた感じです。

ペリカンのプロンプトも同じです。ペリカンを見てください。かなりシンプルで、かなり落ち着いています。そしてLite Previewバージョンでは少し悪化しましたが、機能しました。リオのボクセルアートも同じです。このFlash Previewバージョンでは、コルコバードのキリスト像が見えます。全部正しいです。ピザの形をした島ですが、ポン・ジ・アスーカルとケーブルカーがあります。

そしてLite previewでは、ケーブルカーがその周りを回転している十字架のようなものになりました。太陽系みたいです。でも、これで楽しいことができますし、安価にその超能力を使って、私たちのために機能させて楽しむことができます。

3D都市プロジェクトでの実装

例えば、3D都市を覚えていますか。今は都市があって、たくさんの生き物がいて、車があって、都市があって、モニュメントがあります。このプロジェクトをフォローしている人は見えていますよ。モニュメントが全部表示されています。見てください、面白いことに、自由の女神像があります。

そして今、皆さん、新機能を見てください。例えば、ここにGabi Soaresがいて、電話番号24です。番号がそこに表示されています。Edu Silvaは電話番号26で、そこに犬のMartinsが28です。23がDani Vieiraです。

では、携帯電話を開いて、Dani Vieiraの番号を保存します。もう保存されています。そしてここでチャットを送ります。「ハイ」と送ると、彼女がジャンプするのが見えましたか。そして言いました。GのAPIエラー、設定されていません。なぜかというと、Google AI StudioにあるAPIキーを使えるように追加したからです。

面白いことに、私はここで無料レベルを使っています。請求を設定していないので、無料APIを使っています。ゲームに来て、設定に行って、ここにAPIを入力します。

このシステムは、最小限のセキュリティしかありません。だからテストしたければテストしてください。でもその後、ここからAPIを削除するか、無料アカウントに置いておいて何も起こらないようにしてください。後でこの統合部分を改善しますが、今のところこれはテスト用です。AIを使ったNPCモードを有効にして、保存して閉じて、Dani Vieiraがいるゲームに戻ります。

もう一度携帯電話を開いて、今度は「ハイ」と送ります。彼女が小さくジャンプします。そして彼女がここで返信しました。「ハイ、訴訟や緊急配達のためでなければ、放っておいてください。終わらせなければならない書類の山があります」

NPCとのインタラクティブな対話

何が起こったかというと、今押すとここに私の会話が表示されます。チャットを見て編集します。彼女と話したことが全部見られます。「ハイ」と送りました。そうしたらキーエラーが出て、またハイを送りました。そうしたら彼女があれを返しました。

そしてここに彼女の性格があります。角のオフィスで働いていて、ストレスを抱えて生きています。ここは間違っています。ストレス要因ではなく、ストレスを抱えています。だから彼女のストーリーをここで改善して、もっと何か言えます。

そこで彼女のストーリーに追加しました。彼女を幸せにする唯一のものはコーヒーとポン・デ・ケージョです。そしてここで保存します。ゲームに戻ります。ここで小さなウィンドウを開きます。あなたにプレゼントがあります。見てみましょう。ジャンプしますよ。ジャンプします。

見て、ジャンプしました。本当ですか。温かいコーヒーとポン・デ・ケージョなら、あなたは今日の私のお気に入りの人になりました。そこで言います。的中です。

つまりこのゲームは、小さくて超高速なモデルを使っているので超安くなることが分かりましたね。そして会話部分では、プログラミングには弱いモデルでも問題ありません。Daniもここで同意しています。まあ、あなたは私の命を救いました。机に置いておいてください。この勤務時間の残りを耐えるために本当に必要です。

だから皆さん、今、私たちの3D都市では、携帯電話でメッセージを送ることでどんなNPCとも会話できるようになりました。

さらなる対話の展開

面白いアップグレードをしました。例えば、Oteil Limaは猫ですか、それとも犬ですか。分かりません。待って、車が来ています。気をつけて。この猫にメッセージを送ります。番号を追加しました。チャットに入って、おはようと送ります。何が起こるか見てみましょう。ジャンプしました。

おはようございます。この辺りで雑種のキャラメル色の犬を見ませんでしたか。先週から犬を探しています。犬を飼っている猫というのは面白いですよね。すごく変ですよね。押してみて、ここを見て何が起こっているか見ると、先週逃げた犬を探しています。ここに入れなければなりません。

Oteilは猫です。彼女は自分が猫だと知っている必要があります。そうでないと混乱しますから。そこで送ります。本当ですか、あなたが犬好きだとは思いませんでした。でも今、彼女は自分が猫だと気づきます。

そうなんです、彼は私の親友です。私よりずっと大きいですけど。どこに行ったか何か手がかりはありますか。残念ながらありません。

それで、どう思いましたか。これについて、小さくて超安いモデルでNPCと会話させるのが価値があるかどうか、下にコメントしてください。私は価値があると思います。この品質の小さなモデルは、2023年の大きなモデルにほぼ相当します。

まとめとコミュニティへの呼びかけ

物事は過去とはかなり違います。だから、利用してください。ゲームを作って、これらの安いモデルでもAPIを使ってください。自分のゲームでもです。下に何を考えているかコメントしてください。そして、このような動画を見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。

メンバーはインテリジェントエージェントの限定動画や先行公開動画にアクセスできます。それでは、いいねを押してください。ありがとうございました。