Gemini 3.5?新しいGeminiのステルスモデルが強力かつ高速!(完全検証済み)

Google・DeepMind・Alphabet
この記事は約10分で読めます。

Googleの最新AIモデル「Gemini 3.1 Flash」の可能性が高いとされる、Arena上の謎のモデル「White Water」についての検証動画である。フロントエンド開発やゲームのクローン作成などにおける圧倒的な生成スピードと精度の高さを解説し、今後の正式リリースへの期待を語っている。

Gemini 3.5? NEW Gemini Stealth Model Is POWERFUL & Fast! (Fully Tested)
Stop collecting responses, start triggering results. Build your Zapier Form and try it free! Get ready for the next-leve...

新たなGeminiステルスモデル「White Water」の発見

Googleが最先端のエージェンティックモデルであるGemini 3.1 Proをリリースしてから数ヶ月が経ちました。このモデルは、フロントエンドや基本的なコーディングタスクにおいて非常に強力であることが証明されており、特にマルチモーダル機能において優れています。しかし、私たちの多くはFlashバージョンの登場を待ち望んでいました。そして、おそらくかなり近いうちにそれが手に入るのではないかと考えています。というのも、つい最近GeminiチームがGemini 3.1 Flash Lightを導入したからです。これは信じられないほど高速で、リアルタイムのオーディオや音声インタラクションを可能にするライブバージョンも備えています。これらのリリースに加えて、Arenaに新たに登場したリークモデルの存在を考えると、Gemini 3.1 Flashの完全なリリースが目前に迫っていることが強く示唆されています。正直なところ、Flashモデルは非常に高速でコストパフォーマンスが高く、現実世界のアプリケーションやAI製品のスケールアップに理想的であるため、私はこのリリースを本当に楽しみにしています。

さらに興味深いことに、X上でKenという開発者が最近、ArenaでWhite Waterというコードネームのモデルを発見しました。このモデルはGeminiモデルとしてタグ付けされており、私自身のテストに基づいても初期の段階から非常に有望な結果を示しています。ハルシネーションの発生率が低く、生成スピードが非常に速く、全体的な品質もしっかりしています。

もちろん、Gemini 3.1 Proと同じレベルというわけではありません。それでも、もしこれがGemini 3.1 Flashであるならば、私たちは非常に強力で効率的なモデルのリリースを間近に控えていることになります。正直に言うと、このFlashモデルはかなり出来の良いMinecraftのクローンを生成してくれました。これまで他のほとんどのモデルではここまでの生成結果を得られたことがなく、Gemini 3.1 ProでさえMinecraftのクローン生成では少し物足りなかったことを考えると、これはちょっと驚きです。地形が絶え間なく生成されているのがわかると思います。配置できるさまざまなブロックのアイコンも生成されていて、本当に素晴らしいです。いろんなブロックを壊すこともできますし、もちろん配置することも可能です。

唯一の欠点はインベントリがないことです。Eキーを押しても、インベントリのコマンドが反応しません。しかし、これがかなり短時間で生成されたという事実が、皆さん、一番驚くべきところなのです。ですので、この生成結果に関しては、他のモデルで見てきたものと比較して、私は10点満点中8点を与えたいと思います。

スポンサーメッセージ:Zapierによるフォームの自動化

ほとんどの企業はフォームの使い方を完全に間違えており、そのせいでリード(見込み客)を逃しています。だからこそ、今日の動画はZapierの提供でお送りします。彼らはフォームが本来果たすべき役割を根本から変えようとしています。なぜなら、フォームは単にデータを収集するためのものではないからです。フォームは皆さんのビジネス全体を動かすきっかけとなるべきなのです。Zapier Formsを使えば、フォームが送信されるたびに、追加のソフトウェアや遅延なしで、ツール全体にわたって自動化、AIによる意思決定、そしてアクションが即座に実行されます。

実際の私たちのワークフローをご紹介しましょう。誰かがZapierのフォームに入力すると、Zapierは即座にそのリードの情報を充実させ、意図を分析します。高品質なリードであれば、CRMに送信してチームに通知します。意図が低いと判断された場合は、パーソナライズされたフォローアップのシーケンスがトリガーされます。すべてが記録され、追跡され、自動的に処理されるのです。

ほとんどの人はフォームを単なるデータの保管場所として使っていますが、私たちはAIシステムの出発点として使っています。これこそがZapierの本当の力です。下の概要欄のリンクからZapierを無料で試すことができます。単なるフォームではなく、システムを構築し始めましょう。

Arenaでの「White Water」モデルのテストと評価

さて、Gemini 3.1 Flashである可能性が高いWhite Waterモデルを試してみたい場合は、現在Arenaという名前にリブランディングされたAlamarinaにアクセスするだけです。アカウントを持っていることを確認してください。バトルモードで何らかのリクエストを送信します。例えば、コーヒーショップのランディングページを作成して、といったプロンプトを入力して送信すると、White Waterモデルによって生成される確率があります。

これは基本的に、異なるモデルが他のモデルと比べてどの程度のパフォーマンスを発揮するかを評価するためのバトルモードです。企業は通常、自社のモデルが他のさまざまな大規模言語モデルに対してどれくらいの性能を持っているかを確認し、評価するためにこのプラットフォームを使用します。基本的には、2つのアシスタントが回答を生成した後、どちらのモデルがより良い仕事をしたかを投票することができます。そして投票後に、どのモデルがその回答を生成したかが表示される仕組みになっています。

まず手始めに、私はWhite Waterモデル、つまりFlashモデルをハイエンドなフロントエンド製品の作成で評価してみました。ここで私はプロンプトを使って、このランディングページを作成するようリクエストしました。すると、このバーのアニメーションのような、Proモデルでもあまり見られないような細かな工夫が確認できます。各コンポーネントにアニメーションが割り当てられているのです。私はこの生成結果の創造性とオリジナリティが本当に気に入りました。100%完璧というわけではありません。スクロールアニメーションの生成があまりうまくいっていないのがわかりますし、後でGLM 5.1が生成したものもお見せしますが、そちらの方がこれより優れていると私は思っています。しかし、それでもこのモデルが目的を達成するために見事な仕事をしたことがわかるでしょう。

全体的に見て品質はかなり高く、Flashモデルとしては非常に印象的です。さまざまなタイポグラフィやコンポーネントが使われたこのランディングページの生成結果を、私は全体的にとても気に入っています。参考までに、これがオープンソースモデルであるGLM 5.1が生成したもので、すべてのコンポーネントを完璧に仕上げています。このアニメーションを見てみてください。

次のテストでは、White WaterモデルにMac OSスタイルのオペレーティングシステムを生成するようリクエストしました。ここで、すべてのGeminiモデルに見られるある癖を発見しました。誤解しないでほしいのですが、生成結果自体は素晴らしいです。しかし、こういった小さな癖があるのです。例えば、Finderアプリが私たちがリクエストしたダークモードを完全には適用しておらず、まだライトモードの部分が見えているのがわかると思います。Geminiモデルに与えるプロンプトの指示にうまく従えないことによる、こうした小さな問題が存在します。Geminiモデルにはハルシネーションの問題が多くあります。指示に適切に従うことができないため、物足りない生成結果になってしまうことがあるのです。しかし今回のケースでは、クローン作成をリクエストしたこのMac OSスタイルのオペレーティングシステムは、かなりうまく生成できました。

下部のツールバーにあるSVGアイコンの出来が良く、各アプリもしっかりと生成されているのがわかります。ですから、私はこの生成結果を気に入っていますし、Proモデルと比べても遜色ないレベルです。これは本当に驚くべきことでした。なんとミニサイズのSpotifyのクローンまで生成してくれたのです。さて、設定タブに入ってみると、背景を変更する機能まであり、これもかなりクールです。ですので、今回のケースでは10点満点中8.5点を与えたいと思います。

また、Kenが生成したSVGも非常に印象的です。PS5のコントローラーの3Dモデルは、私たちが以前見たものよりもはるかに良く見えます。彼はさまざまな種類のフロントエンドを生成しており、Minecraftのクローンも作成しています。そして、彼のMinecraftのクローンは、私が生成したものよりもずっと見栄えが良いのです。さらにペリカンのテストもあり、これも以前Gemini 3 Flashで見たものよりもはるかに素晴らしい仕上がりになっています。

優れたUI・フロントエンド生成能力と今後の期待

最高のAIツールやワークフロー、そして誰よりも早い最新情報を手に入れたい方は、下の概要欄のリンクから私の無料ニュースレターにぜひ登録してください。完全無料です。

Geminiモデルの良い点のひとつは、フロントエンドのデザインにおいて信じられないほどの能力を持っていることです。そして、Gemini 3.1 Proが持つその素晴らしい特性が、3.1 Flashにもしっかりと引き継がれているのがわかります。ここで私は、高度なテキストアニメーションとクリエイティブなUIエフェクトを備えたダッシュボードの構築をリクエストしました。ここでは、これらすべての異なるタイポグラフィを管理し、表示することができます。シャッフルやグリッチなど、様々な属性を確認する機能も備わっています。

というわけで、これがモデルが生成したかなりクールなダッシュボードです。私はSaaSのランディングページの作成もリクエストしましたが、生成されたコンポーネントがとても気に入りました。これは間違いなく新しいものであり、他のモデルでは見たことがないものです。フロントエンドの品質は、場合によっては以前Proモデルで見たものよりもはるかに優れています。ですので、これはGemini 3.1 Flashによる間違いなく素晴らしい生成結果と言えます。

皆さん、私たちが現在プレビューしているこのチェックポイントの段階でも、全体として非常に注目すべきモデルになっています。私はその創造性と、それを技術的な精度と組み合わせる能力を本当に気に入っています。さて、私が切実に願っているのは、このチェックポイントの性能が引き下げられない(弱体化されない)ことです。というのも、Googleはモデルをリリースする際にそういったことをしがちだからです。このモデルはGemini 3.1 Proのように、洗練されたハイエンドなフロントエンドを生成できる能力を持っています。そして、皆さんもここの生成結果からそれがお分かりいただけるでしょう。

これは、多くの異なる属性を持つ機能的なコンポーネントを生成する能力があり、様々なコンポーネントを1回のプロンプト(シングルショット)で生成できます。まあ、シングルショットかどうかはそこまで重要ではありませんが。最も重要なのは、このモデルがこれほどの知性を備えており、それを効率的な価格で実行できるということです。もし複雑なインタラクションを処理しつつ美しいコードを生成できるのなら、その価格設定と効率性により、私たちの多くが最終的に使うことになるであろう極めて例外的な素晴らしいツールになるはずです。

この動画が気に入って、チャンネルをサポートしたいと思っていただけた方は、下のスーパーサンクス(Super Thanks)のオプションから寄付をご検討いただければ幸いです。あるいは、私たちのプライベートなDiscordへの参加もぜひご検討ください。そこでは、月額無料で様々なAIツールへの複数サブスクリプションへのアクセス、日々のAIニュース、限定コンテンツなど、多くの特典を利用できます。

というわけで皆さん、本日の新しいGemini 3.1 Flashバージョンに関する動画は以上となります。これが本当にFlashモデルであり、私を試すための何かのテストではないことを願っています。今日の動画で使用したすべてのリンクは下の概要欄に貼っておきます。動画を楽しんでいただき、何か価値ある情報を得ていただけたなら嬉しいです。

さらにAIニュースを知りたい方は、ぜひ私たちのサブチャンネルもチェックしてみてください。日々のAIニュースをお届けするニュースレターへの登録もお忘れなく。Discordへの参加、Twitterでのフォローもお願いします。そして最後に、チャンネル登録、通知ベルをオンにする、この動画への高評価をお願いします。また、最新のAIニュースに遅れずについていくために、過去の動画もぜひご覧ください。

それでは皆さん、素晴らしい一日をお過ごしください。ポジティブな気持ちを広げていきましょう。また近いうちにお会いしましょう。

コメント

タイトルとURLをコピーしました