Gemini 3 Pro – あなたが待ち望んでいたモデル

GoogleがDeepMindを通じて開発したGemini 3 Proがついにリリースされた。本モデルは数年にわたる研究開発の集大成であり、特に推論能力、コーディングスキル、エージェンティックなタスク実行において大幅な性能向上を実現している。LMArenaで初めて1500 Eloスコアを突破し、主要ベンチマークで競合モデルを上回る成績を収めた。Googleは本モデルを単なるチャットインターフェースではなく、実際に作業を遂行できる実用的なツールとして位置づけており、AI Studio、Gemini App、Google検索など複数のプラットフォームで展開する。動的UI生成、ビジュアルレイアウト、Geminiエージェント機能など革新的な機能が追加され、ユーザーは対話だけでなく実際のタスク実行を依頼できるようになる。さらに長時間の思考を要するタスクに特化したGemini 3 Deep Thinkも発表され、AI技術の新たな段階を示している。

Gemini 3 Pro - The Model You've Been Waiting For

In this video, I go through Gemini 3 Pro, the model that people have been waiting for.Blog: more tutorials on...

Gemini 3 Proのリリースと概要
優れたベンチマーク性能
AI Studioでの実践例
コーディング能力のデモンストレーション
プラットフォーム戦略とリリース範囲
Google Labsと製品展開

Gemini 3 Proのリリースと概要

さて、皆さんがかなり長い間待ち望んでいたモデル、Gemini 3が本日リリースされます。そして初期テスターの一人として、DeepMindから私はこのモデルへのアクセス権を得ました。この動画では、このリリースのさまざまな側面について詳しく説明していきます。Gemini 3 Proが何が得意なのかについてお話しします。

Googleがこのモデルで特定の種類のタスクを大幅に改善するために焦点を当てている点についてお話しします。そしてGoogleがこのモデルを使って、全く新しい機能と新製品のスイート全体をどのようにサポートする予定なのかについてもお話しします。さて、本日のGemini 3 Proリリースと併せて、Googleはエージェンティックなコーディングに特化したAnti-Gravityという製品もリリースしています。

これについては実際に別の動画を作成して詳しく解説していますので、興味がある方はそちらの動画もチェックしてみてください。では、まず最初に、このモデルは到着するまでにかなりの時間がかかりました。私が言っているのは、モデルについての噂を話していた人々が言及していた数ヶ月だけのことではありません。このモデルは実際に、Googleが過去数年間にわたって多くのことに焦点を当ててきた集大成なのです。

それはTPUやデータセンターなどのようなAIインフラストラクチャレベルのことから、これらの専門家混合モデルを推進する最先端の研究まで含まれます。これはGoogleで始まっただけでなく、過去数年間にわたって多くの点で進歩してきました。そして今日、私たちはGemini 3にたどり着きました。

そして実際にこのローンチにおいて、Googleはモデルの主要な機能と、それらをさまざまな製品でどのように実際に使用するかという点に焦点を当てています。ですから、内部的にGoogleはGemini 3に一連の機能を持たせることに注力してきました。そしてこれらはいくつかの異なることを中心に展開しています。

モデルは推論において飛躍的な向上を持つべきだということです。実際に使い始めると確かにそうなのですが、多くの点でその推論は特定のスキルに焦点が当てられています。ですから、APIやチャットアプリなどを通じて実際のモデルを使用する際、そこでの全体的な目標は、モデルを賢く、簡潔で、直接的にすることでした。

そしてこれはGoogleが進んでいる非常に明確な方向性のようです。彼らは、おそらくOpenAIがやっているような、重厚で個性重視のスタイルのモデルを目指しているのではないようです。彼らはより、アシスタントであると同時に、実際にあなたのために作業を行い、多くの重労働をしてくれるツールとなるものを目指しています。

そしてこれは、Gemini 3 Proが実際に大幅に優れている多くのスキルで本当に現れています。これは例えば、最先端の推論のようなものだけでなく、長期的なタスクのようなものでも見られます。構築と計画の能力において、これを見ると、それはコーディングタスクのようなものだけでなく、ユーザーがテキスト駆動のインターフェースを超えてモデルと対話できるように、その場で動的なUIを構築できることです。

そしてコーディングについて触れているついでに、これは明らかにGoogleにとって重点分野となっています。コーディングとエージェントがより洗練されたタスクを、関数呼び出しや長期的なタスクなどで実行できるというこの全体的な考え方の両方です。そして、ベンチマークのようなものを見始めると、これさえも見ることができます。

優れたベンチマーク性能

Gemini 3 Proは、すべての主要なベンチマークで2.5 Proを上回るだけでなく、多くの場合大幅な差をつけています。また、1500 Eloを超えるスコアでLMArenaでトップになった最初のモデルでもあり、これはGemini 2.5 Proより50ポイント上です。そして実際にその間にあるのは、Grok 4.1モデルのいくつかだけです。

このモデルが本当に優れている他のベンチマークとしては、humanity’s last examで37.5%を達成しています。その試験での進歩は、作成者が意図していたよりもはるかに速く進んでいることは明らかですが、それは本当に、本物の理解と複数ステップの論理を測定しています。そこでGemini 3 Proがはるかに優れていることがわかります。

注目すべきもう一つのベンチマークは、GPQA diamondです。これはGoogle proof question answeringのことで、そこでの全体的な考え方は、推論だけでなく、博士号取得者が自分の専門トピックで実際に持っているような深い知識を測定することです。モデルカードからベンチマークを見てみると、非常に印象的です。私が話したhumanity’s last examがあるだけでなく、ARC-AGI 2がClaude Sonnet 4.5とGPT 5.1の両方よりも大幅に高くなっています。

そして、terminal bench 2のようなものを見るエージェンティックなコーディングのベンチマークがあります。これも、Gemini 2.5だけでなく、そこにある競合モデルよりも大幅に優れています。Agentic tool useベンチマークも非常に良い結果を出しています。Claude Sonnet 4.5をわずかに上回っています。そしてご覧のように、おそらくSWE Benchを除いて、これらすべてにおいて、Gemini 3 Proはここで競合を打ち負かしています。

AI Studioでの実践例

さて、AI Studioに入って、実際にこれを使って物を構築するいくつかの実例を見てみましょう。AI Studioに入ってきて、私が興味深いと思ったのは、複数の検索と複数のツールを使用する必要があるさまざまな例を試してみることです。

実際には膨大な量のツールを与えているわけではありませんが、このプロンプトから、ここでの考え方は検索を行い、それらの検索に応答し、いくつかのコードを書き、そしてこれらすべてを徐々にまとめていく必要があるということがわかります。そして確かに、それが始まり、実際にそれを行います。最終的に、ここの下でコード実行を与えていることがわかります。

グラウンディングとURL contextを与えて、基本的に物事を引き戻すことができるようにしています。そして基本的に、そこにあるさまざまなコーディングツールの分析を行うように依頼しました。最終的にコードをたくさん書くことができることがわかります。そしてそれを実行し、これを使って実際に比較表を作成し、すべてをまとめることができます。

そして、実際に各サイトで見つけたもののcitationが途中で提供されます。そして私はそれらのいくつかを確認しましたが、非常に正確であるように見えます。この点に到達するために、多くの異なるソースを使用していることがわかります。しかし、また、異なるベンチマーク、異なるレビューなどを見つけるために、これらの異なるキーワードで検索された大量の検索も使用しています。

そしてこれは、私が実行したさまざまなテストの多くで見られる共通のパターンです。基本的にAIエージェントの現状をまとめるように依頼するような、同様のことを行っています。それが進んでいくのがわかります。この場合、いくつかのスライドを作成するはずでしたが、実際にはここでスライドツールのセットを与えていません。

サンドボックスにいるだけですが、コード実行を与えています。グラウンディング検索などを与えています。そして、この種のタスクを行うには、これを通過する多くのマルチホップのステップを実行する必要があります。そして、使用したすべてのソースと、異なる情報を見つけてまとめるために実際に行った大量の検索を見ると、これも再び見ることができます。

これは、より長期的なタスクにとって本当に良い兆候です。そして、APIバージョンを使用している場合にも確実に現れます。そして基本的に一連のタスクを与え、それを通して多くのマルチホップまたはマルチステップの推論ポイントでこれらの多くをまとめる必要があります。

コーディング能力のデモンストレーション

さて、実際のコーディング能力のいくつかを見てみましょう。そして実際のビルドツールについては後で説明します。ここで見ることができますが、これは実際にはGooglerの一人から来た例で、3Dボクセル画像を作成しています。過去数週間でこの種のものがかなり多く出回っています。

これは非常に興味深いと思います。なぜなら、これは基本的にインタラクティブなシミュレーションだからです。これはゴールデンゲートブリッジのもので、three.jsを使用していますが、それは特に驚くことではありません。しかし、異なる照明、スライダー、霧、これらすべてのものをそこに記述しています。モデルは実際にこれを行うために注意を払う必要があります。

そして、その考えを見ると、持ち出された各要素に対処していることがわかります。これは本当に良いことです。そして最終的に、このシンプルなHTMLページを提供してくれます。ですから、ズームインとズームアウトができます。時刻を変更できるので、実際に物事を見ることができます。これを回転させて、いろいろできます。

さて、交通密度を増やすことができます。実際に水面から輝くものを見ることができます。後ろのサンフランシスコのいくつかの建物を見ることができます。そして霧のようなものを追加することさえできるので、実際に何が起こっているのかを見ることができます。ボートがあって、そこで揺れていると思います。

そして、これは実際にここで行っていることにとって非常に印象的です。モデルが実際に非常によく輝くもう一つの分野は、AI Studioにあるこの「Build your ideas with Gemini」全体です。これは彼らのバイブコーディングツールのようなものです。多くのことをワンショットで行うことができます。そして、実際に何かを作成しようとすると、そのアプリに入れたい異なる要素を選択し、それらがここに追加されることがわかります。

さて、モデルはゲームに関連するものに特に優れていると言わなければなりません。これは私を驚かせます。さて、ここに、基本的に非常に短いプロンプトを与えたものがあります。プロンプトを失くしてしまったようですが、これは基本的にCrossy Roadのようなものを構築するワンショットゲームです。Crossy Roadを知っているなら、異なるキャラクターがいます。

これはボクセル環境です。そして昔のゲームFroggerのようなものです。ここで、これが基本的にワンショットで全体を行ったことがわかります。そうですね、それほど素晴らしいわけではないと主張することもできます。ボードの一部が切れていたりしますが、ここでプレイできる完全に機能するゲームがあることがわかります。だから来て、車にぶつかることさえできます。

そして、これを実際にまとめるのはワンショットであることがわかります。スコアシステムがあります。ベストスコアシステムがあります。これらのそれぞれがここにあります。もう一つの例は、ゲーム「Don’t Starve」のクローンのようなものを作るように依頼したものです。Don’t Starveを知っているなら、それは特定の漫画のような見た目をしています。

プロンプトで依頼したのは、Don’t Starveのスタイルで2D漫画ゲームを作ってくれますか、世界を歩き回ってクラフティングに使用する異なる要素を見つけるキャラクターをコントロールするというものです。それが全体のプロンプトです。そして、それは実行し、これを行うことを可能にするものをまとめることができました。

さて、実際にこれをプレイしてみたことはありません。これは実行して、世界中を歩き回ることができる何かを作りました。おそらく最高のグラフィックではありませんが、ここでもフォントが実際のゲームに非常に似ていることがわかります。しかし、ここにクラフティングのものもあり、ここで実際にクラフティングするために必要なものがわかります。これは実際のゲームに非常に似ています。

ですから、実際のゲームに何があるかについての良い感覚を持っているだけでなく、実際にそれをコード化してまとめる能力も持っているというのは、興味深いことです。さて、実際のゲームではないものを作りたい場合、これは先週私が行った例で、基本的にテクニュースのパロディだが猫のために書かれた、プロフェッショナルに見えるニュースサイトを作ってくれと依頼しました。洗練された見た目にして、良いグラフィックを入れてください。

そしてここで、全体的なウェブサイトを構築したことがわかります。明らかに、推測ですがnano bananaまたはimage genを使用して、ここの画像を実際に作成しています。しかし、異なる要素としてこれらすべてをまとめて配置したことがわかります。そして、トレンドニュースなどがあります。

そして、ここで画面のサイズを変更しても、それに適応することができます。ですから、たくさんのプロンプトを通して異なるものを見せるのではなく、自分でここのAI Studioに来ることをお勧めします。これは無料であることを忘れないでください。試すことができます。そして、特定のユースケースに対して、実際にどのように応答しているかを確認できます。ここに来て思考レベルを設定できます。

明らかに、標準的なツールなどの多くを設定できます。そして、プロンプトとユースケースをテストするために、AI StudioバージョンまたはAPIバージョンのいずれかで始めるのは非常に簡単です。

プラットフォーム戦略とリリース範囲

このリリースについて本当に興味深いことの一つは、GoogleがGemini 3 Proモデルをリリースしている実際のプラットフォームです。2.5 Proが出たときを振り返ると、基本的にその時はAI Studioだけでした。これらのモデルは開発者のみが使用していました。特にプレビューモデルはAI Studioでのみサポートされており、当時はVertexやGCPでさえサポートされていないことがよくありました。

Gemini 3 Proについては、8か月後の今、これは非常に異なる話です。もちろん、AI Studio全体がそこにあります。それは驚きではありません。そして、Vertexを持っていることも、最近では驚きではないと思います。しかしそれを超えて、Geminiアプリがあります。最初の日にGeminiアプリでモデルが出てくるのを見始めたのは、この6か月ほどの間だけです。

そしてGeminiアプリ自体は、大きな勢いを見せています。2.5 ProバージョンのGeminiがプレビューで出てから、3億人以上のユーザーを追加しました。そして7月以降、2億人以上のユーザーを追加しています。そして、開発者としての私たちは、最新のGeminiモデルを求める場所としてAI Studioを考える傾向があると思いますが、明らかに、Geminiアプリが現在最も多くの牽引力を得ているものです。

Geminiアプリでは、Gemini 3が実際に生成できる機能である、本当に興味深いものを追加しています。まず最初はビジュアルレイアウトです。ですから、ここでの考え方は、単にテキストを返すのではなく、モデルが画像を見つけに行き、それらをレイアウトすることができ、また、コードとして表示されるのではなく、人々が関与できるインタラクティブなウェブサイトとして表示される、コードを介したさまざまな出力を生成できるということです。

これに沿ったもう一つは、動的ビューの考え方です。そして、彼らがこれのために示しているいくつかの例で、興味のある特定のトピックや主題について、Geminiアプリでその場で完全にインタラクティブなポータルを作成できることがわかります。

そして、これがGeminiアプリの学習モードのようなものを全く新しいレベルに引き上げると考えなければなりません。そこでは、基本的に、対話したり、学んだり、使用したりするために、自分が求めているものに特化して作られたものを得ることができます。Geminiアプリに来るもう一つの新機能は、ある意味では全く新しい製品と考えることさえできますが、Geminiエージェントです。

そしてこれは、Geminiアプリが実際に長期的なタスク、ツールなどを使った完全にエージェンティックなものを利用していると考えることができる場所です。ですから、ここでの考え方は、単に情報を求めるのではなく、単にここでチャットするのではないということです。これは、例えば、受信トレイを整理するなど、基本的に伝えることができる実行するもののようなものです。

このタスクを実行してください。そして、Googleが基本的にそれを強化したツールのセットを持つエージェントとして、それを実行しに行くことができます。さて、それがMCPまたは何らかのカスタムツールの形式を含むかどうかはまだわかりません。しかし確かに、Claudeのスキルに似たような路線を進んでいるのが見えます。そして、これらのアプリが純粋なチャットインターフェースから、作業を完了できるだけでなく、あなたのために作業を完了できるものへと移行しています。

彼らがGemini 3 Proで発表したもう一つの大きなプラットフォームは、実際にGemini 3モデルを使用する予定のものですが、検索です。そして、これがGoogleの得意分野であることはわかっています。彼らは基本的に、他の競合や回答エンジンのいくつかがすでに追加している機能のいくつかを実装するのにかなりの時間がかかったことはわかっています。

しかし私にとって、ここで興味深いことは、つい最近まで、Geminiは常に検索にフラッシュモデルを使用していたということです。ですから、AIモードなどで何かをしていても、通常はGeminiのフラッシュモデルを使用していました。この場合、Gemini 3では、実際にプロモデルを使用している可能性があり、そこでプロモデルの最高のものを得ることができるようです。

そして、彼らが示しているいくつかのことから、検索でGemini 3モデルを使用している本当に興味深いアイデアがあるように思えます。クエリを展開するという全体的な考え方、基本的にクエリを取って複数のクエリに書き換え、それからそれをチェックすることは、おそらくこれまでは計算集約的すぎてできなかったことです。

Googleはこれを解決し、AIモードに組み込んだので、実際に最良の応答を得ることができます。これに加えて、AIモードは実際のAIモードで全体的な生成UIを取得しています。そして、誰かが住宅ローンについて特定の質問をした場合、実際にモデルに住宅ローン計算機を書かせて、特定のクエリに関連して表示させる方法について、本当に素晴らしい例があります。

そしてこの生成UIはそこで止まりません。今、私たちは、基本的に関与しているUIが、モデルに何を求めているかに基づいて動的に変化できる世界に移行しているというこの全体的な考え方です。ですから、それはまず米国でAIモードに来ると思います。しかし、物事が進むにつれて徐々に世界の他の地域にも展開されると想像しています。

そしてそれはそこで止まりません。明らかに、Google内の多くの製品チームがこのモデルにアクセスでき、このモデルのために計画してきました。ですから、おそらくしばらくの間持っていたアイデアですが、それを提供するのに十分強力なモデルを持っていなかったアイデアが、Google Labsから出てくる興味深いものがたくさん見られると思います。

Google Labsと製品展開

ですから、明らかに過去数か月間、OpalがGoogle Labsから出てきたのを見てきました。Stitchを見てきました。そこで旅を始めたさまざまなアイデアの束を見てきました。Notebook LMは言うまでもなく、これはアプリとしては史上最大の方向転換を遂げたと思います。私が最初にそれについて動画を作ったとき、世界中で数千人しかそれを使用していませんでした。

今ではGoogleの最もホットな製品の一つになっています。ですから、さまざまなアプリで何でも学ぶというこの全体的な考え方、おそらくAI Studioで主に何でも構築するが、Gemini CLIのようなものやもちろんAntigravityでも、何でも計画するというようなことまで。そして、さまざまなプラットフォームが使用している組み込みエージェントは、このモデルがどれほど強力であるか、そしてGoogleがこのモデルをGoogleエコシステムで人々が使用している多くのプラットフォーム、多くのアプリ、機能にわたって展開できるように計画してきたかを示しています。

最後に、彼らが発表したがまだ実際にはリリースされていないもう一つのこと、そしてこれについてあまり話すことはできませんが、Gemini 3 Deep Thinkです。それが出たとき、Gemini 2.5 Deep Thinkについての動画を作りました。そして、最初のトークンまでの時間が15分かかる可能性があるというそのモデルの周りには多くの課題があり、非常に長く考えるなどといったことについて話しました。

そして残念ながら、モデルはAPIに入りませんでした。おそらく純粋に、そのモデルを実際に実行することに関する多くの課題、そしておそらくそのモデルを実行するコストのためだと思います。しかし良いことは、DeepMindチームが今、Gemini 3 Deep Thinkを発表したことです。これは前のものに対してかなりの改善です。

繰り返しますが、これはあなたに応答する前に、何十分も考えるために実行するのを喜んで待つときに使用する種類のモデルであるという同じ考え方です。そしてこの発表と共に、彼らはhumanity’s last examのようなものについて、かなり印象的なパフォーマンススコアを展開しました。そして私にとってより興味深いのは、ARC AGIチャレンジです。

ですから、それがリリースに近づくにつれて、それだけのために別の動画を作成し、それが何ができるかのいくつかの例を説明します。全体的にGemini 3 Proのリリースは、APIを通じてそれを使用する場合はモデルの観点から、またさまざまなGoogleアプリなどでそれを使用する場合は製品の観点から、非常に印象的です。

そして、これはまだプレビューリリースですが、2.0モデル、2.5 ProモデルとFlashモデルなどで見たように、GAリリースに到達する前に複数回の改善の反復を見たように、3 Proとおそらくそれほど遠くない将来にFlashとFlash liteモデルでも同じことが見られると予想しています。

ですから、ユースケースがある場合は、AI Studioに行ってください。モデルで遊んでみてください。完全に無料です。試すことができます。どのように機能するかを確認できます。エージェンティックなコーディングに興味がある場合は、ぜひAntigravityをチェックしてください。先ほど述べたように、それについて完全な動画を作成しました。それは今日ダウンロードできるものです。

使い始めることができます。そして、さまざまなコーディングタスクなどを試すためにGemini 3 Proモデルを実際に使用できる無料通話をたくさん提供しています。そして今後数週間で、ADKでこれらのものを実際にどのように使用できるかについて、いくつかのフォローアップ動画を作成します。そして、おそらくそれほど遠くない将来に日の目を見るかもしれない他のいくつかのモデルが進行中だと思います。

さて、いつものように、コメントであなたの考えを教えてください。自分でプロンプトを試している場合に何が見えるかを聞きたいです。私はこの動画を、単に私がプロンプトを説明する動画ではなく、実際に何が起こっているかの背後にある重要な考え方について話す動画にしようとしました。そして、人々が、APIの観点から、これは私が興味を持つ主なものだと思いますが、製品の観点からも、これをどこで使用すると見ているかを聞きたいです。これは本当に興味深いと思います。

とにかく、いつものように、動画が役に立ったと思ったら、いいねとチャンネル登録をクリックしてください。次の動画でお話しします。それでは。