Googleが発表した最新の大規模言語モデルGemini 3は、推論能力、コーディング、マルチモーダル処理、長文コンテキスト理解の4つの分野で大幅な性能向上を実現し、複数のベンチマークで業界トップの座を獲得した。特筆すべきは、humanity’s last examで37.5%、GPQA Diamondで91.9%を記録し、それぞれGPT-5 ProやGPT-5.1を上回る結果を示した点である。本モデルはGoogle検索、Geminiアプリ、AI Studioを通じて提供され、新たに実装されたエージェントモードでは、メール確認、カレンダー管理、ウェブブラウジングなどの実務タスクを自律的に実行できる。実地テストでは、複雑な論理パズルの解決、学術論文の視覚化、HTMLベースのゲーム生成など、一度のプロンプトで多段階タスクを高精度で処理する能力が確認された。特にCanvas機能との連携により、Minecraftライクな3D環境やターン制戦略ゲーム、さらにはオリジナル楽曲の生成まで、外部ライブラリなしで実現できることが実証されている。一年前と比較して技術進化は著しく、AI Studioでの無料アクセスも含め、Googleは現時点で最も優れた言語モデルを市場に投入したと評価できる。

Googleの新モデルGemini 3が登場
さて、Googleの新しいGeminiモデルが登場しました。私は幸運にも早期アクセスを提供していただきました。Googleからは「マット、このビデオをまだ世界と共有するんじゃないぞ」と言われていたので、彼らが正式に発表する瞬間まで待ってこのビデオを公開することにしました。
このビデオでは、Gemini 3について深く掘り下げて、この新しい大規模言語モデルができることすべてをチェックしていきます。全く新しいエージェントモードも含めてです。良い点、悪い点、そして視覚的に不快な点までお伝えします。まあ、あなたのお母さんみたいにね。では、掘り下げていきましょう。
もうご存知かもしれませんが、GoogleはGemini 3という全く新しいフラッグシップの最先端モデルをリリースしました。さらに新しいDeepthinkモードも発表されました。これは基本的に難しい問題に対する追加の頭脳パワーのようなものです。そして実際にあなたのためにいろいろなことをしてくれるGeminiエージェントもあります。メールを読んだり、カレンダーを確認したり、ウェブを閲覧したり、すべてをまとめたりしてくれます。
さて、Deepthink部分については今日発表されましたが、その部分はまだ近日公開予定です。Gemini 3とGeminiエージェントについては、どちらも今日から利用可能です。
では、Gemini 3とは何でしょうか。Gemini 3はGoogleの新しいトップエンドの思考モデルです。これは彼らの次世代フラッグシップで、彼らのラインナップの最上位に位置し、他社の最高モデルと競合することを意図したものです。
Gemini 2.5と比較して、実際に4つの分野でかなり大きな飛躍を主張しています。1つ目は推論です。多段階の論理、複雑な問題解決、計画立案、そういったものです。2つ目はコーディングです。コードの記述とリファクタリング、大規模なコードベースの理解、ツールの使用などです。3つ目はマルチモーダルです。つまり、テキスト、画像、チャート、ドキュメント、長い動画をすべて一度に処理できます。そして4つ目は長文コンテキストです。より大きなプロンプト、より長い会話、さらには長い動画にわたって一貫性を保つということです。
これは何かを本当によく考え抜いてもらいたいときに使うモデルであり、単に短い段落を吐き出すだけのものではありません。
ベンチマークでの圧倒的な性能
彼らはそれを裏付けるためにかなり驚異的なベンチマーク数値も共有しました。私は通常、ベンチマークの大ファンではありません。なぜなら、ベンチマークは通常、一般消費者が気にするようなことには向いていないからです。しかし、新しい最先端のリーダーがいる場合は、特に簡単に共有する価値があると感じています。
humanity’s last examでは、これは多段階推論と専門レベルの人文科学知識をテストするベンチマークですが、Gemini 3 Proはツール使用なしで37.5%のスコアを記録しました。これは非常に難しいベンチマークであり、この数値は彼らの以前の最高記録を上回っています。また、これによりベンチマークでの新しいトップモデルとなり、2番目に良いモデルはGPT-5 Proで31.64%を記録しました。
GPQA Diamondベンチマークでは、これは基本的に博士レベルの科学と推論の質問ですが、91.9%を記録し、ここでも新しいリーダーになりました。87.6%を記録したGPT-5.1を打ち負かしました。
そしてほとんどすべての他のベンチマークでも同じストーリーを語っています。Gemini 3は大規模言語モデルの中で新しいトップドッグです。平易な英語で言えば、紙の上では、これは小さな増分アップグレードではありません。難しいことを推論できるかという点でかなり真剣な飛躍です。現時点では、ベンチマークによれば新しい最先端の勝者がいますが、これからテストでどれだけ持ちこたえるか見ていきます。
提供方法と利用可能性
さて、可用性については、彼らが発表したことは次のとおりです。彼らはGemini 3を直接Google検索に投入しています。したがって、米国でGoogle AI ProまたはGoogle AI Ultraサブスクリプションに加入している場合、AIモードエクスペリエンスを支えるGemini 3が表示されますが、繰り返しますが、有料プランのいずれかに加入している場合のみです。
また、Geminiアプリ自体にも登場します。したがって、ウェブでGeminiを使用している場合、舞台裏のモデルの1つとしてGemini 3を取得できます。そしてGemini 3は、AI Studio内およびGeminiコマンドラインインターフェース、つまりCLI経由で構築を開始することもできます。
そして彼らは、これがAI Studio内のすべての層のユーザー向けであることを特に言及しました。したがって、誰でもAI Studio内でこの新しいモデルを無料で試すことができると思います。
彼らはまた、Google Anti-gravityについても言及しました。これは彼らの新しい開発環境で、パブリックプレビューで登場し、Mac、Windows、Linuxで展開されます。これは開発者側の話ですが、重要な点は、Gemini 3がその体験の多くを支えるモデルでもあるということです。
したがって、初日には検索、Geminiアプリ、AI Studio、CLIに投入され、その後Anti-gravityのような開発者ツールに投入されます。
さて、他の大きな発表は、Gemini 3 DeepthinkとGeminiエージェントでした。Gemini 3 Deepthinkは強化された推論モードです。もう少し時間をかけて、もう少し深く考えるというようなものだと考えてください。
現時点では、彼らはDeepthinkを安全性テスターにのみ提供しており、その後、今後数週間でGoogle AI Ultraサブスクライバーに展開される予定ですが、それは月額250ドルのプランのようなものです。基本的に最も難しい問題を対象としています。長い思考の連鎖、多段階推論、そういった類のものです。
そして、Geminiウェブアプリ内に新しいGeminiエージェントモードもあります。これも私がしばらくアクセスできていた機能です。これにより、Geminiは質問に答えるだけでなく、実際に最近のメールをスキャンしたり、Driveで関連ドキュメントを見つけたり、スライドデッキを作成したり、オンラインで予約したりできます。
現時点ではウェブのみです。まだ実験的であり、彼らは監督する必要があると繰り返し言いました。一部のサイトはそれをブロックします。確認なしに先に進むことがあり、それが行うことに対してあなたが責任を負います。
したがって、今のところ、エージェントモードを使用する場合は、まだ初期段階にある間は注意して使用してください。これからカメラでそれでも遊んでみて、おかしくなり始める前にどこまで行けるか見てみます。
さて、私は人々が気にするであろう発表とすべてのことをカバーしたと思います。では、実際に使ってみましょう。
スポンサーメッセージ
コンテンツクリエイターとして、AIは本当に生産性を高め、小さなことを片付けるのに役立っています。しかし、常にそうだったわけではありません。ある時点で、扱うAIツールが多すぎることが、手動で行うよりも多くの作業になっていました。だからこそ、私はMakeが構築しているものが大好きなのです。
基本的に、すべてのAIツールのためのビジュアルコントロールルームで、10個の異なるタブやアプリを行き来するのではなく、すべてがどのように接続され、どのように連携するかを実際に見ることができます。
私はオーディエンス成長エージェントを構築したかったのです。実際のデータを使って私のオーディエンス成長を追跡するためのものです。そしてこれがその仕組みです。データエージェントが私のYouTube Studioから分析を取得します。トレンドエージェントがどのコンテンツテーマが最も良いパフォーマンスを示しているかを分析します。計画エージェントが来週のコンテンツプランを生成し、毎週月曜日に私とプロデューサーのDaveにメールします。そしてレポートエージェントが毎週金曜日に先週の勝利と洞察の要約を私にメールします。
これは私のチャンネルに本当に実世界の価値を提供します。Make Gridのおかげで、実際にプロセス全体が動いているのを見ることができ、必要に応じて何でも調整できます。
Makeは継続的に改善し、あなたがいる場所であなたに会うようにしています。最近Waves 25で、彼らはMaya by Makeを導入しました。これは会話型ビルダーで、話しかけるだけで自動化を作成できます。彼らはまた、新しい超調整可能なAIエージェントを展開し、Make Gridをさらに使いやすくし、自動化の完全な分析と制御を提供しました。
したがって、あなたがコンテンツクリエイター、マーケティングエージェンシー、または自分のスタートアップを構築している場合でも、これがAIを実際に運用する方法です。バラバラのアプリの束ではなく、接続されたエコシステム全体でです。
現在、Makeは私たちのコミュニティに、以下のリンクを使用してサインアップすると、Proプランの1か月無料を提供しています。したがって、ジャグリングを止めてAI駆動ワークフローをリードする準備ができている場合は、説明のリンクをチェックしてください。無料の1か月を手に入れて、Makeでよりスマートに構築を始めましょう。今日のビデオのこの部分をスポンサーしてくれたmake.comに感謝します。
実際のテスト開始
さて、テストに入る前に、Gemini 3はstudio.google.comのGoogle AI Studio内で利用できるはずです。ここでモデルに来ると、モデルリストからGemini 3を選択できるはずです。
ただし、私は正式にライブになる前にこれを録画しており、彼らは私にGeminiウェブアプリ内でのデモアクセスを提供してくれました。したがって、実際にはGoogle AI Studio内でアクセスできません。したがって、すべてのデモはGeminiウェブアプリで行いますが、繰り返しますが、ここでも利用できるはずです。
最初のテストでは、かなり簡単だと思うものを与えますが、いくつかの論理と物事を考える必要があります。あなたは私のオペレーションプランナーです。私は今後10日間で公開したい4つのビデオがあります。ビデオAはスポンサーなので4日目までにライブにする必要があります。ビデオBは撮影後2日間の編集が必要です。ビデオCは週末に公開できません。ビデオDはAが最初に公開されることに依存しています。
制約は次のとおりです。私は月曜日、水曜日、金曜日にのみ撮影します。1週間に最大3本のビデオしか公開したくありません。スポンサー付きビデオがライブになる前に少なくとも1日のバッファー日が必要です。
毎日何をしているか、各ビデオがいつ撮影され公開されるかを示す詳細な10日間のカレンダーを作成してください。このスケジュールがすべての制約を満たす理由についての短い正当化を添えてください。次に、同じように機能する代替スケジュールを提案し、トレードオフを説明してください。
実際に撮影内訳を提供してくれたことがわかります。11月17日撮影、18日編集、19日撮影、ビデオA公開、ビデオB編集、ビデオC撮影、ビデオB編集など。すべてを分解してくれたのがわかります。そして、これがうまくいく理由についての正当化があります。そして、必要に応じてフォローできる代替スケジュールも提供してくれました。さまざまなスケジュールのトレードオフとともにです。
これはテストに合格し、実際にここで提供したすべての制約を満たしました。それは勝利です。
より複雑な論理パズル
さて、ここで論理をもう少し複雑にして、パズルの数学を投げてみましょう。この確率パズルをステップバイステップで解いてください。ゲームショーには5つのドアがあります。1つのドアの後ろには車があります。4つのドアの後ろにはヤギがいます。あなたは1つのドアを選びます。
車がどこにあるかを知っているホストが、2つの異なるヤギのドアを開け、あなたに選択を提供します。元のドアに固執する。残りの2つの閉じたドアのいずれかに切り替える。
モデルに求めていることは次のとおりです。常に留まる場合の車を獲得する確率を計算してください。常に切り替えるが、残りの2つのドア間でランダムに選択する場合の確率を計算してください。
ホストが常にn-3匹のヤギを開き、あなたが留まるか残りの2つのドアのいずれかに切り替えるかを選択するn個のドアの場合について推論を一般化してください。あなたの作業を明確に示してください。
作業を示す部分が、このプロンプトで私にとって最も興味深い部分だと実際に思います。ここで数学を行っているのがわかります。固執する場合に勝つ確率は20%です。ここで数学を見ることができます。切り替える場合に勝つ確率。いくつかのシナリオを分解していますが、それからそれがすべてを理解するために使用した数学を非常にうまく視覚化しています。
視覚的に、これは作業を実際に示した方法に感銘を受けました。このように、これは私にとって印象的です。
さて、今、物事は本当に楽しくなってきました。次に私が与えたプロンプトはこれです。このアーカイブペーパーに行ってください。そして私はURLを与えました。したがって、他のURLから情報を取得できることを確認しています。
そしてステップ1、非技術的な聴衆向けに10の箇条書きでペーパーの核心的なアイデアを要約してください。ステップ2、それらの10の箇条書きをYouTubeビデオの2分間の説明スクリプトに変えてください。ステップ3、ここからが本当に楽しくなります。HTML CSS SVGを使用して、スクリプトと一緒に実行して初心者に注意を説明できる簡単なアニメーション視覚シーケンスを設計してください。アニメーションの実際のHTML CSS SVGコードを含めてください。
問題のペーパーは、有名な「Attention Is All You Need」というペーパーです。現在、ほとんどすべての大規模言語モデルが構築されているトランスフォーマーアーキテクチャを導入したペーパーです。
最初は、他の大規模言語モデルがするようなことをしました。ペーパー「Attention Is All You Need」の要約スクリプトと視覚化コードはこちらです。ほとんどすべての大規模言語モデルがこれをうまく行うことができます。ペーパーを要約しています。
そしてステップ2、YouTube用の2分間の説明スクリプト。スクリプトを書いてくれました。これらの複数ステップのことを行っているのがわかります。要約を提供し、スクリプトを書き、それからコードを書く。同じプロンプト内でステップ1、ステップ2、ステップ3をすべて行います。
ここにスクリプトがあります。どの大規模言語モデルもスクリプトを書くことができますが、それでも同じプロンプト内でステップバイステップでこれを行っているのは印象的です。
しかし、ステップ3が私が本当に興奮したものです。これは自己完結型のHTMLファイルです。index.htmlとして保存してブラウザで開くことができます。テキストエディタにコピーアンドペーストしてからブラウザで開きたくありませんでした。
したがって、ここでこのコードを提供した後、このコードをキャンバスで開いてみましょうと言いました。セルフアテンション視覚化のコードをキャンバスに抽出したので、実行して編集できますと言いました。キャンバス内で何を生成したか見てみましょう。
「Attention Is All You Need」のこのビジュアルを生成しました。これは実際にアテンションメカニズムが何であるかを視覚化する非常に良い仕事をしています。
「その動物は通りを渡らなかった、なぜならそれは疲れすぎていたから」という文で。トランスフォーマーアーキテクチャの大きな突破口は、あなたが与えた文書の前の他の単語からコンテキストを取得できたことでした。
従来の次の単語予測のようなものは、それが何を指しているのか必ずしも理解できないかもしれません。なぜなら、その直前の単語は「なぜなら」だったからです。そしてアテンションメカニズムは、モデルが前に来た単語をよりよく理解できるようにしました。したがって、それが何を意味するかのようなことについてより多くのコンテキストを理解できました。
これらのカラフルな線が「it」から「animal」を指していることに気づいていることがわかります。その動物は通りを渡らなかった、なぜならそれは疲れすぎていたから。疲れていたのと同じです。何が疲れていたのか。それです。それは何だったのか。動物です。
素晴らしい視覚化です。そして色の選択も大好きです。これは本当に私を感銘させました。シンプルに見えることは知っていますが、これが非常に複雑な説明であったPDFを取り、この視覚化を作成し、概念を完全に単純化できたことは本当にクールだと思いました。
さらなる複雑なタスク
これは私がテストした別のプロンプトです。乱雑で構造化されていないメモのブロックと、いくつかのランダムなメモがあります。AIモデルは毎年大きくなっています。エネルギー使用量が増加しています。Nvidia、AMD、Googleの新しいチップ。オープンソース対クローズドソースの議論。多くの詳細やコンテキストはなく、いくつかのランダムな箇条書きのようなものです。
そして私は言います、これをYouTubeビデオの明確な3幕構造の物語に変えてください。各ショットが視覚的に説明された8つのショットを含むストーリーボード。ビデオを開くためのHTML CSSキーフレームを使用したシンプルなテキストベースのモーショングラフィックシーケンス。
したがって、再び、単一のプロンプトから複数のステップをテストしています。ここで見ているのは、3幕構造です。第1幕、第2幕、第3幕。非常に少ないコンテキストで、いくつかのランダムな箇条書きだけで、これをすべて引き出しました。
そして8ショットのストーリーボードを作成しました。ショット1から8まで、視覚的な説明とオーディオボイスオーバーキューがあります。ストーリーボードが何をしたかを実際にチェックしたい場合は、ビデオを一時停止してください。
そして私のお気に入りの部分、私はビジュアルが大好きなので、HTML/CSSモーショングラフィックのイントロです。もう一度、他のすべてと一緒にHTMLをインラインで書きました。そして私は「ねえ、これをキャンバスで開いてみましょう」と言いました。キャンバス内で何を作ったか見てみましょう。実際にこれはまだ見ていません。初めて見ています。
さて、この中央集権化された分散化されたアニメーションをここに作成しました。かなり良いです。実際に選択できますが、クールなHTMLアニメーションがあります。これは前のものほど感銘を受けませんでしたが、再び、これは複数ステップのプロセスの3番目のステップでした。3幕構造を書きました。ストーリーボードを書きました。そして3番目のステップとしてこのアニメーションを作りました。
でも、まだ何も見ていません。さらに深く掘り下げて、他にどんなクールなことができるか見てみましょう。
Canvas機能での驚異的な成果
キャンバスの中で、私はより賢くなり、キャンバスを使うように指示し始めました。HTML、CSS、JavaScriptのみを使用して最小限のMinecraftのようなボクセルワールドを構築してください。外部ライブラリは不要です。
要件:プレイヤーが移動できるブロックの2Dまたは疑似3Dグリッド。プレイヤーを移動するためのキーボードコントロール。ブロックを配置および削除する能力。完全にフラットに見えないようにシンプルな照明またはシェーディング効果。すべてのコードはブラウザでそのまま実行可能でなければなりません。コードを書いた後、アーキテクチャと各ファイルがどのように組み合わさるかを説明してください。
さて、考えてくれて、ここで実際に構築したもののアーキテクチャ説明を提供してくれました。そして、ここでキャンバスを開くと、なんてこった、これが生成されたものです。見てみましょう。要件を満たしましたか。
ブロックの2Dまたは疑似3Dグリッド。はい。キーボードコントロール。まあ、ここに表示されています。まだテストしていません。ブロックを配置および削除する能力。完全にフラットに見えないようにシンプルな照明またはシェーディング効果。すべてのコードはブラウザでそのまま実行可能。
さて、それが機能していることはわかっています。ブラウザで実行されています。それで実際に機能しますか。ここに戻ってクリックしてみます。マウスで移動できますが、WDキーは何もしていません。スペースバーは何もしていません。シフトは何もしていません。左クリックと右クリックは実際に機能しています。
したがって、実際にブロックを追加したり、クリックしてブロックを削除したりできます。その機能は実際に機能しています。でも、あれ、待って。何だって。今、移動が機能しています。最初に移動しようとしたときは機能していませんでした。ブロックを配置する必要があったようです。ブロックを配置するとすぐに移動できました。
これはワンショットです。これはここでワンショットです。外部ライブラリを使用せずに。これはクレイジーです。なんてこった。私は今、これに非常に感銘を受けています。
全画面表示できるか見てみます。さて、キャンバスで全画面表示するオプションはどこにも見当たりません。プレイヤーを移動するためのキーボードコントロール。はい、それは機能しています。最初は機能しませんでした。なぜかわかりませんが、今は機能しています。ブロックを配置および削除できます。
ブロックのスタイルを変更したりすることはできませんが、さらにいくつかのプロンプトで、Minecraftをバイブコーディングしたところです。この同じMinecraftコンセプトについて、もう1つテストしたいことがあります。
このものでは、HTML、CSS、JavaScriptのみを使用し、外部ライブラリは使用しないと言いました。この部分を削除して、好きなようにやらせるとどうなるか興味があります。制約を取り除くような感じです。したがって、まったく同じプロンプトを与えましたが、それを削除しただけです。
そして今、これをキャンバスで開くと。なんてこった。さて、これがこれの外観です。実際に風景の上に浮かんでいる状態で始まります。しかし、シフトを押すと実際に下がることができます。通り抜けますか。はい、実際に環境を通り抜けます。大したことではありません。単一のプロンプトでしたからね。
WDキーが機能します。スペースは私を上に連れて行きます。シフトは私を下に連れて行きます。左クリックはブロックを壊します。右クリックはブロックを追加し戻します。そして、これは私にとって非常に正気ではありません。
1から5で色を選択します。見てみましょう。平らなエリアに移動しましょう。色番号1で1ブロック。色番号2で1ブロック。色番号3、4、5。そして、ここに異なる色のブロックがあります。これはかなりワイルドです。
したがって、子供たち、これを見ていて両親がMinecraftを買ってくれない場合は、自分で作ればいいのです。
ゲーム開発の実験
別のゲームを試してみましょう。HTML、CSS、JavaScriptのみを使用して、Advanced Warsにインスパイアされたシンプルなターンベース戦略ゲームを作成してください。要件:10×10グリッド。赤と青の2人のプレイヤー。2つのユニットタイプ、歩兵は2タイル移動、戦車は3タイル移動でより高い攻撃力。各ユニットにはHPと攻撃ダメージがあります。ユニットを選択してクリックし、有効なタイルをクリックして移動または攻撃します。対戦相手のための非常にシンプルなAI。そのターンでは、各ユニットを最も近い敵に向かって移動し、射程内にいる場合は攻撃する必要があります。外部ライブラリなし。
そして、作成されたミニウォーズはこちらです。私は赤です。赤のターンです。プレイヤーを移動しましょう。移動できるスロットを教えてくれています。敵に近づくようにみんなを移動します。これを進めましょう。すべてのプレイヤーを敵の近くまで移動させます。
それからターンを終了して、AIがどのように機能するか見てみましょう。さて、青のAIが考えていて、すべてのプレイヤーを私のプレイヤーに近づけています。もう一度近づいてみましょう。ここで何ができるか見てみましょう。それからターンを終了します。
これを選択すれば攻撃できると思います。攻撃方法がわかりません。なぜ許可されないのかわかりません。ああ、攻撃しました。だから、この戦車対戦車でやってみましょう。攻撃できない理由がわかりません。ちょっと変な動作をしていますが、かなり近いです。この男を攻撃できました。なぜ攻撃できないのかわかりません。
いくつかの問題があります。ここを見てみます。このゲームのプレイ方法を促して、何か間違ったことをしているかどうか確認しました。でも、移動後に敵が隣接している場合と言っています。
わかりました。だから、最初に移動する必要があるかもしれません。さて、ここをクリックすると、この男を攻撃するはずです。はい。だから今、その男を攻撃します。わかりました。ここで何をしているのかわかりません。
この男を選択して隣接させると、今攻撃できます。この男を選択して隣接させると、今攻撃できます。そして、この男をここに動かして、そこで攻撃します。さて、さて。今、クリックしています。
ターンを終了できます。そして、彼らは私のプレイヤーを攻撃するつもりです。そして、実際に機能します。何をしているのかわからなかっただけです。
過去のビデオでテストしたことの1つは、私のお気に入りのゲームの1つを生成させることです。ブラウザのキャンバスで動作するVampire Survivorsクローンを作成してください。
それをやってくれたのがわかります。問題なくこれを開くと。Vampire Survivorsクローンを手に入れました。レベルアップしました。魔法の杖をレベルアップしましょう。ニンニクをやりましょう。そうすると、このオーラが追加されます。もっと大きなオーラを作りましょう。
非常に速いです。すごい。すべての動きがどれだけ速いか見てください。でも、ワンショットです。レベルアップし続けるだけです。だから、ちょっと不安定です。レベルアップシステムを少し遅くする必要があると思います。もうレベル25です。
でも、つまり、もう1つのプロンプトで、おそらくそこに到達します。フィードバックを与えましょう。このゲームは非常に速いです。すべてのNPCとキャラクターが速すぎて、レベルアップも速すぎます。解決してくれるか見てみましょう。
さて、ゲームをリバランスして、より戦略的なペースを提供しました。もう一度試してみましょう。さて、今話が通じます。物事はもう少し普通のペースで動いています。XPを集めましょう。同じ2つのオプションを提供していますが、どうでもいいです。かなり良い仕事をしてくれました。
今、私はコーヒーを飲んでいるので、どんどん速く動いています。スピードが本当に本当に速くエスカレートします。そして死にました。かなり近かったです。Vampire Survivorsをプレイしたことがあるなら、近いです。
音楽生成機能
音楽を作れるかどうかテストしたかったのです。だから、ハッピーバースデーの曲を作って、ブラウザで再生できるようにしてくださいというプロンプトを与えました。見てみましょう。
名前を入力して再生を押してください。ええと、行きましょう。名前としてGemini。ハッピーバースデー、ディアGemini。なぜ名前を尋ねるのかわかりません。歌っているわけではありませんが、私がしたことは、ハッピーバースデーの曲を作って、ブラウザで再生できるようにすることだけでした。
そして、実際に背景でこれらすべてのアニメーションを生成しました。風船と紙吹雪とページと一種のカラオケシングアロング。私がそれを促さずに、それをすべて自分でやりました。ユーザーにとってこれをクールにしようと推測しただけです。
そして、私の好奇心は、完全にオリジナルの曲を生成するように頼んだらどうなるかということになりました。だから、完全にオリジナルの曲を作成して、ブラウザで再生できるようにしてくださいと言いました。オーディオを初期化しましょう。再生しましょう。
歌詞さえあります。星が空でグリッチしている。だから、一緒に歌うことになっていると思います。そして、このビジュアライザーを作るように頼みませんでした。この配色や再生または停止ボタンを入れるように頼みませんでした。歌詞を与えることさえ頼みませんでした。何も与えませんでした。
完全にオリジナルの曲を作成して、ブラウザで再生できるようにするというプロンプトを与えました。MP3ファイルを直接送信できないので、tone.jsを使用してカスタムウェブプレーヤーを構築しました。単一のファイルがシンセサイザー、シーケンサー、ビジュアライザーのオールインワンとして機能します。
コードを使用してブラウザ内でリアルタイムにオーディオを生成します。したがって、私が作曲したとおりに曲を聞くことができます。
そして、Gemini 3がやっていることに本当に驚きました。そして、まだ表面をなぞっただけです。このビデオはすでに少し長くなっていますが、まだエージェントモードさえ試していません。だから、そこでいくつかのことをテストしてみましょう。
エージェントモードのテスト
Gemini内で、エージェントモードの場合、thinkingにする必要があります。そして、ツールの下で、エージェントを選択する必要があります。
これはラボ機能なので、デフォルトでオンになっていない可能性がありますが、有料プランのいずれかをお持ちの場合は、Google Labs内でこれをオンにできるはずです。
かなり自己奉仕的なプロンプトから始めましょう。過去7日間の最も重要なAI発表の3つを調査してください。それぞれについて、3文の要約、主要なソースへのリンク、1つの潜在的な欠点または批判を教えてください。次に、これをYouTubeニュースビデオの10の箇条書きショーランダウンに変え、ビデオの短いイントロとアウトロスクリプトを作成してください。
エージェントモードをオンにしてこれを実行してみましょう。タスク情報を処理しているのがわかります。基本的に、それが行って従うステップバイステップのチェックリストのようなものを構築していると思います。AIニュースを特定しています。
だから、最新のAIニュースについて独自のGoogle検索を行っています。製品リリースを分析し、資金調達の発表を確認し、リリースデータを確認し、GPT-5.1の存在を検証し、競合する発表を評価し、発表の優先順位付けを最終決定しています。
今、これは実際にクラウドベースのブラウザをスピンアップしてブラウザで実行しているのではありません。Gemini内で直接これらのエージェント的なタスクをすべて行うことができますが、適切なプロンプトでブラウザをスピンアップします。
今、深い分析を行っていて、ここでキャンバスが開いたのがわかります。11月10日から17日までのトップ3のAI発表。OpenAIがGPT-5.1をローンチ。Future HouseがCosmos AIサイエンティストを発表。Google Notebook LMがDeep Researchエージェントを追加。
そして、これがYouTubeショーランダウンです。コールドオープン、イントロ、ストーリー1 GPT-5.1、批判、安全性の拒否について不満を持つユーザー。Cosmos、捏造された統計の問題、Notebook、LM、いくつかの佳作、Nvidia、Blackwell、AI、Climate Institute。そして、イントロスクリプトとアウトロスクリプトをくれました。それをすべて単一のプロンプトで行いました。それをすべて行うことができました。
実用的なアシスタント機能
さて、実際のアシスタントとしてテストしましょう。私のエグゼクティブアシスタントとして行動してください。今後3日間の今後のカレンダーイベントを見てください。タスクや締め切りのように見えるものについて最近のメールをチェックしてください。
それを私のために単一のコントロールパネルに組み合わせてください。今日のトップ3の優先事項、タイムブロックの提案、そして断るか委任すべきことのリストを、ドキュメントやノートアプリにコピーできるシンプルなダッシュボードとして提示してください。
さて、このプロンプトには1つ問題があります。それは私の問題です。おそらくこれに遭遇することはないでしょう。ここで使用しているGoogleアカウントは、私の通常の日常的なGoogleアカウントではありません。通常のカレンダーが添付されているGoogleアカウントや通常のGmailが添付されているGoogleアカウントではありません。
これは、Googleが私にものへのアクセスを提供してくれるGoogleアカウントですが、Gmailとカレンダーを持つ実際のGoogleアカウントではありません。だから、実際に何を見つけるかわかりませんが、見てみましょう。
さて、私のためにこのタスクを実行してくれました。このページではかなりぼかす必要があるものがおそらくたくさんあります。でも、予想通り、私のスケジュールはクリアだと言っています。カレンダーイベントが見つかりません。
今日のトップ3の優先事項をくれたのがわかります。私が持っていたこのブリーフィングミーティングに出席/確認する。アクティベート。話すことができない特定のツールへの早期アクセスがあるので、ぼかしています。そして、毎週のスケジュールレビューを計画します。
私のカレンダーは現在開いていると言っています。そうではありません。間違ったカレンダーを見ているだけです。そして、ここに降りてくると、今後3日間のタイムブロッキングの提案。スケジュールがクリアなので、上記の情報で私ができることを分解してくれましたが、再び、私の主要なメールやカレンダーを実際に見ていません。
だから、あまり役に立ちませんが、おそらくあなたには役立つでしょう。そして、特定のタスクではブラウザを実際に開くので、ブラウザを起動させようとしています。だから、これを試してみましょう。
今週の金曜日の夜、午後7時30分頃に2人分のディナー予約を予約してください。サンフランシスコで屋外席が利用可能な高評価のイタリアンレストランを見つけてください。それを送信してみましょう。
さて、私たちのために調査をしてくれています。さて、コンピュータ使用エージェントを活用すると言っています。ああ。ほら、今ポップオーバーしています。ブラウザを開きます。ブラウザを使用していると言っています。
今、実際に私のウェブブラウザを使用しているのではありません。これはクラウド内のブラウザです。手を挙げているのが見えます。私のためにOpen Tableに行ったところです。何も触っていません。私のためにすべてのブラウジングを実際に行っているのです。これは私のマウスです。
ブラウザ内に表示されているマウスは、AIマウスがその仕事をしているのです。私のためにカレンダーを見ているのがわかります。11月21日、午後7時、2人、サンフランシスコを検索して、いくつかのレストランを見つけました。
何らかの理由で誤って戻るをクリックしたと思います。さて、それらのレストランを再び見つけました。以前の調査で見つけた特定のレストランの検索を行っています。SocialまたはSocialと呼ばれるものです。
私たちのために実行しているブラウザの右下に予約時間が表示されているのがわかります。利用可能な座席オプション、スタンダード、屋外。屋外を選択してくれるか見てみましょう。そして、左側のここを見ると、その思考プロセスを実際に見ることができます。
サンフランシスコの検索結果ページに戻ってRoma Anticaの検索を開始することにしました。パンくずナビゲーションを使用して、レストランのリストに戻ります。新しいレストラン名を入力して、空室状況を確認する準備ができています。メイン検索に戻って、ここにレストラン名を入力します。見つけました。
わかるでしょう。実際にあなたに代わってブラウジングできます。最終結果まで早送りさせてください。少し時間がかかりましたが、最終的にそこに到達しました。
本当にクールなのは、実際にここでブラウザをクリックして、ブラウザ内で取ったすべてのアクションをステップバイステップで見ることができることです。これは実際にかなりクールです。ビデオ全体を見る必要はありません。最終的にそこに到達するステップバイステップのスクリーンショットを見るだけです。
今、ブラウザは一時停止しました。なぜなら、予約をしたこのresiシステムにログインしていなかったからです。だから、一時停止して、ログインして予約を完了できるように制御を引き継ぐように頼みました。しかし、最終的に予約できるところまで連れて行ってくれました。
まとめと総評
そして、それが今日彼らが行ったGemini 3とGeminiエージェントの発表です。そして、印象的です。Gemini 3を使用しているとき、特にグラフィックスやビジュアルビデオや実際にジャンプしてプレイできるゲームを単一のプロンプトで作るように頼んでいたとき、私は本当に驚きました。
今、私たちがいる場所を1年前または2年前と比較すると、クレイジーです。このようなものがどれだけ良くなっているか、私の心を吹き飛ばしています。そして、そこにいるすべてのモデルプロバイダーの中で、私の意見では、Googleは最も寛大なものの1つです。
なぜなら、彼らは私たちにAI Studioへのアクセスを提供してくれるからです。そこで、ProまたはUltraアカウントを持っていなくても、これらすべてのモデルを無料でテストして遊ぶことができます。そして今、彼らはすべてのベンチマークによれば市場で最高のモデルを持っています。
そして、私のすべてのテストによっても、これらは私が今まで見た中で最高の結果のいくつかです。したがって、Gemini 3は本当に、本当に印象的です。利用可能です。今出ています。早期アクセスをくれてこのように1週間前に遊ばせてくれたGoogleに感謝する必要があります。
このモデルが何ができるかの表面をなぞっているだけのような気がします。自分でAPIを使ってもう少しテストして、他に何ができるか見て、本当に限界を押し広げるつもりですが、人々が実際にこのモデルがどれだけ本当にクソ印象的かを学ぶにつれて、今後数週間でGemini 3についてたくさん聞くことになると思います。
本当にクールです。しかし、それが今日のあなたのために得たものです。すべての発表を分解して、このモデルを本当にテストしたかったのです。Matt BurmanやMatt Vid Proや他のAIビデオを作る仲間たちのような私の他の仲間たちも、いくつかの他のテストを行い、さらに深く掘り下げて、さらに複雑なプロンプトを試すと確信しています。
したがって、それらの仲間たちのビデオもチェックしてください。でも、印象を受けました。あなたもおそらくそうだと思います。
一緒にたむろして、一緒にオタクになってくれて本当にありがとうございます。すべての最新のAIニュースとツール、そしてこのようなものを実際に実装する方法についてのチュートリアルをループし続けたい場合は、このビデオに「いいね」をして、このチャンネルを購読してください。AIのすべての最新の進歩に気づき、ループし続けることを確認します。
あなたのためにこのようなビデオを作ることができるように、毎日それに追いついています。本当に、本当にあなたに感謝します。うまくいけば、次のビデオで会いましょう。バイバイ。
あなたのママみたいに。わかりません。今日私と一緒にオタクになってくれて本当にありがとうございます。このようなビデオが好きなら、必ず親指を立てて、このチャンネルを購読してください。このようなビデオがあなたのYouTubeフィードに表示されるようにします。
そしてまだの場合は、futurtools.ioをチェックしてください。そこでは、すべてのクールなAIツールとすべての最新のAIニュースを共有しています。そして、素晴らしい無料のニュースレターがあります。再度ありがとうございます。本当に感謝しています。次のビデオで会いましょう。


コメント