Googleが世界最強のAIエージェントなどを公開

AIエージェント
この記事は約14分で読めます。

Googleが発表した最新のAIアップデートを紹介する動画である。Gemini Deep Researchの大幅な性能向上、企業向けエージェント基盤であるGemini Enterprise、CX Agent Studioによる顧客対応エージェント構築、Google WorkspaceやJiraとの連携、さらにGoogle Cloud AIを使ったスポーツ映像解析まで、GoogleのAI戦略が研究・業務・開発・スポーツ分析へ広がっていることを示す内容である。

Google Just Released The Worlds Most Powerful AI Agent And More..
🎓 Learn AI With Me For Free - 🌐Subscribe To My Newsletter - your Fre...

Googleの新AIアップデートとDeep Research

Googleが本当にたった今、大量のAIアップデートを公開したのに、誰もそのことを話していません。では、さっそく見ていきましょう。

まず話したいAIアップデートの一つが、新しいGoogle Deep Research Agentです。このリサーチエージェントは、現時点であらゆるベンチマークにおいて1位になっています。まだほとんどの人はすぐには使えないと思います。というのも、これは実際にはAPIでのみ提供されているからです。しかしGoogleは、多くの人が見逃しているさまざまなAIアップデートを発表しています。

まずはこのエージェントから見ていき、その後で他の内容に入っていきます。

GoogleはGemini Deep Researchに新しいアップデートを公開したばかりで、私たちはその能力が大きく飛躍したのを目にしました。最初に強く印象に残ったのは、そのスピードと徹底性です。これによって、科学文献全体を評価する必要があるような、非常に重い科学的な問いを、誰でも尋ねて答えられるようになりました。

そして、何週間も何か月も待つのではなく、数日で問いに答えられるようになります。Deep Researchが非常に見事にできるのは、定量的データをより定性的なデータと結びつけ、それを本当に生き生きとした形で示すことです。

FactSetは、よりオープンなアプローチとオープンなエコシステムを早期に採用した企業でした。私たちの業界では、信頼が極めて重要な要素です。革新性や最先端の機能があったとしても、データが盤石でなければ、お客様はそれを使いません。

そのデータに対して、よりAIに対応したアプローチを取り入れることで、Deep Researchのようなソリューションに統合できるようになります。そしてそれは、回答をしっかり根拠づけ、お客様に自信を持って提供するうえで本当に役立ちます。

Axiomの目標は、科学者が、どの薬が臨床試験で失敗するのかを、実際に失敗する前に理解できるよう支援することです。薬剤毒性や薬の臨床結果に関するデータは、あちこちに埋もれています。そして多くの場合、本当に知る必要がある情報は、非常に長いPDFの80ページ目にあったりします。ですから、Gemini Researcherがあらゆるモダリティのデータにアクセスできる能力は、私たちにとって極めて重要でした。

私たちの業界は、アルファの創出、つまり意外な場所からインサイトを見つけ出すことがすべてです。ですから、マルチモーダル性、つまり動画や音声からセンチメントを取り込み、テキストを見て、定量的データも取り込み、それらを一か所にまとめられるという点は、過去のリサーチよりはるかに高度で、物語の厚みがまったく違います。

Deep Researchを通じて、これほど多くの情報源を横断して処理できる量を考えると、人間の専門性を解き放ち、ニュアンスを引き出すことができます。そして、情報を顧客や同僚にどう伝えるか、人間的な要素をどう加えるかに、より集中できるようになります。これは金融業界にとって大きな転換です。なぜなら、この業界は長い間、生産性を強く求めてきたからです。

Deep Researchは、私たちのチームを本当に加速させてくれました。非常に複雑なワークフローを構築しなければならない状況から、私たちを解放してくれたのです。科学者が極めて速く反復できるようにし、どの問いを尋ねたいのかに集中できるようにしてくれます。

実現可能になるアイデアの数、そのアイデアの質、そして新しいインサイトが私たちの顧客に成果をもたらすあり方は、研究が大きく変化していることを示しています。個人の人間だけでは不可能なほど、スコープを広げられるのです。

Google Cloud NextのAIアップデート

では、Googleの他のAIアップデート、特にCloud Nextイベントの内容に入っていきましょう。ここからはGoogleに説明してもらいます。

YouTube TVおよびNFL Sunday Ticketサポートラインにお電話いただきありがとうございます。本日はどのようなご用件でしょうか。

ああ、はい。明日の夜、NFLドラフトを見るために友人がたくさん来る予定なんです。ケーブルテレビには入っていなくて、正直に言うとスポーツくらいしか見ないんですよ。YouTube TVには、それ専用みたいなプランはありますか。

はい、ございます。YouTube TV Sports Planは、まさにお客様がお探しの内容に加えて、30以上のスポーツチャンネルを含んでいます。基本プランより月額18ドル安くなっています。いまおかけいただいている番号宛てに、直接アクセスできるリンクをテキストでお送りしましょうか。

はい、リンクを送ってください。見てみます。

承知しました。携帯電話にリンクをお送りしました。本日、他にお手伝いできることはありますか。

ええ、はい。今ちょっとこれを見てみます。実は今日、義父が一緒にここにいるんです。彼も自分のアカウントでスポーツプランに入ろうか考えていまして。これについて彼がどう思うか確認したいんです。実は、このプランの内容を彼向けにスペイン語で簡単に要約してもらえますか。彼はたぶん、アメフトとサッカーの両方が見られることを知りたいだけだと思います。そう言いましたよね。

あ、もう一つ質問です。家の中に複数のテレビを設置しようと思っていて、たとえばリビングに1台、パティオに1台という感じです。このプランで問題ないですか。

もちろんです。スポーツプランでは、同時に最大3画面までストリーミングできます。他にご質問はありますか。

最高です。いえ、大丈夫です。実は今、僕は大勢の人がいるスタジアムの真ん中にいて、ライブ配信では何百万人も見ていると思うので、そろそろ行かないといけません。助かりました。それでは。

はい、今のはかなり簡単でしたね。エージェントは複雑な商品ロジックを処理し、言語もシームレスに切り替えることができました。では、チームが変更を加えたい場合はどうなるのでしょうか。大量のソフトウェアエンジニアが延々と続くコード行を更新する必要はありません。必要なのはCX Agent Studioだけです。

CX Agent Studioによる顧客対応エージェント構築

こちらには、CX Agent Studio内のビジュアルビルダーがあります。これは、エージェント構築体験全体に対して、完全な透明性と制御を提供するよう設計されています。これは、YouTube TVが実際に本番環境に投入したエージェントの舞台裏です。

オーケストレーションは、複数の専門的なサブエージェントを横断して管理されており、最も複雑なリクエストでさえ処理できます。そして組み込みのテストインターフェースを使えば、すべての回答が根拠に基づき、事実に沿っており、ここにあるエージェントのPricefinderツールのようなナレッジベースから直接引き出されていることを確認できます。

そして一番すばらしいのは、YouTube TVのカスタマーサポートチームが、この体験全体をわずか6週間で構築し、デプロイしたことです。

では、チームがプロモーションを実施したいとしましょう。新しいサブエージェントを追加するのは本当に簡単です。ここで新しいサブエージェントを追加をクリックして、これを新しいプロモーションエージェントにします。プロモーションと入力します。保存を押します。

そして、自然言語の指示で、一連のビジネスロジックをこのエージェントにすばやく追加します。作成を押します。すると、このようにして、私たちのマルチエージェントシステムは、この新しい専門エージェントに即座に適応しました。本当にそれくらい簡単なのです。

Gemini Enterpriseとマルチエージェントの業務自動化

Gemini Enterpriseは、エージェントを構築し、管理し、やり取りするためのプラットフォームです。これから、複数のプラットフォームにまたがって複数のエージェントをどのようにオーケストレーションできるか、シームレスな引き継ぎのためにコンテキストを共有できるか、そしてワークフローを効率化できるかを実演します。

私が世界規模の家具小売企業で働いていると想像してください。こちらが私専用のホームページで、社内のビジネスコンテキストと外部ソースを、単一の画面で扱うことができます。

エージェントギャラリーには、私が承認したエージェントの一覧があります。Googleが組み込んだものもあれば、自社のエージェントもあります。たとえば、この価格および利益率最適化エージェントは、エージェント、ツール、ソースを横断して自律的にオーケストレーションします。

では、Gemini Enterpriseが動くところを見てみましょう。あまり人気のない商品ラインを再び活性化するために、現在のインテリアデザインのトレンドを分析し、倉庫内のデッドストックを特定し、再ローンチキャンペーンをオーケストレーションするよう、エージェントに依頼します。

その一つのプロンプトだけで、複数のエージェントが、通常なら何時間もかかる一連の作業を数分で完了します。Deep Researchを搭載した私の市場調査エージェントは、最新のGoogle検索情報を、私たち自身の売上データやCSATデータとあわせて分析します。

私のデータインサイトエージェントは、場所や形式にかかわらず、グローバルな商品カタログに接続しています。それは、デッドストックが滞留在庫を意味することを理解し、私たちのエージェント型データクラウドを使って適切なデータセットを特定します。そして私の製品戦略エージェントが、すべてをまとめます。

この計画を承認しましょう。これには数分かかる場合があるので、早送りします。

はい、こちらがハイライトです。オーガニックモダンは非常に大きなトレンドで、顧客は高い金額を払っています。私たちのTuscanyコレクションには余剰在庫があり、それが実はこのトレンドにぴったり合っています。ただ、売上はあまり良くありませんでした。

提案は、ブランドを作り直し、現在の割引価格よりは高く、しかし競合価格よりは低く再価格設定することです。これがすべて、たった一つのシンプルなプロンプトで実現しました。これらの提案を行うために分析したソースも確認できます。

Gemini Enterpriseは、新しいランディングページと、前面に打ち出すための新しいメディアも提案しています。私は製品戦略エージェントに、いくつか動画を生成するよう依頼します。この部分にも少し時間がかかるので、事前に生成しておいた候補を見てみましょう。

これは素晴らしいですね。V3は、まさにその家具を、まったく新しいオーガニックなリビングスタイルの空間に配置しています。では、ウェブサイトを更新しましょう。開発エージェントに、エンジニアリングチームと連携するよう依頼します。

それはJiraに直接接続し、開発者に完全なコンテキストを渡して、シームレスに引き継ぎます。そして開発者側では、このJiraチケットに関する通知が、ここにあるGoogle Chatに自動的に届きます。

ここでCLIを使って進めます。開発エージェントに、そのJiraチケットへの対応を開始するよう依頼します。すると、戦略、アセット、そしてこのウェブページをどのように実行する予定かについて概要を示してくれます。そこには、前回のGemini Enterpriseセッション、チケット、そして私たちのブランドおよびコーディングガイドラインのすべてのコンテキストが使われています。

これは本当に簡単です。では、これを構築してデプロイしましょう。ここからは少し時間がかかる場合があります。会場にいる開発者の皆さんならご存じだと思います。ですので、少しだけ先に進めておきました。最終的な成果物を確認してみましょう。

これは完璧ですね。ではGemini Enterpriseに戻って、ローンチに向けて店舗の準備を進めます。通常、この部分は店舗運営チームが担当します。そこで私はまったく新しいセッションにいます。地域の販売代理店に最新情報を共有するための資料を作るよう依頼します。

Gemini Enterpriseは、自社のコンテキストを使って、このローンチについて知る必要がある内容、私が過去にどのようにこうしたローンチを管理してきたか、そしてチームの売上目標を正確に見つけ出します。そしてGoogle Workspaceエージェントと連携し、私個人のスタイルに合わせたブランド付きのスライド資料を作成します。

これも1、2分かかる場合があるので、事前に生成しておいたものを見てみましょう。しかも、新しいcanvasモードを使えば、Gemini Enterpriseを離れることなく、Google Slides内で編集や共同作業ができます。

全体として、これはとても良いと思います。ただ、ここではre-imaginedという言葉のほうが好みです。完璧です。それでは、これをチームと共有します。どうやら、もう何人かが参加し始めているようです。

振り返ってみましょう。Gemini Enterpriseが、一つのプロンプトで複数のエージェントをオーケストレーションし、コンテキストを共有し、Google Workspaceでコンテンツを生成して共同編集する様子を見ました。

これらはすべて、エンタープライズグレードのガバナンスによって支えられています。組織は、自社のビジネスデータに対する制御を維持しながら、大規模にエージェントを管理し、保護できるのです。これこそが、Gemini Enterpriseエージェントプラットフォームの力です。

Google Cloud AIによるスノーボード映像解析

ジョン、これはすごく楽しくなりますよ。

わかりました。

Google Cloud AIの力をハーフパイプに解き放ちます。そのために、あなたの2017年Burton US Openから一つのトリックを取り上げます。

おお、すごいですね。

きっと覚えていると思います。懐かしい映像です。

懐かしいですね。

では、このクリップを観客の皆さんのために分析して、AIが見ているクールなものをすべて見られるようにしましょう。

わかりました。

では始めましょう。

まず、このトリックは3秒未満で終わっています。

本当に一瞬のぼやけた動きですね。

ご覧の皆さんに説明すると、これは何というトリックですか。

これはスイッチ・キャブ・ダブルフリップ1440です。

それはものすごいですね。でも他の皆さんのために言うと、それは実際にはどういう意味なのでしょうか。

基本的には、自分にとって不自然な方向で滑って、途中で2回フリップしながら、4回転するということです。

ビデオカメラで止めようとしたんですが、できませんでした。では、これをスローモーションにしてみましょう。

はい。

これを行うには、この映像をフレームごとに分析し、Google Cloudが何を見ているのかを確認する必要があります。

そして、これは基本的に、この映像内のすべての停止点について行っていきます。まずは、あなたの姿勢から始めましょう。

はい。

ここが非常に面白いところです。私たちはGoogle DeepMindと共同でモデルを構築しました。このモデルは、あなたを空間的に追跡し、平面的な2次元動画から、あなたの本質的には3次元のポーズを作成できます。

すごいですね。

本当に気に入っています。え、ここではあなたの姿すら見えないんですが、どうやってやっているんですか。

これは私の、タイトなパンツとレザージャケットの時代でしたからね。かなり拡大して見ないといけません。

そうですね。実は裏にもいくつか用意してありますよ。

いい見た目でした。

今でもいい見た目です。

わかりました。

では次の話に移りましょう。

はい。

これらはGeminiによって生成される統計情報です。

ここでは、飛行ダイナミクス、回転速度、さらにはタックの圧縮具合まで追跡しています。

これはすごいですね。以前はこんなものはありませんでした。自分が空中にどれだけの時間いたのかが分かります。そして、過去に自分が撮った映像を取り出して、新しい映像と比較できます。たとえば、トリックを成功させたときは空中にどれだけいたのか、失敗したときはどれだけだったのかを比べられるわけです。そのデータは、自分が上達するうえで本当に役立ちます。そしてもちろん、次の世代もこうしたツールを使えます。

その通りです。そして私が好きなのは、あなたの回転速度がここでどれほど速く上がるかを見られるところです。すべてはパイプからどう飛び出すかにかかっていますよね。

トルクですね。まさにそこから出る力です。

では、ここでもう一つ、私たちが作ったクールなものを見てみましょう。リボンオーバーレイです。

ああ、これは大好きです。

私がこれを気に入っているのは、ここであなたのコークの動きを、全体の可視化によって実際に示しているところです。ここでは何が起きているのでしょうか。

この表示で青から緑に移っていますよね。これは何でしょうか。エンジニアたちと作業していたとき、私はこのトリックを説明しようとしていました。このトリックには転換点があるんです。通常はまずフロントフリップを1回して、それから2回目に入ります。でもその後、一度止めて、そこからバックフリップに戻らなければなりません。

そうですね。

そして、そのトリック内の転換点を逃すと、まあ、良くないことになります。良くないですね。

でもこれは、そのポイントを本当に正確に示しています。

これを見るのは本当に面白いですね。そして私が素晴らしいと思うのは、これによってスポーツがファンにとってよりアクセスしやすくなることです。あなたがこのトリックにどれほど常識外れの動きを詰め込んでいるのか、私たちは見ることができます。

その通りです。

では、この話を戻して、もう少し技術について話しましょう。

はい。

Google Cloudは、ここで誰もが革新できるよう支援しています。空間分析のような用途特化型の新しいモデルを作成し、大量のデータを使ってトレーニングし、Google Cloud TPUによってモデルを扱うこともできます。

そして、Gemini Enterpriseエージェントプラットフォーム、コンピュート、モデル、プラットフォームを通じて、誰もが安全なデータとエージェント基盤を構築できるよう支援しています。これがGoogle Cloud AIの力です。

私自身の経験から言うと、山でトリックを学ぶことと、実際にそのトリックの物理を理解することは、まったく別のことです。これは、次世代のアスリートが新しい技を学ぶのを助けるだけでなく、家で見ているファンがそのスポーツをよりよく理解する助けにも本当になると思います。

そして、それはスノーボードだけではなく、世界中のスポーツに言えることだと思います。

コメント

タイトルとURLをコピーしました