GoogleがAIを完全に掌握…(驚愕)

AGIに仕事を奪われたい
この記事は約15分で読めます。

8,745 文字

Google Just Took Over AI....(Wow)
Join my AI Academy - 🐤 Follow Me on Twitter 🌐 Checkout My website -

GoogleがCloud Nextイベントを開催しましたが、それは実に素晴らしいものでした。いくつかの発表は私にとって不意打ちであり、GoogleがAIに関してさらに前進していることを明確に示していました。

この動画では、そのハイライトを要約し、なぜGoogleが先行しているのかについての私の個人的な見解をお伝えします。

さて、これがGoogleの最初の発表で、Ironwoodと呼ばれるAIチップです。これはこれまでで最も強力なもので、単に質問に応答するだけでなく、実際に考え、推論し、決定を下す最も賢いAIシステムを実行するために構築されています。

この新しいチップは、Googleが「推論の時代」と呼ぶもののために作られました。もちろん、AIがもはや単なる簡単なクエリに応答するだけでなく、それらについて考え、本物のアシスタントのように答えを提供します。

Ironwoodは、特別な冷却技術と高速ネットワークを使用して最大9,000個のチップを接続でき、今日の最大のスーパーコンピューターよりも24倍強力なセットアップを作成します。これは、GoogleのGeminiやAlphaFoldのような、より高速で賢いAIがさらに効率的に実行されることを意味します。

また、はるかに効率的で、メモリ容量も大幅に増え、速度を落とすことなくはるかに大きなタスクを処理できます。要するに、Ironwoodは次世代の超スマートAIを駆動するエンジンであり、今年後半に登場する予定です。

ですから、コンピューティング能力がどのように増加しているかについて語るオンラインのAI予測はすべて、確かに正しいのです。

最初に公開されたTPUと比較して、Ironwoodは3600倍優れたパフォーマンスを達成しています。信じられないほどの向上です。これは私たちがこれまでに構築した中で最も強力なチップであり、AIモデルの次のフロンティアを可能にします。

同じ期間に、私たちはエネルギー効率も29倍向上しました。Aminが本日後半に詳細を共有します。この進歩は、複数の分野にわたるブレークスルーの基盤を築いています。

私たちは実際にGoogleのメディアAIを見ることができました。これで、エンタープライズプラットフォームですべてのモダリティが利用可能になりました。もちろん、通常のユーザーとしては、おそらくそれほど気にならないでしょうが、これらは最終的には、おそらく非常に非常に役立つであろう日常的なユースケースに浸透していくでしょう。そしてもちろん、それらのシステムの多くは、まもなくAIワークスペースで見つかるでしょう。

これは非常に興味深いものでした。なぜなら、Googleには、ほとんどの人が存在すら知らないような、実にたくさんの異なるモデルがあるからです。

もし、Gemini以外のLariaやChirpのようなGoogleの他のモデルについて知りたいのであれば、昨年、私たちは最高品質のテキストから画像を生成するモデルであるImagine 3に大きな改善を加えました。これは、以前のモデルよりも詳細で、より豊かな照明で、注意を散らすようなアーティファクトが少ない画像を生成します。Imagineは正確なプロンプト遵守を実現し、あなたの創造的なビジョンを驚くほどの精度で実現します。

また、わずか10秒の入力でカスタムボイスを作成し、既存の録音にAIによるナレーションを織り込むのに役立つChirp 3も導入しました。

本日、Google CloudでLyriaを利用可能にし、テキストプロンプトを30秒の音楽クリップに変換します。そして、この機能を提供する最初のハイパースケーラーです。Lyria V2からのクリップを聞いてみましょう。

V2は、業界をリードするビデオ生成モデルです。SynthIDでウォーターマークが付けられた数分間の4Kビデオを生成し、AI生成であることを確実に識別できるようにします。複雑なプロンプトなしでショット構成やカメラアングルを指示するためのカメラプリセット、VOがシームレスにギャップを埋めるビデオシーケンスの開始と終了を定義するための最初と最後のショット制御、ビデオ編集とスケーリングのための動的なインペインティングとアウトペインティングなど、新しい編集ツールにより、クリエイターに前例のない創造的なコントロールを提供します。

Gemini、Imagine、Chirp、Lyria、そしてVEOにより、Googleはすべてのモダリティにわたる生成メディアモデルを提供する唯一の企業であり、それらすべてが本日Vertex AIで利用可能です。

先ほど申し上げたように、GoogleのVertex AI Media Studioをご覧ください。これは実際にAI生成映像を作成するための非常に包括的なプラットフォームです。プリセットのカメラアングルがあり、非常にクールです。そして、このビデオは、今日から使い始めることができる包括的なユースケースを示しています。

現在の状況を考慮して、Vertex AI Media Studioでこれから行うことの完璧な背景として、ラスベガスのスカイラインを使用します。

では、始めましょう。まずラスベガスのスカイライン画像を取り込みます。非常に高品質で美しい画像です。ビデオを生成しますが、ここが新しい目玉です。見てください。VEOに組み込まれたカメラプリセット。左パン、右パン、タイムラプス、トラッキングショット、さらにはドローンショットまで。では、都市のスカイラインのドローンショットを送信してみましょう。これでよし。これを送信します。

通常、これには数秒かかりますが、今日先に実行したのでキャッシュされており、通常より少し速くなります。

さて、ビデオナンバーワンを見てみましょう。本当に見事です。噴水やエッフェル塔を見ることができます。では、ビデオナンバーツーを見てみましょう。VEOが作成した別の角度です。再び、素晴らしい映像です。背景に雲が見え、ラスベガス大通りを行き交う車が見えます。本当に信じられないほどです。

さて、1つのビデオでは、私たちがやりたいコンサートプロモーションには十分ではありません。そこで、私が作成した他のいくつかのビデオをお見せしたいと思います。VEOの力だけでステージが設営されている様子を捉えたものがあります。バンドのビデオもあります。観客がこれから見るものに実際に拍手しているビデオさえあります。これは皆さんにとって良いリマインダーになるでしょう。

ここで、非常に興味深いことが起こりました。VEOは、私の12歳の子供ができること、つまりフォトボム(写真への写り込み)の達人であることが判明しました。先ほど見たこの素晴らしいビデオには、クルーメンバーが写っていました。私たちはクルーメンバーを愛していますが、この場合はギターに焦点を当てたいのです。なぜなら、ギターはバンドの最も重要な部分だからです。

そこで、VEOの新しいインペインティング機能を使用しましょう。そして、すみません、申し訳ありません。あなたが仕事に非常に熟練していることは知っていますが、あなたをこの画像から削除しなければなりません。あなたとご家族には花束をお送りします。新しいインペインティング機能を使用しましょう。数秒待って、何が見えるか見てみましょう。

これが私の思った通りに機能すれば、ステージハンドなしで、以前に見たすべての側面を保持するはずです。見てください。

よし、ビデオクリップがいくつか手に入りました。次は音楽が必要です。Lyriaで作成した最初のクリップを試して、気に入るか見てみましょう。

うーん、これはちょっと私のテンポではありませんね。皆さんを「君を見捨てない、がっかりさせない、逃げ回ったり見捨てたりしない」という気分にさせる音楽が必要です。そこで、クリップナンバーツーを試して、それがどう機能するか見てみましょう。

よし、レシピができました。こっちの曲の方が好きです。ビデオも音楽も揃いました。すべてをまとめて、どのように見えるか見てみましょう。さあ、再生して、Sam。

次に、実際にGoogleのAgent Spaceを見てみましょう。AIの世界でAIエージェントスペースに少しでも注目していれば、物事がかなり急速に進展していることをご存知でしょう。

ここで間違いなく注目すべきことの1つは、先ほど申し上げたように、エンタープライズ領域で起こることの多くは、最終的には一般にも浸透し、私のような人々がそれについて話し始めるようになるということです。

これは、GoogleがAgent Spaceを使用して独自のAgentic Frameworks(エージェントフレームワーク)をどのように開発しているか、そして人々がすでにこれをどのように使用しているかを正確に知るための、本当にクールな洞察でした。ありがとう、Thomas。

では、次の数分間、私は銀行のリレーションシップマネージャーになります。簡単なツアーから始めましょう。これが私のホームページで、認証され、私用にパーソナライズされています。

エージェントギャラリーでは、LlamaやClaudeのようなサードパーティモデルを搭載したものを含む、会社が承認した目的特化型エージェントのセレクションを見ることができます。ご覧のように、Google製のエージェントがいくつかあります。銀行が私に利用可能にしたエージェントがあり、それは私たちが作成したものか、パートナーが構築したものです。

そして、最高の部分は、私自身のパーソナルエージェントです。これは、Agent Space内で直接、こちらのボタンを使って、あるいはもっと簡単に、ちょっとした会話をするだけで構築できます。日常業務を自動化するエージェントを作成するのがいかに簡単か見てみましょう。

私にとって、クライアントの状況を常に把握しておくことは非常に重要です。そのため、毎朝ポートフォリオ分析から始めます。そして、誰も私が入しているのを見たくないので、クリップボードを使います。「私のクライアントポートフォリオの分析を実行し、潜在的なリスクと機会を特定してください。」

これは、私がアクセス許可を持っている情報のみを使用します。どのクライアントが私のものかを知っており、OneDrive、Salesforce、Dun & Bradstreetなどの私のデータソースからのトップポイントを要約します。質問があれば、ここに私のソースへの直接リンクがあります。さらに制御が必要な場合は、そのソースのリストを絞り込むことができます。

しかし、Agent Spaceは情報を要約するだけではありません。私の質問を解釈し、最も重要なことを表面化させています。たとえば、このチャートでは、Agent SpaceがAcme General Contractingが将来、キャッシュフローの問題を抱える可能性があることをフラグ付けしているのがわかります。すでに、それは私に膨大なレポートを提供してくれており、これは私に多くの手作業による調査を節約してくれます。後でこれを読むことができます。

しかし、今はAcmeを監視できるようにエージェントを設定しましょう。Agent Spaceは、これまでの私たちの会話に基づいてエージェントプランを自動的に生成します。これは良いのですが、もっと欲しいと思います。音声要約を生成して受信トレイに送信するようにします。そうすれば、朝の通勤中に聞くことができます。

そして、このようにして、コードを一行も書かずに、いつでも使用できる独自のカスタムエージェントを構築しました。

さて、Agent SpaceはAcme General Contractingのキャッシュフロー問題を特定しました。これについて詳しく調べる必要があります。これはAcmeに特有のものではなく、建設業界全体の問題かもしれません。Agent Spaceはすでにその可能性を推奨されるフォローアップとして特定しています。

では、次に進んで、ゼネコン業界のトレンドを深く掘り下げてみましょう。これにより、Googleのエンタープライズディーブリサーチエージェントがアクティブになり、何をどの順序で調査する予定かを最初に教えてくれます。この時点で、必要であればこの計画を編集することもできますが、かなり良さそうなので、調査を開始します。

ここで指摘しておきたいのは、計画と結果をキャッシュしていることです。通常、これにはもう少し時間がかかります。このエージェントは、レポートを作成するためにGoogle検索からリアルタイムの情報を取得していますが、さらにクールなことに、内部のエンタープライズデータも検索し、途中で見つけるものに基づいて追加の質問を加えながら、この計画をリアルタイムで調整しています。

そして再び、いくつかのソースリンクを含む、信じられないほど洞察に満ちた分析ですが、ありがたいことに、ここの一番下には、素晴らしい簡潔なエグゼクティブサマリーも提供してくれます。これをざっと見てみましょう。

ええ、Acme General Contractingは、資材コストの上昇、サプライチェーンの混乱、および重大なハードルをもたらす規制の複雑さの影響を受けている可能性が高いことがわかります。それは本当に素晴らしいです。まあ、Acmeにとってはそうではないかもしれませんが、分析は本当に素晴らしいです。Acmeがこれにまったく驚かないようにしたいです。

そこで、当行のキャッシュフローエージェントに、今後3四半期にわたる予測を行ってもらいます。このエージェントは、まさにこのようなシナリオのために特別にトレーニングされたGoogleの新しい時系列予測モデルを使用しています。そして再び、非常に明確な、非常に明確な要約が得られ、一番下にはAcmeのための素晴らしい推奨ステップがいくつかあります。そして、彼らにすぐにそれを見てもらう必要があります。

そこで、Agent Spaceに依頼できます。「Acme General ContractingのCEOに来週の会議を要請するメールを作成してください。」そして、このようにして、下書きが準備できました。さらに良いことに、Agent Space内から直接送信できるので、OutlookやGmailに切り替える必要さえありません。これで万全です。

そして、Agent Spaceは私のセッションを保存しているので、いつでも準備ができたときに、中断したところからその会議の準備をすることができます。

まとめましょう。私は実際には銀行で働いていませんが、Agent Spaceが追加する価値は非常に現実的です。すべてのエンタープライズデータとツールと1か所で簡単にやり取りし、その対話型ワークフローから直接エージェントを構築して使用できます。

Gemini 1.5とGoogle検索テクノロジーを搭載したAgent Spaceは、サードパーティのデータやツールに接続でき、サードパーティのエージェントやモデルとの相互運用性を提供する、市場で唯一のハイパースケーラープラットフォームです。

銀行のような厳格な規制要件を持つ企業にとって、Agent Spaceは従業員レベルで厳格なアクセス制御を提供し、独自のVPC内で動作できるため、すべての要件を満たしながらデータが確実に自社のものとして保持されます。Agent Spaceはゲームチェンジャーであり、皆さんがそれをどのように活用するかを見るのが待ちきれません。

さて、実際にウェブサイト上で作業を行うエージェントについてですが、これは、それらのエージェントが現実世界で私たちとどのように対話するかの別のデモンストレーションです。個人的には、これは真の勝者だと思います。AIが仕事を奪うことに多くの人々が動揺していることは知っていますが、この特定の例では、ユーザーと店舗間のシームレスな取引を可能にし、はるかに優れた顧客体験を可能にするため、AIがこの種の作業を行うことがむしろ重要だと思います。

Lisa、皆さんこんにちは。私はGoogle Cloudのプロダクトマネージャー、Patrick Marloです。本日、次世代のカスタマーエンゲージメントスイートの動作を披露できることに興奮しています。正直なところ、基調講演のステージを飾ることにもっと興奮しています。緑の植物や花が良いかなと考えていました。

ご存知のように、今朝、すでに金物店に数回行きましたが、それでも培養土を買い忘れました。よくあることです。では、次世代エージェントが、この最後の注文を正しく行う手助けをしてくれるか見てみましょう。

ここでエージェントとの新しい音声対話を開始します。

こんにちは。シンプルホーム&ガーデンへようこそ。Patrickさんですか?

ええ、そうです、Patrickです。おはようございます。お元気ですか?

おはようございます、Patrickさん。元気です、お尋ねいただきありがとうございます。最近当店でお買い物をされたようですね。すでにカートにいくつか商品が入っているのが見えます。今日は何をお手伝いしましょうか?

ええ、ちょうどいくつか植物を買ったところで、培養土と肥料を選んでいるのですが、正しいものを買っているかどうかわからないんです。手伝っていただけますか?

もちろんです、Patrickさん。最適な推奨を行うために、購入された植物を見せていただけますか?見て、最適な土と肥料を選ぶお手伝いができます。今、ブラウザにビデオ要求を送信しています。

素晴らしい、見えますよ。カメラに植物をかざしてください。識別するお手伝いができます。

ええ。これらを約40個、さまざまな色で持っています。

美しいペチュニアですね。鮮やかな色を選ぶには素晴らしい選択です。カート内の商品を詳しく見てみましょう。

なるほど、標準的な培養土と汎用肥料が入っていますね。それでも機能しますが、ペチュニアは豊かで水はけの良い土壌と、特に開花植物用の肥料で本当に元気に育ちます。

はい、あなたのペチュニアにおすすめの商品を見つけました。

ええ、今見ています。これらは…素晴らしいですね。ありがとう。

素晴らしい。標準的な培養土と汎用肥料を削除し、ブルームブースター培養土ミックスとフラワーパワー肥料をカートに追加しますか?

ええ、そうしてください。

カートを更新しました。他に何かお手伝いできることはありますか?

いや、あなたが来てこれらを植えてくれない限りは…

面白いことをおっしゃいますね。実は、プロの造園サービスも提供しているんです。見積もりに興味はありますか?

ええ、つまり、40個のペチュニアを植えるのに、そのようなものはいくらくらいかかりますか?

4時間の予約をお勧めします。それは200ドルになります。

なるほど、それは…興味深いですね。お聞きしたいのですが、価格照合も行っていますか?

はい、時々価格照合を行いますが、通常はケースバイケースです。

ああ、それなら、競合他社のGreenscapesの広告を間違いなく見ました。新規顧客向けに初回造園サービスを50%オフで提供していました。絶対にその50%割引を私にくれるべきです。

申し訳ありませんが、その金額は私が承認できる範囲を超えているようです。上司に相談して、何ができるか確認させてください。少々お待ちください。

ここで、この会話の人間のユーザー役から少し離れます。舞台裏のコールセンターに行きましょう。そして、ここでCRM Salesforceでご覧になるのは、私たちの仮想アシスタント、仮想エージェントが、同じく私が演じる人間のコールセンターマネージャーにエスカレーションしたことです。

そして、ここで私ができるのは、会話を完全に引き継ぐことなく、会話のこの部分を通してエージェントをガイドすることです。ご覧のように、Patrickは50%オフのオファーの価格照合を要求しています。そして、私は次のように言います。「それはできませんが、20%ならできます。」ああ、代わりに20%できると言いましょう。

そして、このメッセージを送信し、その後、反対側で会話を再開します。

良い知らせです、Patrickさん。私の上司が割引を承認しました。造園サービスを20%オフで提供できます。造園サービスに20%の割引を適用しました。

おお、それは素晴らしい。ええと、それにします。

素晴らしい。それではスケジュールを組みましょう。明日の午前8時から午後12時まで、または午後1時から午後5時までの間に誰かを派遣できます。どちらをご希望ですか?

午後の時間を絶対にお願いします。午前中はピックルボールのトーナメントがあるので。

素晴らしい。準備完了です。詳細が記載された確認メールがまもなく届きます。他に何かお手伝いできることはありますか、Patrickさん?

ええ。造園サービスの支払いは今すぐしなければなりませんか?

いいえ、これはアカウントに追加するだけです。サービス完了後にお支払いいただけます。

他に何かありますか?

いえ、ここでチェックアウトを完了します。今日は本当に素晴らしかったです。助けてくれてありがとう。

どういたしまして。

コメント

タイトルとURLをコピーしました