第三の波としてのAIの到来:エージェント型AIが私たちの働き方を変革する理由

AIに仕事を奪われたい
この記事は約17分で読めます。

9,830 文字

The Third Wave Of AI Is Here: Why Agentic AI Will Transform The Way We Work
🤖 The next wave of AI is here, and it's not just about chatbots - it's about intelligent AI agents that will work alongs...

バーナード:皆さん、ビジネスとテクノロジーの未来に関する私のポッドキャストにようこそ。今日のトピックは、AIの第三の波、つまりSalesforceがエージェント型AIによって新しい労働力革命を引き起こすためにAIをどのように再構築しているかについてです。今日のゲストは、Salesforce AIリサーチのエグゼクティブバイスプレジデント兼チーフサイエンティストのシルビオ・サラビさんです。ようこそ。
シルビオ:ありがとうございます、バーナード。お招きいただき光栄です。
バーナード:お会いできて嬉しいです。今日はどちらからご参加ですか?
シルビオ:パロアルトです。私たちのオフィスがあり、私のAIリサーチ組織がある場所です。
バーナード:素晴らしいですね。あなたはSalesforceのAI変革の最前線におられますが、エージェント型AIへの戦略的転換のきっかけは何だったのでしょうか?また、それはあなたにとってどのような根本的な変化を意味するのでしょうか?
シルビオ:はい、確かに私たちにとって非常にエキサイティングな時期です。チーフサイエンティストとして、私は大規模な研究者とエンジニアの組織を監督し、会社のイノベーションを推進しています。
この1年間で、生成AIの使用方法が急速に進化していることが明らかになりました。数ヶ月前まで、企業向けAIの主なパラダイムは、メールの作成や要約の作成、コードの作成などの生産性ツールとして生成AIを使用することでした。しかし今、これは変化しており、私たちは生成AIを使って完全なタスクの自動化や、私たちに代わってアクションを実行するようになってきています。
これは確かにパラダイムシフトです。エージェントとエージェントシステムに関する私のビジョンについて少しお話しさせてください。Salesforceには本質的に2種類の自律システムがあります。1つはAIアシスタント、もう1つはAIエージェントです。
アシスタントは、ユーザーの好みに高度にパーソナライズされ、整合性が取れていることが期待されます。アシスタントは人間がループの中にいる状態で働くことが期待され、実行すべき仕事に関して人間がガイダンスを提供できます。
一方、エージェントは特定のユーザーに割り当てられるのではなく、チームや大規模な組織に適合します。アシスタントとは異なり、エージェントは個人ではなく組織全体にパーソナライズされることを意図しています。エージェントは異なるスキルセットを持ち、異なる役割を持ち、必要に応じて利用可能です。
例えば、組織は営業チームを拡大するためにAIエージェントSDRを雇用したり、カスタマーサービスタスクを自動化するためにCSRエージェントを雇用したりすることができます。
バーナード:このビジョンについて、AIエージェントがどのように使用されるのか、具体的な例を探ってみたいと思います。
シルビオ:そうですね、例えば、カスタマーサービスを持つ企業があり、カスタマーサービスタスクを自動化するためのエージェントをセットアップする状況を想像してください。顧客が情報を求めている場合、例えば返品ポリシーについて話し合いたい場合や、店舗から特定の商品を受け取る方法について知りたい場合、エージェントは会社を代表して質問に答え、このプロセスを案内します。
私たちが推進しているイノベーションの側面は、これらのエージェントが簡単にオンデマンドでセットアップできることです。カスタマーサービスタスクを自動化するためのCSRエージェントをセットアップするテンプレートがあり、それを自社のデータクラウドにプラグインすることで、商品に関連する情報や、特定のオファリングに設定したいポリシーの種類に関連するすべての情報を取得できます。
そして、エージェントはすぐに展開可能になります。ある程度のカスタマイズやパーソナライズも可能で、例えば特定の返品ポリシーを設定したり、エージェントの動作方法に関するガイドラインを設定したりすることも、コンポーネントの追加や削除によって簡単に行えます。
バーナード:それは分かりやすいですね。あなたのCEOのマーク・ベニオフ氏は最近、来年には10億のAIエージェントが労働力として参入するという非常に印象的な予測をしました。この分野に深く関わる者として、私たちの働き方に対するAIの第三の波の実世界での影響をどのように見ていますか?
シルビオ:これは間違いなく転換点です。私は、プラットフォームを通じてこれらの異なるタイプのエージェントがすぐにオンデマンドで利用可能になり、顧客は自分のユースケースに最適なエージェントを選択できるようになると考えています。
ある時点で、非常に多くのエージェントが異なるレベルの粒度で異なるタスクを実行できるようになります。販売会話の要約を書くような非常に特定のタスクに特化したエージェントから、他のエージェントを制御・操作できる高レベルなエージェントまで想像してください。
確かに、私たちは多くの複雑さ、多くのタイプのエージェント、そしてエージェント間の多くのタイプの相互作用を持つことになるでしょう。私たちは皆がエージェントを持つ状況に進化していくでしょう。私は個人のエージェントを持ち、あなたも個人のエージェントを持ち、私のエージェントは例えば車のレンタルや特定のサービスの要求のために会社に電話をかけ、その会社は自社のエージェントを持っていて私のエージェントと話をし、これらの非常に興味深い相互作用が行われます。
もちろん、これには信頼に関する非常に重要なガイドラインが必要です。これは実際にSalesforceで重点的に取り組んでいる非常に重要なトピックです。
バーナード:これについてもう少し詳しく掘り下げてみたいと思います。AIエージェントの開発には、今おっしゃったようにガードレールに関して多くの複雑な課題があると想像します。チームが直面した技術的な障壁と、より広範な倫理的・社会的影響に関する議論や討論について説明していただけますか?
シルビオ:もちろんです。エージェントの信頼性を確保することは、非常に複雑で課題の多いタスクです。
消費者向けの領域では、AIが不正確な回答を生成しても、それは迷惑かもしれませんが、大きな損害にはなりません。ほとんどの人はその特定の機能やツールを使用しなくなるか、使用頻度を減らすでしょう。
しかし、企業向けの領域では、不正確なエージェントが間違った計画を実行すると、災害につながります。自律走行車が歩行者に衝突するようなものです。そのため、これらのエージェントの設計には細心の注意を払う必要があり、自律システムが適切な信頼の境界内で動作するようにガードレールを構築する必要があります。
これらのガードレールは、エージェントに何をすべきか、何をすべきでないかを伝えるのに役立ちます。良いニュースは、Salesforceでは何年もの経験からこれらのガードレールを運用してきており、信頼できるビジネスロジックを使用し、完成させてきたということです。
これらの信頼できるビジネスロジックは、エージェントの動作方法や、Agent Forceプラットフォームで利用可能になる異なるテンプレートの構築方法に注入・移転することができます。
しかし、これらのガイドラインは常に定義が簡単というわけではありません。なぜなら、それらは常識や複雑な文脈的状況から導き出される可能性があるからです。そのため、エージェントが持ち得るすべての可能な行動を予測することは非常に困難です。
もう1つの重要なことは、これらのエージェントが考案する行動と計画が人間によって検証可能であることを確認することです。これは特に、重要な潜在的に不可逆な決定を下す必要がある場合に当てはまります。これが私たちが「人間が舵を取る」と呼ぶものです。人間がそのような重要な決定ポイントでエージェントを制御できるということです。
バーナード:つまり、あなたが見ている未来では、エージェントは完全に自律的に行動するのではなく、どこかに必ず人間がループの中にいるということですね?
シルビオ:はい、その通りです。特に、エージェントが重要な決定を下す必要がある場合や、エージェントが不確実性の領域を明らかにする必要がある場合には重要です。
これらのAIシステムが特定の決定や行動を行う際の信頼性を開示できることが非常に重要です。エージェントAIに自信がない場合、私たちは制御権を人間に戻す必要があります。人間は適切なタイミングで適切な状況を評価することができます。
バーナード:Salesforceは最近、チャットボットの時代は終わったという興味深い立場を取っていますね。企業は独自のAIソリューションを構築するのではなく、プラットフォームベースのサービスを採用すべきだとあなたは提案されています。その見方の背景には何があるのでしょうか?
シルビオ:要点は、大規模言語モデルがビジネスにどのように役立つかについて多くの議論があったということです。
確かに、多くの消費者向けアプリケーションでは、これらの大規模モデルが利用可能であることは非常に強力で有益です。特に、ユーザーが実行する必要のあるタスクが必ずしも事前に指定されていない状況を指しています。
消費者向けの領域では、私は自分のアプリケーションのための文章を書いたり、宇宙について話したり、盆栽の育て方について話したり、特定の転写を要約に変換したりすることができます。AIは消費者向けの領域で多くのことができます。
企業向けの領域では、物事ははるかに限定的で制限されています。ユースケースはよく定義されており、アプリケーションはよく定義されており、ドメインは非常に具体的です。金融からヘルスケア、自動車、一般的なCRMユースケース、コマースまで幅広く対応しています。
このような状況では、タスクとユースケースがはるかに明確に定義されています。そのため、私たちのビジョンでは、これらのエージェントのポートフォリオを利用可能にすることは、独自のLLMをカスタマイズしたり、これらのLLMの周りにすべてのインフラを構築したりするよりもはるかに効果的な方法です。
なぜなら、LLM自体では十分ではないことを覚えておく必要があるからです。実際には、正しい情報を引き出すために、検索生成システムなどの他のコンポーネントと連携するための適切な配管を設置する必要があります。また、先ほど議論したような適切な信頼のガードレールを設置する必要があります。
これらすべてには多くの複雑さが必要で、多くの企業はこれらの異なる要素をすべて組み合わせるノウハウや経験を持っていません。そのため、私たちのアプローチは、非常に簡単に使用でき、初期化できるプラグアンドプレイのエージェントを提供することです。
もちろん、カスタマイズの機会はありますが、このアプローチでは、すべての配管を正確に行う方法を知る必要はありません。私たちがあなたのために配管を行うというのがアイデアです。
バーナード:よく分かりました。批評家の中には、よりプラットフォームベースのAIサービスへの移行は、大手テクノロジー企業への依存度を高める可能性があると主張する人もいます。これらの懸念についてどのようにお考えですか?
シルビオ:私たちは、これらのエージェントが潜在的に異なるタイプのLLMによって動作する、つまり異なるタイプのAI機能によって動作するシナリオに向かっています。
私の予測では、少なくとも大規模言語モデルの基本的な部分に関しては、この技術の多くがコモディティ化されるということです。
確かに、数兆のパラメータを持つフロンティアモデルの構築には、多くの計算能力とノウハウが必要です。特に、複雑な推論を行い、数学的問題を解決できるAIを構築したい場合には、このような大規模なモデルが必要です。
しかし、企業向けのユースケースや特定のエージェントを動作させるためには、そこまでの規模は必要ありません。実際には、構築がはるかに容易なモデルで作業することができ、それらの特定のユースケースや特定のドメインに対して微調整することができます。
これらについては、よりコモディティ化されたモデルを活用することができ、または市場で間違いなく利用可能になり、非常に分散化された方法で間もなく利用可能になるでしょう。
したがって、私は多くのコアAIが間違いなくコモディティ化されると考えていますが、もちろんSalesforceのような企業は、多くのビジネスにとって重要な実現要因となるエージェントをホストするためのインフラとプラットフォームを集約する支援ができます。
バーナード:エージェント型AIに関する議論全体で、AIエージェントが「できないこと」に多くの焦点が当てられています。Salesforceでエージェント型AIを開発する中で、彼らが「できること」について最も驚いたことは何ですか?
シルビオ:私の組織での取り組みについて少しお話しさせてください。チーフサイエンティストとして、私はエンジニアリングと製品チームと緊密に連携するAIR組織を運営しています。私たちの目標は、将来のことを少し先読みし、将来の方向性を考え、最終的に会社のイノベーションとテクノロジーを推進できる技術を提案し、生産することです。
特に、私たちはエージェントの2つの主要なコンポーネント、つまりメモリと脳に長い間投資してきました。
メモリは、エージェントが以前に何が起こったかを覚えることを可能にします。エージェントがあれば、以前の会話や以前のインタラクションをすべて忘れることはできません。会話の状態や以前に何が起こったかを記憶するメカニズムが必要です。
特に、ポリシーやベストプラクティスなど、他のタイプのデータや他のタイプのレポジトリから情報を引き出すことができる必要があります。これらはすべて、エージェントの動作方法に注入される必要があるコンポーネントです。
そのために、私たちは検索補強生成(RAG)に基づく技術を構築しました。これは、市場で利用可能な同様の技術と比較してより正確な結果を生み出しています。これは私たちの主要なインキュベーションプロジェクトの1つであり、主要な顧客とのパートナーシップで行われました。
メモリに加えて、2番目のコンポーネントは脳です。脳は、より技術的な用語では推論エンジンです。これは、エージェントが単にメールを生成したり情報を検索したりするだけでなく、より複雑なタスクを実行できるように動作させる要素です。
ここでは、計画立案、推論、そして実世界に影響を与える一連のタスクの調整が重要です。これらのアクションが実世界にどのような影響を与えるかを見ることで、エージェントはこのようなフィードバックから学習し、適応する必要があります。
これは、機械学習の分野で長年開発してきた強化学習技術に似ています。エージェントは環境からの反応を見ることで、アクションを改善する方法を学習できます。これはすべてエージェントの脳の一部であり、私たちの組織でもより強力な脳を構築するための高度な技術を開発しています。
これもまた、数週間前のDreamforceで紹介された Atlas推論エンジンの一部であり、将来のリリースでAgent Forceプラットフォームで利用可能になる予定です。
バーナード:素晴らしいですね。これは興味深いです。組織が実際にこれらをどのように活用し、どのようなユースケースが生まれるのか、楽しみです。おそらく5年先を見据えて、人間の労働者とAIエージェントの関係がどのように進化すると考えていますか?また、この未来について最も期待することは何ですか?
シルビオ:これは実際に素晴らしい質問です。最近の期間で、エージェントと人間が一緒に働くこの新しい時代に私たちがどのように向かっているのかを理解することに、私の関心の多くが向けられています。
先ほど述べたように、私たち全員がそれぞれのエージェントを持ち、組織はエージェントの労働力を活用し、至る所にエージェントが存在する状況になるでしょう。
繰り返しになりますが、これらのエージェントは専門化され、マーケットプレイスで利用可能になり、オンデマンドで雇用または利用可能になります。
在庫確認、顧客インタラクションのサマリー作成、保険金請求の紛争処理、財務計画、患者の投薬サマリーなど、ヘルスケアから金融、コマースまで、さまざまな垂直産業、さまざまなドメインにわたってエージェントが存在することになるでしょう。
これは非常に強力なビジョンであり、将来確実に実現するでしょう。興味深い部分は、これらの人間とエージェントのインタラクションをどのようにモデル化するかということです。
エージェント同士が相互作用する状況になり、複雑なタスクに対処するために協力する必要があります。先ほど述べたように、私のエージェントは特定の場所や時間で車をレンタルするためにレンタル会社のエージェントに連絡する必要があるかもしれません。
私のエージェントは、私の可用性、興味、ニーズを知っている必要があり、レンタル会社のエージェントと最適な取引や、私のために車を利用可能にする最適な方法について交渉する必要があります。
また、潜在的な対立の状況も発生するかもしれません。例えば、レンタル会社が追加機能を販売しようとし、私のエージェントはより良い価格を引き出そうとするかもしれません。エージェントがどのように協力するか、または潜在的に対立する状況でどのように動作するかについて、非常に興味深いダイナミクスが生まれるでしょう。
また、エージェントが私たち自身のワークフローの一部となる状況もあるでしょう。あなたと私、そして他の誰かとのミーティングを想像してください。ある時点でエージェントが登場し、会話に関する価値ある情報を提供します。
単にノートを取ったり要約を作成したりするだけでなく、独自の洞察を持って会話に介入し、参加することもあるでしょう。これは非常に興味深いインタラクションの方法になりますが、根本的に私たち人間ユーザーにとって重要なのは、これらのエージェントの能力が何であるかを学ぶことです。
AIが何をうまく行え、何をうまく行えないのか、その限界と機会について非常に意識的である必要があります。AIがどのように動作するのかについて、その境界を正確に理解することが非常に重要です。
バーナード:組織内で人間と並んで働くHRエージェント、財務エージェント、営業エージェントなど、多くの専門化されたエージェントが存在する世界が来ると考えていますか?
シルビオ:その通りです。まさにそれが起こることです。そして、これらのエージェントをどのように調整し、活用するかを学ぶ必要があります。
将来の仕事は、チーフオブスタッフのような、このエージェントの艦隊を調整・組織し、エージェントにタスクを委任する方法を知り、その能力を最大限に活用できる人のようになると想像しています。
これにより、人間はより高レベルの仕事の設計に専念でき、私たちが必ずしも深く関わりたくない単調で反復的なタスクをエージェントに委任することができます。
バーナード:AIエージェントと成功裏に協働するために、人間が注力すべきスキルの観点から、これは仕事の未来にとって何を意味すると思いますか?
シルビオ:まず第一に、先ほど述べたように、人間はAIがどのように動作するのか、その機会と限界について正確に理解する必要があります。これは非常に重要です。
利用可能なエージェントが実行できるタスクを正確に理解できる必要があります。そして、スキルは実際に、自分自身をオーケストレーターとして、多くのツールや自動化の方法を利用できる人として再想像することになります。
この認識は、私たちが将来の仕事について考える方法を修正する上で非常に重要です。
バーナード:同意です。あなたはこのエージェント型AIをAIの第三の波だとおっしゃいましたが、あなたが考える第一と第二の波について簡単に教えていただけますか?
シルビオ:現在の波はデジタルエージェントの波です。次の波は物理的エージェントの波になるでしょう。
エージェントがもはやバーチャルな空間だけでなく、物理的な空間で動作し、物理的な世界との直接的なインタラクションを必要とするタスクを実行する状況が生まれるでしょう。
実際、私たちはすでに例を持っています。自動運転車は、都市や都市環境、高速道路で運転するようなタスクを実行するエージェントの例です。
現在、私たちはこれらのエージェント、つまり自律走行車が信頼できる方法で動作するようになることに近づいています。これらは物理的な世界と相互作用し、物理的な世界との関わりを通じて行動を修正する方法を学習するエージェントの例です。
後には、物理的なタスクを実際に実行するロボットの時代が訪れるでしょう。しかし、私の予測では、ハードウェアの操作タスクの実行に関連する多くの課題を克服する必要があるため、この段階に到達するまでにはまだ数年かかるでしょう。
バーナード:素晴らしいですね。では、振り返って、AIの第一波と第二波は何だったのでしょうか?
シルビオ:第一波は実際に予測的なものでした。予測を行い、時間的な現象を想像する能力です。例えば、販売している製品の数に対応する時系列データがあれば、過去の行動に基づいて次に何が起こるかを予測できます。
これは、倉庫の在庫管理や、特定の仕事のためのリソースの配置を予測するなど、多くのアプリケーションで非常に強力です。これが予測AIと呼ばれるものでした。
現在の波は生成AIです。AIを使用してコンテンツを生成し、人間との会話を可能にします。予測AIでは、AIと実際の人間のような会話を持つことは非常に難しかったのですが、生成AIではこのような会話が可能になり、AIが人間に情報を注入することができます。
第三波はAIエージェントで、私たちが先ほど議論したとおりです。そして第四波は実際に物理的なエージェントです。
バーナード:まだAIの第一波と第二波に留まっている企業や個人に対して、今すぐエージェント型AIに注目すべき主な理由は何でしょうか?
シルビオ:エージェント型AIは、ビジネスの運営方法を再定義したい場合に特に重要になります。あなたのために物事を行うことができるこれらのエージェントを利用できるようにして、ビジネスを再考することです。
ワークフローをどのように分解し、そのワークフローの多くのコンポーネントをこれらのエージェントで置き換えることができるかを想像してください。これが、ビジネスの未来を想像する方法です。
これらの強力なツールを利用してタスクを自動化し、ワークフローをどのようにエージェントで実装できるコンポーネントに分解するかを考えることです。
もちろん、人間のループを持つことは非常に重要です。最初に述べたように、エージェントの動作を制御する舵取り役として人間がいることは非常に重要です。重要な決定ポイントへのアクセスは非常に重要です。
また、すべてのAI出力を透明にすることも重要です。AIが何を生成し、人間が何を生成したのかを理解する必要があります。これは将来のビジネスにおいて非常に重要です。誰かが私に電話してきた場合、それが人間なのかエージェントなのかを知る必要があります。このレベルの透明性に到達することは非常に重要です。
バーナード:素晴らしい、本当に興味深いお話でした。シルビオさん、時間を割いていただき、ありがとうございました。このインタビューを再視聴したい方は、私のYouTubeチャンネルで、この会話と、テクノロジーとビジネスの未来に関する他の何百もの会話を見つけることができます。ありがとうございました。
シルビオ:ありがとうございます。ありがとうございました、バーナード。

コメント

タイトルとURLをコピーしました