本動画では、Capital OneのエンタープライズデータおよびAI担当エグゼクティブ・バイス・プレジデント兼チーフサイエンティストであるPrem Natarajanが、同社のAI戦略について詳しく語っている。Capital Oneは既製のAIモデルを購入するのではなく、オープンソースをベースに自社データを深く統合したAIスタックを独自に構築する道を選択した。この決断の背景には、同社の技術重視の企業文化、クラウドファーストの姿勢、そしてデータガバナンスへの長年の投資がある。Natarajanは、自動車ディーラー向けのチャットコンシェルジュやコールセンターのエージェント支援など、具体的なエージェンティックAIアプリケーションの事例を紹介しながら、専門化と推論能力を組み合わせることで顧客体験を向上させる方法を説明する。また、レイテンシーの最適化、モデルの蒸留、リスク管理など、金融機関ならではの要件に対応するために、スタック全体を自社で制御することの重要性を強調している。本対談は、エンタープライズAIの構築における「ビルド対バイ」という根本的な問いに対する実践的な洞察を提供するものである。

AIをゼロから構築するCapital Oneの選択
AIをゼロから構築すべきか、それとも既製品を購入すべきか。このブランドには明確な答えがあります。今日は、Capital Oneのエグゼクティブ・バイス・プレジデントでエンタープライズデータおよびAI部門の責任者、そしてチーフサイエンティストであるPrem Natarajan氏をお迎えして、同社がどのようにAI戦略を組み立てているかについてお話を伺います。このインタビューはCapital Oneの提供でお送りします。
Prem、お会いできて嬉しいです。番組へようこそ。
Alex、お招きいただき嬉しく思います。
あなたには非常に興味深い経歴があります。AmazonがAlexaを構築した際、まさにその現場におられましたね。その話については後ほど戻りたいと思いますが、あなたは企業がいかに効果的にAI戦略を構築するかを実際に見てこられました。そして今、Capital OneでAIの取り組みを統括されています。冒頭で少し触れましたが、基本的に多くのブランドが、AIを既製品として購入するか自社開発するかという問題、本当に議論を経験しています。そして、あなたには明確な答えがあります。あなたは自社開発を選択されました。それは本当に私を驚かせました。では、なぜ既製のモデルに頼るのではなく、独自のAIスタックを構築することを決めたのか、少しお話しいただけますか。なぜ自社開発なのか、そしてどれだけ投資するかをどのように決定したのでしょうか。
データとAIの統合が生む競争優位性
素晴らしい導入の質問ですね、Alex。私たちの決定は、ほとんどの組織がそうであるように、自分たちの歴史と組織のDNA、そして歴史的に何がうまくいってきたかに根ざしています。Capital Oneでは、ご存知のように非常にテクノロジー重視の銀行です。CEOはよく、私たちを銀行業界にいるテクノロジー企業だと話します。
それを形作ってきたものは何かと言えば、Capital Oneの創業まで遡ります。私たちの遺産は、データと分析によって導かれる意思決定を非常に効果的に活用して、顧客に最高の製品とサービスを提供してきた企業としてのものです。それは私たちが行うことの核心にあります。ですから、このAI革命を見て、AIの完全な恩恵を顧客にもたらすために何が必要かを自問するとき、金融サービスは私たちの生活にとって非常に中心的なものです。
金融は私たちの生活にとって非常に重要であり、したがって金融サービスも非常に重要です。ですから私たちの問いは常に、いかに最高のものを提供するかということです。その観点から見ると、私たちはある意味でCapital Oneの創業時に始まった旅の上に構築していますが、実際にはこの10年余りの間、私たちはこのテクノロジーの旅を続けてきました。
私たちはクラウドに全面的に移行した最初の企業、最初の銀行です。私たちは完全にパブリッククラウド上にあります。それによって最先端のソフトウェアエンジニアリング、最先端の実践などがもたらされます。私たちはこのクラウドの旅の中でデータ変革の旅も続けてきました。私たちのすべてのデータがクラウド上にあるだけでなく、そのデータのキュレーション、ガバナンス、そして品質と完全性に多くの投資をしてきました。これらすべてが、AI世界で成功するための前提条件であることがわかりました。しかし、もう一つあります。
顧客のためにそのすべてを本当に実現するためには、自分たちのデータをモデルに持ち込まなければなりません。それらのモデルの深いカスタマイゼーションができる方法で、そうすることで、提供している製品とサービスのためにそのデータの価値を真に解き放つことができます。
それが私たちを導いてきたもので、過去数年間の多くの経験が私たちが進んでいる道を検証してきました。今のところ、自分たちのデータをモデルに持ち込み、その方法でAIの完全な力を活用することが、私たちの決定を推進してきたということだけ言っておきます。それが私たちの仮説であり、過去数年間に行ってきたことがその仮説を検証してきました。
では、ゼロから構築しているのですか、それとも既製のモデルでこのデータを使用しているのですか。私の印象では、ゼロからの構築だと思っていましたが。
ええ、ええ、ええ。私たちは間違いなくゼロから構築しています。先ほど言ったように、まず私たちはクラウドに全面的に移行しました。ですから基本的にクラウドの上に構築しています。しかしプラットフォームを構築することになると、クラウド上のコアサービスを使用します。
弾力的なコンピューティング、弾力的なストレージ、その他すべて、そして他の多くの基盤サービスですが、その後、それらのコアクラウドサービスの上に私たちのプラットフォームを構築します。ですからAI以前の場合、古典的な機械学習モデルの場合、私たちは会社全体のすべてのモデラーとデータサイエンティストがモデルを構築するための独自のエンタープライズプラットフォームを構築しました。これらのプラットフォームは私たちのデータプラットフォームとソフトウェアプラットフォームのコンテキストで機能し、大規模なモデリングを可能にします。
私たちは同じ考え方をもたらしました。ですから私たちは独自のプラットフォームを構築しました。そのプラットフォームの上に独自の再利用可能なサービスを構築しました。これらの再利用可能なサービスは、会社全体の開発者がAI搭載アプリケーションを構築するために活用できるパターンの両方です。しかし他の重要なこともあります。私たちは銀行です。
私たちはリスク管理を中心的なものとしてリードしています。実際、見てください、このボトルを。私はリスクテックのボトルから水を飲んでいます。ですから、私たちはそれでリードしています。ですからあらゆる種類の観測可能性と監視機能がプラットフォームに組み込まれています。ですから、これらのことを導入した後にどのように管理するかについて人々が抱く懸念の多くは、プラットフォームに入れれば、それらすべてのサービスを通じてスケールすることができます。
ですから私たちはゼロから構築しています。弾力的なコンピューティング、弾力的なストレージ、GPUの上に構築しています。GPUはご存知のように、まだ弾力的ではありません。実際、可用性自体が課題になることがよくあります。しかしそれを超えて、私たちはプラットフォーム層、再利用可能なサービス、再利用可能な機能、開発者向けツール、そして観測可能性と監視機能、ダッシュボードを構築して、リスク管理の専門家が物事が適切に行われていることを確認できるようにしています。
チャットコンシェルジュ:エージェンティックAIの実例
なるほど。では、これを少し掘り下げたいと思います。なぜ既製品を取るのではなく、独自のモデルを開発することが理にかなっているのかを知りたいからです。しかし、これを行うためには、おそらく少し基礎を固めて、実際に何を構築したのかを尋ねる必要があると思います。では、Capital Oneでこれまでに何を構築しましたか。GPUとインフラストラクチャ、モデル、エージェント、アプリケーションなど、スタック全体について話していただけますか。Capital Oneが市場に出している、この生成AI の時代または生成AI技術の上に構築されたものは正確には何ですか。
具体的な例で説明させてください、Alex。ご存知のように、私たちは今、少なくとも一般の認識では、エージェンティックAIの波の中にいます。
エージェンティックAIとは何ですか。
ええ、エージェンティックAIは、少なくとも私たちが見る限り、今日の生成AIにおける最も強力な2つの力を結びつけるものです。
一つは推論の力であり、もう一つは専門化の力です。エージェンティックAIは推論を使用して複雑なワークフローをより単純なタスクに分解し、その後、専門化の力を使用して、それらのより単純なタスクを正確で堅牢で信頼性が高く、効率的な方法で実行します。ですからこれら2つを結びつけることが、本当にエージェンティックAIなのです。
もちろん、エージェンティックには他の側面もあります。単に質問に答えるだけでなく、特定のアクションを実行できるようになるなどです。しかし、これらすべては、推論と専門化という2つの基本的な属性に依存しています。そして、これが示しているのは、専門化の部分が、データをモデルに持ち込むことが非常に重要であるということです。なぜなら、それらはあなたが物事を行う方法の専門家でなければならないからです。
さて、私たちが構築したものという点では、私たちは2024年春にエージェントインフラストラクチャの構築を開始しました。なぜなら、これがエンタープライズ全体で大規模にAIを動員する方法のトレンドになることがすでに見えていたからです。構築を開始したとき、私たちは言いました、特に私たちはまだ非常に初期段階にあり、私が言っていたように、私たちはリスク管理をあらゆる初期探索の中心的な要件としてリードしているので、これで実現できるアプリケーションは何かと。ですから私たちは
Capital Oneの金融サービス事業部門の同僚とのパートナーシップで、このアプリケーションを特定しました。ご存知のように、Capital Oneは国内最大級の、おそらく最大の自動車金融事業の一つを持っています。ですから彼らは金融商品を提供するだけでなく、全国の自動車ディーラーにソフトウェア製品も提供しています。
そのうちの一つが、ユーザーと対話するチャットボットです。私たちは言いました、ああ、これは比較的低リスクですが、相互作用の表面積が高いと。ですからエージェンティックインフラストラクチャとアーキテクチャの力を構築し実証することを可能にし、同時にリスクを管理し調整し、その相互作用から学び、これらのものの動作は何かを言うことを可能にします。
ですから私たちは実際にチャットコンシェルジュと呼ばれるものを構築しました。素晴らしいことに、Capital Oneには物事を横断して協力する文化があります。私が最初に来たとき、私はできるのかと思っていましたが、今では会社全体を動員して物事を実現する自然な本能に完全に触発されています。
ですから私たちはパートナーと非常に密接に協力し、金融サービスの領域で働きました。彼らはこのエージェンティックインフラストラクチャに支えられたアプリケーションを構築しました。チャットコンシェルジュは今、全国の多くのディーラーシップで利用可能です。それが一つの方法ですが、そこから得た一般的な収穫、Alexは、生成AIの問題に見えるものをエージェンティックな問題にキャストすることで、ラボと本番環境の間のギャップを埋めることができたということです。それによって何ができたかというと、アプリケーションに非常に特化した推論の力と、会社に非常に特化した専門化の部分、そして私たちが物事をどのように行いたいかを持ち込むことができました。
では、このチャットコンシェルジュアプリケーションについて少し教えてください。それは、私が自動車ディーラーに入って、本当に好きな車を見つけて、融資の資格があるかどうか疑問に思うということですか。
それでチャットコンシェルジュにアクセスして、私がどれだけ稼いでいるか、どこに住んでいるか、過去に破産したことがあるかなどの属性をたくさん伝えて、そうすればローンの資格があるかどうか、または何をするかを教えてくれるのですか。正確には何をするのですか。
私たちは今日、非常にオンラインの世界に住んでいます、ご存知のように、Alexですよね。ですから私たちの顧客体験は、どこかの場所に入ったときに始まるのではありません。私たちの顧客体験は、ウェブでそのビジネスを検索して、彼らが何を持っているかを見るときに始まります。ですからチャットコンシェルジュはオンラインで始まります、顧客が車を探しているとき、どんな種類の車を探しているかを言うことができます。車は非常に中心的なものです。私がSanjieから学んだことの一つは、彼は私たちの自動車部門を率いる刺激的なリーダーですが、車が人々が米国で完全な経済的で成功した生産的な生活を送ることができるためにいかに中心的であるかということでした。
それは信じられないことです。ですから、人々が車に乗れるようにすることに使命の焦点があると思います。しかし体験はオンラインで始まります。ですから人々はディーラーのウェブサイトに行って、こういう種類の車が欲しいと言います。そして対話して、家族の規模はどれくらいか、どんな種類の旅行をするかなどと言うかもしれません。そしてそのすべての体験が今、チャットコンシェルジュによって前面に出されています。なぜなら、それは実際にあなたのニーズの対話的な理解に関与できるからです。
通常、私たちは古典的なチャットボットのように、顧客の意図は何かということだけを考え、その意図を満たそうとします。私たちは今、あなたのニーズを本当に理解したいというパラダイムにいます。あなたが本当に必要としているものは何か対話しましょう。そこから私たちは、ここにあなたが持っている選択肢があると言い、それからアポイントメントをスケジュールしたいですかと言い、それからある時点で私たちは引き継ぎます。
明らかに、最も満足のいく体験には常にある時点で人間がループに入ります。ですからアイデアは、人々が何を望んでいるかを把握し、ディーラーシップに来る準備ができるように、これを大規模に利用可能にすることです。彼らはすでにその人間との接続を確立しており、それから前進しています。
それがチャットコンシェルジュの実際の姿です。実際、この電話の後、スタッフにチャットコンシェルジュへのリンクを送ってもらいます。あなたのお気に入りのディーラーシップで試してみることができるかもしれません。
明白な質問ですが、なぜ銀行がこれを構築しているのですか。それは、ディーラーがより多くの取引を成立させるのを助けることで、銀行側からのより多くの融資機会につながるからですか。銀行のビジネスの部分はここでどのように機能するのですか。
Alexは、その興味を考えると、ある時点でSanjieと座って、自動車金融ビジネス全体を理解するために話をすべきだと思います。素晴らしいことです。私の仕事の大きな喜びの一つは、ビジネスを前進させるために多くのニーズを持つ多くの事業部門のパートナーがいて、私たちはAIの魔法をどのように持ち込むか、またはそれを実現するために持ち込むかを言うことができることです。
しかし最終的に、私たちは非常に幸せな顧客を持つビジネスをしています。
そうですよね。ですから私が最も気にかけている動機は、提供している製品とサービスに顧客が最も満足できるようにどのように助けているかということです、Alex。各事業部門には独自の具体的なビジネス計画があり、なぜ特定のことに取り組んでいるのかがあります。
しかし、テクノロジーの観点から、私が座っている場所から、私の仕事は、幸せな顧客への執拗な焦点を持って、それらすべての計画を可能な限り最善に実現できるようにすることです。
ええ、それは魅力的です。ですからCapital Oneはある意味で、最終顧客のためのテクノロジーのクリアリングハウスになり、おそらくこれらのアプリケーションを通じて彼らのビジネスを成長させるのを助けます。
あなたは以前、Capital Oneが行うことは、モデルにデータを持ち込んで、これらのモデルの全体的な機能を改善できるようにすることだと述べました。では、人々がディーラーのウェブサイトでチャットして、欲しい車の種類を見つけようとしているこのチャットコンシェルジュの経験に戻りましょう。
Capital Oneが持っているデータは、この経験でどこに関与してくるのですか。
これについては、先ほど言ったように、リスクの表面が比較的小さく、相互作用が大きいアプリケーションから始めました。ユーザーと対話するとき、彼らがどんな種類の質問をするのか、そしてこれらの会話のいくつか、特に歴史的にどこで摩擦があったのか、より柔軟でより有能なパラダイムでそれらにどのように対処するかということです。それが私たちが持っていた一つのデータセットでした。もう一つのデータセットは、もちろん実際の車の在庫とどのようなものが利用可能かなどです。その意味で、これは私たちがこの能力を証明するための最初の橋頭堡だったので、私たちはこれらの両方を持ち込むことができました。
これらすべてには重要な学習の側面もあります、Alex。エンジニアリング環境で何かを構築してから本番環境に持っていくことは、その一つのステップです。私が認識してきたのは、それがAIの天国への階段の最初のステップだということです。多くのアクション、多くの学習は、実際には階段の残りを上っていくことにあります。
本番後の学習は何か、観測可能性と監視ツールは顧客が摩擦を経験しているかもしれない場所について何を教えてくれるか、どのように改善するか。ご想像のように、改善の具体的な数字に通常は踏み込みませんが、本番後の改善はかなり大きいと言えます。それが別の部分です。なぜ自社開発するのか、購入するのかなどについて話しましたよね。
エージェントという言葉の非常に異なる使用法で、企業として、これらすべてを改善するためのエージェンシー、つまり主体性を持ちたいのです。これらの複雑な技術アーキテクチャと製品は、すべてスタックの異なる層が互いに協調して機能することに関するものです。私の考えでは、単にこれをここに持ってくる、これを持ってくる、それらを結びつけてやるという、システム統合の見方を超えています。
25年前、20年前の音声認識と機械翻訳からの非常に古い例を挙げます。私がDARPAの世界に非常に深く関わっていたとき、私の仕事の多くはDARPAプログラムによって支援されていました。一つの見方は、音声認識エンジンを取って、それを使って音声を転写し、その後有能な機械翻訳エンジンを持ってきて、それが音声の出力を取って翻訳するというものでした。
音声認識エンジンと機械翻訳エンジンの語彙が同期していなければ、ギャップで多くを失う可能性があります。または語彙用語の標準化なども同様です。ですから多くの精度を失います。同じことです。今、スタックに非常に多くの層がある規模に拡大してください。
それらすべてが同じオーケストラの楽譜を演奏していなければ、完全に調和した、心地よいオーケストラアレンジメントのようなものを作成することは非常に困難です。だからこそ本当に構築する必要があるのです。これらすべてが今、非常に多くの相互作用と最適化、全体を通じた共同最適化を必要とするからです。この本番後の改善は、実際にその例です。観察する特定のクラスの摩擦に対処するために、スタックのどの部分を改善する必要があるか正確にはわからないからです。しかしスタックのどの部分でも変更できることは、プロダクトマネージャー、エンジニア、科学者にとって非常に解放的で力を与えるものです。なぜなら誰もが今、製品と体験を改善するために動員できるからです。
そうですね。
顧客体験の向上とエンタープライズAIの展開
さて、これが橋頭堡だと述べられましたね。では、海岸はどんな感じか少し話してください。野心は何ですか。これがうまくいけば、次に来るものは何ですか。
野心ですね。次に来るものは、本当にゆっくりと着実に、リスクを通じた斜面です。私たちの野心はもちろん、これを幅広いアプリケーション領域全体でできるだけ広く効果的に使用することです。
しかし、これらのことに関する私たちの最初の野心は、顧客に最高のサービスを提供するために、いかに私たちの従業員に力を与えるかということです。例えば、最初のアプリケーションの一つは、実際に2023年に開発を始めた最初のアプリケーションは、エージェント支援でした。私たちは日常的に多くの顧客サービスのやり取りがあります。ご存知のように、電話をかけるといつも少し待ち時間がありますよね。
コールセンターに電話をかけて、エージェントを待っていて、電話を取る人間のエージェントは、あなたが待っていたこと、そして迅速で正確な答えに対する高まった期待の状態にあることを非常に認識しています。しかし彼らは、その時点で持っているシステムを扱って答えを見つけなければなりません。
時には答えが複数の異なるソースから来ることもあります。彼らは答えを統合してあなたに伝えなければなりません。そして私たち顧客は、ご存知のように、イライラしていて、早く答えが欲しいのです。したがって、その時点で人間のエージェントの認知的負担を軽減するAIシステムを構築できれば、顧客への迅速で正確な応答につながるだけでなく、顧客との対話の最前線にいる人間のエージェントの生活体験も大幅に改善します。
ですから、開始時に特定の方法で機能する初期バージョンを構築しましたが、これらの問題をエージェンティックな問題としてキャストすることが、どれだけ多くの力を私たちに与えているかを見ると、私たちはすでに人間のエージェントのためのそれらのパフォーマンスを改善できる方法を見始めています。もう一つの例はソフトウェアでしょう。私たちのソフトウェア開発者は、言ったように、私たちは心からテクノロジー企業です。
すでに生成AIから恩恵を受けていますが、それは私たちの仕事のもう一つの大きな柱になるでしょう。私たちは、アイデアと願望がしばしば限られた時間内にそれらを実行し提供する能力を超える世界に住んでいます。ですから、これらすべてのことが、私たちが物事を開発し提供できる速度を解き放つことに非常に興奮しています、そして再び、顧客に対してです。
そして、これは私たち一人一人に影響を与えると思います。私は常にAIの高貴な目的の一つは、人間がその負担を最も重く感じるときに、認知的負担を人間からシステムに移すことだと感じてきました。AIについて考えれば考えるほど、今後数年間は、そのAIの力をCapital Oneのすべての従業員にもたらすことで、本当に素晴らしい経験をすることになると思います。
間違いなく。では、ここでのアーキテクチャについてもう少し話しましょう。これについてもう一度確認したいと思います。構築してきたこの体験を構築できるようにするために、オープンソースから始めて、それをカスタマイズし、データを持ち込みました。
AIラボのリーダー、例えばAnthropicのDarioなどとの会話で、彼が言ったことの一つは、ある意味でオープンソースを反映し始めているということです。つまり、カスタマイゼーションが可能で、データを持ち込むことが、既製のモデルで可能になっているということです。つまりAnthropicのClaudeです。
では、なぜオープンソースを使ってカスタマイズするのですか。それは単により大きな制御だけですか、それとも何を得られるのですか。
ええ、より大きな制御と言うとき、私たちは実際により大きなパフォーマンス改善能力について話しています。その意味での制御のための制御ではありません。本当にパフォーマンスについてです。
それについて話しましょう。
チャットコンシェルジュに少し戻りましょう。チャットコンシェルジュのようなものが通過する異なるステップは何でしょうか。単純なやり取りでも、ユーザーとニーズを確認したいです。その後、作業する予定の計画をシミュレートしたいです。その計画を検証して、正しいことを確認したいなどです。これらの各ステップは、ステップの実行を改善するために必要なデータと、推論能力とユーザーとの対話の組み合わせです。
ビジネスはそれをどのように実行したいのでしょうか。これらのことが起こったら、ループ内の人間、つまり私の従業員にこれを送りたいという特定のことがあるかもしれません。他の人々は異なることを持っているかもしれません。ですからUXとパフォーマンス自体の両方のかなりのカスタマイゼーションがあります。このコンテキストで、私たちが最も気にかけていることは何でしょうか。私たちが最も気にかけていることの一つは、速度またはレイテンシーです。あなたがお気に入りのホームアシスタントを使用していることからこれを知っているでしょう。応答に3秒かかる場合、2秒かかる場合よりもはるかに満足度が低く、1秒かかる場合よりもはるかに満足度が低いです。私たちはその対話の速度が好きです、そしてそれは顧客満足の大きな推進力です。
ですから、これらのことの速度を改善したい場合、蒸留のようなことをして、これらのモデルを作る必要があります。専門化のもう一つの利点は、モデルのサイズに対して同じパフォーマンスを提供するために、モデルをはるかにコンパクトにできることです。なぜなら今、それらは専門化されているからです。つまり、はるかに速く実行できるということです。つまり、全体として、効率性を得るだけでなく、従業員または顧客にとってはるかに満足のいく体験も得られます。
これらの種類のことは、今のところ、少なくとも私たちが発見していることは、私たちが唯一発見しているとは思いませんが、私たちが発見していることは、オープンソースモデルに基づいて、その後、これらのモデルに非常に深いカスタマイゼーションでデータを持ち込み、その後、その完全な利点を得ることによって、はるかに実行可能だということです。例えばソフトウェア開発のような領域があるでしょう。世界中でどのように実践されているかという点で、非常に水平的な側面があります。
少なくとも今のところ、そのようなソフトウェア環境のコンテキストをもたらすものなどの他のアプローチが、これらの他のアプローチのように、私たちが持ち込むものは、おそらくソフトウェア環境のコンテキストなどです。少なくとも今のところ、特定のタスクについて、コンテキストなどを消費する驚くべき能力を持つこれらのクローズドソースモデルのいくつかは、多くの価値を提供し続けると思います。それは、相互作用しているすべての領域に入ると、Alex、ほぼすべてのパラダイムが貢献する余地があると思います。しかし私たちの領域で発見していることは、
オープンソース上に構築し、データをモデルに非常に近づけることなどが、多くの場合に購入するのではなく構築する理由の違いを生み出しているということです。真空中でそれを行うわけではありません。
何かを行う最良の方法は何かを常に探しており、今のところ、すべての実験はこの方向を指しています。
好むオープンソースモデルはありますか。
いいえ。実際には、アプリケーションに応じて複数を使用しています。繰り返しますが、このベンチマークを行っています。
ですから、これらのモデルを見て、異なるクラスのアプリケーションに対して最良のトレードオフを提供するモデルはどれかを見ています。同時に、すべてのモデルがサポートされる場所にはなりません。しかし、複数のオープンソースモデルから大いに借りています。
魅力的です。つまり、Mr.に来てもらってスタジオに入ってもらおうとしていて、考えていることの一つは、DeepSeekの瞬間が起こったときのことです。それは、オープンソースがクローズドソースモデルを超えていなかったが、人々が本当に真剣に受け止め始める地点まで追いついたように見えました。その時、人々が私に言っていたことは、OpenAIが独自に取り組み、Anthropicが独自に取り組むのではなく、オープンソースのコミュニティ全体が効果的に協力して、お互いの革新の上に構築していくということでした。そして彼らはすぐにクローズドモデルを超えるだろうと。
それがまだ起こったかどうかはわかりませんし、オープンソースの状態について、あなたの視点を聞きたいです。なぜなら、これを考えていると、まあ、DeepSeekは2025年の初めに起こりました。私たちは今、ここの終わりにいて、競争がどのように見えるか気になります。
ええ、進行中のレースは一つ以上あると思います。
Alex、その一部は、私たちがすべて一つのレースであることを望んでいることだと思います。いくつかのベンチマークで最高のモデルのようなものです。しかしご存知のように、これらのモデルのパフォーマンスを測定するために使用されてきた、ある意味で使用され続けているベンチマークでさえ、それ自体が疑問視されています。なぜなら、これらのモデルを開発している人々でさえ、これらのベンチマークで改善するのを見て、それを出して、現実世界は「まあ」という感じだからです。それは違いだったのかと。レースがあるときはいつでも、私たちの実世界の体験の認識と相関する非常に明確なメトリックがなければ、進歩を判断するのは難しいです。
私たちが参加しているレースは、最高のエンタープライズAIソリューションを構築することです。それによって最も有能なエンタープライズAI製品とサービスが可能になり、その後、従業員と顧客に提供されます。
ですからその観点から見ると、もはやモデルだけの問題ではありません。スタック全体の問題です。これを聞いたことがあるでしょう。解き放たれる価値の多くは、適切な時に適切なコンテキストを消費する能力からも来ています。だからこそ、これらすべてのプロトコルなどの出現も見ているわけです。
しかし、モデルに適切なコンテキストをもたらす最良の方法の一つは、実際にはモデルの深いカスタマイゼーションを行うことです。すべてのコンテキストが動的であるわけではありません。
多くのコンテキストは、はるかに遅い速度で変化します。そのコンテキストがモデルに焼き込まれることで、モデルは最初からはるかに有能になります。
その後、動的なエンタープライズコンテンツをそれに持ち込むと、すでに誰かがいます。それは本当にAlexのようなものです、特定の会社、Capital Oneで一定期間働いている誰かが、新しいタスクを行わなければならないとき、彼らは物事がどのように機能するか、私たちが働くかもしれないスタイルなどについて多くを学んでいます。
そして彼らはそれを新しいコンテキストに持ち込み、はるかに有能です。私たちがこれをどのように見ているかという点で、それと大きく変わらないのは、モデルが私たちのデータとどのように物事を行うか、多くの異なることで深くカスタマイズされているとき、そして過去にモデルで見てきたのは、同じモデルをより多くのタスクを行うように訓練すると、あらゆるタスクでより良くなることがわかります。ある意味で、それは興味深いことです。ここでも同じで、より多くをカスタマイズし、より多くのタスクを行うように訓練すると、Capital Oneについてますます学んでいくようになり、その後、新しいコンテキストをそれに持ち込みます。
ですからその意味で、私たちは完全なスタックを取ります。モデルは非常に重要で、そのスタックの基盤的な要素です。しかし、それらはそのスタックの唯一の要素ではありません。
AIパイロットの成功要因と将来展望
ああ、なるほど。それは非常に理にかなっています。よし、あといくつか質問があります。
AIパイロットについてです。いくつか実行されていて、うまくいくかどうかの割合については議論があります。つまり、95%が失敗すると言ったMITの研究がありました。私はそれを完全には信じていません。
しかし、パイロットの大多数が本番環境に出ないというアイデアは、私が聞いたことという点で確かに共鳴します。では、AIパイロットが本番環境に出るのを助けるものは何ですか。そこに到達すると収益性が高くなるものは何ですか、成功させるものは何ですか。
ええ、一つの見方は、まず最初に言っておきますが、それは私たちの経験と一致していません。
しかし、私たちの歴史に戻ると、私たちはテクノロジーに投資してきましたが、特に機械学習の複数世代を通じてAIと機械学習に投資してきました。それを通じて、どのユースケースが追求する価値があるかを事前に判断する方法、何がより多くの開発を必要とするかなどについて、特定のアプローチ、方法論、実践を学びます。
ですから、成功の確率は、何かに関与するために行った準備によって条件付けられていると思います。それは、あなたが知っている、成長して十分な量のストリートクリケットをプレイしてきたが、それは私をアメリカンフットボールに本当に準備させてくれなかったようなものです。
わかりました。
ええ。少し違うスポーツです。
そうですね。そう言えます。ええ、ゲームが大好きです。プレイするのが大好きです。しかしフットボールに入ると、ルールは何か、何を知っているかなどとなります。同じ意味で、どれくらいこの世界に準備してきたか、プロセスはどのようなものか、持っている才能は何かということです。これはある意味で非常に360度のゲームです。非常に多分野のゲームです。素晴らしい製品マネージャーが必要です。
素晴らしいエンジニアが必要です。素晴らしい科学者が必要です。素晴らしいビジネス思考家が必要です。素晴らしいリスク管理の人々が必要です。彼らは単にリスクを理解しているだけでなく、新しいことも学んでいて、この新興分野にリスクの経験をどのように適用するかを言っています。私たちはこれらすべてのことを横断する才能のコレクションに恵まれており、それが私たちを可能にしています。
ですから、それはある意味で特権的な立場に住んでいることを認識しています。しかしそれをすべて認めた上で、私はまだ言います、私たちの経験は、適切な思考プロセスに従うとき、ユースケースを浮上させ、それらのユースケースを開発する準備状況を分析し、途中で多くの資格ステップがあり、構成要素間で信頼に依存する率直な会話を持つ必要があると言えば、私たちは発見します。あなたが話しているその研究とは、私たちの経験からできるだけ離れたものです。
しかし、本当にそれは、取り組むための準備についてだと思います。ゲームに、いわば。
ええ。よし、最後の質問です。冒頭で述べたように、Amazon Alexaの現場にまさに最初からいらっしゃいました。
そこから今日のAIまで見てきたのはどんな感じか、そしてどこに向かっていると思うか、少し教えてください。
ええ。Alex、よければ、もう一歩下がりたいと思います。
どうぞ。
なぜなら、DARPAとそれが数十年の存在を通じて支援してきたコミュニティの途方もない貢献を認識しなければならないと思うからです。AIと機械学習における基礎的な研究のほぼすべて、その巨大な部分がDARPAの支援で起こってきたからです。ですから私は、DARPAから恩恵を受けた世界で人生の多くを過ごしてきたので、それを認めたいと思います。音声認識、機械翻訳、さらにAIであっても、DARPAは他の人々が話す前に説明可能なAIに投資していました。DARPAは他の人々の前に信頼できるAIについて話していました。ですからその部分を認識すべきだと思います。
しかし私が見てきた傾向として、特にAlexaでの仕事がある種それを新しいレベルに引き上げたと思うのは、私たちがこれらすべてのコンポーネント技術を一度に一つずつ構築し、特定のアプリケーションでそれらを組み合わせようとしていたことです。しかし、それが一度に全員の家庭で小売体験に入り、大人だけでなく子供も対話できる消費者AIのようになった規模、それがその時に起こった魔法の変革でした。
つまり、私の娘たちが友達を連れてきて、この曲をかけて、あの曲をかけて、この曲に変更できるという競争があるなどと言っているのを見ていました。それが作り出した、環境に話しかけることができる、それが私に返事をする、または応答するという感覚、それが私にとって本当の魔法でした。DARPA世界での素晴らしい時間を過ごしました。実際、私は南カリフォルニア大学にいたこともあります。
そこでも素晴らしい素晴らしい学習体験がありました。そして今、AmazonそしてCapital Oneです。これらの経験のそれぞれが、それぞれの方法で非常に満足のいくものでした。そしてAlex、私は言わなければなりません、AIと金融の未来を変えることに貢献したいなら、金融自体を変えたいなら、そして金融における世界最高のAI組織の一員になりたいなら、ぜひ参加してください。
わかりました。では、人々がCapital OneのAIの取り組みについてもっと学んだり、実際に取り組みに参加することを決めたりすることに興味がある場合、どこに行けばいいですか。
私たちの多くのAI作業について話すかなりしっかりしたウェブサイトプレゼンスを維持しています。ですから、AIブログとウェブサイトのAI部分に行くことをお勧めします。
非常に簡単なGoogle検索を行ってください。ウェブサイトのURLは変わる可能性があるからです。単純に検索をしてください、ウェブ検索でCapital One AIと言えば、私たちの多くの作業が見えます。そして何か質問があれば、そこに連絡先情報があります。連絡してください。そして常にLinkedInがあります。
そうですね。さて、Prem、魅力的な内容でした。ゼロから構築してきた範囲を見るのは驚くべきことで、特に既製品を購入するのではなく、なぜその道を選んだのかを具体的に説明してくれたことは、私にとって非常に魅力的でした。これを行うには多くの方法がありますが、あなたの道を見るのは本当に興味深いと思います。そして、今後何が控えているかについてもっと学ぶのを楽しみにしています。改めてありがとうございました。
いいえ、ありがとうございます、Alex。多くの示唆に富む質問があり、このやり取りを楽しみました。
ええ、同様です。よし、皆さん。Premに感謝します。皆さん、視聴していただきありがとうございます。すぐにフィードに別のビデオで戻ってきます。改めてありがとうございました。次回またお会いしましょう。


コメント