データを正しく扱うことがAIプロジェクト成功の鍵となる理由――チャールズ・サンズベリーと語る

AIエージェント
この記事は約23分で読めます。

ClouderaのCEOであるチャールズ・サンズベリーが、AIプロジェクトで真の経済価値を生み出すためにはデータの適切な管理が鍵となることを解説する。ドットコムバブル期にモルガン・スタンレーでテクノロジー投資銀行業務の責任者を務めた経験を持つ彼は、現在のAIブームを過去のバブルと比較しながら、企業が直面する課題を語る。96%の企業がAIを試行しているものの、わずか9%しか必要なデータに完全にアクセスできていない現状において、データの品質と整備こそがAI活用の成否を分けると強調する。大手金融機関での不正検知システムの成功事例を通じて、適切なデータ管理と人間の判断を組み合わせたAI活用の実例を示し、企業がどのようにしてAIから真の価値を引き出せるかを明らかにする。

Why Getting Data Right Could Be The Key To Effective AI Projects — With Charles Sansbury
Charles Sansbury is the Chief Executive Officer at Cloudera. Sandsbury joins our show to talk about the fundamentals of ...

ClouderaのCEOが語るAIの経済的価値

AIが真の経済的価値を提供するには何が必要なのでしょうか。ClouderaのCEOであるチャールズ・サンズベリーさんと話をしましょう。チャールズさんはスタジオにお越しいただいています。この動画はClouderaの提供でお送りします。チャールズさん、お会いできて嬉しいです。お元気ですか。

お会いできて嬉しいです。お招きいただきありがとうございます。

お越しいただきありがとうございます。この番組では人工知能の経済的価値についてずっと話してきました。このテクノロジーに投資収益率があるのかどうかということです。今日あなたとお話しできることをとても嬉しく思っています。なぜならあなたは魅力的な経歴をお持ちだからです。あなたは1996年から2000年までモルガン・スタンレーでテクノロジー投資銀行業務の主任、テクノロジー投資銀行業務の責任者でしたね。

その通りです。

つまりあなたは過去のテクノロジーへの熱狂、ドットコムの瞬間を目撃してきたわけです。それは今の瞬間とどう比較されますか。

さらに良いことに、私は2000年に退職して実際にドットコムの寵児の一つだった企業に入社したんです。だから私はアドバイザーとしても当事者としても両方を経験しました。

どんな会社ですか。

ヴィネットコーポレーションという会社です。ウェブコンテンツ管理システムの元祖メーカーですね。複雑なウェブサイトを構築するなら、ヴィネットに行ってソフトウェアを買ったんです。当時までで史上最速で成長したソフトウェア会社でした。需要があったため、1998年の売上高1800万ドルから99年には約9600万ドル、2000年には4億ドル近くまで成長しました。そして軌道が変わったんです。

ドットコムバブルと現在のAIブームの比較

当時見たことと今日について少し話してください。同じことでしょうか。人々はこれも別のバブルだと言っています。私にとってそれは、私がその瞬間にいたとき、機会への熱狂がありましたが、私たちが実際に言っていたのは、その時点であらゆるアイデアに資金が提供され、市場は資金提供においてアイデアと良いアイデアを区別していなかったということです。

そのため金融投資家は初期段階ですべてに賭けることで報酬を得ていました。つまり彼らの解決策は、もし私が声に出して計算するなら、私たちはルーレットをしていて配当は100対1で、33のスポットがある。だから全てのスポットにお金を置きましょうということでした。負けもあるでしょうが、勝者がそれを補うでしょうと。

時間が経つにつれて、見極めることがより重要になりました。その時点で、ビジネスのいくつかの壮大な失敗が見られました。ウェブバンという会社があって、ショッピング体験を自動化しようとしていました。彼らは自動化されたショッピング体験の構築に6億ドルか7億ドルを費やしました。結局、買い物の方法は棚から物を取って入れることだとわかったんです。

今から15年後、人間が実際に仕事をすることで、ロボットではなく、宅配サービスのようなものが実現しました。でも振り返ってみると、明らかであるべきだったと言えます。その瞬間には、意味がないと言える特定のアイデアがありました。しかし一般的にはほとんどのビジネスにビジネス価値が付いていました。

だから今もおそらく同じことが当てはまると思いますが、違うのは金融面での金額がはるかに大きくなったことです。1998年のソフトウェアスタートアップに資金を提供するベンチャーキャピタルラウンドを考えると、最初のラウンドは2000万ドルで、営業部隊を構築するには4000万ドルか5000万ドルで、それらは天文学的な金額でした。今何が違うかというと、これらの市場で関連性を持つために必要な金額が、私たちがこれまでに見たことのないものを超えているということです。

最近読んだ記事には、AI業界のリーダーたちと彼らが必要とする資金について、その記事はやや挑発的でしたが、私たちの金融システムにとってシステミックリスクだと書かれていました。しかし考えてみれば、私たちは今、ハードウェア、電力、発電を購入するために非常に多くのお金を費やしています。そして私たちには分からないんです。ただ私が言えるのは、最終目標と成果は、インターネットでビーチボールやビーチボールドットコム、靴下を売るよりも具体的だということです。

だから私は具体的だと思います。確かにこれらの投資で失われるお金はたくさんあるでしょう。しかし実際に起こることは違うと思います。成功しない企業がたくさん出てくるでしょうが、ごく少数が大成功を収め、利益が損失を上回るでしょう。しかし利益は非常に少数の勝者に集中するでしょう。それが私が見ている最終結果です。

あなたの話を聞いていると、いくつかのパターンが浮かび上がってきますね。そうですね。いくつかの比較と対比があります。たとえばドットコムブームでは、資金は多くの企業に分散されていて、アイデアがあれば資金が得られました。今ははるかに集中しています。

でも違いは、OpenAIのように400億ドルの投資を受けている企業や、Nvidiaと発表したばかりの1000億ドルの投資を受けている企業の場合、人々が実際に彼らの製品を使っているということです。それはまるでドットコム時代にいるけれど、みんなが一人の、一つの企業から注文しているようなものです。

その通りです。あなたには魅力的な調査が出たばかりです。ClouderaはエンタープライズAIとデータアーキテクチャの現状を調査し、IT責任者に生成AIを使っているか、AIを使っているかと尋ねました。まず生成AIの前にAIについて話しています。96%がイエスと答えました。

はい。

その意味は何でしょうか。

企業のAI採用における課題

二つの要素があります。一つは、企業IT内でAIを使用していることを示すための競争があると思います。なぜなら、コード品質を改善した、顧客からの電話への対応能力を改善したといった、非常に注目度の高い成功事例に多くの焦点が当てられてきたからです。これらの成果は本物です。しかしもう一つ起こっていることは、96%の企業がAIを試しているのに対し、約30%のIT組織しか自分たちのしていることを承認していないということです。

つまりビジネスはITガバナンス、ITルール、IT構造を先行しているということです。つまり今、ある種の無法地帯が起こっていて、ビジネスユーザー、IT以外の人がAIイニシアチブを推進しているんです。なぜなら彼または彼女は上司からこのテクノロジーの価値を示せと押されているからです。

コード補完やコンテンツ生成、顧客サポート駆動型アプリケーションに関する初期の成功事例は非常に現実的で簡単に得られます。問題はそれではなく、次に何が起こるか、そしてAIのキラーアプリとは何かということだと思います。私たちはこれについて息を切らして話し、私も興奮しますが、これはまだ約2年半しか経っていないんです。だからそれが進んでいるペースを考えると、どのアプリケーションが企業にとってのゲームチェンジャーになるかについては、まだ非常に初期段階にあると思います。

私たちがチームに内部的に言ったのは、ビジネス全体のあらゆる機能でAIの使用を考えてほしいということです。法務の観点からは非常に分かりやすいです。マーケティングからも非常に分かりやすいです。財務、運用、そして明らかにソフトウェア開発です。

しかし実際にはソフトウェア開発者たちは私たちより先を行っていました。IT部門が使用する特定のツールセットを承認する前に、彼らはすでに私たちの環境でいくつかのコード補完ツールを使っていたんです。これはビジネスがITよりも速く動いているという事実を示しています。

大規模な採用、真のビジネス価値がありますが、テクノロジーはテクノロジーの採用を制御しようとしている人々よりも速く動いています。それが今日ニューヨークでのイベントで私たちが聞いている緊張感です。

では質問させてください。これらすべての部門はITを通す必要があるのでしょうか。たとえばマーケティング、コンテンツ生成にAIを使用しているマーケティングは、ITを通す必要があるのでしょうか。ある状況ではITが関与している方が成功すると思いますが、バランスはどこにあるのでしょうか。

特に生成AIから自律エージェントが人間に確認せずにシステムを通過して作業を行うエージェント型AIに移行する際の懸念です。私たちがまだ対処できていないリスクを生み出すと思います。

今日、私たちのカンファレンスで発表していた方の一人と会話をしていたのですが、その人は大規模なグローバル金融サービス組織のITガバナンスを担当しています。その人が言うには、現在ビジネスはITベースのガバナンスと規制に反発していますが、実際にそれが導入されれば、ガバナンスは妨げではなく加速要因になるということです。承認されたツールとプロセスのセットがあれば、ビジネス部門がそれを展開できるようにすることができるからです。

しかし私は個人的に、そしてガバナンスモデルの観点から、企業インフラ内部に展開されるテクノロジーに対する何らかの監視がないことに非常に不快感を覚えます。それが私の懸念であり、組織内には私が過度に慎重だと考える人がいることも知っています。しかしそれが私の考え方です。

でもこれは効果性の問題でもあります。つまり、私はこれをあなたに提案したいと思います。多くの組織は、人々が業務でChatGPTを使用している際にある程度の価値を得ています。

はい。

しかし業務の仕方を変えることになると、そこでガバナンスが必要になり、賛同が必要になるんです。あなたの調査は魅力的です。調査からの直接の引用ですが、非常に印象的なことがありました。回答者のわずか9%が、すべてのデータが利用可能だと答えました。そして38%だけが、組織のデータのほとんどが利用可能だと答えました。つまり事実上、データで動くこのテクノロジーがあるのに、わずか9%の人しかアクセスできていないんです。

何が起こっているのでしょうか。

データの品質がAI成功の鍵

Clouderaの宣伝をすると、それが私たちが話してきた価値提案であり、私たちの新製品が対処するために設計されたものです。しかし大きく一歩下がると、AIが動作するために必要なのは、加速されたコンピューティングと高品質なデータです。

加速されたコンピューティングとモデルは展開されていますが、大企業のデータ資産は、引き出しやフォーラムに物が押し込まれた埃っぽい古いクローゼットのようなものです。人々が集まってそれについて話すとき、人々はある種恥ずかしがっていますが、実際にはみんなが同じ問題を抱えていることが分かります。

私たちのさまざまなエンタープライズアプリケーション全体に、クリーンで原始的なデータのセットを持っていないんです。しかしAI、AIイニシアチブは展開されているため、データの品質を維持または向上させるために非常に迅速に動いています。私たちの見解は、答えはすべてのデータを取ってクラウドに移動することではないということです。そうすればこれらのクラウドベースのモデル上で非常にきちんと実行できますが、そうすると長年にわたって構築してきた企業コンテキストのコントロールを失うことになります。

顧客との取引、あなたが持っている独自の洞察です。しかしデータを整えてAIが一か所に配置できるように1年か2年待つこともできません。基本的にモデルをそのデータに持ってくることができるように。

だから私たちがしようとしていること、実際にしていることは、研究開発と私たちの新しい、基本的に私たちの製品の新しい反復の組み合わせを通じて、顧客にオーケストレーションレイヤーを作成する能力を提供しようとしています。これはClouderapや他のアプリケーションデータストアであろうと、オンプレミスの両方を重ね合わせ、クラウドベースのアプリケーションとハイパースケーラーベースのデータも重ね合わせます。基本的に、すべてを一か所に移動することなく、これらのコンポーネント部品に基づいて効果的にオープンデータレイクを作成できるんです。

また私たちはデータラングリング、つまりデータクレンジングと呼ばれることもできます。基本的にゼロから再構築することなく、一か所にデータのプールを持つことができるんです。つまりこれは、高品質なデータのセット上ではるかに迅速に立ち上げて実行できるということです。そしてこれは私たちが話してきた問題に対処します。つまり、AIが良いデータ上に構築されていて、あなたのデータが良くない場合、展開するモデルから質の高い答えが得られないということです。

金融機関での成功事例

これがすべてうまくいったときの例を挙げていただけますか。

実は本当に興味深い例があります。顧客の一人が数日前に教えてくれました。大規模なグローバル金融サービス機関で、米国以外を拠点としています。彼らは世界中で発生する取引を持っていて、規制された銀行として、グローバルな顧客確認とマネーロンダリング防止規則に従って、疑わしいとフラグが立てられた顧客を評価しなければなりません。

もともと、そして彼らは、そしてこれは買収を通じて一緒になった銀行です。彼らは地域Aで買収したビジネスを持っていて、異なるシステム上で異なるリポジトリを持っています。そして彼らが持っているシステムは証券取引システム、現金自動預け払い機システムなどで、これらはすべて、時間の経過とともにすべて別々だったため、緊密に統合されていません。

基本的に、フラグが立てられた問題があり、人間に調査させる必要があります。彼らのクレジットカード取引は何だったか。彼らは飛行機のチケットを買ってこの場所に行ったのか。そして日常的にこのような問題を調べるには、1000人がフルタイムの仕事をする必要がありました。

そして今、彼らはエージェントを作成しました。基本的にインシデントが発生すると、このエージェントが調べに行き、このエージェントに基づいてスコアを付けます。ああ、なんということだ、マルタで現金預金があった。それは非常に奇妙だ。彼らはマルタにいたことがあるのか。ええ、実際に。

彼らはマルタへの飛行機のチケットを買い、実際にマルタのスターバックスでコーヒーを買った。だからそれは理にかなっています。一方、理にかなっていない場合は異なるスコアが付けられます。そうして彼らは基本的にこれらのインシデントのスコアリングシステムを作成し、線を引くことができることを発見しました。たとえばスコアが100点満点中40点だとすると、40点以下のすべては問題なしということです。

そして40点を超えると、上位10%が不正である可能性が高いことが分かります。だから彼らは人間の調査員をすでにエージェントによって作成されたデータファイルと共に配置し、これらのケースをより迅速に解決できるようにしています。

これにより彼らは基本的に1000人のチームを取り、それらの人々の大部分を銀行内の他の機能に再配置することができました。

つまりこれは数千万ドルの節約であり、より効率的なプロセスであり、マルタでたまたまスターバックスを買って現金預金をしたためにクレジットカードを切られる顧客にとってもより良いことです。彼らが私に説明してくれたとき、私はそれは完全に理にかなっていると思いました。

しかし生成AIだけでなくエージェント型テクノロジーの出現なしには本当に可能ではありませんでした。だからこれは初期のユースケースだと思いますが、ビジネスプロセスを再考し、それらのビジネスプロセス上にテクノロジーを重ね合わせる人々のたくさんの事例を見ています。これはまさに桁違いに良い結果をもたらすでしょう。

それはかなりエキサイティングなユースケースだと思います。それについていくつか質問させてください。彼らは今日それができています。彼らは数か月間本番環境でそれをしてきました。そして彼らはボットを信頼しています。

彼らはボットを信頼しています。明らかにたくさんの反復テストがありましたが、異なる質問は、魔法は正しい位置に線を引くことです。どの時点で人間を関与させるかということです。私たちが話をしてきた多くのAI戦略家が言ってきたことの一つだと思います。人間を関与させる異なる時点がある異なる状況があります。医療関連のことがあればX線画像の読影などでは人間がかなり早く関与します。今日私たちのほとんどの取引所で起こっている自動取引を考えてみてください。人間はそれには関与しません。

だから自動取引から医療までのその階層のどこかに、人間のための異なるレベルの関与があります。そして今述べたことの芸術は、彼らが人間を関与させる時点を決めることで線を引く場所を決めたということだと思います。これは本当に私たちが直面しようとしている複雑な問題の一つだと思います。つまり、これらのプロセスの多くにおいてある時点で、私たちは人間を関与させたいと思うでしょうし、何らかの形で結果に責任を持つ人間が必要になるでしょう。

だから誰かがそれについて心配します。これらのエージェントを野放しにして何が起こるか見るのとは対照的に。

そうですね。そしてそれは興味深いことです。なぜなら、もし私が正しく理解していれば、大規模言語モデルを使用しているからです。

はい。

これらすべての入力を取って意味を理解するために。しかし良いデータ上で動作しているため、実際に論理的な結論を導き出すことができるんですよね。

プライベートAIとデータ主権

ええ、そしてそこで重要なもう一つのことは、プライベートAIの概念について話すことです。プライベートAIは基本的に、事前学習されたモデルを購入し、いくらかのファインチューニングを行いますが、独自のデータでファインチューニングを行います。プライベートの概念は、基本的に独自のデータと企業コンテキストを、そのデータがセキュリティ境界の外に漏れることなく、最適な効果でモデルに情報を提供する方法で使用することです。

だから最も機密性の高いデータを外部に置きたくないんです。そしてこの点が示すもう一つのことは、彼らが内部的にこれをシステム上で行ったということです。なぜなら彼らは必ずしも、特定の取引と顧客に関するすべての情報を、完全な指揮統制権がないどこかのリポジトリやビークルに置きたくないからです。

そしてそれは運用上の懸念でもありますが、これはまた彼らが巨大なデータ主権の懸念を持っている場所でもあります。そしてこれらは顧客がデータセキュリティ、データプライバシー、そして最終的にはデータ主権についてどう考えるかという点で、ますます影響を与えるようになっています。

人間が関与することが理にかなう線は時間とともに上がり続けると思いますか、それともこれくらいが良いところなのでしょうか。

私が使う大規模言語モデルの改善が示すものだとすれば、線は上がり続けるでしょう。テクノロジーは非常に速く反復され、私が思っていたよりもはるかに速く良くなっています。

AIの投資収益率について

あなたは研究を見たことがあると思います。たとえばMITの研究で、番組でたくさん話してきた、どこでも引用されている95%の研究です。

その通りです。

95%の企業がAIで投資収益率を得ていない。これはAIで投資収益率を得ている企業のかなり明確なケースのようです。

はい。

あなたはそれらの数字を信じますか。その研究をどう読むべきでしょうか。

多くのことが試みられてすぐに失敗していると思います。そして今ビジネスユーザーにとって、重要なユースケースを特定することは非常に難しいと思います。その例として、テクノロジーへの習熟だけでなく、ビジネスへの深い理解も必要だということです。歴史的に、私たちのIT担当者の多くはビジネスの専門家ではなく、ビジネス担当者の多くはITの専門家ではありませんでした。

だから今、それら二つを組み合わせるにはかなりユニークな個人が必要だと思います。そして多くのユースケースは、テクノロジー経験があまりないビジネスユーザーや、ビジネス経験があまりないITユーザーによって推進されていると思います。何かをしなければという緊急性によって推進されているんです。それが今私たちが見ているものだと思います。何かをしなければならないから、プロトタイプを実行しようということです。経営陣への報告が3つのプロトタイプを実行して失敗したというものであっても、それは何もしなかったよりはまだ良いんです。

そうですね。CEOのところに行って「AIの戦略がありません」とは言えません。

何もしないという選択肢はないんです。

まさにその通りです。

分かりました。CEOといえば、CEOへの質問をさせてください。ええと、もし部屋にCEOがいれば、彼または彼女に尋ねることができるでしょう。

私はちょうどGoogleで検索を担当している人々やそこのいくつかの製品と話していました。そして私は言いました。見てください、AIは多くの可能性を持つ製品ですが、どこに投資すべきか知ることは本当に難しいです。なぜならうまくいっている日もあれば、うまくいっていない日もあります。意味をなすユースケースもあれば、意味をなさないユースケースもあります。

だからあなたが座っている場所から、あなたの視点を聞きたいのですが、Clouderaはどこに進むか、どこに進まないかをどう決定しているのでしょうか。なぜならあなたには生成AIに関連しない、かなり良いビジネスがあるからです。だからあなたはこの常にデイワンのような状況にいるんです。再発明したいのか、それとも主力製品にとどまるのか。CEOとしてそれをどう考えますか。

それは本当に難しい質問です。デイワンの例えを使えば、純粋なデイワンの視点は、この時点から歴史を無視して言うでしょう。正しい決定は何か。これが私たちがビジネスを始めた最初の日です。そしてそれは理論的には真実です。しかし私たちには10億ドル以上の収益と、すべての分析イニシアチブのためにエンタープライズデータを安全で確実でアクセス可能に管理することを私たちに依存している世界最大の顧客700社か800社があります。

だから私はそれを無視できません。だから今の答えは、私たちは両方をしなければならないということです。だから私たちはそのコアデータプラットフォーム、基本的にすべてのグローバル産業のトップ10企業のうち8社か9社のデータ基盤であるClouderaデータプラットフォームに投資しています。しかしこれらの同じ顧客は言っています。そしてまた、私は私の組織内のリポジトリで最もデータ重力を持っているため、AIツールと機能に関して何をしているのか、そのデータをデータレイクハウス形式で使用できるようにして、基本的にそれを使ってビジネスユーザーが展開したいモデルをトレーニングおよび構築できるようにしてください。

だから私たちの視点からは、両方の世界にまたがることができると思います。すべてのリソースを新しいイニシアチブに移すことは賢明ではないでしょう。なぜなら大規模な組織が言っているからです。見てください、データセンターで動作するこの製品が今後20年間動作することを確認する必要があります。一方で、これらの同じ顧客全員によって推進されるイノベーションリクエストもあります。

だから今、私たちは両方をしています。私たちはプラットフォームへの投資と進化を続けていますが、内部のR&Dの面でも、またデータ管理機能に機能を追加することに関して最近3つの買収も行いました。

ClouderaのCEOとしての戦略

またコンテナ化機能の追加により、基本的にコンピューティングプラットフォームに関係なくクラウドのようなユーザーエクスペリエンスを提供できるようになります。それはよりフォワードイノベーション駆動型です。だから今、私にはすべてをイノベーションに移す贅沢はありませんが、また過去15年間にわたって構築されてきた知識と専門知識の基盤もあります。ビッグデータの初期段階でおそらく疑いの余地のないリーダーであり、それを活用してAIのニーズをどう解決するかについてより良い決定を下すことができます。

だからそれは、それはCEOの答えで、私はある程度落ち着いて議事妨害しました。

それは議事妨害ではありませんでした。それは正当な答えでした。あなたは両方をしなければならないと話しました。

両方をしなければならないんです。

あなたの旅について聞きたいのですが、実際、あなたがChatGPTが出てきたのを見て、そして今日あなたが話していることを聞いているのがどんなものだったか、想像さえできません。企業は、これを私たちの会社に導入する必要があると思ったと思います。おそらく既製のモデルを使って、そして気づいたのは、公開データだけを使っていても、内部データと接続できたときほど価値がないだろうということです。そしておそらくあなたの電話が鳴り始めたでしょう。

少しあなたにとってどんなものだったか話してください。

初期段階では、見てください、AIはクラウドで生まれ、すべてのモデルは公開されているすべてのデータで訓練されました。それらが良くなるにつれて、どんどん良くなりましたが、その時点ですべてのモデルは同じデータで訓練されています。それは差別化されていません。そして顧客が来て言いました。見てください、私はこのすべての顧客インタラクションデータや取引データを持っています。そしてどうやってそれを入力するのか。そして約2年か2年半前に、より良い結果を得るためにモデルのファインチューニングにもそれを組み込む必要があることが明らかになりました。ファインチューニングはその時まだ用語でさえありませんでしたよね。

基本的により良い結果を得るためです。そして私が使う例は、私の法務部門に対してです。私たちは時間をかけて署名してきた何千もの契約があります。私たちが合意した特定の条項、交渉する特定の条項、交渉しない特定の条項があります。

そして私たちは、ここに入ってくる契約がある、モデルにそれを入力して、私たちのルールを理解させることができます。これが過去に私たちが合意したことに基づいた私たちのマークアップです。それは素晴らしいことですが、それは私たち自身の内部コンテキストで訓練されている場合にのみ価値があります。aとbです。そのモデルは『戦争と平和』を読んでいる必要はありません。私たちにそれを提供するために。公開されているすべてのもので一般的に訓練されている必要はなく、私たちのコンテンツで訓練されている必要があるんです。

だから私がそこで言っている点は、人々は大規模言語モデルと小規模言語モデル、そしてそれらが適切な場所と、より良い結果を与える適切なデータでモデルを訓練することでより的を絞ることについて、より良くなっているということです。初期の頃は海を沸騰させることでしたよね。だから大規模言語モデルで見た進歩、異なるユースケースに対して異なるモデルを使用することの理解における顧客の洗練度の進歩は、過去12ヶ月か18ヶ月で劇的に異なっていると思います。そして私たちはまだこの採用の非常に初期の段階にいます。

だから私たちは、私たちは特等席を持っていると言えます。間違いなく私たちはリングの中にいますが、これの多くについて、そしてそれはかなりエキサイティングです。しかし答えは、今やっていることに固執しすぎないことだと思います。なぜなら何かより良いものが角を曲がったところにやってくるからです。

企業がこれをすべて急いで展開しようとしていた初期の頃、私たちと一般の人々は、彼らがそれを間違えた陽気な例をいくつか見ました。たとえば自動車ディーラーシップがポリシーを読んだと言って割引を提供しました。そして彼らはただ割引を幻想しただけです。そしてそれに従うべきかどうかという問題があります。これは投資収益率の問題とこれがどこに向かうかについて考えるとき、重要なことだと思います。

それが正しくなるまで、これらの質問は生成AIに付きまとうでしょう。私たちはまた、モデルが良くなっているかどうかについてもたくさん話します。ええ、モデルはある時点まで良くなることができます。しかしクリーンなデータを取り入れ始め、モデルをこれらのタイプの幻覚にさらさないようにすると、それが機能する製品として本番環境に投入できるようになる時です。

ええ、モデルは良くなっていると思いますが、130億個のパラメータが本当に120億個のパラメータよりもはるかに良いのかという、ある種の漸近的な障壁に近づいているかもしれません。おそらく9個で十分で、おそらく5個で十分です。

誰かが数学的に作業をしたでしょうが、私の推測では、モデル自体が良くなっていない点に近づいているということです。つまり訓練するデータの品質がますます重要になってきているということです。だから顧客がデータの忠実性、データ品質、そしてデータ系統、つまりモデルを訓練するデータがどこから来るかの理解についてはるかに多く話しているのを聞いています。

そして私が思うに、起こっていることは、エンタープライズデータが企業資産として再評価されていて、人々は今それを正しく行うためにより多くのお金を使う意欲があるということです。歴史的には、もし私がIT責任者で、プロジェクトが出てきて、一つはサイバーセキュリティで、私たちはそれに資金を提供します。一つはアナリティクスで、ええ、私たちはそれに資金を提供します。一つはデータガバナンスとある種のデータ忠実性で、それが何を意味するのかさえ分からない、それはリストの一番下に行きます。

だから多くの企業がデータストアを軽視してきたと思いますが、18ヶ月前まではそうでしたが、今は顧客にとって非常に高い優先事項になっていると思います。なぜなら再び、コンポーネントは加速されたコンピューティングと高品質なデータであり、モデルがほぼ最適化されている場合、データは結果の品質を向上させる次のチャンスだからです。

分かりました、チャールズさん、人々がもっと知りたい場合、どこに行けばいいですか。

cloudera.comです。私たちはオンラインで膨大な量の書かれたものとビデオ資料のグループを持っています。私たちはこのビジョンに到達するのに役立つ一連の新製品を導入したばかりです。だから人々に会社についてもっと知ることをお勧めします。そして明らかに私たちは起こっていることに興奮しています。

素晴らしい。チャールズさん、会話をありがとうございました。

ありがとうございました。感謝します。

それでは皆さん、ご視聴ありがとうございました。すぐにまたお会いしましょう。

コメント

タイトルとURLをコピーしました