企業の95%が本当にAI投資で収益を得られていないのか? — Aaron Levieと共に

経済・ビジネス・投資
この記事は約32分で読めます。

この動画は、企業のAI投資に対する収益が95%の組織で得られていないというMITの調査結果について、BoxのCEOであるAaron Levieが詳細に分析し反論する内容である。Levieは、この調査結果が技術導入の初期段階における自然な現象であり、内製化よりも外部のソリューション活用が成功率を高めること、そしてAIエージェントの活用によってスタートアップが従来の100人規模の企業と同等の成果を9人で達成している実例などを紹介している。さらに、GPT-5の評価やAIエージェントの定義、そして知識労働における自動化の革命的な可能性について議論が展開される。

Are 95% of Businesses Really Getting No Return on AI Investment? — With Aaron Levie
Aaron Levie is the CEO of Box. Levie joins Big Technology to discuss the reports that a vast majority of businesses are ...

なぜヘッドラインは企業がAI投資で収益を得られていないと伝えているのか

なぜヘッドラインは企業がAI投資で収益を得られていないと伝えているのでしょうか。そしてAIエージェントはついに働く準備が整ったのでしょうか。BoxのCEOであるAaron Levieと共に、この後すべてをカバーしていきます。

Big Technology Podcastへようこそ。テック業界とその先にある世界について、冷静で細かな議論を行う番組です。今日はAIとビジネスでの応用について、実際に違いを生み出しているかどうか、そしてAIエージェントが本物なのかどうかについて話していきます。今日は完璧なゲストをお迎えしています。BoxのBox Works AIイベントを終えたばかりのAaron Levieが戻ってきてくれました。Aaron、いつものように会えて嬉しいです。

ありがとうございます、Alex。こちらこそです。

Box Works AIイベントと言ったのでしょうか、それとも単にBox Worksと呼ばれているのでしょうか。実際、あなたがAIイベントと呼ぶのが好きです。Box Worksと呼ばれているだけですが、いつでもAIを追加したければ、構いませんよ。

分かりました。多くのAIニュースがありましたね。それについては後で詳しく話しましょう。

MIT調査への反論

ビジネスでのAI応用について多くの人と話しているので、このMIT調査について聞かせてください。何が現実で何がそうでないかについて、あなたの見解を教えてください。これはAxiosからです。数週間前、AI利益に関するMIT調査がテック投資家を動揺させました。ウォール街の最大の恐れが、最近のMIT調査によって検証されました。調査対象となった組織の95%がAI投資でゼロリターンを得ていることが示されたのです。

300の公開AI事業を調査して、ビジネスへのAIの影響についてハイプなしの現実を解明しようとしました。組織の95%が、生成AIへの企業投資300億から400億ドルにも関わらず、ゼロリターンを見つけたと答えています。これはビジネス界で誰もが話題にしている研究です。何か妥当性があると思いますか。あなたはもう首を振っていますね。

実際に7つの次元で首を振っています。それぞれを分析していきましょう。

やりましょう。

最初のもので、おそらく最も面白いのはウォール街の要素です。実際、ウォール街はこの次元で完全に統合失調症的です。

明らかに、そのような報告は一方では彼らを怖がらせますが、実際には、AIが非常に優れているためにすべてのソフトウェアが死んでしまうという考えの周りに、同じくらいのウォール街の熱狂的なエネルギーがあります。これは非常に両極端な状態です。つまり、AIの採用においてどこにいるのか対AI が非常に強力になってソフトウェアビジネスモデルが存在しなくなるという状況です。すべてがAIによって配信されるからです。

このような極端な二極化要素を持つほとんどの物事と同じように、現実ははるかに微妙だと思います。私たちはまだAIの採用曲線の初期段階にいます。これらのタイプの技術の初期段階では、多くの概念実証があり、さまざまな技術の多くの試行があり、人々はどのツールがどのユースケースに機能するかを理解しようとしています。

定義上、あなたは多くの試みがある荒野にいます。さまざまなベンダーや技術スタックでこれらの技術を試すことで、これらのプロジェクトやパイロットの多くは間違いなく失敗します。定義上それらはパイロットであり、私たちはまだ初期段階にいるからです。

調査で興味深いことの一つは、AIスタックを効果的にDIYしようとした企業と、本当に応用されたソリューションとユースケースを使った企業の間に大きな差があることでした。これは私たちの顧客基盤で見つける傾向があります。

おそらくAIを把握するのは比較的簡単だろうという最初の理論があったと思います。独自のAIアプリケーションを構築できるでしょう。データのすべてのベクトル埋め込みを自分たちで行います。それをベクトルデータベースに入れます。データアクセスのセキュリティと権限を自分たちで管理します。

そして気づいたら、企業内の特定のワークフローにAIを展開したい企業が、その組織内で単一のユーザーが実際にAIと相互作用する前に、実行・管理しなければならないソフトウェアが10から15の異なる部分を持つかもしれません。そのようなアーキテクチャはおそらく機能しないでしょう。

調整されたユースケースを解決する目的志向のソリューションが必要です。それらはAIコーディング全体のような非常に大きなユースケースでも構いませんが、これをブートストラップしたり、すべてを自分で構築したりする立場にいたくないでしょう。それが調査での認識の一つでした。ただし、正しいユースケースを得る必要があるということ以外のどんな結論にも、私は心から反対します。

最も効果的なAI分野をターゲットにしなければならず、おそらくこの技術を自分で構築すべきではありません。しかし経験的には私たちの側からです。私たちは毎日、即座の利益を見ている顧客と話をする機会があります。同僚が実際のROI節約を取締役会に提示できない顧客と話したことがあります。

取締役会が信じないほど良い数字だからです。それで実際に水で薄めなければなりません。見ているものに基づいて、より実用的で信じられるようにするために。

それはひどい取締役会ではありませんか。つまり、取締役会が真実を聞けないなら新しい取締役会が必要ですが、真実があまりにも良くて信じられないように聞こえるということです。ROIがあまりにも良くて、実際にこれがどのように機能するかを説明するときに信じてもらえないのです。少なくとも私たちの顧客については、全面的に例を見ています。

私たちは非常に応用されたユースケースの利点があります。文書と非構造化データを取り、その後、構造化データを文書から抽出するなど、そのデータで動作できるAIエージェントを持っています。10万の契約を渡してくれれば、それらの契約で構造化データフィールドを引き出します。

または請求書を渡してくれれば、請求書の主要な詳細を引き出してワークフローの自動化を支援します。これらのユースケースは非常に高いROIになる傾向があります。なぜなら、以前はそのデータを得ていなかったか、それを行うのに非常にコストがかかったからです。そしてAIはそのような種類のタスクを実行することがますます上手になっています。

そのため、顧客に即座の利益があります。ワークフローをはるかに簡単に自動化できます。その結果、一部の分野での運用コストを下げることができます。私たちは顧客基盤内でのAI採用に基づいて、異なる結果セットを見る傾向がありますが、過去数年間のすべてのプロジェクトを拡大して考えると、この分野でどれほど早期段階にいるかという現実として、混合した結果を得ることになると思います。

内製ビルドは外部パートナーシップの2倍の率で失敗すると書かれています。そこは的確ですね。独力でこれをつなぎ合わせようとする人々対外部で行う人々は苦戦しており、これは従来の常識に反するものです。従来の常識では、ユースケースにカスタマイズできるように、おそらくオープンソースで内部的に構築できることが望ましいと考えられていましたが、実際には既製品のいくつかが非常にうまく機能していることが判明しています。

これらの種類の調査やアーキテクチャについて話すときの多くの課題は、テック業界と非テック業界を分離しなければならないことです。非テック業界は、これらの種類の技術の消費者であり、テック業界は構築者です。

オープンソースは非常に価値がありますが、法律事務所がオープンソースモデルを使って独自のAIプロジェクトを構築するという意味ではありません。地球上のすべての企業がワークフローを自動化する独自の技術を構築すると考えるなら、それは災いのレシピです。技術が早期段階にあり、展開できる応用ソリューションがなかったために、多くのパイロットでは実際にそのような場合でした。しかし、オープンソースは実際にはBoxのような会社にとって非常に価値があります。12万の顧客に技術を提供しており、そのような能力を活用する内部専門知識を実際に持っているからです。

オープンソースを例とした次元からの結論は、地球上のすべての企業が独自のAI戦略をDIYすることを期待すべきではなく、それはAI採用の観点から収益と利益を得られないレシピだということです。そして最後に指摘したい点は、AIから真の利益を得るには、かなりの変更管理が必要だということです。

これは、既存のワークフローを取り、AIを直接その中に落とし込んで、そのワークフローが突然3倍良くなるという万能薬タイプのソリューションではありません。

通常、AIを活用するために作業を再設計する必要があります。最近ますます至った結論は、2年か3年前にはAIが私たちの働き方についてすべてを学習し、私たちのワークフローに適応してワークフローに自動化をもたらすという感覚を持っていたと思います。

現実的には、AIを完全に活用するために、おそらく増分的に、しかし場合によっては意味深く、私たちの作業を修正する必要があるでしょう。それは一方では難しく聞こえるかもしれませんが、それを行う企業にとって、ROIはかなり大きくなるでしょう。

現在最も明らかな例として、生産性向上を見ているAIコーディングについて考えてみましょう。AI第一エンジニアが働く方法は、2年か3年前にエンジニアリングしていた方法とはかなり異なります。エンジニアは本当により管理者になります。

エージェントを配置してコードベースの大部分で作業させ、その後、レビューする大量の作業を持って戻ってきます。エンジニアとしてバックグラウンドエージェントを活用し、実際にタスクを実行する適切な種類のプロンプトの与え方、コードベースについて効果的に考える新しい方法、仕様の処理、AIエージェントが何をすべきかのルールについて考えるワークフローを変更しなければ、AIから2倍や5倍の利益を得ることはおそらくできません。

この作業をすべて行わなければ、AIから2倍や5倍の利益を得ることはおそらくできません。そのため、エージェントが私たちのプロセスに入って行っているすべてを自動化すると考えるのではなく、エージェントを効果的にするために実際にビジネスプロセスの一部を再設計する必要があります。

ところで、パイロットについて数回言及していますが、これは話すことが重要だと思います。なぜなら、この研究はパイロットだけではなかったからです。組織の95%がAI投資でゼロリターンを得ています。

パイロットのことは興味深いと思います。なぜなら、パイロットが失敗するのは自然だからです。実際、私がしばしば話すように、AIパイロットの20%だけ、または10から20%のAIパイロットが実稼働に出るという話をすることについて、リスナーからフィードバックを受けました。それは良い数字かもしれません。

初期段階では明らかに試行錯誤があるでしょうから。

明確にするために、私は技術がまだ非常に初期段階にあるという意味で、パイロットという言葉を口語的に使っています。顧客と話すとき、これまでに展開したもののほとんどがパイロットと同等のものであることが多いからです。

文字通り組織全体でそうです。組織全体では、一つの中央化された調査実施者が組織全体を代表するのは難しいです。それがまさに私が調査を好きになりたくない理由です。調査は素晴らしいです。興味深い、会話のきっかけですが、実際にこの質問にどのように答えているか、生産性を測定する方法は何か、非認可の方法でChatGPTを使っているすべてのエンドユーザーと彼らが行っていることを実際に調査したかを評価しようとしたら、それをすべて捉えることはできません。

そのため、より中央集権的な、重い、再び種類の、よりパイロット指向のタイプのプロジェクトを表す傾向があります。なぜなら、再び私たちがどれほど早期段階にいるかだからです。エージェントという言葉は1年未満前に登場したばかりです。これらの多くの分野でまだ早期段階です。

しかし再び、会話を始めるという理由で素晴らしい調査だと思います。しかし、結論がAIの使用を遅くしたり、リスクの観点から軽減すべきものを実現すること以外の何かをすることだったら、実際に失敗は、またはその問題は、一部の企業をさらに遅く動かすだけで、他の企業がそれらを追い越すことになるでしょう。

それは聞き手が、その調査について何をするかを決定するのは、聞き手次第です。

この研究について私が非常に興味深いと思った、やや過小評価されてきたもう一つのことを教えます。公式なLLM購入は企業の40%だけをカバーしているが、従業員の90%は毎日個人的にAIを使用している、少なくとも調査対象者はそうです。これは非常に興味深いことです。なぜなら、企業が生産にこのようなものを導入するよりも、個人的な使用と個人の間により多くの関心があることを意味するからです。

あなたは明らかにここで反応がありますね。聞かせてください。

私はそれが経験的な現れた選好だと思います。つまり、それを知った後は調査する必要すらありません。なぜ人々が個人的生産性の意味で、その率でAIを使いに行くのでしょうか。

それは彼らがそれから価値を得ているからです。つまり、それは人々が働く方法のベースラインのようなものになっています。今日AIを排除したとしましょう。うわあ、大丈夫、私は実際にあの3時間の研究をしなければならないことに気づくでしょう。以前は深い研究プロジェクトとして開始し、5分後にチェックバックすることができたのに。

つまり、私たちがこれらの技術を日常的に使うことを選んでいるのは経験的です。なぜなら、それらが生産性を追加しているからです。これまでにAIで見てきたことは、これらの技術を展開し始めると起こり始めることの表面をかろうじて引っかいているだけだと私は主張します。

ビジネスでの使用は、企業の大規模言語モデルの拡張使用対個人が独自にChatGPTを使用することの潜在的にブレンドになると思いますか?それとも将来的には何かのブレンドになると思いますか?あなたは明らかに物事の反対側でこれが起こるのを見ています。

いえ、未来は、技術自体の拡散の最も初期段階にいると思います。顧客を研究しに行くときの基本的なユースケースの、なぜ完全なアカウントプランを取得しないのでしょうか。この人はこの会社で働いており、これらのことに興味があり、これがその業界のトレンドですと言うのではなく、なぜAIシステムに完全な… を生成してもらわないのでしょうか。

それは非常に強力ですが、人々がどのように働くか、人々が行うワークフローの全範囲について考えれば、比較的基本的でもあります。私たちがどれほど早期段階にいるかの本当に興味深い例の一つは、Claudeが今週、ファイルを生成してくれる新しい機能を発表しました。ChatGPTの瞬間から2年半、ほぼ3年経っているにも関わらず、AIシステムがワード文書やPowerPointプレゼンテーションの形で、信頼できる高品質の文書を生成できるのは初めてだと私は信じています。

ほぼ3年経ち、「ああ、それは良いプレゼンテーションのように見える」と言えるものを生成できるのは初めてです。私たちはまだ非常に初期段階にいます。まだ数年かかると想像してください。

そのような技術が企業に波及し始める未来を想像してください。顧客に販売している製品を提示しに行く前に、1時間か2時間を費やして調査し、プレゼンテーション用のPowerPointファイルを作る代わりに、AIエージェントのところに行って「この顧客に売りに行く予定です。このプレゼンテーションを生成してください」と言い、それを開始すると、再び3分後にあなたのために終わっています。これは私たちがほぼ毎日行っているすべてのワークフロー、私たちが行っているほとんどすべてのものに現れるでしょう。

コーダーは未来がどのような見た目かについて最初のレンズを得ています。なぜなら彼らがこれらのツールを活用するように配線されており、AIコーディングが最初のブレークアウトユースケースの種類だったからです。しかし、インターフェースに行き、エージェントと話し、あなたのために複数ステップの作業を実行するという同じダイナミクスが、今後数年間で知識労働のすべてに現れ始めるでしょう。

私はこの意味で実際におそらく実用主義者です。これは仕事の即座の一夜での変革のようなものにはならないでしょう。何年もの変更管理がかかるでしょう。今週、あなたが述べたように私たちは会議を主催しましたが、定義上、前向きで技術の早期採用者である群衆がたまたまいましたが、それは経済全体の小さな部分を表しています。

すべての銀行、すべての製薬会社、すべての法律事務所がこのAI第一の方法で配線され始めるまでには何年もかかるでしょう。しかし明確に、それは起こるでしょうし、その列車を遅くするものは何もありません。

Claudeを使った文書生成の実用性

さて、Claudeを使って文書を生成するユースケースについてもう少し話しましょう。つまり、あなたが挙げた例は、これらのうちの一つを使って顧客に売り込みに行くというものでした。ほとんどの組織には、PowerPointテンプレートと組み込まれたデータがあると想像します。価格設定スプレッドシート、在庫スプレッドシート、ポジショニングに関する文書をアップロードし、これに基づいてPowerPointを作成してくださいとClaudeに言ったとしても、良い仕事をするでしょう。

しかし、これが人々が仕事をする方法になると言うことは、実際に市場に出るときに既に持っている他の文書を使うのではなく、パーティートリックのように見えるものとどれほど実用的でしょうか。

ええ、これが実際に現れる方法を知っています。正確な日付は表現できませんが、Boxに行って「これが私のセールスプレゼンテーションテンプレートです。新しいクライアント情報があります。それでPowerPointプレゼンテーションを生成してください」と言うだけです。既存のデータをソース素材として使用するのです。これは何らかの一回限りのバイブコーディングされた文書ではありません。

次に生成する文書のソース素材として既存の資産を使用し、その作業をレビューしに行きます。それに3分かかりますが、顧客リサーチとすべてのグラフィックの移動、関連情報の配置にかかった1時間か2時間のすべての時間を節約できるでしょう。

それはあなたのために行われるだけです。経済の何らかのセクターで1日にそれを行う100万人にそれを掛けると、数千万時間の生産性向上を経済内で見ることができるでしょう。

これらのモデルの信頼性についてどう感じていますか?なぜなら、何かの準備のために深い研究を使えるとか、これらのモデルを使ってPowerPointを生成し、それを数分でチェックすることについて何回か話しているからです。これらの出力が十分に信頼できるので、それだけで済むと思う段階にいますか?

正しいコンテキストをAIに与えることと、信頼できるデータにAIを効果的にグラウンディングする方法、適切な種類のプロンプトと十分に高品質なモデルについて本当に優れている限り、幻覚や正確性の問題のすべてではないにしても、大部分をほぼ根絶できます。

私たちの場合、Boxで行うすべてのことは、既存のデータをAIエージェントのソース素材として考えています。AIエージェントが効果的になるためのソースコンテキストです。私たちのセールスプレゼンテーションである既存のPowerPointドキュメントを取り、新しい顧客のためにこれを修正してくださいと言い、ある程度の思考モードを持つ推論モデルであるフロンティアモデルでそれを行うと、99%の時間で極小の偽の小さな種類のエラーや失敗を作るでしょう。それは現時点で解決された問題です。

節約する数時間に対する5分のトレードオフは、その作業をレビューしに行くのにまだ簡単に価値があります。これは、コーディングで未来がどのように見えるかについて信じられないほど最前列の席を実際に持っているのです。

新しいスタートアップと話すと、これを行うかどうかは分かりませんが、世界のデバイスなどと時間を過ごすことがあると知っています。しかし、新しい5人のスタートアップに行って話してください。興味深いのは、彼らが私が人生で見た中で最もクレイジーな方法で働いていることです。

この間、9人のスタートアップと話していましたが、少なくとも約100人の会社のサイズで実行していると推定しており、それは基本的な数学を行うとおそらく控えめでした。彼らのエンジニア一人一人が5人や10人、20人のエンジニア相当の作業の出力能力を持っているからです。しかし、彼らは完全に異なる方法で働いています。彼らはAIエージェントの管理者です。構築したいもののための本当に良い仕様を書くことに時間を費やします。ソフトウェアの設計アーキテクチャについて本当に良い時間を費やします。

そしてエージェントの出力をレビューすることに多くの時間を費やします。知識労働のすべての分野がそのように見えるわけではありません。しかし、セールスで想像してみてください、マーケティングで想像してみてください、法的作業で想像してみてください。あなたの役割が多くの基礎的なデータ準備、研究、作成タイプの作業を行うエージェントを管理し、その後あなたの仕事がその作業をレビューし、より広いビジネスプロセスにまとめることだとしたら。それは実際に将来の多くの作業がどのように見えるかです。

幻覚やエラーのこのアイデアは、時々他の人の作業をレビューしなければならず、他の人が私の作業をレビューし、私が作成するプレゼンテーションにエラーがあり、誰かがそれを捉えて、スペルミスを見たり、顧客の名前を間違った方法で変更したりして、彼らがそれを変更するということと何も違わないでしょう。

私たちはAIエージェントに対してそれを行うでしょう。これは、AIエージェントが私たちの作業をレビューし、段階的により生産的にしてくれると思っていたモデルの反転です。私たちがAIエージェントの作業のレビュアーになるでしょう。私たちが編集者になります。管理者になります。オーケストレーターになります。そしてそれが実際に生産性向上を得る方法です。

AIコーディング分野を見てください。スタートアップがレバレッジを得るために何をしているかを見て、それをより広い経済に対して考えてください。

AIエージェントの定義と実装

とても興味深いですね、Aaron。前回お話しした時、あなたは基本的にAIコーディングツールを使って一人で会社を構築している人を知っていると話していました。

それで、AnthropicのDarioのプロフィールを書いている過程で、あなたの引用もありますが、Claude Codeを使って似たようなことを一人で構築している開発者を見つけに行きました。これは明らかに、Anthropicがレート制限をかけなければならない状況になるほど、明らかに起こっていることです。

これがまさに、MIT調査を愛していると言う理由です。素晴らしいと思います。楽しい会話のトピックですが、人々があなたが今言ったことが実際に現場で起こっているのを見逃し、それが企業に波及する際に何を意味するかに注意を払い始めず、人々がAIエージェントの世界のためにワークフローの再設計について考え始めないということが一つの悲劇でしょう。これはすべての技術の波で起こることです。

早期採用者と早期イノベーター、そして遅れをとる人々がいる理由は、早期採用者とイノベーターがあなたのAnthropic記事を読んで「ああ、これは実際に本当のトレンドだ」と見るからです。遅れをとる人々はMIT記事を読んで「ああ、私は正当化された」と言うでしょう。

一部の企業はそのような早期リターンをはるかに速い率で得るでしょう。他の企業は待つことができます。時にはそれが会社が破壊されることを意味し、時にはそうではありません。なぜなら、組織として何らかの独自の能力を実際に持っているからです。PfizerやEli Lillyが一つの結果としてAIの採用に少し長くかかったとしても、より実用的になることは全く問題ありません。彼らは市場での地位を十分に持っており、十分な流通を持っているので、この技術がより成熟するまで待つ余裕があります。

しかし、私が今スタートアップだとしたら、おそらくより大きな既存企業の周りで円を描くためにそれを可能な限り優位として使うでしょう。

これが市場で創造的破壊を生み出す素晴らしい緊張感を作るものです。技術変化のすべての波で。

さて、エージェントの定義について、そしてあなたがBoxでそれらをどのように展開しているかについて、もう少し話したいと思います。また、GPT-5についてのあなたの反応も聞きたいです。

エージェントの定義と消費者製品の課題

Big Technology PodcastでBox CEOのAaron Levieと一緒に戻ってきました。Aaron、エージェントやGPT-5に入る前に、基本的な質問から始めさせてください。これがビジネスで既に起こっているなら、基本的にはAIに独力で作業をさせ、異なるデータソースから情報を引き出して一貫した形で提示する方法を見つけているということですが、なぜAmazonのAlexa PlusやAppleのApple Intelligenceのような消費者企業が、デバイス上や消費者製品で同様の活動をする何かをまとめることがこれほど困難だったと思いますか?彼らは皆それを約束しましたが、まだそこに到達していません。

技術が存在できるという事実は、それを生み出すための実行要件とは異なると思います。私たちは皆、フロンティアモデルが何をできるかについて最前列の席を得ており、企業がこれらの応用ユースケースのためにそれらをパッケージ化することができます。しかし、数千万人または数億人のユーザーを持つ製品の企業で、特定の期待を持つ消費者がいる場合、フロンティアモデルから信頼できる、手頃な価格でエンドカスタマーにそれを提供する方法まで、多くの実行ギャップが必要です。

より大きな企業は皆、その動きの独自のバージョンを経験していると思います。スペースが非常に速く動いているので、おそらくある程度の優柔不断について同情できるとも想像します。ある日一つのモデルがトップにあり、翌日別のモデルがトップにあり、また別の日に別のモデルが突破するかもしれません。

最終的なアーキテクチャに着地するときまでに、それが持続可能な長期アーキテクチャであることを確実にしたいでしょう。ある程度まで時間はあなたの味方です。誰が脱落し、誰が続けるかを見るために待ちたいかもしれないからです。私は、あなたが今言及した企業のような、スペースが完全に破壊されて、最終的なアーキテクチャに着地したら追いつけないということはないと思います。

しかし、彼らがどのように実行するかを見なければなりません。

ビジネスでは、より規定されたユースケースがあるということでしょうか。電話では、これらのプロアクティブな通知を取得しようとしている場合、膨大なデータの宇宙を見ていることになりますが、ビジネスではより集中されているのでしょうか。違いは何でしょうか?

実際、違いはないと言います。ビジネスでも、私たちは非常に早期段階です。私たちがどれほど早期段階にいるかを処理しなければなりません。これまでのブレークアウトは、消費者向けのChatGPTでした。ブレークアウトは、非常にオンラインで、すべてに注意を払っている非常に配線されたエンジニア向けのコーディングエージェントでした。そして経済全体の早期採用者です。

企業で展開されているエージェントのほとんどは、Jeffrey Mooreが技術採用曲線のアイデアを思いついた、または少なくとも普及させたことができます。個人のグループが属する複数のカテゴリーがあります。

早期イノベーターと早期採用者がいます。それからキャズムがあります。それから基本的に実用主義者と早期過半数の種類があり、それから遅れをとる人々がいます。私たちは一部のユースケースでキャズムを飛び越える早期採用者の初期段階にいます。

しかし、私たち全員が毎日ぶらぶらして話している早期採用者である人々がいるこのキャズムがあることを想像しなければなりません。彼らはすべてを試すでしょう。これらのクレイジーなゴーグルを試し、頭に磁石をつけ、最もクレイジーなことをします。Google Glassを着用します。

それは実際には、そのものがキャズムを飛び越えるかどうかについてほとんど何も教えてくれません。実際に規模で物事を採用する早期過半数やその実用主義者のようなものを見なければなりません。明確に突破した技術の種類は、ChatGPT製品、Cursor製品、これらの次世代研究エージェントタイプのものの多くです。Perplexityはその早期過半数でうまくやっていますが、AIエージェントがキャズムを飛び越える段階では非常に早期です。いくつかは成功しないでしょう。いくつかは成功するでしょう。

しかし、ビジネスがあなたが今挙げた例よりも特に速く動いているとは言わないでしょう。多くの例を見ることができると思いますが、それらは通常その早期採用者タイプのカテゴリーにあります。

私たちが話している週に、あなたはBoxで多くの異なるエージェントをリリースしています。しかし、エージェントとは何かを聞くことから、この議論を始めさせてください。なぜなら、それは過度に使用された用語のように思え、私自身、常にこの中にいるにも関わらず、その言葉が実際に何を意味するかについて完全に明確ではないからです。

それが完全に過度に使用されることを予想すべきだと思います。それは現在、あなたのために作業を行うAIシステムと話すための新しい専門用語になっています。

私たちが今後業界として使用する主要な用語になるでしょう。バズワードだからではなく、実際に有用な用語だからです。あなたのために自動化された作業を行う定義可能なオブジェクトです。場合によっては質問に答えるという単純なことかもしれません。しかし、テック業界のほとんどの人は、ある程度の作業を行い、その作業を行うためにAIモデルを複数回ループすることを一般的に主張するでしょう。

それはClaude CodeやCursorがエージェントを持つ、Replitがエージェントを持つところからのすべてかもしれません。これらの品質を持つウェブサイトを構築してくださいというタスクを与えると、10分で何週間分の人間の作業を行います。それが全体のプロセスを管理し、モデルを複数回ループし、それが何をしているかを追跡し、プロセス中にメモリを更新するエージェントです。それが事実上エージェントです。

それがコーディングのエージェントで、法律、ヘルスケア、金融、教育で同じ種類のエージェントアーキテクチャが現れるのを見るでしょう。あなたのために作業を行うエージェントを展開できます。

重要なアクセスは、介入し、修正し、正しい方向に再度向ける前に、エージェントがどれだけの作業を行えるかです。

現在、その作業の多くは数分の長さかもしれませんが、エージェントが数十分、あるいは数時間実行され、効果的により良く、より高品質の出力を推進する例を見ています。エージェントについて考える方法だと思いますし、これらは来年にわたって非常に普及するでしょうが、2025年は実際に真剣にそれについて話すことができる最初の年です。

Andre Karpathyが持っていたように、これをエージェントの年として考えるべきではないと思います。エージェントの10年として考えるべきです。それはおそらく正しい考え方です。モバイルの年がモバイルの10年になったように。しかし、最終的に私たちはモバイルを使い始めました。

しかし、モバイルの年は重要でした。一部の人々はそれが2022年だったと言いましたが、おそらく最初に現実的になり得たのは2002年でした。

一部の人々は、しかしiPhoneがあった2006年と2007年まで本当に現実的ではありませんでした。私と他の多くの人々は、エージェントのためのiPhoneを既に持っていると確信しています。何らかの新しい画期的なアーキテクチャは必要ありません。エージェントのための中核的な足場として既に機能するアーキテクチャがあります。

今、10年の時計を開始できます。しかし、それは完全自動運転タイプの問題になるでしょう。明らかにWaymoは、10年、10年半前に開始され、今年だけ郊外のシリコンバレーでアクセス可能になりました。

10年または10年半かかったことは、多くのエンジニアリング作業、道路上の多くのマイル、システムの正確性と知性のあらゆる側面の改善でした。知識労働でも同じことを見るでしょう。何年もかかるでしょう。早期採用者が早期リターンを得るでしょう。

実用主義者は、多くの手取り足取りなしで機能するようになったら使用するでしょう。誰もがそのスペクトラムの中間のどこかに着地するでしょう。

Box Automateとビジネスプロセスの自動化

今週のあなたのプレゼンテーションの一部を見ましたが、あなたが話している企業が展開できるようにするエージェントの一部は、例えばアパートを借りる申請を見たり、不動産記録を見てそこでタスクを実行したり、臨床検査を見て問題を引き出そうとするレポートを作成したりするものです。これらを作成するプロセスについて少し話してください。これはまだデモ段階なのでしょうか、それとも実際に本物なのでしょうか。

2番目の質問から始めましょう。今週、多くの大きな発表を行いました。発表した製品と機能の一部は、現在完全にGAです。顧客は既に使用を開始できます。

一部は、今後数四半期で出される製品について少しクリスタルボールビューを提供します。例として、すべての顧客が今すぐ使用できるAIエージェントがあります。それはデータ抽出エージェントです。契約書や請求書、医療データを渡すことができます。

そして、そのコンテンツを通して作業し、それらの文書から重要なデータを引き出し、その周りでワークフローを自動化できるAIエージェントがあります。Box WorksでBox Automateと呼ばれる新しい機能を発表しました。

Box Automateのアイデアは、文書をレビューしたり、提案を生成したり、データに基づいて顧客のための販売計画を生成したりするのに役立つ一回限りのエージェントを持つことは非常に強力だということです。それは非常に強力です。しかし、さらに強力なのは、これらのエージェントの多くを完全なビジネスプロセスに落とし込むことができることです。

Box Automateで実際にできることは、Box内でビジネスプロセスを定義することです。それは顧客のオンボーディングワークフローかもしれません。M&Aデューデリジェンスレビュープロセスかもしれません。ヘルスケア患者レビュープロセスかもしれません。Box Automate内でそのワークフローを定義します。それはドラッグアンドドロップのワークフロービルダーです。そして、プロセスの任意の時点で、そのプロセス内で作業を行うAIエージェントを持ち込むことができます。

AIエージェントにとって非常に重要なことの一つは、効果的になるために適切なコンテキストが必要だということです。私たちのシステムでは、企業のコンテンツからエージェントにそのコンテキストを取得できます。マーケティング資産、研究データ、契約書、請求書がエージェントにとって非常に重要なコンテキストになります。

Box Automateでは、基本的に既存のコンテンツを活用するワークフローでオンデマンドまたはオンザフライでこれらのエージェントを構築でき、企業の周りで多くの知識労働タスクの自動化を支援し始めることができます。

GPT-5の評価と反応

GPT-5に関する初期のレビューの多くは、この種のことを行うため、またはこの種の作業の基盤層として構築されたということでした。初期に読んだレビューでは、ただ物事を行うということで、ChatGPTでGPT-5を使用している時に、あなたのために何かできますかと言わない答えを文字通り得ることができないことに人々が気づいています。

実際に興味があるのは、あなたの反応です。前回話したときはGPT-5以前でした。この新しいモデルセット、実際にはモデルセットについて、そして多くの人が初期に失望したという事実についてどう思われるか興味があります。

失望やオンラインの時代精神について、実際に興味深いことに既にかなり変化しており、多くの人がGPT-5についての見解を更新していると思います。Code Xが最近コーディングエージェント側で非常に強くなってきています。

過去1年ほどにわたって、これらの信じられないようなジャンプと突破に慣れてしまい、中毒になっていると思います。考えてみると、GPT-4からGPT-4oから01と03、そしてGPT-4.1まで行き、それぞれが異なる軸で実際にかなり意味のあるステップ関数でした。

GPT-4を取ってGPT-5にジャンプしていたら、非常に指数関数的に見えたでしょう。しかし、その過程で、GPT-5が最終的になるものの早期プレビューを効果的に与えてくれたポイントを得ました。それは思考の連鎖を持つ思考モデルで、はるかに高品質のコーディングスキルと作業の重要な次元での多くの能力です。

GPT-5への道筋で多くの段階的なステップまたはステップ関数のステップを得たという事実によって主に推進されたと思います。そして、GPT-5はそれらの突破の多くの集大成でした。

再び、3から4から5に行っていたら、これまでに見た中で最も垂直な軸になっていたでしょう。しかし、その過程でのそれらのステップが、その種の反応を引き起こしたのだと思います。

私たちの世界では、多くの評価ですべてのモデルをテストし、異なるタイプの企業データ、契約書、財務文書、研究資料、内部メモ、それらのタイプのものをモデルに与えます。その文書やデータについて一連の質問をモデルに尋ねます。

例としてGPT-4.1対GPT-5で私たちの評価で意味のある改善を見ました。私たちの主要な、私たちの主要なテストでの複数ポイントの改善でした。これらの改善は、顧客にとっての実生活での改善に変換されます。突然、非構造化ヘルスケアデータでGPT-5を使用しているヘルスケアプロバイダーが以前より良い結果を得たり、契約書で使用しているときにより良い結果を得たりするでしょう。

ヘルスケアや法律や金融サービスで専門的分析が必要な分野や、より一般的な意味でロジックや推論や数学が必要な場合も、それらの次元での改善でした。

AI業界の経済状況について

AI業界の経済について簡単な感触を教えてもらえますか?私たちはOpenAIの損失が2029年まで合計1,150億ドルになる瞬間に話しています。すみません、2029年まで1,150億ドルのキャッシュバーンで、以前に期待していたより800億ドル高いです。今年は約100億ドルを稼ぐと予想されていますが、Oracleとの3,000億ドルの契約に署名したばかりで、OracleをほぼImported Trillion dollar company overnight and made Larry Ellison the richest person in the world above Elon Musk.

これはどう意味をなすのでしょうか?

私のように、そして確実に他の人々、Jensen、Sam、Elonまで信じているように、これがおそらく今まで私たちがアクセスしたことがある最大の技術だと信じるなら、意味をなすと思います。

知識労働に自動化をもたらすことができる第三次産業革命のようなものとして考えるなら。そのことについて少し考えてみてください。知識労働に自動化をもたらすことができます。知識労働の世界のすべては、常に基本的に私たち人間がどれだけ速く働けるかによって制限されていました。コンピューターに入力し、システムにデータを入れ、他の誰かがそのデータを読み、何らかのプロセスで移動する。それが知識労働の速度でした。情報を入力または読み取って、そのデータで現実世界で何かを行う速度でした。それが知識労働が起こることができる速度、ペースでした。

私たちが知っているすべての知識労働分野、ヘルスケア専門家が医療診断を読む、臨床研究を行う生命科学専門家、事件についての事実を見つけようとする弁護士、知的財産を扱う、コードを生成し製品仕様を読むエンジニア。その作業はすべて、私たち個人が個人的にその作業をどれだけ速くできるかによって常に制約されてきました。

AIで初めて、効果的にそのすべての作業に自動化をもたらすことができます。その自動化は、問題に投じる計算量に基づいて調整することができます。

そして、データがどれだけ優れているか、AIにそのデータを取得するシステムがどれだけ効果的かによって。計算を切り替え、人々ができるよりもはるかに低いコストで作業で異なるレベルの自動化と効果的な出力を得ることができる世界では。

それは経済において、産業後の世界において私たちが持った最大の突破です。そのテクノロジーが出回る飽和点に到達するために1,000億ドルの損失は、すべてのヘルスケア、すべての法律、すべての生命科学、すべての金融サービス、すべてのエンジニアリングの経済と経済の規模について考えるとき、実際に非常に小さな数字です。

これらの技術会社がこれを引き受けている方法だと思います。損失は選択であることを明確にするために。それは非常に明らかです。彼らはそのお金を失うことを選んでいます。戦略的理由でそれを行っています。少なくとも彼らの決定です。

戦略的理由は、これが所有し支配するのに非常に価値ある市場であるため、今日の種類のコスト率ですべてを請求し、すべてが収益性があることを確認するよりも、能力を構築し、多くの場合ChatGPTの無料消費者層での使用を補助することを選ぶということです。それは彼らができる選択です。すべてに料金を請求することを決定できます。今日はより少ない採用を得るでしょう。それは即座により持続可能なビジネスになるでしょう。

しかし、賞が十分大きく、すべての研究費用、すべてのデータセンター費用、必要に応じた補助金を行い、その採用と需要を推進することが価値があると十分な人が信じています。

それは大きく行くか、家に帰るかというタイプの賭けです。明らかに非常に賢い、非常に経済的に合理的な企業、個人、ソブリン・ウェルス・ファンドがその賭けが価値があると信じています。

この技術がどれほど重要な経済的影響を与えることができるかという理由で、おそらくその賭けが価値があると私は考えています。スペースの個々のプレーヤーとどのように展開するかは明らかに見守らなければなりません。

みなさん、Boxの提供についてはbox.comで詳しく知ることができます。Aaron と私が今日ここで話し合ったことについてより多く話すビデオがホームページで現在再生されています。Aaron、お会いできて素晴らしかった。再び番組に来てくれてありがとう。

ありがとう、Alex。

皆さん、視聴していただきありがとうございます。Big Technology Podcastでまたお会いしましょう。

コメント

タイトルとURLをコピーしました