この動画では、AIエージェントに関する二つの対照的な視点が紹介されている。一方は元OpenAIの研究者アンドレ・カルパシーによる「ソフトウェア3.0」という技術者の視点から見た現実的なAI開発論であり、もう一方はマッキンゼーが提唱する「エージェンティック・メッシュ」というビジネスコンサルタント的な理想論である。カルパシーは大規模言語モデルを「人々の霊」という確率的シミュレーションとして捉え、人間の監督が必要な現実的なAI活用を提案する一方、マッキンゼーはプラグ・アンド・プレイ式の簡単なAI導入を謳うが実際には構築不可能な理論に過ぎないと批判されている。

AIの中心に存在する戦争:ビジネスコンサルタント対建設者
AIの中心には、ビジネスコンサルタントと建設者の間に戦争があります。今週、アンドレ・カルパシーとマッキンゼーの間で鮮明に浮き彫りになったその対立について概説したいと思います。
両者とも今週、重要なプレゼンテーションと論文を発表しました。彼らが示した対照的な違いと、なぜアンドレのビジョンがより正しい可能性が高いのかについてお話ししたいと思います。ただし、マッキンゼーは役員会議室で大きな影響力を持っているため、両方を理解することが重要です。
カルパシーのプレゼンテーションの背景
まず、カルパシーのプレゼンテーションの文脈を理解しましょう。彼はY Combinatorスタートアップスクールで起業家たちに向けて講演しています。彼のプレゼンテーションのタイトルはソフトウェア3.0で、これについて語る資格が彼にあるのは、数年前に同じくYCでソフトウェア2.0という用語を作り出したからです。
彼は戻ってきて、基本的に新しいパラダイムがあると言っています。それは明らかにAIによって形作られており、プレゼンテーションの多くの時間を費やして、大規模言語モデルの特質のために独特なデザイン問題としてAIについて考えることを奨励しています。
彼は大規模言語モデルをコンピューター、大規模言語モデルをユーティリティ、大規模言語モデルをオペレーティングシステムとして語っています。そして、LLMがこれらと一致する特質を持っていることを詳しく説明しています。
LLMの特質について
例えば、ユーティリティとして、私たちは電気を測定するのと同じように、トークンあたりのドルで使用量を測定します。OSについては、特に若い人々がオペレーティングシステムのようにAIを使用しているという事実について、AIの他の主要人物たちがすでに語っています。WindowsとMacの戦争のように、オペレーティングシステムの好みに違いがあるのと同様に、ClaudeとOpenAIの好みの違いがあるため、同様の二分法が展開されています。
ソフトウェア3.0の核心
しかし、ソフトウェア3.0の核心に入りましょう。ソフトウェア3.0は、次のコーディング言語が英語であり、決定論的ソフトウェアではなく、カルパシーが「人々の霊」と呼ぶものを扱っているという考えです。
人々の確率的シミュレーションというのが、彼がLLMを表現する方法です。私はこのフレーズが大好きで、たくさん使って共有するつもりです。なぜなら、大規模言語モデルがなぜそんなに人間らしく感じるのに人間ではないのかを説明するのに役立つからです。
大規模言語モデルの知能がなぜそんなに不規則に感じるのかを説明しています。それらは人々の確率的シミュレーションなのです。人々の霊なのです。
エージェントの過度な宣伝への警告
そして、もし私たちが人々の霊のためのソフトウェアを構築しているなら、この種の相互作用のために、ソフトウェアをどのように設計するかを根本から考えなければなりません。
ここでアンドレの注意が入ってきます。そして、エージェントをそんなに誇大宣伝している時代には、それが本当に必要だと思います。私たちが今後6ヶ月、18ヶ月、2年間で構築することについて、どこかに行くためにはかなりの人間の監督が必要な人々の霊のために構築していると考えることは本当に重要です。
アンドレは、私が見てきたAIの他の主要人物たちよりも、この点について正直です。彼はAIエージェントがすべてを引き継いで自律的になると過度に宣伝して言うことはありません。
マッキンゼーとの対立
ここで、マッキンゼーとの初期の対立が見えてきます。なぜなら、アンドレが言っていることは、本質的に人々の霊やLLMには信頼できる実行力がないということだからです。彼らの知能には、この時点で高レベルなタスクで信頼されるのに十分なすべてのことを得意とするには、あまりにも多くの不規則性があります。
代わりに、人間がループ内のバリデーターである必要があるという前提でソフトウェアを構築すべきです。AIが生成し、人間が検証する必要があります。そして、その観点からソフトウェアをデザイン問題として考える必要があります。
ソフトウェア設計の二つのアプローチ
彼は、これを簡単にする二つの方法があると提案しています。一つはかなり明白です。チェック責任検証ループをできるだけ簡単にすることです。これはソフトウェア101です。
しかし、二つ目は少し議論の余地があります。アンドレはLLMを短いリードにつけて、意図的にAI生成を制約することを提案しています。評価者を圧倒するほど多くのAI生成がないようにするためです。
この例としては、AIが何百もの異なる広告バリアントを生成するが、人間がそのうち10個しか検証できない場合があります。その場合、何の意味があるのでしょうか?その時点で、エネルギーを浪費しているだけです。彼のその正直さに感謝します。
英語がプログラミング言語になることへの疑問
今、アンドレが完全に正しいとは思いませんし、少なくとも英語が事実上未来の唯一のプログラミング言語になるという彼の意見には同意しません。特に、複雑なシステムの構築を理解する強力な技術エンジニアが必要になると思います。なぜなら、彼が話している従来のソフトウェアとこのエージェンティック拡張ソフトウェアが相互作用するにつれて、システムはより複雑になろうとしているからです。
これは、英語がずっとコードを駆動するほどきれいにはならないでしょう。しかし、最初からエンジニアリングに浸かり、コードを前後に知り尽くしている彼の観点から、英語への移行は根本的なシフトであることを理解しています。
バイブコーディングの限界についての正直さ
彼は数ヶ月前に始めたバイブコーディング革命の限界について正直であることを評価します。彼は「バイブコーディング」と言って、何千ものスタートアップを生み出した人でした。
そして彼は、バイブコーディングが現在ローカル環境では素晴らしいが、CI/CDやインテグレーションなどのデプロイパイプラインには、現在バイブコーディングではうまく機能しない他の多くの部分があるという事実について、本当に正直に話しています。その正直さも評価しました。
ソフトウェア3.0のビジョン
これらすべてをまとめると、基本的にアンドレが言っていることは、ソフトウェア3.0のビジョンは、エージェントが私たちのスパン、リーチ、コントロールを拡張する拡張アイアンマンスーツを自分たちのために構築するようなものだということです。しかし、私たちはデータとの相互作用に対応するようにデータシステムを設計し、エージェントフレンドリーになるようにソフトウェアを設計し、エージェントがデータと相互作用し、人々がそれを持続可能なループで検証できるようにエージェント制御システムについて考える必要があります。
これは本当に興味深いソフトウェアデザインの話で、スケーラブルで実証的です。そして、彼が建設者であるため、指先の知識を感じることができます。それが、アンドレのソフトウェア3.0のプレゼンテーションと、非常に異なるマッキンゼーのプレゼンテーションとの根本的な違いです。
マッキンゼーのアプローチ
マッキンゼーはCEOに向けて話しています。マッキンゼーは、そして見てください、私はMistralがマッキンゼーのプレゼンテーションを承認したことを理解しています。それはすべてエージェンティックメッシュについてです。それがテーマです。そして、Mistralのceoが冒頭で素敵な紹介をしています。これはMistralへの攻撃ではありません。彼らは困難な仕事をしており、素晴らしいソフトウェアを生産しています。
しかし、マッキンゼーは、聴衆との話し方のために、技術チームが構築可能な何かを成功裏に明確にすることができません。それが根本的な問題です。
マッキンゼーの問題点
彼らがプレゼンテーションでCEOに伝えたいと思うことは理解しています。このプレゼンテーションもリンクします。ワークフローの観点で考えることが重要だということです。それは正しいです。LLMがタスクを自動化するだけでなく考えることが重要だということです。それは正しいです。エージェントについて考えるなら、自律性について考えなければならないということです。それは正しいです。
問題は、彼らが一般的な概念から解決策を提案しようとするときに発生します。エージェンティックメッシュは、実証的な根拠のない言葉のサラダです。建設者のタッチがありません。そして、それがそのプレゼンテーションを非常に懸念させるものです。
企業での実際の問題
なぜなら、私は製品エンジニアリング側の人間として、そのようなレポートを受けたばかりのCEOが入ってきて「これはただ機能するはずだ。マッキンゼーの人たちは、エージェンティックメッシュを構築でき、追加作業なしに任意のモデルをプラグインできると言っている。なぜMistral smallを使わないのか、なぜGPT-3.5 turboを使わないのか」と言うのを何度も見てきたからです。ちなみに、両方ともプレゼンテーションに含まれています。
技術チームは目を回します。なぜなら、彼らは「これらは古いモデルです。小さすぎます」と言うからです。
エッジコンピューティングの現実
これは、あまりうまく持続していないエッジコンピューティングの仮定に依存しています。なぜなら、より大きなモデルは、より小さなモデルが匹敵していない知能の持続的な向上を示しているからです。2025年の大きな驚きの一つは、モデルのエッジコンピューティングが人々が思っていたほどうまく機能していないことです。
彼の名誉のために、アンドレはまだエッジコンピューティングの余地があると考えています。見てみましょう。Appleは昨年初めにそれに大きな賭けをしましたが、本当に報われていません。まだ分からないです。エッジコンピューティングについて私たちをうさぎの穴に落とすのは避けたいと思います。それはおそらく異なる会話です。
マッキンゼーの根本的な問題
マッキンゼーのポイントは、彼らが実際に構築可能なものを推奨できるべきだということです。そして、USBポートのようにプラグインできるエージェントの効果的な理論的基板を推奨し、任意のエージェントがプラグインでき、任意のデータをプラグインできるとすれば、それはCEOにとって作り話です。
それはCEOを夜によく眠らせます。それは真実ではありません。それは実際にものを構築する方法ではありません。
ビジネスナラティブの必要性
私は、技術的概念をビジネスナラティブに簡素化しなければならない取締役会と働かなければならなかったため、理解しています。それは理解しています。非技術的な人々が理解しやすい結果について話すことができなければならないことは理解しています。
アンドレ・カルパシーのソフトウェア3.0や同様にきれいな技術ビジョンを取って、良いビジネスストーリーを語ることは可能です。明確なビジネスナラティブを伝えるために、マッキンゼーが使用するような詭弁、言葉のサラダに頼る必要はありません。
現実と作り話
実際、彼らがそれをやっているという事実、つまり根本的に真実ではないストーリーを語っているという事実。なぜなら、エージェントをUSBのようにプラグインすることはできないからです。任意のソースから変更なしにプラグインして、データに貼り付けて、すべてが魔法のように機能することを期待することはできません。
そのようには機能しません。そして、そのビジョンを売るなら、あなたが売っているのは、多くの企業がAIへの投資後にAIから離れていく理由であり、多くの企業AIプロジェクトが立ち上がらない理由です。このようなアドバイスのせいです。
真実を語る必要性
私がマッキンゼーを少し攻撃している理由の一部は、Cスイートと取締役会の耳を持つ人々にAI構築の真実を語る必要があるからです。AIシステムがどれほど複雑かの真実を語る必要があるからです。
はい、投資して企業レベルで真のAIとエージェンティックシステムを取得し、それらを実装できれば、報酬のパワーローがあります。テーブルには大金があります。それは重要ですが、そこに到達するのは困難です。
スタートアップへのアドバイス
そして、もしあなたが始めたばかりなら、それはあなたが始めたい場所ではないかもしれません。必ずしもカスタマーサクセスライン全体を自動化したり、すべての小売注文とピックアップを自動化したりすることから始めたくありません。お分かりでしょう。
あなたがやりたいことは、クロール・ウォーク・ラン・モーションに焦点を当てることです。あなたが望む文化変化を記述し、それを生き始めることです。
文化変化の重要性
それが今日あなたに残したい部分です。アンドレが私たちの組織で作成する必要があると提案している文化変化とは何でしょうか?それは、ソフトウェア3.0の観点で考えることを可能にし、LLMを人々としてではなく、プログラムとしてでもなく、確率的文脈における人々の確率的シミュレーションとして考え、関係することを可能にするものです。
LLMには関連する創発心理学があり、心理学が「真実」でなくても、これらが「シミュレーション」であっても、それについて語ることは関連しています。私たちはまだそれについて話し、理解することができます。そして、それは確率的エージェントが私たちのソフトウェアインフラストラクチャとどのように相互作用するかを理解する窓かもしれません。
真実を語ることの重要性
掘り下げることがたくさんありますが、実際に起こっていることを掘り下げて、実際に重要なビジネスストーリーを語る方が、マッキンゼー側に行ってすべてが簡単だと偽り、企業が取締役会デッキが言うよりもはるかに困難だと遅れて発見して、AIを始めてから離れていく状況に陥るよりもずっと良いでしょう。
エージェントをいつでもプラグインできるというのは真実ではありません。これらの小さなエッジモデルがあなたが望むことは何でもして、次に来る大きなモデルに食べられないというのは真実ではありません。
私たちはスタック全体で真実を語るより良い仕事をする必要があります。そして、アンドレがそれを最善を尽くして示していることに感謝します。そして、私はマッキンゼーのような組織にもっと強い姿勢を取ることを求めています。
見てください、私は自分をだましているのでしょうか?彼らは私の声を聞かないでしょう。彼らは聞かないでしょう。それで構いません。私はまだ求めることができます。私はまだAIの挑戦に対するより良い対応を期待することができます。
乾杯。


コメント