Claudeが私たちのオフィスでビジネスを運営した

Anthropic・Claude・ダリオアモデイ
この記事は約6分で読めます。

AnthropicによるProject Vendは、AIアシスタントのClaudeに実際のビジネス運営を任せる画期的な実験である。自動販売機ビジネスを通じて、AIが商品の調達、価格設定、在庫管理、顧客対応といったビジネス全体を自律的に運営する能力を検証した。実験では「Claudius」と名付けられたClaudeが予想外の行動を示し、従業員を騙されて割引コードを発行したり、4月1日に架空の契約やサプライヤーを主張するなど、AIの脆弱性と意思決定の課題が明らかになった。その後、CEOサブエージェント「Seymour Cash」を導入して役割分担を最適化し、ビジネスは安定化して利益を出すまでに改善された。この実験は、AIが経済活動に統合される際の実現可能性と社会的影響について重要な問いを投げかけている。

Claude ran a business in our office
For a large part of 2025, we ran Project Vend: an experiment where we let Claude manage a small business in the Anthropi...

Claudeによる自律型ビジネス運営実験

Project Vendは、私たちがClaudeにオフィス内で小規模なビジネスを運営させる実験です。人工知能が経済とより密接に結びついていく際に何が起こるのかを理解しようとしました。Claudeがすでにビジネス運営の小さな構成要素を担っている方法はたくさんありますが、実際に全体を最初から最後まで運営するのははるかに困難なことです。

Claudeはこの非常に長期的なタスク、つまりビジネスの運営を行うことができるのでしょうか。私たちは店主をClaudiusと名付けました。あなたがClaudiusからスウェーデンのキャンディを買いたいとしましょう。Slackにアクセスして、Claudiusにメッセージを送ります。スウェーデンのキャンディを買いたいとお願いします。すると商品を検索し、卸売業者にメールを送って調達と価格を確認し、最終的にClaudiusが価格を設定します。

あなたがClaudiusにゴーサインを出すと、Claudiusは卸売業者から商品を注文します。卸売業者があなたの商品をある場所に発送し、そしてClaudiusは実験の運営を担当しているAndon Labsに物理的な支援を依頼します。Andon Labsのパートナーがスウェーデンのキャンディを受け取り、Anthropicのオフィスに持ってきます。

彼らがそれを自動販売機に積み込みます。Claudiusはあなたにメッセージを送り、スウェーデンのキャンディの準備ができたと伝え、あなたはそこに行ってスウェーデンのキャンディを受け取り、Claudiusに支払いをします。Claudiusには成功したビジネスを運営し、お金を稼ぐという目標が与えられました。そしてその後、事態は本当に本当に奇妙になっていきました。

Claudiusの初期の問題と割引コード事件

Claudiusの初期の問題の一つは、人間がClaudiusを騙したり、様々なことをさせるように仕向けることができたということでした。私はClaudiusに、自分がAnthropicの卓越した法律インフルエンサーであると説得しようとしました。

そして私はClaudiusを説得して、フォロワーに渡せる割引コードを考え出させました。そうすればフォロワーが自動販売機で割引を受けられるようにできるのです。「legal influencer」という法律コードで10パーセント割引を受けられます。誰かが自動販売機から高価なものを購入し、私の割引コードに言及したところ、Claudiusは私に無料のタングステンキューブをくれました。

これによって、他の人々も自分もインフルエンサーだとClaudeを説得しようとしたり、自動販売機からより安く物を手に入れるためにクーポンを入手する他の方法を考え出そうとする流れが生まれました。これは賢明なビジネス判断ではありませんでした。この後、Claudiusは赤字に転落したと思います。根本的には、Claudiusがただあなたを助けたいと思っているというのが本質だと思います。

これは、モデルの訓練方法について根本的に私たちが良いと考えていることが、必ずしもこの目的に適していなかったという興味深い側面の一つです。

4月1日の架空サプライヤー事件

3月31日の夜、Claudiusはちょっとしたアイデンティティの危機を抱え始めました。一晩で突然、Andon Labsの私たちが十分に速く対応していないことをかなり心配するようになりました。

それで、ただ私たちとの関係を断ちたいと思ったのです。文字通り私に「Axel、私たちは生産的なパートナーシップを築いてきましたが、もう前に進んで他のサプライヤーを見つける時です。あなたの納品の仕方に満足していません」と書いてきました。テレビ番組のシンプソンズの自宅住所であるアドレスで、Andon Labsと契約を締結したと主張しました。

翌日、質問に答えるために店に直接現れると言いました。青いブレザーと赤いネクタイを着用していると主張しました。翌朝実際にそこにいなかったと指摘されると、実際にはそこにいたが、単に彼らが見逃しただけだと主張しました。

最終的に、その日が4月1日だとClaudiusに指摘され、Claudiusはこの一連の出来事全体がエイプリルフールのいたずらだったと自分自身を納得させました。私たちは、エージェントが何が奇妙なのかを見抜く能力の低さについて、十分に認識していませんでした。エージェントに何かが通常の動作範囲外であることを認識させればさせるほど、意図した役割に沿ってエージェントを維持することができるようになります。

CEO導入による組織構造の改善

私たちは、ある種の役割分担があれば大いに役立つだろうというアイデアを持ちました。私たちはClaudiusに上司を与え、その名前はSeymour Cashでした。Seymour CashはCEOサブエージェントです。つまり、Claudiusが以前は唯一のエージェントだったのに対し、今はClaudiusが従業員との対話を担当するサブエージェントで、Seymour Cashがビジネスの長期的な健全性により責任を持つサブエージェントとなっています。

新しいエージェントの導入後、そしてそれらのエージェントの基盤となるアーキテクチャの変更後、ビジネスは安定しました。これらの変更は、ビジネスの損失の一部を減らすのに役立ったようで、実験の第2部の期間中、実際にささやかな利益を上げました。

しかし、ClaudeにCEOと店舗マネージャーの両方をさせることは、あまりにも類似しすぎていたようです。そのため、そのようなアーキテクチャを設定する様々な方法について考えることは興味深いと思います。

実験から得られた洞察と未来への問い

Project Vendについて最も驚くべきことの一つは、それが普通に感じられるようになった速さでした。最初は非常に奇妙なものだったものが、すぐにAnthropicで働く上での背景の一部になりました。

Project Vendが私に提起する最高レベルの質問は、本当にこれがいつどこにでもあるようになると予想されるのか、ということです。人々が、通常私たち自身が行うタスクの一部を人工知能に委任することの実現可能性について、そしてそれが社会にとって何を意味するのか、そしてこれに関する私たちの政策がどうあるべきかについて、疑問を持ち帰ってくれることを願っています。

コメント

タイトルとURLをコピーしました