AnthropicでClaudeのプロダクトを率いるボリス・チェルニーが、AIエージェントによる自動の旅行予約体験や、モデルの進化に伴うマインドセットの転換について語る。また、シリコンバレーなどで問題視されている、評価を上げるために無駄にAIトークンを消費する「トークンマキシング」の実態について議論し、過去のPC普及期との比較を交えながら、企業が真にAIの生産性向上メリットを享受するための組織変革の重要性を解説する内容である。

AIエージェントがもたらす自律的な予約体験と進化するモデルへの期待値
実は最近、複数の飛行機を予約するためにco-workを使ったばかりなんです。今月はあちこち飛び回る予定がありまして、ロンドンや東京でcode with Claudeのイベントが控えていますし、その道中にもいくつか立ち寄る場所があります。それで、これらの場所にこの時期に行きたいとco-workとやり取りをしました。全部で5か所、かなりの数の都市を巡る旅で、大まかなスケジュールはこのような感じでした。
私のメールやカレンダーに目を通してダブルチェックし、見落としがないか確認してほしいと頼んだところ、実際に見落としていた滞在地を2か所見つけてくれました。さらに、私が間違えて伝えていた日付もいくつか指摘してくれたのです。私が依頼した後に、AIがメールを確認しただけでこれらを見つけ出しました。
それから飛行機の予約を指示しました。私はそのまま別のコーディング作業、つまり自分の仕事に戻り、1時間後に戻ってみると、すでに8つの飛行機と5つのホテルが予約されていました。ホテルのうち1つだけエリアが少し間違っていたので、予約を取り直して変更するよう頼んだら、すぐに完了しました。それだけです。
実は、これはco-workやClaude Codeを使うたびに毎回試していることなのです。私なりのテストケースのようなものを持っていまして、自分が普段行う典型的な作業を、モデルが進化するたびに新しいモデルで再試行しています。そして、今回がこれまでに得られた最高の成果でした。co-workとOpus 4.7が組み合わさることで、このようなことが可能になる何かがあるのだと思います。
私にとって最も難しかったことの一つは、モデルが進化するにつれて、それが何をもたらしてくれるかという期待値を常に再調整しなければならない点です。もし1年前のモデルを使ったきりで、それ以降触っていない人たち、特にエンジニアと話をすれば、その人たちは、AIはコーディングがあまり得意ではないし、一度に数行以上書かせるのは信用できない、といったことを言うかもしれません。なぜなら、1年前のモデルはそういうレベルだったからです。当時はまだそれほど優れていませんでした。
しかし、現在に時間を進めて、そうした人たちに新しいモデルを試してもらうと、今では多くのエンジニアが実際にそうしているように、完全に別次元の体験になります。その能力はまったく異なっています。
毎月のようにできることが劇的に変わっていく、このようなテクノロジーを使ったのは私も初めてです。このテクノロジーのユーザーとしては、ある種大変なことでもあります。常に再学習し、挑戦し続けなければならないからです。以前は得意でなかったことに対して、次のモデルなら完璧にこなせるかもしれないという、常に初心者のようなマインドセットを持ってテクノロジーを試し続ける必要があります。
ですから、あなたが指摘しているようなビジョンこそが本質だと思います。これまでは、テクノロジーを使う際にはインターフェースの制約に従わざるを得ませんでした。ソフトウェア会社がスケールを意識して構築した仕組みの中で、自分には当てはまらないかもしれない多くの機能に付き合わされ、予約をする際にも自分が欲しいものは分かっているのに、あらゆる不要な飾り立てや手順を踏まなければなりませんでした。自分の好みを把握してくれるウェブサイトなど存在しなかったのです。
しかし今、パラダイムがシフトしています。そこには再びエージェントが存在するようになります。あなたの代わりに外に出て物事を処理し、あなたが望む形でオンラインでの体験を形作ってくれる存在です。これこそが人々が掴み取ろうとしているものであり、だからこそ、これほど爆発的な成長が見られるのだと思います。
トークンマキシングの実態と企業のAI利用における需要の真偽
ここで、その論説を少し検証してみたいと思います。このうちどれほどが現実で、どれほどが可能性に対する手放しの熱狂に過ぎないのか、現実を見つめ直すべき点があるのではないかと気になっていることを挙げさせてください。
まず、非常に大きな需要があることは確かですが、問題はその需要のうち、どれほどが純粋な需要で、どれほどがゲーム化された需要なのかという点です。シリコンバレーの内外で行われている、トークンマキシングと呼ばれる慣行があります。きっと耳にしたことがありますよね。企業が命令を下し、従業員にAIエージェントをできるだけ稼働させて大量のAIトークンを消費させようとする動きのことです。そして、最も多くのトークンを消費した人がリーダーボードで表彰されたり、物理的な行動ではなく、達成すべきAIアクションの目標を満たしたと見なされたりします。このトークンマキシングについての見解と、それが現在構築されている製品の利用動向において大きな割合を占めているとお考えかどうかをお聞きしたいです。
ええ、トークンマキシングが大きな割合を占めているとは思いません。これについてどう考えるべきかというと、実はAnthropicに参画する前、私はFacebookという大手テック企業で働いていました。私はまさに、トークンマキシングが行われているとされる企業の一つであるFacebookにいたのです。
その通りですね、その通りです。
はい。
そして、私の責任の一つは、Metaのすべてのアプリ、つまりFacebook、Instagram、WhatsAppにわたる全コードの健全性を管理することでした。なぜコードの健全性、本質的にはコードの品質といったものを重視するのかというと、コードの品質が非常に高ければ、エンジニアの生産性が向上するからです。生産性の向上に取り組む大規模なチームが存在していました。
Claudeのようなモデルが登場する前は、非常に長い時間をかけて取り組んでも、エンジニア1人あたりの生産性の向上は1年間でせいぜい1%から3%程度でした。それくらいのものだったのです。それでも当時はかなり大きな進歩と見なされていましたし、それは大変な苦労の末に勝ち取ったものでした。本質的に、多くのアイデアを試してようやく、このように生産性を向上させる何かを見つけ出すというプロセスでした。
それがClaudeの登場によって一変しました。現在ではAnthropicを含め、当社の最大の顧客の多くが、数百パーセントという単位での成果の向上を報告しています。当社が最後に報告した数値では、Anthropicのエンジニア1人あたりが書くコードの量は、Claude Codeを導入して以来、およそ250%増加しました。
これはコードの品質や信頼性、その他すべての要素を安定して維持したまま達成されたものです。それらの要素を後退させることなく、コードの量だけが大幅に増加しました。
ですから、このような生産性へのインパクトは非常に新しい現象であり、企業はどうすればこれを手に入れられるかを模索している段階なのだと思います。多くの企業がこの種の恩恵を目にしている一方で、まだやり方を探っている最中の企業もあります。そうした企業への私のアドバイスは、ほとんど常に同じです。
第一に、まずは全員にトークンを与えて、人々に実験をさせることです。トークンマキシングを必ずしも推奨するわけではありませんが、トークンを消費するたびに承認を求める必要がないよう、人々に実験を促すことをお勧めします。
第二に、人々に心理的安全性を提供することです。多くの場合、人々が革新を起こし、自らの生産性を高めるツールを構築するとき、彼らは生産性を向上させるために自分自身のワークフローを変更しています。数々のアイデアを試す中で、うまくいかないものもあれば、うまくいくものも出てきます。ですから、安心して実験に取り組み、新しいプロセスを見つけられるような心理的安全性を与えることが重要です。
予期せぬ場所から生まれるイノベーションと組織変革の教訓
そして、多くの企業が目にするのは、生産性の向上やイノベーションは、必ずしも想定していた人材から生まれるわけではないという事実です。昔であれば、誰もが組織内で最も生産性の高いエンジニアを指し示すことができました。しかし今日では、多くの改善がまったく予想だにしなかった人々からもたらされています。組織の片隅にいる会計士が、エンジニアでは思いもつかなかったような方法で会計業務を自動化してしまうかもしれません。あるいは、マーケターが想像もしなかった手法でマーケティングを自動化するかもしれません。新卒のソフトウェアエンジニアが素晴らしいものを構築することもあります。これは以前には起こり得なかったことです。
課題となるのは、こうしたエンジニアや人材を事前に特定できない点にあります。それが誰なのかは分からず、大抵の場合は驚かされることになります。したがって、行うべきことは人々に実験をさせ、安全性を与え、何らかのユースケースがスケールアップした段階で、初めてそれを最適化することです。事前の最適化は避けるべきです。競争を煽るようなやり方が、自社のカルチャーに合っている企業もあるのかもしれませんが、それならそれで素晴らしいことです。また、別の企業にとっては、私たちがAnthropicで行っているように、エンジニアが実験できるような安全性とスペースを作り出すやり方が合っているのかもしれません。それもまた素晴らしいことです。本当に企業次第だと言えます。
そうですね。言わせてもらえば、私も大量のトークンを消費していますし、常にツールを使っています。Claude CodeとClaude co-workは、どちらも私のビジネスにおいて非常に素晴らしい成果を上げています。私は1人で事業を運営していますが、実際には私の後ろにチームがあり、主にパートタイムベースでサポートしてくれているので、1人というのは少し語弊があるかもしれませんが、その話は別の機会にしましょう。
ただ、こうした話を読んでいると疑問に思うのです。大企業がこれら予算の大部分を占めており、そのインセンティブのあり方が、番組の冒頭で言ったように、これがどれほど持続可能なのかという懸念につながります。一部の場所ではインセンティブが不適切な方向を向いています。
これは最近のフィナンシャル・タイムズの記事ですが、Amazonのスタッフが利用実績のスコアを膨らませるために、不要なタスクにAIツールを使用しているという報道がありました。一部の従業員によると、トークンの消費量を増やすために、同僚たちがさらに不要なAIアクティビティを自動化するソフトウェアを使っていたとのことです。この動きは、Amazonが開発者の80%以上に対して毎週AIを使用するという目標を導入したため、テクノロジーを採用しなければならないというプレッシャーを反映したものだとされています。
私はこの内容についてAmazonの従業員に事実確認を行いました。すると、まさにその通り、これが現実に起きていることだという返答でした。その従業員は、目標を達成するために、毎日何時間も実行された後に削除される自動化処理を起動していると話してくれました。
あなたは、こうしたトークンマキシングが需要の大部分を占めているわけではないとおっしゃいましたが、これがほとんどの場所において例外であり、一般的な規則ではないことを示す、そちら側から見える証拠などは何かありますか。
ええ、このトークンマキシングのようなことをどれほどの企業が実施しているのかは分かりません。トレンドとして少し耳にしたことはあります。しかし、Claude Codeの顧客ベースに目を向けると、実に非常に多くの顧客が存在しています。ですから、どこか一つの企業が利用を牽引しているような状況ではありません。決してそのような形ではないのです。
ただ、少し視野を広げて、この種の変革がどのようにして起こるのかについて考えてみたいと思います。これらの企業がやろうとしていることのゴール、私は彼らを代弁するつもりはありませんし、直接彼らと話してみることをお勧めしますが、彼らが目指しているゴールはおそらく、組織の変革であり、ビジネスプロセスの変革です。どうすれば企業がAIから恩恵を受けられるようにするかという点です。
そして、これは往々にして不明確です。企業ごとにビジネスもカルチャーも組織も、物事の進め方も異なるため、企業に大きく依存します。
1990年代の古いハーバード・ビジネス・レビューの記事で、私が大好きなものがあります。タイトルは失念してしまいましたが、コンピュータは普及したのに、なぜ誰も生産性へのインパクトを目にしていないのか、といった内容でした。これは大きな疑問でしたよね。今日の私たちにとっては、コンピュータが生産性を高めてくれることは極めて明白です。信じられないほど当たり前のことです。
しかし、あの90年代当時、それは当たり前ではありませんでした。当時はパーソナルコンピュータが導入され始め、メインフレームに取って代わり、価格も手頃になっていました。そのため、平均的な企業やスタートアップでも購入できるようになり、メインフレームに何百万ドルも費やす必要はなくなっていました。
ところが、そこには課題があり、逆説的な状況が生じていました。企業はコンピュータを導入しているにもかかわらず、生産性の向上を実感できていなかったのです。一体何が起きていたのでしょうか。
そのハーバード・ビジネス・レビューの記事が主張していたのは、コンピュータから恩恵を受けるためには、ビジネスプロセス全体をコンピュータを中心に再構築しなければならないということでした。コンピュータを業務の進め方の中心に据える必要があるのです。もし依然として紙の書類をファイリングキャビネットに収め、引き出しに大量の書類を詰め込んでいるような、紙とペンによる物理的なプロセスのままで、コンピュータがその周辺にただ置かれているだけだとしたら、本当の恩恵は得られません。
しかし、ファイリングキャビネットを捨て、書類でいっぱいの机の引き出しを片付け、コンピュータを中心に据えてすべてのビジネスプロセスを行うようにすれば、恩恵を受けることができます。
そして、企業の間に分断が生じました。このかなり痛みを伴う変革を実行して恩恵を受けた企業もあれば、そうしなかった企業もありました。
現在の状況もそれと全く同じだと思います。多くの企業がAIの生産性へのインパクトからどのように恩恵を受けるかを模索しており、そこには多大な実験が存在し、誰もがその恩恵を手にするための異なるアプローチを試しています。正解となるアプローチが一つだけあるとは私は思いません。


コメント