AnthropicでClaude Codeを率いるボリス・チェルニーが、プロダクトの爆発的な成長の裏側やAIエージェントの未来について語る。シリコンバレーで話題の「tokenmaxxing(トークンマックス化)」の実態や、LLMの効率性とループ問題、そしてヤン・ルカンが提唱する世界モデルの必要性に対する現場目線からの反論など、テック業界の最前線で起きている変化を鋭く分析する内容である。

Claude Codeの驚異的な成長と市場の需要
信じられないほどの深い成長を目にしています。そしてそれは、さらに指数関数的な加速を続けているのです。Claude Codeは100%Claude Codeによって書かれています。co-workも100%Claude Codeによって書かれているのです。Anthropicの社内やプロダクト全体で、完全にClaude Codeによって書かれる機能がどんどん増えています。
私はコードを書きません。Claudeにプロンプトを出すだけです。そして実を言うと最近では、私がしていることの大半は、他のClaudeにプロンプトを出すためのClaudeを動かすことです。ですから、私はClaudeと会話すらしていません。私のClaudeが、別のClaudeたちと話しているのです。
プロダクトの爆発的な成長、ロードマップの次なる展望、そしてこのすべてが持続可能なのかどうかについて、Claude Codeの責任者であるボリス・チェルニーとお話ししていきます。
Big Technology Podcastへようこそ。この番組では、テック世界とその先にある話題について、冷静でニュアンス豊かな会話をお届けします。今日も素晴らしい内容をご用意しています。スタジオにAnthropicのClaude Code責任者、ボリス・チェルニーをお迎えしました。プロダクトのこと、その急激な普及の仕方、ロードマップの次なる展開、そしてもちろん、それが持続可能なのかどうかについて、すべてを語り尽くします。トークンマックス化やトークンの非効率性、そして当然ながら知識労働の未来といったトピックに切り込んでいきます。カバーすべきテーマには事欠きません。ボリス、お会いできて嬉しいです。番組へようこそ。
ありがとうございます。呼んでいただき光栄です。
では、まずはClaude Codeの成長について少しお話ししましょう。途方もない規模ですよね。先日のイベントで、AnthropicのCEOであるダリオ・アモデイが、同社プロダクトへの需要が前年比で80倍ほどに跳ね上がっていると話していました。去年の今頃、彼と話したときには、AnthropicのARR(年間経常収益)が40億ドルに達したことを非常に喜んでいたのを覚えています。今となっては、それすら遠い過去の数字に見えますね。現在の数字によれば、おそらく450億ドルほどになっているのではないでしょうか。そこだけで10倍の成長、そして需要は80倍です。問題は、会社がこの需要にどれだけ早く応えられるかという点にあります。世界中でこれを利用する人が増え続ける中で、Claude Codeがその需要のどれほどの割合を占めているのか、そして需要の伸びや利用状況についてどのような推移を目にしてきたのか教えてください。
エージェントの使い方やAIの活用方法は、単にAnthropicのプロダクト全般に限った話ではなく、特にClaude Codeにおいて顕著だと考えています。もちろんAnthropicには多くの異なるプロダクトがあります。Claude Codeがあり、Claudeのチャットがあり、Claude Designがあり、co-workがあり、さらにはAPIプロダクトもあります。Anthropicを体験する方法はたくさんあるのです。しかし、多くの人々にとって、Claude Codeが最初の入り口になっています。
ええ、成長は本当に異常なほどです。最初に社内でリリースしたとき、瞬く間に利用者が急増しました。そのため、Anthropicの外部にClaude Codeを公開する前から、これはヒット作になる可能性が非常に高いと感じていました。そして、Opus 4やSonnet 4をリリースした頃、これは去年の5月のことですが、成長はまさに指数関数的なものになりました。これほど急な成長曲線は見たことがありません。さらに、11月のOpus 4.5、今年2月の4.6、そして4.7へと進むにつれて、何度も何度も成長がさらに角度を上げて屈折し続けているのです。
私たちのチームには、テック業界で長く働いてきたメンバーがたくさんいます。これまでに、いわゆるユニコーン企業やハイパーグロースと呼ばれるプロダクトをいくつも経験してきました。テック業界では常にそうした話が上りますよね。しかし、そのチームの面々でさえ、これほどの成長は誰も見たことがありません。ですから私たちは今、どうすれば誰もがこの体験を継続できるようにできるか、どうすればこのペース、そして将来的には現在よりもさらに急になるかもしれないペースでの成長を維持できるかを見極めようとしています。私たちはその方法や、サービスをスケールさせ続ける方法について、本当に多くのことを学んでいる最中です。
1年前の時点では、AnthropicのAIモデルの利用の大半はAPI経由で行われていたことが明確でしたよね。たとえばコンサルティンググループのような企業が、銀行のシステムにそれを組み込み、銀行がいくつかの計算結果を要約するために使う、といったようなケースです。今のはあくまで一例ですが、当時のClaudeのチャットボットと比較すると、利用量でも収益でも、あらゆる面でAPIが圧倒的なライオンの分け前を占めていました。現在でもその状況は変わらないのでしょうか、それともClaude Codeがそれを追い抜こうとしているのですか。
混ざり合っている状態ですね。プロダクトがAnthropicにおいて1年前よりもはるかに大きな役割を果たしているのは間違いありません。それは確実な事実です。プロダクトの成長は加速しており、非常に速いペースで伸びています。同時にAPIの成長も加速しており、同じく非常に速く伸びています。私たちにとっては、その両方に投資を行っている状態です。私たちはプロダクト企業でなければなりません。研究所がプロダクトを構築すべき理由はたくさんあるからです。
実は、初期の段階ではこの方針は明確ではありませんでした。私が加わるより前の、Anthropicの歴史のごく初期においては、そもそもプロダクトを作るべきなのかどうか、それが本当にやる価値のあることなのか、活発な議論が行われていたのです。結果として、それは非常に価値のあることだと分かりました。注目を集めるというマインドシェアの観点からもそうですし、安全性(セーフティ)の観点からもそうです。根本的に、私たちはAIの安全性を研究するために存在しています。プロダクトを持つことは、その研究を行うためのより優れたツールを私たちに与えてくれるのです。
また、私たちは少人数の組織でもあります。そのため、世界にあるすべてのものを自分たちだけで構築することはできません。だからこそ、私たちはプラットフォームも提供しなければならないのです。管理されたエージェントやAPI、SDKなど、これらすべてのプロダクトを提供することで、人々がその上にシステムを構築できるようにしています。そして、何千、何万もの企業がその道を選択しています。
混ざり合っている、という答え方自体が非常に興味深いですね。つまり、現時点でどちらの規模が大きいのかは明かさないということだと受け止めました。
今はまだ言えないかもしれませんね。
分かりました。しかし、APIの方が大きいと一概に言えないという事実、あるいは混ざり合っていると言及すること自体が、Anthropicの自社運営プロダクトが凄まじい勢いで成長していることを物語っていますね。
さて、ここまでの背景として、これが指数関数的に成長しているものであるという前提を共有しました。それに伴い、Anthropicの収益もこのプロダクトと並行して指数関数的に伸びているのを目にしています。これはあなたが構想し、構築し、現在運営しているプロダクトです。視聴者の中には、そもそもClaude Codeとは何だろうと思っている方もいるかもしれません。私たちの視聴者の多くは当然それが何かを知っていますが、私がここに来る途中で、これをシンプルな一文で定義するとしたらどうなるか考えてみました。そして、「プレーンな英語(自然言語)でウェブサイトやソフトウェアを構築する方法」と書き出したのです。ただ、こちらに向かう途中で、それでは少し実力を過小評価しているのではないかとも思い直しました。あなたなら、これをどのように表現しますか。
それは実際にかなり的を射た表現だと思いますよ。
良かったです。それで行きましょう。多くの人がAIについて考えるとき、チャットボットを思い浮かべます。エンジニアにとって、1年半ほど前、私たちがClaude Codeを始める前のAIとは、大半の人にとってそういうものでした。しかし、ある時点で私たちは、モデルがコーディングにおいて非常に優れた能力を発揮し始めており、ツールの利用(ツールユース)にも非常に長けてきていることに気づいたのです。これらは私たちがかねてよりモデルに訓練させてきたことであり、しばらくの間、研究の方向性でもありました。それが商業的に有用になり始めたのが、約1年半前のことです。
そこでClaude Codeの開発において、私たちはひとつの賭けに出ました。当時、世界中の誰もがコードを書く際に行っていた方法、つまり基本的には高機能なテキストエディタを使うというアプローチから、あえて逸脱することにしたのです。私たちは、それよりもはるかに優れた、これまでに行われたことのない全く異なるアプローチができるのではないかと考えました。それは大いなる賭けでした。そうして私たちはClaude Codeを導入したのです。
当時のチャットボットとClaude Codeを分けた決定的な違いは、Claude Codeが「ツールを使える」という点にありました。これに尽きます。これが唯一の違いです。チャットボットの場合、ユーザーとAIの間でメッセージを行ったり来たりさせて会話をしますが、エージェント(そしてClaude Codeはエージェントです)は、ユーザーのツールを直接動かすことができるのです。
AIエージェントへのシフトとツール運用の実態
その「ツール」について、簡単に定義しておけますか。ツールの対象は、ブラウザの操作から、Cloudflareにログインしてそこである種のエージェントを設定するようなことまで、何でも含まれると考えて間違いありませんか。つまり、このプロダクト自体が何をするかというよりも、このプロダクトが何にログインして、オンラインで利用可能な多様なプロダクトを使って何ができるか、という話になってくるわけですね。
その通りです。あらゆる異なるツールを接続することができます。ブラウザを使うこともできますし、コンピュータを操作することもできます。たとえば、コンピュータ上のファイルを編集するという極めてシンプルな操作でさえ、1年半前にはそれを実際に実行できるAIプロダクトは存在しませんでした。しかし、それこそがClaude Codeが最初にできるようになったことだったのです。デスクトップ上のファイルを編集すること。デスクトップに大量のファイルがあれば、それを整理することができます。Claude Codeやco-workは、ユーザーが許可を与えれば、そうしたアクセス権を持つことができるのです。
承認すれば、ということですね。
ええ、承認を与えればそれが可能です。そしてこれは魔法のようです。この小さな違いが、人々がこのプロダクトを使う方法を完全に変え、このプロダクトがユーザーのために何をもたらすことができるかを根底から変えてしまうのです。
掘り下げて考えると、根本的な部分として、AIは単なる「自動補完の優秀な道具」からシフトしたように思えます。根本的なレイヤーにおいて、AIは次に何が来るかを予測しているに過ぎないわけですから。機械学習を大規模なデータセットに適用する場合、住宅ローンが債務不履行になるかどうかを予測し、銀行が融資を行うべきかを判断する。文章であれば次の単語を予測し、コードであれば一連のシーケンスの中で次のコードの断片を予測する。それが第一世代だったと思います。
しかし、あなたが今話しているのは、自然言語のプロンプトを与えた後、マシンが実際に自ら進んでコードを書き、ツールに接続し、ユーザーに代わって処理を実行できるということです。私の認識が間違っていなければ、ここでのユースケースは、開発者がこれに接続してClaude Codeでコードを書くという、主に彼らによって牽引された爆発的な普及から、第二の勢力へと広がっています。つまり、私のような非技術系の人間が、AIエージェントであるClaude Codeに指示を出して、業務フローのソフトウェアやウェブサイトを作らせたり、あるいはその派生プロダクトである、より手軽な姉妹プロダクトとも呼べるClaude co-workを介してコンピュータの制御を任せたりする形です。ブラウザへのアクセスを許可して、私がどんなフライトの予約を好むかを知っているエージェントに「数週間後にインドに行く必要があるから、フライトを予約して」と告げるような世界ですね。
ええ、まさにその通りです。実は私自身、ちょうど先日co-workを使っていくつかのフライトを予約したところです。今月はロンドンや東京で開催される「Code with Claude」などのイベントがあり、その道中にもいくつかの滞在地があるため、何度も飛行機に乗る予定があります。そこでco-workとやり取りをしました。「この時期にこれらの場所にいる必要がある」と伝え、それは5つの目的地に及ぶ、かなりの数の都市を巡るスケジュールでした。大まかな予定を渡し、私のメールやカレンダーを確認して、何か見落としがないかダブルチェックするよう指示したのです。
すると、私が失念していた2つの滞在地と、私が間違って伝えていたいくつかの日付を、エージェントが実際に見つけ出しました。私がそう指示した後に、メールを調べることでそれを見つけたのです。それからフライトを予約するように指示し、私は別の作業のためにコーディングや仕事に戻りました。1時間後に戻ってみると、8つのフライトと5つのホテルがすべて予約されていました。そのうちの1つのホテルは、少しエリアが間違っていたのですが、予約を変更して修正するよう頼むと、すぐに完了しました。それだけのことです。
私は実際に、新モデルが登場するたびに、Claude Codeやco-workでこうした共通のタスクをテストケースとして何度も再試行しています。モデルが進化するにつれて試すのですが、今回の結果はこれまでで最高のものでした。co-workとOpus 4.7の組み合わせには、これを成し遂げる何かがあります。
私にとって最も難しいことのひとつは、モデルが向上するにつれて、それが何を実行できるかという期待値を常に再調整し続けなければならない点にあります。特に1年前のモデルを使い、それ以降触れていない人と話をすると、「いや、コーディングはあまり得意じゃないし、一度に数行以上書かせるのは信用できない」と言うかもしれません。なぜなら、1年前のモデルはそういう状態だったからです。まだそれほど優れてはいませんでした。しかし、今日に時間を進めて、そうした人たちに新しいモデルを試してもらうと(実際に増え続けるエンジニアがそうしているように)、それは全く異なる体験になります。能力そのものが完全に別次元なのです。
毎月のように、できることの段階的な変化(ステップチェンジ)が起きるテクノロジーというのは、これが初めての経験です。このテクノロジーのユーザーとしては、常に再学習し、再試行し続けなければならないため、かなり大変なことでもあります。以前はうまくいかなかったことに対して、常に「初心者の心(ビギナーズマインドセット)」を持ってテクノロジーを試す必要があります。なぜなら、次のモデルになれば、それが完璧にこなせるようになっているかもしれないからです。
あなたが描いているビジョンを要約すると、効果としてこういうことですね。以前であれば、テクノロジーを使う際にはインターフェースの制約に従う必要があった。ソフトウェア企業はスケールを重視してシステムを構築するため、自分には適用できないような多くの機能が詰め込まれており、何かを予約しようとするたびに、自分の好みを把握していないウェブサイトで、あらゆるお決まりの操作をこなさなければならなかった。
今やそのパラダイムがシフトし、再びエージェントの時代が到来している。外に出てユーザーのために処理を実行し、オンラインでの体験をユーザーが望む形に形成してくれる存在です。それこそが、人々が飛びついている理由であり、現在起きている爆発的な成長の背景にあるものだと思います。
トークンマックス化(Tokenmaxxing)の実態と組織の変革
しかしここで、そのテーゼに対して少し負荷テスト(プレッシャーテスト)を行いたいと思います。この動きのどれほどが本物で、どれほどが可能性に対する無邪気な熱狂に過ぎないのか、現実的な見極めが必要な部分を提起させてください。
第一に、これほど大きな需要がある一方で、その需要のどれほどが純粋なもので、どれほどがゲーム化(操作)されたものなのかという疑問があります。シリコンバレーの内外で起きている慣行として、「tokenmaxxing(トークンマックス化)」と呼ばれるものがあります。きっと耳にされていますよね。企業が命令を下し、従業員に対してAIエージェントを可能な限り動かして大量のAIトークンを消費させるというものです。そして、最も多くのトークンを消費した人がリーダーボードで表彰されたり、物理的な行動ではなく、達成すべきAIアクションの目標を満たしたとして評価されたりします。構築されているプロダクトの利用状況において、このトークンマックス化が大きな割合を占めていると考えているか、あなたの見解を聞かせてください。
ええ、トークンマックス化が大きな割合を占めているとは思いません。これについてどう考えるべきかというと、実はAnthropicに加わる前、私は大手テック企業のFacebook(現Meta)に勤務していました。
まさにトークンマックス化を行っているとされる企業のひとつですね。
その通りです。そこでの私の責任のひとつは、Metaのアプリ全体、つまりFacebook、Instagram、WhatsAppにわたるすべてのコードの健全性を管理することでした。コードの健全性、つまり基本的にはコードの品質のようなものを気にかける理由は、コードの品質が非常に高ければ、エンジニアの生産性が向上するからです。そこには生産性を専門に扱う巨大なチームが存在していました。
モデルが登場する前、Claudeが登場する前は、非常に長い時間をかけて取り組んでも、1人のエンジニアあたりの生産性の向上は、1年間を通じてわずか1%から3%程度という世界でした。それくらいの規模です。そして、それは非常に苦労して勝ち取る種類のものでした。基本的には多くのアイデアを試し、最終的にそうした生産性向上をもたらす何かを見つけ出すのです。
しかし、Claudeによって起きた変化は、現在Anthropicをはじめ、私たちの最大の顧客企業の多くが、数百パーセントのオーダーでの生産性向上を報告しているという事実です。私たちが最後に報告した数字では、Anthropicのエンジニア1人あたりが書くコードの量は、Claude Codeを導入して以来、およそ250%増加しました。しかも、コードの品質や信頼性など、あらゆる要素を安定した状態に保ったままで、です。それらが退歩することなく、コードのボリュームが大幅に増加したのです。
ですから、このような生産性へのインパクトは極めて新しい現象であり、多くの企業がどうすればこの恩恵を享受できるか模索している段階なのだと思います。多くの企業が実際に成果を出している一方で、まだ方法を掴もうとしている企業もあります。そうした企業への私の助言は、ほとんどいつも同じです。
第一に、まずは全員にトークンを行き渡らせ、自由に実験させることです。必ずしもトークンマックス化を推奨するわけではありませんが、すべてのトークン消費に対して一々承認を求めなくても済むように、人々に実験の場を与えるべきです。
第二に、人々に心理的安全性(サイコロジカルセーフティ)を提供することです。多くの場合、人々がイノベーションを起こし、自らの生産性を高めるツールを構築するとき、彼らは自分自身のワークフローそのものを変革しています。多くのアイデアを試す中で、うまくいかないものもあれば、うまくいくものもあります。そのため、実験を行うことや、新しいプロセスを見つけ出すことに対して安心感を持てるような心理的安全性が必要なのです。
そして、多くの企業が目にするのは、生産性の向上やイノベーションは、必ずしも想定していた人物からは生まれないという事実です。昔であれば、誰もが「彼らが最も生産性の高いエンジニアだ」と指し示すことができました。しかし今日においては、多くの改善が、全く予想もしなかった人物からもたらされています。組織の片隅にいる会計士が、エンジニアでは思いもよらなかった方法で会計業務を自動化してしまうかもしれません。あるいは、マーケターが想像もつかなかった方法でマーケティングを自動化するかもしれません。新卒のソフトウェアエンジニアが、素晴らしいものを構築することもあります。これは以前には起き得なかったことです。
課題は、こうしたエンジニアや人材を事前に特定することができない点にあります。誰がそれを成し遂げるのか分からず、ほぼ常に驚かされることになります。したがって、行うべきは人々に実験を許し、安全な環境を与え、何らかのユースケースがスケールアップした段階で、初めて最適化を考えることです。事前の段階から最適化を急いではいけません。
ですから、それを競争のような形で行うことが自社のカルチャーに合う企業にとっては、そのやり方も素晴らしいと思います。一方で、私たちがAnthropicで行っているように、エンジニアが実験できる安全性とスペースを作り出すというアプローチが合う企業にとっては、それもまた素晴らしい方法です。それは本当に企業次第です。
言わせてください、私は多くのトークンを消費していますよ。常にツールに触れています。Claude CodeもClaude co-workも、私のビジネスにおいて非常に素晴らしい成果を上げてくれています。私は個人で運営していますが、実際にはパートタイムで支えてくれるチームのメンバーがいるので、個人と言うのは少し語弊があるかもしれませんが、それはまた別の番組の話ですね。
しかし、これらの記事を読むと、大企業がこうした予算の大部分を占めており、そのインセンティブ(動機付け)がいくつかの場所で歪んだ形で機能しているのではないかと疑問を抱かざるを得ません。番組の冒頭で「これはどれほど持続可能なのか」と問いかけましたが、インセンティブが健全ではない場所があるのです。これは最近のフィナンシャル・タイムズの報道です。「Amazonのスタッフが、利用スコアを水増しするために不要なタスクにAIツールを使用している。一部の従業員は、同僚たちがトークンの消費量を増やすために、余計で不要なAIアクティビティを自動化するソフトウェアを使っていると証言した。この動きは、Amazonが全開発者の80%以上に毎週AIを使用させる目標を導入したことで、テクノロジーの採用へのプレッシャーが反映されたものだと彼らは語った」とあります。
私はこの内容をAmazonの従業員に確認(ガットチェック)したのですが、「その通り、それが現実に起きていることだ」と言っていました。彼が言うには、目標を達成するために、毎日何時間も走り続けてから消去される自動化処理をトリガーしているとのことです。あなたはこうしたトークンマックス化の動きが需要の大きな部分を占めているとは考えていないとのことですが、これが大半の場所において一般規則ではなく、あくまで例外的な特異値(アウトライアー)であることを示す証拠が、あなたの側から何か見えているのでしょうか。
ええ、このトークンマックス化という現象をどれほどの数の企業が実施しているのかは私には分かりません。トレンドとして少し耳にしたことはあります。ただ、Claude Codeの顧客に目を向けると、非常に多くの、多様な顧客が存在しています。ですから、特定の1社が全体の利用量を牽引しているというような状況ではありません。それだけは確かです。
少し視野を広げて、このような変革がどのように起きるのかについて考えてみたいと思います。これらの企業がやろうとしていることのゴールは(彼らを代弁するつもりはありませんし、直接彼らと話すことをお勧めしますが)、おそらく組織の変革やビジネスプロセスの変革なのだと思います。どうすれば自社がAIの恩恵を受けられるようにするか。これは往々にして不透明です。企業ごとにビジネスもカルチャーも組織構造も、業務の進め方も異なるため、非常に企業依存度が高いのです。
90年代のハーバード・ビジネス・レビューの古い記事で、私がとても気に入っているものがあります。タイトルは失念してしまいましたが、内容は「コンピュータは普及したのに、なぜ誰も生産性へのインパクトを目にしていないのか」という問題提起でした。これは当時、大きな疑問でした。現在でこそ、コンピュータが私たちの生産性を高めてくれることは信じられないほど自明(オブビアス)な事実です。しかし、あの90年代においては、それは自明ではありませんでした。
当時何が起きていたかというと、パーソナルコンピュータが導入され、メインフレームを置き換え、手頃な価格になっていきました。平均的な企業やスタートアップでも購入できるようになり、メインフレームに何百万ドルも費やす必要がなくなったのです。しかし、そこに挑戦とパラドックスが存在していました。企業はそれを採用しているにもかかわらず、生産性の向上が見られなかったのです。一体何が起きていたのか。
そのハーバード・ビジネス・レビューの記事が主張したのは、コンピュータから利益を得るためには、業務プロセス全体をコンピュータを中心に据えて再構築(リストラクチャー)しなければならない、ということでした。コンピュータが業務のやり方の中心になければならないのです。もし、いまだに紙の書類を詰め込んだファイリングキャビネットがあり、引き出しが書類でいっぱいで、紙とペンによる物理的なプロセスが続いており、コンピュータがその周辺部に置かれているだけであるなら、本当の意味での恩恵は得られません。
しかし、ファイリングキャビネットを捨て、書類でいっぱいのデスクの引き出しを片付け、コンピュータを中心に据えてすべてのビジネスプロセスを動かすようにすれば、恩恵を受けることができます。そして、当時企業の間には明確な分岐が生じました。このかなり痛みを伴う変革を実行して恩恵を受けた企業と、そうしなかった企業です。
現在の状況もそれと全く同じだと考えています。多くの企業が、AIがもたらす生産性のインパクトからどのように利益を得るかを見極めようとしており、そこには膨大な試行錯誤が存在します。どのように利益を出すかを見出すために、誰もが異なるアプローチを試している段階なのです。正解となるアプローチがひとつだけあるとは思いません。
なるほど。Claude Codeの成長やAnthropicの成長がこれほど速い性質のものであるとき、こうした事柄を徹底的に議論し、あなたの視点を聞くことは非常に有益ですね。
LLMの効率性と自律ループ問題
さて、それがトークンマックス化のお話でした。トークンとはもちろん、モデルが出力する単語や単語の断片であり、またモデルに入力される単語やその断片のことですよね。そして、それこそがこれらAI企業が課金する基準であり、トークンが増えれば増えるほど、より多くのデータセンターが必要になる、といった仕組みです。
モデルが進化するにつれて、時に「これらは本来あるべき効率性を備えているのだろうか」と疑問に思うことがあります。これらの大型モデルは、出力が素晴らしいものであっても、 basic(基礎的)なタスクに対して時に膨大な仕事をこなし、大量のトークンを消費することがあります。人々は「本来なら極めて簡単なプロセスであるはずの場所で、モデルが多大なトークンを浪費し、効率的にゴールに到達できていないのではないか、それがトークンの需要を不当に押し上げているのではないか」と懸念しています。
ひとつ例を挙げさせてください。私はPowerPointのプレゼンテーションを作成するためにClaude co-workを使っています。非常に優秀にこなしてくれます。Opus 4.7モデルを使っているのですが、数回ほど「よし、その作成しているファイルをPDFとして出力(シップ)してくれ」と指示したことがありました。すると、モデルが突然理性を失った(ルーズ・マイ・マインド)ような挙動を始めたのです。ぐるぐるとサイクルを繰り返し、利用可能なあらゆるツールを片っ端から使い始め、どうしてもPDFを出力することができないように見えました。
最終的に、私は何度も「違う、君はそのPowerPointを作っているんだ、場所は分かっているはずだ、それを出力しろ」と言い続けました。するとモデルは「お詫び申し上げます。実際には私たちの行く手を阻んでいなかった制約について思い悩み、泥沼(ラビットホール)にハマり込んでいました。ファイルはそこにあります」と返し、それからファイルを出力したのです。こうしたモデルの効率性について少しお話しいただけますか。そして、Opus 4.7のようなモデルが基礎的なタスクを行う際に見せる、こうした「ループ(輪)」に入り込んでしまう現象は、正当な懸念材料なのでしょうか。
一般的に、私たちがモデルについて考えるとき、いくつかの異なる側面があります。ひとつは「どれほど賢いか(インテリジェンス)」、もうひとつは「どれほど速いか」、そして「どれほど効率的か」です。私たちは通常、これらすべてを並行して進化させようとしています。
ただ、これらの中で、私たちはおそらく「賢さ(インテリジェンス)」を最優先に最適化すべきだと考えています。それが最も重要なことだからです。たとえ少し効率が落ちたとしても、より賢くなり、より多くのことができるようになるのであれば、それは極めて有用です。なぜなら、効率性の最適化はその後からついてくるものだからです。まずモデルをより賢くし、その後に効率的にする。そういう順番で進めています。
私たちは、ユーザーにこれに対するコントロールをどのように提供すべきか、様々な実験を行ってきました。私たちが常に正しいデフォルト(初期設定)を把握できているとは限らないからです。実際にそれを使っているユーザーの方が、状況をよく理解している場合があります。
そのための仕組みのひとつが、モデルの選択です。Opus、Sonnet、あるいはHaikuを選ぶことができます。
Opusが最大で、Sonnetが中間、Haikuが最小ですね。
その通りです。これは単純にモデルのサイズの話ですね。そして、もうひとつの実験的なアプローチが「努力量(エフォート)」の調整です。この言葉は実際に非常に説明的(ディスクリプティブ)で的を射ていると思います。そのタスクに対して、どれだけの努力を投入させたいか、という設定です。ユーザーはこれを設定することができます。推奨される努力量というものがあり、たとえばOpus 4.7で賢さを最大限に引き出したい場合は、「極めて高い(エクストラハイ)」、あるいは「最大(マキシマム)」の努力量を使用します。しかし、もしトークンの消費を抑えたいのであれば、「中間(ミディアム)」や「低い(ロー)」の努力量を選択することができるのです。これはユーザーが持っている制御権です。
ええ、先日の番組でもこの話題を取り上げました。その際、あるコメントが寄せられたのですが、私は「これらの大型モデルはいずれ、先ほどのPDF出力のような問題に対して、より効率的な解決策を見出すだろう」という意見を持っていました。しかし、そのコメンターは次のように書いてきたのです。「アレックス、彼らはそのPDF問題のような事象を修正することはできない。それはLLMテクノロジーの根源的な性質に起因するものであり、エージェント型AIが広く普及し有用に使われるための最大の障壁だ」と。
彼が言わんとしていたことを翻訳すると、私たちが先に予測の話をしたように、これはすべて確率論的な仕組みに基づいている。次にくる単語を予測しているに過ぎない。AIエージェントから同じ答えが二度返ってくることはない。したがって、この種の現象は彼らの動き方の仕様(フィーチャー)であり、修正不可能なバリエーションである、ということだと思います。どう思われますか。
いいえ、それは正しくないと思います。ズームアウトして、少し広い視野で考えてみましょう。
まず、エンジニアが最初の開拓者(アタプター)でしたよね。エンジニアがClaude Codeを使い始めたのは約1年半前で、それは非エンジニアの人々が意味のある形でエージェントを使い始める前のことでした。co-workなどが登場する前の話です。1年半前のClaude Codeがどうだったか思い返すと、決してそれほど優れたものではありませんでした。少しのコードを書かせるために使うことはできましたが、機能全体やプロダクト全体を構築する仕事を完全に信頼して任せられるかと言えば、良い結果にはなりませんでした。当時も同じような現象、つまりスパイラル(螺旋状のループ)に陥ったり、品質が良くなかったり、構築されたコードが劣悪だったり動かなかったり、ということが起きていたのです。
しかし、ある時点で、それは単純に向上し始めました。モデルが進化し、Claude Codeが改良されるにつれて、結果はどんどん良く、良くなっていったのです。そして今日に時間を進めると、Claude Codeは100%Claude Codeによって書かれています。co-workも100%Claude Codeによって書かれています。Anthropicの社内やプロダクト全体で、完全にClaude Codeによって書かれる機能がどんどん増えているのです。
これは顧客企業からも同じように耳にすることです。昨日、スタートアップのインキュベーターであるY Combinatorで講演を行ったのですが、参加者に手を挙げてもらいました。全員がClaude Codeを使っている状況で、「現在、自分のコードの100%がClaude Codeを使って書かれているという人は手を挙げてください」と尋ねたところ、約半数の手が上がりました。次に、「AIを使って書かれたコードが0%であるという人は手を挙げてください」と尋ねると、上がった手は1つだけでした。約100人がいる部屋でのことです。その1人の人にも敬意を表しますが(パワー・トゥ・ザ・パーソン)。
もちろん、そこにはまだ開拓の余地が残されているのは明らかですが、それ以外の人々は全員、その中間のどこかに位置していました。大半のコードがClaude Codeで書かれているけれど、すべてではない、という状態です。しかし、それこそが今日のモデルが到達している地平なのです。1年前はそこにはいませんでした。1年前は、そのようなことをこなせるほど優れてはいなかったのです。
ですから、これこそがまさに今、皆さんがco-workの進展において目にしていることそのものです。まだ初期段階(アーリーデイズ)です。リリースしたのは、ほんの数ヶ月前のことですから。プロダクトが良くなり、モデルが良くなるにつれて、これは向上し続け、さらに良くなっていきます。しかし、まだ初期の段階です。今日co-workを使っている人は全員が早期採用者(アーリーアダプター)であり、今日AIを使っている人でさえ全員が早期採用者です。世界には膨大な数の人間がいますが、大半の人はまだ意味のある形でAIを試していません。ですから、これを向上させる余地はまだまだ残されているのです。
ユーザー体験の進化とレートリミット(利用制限)の課題
私たちは6月18日にここサンフランシスコでイベントを開催する予定なのですが、マーケティング資料の多くをco-workで作成しました。もちろん、行ったり来たりのやり取りをしています。ワンショット(一発)でそのまま出させるわけではなく、テキストのコピーを確認しながら進めていますが、ポッドキャストの成長を示すためにダウンロード統計のデータをアップロードする、といったようなことをさせています。
そして、登壇者の名前を渡すと、イベントのプロスペクタス(趣意書)を構築する能力が本当に驚異的(インセイン)なのです。イベントがどのようなものになるのか、どのようなオーディエンスが集まるのか、誰が話すのか、なぜそこに参加すべきなのか、どのように連絡を取るべきなのか。凄まじいです。本当に素晴らしい出来栄えです。
あなたが初めてそれを使ったとき、そしてエージェントがあなたのツールを実際に動かすのを目にしたとき、最初のリフレクション(感覚)はどのようなものでしたか。
私の場合は、当然ながら、あらゆる権限を有効化(イネーブル)して臨みました。これは多くの人が経験してきたことだと思いますが、Claudeのブラウザ拡張機能を入れたとき、この恩恵を最大限に受けるためには、あるいは最大のメリットを得るためには、Claudeにブラウザの制御を委ねて代わりに処理を実行させるしかない、と気づく瞬間があります。
その体験は、私が自動運転車のWaymo(ウェイモ)に乗ったときの感覚とほとんど同じでした。最初の数回の右左折のとき、私はハンドルを握るかのように手を固く握り締め(ホワイトナックリング)、注視し、すべてを確認して承認すべきかどうか緊張していました。しかし、少しずつ信頼し始めるようになると、ただ「承認、承認、承認」とボタンを押し続けるようになりますよね。Waymoでも同じです。「よし、どうやらこれで死ぬことはなさそうだ」と分かると、5分後にはAIが運転している横でスマホを見ている。それが、コードやco-workにおける私の経験でした。そうした感覚と一致しますか。
ええ、それはまさに私の経験とも一致します。あらゆるテクノロジーがそうであるように。
以前、時間をかけてco-workの使い方を学んでいる友人の様子を見ていたのですが、彼女はエンジニアではありません。先日、このようなユースケースがありました。彼女のコンピュータに言語入力の設定(ノートパソコンで言語を切り替える機能)があり、そこに何らかの問題が発生して、どうすれば修正できるか分からずに困っていたのです。以前であれば、彼女がしたであろう行動は、Googleに行って「パソコンで起きているこの言語の問題をどうやって直せばいいか」と検索することでした。
しかし今回、彼女は単純にco-workに尋ねたのです。するとco-workは「分かりました、ちょっと見てみますね。あなたのコンピュータを操作してもいいですか」と返し、彼女が「はい」と答えると、コンピュータの制御を引き受けました。すると画面が独特の「オレンジ色の輝き(オレンジグロウ)」を帯び、co-workが設定を開き、言語ピッカーで何が起きているかを確認し、診断を下して修正していく様子を、ただ見守ることになります。
ユーザーは依然として運転席(ドライバーズシート)に座っているため、起きていることを目にすることができますし、監視(モニター)することも可能です。背景の隠れた場所で勝手に処理が進んでいるわけではありません。しかし、それはまさに魔法のようです。私自身の本能であればGoogleを開くところだったので、彼女がこの問題に対してco-workを使うようになったのは、非常に面白い変化だと感じました。
これは私自身も常に感じていることです。これらのプロダクトの進化と共に育ち、以前のバージョンを知っている人々は、そこまで野心的(アンビシャス)になれない傾向があるかもしれません。しかし、プロダクトに新しく触れる人々を見ていると、私が思いもよらなかったような事柄にClaude Codeやco-workを使っているのをよく目にします。それは本当に驚くべきことで、極めてクリエイティブです。彼らの姿を見るたびに、私自身多くのことを学んでいます。
ええ。ただ、現時点における最大の欠点、そしてあなたがX(旧Twitter)で人々へ返信しているのも目にしていますが、それは「レートリミット(利用制限)」の問題だと思います。「Claude Codeを試してみたけれど、もう使うのをやめた」と言う人がいるとき、その典型的な理由は、トークンの割り当てを使い果たしてしまったからです。1時間ほど動かしただけで制限がかかり、再び使うために4時間待たなければならず、別の代替手段を探しに行ってしまう。
このレートリミットという問題は、プロダクトが成長する能力に対してどのような影響を与えてきたと考えていますか。また、人々がそうした制限を気にせずに利用できるようにするための計画があれば、教えてください。
それについては、現在私たちが精力的に取り組んでいる最中です。現実をお話しすると、実際にレートリミットに達しているユーザーは全体の極めて小さな割合に過ぎません。これはプロユーザー(Proプラン)にとっては少し意外かもしれませんが、Maxユーザー(Maxプラン)においては、実は非常に低い割合なのです。
ただ、人々がその不満を口にする背景には、いくつか同時に起きている事象があります。第一に、私たちは実際に一時的にピーク時のレートリミットを削減した時期がありました。現在はすでにそれを撤回(ロールバック)し、実際にはレートリミットを2倍に増やしています。つまり、人々により多くの制限枠を提供しているのですが、一時期、それを削減していた短い期間があったため、人々がそこに直面してしまっていたのです。
第二に起きているのは、Claude Codeが非常に拡張性(エクステンシブル)に優れているという点です。人々はプラグインを使ったり、あらゆる種類のインテグレーション(統合機能)を利用したりできます。そして、これらのいくつかには、トークンを極めて非効率的な方法で消費してしまうものがあるのです。そのため、私たちが取り組んできたのは、その消費状況をユーザーに対して可視化(サーフェシング)することです。これによって、ユーザーはそのプラグインを使うべきか否かを判断できるようになります。自分のトークンの何パーセントがそこに費やされているかを目にすることができるからです。
そして第三に、純粋にヘビーユーザー(パワーユーザー)が急増しているという事実があります。最初にClaude Codeをリリースしたとき、人々は一度に1つのClaudeを動かしていました。しかし現在、私自身のコンピュータを例に挙げると、私はおそらく一度に5つのClaudeを同時に走らせています。さらに毎晩のように、毎晩とまでは言いませんが、大半の夜には、何百ものClaudeを同時に、すべて並列で走らせているのです。
何百も、時には何千もですか。
ええ、何百、時には何千もです。これは1年前には想像すらできなかったことです。そして当然ながら、これは大量のトークンを消費します。多くの人々が、こうしたはるかに多くのトークンを使用する新しいワークフローを見出し始めています。これは、Maxプランで実行できることの境界線(エッジ)にあるような領域です。だからこそ、API経由で支払うという選択肢も存在しています。必要なだけのトークンを確保したいのであれば、その方法を取ることも可能です。多くの大企業(エンタープライズ)が実際にそうしています。
テック大手の投資競争とデータセンターの供給力
少し前のことですが、AnthropicのCEOであるダリオは、OpenAIを引き合いに出して、開発のための巨額の支出(ビルドアウト)について言及していました。彼はその後もこの件について語っています。「私は規律(ディシプリン)を持った支出を心がけている」と。それでも、あなたが話したような機能を可能にするために、データセンターへ何十億ドルもの資金を投じているわけですが、彼が言うには、OpenAIのような他社は「YOLO(人生は一度きり、お気楽に突っ込む姿勢)」でやっている、ということです。
しかし、現在のOpenAIもCodex(コーデックス)を擁してこれを展開しており、それをYOLOと呼ぶこともできるでしょうが、彼らは構築した膨大なデータセンターのキャパシティを持っています。これについてはどう考えていますか。なぜなら、ユーザーがこちらのレートリミットに直面したとき、彼らは単純にCodexへと流れてしまうかもしれないからです。非常に激しい競争が起きています。Anthropicの内部ではこの状況をどのように捉えているのでしょうか。外部からの見え方(パースペプション)としては、データセンターの構築に対するその「規律」が、結果として、両社が繰り広げている最も重要なプロダクトの争いにおいてユーザーを失う原因になりかねないのではないか、という懸念があります。
ええ、まず第一に、私たちの成長速度は現在、歴史上最も速い状態にあります。したがって、Claude Codeに関して言えば、成長はさらに加速しており、大半のユーザーが実際にはそれほど頻繁にレートリミットに達していないことがその背景にあります。制限に直面している人々に関しても、私たちはその体験を向上させることにレーザーのように集中(レーザーフォーカス)しており、そのため500あったレートリミットを2倍に増やしました。本日、週ごとのレートリミットをさらに引き上げることを発表しますし、もちろん、イーロン・マスクを介して、これらすべての新しいユーザーに対応するために稼働させた新しいColossus(コロッサス)のキャパシティについても発表したところです。
イーロンを介して、ですね。
イーロンを介して、です。なぜなら、この成長は本当に、誰も予測できなかった規模のものだからです。私たちの最も大胆な予測をも遥かに超えていました。ですから、私たちにとって最も重要なのは、ユーザーにサービスを提供することです。ユーザーに本当に満足してもらえるようにしたい。そのために、できる限りのあらゆる取り組みを行っています。
Codexには驚かされましたか。競合としてどのように見ていますか。
常に模倣者(コピーキャット)や競合は存在するものです。私にとっては、それは光栄なこと(フラッタリング)ですし、誰もがより良い仕事をせざるを得なくなる環境を作るという意味で、良い刺激だと考えています。ですから、私自身が最も大切にしているのは、ユーザーにサービスを提供するために自分たちができる最高の仕事をすることです。チームの全員に対して、毎日ユーザーと対話し、プロダクトを毎日少しずつ良くし続けるよう促しています。私が最も重視しているのは、その点にあります。
知識労働の未来と「指示を出す人間」のレバレッジ
分かりました。一度休憩を挟みたいと思いますが、カバーすべき内容はまだまだたくさんあります。これがコードの世界を超えてどのように広がっていくのか、チャットボットの未来、そして用意しているアジェンダを進めていきたいです。本当に2時間必要な内容ですね。では、一度ブレイクを入れて、戻ってきたら残りのテーマにできる限り切り込んでいきましょう。
Big Technology Podcastに戻ってきました。AnthropicでClaude Codeの責任者を務めるボリス・チェルニー氏とお届けしています。ボリス、素晴らしいお話をありがとうございます。先ほども言いましたが、私はあなたのプロダクトを毎日使っているので、こうして直接お話しできるのは本当に楽しいです。
ここまでの内容で、この技術がチャットボットという枠組みを遥かに超えて広がっていくという点に触れました。フライトの予約の話をしましたし、マーケティングのプレゼンテーションの話もしました。そして、私たちがこうして話している今週、新しいユースケースとして、Claude co-workが中小企業向けにQuickBooksを操作して簿記の業務をこなせるようになる、という展開も発表されました。これはどこへ向かっていくのでしょうか。この広大なロードマップは、最終的に私たちをどこへ連れていくのだと考えていますか。
私たちは、Claude Codeとco-workに関して、いくつかの大きなテーマを考えています。
ひとつは「賢さ(インテリジェンス)」の向上です。これはほぼ全面的にモデルの進化に依存しています。モデルが向上すれば、私たちはより野心的なタスクに挑むことができます。コーディングにおいては、かつては一度に1行のコードを書くことだったのが、今や機能全体やプロダクト全体を構築することへと進化しました。co-workに関しては、始まったのはごく最近のことですが、当初は書類を作成することだったのが、今やフライトの予約、複数のツールの組み合わせ、そしてQuickBooksの操作へと広がっています。この最前線(フロンティア)は、非常に、本当に非常に速いペースで進化し、移動し続けているのです。
私たちはまた、Claude Codeにおいて、より長時間を要するタスク(ロングランニング・タスク)をどのように実行するかについても考えています。最近、私たちは「オートモード(auto mode)」と呼ばれる機能をリリースしました。オートモードとは、基本的には、権限の承認を求めるプロンプト(パーミッションプロンプト)を置き換えるものです。これまでは、モデルがツールを使用するたびに、Claudeが「このツールを使ってもよろしいですか」とユーザーに尋ねる仕様になっていました。通常、ユーザーはただ「はい」と答えるわけですが、何度も何度も「はい」を押し続けるのは、次第に疲れてくるものです。
「常に許可する」のボタンですね。
そうです、まさにそのボタンです。しかし、セキュリティの観点から考えると、この承認に対して非常に慎重(ソートフル)であることは極めて重要なのです。私たちが気づいたのは、表示されるダイアログの数が多すぎるために、人々は一々真剣に考えるのをやめてしまい、疲弊(ファティーグ)してただ「はい」や「常に許可」を押すようになってしまうという現実でした。
その答えがオートモードです。これはツール呼び出しをルーティングする新しい方法です。仕組みとしては、Claudeがツールを使いたいとき、別のClaudeに対して「このツールを使うことは安全ですか」と尋ねるのです。その判断を行うClaudeは、一部のコンテキストを把握していますが、すべてのコンテキストを持っているわけではありません。そこには何層もの安全確認のレイヤーが存在します。私たちはこれを本当に安全なものにするために、何ヶ月もかけて改良を繰り返してきました。安全性を担保するために、何千もの異なるベンチマークや評価(エバルズ)を使用しています。
そして、実験室の設定(ラボラトリーセッティング)でも、実際の運用の現場(イン・ザ・ワイルド)でも、これが以前のアプローチよりも安全であることが実証されました。ユーザーにとっては、そこに座って何度も何度も「はい」を押し続ける必要がなくなるため、非常に素晴らしいメリットです。さらに、結果そのものも向上します。なぜなら、Claudeが提示する膨大なリストの中に、もし1つだけ不安全なコマンドが埋もれていたとしたら、人間であれば誤って「はい」を押してしまう可能性がありますが、オートモードを介して2つ目のClaudeに尋ねれば、それは絶対に「はい」とは言わないからです。これがひとつの大きな投資領域です。
そしておそらく、3つ目の大きなテーマは、より多くのClaudeを並列で実行することです。Claudeの非常に興味深い特徴であり、私たちがClaude Codeのユーザーの中にかなり初期から見出し始めていた現象ですが、現在、一度に1つのClaude Codeだけを動かしている人はほとんどいません。多くの人が、数個から数千個に及ぶ膨大な数のClaude Codeを同時に走らせています。そしてco-workに関しても、全く同じ現象が見られ始めています。co-workを動かすことに慣れてくるにつれて、ひとつのタスクを開始し、それから2つ目のタスクを開始して自分は次の仕事へ移る、というように、並列でより多くの処理をこなすようになるのです。この体験を非常に快適なものにし、人々にとってより明快なものにするための機会が、まだ無数に残されていると考えています。どのように行うべきか、いつ行うべきか、といった点ですね。
そしてそれはおそらく、チャットボットを使う方法そのものにも波及していきますよね。
Anthropicとチャットボットの間には、ある種の関係性(リレーションシップ)の変遷があって面白いです。最初はテクノロジー最優先で始まり、それからチャットボットを構築することを決めてClaudeを出荷し、その後はどちらかというと企業向け(エンタープライズ)へとシフトしていきました。あらゆるチャートに目を向けると、Claudeの順位は常に下位に位置していた時期もありました。しかし今、Claudeの利用量が急上昇しているのを目にしています。
ここで私の考えを述べさせてください。これについてあなたの意見を聞きたいのですが、チャットボットの未来とは、単に「私が質問を投げかけ、AIが回答を返す」というものではなくなる。そうではなく、「私が質問を投げかけるか、あるいは直面している問題について語りかけると、チャットボットの側から、私の代わりに実行できる何らかのアクションを提案してくる」という形になるのではないでしょうか。
たとえば現在、私がインドへの旅行について熱心に話しているとしたら、将来的に返ってくる反応は、あなたが先ほど言ったように、わざわざ別のステップを踏んでフライトを予約しに行く必要なく、よりプロアクティブなチャットボットが「分かりました、私がこれについてすべて手配しておきましょうか」と言ってくるような世界です。方向性として、そのような認識で合っていますか。
それは十分にあり得るシナリオだと思います。十分に想像できますね。
開発に取り組んでいますか。
エージェントこそが未来であり、私たちはそうした様々な実験を進めています。今言われたようなアプローチに近い試みも、いくつか行っていますよ。
Salesforce管理者募集の謎と企業の「防壁(モート)」
なるほど。しかし、この技術ができることには一定の限界(リミット)も存在しますよね。並列で何千ものClaudeを動かすことの限界を示す、少し皮肉めいた言及として、Anthropicがどのような職種を募集しているか、という点に注目が集まることがあります。私がAnthropicのサイトで一番気に入っている求人情報は、「Salesforce管理者」を募集しているというものです。また、企業がこのテクノロジーを導入(デプロイ)するのを支援するためのコンサルタントも募集しています。多くの人々は、これを「このテクノロジーだけでは、そこまでしか到達できない」という事実を暗黙のうちに認めている(タシット・アドミッション)と捉えています。
これについて、ウォートン・スクールのイーサン・モリック教授は次のように述べています。「AI研究所が本当に『人工超知能(ASI)』の到来を信じているかどうかを知る基準は、彼らが新しく結成したコンサルティンググループ、失礼、フォワード・デプロイ型エンジニアリンググループを解散したときだ。AIがどのように有用であるかを見極め、組織の変革やシステム統合を行うために人間が必要とされている限り、人間の雇用はかなり安全だと言える」と。これについてはどう考えますか。
ええ。私自身が日々行っているエンジニアリングの形に目を向けると、先ほども言ったように、私はコードを書きません。Claudeにプロンプトを出すだけです。そして最近では、別のClaudeにプロンプトを出すためのClaudeを動かしています。私自身はClaudeと直接話してすらいないのです。
エンジニアリングの世界で起きているのは、1人の人間が持つことができるレバレッジ(影響力のテコ)の量が、まさに爆発的に拡大しているという現象です。1人の人間がどれほど巨大なビジネスを構築できるか、1人の人間がどれほど多くのプロダクトをサポートできるか、という話です。現在、Anthropicのエンジニア1人が持っているレバレッジは、本当に常軌を逸したレベルに達しています。
そして、この変化は他の職種(ディシプリン)でも見られ始めています。Claudeを使って業務をこなすマーケターたちもそうですし、Claude Codeを使って顧客のシステム実装を行うフォワード・デプロイ型のエンジニアたちも同様です。私たちの営業(セールス)チームでも同じことが起きています。実際、Anthropicのゴー・トゥ・マーケット(市場開拓)チームの約半分はClaude Codeを使い、残りの半分はco-workを使っています。全員があらゆるプロダクトを使いこなしている状態です。
したがって、私たちが目にしている現実とは、個人の持つレバレッジの量が劇的に高まっている一方で、私たちは依然として「優秀な人材の絶対数」というボトルネックに直面している、ということです。個人のレバレッジが上がったとしても、需要があまりにも旺盛(インセイン)であり、構築すべきものが無数に存在するため、十分な数の優秀な人間を雇いきることができないのです。私たちの側におけるボトルネックは、依然としてそこにあります。
しかし、もしこの技術がそこまですべてをこなせるほど強力なのであれば、人々はこう反論するでしょう。「自社の営業組織がどのように動いているかを確認させて、プロンプトひとつでSalesforceを自動設定させればいいじゃないか」と。あるいは別の例として、「もしAnthropicが本当に強力なAIを持っていると証明したいなら、IPO(新規公開株式)の書類手続きをすべてAIに任せて、投資銀行を雇うのをやめてみせろ」とも言われます。これらは不公平なテスト(不当な要求)なのでしょうか。
実は、チームの中にClaudeを使って自分の確定申告(タックス)をこなしたメンバーが1人います。もちろん、これを他人に無条件でお勧めするわけではありませんが、私自身も自分の税務データをClaudeに走らせてみて、お抱えの会計士の計算結果と比較したことがあります。結果は、極めて近いものでした。
私も同じことをやりましたよ。皆さん、決してそれを推奨しているわけではありませんが、非常に興味深いユースケース(事例)であることは間違いありません。
その通りです。しかし、この議論において人々が根本的に見落としているのは、最終的には「人」がClaudeと対話し、Claudeに対してその処理を実行するよう依頼(アスク)しなければならない、という点です。たとえSalesforceが自動的に設定されるようになり、人間がすべてのボタンを押す必要がなくなってClaudeがそれをこなすようになったとしても、誰かがClaudeにそれをやるよう指示を出さなければなりません。
そして、Salesforceを無数の異なる方法で設定しなければならないとしたら、Claudeにその指示を出すこと自体が、ひとつのフルタイムの仕事になり得るのです。そしてある時点で、Claudeは別のClaudeにその指示を出すことが非常に得意になるでしょう。そのとき、人間の仕事は「別のClaudeに指示を出すClaudeに対して、指示を与えること」になります。この連鎖(チェーン)はどんどん深くなっていくでしょう。しかし最終的には、これを操縦(パイロット)する人間が依然として必要なのです。
では、将来的には、人間の仕事はただ1つの質問を投げかけるだけになる、ということでしょうか。
ええ。しかし、正しい質問を投げかけるという行為が、どれほど莫大なレバレッジ(影響力)を持つことになるか、想像してみてください。
確かにそれは一理あります。良い指摘ですね。
Salesforceの話題が出ましたので、いわゆる「SaaSの黙示録(サス・アポカリプス)」についても触れなければなりません。プログラミングの自動化が進む中で、どのようなソフトウェア企業が生き残り(セーフ)、どのような企業が苦境に立たされる(トラブル)のかについて、あなたは非常に興味深い視点を持っていますよね。以前、ビジネスに存在する異なる「防壁(モート=参入障壁)」について、どのモートが重要性を増し、どのモートが低下していくのかを語られていました。その点について、ここで簡単に共有していただけますか。
ビジネスにおけるモートを議論するための非常に優れたフレームワークとして、「セブン・パワーズ(7つの経済的地位)」と呼ばれるものがあります。この手のフレームワークは無数にありますが、これが私の個人的なお気に入りです。私は学生時代に経済学を専攻しており、コンピュータサイエンスを学んだわけではないので、ビジネスを考えるときには今でもこうしたフレームワークの枠組みで捉える傾向があります。
ビジネスには様々な種類のモートが存在します。ひとつのモートを持つ企業もあれば、いくつかのモートをポートフォリオのように組み合わせている企業もあります。たとえば、ひとつのモートは「規模の経済(スケール・エコノミーズ)」です。生産の規模を拡大するにつれて、収益逓増の法則が働きます。もうひとつは「ネットワーク効果(ネットワーク・エフェクツ)」です。メッセージングアプリなどがその典型ですね。利用する人が増えれば増えるほど、個々のユーザーにとっての価値が高まっていきます。他にも「乗り換えコスト(スイッチング・コスト)」や「プロセス・パワー(プロセスの優位性)」などがあります。
私は、これらのモートの大部分は今後も依然として重要であり続けると考えていますが、相対的に見て、次の1年で重要性が増すものと、重要性が低下するものに分かれると考えています。
重要性が増すと考えているもののひとつは、ネットワーク効果です。なぜなら、誰がコードを書いているかは関係ないからです。プロダクトの核心部分にエージェントが据えられていようが、プロダクトに高度なインテリジェンスが組み込まれていようが、そのプロダクトにネットワーク効果が存在しているという事実は、今後も変わらず強力な意味を持ち続けます。
一方で、重要性が低下するモートもあります。その代表例が、乗り換えコスト(スイッチング・コスト)です。なぜなら、ベンダーAからベンダーBへシステムを切り替えたいと考えたとき、ただClaudeに「切り替えてくれ」と頼めば済むようになるからです。そしてClaudeは、時間を経るごとにそれをこなすのがどんどん得意になっていきます。ですから、企業として今考えるべきは、「自社の持つモートとは一体何なのか」という点です。大企業の多くは、単一の要素ではなく、非常に多くのモートを積み重ねています。時間をかけて防御力のあるビジネスを築き、ある規模に達するプロセスとは、そうしたモートを蓄積していく行為に他ならないからです。無数のモートが必要なのです。その中で、何がより価値を高め、何が価値を失うのかを見極める必要があります。
しかし、これらの異なるソフトウェア企業について考えるとき、もし人々がClaude Codeを使うようになったら、あらゆるモートが境界を失って溶け去って(ブレンド・アウェイ)しまうのではないかとも思います。ユーザーは潜在的に、すべてのソフトウェアとインターフェースを持つ「単一のアプリ」の中に滞在することになり、それは結果として、世界にソフトウェア企業が実質1社しか存在しなくなるような状態を意味しませんか。
ええ、そのようなシナリオを含め、これがどのように展開するかには多くの道筋が考えられます。今言われたような世界も可能性としてはあり得ますが、個人的には少し現実離れ(ファーフェッチド)しているようにも感じられます。
たとえば、自分がメッセージングアプリを使うとき、どのアプリを使うかをどうやって決めるか考えてみてください。私は「自分の友人が使っているアプリ、友人に連絡が取れるアプリ」を使います。したがって、自分自身のためにどれほど素晴らしいアプリを構築できるか(実際に今の技術を使えば、Claude Codeを使って数時間で最高のメッセージングアプリを作ることができますが)、それは重要ではないのです。友人と話せなければ、何の意味もありませんから。
しかし、それこそがまさに私の言いたい例(エグザンプル)なのです。私の言うことが正しいかファクトチェックしてほしいのですが、将来的には、ユーザーが使うメッセージングアプリの中にエージェントが組み込まれ、友人からメッセージが届いたことをエージェントが通知してくれるようになる。あなたがiPhoneでClaude Codeを頻繁に使っているのは知っていますが、ユーザーはただその通知を目にし、エージェントに向かって言葉を返すだけでよくなる。企業側がその連携を拒まない(プレイボール)限り、すべてのコミュニケーションが、これらの中に一元化(セントラライズ)される可能性があるのではないでしょうか。
最終的にはエージェントがその窓口になるという形はあり得ますね。ただ、実際のコミュニケーション自体はどのように行われるのでしょうか。たとえば、Signal(シグナル)のようなメッセージングアプリに目を向けると、通信のために使用している独自のプロトコル(通信規約)が存在します。私が新しいアプリを構築し、それと同じプロトコルをエージェントに使わせることはできるかもしれませんが、現行の仕組みでは、Signalを直接使っている他の人々にそのままメッセージを送ることはできません。ただし、既存のアプリがそれをサポートしているのであれば、エージェントに私の既存アプリを操作させて、そのメッセージングを実行させる、という形は十分に可能です。
ですから、これがどう転ぶかはまだ明確ではありません。現在の人々は、アプリとエージェントを混ぜ合わせて使っています。しかし私は、根本的な部分において、これらの多くのモートは時間の経過とともにより一層価値を高めていくと考えています。
別の例を考えてみましょう。TSMCのような半導体(チップ)製造メーカーを思い浮かべてみてください。彼らが製造プロセスを構築するために投入している膨大な努力、そして規模の拡大(スケール)とともにコストを引き下げていくプロセスの構築について考えると、これは根源的な経済の力(エコノミック・フォース)であり、製造業をはじめとする多くの企業がこの種の優位性を持っています。規模によってコストが下がる仕組みです。テック企業においては、これがインフラストラクチャー(基盤)の領域に該当します。極めて優れたインフラを構築すれば、より多くのユーザーをサポートすることができ、ユーザーあたりの限界コストは時間の経過とともに低下していきます。このような効果を握っている限り、あなたや私が自由にアプリを構築できるかどうかに関わらず、それは依然として極めて強力なモートであり続けるのです。ただ、間違いなく、その両方の力が同時に働いている状況だと思います。
自律改善(自己ループ)の確率と世界モデル論争
分かりました。残り10分で、あと3つのテーマがあります。すべていけるか試してみましょう。
Anthropicの創設者のひとりであるジャック・クラークが、最近、2028年までにこれらのモデルが「自ら自律的に性能を改善し始める(自己改善ループ)」確率が約60%あると信じている、と発言していました。パーセンテージや年数に多少のズレはあるかもしれませんが、大まかな目安としてその認識で合っています。あなたは、コーディングが自律的に行われるアプリの現場にいて、そのプロダクトを実際に運営している立場です。ジャックの意見に同意しますか。
その見立ては正しいように思えます。
ええ。Claude Codeがどのように書かれているかという実態に目を向けると、Claude Codeの100%がClaude Codeを使って書かれています。これは去年の11月、Opus 4.5の時点からずっと続いている現実です。
それはつまり、ある種の「急速な離陸(ファスト・テイクオフ)」のシナリオということになりますね。それを予期(アンティシペート)していますか。
その可能性は十分にありますし、それこそがまさに「Anthropicが存在している理由」そのものなのです。Anthropicにいるエンジニアや研究者に、なぜこの会社に加わったのかを尋ねれば、誰もが「AIの安全性(AIセーフティ)のためだ」と答えるでしょう。それは私たちが未来、何年も先の未来を考えるとき、自分たちの子どもの世代のために最も重要であり、絶対に正しく成し遂げなければならない(ゲット・ライト)と考えているのが、この技術が安全であり、良い方向へ進むようにすることだからです。ええ、今言われたような展開は、起こり得る可能性のある結果のひとつです。
ただし、現時点で私たちが目にしているものは、まだそこには達していません。現在、Claude Codeは自分自身を書いていますが、プロンプトを出しているのは依然として人間です。Claude Codeの次なる機能として何を構築すべきかについて、Claude自身がアイデアを生成し始めてはいますが、常に優れたアイデアであるとは限りませんし、大半のアイデアは今でも私が生成しています。しかし、ある時点で、それは変わるでしょう。モデルが向上し、より「自己強化的なループ(セルフ・レインフォーシング・ループ)」へと変化していくはずです。
世界モデル(ワールドモデル)をめぐる議論についても、ぜひあなたの考えを聞きたいです。世界モデルの必要性を支持するプロ・ワールドモデル派の人々は、「大規模言語モデル(LLM)は自らの行動がもたらす結果(コンシクエンセズ)を理解しておらず、効果的なエージェントを実現するためには、世界モデルをシステムに組み込む必要がある」と主張しています。
ここにヤン・ルカンの言葉があります。「世界モデルなしに、信頼できるエージェントシステムを構築することはできない。LLMは世界モデルを持っていない。彼らは行動を起こす前に、その行動がもたらす結果を予測することができない。ヤンに言わせれば、彼らはただ行動しているだけで、その後に何が起きるかは誰か他の人間の問題に過ぎない」と。私は先日、OpenAIのグレッグ・ブロックマンと話したのですが、彼は基本的にはその主張を受け入れておらず、LLM、つまりこれらのテキストモデルこそが直接AGI(汎用人工知能)へ到達する道筋であると考えていると話していました。
あなたはどちらの側に立っていますか。世界モデルのインテリジェンスを内部に焼き付ける(ベイクインする)必要があると信じる側ですか、それともLLM単体で十分に到達可能であると考える側ですか。
ヤンに対して、「もしよければ一度席を並べて、1時間ほど一緒にClaude Codeを動かしてみませんか」というオファーを出したいですね。ぜひ彼に見せてあげたいです。
それはぜひ、この番組の中でやっていただきたいですね。
ええ。その上で、彼がどう考えるか聞いてみたいです。彼の気が変わるかもしれないし、変わらないかもしれない。
ただ、私のスタンスとしては、私はかなり明確にプロダクト(製品開発)の側に身を置いています。そのため、研究の根源的なアプローチに関する学術的な視点(パースペクティブ)は、実際には持ち合わせていません。
ですが、もしよろしければ、もう少しだけ深く掘り下げさせてください。あなたはプロダクトの側ですが、私は多くの人々から、「世界がどのように動いているかという概念、つまり世界モデルのような conception(概念把握)がなければ、LLMは世界の仕組みや、自らの行動の結果に対する真の理解を持つことはできない」という意見を聞いてきました。
あなたは先ほど、co-workを使って何本のフライトを予約したと言いましたか。8本のフライトとホテルですよね。あなたは、エージェントが「行動の結果」に対して何らかの理解を持っていると信じているからこそ、クレジットカードの情報を渡したはずです。そうでなければ渡さないでしょう。その点に関する具体的な反論(アーギュメント)については、どう考えていますか。
Anthropicの基礎研究(リサーチ)に携わっているメンバーの論文を読む限りにおいて、これらのモデルが示している「インテリジェンス(知性)」の度合いには、驚かされるばかりです。あなたが冒頭で言われたように、モデルが根本的に行っているのは、次のトークンを予測すること(プレディクト・ザ・ネクスト・トークン)です。
そう考えると、「そんな単純な処理が、どうして知性に結びつくというのか」と、取るに足らないことのように思えますよね。しかし、私たちはこれまでに、モデルがどのように「計画(プラン)」を立て、どのように実際に「論理的思考(リーズン)」を組み立てているかについて、多くの研究成果を公表してきました。次のトークンを予測するだけのモデルからは、実際には到底予想もできないような、極めて驚くべき振る舞い(ビヘイビアズ)がいくつも確認されているのです。ですから、私はその実力を決して過小評価(ディスカウント)すべきではないと考えています。
私のお気に入りのエピソードは、モデルが詩を書くときの挙動です。モデルが詩の最初の1行を書いている最中に、モデルの内部状態を観察すると(これはAnthropicの研究成果です)、彼らはすでに「次の行」の展開を考えている、という事実が分かっています。
そんなことがどうして可能なのか、本当に不思議ですよね。
ええ、しかしそれが現実なのです。そしてそれこそが、まさに私自身の思考プロセスと同じでもあります。もし私が詩を書くとしたら、私も全く同じように頭を動かすでしょう。次の単語を予測することをただ教え込まれた存在が、どういうわけか、その次の単語を生み出す難易度が十分に高いものであるとき、そこへ至るために「遥か先まで計画を立てる方法」を真に学習しなければならなくなり、これらすべての思考プロセスを自律的に習得していくのです。
テックの未来:現実の需要か、一時の熱狂か
最後の質問です。時に、現在進行中の大きなテクノロジーの転換を目にするとき(私のこれまでのキャリアでも様々な技術革新をカバーしてきましたが)、うまく定着したものもあれば、そうならなかったものもありました。私は常に自分自身に問いかけなければなりません。「これが本当に未来の姿なのか、それとも一時の熱狂(フィーバードリーム)に過ぎないのか」と。
現在のデータを見る限り、これが本物の変化であることは示されています。しかし同時に、これがどのように進化し続けるかという未来に対して、どれほど直線を引いて予測(エクストラポレート)できるのか、疑問を呈する必要もあります。「これは一時の熱狂に過ぎない」とする反論の根拠は、一般的なユーザーはもっとシンプルなインターフェースを望んでおり、画面をタップして進める操作を気にしておらず、Claude Codeに話しかけるようなスタイルは「少しテック寄り(テッキー)すぎる」と感じてしまい、エンジニアの間でどれほど爆発的に普及したとしても、日常の一般ユーザー(エブリデイユーザー)にまでは浸透しないのではないか、という見方です。これにはどのように答えますか。
私たちは先日、Opus 4.7をテーマにしたハッカソンを開催したのですが、勝者のひとりは「医師」でした。彼は自分でアプリを構築したのです。他にも電気技師(エレクトリシャン)がいましたし、大工(カーペンター)もいました。これらの人々の多くは、それまでコーディングの経験(エクスペリエンス)を一切持っていませんでした。しかし彼らは、Claude Codeを使って、現実に役立つ実用的なソフトウェアを構築したのです。中には、私たちが開催したハッカソンの成果を元に、スタートアップを立ち上げて売却( exit)した人物まで現れました。
疑いなく、私たちが最初にClaude Codeを構築したとき、それはエンジニアのための道具であり、エンジニアたちがその使い方を見出していきました。しかし、極めて短い時間のうちに、エンジニアではない人々が、これを使って「経済的に有用なもの(エコノミカリー・ユースフルな成果物)」を生み出す方法を自ら発見していったのです。
実際に現在の利用状況(ユージ)の大部分に目を向けると、利用しているのはエンジニアではありません。人々にとってあまりにも有用であるため、彼らは自ら進んで、多少の手間や障壁(フープス)を乗り越えてでもこれを使おうとしています。co-workがリリースされる前でさえ、人々はわざわざターミナル(コマンドライン)を開いてClaude Codeをインストールしていました。多くの人々にとって、それが人生で初めてターミナルを触る機会だったのです。
もちろん現在では、Claude Codeにはデスクトップアプリがあり、iOSアプリがあり、Slackアプリもあります。インタラクション(対話)の方法は無数に用意されています。しかし、それでも人々が初期に不便を忍んでまで使おうとしていたのは、それが圧倒的に有用だったからに他なりません。
プロダクト開発に携わる人間(プロダクトパーソン)として、私にとってこれこそが、「これは本当に有用なものなのか」「毎日これを使い、毎日使い続ける人が大勢存在するのか」という問いに対する、究極の市場テスト(マーケットテスト)であると考えています。そして事実、膨大な数の人々がこれを使っており、その規模は成長し続けています。私は、人々がこれを利用するその独創的な方法の数々に、常に驚かされ続けているのです。
ええ。私自身、気づけば自分でも驚くような方法でこれらのツールを使い始めていることに気づかされますし、これから次なる展開がどうなるのか、非常に楽しみです。これからも使い続けたいと思いますし、今日こうしてお話しできる機会を得られたことを本当に嬉しく思います。ぜひまた番組に来てください。
ええ、呼んでいただき本当にありがとうございました。
ありがとうございました、ボリス。素晴らしいお話でした。視聴者の皆さん、お聞きいただき、そしてご覧いただき本当にありがとうございました。また次回、Big Technology Podcastでお会いしましょう。


コメント