Claudeでエージェントの未来を構築する

本動画は、AnthropicのClaudeを使用したエージェント開発の未来について、同社の開発者プラットフォームチームが解説するものである。Claude Developer Platformの進化、エージェントの定義、そして開発者が直面する課題への解決策が議論されている。特に注目すべきは、モデルの能力を最大限に引き出すために「足枷を外す」という哲学であり、過度なスキャフォールディングを排除し、モデル自身の推論能力を信頼するアプローチが強調されている。Claude Code SDKをはじめとする新しいツール群、コンテキスト管理機能、メモリ機能などの実装を通じて、より自律的で継続的に改善するAIエージェントの実現を目指している様子が明らかにされる。

Building the future of agents with Claude

Anthropic’s Alex Albert (Claude Relations), Brad Abrams (Product) and Katelyn Lesse (Engineering) discuss the evolution ...

Claude Developer Platformの進化

開発者として、私の創造性にはどこかで限界があります。私が思いつけるユースケースには限りがあるんです。でもモデルは、誰かが何を持ってきても、そのことをやり遂げる方法を見つけ出してくれます。

こんにちは、Alexです。私はAnthropicでClaude Relationsを担当しています。今日はClaudeでエージェントの未来を構築することについてお話しします。同僚たちも一緒です。

私はBradです。Claude Developer PlatformのPMチームを率いています。

私はKatelynです。Claude Developer Platformのエンジニアリングチームをリードしています。

では、Claude Developer Platformについて話しましょう。

そうですね、そこから始めましょう。

そこからスタートですね。

以前はAnthropic APIと呼ばれていました。

そうです。私たちは大きな名称変更を経たばかりです。なぜその変更を行ったのか、そしてこの新しいプラットフォームとは何で、何を包含しているのか説明してもらえますか。

もちろんです。Claude Developer Platformは、私たちのAPI、SDK、ドキュメント、コンソール内のすべての体験、そして開発者がClaudeの上に構築するために実際に必要なあらゆるものを包含しています。

世界中の素晴らしい顧客にサービスを提供できることを、私たちは本当に誇りに思っています。彼らはClaudeを使って知能の天井を引き上げようとしているんです。そしてプラットフォームは本当に彼らがそれを実現することを可能にしています。私が特に気に入っている点の一つは、このプラットフォームは外部の顧客にサービスを提供するだけでなく、実は私たちの内部製品にもサービスを提供しているということです。

私たちはよく人々に伝えているんですが、例えばClaude Codeは実際に私たちの公開プラットフォーム上に直接構築されています。

なるほど。

そうですね、つまり、始めた当初は単なるAnthropic APIで、モデルへの非常にシンプルなアクセスでした。でもこの1年ほどで、本当にたくさんの機能を追加してきました。プロンプトキャッシングを追加し、バッチAPIも完全に別で追加し、ウェブ検索、ウェブフェッチを追加し、コンテキスト管理のサポート、コード実行もあります。

これらすべてのツール、つまり今では、私たちとしては、そう、志として、これは今やプラットフォームだと感じています。

なるほど、つまり今ではそれに含まれるものがずっと多くなったということですね。過去1年で非常に劇的な進化を遂げたと。

そうです、そうです。

より良くなったと思います。

そしてそれは、開発者たちがとにかくそう呼んでいたものでもあると思います。

つまり、開発者たちが言っていることに合わせるのは常に自然なことですから。

私たちは少し遅れて気づいたんですけどね。常にそういう性質を持っていましたよね。

大丈夫です。

私たちは償いをしました。チャットモデルから、おそらくこのより自律的な未来へと移行する中で、今できるクールなことの一つは、この開発者プラットフォームの一部としてエージェントを構築することです。

プラットフォーム上で実際にそれをどのように行っているかに入る前に、そもそもエージェントとは何なのかについて話せますか。

そうですね、つまりエージェントというのは、ほとんどバズワードのようなものですよね。今では誰と話してもエージェントを構築していて、業界の技術用語がそのレベルに達すると、定義が非常に曖昧になります。

誰もが構築するものすべてがエージェントです。でもAnthropicで私たちが本当にエージェントについて考えているのは、モデルがどのツールを呼び出すか選択し、それらのツールを呼び出し、結果を処理し、次のステップを選択するある程度の自律性を持っているということです。基礎研究ラボとして、モデルとその推論、それがどのように行動を決定するかに重点を置くことは、エージェントが何であるかの本当に重要な要素だと考えています。

なるほど、つまりある意味で自律的であるという側面ですね。

そうです。

目標に向かって進んでいく…

つまり、Claudeがたどるべき道をあらかじめ定義している、本当に有用なワークフローを実行している顧客もいます。それは非常に有用なことです。でもエージェント的なことの良い点は、モデルが数ヶ月ごとに良くなるにつれて、新しいモデルをリリースすると、真のエージェント的なパターンでは、それらのサービスは単により良くなっていくということです。

一方で、多くのスキャフォールディングを含むワークフローを構築すると、モデルに境界を設けることになり、それは一部のユースケースでは問題ないかもしれませんが、それは次のモデルリリースが得る次のレベルの知能を活用できないかもしれないということを意味します。

なるほど、少なくとも過去6から12ヶ月のエージェントには、おっしゃったように、スキャフォールディングが少し妨げになっていて、おそらく私たちはその一部を取り除いているという興味深いトレンドがあるようです。

その背後にある直感を説明してもらえますか。これは実際に未来なのでしょうか、つまりモデルに与えるものをどんどん減らしていくということは。

そうですね、つまり時間とともに私たちが見ているのは、モデルがタスクを達成するために必要とするスキャフォールディングは、モデルの知能レベルが上がるにつれて、必要なものが減っているということです。

そしてそれは上がり続けると私たちは信じています。基本的にモデルは、達成しようとしている高レベルのタスクについて、より文脈的な理解を持っています。したがって、それほど多くのガードレールを必要としません。実際、それらのガードレールは場合によっては負債のようなものになります。新しいモデルを試した顧客が「ああ、これは実際にはほんの少しだけ良いだけだ」と言うことがありました。

それで私たちは彼らと一緒に何が起こっているのかを調べます。すると、そうですね、彼らはモデルの知能を見ることを難しくするような方法で制約をかけていたんです。

なるほど、これは私たちが顧客との現場で見ていることと一致しますか。彼らも同じトレンドに従っているのでしょうか。極限では、Claudeを管理するためのあらゆる種類の革新的な技術を探求している顧客がいることを知っています。

そうですね、完全にそうです。そして実際に今、これについて多くの議論があります。エージェントとは何か、何が必要か、何を構築する必要があるのか。「それは単なるワイルドループだ」と言う人もいます。「それほど頑張る必要はない」と。そして最終的には、人々がモデルの周りに配置しているフレームワークの多くの進化があり、それらはエージェントを調整し、モデルから最大限のものを引き出すのに役立っています。

そして業界がおそらく巡り巡って辿り着いているのは、その多くがおそらく重すぎて、おそらく意見が強すぎるものになってしまったということで、だからこそ人々が「それは単なるワイルドループで、それだけで十分だ」というところに戻ってくるわけです。そして私たちがそこでやろうとしているのは、多くの点でそれはワイルドループかもしれないけれど、人々がモデルから最大限のものを得るのを助けるために私たちがよりユニークにできることは、それらのツール、それらの機能などの多くだということです。

そして私たちがやりたいのは、人々がそれらのツールをどのように使うべきかについてある程度意見を持ったフレームワークとツールとプラットフォームを提供することです。でもそれは、Bradの指摘したように、モデルが最終的にやろうとしていることの邪魔になるような超重量級のフレームワークではありません。正しいバランスを取るんです。

つまり、多くの人々が試みてきたことを私たちは見てきたので、そこで意見を持つことができることを知っています。でも私たちはそれを軽量な方法でやりたいし、私たちが本当にやっていることは、超重量級のフレームワークで足を引っ張ることなく、モデルから最高のものを得るのを助けることであることを確実にしたいんです。

なるほど、それでは戦略の一部は、モデルに与えることができるこれらの補助的なツールや物事を提供することだと説明されますか。でも必ずしもモデル自体にバンパーを生み出しているわけではない。

そうです、私たちはそれを、どうやってモデルの足枷を外すかと考えています。モデルはすでに多くの能力を持っています。

実際、現在の世代のモデルを取っても、私たちが解き放つことができたよりもはるかに多くの知能がその中にあると私は確信しています。でもとにかく、その直感は、モデルに必要なツールを与えて自由にさせ、それらを正しい方法で使えるようにすれば、素晴らしい結果が得られるということです。

その良い例は、私たちがこのサーバーサイドのウェブ検索ツールとウェブフェッチツールを立ち上げたことだと思います。顧客がそれらを使うのを見るのは興味深かったです。実際、私たちが本当にやったことは、非常に最小限のプロンプトです。ウェブ検索ツールを与えるだけで、突然、ディープリサーチタスクがAPI上でそのスイッチをオンにするだけでほぼ完全に完了します。なぜならモデルはそのツールを呼び出し、結果を見て、それを考慮して、オーケー、多分これらの他の検索を呼び出す必要があるかもしれない、そして、ああ、返した4番目のリンク、それが素晴らしいものだ、とそのリンクにウェブフェッチをしてそのデータを持ち帰る、と言うからです。

そして本当にすべて非常に自律的に自分で決定しています。

なるほど、それはシステムの知能がどこに適用されるかという興味深いシフトのようなものだと思います。

まさにそうです。

開発者が誘導するために自分の知能を適用しなければならなかったことから、今はモデルがそれを理解するようになっています。

そうです、モデルがそれをやるのは本当にエキサイティングです。なぜなら開発者として、私の創造性にはどこかで限界があるからです。私が思いつけるユースケースには限りがありますが、モデルは、誰かが何を持ってきても、モデルはそのことをやり遂げる方法を見つけ出します。

だから、モデルの足枷を外すのは素晴らしいことです。

なるほど、もし私が今日開発者で、開発者プラットフォームで構築を始めようとしているなら、何をお勧めしますか。始めるためのベストプラクティスや方法は何ですか。

そうですね、非常に戦術的には、実際に今私たちが推奨している一番のものはClaude Code SDKです。

Claude Code SDKについて本当に、本当に興味深いのは、私たちは基本的にモデルの周りにエージェントハーネス、エージェント的なハーネスを構築して、そのループを実行し、多くのツール呼び出しやその他の機能の使用を自動化したということです。そして明らかに元々はコーディング目的で構築されました。そしてチームが本当にすぐに理解したのは、実際にこれは優れた汎用エージェント的ハーネスだということでした。

そしてSDKがやることは、人々にすべてのツール呼び出しなどを含むループを構築する必要なく、実際にエージェントのプロトタイプを作り始めるための完璧な箱から出してすぐ使えるソリューションを提供することです。それはメッセージAPIと私たちが言及しているすべての同じツールの上に構築されています。でもそれは箱から出してすぐに本当に素晴らしいスタート地点を与えてくれます。

なるほど、これは開発者と話すときに私が感じるかなり一般的な誤解のように思えます。Claude Code SDKについて。つまり、私はコーディングアプリケーションを構築していない。なぜこれを使いたいのか。でもコーディング特有の部分を取り除くことができます。

そうですね、これは私たちがモデルからスキャフォールディングを取り除くことについて話していたことの良い例だと思います。

つまり、Claude Codeから本当にモデルの足枷を外すために物事を取り除き終えたら、結局コーディングに関するものは何も残っていなかったんです。他のすべてを取り除くと、それはただのエージェント的ループで、Claudeにファイルシステムへのアクセス、Linuxコマンドラインツールのセットへのアクセス、コードを書いてそのコードを実行する能力を与える本当にミニマリスティックなものです。

だからそれらはすべて非常に一般的な能力で、幅広い問題を解決できることが判明しました。

なるほど、そうですね。私が自分のサイドプロジェクトで遭遇してきたこと、そしてAnthropic内のプロジェクトでも見てきたことは、Claude Code SDK以前は、誰もがプロンプトキャッシングを管理する何らかの形式や、ツール呼び出しとそのループを管理する何らかの形式を実装していたということです。

そして今では、ああ、この基点から始めて、そこから構築すればいい、となっています。

もう少し高いところからスタートするんですね。

そうです、そうです、そうです。

つまり、さらなる抽象化レベルです。それは非常に興味深いと思います。

つまり、特にエージェントを検討している企業にとって考えるべき他の本当に興味深いことは、どのユースケースをターゲットにするかということだと思います。

テクノロジーを超えて考えて、解決すべき実際の問題は何か。そして、多くの顧客を見てきて、たくさんのことをやっているのを見て、私たちはそのすべてが大好きですが、最大の影響があるのは、顧客がこれのビジネス価値は何かについて真剣に考えた場合です。それは実際にこれだけのエンジニアリング時間を節約するのか、これだけの手作業を削減するのを助けるのか、などです。エージェントプロジェクトの期待される成果を明確にできることは、

エージェントの範囲を定義するのに本当に役立つと思います。

なるほど、そしてSDKにもう一度結びつけると。個々の開発者、私のような、何かに本当に速くハックを始めたいだけの人にとって、本当に、本当に有用だったようです。これらの顧客、これらのことで実際のビジネス価値を得ようとしている企業にとって。

彼らはSDKを使うべきですか。彼らにとって準備はできていますか。そのようなスケールでの使用に対応していますか。

そうですね、多くの点でそうだと思います。多くの点で、もしあなたがその状況にいて、つまり、そのランタイムをデプロイできる状況なら、基本的に、SDKから得られるのはエージェント的ループランタイムです。準備ができたら、そのランタイムをどこにでも、いつでもデプロイできます。

でも私たちが本当にやろうとしていることは、SDKが人々に解放するものの精神を取り入れて、私たちがループを提供し、自動化された方法で多くのツール呼び出しを提供する、より高次の抽象化に上がって、スケールで本当に彼らのユースケースを解決できる箱から出してすぐ使えるソリューションを人々に提供する方法を考えることです。

そしてそれは、今年の残りを通じて私たちのロードマップで目指そうとしている方向性の多くだと思います。そして私たちがそれについて考えるときの本当に重要な点は、ここでの全体的な目標が、ユーザーが本当にその知能の天井を引き上げ、モデルから絶対的に最高の成果を得るのを助けることなら、より高次の抽象化は単にそれを簡単にするだけではありません。なぜなら自分でそのコードをすべて書く必要がないからです。

実際に、どうすれば本当に、真に最高の成果を得るのを助けられるか、ということです。なぜなら私たちは研究と同じ部屋にいて、推論と同じ部屋にいて、私たちの抽象化、私たちのエージェント的ループがClaudeと連携するのに非常に強力で非常に優れたものになることを確実にする方法を知っているからです。そして私がそこに付け加える最後のことは、特にこれらのものがより長時間実行されるようになり、人々がそれらのより長時間実行されるタスクに取り組むのを助けるためのより多くのツールを提供するにつれて、私たちのユーザーが

解決し続けようとすることを私たちが知っているもう一つの大きな問題は、それらのより長時間実行されるタスク内での観測可能性です。そしてそれは人々にとって最も一般的に出てくることの一つです。これらの長時間実行されるタスクがあり、これらの本当に素晴らしい成果を得ようとしているが、いくらかの操縦が必要かもしれない、プロンプトを調整する必要があるかもしれない、ツール呼び出しについて少し違った考え方をする必要があるかもしれない、と。

そしてそれは、時間とともにプラットフォームを通じてその観測可能性を人々に提供できることを私たちが知っているものです。そしてそれは私たちにとってもう一つの大きな焦点分野です。

なるほど、それは本当に興味深いです。つまり、これはエージェントで頭をもたげ始めている大きな問題でした。

そう思います。

特に彼らを信頼して、どこか他のアプリケーションでバックグラウンドで働かせるとき、実際に正しいことをやっているかどうかをどう確認するか、そしてもしそれらをデプロイするなら。

そうです、どうやって監査するか。つまり、システムにある程度の自律性を与えるつもりなら、正しいことが起こっているかを確認し、物事を調整できるように監査する方法が必要です。

だから観測可能性は本当にこれの重要な部分だと思います。

そこにピンを留めておいて、未来についてどのようにそれに対処するつもりかについて質問したいと思います。その前に、開発者プラットフォームで始めるときに人々が知っておくべき他のツールはありますか。あなたが役立つまたは有用だと感じたもの。

そうですね、つまり、ウェブ検索とウェブフェッチについて言及しました。

もう一つの大きなことで、私たちが今見ているのは、顧客が現在コンテキストウィンドウを管理するために多くの作業をしなければならないということだと思います。デフォルトでは、Claudeは20万トークンのコンテキストを持っています。Sonnetでベータ版で利用可能な100万トークンがあり、それは素晴らしいですが、100万でもそこには限界があります。そして多くの顧客が私たちに伝えているのは、コンテキストのより小さな部分を使っても、より良い出力、より高い知能が得られるということです。

そして私たちは、開発者がそのコンテキストを管理するのを助けるために、ちょうど出てきたいくつかのクールな機能を持っています。これらのエージェント的ループでは、多くの場合10回、15回、100回のツール呼び出しを行っていて、このファイルを編集したり、このデータベースでデータを調べたり、このメールを送信したりします。そしてそれらのツール呼び出しのそれぞれが100、200、1000トークンを占めます。

そして私たちは、モデルが実際にもう必要のない古いツール呼び出しの一部を削除できる、このクールな機能を持っています。

興味深いですね。

そしてそれは、ちょうどあなたが机を片付けてノートブックを片付けると、少し集中しやすくなるように。プロンプトを片付ければ、実際にモデルは実際に少し集中しやすくなります。

ああ、興味深い。それでは、不要なコンテキストを削除しているんですね。必要なコンテキストを削除してしまうリスクはありますか。

そうです。

それはどう機能するんですか。

ええ、ええ、ええ。だから私たちはそれについていくつかのガードレールと境界を設けていますが、一般的なルールは、モデルがすでにそれらのツールに基づいて決定を下した、数ターン前のツールを削除しようとするということです。

ええ、最近それで遊んでいて、ちょうど呼び出したツールを削除したら、ああ、ツールの結果がなくなった、何をすればいいか分からない、となりました。それでも、モデル、Sonnetは諦めません。単にこのツールをもう一度呼び出すだけだ、という感じです。

ええ、ええ、ええ、ええ。

でもそうです、だから一般的に私たちはその経験のために、いくつかの境界を設けました。

だから最新のツールのセットは保持します。

なるほど、わかりました。

そして私たちがやるもう一つのクールなことは、それを墓石化することです。つまりそれによって、ツール呼び出しを削除するとき、モデルにメモを入れて、ああ、検索呼び出しのツール結果はここにあった、と伝えるということです。

ああ、わかりました。

そして削除された、と。

だからモデルは完全に記憶を消されるわけではない。

まさにそうです。何が起こっているかについてモデルにもう少しコンテキストを与えると、モデルはより良くやると分かったと思います。そしてそれが重要な機能です。もう一つは、私たちが追加したこの種のエージェント的メモリ機能です。そこで私たちは、今、モデルにタスクを与えると、ディープリサーチタスクやポケモンをプレイするなど、モデルは実行するたびにほぼ同じことをします。

でも人間にタスクを与えると、人間がタスクを5回目に行うとき、彼らははるかに良くやります。なぜなら彼らは学んだからです。オーケー、この検索をするなら、たぶんWikipediaサイトはこの他のサイトより良い、とか何でも。どのものかを学ぶので、時間とともに良くなります。だから私たちは今、モデルにこのメモリツールを与えたので、モデルは実際に進みながらいくつかのメモを取り、ああ、このウェブサイトはたぶん正しいものではないと気づく、または検索をするならこのようにすべきだ、または調べるなら、あのデータベースではなくこのデータベースを使うべきだ、などと言えます。

そしてそれらのメモを取ります。そして行き詰まったとき、実際に戻ってメモを見直して、オーケー、ああ、このタスクを始めている、メモを読ませて、理解できるようにしよう、と言えます。

ああ、クールです。だから私たちはそのすべてを開発者のために処理しているんですね。

そうです、そうです、まあ、私たちはモデルにメモリを行うこの核心的能力を与えていて、今のところ開発者にメモリを管理させています。なぜなら、異なる開発者は、それを何らかのクラウドストレージに保存したいかもしれないし、他のどこかに保存したいかもしれないからです。だから開発者が正確にメモリをどこに保存するか理解できるようにしています。

そうすれば彼らはそれをより制御できます。

でもツールは公開しています。

でもツールは公開しています。そうです、ツールは公開しています。

それでは、ロードマップの質問に再び戻ります。最近立ち上げた新機能がたくさんあるようです。多くの勢いがあり、そして今ではClaude Code SDKのような他の提供物やまもなく登場するものもあります。

Katelynさん、あなたが最もワクワクしていることは何ですか。今後6から12ヶ月の未来はどのように見えますか。

そうですね、私たちは、Claudeから絶対的に最高の成果を得ることをできるだけシンプルにできる、これらのより高次の抽象化について少し話しました。そして私たちはそれを、話した観測可能性と組み合わせたいんです。そうすればあなたは本当に、データを見て、それらのより長時間実行されるタスクから洞察を得ることができます。

そしてこれらのものを組み合わせて、Bradがちょうど話したメモリのような能力について考え始めることができれば、時間とともにClaudeから最高の成果を得るのを助けるだけでなく、Claudeから自己改善し継続的に改善する成果を得るのを助けることができるこのフライホイールを本当に見始めることができます。

そして私にとって、それはロードマップの銀河脳的な魔法のようなものです。人々が私たちのところに来て、Claudeで構築していて、タスクがあり、やろうとしていることを知っている、そして時間とともにそれがどんどん良くなっているという本当にアハ体験を得られる地点に到達することです。

そして、私たちがやっているすべてにおいて、私たちが確実に追求しようとしている最大のことがそれです。

それは素晴らしいです。

ええ、つまり、私はいつもモデルの立ち上げにワクワクしていると言わざるを得ないと思います。それはクリスマスのようです、わあ、今何が可能になるんだろう。だから私はモデルの立ち上げが出てくるたびに遊ぶのが大好きです。より多くのユースケースを解放するだけでなく、私たちが一生懸命取り組んできて改善しようとしてきたいくつかのユースケースもあり、それが改善されるのを見るのは満足です。でも同時に、モデルがこんなことができるとは全く思いもしなかったこともあります。

今ではASCII画像をずっと上手く描くとか、何でも。

重要なことです。

非常に重要なことです。でもそれを超えて、私が本当にワクワクしているもう一つのことは、私たちはClaudeにコンピューターを与える初期段階にいるということです。つまり、もし私たちがAnthropicでここに従業員を雇って、彼らを歓迎するとします。「最初の日です。」

でも彼らにコンピューターを与えなかったら。彼らはAnthropicであまり成功しないでしょう。だから今のところ、基本的に誰もがClaudeを使っていますが、Claudeはコンピューターを持っていません。だから私はClaudeにコンピューターを与えることに本当にワクワクしています。そしてコード実行ツールでそれの非常に初期段階を見ることができます。モデルがVM上でコードを書いて実行し、結果を得ることができるところです。

だから画像をズームインしたり、Excelスプレッドシートを取ってチャートやグラフを使った素晴らしいデータ分析を作成したりできます。そしてそれはただの初期段階です。もし常にそこにある永続的なコンピューターがあって、必要な方法でそこにファイルを整理し、望む方法でツールをセットアップできたら。そして私はそのシナリオには多くの余地があると思います。

そうですね、それはすべてこの足枷を外すことにも結びついていると思います。

まさにそうです、まさにそうです。すべてはモデルの足枷を外すことです。まさにその通り、Claudeにツールを与えるだけです。

そうですね。

まあ、私はその未来にワクワクしています。この会話をありがとうございました。

わかりました、クールです。ええ、ありがとう。

ありがとうございます。