Anthropicのプロダクト責任者であるMike Kriegerが、AIモデル開発の加速について語る。Instagram共同創業者でもある彼は、Claude 4から4.5への進化がわずか数か月で実現した背景として、顧客からの迅速なフィードバックループ、モデルリリースプロセスの効率化、そして大規模トレーニングを可能にするエンジニアリングの向上を挙げる。AIエージェントの定義、メモリ機能の重要性、金融や顧客サポートなどの分野への応用、そしてソーシャルメディア構築との共通点と相違点まで、幅広いトピックを網羅している。また、エンタープライズでのAI導入における課題と、Anthropicがどのように企業と協力して実装を支援しているかについても詳述する。

AIモデル開発の加速とその背景
Anthropicのプロダクト責任者であるMike Kriegerが、AIモデル開発がどのように加速しているか、そして物事が速く進み続ける中で何に注目すべきかについて語ります。
Big Technology Podcastへようこそ。テクノロジーの世界とその先にある冷静で微妙な会話を提供する番組です。
さて、AnthropicはClaude 4シリーズのモデルが発表されてからわずか数か月後に、新しいモデルであるSonnet 4.5をリリースしました。つまり、物事は急速に進んでおり、なぜこれほど速く動いているのか、そしてAI業界とビジネス全体にとってその意味は何なのかを探っていきます。そして今日は、それを行うのに最適なゲストをお迎えしています。Anthropicのプロダクト責任者であるMike Kriegerがここにいます。Mike、また会えて嬉しいです。番組へようこそ。
こちらこそです。ありがとう、Alex。
Anthropicの最初のデベロッパーデイの観客席に座っていたのを覚えています。そして、AI界隈では面白いことに、猫の年齢か犬の年齢か、もうわかりませんが、毎月が1年のように感じられます。これは2025年5月のことでした。
あなたとDarioがステージ上で「はい、私たちはClaude 4をリリースしていますが、次のイテレーションをこれまでよりもはるかに速くリリースします」と言っていたのを覚えています。そして、すでに4.5に到達しています。どうやってそれが実現したのですか。
いくつかのことが見えてきていると思います。5月のことを考えるだけでも、また1年前のように感じられますね。犬の年齢が正しいと思います。いくつかのことがあります。1つは、私たちがエンドユーザー、つまり例えば当社のプラットフォームの顧客とより密接に協力するようになったことです。それによって、はるかに速いフィードバックループを聞くことができます。「Sonnet 4はこういう点で素晴らしいです。こういう点ではもっと良くなってほしいです」といった具合にです。
そして、モデルを本当に興味深い方法でプッシュする顧客が増えてきています。これは研究側にとって非常に役立ちます。なぜなら、「これらはClaudeの次のバージョンで取り組むべき問題だ」と言えるからです。例えば、Claudeは、Sonnet 4や、Opusでさえ、Opusは私たちの最大のモデルですが、コードを書くのは得意ですが、長い時間軸で作業している場合、脇道にそれたり迷子になったりする傾向がありました。
これがSonnet 4.5の本当に重視した点でした。モデルが特定の時点で何を考えているかというコンテキストに多くのデータを入れますが、ある時点でそれがいっぱいになります。そして、それらの作業を続けるためにどのように管理するか。そのフィードバックループがあることは本当に役立ちますし、緊急性も与えてくれます。なぜなら、修正したいバグや、少なくとも修正したい機能要求のようなものがあるということだからです。それが1つの要素です。
もう1つは、モデルリリースのプロセスを大幅に効率化したことです。昨年5月のSonnet 3.5の直前に入社したので、もう本当に昔のことですが、それから今までの間に、運用面での向上が見られました。顧客から早期アクセスのフィードバックをどのように得るか、残りの顧客にどのように十分な事前通知を与えて、ローンチ日に共同ローンチできるようにするか、ロールアウトの朝はどのようなものかなど。ある顧客と話をしたのですが、彼は「多くのラボのモデルロールアウトを見てきたけれど、これは私が見た中で最もスムーズだった」と言っていました。これは、私たちがモデルリリースプロセスをどれだけ効率化したかを示す大きな支持として受け取りました。
それによって、毎回のリリースが非常に特別で非常に困難なプロセスのように感じられることがなくなります。もっと、私たちは何をしているか分かっている、という感じになります。日付が決まっています。研究が予測可能である範囲で、もちろん予測可能ではありませんが、その領域の中で、どうやってそれを可能な限りスムーズにするかということです。
スケールとアルゴリズムの進化
なるほど。そして、おそらく外部の愚かな視点から見ているのですが、あなたが言及しなかったことの1つはスケールです。特にAnthropicからスケーリング法則について多く聞いているので、私の一部は、Claude 4はX個のGPUで、4.5はY個のGPUで、5はZ個のGPUだろうと考えていました。では、モデルリリースの番号は、トレーニングしているデータセンターのスケールやデータのスケールと相関していますか。
興味深いのは、さまざまな時点で、そして私たちのチーフサイエンティストであるJared Kaplanと話せば、彼も同じことを言うと思いますが、スケーリング法則は何が可能かの全体像を描きますが、予め決まっているわけではありません。実際にそこに到達するには、機械学習とエンジニアリングの両方において、非常に困難な作業がたくさんあります。
あなたの質問に答えるために、過去6か月間のスケールについて注目すべき点の1つは、それが本当にエンジニアリングだったということです。増加し続けるアクセラレーターでプレトレーニングとポストトレーニングの両方を行う場合、どうやってそれを信頼性の高いものにするか、どうやってそれを維持するか、どうやって、一部に問題が発生しても、私たちが「ラン」と呼ぶものを継続させるか。
あなたの質問に対して、これらのモデルを提供する能力の向上の多くは、実際には大規模なトレーニングランを実行する能力から来ています。これは基本的にエンジニアリングと機械学習の問題です。両方が改善していると思います。Sonnet 4と4.5の間で何か指摘するとすれば、その多くは実際にエンジニアリング側にあり、特にポストトレーニングの作業の多くをスケールアップできるようにすることです。
私の理解が正しければ、Anthropicがデータセンターをスケールアップすることから得ている利益ではなく、モデルをより良くするためにチームが行っているアルゴリズム作業だということですね。
それらは本当に一緒になります。アルゴリズム作業があり、そして、それらのアルゴリズムの改善に使用できるコンピュートの量を最大化する能力があります。それらは本当に手を取り合っていて、時には直接的に手を取り合っています。小規模で機能するアイデアが、スケールアップすると機能しなくなることがあります。そして他の時には、十分なデータとスケールがあって初めて機能するアイデアもあります。
ですから、私たちのチームについて考えると、実際に新しいCTOを迎えたばかりです。彼の任務の多くは、研究チームとコアエンジニアリングチームをどのように協力させて、そのようなスケールを達成するかということになると思います。
コーディング能力と社内での活用
わかりました。そして、もう1つ期待していたことで、まだ聞いていないかもしれないのは、Anthropic内のチームがAIモデルのコーディング能力を使用して、より速く出荷できるようになったということです。それはここでは脇役なのか、それとも主役なのですか。
それは良い点ですね。少し考えなければなりません。両方の要素があると思います。コーディング能力を超えて現れているものがあり、それはClaudeがプロセスの本当にアクティブな参加者になる能力です。
どういうことかというと、Sonnet 4の頃でさえ、Claudeの使われ方を考えると、これらのモデルをローンチするためのコードを書くのを手伝う、確かに製品コードを書くのに大いに貢献する、Claude Codeに大いに貢献するといった具合でした。Claude Code自体、非常にループの中でClaude Codeを使ってClaude Codeを開発しています。
4と4.5の最大の違いは、例えば私たちのSlackチャンネルで、Claudeをエージェントとして、あるいはほぼ同僚として持つようになったことです。例えば、私たちが構築した「Claude on call」というものがあります。エンジニアだったことがあれば、しなければならないことの1つは、比喩的なポケベルを持つことです。基本的に、1週間か2週間、システムを管理するためにオンコールになります。ポケベルが鳴ったら現れて、「問題が起きている可能性のあることがいくつかある。これらのグラフを確認しなければならない。これを試してみるかもしれない」と言います。
私たちがClaude Agent SDKを使って構築したものの1つ、これはSonnet 4.5と一緒に公開しましたが、社内ではしばらく使っていたのですが、Claudeがそれらのインシデントチャンネルに最初に現れて、何が起きているかをすでに把握し、「私が他のことをしている間に、データの調査をしてくれますか」と非常に迅速に答えることができる能力です。
そして、コーディングする能力を超えて、Claudeに社内でこれらの本当に協力的な役割を果たしてもらうことが増えてきました。それは、Claude Codeと同じ技術を内部で使用していますが、会社をより効率的にしたり、よりスケールアップできるようにしたり、よりよく理解できるようにしたりすることで、会社を加速させています。ですから、あなたの質問に対する答えは、構築側では脇役ですが、実際の運用側ではもっと基本的な役割を果たしているということです。
もう少し掘り下げてみましょう。つまり、基本的にコーディングのオートコンプリートではなく、実際に外に出て積極的に物事を調べて、洞察を持って戻ってくるということですね。
その通りです。そして、似たようなエージェント、今では業界用語ですが、私たちも持っています。エージェントは今、多くの人にとって多くの意味を持つことがあります。
エージェントについて話し始めるなら、エージェントはあなたにとって何を意味しますか。この言葉の定義が必要です。理解するのに苦労しているので。
最も純粋な定義だと思いますが、これはあまり純粋ではありません。おそらく20語くらい使うことになるでしょうから、一緒に編集できるかもしれません。
そうですね。
AIシステムで、さまざまなツールを使用して長い時間軸にわたって計画し、アクションを実行できるもので、ステップが予め決まっていないものです。それらは、現れる情報に基づいて動的に問題を解決できます。
実は、私たちが自社製品について考える際に内部で使っている、エージェントのスコアカードのようなものがあります。そして、私が見ている特性がたくさんあります。これは20語よりはるかに多いですね、Alex。ですから、私が見ている属性は、自律性のようなものです。つまり、エージェントはどれくらいの時間制約なしに実行できるか。Sonnet 4.5はそこで大きな飛躍です。
積極性、エージェントが質問に反応するだけでなく、実際にアイデアを提案したり、口を挟んだりできるか。ツールを使用する能力。そして多くの場合、さまざまなツールです。リサーチツールもあれば、データベースに書き込めるものもあります。メモリ。
つまり、エージェントは時間とともに学習し、タスクを実行する能力を向上させることができるか。私はいつも、エージェントとの100回目のタスクは1回目よりもはるかに良くなるべきだと言っています。なぜなら、人間の従業員にもそうあるべきだからです。コミュニケーション、それは適切な場所すべてに現れているか。
ですから、私たちにとって、これらのエンティティ、これらのエージェントは、SlackやTeamsなど、仕事をするすべての場所に現れ始めると考えています。例えば、私たちはChromeでClaudeのリサーチプレビューをローンチしました。Claudeは、仕事をClaudeに持っていく必要があるのではなく、仕事をしているすべての場所にいる必要があると考えています。
ですから、このような属性のスパイダーチャートのようなものさえあります。私たちが内部で構築している特定のエージェントについて、これらのさまざまな属性でそれを評価し、「わかりました。次の四半期の投資は自律性にするか、メモリにするか」と言えます。そして、取り組んでいる属性を選ぶことができます。
いや、それは実は良いエージェントの定義でした。これまでに聞いた中で最も完全な定義だと思います。では、私たちが話している中で出てくる包括的な質問があります。少なくとも近い将来、AIで見られる改善の大部分は、これらのモデルのオーケストレーション、複数のステップを踏めるようにすることから来るのでしょうか。
LLMの初期の特徴だったと思われるもの、つまり、基本的にそれを大きくする、一般的にもっと賢くする、おそらくいくつかのPhDに情報をポストトレーニングで与えてもらう、そうすれば何が起こるかを見るというものとは対照的に。
特定のタスクやドメインにおいて、その種の非常に正確な深さが引き続き重要であり続ける分野や学問があると思います。しかし、私はもっとワクワクしていますし、全体的に、私たちは製品側からでさえ、そのオーケストレーションにもっと多くの時間を費やしていると思います。
そして、実際には2つの部分があると思います。1つはそのオーケストレーションです。そして2つ目は、Claudeが行っている作業をかなり良いから素晴らしいものにする方法です。
私たちは、Claudeがダウンロードしてそれらのアプリに持ち込むことができるWordやPowerPoint、Excelファイルを作成する能力をローンチしました。自分でやった場合の50%の良さになったとしても、それは十分ではないと思いますし、実際にはスピードアップしません。むしろ、自分でやれば良かった、そうすれば少なくとも何をしたか分かったのに、という感じです。
75%から80%のしきい値をクリアし始めると、もちろんこれは科学的ではなく、ちょっとしたバイブスベースのものですが、実際に仕事を本当に加速させ始めます。それが別の重点でもあります。そして、それが興味深いのは、その一部がポストトレーニングであることです。その一部は、実際にClaudeに本当に良い例をたくさん与え、モデルがプロフェッショナルな品質だと私たちが考える出力をどのように生成しているかと密接に協力することでもあります。
Sonnet 4.5の具体的な改善点
わかりました。15分経ったので、おそらくClaude 4と4.5の間で改善した具体的なことについて少し話すべきだと思います。新しいモデルで良くなったことのリストを簡単に教えていただけますか。
はい、ハイライトだと思うものは、3つのカテゴリーに分けられるかもしれません。1つは価格性能の観点からです。Sonnet 4.5は基本的に、最大モデルであるOpusを事実上すべてのカテゴリーで上回っていますが、より速く実行され、5分の1のコストで行います。
5月のCode with Claudeで、Opus 4を発表していたときのことを考えると、今はそれよりも優れていて、その後継であるOpus 4.1よりも優れているモデルがありますが、5分の1のコストで行っています。これは非常に、その種の知能のための全く新しい一連のユースケースを開くものです。それが価格性能の部分の1つです。
2つ目は、より長くコーディングするだけでなく、より長くエージェント的に実行する能力です。エージェントについて少し話しましたが、私たちが見たのは、実際に、私はこれの面白いビデオを私のXアカウントに投稿しましたが、Claude 1からClaude 4.5までのすべてのClaudeに、私たちの主力AI製品であるclaude.aiを再作成するよう依頼しました。
4.5は本当に、それを行うことができた最初のものでした。そして、実際に品質のあるものを作成しました。実際に機能します。ログインでき、APIキーを使用でき、それらすべてができます。
エージェント的に実行する能力、長い時間軸で作業する能力。ある顧客は30時間作業させました。もちろん、それがすべてのタスクではありませんが、私たちが見始めている上限の種類です。それが別の大きな改善です。
そして3つ目は、コードを超えて、私たちが本当に重要だと考える他のドメインにポストトレーニングの勝利のいくつかを移すことです。
例えば、財務分析は私たちが非常に興味を持っている分野です。そして、数か月前にClaude for Financial Servicesをローンチしました。そして、それをSonnet 4.5のモデルトレーニングにも組み込みました。ですから、Finance BenchやLegalドメインのようなベンチマークを見ると、モデルは明らかに重要なコードだけでなく、これらの他のドメインでも改善しています。これらの課題を解決するために実際にコードを使用するかもしれませんが、要点はコードを書くことではなく、例えば財務分析を解決することです。
わかりました。これらのさまざまなエージェントについては絶対に掘り下げたいのですが、その前にこれを聞かせてください。新しいSonnet 4.5モデルは、前回のリリースまたは4リリースの大きなモデルであるOpusよりも高性能で、より安価だと述べましたね。それはどうやって実現するのですか。
Sonnet 4.5を大規模なスケールでトレーニングするというスケールについて少し話しましたが、それが1つの要素です。
もう1つは、私たちが行ったポストトレーニング作業の改善です。3つ目は、OpusまたはSonnetがもっと良くなってほしいと顧客から聞いていることに基づいて、本当にループを閉じて、それを正しくすることです。
ですから、私たちが常に聞くことの1つは指示に従うことです。Sonnetにこれをするように言ったら、AIであっても、創造的であろうとしても、本当に規範的である必要がある時があります。私たちは、このSonnetにも指示に従うことに多くの作業を投入しました。
エージェントの活用領域
これらのエージェントについて話したいと思います。リリース時に強調した4つの異なるタイプのリストがあります。金融、パーソナルアシスタントエージェント、カスタマーサポート、そしてディープリサーチです。これらが誰のためのものかについて話したいと思います。
金融エージェントは興味深いです。外部APIにアクセスすることで、ポートフォリオと目標を理解し、投資の評価を支援するエージェントを構築できると述べています。
パーソナルアシスタントエージェント。内部データソースを接続し、アプリケーション間でコンテキストを追跡することで、旅行の予約やカレンダーの管理、アポイントメントのスケジュール設定、ブリーフの作成などを支援するエージェントを構築できます。
これらを設定するには、かなりの作業が必要だと思います。例えば、金融エージェントを使う場合、APIが何であるかを理解する必要があります。ですから、ほとんどの人がすぐに使えるものではないと思います。では、この一連のエージェントは誰のためのものですか。そして、この技術をもっとアクセスしやすくする計画はありますか。
例えば、金融のプロフェッショナルでなくても、AIに自分のポートフォリオを調べてもらいたい人がいるとします。最終的には、こういった高度な技術的なことを知らなくても、簡単に設定して実行できるようになりますか。
はい、それは絶対に目標です。私たち自身が構築し、エンドツーエンドでデプロイするエージェントがあります。
パーソナルアシスタンス側で次に少し話しますが、基本的にこれらは、特定のドメインの専門知識を持っている企業のために私たちが力を与えることができるエージェントです。Anthropicで最初に働いた企業の1つはIntuitでした。私たちは彼らの税務アドバイザリーサービスを支えていました。
Anthropicは税務製品を構築することは決してありません。しかし、Intuitは最大のものを持っています。ですから、彼らの税務Q&Aを支えることができたのは本当に強力でした。今では、これらの他の場所すべてを想像できます。Microsoftとも、彼らのOfficeスイート内のエージェントのためにさらに緊密に協力してきました。
ですから、財務分析能力と財務計画能力を取り入れて、例えばExcelユーザーに近づけることができます。それが、これらのいくつかの最大の価値を引き出す方法だと思います。そして、これらの能力をデモンストレーションしますが、私たちが構築するファーストパーティ製品に関しては、どれに深く取り組むかについて非常に慎重です。
なぜなら、あなたが指摘したように、これらの製品が到達すべき規模に到達するには、エンドツーエンドのユーザーエクスペリエンス全体を本当に考え抜いている誰かが必要で、おそらく既存のコネクターのいくつかもすでにセットアップされていることが必要だからです。
しかし、これらのいくつかを自分たちで構築することも重要だと思います。パーソナルアシスタントのケースについて話しましたね。私たちのモバイルアプリで、オンデバイス機能を使うのもとても楽しんでいることの1つです。
実際、今日Appleが私たちをフィーチャーしているのを見ました。Sonnet 4.5の新機能としてです。iOSとAndroidの両方で、Claudeはカレンダーを読んだり、リマインダーを読んだり、テキストメッセージを作成したりすることができます。セットアップはほとんど必要ありません。それが理想的ですよね。既存のコネクターがあり、セットアップの初期化に多くの時間を費やす必要がなく、実際の作業を始められます。
でも、あなたの質問にもっと簡潔に答えると、私たちが自分たちで構築するものもありますし、それらについてはセットアッププロセスを簡素化するために最善を尽くします。しかし、これらのエージェントを既存の製品に組み込むことにも非常に興奮しています。そうすれば、すべてのデータが組み込まれています。
ホワイトカラー労働への影響とオーグメンテーション
ブログ投稿を読みながら、Darioの予測であるホワイトカラーの血の海について少し考え始めました。
それについて考えないのは不可能です。彼は、数年以内にホワイトカラーの仕事の50%がこれらのAIボットによって自動化される可能性があると言っています。これらの金融タスクやカスタマーサポートタスク、あるいはパーソナルアシスタントになることさえできることを見ると、製品を運営している人としてのあなたの視点から、これは喜んで人間の仕事を自動化しようとしているものなのか、それともあなたの役割でどのように考えているのか気になります。
私たちには製品原則があり、それに向かって取り組もうとしています。実際、興味深いことに、Instagramでさえ、全く異なるわけではありませんが、少し異なる製品原則を持っていたと思います。誰のために構築しているのか、どのように、どうやって行うのかを理解することが重要だと思います。
私たちが運用している原則の1つは、補完的または拡張的なものを構築できるなら、まずそれらを優先するということです。長期的には、これらの製品全体がより多くの自動化や仕事の代替さえも行う可能性があるし、おそらくそうなるだろうということを言わないわけではありません。
しかし、より拡張的な製品を構築できれば、2つのことが起こると考えています。つまり、すべての仕事を取って全部やってくれる金融エージェントではなく、もっとやり取りをするようなものです。1つは、AIが今日何が得意で何が得意でないかについて、人々が直感を養うのに役立つと思います。ですから、それは直感の構築に役立ちます。
そして2つ目は、人々がその適応を行う期間を延ばすと思います。Darioがそこで労働への影響の可能性について話しているのを見るなら、それはそれらを加速させようとするためではなく、「これが来ると思います。今この会話を始めましょう」ということです。
そして、私たちが構築する製品では、これが来る可能性が高いことを示しつつも、より拡張的な製品を構築することで、ここからそこまでの橋を架けることができると思います。これは確かにアートとサイエンスがあります。製品チーム内でもこれについて多くの議論をしています。
デザイン責任者と素晴らしい会話をしました。彼が「ボタンを押せばその日の仕事を全部やってくれる製品があったら、それは良い製品だろうか、それはAnthropic的な製品だろうか」と言っていました。私たち両方とも「いいえ」という結論に達しました。私たちが打ち出してきた核となるブランドの信条の1つは「考え続ける」ことです。
私たちは、人間の思考の代替物というよりも、人間の思考の協力的な加速装置のようなものでありたいと思っています。そして、可能な限り長くそうあり続けたいと思っています。
そうですね、私はまだこれについてどう感じるべきか考え中です。しかし、オーグメンテーション対オートメーションをめぐる会話は、まだ非常に初歩的で、正直に言って、かなり愚かな見方だと思います。あなたが言っていることを言っているのではなく、業界のこの問題に対する視点を言っているのですが、タスクを拡張しているのか自動化しているのかということです。
例を挙げましょう。会社内の仕事を自動化した場合、仕事を自動化したことになります。問題は次に何が起こるかです。そして、その仕事をしていた人を新しいプロジェクトのリードや、例えばより価値の高い何かに配置すれば、今度は拡張したことになりますが、拡張という言葉では表現しきれないような方法で拡張しています。
ですから、これを測定するのは本当に難しいと思います。そして、私は会話がこれまでどのように進んできたかについて、複雑な思いを抱いています。どう思いますか。
あなたが言っていることには多くの真実があると思います。特定の時点のタスクがありますよね。カレンダーを管理するとか、話している何かについてリサーチするとか。そして、その人が会社内で持っている役割の種類という、より広いコンテキストがあります。
私たちが考えていることの多くは、人々が最終的にAIの単なるユーザーというよりも、AIのマネージャーのように感じるようになることです。これはエンジニアリングでも起きています。私たちの最高のエンジニアは、一度に3つか4つのClaude Codeインスタンスを管理しています。
そして突然、より高いレベルで考える必要が出てきます。これらのサブClaude Codeそれぞれにやってもらいたいタスクの単位は何か、と。AIシステムと対話する方法についても同じことが言えると思いますし、そこには自動化と拡張の何らかの組み合わせがあるでしょう。
私がこのブルケースについて考える方法は2つあります。1つは、特定の分野の世界的な専門家レベルの思考を、以前はそれを持っていなかったかもしれない企業にもたらすことができるかということです。その才能が地域市場に存在しないか、会社が立ち上がったばかりで世界クラスのCPOやCTOを雇う余裕がないからです。
そこでベースラインを引き上げることができるか。それが1つの要素です。そして2つ目は、スケールし、その小さなチームの結束を維持できる企業が出現するということです。Instagramで私たちはこれを本当にうまくやったと思います。最初から巨大な労働力を構築する必要なくです。
そして、構築される企業の種類は変わるでしょうが、それでも全体を通して莫大な経済的機会があると思います。より少数の大きなモノリシックな企業ではなく、より多くの小さな企業になるかもしれませんが。
興味深いですね。あなたがInstagramにいたときのことを考えると、売却時に16人で10億ドルで売って、人々はそれがクレイジーだと言いましたよね。
その通りです。ある時、「一人で10億ドルの価値がある最初の会社はいつ現れると思いますか」という質問を受けました。私は「私たちは13人でした」と答えました。売却時は13人で、クロージング時は16人でした。基本的にはそのあたりです。ええ、そのあたりでした。ですから、私たちは少ない人数で多くのことを成し遂げました。その多くは集中から来ていたと思います。
そして、さらに効率的にできた仕事もおそらくあったでしょう。売却を数年待っていれば、その2倍、3倍の価値があったかもしれません。
皆さん、ちなみに、Mikeの以前の仕事について知らない方は、彼はInstagramの共同創業者です。
ですから、会話の後半では、ソーシャルメディアの要素やソーシャルメディア構築との比較に入っていきます。でも、前半を締めくくるにあたって、あと2つ質問があります。
メモリ機能の重要性
メモリについて言及されましたね。これは、この作業の中で最も興味深い部分の1つであり、一般的な会話ではあまり評価されていないと思います。これらのボット内でより良いメモリを構築することが、どれほど重要で、それが実際にどのように起きているのかについて話していただけますか。
メモリに関して私たちが行ったことの最大のブレークスルーまたは本当に重要な部分は、モデルが他の方法で情報にアクセスする代替物として、またはモデルの上に構築されたシステムとして扱うのではなく、実際にそれをモデルに深く訓練したことです。
ですから、モデルはメモリの概念について知っています。面白く聞こえるかもしれませんが、話しかけるとそれが本当にわかります。そして、あなたは待ってください、それはどういう意味ですか。モデルについて話さなければなりません。
基本的に、トレーニングでは、モデルに効果的にメモリを読み込んだり、更新したり、書き込んだりするための一連のツールを与えます。
つまり、モデルは自分自身のメモリを管理できるという概念を理解しているということです。そして、私たちのプラットフォームでは、実際にそれを使用できる基本的な構成要素として持っています。つまり、メモリアクセスツールを持つClaudeと話しているとき、「ねえ、Claude、これについてメモリを更新してくれますか」と言えます。そして、それが何を意味するかを知っています。「了解、メモリを更新します」と言います。
あるいは、アクションを実行しているとき、そのアクションに関連するメモリがある可能性が高いと考えると、アクションを実行する前にそのメモリを取得します。以前のシステムでは、それを自分で上に構築する必要があったか、Claudeやこれらのシステムのいずれもそれを使うのが得意ではありませんでした。
ですから、効果的に、私たちが「以前にこれをやったと思う」とか「以前にこれが起きたと思う。考えてみるか、メールを検索してみるか」という考えを持つのと同じ方法です。私たちは基本的にClaudeに同じ能力を与えました。
そして、それは、あなたが誰と対話しているか、何をすべきかといった、非常に事実ベースのメモリになることができます。しかし、タスクベースのものにもなります。Xをしているときは必ずYをすることを覚えておいてください、というような。
それはかなり素晴らしいですね。では、メモリを使用するとき、メモリは何をもたらしてくれるのですか。より良いメモリは、より多くの側面を記憶し始めるのでしょうか。1つの例を挙げましょう。これは非常に初歩的ですが、Claudeを使ってポッドキャストの説明を作成する場合、最初にフォーマットプロンプトを投下します。最初の文はこうあるべき、2番目の文はこうあるべき、というように。
そして、説明を求めるたびに、その正確なプロンプトを使わなければなりません。さもなければ、好き勝手なことをしてフリーランスをします。これが私たちの物事のやり方だと覚えておいてと伝えたら、これらのボットが十分に賢くなって、それを知るようになるのはいつになるでしょうか。
そして、私の問題は、同じことをやってもらおうとするときに、多くの人が抱えている問題だと確信しています。
そうですね。非常に近いうちです。ですから、次の1週間ほどでローンチが予定されています。メモリと、仕事を完了させたい反復可能な方法のアイデアの両方があります。
メモリの観点からは、私はAlex、ポッドキャストとニュースレターとサイトを運営している、といった非常に基本的な事実ベースのものを超えて。それは多少役立ちますが、十分ではないと思います。
以前にこの人と対話したことがあるか、前回Mikeとチャットしたときに何が起こったか、そこでのメモリを検索できるか、というレベルに到達すること。あるいは、これらの要約を生成するときは常に、この部分を必ず引用するとか、よりパンチの効いたもので始めるとか、時間とともに結果を更新して学習できるということです。
それが目標です。繰り返しますが、Claudeが非常に有能な新入社員のようなものであるなら、私たちのプラットフォームで使用するにしても、ファーストパーティ製品を使用するにしても、時間とともに使用するにつれて改善している地点に到達したいと思っています。あなたの好みに合わせて訓練を手伝った仲間のように感じてほしいです。
優先順位のリストでその能力はどこにありますか。あなたにとって非常に高いように聞こえます。OpenAIにとっても高いことは知っています。
そうですね、私たちにとって本当に高いです。ファーストパーティ側でも高いですが、プラットフォーム部分でも非常に高いです。
わかりました。では、休憩に入りましょう。その後、AI構築の瞬間が、ソーシャルメディア構築と何が共通していて、何が異なるのかについてお聞きしたいと思います。もちろん、あなたはその中心にいました。では、休憩の後にそれをやりましょう。
ソーシャルメディアとAI構築の比較
そして、Big Technology Podcastに戻ってきました。Mike Kriegerです。彼はAnthropicのプロダクト責任者であり、Instagramの共同創業者です。では、ソーシャルメディアとAIについて話しましょう。非常に興味深いです。
AI業界を見回すと、FacebookやTwitterのような場所から来た多くの人々が、これらのAI企業の大きな部分を運営しているのが見えます。もちろん、あなた自身、Instagramの共同創業者であり、Anthropicのプロダクト責任者です。Kevin Weilは、確かInstagramのプロダクト責任者でもあったと思いますが、OpenAIでプロダクトを運営しています。
FacebookからきたFidji SimoはOpenAIでコンシューマーアプリケーションを運営しています。まだまだ続けられます。これらの製品を構築することは、ソーシャルメディアの構築と何が共通していて、どう違うのですか。
実際の製品自体から抽象化して、良い製品を構築するには何が必要かということがあるかもしれません。私が思うに、ソーシャルメディア志向の人々が多くAIに移ってきたというよりも、4年前、ChatGPT以前、これらのLLMの多くが出現する前の時点で、最高の製品担当者の多くがそこに集中していたということだと思います。
ですから、それは最近の才能の集中地のようなものです。特定の分野の才能の集中がよく起こることを私は発見しています。それが以前はソーシャルメディアでした。ですから、それが部分的に1つです。そして、あなたがデータが何を伝えているかを理解することですが、次にどこに移動したいかについて賭けをする直感を持つこともあります。どうやって素晴らしい製品チームを組み立てるか。製品、エンジニアリング、デザイン、マーケティングがどのようにうまく連携するか。これらのさまざまな側面すべてです。それが1つです。
そして、ソーシャルメディア内での類似点と相違点という別の質問があると思います。Claudeでは、かなり異なると感じます。より多くのビジネスオーディエンスがあります。個人で使用している人もたくさんいますが、今のところあのソーシャルコンポーネントが少ないです。
確かにもっと口コミです。私たちが経験した最もソーシャルなことは、人々がニューヨークで行ったばかりのグッズやポップアップにどれだけ興奮したかでした。それは本当にアトラクターの瞬間のようなもので、そこでもっとそういうものがありました。
しかし、一般的には、大文字のGrowthのメカニクス、何人の人を連れてきたか、誰を招待したか、それらのさまざまな部分はあまりありません。少なくとも私たちがClaudeで取り組んでいる部分からは少し違います。
もちろん、これらの多くの、またはClaudeではないツールが画像や動画の生成に移行するにつれて、人々がソーシャルメディアのフロントで行っていたことと、より強い重なりがあります。
エンゲージメントはあなたにとってどれくらい重要ですか。つまり、Facebookの意思決定を本当に推進したのはエンゲージメントで、もちろん成長、そしておそらくこの2つは手を取り合っているのでしょう。
私たちは常にAI製品について疑問に思います。もちろん、人々に使ってもらいたいですが、エンゲージメントのためのエンゲージメントは望んでいません。なぜなら、これらのユースケースに対応するのは非常にコストがかかるからです。では、最適化しようとしている指標の観点から、エンゲージメントはあなたにとってどこに位置していますか。
私たちはエンゲージメントをあまり見ていません。少なくとも、Instagramで費やした時間のような典型的なものでは見ていません。実用性の代理として、日々の訪問者のようなものを見ています。それが私たちが見ているものの1つです。
しかし、興味深いことに、昨日モバイルチームと話していて、将来、人々のClaude Codeのようなものとの対話は、もっとモバイル志向になるかもしれないと思いました。理想的には、私たちのオフィスはSalesforce Parkのすぐそばにあります。
コーディングタスクを開始して、Salesforce Parkを散歩したいと思っています。おそらく同僚と一緒に。途中でピンが鳴って、何か明確化の質問があるかもしれません。そしてデスクに戻ると終わっています。それは、キーボードに手を置いているのとは非常に異なる分野です。また、それはコーディングが今日主に進化してきたものとは異なる分野のように感じます。
そして今では、実現したい創造的なアイデアは何かということについてです。しかし、その世界では、費やした時間はかなり低かったですよね。おそらく、タスクを開始していくつかの質問を解決するようなものでしたが、生産されたものの価値ははるかに高かったです。ですから、対話のパラダイムは、私たちが最終的に見ているものという点で本当に本当に異なります。
そして、ソーシャルメディアで見られるような長いセッションや対話ではなく、完了した仕事の価値についてもっと考えています。
私は正真正銘、インタビューした創業者から、彼女のお気に入りのユースケースは、AIを使ってコンピューターから離れることだと言われたところです。これはテクノロジーで以前に聞いたことがないことです。
Mark Zuckerbergの戦略とソーシャルメディアへの影響
では、Mark Zuckerbergが彼の非常にユニークなAI戦略で何をしようとしていると思うか聞かなければなりません。
長い間知っているNatのような人々がいて、本当に尊敬しています。ですから、この企業ポートフォリオにとってAIが何を意味するかについて、もっと実験が見られると思います。
検索バーにチャットボット的なものを置いた最初の波は、特に変革的ではなかったと思いますし、そこのチームはおそらくそれを知っていると思います。ですから、私が見たい、あるいは期待することは、InstagramやBoltのような、それらのサーフェスの外に存在できるような、より多くの実験です。
Instagramで私たちが持っていたアイデアのいくつかは、Hyperlapseのようなアプリに本当に属していませんでした。誰もBoltを覚えていませんが、Boltは私たちの非常に高速なメッセンジャーでした。
InstagramやFacebook、WhatsAppのように広く普及したサービスを持つと、そこに新しい行動を導入するのは難しいと思います。私たちはStoriesでそれを行いましたし、彼らはその後Reelsでそれを行いました。しかし、世代に1回のような感じで、それ以上の実験のテストベッドを持ちたいと思います。
そして、私が彼らの考え方について知っていることから、そのような実験がもっと出てくると思います。
興味深いですね。Instagramの共同創業者として、AI生成の画像や動画がソーシャルメディアのフィードを埋め尽くし、Soraアプリのようなものをアプリストアのナンバーワンの座に押し上げたのを、興味を持って見ていると思います。
AI生成コンテンツや動画、おそらくこのCameoバージョンのように自分を動画に入れることができるものが、今日私たちが持っている人間が生成するコンテンツを脅かしたり、置き換えようとしたりすると思いますか。それとも、人間のものがトップに留まり、これは一時的な流行だと思いますか。
そうですね、ここで私がまだ確信していないことがあります。Instagramでこれを見ました。クリエイティブツールが出現し、もちろんこれらはVeoやSora、これらの他のモデルで見ているような能力よりもはるかに基本的なレベルでしたが、クリエイティブツールの出現を見て、それが単にネットワークになるというよりも、戻ってくるネットワークに超越できるかどうかは、多くの場合そうではありませんでした。
それにはいくつかの理由があったと思います。1つは、少なくともその世代の製品では、クリエイティブコンテンツまたは作成されたコンテンツが、時間とともに少し同じようなものになり始めることです。特に非常にスタイライズされたツールの場合はそうです。
そして2つ目は、Instagramを Instagramたらしめているダイナミクス、つまり、そこですでに知っている人々、フォローしている人々、知っているクリエイターです。もちろんこれは今では変わり、よりアルゴリズミックなReels志向の部分になっています。あるいは、おそらく私は以前のInstagramについて話しているのかもしれません。まだ重いフォローコンポーネントがありました。
誰と対話しているか分かっているというような感じになります。もちろん、TikTokは物事について非常に異なる見方をしています。ですから、それが置き換えているという点で、真実でなければならないことは、1つは、コンテンツが時間とともに多様に感じられること、そしてこの前に見たことがあるような感じではないことです。本当に興味深いですが、以前に見たことがあります。
そして2つ目は、そのネットワークに時間をかけて存在することに価値があるか。そして、興味のあるコンテンツだけでなく、気にかけている人々や形成されるコミュニティがあるから開いているかどうかです。
なぜなら、それが実際にInstagramが正しく行ったことだと思うからです。写真を撮ることを中心とした、特定の都市に住むことを中心とした、新たに出現するコミュニティが見られ始めました。それらは非常に自己組織化されていました。私たちが人々に与えた唯一のツールはハッシュタグでした。それがこれらのコミュニティを刺激するのに十分でした。ですから、それがまだ答えられるべき根本的な質問だと思います。
そうですね、素晴らしい指摘だと思います。自分を動画に入れることができるCameo的な側面が、これらのアプリでそれを実現する方向に多少進むかもしれません。しかし、金曜日にSoraを手放すことができなかったことをお話ししますが、今は水曜日で、今すぐ開きたいという気持ちは本当にありません。
おそらくあなたは正しいと思います。すべてのAIコンテンツ作成には、ある程度の同一性があり、1つの動画を見ると、すべてを見たような気分になるかもしれません。そして、おそらく人々は創造的なプロンプトを思いつき、新しいトレンドを見るでしょう。しかし、それはまさにその通りの指摘だと思います。それが課題です。
そうですね。実験という点では、すべてが非常に速く起きていると思います。ですから、これらのツールが適応する能力もあると思います。そして、それがソーシャル製品の新しいカンブリア爆発への扉を開くかどうかは、私が本当に追跡しているもう1つのことです。
ここ数年間、ソーシャルフロントでは非常に静かだったように感じます。なぜなら、本当に大きなプレイヤーの間で安定してきて、新しい実験があまりないからです。そして、2010年代の、もしソーシャル製品がこのようだったら、もしこのことについて差別化された見方をしたらどうなるか、という時代が恋しいです。すべてのほとんどはうまくいかないでしょうが、少なくとも「やった、それを試したい、それは異なる体験だ」というような価値があります。
前面と背面のカメラを一緒に撮る写真アプリのような、新奇なもののように感じられるものでさえ。それは永続的なネットワークですか。いいえ、しかし何かへの道を示しました。
そうですね、それは楽しかったです。そして、私もそれが恋しいです。ちなみに、それは2020年代に起きたと思いますが、私は確かに2010年代が恋しいです。BuzzFeedでソーシャルメディアレポートをしていたときで、毎週新しいアプリがあって、「さて、Peachって何だ。これを試してみよう」という感じでした。そして消えていきましたが、何か新しいものがありました。
ああ、なんてことだ。Peachは古典でした。史上最高の古典でした。
そうでした。では、コミュニティについて簡単に話したいと思います。ユーザーのコミュニティを見つけてフィードバックを得るためには、どこを見ますか。そして、Redditはあなたにとってどれくらい重要ですか。AI分野での活動の多くがRedditに移っているのを見てきましたし、r/Singularityを読んでいるのか、どれくらい深く入り込んでいるのか気になります。
それは素晴らしい質問ですね。ですから、興味深いことに、私たちが見ているコミュニティは、多少重複していますが、異なるものがあると言えます。1つは、プラットフォームであることから、モデルがどこで改善し続けることができるか、あるいはプラットフォームとして何をもっとうまくできるかについて、非常に明確な視点を持つことが多い強力な顧客基盤があります。
ですから、これはInstagramでの経験とは非常に異なります。Instagramの使い方について多くの人と話しましたが、Anthropicで持っているような、アドバイザリーボードのようなより永続的な概念はありませんでした。そして、数か月前にPaul Smithを新しいチーフ・コマーシャル・オフィサーとして迎えました。彼は、私たちが話してきた、より多くのエンタープライズの人々のコミュニティももたらしてくれました。
それが1つの大きな違いです。つまり、より安定した、話をしている一連の人々やコミュニティです。それが1つです。実際、私たちには素晴らしいユーザー・エクスペリエンス・リサーチチームがあり、そこで、claude.aiのようなものの中心的なデモグラフィックだと考えているパワーユーザーが製品をどのように使用しているかについて、つながりを保つことができます。
そして、私はそれが大好きです。毎月、製品全体会議を行い、その中で私のお気に入りの部分は、基本的にUXRチームがユーザーの声を届ける部分です。時には驚くことがあります。なぜなら、必ずしもソフトウェアエンジニアの典型のような、私たちの製品を確実に使っている人々だけではないからです。
「私はマーケティングマネージャーで、週に20のデッキを作成する必要があり、ついに使っているツールを見つけました。でも、これが私の感想です。これがAIに対する私の恐れです。これがAIの約束です」というような人もいます。それは、非常に人間的な側面があります。
そして確実に、TwitterやXとRedditには、AIコミュニティの強力なポケットがあると思います。私たちは、以前よりもそのコミュニティに関与するのが上手になったと思います。
以前は、「大量のボリュームがあるけれど、どう反応すればいいか」というような時期がありました。そして、修正したいことがある時だけ現れるようにはしたくないですよね。そうすると、非常に企業的で本物らしくない感じになります。ですから、私たちは、それらのコミュニティに参加するより良い能力を見つけたと思います。
そして、それは良いことです。彼らは多くの場合、何が可能かの端を教えてくれるパワーユーザーや極端なユーザーであり、それをより広く一般化しようとすることができます。しかし、r/Singularityよりも少なく、おそらくr/ClaudeAIの方が多いです。非常に平凡ですが、多くの人々がたむろしている場所です。
わかりました。この会話全体を通して、OpenAIが基本的にAnthropicがコーディングでどれだけうまくやっているかを見て、これが会社のナンバーワンの優先事項だと言っているという事実については触れていませんでした。Xと言えば、毎日OpenAIのリーダーがX上で彼らのCodeXプロダクトを宣伝し、彼らがコーディングスキルでどれだけ進んでいるかについて話しているのを見ることができます。
では、OpenAIの挑戦をどのように評価しているか、そしてAnthropicの強みであったコーディングで彼らと真正面から対決することがどのようなものになるかについて話していただけますか。
そうですね、確かに夏には、私たちがどれだけ孤独に、注意を払い、製品を出していたかが、全体的に驚きだったという時期があったかもしれません。確かに、もっと興味深く、競争的になってきました。それは大好きです。
Instagramでの私のお気に入りの時期も、興味深い競合他社がいた時でした。それは、私たちが構築したい製品は何か、必要な能力は何かという点で、前進を促すと思います。
ですから、ゲームオンのような、私たちにとっても興味深い瞬間です。コーディングの部分は、コーディングが本当に価値の高い経済活動であるという事実を超えて、モデルが計画を立て、コードを書き、問題を解決する能力は、ソフトウェアエンジニアリングに役立つだけでなく、長期的に構築したいエージェント的な行動にとって本当にクリティカルパスだと見ています。
ですから、それが私たちのトップ2または3の優先事項の1つでないということは決してありません。そして、それは、人々にとって正しい問題を深く解決する正しい製品をどのように提供するかという問題です。おそらくこれは、良い製品デザインと私が製品についてどう考えるかについてのあなたの質問全体につながります。
ソフトウェアエンジニアリングのベンチで高いスコアを出すことは、ベンチマークとして重要です。しかし、人々から「Rustでやっていた本当に難しいタスクがあって、Sonnet 4ではできなかった。Opus 4もかろうじてできた。Sonnet 4.5ならできる」というフィードバックを得ることの方が、はるかに重要だと思います。それには非常に興奮します。なぜなら、実際に現実世界でインパクトを与えているということだからです。
ですから、私たちが仕事を正しく行っていれば、コーディングについて、他のプレイヤーがスペースに参入している存在の中でも、人々がこれらの製品を実際にどのように使っているかを聞くことに本当に集中し続け、将来のモデルバージョンがその高い実用性スペースで人々がいる場所を満たしていることを確実にしようとしているのが見えると思います。
エンタープライズでのAI導入
最後の質問です、Mike。企業は皆ジェネレーティブAIに興味を持っていますが、それを実装するのは得意ではありません。彼ら自身もそれを認めていますし、調査もそれを示しています。彼らはまとまるでしょうか。
まとまると思います。実際、私たちの会話の後、製品チームとオフサイトを行う予定で、来年の焦点の多くは、エンタープライズ側にさらに入っていくことを続けることです。そして、いくつかのことがあると思います。
これについて、おそらく別の1時間全体を使うこともできます。私はこれについても非常に興奮しています。企業がすでに採用しているClaude for Enterpriseのような製品を取り入れて、それを本当に本当に役立つものにする方法という範囲があります。
以前に出力品質について少し話しましたが、それが実際にどれだけあなたを助けているか。企業のAI採用に関して見られるかもしれない幻滅の谷、または幻滅のトラフには、これらのツールが時間を節約し、仕事をより良くするという約束があったと思います。それは、以前の世代の製品では満たされませんでした。
そして、私たちが実際にエンタープライズで粘着性のある採用を得るつもりなら、それらは満たされる必要があります。ですから、私たちが推し進めていることの多くは、AI生成のドキュメントのがらくたではないということです。それは、あなたが反復し、使用し、作成したことを誇りに思えるAI生成の品質のあるものです。人々がコーディング側で構築したものについて誇りに思えるのと同じように。
そして、Claude for Enterpriseの部分を超えて、より深い統合、内部変革のようなものまであります。そして、企業がどのように考え、採用しているかというあなたの質問に対して、そこで私たちが学んでいることは、少なくとも予見可能な将来、企業がそこに到達するのを支援するという点で、はるかに積極的に取り組む必要があるということです。
ですから、今週発表したDeloitteと提携して、企業に私たち自身のエンジニアを組み込んで、私たちのテクノロジーを取り入れ、彼らの最も高いニーズに企業を合わせ、実際に共同開発し、問題を解決するまで建物に閉じこもって、その経験から学び、次の企業に移るというようなモデルをもっと行っています。
しかし、エンタープライズ製品を持っているだけで、企業がそれを理解してくれることを期待する、というような、後ろに寄りかかるようなものとは非常に異なると思います。私たちは、そのスペクトラムの両端で、もっとはるかに積極的に取り組む必要があると思います。
Claude.aiがウェブサイトです。Mike KriegerはAnthropicのチーフ・プロダクト・オフィサーです。Mike、いつも話すのが楽しいです。番組に来てくれてありがとう。
呼んでくれてありがとう、Alex。
さて、皆さん、聞いて見てくれてありがとうございました。金曜日に今週のニュースを分析しますので、その時にお会いしましょう。Big Technologyで。


コメント