Claude Codeのレート制限変更を巡る論争とAnthropicのGPU不足問題

Anthropic・Claude・ダリオアモデイ
この記事は約30分で読めます。

AnthropicがClaude Codeのレート制限を変更し、ユーザーから激しい反発を受けている。平日午前5時から11時(太平洋時間)の間、5時間セッション制限の消費速度が大幅に増加するという変更だ。この背景にはGPU不足という深刻な問題がある。研究部門、製品開発部門、ユーザーという3つのグループが限られたGPUリソースを奪い合う構図となっており、急激な成長によってユーザー需要が急増した結果、研究優先だった同社が苦しい選択を迫られている。OpenAIが早期から大量のGPUを確保していたのに対し、AnthropicとGoogleは投資が遅れ、現在Amazon等との協力でキャッチアップを図っている状況だ。今回の変更自体は経済的に理解できるものの、事前告知なしでの実施、公式発表の遅れ、従業員個人のTwitter投稿のみでの周知など、コミュニケーション面での失敗が批判を増幅させている。

We need to talk about the Claude Code rate limits
Anthropic just made the limits on the Claude Max/Pro plans a lot worse...Thank you Depot for sponsoring! Check them out ...

Anthropicのレート制限変更に対する反発

AnthropicがClaude Codeサブスクリプションのレート制限に大きな変更を加えたことで、ユーザーから激しい反発が起きています。最初は「春休みキャンペーン」として、ピーク時間外の使用量を2倍にするという発表がありました。これは3月14日のことでした。

しかしその1週間後、新たな投稿が出されました。Claudeへの需要増加に対応するため、平日の午前5時から11時(太平洋時間)の間、無料プラン、プロプラン、マックスプランの5時間セッション制限を調整するという内容です。週間の制限自体は変わりませんが、この特定の時間帯では5時間セッション制限を以前より速く消費してしまうことになります。

この変更について、多くの考えがあります。

Claude Codeサブスクリプションの異常な寛容さ

ご存じない方のために説明すると、Claude Codeのサブスクリプションは歴史的に非常に、非常に寛容でした。競合他社の分析によれば、月額200ドルのプランに加入すると、最大で月5,000ドル相当のコンピュートリソースを消費できるとされています。これは25倍の補助金です。これは異常です。

彼らがそうしたいならそれは構いませんが、それができなくなるまでの話です。そして、どうやら管理に苦労しているようです。特に午前5時から11時という時間帯が、彼らの苦境の中心になっているようです。これは、以前のClaude春休み割引キャンペーンで引用されたのとまったく同じ時間帯です。午前5時から11時の太平洋時間の時間帯です。

その時間帯以外では、使用量が2倍になりました。しかし、その時間帯内で作業していた場合、使用量は同じままでした。しかし今回、さらに進んで大幅に制限したようです。一見小さく見える数字を引用していますが、実際には非常に恐ろしい数字です。約7%のユーザーが、特にプロティアで、以前なら到達しなかったセッション制限に到達するだろうと述べています。

これは良くありません。すべての返信を見ると、「再考すべきだと思います」から「これはクソだ」まで、人々は満足していません。

ここでの私の見解は、皆さんを驚かせるかもしれません。彼らはこれに対して過度の批判を受けすぎていると思います。なぜそう考えるのか、どうしてこうなったのか、そして今後このようなことがますます増えていくであろう理由について、最善を尽くして説明します。

コンピュートリソースの現実

まず取り上げなければならないのは、コンピュートリソースが高価だということです。より具体的には、Anthropicがコンピュートリソースに関してひどい選択をし、その代償を長期的に支払っているという話をする必要があります。

このコミュニケーション方法、以前の変更でのテスト方法、そしてThoric氏が一人でこれらすべてに対処しなければならず、社内から何の支援も受けていないように見えることなど、他にも話したいことがあります。それらすべてについても話しますので、ご心配なく。

しかし、コンピュート側に本当に焦点を当てたいと思います。なぜなら、そこには興味深い話があるからです。

まず、皆さんが実際には知らないかもしれないことから始めましょう。Claudeのようなモデルを実行するにはGPUが必要です。革新的な考え方ですね。でも、これを別の事実と組み合わせると、物事が少し理解しやすくなると思います。

Anthropicの研究者もGPUを必要としています。これも明白に思えるかもしれません。モデルの実行にGPUが必要で、モデルのトレーニングにGPUが必要なのは明らかです。しかし、ここには大きな問題があります。

GPUの配分という難題

固定数のGPUがある場合、どうやってそれらを分割しますか?製品にお金を払って使用しているユーザーに十分なGPUがあることを確保し、同時にユーザー向けの製品を作る製品チームのためにも十分なGPUがあることを確保し、さらにモデルを構築する研究者や人々のためにも十分なGPUがあることをどうやって確保しますか?

私の理解では、ここで重要な3つのグループの間には非常に敵対的な関係があります。研究、製品、そしてユーザーです。

研究が何をするかは皆さんご存じでしょう。彼らは実際にモデルを作り、これらすべてのコンピュートパワーを使ってモデルを作成する人々です。

次に製品があります。これはclaude.aiウェブサイト、Claude Codeサブスクリプション、CLI、統合するすべてのもの、Cowork、彼らが提供するすべての製品、さらにある程度は企業に販売するAPIやSDKなども含まれます。これらは会社で製品を構築している人々です。

そして、ユーザーがいます。これらの製品にお金を払い、それらを消費している人々です。

しかし、時間とともに何かが変わりました。2024年には多くの顧客を獲得し、1億ドルの収益を上げました。2025年には10億ドルを稼ぎました。そして現在、2026年の収益は、現状のまま推移すれば、さらに成長しなくても、140億ドルに達する見込みです。

年間10万ドル以上をClaudeに費やす顧客数は、過去1年で7倍に成長しました。また、企業側もあります。2年前、年間ベースで100万ドル以上を使う顧客は十数社でした。現在、その数は500社を超えています。フォーチュン10企業のうち8社が現在Claudeの顧客です。

わかりますか?成長は異常なものでした。そしてそれは、この内訳の製品側とユーザー側が、彼らが持つGPU割り当てにますます侵食していることを意味します。

これは明らかに非常に不正確ですが、彼らが100個のGPUを持っているとしましょう。社内の異なるグループにこれらをどのように分割するかを決める必要があります。

50対50に分割されるかもしれません。半分は研究に、半分はユーザーに。もっと積極的に分割するかもしれません。75対25かもしれません。逆に進むかもしれません。研究にもっと多くを与えるかもしれません。

ここでの問題は、これらの一方が弾力的だということです。つまり、社内の人々がGPUをどれだけ使用しているかを変更できるという意味です。

内部でのGPU争奪戦

研究が使いすぎていて、製品が何らかの契約を結ぶためにもっと必要な場合、研究からGPUを取り上げてユーザーに再割り当てできます。そして、これよりもさらに細かい方法で割り当てています。

Sonnet 4がリリースされたとき、基本的な使用のためでさえ、T3チャットで十分なレート制限を得られませんでした。そして、そこの営業担当者と長いやり取りをしました。彼らはレート制限を引き上げることができると言いましたが、他のモデルのレート制限を下げなければならないと言いました。なぜなら、彼らが実質的にやっていたことは、特定のモデル用に予約されるGPUの数を変更することだったからです。

このように考えなければならないのは彼らだけではありません。OpenAIでさえ、製品を閉鎖しなければなりませんでした。Soraアプリとそのビデオモデル用のAPIです。先日、私が厳しく批判したものです。

Soraアプリはビデオジェネレーションがコストがかかるため、とんでもない量のコンピュートリソースを使用していました。そして、それで実際にお金を稼いでいませんでした。実際の成長や方向性が見えませんでした。そこで、最善の解決策は、それを終了して、そのGPUを他のことに利用できるようにすることだと判断しました。

他の研究所もこれらの問題を抱えていますが、Anthropic特有の問題に焦点を当てたいと思います。

最初の問題は、研究会社から製品会社への移行において、彼らがどれほどひどく調整したかということです。それは彼らのDNAにはありませんでした。血の中にはありませんでした。彼らがやるべきことではありませんでした。

元のClaudeサイトでさえ、外部委託されました。彼らは外部の他の開発者に行って構築してもらいました。なぜなら、彼らはモデルを良くすることに集中したかっただけだからです。そのため、研究がAnthropicという会社を率いる傾向がありました。研究者が望むことが、最終的に起こることになる傾向がありました。

つまり、製品と製品のユーザーがますます多くの需要を持ち始めたとき、研究は動揺しました。そして、お金を失い顧客を失うことなく、ユーザーが使用しているコンピュートリソースの量を本当に減らすことはできないことに気づいたとき、研究が少し譲歩し、社内で共有されているGPUの量について少し打撃を受けなければならないと判断しました。

これは研究を非常に動揺させ、今でも研究を動揺させているようです。そして今、研究は本当にGPUを必要としているようです。なぜなら、彼らはインターネット上で漏れ続けている、いくつかのクレイジーな新しい神モデルのトレーニングにGPUを使用しているからです。

私はそれについて何も知りません。早期アクセスもありません。これが起こっていることだけは知っています。人々が尋ね続けています。私はMythosについて、漏れた1つのブログ投稿以外は何も知りません。

明らかにAnthropicは現在、GPUを猛烈に使用しています。同時に、彼らは前例のない成長に直面しています。

研究はより大きく、よりスマートなモデルを作っているので、より多くのGPUを必要としています。製品はより狂ったような製品を構築しようとしているので、より多くのGPUを必要としています。バックグラウンドエージェント、大量のトークンを使用するコードレビューなどです。

特定の製品がリクエストごとに以前よりも多くのトークンを使用するすべてのタイプのものです。そして、ユーザーの成長があります。

研究者はより多くの研究のためにより多くのGPUを必要としています。製品は製品のためにリクエストごとにより多くのGPU時間を必要としています。そして、彼らはより多くのコンピュートリソースを平均的に必要とする製品を作っています。なぜなら、彼らは製品でさらに先に進みたいからです。

そして、ユーザーはより多くの使用を要求しています。なぜなら、彼らは有料顧客だからです。一部はサブスクリプションに、一部はAPI価格を支払っています。彼らはすべてより多くのコンピュートリソースを必要としています。

その結果、これらのグループは固定されたGPUのセットのために常に互いに戦っているだけです。

GPUを買えばいいじゃないか?その落とし穴

ここにはかなり明白な解決策がありますよね?もっとGPUを買えばいいんです。もっと手に入れればいいんです。

問題がそれなら、もっとGPUを手に入れればいいんです。彼らは300億ドルを調達しました。それは大量のGPUマネーです。存在すればたくさんのグラフィックカードを手に入れることができます。

ここに問題があります。GPUを買うのは難しいんです。多くのGPUを買うには先見の明が必要です。本当に早い段階でそれらを買うことを選択する必要があります。なぜなら、実際にサーバーファームに到着するまでに18ヶ月から3年かかる可能性があるからです。

そして、Anthropicはより多くのコンピュートリソースの購入に大きく投資することを選択しませんでした。ここで良いデータを取得しようとしてきました。誰もがこれを秘密にしているので確実に知るのは難しいですが、実際に最近、Anthropicはコンピュートリソースの量とH100の数を大幅に増やし、OpenAIがデータセンターで持っているところをわずかに追い越したようです。

とはいえ、私たちはまだこれらのものが作られているこの窓の中にいます。伝えられるところによると、新しいxAIサーバーファームは大規模になる予定です。大規模、本当に大規模です。そのコストは440億ドルで、Anthropicが調達したばかりの額よりも多いです。

しかし、より多くのコンピュートリソースのためのAnthropicとAmazonのコラボレーションも非常にうまくいっているようで、再び彼らを上回るでしょう。

とはいえ、これはAnthropicが所有しているものではありません。これはAmazonが所有しています。これは彼らすべての間のコラボレーションです。

現在、業界では、AnthropicとGoogleの両方がコンピュートリソースとGPUの購入にやや遅れて飛びついたため、全体的に非常に遅れていると広く理解されています。そして、この容量の多くはAmazonと共有されています。

両当事者が遅れているため、彼らは協力しているように見えます。Googleは現在、Anthropicにリースされるデータセンタープロジェクトに資金を提供しています。そうすることで、Anthropicは再びより多くのGPUを持つことができます。なぜなら、彼らは現在GPUで非常に遅れているからです。

一方、私が聞いたところによると、OpenAIはいつでも利用可能なすべてのコンピュートリソースを文字通り購入することを選択したようです。どれだけ必要か、長期的にどれだけ必要かを計算するのではなく、いつでもできる限り目の前にあるすべてのものを文字通り購入するという感じです。

その結果、彼らはこのタイプの急増に対してわずかに良い位置にいます。しかし、研究のために十分であることを確認する必要もあり、それはしばしばより多くのコンピュートリソースを得るためのSoraの閉鎖のようなものを含みます。

すべてはコンピュート危機に起因する

しかし結局のところ、ここで起こっているほとんどすべてはコンピュート危機によるものです。利用可能なGPUが一定量しかなく、誰もがそれらを求めて戦っている場合、結果としてある程度、誰も満足せず、誰も自分がやろうとしていることに十分なものを得られません。

これが、非常に多くの人々が物事をより効率的にする方法を見つけることに多額の投資をしている理由でもあります。Googleの新しいturboquantのようなものです。より効率的なAIを作るための新しい圧縮の再考で、メモリ使用量を減らします。

これは本当にクールで、明らかに彼らが投資している取り組みです。なぜなら、彼らはモデルによって使用されているコンピュートリソースの量を減らす方法を見つけたいからです。

これが、昨年末にモデルの劣化の問題があった理由でもあります。なぜなら、彼らはGPUの管理方法、モデルの展開方法を変更しようとしていたからです。リクエストごと、トークンごとにより効率的にするためです。そして、彼らが変更したもののいくつかは、期待どおりに機能しませんでした。その結果、パフォーマンスが低下しました。

彼らは多くの実験をしているようです。なぜなら、彼らによれば98%の稼働時間に低下しているからです。そして、より積極的に監視している人々によれば、おそらく95%に近いでしょう。

ほぼ半分の日に何らかの停止があります。そして、そのうちのいくつかはクレイジーです。2月26日には、すべての使用レポートで6時間の停止がありました。27日には、ほとんどのものにログインできない4時間の停止がありました。Anthropicのインフラストラクチャが問題を抱えている頻度は、かなりクレイジーです。

はい、彼らは実際に1ナインの稼働時間と信頼性に低下しています。Claude Codeはまだ2を主張しており、おそらくそれに近いですが、あまり良くありません。まだGitHubよりは良いですが、誰もGitHubの現在の状態を擁護しているとは思いません。

はい、GitHubは90です。だから彼らはもはや09ではありませんが、はい、良くありません。

だから、みんながGPUを奪い合っています。十分なGPUがありません。彼らは能力の限りを尽くして物事を割り当てようとしています。そして、彼らは明らかに実験も行おうとしています。コンピュートリソースがいつ発生するかをシフトするのに何が必要かを理解しようとしています。なぜなら、コンピュートリソードの負荷は一日中均等ではないからです。

ピーク時間とオフピーク時間の違い

午前7時から11時の間に並行して作業することが多い20人の顧客がいる場合、それらの顧客のために20個のGPUが必要になります。しかし、午後4時に彼らの半分がサインオフすると、必要なGPUの2倍になります。

したがって、彼らがピーク時の容量ニーズを処理するためにGPUを購入している場合、ピーク時間外のときに使用されていない多くのGPUに座ることになります。

これは、多くの研究所が全体的なモデルに価格設定しようとしているものです。なぜなら、オフピーク時間は競合がないため、実質的に安くなるからです。

1つのGPUがあり、それを望む3人がいる場合、そのうちの2人はユーザーで、1人は企業ユーザー、1人はサブスクリプションユーザー、そして1人は研究者の1人です。誰がそれを得るかを選ぶのは簡単ではありません。

これについて考える別の方法は、まったく異なります。ここでさまざまなグループがもたらす価値の量について考える必要があります。研究、製品、ユーザーの代わりに、これを研究、サブスクリプション、企業/API使用に変更します。このように物事を分解します。物事は非常に異なります。

彼らの研究者はすぐにお金を稼ぐことはできないかもしれません。研究者がGPUを使用しているときはいつでも、それは顧客に行く可能性があるGPU時間であるため、コストがかかります。しかし、研究者がそれを使用すると、モデルが十分に良くなって出すことができるまで、ゼロ、まったく何も得られません。そうすれば、それでお金を稼ぐことができます。

しかし、研究者は使用時にゼロドルを稼いでいます。将来的に潜在的に数十億ドルを稼ぐことができることを期待して。

サブスクリプションは面白いです。なぜなら、それは基本的に保証されたレートだからです。月額200ドルを支払っている場合、サブを使用するかどうかにかかわらず、まだ200ドルを支払っています。50ドルの推論、0ドルの推論、または5,000ドルの推論を行う場合でも、実際には問題ではありません。

Anthropicは同じ金額を稼ぎます。そして、企業のケースがあります。これは実質的に利用可能な使用量に基づいてスケーリングされます。Anthropicを通じて利用可能なすべてのコンピュートリソースを文字通り喜んで使用する特定の企業がありますが、十分ではありません。そのため、彼らは最終的にできることでボトルネックになり、完全に最大化されたレートを支払っています。

3つのグループの価値を比較する

より簡単に言うと、研究者により多くのGPUを与えれば、より良いモデルをより速く手に入れるかもしれません。サブスクリプションユーザーにより多くのGPUを与えれば、彼らをもう少し保持できるかもしれませんが、彼らは関係なく同じ金額を支払っているため、直接的にお金を稼ぐことはありません。

企業とAPIユーザーにより多くのアクセスを与えれば、彼らはより多くのお金を使い、あなたはより多くのお金を稼ぎます。

したがって、企業は即座の金銭的利益です。サブスクリプションは金銭的利益ですが、解約を防ごうとしているだけです。そして、研究者は長期的な金銭的投資です。

これらすべてにどのように分割するかは簡単ではありません。そして、私はここで起こっていることはある程度、彼らが単にそうしていないということだと思います。彼らはすでに設置されているシステムを残しており、現在それは継ぎ目で壊れています。

以前、彼らが研究からGPUを取り上げ、この線を下に移動させて、製品により多くを持たせることができると言ったことを覚えていますか?彼らはできます。なぜなら、研究者は彼らの従業員だからです。彼らは好きなようにできます。

しかし、それは逆の方向にも進みます。前に述べたように、これは研究として主導され、運営され、考えられているビジネスです。役員会とAnthropicを始めた人々はすべて研究者です。会社のポイントは研究であり、研究が第一です。

したがって、研究者がGPUを取り上げられる可能性がある場合、なぜユーザーはできないのでしょうか?そして、私はそれが社内で起こっていることだと思います。彼らはこれを彼らに起こることとまったく同じように見ています。

Anthropicのすべての従業員は、ある時点でGPU割り当てが意味のあるレベルで削減された瞬間がありました。彼らはある量のコンピュートリソースを持っていて、突然少ないコンピュートリソースを持っています。

それはこれらの従業員のほとんどに起こった本当のことです。したがって、それをユーザーに渡すという考えが出てきたとき、彼らはそれについてあまり深く考えなかったと思います。彼らはこう考えました。まあ、製品は常にGPUを失っています。研究は常にGPUを失っています。ユーザーの番だと思います。

そして、ありがたいことに、私たちはその小さな小さなビットからそれを取るだけです。私たちが解約することを恐れている多くの企業顧客がいるこの特定のウィンドウの間だけです。彼らが期待する使用を得ることができない場合。

したがって、彼らが十分なGPUを持っていることを確認する必要があります。したがって、これらの時間中に、ユーザーに少し影響を与えます。そして、彼らはおそらくそれについてあまり考えなかったでしょう。

コミュニケーションの失敗

そして、ここで彼らが台無しにしたことに入ります。彼らは発表する前にそれをしました。そして、それが本当に怪しくなるところです。

多くのユーザーが、この変更が発表される前の日と当日にClaude Codeサブスクリプションの問題を報告していました。Thoric氏がここで言ったように、これは平日の午前5時から11時(太平洋時間)の間にユーザーに影響を与えます。彼がツイートしたのは太平洋時間の午後12時45分でした。それは良くありません。

認めざるを得ない小さいですが非常に非常に迷惑なことがもう1つあります。誰もがTwitterにいるわけではありません。Twitterにいないという選択ができるなら、私はずっと前にその選択をしていたでしょう。悲しいことに、私と他の多くの人々はそこに閉じ込められています。

この投稿は、ウィンドウが終了してから約2時間遅れただけでなく、Twitterにしかなく、公式のAnthropicアカウントからのものでさえありません。Thoricからのもので、彼はAnthropicの個人従業員です。彼はチームすら運営していません。彼は彼らのためにDevRel的なことをする人です。

これがこの唯一の公開確認です。したがって、Twitterユーザーでなく、彼をフォローしていないが、Claude Codeに支払っており、サブスクリプションに支払っている場合、この情報を得る場所はありません。ダッシュボードにはありません。

CLIにはありません。claude.aiにはありません。これはTwitterにいる場合にのみ取得する情報です。それは彼らが受け取る巨大な光学的Lです。

ありがたいことに、多くの皆さんはここでそれを手に入れています。実際、Claude Codeのヘビーユーザーであるにもかかわらず、このビデオの前にこの変更について知らなかった場合はコメントを残してください。

そして、彼らが会社として発表しなかったために、これらの制限の1つに達して混乱した場合は、間違いなく教えてください。

面白いことに、一方で、彼らがその時間外の制限を2倍にした春休みのことをしたとき、公式サイトにもリンクがあり、公式アカウントからのツイートもありました。

そして、それは最悪です。それは不条理です。そして、それはThoric氏のせいではありません。どちらかといえば、彼はここでの解決策であり、問題ではありません。彼はこの投稿をした人です。

しかし、anthropicがこれに飛びつかず、これを公式に伝えていないことは、比較的恥ずべきことです。サブスクリプションが突然価値が低くなったことを聞くために、TwitterとRedditとYouTubeにいる必要はありません。

製品を使用するときに、製品内でそれを見ることができるはずです。

数字の透明性の欠如

とにかく、もう1つ良くないことは、彼らがその5時間のウィンドウをどれだけ速く通過するかを指定していないことです。彼らはただそうすると言っているだけです。

したがって、このメッセージは合理的であり、透明性への取り組みに対してThoricに深く感謝していますが、ここでの失敗を認識することが重要です。

実際の数字の欠如とここでの非常に時期尚早な発表の組み合わせは、ひどい光学効果でした。これらのことは一緒になって、ほとんどの見物人、特にこれらの制限の1つに達した人々にとって、ひどく見え、ひどく感じました。

どうやら7%のユーザーがこれらを打つことになります。それは発表が公開される前にこれを打つかなりの数のユーザーです。

ここに、マックスプランに6ヶ月以上加入していて、一度も問題がなかったユーザーがいます。しかし、この変更が有効になった日に、Claude Codeが5時間制限の100%を使用しました。通常は10%しかかからないワークフローで。

ここでの打撃がどれだけ大きいかを確実に知ることは難しいです。彼らがこれを発表してから平日ではなかったため、実際に徹底的にテストすることができませんでした。

しかし、このユーザーが言っていることが本当で、そのウィンドウ中に10倍の減少である場合、それは本当に本当に悪いです。それは本当に、本当に悪いです。

OpenAIとの対比

OpenAIで起こっていることと対比しないのは難しいです。Tiboは奇妙なことに同じ日に、彼らが全プランでCodexの使用制限をリセットしたことを共有しました。そうすることで、誰もが彼らがちょうど立ち上げた新しいプラグインシステムで実験できるようにしました。

そして、リセットしてからしばらく経っているので、Tiboはいつもいつもcodexの使用制限をリセットすることで有名です。バグがあればリセットされます。新機能があればリセットされます。新しいモデルがあります。しばしばリセットされます。

そして、彼らは現在、4月1日に終了する予定の2倍の使用ウィンドウにいます。誰も信じないでしょう。それは戦略的だったとは思いませんが、かなり面白い方法で出てきました。

これは非常に一般的になったので、人々はそれについてミームを作り始めました。Codexレート制限リセットのようなものです。今日リセットされたかどうかを教えてくれます。これらのミームは非常に多くあります。聖Tibo、トークンの与え手、制限のリセッター。

ああ、それはミームになりました。彼らはこれで悪名高くなり、彼らはそれを利用しています。ここで本当に面白いことがあります。そして、私はこれらの数字を読み取るのは嫌いですが、それらはあまり意味がありません。

この投稿は9,000いいね、88万8,000ビューです。したがって、100万ビュー未満、9,000いいねです。Thoricのものは700万ビューです。したがって、視聴者数は7倍、目は7倍で、いいねは7,000で少ないです。

それはリアルタイムで起こっている感情のシフトです。そして、これはOpenAIが彼らがやっていることの方法、透明性、そして彼らがやっているユーザーフレンドリーな行動に対して多くのサポートを得ているということです。

一方、Anthropicは記録的なペースでコミュニティとの信頼を燃やしています。この変更自体は、私の意見では、主に理にかなっているにもかかわらず。

これは彼らが抱えている本当の問題です。彼らは貪欲だからこれを変更しているのではありません。お金を最大化したいわけでもありません。これらのサブスクリプションを持っている人々を台無しにしたいわけでもありません。

彼らは明らかに岩と固い場所の状況にあり、意味をなして補助金を出しすぎました。200ドルのサブスクリプションに対して5,000ドルのコンピュートリソースを得ることは、ただ狂気です。そして、彼らがもうそれをできなくなるまで、彼らがそれをやりたいなら、それは問題ありません。

そして、彼らは管理するのに苦労しているようです。この午前5時から11時のウィンドウは、特に企業顧客が十分なGPUがないためにアクセスできなかった問題ではありませんでした。

彼らは制限全体を変更することもできました。しかし、私は彼らがこの方向に進んだことが好きです。

春休みキャンペーンは実験だった

彼らの以前の春休みのことは、ウィンドウで実験し、午前5時から11時のウィンドウの代わりに、その外により多くの使用があったときの使用がどのようなものかを見るための試みだったことも明らかです。

したがって、彼らはこの戦略を試しました。彼らはデータを得ました。多くを学んだと確信しています。そして、結論は、人々をこのウィンドウから引き出すのに十分ではなかったということでした。

したがって、彼らはこのウィンドウでの使用量を強制的に減らす必要があります。そして、明確にするために、彼らはこのようなことをしている唯一の研究所ではありません。

彼らはそれをはるかに透明性が低く、非常に恥ずかしい積極的な方法でやっているかもしれません。しかし、OpenAIのような他の研究所があり、これを逆方向にやっています。

通常の時間中の5.4のデフォルト価格は、100万トークンあたり2.50ドル、100万トークンアウトあたり15ドルです。しかし、バッチ価格設定に行くと、大幅に削減されます。バッチ処理を行うと、100万あたり125ドル、100万アウトあたり750ドルに文字通り半分にカットされます。

バッチ価格設定とは何ですか?時間に敏感でない多数のAPIリクエスト用です。これは、コンピュートリソースを予約してできるだけ早く実行させる代わりに、キューに入れて、完了したときに通知するのを待っているということです。

それは彼らが需要の増加を処理している方法の一部ですが、それはまた、非常にコストに敏感な人々が1ドルあたりに得る価値を最大化する方法でもあります。

とはいえ、CodexやT3コードのような製品でバッチ処理を使用することは決してありません。バックグラウンドで分析したい大量のデータがあり、いつ完了するかを気にしない場合に使用します。

そして、flexは主に同じですが、レイテンシが高いだけです。バッチは、多くのものをグループ化して、後で完了したときにpingされたい場合により多くです。flexは似ていますが、反対のものがあり、それが優先です。トークン間で制限されないように、リクエスト全体に十分なGPUが割り当てられていることを確認します。

その結果、2倍高価です。100万あたり5ドル、100万アウトあたり30ドルです。今、私たちはsonnetの価格に近づいていますが、sonnet fastはさらに驚くほど高価です。

いずれにせよ、あなたはここでアイデアを得ます。願わくば、ここでの違いの多くは可用性にあります。そして、多くのお金を払っている企業顧客によって使用されているピークアワー中のGPUは、誰も使用していない週末の午前1時のGPUよりもはるかに価値があります。私たちのような退化したもの以外は。

私はここで私たちが似ていることを知っています。私たちはオフアワーでのコーディングとさらにオフアワーでのYouTubeビデオの視聴が大好きです。真夜中過ぎにこれを見ている場合はコメントを残してください。

アイデアは得られます。

Thoric氏の言葉を信じる

最後に注目する価値があることは、Thoricからのこの最後のメッセージです。私は彼の言葉をここで受け取っています。この声明で真実でない理由が彼にあるとは想像できません。

全体として、週間制限は同じままです。変わっているのは、それらが週にわたってどのように分散されているかだけです。

繰り返しますが、それはおそらく彼らが2倍のことをした理由です。彼らはユーザーに2倍のコンピュートリソースとオフアワーを与えることができれば、それが彼らを破壊するかどうかを見たかったのです。そして、長期的にはそれが彼らの計画のようなものだと推測しています。

彼らはオフアワー中にはるかに高い制限を与え、これらのピークアワー中にわずかに意味のある低い制限を与えるつもりです。

とはいえ、人々は最初に発表されたときにそれを何となく感じました。割引価格をやっていると。Pranetは、Anthropicが最も古いSaaS価格設定のトリックを引っ張ったと言いました。

Claude maxの200ドルの制限は過去1週間で著しく悪化しましたが、突然彼らは2週間のオフピーク使用の2倍を発表しました。

寛大に聞こえますが、彼は彼らが静かに制限を下げ、削減された制限を正常に感じさせるために一時的な2倍を追加したと疑っています。次に、プロモーションが終了し、以前よりも低いベースラインを更新しました。

Claude Codeサブスクリプションからどれだけの価値を得ることができるかについて多くの分析を行う人々がたくさんいます。私はかなり確信しています。Cursorは、それを文書化できるように、常にバックグラウンドで実行されている何かを持っているだけです。

しかし、はい、人々がここでそれほど陰謀論的である理由がわかります。特に以前にThorが返信したからです。「いいえ、それはただのボーナス2倍です。それほど深くはありません。」

私は彼がこの時点でこれを信じていて、チームが週にわたってコンピュート使用量を広げる異なる方法を調べるという目標を与えられたとかなり確信しています。そして、予想よりも速く、繰り返しますが、彼らは予想よりも速く成長しているため。

これは迅速に変更する必要がありました。彼らはおそらくこれを理解するために1、2ヶ月あると思っていたのでしょう。それは結局1週間になりましたが、その後彼らは変更をしなければなりませんでした。彼らは静かに変更をしました。すべてが爆発し、現在、私が合理的だと思う理由で、人々は非常に動揺しています。

まとめ:コンピュート問題は現実だが、コミュニケーションが失敗

要約すると、コンピュート問題は現実です。Anthropicはそのためだけにこれをやっているわけではありません。彼らはユーザーを嫌っているからこれをやっているわけではありません。彼らはコンピュートリソースがなくなっているからこれをやっているのです。そして、彼らは特定の時間中に研究と他の製品と企業顧客をライン上に保つために、ユーザーがいくつかを節約できると考えました。

正直なところ、彼らがこれにアプローチした方法、このウィンドウに問題があるというアイデアが好きです。したがって、全体的に得られる量を減らす代わりに、このウィンドウ中にそれを制限するつもりです。

私もここでバイアスがかかっています。なぜなら、私のコーディング時間のほとんどはそのウィンドウの外側にあるからです。したがって、これは私が直接行う作業に実際には影響しませんが、それは多くのユーザーにとって大変ではないという意味ではありません。

どうやら、すべてのユーザーの7%が以前は到達しなかった制限に達するでしょう。これは、彼らが持っているユーザー数を覚えているとき、まだ狂気です。

したがって、私は彼らがこの変更をしたかった方法とこれを展開したかった方法のアイデアが好きです。しかし、いつものように、Anthropicにはいくつかのanthropic特有の問題があります。

1つ目は、十分なコンピュートリソースを購入しなかったことです。そして今、私たちユーザーとしてそのコストを支払っています。彼らはまた、歴史的に他のいくつかの研究所ほど効率的にモデルを作成していません。使用されているトークンの量とそれが取るコンピュートリソースの量だけです。

異なるモデルで使用される電力のワット数の違いが何であるかを知ることはできませんが、Opusは最近のOpenAIリリースのどれよりも大きなモデルであることが一般的に合意されています。

5.4も明らかに5.2よりも大きいですが、それゆえOpenAI側の価格のゆっくりとした上昇です。それはまだ、私たちが知る限り、Opusモデルほど大きくはありません。そして、確かに彼らが近い将来にドロップすると言われているこのMythosモデルほど大きくはありません。

そして、断然最大の問題は、anthropicが人間を理解していないことです。彼らはユーザーとどのようにコミュニケーションするかを知りません。なぜなら、それについてのリーダーシップや文化がないからです。

これらのタイプのことについてのコミュニケーションがほとんどないため、最善を尽くしている、おそらく1年もいない、Twitterのバッジすら持っていない、ランダムなDevRelのThoricが、今やすべてのこのコミュニケーションを担当する人物になっています。

Thoric氏を責めるな

主に他の誰も踏み出さなかったからです。OpenAIには、何かが変わるたびに、良い、悪い、その他を問わず、出てきて参加する約20人の異なる人々がいます。Anthropicで何かが起こっているときはいつでも、それは哀れなThoricの問題です。

そして、私は彼がこれに対処する役割に雇われた唯一の人物であり、それに対処するために最善を尽くして塹壕にまだいることに対して、彼に非常に共感しています。

特に、弁護士が彼が言いたいことの半分を取り締まっていることを知っているからです。Joelが言ったように、このタイプのことはThorの給料のはるか上にあります。そして、私はそれ以上同意できませんでした。

彼の仕事は、Anthropicでのコミュニケーション、製品、問題のすべてをリードすることではありません。彼はこの決定について何の発言権もありません。このレート制限について彼を嫌がらせすることがAnthropicがこれらのことをする可能性を何らかの形で変えると思うなら、あなたはこれ以上間違っていることはできません。

ある程度、社内で私たちを擁護することがThorの仕事です。彼を追いかけることは、私たちのために上げられた手を噛むことです。彼には従業員がいません。彼はチームを運営していません。彼はエグゼクティブではありません。彼はマネージャーですらありません。彼はTwitterで彼らを擁護し、物事をより明確にしようとして立ち往生しているDevRilの人です。

そして、私は彼の投稿の1つが出るたびに、社内の弁護士が彼にさせなかったために出なかったものが少なくとも5つあることを確信しています。

だから、この男にクソを与えないでください。彼は問題ではありません。どちらかといえば、彼は私たちが持っている解決策に最も近いものです。しかし、問題ははるかに大きく、彼よりもはるかに良い給料をもらっています。それは文化的なレベルで存在します。研究、製品、ユーザーの間のこの分裂の奥深くに存在します。

そして、ユーザー擁護者、研究者のために十分なGPUを持っていないために私たちに代わってAnthropicに伝える人を追いかけることは、社内のヒエラルキーの根本的な誤解です。

そして、人々が怒っていることを理解しています。そうあるべきです。物事はコミュニケーションが不十分で、露骨にコミュニケーションされ、十分な透明性がない方法で変更されました。それはすべて真実です。それは彼のせいではありません。

そして、他の研究所が本当に優れたコミュニケーションの人を望んでいて、少し解放して、物事について現実的にさせたい場合は、彼をそこから引き抜きたいかもしれません。

彼がどれだけ喜んで去るかはわかりませんが、彼がそうしているのと同じくらい一生懸命努力している誰かを見るのは残念です。会社で彼が物事をする能力に対してそれほど積極的に戦っています。

はい、状況をコントロールしていない個人を追いかけないでください。Anthropicを擁護するのにこれだけの時間を費やしたとは信じられません。そして、いつもと同じ結論に達しました。彼らは人々を理解していません。彼らは開発者を理解していません。彼らはどのようにコミュニケーションするかを知らず、十分に透明ではありません。

これは常にこの会社の場合でした。それらが私がここで認識している問題です。変更自体ではありません。なぜなら、彼らはコンピュートリソースが少ないからです。

彼らがそこに自分自身を置いたのは残念ですが、彼らはそこにいます。彼らがこれをした理由を理解しています。私は実際に彼らがこの変更でユーザー寄りであろうとしていると思います。しかし、いつものように、Anthropicのオフィスの外の世界を理解できないことは、彼らを積極的に燃やしています。

そして、もしかしたら、もしかしたら、彼らはAnthropicの給料をもらっていない人々の話を聞き始めるでしょう。そして、もしかしたら、その結果、彼らはこのタイプの恥ずかしいことをやめるでしょう。

指を交差させて、それがそうであることを願っています。しかし、私には自信がありません。この会社は人々が彼らについてどう感じているかを気にしないようです。彼らはただ自信を持って間違ったことをして、逃げます。だから、物事がどこに行くか見てみましょう。

次回まで、私はCodexに固執しています。

コメント

タイトルとURLをコピーしました