Claude Codeがめちゃくちゃ高くなった件(やっぱりな)

Anthropic・Claude・ダリオアモデイ
この記事は約19分で読めます。

この動画は、AnthropicのClaude Codeが2週間前にCursorの価格変更で注目を集めたものの、予想通り月額200ドルプランでも週次制限が導入されることになった経緯を解説している。一部のパワーユーザーが24時間体制でツールを酷使し、月額200ドルプランで数万ドル相当の推論コストを消費していた実態を明かし、AI業界におけるコスト構造の現実と「無制限」サービスが持続不可能である理由を詳しく分析している。

Claude Code just got WAY more expensive (called it)
Claude Code usage is no longer unlimited, unfortunately the free lunch can't last forever...Thank you CodeRabbit for spo...

Claude Codeの価格変更と業界の現実

2週間前にみんなCursorが価格体系変更したときめっちゃ怒ってたの覚えてるやろ?みんなClaude Codeに移れって言うてたよな、めっちゃ安くてお得やからって。覚えてるで。それでワイはみんなに警告したったんや、そんなん長続きせえへんって。GPU使いまくる業界で推論回すのにめっちゃ金かかるのに、タダ飯なんてあるわけないんや。

とは言うたものの、みんなは月200ドルのプランでCloud Codeは十分やと思ってたみたいやな。今日はみんなに嬉しいお知らせがあるで。みんな間違ってたんや。タダ飯の時代は終わりや。Anthropicが来月末からCloud ProとMaxユーザーに週次制限を導入することになったんや。これはずっと前から予想してた、めっちゃ遅れた軌道修正やで。

ワイがCloud Codeでやってる人らを見てたら、もうとんでもないことしよるからな。あのスーパーパワーユーザーたちは数万ドルもかかってたんや。大げさやないで。彼ら自身が言うてるからな。Cloud Codeの大ファンの中には24時間365日バックグラウンドで走らせっぱなしの人もおる。そういう使い方は素晴らしいし、ワイらもそれを可能にしたいんやけど、一部の極端なケースがめっちゃコストかかるんや。

例えば、ある1人のユーザーが200ドルプランで数万ドル分のモデル使用量を消費したんや。どないしてそんなことが可能なんや?AIツールとその悪用方法、価格設定の仕方、この業界全体の経済がどう変化していくか、お金を効率的に使う方法について学ぶことがようけあるで。

スポンサー紹介とCode Rabbit

とは言うても、誰かがワイの推論料金を払わなあかんからな。今日のスポンサーから一言もろて、本題に入るで。

AIがコード書くのが得意やってのはもうよう知られてるな。ウチのチームは今まで以上に早く出荷してるんやけど、その分PRも今まで以上に多いんや。ありがたいことに、ちゃんとやれば、AIはコードレビューも得意やということが分かったんや。

それで今日のスポンサーであるCode Rabbitを気に入ったんや。最初に彼らがスポンサーの話を持ちかけてきたとき、ワイは懐疑的やった。それでプロジェクトにセットアップしてみたんや。チームは微妙な反応で、ちょっと有益な情報が得られるかもしれへん程度で、使ってみて大丈夫やったら何人かに推薦して終わりやと思ってた。そんな風にはならんかったんや。

Code Rabbitはすぐにウチのスタックで最も有用な部分の一つになった。この製品にほんまに惚れ込んでしもたんや。他にもようけ試したけど、Code Rabbitが一番ええレビューをしてくれる。何より大事なのは、めっちゃ気に入ったから投資させてくれって頼み込んだくらいや。長く続く会社やって分かってるからな。

最初に使い始めた頃からめっちゃ改善されてるで。今はVS Code拡張もあって、ファイル保存してコミットするときにすぐレビューしてくれるんや。めっちゃ便利や。でも正直、一番気に入ってるのは、チームに迷惑かける前にPR出すときに使えることや。ワイがコード出荷するとき、PRを作成して準備完了にマークするけど、実際に準備できるまではチームに送らへん。Code Rabbitが5分以内にレビューして有用なコメントをようけ残してくれるからや。

ここではワイがバリューで馬鹿なことしてるのを指摘してくれてる。当然、妥当なコメントや。でもここでは実際の潜在的バグを見つけてくれてる。T3チャット用のマイグレーション条件の書き方で無限ループになる可能性があることに気づいて、そのまま見逃すんやなくて、リファクタリング提案をしてくれたんや。無限ループを防ぐ安全チェックを追加する方法のガイドと、ワンクリックでコミット可能な提案まで出してくれて、ここでクリックしてコミットできるんや。

でもそれが一番好きなとこやないんや。一番気に入ってるのは、もうチームにコードレビューで負担をかけてる気がせえへんことや。PR出したときの最初のレビューパスで「この3つのタイポと、この間違いと、このバグを直せ」って言われて、直してから本当のレビューで理解しようとしてもらうってことが何回あったか分からへん。

レビュー中にせなあかん作業で、すべての行をチェックして行が正しいか確認するっていう作業、それがAIの得意分野や。面倒くさい作業や。構文のコードレビューなんてせんでええし、変な無限ループのコードレビューもせんでええ。コードが何をするかを理解して、コードが期待通りに動くかを知るためにコードレビューせなあかん。

他の人のコードを読むときも、もうこういう小さい構文的なことを探さんでよくなったから、コードレビュープロセスがめっちゃ良くなったで。まだCode Rabbitをこんなに気に入ってることが信じられへん。みんなもきっと気に入ると思うで。今すぐ soyv.link/codrabbit で確認してみてや。

Claude Codeを巡る経緯の整理

追いかけてへん人のために、何が起こったかの簡単なまとめや。

ステップ1、AnthropicがClaude 3.5 Sonnetをリリース。これはツール呼び出し機能で革命的やったし、コードに関しても従来のモデルよりちょっと良くなってた。その組み合わせで、みんながええエージェント的なコードツールを作るのがめっちゃ簡単になったんや。それでCursor、Windsurf、その他がClaude 3.5 Sonnet使って素晴らしいエージェント的なコードツールを作った。

これがどんどん成長・拡大して、社内的な理由でAnthropicはAnthropicモデルでコードをやるための独自CLIツールを作ることにしたんや。それでClaude CodeはAnthropic社内で使うために作られた。ここで3.5ポイント入れとくけど、彼らは秘密兵器やと思って公開するのをためらってたけど、結局リリースしたんや。今思えばちょっと面白い話やな。

それからポイント4でゆっくり成長。5でClaude Codeの作者BorisとCatwooがCursorに転職。彼らがついに辞めてCursorで働き始めた頃と同じ時期に、Claude Codeの人気が爆発したんや。Claude Codeの成長カーブはめっちゃ変やった。ゆっくりと人気になっていって、最後に爆発したんや。

彼らが辞めた頃に人気が爆発し始めて、もっと重要なのは悪用も始まったんや。6.5に上げるで、重要なポイント6があるからな。AnthropicがClaude Code使用量に新しいサブティアを追加したんや。月200ドルのMaxティアや。それまではClaude CodeはAPIビリングを使ってた。

つまり推論が実行されたら、生のトークンコストを払うだけやった。このコストがどう機能するか知らん人のために説明すると、公式APIからのAIの大部分は入力と出力トークンで価格設定される。トークンはAIが行った推論のかたまりや。大体3~6文字や。あなたが与えるテキストの分割方法であり、あなたに送るテキストの生成方法でもある。

次トークン予測モデルやからな。たくさんのトークンがあると、次に最も可能性の高いものを推測して、それがAIの応答生成方法や。そういうわけで、出力トークンは入力より大分高くなりがちやけど、どっちも他の選択肢よりずっと高い。

モデル価格ページの更新をちゃんとできてへんねん。価格が変わったり、GPT-4.5がもう死んでもうたりで、細かい変更がようけ必要なんや。でもClaudeモデルが他の多くのものに比べてどれだけ高いかを強調したいんや。o3 miniとo4 miniは入力110ドル、出力4.40ドルに対して、Claude 4は入力3ドル、出力15ドルや。

こういうチャート大好きや。知能対価格。モデルがトークン生成にかかるコストと、Artificial Analysisがベンチマーク全体で出した知能スコアとのギャップを示してる。ここでClaude 4 OpusやO3 Proみたいなモデルが、Gemini 2.5やGrok 4みたいなモデルよりずっと高いのが分かるやろ。ただ、これはトークンあたりのコストだけや。

実際に動かすコストやない。ここをスクロールダウンしてみ、ベンチマーク実行時の実際のコストがどれだけ違うかが分かるで。GPT-4oはベンチマーク全体を65ドルで実行できる。ここで面白い事実。Gemini 2.0 Flashは全体を3ドルで実行できる。2.5 Flashは100倍以上コストがかかる。出力トークンが高くて、推論でより多くのトークンを生成するからや。

それが知っておくべき最大のポイントや。モデルによって作業に対して生成するトークン数が違うんや。T3チャットで、どのモデルがどれだけ効率的・非効率的かを調べてたんや。トークンコストに基づいてGrokの請求書が予想より高いことに気づいた。案の定、Grok 4は応答あたりとんでもない量のトークンを生成しよる。

これはT3チャットで送信されたメッセージあたりの平均出力トークン数や。Grok 4は平均2000トークン以上生成する。ユーザーには2文しか見えへんかっても、ユーザーが見ることのない推論生成がすべてお金がかかるんや。その生成は超非効率で、めっちゃ高くなりがちや。

Grok 4は本当にトークンを食いよる。それでとんでもなく高くつくんや。Artificial Analysisの知能ベンチで最も高いモデルの一つになってる理由や。O3 Proの半分のコストがかかる。トークン生成がめっちゃ非効率やからや。それをO3みたいなもんと比較すると、多くの面でより良いモデルで価格は3分の1以下、かなりお得やで。また、入力出力コストだけやなくて、請求される出力量やからな。

ここの知能対実行コストを見ると、全然違うチャートになって、左上の象限には何もなくなる。そんなに賢くて実行するのが比較的安いものはないからや。これらのモデルが応答に対して実際に生成してるトークン数に気づくと、すべてずっと高くなるからや。

そういうわけで、Anthropicが自分で何百ドルも生成せんでええようにサブスクリプションティアを導入してくれたんはめっちゃ親切やった。Claude Codeで一つのコマンド実行しただけで12~15ドルかかったことがあって、その変更は良くなくて捨てなあかんかった。

Claude Codeは彼らが作ったクローズドソースやから、Anthropicモデルしか使えんし、コードベースを辿って問題の解決方法を見つけるみたいなことに他の安いモデルを活用できへん。Claude 3 Haikuっちゅう安いモデルは使うけど、そんなに良いモデルやないから、その部分はあんまり得意やない。

それでも200ドルティアを追加したから、多くの人がClaude Codeを使い始めた。理にかなった考え方や。月200ドル、クール。完全に無制限やと思うやろ。それで気づいたんは、ワンペイメントで無制限アクセスみたいなもんを探してるパワーユーザーがようけおるってことや。

十分高い金額を払えば、もう使用量を心配せんでええと期待してるんや。今、月200ドルでは足らんということが分かって、多くの人が「ほな2000ドルにしてくれ」って反応してる。悪いニュースや。月2000ドルティアが自分のやってることに妥当なコストやと思うなら、あんたは2000ドル以上かかってるで。

全然意味が分からん。Sam Altmanが昔、OpenAIの250ドルティアが実際は赤字やって投稿してたの覚えてるで。そのティアに加入するユーザーはずっと多くの生成をする傾向があるからや。分かるやろ。

7番目、BorisとCatが戻った。好きなように推測してええけど、正直ワイが思うのは、彼らが辞めたときはClaude Codeがそんなに急成長してへんかったのに、その後めっちゃ急成長してるのを見たからや。どうやって破壊される可能性があるかの予兆を見て、それを救って面倒見たかったんや。自分らが作ったもんやからな。自分の子供みたいなもんで、それをするために戻ったんや。外から見たらめっちゃドラマチックに見えるかもしれへんけど、なんでそうなるかは十分理解できる。

同じ時期に、みんながClaude Codeのとんでもない悪用を見せびらかし始めた。お気に入りの例をいくつか取ってきて見せたるで。

パワーユーザーによる極端な使用例

McKay Wrigleyっちゅう人がおって、Claude Pooterって呼んでるMac Miniを動かしてる。24時間365日動いて、好きなことをしよる。コンピュータを完全にコントロールしてるんや。ここで見てもらえるように、これがClaude Pooterや。つまりClaude Codeのインスタンスが独自のMac Miniで動いてるってわけや。

このMac MiniはClaudeが完全にコントロールしてて、基本的にClaude 4 Opusを無限ループで動かしてるんや。Claudeは好きなことができる。既にやったことを見せたるで。作曲を試してみたりしてるな。ここで音楽を書いてるのが見える。将来の自分へのタイムカプセルとして機能するタイムカプセルを作るPythonプログラムを作った。

claw.mdファイルを編集する完全な権限を持ってる。システムについてメモを取ってるのが見えるやろ。やったことが色々見えるな。夢日記まで書いてるで。まだこれをいじってる最中やけど、要点はこのMac Miniが24時間365日オンで、Claude Codeが好きなことができるってことや。これはClaudeのコンピュータや。自分の家みたいなもんや。何かテストしてほしいアイデアがある人は教えてくれや。

分かるやろ、彼はコンピュータを動かして無限にトークンを生成してる。実用的やないかもしれへんけど、絶対面白いで。

それからZach Jacksonみたいな人もおる。ワイの好きな開発者の一人や。現代のWebdev世界でmicrofrontendsを実現可能にしてる人や。彼はClaude Codeをめっちゃ使ってる。どうやら月200ドルティアで1日4000~5000トークンの推論を使ってたらしい。これが先週やったことのリストや。

TSLintを全部、すべてのルールを含めてGoに移植した。ブラウザ用にLinuxカーネルをWebAssemblyにコンパイルした。GitHubのissueをいっぱい修正した。RustベースのWebpack代替のRSpackで実験した。10万行のコードのPRを小さな部分に分けてすべてテストした。

ドキュメントとアーキテクチャ仕様をいっぱい書いた。10メガバイトのminified JSファイルを逆コンパイルした。正気やないで。これが全部、コンピュータのクラスターでClaude Codeを叩いて動いてるんや。彼が1日にやってる推論量は、使ってるコンピュータ全部を合わせたより高くつくと思うで。正気やない。彼みたいなことをやってる人は彼だけやない。

これが1、2人だけやと思うかもしれへんけど、そうやない。Anthropicによると5%未満やけど、1%未満とは言わんかった。つまりこういう悪用をしてる人がようけおるってことや。考えてみてや。小さく聞こえるかもしれへんけど、Claude Codeを使ってる人が100人おって、そのうち5人が悪用してたら、それはようけの人やけど、Claude Codeを使ってる人は100人やない。

何十万人もおって、つまり何千人もの人がClaude Codeを悪用してたってことや。こういう人たちは今後、ずっと多く払うか、他のタダ乗りできるツールを見つけるかせなあかん。

ZIRP時代の終焉

これをZIRP(ゼロ金利現象)の新時代やと言えるかもしれん。みんなの好きな流行語や。この用語は、コロナの時に金利がめっちゃ低くなった時に生まれた。結果として、たくさんお金を持ってるところが、お金をただ持ってても年5%もらえへんから、よりリスキーなことにお金を投げるようになったんや。それでスタートアップがようけ資金調達して、ユーザーほとんどおらんくて売上ゼロのスタートアップが40~50人も従業員抱えてたんや。

Browser Companyみたいなところが有料ユーザー全然おらんのに130人以上従業員抱えられる理由や。これは多くの面でZIRP時代っぽい。理由は、こういう会社がユーザーを獲得するためにようけお金を使う意思があるからや。AnthropicがClaude Codeをより魅力的にして、ようけの人を引きつけるための意図的な動きやったとも言えるかもしれん。

その過程でBorisとCatも引き戻された。Claude Codeをずっと普及させるために、そのコストを食うことを選んだんや。うまくいった。彼らが実質的にマーケティングで何百万ドルも使ったと見れば、勝ったんや。でも今は自分らがやったことの代償を払わなあかん。請求書を見て、どれだけヤバいことになってるか気づいたんや。提供してた推論量があまりにも太っ腹すぎたからな。

この数字は前に説明したで。以前の制限は5時間で200リクエスト、1日で960、入力トークン10万、出力トークン8000やった。一つのリクエストでたくさんのやり取りができて、それがずっと高くなる可能性があったとしてもや。ワイの概算では1日400ドルくらいかかると予想してた。

みんなは「そんなにかかるわけない。ここで嘘ついてる」って言うてた。どうや?みんなが正しかった。ワイが間違ってた。実際は何千ドルもの推論ができることが分かった。リクエストを、このトークン制限に当たる一往復だけとカウントしてへんからや。

一つのリクエストで実際はたくさんのやり取りができて、入力と出力両方で何十万トークンも生成できるんや。それで実際に1日何千ドルもの推論をしてる人がおったんや。

開示と業界の現実

簡単に開示しとくけど、ワイはこういうAIビルダーツールを作ってる会社の多くに投資・アドバイザーをしてる。だからバイアスがある。それを考慮してくれ。Cursorもその一つや。でも同時に、Anthropicでとんでもない請求書のAI会社も経営してる。だからほぼ誰よりもこれを深く知ってるんや。ワイのバイアスを考慮してくれ、でもワイが何を話してるか分かってるってことも考慮してくれ。

とにかく、Anthropicでのウチらのとんでもない請求書に貢献したいなら、ええ方法があるで。T3を見てみてや。使うのがクソやないAIチャットアプリは唯一これだけや。欲しいモデル全部にアクセスできて月8ドルや。でもワイらを本当に血まみれにしたくて、まだサインアップしてへんなら、初回サインアップ用の割引コード「not unlimited」を作ったで。初月1ドルや。

1600メッセージが1ドル。画像生成もできる。かなりお得やろ。今すぐt3でチェックしてや。動画に戻るで。

Anthropicの公式発表

実際の発表も見てみよう。さっと読んでみるで。「8月末にCloud ProとMaxに新しい週次レート制限を導入します。現在の使用量に基づいて、加入者の5%未満に適用されると推定しています。」

「Claude Codeは前例のない需要を見ており、特にMaxプランの一部として。この成長を支援し続け、Claude Codeをさらに良くする作業をしてる最中です。でも今のところ、いくつか変更が必要です。」

「Claude Codeの最大のファンの中には、24時間365日バックグラウンドで継続的に実行してる人もいます。こういう使い方は素晴らしく、ワイらもそれを可能にしたいのですが、一部の極端なケースはサポートするのに非常にコストがかかります。」

「例えば、あるユーザーは200ドルプランで数万ドルのモデル使用量を消費しました。他のケースでは、少数のユーザーがアカウント共有・転売によって使用ポリシーに違反しています。これは全Cloudユーザーの容量に影響し、ワイらはそれを止めるための適切な措置を取っています。」

「8月28日から、できるだけ少ない顧客に影響を与えながら、これらの問題を軽減する新しい週次制限を導入します。選択すればMaxプランユーザーが標準API料金で追加使用量を購入できるサポートもします。Claude Codeへのできるだけ広いアクセスを確保する最良の方法をまだ模索中です。Claude Codeの使用についてフィードバックがあるパワーユーザーは、ぜひ聞かせてください。」

すぐに返事が来て「標準API価格は高すぎる」や。結局、みんなこれらを動かす実際のコストを払いたくないんや。

コスト構造の現実

これらのコストがある程度マークアップされてへんって言うつもりはない。そうやなかったら割引できへんからな。でもワイがめっちゃ厳密に説明しようとしてるのは、実際のコストが比較的高いってことや。

これらのモデルを動かすには、非常に複雑な問題を解決してその過程でたくさんのエネルギーを使うために、ようけの非常に高価なGPUが必要なんや。安く提供してくれるなら、それは他の誰かにもっと高い金額で提供できへん推論や。彼らはこれらのGPUを持ってて、常に叩かれてる。

得てる膨大なトラフィック量を管理するのに定期的に問題を抱えてる。タダまたは彼らがようけ超えた200ドルでこれを配りたくないんや、ワイみたいにT3チャットで使ってる他のビジネス、会社、人にその推論を再販できるときにな。1000ドル分を200ドルであんたに渡すのに、1000ドル分を1000ドルでワイに渡せるのに、なんでそんなことするん?意味が分からん。

そういうわけで、API価格になったときに見る実際の請求書はよくない。Cursorで起こった怒りの理由はこれや。CursorがEvil(邪悪)やったり非効率やからやない。独自モデルを作ってへんからでもない。Cursorが倒れへんビジネスを作ろうとしてるからや。時間が経つにつれて、月20ドルティアがツールで人がやってることに適切に合わへんくなった。

それに応じて変更せなあかんかった。Anthropicがこういう間違いをするのは言い訳できひん。全部見てきて、「えー、200ドルで大丈夫やと思う。大体のことはカバーできるやろ」って決めたからや。間違ってた。今はその誤算に対して受けるべきPRの打撃を食らってる。

みんなはこれらがどれだけのコードを生成するか理解してへんと思う。これはSentryのArmenや。Sentryクローンを作らせようとして、とんでもない数のトークンを生成した。8700秒、2時間半以上かかって、気持ち悪いほどの量のコードを生成した。文字通り2万5千行のコード。見事に失敗した。

これはとんでもない金額になったはずや。考えたくもない。でも彼は何も払わんで良かった。月200ドル払って、こんなことができて、その後も続けられるんや。ちょっととんでもないで。

代替選択肢の模索

ありがたいことに、他の選択肢を発見してる人がおる。個人的にはOpen Codeが、Claudeの同じモデルを使ってもかなり安いことが分かった。でも今は本当に良い他のモデルもある。Qwen 3 Coderは76万トークンのコンテキストでOpusより速くアプリを修正できて、かなり安い。Kleinが50万トークンのコンテキストを使って突き進んで結果を生成してるところや。全然問題ない。

あんまり時間を無駄にしたくないから、要点をまとめるで。

まとめ:業界の現実と教訓

良すぎて本当やと思えへんことは、補助金が出てるんや。Cursorで400ドルかかることがClaudeで200ドルやったら、どっちかの数字が嘘ついてて、安すぎる方がおそらく嘘や。

API価格より安かったら、それはマーケティングや。AnthropicがClaude Codeをこんなに安くした唯一の理由は、勝たせたかったからや。市場で遠くまで行かせたかったんや。こういう極端なユーザーに自分らのやってることを気に入ってもらって使ってもらうことには大きな価値がある。たとえ彼らに使わせるのにとんでもない金がかかってもや。

彼らはTwitterで投稿するやろ。コンテンツを作るやろ。自分らがやってることの価値を広めるやろ。だからようけのものを得られるけど、ようけのコストもかかる。でも今見たように限界もある。もちろん、最も重要なポイントは、この世界に無制限なんてものはないってことや。

何かが無制限であるためには、プロバイダー側でそんなにお金がかからへんことが必要や。AIはとんでもなくお金がかかる。利用可能な電力とGPUの量によって制限される分野に、無制限なんてものはない。誰も実際にはどんな金額でもそれらへの無制限アクセスを与えへん。最終的に、使った金額を吹き飛ばしてもうて、もうお得やなくなるからや。

これについてはいろいろ言いたいことがある。みんなはどう思うか教えてくれ。Claude Codeから移るんか、それとも新しい価格を受け入れるんか。教えてくれ。それまで、またな、オタクども。

コメント

タイトルとURLをコピーしました