AIには補助金問題がある

AI競争
この記事は約37分で読めます。

AI業界における無料・補助金付き推論の時代が急速に終焉を迎えている。Googleは無料ユーザーをGemini Proモデルから締め出し、GitHub Copilot学生プランは主要モデルへのアクセスを制限し始めた。広告収益では推論コストを賄えず、データ収集の価値も限定的である。各社が無料推論を提供してきた真の理由は顧客獲得競争であり、OpenAIやAnthropicとの市場シェア争いが背景にある。しかしGoogleは戦略的というより混乱の結果この状況に陥った。AnthropicはClaude Codeで月200ドルに対し最大5000ドル相当の推論を提供するなど25倍の補助を続けているが、これは生涯顧客を確保するための投資である。一方で選択肢を与えるツールには敵対的姿勢を取る。無料推論時代の終わりは必然であり、ユーザーは今のうちに高価値サブスクリプションを活用すべきである。

AI has a subsidization problem
AI subscriptions from the top labs are very heavily subsidized at this point. ,000 for 0 isn't going to last foreve...

無料推論時代の終焉

Gemini CLIに変更を加えることを透明にお伝えしたいと思います。これにはポリシー違反ユースケースのより強固な検出、特定タイプのアカウントへのトラフィック優先順位付け、そして無料ティアユーザーに対するGemini Proモデルの制限が含まれます。

GitHub Copilot学生向けの重要なアップデートです。無料のCopilotアクセスは新しいGitHub Copilot学生プランの下で管理されることになります。しかしこの移行の一環として、GPT 5.4やClaude OpusとSonnetを含むいくつかのプレミアムモデルは、GitHub Copilot学生プランでの自己選択ができなくなります。

OpenCode 1.3.0はClaude Maxプラグインをロードしなくなります。Anthropicに開発者の選択をサポートするよう説得するために最善を尽くしましたが、彼らは弁護士を送ってきました。

Googleチームの皆さん、こんにちは。私はGoogle AI Proのサブスクライバーですが、アカウントに適用される割当に関するバグまたは文書化されていない変更があると考えています。私たちは5時間ごとにリフレッシュされる高い寛大な割当を受け取り、無料ユーザーよりも高い週次レート制限があるはずです。しかし現在の私のAnti-Gravity UIは、はるかに長いクールダウンを示しています。

補助金時代が予想よりも早く終わりを迎えつつあるようですね。正直言って、かなり驚いています。Googleが本当にここで最初に撤退し始め、何らかの理由でGeminiに夢中になっているユーザーへの無料および補助金付きアクセスを削減し始めるとは思っていませんでした。

ここで潮目が変わるスピードがいかに速いかを見るのは、ちょっと狂気じみています。数百ドルで数千ドルの推論を配っていたのが、無料ユーザーを完全に締め出し、GitHub Copilotのような学生プランユーザーが利用できるものを大幅に制限するまでになりました。

これが終わりの始まりです。しかし終わりを理解し評価するためには、おそらく始まりもよりよく理解する必要があります。どのようにしてここに至ったのか、これらすべてが何を意味するのか、そしてAI開発関連の経済学の未来はどうなるのか。これらの企業は数年後にも存在しているのでしょうか。分かりません。

ありがたいことに、どの企業も私のカバレッジに対してお金を払っていません。ですから、これをできるだけ偏りなくカバーし、私たちが今支払っているツールとサブスクリプションがどこに向かっているのかをよりよく理解できるようお手伝いします。

広告収益の現実

しかしそれらにお金を払うためには、私も資金が必要です。ということで、今日のスポンサーのために少し休憩を入れましょう。

時々、人気のあるソリューションはあまり良くありません。そしてGitHub Actionsの場合はそうだと自信を持って言えます。私たちのCIのほとんどをGitHub Actionsで実行しているという事実は情けないです。今日のスポンサーであるDep Depotのような素晴らしいものを使っていても、彼らはActionsをはるかに高速にし、Dockerビルドも速くしてくれます。

しかし彼らはGitHubが許可するものによってやや制限されています。なぜならGitHub Actionsは率直に言ってひどいからです。もしActionsをより良くする方法を知っている人が、より良いActionsを作る時間を取ったらどうなるでしょう。画面に映っているのは何でしょう。今利用可能です。Depotci。Depotは、GitHub Actionsを殺すことでGitHub Actionsを修正しました。

この年の彼らのフレーミングが本当に気に入っています。彼らはGitHub Actionsをできる限り良くするためにあらゆることをしましたが、常に天井に達する必要がありました。そして今、彼らはそれに到達しました。システムの約30%しか改善できないことが判明しました。しかし残りの70%は彼らのコントロール外でした。それが遅くします。インターフェースを難しくします。

エージェントが何もできなくします。そして私たちは皆、CIからのエラーをエージェントにコピー&ペーストしなければならなかった経験があると思います。もし彼らが実際にその情報を取得できるCLIがあったらどうでしょう。もしあなたのものを実行しているボックスにSSHで接続するより信頼性の高い方法があって、実際に何が間違っているのかを把握できたらどうでしょう。

もし実際に有用な情報を提供するダッシュボードと、これらすべてを活用するためにエージェントに渡せるスキルがあったらどうでしょう。もし今日、何をしているか知っている人々によってGitHub Actionsが再発明され、エージェントがあなたの実際のコードベースでより成功するのを可能にしたらどうでしょう。

そしてもし2つのコマンドですべてを移行できたらどうでしょう。はい、始めるのは実際にそれほど簡単です。すでにはるかに高速で使いやすくなっており、開発者としてのあなた自身だけでなく、あなたのエージェントにとってもそうです。

GitHubとの戦いをやめて、仕事に戻りましょう。soyv.link/depoで。

無料コンピュートという幻想

無料のコンピュートなど存在しません。そして私はこの事実について非常に、非常に厳格でありたいと思います。人々はAIがモデルが作成されたら無料だと考えているようです。しかしそうではありません。

私のアパートで自分のGPU上でローカルモデルを実行するだけで、電気代だけで月に数百ドルかかります。これらのものにはコストがかかります。そしてもしそれらを無料で配っているなら、そこには理由がなければなりません。

広告で収益を上げているのかもしれません。トライアルで顧客を引き付けようとしているのかもしれません。大量のデータを収集しているのかもしれません。そしておそらくそれはこれらすべての組み合わせで、経済的に実行可能にしているのです。しかし一般的に無料の推論を提供することが多くの意味を持つ場所には到達していません。

そしてこれは私たちがしばらくの間持っていた理論です。フロンティアインテリジェンスの価格はやや一貫して下がってきました。これは異なるモデルのコストが2023年以降どのように下がったかを示すチャートです。40や40 miniのようなものは、2023年初頭のGPT4 32Kの同等品より最大10倍安くなりました。

そしてこれは特にオープンウェイトモデルが登場してさらに安くなることで、このトレンドが続くように見えました。しかし私たちが予期していなかったことがありました。私たちが行っている推論の量が指数関数的に増加することを予期していませんでした。

もし2023年と現在を比較して、質問に応答するためにモデルが生成したトークン数について同様のチャートを作成したら、使用されているトークンの量は少なくとも10倍になっています。なぜなら今ではコードベースのようなものをプロンプトしているからです。

そしてモデルは単に応答をワンショットで出しているだけではありません。彼らはツールコールを行っており、それはより多くの追加応答、データを収集するために行われるより多くの追加ステップ、そして途中の各ステップで効果的に別のチャットが発生していることを意味します。

リーズニングトークンもここでコストを大幅に増加させています。私たちがAI全般により多くのお金を使っているという理由だけでなく、特定のプロンプトに対して使っている金額が、コストが下がった分を相殺して余りあるほど増えています。

しかしさらに重要なのは、GPUに物事をさせる必要がある量が増加したことです。1つのチャットメッセージがかつて200トークンを生成していたのに、今では最大20万トークンを生成するとしたら、それはGPU上で費やされる時間も増えることになります。

Geminiの補助金戦略とその失敗

そしてもしあなたがGPUを使用しているなら、他の誰かは使用できません。そしてそれは本質的にお金がかかります。ですからインテリジェンスがトークンあたりで安くなっているという意味では、場合によっては十分ではありません。そしてより多くのGPUとGPU上でより多くの時間を要するこれらの長い生成を行う需要は一貫して上昇しています。

ではGeminiはどこに入ってくるのでしょうか。補助金戦争のためです。AIモデルが最初にある種の存在になったとき、私たちはどのように課金するかを考えようとしていました。なぜなら当時のユーザー、そして今でもある程度は、トークンを本当には理解していなかったからです。

文字セットごとに請求されるという考えは彼らには意味をなしませんでした。ですからT3 Chatを含む多くの製品が、メッセージ数に基づいて請求することを決定しました。

これは問題です。もし私がT3 Chatのようなサービスに行って「2足す2は何?」と尋ねたら、非常に迅速に答えが生成され、あまり多くのトークンではなく、この質問に答えるのにわずか11トークンです。

しかしもし私がReactについて15の詩を書くように頼んだら、15はやりません。5にします。ここで保守的にいきます。このメッセージは434トークン生成されました。

これは似たような質問の長さに対して40倍のトークンです。なぜなら私が求めているものがここではより複雑だからです。そして答えはより多くなります。そしてもしあなたがこの40倍の例で私がやや誇張したと思うなら、そうではありません。

実世界の経験では、最も少ないトークンを使用した下位10%のメッセージと、メッセージで使用された最も多いトークンの上位10%との間のギャップは、400倍のギャップに近いと言えます。

ですからいくつかのメッセージは文字通り0.001コストがかかります。他のメッセージは数ドルかかることがあります。そして、はい、あなたはT3 Chatで月8ドルでメッセージを送信できますが、その個別のメッセージがAPIで私たちに1ドル、あなたのサブスクリプションの8分の1を1つのプロンプトでコストをかけることがあります。ちょっと狂気じみていますが、それがモデルの仕組みであり、より多くのことが起こっているときにこれらのものが自然により多くのコストをかける方法です。

同時に、これらのビジネス顧客のニーズも成長しています。これらの企業がエンドユーザーを求めて互いに競争したいという欲求も高まっています。OpenAIは現在、月20ドルのChatGPTサブスクリプションでエンドユーザーをほぼ獲得しており、それが彼らの収益の70%を占めています。彼らはそこで圧勝しています。

私は月20ドルのChatGPTサブスクリプションをシャットダウンして、月20ドルのGeminiをサブスクライブした人に会ったことがありません。誰もそんなことはしません。私が見た中で最も近いのは、Geminiの無料ティアを使用して、もうChatGPTが本当に必要ないことに気づいた人々です。それでキャンセルします。

それは理解できます。そしてこれはある種、Googleが賭けたいことです。彼らはインテリジェンスを十分に良く十分に安くできるかどうかで、すべてのユーザーが最終的にGoogleのインテリジェンスを使い始め、最終的にすべての競争を殺し、GoogleがAI世界全体を所有し、カテゴリー化を行っている企業に好きな料金を請求できるようになります。

問題は、私たちが皆同じGPUを奪い合っているということです。これらの企業のすべてが、ビジネス顧客へのリクエストを処理し、研究ラボのために、AIで物事を生成し、独自のモデルを作り、独自の何でも彼らがやっていることをするために使用できるインフラの量を持っています。そしてAnti-GravityやT3 Codeのような製品で、または単にチャットインターフェースで直接モデルを使用するために月々何ドルかを支払っているエンドユーザーのために。

そして特にGoogleは、OpenAIやAnthropicから顧客を奪い取りたいと必死なので、彼らは自社製品での使用を補助しすぎています。私のコンテンツで、Twitter、Twitch、YouTube、またはどこであれ、低所得の人々からのコメントを何度見たことか。彼らは、より良いものへのサブスクリプションを買う余裕がない貧しい人々にとってAnti-Gravityが最良の選択肢だから、Anti-Gravityに対して意地悪をやめるべきだと言っています。

これに対して私は通常、舌を噛みます。なぜならここでの現実を知っているからです。それらの顧客は無料の推論を得るほど価値がありません。それが続く世界はありません。そして私たちは今その終わりにいます。それが来ることは感じていましたが、正直言ってGoogleの何十億ドルもの資金がこれをもう少し長く持続させると思っていました。

Googleは無料の推論を配ることでユーザーを獲得しましたが、それは彼らのユーザーの大多数が無料の推論を使用していることを意味し、彼らが大量のコストを食べ、現在実際にお金を使っている人々に使用される可能性のある多くのGPUが使用されていることを意味しました。

そしてこれは私たちに影響を与えました。人々がT3 Chatで有料のものを使用している時があり、私たちはAPI価格を支払っているのに、彼らがメッセージを送信すると3.1が過負荷のために応答に失敗することがありました。

あるいは、コンテンツのためにずっと前にサブスクライブした月250ドルのGoogleプランでさえ、私はこのようなことについて不満を言うためにそれを持っているのが楽しいので、おそらくキャンセルすべきですが、月250ドルのサブスクリプションとGemini CLIで新しいGemini 3.1 Proモデルがドロップしたときに使用できませんでした。

尋ねられたとき、彼らはこれを容量の問題として挙げました。なぜなら彼らはそれを無料であまりにも多く配っているからです。

無料推論の真のコスト

無料の推論など存在しません。あなたが製品であるか、そしてあなたは長くはそうではなくなるでしょう、あるいは何か違法なことが起こっているかのどちらかです。

ですからもしあなたがこれらのツールを無料だから選んでいて、余裕がなく、数千ドルの無料推論の2ヶ月を使用しなかった場合、念のため、あなたはそのウィンドウ中に数千ドルのコンピュートを無料で手に入れています。もしそれが月20ドルを作る方法を見つけるのに十分でなかったなら、それはあなたの問題であり、Googleの問題ではありません。

真剣に、これは、これはただ起こるはずだったことです。こんなに早く起こったことには驚いています。しかし今、Anti-GravityやGemini CLIを使用する理由はゼロです。なぜなら彼らはどこでもほとんど補助していないからです。

彼らは無料ユーザーをProモデルから完全に追い出しています。そして私はある程度Gemini Flash信者ですが、日常のコードには十分ではありません。無料ティアやGemini CLIでGemini 3 Flashのようなものを使って実際のコードを行うという考えは、私をやや気分悪くさせます。

それは幼児のおもちゃのキーボードを使って実際のアプリケーションを構築しようとするようなものです。あるいはFisherPriceのカラオケマシンを使ってアルバムを録音しようとするようなものです。それは単にそこにありません。バカげた感じがします。

しかしここで最も狂った一文は、直接的なコントロールに関するものです。あなた自身の割当と請求に対する直接的なコントロールのために、AI StudioまたはVert.Ex.aiから自分の有料APIキーを使用してください。

これは彼らが公式Gemini CLIアカウントで直接言っていることです。私たちは有料サブスクリプションでのあなたの使用を削減するつもりです。ですからもしより多くの使用が欲しければ、APIキーを使用してください。これは狂っています。これは正気の沙汰ではありません。彼らはあなたたちを激しく切り捨てています。

ではどうやってここに至ったのでしょうか。なぜこれらの企業はすべて無料で補助金付きの推論を行うのでしょうか。それはドラマをもたらすだけのようです。

去年7月のドラマを覚えていますか。Cursorがメッセージごとから使用量に基づく請求モデルに切り替え、みんなが大騒ぎしました。これらのことは問題を引き起こすだけのようです。

まあ、これを行う最初の理由は、他の場所で収益を上げることができるということです。おそらく広告です。もし推論が行われるのをカバーするのに十分な広告収益を上げる能力があれば、素晴らしいです。しかし人々は広告でどれだけのお金を稼げるかを大幅に過大評価していると思います。

広告にどれだけ少ないお金があるかを示す私のお気に入りの方法の1つは、私自身です。私のYouTubeチャンネルはかなり人気があります。私たちは経験豊富な開発者から月約300万のビューを得ています。

ですから私たちのCPMは比較的高いです。過去28日間で、私のチャンネルは465,500時間視聴されました。ですから28日間に672時間あるとすると、それは1時間あたり693時間になります。つまり1時間が経過するたびに、私のコンテンツの693時間が視聴されています。

長い間サブスクライブして視聴してくれている方々に、私たちは心から感謝しています。これらの数字は狂気じみています。私にとってまだ処理するのが難しいです。1時間が経過するごとに視聴される時間がほぼ1000時間に達しているというのは、ただ驚愕です。

任意の瞬間に、平均して600から700人がTheoの話を見ているというのは狂気じみています。では、これから月にどれだけの収益があると思いますか。覚えておいてください、経験豊富な開発者、高いCPMです。なぜならこれらの開発者は経験豊富だからです。

YouTubeの広告から月にどれだけ収益があると思いますか。そして繰り返しますが、もしすでに答えを知っているならチャットで答えないでください。頭の中で数字を思い浮かべてください。Twitchチャットに飛んで、ここの人々が何を考えているか見てみます。

オーケー、40,000、20,000、10Kから20K、ショートから500ドルが見えています。Twitchで働いていたあなたはズルいですね。

答えは、月約9,000ドルです。様々な異なることに応じて5から9の間で変動します。ここでの不条理さを強調したいと思います。これは28日間で20,000日分の私のコンテンツが視聴されたということです。

ですから20,000日分の私のコンテンツが視聴されることは、広告で約9,000ドルの価値があります。それは私の編集者に支払うのにさえ十分ではありません。

YouTubeの広告は、これらのタイプの大規模な操作でさえ、お金を稼ぐ本当の方法ではありません。そしてこれは私と分割される収益です。ですからここでのGoogleの完全な広告収益はおそらくこれの2倍です。50-50の分割だと信じられています。

それが実際にそうであることを本当に知る方法はありませんが、私は彼らの言葉を信じます。おそらくそうでしょう。ですからGoogleは私のコンテンツから理論的にその時間に最大18,000ドルを稼ぎました。

ですからもし広告が推論のコストをカバーできると思っているなら、あなたは非常に非常に愚かです。それについて言えることはそれだけです。もしこれをビューあたりのドルに再構成すると、ビューあたり0.028になります。それがどれだけ小さいか理解していますか。

そして覚えておいてください、個別のメッセージは1ドル以上かかることがあります。ですからもしプロンプトの下にある小さな広告が、プロンプトが無料であることを正当化するのに十分だと思っているなら、私は道の向こうにたくさんの橋を持っていて、あなたに見てもらいたいです。

真剣に、広告には少なくとも個人レベルでは金がありません。人々はGoogleのような企業が広告で何十億ドルも稼いでいるのを見ます。なぜなら彼らはそれを何十億という規模でやっているからです。

広告で10億ドルを稼ぐには、まず1兆の広告を送信しなければなりません。そしてもしそれらの各インスタンスが1ドルかかる可能性があるなら、あなたはただお金を失うだけです。ですから0.3セントの広告が複数ドルのプロンプトをカバーする世界はありません。

世界は単にそのようには機能しません。ですからもし広告が、広告があるからこれらのものの完全なコストを完全に補助するのに十分な方法だと思っているなら、あなたはこれらがどのように機能するかを知りません。

このスケールがはっきりしていることを確認したいだけです。なぜなら人々は広告が実際よりも多くの収益を生むと考えているようだからです。

これも私たちがこのチャンネルに素晴らしいスポンサーを持っていることに非常に感謝している理由です。なぜなら彼らがこれを機能させているからです。もしスポンサーがいなかったら、私はこれができなかったでしょう。なぜならTwitchで人々が私に支払う収益とYouTubeの広告からの収益は、私のチームメンバーの1人をカバーするのにちょうど十分だからです。

チャンネルを運営するために持っている全チームには遠く及びません。確かに私がそこから1セントを稼ぐことからは程遠いです。実際、私はスポンサーに非常に感謝しているので、今すぐその1つについてお話しします。

モバイルアプリ開発の民主化

AIはアプリの構築が本当に得意になりました。まあ、少なくともウェブアプリは。モバイルに来ると、事態ははるかに複雑になります。アプリをリリースしようとするだけでも面倒です。携帯電話ができるクールなことを活用したいです。

AR側でもカメラでも、iPhoneのSwiftバインディングに埋め込まれた他のすべての魔法的なものでも、あなたはかなり運が悪いです。まあ、Ror Maxがドロップする前はそうでした。なぜならこれは狂気じみているからです。私は実際に本当に吹き飛ばされています。

この広告のために遊ぶように設定してきましたが、中毒になっていると思います。これで実際のアプリケーションを作るのは笑えるほど簡単です。私が作ったものは少しおかしくて、ここで見えないことに気づくかもしれません。それは私が携帯電話に接続しているからです。

Rorは今、Macアプリを出荷しているので、携帯電話とコンピューターをリンクさせて、ちなみにバックグラウンドでCloud Codeを使用しながら、実際のネイティブiPhoneアプリケーションを構築できます。

これは構築された実際のSwiftアプリで、私のマシンで構築されたわけでもありません。クラウドで構築され、それから私がコンピューターで作業しているときに私の携帯電話に入れるために彼らのパイプラインを使用しました。

ここで与えたタスクは簡単ではありませんでした。AR機能と携帯電話のカメラを使って、私の頭に帽子をかぶせるアプリを構築するように頼みました。

そして実際に機能します。何ですって。このようなことがこのようなウェブアプリで遊ぶだけで実行できるというのは、ちょっと狂気じみています。帽子が頭の前にあるように見えるかもしれません。それはあまり正しくありません。修正するように頼みました。成功したか見てみましょう。

隅に小さなビルディングボタンがあるのが見えます。そして再構築してアプリを携帯電話に直接更新するように指示できます。

オンボーディングも素晴らしいと言いたいです。本当に正しく取得するのが面倒なこれらすべてのタイプの小さなことを、それらの対処方法を教えてくれます。そして私は人生でiOSのことをやってこんなにスムーズなセットアップをしたことがありません。公式のAppleのものでさえ、これよりもはるかに難しかったです。

くそっ、実際に機能しました。何ですって。これらはiOSを知らなければ人々が行うのが現実的ではなかったタイプのことです。まあ、これで何でも構築できます。私が知る限り、彼らはサブウェイサーファーズのクローンからフライト管理アプリ、完全なポケモンGoクローンまですべてを披露してきました。

iPhoneができることすべて、すべてのAPI、通常ブロッカーになるすべてのものを使用できます。

しかし断然最大の取引は、App Storeへの2クリックです。私はRor Maxに吹き飛ばされています。そしてあなたもきっとそうでしょう。今すぐsoyv.link/roorでチェックしてください。

スポンサーは私に収益をもたらすことができますが、この一般的な方法での広告は推論をカバーするのに十分な収益を生み出すことはできません。地獄、私のスポンサーでさえ、あなたたち全員が無料でプロンプトするためにプロンプトあたり1ドル以上をカバーすることを望まないでしょう。

ここで現実的になっているだけです。では他にどんな理由で誰かが無料または補助金付き推論をしたいと思うでしょうか。

データ収集の価値

私が人々がよく話しているのを見るもう1つで、ある程度本当なのはデータです。私たちは今、様々な異なるシナリオで、最終的に確認された良い結果を持つLMとのチャット履歴が、新しいモデルをトレーニングするために本当に強力であることを見てきました。

あなたがトレーニングしている元のデータを生成したものよりも賢いモデルを作ることは決してできませんが、非常に近づくことができ、はるかに安く行うことができます。これがAnthropicが、自分たちのトレーニングに使用できるAnthropicモデルからのプロンプトや他のデータへのアクセスを取得しているこれらすべての中国のラボを非常に恐れている理由です。

これもまた、私が聞いたいくつかの怪しいことがあり、より良い例を参照して皆さんに見せることができたらよかったのですが、良い友人から、Claude Codeのためのより安いサブスクリプションを提供している中国企業があり、奇妙なClawラッパーのようなものを使用する必要があり、月10ドルのようなはるかに安い価格でまだAnthropicモデルを使用するというものを知っています。

そして彼らがそれを行った理由は、すべてのリクエストを中間に入り、すべての入力と出力を収集して、それを使用してトレーニングに行けるようにしたかったからです。少なくともそれが私の推測です。なぜならこれのどれも記録にないからです。

それは非常に違法でした。彼らはまた、その推論を得るためにあらゆる種類の疑わしい方法を使用していたでしょう。しかしそのタイプの海賊版が価値があるのは、データがとても価値があるからです。

Cursorのようなケースでは、彼らはこれから大いに利益を得ると私は主張したいです。明らかに、率直に言って支払いを望まない人々も有用なものの面でジャックシット、くだらないものに取り組んでいるので、無料の推論を与えるほど十分に利益を得ていません。

ですからもし月20ドルのサブスクリプションを買う余裕がないなら、あなたの推論は平均的な人よりも価値が低いです。もし実際の企業での仕事がなく、実際のコードベースで作業していて、そのためにCursorサブスクリプションを買う余裕がないなら、私たちはあなたのデータを望んでいません。有用ではありません。

しかしもしあなたが企業で働いていて、ドルあたり得られるものを最小最大化しようとしているだけなら、Cursorはある程度の補助を正当化できます。なぜならもし彼らがあなたの作業とプロンプトからデータを取得できれば、それを使って自分たちのより良く、より安いモデルをトレーニングし、それから自分たちのコストを下げるために使用できるからです。

とはいえ、データは無料で配る価値があるほど価値はありません。Cursorが食べようとしていた、あるいは食べることができたであろうよりも少し多くのコストを食べるのを助けるだけです。

顧客獲得競争の実態

そしてここで企業がこれを行っている本当の理由に到達します。顧客を奪うこと。これは、それを買う余裕がある企業からの必死の試みで、人々に自分たちのものを使うよう説得することです。

そして一般的に言って、誰かが使用しているものを変更する理由は2つあります。それはより良い何か他のものがあるか、十分に良くてより安い何か他のものがあるかです。それが人々が新しいものを試す2つの理由です。

私たちの周りのすべてが変化している世界では、何がより良いかを識別することさえ本当に難しくなっています。そして同時に、これらのものの多くがより高価になっています。

私は去年の初めに月20ドルのサブスクリプション2つを持っていたのが、3つの月200ドル以上のサブスクリプションになりました。それは本当に早く起こりました。つまり顧客を獲得することはより難しくなっています。なぜなら私は既存の月200ドルのプランに対してあなたの月200ドルのプランに盲目的にサインアップするつもりはないからです。それを考慮したり見たり気にしたりするために、それが十分に良いことを知る必要があります。

しかしもしそれを無料で提供してくれるなら、見てみるかもしれません。そしてもしあなたのものが十分に良くて無料なら、支払っているものをキャンセルしてあなたのものに固執するかもしれません。あるいはそれが十分に安ければ、ただそれに移動して幸せになります。

もし競争相手よりも良くできないか、競争相手よりも良い方法を伝えるのに苦労しているなら、価格が伝える最も簡単な方法になります。

そして私は確かにここで経験から話しているわけではありません。月8ドルのチャットアプリ、T3 Chatを出すことは、確かに私があまりにもよく知っているであろうことではありません。

もし人々にあなたがより良いと説得できないなら、あなたがより安いと説得してください。なぜならそれは簡単だからです。そして彼らが移動したら、もしそれがより良ければ、あなたが構築したものがどれだけより良いかを発見するでしょう。あるいはしないでしょう。

ですから安いまたは無料にすることは、潜在的な新しいユーザーに大きなブーストを与えることができますが、もし十分に良くなければ、彼らを維持せず、残された人々にお金を無駄にするだけです。

ですからもし私たちにこの範囲の人々がいて、右側に億万長者がいて、左側にコードを学んでいる12歳がいるなら、これらのグループの支出可能性は大幅に異なります。

そしてもし億万長者に愛される製品を作ることができれば、おそらくそうすべきです。なぜなら多くのお金を稼ぐことができるからです。しかしこのスペクトルのどこかに線があり、それは無料なら試すというものです。

そしてこの線は、人々が無料で配られればもっと興味を持つポイントです。

この線はおそらくここでさらに右にあります。私が知っている金持ちの一部でさえ、有料のものよりも無料のものを試すことにはるかに興味を持っています。ですからどこかに線があります。

しかしここで識別すべき重要な範囲もあります。それはより良いものにお金を払うという範囲です。ですからもしあなたのものを無料にして、長期的に有料ユーザーを獲得したいなら、ここの範囲は金鉱です。

無料なら試すとより良ければお金を払うの間の範囲。もし無料だから彼らを引き込むことができ、それからより良いから彼らがそれに固執し、お金を使い始めるなら、素晴らしいです。このバケツから多くの良いユーザーを得ることができます。

GitHubのようなものがこれを本当にうまくやっていると私は主張したいです。GitHubは私たち全員が使用するもので、無料だから、そしてみんながそれを使っているのを見るからです。そして仕事に行くとそこでそれを使いたいです。

支払いを始めて、彼らは多くのお金を稼ぎます。しかしここに問題があります。私たちはこのエリアのユーザーが製品に十分満足して有料ユーザーになることを期待しています。しかし製品があまり良くなかったらどうなるでしょうか。

まあ、それから私たちはこのセクションに存在する別の線にぶつかります。無料でしか使えない。

そしてこの線は死刑宣告です。ここの左側のすべては自殺ミッションです。もしあなたの唯一のユーザーが、より良いものを使う余裕がないからあなたのものを使用している人々なら、あなたは終わっています。あなたは絶対に終わっています。この位置から回復することは決してないでしょう。

これらの企業の多くが過去に無料ティアを提供した唯一の理由は、preAIのように、みんなが無料なら試すし、十分な人々が支払いを始めるので価値があったからです。

しかしもしこの線を越えたすべての人々が満足していて、あなたのものを試すつもりがないなら、無料にすることで得られるのは、大量のお金をかけてあなたに費用をかけ、実際の有料ユーザーに決して転換しないくだらないユーザーの束だけです。

くだらなくて無料であることによって、Googleは効果的にAnti-Gravityのユーザーベースを、本当に何をしているか分からない初期のプログラマーで価値がなく、お金を使わない人々、または本当に経験豊富なプログラマーで、これもお金を使わない人々にフィルタリングしました。

Linus Torvaldsを見ています。何らかの理由で無料だからAnti-Gravityでバイブコーディングしているのを見ました。しかしそれがこれの現実です。これらの企業のほとんどは、Linus Torvaldsのような人が無料だから試してくれることを望んで無料のことをやっています。

しかし現実には、彼らが結局得るのは、他の何かを買う余裕がないからだけにそれを使用しているこれらすべての人々です。

そしてそれらのユーザーはあなたのGPUとエネルギーと時間とサポートを無駄にするつもりです。特にこれらの安くて無料のユーザーは、非常に多くのニーズがあるため、サポートの面で非常に高価です。

100ドルのクライアントがあなたのすべての時間と注意を求めるという古典的なミームがあります。1,000ドルのクライアントは良さそうだと言います。それは非常に現実的なことです。

この範囲のユーザーは、有料ユーザーほど高価ではないか、安くはありません。彼らはしばしばより高価です。彼らはより高い期待を持っています。彼らはより面倒です。そして彼らがあなたに収益をもたらす可能性はゼロに近いのではありません。ゼロです。

そしてGoogleは不注意にも、自分たちのコード関連のものの大多数のユーザーがこの呪われた隅に住む位置に自分自身を置きました。

そしてそれがGoogleが物事を切り捨てなければならない理由です。しかし私はこれを他のビジネスと比較したいです。Claude Codeのようなものと比較したいです。

サブスクリプションモデルの経済学

このどこかに別の線があります。それは月200ドルを払える余裕があるというものです。それはあなたがそのためにただサインアップして使用することを望んでいるという意味ではありませんが、そのくらいのお金を使うことができます。

ですからウェブサイトの無料ティアでClaudeを試したかもしれません。それらのゲストパスのようなものを手に入れて、Cloud Codeを試しているかもしれません。ああ、これはかなり印象的だ。自分が支払っているのが見えるな、と。

それで20ドルティアにバンプします。すべての使用量を使います。ああ、これは有用だ。もう少し払おう、と。再びバンプアップして、そして突然月200ドルティアにいます。

それからOpenAIが新しいモデルを出して、本当に使いたいことを見ます。しかし2つ目の月200ドルのサブスクリプションは欲しくないです。ですから代わりに、Cursorを試します。なぜならCursorには月200ドルのプランがありますが、ClaudeとOpenAIモデルが入っているからです。

とにかくClaudeサブスクリプションの半分も使っていなかったので、大丈夫でしょう。それでCursorに移動して、最初の3日間で限界に達し、何だこれは、Claudeプランを使っていたときには限界に近づくことさえなかったのに。なぜCursorに費やしている同じお金がこんなに早く限界に達するんだ。間違ったモデルを使ったのか。何か悪いことをしたのか。Cursorは貪欲だから過剰請求しているだけなのか、と。

いいえ、実際にはまったく逆です。その月200ドルのプランは月最大5,000ドルのコンピュートに使用できることが判明しました。ではなぜ彼らはこんなことをするのでしょうか。いくつかのユーザーアーキタイプについて考えてみましょう。

再びその12歳に焦点を当てましょう。12歳は最大15ドルの推論を使用できます。彼らは0ドル支払います。彼らは生涯にわたってゼロを支払うでしょう。このユーザーは会社に収益をもたらさないでしょう。

そして彼らは何百万人もいます。これはあまり魅力的な顧客の内訳ではありません。これは私がユーザーとして欲しい人ではありません。

では42歳の開発者はどうでしょう。彼らは最大5,000ドルの推論を使用できます。彼らは月200ドル支払います。彼らは生涯にわたって100万ドル以上を支払うか、会社に支払わせるかもしれません。そしてこれらの人々は多くても数十万人しかいません。

ですから一方で、この42歳の開発者は12歳よりもAnthropicにはるかにコストをかけています。12歳はゼロに対して15をコストしています。42歳の開発者は200に対して5,000をコストしているので、理論的にAnthropicに最大4,800ドルをコストしています。そして12歳は15しかコストしていません。

しかしこれをより長期的に考えてみましょう。もし推論のコストが10分の1になったらどうなるでしょうか。この無料ユーザーは1ドル50になりますが、それは広告でカバーされるほどではありません。それはまだ利益が出ません。そして彼らは決してお金を使いません。ですからこのユーザーはまだ最悪です。

しかしその5,000ドルの推論は突然500ドルになります。明らかにまだ利益は出ません。彼らはまだそれで300ドル損をしています。しかしもし価格が10倍安くなれば、地獄のように近づきます。

また、ほとんどのユーザーがそのすべての推論を使用することに近づかないことは注目に値します。ですからもしあなたのトップ1%のユーザーが許可された全量を使用しているが、平均ユーザーが半分未満を使用しているなら、この変更で簡単に利益を上げています。

しかしもし100倍安くなったら、12歳はまだ15コストしますが、それは広告で彼らをカバーするのにほぼ十分か、少なくとも近いかもしれません。

しかしそれはまた、Anthropicのコストが50ドルで、今彼らはトップティアユーザーで4倍の利益を得ているということも意味します。これはここで考慮しなければならない異なる次元の1つにすぎません。

より重要なのは、もしあなたが私に月200ドルのプランを与えてくれたら、私は個人的に使います。本当に気に入ります。そして会社に行って「ねえ、ここでこれを使うべきだ」と言います。

彼らは全エンジニアリング組織をそれにサブスクライブします。その組織の20%が実際にそれを使用します。そして10%がそれを激しく使用します。それは私の支出の80%が、ほとんどそれを使用していない人々に行くということです。Anthropicへのただのお金です。

私は自分自身でこれをやっているようなものです。なぜなら月200ドルのサブスクリプションを維持しているのに、CursorやCodec CLI、主にCodec CLIのようなものを使用するのに忙しすぎて、Cloud Codeをほとんど使用していないからです。

ですから私の推論をほとんど使用しておらず、それが他の人々のコストを補助するのに役立っています。しかしもしすべてのユーザーが0ドルを使ったら、彼らは互いを補助することはできません。

長期的展望と結論

そして12歳のときに彼らはずっと貧しいわけではないと言っている人たちへ。大人になったら製品を使うかもしれません。ああ、彼らは大人になって良いものに移るでしょう。

もしあなたがこの仮定について正しかったなら、デイリードライバーコンピューターとしてChromebookを使用している22歳のGenZerの束があるはずです。あなたはただ間違っています。

子供たちが成長したら、より良いものを手に入れます。そして貧しい子供たちのために物を作ることが経済的に意味をなす唯一の理由は、彼らからお金を稼ぐことができる場合です。

そしてあなたはできません。そして後でそのお金を稼ぐこともないでしょう。あなたはただ間違っています。そしてありがたいことに、1つの企業だけがそうでないと考えるほど愚かでした。そしてそれはみんなのお気に入りGoogleです。

そしてGoogleは今、これを行うことで自分たちがどれほどひどく台無しにしたかを認識しました。そして彼らはそれをロックダウンしようとしています。

私はほぼ100%の確実性でこのタイプの補助金が死ななければならないと言うでしょう。このようなものが存在すべき理由はありませんでした。それは誰かがGoogleの開発者製品に気を配る人を得ようとする必死の試みで、あまりにも多くの推論を無料または本当に安く配った、PMのくだらないプレートでの悪い数学でした。

そして彼らは完全に失敗しました。このタイプの補助金はもう少し興味深いです。一方で、それは不条理です。

ここで得ている推論の量は狂気じみています。これは続くことができません。彼らは長期的にこれを買う余裕があるはずがありません。しかし他方で、彼らが補助している量は増えています。

私が以前引用したのと同じ理由によると、Cursorが独自の内部テストを行っているというもので、昨年は月200ドルのプランで月最大2,000ドルしか使用できませんでした。

ですからそれは10倍の補助金でした。それ以来25倍になっています。Anthropicは彼らのモデルを使用するときに割引の観点から得ているものを増やしています。そして彼らがそれを行う理由と多くのインセンティブがあります。

しかし最大のものは、彼らがすべてのモデルが使用できるCursorから人々を追い出し、Anthropicモデルだけが使用できるClaude Codeに移したいということです。

彼らはこれを行うために非常に強い経済的インセンティブを持っており、そのために台無しになり続けるでしょう。それは彼らがDAXやOpen Codeに台無しになっている同じ理由です。

これには多くのレイヤーがありますが、その1つは、もし他のハーネスを使用するなら、他のモデルに切り替えるのが簡単だということです。ですからAnthropicエコシステムにあまり固定されません。

そして推論が安くなる前にあなたが移動した場合、月200ドルで5,000ドルの推論を与えることは彼らにとって意味をなしません。これらの補助金は生涯顧客にする場合にのみ意味をなします。

ですから生涯顧客としてあなたを失うリスクがあるものはすべて、彼らが取ることに興味のない大きなリスクです。だからAnthropicは選択肢を与えるツールからあなたを追い出すために一生懸命働いています。

そしてこれが、利用規約、SDK、独自のガイドライン、既存の従業員やオンラインの人々から得たアドバイス、そして最も重要なことに、Claudeによると、私たちの実装は完全に問題なく安全であるにもかかわらず、T3 CodeでのClaude実装について私が恐れている唯一の理由です。

しかしAnthropicが選択肢を持つことを望んでいないという経済的現実は、彼らの補助金が長期的に利益を保証しないからで、それは本当のリスクです。

ですからT3 Codeが時間の経過とともに良いCloud Codeサポートを持たなくなる唯一の理由は、Anthropicが具体的にあなたに選択肢を持ってほしくないからです。

ではなぜOpenAIは補助金を行うのでしょうか。この特定の開発者を含む一部の人々が、モデルがくだらないことにうんざりしてClaudeから切り替えて、OpenAIのモデルのようなものを支持したため、私は逆の効果を得ていると思います。

これは主に彼らの成長フェーズのためです。実際、お見せできます。4月2日まで2倍のレート制限でCodexアプリを試してください。ちなみに、これらの制限はCodexアプリだけでなく、すべてのCodexサービスに適用されると私は理解しています。

しかし彼らがここであなたに与えている2倍のレート制限は、他の選択肢から人々を引き抜こうと本当に一生懕命努力しているからです。

CodexはCloud Codeよりもはるかに人気がないため、今日まで、ユーザーを引き抜くために彼らができることは何でもしなければなりませんでした。そしてこれらのレート制限は寛大すぎます。

私は試していたときに30%の使用量を超えたことさえありません。私の従業員の1人が一度90%近くになりましたが、それはJuliusで、彼は一生懸命やろうとしていました。

そしてTiboが押し続けているリセットボタンがあります。それは全く別のジョークのセットです。OpenAIがこれを行い、正当化できる理由は、何もしていない月20ドルティアに非常に多くのサブスクライバーがいて、これを十分に正当化しているからです。

それをランドグラブとして、Claude Codeからいくつかの地盤を奪おうとする機会として、ここでお金の価値があります。

しかし再び、私のリストに戻ると、これはすべて3の一部です。本当に意味をなす唯一の戦略。無料で補助金付き推論を配る理由は顧客を奪うことです。新しい顧客を作りません。パイを成長させません。

これを行う理由は、他の誰かからパイのより多くを奪うことです。そしてそれがOpenAIが今多くの異なることをやっている理由です。

これが彼らが私たちに一時的な2倍のレート制限を与えている理由であるだけでなく、これも彼らがOpen Codeや私たちのようなT3 Codeの人々と一緒に働いて、統合するために必要なすべてを持っていることを確認している理由です。なぜなら彼らは唯一の選択肢になりたくないからです。

彼らは最良の選択肢になりたいのです。なぜなら今彼らは市場の最大30%の選択肢だからです。

しかしもし彼らがみんなに選択肢のリストを与え、彼らのものが最良の価値と最良の選択肢なら、彼らはますます勝ち始めるでしょう。そしてこれは今のところ彼らにとって非常にうまくいっています。

一方、Anthropicは保持を維持するために補助金を提供するインセンティブを持っていますが、他の人の近くで自社製品を提供し続けるインセンティブはありません。

これが、Codexで働くエンジニアがClaudeについて意味のある話をするのを聞くのに対し、ClaudeエンジニアにCodexについて言及させるのに本当に苦労する理由です。それは彼らが両方とも住んでいる現実歪曲バブルのユニークな形にすぎません。

しかしそれはすべて、彼らが市場のどこにいるかに帰着します。そして正直に言うと、OpenAIと一緒に働くのが大好きで、そこで友達の人々が素晴らしく、一緒に働くのが楽しいとしても、もし彼らが50%以上の市場シェアを獲得したら、彼らの調子が急速に変わると予想します。

Anthropicで起こったように、彼らは合理的で、やや寛大だったのが、もしCloud Codeを使用していないなら、くたばれ、というようになりました。そしてそれは本当に早く起こりました。

ではGoogleはこのすべてにどこに適合するのでしょうか。彼らは適合しません。なぜなら彼らは無知だからです。ビジネスとしてのGoogleは実際のAI顧客を獲得しようと必死です。

そして彼らはそれを、GPUと割り当てをめぐって戦っている、お互いのコミュニケーションと理解のない、会社全体にわたる何十もの異なるチームを形成することでやっています。

そして私はGoogleで開発ツールに取り組んでいた人々を知っています。彼らはAnti-Gravityの無料ユーザーに配りたかったので、Gemini Pro 3.1を追加するようGoogleを説得することができませんでした。

ああ、Googleは自分たちの開発者を台無しにするほど激しく補助しました。そしてその結果、物事がどれだけ燃えているかは本当に狂気じみています。

Anthropicがこれらのタイプのことを非常に焦点を絞った戦略で行うのに対し、Googleは無能だからそれらを行っています。彼らは不注意にも自分自身を悪い位置に置きました。

ですから私はあなたたちにこのフレーミングを提供して、これらすべての企業とそれらがなぜそのように機能するかを理解するのを助けるために最善を尽くしていますが、これらのフレーミングのどれもGoogleには決して機能しません。なぜならGoogleは意味をなすことに基づいて機能していないからです。

GoogleはGoogleがどのように機能するかに基づいて機能しており、それは特に良くありません。私はGeminiは悪いバイブスビデオをしばらく計画してきました。誰も気にしないと思うので、わざわざやるかどうかさえ分かりません。

Geminiモデルを使用していて、Anti-Gravityのようなものを激しく使用していると知っていた唯一の人々は、他のものを買う余裕がなかった人々でした。

そして今、彼らが公式にそれを行うことから追放されたので、今後誰も私に尋ねないと予想しています。うまくいけば、これはこれらのビジネスインセンティブがどのように機能するかの理解に役立ち、おそらくあなたの月200ドルのサブスクリプションを少しの精査で見るでしょう。

あるいは少なくとも、他の誰もそうしないときに全額を支払わなければならない私たちのようなT3 Chatのようなサービスにもう少し寛大になるでしょう。

これらのサブスクリプションのユーザーであることは素晴らしい時間ですが、彼らと戦おうとしている競合他社であることはひどい時間です。だからこれらすべての企業がそれをやっているのです。

だから私たちのような小さなスタートアップが台無しになるのです。そしてだからこそ、これらのツールで構築する開発者であるあなたには、素晴らしいことをする信じられない機会があるのです。

真剣に、もしこれらのサブスクリプションの1つを買う余裕があって、まだ持っていないなら、本当に1つを見つけるべきです。たとえそれが私たちがT3 Chatで構築したようなものを使用しないことを意味するとしても。

なぜならそれらは実際に使用できるなら、人生で得られるこのタイプの無料価値の最後のチャンスの1つであるほど高い価値のリターンだからです。できる限りそれを利用すべきですが、私たちが今見始めているように、いつでも消えることを期待してください。

そしてうまくいけば、長期的にはこれが必要ないほど価格が安くなるでしょう。それまでの間、私は月200ドルのサブスクリプションを最大限に活用するために最善を尽くすつもりです。あなたもそうすべきです。

そしてもしそれを行う場所を探しているなら、T3 Codeを試してみるべきです。私たちはこれらすべてをオープンソースラッパーで提供しています。

とにかく、これについて他に何もありません。あなたたちがどう感じるか興味があります。

コメント

タイトルとURLをコピーしました