PrimeはAIについて(ほとんど)正しい

Anthropic・Claude・ダリオアモデイ
この記事は約42分で読めます。

本動画は、ソフトウェア開発者のTheoがPrimagenの動画を参照しながら、AIエコノミーにおけるコンピュート(計算資源)の制約とサブスクリプションモデルの現状について解説する内容である。AnthropicのClaude CodeやGitHub Copilotの制限強化の背景には、企業がユーザーから利益を搾取する目的ではなく、エンタープライズ顧客向けに有限なGPUリソースを確保しなければならない切実な事情があることを指摘している。さらに、AIモデルの進化によってトークンあたりの推論効率が飛躍的に向上し、実際のコストパフォーマンスは下がり続けていることをデータとともに解説している。

Prime is (mostly) right about AI
Prime's takes on the AI Economy are mostly right, but there's a couple things worth going deeper on...Thank you Blacksmi...

開発におけるAIの活用とPrimeの動画について

開発作業にAIを使うのが結構好きだと気づいている方も多いと思います。全体的にかなり優秀だと思っています。これは以前の私の考え方からは大きな変化です。そして時間が経つにつれ、開発作業でAIに手を伸ばすことがどんどん増えています。しかし、すべての開発者が同じように感じているわけではありません。特に私の古い友人であるPrimagenは、AIエコノミーがこれからどのように変化するかについての動画を公開したばかりです。

私はすでにその動画を見たので、これは通常のリアクション動画にはなりません。しかし、彼の意見のいくつかを掘り下げてみたいと思います。というのも、そこには多くの真実が含まれており、そのニュアンスが見過ごされているように感じるからです。しかしその一方で、これらすべての経済的側面について、あまりよく理解されていないと感じる部分もあります。特に、MicrosoftやGoogleが言及されると、細かい詳細が少し失われているように感じます。ここでは、納得のいく妥協点を見つけようと思います。なぜなら、Primeはすでにアンチと完全なAI依存症の人たちの中間くらいにいるからです。

私も自分はその中間のどこかにいると思いたいです。みんな私がもっと依存症の側にいると思っているのは知っていますし、その理由もわかります。これは素晴らしい動画なので、その中のニュアンスを見つけるために最善を尽くしたいと思っています。それでは、今日のスポンサーからの一言の直後に、この動画に飛び込んでPrimeの意見についてすべて話していきましょう。

ビルドプロセスを高速化するBlacksmith

今日のスポンサーについては、おそらくすでに私が話しているのを聞いたことがあるでしょう。Blacksmithです。待って、彼らはMacランナーを提供しているんです。はい、ここでは演技をしていますが、これを聞いたとき、私はそれ以上に興奮しました。なぜなら、現在のT3のコードビルドプロセスで最も遅い部分の1つがMacランナーだからです。

Macアプリをビルドするには、Macを使用する必要があります。そして、私たちはMac用のアプリをビルドしていたので、GitHubのMacランナーに行き詰まっていました。これは本当にひどい代物です。私たちのビルドプロセス全体は以前は16分かかっていました。そして、その多くの時間はMac版のx64 Intelビルドに費やされており、それには8分以上かかっていました。今では3分34秒で終わります。そして、ARM 64ビルド、つまりAppleシリコン用のものは、GitHubでは6分11秒かかっていました。それが今では4分未満、3分32秒で終わります。

これにより、私たちはリリースについてイライラしていた状態から、リリースを行うのが少し楽しみな状態になりました。私たちが現在T3コードでナイトリービルドをリリースしている理由が気になるなら、それはビルドプロセスがどれほど安く、速くなったかによるものです。皆さんに本当に正直に言います。もしGitHubでMacアプリをビルドしていて、まだBlacksmithを使っていないなら、本当に多くの時間を無駄にしています。そして、Macアプリをビルドしていなくても、まだGitHub Actionsを使っているなら、やはり時間を無駄にしています。なぜなら、Blacksmithは半額以下の価格で2倍速いからです。時間とお金の無駄遣いをやめて、soyv.link/blacksmithでより速くビルドしましょう。

AIエコノミーのほころびとAnthropicの価格テスト

Primeが何を言っているか見てみましょう。

ひび割れが見え始めています。基礎が少し揺らいでいるように見えます。私が話しているのはAIエコノミー、トークンエコノミーのことです。最初のものはもちろん、みんなのお気に入りであり、善人であるAnthropicからのものです。でしょ。彼らの弁護士が大好きなんですよ。ほんの数日前に起こったことは、Anthropicがペインテッドドアテストと呼ばれるものを行ったということです。少なくとも私はいつもそういう用語で聞いています。フェイクドアテストという言葉を使っている人も見たことがあります。これは、価格ページに別の価格を表示して、もしユーザーにさらに高い料金を請求したらどれくらい多くの利益を得られるか、どれくらいの人が価格ページから離脱するかを確認するものです。では、仮説を立ててみましょう。

ここで彼が話しているのは、数週間前に起こった変更のことです。Anthropicは、Claude Codeを20ドルのティアから外し、Claude Codeを使用するためには100ドルまたは200ドルのティアにする必要があるかどうかを確認したいと考えていました。彼らがこの変更を行いたかった理由は、Claude Codeの実行にはコストがかかり、コンピュートを節約しようとしたからです。しかし、ここで彼が見落としている部分があります。彼が見落としている最初の点は、ここでエコノミーが崩壊し始めたのはこれが初めてではないということです。私は、最初のきっかけは実は昨年の7月までさかのぼると主張したいです。

このケースではCursorが大きな打撃を受けました。私がCursorを取り上げているのは、以前は彼らがメッセージ数で課金していたからです。つまり、一定の金額を支払うと、1ヶ月に特定の数のメッセージを受け取ることができました。数セントで実行できるメッセージもあれば、実行に数ドルかかるメッセージもあるため、これは最悪です。面白い事実として、現時点でのGitHubは依然としてメッセージ数に基づいた価格設定を行っています。彼らもこれに気づき、来月の初めにこれを変更しようとしています。

実際に私は暗号学の課題を解決しようとしてターミナルを実行しており、1つのメッセージで1時間半近く実行され続けています。40ドルのプランでは月に1,500件のメッセージが使えます。完全に非現実的です。これについては後でまた戻ってきますので心配しないでください。しかし、私はこれが終わりの始まりだったと主張したいです。

Cursorは推論のためにラボに支払う必要があるため、補助金を出す能力がありません。各リクエストに対してOpenAIやAnthropicに現金を支払わなければならないため、一部のユーザーが200メッセージで10ドル分の推論を行い、他のユーザーが200メッセージで数千ドル分の推論を行うような状況では、補助金を吸収しきれませんでした。そして、Cursorはそれを負担しきれませんでした。そのため、価格設定はリクエストの数ではなく、リクエストの実行にかかるコストをより反映したものに変更されました。つまり、これがここでの最初の終わりの始まりでした。

コンピュートのピーク時制限とサブスクリプションの限界

次の本当に大きな出来事は、Anthropicが推論を使用できる時間を変更し始めたときです。これは推論が増えるように見えるので当てはまらないように思えるかもしれませんが、Anthropicが今年の3月にこれを行ったとき、これは本当に大きな変更だったので聞いてください。

Claudeを使用している皆様へささやかな感謝の気持ちを込めて。今後2週間、ピーク時以外の利用枠を2倍にします。

これは、時間帯に基づいてどのように価格を設定するかを把握するためにAnthropicが実行した最初の実験でした。彼らが利用できるGPUの数には限りがあり、リクエストを実行できるコンピュートの量も限られています。したがって、平日の昼間に大量の利用を引き出そうとするユーザーがたくさんいる場合、24時間365日実行している人々にとって、その時間帯は事実上コストが高くなることを意味します。なぜなら、100基のGPUがあり、平日の昼間に95基が使用されている場合、残りの5基は、50基が利用可能なオフピーク時とは全く異なる見られ方をするからです。

そのため、Anthropicは、平日の昼間にコンピュートを利用できるようにしたいので、パワーユーザーをオフピーク時に誘導しようとしていました。これは彼らが望んでいたほどうまくいきませんでした。わずか1週間半後、AnthropicはClaudeの増大する需要を管理するために、ピーク時の無料、プロ、マックスプランの5時間セッション制限を調整すると公式に発表しました。週間の制限は変更されません。つまり、太平洋時間の午前5時から午前11時、またはグリニッジ標準時の午前1時から午前7時の間は、以前よりも早く5時間のセッション制限を消費することになります。

これが私が強調したかった重要な部分です。以前のものは、彼らが私たちにオフピーク時をもっと使うように促せるかどうかを確認するものでした。それでは十分ではありませんでした。そのため、彼らは逆のことを行い、特定の時間帯に得られる使用量を減らさなければなりませんでした。

一瞬Cursorの話に戻りますが、繰り返しになりますが、Cursorは他のラボと同じように補助金を出すことができません。彼らはこのほぼ無限の量のコンピュートとGPUを所有していません。Cursorは、私たちと同じようにAnthropicとOpenAIの顧客です。そのため、彼らはこれらのことにはるかに敏感です。だからこそ、彼らは早く補助金を打ち切らなければなりませんでした。そして、これが他のプラットフォームで1ドルあたりどれくらいのコンピュートが得られるかを把握するための内部監査を数多く行っている理由でもあります。

そのため、彼らは内部で、200ドルのClaude Codeサブスクリプションからどれくらい引き出せるかを測定しています。以前は最大2,000ドル相当のコンピュートを行うことができました。現在、彼らは、Anthropicが非常に積極的に補助金を出しているため、その月額200ドルのプランで最大5,000ドル相当の推論を得ることができるという、さらに狂った数字を目の当たりにしています。

Primeは、Claude Codeを20ドルのプランから外そうとした最近のドラマから始めたので、もう少し歴史的な背景を提供したかったのです。私はそれを、人々を100ドルのプランに引き上げようとしているというよりは、Anthropicがこれらすべての低ティアのユーザーにClaude Codeの使用をやめさせようとしていると見ています。彼らの目標は、ここで単に利益を増やすことではなく、コンピュートを取り戻すことです。

そして、Anthropicのエンタープライズ分野での成長は尋常ではなく、そこで収益の大半を上げているので、その点を本当に強調したいです。彼らは、人々が20ドルのプランから100ドルのプランに移行することについてはそれほど気にしていません。彼らがより具体的に気にしているのは、他のすべてのエンタープライズの顧客のために利用できるように、コンピュートを確保できるかどうかということです。Anthropicが気にしているのはエンタープライズの収益なので、その点に確実にお答えしたいと思います。

サブスクリプションの収益はほとんどただのマーケティングであり、彼らがこのような異常な補助金を出している理由は、お金を取り戻せると考えているからでも、単に圧倒して勝とうとしているからでもありません。それは主にマーケティングの戦略です。問題は、彼らがGPUを所有している事実上のマーケティングとコンピュートを交換していることです。これらの価格で提供することで、彼らの見栄えが良くなり、より頻繁に見られるようになります。しかし、今はコンピュートが不足しているため、それをうまくやり過ごすのは難しくなっています。しかし、これは単に収益を急増させることよりも、コンピュートに大きく関わっています。

モデルの電気代とコンピュートの実際のコスト

次の中心的なポイント、つまり推論を行っている企業のユーザーおよびビジネスとして実際にどのようにコストが機能するかという点に進みたいので、少し飛ばします。

まあ、彼らは推論で儲けているんだよ。リクエストコールをするたびに、もちろんお金を稼いでいる。それはさ、靴を売るために従業員に支払う金額だけで靴のコストを計算したら、ああ、すべての靴から利益を得ているな、と言うようなものだよ。彼らはすべてのリクエストからお金を稼いでいる。ああ、それは理にかなっているけど、実際には本当のコストを考慮していないんだ。いいか、Opus 45を使っていた人たちは、今はOpus 46を使っている。誰もOpus 47なんて使っていない。ちょっと派手になったモデルだ。いや、誰もあんなの好きじゃない。でも、それはつまり、45に費やされたすべてのコストは、もし彼らが推論コストでそれを回収できなかったら、45はただ彼らのコストになったということだ。そして、これは明らかに起こっていることだ。

OpenAIについては後で話します。Anthropicの例について話したいのですが、大部分において彼は正しいからです。あなたがAPIコストで15ドルを費やし、Anthropicにとっての電気代が1.50ドルだったというような単純な数字でコストを見ているとします。彼らはそれで利益を得ましたが、それが崩れるレイヤーがいくつかあります。

1つ目はサブスクリプションモデルで、一部のユーザーは200ドルで5,000ドル相当の推論を使用しています。それはかなり厳しい補助金であり、電気代だけで考えても彼らはおそらく損をしています。GPUのコストも、トレーニングのコストも、従業員のコストも、その他のいかなる費用も計算に入れず、電気代だけを計算してもです。彼らが行っている極端な補助金のせいで、純粋に電気代だけでAnthropicに損害を与えているユーザーがいます。

APIリクエストに対するコンピュートのコストの見積もりは、15%から20%と低くなっています。したがって、AnthropicまたはOpenAIが負担する生コストは、おそらくあなたがAPIリクエストに費やす金額の15%から20%です。しかし繰り返しになりますが、20倍以上の補助金を出している場合、それは帳消しになり、これらの企業はあなたにそのレベルの補助金を提供するために事実上お金を使っていることになります。

そして、コストと電気代のこれらの数字が狂っているように聞こえるなら、私は5090を使ってサイドでいくつかの楽しいトレーニングタスクを行っています。そして、それだけで私の電気代は約1,000ドル上がりました。私の電気代は、エアコン、コンピューター、その他すべてを含めて、ここサンフランシスコでは月に約1,800ドルです。異常です。電気代は高く、他の場所ではもっと安いですが、それでも半額くらいでしょう。アメリカで最も安いような場所でさえ、ハイエンドGPUをフルパワーの数千ワットで24時間365日稼働させれば、月に500ドル以上の電気代になります。それがどれほど高くなるか、本当に狂っています。

プレトレーニングとポストトレーニングの経済学

ですので、ここで掘り下げたい他の部分があります。具体的には、モデルに費やした金額を稼がなければならないという、長期的な価格の償却についてです。ここで話したいことが2つあります。プレトレーニングとポストトレーニングに分けたいと思います。なぜなら、Primeがここで言及しているのは、大部分がプレトレーニング部分に当てはまるからです。ダリオ・アモデイがこれについて話している本当に素晴らしいインタビューがあります。

現在のモデルビジネスで起こっていることを説明するには、2つの異なる方法があるようなものです。つまり、2023年に1億ドルかけてモデルをトレーニングし、それを2024年にデプロイして、それが2億ドルの収益を生み出したとしましょう。一方で、スケーリング則により、2024年には10億ドルかかるモデルもトレーニングし、2025年にはそこから20億ドルの収益を得て、さらにモデルのトレーニングに100億ドルを費やしたとします。

ですから、企業の損益を従来の方法で見ると、初年度は1億ドルの損失、2年目は8億ドルの損失、3年目は80億ドルの損失ということになります。つまり、どんどん悪化しているように見えます。各モデルを一つの企業だと考えると、2023年にトレーニングされたモデルは収益性が高かったわけです。1億ドルを支払い、その後2億ドルの収益を生み出しました。モデルを使った推論にはいくらかのコストがかかります。しかし、この漫画のような極端な例では、その2つを足しても、良い状態にあると仮定しましょう。すべてのモデルが一つの企業だとすれば、この例のモデルは実際には収益性が高いということです。

つまり、これがPrimeがそこで話していたことの大まかな内容です。各モデルのコストと、どれだけのお金を稼ぐかを見れば、利益が出ていることになります。通常、仮にSonnet 35のコストが1億ドルで、収益で2億ドルを取り戻したとすれば、そのモデルは利益を生みました。次のモデルをトレーニングするために4億ドルを費やしたとしても、企業は損失を出したかもしれませんが、モデル自体は、入ってくるお金と出ていくお金で採算が取れていました。しかし、彼らは新しいモデルを作るコストをスケールアップし続けなければならず、それは収益もそれに伴ってスケールアップする場合にのみ機能します。

Primeが言ったことで私が同意できない点、つまりこのモデルに正確に当てはまらない点があります。それは、Opus 47や、ある程度はOpus 46も、Opus 45ほどの大きな飛躍ではなかったため損失を出しており、人々が使っているのは45と、ある程度は46だという主張です。より早く置き換えられ、より早く次のモデルに移行したり、それほど採用されなかったりするこれらのモデルのリリースで彼らが損失を出している可能性はあります。しかし、そうではありません。そうではない理由は、行われるトレーニングの種類が異なるからです。

皆さんもすでにお気づきかと思いますが、新しいモデルのリリースが、前のものと同じように感じられるのに、少し賢く、少し速く、特定の領域で少しだけ能力が高くなっているように感じられることがあります。そしてまたある時は、まったく違うものに感じられます。例えば、GPD 52から53 codeexへの移行は、ああ、もっとよく話しかけてくるけど、賢さはだいたい同じだな、という感じでした。そして53 codeexから54へは、ああ、少しやりすぎ感はあるけど似ているな、という感じでした。

55は、おそらく別の名前を付けるべきだったと思えるほど、まったく異なるように感じます。GPTラインとは別のものか、正直言ってGPT6にするべきでした。なぜなら、モデルが根本的に非常に異なっているからです。それが非常に異なっている理由は、プレトレーニングによるものです。

モデルのトレーニングには主に2つの種類があります。プレトレーニングとポストトレーニングです。プレトレーニングとは、すべての情報、収集したすべてのデータを取り込み、それをモデルであるこのパラメーターの山に焼き付ける方法です。そして、それに特定の方法で振る舞ってもらいたいと考えます。つまり、プレトレーニングは知識を効果的に入力する方法であり、ポストトレーニングはその中から振る舞いを引き出す方法です。

これはここでのすべての内容を非常に大まかに簡略化したものです。興味があるなら、もっと詳しく調べることを強くお勧めします。本当に素晴らしい内容です。私がここでお伝えしたいのは、プレトレーニングは数千億ドル、あるいは数十億ドル規模のコンピュートコストがかかる大規模で高価なものであり、数テラバイトのデータを圧縮して、LLMとしてプログラム的にテキストを生成できる特定の形にしようとするものだということです。

ポストトレーニングは、その振る舞いをどのように洗練させるかというものです。そして、ポストトレーニングは人々が予想していたよりもはるかに価値があることがわかりました。特に、強化学習の戦略であるRLVRやRHFです。これらは、長いツールコールの実行、長いエージェントの実行、コードの作成、そしてそういった種類のすべてのタスクをモデルにうまくやらせるのに非常に優れていることがわかりました。強化学習によってモデルをそういった面でずっと良くすることができます。

なぜそれがわかるかというと、CursorのComposer 2のようなモデルは、実際には新しいモデルではないからです。それらはKimmy K25のような古いモデルのファインチューニング版です。中国のMoonshotのKimmy K25はオープンウェイトモデルです。そして、ウェイトが公開されているため、自分で強化学習を行ったり、外部でファインチューニングしたりすることができます。

これはモデルのウェイトが公開されていれば誰でもできるというようなことではありません。また、一般的に言って、プレトレーニングよりもはるかに費用がかからないことがよくあります。したがって、Opus 45はほぼ間違いなく新しいプレトレーニングでした。それはOpusの仕組みと振る舞いにおける根本的な変化でした。だからこそ、以前のOpusモデルよりも3倍安くなったのです。おそらく以前よりも小さく作られ、結果として彼らが予想していたよりもはるかに賢くなったからです。

そして、おそらくその時点から、Opus 46や47はコストの低いポストトレーニングだったのでしょう。これは通常、リリースサイクルのペースを見るだけでわかります。しかし、これにも例外はあります。チャットにいる私の研究仲間の何人かが指摘しているように、Grok 4はプレトレーニングよりも強化学習のコンピュートにより多くの時間を費やしました。CursorのComposer 2のようなものでさえ、Kimmyが最初にプレトレーニングに費やしたコンピュートの4倍以上をポストトレーニングに費やしたと言われています。

つまりここには例外がありますが、一般的に言って、特に大規模なラボでは、一度新しいプレトレーニングを行うと、将来のイテレーションはそれほど高価にはなりません。彼らは内部で5つか6つのバージョンを持っていることが多く、その中で最も気に入ったものを選んでリリースします。一度プレトレーニングが完了すれば、モデルに対する個々のアップデートは、以前の新しいモデルのような数十億ドルの投資にはなりません。

ですから、55にはおそらく数億ドル、あるいは数十億ドルかかっているでしょう。それに比べれば、56はおそらくそれほど大きなコストにはならないでしょう。Opus 45はおそらく10億ドル近いコストがかかりました。Opus 46はおそらくはるかに少ないでしょう。理解しておくことが重要なので、その点を明確にしておきたかっただけです。

MicrosoftとGitHub Copilotの制限の真実

ここでPrimeがOpenAIについて何と言っているか見てみましょう。

OpenAIは1,220億ドルか1,200億ドルの投資を受けており、それは18〜24ヶ月運営するのに十分なお金だ。それは、今後18〜24ヶ月間、毎月50億から70億ドルの赤字を出し続けるようなものだ。彼らはどれくらいのお金を稼げるかを知る必要があるので、このテストを行わなければならなかった。なぜなら、何らかの変更を行わなければ、彼らは何十億ドルも失い続けるからだ。

さて、もしこれが単独で起こったことなら、私は、おい、Claudeはもっとお金を稼ぐ必要があるだけだ。彼らはOpenAIと競合しているから、もっと競争力を持たなきゃいけないんだ、と言うだろう。そして、ああ、そういうことか、と思うだろう。しかし、このようなことが起こっているのはこれだけではない。ほんの数日前、他に誰が少し価格を変更しようと決めたと思う?Microsoftだ。ああ、美しいMicrosoft。私はサティアを愛している。Copilotを愛している。Copilotって最高じゃないか?これが最高だろ?

私がCopilotと言うと、彼らの50あるサービスの一つを思い浮かべるかもしれないから、君たちはおそらく混乱しているだろう。私が話しているのはGitHub、この場合はGitHub Copilotのことだ。ほら、GitHub Copilotは、以前はいくらかの金額を支払うと、代行してアクションを実行できた。実行できるアクションの量が決まっていた。さて、それの何が問題なんだ?すべてのモデルが同じコストではないということだ。

これに関する問題はそこではありません。確かに、異なるモデルには異なるコストがかかりますが、特定のモデルでは1メッセージあたり2倍または3倍のメッセージを消費するように設定できます。問題は、そしてこれこそが実際に私に反応動画を作るきっかけを与えたポイントなのですが、一部のモデルが高価で一部が安価であるということではありません。メッセージの数で価格設定すること自体がまったく理にかなっていないということです。

ウォルマートが、カートに入っている商品の量で価格設定したと想像してみてください。あるいは、何人入店したかで価格設定をして、入店時に料金を請求し、好きなものを持っていって帰るようなシステムだったらどうでしょう。ある人は入ってキャンディーを2つ持っていきます。ある人は入ってテレビを5台持ち去ります。商品数で価格設定しているなら、それは機能しません。そして最悪な部分は、Copilotがすでにこれを行っているということです。

Copilotにアクセスして別のモデルを選ぶと、異なるモデルの乗数レートが表示されます。たとえば、ここでは54は1倍ですが、55は7.5倍です。それが使用するメッセージの数です。ですから、私がCopilotで利用している40ドルのプランでは、オープンソースのおかげで無料になっているのだと思います。ですので、GitHubには感謝しています。月に1,500件のメッセージが提供されます。

問題は、一部のメッセージは応答に数ペニーしかかからないということです。それがOpusであれ54であれ何であれ、関係ありません。重要なのは、それが何をしているのか、そしてどれくらい時間がかかるかということです。そして先ほど、私がこのリクエストを実行していると言ったのを思い出してください。このリクエストは2時間に近づいています。私が1つのメッセージを送信して、それが2時間実行され続けています。この1つのメッセージだけで、100ドル以上のコンピュートを使用することになります。

これは意味がわかりません。誰かのカートに入っている商品の数に基づいて請求することはできません。商品の値段に基づいて請求するべきです。Copilotの問題と、彼らが今この変更を行っている理由は、補助金が終わったからではありません。それは単にMicrosoftの動きが遅い会社であり、これを修正するのに時間がかかったからです。ここで重要なのはそれだけです。

そして7.5倍という部分は、私が主張したいポイントを実際に強調しています。それは、これらの数字とこれらのコストは、APIの価格やラボが請求している金額に基づいていないということです。これらの価格は、このモデルを実行するためにどれだけのコンピュートが利用可能か、そしてそのコンピュートを補助金を受けているCopilotユーザーに提供することが彼らにとってどれほどコストがかかるかに基づいています。

歴史的に、Copilotのユーザーは十分に軽いユーザーだったので、彼らは単にコストを負担することができました。もし月額40ドルのユーザーの一部が800ドルのコストをかけたとしても、まあいいか、ここはMicrosoftだから、となるわけです。彼らは儲かっていますから。彼らにはその余裕があります。

資金不足ではなくコンピュート不足

問題は、現在そのようなユーザーが十分にいるということです。そして彼らが費やしているのはお金だけではありません。彼らが失っているのはコンピュートです。そして彼らはコンピュートの制約を受けています。彼らは、彼らが行っている他のすべての企業の他のすべての取引のために、Azure上で可能な限り多くのコンピュートを確保しようと戦っています。彼らはそのコンピュートを必要としているのです。

あなたがCopilotを使うときに彼らに過剰なコストをかけているというだけではありません。彼らは、Copilotが使用しているGPUを利用可能にする必要があるのです。彼らの発表のより重要な点は、価格を変更したことではありません。より重要なのは、彼らが新規登録を完全に一時停止したことです。もっとお金を稼ぎたいからといって、新規登録を一時停止することはありません。容量がないから新規登録を一時停止するのです。

そして、これが私が徹底的に伝えたい本当に大きなポイントです。問題は、使うお金が十分にないことではありません。問題は、彼らがこれら20ドルのプランのユーザーに過剰に支出していて、あなたにもっとお金を使わせたいということではありません。これは、世間で言われているような従来の右肩上がりの問題ではありません。

これは、これらの企業がユーザーであるあなたから一銭でも多く搾り取ろうとしているわけではないのです。彼らはあなたのことなど気にしていません。彼らが気にしているのは、実際に利益をもたらしてくれるエンタープライズの顧客だけです。そして、彼らのサーバーファームには、それらの顧客に対応し、彼らに実際の利益をもたらすものを販売するのに十分なNvidiaのグラフィックカードがありません。

GitHubとMicrosoftが新規登録を一時停止しなければならなかったことがどれほど異常なことか理解できますか?それは収益の回収ではありません。それはもっとお金を稼ごうとする必死の試みではありません。それはエンタープライズの顧客を失うのを止めるためにコンピュートを確保しようとしているのです。それがここでの本当の話であり、それを確実に強調しておきたいのです。

君はCursorのComposer 2について考えるのが早すぎる。あんなのコストなんてほとんどかかっていない。Opus 47について考えるとき、それにははるかに多くのコストがかかる。コストは20倍以上になるという話だ。だから当然、Copilotは何らかの削減をしなければならず、それが彼らが行ったことだ。もはや一定量の実行回数を得られるわけではないんだ。

この部分を飛ばすのは心苦しいですが、これは完全に間違っています。もう一度言いますが、ここでPrimeが主張しようとしている核心的なポイントは正しいです。彼は単に、これらの詳細を知るほど深く関わっていないだけです。そして、利用ベースの変更は、彼らがお金を回収しようとしているからではありません。

月額200ドル、あるいは月額40ドル、あるいは月額20ドルのユーザーがコンピュートを使いすぎて、エンタープライズの顧客向けに利用できるコンピュートがなくなってしまわないように確実にしようとしているのです。チャットにいる私の研究仲間が指摘しているように、容量は大きな問題になるでしょう。私はとても恐れています。チップの製造が追いついていないのです。それがここでの問題です。

次のセクションでは、PrimeがMicrosoftをこの分野の他の企業と比較し始めますが、彼は非常に興味深く、また非常に異なる企業を1つ取り上げています。

いいかい、MicrosoftとAnthropicの違いは、Microsoftはお金を稼いでいるということだ。Anthropicにとっては狂った概念だとはわかっているが、Microsoftはたくさんのお金を稼いでいる。好むと好まざるとにかかわらず、彼らは世界最大の企業の1つだ。だから、ユーザーを集めるために、しばらくの間は少し急降下するようなことも実際にできるんだ。しかしこの時点でさえ、彼らはおい、これ以上は無理だ。もっと稼がないと。これは馬鹿げている、と言っているんだ。

これは先ほどと同じ間違いです。また、これは以前のAnthropicの変更に対する誤解でもあると主張したいです。彼らは人々を上位プランに押し上げるために、月額20ドルのプランでのClaude Codeの潜在的な利用可能性を変更したのではありません。彼らが行ったのは、月額20ドルのプランで得られるClaude Codeの量を大幅に制限することで、アップグレードする動機を与えるということでした。

彼らはそのようなサブスクリプションを気にしていません。彼らが求めているのは、より多くのエンタープライズ顧客だけです。それがこの変更の見方であるべきです。月額20ドルのClaudeプランでのClaude Codeの削除は、彼らが価格を引き上げているわけではありません。それは、毎日ますます多くのユーザーが登録するにつれて浪費されているコンピュートの奔流を遅らせようとしているのです。

Copilotの一時停止とまったく同じことです。これらを同じように考えてください。Claude Codeの月額20ドルの変更と、Copilotの新規登録の一時停止は同じことです。これは、Microsoftが資金を燃やしすぎて、それを取り戻して今もっと稼ごうとしているからではありません。どちらも同じ問題を抱えているからです。

MicrosoftもAnthropicもNvidiaではないため、どちらもコンピュートが不足しているのです。彼らは無制限のコンピュートにアクセスすることはできません。実はNvidiaでさえそうです。彼らはそれを製造できるだけであり、実際にシリコンを製造するために依存している企業によって制限されています。

現在、世界には十分なコンピュートがありません。それが問題なのです。私たちは限られた資源で作業しており、その限られた資源はお金ではありません。そして、もし私たちが利用可能なコンピュートの量ではなく、お金の問題にしようとし続ければ、事実とは異なる陰謀論の道を歩み始めることになります。これらの行動は確かに何かの終わりを表していますが、これは補助金経済の終わりではありません。これは、コンピュートの制限が企業の考え方に実際に影響を与え始める始まりなのです。それがここでの重要な違いです。

ちょうどKicがサム・アルトマンからの2年前のこのツイートへのリンクを送ってくれました。実際にはもうすぐ3年になります。

ChatGPT Plusの新規登録を少しの間一時停止します。開発者会議後の利用の急増が私たちの容量を超えており、すべての人に素晴らしい体験を提供できるようにしたいと考えています。サブスクリプションが再開されたときにアプリ内で通知を受け取るために登録することは引き続き可能です。

繰り返しになりますが、OpenAIはコンピュートが制限されていたため、文字通り可能な限りのコンピュートを購入しました。それは去年から今年にかけて入ってき始めており、今では彼らにこのような問題はありません。それは彼らが他の企業よりも多くのお金を持っているからでも、他の企業よりも積極的に補助金を出そうとしているからでもありません。彼らはただ、より多くのコンピュートを持っているというだけです。

結局のところ、すべてはコンピュートに行き着くのです。これらすべて、Opus 47がより愚かになったことさえ、間違いなくコンピュートのせいだと言えます。

Googleの無料コンピュートとサブスクリプションの現実

ここで何が起きているんだ?Microsoftによれば、これすら意味をなさない。さて、これらすべてから正直に言って真の勝者はGoogleだ。典型的なGoogleだ。彼らは年間1000億ドル以上をAIに注ぎ込んでいるし、彼らにはそれができる。そしてどうだと思う?彼らが1000億ドル、2000億ドルをAIに注ぎ込んだ後でも、彼らはまだ利益を出しているんだ。

それはとんでもないことだ。彼らは毎年毎年、そんなにも多くのお金を使うことができるし、投資家がまだ自分たちを魅力的に思ってくれるだろうかと思い悩む必要もないんだ。おそらくそれが、これらの企業から得られるような同レベルの誇大宣伝がGoogleから出てこない理由だろうね。

私は、この部分全体が完全に間違っていると思います。Googleにとってはそういう仕組みではありません。Googleは現在、他の誰よりもはるかに多くの無料コンピュートを提供しています。圧倒的にです。例を挙げましょう。GoogleでPrimagenを検索すると、彼のリンクが表示されます。しかし、Primagenとは誰かと尋ねるとどうなるか見てください。ここでAIによる概要が表示されます。これは無料のコンピュートです。サインアウトしたアカウントでこれを実行するとどうなるか見てください。おお、それでも実行されました。それでも実行されました。

これらのAIによる概要は無料のコンピュートです。彼はどのようにして人気が出たのでしょうか?今、私はgoogle.comで文字通り無料のコンピュートを実行しています。サインアウトしたシークレットブラウザでこれを無料で実行しています。ああ、キャッシュされてるんじゃないの?なぜフォローアップできるの?と言う人たちがいますが、これはGoogleの一部として組み込まれた完全なチャットインターフェースです。彼らはとてつもない量の無料コンピュートを実行しています。

そして、多くの人から、補助金が非常に積極的であったためにAnti-gravityを使用していると聞いています。実際のところ、Googleのモデルはあまりにもひどいため、Anti-gravityで使用できるGoogleサブスクリプションの中にOpus 45を含めていました。そして、その中の補助金付きのOpusを使用するためだけにAnti-gravityを使用している人を何人も知っていました。

そしてそれが最終的に非常に爆発的に拡大したため、Googleは推論を使用できる場所に制限をかけ始めた最初の企業となりました。Anti-gravityの使用状況を追跡するためのプラグインを作成しているだけの人々でさえ、BANされ始めたのです。Anti-gravityをオープンコードなどとリンクさせるためのプラグインを作成していた人々も全員BANされ始めました。

彼らは最初気前が良すぎたため、その後撤回せざるを得なくなり、それに対して積極的になっています。あなたがGoogleが補助金を出していると思わない理由は、彼らが最初はあまりにも積極的にそれを行ったために、まず取り戻さなければならなかったからです。そして、Googleのモデルはあまりにもひどいので誰もそれについて話しません。したがって、これは開発者コミュニティの多くの人々にとって完全な死角のようなものです。

Googleは他の誰よりも多くの無料コンピュートを実行しています。彼らは他の誰よりも手厚く補助金を出していました。彼らは他の誰よりも早く、他の誰よりも積極的に回収しなければなりませんでした。Googleはおそらくこれらすべての中で最も極端な例であり、彼らはTPUを製造しているため自前でコンピュートを作っていますが、その点においては非常に遅れをとっており、周りにあるという理由だけでトレーニングと推論の両方にCPUを使用しているという噂があるほどです。

Googleは他の企業と同じくらい、あるいはそれ以上にコンピュートの制約を受けており、それに応じて行動してきました。このようなことが起こっていることに気付くには多くの注意を払う必要があるため、この詳細に精通していないことについて誰も責めるつもりはありませんが、これは単なる大きな見落としです。Googleは、私がここで話していることのこれ以上ない良い例です。

企業向け利用と個人向けサブスクリプションの違い

補助金付きのコンピュート時代は終わってはいませんが、利用可能なコンピュートの量がどんどん少なくなっているため、終わりを迎えつつあります。本当のところは、あなたのサブスクリプションが制限されているとか、月額20ドルのティアがより制限されているということではありません。本当のところは、RAMの価格が上がったということです。それこそが、これらが本当に焦点を当てるべきことです。ここでのコストの問題は、20ドルで何が得られるかに関連するものではありません。それは、コンピュートがどれほど高価になったかに関連するものです。ちょっと考えてみてください。

Googleも最前線で競争している。Googleも市場で勝とうと試みている。Googleも、自分たちのAIが最高のAIであり、それを導き、未来へと持っていくことができるとみんなに納得させようとしている。TransformerやGPTを発明したにもかかわらず、どういうわけかヘマをして市場に最初に投入できなかったという事実があるのにな。その答えは誰も知らない。そしてAIは本当に高価だ。

Uberは、わずか4ヶ月で1年分のAI予算を使い果たしたと主張したばかりだ。おいおい、こんなことが起こるなんて信じられないよ。どうして全従業員にAIを最大限に使用するように言えたんだ?ところで、私たちはAIの使用量であなたたちを評価しているぞ。なんてことだ、君たちはAIを使いすぎている。どうしてこうなった?一体何なんだ?4ヶ月で1年分の予算を使うなんてあり得ないだろ。一体何をしているんだ?みんないったいあのトークンで何をしているんだ?

そしてここで、私がずっと主張してきたポイントが登場します。UberはClaude Codeで月額200ドルのサブスクリプションを使用していません。月額20ドルのものを使用していないことは確かです。UberはAPIを通じて推論を使用しています。そのため、彼らはAnthropicとOpenAIに直接支払っています。ここで話されているのはAPIのコストです。彼らは正規の料金を支払っています。

これらのツールに対する私の使い方は個人向けのサブスクリプションを使用するもので、はるかに気前が良いです。私はおそらく、Uberの平均的な従業員と同じくらいの量の推論を行っています。違いは、私はそれに月に200ドル支払い、彼らは2,000ドル支払うということです。これがここでの重要な部分です。他の企業からも、多くのさまざまな場所の内部関係者から、近い将来共有できることを期待しているとんでもない数字を聞いています。

エンジニアが給与として支払われる以上の額をコンピュートに費やし、推論に費やしている企業を知っています。なぜなら、企業は異なる条件の下で契約しなければならないからです。これらのサブスクリプションの多くは、私たちがエンタープライズ契約を交渉すべきときにこれらを使用することはできないと明示的に述べているためです。

ところで、先ほど送信したあの1つのメッセージはまだ実行中です。このメッセージが実行されてからもう2時間以上経ちます。そして、なぜエンタープライズの仕事でサブスクリプションを使用できないのか疑問に思っているなら、私は単刀直入に尋ねました。はい、どうぞ。

消費者向け規約は、意図的に商用提供を除外しています。規約は、商用規約がAPIキーを管理することを明確にする通知から始まります。コンソールやそれらを参照するその他の提供物は、個人向けのClaudeやClaude Proが含まれていないことを明示的にカバーしています。Claude Code独自の法的コンプライアンスページでも、この分割が確認されています。商用規約はチームに適用されます。消費者向け規約は無料版に適用されます。これは一般的な個人の使用を想定しています。

Claude Codeの法的ページには、ProプランおよびMaxプランの宣伝されている利用制限は、代理店におけるClaude Codeの一般的な個人の使用を想定していると記載されています。これは、何が正当な使用と見なされるかに対するソフトキャップです。また、ビジネスドメインと非商用評価に関するセクション全体もあります。雇用主が所有する電子メールで登録します。あなたのアカウントはあなたの組織のエンタープライズなどなどにリンクされる可能性があります。

Anthropicが限定的な評価を許可する場合。評価目的での使用は、個人的な非商用利用のみに制限されます。彼らはまた、競合製品を作るためにそれを使用することを防いでいますが、現時点では基本的に誰もが、そう、誰もがそれを行っています。

そして最も重大な問題は、サブスクリプションの階層にいる場合、オプトアウトした後でもあなたのデータがトレーニングに使用される可能性があるということです。フラグが立てられたコンテンツとフィードバックは引き続き使用される可能性があります。ゼロデータ保持はありません。データの適切な分離はありません。そして、ほとんどの企業は絶対にそれを許さないでしょう。

ビジネス提携契約は、顧客が契約を締結し、ゼロデータ保持を有効にしている場合にのみClaude Codeに拡張されます。どちらもエンタープライズ契約が必要です。MaxプランはHIPAAでカバーされません。彼らはあなたをエンタープライズプランにしたいのです。もしエンタープライズの仕事をしているなら、ここでは現実的になりましょう。

ですから繰り返しになりますが、エンタープライズにいる場合、月に200ドルを支払っているわけではありません。あなたはトークンに対して支払っており、トークンははるかに高価です。多くの人が理解していないので、それを確実に理解しておいてほしいのです。

モデルの進化とコストパフォーマンスの向上

どうだろうな。俺は、さあみんな、引き上げだ。もうAIは使わない。AIは経済的に成り立たないから、君たちはすべて手作業でのコーディングに戻らなければならない、というようなことにはならないと思う。いや、いや、いや、絶対にならない。彼らは何らかの方法を見つけるだろう。確かに、数年先になるかもしれないが、あのね。彼らはこれを実現可能なものにする方法を見つけるだろうが、今のところ、私たちはひび割れを見始めている。かつてのように自由にはいかず、あなたが得られる使用量は明らかに、そして明確に減少しているんだ。

私は、ああ、何が何でもアンチAIだ、というような人物にはなりたくない。だからこそ、彼らのマーケティングがどれほど馬鹿げているかを示すためにこの動画を作っているんだ。これが彼らがこのような誇大広告のマーケティングを行う理由だ。だからダリオはいつも言っているんだ、おい、君はもうすぐ、もうすぐ仕事を失うぞ。そう、私たちが君の仕事を奪うんだ、と。

彼にはとても申し訳なく思います。ああ、私が少し話したいのは、彼が先ほど言った、私たちが得られるコンピュートの量が減っているというポイントについてです。私は本当にそうは思いません。純粋に金額で測るなら、そうでしょう。最高峰のフロンティアモデルへのトークン数で測るならそうかもしれませんが、知能のコストは一貫して下がり続けています。

これの良い例が、Artificial Analysisのインテリジェンスインデックスです。GBT55は以前よりも高価なモデルです。彼らはトークンコストを2倍にしましたが、同時により効率的にもしました。そして、最高峰モデルの最高クラスであるX Highバージョンを見ると、55は54よりも賢いです。55は60点を獲得し、54は57点でした。より賢くなっています。これがはるかに面白くなるのは、5.5 mediumをオンにしたときです。5.5 mediumをグラフに表示すると、5.5 mediumが5.4x highとほぼ同等のパフォーマンスを示したことに気付くでしょう。同じスコアです。

しかし、はるかに興味深いのは実際の実行コストです。これはトークンあたりのコストではありません。人々はそれらの数字に夢中になりすぎます。再びスーパーマーケットの例を挙げると、誰かがブドウを買っていて請求したい場合、ブドウの数で請求することも、ブドウの重さで請求することもできます。そして、トークン数を見るとき、私たちは事実上ブドウ1粒あたりのコストを見ているわけですが、実際のコストは、トークンあたりどれほど高価かということだけではありません。あなたの問題を解決するためにいくつのトークンが必要だったかということです。

そして、それはここで非常に興味深い情報を示しています。GPT 54と55x highのことです。覚えておいてください、55はトークンあたり2倍高価であるにもかかわらず、使用したトークン数が十分に少なかったため、全く同じデータのドロップ、実行、その他すべてに対して、2,850ドルから3,350ドルへと、わずか20%ほどコストが上がっただけでした。そして、トークンあたりGPT55よりも安いSonnetは、はるかに多くのトークンを使用したため、結果的により高価になりました。そして当然ながら、Opusは5,300ドルで基本的に倍の価格です。

しかし、ここからが素晴らしいところであり、コストが大幅に上昇することを心配する必要がない部分です。もしあなたが54の賢さに満足していたなら、楽しみにしていてください。なぜなら55 mediumは同じくらい賢く、コストは半分以下だからです。54x highのコストが2,800ドルであるのに対し、55 mediumのコストは1,200ドルです。これがここでワクワクする部分です。

私たちがより多くのコンピュートを注ぎ込んでいるため、最前線は引き続き高価になり続けていますが、特定の知能レベルにおいて、価格は急速に下落しています。54は数ヶ月前、いや2ヶ月も前ではありませんが、そのくらいに登場しました。そして、1ヶ月半ほど後に登場した55は、そのレベルの知能を取り入れ、価格を半分にし、その後、20%増しの金額でより高い知能を提供しました。そして、もしもう少しレベルを下げてもよくて、正直言って私のデフォルトになりつつある55 lowを試してみたいなら、これを実行するのにわずか500ドルしかかかりません。

それは54の6分の1の価格です。そして知能レベルもそれほど離れていません。ええ、より愚かにはなっていますが、それでも51ポイントです。それは依然として、はるかに高価だったClaude Sonnet 46などと肩を並べるものです。そして繰り返しになりますが、トークンの数を比較すると、非常に面白いことになります。なぜなら、Sonnet 46 maxはこのベンチマークを実行するのに2億トークンを消費したからです。

Opusは1億1000万トークンでより効率的でしたが、それらのトークンは非常に高価です。54x highは1億2000万トークンを使用したので、Opusよりわずかに多いです。ここを見ると、55は7500万トークンまで減少しました。トークンの大幅な削減です。55 mediumはわずか2200万トークンで、55 lowは私たちが選択した中で最も少ない700万トークンを使用し、DeepSeek 4よりも高いスコアを出しました。このチャートの最も左と最も右にあるモデルは同じスコアを獲得しました。最も多くのトークンを使用したDeepSeek V4と、最も少ないトークンを使用した55 lowが同じスコアを獲得したのです。

それが素晴らしいところです。正しい場所に努力を注いでいるラボは、物事をより効率的にしています。これらをより安くするための努力が行われています。あなたはサブスクリプションがどれほど高いか、いくつのメッセージが得られるか、あるいはトークンがどれほど高価かを見ているため、これに気付かないかもしれませんが、実際の作業を完了するのにどれほどのコストがかかるかを見ると、Anthropicのモデルを使用していない限り、コストは急速に下がっています。

計算資源の制約と今後のAIエコノミー

ここにあるすべての数字がどれほど馬鹿げていてでたらめであるか、そしてあなたに提示される価格が電気代ではなく、コンピュートの利用可能性に基づいていることを強調しておきます。55はトークン単位では2倍高価であるにもかかわらず、特にmediumやlowで使用する場合は、1回の実行あたりのコストがはるかに安くなることが確認されました。結果として54よりもはるかに安くなります。

先ほどのお気に入りの例であるMicrosoftに戻りますが、最悪の場合は2倍高価であるものの、一般的には実際には54よりもかなり安い55が、なぜ54が1倍のときに1リクエストあたり7.5倍のメッセージになるのでしょうか?もしこれが実行コストに関するものであれば、これらの数字は文字通りまったく意味をなしません。これらの数字がこのように設定されており、Opusが15倍である理由は、実際には利用可能なプロビジョニングの量に行き着くからです。

54を実行しているGPUはいくつあるか?55を実行しているのはいくつあるか?それらの異なるクラスターにはどれくらいの需要があるか?それらのクラスターにはどれくらいの空きがあるか?Microsoftは現在、55の推論を企業やエンタープライズに販売しようとしているため、55を提供することはMicrosoftにとってより多くの機会費用がかかります。

これらの数字は、実際により多くのお金やより少ないお金を稼ぐことを意図したものではありません。これらは、月額40ドルを支払っている個人としてのあなたを、トークンあたりはるかに多くのお金を支払っているFortune 500企業の邪魔にならないようにするためのものです。ただそれだけのことです。そして、これをそれ以外の方法で考えているなら、あなたは陰謀論的なでたらめに騙されています。実際の仕組みはそういうものではありません。

ところで、2時間を大幅に超えましたが、この1つのリクエストはまだ実行中であり、私のCopilotの使用量は依然として0.4%です。ですから、GitHub Copilotが行っているこの変更を、彼らが邪悪で強欲なためだと思っているなら、あなたはこれらのコストがどのように機能しているかを単に理解していないだけです。理解していないのです。それはそれで構いませんが、自分が理解していないことについて文句を言うべきではありません。理解しに行きましょう。

私がこれを指摘したかったのは、それが周囲でよく見かける非常に一般的な誤解だからです。

私が君たちのすべてのお金を奪っていることに、本当に申し訳なく思っているよ。本当にごめんね。とても危険なことだ。でも、これが彼らがそれをやっている理由なんだ。資金を調達する必要があるからだ。これがGoogleがやらない理由だ。彼らはダリオやサムが調達しなければならないような資金を調達する必要がないからね。ああ。

繰り返しになりますが、これは間違っています。Googleは非常に手厚く補助金を出していました。GoogleとMicrosoftの問題は、彼らがより多くの資金を持っているためより長く補助金を出すことができたのに、Googleはそうしないことを選んだ、ということではありません。Microsoftはそうすることを選びました。エンタープライズにおいては、これらのことを行い、正しく行うにはより長い時間がかかるというだけです。

Microsoftは自分たちの評判に傷がつくことを望んでいません。そのため、彼らはCopilotの気前の良さを本来あるべきよりも長く延長しました。Googleは評判が何を意味するのかをあまり理解していないため、すでにひどい製品を基本的には使えなくするような変更をはるかに迅速に行いました。

ここでのもう一つの要素は、CopilotがVS Codeの一部であることがそれを堅牢にしているということです。一般的に言って、Copilotの開発者エコシステムは大丈夫です。私のお気に入りではありませんし、もっと好きな他のハーネスもありますが、CopilotのCLIは完全に問題ありません。Googleのソリューションについてはそうではありません。GoogleのCLIは優れていませんし、GoogleのIDEは全くのゴミです。そのため、Googleはそこで失うものはあまりありませんでした。

しかし、ここにはあまりにも多くのニュアンスがあるため、これらのすべてのニュアンスが見逃されてしまったように感じます。何が起こっているかを理解するためには、精通していなければならないことが非常にたくさんあります。そして繰り返しになりますが、これらのことを理解せず、これらのことを伝えなかったことについてPrimeを責めるつもりはありません。なぜなら彼の核心的なポイントは依然として有効だからです。

物事は変化しており、私たちは物事がある一つの方法で機能することに慣れてきています。それは変わってきています。しかし、多くの点においてそれらは良くなっているとも思います。月額100ドルを支払うだけで、エンドユーザーとして3つの完全なスタートアップを構築するのに十分なコンピュートを得られるという事実は信じられないほどです。これらのモデルがはるかに効率的かつ賢くなっているという事実は信じがたいことです。

モデルの能力の天井に達しつつあると言った私の以前の動画は、後から振り返ってみるとあまりにも馬鹿げていて、実際ちょっと笑えるくらいです。ですから、私はここで話しているどんなことよりも、はるかに馬鹿げた失敗をしたり、はるかに情報不足な動画や意見を出したりしたことがありますが、結果的に雑草の奥深くまで入り込み、これらのことをすべて学ぶことになりました。それが、私がこれを取り上げたかった理由です。

それでも、元の動画を見に行くべきだと思います。概要欄にリンクされています。これらすべての経済的側面が移行し、変化しているというここでのPrimeの分析には全体的に同意しますが、それはエンドユーザーとしてのあなたからどれだけのお金を搾り取れるかということよりも、彼らが利用できるコンピュートの量に関する問題であることがはるかに大きいと思います。

この件について私が言いたいことは以上です。この解説が役立つことを願っています。それでは次回まで、GPUを大切に。

コメント

タイトルとURLをコピーしました