AI モデル: 底値への競争

9,978 文字

AI models are in a race to the bottom. They're working as hard as they can to make them both as cheap and as powerful as...

トークンバッチ、これはGPT-3が登場してからの2年間で起きたことです。コストは100万トークンあたり60ドルからセントレベルまで急落しました。状況は激変しており、ここに至った経緯や業界への影響、そして長期的にAIがどのように「すべて」を変えていくのかについてお話ししたいと思います。このビデオはAIが生成したものではないので、私のチームに給料を払う必要があります。今日のスポンサーについて少しお話しした後、本題に戻りましょう。
今日のスポンサーについてとても興奮しています。なぜなら、長い間愛用してきた会社であり、私の大好きなものの一つであるElixirについて話す機会を与えてくれたからです。品質の高いものを迅速かつ大規模に提供しようとしているなら、docyardがあなたをサポートします。彼らは私が話したことのある中で最もスケールに関して詳しい人たちの一人です。特にElixirの世界のオープンソースエコシステムに多大な貢献をしており、ご存知かもしれませんが私はそれが大好きです。
技術がとても効率的にスケールする理由があり、DiscordからWhatsAppまでほとんどの企業がそれらのツールに大きく依存しています。彼らはスケールについて信じられないほど詳しく、彼らがAIの世界にも深く関わっているのを見られてとても嬉しいです。彼らは通常のAI開発者ではありません。私はその言葉に特定の意味合いがあることを知っています。私は彼らを、私が多くの時間を費やしてきたエコシステムで素晴らしい仕事をしているオープンソースのチャンピオンとして知っています。彼らは良い友人であり、彼らと一緒にいて悪い状況になるとは想像できません。
もちろん、私を信じる必要はありません。おそらく以前に聞いたことがあるNASDAQやAdobeなどの多くの企業がここにあります。これらの企業が助けを求めた同じエンジニアと仕事をしたいなら、彼らに勝るものはほとんどありません。良いフルスタック開発に必要なことをすべて知っています。もちろん彼らはElixirの専門家なので、サーバーサイドの複雑なことをすべて知っています。また、現代のテクノロジースタックについても熟知しています。彼らはReactにも驚くほど詳しいですが、Swift（iOS開発言語）にも深い知識があります。信じられないことに、iOS上でElixirアプリをネイティブにレンダリングするためにReact Nativeの代替品を自ら開発しました。
ゼロから始めようとしているか、既存の技術がスケールすることを確認しようとしているかにかかわらず、彼らはあなたをサポートします。詳細を知りたい場合は、ぜひ無料の電話相談を予約してください。彼らは非常に役立つ情報をたくさん提供してくれます。Theoが紹介したと伝えるのを忘れないでください。本日のビデオのスポンサーであるdocyardに感謝します。今すぐ彼らをチェックしてください。アドレスはwvw.l/doyardです。
さて、何が起きたのでしょうか。特に3から3.5への移行では、100万トークンあたり60ドルから20ドルへと価格が下がり、その後すぐにさらに安くなりました。多くのことが起こりましたが、間違いなく最大の要因は競争です。この戦いでは、主に2つの軸で競争が行われています。出力の品質と価格です。彼らが話すのが好きな他のランダムなものもあり、私も気にしているものです。例えば、速度、API機能、UIとUX、製品機能などです。
これらはすべてクールで、Twitterでのデモが上手くいき、とても楽しいものです。しかし、これらはモデル戦争ではありません。なぜなら、これらは全く別のものだからです。ここで行われることのほとんどは私にもできます。私はモデルを作っているわけではなく、多くのGPUで訓練しているわけではありませんが、ここで実際の変化を起こすことができます。この分野でクールなものを作ることができますが、非常に高価で特殊なリソースを持つ限られた数の人々だけがこのセクションで競争できます。そしてこれは業界に興味深い影響を与えました。
特に、AIでお金を稼ぐ唯一の方法はここに住むことだと思われていました。なぜなら、この分野で競争していなくても、本当に良いUIや製品を構築して他の人のモデルを使った場合、OpenAIが現れてそれをやってしまう可能性があったからです。それが前提でした。しかし、その前提はかなり間違っていることが判明しました。なぜなら、今は逆のことが起きているからです。私のような人が入ってきて、OpenAIの製品のクローンを作り、それをより良くして、それでもOpenAIのモデルを提供し、その結果は非常に良いものになっています。
他の人が指摘した別の良いことは、コンテキストウィンドウも競争していることです。これは外部からは多くのことができないものの一つです。速度も同様です。これらを分解すると、最初のカテゴリーはモデル作成者だけが本当に変更できるもの、コンテキストウィンドウについては主にモデル作成者ですが、ハックすることもできます。そして、下のセクションは誰でもある程度できるものです。モデル戦争をこの3つのカテゴリーで考えると、現在何が起きているのかを処理するのがはるかに簡単になります。この戦争はしばらく激しく行われてきており、その結果はほぼすべてのチャートに現れています。
これら2つをグラフにしてみましょう。まずは品質から始めます。一方に時間、もう一方に品質を置きます。これは興味深いレースでした。私はOpenAIを表すために青を使います。それが彼らのお気に入りの色だからです。ここで任意のカットオフを描きます。GPT-3の前と後と言いましょう。GPT-3の前とGPT-3の後があるのは面白いですね。BGP-3とAとラベル付けしましょう。冗談は言いません。
それまでは、自動修正や自動翻訳のようなクールなことが起こっていました。コンピュータが生成できるものの品質はゆっくりと着実に向上していましたが、GPT-3は任意の入力に基づいてテキストを生成するコンピュータの能力における記念碑的な飛躍を表していました。これは自動補完から実際に役立つものへの移行でした。GPT-3の登場時、彼らはモデルを投入しただけでなく、LLMがどのように機能するか、なぜこのモデルが価値があるのかを詳述した多くの研究論文も発表しました。その結果、他の人々がすぐに独自のものを構築し始め、追いつこうとするのを見ました。
競合他社からの比較的早い段階でモニュメンタルな進展がありました。MeiLの登場、Llamaの作業の開始、その他多くのランダムなオープンモデルが登場しました。特に素晴らしいものではありませんでしたが、GPT-3の発売と共に多くの作業がすぐに始まりました。しかし、品質が近づき始めるとすぐに3.5がリリースされ、また大きな品質の飛躍が見られました。また、ハイプが進行中で、人々はそれに飛び込み、OpenAIはバックグラウンドでも物事をより効率的にするために懸命に取り組んでいたので、価格を下げることができました。
また、彼らと競合他社との間のギャップが縮まっているのを見ました。特にGPT-3の終わり頃には、他のモデルが本当に追いついてきているように見え、このスペースが閉じ始めていました。しかし、彼らが新しいものをリリースするたびに、そのスペースは再び広がります。私たちはOpenAIがかなり先行していることに気づき、そして物事は追いついてきます。しかし、2つのことが起こりました。追いつくのにかかる時間が減少し、OpenAIが見ている勝利の大きさも減少しています。3.5から4への変化は、私や他の多くの人が期待していたほど大きくなく、4から4oへの変化はさらに小さかったと言えます。価格面では素晴らしかったですが、品質面では特に記念碑的な勝利ではありませんでした。
そのため、この線はどんどん追いついてきており、追いつくためにしなければならない作業量は毎回減少しています。それはより早く近づいています。その後、o1とo3が登場し、再び品質を向上させましたが、私は本当に品質をこのように考えたいと思います。品質のバーはOpenAIによって設定され、業界の残りの部分はOpenAIが任意の時点で到達しているところにできるだけ近づこうと競争しています。私たちは確かに4oを超えましたが、o1、そして確かにo3 mini on highを真に超えたものはあまり見ていません。これらのモデルから得られる品質は素晴らしいものです。Claudeはいくつかの点で優れていますが、全体的に意味のある程度良いモデルではありません。特に価格を考慮すると。しかし、これは品質面だけです。
そこで、これを取り上げて、代わりに価格をやってみましょう。価格は非常に異なるチャートだからです。3から3.5への価格の大幅な下落がありました。それがどれほど不条理だったかをより現実的に示すために、少し拡張してみます。なぜなら、3から3.5への価格下落は狂ったようなものだったからです。重要なのは、代替品が出始めた時、どれも最初からそんなに高くなかったということです。代替品は、浮き沈みはありますが、この狂った底値への競争を戦っています。正直に言うと、代替品は常にかなり低い価格で提供されていました。
より現実的に考えれば、おそらくそのようになるでしょう。OpenAIがリリースする新しいものごとに、彼らは最善を尽くします。実際、最初は4は価格をあまり下げなかったと思います。先ほどのチャートを確認できます。3.5 turboは大幅な価格下落でした。実際、turboは品質面ではまったく大きな勝利ではありませんでしたが、価格面では大きな下落でした。4はその時点でほぼ同じ価格だったと思います。3をここに入れるとチャートが読めなくなるほどです。OpenAIはチャートを読めなくする奇妙な能力を持っています。
最近、artificial analysisというサイトでかなり時間を過ごしました。これは異なるモデルを見て、それらがどのように比較され、それらのパフォーマンスがどのように見えるかを見ることができる場所です。ここには現在、より人気のある、十分に確立された信頼できるモデルがたくさんあります。OpenAIについて私が言っていたことは、このチャート、インテリジェンス対価格、o1は笑うほど高価でこのチャートを台無しにするということです。ただし、o1の価格はGPT-3の発売時の価格の半分です。ここでo1をオフにすると、チャートが突然役立つようになります。o1が価格で非常に歪んでいるため、チャートが台無しになるというのは本当に面白いと思いました。それを追加したり削除したりすると、まったく異なるストーリーが描かれます。
これはまた、なぜ私がClaudeにとてもイライラしているのかを示しています。できることに対する価格はもうそこにないからです。ここにo1を入れると、ここになります。私がここで描こうとしているチャート、底値への競走には必ずしも役立ちませんが、o1を、例えばo3と比較すると、笑うほど安く、同様の品質です。もう一度こちらに戻ると、o3 miniは実際にその「よく価格設定された」という象限に収まります。o1は文字通り10倍以上高価です。チャートを見てみましょう。そうですね、o3 miniは入力に10セント、出力に40セント、o1は文字通り10倍以上高価です。狂っています。
しかし、o1の後にOpenAIが出した最初のものがo3であり、特にo3 miniだったのには理由があります。o1が出た時、彼らはすべてのモデルを一度に出しました。o3が出た時、それは出ませんでした。o3はまだ出ていません。o3 miniだけがあります。そして、これが起こったのは、こちらの別の怖いことが原因だと思います。o1は久しぶりに見た最初の大きな品質の飛躍でした。そしてそれは、最初の主要な推論モデルだったため、業界がそれに追いつくのは難しいように思えました。そして、興味深いことが起こるまでは難しかったのです。
R1はo1に非常に近づき、OpenAIの世界に確かに恐怖を植え付けました。しかし、もっと狂っていたのは、o1が価格を上げたにもかかわらず、Deep Seekは安価な範囲に留まったことです。ズームインして、この線をどこに置くかを見てみましょう。R1をそれほど安価にしたのは、私たちが投資していたすべての企業の株を取り出したからのようです。本当のところ、ここではOpenAIによる戦略的な決断がなされました。o3とR1の数字を近くで見ると、彼らは文字通り戦略的にo3 miniでR1のコストのちょうど2倍を選んだことに気づくでしょう。
o3 miniがDeep Seekが彼らを破壊しないようにするためのOpenAIの明らかな動きだと言うなら、それは非常に明らかです。この数字は彼らが請求する他の数字に対して意味をなさないからです。それはそれらの一つの分数でもなく、それらのどれにも近くありません。$44.40は、競合が$22であり、あなたが正確に2倍を行っているという状況でなければ、非常に奇妙な金額です。より良い品質を約束し、R1を実行するのはまだ大変だからホストがはるかに簡単です。
現在、品質の世界ではOpenAIがパックをリードし、他のすべての人が追いつこうと戦っていますが、価格は逆であり、他のすべての人がリードし、OpenAIが追いつかざるを得ないことは明らかです。R1で見られたような狂ったことが起こると、それはOpenAIが試みていたことにとって非常に厳しいものでした。彼らはo3、特にそのminiモデルをリリースすることを余儀なくされました。彼らが最初にminiモデルを出し、価格を下げるのは前例のないことでした。そして、自分の足を撃つようなことをしました。o3 miniはo1に品質面で非常に近いからです。彼らがそれを行う唯一の理由は、この赤い線がどのように見えるかを恐れていたからです。
これを、価格を下に置き、ここにすべてのものがリリースされる時間に対する相対的なものとしてギャップとして描くと、最高のモデルの業界価格とOpenAI価格の間のギャップはこのギャップは狂っていました。そして、Deep Seekがどこにいたかと比較すると、これが起こりました。ここのスペース、品質と価格の比率は、特にここ数ヶ月で狂ったことになっています。それは下がっていましたが、そこでの底値への競争を見るのは狂っていました。
そして、Geminiのようなものが、これまで見た中で最も低い価格で登場し、品質が4oに匹敵するのを見るのは狂っています。私がAIのピルを飲んでT3 chatを構築し始めた理由は、Deep Seek V3に非常に感銘を受けたからでした。初めて「ああ、それは文字通りClaudeよりも20倍安く、同様の品質レベルだ」と思いました。私はこれで何かを構築したいと思いました。ワオ、Deep Seekのサイトはちょっと良くないので、自分のより良いものを構築したいと思いました。それが比較的成功したAIアプリにつながりました。このレースを見るのは狂っていました。それは私を傍観者から参加者に変えました。
これは興味深い副作用をもたらしました。それは、これらの企業が持っていた堀が侵食し始めているということです。私は近く別のビデオを作る予定があります。面白いことに、今日それを録画するかもしれません。それはラッパー（訳注：ここではモデルをラップする製品やサービスを指すと思われる）が勝者であるという内容です。なぜなら、私たちが話している戦いのどれもここでのどれもOpenAIを助けないからです。これは彼らを傷つけます。彼らのマージンは急速に下がっており、業界全体での品質のリードは急速に閉じています。品質における彼らの優位性は急速に死んでおり、価格における彼らの優位性は存在していません。
彼らは価格で追いつくために最も激しく戦っている一方で、月額200ドルのサブスクリプションをリリースし、それで損をしています。彼らがこれらのものに任意に高い価格を付けているわけではありません。彼らは品質を上げることにとても焦点を当てていたため、価格はそれほど懸念事項ではありませんでした。業界のトレンドが怖かったため、できるところでは価格を下げましたが、o1は彼らがそれほど懸念していなかったことを示しています。彼らは品質のリードが十分に大きいと感じ、好きなように価格を設定できると思っていました。
正直に言うと、彼らはある程度できました。しかし、それはもう終わりました。彼らはその立場で戦い続けることはできません。品質のギャップは今や、価格に10倍の乗数を掛けることができないほど十分に閉じています。確かに、他のいくつかのオプションと比較して彼らが行っている100倍以上はできません。その立場はもう持続可能ではありません。それが彼らのマージンだけなら、それは一つのことです。彼らはマージンを消去することができます。狂ったことに、私たちは現在、OpenAI Proサブスクリプションで損をしています。それは月額200ドルのティアで、o1 Proを導入します。そのモデルは実行するのが非常に高価なので、GPUと推論のコストだけでもサブスクリプションから得ているお金よりも大きいのです。これは狂っています。彼らのモデルは実際にそれほど高価に実行されています。
だから、ここでの彼らのマージンは狂っているわけではなく、彼らのコストが狂っています。そして今、品質が近いこれらのオープンモデルがあり、Googleのような企業が品質で競争し、価格で大活躍しています。物事は急速に変化しています。モデル間の切り替えが本当に難しかったとしたら、彼らは堀を持っているでしょう。
これを、例えば私たちのほとんどがウェブに使用しているAWSのようなものと比較してみましょう。AWSが非常に高い価格を出し、突然業界が価格的にはるかに競争力のある多くの代替品を生み出したとしても、AWSから移行するのは依然として難しいでしょう。なぜなら、その上に自分のインフラを構築しているからです。ボタンをクリックしたり、コードの一行を変更したりするだけで、別のプロバイダーに移ることはできません。AIアプリではそれを文字通り行うことができます。これが実際のT3 chatのコードです。
正しいモデルでレンダリングし、テキストを実際に生成するときにモデルを選択するためのコードです。そしてこれが消費されている場所、stream textを探すと、これがコードを変更する必要がある場所です。ここで私が渡すモデルを変更することができます。他の多くのことも変更できます。OpenAI for miniを入れることもでき、それがインポートされていれば、これはそのまま動作します。クール、これで4o miniが実行されています。もう一度変更しましょう。デフォルトのモデルを変更しましょう。今日は何を使いたいですか？
Googleのを使いましょう。Googleでいいですね。flash2を使いたいですか？いいですね。これでモデルはflash2になりました。実際にそれは簡単です。T3 chatでタイトル生成を4o miniからGeminiに変更したとき、それはコードの一行の変更でした。モデルプロバイダーの世界には堀がなく、それは素晴らしいことです。これは非常に非常に競争の激しい業界になるでしょう。それは車の価格のようではなく、食品の価格のようなものになるでしょう。
もし新しい食料品店があなたの食料品店のすぐ隣にオープンし、すべてのものが5分の1の価格で、ほぼ同じ品質であれば、あなたは古い食料品店に行かなくなるでしょう。これらのものは非常に使い捨てであり、非常に消費可能で、切り替えが非常に簡単なため、OpenAIはトップに留まるために激しく戦わなければなりません。そしてそれは明らかです。業界は価格を地面に押し下げました。
これは昨年11月の記事ですが、それ以降はもっと狂ったことになっています。正直なところ、最初のここでの100万トークンあたり60ドルという数字が非常に狂っているため、見ることすらできないかもしれません。そのスケールでは、私たちが一貫して50％の勝利を見ているという事実を理解するのが難しいです。この価格は過去3年間で毎年50％以上下がっています。ちょっと狂っています。
申し訳ありませんが、それすら公平ではありません。それは現在、毎年10倍の価格下落に近いです。狂っています。そして、それは一致します。ここに戻って、例えば4o miniを見ると、価格的には画期的でしたが、4oに近いです。4oはまだその時点では安かったです。入力に50セント、出力に10ドル。私は4oよりもflash2の方が好きです。それは20分の1の価格です。それは狂っています。
基本的に私が言っているのは、anthropicが安い新しいモデルをすぐに出さなければ、彼らは終わりです。彼らは今、煙の上に乗っているようなものです。OpenAIは、高価な新しいものを出し続けることができないところまで追い詰められています。高価なものはもはやモデルではなく、製品になるでしょう。だから、彼らはさらに高い価格でo3を出す代わりに、安価なo3 miniを出し、Deep Researchのような全く異なる世界の新製品を作りました。
OpenAIはこのスペースで競争するのが嫌だと気づき、もうそれを好んでいません。この戦争では、彼らはそれを少し速くしましたが、ここで競争することにもあまり関心を持っていないようです。ここは彼らが勝ちたいところです。OpenAIは現在、モデルよりも製品に焦点を当てているようです。モデル戦争は彼らを悪く見せるほど十分なため、彼らは再びこれについてより多く話していますが、彼らはここに部分を出しています。
Deep Researchのようなもの、スケジューリング製品のようなもの、ブラウザを制御できるオペレーターのようなものです。彼らはここで競争したいと思っています。なぜなら、これは非常に商品化されており、彼らはもはやここでそれほど多くのお金を稼ぐことができないことを知っているからです。そして彼らは壁の文字を知っています。この戦争は最悪で、この戦争も競争するのがより楽しいです。それはより安価で、より柔軟で、もっと楽しいことに取り組んでいるエンジニアを持っています。たくさんの科学者を必要としません。GPUを20％効率的にする新しい数学的プロセスを発明しようとすることで、5％の時間を必要としません。
だから、これが最終的に業界にとって何を意味するのか見てみたいと思います。私の仮説は、ClaudeやOpenAIのような企業は互いに競争するのをやめ、私のような人々や、Perplexityのような人々、これらのモデルを活用する製品を構築している人々と競争を始めるだろうということです。なぜなら、モデル戦争はもはやそれほど多くのお金を稼ぐことができる場所ではないからです。そして、この底値への競争があるため、仮に画期的なモデルを作って10倍安く、99％の品質があったとしても、誰かが11倍安く、99.5％の品質のあるものを数週間で作るでしょう。
私たちは底値への競争をとても速く行ったため、チャートを見てもあまり意味をなさなくなっています。AIの分野で何が起きているかを考える際には、これを考慮することが重要だと思います。
みなさんはどう感じますか？これらのモデル企業が競争力を失うほど自分たちの価格設定をしてしまったと考えるのは、私が狂っているでしょうか？製品の世界に住んでいるから妄想しているだけでしょうか？それとも、ここのマージンはもはや意味をなさないのでしょうか？また、業界がGPTの価格を下げるという強制的な機能と、GPTが品質のバーを上げるという機能について、どう思いますか？コメントで教えてください。T3 chatを試してみて、次回までピース、オタクたち。