
中国のDeepSeekが最新のR1モデルアップデートにより、わずか600万ドルの予算でGemini 2.5 ProやOpenAIのo3といった最先端AIモデルと同等の性能を達成した。価格性能比では他社を圧倒的に上回るが、米国政府は国家安全保障上の懸念からDeepSeekの使用禁止を政府機関に通達し、次世代モデルR2の開発もHuaweiチップの使用制限により大幅な遅延が予想される状況である。
13,449 文字

衝撃的な展開として、DeepSeekが再び絶対に不可能と思われていたことを実際に成し遂げた可能性があります。この会社についてまだ馴染みがない方もいらっしゃるかもしれませんが、今この動画をご覧になっているということは、きっとご存知でしょう。DeepSeekは中国発の革新的な企業で、文字通りAI業界に嵐を巻き起こしました。
これは誇張ではありません。そして今日、彼らの思考モデルR1の最新アップデートにおいて、実際に一部の最先端モデルよりもさらに優れた性能を示しているのです。これは私にとって驚きでした。今日の動画では、これがなぜ皆さんが思っている以上に大きな出来事なのか、その詳細について詳しく説明していきます。
これらの簡単なベンチマークを実際に見てみると、非常に重要だと思います。なぜなら、DeepSeekが実際に2つのモデルをリリースしていることを、ほとんどの人が理解していないからです。彼らには常に標準的なチャットモデルであるDeepSeek V3があり、そしてDeepSeek R1バリアントがあります。これは本質的に思考版のモデルで、つまりモデルが最終回答を提出する前に、その思考プロセスと全体的な計画について推論するモデルです。
ここで、これを非常に特別なものにしている理由が本当に分かり始めます。最新アップデートであるDeepSeek R1(5/28で示される)は、文字通りGemini 2.5 ProやOpenAIのo3といった最先端モデルと互角なのです。DeepSeekのバーは縞模様のピンクまたは紫のバーで、これらの最先端モデルと文字通り互角であることが分かります。
覚えておかなければならないのは、これを絶対に信じられないものにしているのは、このモデルがわずか600万ドルで訓練されたと言われているということです。もちろん、この主張に反論する様々な個人がいましたが、重要なのは、彼らが予算と時間の制約の中でこれを実現しなければならなかったということです。一体どうして、推論に数十億ドルを費やしている最先端企業に、わずかな費用で追いつくことができたのでしょうか?これは、この会社が将来的にリードする可能性が非常に高いと人々に信じさせています。
これらすべてのベンチマークを見ると、その多くがモデルの位置を把握する上で本当に重要です。そのほとんどは数学と科学にわたるもので、もちろん後で詳しく説明するコーディングに関するものもあります。人工知能解析インデックスを見ると、これはモデルの位置を示す非常に良い指標です。なぜなら、実際に1つだけでなく7つの評価を組み込んでいるからです。
1つの要因だけを見る他の評価とは異なり、これはすべてのベンチマークを見て、平均スコアを集計するものです。そして、DeepSeek R1の飛躍が絶対に信じられないものであることが分かります。例えば、これを見てください。
昨日の動画をご覧になった方は、Claude 4がいかに素晴らしいかについて話したことを覚えているでしょう。そして実際に、それがClaude Sonet思考を飛び越えていることが分かります。また、Qwen 3 Reasoning、Gemini 2.5 Flash、Grok 3 Reasoning、そしてGemini 2.5 Pro Previewも飛び越えています。これは絶対に信じられないことです。
これは、現在DeepSeekがモデルの品質という点でOpenAIのすぐ後ろにいると一部の人々が主張できることを意味します。これらのモデルを作るのにどれだけの時間と努力が費やされてきたかを考えると、これは非常に重要な発言です。私にとって、これは信じられない驚きです。
今、私が詳しく説明したいのは、もちろん特定の具体的なベンチマークについてです。基本的に、私たちは今、このモデルが本質的にGoogleのモデルや類似分野の他の多くの技術企業と同じくらい賢いということを知っています。これは、これが彼らのフロンティアモデルの2回目の反復であることを考えると、正直に期待していませんでしたが、DeepSeekにとってこれは単なるアップデートでした。
皆さんは本当にこれに感銘を受けるべきだと思います。なぜなら、これが次のフロンティアモデルであるDeepSeek R2だったとしても、この種の性能はまだかなり印象的だったでしょう。しかし、彼らが単にR1をアップデートしてこれほど効果的にしたという事実は非常に懸念すべきことです。なぜなら、おそらくこれらの技術企業が最先端AI性能に関してリードしていないのではないかと私に思わせるからです。
皆さんに本当に注目してほしいベンチマークが1つあります。それはArc Polygon スコアです。誰かがローカルLlamaサブレディットに投稿しました。これは基本的に、LLMをローカルで実行することやオープンソースAIを見ている個人向けのサブレディットです。彼らは、DeepSeek R1がArc PolygonでClaude 4 Opusと同じスコア、なんと70%を獲得したと述べています。
これは絶対に信じられないことです。この件について驚くべきことは、これらの大手技術企業のフロンティアモデルがしばしば非常に高価であることを私たちが知っているということです。そこで、皆さんに本当に理解していただきたいのは、これの実行には約2ドルから3ドルかかったということです。一方、Claude Opusのようなモデルはずっと高価です。同じ種類の推論では、おそらく約50ドルほどかかるでしょう。
Arc Polygonベンチマークで見ることができますが、これはもちろんソフトウェアエンジニアリングタスクにとって非常に、非常に重要なベンチマークです。文字通り他のモデルにわずかに遅れを取っているだけです。そして、遅れを取っている他のモデルは、決して悪いモデルではありません。
これらは最高の推論設定での最先端モデルです。o4 miniをミディアム設定で、そしてo4 mini highとo3 highがDeepSeekを上回る唯一のモデルであることが分かります。これがどれほどの推論なのかを理解する必要があります。OpenAIのo3 mini highとo4 mini highが何であるかについての初期結果からの声明を覚えているなら、これらは非常に長い時間、多くのトークンで推論するモデルであり、非常に非常に高価です。
彼らがいくつかの汎用人工知能テストでこれらのhighモデルをテストしたことを覚えており、それらの実行の一部は単一のクエリに約1,000ドルかかりました。DeepSeek R1がo4 MiniとO3の両方のhigh設定にこれほど迫っていることは、控えめに言ってもかなり印象的であり、また懸念すべきことでもあります。なぜなら、もしかすると彼らの次のモデルはさらに優れているかもしれないからです。
覚えておいてください、私が言ったように、これはベンチマーク性能だけの問題ではありません。確かに、ほとんどの人は世界で最高のAIに群がるでしょうが、現実では異なる可能性があります。なぜなら、もちろん私たちは常にモデルのコストを考慮に入れなければならないからです。このDeepSeek R1モデルは完全に素晴らしいものです。
その素晴らしさについて驚くべきことは、これらの他の大規模言語モデルのコストのほんの一部のコストであることです。これはかなり古いチャートですが、出力と入力の観点から新しいモデル間の価格格差を見るとどうなるかを示しています。元のR1は文字通り価格の観点から1ドルから2ドルの間でした。
しかし、他のフロンティアモデルを見ると、本当に安かった唯一の会社は、もちろんGoogleのモデルでした。これはGemini 1.5 Proについて話していますが、実際にはモデルは今より高価になっていると私は主張します。価格について話していた理由を覚えていますか?これが非常に大きな問題だと思う理由は、DeepSeekの主な点が別の最先端モデルをリリースしたという事実ではなかったからです。
見出しを飾った主な点は、彼らがそれをわずかなコストで実行し、はるかに安く、はるかに速く、そして全体的により効率的なサービスを提供できたという事実でした。それがNvidiaが一日で数十億ドルを失った理由です。人々は、まあ、もしあなたが少ない、明らかに少しだけではありませんが、もちろん大幅に少ないNvidia GPUでそれができるなら、なぜ私たちは皆、それが地球上で最も価値のあるものだと思って株を買っているのか、と言ったからです。
そしてここでまた同じことが起きています。DeepSeek R1を他のフロンティアモデルと比較すると、価格の点で明確な違いがあることが皆さんにも明らかに分かります。Claude 4 Opusは出力に約75ドル、入力に約15ドルです。これは100万トークンあたりです。一方、DeepSeekは出力に約55ドル、約2.19ドルです。
皆さん、価格対性能比の観点から、これは信じられないことです。Gemini 2.5 Proを見てください。これらの他のすべてのモデルを見てください。ここでの違いは絶対に優れています。人々が理解していないことの1つは、開発者と消費者は1つの特定のプラットフォームに対して本当に忠誠心を持っていないということです。はい、OpenAIに忠誠心を持つでしょう。なぜなら、それはもちろんあなたのメモリが保存されている場所だからです。
それは間違いなく素晴らしい製品ですが、開発者、バックエンドが複雑なタスクを実行するLLMにすぎないAPIの人々は、本当に最も安いモデルを使用することを確実にするでしょう。なぜなら、彼らは大幅に節約できるからです。そして、多くのこれらの企業にとってそれが事実なら、まあ、おそらくDeepSeekは彼らの市場シェアを食い込んでいる可能性があります。
テストを実行したこのユーザーが、それがわずか約3ドルかかったと言ったのを文字通り見ることができます。絶対に信じられないことです。ベンチマークについてかなり話しましたが、皆さんにお見せしたいかなり興味深いものがあります。なぜなら、動画の冒頭で、新しいエディションのDeepSeek R1が本質的に基本的にo3と最新で、Anthropicのような企業さえも上回っていると話したからです。
しかし、ここで新しいリーダーボードを紹介します。なぜなら、リーダーボードには少し修正が必要かもしれないと思うからです。つまり、これらのモデルがリリースされるとき、時々これらのリーダーボードが調べるテストで訓練することがあります。SEALリーダーボードは、スキルAI安全評価・調整研究所によって開発されたLLM向けの専門家主導のサードパーティランキングのセットです。
これらのベンチマークは、複数のドメインにわたってフロンティアLLMの能力の透明で偏りがなく、改ざん防止の評価を提供するように設計されています。主な違いは、ほとんどの人がこれらを見るべきだと思う理由ですが、これらはプライベートでキュレーションされたデータセットであることです。
多くの公開ベンチマークとは異なり、SEALは実際に評価データでモデルが訓練されたりファインチューニングされたりすることを防ぐために秘密にされている独自のデータセットを使用しています。SEALからの結果を見ると、このアプローチは結果が事前の露出によってゲーム化されたり汚染されたりしないことを保証します。これははるかに正確なものです。
すべてのプロンプトと評価が検証されたドメインエキスパートによって作成・レビューされる専門家評価のようなものがあります。これは評価が厳密で、関連性があり、信頼できることを保証します。実際にDeepSeek R1を見つけることができたものの1つがあります。皆さんに見えるかどうか分かりません。すぐにハイライトしてみます。
DeepSeekは現在12位です。これはマルチチャレンジです。マルチチャレンジが何なのか知らないかもしれません。これは基本的に、AIモデルが人間との実際の会話にどれだけ良いかを見るために作られたテストです。一度に1つのメッセージだけでなく、完全な前後の会話です。ほとんどのAIテストは、AIが1つの賢い質問に答えることができるかのようなものですが、マルチチャレンジは、AIが混乱したり物事を忘れたりすることなく、完全な会話に追いつくことができるかのようなものです。
このテストが実際にテストするものは何でしょうか?基本的に4つのことをテストします。1つ目は指示保持です。AIは最初にあなたが言ったことを覚えていたでしょうか?ユーザーメモリ。以前にあなたが言ったことを今起こっていることと結びつけることができるでしょうか?そして適切な編集。あなたがその部分を変更すると言ったとき、古いメッセージの内容を修正できるでしょうか?そして自己一貫性。
それは自分が何について話しているかを知っているように聞こえるでしょうか、それとも単に自分自身と矛盾しているでしょうか?この種のベンチマークを見ると、o3が明らかにトップにあることが分かります。新しくリリースされたバージョンのDeepSeekがなぜ12位にいるのでしょうか?正直なところ、よく分かりません。
これは、これがより質的なベンチマークであることを考慮すると、DeepSeekが出力の種類の観点からどのように訓練されているかによるものかもしれません。おそらくモデルに強化学習と人間のフィードバックを行っている人々が、中国にいるので、評価の異なる方法を持っているのかもしれません。それが潜在的な理由かもしれません。
あるいは、DeepSeekは全体的に学術的タスクで本当に賢くなるように訓練されているだけかもしれません。いずれにせよ、本当に特定のベンチマークを見ると、モデルがどこで優れていて、どこで劣っているかを本当に測ることができることを示しています。これが私がSEALからの異なるベンチマークを見ることを本当に好む理由です。なぜなら、各モデルのニュアンスとそれを特別にするものを本当に見ることができるからです。
そして、これは本当に有用だと思います。なぜなら、しばしば私は何が得意なのかを自分で把握するためにモデルをテストすることに多くの時間を無駄にしていたからです。しかし、DeepSeekが他のモデルほど指示に従うことや指示保持が得意でないことを今知っているなら、もちろんそれは私が使いたくないものかもしれないことを知っています。
これを前に見せるべきだったのですが、これはもちろんこのモデルが他のすべてのモデルと比較してどうなのかです。ここでかなり素晴らしく見えることが分かります。AMEのような一部の分野では、Gemini 2.5 Proを上回っています。また、Qwen 3 235Bも上回っています。正直なところ皆さん、私はQwen 3 235Bについて動画を作りましたが、そのモデルは絶対に優秀でした。
そのモデルの厳密なテストを行い、それが無料であることと、それらのタスクでそれほど効果的であることを本当に信じることができませんでした。そのモデルが2350億パラメータであることは本当に印象的でした。DeepSeek R1が実際に何であるかを見ると、モデルは約6000億パラメータです。
確かに、DeepSeekは少し大きいですが、それでもこれはかなり信じられないモデルだと思います。また、注目すべきことがあります。LMSYS Arenaリーダーボードはまだありません。これはもちろん、人間が実際に会話で何を望むかを基本的にテストするベンチマークです。これはもちろん、正しい答えを得たかどうかを本当に見ているのではないため、より質的なベンチマークです。
実際の人間によって検証されています。人々はこのウェブサイトを使用し、質問を送信し、基本的にどちらの回答がより好きかをブラインドテストします。時間が経つにつれて、彼らがより好むモデルが投票され、より高いELOスコアを得ます。これがLMSYSが最高のものの1つである理由です。なぜなら、実際のベンチマーク修正がなく、基本的にどのモデルが最高のバイブスと最高の常識を与えてくれるかを示すことができるからです。
現在勝っているモデルは、Google Gemini 2.5 ProとウェブデベロップメントでのClaude 4 Opusです。複数の異なるカテゴリがあります。だから、各カテゴリで正確にどのモデルを使用するかを知りたい場合は、それがすぐに見るべきウェブサイトでしょう。
DeepSeekでは、彼らはR1だけをリリースしたのではありません。実際にそれらの能力をQwen 3 80億パラメータベースモデルに蒸留しました。そしてそれは絶対に信じられないことです。そのモデルは、AIME 2024でオープンソースモデルの中で最先端の性能を達成し、元のQwen 3 8Bを10%上回り、Qwen 3 235B thinkingの性能と一致しています。
彼らは、DeepSeek R1からの思考の連鎖が、推論モデルに関する学術研究と小規模モデルに焦点を当てた産業開発の両方にとって重要な意味を持つと信じています。基本的に、彼らは新しいエディションのDeepSeek R1からのそれらの信じられない能力を取り、それを80億パラメータで基本的に今最先端であるより小さなモデルに組み込むことができました。
間違いでなければ、Twitterで誰かがこのバージョンを電話で使用しているのを見たことを覚えています。正直なところ、知能がコンパクトで電話にあることは、今後10年以内に絶対に信じられないことになるでしょう。o3のようなエージェントがあなたの指先でプライベート情報と共にローカルオフラインで実行されることを想像してみてください。
しかし、もちろん非常に大きな問題が来ています。確かにDeepSeekは素晴らしいモデルですが、実際にはDeepSeekの将来のバージョンを手に入れられない可能性があります。それはかなりクレイジーに聞こえることは知っていますが、世界中の政府が実際にDeepSeekへのアクセスをブロックしようとしているのです。今のところ、それは主に政府職員向けのようですが、将来的にはそれが非常に変わる可能性があります。
つまり、それがDeepSeekが、TikTokが攻撃を受け、潜在的に禁止されようとしていた完全な理由です。基本的に、米国政府はDeepSeekを禁止しようとしており、それは主にDeepSeekが中国のAI企業であり、非常に人気を得ているが、ユーザーデータをどのように処理するかについて米国の官僚と規制当局を実際に警戒させているいくつかの質問があるため、国家安全保障、データプライバシー、外国の影響に関する懸念によるものです。
彼らがこの国家安全保障リスクを持つ主な理由は、DeepSeekが中国共産党やChina Mobileのような中国国有企業とのつながりを持っている可能性があるとされているからです。米国当局は実際に、DeepSeekが機密の政府、企業、または個人データにアクセスされる可能性があり、中国当局が要求に応じて企業にデータを共有することを要求する中国の国家安全保障法の下で、中国当局によってスパイ活動に使用される可能性を恐れています。
そしてもちろん、データプライバシーの懸念があります。DeepSeekは中国にあるサーバーにユーザーデータを保存し、中国の諜報機関による不正アクセスと監視のリスクを高めています。DeepSeekがユーザーデータをどのように収集、処理、共有するかについての透明性の欠如があり、プライバシーと米国および国際基準への準拠に関する懸念をさらに煽っています。これが、米国だけでなく他の国々もDeepSeekを禁止しようとしている理由です。
最近、3月17日にこの記事を得ました。米国商務省が最近数週間で政府機器でDeepSeekが禁止される予定であることをスタッフに通知した、とロイターが見たメッセージと問題に詳しい2人によると。商務省情報システムを安全に保つのを助けるために、新しい中国ベースのAI、DeepSeekへのアクセスは、すべてのGFEで広く禁止されている、とある人は言いました。
DeepSeekを使用することにより、ユーザーは契約、文書、財務記録などの非常に機密性の高い独占情報をCCPと無意識に共有している、と中国共産党に言及して3月3日の書簡で議員は書きました。間違った手に渡ると、このデータは外国の敵として知られるCCPにとって非常な資産です。
そして彼らは、バージニア、テキサス、ニューヨークを含む多数の州が政府機器からモデルを禁止しており、21の州検事総長の連合が議会に法律を可決するよう促していることについて話しています。全体的に、米国商務省がすでに政府機器でDeepSeekを禁止していることを私たちは見ています。
この全てについて驚くべきことは、DeepSeekの次のモデルについて話す必要があることです。一体R2はどこにあるのでしょうか?皆さんの中には覚えている方もいるかもしれませんが、R2は大幅な遅延に直面している可能性があります。R2はDeepSeekのモデルの次の設置です。私たちが心配している、まあ、実際には心配しているのではありませんが、懸念していることは、このモデルが実際に完全に遅延される可能性があるということです。
モデルは5月初旬に配信またはリリースされる予定でした。そして、4月になると言っている人もいました。多くの人がこれをAI業界にとって重要な瞬間とさえ呼んでいました。しかし、最近の制限と新しい法律の可決により、実際にはかなり長い間DeepSeek R2を得られない可能性があるようです。
DeepSeek R2は本質的に、1月に皆を衝撃を与えた会社の画期的なモデルの非常に期待される後継者です。1月にこれが皆を衝撃させた理由を覚えているなら、中国企業は当時の主要な西側企業の性能に匹敵するシステムを実際に作ることができなかったと信じられていたからです。
しかし、ねえ、これらの人々は実際に西側企業と同じレベルにあり、より安くそれを行っているのを見たとき、これは本当に大きな赤信号を提起し、人々は、ちょっと待って、中国は全く遅れていないので、実際にここに焦点を合わせる必要がある、と言いました。
この件について驚くべきことは、DeepSeekがHuaweiのAscend 910B AIチップの使用を中心に全体のR2開発戦略を構築したことです。この決定は選択によるものではなく、むしろ必要性によるものでした。中国企業は輸出制限により、Nvidiaのような企業が作った最も先進的なAIチップへのアクセスから大幅に遮断されているからです。
HuaweiのAscendチップは、モデルを訓練するために強力なコンピューティングを必要とする中国のAI企業にとって主要な代替手段となっています。これらのチップはDeepSeekにとって不可欠であり、なぜそれが非常に複雑になり、なぜ私たちが大幅な遅延に直面する可能性があるかを皆さんにお見せします。
Ascend 910Bチップは、HuaweiがA100のような古い世代のNvidiaチップと競争できると主張する中国で国内生産されたプロセッサです。DeepSeekは、ここで興味深いことに、これらのHuaweiのチップクラスターの82%の利用率を達成し、FP16精度で512 petaflopsのコンピューティングパワーに達したと報告されています。これは印象的なエンジニアリング成果を表していますが、性能はNvidiaの現在のH100チップが提供できるものの約60%にすぎないと推定されています。
ここで事態が複雑になります。2025年5月に米国商務省、産業安全保障局が、世界のどこでもHuawei Ascendチップを使用することは米国輸出管理に違反すると宣言する前例のない指導を発行しました。これは米国と中国の間で進行中の技術戦争における重要なエスカレーションであり、前例のない方法で米国の法的管轄権を世界的に拡張しました。
米国政府の立場は、Huawei Ascendチップが特定の米国ソフトウェアや技術で設計されたか、または特定の米国起源ソフトウェア技術の直接産物である半導体製造装置で生産された可能性が高いということです。基本的に、チップが中国で製造されているにもかかわらず、米国系IPを含んでいるか、米国の設計装置を使用して作られているとされるため、米国がその使用に対して法的権限を主張しているということを意味します。
この支配の意味は深刻です。世界のどこであろうと、これらのHuaweiチップを使用する人は誰でも、米国法の下で刑事罰に直面する可能性があります。これがDeepSeekを混乱させているものです。彼らがこれらのチップを使用してそのモデルを製造すれば、いくつかの影響に直面する可能性があるため、これは異常な法的リスクを作り出します。
DeepSeek R2がおそらく驚くべきモデルになる理由が分かりますが、遅延に直面する可能性があります。法的問題を超えて、DeepSeek R2がHuaweiチップで直面するいくつかの重要な技術的課題があり、これらがタイムラインを遅らせる可能性があります。HuaweiのAscendチップが大規模なAI訓練にとって問題となる深刻な安定性と性能の問題に苦しんでいることを示す複数の報告があります。
Ascendチップを使用している中国のAI企業は、すでにハードウェア性能の問題、特にAIモデル開発にとって重要な安定性の問題について苦情を述べています。ご存知でなければ、AIモデルは訓練中に長期間、時には数週間または数ヶ月間中断なしに継続的に実行するためのハードウェアを必要とします。
Ascendチップは頻繁なクラッシュと持続的な訓練ワークロードを非常に困難にする安定性の問題に苦しんでいると報告されています。ユーザーはまた、これらのAscendチップがNvidiaの代替手段と比較してより遅いチップ間接続性を持っていると報告しています。この接続性は基本的に開発者が複数のチップを大規模なAI訓練実行で一緒に作業できるクラスターに結合することを可能にします。
より遅い接続性は、訓練プロセスが完了するのにずっと長い時間がかかることを意味し、コストと開発時間を大幅に増加させます。Huawei自身のスタッフでさえ、Ascendハードウェアが使用するのを困難で不安定にすると言って、彼らのプラットフォームについて懸念を表明していると報告されています。
もしDeepSeekが法的懸念のためにこれらのHuaweiチップを放棄することを余儀なくされた場合、異なるハードウェアでR2モデルを再訓練するという巨大な課題に直面することになります。1.2兆パラメータと噂されるモデルの訓練には、数千のプロセッサで数ヶ月の継続的な計算が必要です。このプロセスには、AIシステムに数百万冊の本の価値のテキストに相当する5.2ペタバイトの訓練データを供給することが含まれます。
異なるハードウェアでこの全体のプロセスをやり直すことは、あるシステムから別のシステムにファイルをコピーするという単純な問題ではありません。異なるAIチップは異なるアーキテクチャプログラミングインターフェースと異なる最適化要件を持っています。HuaweiのAscendチップで効率的に実行するために特別に最適化されたコードは、代替プロセッサのために完全に書き直される必要があります。
このソフトウェア変換プロセスだけでも数ヶ月のエンジニアリング作業がかかる可能性があります。訓練プロセス自体は、より速いハードウェアでも、最初から再開する必要があります。R2サイズのモデルの訓練には通常、数ヶ月の継続的な計算が必要です。もしDeepSeekがHuaweiチップよりも強力でない代替手段に切り替えることを余儀なくされた場合、取引時間は元のタイムラインよりもさらに長くなる可能性があります。
全体的に、DeepSeekと彼らの将来のモデルについて非常に興奮していますが、彼らは技術的、法的、戦略的課題の完璧な嵐に直面しており、これは分裂が増すグローバル技術環境におけるAI開発の複雑な現実を示しています。当初、米国輸出制限に対する巧妙な回避策と見られていたこれらのHuaweiチップへの依存は、今や潜在的な負債となっています。
DeepSeek R2が出てきて、さらなるバージョンがある時に実際に何を見る可能性があるかについては、インターネット上の現在の情報はおそらく正確だと思います。既知のモデルに対するDeepSeek R2の噂からのこの表を見ると、かなりの違いがあることが分かります。
皆さんに完全に正直でいるために、これに追加させてください。この情報の一部は、複数のAIモデルで研究を行っていたときに見つけることができた唯一のものであったため、基本的に中国の株式フォーラムからの噂にすぎません。1つ目は、1.2兆のパラメータであることは、もちろん噂です。
現在のAIモデルが専門家の混合で、特定の時間にそれほど多くのアクティブなパラメータを実際に必要としないため、これらのモデルをより効率的にすることに成功しているため、実際にはそれほど多くのパラメータを持っていないことを私たちは知っています。Qwen 3でそのモデルが顕著な効率性の点で何をすることができたかをすでに見ました。
すべての蒸留が進行している今、他のモデルまたはすべてのモデルで、それはそれほど高くない可能性があります。実際にパラメータ数のようなものを推測するのがかなり困難である理由は、AI企業が本質的に彼らの秘密のソースのようなものであるため、これらのパラメータが何であるかを知られることを本当に本当に望んでいないからです。
これらのモデルが作られるとき、他の企業がコピーできる可能性があるあまりにも多くのことをリリースしないよう本当に努力します。もちろん、ハイブリッドアーキテクチャが期待されており、これは基本的に専門家の混合にすぎません。そして、動画で前に話したように、5.2ペタバイトの訓練データがあるとされています。
これは完全に噂ですが、それでも見るのはかなり興味深いです。API入力コストと出力コストについては、100万トークンあたり約7ドルと27ドルを見ています。個人的に、特にフロンティアレベルの知能でそれが可能になるかどうか分かりません。なぜなら、私たちは実際にトレンドの逆を見ていると思うからです。
確かに、知能に対する価格は下がっていますが、もし実際に新しい曲線に行くなら、それはモデルがより長く推論するにつれてより賢くなるということです。もし彼らがより長く推論するなら、それはより多くのトークンを使用し、全体的により多くの費用がかかることを意味します。だから、コストがそれほど安くなるかは完全に確信していません。しかし、これらの他のフロンティアモデルよりもあまり高価になることは期待していません。
DeepSeekについて疑問に思っていることの1つは、視覚能力を持つかどうか、そして潜在的にまだオープンソースになるかどうかです。彼らはかなり長い間オープンソースになることを約束していることを知っていますが、いくつかの企業がそのオープンソースの性質を元に戻すのをすでに見ており、特にOpenAIでそうです。実際にはMistral AIについて言及しています。なぜなら、オープンソースであることは素晴らしいが、これらの訓練実行が数百万ドルの費用がかかり、潜在的にOpenAIを下回る可能性があるときにそれを維持するのはかなり困難であることを彼らが理解していると思うからです。
DeepSeekが、例えば月額5ドルまたは10ドルだったとしたら、人々はまだそれにお金を払うでしょうか?私は彼らがそうするかもしれないと思います。月額わずか5ドルのAIを持つことは狂気に聞こえることは知っていますが、多くの現在の西側経済でこの生活費危機があるという事実を考慮すると、人々は中国企業によって作られたとしても、フロンティア知能に対して月額5ドルを喜んで支払うだろうと私はかなり確信しています。
いつものように、私は人々が企業に対して本当に忠誠心を持っているのではなく、最高のものに対してより忠誠心を持っていると言ってきました。


コメント