DeepSeek V4は、中国が制限されたGPUリソースで開発した最新のフロンティアレベルAIモデルである。オープンソースかつ圧倒的な低コストで、Claude Opus 4.7やGPT-5.5に迫る性能を実現している。この技術革新は、アメリカのAI優位性に対する重大な挑戦であり、企業が中国製オープンソースモデルを選択する経済的インセンティブを生み出している。輸出規制の効果が限定的であることを示すと同時に、アメリカがオープンソース戦略と効率性向上を急ぐ必要性を浮き彫りにしている。

DeepSeek V4の衝撃
DeepSeekが最新のフラッグシップモデルV4をリリースしました。巨大で、パワフルで、オープンソースで、そしてコストはほんの一部です。そしてこれは、アメリカの人工知能における優位性を終わらせるかもしれないモデルなのです。中国が追いついたからではなく、これから起こることのためです。
通常であれば、この時点でモデルの概要を説明するところです。モデルについて説明して、ベンチマークを見せて、テストして、私の考えをお見せするわけです。でも見ていくうちに、実はもっと大きなストーリーがあることに気づいたんです。
アメリカは最高のチップを持っています。AI研究所に最も多くの資金が流れ込んでいます。それなのに、中国は最高のモデルに匹敵するフロンティアレベルのモデルをリリースできたんです。完全にオープンソースで、完全にオープンウェイトで、そしてコストとリソースはほんの一部です。彼らは文字通り性能を制限されたNvidia GPUで作業しているんです。
これは本来不可能なはずで、その余波は人々が認識している以上に大きなものになるでしょう。そこで今日は、DeepSeek V4の何が特別なのか、なぜそれが重要なのか、そして世界にとって何を意味するのかをお話しします。
でもその前に、もしAIモデルについての動画を見るのが好きなら、ぜひいいねとチャンネル登録のボタンを押してください。できるだけ多くの人に届けて、人工知能について教えて、ワクワクしてもらいたいんです。いいねとチャンネル登録のボタンを押すことは、皆さんが思っている以上にこのチャンネルの助けになります。先にありがとうございます。
DeepSeek V4の特別な点
では、DeepSeek V4の何がそんなに特別なのでしょうか。まず、DeepSeekが実際にどういう存在なのかをお話ししましょう。覚えているかもしれませんが、約18ヶ月前、彼らは文字通り世界を変えたモデルをリリースしました。DeepSeek R1と呼ばれるもので、思考できるオープンソースのオープンウェイトモデルでした。
当時を思い出してください。思考できるモデルは、アメリカのクローズドソースAI研究所だけが開発していました。彼らはR1をリリースして、他の国やオープンソース研究所もフロンティアにあるモデルを開発できることを世界に示し、株式市場はほぼ一晩で20%下落しました。
DeepSeek R1で本当に特別だったのは、彼らがそれを訓練できた効率性でした。アメリカのフロンティアAI研究所が支払った数千億ドルのほんの一部の価格だったんです。それで人々は「うわあ、もし彼らがほんの一部の価格で訓練できるなら、Nvidia GPUは実際にはそれほど価値がないのかもしれない」と思いました。
でも、彼らはそれについて大きく間違っていたことが判明しました。価格が安くなると、実際にはもっとたくさん使うようになるんです。これはジェボンズのパラドックスと呼ばれています。
そして今日に早送りします。DeepSeekがV4で戻ってきました。そして彼らは、いくつかの失敗について非常に正直であることを含めて、どのようにそれをすべて行ったかを説明する信じられないほど徹底的なホワイトペーパーを書きました。アメリカのクローズドソースAI研究所のどれよりもはるかに正直です。
モデルの詳細とベンチマーク
さて、これが投稿です。昨夜遅くに出ました。説明させてください。DeepSeek V4プレビューがここにあり、ProとFlashの2つのフレーバーで提供されます。
まず、100万トークンのコンテキスト長を持っています。これは驚くべきことです。なぜならこれがフロンティアだからです。つまり、すぐにそのボックスにチェックを入れられます。彼らはコンテキスト制限のフロンティアにいます。
次に、これは1.6兆の総パラメータモデルで、490億のアクティブパラメータを持っています。これはMixture of Expertsと呼ばれています。基本的には、巨大なモデルを持ちながら、与えられた質問やプロンプトに特化したモデルの小さな部分だけを実行できるようにするものです。
彼らはまたV4 Flashも持っており、これは彼らのワークホースモデルです。より小さく、より速く、そしてはるかに安くなります。これは2840億の総パラメータで、130億のアクティブパラメータです。
このスクリーンショットを見ると、両方とも約33兆トークンの訓練データで訓練されたことがわかります。これらのモデルのいくつかの特徴として、エージェント機能が強化されています。Opus 4.7やGPT-5.5のような最先端のエージェントコーディングモデルに匹敵します。文字通り、先週AnthropicとOpenAIからリリースされたばかりのモデルです。
豊富な世界知識と世界クラスの推論を持ち、数学、STEM、コーディングにおいて現在のすべてのオープンモデルを上回り、トップのクローズドソースモデルに匹敵しています。
主要なベンチマークをいくつかお見せしましょう。ここにMMU Proがあります。これは知識と推論です。ここで濃い緑のバーで見ることができますが、これがDeepSeekで、オレンジがOpus 4.6、紫がGPT-5.4、そしてストライプで示されているのが新しいモデル、Opus 4.7とGPT-5.5です。
でも見ているのは、ここでは少し遅れているものの、すぐそこにあるということです。そして覚えておいてください、価格はほんの一部なんです。GPQA diamond、同じことです。SWE-bench Verified。そして基本的に、全体的に見ているのは、確かに遅れているけれども、ほんの少しだけだということです。
そしてこれがここでの本当のストーリーなんです。ほとんどのユースケース、圧倒的多数のユースケースは、絶対的なフロンティアレベルのインテリジェンスを必要としません。そしてDeepSeekがはるかに効率的ではるかに安いという事実が、実際にアメリカにとっての問題なんです。
コストの問題
それでコストについて話しましょう。なぜなら、これが本当に私たちが恐れるべきものだからです。なぜかわからない場合は、説明します。まずコストを見てみましょう。これはAIモデルの価格対性能です。
Y軸にはインテリジェンスがあります。高いほど賢いと考えてください。X軸は価格です。左に行くほど安いです。安い方が良いです。つまり、ここの左上にいたいわけです。できるだけ安く、できるだけインテリジェントでありたい。
それで何が見えますか。GPT-5.5がちょうどリリースされ、一番上にあります。Opus 4.7がすぐ隣にあります。そして今はインテリジェンスだけを測定しています。GPT-5.4 extra highがここにあります。そしてDeepSeek V4 Proがあります。
インテリジェンスでは少し遅れていますが、はるかにはるかに安いです。そしてここのFlashを見てください。確かにインテリジェンスは大きく落ちています。それでも本当に良いですが、これはここの絶対的なワークホースモデルの価格です。これは100万トークンあたりペニーです。
さて、過去数年間でアメリカのフロンティア研究所と中国のフロンティア研究所の間の競争がどのように進んできたかをお見せしたいと思います。2023年5月に出たGPT-4があり、この巨大なギャップがありました。これはArenaのELOスコアで、それからQwen、それからGLM-4です。
この時点で、o1 previewが出た直後です。覚えていますか、o1は最初の思考モデルでした。その直後、わずか数ヶ月でDeepSeek R1が世界を変え、ギャップをほぼ完全に埋めました。アメリカの研究所は先に進み、彼らの間でこの行ったり来たりの潮の満ち引きがありました。
アメリカが先に進むたびに、中国のオープンソースが追いつきます。彼らは常に遅れてきましたが、それは常にそうであるとは限らないかもしれません。
輸出規制の効果
そこで地政学的な質問になります。輸出規制は実際に機能しているのでしょうか。輸出規制は基本的に、アメリカ、具体的にはNvidiaが、そのトップチップ、最高のGB300といくつかの他のものを中国に直接販売することが許可されていないことを意味します。
中国がこれらの輸出規制を回避して、他の国に輸入して密輸しているという噂がたくさんあります。そしてそこには全体的なストーリーがあります。でも今日はそれには触れません。でも輸出規制は機能しているのでしょうか。実際に施行されていると仮定して。
答えは、ある意味ではイエスで、ある意味ではノーです。輸出規制は機能しています。なぜなら、中国はアメリカが持っているのと同じコンピュートリソースを持っていないからです。これは単なる事実です。たとえ彼らがチップを密輸できたとしても、それは困難で、確実にアメリカにあるほどのコンピュートは持っていません。でももし持っていたら、彼らが何ができるか想像してみてください。
その一方で、輸出規制はある意味機能していません。なぜなら、彼らはアルゴリズム側で革新しているからです。彼らは、DeepSeekを含むこれらのモデルの訓練と推論の実行を信じられないほど効率的にする素晴らしいアルゴリズムのブレークスルーを生み出しています。
それで、性能を制限されたGPUを使っても、中国のネイティブGPUを使っても、彼らはまだフロンティアレベルのモデルを作成できるんです。実際、Nvidia、特にJensenは、彼らにトップGPUを販売するための議論をしてきました。中国は独自のAIチップを開発し、生産するでしょう。それらはアメリカの技術の上に構築されるべきです。
そしてその議論は、実際にDeepSeek V4がアメリカ経済にとってなぜそのような大きな問題であり、大きな脅威であるかの理由なんです。でもその裏側として、彼らは独自のチップを作るでしょう。彼らは独自の素晴らしいモデルを作るでしょう。そしてそれらはアメリカの企業や同盟国にとって非常に魅力的になるでしょう。でもそれについては後ほど。
蒸留攻撃の問題
蒸留ハッキングについて話したいと思います。なぜならそれはすべて関連しているからです。ほんの数週間前、Anthropicは基本的に、中国のトップAI研究所がClaudeモデルに対して蒸留攻撃を行っていた証拠があると報告しました。
それは実際に何を意味するのでしょうか。蒸留攻撃を説明する最も簡単な方法は、中国のAI研究所が本質的にClaudeやChatGPTからデータを盗もうとしているということです。彼らは質問をして、答えを得て、それらの質問と答えのペアを使って自分たちのモデルを訓練しています。
これらの質問と答えのペアがすべてです。それはAnthropicやOpenAIのような企業の知的財産なんです。そして昨日、アメリカ政府が蒸留攻撃に関する声明を出しました。これはMichael Kratzios局長です。
アメリカは、主に中国の外国の実体がアメリカのAIを盗むために産業規模の蒸留キャンペーンを実行しているという証拠を持っています。私たちはアメリカの革新を保護するために行動を起こします。
さて、これはすでに数週間前にAnthropicによって報告されていました。だから、これは本当に新しいニュースではありませんが、アメリカ政府が実際にはい、それは起こっていると言っているのが新しい部分です。そして私は、なぜこれが全体のストーリーに結びつくのかを説明します。
これらの外国の実体は、何万ものプロキシとジェイルブレイキング技術と協調的なキャンペーンを使用して、体系的にアメリカのブレークスルーを抽出しています。
でもここがポイントです。Anthropicのレポートを見ると、中国の研究所、特にDeepSeekは実際にはそれほど多くのデータを盗んでいませんでした。そして実際には、彼らは全く盗んでいなかったという議論があります。利用規約に違反しているかもしれませんが、その多くは単純なベンチマーク比較で説明できます。
もしあなたがフロンティア研究所で、私のモデルが競合モデルに対してどれだけうまくやっているかを知りたいなら、知る唯一の方法は両方に対してベンチマークを実行することです。そしてそれらのベンチマークは蒸留攻撃と全く同じに見えます。
これがAnthropicからのレポートです。1つだけ非常に簡単にお見せしたいと思います。DeepSeekの蒸留攻撃の規模は、わずか15万回のやりとりです。それは多くありません。
さて、Kimiの背後にある企業Moonshotは340万回持っていて、Miniaxは1300万回持っています。確かに中国の研究所の中でDeepSeekは、他の研究所よりもはるかに少なくこのいわゆる蒸留攻撃を行ってきました。そして15万回のやりとりは、DeepSeekが達成できた品質レベルを説明するには実際には十分ではありません。
そしてそれを、彼らが全体をオープンソース化したという事実と組み合わせます。彼らは、彼らがそれをどのように達成できたかを正確に説明する信じられないほど詳細で徹底的なホワイトペーパーを持っています。それはただ合わないんです。
輸出規制が実際に機能しているという話に戻ります。TwitterユーザーのJukconがレポートで非常に興味深いことを指摘しました。なぜなら、私が言ったように、DeepSeekは非常に徹底的なレポートを出したからです。
ハイエンドコンピュート能力の制約により、現在のProのサービス能力は非常に限られています。今年後半に950のスーパーノードが大規模に起動された後、Proの価格は大幅に削減されることが期待されています。
つまり、彼らは非常にコンピュート制約があります。彼らはこのモデルを焼いて生産できましたが、最も最適化された方法でサービスを提供することさえできません。そして彼らはまた、そうでなければ請求するよりも多く請求しています。だから価格は下がり続けるでしょう。そして価格が今私が焦点を当てたいものです。
なぜ価格と効率が重要なのか
それで、なぜDeepSeek V4の価格と効率がそのような大きな問題なのでしょうか。はい、それはほぼ最先端です。ほぼ、完全にではありません。トップモデルのOpus 4.7やGPT-5.5とほぼ同じくらい良いです。
でもここがポイントです。同じくらい良い必要はないんです。そしてほぼ同じくらい良いだけで、アメリカの企業を含むほとんどすべての人にとって十分に良いです。そしてそれが重要なことです。
あなたがアメリカの企業のCEOであるか、私たちの同盟国の1つであると想像してください。そしてあなたはOpus 4.7を見ています。GPT-5.5とコストを見ていて、GPT-5.5が出力100万トークンあたり30ドルであることがわかります。Opus 4.7も同様の価格です。
そしてあなたはDeepSeekを見て、それはあなたのすべてのユースケースを達成できます。なぜならあなたはフロンティア科学研究をしているわけではないからです。世界で最も難しいコーディング問題のいくつかを解こうとしているわけではありません。あなたはビジネスを持っていて、ビジネスを運営しようとしています。
そして価格を見ると、それは文字通りほんの一部です。そしてあなたはそれをより正確にコントロールできます。オープンソースです。好きなだけ微調整できます。好きなように正確に作ることができ、好きなようにホストでき、請求額はそうでなければそうなるサイズのほんの一部になります。
これらのCEOが行っている計算は非常に明白になります。なぜ、オープンソースの中国のモデルよりも、アメリカのフロンティア研究所があなたにモデルを提供するためにそんなに多く支払うのでしょうか。そしてそこに問題が来ます。
なぜなら、ますます多くのアメリカと私たちの同盟国の企業がこれについて考え、中国のオープンソース技術の上に構築する決定を下すようになるからです。そしてそれが大きな議論です。
Jensenが、中国は独自のチップを構築するでしょう、独自のモデルを構築するでしょう、それらはアメリカのチップの上に構築されるべきだという議論をしたことを覚えていますか。まあ、同じ議論が、中国のオープンソースモデルの上に構築するアメリカ企業との裏側にあります。
それはアメリカにとって大きなセキュリティリスクです。なぜなら、中国企業が突然アーキテクチャを変更したり、私たちを遮断したりすることを決定した場合、私たちは本当に悪い立場にいるからです。
アメリカへの影響
それで、これについて考えてみましょう。アメリカのAI産業に数兆ドルが流れ込んでいます。インフラストラクチャの構築が、歴史上のどのインフラストラクチャ構築よりも急速に行われています。
つまり、もしあなたがリターンを必要とするすべてのこの投資を持っていて、突然そのリターンを得ていない場合、アメリカ経済が崩壊する可能性があります。特に私たちは人工知能が私たちの経済の未来であることに非常に重く賭けているからです。
そして文化的に考えてください。ソーシャルメディアが世界をどのように変えたか考えてください。そしてソーシャルメディアはアメリカから来ました。私たちは多くの場所で物語をコントロールすることができました。
今、それをひっくり返して想像してください。私たちは皆、中国のモデルの上に構築されていて、彼らがモデルが何を言えて何を言えないかを指示しています。これらは、アメリカ企業が中国のオープンソースモデルの上にAI戦略を構築することを決定した場合に、私たちが取り組まなければならない大きな質問です。そしてそれらは今非常に魅力的に見えています。
これからどうすべきか
それで、ここからどこへ行くのでしょうか。アメリカには2つの大きなイニシアチブが必要だと思います。第一に、オープンソースにはるかに強く取り組む必要があります。アメリカのフロンティア研究所は、ほとんどの場合、オープンソースに友好的ではありません。おそらくGoogleは例外かもしれませんが、Googleは小さなオープンソースモデルを構築しており、DeepSeek V4と同じレベルや同じ能力ではありません。
そして効率性にも取り組む必要があります。たとえクローズドソースを維持し、OpenAIとAnthropicによって提供されるとしても、彼らははるかに速くはるかに安くなる必要があります。なぜなら、アメリカの企業はこれらの異なるモデルを見て、コスト的に理にかなっている必要があるからです。それが全世界がアメリカの人工知能の上に構築することを可能にするでしょう。
だから、もしDeepSeekがすべてを正しく行っているなら、Anthropicは、少なくとも最近は、すべてを間違って行っているかもしれません。私はそれについてビデオを作ったので、今画面に表示されているビデオをチェックしてください。人々は私が彼らに少し厳しすぎたと言いますが、私は本当にフラストレーションを感じてきました。


コメント