DeepSeekが新たにリリースしたV3.2は、オープンソースモデルとして初めて国際数学オリンピック(IMO)で金メダルレベルのスコアを達成し、OpenAIやAnthropicといったクローズドソースの最先端ラボのモデルを上回る性能を示した。注目すべきは、この成果が圧倒的に少ない予算と驚異的な効率性で実現されている点である。V3.2には通常版と特別版(Special)の2つのバリエーションがあり、特に特別版はGPT-5 HighやGemini 3.0 Proを凌駕するベンチマークスコアを記録している。技術的なブレークスルーとしては、計算複雑度を大幅に削減する独自のDeepSeekスパースアテンション(DSA)機構、スケーラブルな強化学習フレームワーク、そして大規模なエージェントタスク合成パイプラインの3点が挙げられる。これらの革新により、長いコンテキストウィンドウでも高速性を維持しながら、特にツール使用やエージェント的なタスクにおいて優れた性能を発揮する。671億パラメータの混合エキスパートモデルでありながら、完全オープンソース・MITライセンスで公開されている点も特筆に値する。

DeepSeek V3.2の登場
DeepSeek 3.2が登場しました。そして私たちは人工知能の世界で再びDeepSeekモーメントを迎えています。3.2は公式に、国際数学オリンピックで金メダルを獲得した初のオープンソースモデルとなりました。OpenAIやAnthropicといったクローズドソースの最先端ラボのトップモデルたちを打ち負かしているのです。そして彼らはこれを、予算のほんの一部で、しかも驚異的な効率性で成し遂げました。
それでは、今すぐ全てを詳しく解説していきましょう。こちらがDeepSeekの公式アカウントからのツイートで、DeepSeek v3.2と3.2 specialを発表しています。エージェント向けに構築された推論ファーストモデルです。ツイートにあるように、DeepSeek 3.2には3つのフレーバーがあります。3.2の通常の思考モデルと、それから3.2 specialのmax思考モデルがあります。
ベンチマーク結果の比較
これらのベンチマークを見てください。こちらにGPT-5 High、Gemini 3.0 Pro、Kimi K2 thinking、そしてこれらがトップモデルです。唯一欠けているのはOpus 4.5です。こちらがAIME 2025です。GPT-5 Highが94.6、Gemini 3.0 Proが95、そしてDeepSeek V3.2 Specialが96となっています。
さて、括弧内に表示されているのは使用されたトークン数です。お分かりのように、通常の思考モデルではGPT-5 HighやGemini 3.0 Proと比較してかなりトークン効率が良いのですが、モデルの特別版が使用されると大量のトークンを使用します。確かにトークン効率は良くありませんが、信じられないほど高いスコアを記録しています。
こちらがLive CodeBenchで、specialが88.7に対して84.5、通常の思考モデルは83.3です。こちらがGPQA Diamondで、GPT-5 Highが85.7、3.0 Proが91.9、そしてDeepSeek V3.2 Specialが85.7となっています。
3つの主要な技術革新
DeepSeekはこの新しいモデルでいくつか本当に斬新なことを行いました。そしてDeepSeekが知られているのは、これらのモデルを構築する際のアルゴリズム面で本当に限界を押し広げることです。
ここでの2つの主要なブレークスルーは、1つ目がDeepseekスパースアテンションです。彼らは基本的にアテンション機構を更新しました。ご存知のように「アテンションこそが全て」を信じられないほど効率的にしたのです。私たちはDSAを導入しました。これは長いコンテキストシナリオにおいてモデルのパフォーマンスを維持しながら計算複雑度を大幅に削減する効率的なアテンション機構です。
アテンション機構の効率を改善することで可能になるのは、速度を犠牲にすることなくこれらのモデルのコンテキストウィンドウを増やすことです。過去3年間のすべてのモデルリリースで気づいたことがあるかもしれませんが、コンテキストウィンドウはあまり拡大していません。
これは、コンテキストウィンドウを増やすための数学が二次関数的だからです。つまり、コンテキストウィンドウを増やすと、その増加したコンテキストウィンドウを可能にするための計算コストが二次関数的に増加します。これは基本的に大幅に増加することを意味します。
彼らができた2つ目のことは、スケーラブルな強化学習フレームワークへの投資です。堅牢な強化学習プロトコルを実装し、トレーニング後の計算をスケールすることで、DeepSeek v3.2はGPT-5に匹敵するパフォーマンスを発揮します。特に、私たちの高計算バリアント3.2 specialはGPT-5を上回り、Gemini 3.0 Proと同等の推論能力を示し、2025年のIMOとIOIの両方で金メダルレベルのパフォーマンスを達成しています。
そして3つ目が、大規模エージェントタスク合成パイプラインです。これらのモデルはすべてエージェント使用に関するもので、特にツール呼び出しに優れています。彼らがそれを実現できた方法は、合成エージェントデータを作成するために特別に環境をセットアップしたことです。推論をツール使用シナリオに統合するために、私たちは大規模にトレーニングデータを体系的に生成する新しい合成パイプラインを開発しました。
非常にクールです。AI作成プロセスから人間をより多く排除できれば、よりスケーラブルになります。
Zapierによる提供
ところで、ツール使用に特化したAIモデルがお好きなら、今日のビデオのスポンサーであるZapierで8,000以上のツールを使うことができます。Zapierとは何でしょうか。Zapierを使えば、アプリとAIツールを一緒に接続して自律的に動作させることができます。
トリガーを設定し、AIに何をしてほしいかを選択すれば、Zapierが自動的に実行します。Zapierを使えば、ワークフローの途中にAIを組み込んでスーパーチャージすることができ、メールの下書き作成、メモの要約、コンテンツ生成、データの更新など、何も触れることなく実行できます。私は10年以上Zapierを使っています。
現在の会社でも使っていますし、Instagramの投稿を簡単に自動化する自動化を作ったばかりです。投稿したい内容の記事をドラッグ&ドロップするだけで、テキストを作成するだけでなく、画像も作成し、すべてを自動的に投稿します。超シームレスで、その特定の自動化へのリンクを下に掲載します。
それをクリックしてコピーして、追加することができます。Zapierは8,000以上の異なるアプリと統合しています。基本的にステロイドを使ったMCPのようなもので、実際にMCPエンドポイントもあります。ぜひチェックして、私が紹介したと伝えてください。下のリンクをクリックして私のワークフローをコピーしてください。
そして改めて、このビデオのスポンサーになってくれたZapierに感謝します。それではビデオに戻りましょう。
強化学習への大規模投資
さて、少しの間、強化学習について話しましょう。彼らは計算予算の10%以上を強化学習に費やしました。10%は多く聞こえないかもしれませんが、それ以前のほぼすべてのモデルと比較すると、かなりの量です。これを聞いてください。
特に、このフレームワークは事前トレーニングコストの10%を超えるトレーニング後の計算予算を割り当て、高度な機能を解放します。そして、これらのモデルをエージェント使用ケースで本当に優れたものにするために、これを聞いてください。彼らはエージェントタスクのために1,800以上の異なる環境と85,000の複雑なプロンプトを生成しました。この広範な合成データがRLプロセスを推進し、エージェントコンテキストにおけるモデルの汎化と指示追従能力を大幅に向上させています。
アテンション機構の重要性
さて、ここが非常に重要な部分です。彼らがこのモデルをトレーニングするために使用したアテンション機構がなぜそれほど重要なのか。DSA、DeepSeekアテンションは、メインモデルのコアアテンション複雑度をビッグOのL2からビッグOのL×Kに削減します。これが混乱するように聞こえる場合、最も簡単な考え方は、この例ではアテンション複雑度を指数関数的にスケールするのではなく、より線形的にスケールしているということです。
それは、爆発的なコストと制御されたコストの違いです。つまり、要点は実行コストがはるかに安いということです。そして前述のように、ツール使用に非常に優れています。ツール使用ベンチマークにおいて、DeepSeek V3.2はオープンソースとクローズドソースのLLMの間のパフォーマンスギャップを大幅に縮小しています。それでもFrontierモデルには及びませんので、ツール使用において完全にFrontierレベルではありませんが、それでも本当に優れていて非常に近いです。
モデルの仕様と利用可能性
さて、このモデルはFrontierですが、6,710億パラメータと比較的小さいです。推論時に370億のアクティブパラメータを持つ混合エキスパートモデルです。FP8でこれを実行したい場合、700GBのVRAMで実行できます。そして、完全なBF-16で実行したい場合は1.3テラバイトのVRAMが必要です。
このモデルは完全にオープンソースで、オープンウェイト、MITライセンスです。それでは以上です。モデルをチェックしてください。試してみてください。どう思うか教えてください。このビデオを楽しんでいただけたら、いいねとチャンネル登録をご検討ください。それでは次のビデオでお会いしましょう。


コメント