MiniMax M3:Opusに匹敵、17倍安価、完全オープン!

Anthropic・Claude・ダリオアモデイ
この記事は約11分で読めます。

MiniMaxチームが新たに発表したオープンウェイトモデルであるM3の解説である。M3は、コーディング機能、エージェントワークフロー、100万トークンのコンテキストウィンドウという3つの最先端機能を単一のモデルに統合し、ネイティブなマルチモーダル対応も果たしている。特筆すべきはそのコストパフォーマンスであり、GPT 5.5やClaude Opusを凌駕するベンチマークスコアを記録しながら、利用価格を大幅に抑えている。独自のスパースアテンションであるMSAにより、速度を落とさずに長大なコンテキストを処理できる。さらに、CUDAカーネルの最適化や3Dシミュレーションの生成、SVGアニメーションの作成など、実際のデモンストレーションを通じてその強力なプログラミング能力やフロントエンド設計の精度が確認できる。

MiniMax M3: Rivals Opus, 17x Cheaper, Fully Open!
🔗 MiniMax M3 official links:MiniMax Token Plan 12% OFF: Platform: https...

MiniMax M3の驚異的な性能と価格

MiniMaxチームが戻ってきました。彼らは初のオープンウェイトモデルであるM3をリリースしたばかりです。このモデルは、コーディング、エージェント的ワークフロー、そして100万トークンのコンテキストウィンドウという3つの最先端の能力をひとつのモデルに組み込んでいます。そのすべてに加えて、ネイティブなマルチモーダル対応でもあります。

そして本当に驚くべきはその価格です。最先端のパフォーマンスとオープンウェイトを手に入れながら、人々が毎日使っているほとんどの最先端モデルよりも大幅に安価に利用できます。いくつかのベンチマークでは、実際にはOpus 4.7やGPT 5.5を上回っています。正直なところ、オープンモデルでここまでの結果が出るとは予想していませんでした。私が実行したデモについても後ほど紹介しますが、まずはこのモデルを実際に動かしている仕組みをお見せしましょう。ここでのアーキテクチャが大きな役割を果たしているからです。それでは本題に入りましょう。

独自のスパースアテンションと長文脈処理

この高い性能の大部分は、MiniMaxのスパースアテンション、すなわち彼らの新しいMSAアーキテクチャから来ています。これこそが、M3で最低51万2000トークンを保証しつつ、100万トークンのコンテキストウィンドウを実際に可能にしている技術です。なぜこれが重要かというと、長いコンテキストの処理方法に関わってくるからです。

標準的なアテンション機構では、すべてのトークンが他のすべてのトークンを参照します。そのため、入力が大きくなるとコストが急速に跳ね上がり、モデルの処理速度も低下してしまいます。しかし、MSAはスパースな構造を持っています。コンテンツのブロックをスコアリングして重要なものだけを選び出し、それらに対してのみアテンションを実行します。そのため、処理速度を落とすことなく長いウィンドウを維持できるのです。これが、長期にわたるエージェントタスクや大規模なコーディングプロジェクト、そして最近多くの人が行っている長時間の動画や文書の理解において、このモデルを強力なものにしている理由です。

ネイティブなマルチモーダル機能

また、MiniMax M3はネイティブなマルチモーダルモデルでもあります。多くのモデルは、個別の画像エンコーダーを訓練し、それを完成したテキストモデルに縫い合わせることで視覚機能を追加しています。しかしMiniMaxは、最初からテキストと画像を一緒に訓練し、事前学習を100兆トークン以上までスケールさせました。そのため、画像とテキストの表現は、最後に橋渡しされるのではなく、最初から同じ空間に存在しています。

これが実際の使用においてどのように現れるかというと、モデルが周囲のテキストと同じパスで画像について推論できるという点に表れます。彼らのフォーム記入テストでは、白紙のフォーム画像の正しい座標と正しい間隔ですべての入力フィールドを配置し、文字を書き込む前に座標計算を処理してのけました。つまり、文書の解析やスクリーンショットの読み取りなど、レイアウトが重要になるタスクにおいて、ただ画像を説明するのではなく、画像の構造そのものに作用しているのです。

ベンチマーク性能の比較

次にベンチマークを見てみましょう。特にコーディングとエージェントのベンチマークにおいて、全体的に高いパフォーマンスを示しています。ソフトウェアエンジニアリングのSWE-bench Proでは59%を記録し、これはGPT 5.5やGemini 3.1 Proを超え、Opusに迫る数値です。Terminal Bench 2.1では66%、MCP Atlasでは74%、そしてBrowser Chromeでは83.5%を記録し、Opus 4.7の79.3%を上回っています。

私にとって重要に思えるのは、オープンウェイトモデルが、Browser comp、SVG bench、OS Worldなど、これらの多くでOpusやGPT 5.5を実際に打ち負かしているという点です。これはこれまでにはあまり見られなかったことです。もちろん率直に言えば、これらは単なるベンチマークに過ぎません。最終的に重要なのは、本番環境で実際にどう機能するかです。ですから、私自身も独立したテストを行いましたし、みなさんも自分でテストをして独自の意見を持つべきだと思います。

長期的なエージェントタスクのデモ

それでも、長期的なタスクの実行結果は恣意的に選ぶのが難しいものです。そこで、彼らがそれを使って何をしたかの例をお見せしましょう。彼らが示した、語る価値のある長期的なタスクの例が3つあります。

1つ目はCUDAカーネルの最適化です。彼らはM3に、ホッパーGPU上で最適化するためのFPA gemカーネルを渡しました。しかも動くコードすら与えず、簡単なタスクの説明と壊れたTritonのスケルトンだけを渡したのです。するとモデルは約24時間作業を続け、147回のベンチマーク送信と約2000回のツール呼び出しを実行し、ハードウェアの利用率を7.6%から71.3%にまで押し上げました。これは誰も手を触れることなく、約9.4倍の速度向上を実現したことになります。

2つ目は、ICLR 2025の論文をゼロから再現するというもので、約12時間、18回のコミットを経てコアとなる実験を複製しました。ここでは、マルチモーダル側が論文から直接チャートを読み取り、長いコンテキストウィンドウが論文、コード、ログをすべて同時に保持していました。

そして3つ目、私が本当にクレイジーだと思うのはポストトレーニングのベンチマークです。これは、モデルが自身のトレーニングパイプラインを実行し、データを合成し、モデルを訓練し、評価し、反復するというもので、人間は一切関与できません。M3はOpus 4.7とGPT 5.5に次ぐ3位にランクインしました。

これら3つの例が実際にテストしているのは、長期的な一貫性です。モデルが自身の状態を保持し、何千ものステップにわたって自分の間違いから回復できるかどうか、ということです。20ステップほどで脱線してしまうようでは意味がありません。それが、エージェントが本番環境で役立つための実際の壁となっていました。これらの結果は、実際に自分でホストできるモデルにおいて、その点が改善されていることを示しています。

価格設定とAPIの利用

さて、このモデルに注目すべきもう一つの理由は価格設定です。実は今日の動画はMiniMaxの提供でお送りしているため、皆さんには追加で12%の割引が適用されます。現在50%オフのプロモーションが実施されており、GPT 5.5やOpusと競合するモデルでありながら、100万トークンあたり入力が30セント、出力が1ドル20セントという価格設定になっています。これは他社の料金を大きく下回っています。

サブスクリプションのルートとしては彼らのトークンプランもあります。少し変わっているのは、テキスト、画像、音声、音楽のすべてが1つの共有プールから引き出されるという点です。つまり、M3だけでなくモデルファミリー全体をカバーしています。20ドルのプランでは、1ヶ月に約17億のM3トークンを取得できます。先ほども言ったように、すべての階層で12%の割引が適用されます。リンクは説明欄と固定コメントにあります。

標準的なAPIやMiniMaxのコードプラットフォーム経由で実行することもできますし、Cloud Code、Cursor、Codecなどに直接組み込むこともできます。どこでも好きな場所で使えるので、ぜひ自分で試してみる価値があります。

フロントエンド設計とコード生成のテスト

それでは、この新しいモデルが生成した結果をいくつかお見せします。これらの生成はすべて、M3のAPIを直接呼び出して構築されたものです。設定は簡単です。MiniMaxのエンドポイントを指定し、キーを追加し、モデルをM3に設定するだけです。OpenAIやAnthropicのSDKと互換性があるので、ベースURLを入れ替えるだけで済みます。設定方法が分からない方のために、念のためドキュメントのリンクも下に貼っておきます。

これは私が作成を指示したグラスモーフィズムのデザインで、プロフェッショナルなダッシュボードを作ってくれました。まったく悪くないですね。もちろんこれはワンショットでの生成です。私が与えたプロンプトに基づいて、見事に的を射たものを作成しています。

そして2つ目の生成物は、ニューブルータリズムのスタイルで作成するよう指示したものです。これは非常に鮮やかで独特なスタイルを持つため、新しいモデルをテストする際によく使われるスタイルの一つで、モデルはそれをうまく表現する必要があります。この例を見ると、かなり良い仕事をしていることがわかります。アニメーションやスタイルフォーマットも追加されており、すべてが一貫しています。これはSaaSベースの企業を想定したものですが、その要件を明確に満たしているのがわかります。かなり素晴らしいですね。

私が特に気に入ったのは、例えば一番下にあるタスク追跡用の小さなCLIのような細かいディテールです。こういうところに新しいモデルの個性が少し表れていて、とても好感が持てます。そしてこちらはポートフォリオページのようなものです。これら3つの例すべてが示しているように、フロントエンドのデザインに関しては非常に優秀です。多くのトップモデルと同等レベルにあります。画像生成は指示していないので当然生成されていませんが、HTMLポートフォリオウェブサイトのシンプルなテンプレートとしては十分な仕事をしています。

高度なSVGアニメーション生成

先ほど言ったように、これら3つの例はフロントエンド側の能力を示すものですが、次のいくつかの生成結果はSVG側の能力を示しています。例えば、これは日の出と日の入りの完全なSVGアニメーションです。太陽が沈んでいくのがわかりますね。SVG生成においてこのモデルがどれほど有能かを示しています。このベンチマークでもかなり高いランキングを獲得しています。

覚えておいてほしいのは、SVGはすべてコードだということです。数学的な計算や図形、フォーマットなど、すべてがプログラムされています。だからこそ、これを理解し評価することが重要なのです。すべてがプログラミングされているので、例えばこのようにウィンドウを最小化しても、SVGコードで生成されているため、すべてが一貫性を保ったまま崩れません。

別の例もお見せしましょう。わかりやすいようにリロードしますね。Orbitという会社のアニメーションSVGロゴを作成するよう指示したところ、素晴らしい出来栄えになりました。デザインもとても素敵ですね。SVGなので、これを変更してもうまく機能します。少し位置がずれて漂っているパーティクルが1つありますが、まあ許容範囲でしょう。まったく悪くありません。

3Dシミュレーションの実行

最後に紹介する2つの生成結果は、私が作成を指示したシミュレーションのようなものです。まず最初にご覧いただいているのは、太陽系のシミュレーションです。これがモデルの能力の高さを示していると思います。これは3Dシミュレーションです。私たちの太陽系が見えますね。時間のスピードを上げたり、ズームインしたりできます。太陽もかなり綺麗に描かれていて、一貫性があります。様々な惑星を見ても、それぞれの特徴をうまく表現できています。

そして本当にクールなのは、先ほども言ったようにここで時間のスピードを変更できることです。スピードを遅くしたり、こんな風に上げたりできます。今は0.5倍速です。これがすべてワンショットのコーディングで作られているということが、モデルの能力を物語っています。もしモデルと対話して反復作業を行えば、さらに強力なデザインや機能を追加できるでしょう。しかし、コーディングにおいてモデルが最初からどれほど有能であるかという点がおわかりいただけると思います。

もう一つ例をお見せしましょう。これは布のシミュレーターです。これも作成が難しいものですが、モデルはやってのけました。実際に操作できるのがわかります。布を掴んで揺らしたりできますし、重力を強くしたり弱くしたりもできます。重力を減らせば当然布は浮き上がりますし、増やせば下に落ちます。また、布の硬さも調整できます。1に設定するとかなり硬い布になり、0に設定するととても簡単に動くようになります。

さらに風の機能もあります。今、風を強くしてみましたが、布が風に吹かれている様子がわかります。風を弱めれば布は下に落ちます。ワンショットでこの布シミュレーターを作り上げたことからも、このモデルがどれほどパワフルかがわかります。

結論と今後の展望

私が行った初期テストに基づくと、このモデルはM2.7から確実に進歩しており、価格帯や能力を考えても、皆さんが使うべき素晴らしいモデルだと断言できます。わずかなコストで最先端のモデルと同様のパフォーマンスを得ることができます。現在使っているモデルからの乗り換えを考えている方や、新しいモデルやサブスクリプションプランを試してみたいと考えている方にとって、MiniMax M3は最適な選択肢かもしれません。

皆さんがどう思うかはわかりませんが、もしこのモデルを試したことがあるなら、ぜひ意見を聞かせてください。まずは選択肢の一つとして持っておいて、いくつか試してみてから、自分の考えに基づいて決断を下すのが良いと思います。以上がMiniMax M3の紹介でした。

最後にお知らせですが、オープンウェイトと技術レポートの全文は約10日後に公開される予定です。自分でホストしたい方や、MSAの内部ドキュメントを深く掘り下げたい方は、その頃にまたチェックしてみてください。今すぐ使いたい場合、トークンプランでは1つのトークンプールからモデルファミリー全体を利用でき、20ドルのプランで月に約17億のM3トークンが使えます。そして、皆さんにはすべての階層で12%の割引が適用されます。リンクは説明欄とコメントに固定しておきますので、そちらも必ずチェックしてください。

今日の動画のスポンサーであるMiniMaxに改めて感謝します。今日の動画はこれで終わりです。チャンネル登録をよろしくお願いします。また、universeai.behive.com で新しいニュースレターをフォローし、メインチャンネルのWorld of AIの登録もお願いします。Xでもuniverse of AIZをフォローして応援してください。それでは、また次回の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました