MiniMax M3は正気ではない!最高のオープンソースAIモデル!Opus 4.7を打ち負かし50倍安い!(完全テスト済み)

GPT-5
この記事は約11分で読めます。

MiniMax M3は、コーディング、エージェントワークフロー、マルチモーダル推論の3つの最先端機能を単一モデルで統合した初のオープンウェイトAIモデルである。コンテキストウィンドウは最大100万トークンに対応し、ネイティブなマルチモーダルとして視覚理解とテキスト処理を最初から学習している。Swaybench ProやOS Worldなどのベンチマークにおいて、GPT 5.5やOpus 4.7、Gemini 3.1 Proなどのクローズドモデルに匹敵、あるいは凌駕する性能を示す。また、価格設定が非常に安価でありながら、フロントエンド開発、3Dシミュレーション、高度なSVG生成において驚異的な精度と創造性を発揮する点が最大の特徴である。

MiniMax M3 IS INSANE! BEST Opensource AI Model! Beats Opus 4.7 and 50x Cheaper! (Fully Tested)
MiniMax is back with one of the most shocking AI releases yet… and this one might genuinely change how we build software...

MiniMax M3の驚異的な性能と特徴

MiniMaxチームがついにMiniMax M3のローンチという大規模なリリースとともに戻ってきたようです。3つの最先端機能を単一のモデルに統合した初のオープンウェイトモデルとなります。M3は、コーディングやエージェントワークフローからマルチモーダル推論まで、あらゆる課題に取り組むよう設計された、彼らにとってこれまでで最も知的で有能なモデルです。本当に衝撃的なのは、オープンウェイトであり、ほとんどのプロプライエタリな最先端モデルよりも大幅に安価でありながら、最高レベルのパフォーマンスを得られることです。その大部分はMiniMaxのスパースアテンション、新しいMSAアーキテクチャによるものであり、これによりM3では最大100万トークンのコンテキストウィンドウが可能になります。長期間稼働するエージェント、大規模なコーディングプロジェクト、さらには長時間の動画や文書の理解において特に強力な力を発揮します。

さらに印象的なのは、M3が初日からネイティブなマルチモーダルモデルとして構築されたことです。後から視覚機能を追加するのではなく、MiniMaxは最初からテキストと視覚の理解を同時に学習しており、それが現実世界のテストですでに表れています。あるフォーム入力のベンチマークでは、M3は空白のフォーム画像上の正しい位置にすべての情報を配置することに成功し、見事な視覚的推論、文字の間隔、レイアウトの理解力を証明しました。しかし最も際立っていたのは、ドキュメント全体を完成させる前に、座標、間隔、フィールドの配置を慎重に処理していくステップバイステップの推論プロセスです。第一世代のマルチモーダルモデルとして、その結果は本当に素晴らしいものです。

主要ベンチマークでの圧倒的なスコア

ベンチマークに関して言えば、M3は完全なモンスターです。強力な自律的タスク分解、ツールの使用、マルチステップ推論機能により、トップクラスのコーディングおよびエージェントのパフォーマンスを提供します。Swaybench Proのような指標では、M3はGPT 5.5とGemini 3.1 Proの両方を上回り、Opus 4.7に迫っています。また、SVGベンチマークでもOpus 4.7を打ち負かし、Omni DobベンチマークではGemini 3.1 Proを凌駕し、Claw Evolveで最高スコアを達成し、Su Efficiency、Terminal Bench 2.1、Colonel Bench Hard、MCP Atlasの全体にわたって際立った結果を残しています。

しかし、私にとって本当に驚きなのは、ブラウザコンプやSVGベンチマークなどの多くの異なるベンチマークにおいて、オープンウェイトモデルがOpusとGPT 5.5の両方を上回っているのを目にすることです。Swaybench Pro、Kernelbench Hard、さらにはBanker ToolbenchでGPT 5.5を打ち負かし、OS WorldではOpusをも凌駕しています。オープンソースモデルからこのようなパフォーマンスが見られることは、本当に驚異的です。だからこそ、私はMiniMaxチームに大きな敬意を抱いています。私たちが普段よく使っているプロプライエタリな巨大モデルと正当に競争し、いくつかの分野では打ち負かすようなモデルをオープンソース化することは、正直なところ今回のローンチでは全く予想していませんでした。

現実世界のタスクとエージェント機能

ベンチマークスコアにとどまらず、MiniMaxは現実世界における魅力的なエージェント機能も示しました。ある実験では、M3は基本的にタスクの記述と実行不可能なTritonのスケルトンのみを使用して、Nvidia Hopper GPU上のF8 CUDAカーネルを最適化するよう求められました。24時間にわたり、自律的に147回の最適化イテレーションと2000回近いツール呼び出しを行い、ハードウェアの稼働率を7.6パーセントから71.3パーセントまで一気に向上させました。人間の介入なしで驚異的な9.4倍の高速化を実現したのです。

M3はまた、自律的にデータを合成し、モデルをトレーニングし、結果を評価して自ら反復処理を行うよう求められたポストトレインベンチマークで3位にランクインしました。Opus 4.7とGPT 5.5には及ばなかったものの、テストされた他のすべてのモデルを上回りました。しかし、このモデルが長期間のワークフローにおいて劇的に改善され、ハルシネーションを起こすことなく徹底的に仕事をやり遂げられるようになったというのは、ただただ信じられないことです。最高のAIツール、ワークフロー、最新情報を誰よりも早く手に入れたい方は、下の説明欄のリンクから完全無料のニュースレターにぜひご登録ください。

価格設定と技術仕様

技術的な仕様についてですが、M3は最低51万2000トークンを保証しつつ、最大100万トークンのコンテキストウィンドウをサポートしており、今日の最先端モデルの中で利用可能な最大のコンテキストウィンドウの1つとなっています。しかし、常軌を逸しているのはその価格設定です。MiniMaxは現在、標準利用料が50パーセントオフになるプロモーションを実施しており、入力コストを100万トークンあたり60セントから30セントに、出力コストを100万出力トークンあたり2ドル40セントからわずか1ドル20セントに引き下げています。補足すると、最大51万2000トークンまで対応し、GPT 5.5やOpus 4.7と競合し、場合によっては凌駕するモデルの価格設定としては、信じられないほど攻撃的です。

さらに、MiniMaxはアップデートされたMiniMaxトークンプランで手頃な価格をさらに追求しており、20ドルのプランには月に約17億M3トークンが含まれるという、信じられない内容になっています。特定のケースにおいてプロプライエタリな巨大モデルとほぼ同等の素晴らしいモデルをこれほど大量に利用できるため、彼らのトークンプランはまず検討し始めるべきものの1つかもしれません。このモデルを使い始める方法については、彼らのAPIを通じて簡単に行うことができます。彼らのMコードプラットフォームやOpen Routerを通じて使い始めることも可能です。オープンコードでは現在このモデルを完全無料で提供しているため、アクセスするための素晴らしい手段となります。

フロントエンド開発とデザインのテスト

私のテストでは、複数の異なる領域にわたってこのモデルを評価していきます。まずはフロントエンドから始めます。これはモデルが非常に優れたパフォーマンスを発揮する部分であり、個人的にはQuen 3.7 Maxよりも優れているとさえ思っています。このフロントエンドのプロンプトによる今回の生成結果はすべてが信じられないほど素晴らしく、高品質なUIコンポーネント、様々な種類のタイポグラフィ、動的な動きなど、すべてがこの出力で徹底的に生成されています。そして、このプロンプトだけでなく、Gemini 3.5 FlashとM3を比較するこのM3のプロンプトにおいても、レイアウト、間隔、コンポーネント構造への強いこだわりが見て取れます。

ここでは、強いカラーブロッキング、4色から5色、そして異なる変数システムを用いたランディングページの作成を要求しました。モデルがすべての動的な動きにおいて非常に優れていることがわかります。実際にこれを開いてみると、ずっと良く見えます。このランディングページのすべてが本当に、本当に良く見えますね。少しバグがあり、窮屈で、M3で見たものほど良く見えなかったGemini 3.5 Flashのものとは異なり、クリーンなデザインのすべてのコンポーネントを備え、本番環境で使えるレベルにずっと近いと感じました。

UIクローンと高度なウェブアプリケーション

ここでは、ブラウザベースのWindows 11のクローンを作成するよう要求しました。起動音や起動アニメーションからもそれがわかります。Windowsの起動シーンを再現する素晴らしい仕事をしました。PINを入力するか、入力せずにサインインして、ブラウザにログインできることがわかります。ひとつ気づいたのは、すべてのアプリケーションをSVGでコーディングするよう指示し忘れていたことです。ですからそれは私のミスであり、そうでなければこの出力で素晴らしい仕事をしてくれたはずです。

しかし、すべての音を追加するという素晴らしい仕事をしたことがわかります。すべての異なるアプリケーションのクローンがあり、メモ帳もあります。実際に動くペイントアプリまであります。3Dのトレンチランゲームまでありますね。これは実際かなりクールです。これを生成するよう指示したわけではないのに、モデルが自らやってのけました。出力はかなり良く見えますし、クリエイティブな出力を伴う機能的なゲームのようです。電卓、コマンドプロンプト、そして実際に音量を下げられる設定画面まであり、これは私が最初に本当にやりたかったことですが、全体としてこの出力は素晴らしい仕事をしてくれました。そして、これがこのモデルのフロントエンド生成の中でも特に優れたものの1つだと心から信じています。

3D開発と物理シミュレーション

次は、モデルのフロントエンドと3D開発能力のストレステストとなるもので、1990年代のテレビで9つの異なるチャンネルのシミュレーションを作成するよう要求しました。すぐに気づくことの1つは、このモデルの創造性です。1990年代当時と同じように、テレビの画面を凹面にしています。そして、モデルが複雑でインタラクティブな3GSアプリケーションを構築する素晴らしい仕事をしたことがわかります。その開発能力によって、3Dモデルや3D出力を伴う3GSに熟練しています。

さらに、UIコントロール、アニメーション、物理シミュレーション、そしてプロシージャルグラフィックスを、構築されたこの3Dの部屋やこれらすべての異なるチャンネルと組み合わせることさえ可能です。音まで追加されており、生成された要素として素晴らしいです。つまり3GSにおいて、このモデルは実際にかなり良い働きをします。3D開発に関しては、水テストのシミュレーションのようなものを生成するよう要求した際に、モデルはすべての異なるダイナミクスを深く理解し、物理演算やプロシージャルグラフィックスを出力に利用して、これらの様々な出力で信じられないほど素晴らしい結果を出します。

そして、これらの様々な出力で実際にかなりうまく機能します。M3がオープンソースモデルでありながら、このようなものを出力しているなんて信じられません。それだけでなく、自転車に乗るペリカンの3Dシーンは、適切なジオメトリを備えてかなり完成度が高いです。様々なコントロールや様々なアニメーションもあり、こうしたテストは、3Dグラフィックスを用いた視覚的に豊かでインタラクティブなウェブ体験を構築するM3の能力を際立たせています。

SVG生成の圧倒的なクオリティ

次にSVGに関してですが、MiniMax M3はSVGコードの出力という点で並外れた力を発揮します。ここではSVGで蝶を作成するよう要求したのですが、驚くべき仕事をしたことがわかります。アニメーションが施され、背景に雰囲気も追加するなどその創造性は非常に優れており、この出力においては見事な結果を出して、SVG出力の点ではGeminiに近いとさえ評価できます。

ここではPS4のSVGコントローラーを作成するよう要求しました。そしてこれは本当に驚くべきことです。コントローラーの一般的な外観を正確に出力できたという事実は素晴らしいです。なぜなら、Quen 3.7に実際にこのようなものを生成するよう頼むと、メインの構造やメインのキーパッドすら正しく作れずに失敗してしまうからです。

次は、ニューヨーク市のスカイラインをSVGコードで作成するようモデルに要求したものです。昼と夜の移り変わりと、車を追加するように指示しました。そして、ごまかしや水増しなしで最低2000行のコードを書くよう伝えました。昼と夜の移り変わり、雰囲気、そして追加されたこれら他のすべてのコンポーネントといった出力から、見事な仕事をしたことがはっきりとわかります。これこそが、SVGコードに使うモデルとしてこれがおそらく最高クラスの1つだと私が信じる理由です。驚くべき低価格でこれほど素晴らしい品質を出力できるからです。水増しやフィラーの代わりに意味のあるコードで2000行以上の長いSVG出力ファイルを維持することで、ほぼすべてを実現できました。アニメーション、シーンの構成、そして昼から夜へと変化するトランジションを追加することも可能です。

サポートのお願いとまとめ

この動画が気に入り、チャンネルをサポートしたいと思っていただけたら、下のスーパーサンクス機能からチャンネルへの寄付をご検討ください。あるいは、プライベートDiscordへの参加もご検討ください。そこでは、様々なAIツールの複数のサブスクリプションに毎月無料でアクセスできるほか、毎日のAIニュースや限定コンテンツなど、多くの特典があります。

全体として、MiniMax M3は特にコーディングのパフォーマンスと提供される価格の点で、今年最も印象的なモデルリリースの1つです。今日の動画で紹介したこれらの様々な領域のすべてにおいて格別です。そしてこれは、今日から簡単に使い始められるものです。最先端のモデルパフォーマンスを提供しながら、これほどまでにコスト効率の高い優れたモデルなのです。すべての開発者にとって大きな勝利であり、それがオープンソースでもあるというのはただただ信じられません。

今日の動画で使用したすべてのリンクは、下の説明欄に残しておきます。ということで皆さん、ご視聴いただき本当にありがとうございました。ぜひセカンドチャンネルも覗いてみてください。ニュースレターやDiscordへの参加、Twitterのフォローもお願いします。そして最後に、最新のAIニュースを常にチェックできるよう、チャンネル登録、通知ベルのオン、この動画への高評価をお願いします。過去の動画もぜひご覧ください。それでは皆さん、素晴らしい一日をお過ごしください。ポジティブな気持ちを広げていきましょう。また近いうちにお会いしましょう。彼は苦しんでいます。

コメント

タイトルとURLをコピーしました