MiniMax M3 正式發布：跑分接近 Claude Opus 4.7，但價格只要十分之一

中國 AI 新創 MiniMax 正式發布旗艦模型 M3，在多項主流 agentic 與程式碼跑分上超越 GPT-5.5 與 Gemini 3.1 Pro，定價僅為美國頂尖閉源模型的 5-10%。
（前情提要：中國河南博士生創立 MiniMax，不到 OpenAI 1% 資金打造 3000 億市值 AI 平台）
（背景補充：MiniMax 準備 A 股 IPO 科創板！與智譜同步上市吸 AI 資本）

本文目錄

Toggle

M3 定價限時優惠
MSA 如何把算力壓到 1/20、M3 極限在哪裡
企業主權與「閉源 vs 開源」之戰的轉折

MiniMax 於 6 月 1 日在官方部落格正式宣布 M3 上線，全價輸入 $0.6、輸出 $2.4 每百萬 token，僅是 GPT-5.5（約 $35 總成本）的不到 10%。

在 SWE-Bench Pro 程式碼工程指標上，M3 拿下 59.0%，超越 GPT-5.5 與 Gemini 3.1 Pro，而開源權重預計 10 天內發布。

M3 定價限時優惠

M3 的預訓練語料超過 100 兆 token、上下文視窗達 100 萬 token。定價策略同樣激進，限時一週的優惠價為輸入 $0.3、輸出 $1.20 每百萬 token；全價恢復後為輸入 $0.6、輸出 $2.40，換算總成本約 $1.50 至 3.00，對比 Claude Opus 4.8 的約 $30、GPT-5.5 的約 $35，差距是 10 到 20 倍。

訂閱端的定價部分，MiniMax 推出三檔 Token 方案：

Plus 月付 $20 給約 17 億 token、可同時跑 3 到 4 個 agent
Max 月付 $50 給約 51 億 token，並附帶每日 3 段 Hailuo 2.3 影片生成
Ultra 月付 $120 給約 98 億 token、支援 6 到 7 個並發 agent。

MSA 如何把算力壓到 1/20、M3 極限在哪裡

M3 能以如此低價執行，根本原因是 MiniMax 自研的稀疏注意力架構 MSA（MiniMax Sparse Attention）。

標準 Transformer 的注意力計算量隨輸入長度「平方」成長（O(N²)），簡單來說就是，輸入加倍、計算量變四倍，長上下文的成本因此爆炸。MSA 像一位「智慧索引員」，不逐字逐句全量掃描，只挑出與當前生成最相關的區塊讀取。

實測數字：在 100 萬 token 滿載下，每 token 算力需求降至前一代的 1/20；預填充（prefill）階段加速 9 倍、解碼（decoding）階段加速 15 倍；內部測試顯示比現有開源稀疏注意力方案快 4 倍以上。

然而代價也要誠實寫出來。SWE-Bench Pro 上 M3 的 59.0% 對上 Claude Opus 4.8 的 69.2%，差距超過 10 個百分點；Terminal Bench 66.0% 對 74.6%、OSWorld 電腦操作任務 70.0% 對 83.4%。

在最硬的工程指標上，M3 仍落後當前最強閉源模型約一個身位。MiniMax 用成本換來的是「接近前沿」而非「超越前沿」的定位，這個取捨值不值得，最終將由用戶回答。

企業主權與「閉源 vs 開源」之戰的轉折

開源權重預計 10 天內上架 HuggingFace 與 GitHub，授權條款仍在確認中（MIT、Apache 2.0 或新的 OpenMDW 三選一），但無論哪一種，都意味著企業可以在自有伺服器上本地部署 M3，資料不流出私有雲，徹底迴避雲端資料外洩與廠商鎖定的風險，並可針對特定業務場景進行深度微調。

MiniMax 同步推出 agent 產品 MiniMax Code。它把一個大型工程任務拆給一支「Agent Team」，再用「生產者＋驗證者」的對抗式迴圈互相把關，一個 agent 負責寫程式碼，另一個 agent 立刻測試、反駁、要求重來，讓系統能在沒有人盯著的情況下連續運作數天。

MiniMax 研究員在 X 分享了一個案例：M3 被要求自主執行 12 小時、重現 ICLR 2025 最佳論文的實驗，最後自主產出 18 個 commit、23 張實驗圖，核心實驗跑通，證明 M3 能連續自主作業數天。