中國 AI 新創 MiniMax 正式發布旗艦模型 M3,在多項主流 agentic 與程式碼跑分上超越 GPT-5.5 與 Gemini 3.1 Pro,定價僅為美國頂尖閉源模型的 5-10%。
(前情提要:中國河南博士生創立 MiniMax,不到 OpenAI 1% 資金打造 3000 億市值 AI 平台)
(背景補充:MiniMax 準備 A 股 IPO 科創板!與智譜同步上市吸 AI 資本)
本文目錄
- M3 定價限時優惠
- MSA 如何把算力壓到 1/20、M3 極限在哪裡
- 企業主權與「閉源 vs 開源」之戰的轉折
MiniMax 於 6 月 1 日在官方部落格正式宣布 M3 上線,全價輸入 $0.6、輸出 $2.4 每百萬 token,僅是 GPT-5.5(約 $35 總成本)的不到 10%。
在 SWE-Bench Pro 程式碼工程指標上,M3 拿下 59.0%,超越 GPT-5.5 與 Gemini 3.1 Pro,而開源權重預計 10 天內發布。
M3 定價限時優惠
M3 的預訓練語料超過 100 兆 token、上下文視窗達 100 萬 token。定價策略同樣激進,限時一週的優惠價為輸入 $0.3、輸出 $1.20 每百萬 token;全價恢復後為輸入 $0.6、輸出 $2.40,換算總成本約 $1.50 至 3.00,對比 Claude Opus 4.8 的約 $30、GPT-5.5 的約 $35,差距是 10 到 20 倍。
訂閱端的定價部分,MiniMax 推出三檔 Token 方案:
- Plus 月付 $20 給約 17 億 token、可同時跑 3 到 4 個 agent
- Max 月付 $50 給約 51 億 token,並附帶每日 3 段 Hailuo 2.3 影片生成
- Ultra 月付 $120 給約 98 億 token、支援 6 到 7 個並發 agent。
MSA 如何把算力壓到 1/20、M3 極限在哪裡
M3 能以如此低價執行,根本原因是 MiniMax 自研的稀疏注意力架構 MSA(MiniMax Sparse Attention)。
標準 Transformer 的注意力計算量隨輸入長度「平方」成長(O(N²)),簡單來說就是,輸入加倍、計算量變四倍,長上下文的成本因此爆炸。MSA 像一位「智慧索引員」,不逐字逐句全量掃描,只挑出與當前生成最相關的區塊讀取。
實測數字:在 100 萬 token 滿載下,每 token 算力需求降至前一代的 1/20;預填充(prefill)階段加速 9 倍、解碼(decoding)階段加速 15 倍;內部測試顯示比現有開源稀疏注意力方案快 4 倍以上。
然而代價也要誠實寫出來。SWE-Bench Pro 上 M3 的 59.0% 對上 Claude Opus 4.8 的 69.2%,差距超過 10 個百分點;Terminal Bench 66.0% 對 74.6%、OSWorld 電腦操作任務 70.0% 對 83.4%。
在最硬的工程指標上,M3 仍落後當前最強閉源模型約一個身位。MiniMax 用成本換來的是「接近前沿」而非「超越前沿」的定位,這個取捨值不值得,最終將由用戶回答。
企業主權與「閉源 vs 開源」之戰的轉折
開源權重預計 10 天內上架 HuggingFace 與 GitHub,授權條款仍在確認中(MIT、Apache 2.0 或新的 OpenMDW 三選一),但無論哪一種,都意味著企業可以在自有伺服器上本地部署 M3,資料不流出私有雲,徹底迴避雲端資料外洩與廠商鎖定的風險,並可針對特定業務場景進行深度微調。
MiniMax 同步推出 agent 產品 MiniMax Code。它把一個大型工程任務拆給一支「Agent Team」,再用「生產者+驗證者」的對抗式迴圈互相把關,一個 agent 負責寫程式碼,另一個 agent 立刻測試、反駁、要求重來,讓系統能在沒有人盯著的情況下連續運作數天。
MiniMax 研究員在 X 分享了一個案例:M3 被要求自主執行 12 小時、重現 ICLR 2025 最佳論文的實驗,最後自主產出 18 個 commit、23 張實驗圖,核心實驗跑通,證明 M3 能連續自主作業數天。
📍相關報導📍
ChatGPT 問世三週年:大模型之戰告一段落,真正的護城河在哪?
Nvidia 親兒子 Reflection AI 擬再募資 25 億美元、估值狂飆至 250 億!主開啟源 AI 對抗中國 DeepSeek
彭博:中國「限制 AI 頂尖人才出境」,阿里、DeepSeek 高管被迫上繳護照








