[MODEL] 5 分鐘閱讀OraCore 編輯部

MiniMax M3:開源三合一模型

MiniMax M3 主打 1M context、原生多模態與寫程式能力,搭配 MiniMax Code。這篇整理它和 Claude、GPT 的差異。

分享 LinkedIn
MiniMax M3:開源三合一模型

MiniMax M3 是中國開源模型,主打寫程式、1M context 和原生多模態,還搭配 MiniMax Code。

說真的,這組合很有針對性。MiniMax 不是在拼聊天感,而是在拼開發者每天會碰到的事。它想解的問題很直接:程式碼要寫得準,文件要吃得下,圖片也要看得懂。

官方把 M3 定位成國內首個三合一開源模型。這三個能力,分別是寫程式、1M context、原生多模態。旁邊還有一個 MiniMax Code,把它包成可用的 coding agent

這種打法很務實。不是只秀 benchmark,而是把模型放進真實工作流。你可能會想問,這跟 ClaudeGPT-5 有什麼差別。答案是,MiniMax 想先吃下開發者場景,不是先搶通用聊天市場。

能力MiniMax M3意義
寫程式能力Frontier+對準開發與程式生成
Context1M tokens可處理超長程式庫與文件
多模態原生支援可直接處理圖文混合輸入
搭配產品MiniMax Code加上 agent 層,能做多步驟任務

為什麼開發者會在意

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

模型發布很多,真正有用的很少。開發者最怕三件事。第一,模型看不懂專案脈絡。第二,長文件一多就斷片。第三,截圖、UI、流程圖一進來就卡住。M3 就是衝著這三個痛點來的。

MiniMax M3:開源三合一模型

1M context 是最吸睛的數字。講白了,它讓模型能一次看更多內容。大型 repo、設計文件、issue 紀錄、PR 討論,都比較不需要切成一小塊一小塊丟。這對軟體團隊很實際,因為 prompt 切太碎,答案常常也會碎。

原生多模態也不是裝飾品。前端除錯、介面審查、流程圖理解,這些都常常混著圖片和文字。若模型真的能直接吃這種資料,工作流會順很多。至少不用一直把圖片轉來轉去,還要怕資訊掉光。

  • 寫程式能力對日常開發最直接。
  • 1M context 適合長 repo、長文件、長對話。
  • 原生多模態適合 UI、截圖、圖表。
  • 開源版本讓團隊更好部署與測試。

MiniMax Code 的角色

MiniMax Code 才是更像產品的部分。模型本體很重要,但 agent 層決定你能不能真的拿來改 code、跑修補、做 review。沒有這層,很多模型最後都只剩 demo。

這裡的重點是多步驟任務。寫程式不是只吐一段答案。你要它讀檔、理解、修改、再檢查。每一步都吃 context,也吃穩定性。MiniMax 把 M3 和 MiniMax Code 綁在一起,就是想把模型能力直接接到工作流。

官方說法也很直白。M3 在內部測試裡,手感比 Claude Sonnet 4.6 更好。可是它也承認,整體上還追不上 Claude Opus 4.7GPT-5.5。我覺得這種講法比亂吹更像正經產品團隊。

“M3 is the first time we’ve seen a domestic open model try to package coding strength, 1M context, and native multimodal support together.”

這句話很到位。重點不是 M3 有多神,而是它把三個常用能力塞進同一個開源模型。對開發者來說,這比單點刷榜更有意思。

和閉源大模型怎麼比

拿 M3 去比 OpenAIAnthropic 的頂規模型,不能只看單一分數。因為很多團隊真正要的是可部署、可檢查、可控成本。這些條件一上來,開源模型的價值就會變得很實際。

MiniMax M3:開源三合一模型

MiniMax 的策略也很清楚。它沒有說自己已經全面超車,而是把定位放在可用性。若 M3 在真實 coding 場景裡,確實比 Sonnet 4.6 更順手,那很多團隊會先看工作效率,不會先看榜單名次。

閉源模型通常在極限能力上還是強。這點不用硬拗。可是開源模型有另一種優勢,就是部署彈性。你可以自己測、自己調、自己決定資料流向。對企業和工具商來說,這常常比多 2 分 benchmark 更重要。

  • M3 主打實用,不是只拼理論上限。
  • Claude 和 GPT 仍可能在最難任務領先。
  • 開源模型更適合企業部署與內部整合。
  • 1M context 對大型專案特別有感。

還有一個現實問題。很多模型的長 context 只是規格漂亮,實際用起來會掉準度。真正重要的是,它能不能在長文件裡抓到關鍵資訊。這才是開發者會不會留下來用的原因。

這波在中國模型圈代表什麼

MiniMax 這次的打法,反映出中國模型市場的競爭方向。大家開始不只比參數,也比工作流。模型要能接 IDE,要能接文件系統,也要能接圖片和任務代理。單純聊天,已經不夠看了。

這也解釋了為什麼 1M context 這麼受關注。長上下文不是炫技。它直接影響模型能不能吃下大型軟體專案。對寫程式的人來說,這比「回答很像人」更有價值。

從產業角度看,M3 和 MiniMax Code 的組合,像是把模型、工具、代理層綁成一包。這種設計會越來越常見。因為企業買的不是單一 LLM,而是一整套能接進流程的軟體。

如果你在做產品,我會建議直接測三件事。第一,丟整個 repo。第二,丟長文件。第三,丟截圖和 bug report。這三關過了,M3 才算真的有料。

接下來該看什麼

接下來最重要的,不是 MiniMax 又發了幾張圖,而是社群實測會怎麼回饋。模型在官方 demo 裡很強,到了真實專案常常就露餡。這種事開發者看多了,早就不會只信海報。

我覺得 M3 的觀察點有兩個。第一,1M context 是不是只是數字好看。第二,MiniMax Code 能不能真的幫人少寫幾輪 prompt。只要這兩點成立,它就不是單純的中國開源模型新聞,而是能進開發流程的工具。

如果你是工程團隊,現在就該做一件事:拿你自己的 repo 測。不要拿玩具題。玩具題看不出差距。真實資料才會告訴你,M3 是能上線,還是只能留在發表會。