MiniMax M3：開源三合一模型

OraCore Editors

返回首頁

[MODEL] 2026年6月6日5 分鐘閱讀OraCore 編輯部

MiniMax M3：開源三合一模型

MiniMax M3 主打 1M context、原生多模態與寫程式能力，搭配 MiniMax Code。這篇整理它和 Claude、GPT 的差異。

多模態模型開源模型 AI coding

分享 LinkedIn

MiniMax M3 是中國開源模型，主打寫程式、1M context 和原生多模態，還搭配 MiniMax Code。

說真的，這組合很有針對性。MiniMax 不是在拼聊天感，而是在拼開發者每天會碰到的事。它想解的問題很直接：程式碼要寫得準，文件要吃得下，圖片也要看得懂。

官方把 M3 定位成國內首個三合一開源模型。這三個能力，分別是寫程式、1M context、原生多模態。旁邊還有一個 MiniMax Code，把它包成可用的 coding agent。

這種打法很務實。不是只秀 benchmark，而是把模型放進真實工作流。你可能會想問，這跟 Claude、GPT-5 有什麼差別。答案是，MiniMax 想先吃下開發者場景，不是先搶通用聊天市場。

能力	MiniMax M3	意義
寫程式能力	Frontier+	對準開發與程式生成
Context	1M tokens	可處理超長程式庫與文件
多模態	原生支援	可直接處理圖文混合輸入
搭配產品	MiniMax Code	加上 agent 層，能做多步驟任務

為什麼開發者會在意

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

模型發布很多，真正有用的很少。開發者最怕三件事。第一，模型看不懂專案脈絡。第二，長文件一多就斷片。第三，截圖、UI、流程圖一進來就卡住。M3 就是衝著這三個痛點來的。

1M context 是最吸睛的數字。講白了，它讓模型能一次看更多內容。大型 repo、設計文件、issue 紀錄、PR 討論，都比較不需要切成一小塊一小塊丟。這對軟體團隊很實際，因為 prompt 切太碎，答案常常也會碎。

原生多模態也不是裝飾品。前端除錯、介面審查、流程圖理解，這些都常常混著圖片和文字。若模型真的能直接吃這種資料，工作流會順很多。至少不用一直把圖片轉來轉去，還要怕資訊掉光。

寫程式能力對日常開發最直接。
1M context 適合長 repo、長文件、長對話。
原生多模態適合 UI、截圖、圖表。
開源版本讓團隊更好部署與測試。

MiniMax Code 的角色

MiniMax Code 才是更像產品的部分。模型本體很重要，但 agent 層決定你能不能真的拿來改 code、跑修補、做 review。沒有這層，很多模型最後都只剩 demo。

這裡的重點是多步驟任務。寫程式不是只吐一段答案。你要它讀檔、理解、修改、再檢查。每一步都吃 context，也吃穩定性。MiniMax 把 M3 和 MiniMax Code 綁在一起，就是想把模型能力直接接到工作流。

官方說法也很直白。M3 在內部測試裡，手感比 Claude Sonnet 4.6 更好。可是它也承認，整體上還追不上 Claude Opus 4.7 和 GPT-5.5。我覺得這種講法比亂吹更像正經產品團隊。

“M3 is the first time we’ve seen a domestic open model try to package coding strength, 1M context, and native multimodal support together.”

這句話很到位。重點不是 M3 有多神，而是它把三個常用能力塞進同一個開源模型。對開發者來說，這比單點刷榜更有意思。

和閉源大模型怎麼比

拿 M3 去比 OpenAI 或 Anthropic 的頂規模型，不能只看單一分數。因為很多團隊真正要的是可部署、可檢查、可控成本。這些條件一上來，開源模型的價值就會變得很實際。

MiniMax 的策略也很清楚。它沒有說自己已經全面超車，而是把定位放在可用性。若 M3 在真實 coding 場景裡，確實比 Sonnet 4.6 更順手，那很多團隊會先看工作效率，不會先看榜單名次。

閉源模型通常在極限能力上還是強。這點不用硬拗。可是開源模型有另一種優勢，就是部署彈性。你可以自己測、自己調、自己決定資料流向。對企業和工具商來說，這常常比多 2 分 benchmark 更重要。

M3 主打實用，不是只拼理論上限。
Claude 和 GPT 仍可能在最難任務領先。
開源模型更適合企業部署與內部整合。
1M context 對大型專案特別有感。

還有一個現實問題。很多模型的長 context 只是規格漂亮，實際用起來會掉準度。真正重要的是，它能不能在長文件裡抓到關鍵資訊。這才是開發者會不會留下來用的原因。

這波在中國模型圈代表什麼

MiniMax 這次的打法，反映出中國模型市場的競爭方向。大家開始不只比參數，也比工作流。模型要能接 IDE，要能接文件系統，也要能接圖片和任務代理。單純聊天，已經不夠看了。

這也解釋了為什麼 1M context 這麼受關注。長上下文不是炫技。它直接影響模型能不能吃下大型軟體專案。對寫程式的人來說，這比「回答很像人」更有價值。

從產業角度看，M3 和 MiniMax Code 的組合，像是把模型、工具、代理層綁成一包。這種設計會越來越常見。因為企業買的不是單一 LLM，而是一整套能接進流程的軟體。

如果你在做產品，我會建議直接測三件事。第一，丟整個 repo。第二，丟長文件。第三，丟截圖和 bug report。這三關過了，M3 才算真的有料。

接下來該看什麼

接下來最重要的，不是 MiniMax 又發了幾張圖，而是社群實測會怎麼回饋。模型在官方 demo 裡很強，到了真實專案常常就露餡。這種事開發者看多了，早就不會只信海報。

我覺得 M3 的觀察點有兩個。第一，1M context 是不是只是數字好看。第二，MiniMax Code 能不能真的幫人少寫幾輪 prompt。只要這兩點成立，它就不是單純的中國開源模型新聞，而是能進開發流程的工具。

如果你是工程團隊，現在就該做一件事：拿你自己的 repo 測。不要拿玩具題。玩具題看不出差距。真實資料才會告訴你，M3 是能上線，還是只能留在發表會。

// 相關文章

MiniMax M3：開源三合一模型

為什麼開發者會在意

訂閱 AI 趨勢週報

MiniMax Code 的角色

和閉源大模型怎麼比

這波在中國模型圈代表什麼

接下來該看什麼

Opus 5 讓你少碰拒答

Claude Opus 5 以更低價格搶企業單

OpenAI 列出 GPT-5.6 三檔定價

Gemini 3.6 Flash 證明 Google 把效率放在 hype 前面

Kimi K3讀懂82萬行 Grok Build 代碼

GPT-5.6 三版本登場，Token 成本更低