MiniMax M3 把 1M Token 送進寫碼場

OraCore Editors

返回首頁

[MODEL] 2026年6月13日6 分鐘閱讀OraCore 編輯部

MiniMax M3 把 1M Token 送進寫碼場

MiniMax M3 主打 100 萬 Token 長上下文、程式碼與 agent 任務，還支援多模態輸入。這篇看它和 GPT-4o、Claude、Gemini 的差別。

MiniMax M3 agent模型程式碼模型長上下文 100萬Token

分享 LinkedIn

MiniMax M3 是一個主打寫程式、agent 任務和超長上下文的旗艦模型。

說真的，這顆模型很會挑戰開發者的耐心。MiniMax 把 M3 推上旗艦位，直接打出 100 萬 Token 上下文。它還加上原生多模態，目標很明確，就是要讓模型一次看更多、記更久、做更多。

這種規格不是拿來聊天而已。它比較像是要進 codebase、看文件、讀 log，再一路跑完工具鏈。對台灣團隊來說，這種模型最有感的地方，通常不是 demo，而是處理大專案時少切幾次上下文。

項目	內容
模型	MiniMax M3
上下文長度	1,000,000 tokens
主打場景	寫程式與 agent 任務
能力	原生多模態理解

MiniMax 這次押寶長上下文

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

先講白了，100 萬 Token 不是裝飾品。它會直接改變你看待資料的方式。以前要把 repo 拆成很多段，現在可以把更多檔案、規格、錯誤訊息放在同一個 session。

這對大型專案很有感。尤其是 bug triage、架構審查、文件比對，還有那種一看就知道會拖很久的整合工作。模型如果能同時看懂更多內容，人工來回補資料的次數就會少很多。

MiniMax 把 M3 綁在 agent 任務上，也很合理。agent 不是單次問答。它要分步驟做事，還要記得前面的限制。上下文越長，模型越有空間保留前文。

100 萬 Token 可放進更大的 codebase
主打程式碼與 agent 工作流
支援原生多模態輸入
目標是減少反覆切上下文

100 萬 Token 對開發者到底有多實際

長上下文很容易被拿來喊口號。問題是，真的好用時，它會改變工作流程。你不用一直裁切文件，也不用把錯誤紀錄分成十段貼上來。

對寫程式的人來說，這很像把短記憶變長記憶。模型可以同時看到更多函式、更多依賴、更多測試結果。這對找 bug 很有幫助，因為很多問題不是出在單一檔案，而是出在檔案之間的關係。

不過，長上下文也不是萬靈丹。模型如果抓不到重點，讀再多也沒用。它還是得知道哪裡是規格，哪裡是噪音，哪裡是你真的要它修的地方。

“The real challenge is not just getting a model to read more text, but getting it to use that extra context well.” — Andrej Karpathy, former Tesla AI director

這句話很對味。長上下文的價值，不在數字有多大。重點是模型能不能把那些 Token 用在對的地方。

如果你拿 M3 來做內部工具，它可能適合 code review、文件整理、客服知識庫整理，還有長對話式排錯。這些場景都很吃上下文，也很吃穩定度。

拿來跟 GPT、Claude、Gemini 比一下

這裡先講現實面。M3 不是唯一在拼長上下文的模型。GPT-4o、Claude、Gemini 都已經把多模態和長上下文玩得很熟。

M3 的切法比較直接。它不是先講聊天體驗，而是先講寫程式和 agent。這對開發者來說其實蠻務實，因為真正會掏錢的團隊，通常在意的是能不能處理大專案，而不是模型名氣多響。

如果只看功能方向，M3 的位置很清楚。它想把長上下文、多模態、工具型工作一次包進來。這種組合，對內部開發平台、研究助理、支援系統都很有吸引力。

GPT-4o：強在快速多模態互動
Claude：常用在長文推理與寫碼
Gemini：主打多模態與大上下文
MiniMax M3：主打 100 萬 Token 與 agent 工作流

這裡還有一個現實差異。大廠模型通常先把通用能力做滿，再往垂直場景延伸。MiniMax 這次是直接把焦點放在程式碼和 agent，路線比較硬派，也比較容易讓開發者立刻知道它是拿來幹嘛的。

如果 M3 在長 session 裡還能維持穩定輸出，那它就不只是規格漂亮。它會變成一個真的能上工的工具。反過來說，如果它只是 Token 很大，實際表現卻一直跑掉，大家很快就會回頭用熟悉的選項。

這波其實是在搶 agent 工具入口

我覺得這才是重點。現在很多模型都在講 agent，但真正能跑起來的系統，靠的不只是對話介面。它還需要記憶、工具使用、步驟規劃，還有足夠長的上下文。

M3 的訊號很明確。MiniMax 不是只想賣一個聊天模型，而是想進到開發流程裡。你可以把它想成一個會看文件、會讀截圖、也會處理程式碼的助手。

對產品團隊來說，這種模型特別適合做內部知識助理。像是把設計稿、技術規格、issue 討論串和 log 一起丟進去，讓它幫你整理脈絡。這比單純問答更接近真實工作。

MiniMax 的挑戰也很直接。它要證明自己不是只有大數字。它得在長任務裡維持穩定，還要少犯那種會讓工程師翻白眼的低級錯誤。

MiniMax M3 放進產業脈絡看

現在的模型市場很像一場規格戰。大家都會講多模態，大家都會講長上下文。差別在於，誰能把這些能力真的塞進工作流程。

對台灣開發者來說，這件事很實際。很多公司不是在做純聊天產品，而是在做客服、內部搜尋、文件助理、程式輔助工具。這些場景都需要模型能讀很多資料，還要能接 API 和工具。

所以 M3 這種路線，會比單純的聊天模型更接近企業需求。尤其是資料量大的團隊，像 SaaS、新創、系統整合商，會更在意它能不能一次吃下整包上下文。

但也別太浪漫。模型再強，還是得看成本、延遲、穩定性，還有部署方式。這些才是最後會不會進 production 的關鍵。

我會怎麼看這顆模型

簡單講，M3 值得看，但別先高潮。它的 100 萬 Token 很吸睛，程式碼和 agent 方向也很對味。可是真正決定它能不能站穩的，是實測表現。

如果你是開發者，我會建議直接拿真實案例測。拿一個中型 repo、一份長規格、一串 bug log，外加幾張截圖。看它能不能少問幾次、少漏幾個條件。

MiniMax 已經把牌打出來了。接下來就看團隊會不會把它放進日常工作，而不是只拿來跑 demo。這種模型最後能不能留下來，不看宣傳詞，只看它有沒有真的幫你少做幾輪整理。

如果你最近也在找長上下文模型，先別看規格表。先問自己一句：它能不能讓你少切幾次 prompt，還能把任務做完？這個答案，比任何行銷詞都準。

// 相關文章

MiniMax M3 把 1M Token 送進寫碼場

MiniMax 這次押寶長上下文

訂閱 AI 趨勢週報

100 萬 Token 對開發者到底有多實際

拿來跟 GPT、Claude、Gemini 比一下

這波其實是在搶 agent 工具入口

MiniMax M3 放進產業脈絡看

我會怎麼看這顆模型

MiMo-V2-Flash 直衝開源 SWE-bench

OpenAI 低調送件 IPO

Gemini 3.5 Pro 6月登場，2M Token 夠猛

Unsloth 把 Kimi-K2.5 做成 GGUF 包

GPT-5.6先追前端，再談超越 Mythos

Claude Mythos 5：一天搬完5000萬行程式