[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-minimax-m1-open-hybrid-attention-reasoning-model-zh":3,"article-related-minimax-m1-open-hybrid-attention-reasoning-model-zh":33,"series-model-release-5b5fa24f-5259-4e9e-8270-b08b6805f281":84},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":25,"views":29,"created_at":30,"published_at":31,"topic_cluster_id":32},"5b5fa24f-5259-4e9e-8270-b08b6805f281","minimax-m1-open-hybrid-attention-reasoning-model-zh","MiniMax-M1：開源 1M Token 推理模型","\u003Cp data-speakable=\"summary\">MiniMax-M1 是一款開源推理模型，主打 100 萬 \u003Ca href=\"\u002Ftag\u002Ftoken\">Token\u003C\u002Fa> 上下文、8 萬 Token 輸出，還把 API 價格壓得很低。\u003C\u002Fp>\u003Cp>MiniMax 在 2025 年 6 月 16 日推出 \u003Ca href=\"https:\u002F\u002Fwww.minimax.io\u002Fnews\u002Fminimaxm1\" target=\"_blank\" rel=\"noopener\">MiniMax-M1\u003C\u002Fa>。這次最吸睛的不是模型名字，而是數字。100 萬 Token 上下文、8 萬 Token 推理輸出，還有 512 張 H800 跑了 3 週的訓練設定。\u003C\u002Fp>\u003Cp>更狠的是成本。MiniMax 說，整段強化學習只花了 534,700 美元。講白了，這是在告訴大家：大模型不一定非得燒到像失火一樣。它也可以很大，還可以算得精。\u003C\u002Fp>\u003Cp>對開發者來說，這種模型值不值得玩，重點不在宣傳詞。重點在它能不能真的讀長文件、看大程式碼庫、跑長 \u003Ca href=\"\u002Ftag\u002Fagent\">agent\u003C\u002Fa> 流程。MiniMax 把它放進 \u003Ca href=\"https:\u002F\u002Fwww.minimax.io\u002F\" target=\"_blank\" rel=\"noopener\">MiniMax\u003C\u002Fa> App、網頁版和 API，也接上 \u003Ca href=\"https:\u002F\u002Fdocs.vllm.ai\u002F\" target=\"_blank\" rel=\"noopener\">vLLM\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fsgl-project\u002Fsglang\" target=\"_blank\" rel=\"noopener\">SGLang\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002Fminimax\" target=\"_blank\" rel=\"noopener\">Hugging Face\u003C\u002Fa> 與 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FMiniMax-AI\" target=\"_blank\" rel=\"noopener\">GitHub\u003C\u002Fa>，就是想讓人直接上手。\u003C\u002Fp>\u003Ctable>\u003Cthead>\u003Ctr>\u003Cth>指標\u003C\u002Fth>\u003Cth>MiniMax-M1\u003C\u002Fth>\u003Cth>代表意義\u003C\u002Fth>\u003C\u002Ftr>\u003C\u002Fthead>\u003Ctbody>\u003Ctr>\u003Ctd>上下文長度\u003C\u002Ftd>\u003Ctd>1,000,000 tokens\u003C\u002Ftd>\u003Ctd>可處理超長文件與程式碼庫\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>推理輸出\u003C\u002Ftd>\u003Ctd>80,000 tokens\u003C\u002Ftd>\u003Ctd>適合長鏈思考與多步驟任務\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>RL 訓練算力\u003C\u002Ftd>\u003Ctd>512 H800 × 3 週\u003C\u002Ftd>\u003Ctd>顯示訓練規模很大\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>RL 成本\u003C\u002Ftd>\u003Ctd>534,700 美元\u003C\u002Ftd>\u003Ctd>MiniMax 主打效率\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>SWE-bench validation\u003C\u002Ftd>\u003Ctd>55.6% 到 56.0%\u003C\u002Ftd>\u003Ctd>軟體工程能力有競爭力\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>API 價格\u003C\u002Ftd>\u003Ctd>每百萬 tokens $0.4 \u002F $2.2\u003C\u002Ftd>\u003Ctd>輸入與輸出都偏低價\u003C\u002Ftd>\u003C\u002Ftr>\u003C\u002Ftbody>\u003C\u002Ftable>\u003Ch2>MiniMax 為什麼要做這種模型\u003C\u002Fh2>\u003Cp>我覺得這題很直白。現在大家都在比誰的模型更會講，MiniMax 直接改比誰能記更多。100 萬 Token 的上下文，不是拿來唬人而已。它能把長文件、長對話、長程式碼一起塞進去。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778797859209-ea1g.png\" alt=\"MiniMax-M1：開源 1M Token 推理模型\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這對實務工作很有感。你在做 code review、法務文件摘要、客服知識庫查詢，或者 agent 反覆呼叫工具時，模型常常不是不會想。它是前面內容太長，後面就忘了。\u003Ca href=\"\u002Ftag\u002F長上下文\">長上下文\u003C\u002Fa>就是在補這個洞。\u003C\u002Fp>\u003Cp>MiniMax 說 M1 用的是混合注意力設計，裡面有 \u003Ca href=\"https:\u002F\u002Fwww.minimax.io\u002Fnews\u002Fminimaxm1\" target=\"_blank\" rel=\"noopener\">Lightning Attention\u003C\u002Fa>。意思很簡單。它想把長序列的計算壓下來，讓模型在吃大\u003Ca href=\"\u002Fnews\u002Fdata-centers-pushing-homeowners-to-solar-zh\">資料\u003C\u002Fa>時，不要把伺服器搞得像在烤肉。\u003C\u002Fp>\u003Cul>\u003Cli>100 萬 Token 上下文\u003C\u002Fli>\u003Cli>8 萬 Token 推理輸出\u003C\u002Fli>\u003Cli>512 張 H800 參與訓練\u003C\u002Fli>\u003Cli>RL 成本 534,700 美元\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>這些 benchmark 到底怎麼看\u003C\u002Fh2>\u003Cp>先講結論。MiniMax-M1 不是只會秀參數。它把重點放在軟體工程、長上下文理解，還有工具使用。這三個方向都很實際，因為現在很多 AI 工作流，最後都會碰到程式、文件和工具鏈。\u003C\u002Fp>\u003Cp>在 \u003Ca href=\"https:\u002F\u002Fwww.swebench.com\u002F\" target=\"_blank\" rel=\"noopener\">SWE-bench\u003C\u002Fa> vali\u003Ca href=\"\u002Fnews\u002Fwhy-anthropic-gates-foundation-ai-public-goods-zh\">dati\u003C\u002Fa>on 上，MiniMax 公布 M1-40k 是 55.6%，M1-80k 是 56.0%。這個數字沒有把 \u003Ca href=\"https:\u002F\u002Fdeepseek.com\u002F\" target=\"_blank\" rel=\"noopener\">DeepSeek\u003C\u002Fa> 的 R1-0528 拉下來，後者是 57.6%。但它還是站在\u003Ca href=\"\u002Ftag\u002F開源模型\">開源模型\u003C\u002Fa>第一梯隊。\u003C\u002Fp>\u003Cp>長上下文部分就更有看頭。MiniMax 說，M1 在開源模型裡表現很強，甚至把 \u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fo3\u002F\" target=\"_blank\" rel=\"noopener\">OpenAI o3\u003C\u002Fa> 和 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\u002Fclaude-4\" target=\"_blank\" rel=\"noopener\">Claude 4 Opus\u003C\u002Fa> 也拉進比較。它自家說法是，M1 在這項測試排到第二，只輸給 \u003Ca href=\"https:\u002F\u002Fdeepmind.google\u002Ftechnologies\u002Fgemini\u002Fpro\u002F\" target=\"_blank\" rel=\"noopener\">Gemini 2.5 Pro\u003C\u002Fa>。\u003C\u002Fp>\u003Cblockquote>“This feature gives us a substantial computational efficiency advantage in both training and inference.” — MiniMax\u003C\u002Fblockquote>\u003Cp>這句話很重要。因為大家都知道長上下文很香，但也很貴。模型如果只會吃記憶體，最後還是沒人敢用。MiniMax 想說的是，它不只大，還想讓訓練和推理都算得過去。\u003C\u002Fp>\u003Cul>\u003Cli>SWE-bench：55.6% 到 56.0%\u003C\u002Fli>\u003Cli>DeepSeek-R1-0528：57.6%\u003C\u002Fli>\u003Cli>長上下文排名：第二，僅次於 Gemini 2.5 Pro\u003C\u002Fli>\u003Cli>工具使用測試：MiniMax 宣稱領先多數開源模型\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>價格才是這次的殺手鐧\u003C\u002Fh2>\u003Cp>很多模型一出來就愛講能力，價格卻藏到最後。MiniMax 這次反過來，把價格放得很前面。它的 API 在 0 到 20 萬 Token 區間，輸入每百萬 Token 只要 0.4 美元，輸出是 2.2 美元。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778797859128-3199.png\" alt=\"MiniMax-M1：開源 1M Token 推理模型\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>如果輸入超過 20 萬、到 100 萬 Token，輸入價格\u003Ca href=\"\u002Fnews\u002Fweb3-communication-trust-infrastructure-2026-zh\">變成\u003C\u002Fa>每百萬 Token 1.3 美元，輸出還是 2.2 美元。這個設計很有意思。它等於在說，長上下文可以用，但不是叫你亂塞資料。\u003C\u002Fp>\u003Cp>這種定價對開發者很實際。你要跑長文件摘要、程式碼 refactor、知識庫問答，或者 agent 反覆讀寫資料，成本會直接影響你要不要上線。MiniMax 這次就是在搶這塊。\u003C\u002Fp>\u003Cul>\u003Cli>0 到 20 萬輸入：每百萬 Token 0.4 美元\u003C\u002Fli>\u003Cli>0 到 20 萬輸出：每百萬 Token 2.2 美元\u003C\u002Fli>\u003Cli>20 萬到 100 萬輸入：每百萬 Token 1.3 美元\u003C\u002Fli>\u003Cli>20 萬到 100 萬輸出：每百萬 Token 2.2 美元\u003C\u002Fli>\u003C\u002Ful>\u003Cp>更麻煩的是，這還不是只有 API 的事。MiniMax 說 M1 已經能在 App、網頁和開發工具鏈裡用。對團隊來說，工具先接得上，才有機會真的進 production。只會發 paper 的模型，通常都活不久。\u003C\u002Fp>\u003Ch2>跟其他模型比，差在哪裡\u003C\u002Fh2>\u003Cp>如果只看 100 萬 Token，上下文這件事其實已經不是 MiniMax 獨有。\u003Ca href=\"https:\u002F\u002Fdeepmind.google\u002Ftechnologies\u002Fgemini\u002Fpro\u002F\" target=\"_blank\" rel=\"noopener\">Gemini 2.5 Pro\u003C\u002Fa> 也有 100 萬 Token 級別的上下文。差別在於，MiniMax 把價格壓得更明顯，還把開源和部署支援一起端出來。\u003C\u002Fp>\u003Cp>再看開源陣營。\u003Ca href=\"https:\u002F\u002Fdeepseek.com\u002F\" target=\"_blank\" rel=\"noopener\">DeepSeek\u003C\u002Fa> 的 R1 系列在推理圈很有名，\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fmeta-llama\u002Fllama3\" target=\"_blank\" rel=\"noopener\">Meta Llama\u003C\u002Fa> 系列則有更大的生態。MiniMax 的打法比較像是：我不一定要在所有榜單都第一，但我要在長上下文、成本、工具使用這幾個點很能打。\u003C\u002Fp>\u003Cp>這種策略其實很合理。現在企業採購 AI，不會只看單一 \u003Ca href=\"\u002Ftag\u002Fbenchmark\">benchmark\u003C\u002Fa>。你還得看部署難度、推理速度、價格、以及能不能接到既有的伺服器和軟體堆疊。M1 的優勢，就是它把這幾件事綁在一起賣。\u003C\u002Fp>\u003Cul>\u003Cli>Gemini 2.5 Pro：同樣主打超長上下文\u003C\u002Fli>\u003Cli>DeepSeek R1：推理能力強，SWE-bench 更高\u003C\u002Fli>\u003Cli>Meta Llama：開源生態成熟，但長上下文不是唯一賣點\u003C\u002Fli>\u003Cli>MiniMax-M1：價格和長上下文一起打\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>這代表整個 AI 產業什麼事\u003C\u002Fh2>\u003Cp>我覺得這波很像一個轉向。前兩年大家在拼參數和聊天能力，現在開始拼「你到底能不能真的做事」。做事就會碰到長文件、長流程、長記憶，還有工具呼叫。這些都很吃上下文。\u003C\u002Fp>\u003Cp>所以 100 萬 Token 不只是規格表上的數字。它其實在暗示一件事：模型會越來越像工作引擎，不只是聊天機器人。你丟進去的不是一句 prompt，而是一整包資料、規則、歷史紀錄和程式碼。\u003C\u002Fp>\u003Cp>MiniMax 這次還把訓練成本講得很細。512 張 H800、3 週、53.47 萬美元。這些數字的用意很明顯。它想讓市場相信，超長上下文不是只能靠超大預算堆出來。\u003C\u002Fp>\u003Cp>但我也不會把話說滿。模型規格漂亮，不等於每個工作都適合。真正的考驗，是你的資料格式、你的 prompt 工程、還有你的延遲需求。別忘了，Token 再大，回應慢到像在等公車，也沒人想用。\u003C\u002Fp>\u003Ch2>接下來可以怎麼看 M1\u003C\u002Fh2>\u003Cp>如果你是開發者，我會建議你先拿它測三件事。第一是長文件摘要。第二是大程式碼庫問答。第三是多步驟 agent 任務。這三個場景最容易看出模型有沒有真材實料。\u003C\u002Fp>\u003Cp>如果你是產品或 AI 工程師，就該盯成本。API 價格低，代表你有機會把更長的上下文塞進產品，但前提是你要算得出 ROI。不是每個功能都值得開到 100 萬 Token。很多時候，20 萬就夠了。\u003C\u002Fp>\u003Cp>MiniMax-M1 這次給市場的訊號很清楚。開源模型的競爭，已經不是單純比誰更會講。接下來更重要的是，誰能把長上下文、推理品質和成本一起做平衡。你如果正在選模型，這會是很值得實測的一個選項。\u003C\u002Fp>","MiniMax 推出 M1 開源推理模型，主打 100 萬 Token 上下文、8 萬 Token 輸出與低價 API。","www.minimax.io","https:\u002F\u002Fwww.minimax.io\u002Fnews\u002Fminimaxm1",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778797859209-ea1g.png","model-release","zh","6c57f6bf-1023-4a22-a6c0-013bd88ac3d1",[17,18,19,20,21,22,23,24],"MiniMax-M1","開源推理模型","100萬Token上下文","長上下文模型","AI API價格","SWE-bench","vLLM","SGLang",[26,27,28],"MiniMax-M1 主打 100 萬 Token 上下文與 8 萬 Token 輸出，定位很明確。","它把 API 價格壓低，目標是讓長上下文不再只屬於高預算團隊。","對開發者來說，真正該測的是長文件、程式碼庫和 agent 工作流。",6,"2026-05-14T22:30:38.636592+00:00","2026-05-14T22:30:38.611+00:00","0ccb5d2e-69f1-4354-a3e0-cb370221cd95",{"tags":34,"relatedLang":43,"relatedPosts":47},[35,36,38,40,41],{"name":18,"slug":18},{"name":19,"slug":37},"100萬token上下文",{"name":17,"slug":39},"minimax-m1",{"name":20,"slug":20},{"name":21,"slug":42},"ai-api價格",{"id":15,"slug":44,"title":45,"language":46},"minimax-m1-open-hybrid-attention-reasoning-model-en","MiniMax-M1 brings 1M-token open reasoning model","en",[48,54,60,66,72,78],{"id":49,"slug":50,"title":51,"cover_image":52,"image_url":52,"created_at":53,"category":13},"1985ce38-03c6-4968-96fa-b751553bbef3","why-claude-opus-48-is-not-the-big-story-zh","為什麼 Claude Opus 4.8 不是大新聞","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780531367297-nrfs.png","2026-06-04T00:02:24.633987+00:00",{"id":55,"slug":56,"title":57,"cover_image":58,"image_url":58,"created_at":59,"category":13},"8810b91a-9aa2-4cd6-a58b-18fad5897423","devin-booker-sedona-mcdonalds-shoe-launch-zh","Booker把Sedona麥當勞變鞋款發表場","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780510686292-fm1k.png","2026-06-03T18:17:31.966783+00:00",{"id":61,"slug":62,"title":63,"cover_image":64,"image_url":64,"created_at":65,"category":13},"d4d7e664-cc7f-4211-a733-b7c111b86bd6","best-open-source-llms-2026-ranked-zh","2026 最佳開源 LLM 排名","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780396385004-yyka.png","2026-06-02T10:32:37.264398+00:00",{"id":67,"slug":68,"title":69,"cover_image":70,"image_url":70,"created_at":71,"category":13},"06774dfe-08eb-4a53-a8f7-36389b462c2b","llama-3-1-70b-specs-benchmarks-deployment-zh","Llama 3.1 70B：規格與部署","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780395481064-5yri.png","2026-06-02T10:17:33.072306+00:00",{"id":73,"slug":74,"title":75,"cover_image":76,"image_url":76,"created_at":77,"category":13},"e8ee6f00-cf62-41e6-83b7-92ce148fe46e","kill-bill-whole-bloody-affair-4k-blu-ray-zh","《追殺比爾：血腥全集》4K 藍光上市","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780364908972-15qn.png","2026-06-02T01:48:00.707278+00:00",{"id":79,"slug":80,"title":81,"cover_image":82,"image_url":82,"created_at":83,"category":13},"893178f1-7aba-4a0c-a3cf-1812c9d3283e","almalinux-10-2-9-8-new-stacks-zh","AlmaLinux 10.2 與 9.8 更新了什麼","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780291073047-7bxy.png","2026-06-01T05:17:27.940241+00:00",[85,90,95,100,105,110,115,120,125,130],{"id":86,"slug":87,"title":88,"created_at":89},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","2026-03-26T07:18:45.861277+00:00",{"id":91,"slug":92,"title":93,"created_at":94},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":96,"slug":97,"title":98,"created_at":99},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":101,"slug":102,"title":103,"created_at":104},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":106,"slug":107,"title":108,"created_at":109},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":111,"slug":112,"title":113,"created_at":114},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","xiaomi-mimo-v2-pro-1t-moe-agents-zh","小米 MiMo-V2-Pro 登場：1T MoE 模型","2026-03-28T03:06:19.002353+00:00",{"id":116,"slug":117,"title":118,"created_at":119},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":121,"slug":122,"title":123,"created_at":124},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","2026-03-29T04:52:57.886544+00:00",{"id":126,"slug":127,"title":128,"created_at":129},"c679b51f-194a-463b-87fc-7695256ff752","mimo-v2-pro-vs-omni-vs-flash-2026-zh","MiMo V2 Pro、Omni、Flash 怎麼選","2026-04-02T01:18:43.576128+00:00",{"id":131,"slug":132,"title":133,"created_at":134},"3b988fd7-6749-4f01-ba25-c0ad7486dc31","z-ai-glm-5v-turbo-design2code-claude-zh","GLM-5V-Turbo 在 Design2Code 贏了…","2026-04-02T04:03:36.31741+00:00"]