[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-xiaomi-mimo-v2-pro-1t-moe-agents-zh":3,"article-related-xiaomi-mimo-v2-pro-1t-moe-agents-zh":27,"series-model-release-9e1044b4-946d-47fe-9e2a-c2ee032e1164":85},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":11,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":11,"views":25,"created_at":26,"published_at":26,"topic_cluster_id":11},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","xiaomi-mimo-v2-pro-1t-moe-agents-zh","小米 MiMo-V2-Pro 登場：1T MoE 模型","\u003Cp>小米這次真的把牌面打很大。\u003Ca href=\"https:\u002F\u002Fawesomeagents.ai\u002Fmodels\u002Fmimo-v2-pro\u002F\" target=\"_blank\" rel=\"noopener\">MiMo-V2-Pro\u003C\u002Fa> 總參數超過 1 兆，單次啟用 420 億。它還給你 100 萬 token context，起價每百萬 input token 1 美元。\u003C\u002Fp>\u003Cp>講白了，這不是拿來聊天裝可愛的模型。它是衝著 agentic coding 來的。成本、延遲、長上下文，這三個痛點一次全碰上。小米直接把它們攤在桌上。\u003C\u002Fp>\u003Cp>在 \u003Ca href=\"https:\u002F\u002Fwww.swebench.com\u002F\" target=\"_blank\" rel=\"noopener\">SWE-bench Verified\u003C\u002Fa> 上，小米宣稱它拿到 78.0%。這個分數很接近 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude-sonnet\" target=\"_blank\" rel=\"noopener\">Claude Sonnet 4.6\u003C\u002Fa> 的 79.6%。和 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude-opus\" target=\"_blank\" rel=\"noopener\">Claude Opus 4.6\u003C\u002Fa> 的 80.8% 也只差一點點。\u003C\u002Fp>\u003Ch2>小米到底端出什麼\u003C\u002Fh2>\u003Cp>MiMo-V2-Pro 是小米第二代 MiMo 系列的旗艦文字模型。它採用 Mixture-of-Experts，也就是 MoE。簡單說，總參數很大，但每個 token 只喚起其中一部分。\u003C\u002Fp>\u003Cp>這招很實際。你不用真的讓 1T 參數每次都跑一遍。那樣伺服器會先哭。MiMo-V2-Pro 每個 token 啟用 42B 參數，比較像是把大腦分工切開，讓不同專家輪流上場。\u003C\u002Fp>\u003Cp>小米還加了 7:1 hybrid attention pattern，外加輕量 Multi-Token Prediction 層。這些設計都指向同一件事。它想讓 agent loop 跑得更順，少一點卡頓，多一點連續操作。\u003C\u002Fp>\u003Cp>對開發者來說，最重要的不是架構圖，是能不能直接接。MiMo-V2-Pro 目前是 API only，沒有公開權重可抓。你可以從 \u003Ca href=\"https:\u002F\u002Fplatform.xiaomimimo.com\" target=\"_blank\" rel=\"noopener\">platform.xiaomimimo.com\u003C\u002Fa> 下手，也能走 OpenAI 相容端點 \u003Ca href=\"https:\u002F\u002Fapi.xiaomimimo.com\u002Fv1\" target=\"_blank\" rel=\"noopener\">api.xiaomimimo.com\u002Fv1\u003C\u002Fa>。它也上了 \u003Ca href=\"https:\u002F\u002Fopenrouter.ai\u002Fxiaomi\u002Fmimo-v2-pro\" target=\"_blank\" rel=\"noopener\">OpenRouter\u003C\u002Fa>。\u003C\u002Fp>\u003Cul>\u003Cli>總參數超過 1T\u003C\u002Fli>\u003Cli>每 token 啟用 42B\u003C\u002Fli>\u003Cli>標準 context 256K，延伸到 1M\u003C\u002Fli>\u003Cli>最大 completion 131,072 token\u003C\u002Fli>\u003Cli>標準 context 價格：input $1、output $3 \u002F 百萬 token\u003C\u002Fli>\u003Cli>256K 到 1M context：input $2、output $6 \u002F 百萬 token\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>為什麼 Hunter Alpha 會鬧這麼大\u003C\u002Fh2>\u003Cp>在小米正式揭曉前，AI 圈先被一個匿名模型搞得很熱。它叫 \u003Ca href=\"https:\u002F\u002Fopenrouter.ai\u002F\" target=\"_blank\" rel=\"noopener\">OpenRouter\u003C\u002Fa> 上的 Hunter Alpha。它大概在 2026 年 3 月 11 日出現，接著就開始吃掉大量流量。\u003C\u002Fp>\u003Cp>那個流量不是小數字。外界估計它每週處理約 5000 億 token。這種用量，通常不是小模型能扛的。大家自然會開始猜，背後是不是藏著什麼大傢伙。\u003C\u002Fp>\u003Cp>最先被拿來猜的，是 DeepSeek V4。原因也不難懂。小米研究主管羅福莉之前就在 DeepSeek 工作過。這讓整件事更像一場業界八卦接力。直到小米在 3 月 18 日確認，Hunter Alpha 就是 MiMo-V2-Pro，話題才從「這是誰」變成「小米怎麼做到這個價格」。\u003C\u002Fp>\u003Cblockquote>“I am a Chinese AI model primarily trained in Chinese.”\u003C\u002Fblockquote>\u003Cp>這句話就是當時的名場面。當模型被問自己是誰，它只回了這句。說真的，這種回答很像故意吊胃口。也很像一台還沒想好要不要自曝身分的 AI。\u003C\u002Fp>\u003Cp>小米還順手做了開發者拉新。像 \u003Ca href=\"https:\u002F\u002Fcline.bot\u002F\" target=\"_blank\" rel=\"noopener\">Cline\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.blackbox.ai\u002F\" target=\"_blank\" rel=\"noopener\">Blackbox\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.kilocode.ai\u002F\" target=\"_blank\" rel=\"noopener\">KiloCode\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.openclaw.ai\u002F\" target=\"_blank\" rel=\"noopener\">OpenClaw\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.opencode.ai\u002F\" target=\"_blank\" rel=\"noopener\">OpenCode\u003C\u002Fa> 這些工具，發表週都有免費 API 可試。這招很務實。真實開發者丟進去的 repo，才會把模型的毛病逼出來。\u003C\u002Fp>\u003Ch2>數字怎麼看，跟誰比才有感\u003C\u002Fh2>\u003Cp>如果只看宣傳詞，大家很容易麻木。還是得拿數字對照。MiMo-V2-Pro 最有感的地方，是它把接近頂級 coding 模型的分數，壓到更低的價格帶。\u003C\u002Fp>\u003Cp>在 SWE-bench Verified 上，小米給的成績是 78.0%。\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude-sonnet\" target=\"_blank\" rel=\"noopener\">Claude Sonnet 4.6\u003C\u002Fa> 是 79.6%。\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude-opus\" target=\"_blank\" rel=\"noopener\">Claude Opus 4.6\u003C\u002Fa> 是 80.8%。分數差距不大，價格差距就很有感。\u003C\u002Fp>\u003Cp>標準 context 下，MiMo-V2-Pro 是 input $1、output $3。Sonnet 4.6 是 $3 和 $15。Opus 4.6 則是 $5 和 $25。這種差距放到大量 agent traffic，帳單會很誠實地告訴你誰比較兇。\u003C\u002Fp>\u003Cp>在 agentic 任務上，小米還丟出 ClawEval 61.5。這個 benchmark 看的是多輪工具使用、錯誤修正、長程規劃。這些就是 coding agent 最常翻車的地方。MiMo-V2-Pro 在這裡高於 GPT-5.2 的 50.0，低於 Opus 4.6 的 66.3。\u003C\u002Fp>\u003Cul>\u003Cli>SWE-bench Verified：MiMo-V2-Pro 78.0%，Sonnet 4.6 79.6%，Opus 4.6 80.8%\u003C\u002Fli>\u003Cli>ClawEval：MiMo-V2-Pro 61.5，GPT-5.2 50.0，Opus 4.6 66.3\u003C\u002Fli>\u003Cli>Terminal-Bench 2.0：MiMo-V2-Pro 86.7\u003C\u002Fli>\u003Cli>GPQA Diamond：MiMo-V2-Pro 87%\u003C\u002Fli>\u003Cli>VentureBeat 引用的測試總成本：MiMo-V2-Pro $348，GPT-5.2 $2,304，Claude Opus 4.6 $2,486\u003C\u002Fli>\u003C\u002Ful>\u003Cp>我覺得最刺眼的是成本。VentureBeat 報的 benchmark 總帳單，MiMo-V2-Pro 只有 $348。GPT-5.2 是 $2,304。Claude Opus 4.6 是 $2,486。這不是差一點，是直接差一個級距。\u003C\u002Fp>\u003Ch2>它適合放進哪種產品\u003C\u002Fh2>\u003Cp>MiMo-V2-Pro 不是小米唯一的模型。這次它一次丟出三款。這很像在告訴你：別只看旗艦，整條產品線都有分工。\u003C\u002Fp>\u003Cp>\u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002FXiaomiMiMo\" target=\"_blank\" rel=\"noopener\">MiMo-V2-Flash\u003C\u002Fa> 是可自架的版本。它有 310B 總參數、15B active parameters，而且在 Hugging Face 上給了 MIT 授權。這對想控成本、控資料、控部署的人，吸引力很直接。\u003C\u002Fp>\u003Cp>小米還發了 \u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002FXiaomiMiMo\" target=\"_blank\" rel=\"noopener\">MiMo-V2-Omni\u003C\u002Fa>。它走多模態，能處理文字、圖片、影片、音訊。小米說它可以一次處理 10 小時以上連續音訊。價格則是 input $0.40、output $2.00 \u002F 百萬 token。\u003C\u002Fp>\u003Cp>所以三款的定位其實很清楚。你要本地控制，就看 Flash。你要多模態，就先試 Omni。你要最強 agentic coding 表現，就先拿 Pro 去跑你的流水線。\u003C\u002Fp>\u003Cp>但也別太快高潮。MiMo-V2-Pro 目前還有幾個空白。它沒有公開權重。完整總參數拆法也沒全公開。跨所有知識 benchmark 的對照表也不算完整。它也沒有多模態輸入。做文件理解或媒體流程的人，還是得另找模型。\u003C\u002Fp>\u003Cp>如果你問我值不值得試，我會說值得。不是因為它神。是因為它把「接近頂級 coding 成績」和「便宜很多」放在一起。這種組合，對 SaaS、內部工具、客服自動化、repo 修補 agent，都很有吸引力。\u003C\u002Fp>\u003Ch2>這波對開發圈代表什麼\u003C\u002Fh2>\u003Cp>中國模型廠現在很常做一件事。先把參數數字拉高，再把價格壓低。這招不新，但很有效。因為開發者最後看的是每次呼叫的成本，不是簡報封面。\u003C\u002Fp>\u003Cp>MiMo-V2-Pro 的出現，也讓 agent 模型的競爭更直接。以前大家比的是聊天品質。現在比的是能不能在長 context 裡穩定做事。能不能接工具。能不能修 repo。能不能在一堆失敗後還撐住。\u003C\u002Fp>\u003Cp>這也是為什麼 1M context 很重要。很多真實工作不是一問一答。是整包資料、整個專案、整段對話、整串 log 一起丟。你要的是記得住，也要跑得動。這兩件事常常互相打架。\u003C\u002Fp>\u003Cp>現在的關鍵問題很簡單。你的 agent stack，能不能把一部分 coding 流量切到 MiMo-V2-Pro，然後真的省下錢，還不掉穩定性？如果可以，那它就不是新聞而已。它會變成你月底帳單上的差異。\u003C\u002Fp>\u003Ch2>最後怎麼看\u003C\u002Fh2>\u003Cp>我會先把 MiMo-V2-Pro 當成一個值得測的高性價比選項。不是直接換掉現有主力，而是拿 20% 到 30% 的 coding 流量做 A\u002FB test。看修 bug 成功率、工具呼叫失敗率、平均 completion 成本。\u003C\u002Fp>\u003Cp>如果你的團隊現在就有大量 agent 工作，這款模型很適合放進試跑清單。尤其是那些要長上下文、要多輪操作、又很在意帳單的案子。先測，再決定要不要放大。\u003C\u002Fp>\u003Cp>說真的，這類模型現在比的是實戰，不是口號。你手上的 repo、log、ticket、CI 失敗紀錄，才是最好的考場。MiMo-V2-Pro 值不值得留下來，答案應該會很快出來。\u003C\u002Fp>","小米推出 MiMo-V2-Pro，總參數超過 1T、每 token 啟用 42B，還有 1M context。SWE-bench 成績逼近 Claude Sonnet 4.6，價格卻低很多。","awesomeagents.ai","https:\u002F\u002Fawesomeagents.ai\u002Fmodels\u002Fmimo-v2-pro\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1774597397882-x4i9.png","model-release","zh","f063d8d1-41d1-4de4-8ebc-6c40511b9369",[17,18,19,20,21,22,23,24],"小米","MiMo-V2-Pro","MoE","agentic coding","SWE-bench","Claude Sonnet 4.6","LLM","API",16,"2026-03-28T03:06:19.002353+00:00",{"tags":28,"relatedLang":44,"relatedPosts":48},[29,32,35,37,39,41,43],{"name":30,"slug":31},"研究整理","-",{"name":33,"slug":34},"SWE-Bench","swe-bench",{"name":23,"slug":36},"llm",{"name":20,"slug":38},"agentic-coding",{"name":18,"slug":40},"mimo-v2-pro",{"name":19,"slug":42},"moe",{"name":17,"slug":17},{"id":15,"slug":45,"title":46,"language":47},"xiaomi-mimo-v2-pro-1t-moe-agents-en","Xiaomi MiMo-V2-Pro: 1T MoE Model for Agents","en",[49,55,61,67,73,79],{"id":50,"slug":51,"title":52,"cover_image":53,"image_url":53,"created_at":54,"category":13},"cfb68e08-fe4e-49f6-b449-e566faf56311","kimi-2-7-price-coding-benchmark-zh","Kimi 2.7 讓價格成為真正的寫碼基準","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782746270225-tcs9.png","2026-06-29T15:17:24.321277+00:00",{"id":56,"slug":57,"title":58,"cover_image":59,"image_url":59,"created_at":60,"category":13},"ca1e6960-10e7-4fa7-949f-c5991c99fc7e","kimi-k26-open-source-coding-agentic-ai-benchmarks-zh","Kimi K2.6 登頂程式與代理式 AI 基準","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782739078329-qvne.png","2026-06-29T13:17:26.530857+00:00",{"id":62,"slug":63,"title":64,"cover_image":65,"image_url":65,"created_at":66,"category":13},"edf8e66b-c717-4cc1-b15a-96839bb7bbcf","llama-legends-380-season-3-heroes-raids-zh","Llama Legends 3.8.0 推出 Season 3 英雄與突襲","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782711179415-qurv.png","2026-06-29T05:32:32.733919+00:00",{"id":68,"slug":69,"title":70,"cover_image":71,"image_url":71,"created_at":72,"category":13},"88d353ca-468b-4774-922d-ef0cbc2edd68","omlx-045-dev1-glm52-minimax-m3-speedups-zh","oMLX 0.4.5.dev1 讓長上下文更快","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782709372375-25nm.png","2026-06-29T05:02:28.341041+00:00",{"id":74,"slug":75,"title":76,"cover_image":77,"image_url":77,"created_at":78,"category":13},"e6ae84b6-4e55-4ab2-a1cf-4a08e23cbc77","grok-45-private-beta-tesla-spacex-zh","Grok 4.5 先進 Tesla 和 SpaceX 內測","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782687769532-te5b.png","2026-06-28T23:02:22.915901+00:00",{"id":80,"slug":81,"title":82,"cover_image":83,"image_url":83,"created_at":84,"category":13},"186b266a-5b45-4bd4-85a4-5fa62fcc50dc","google-openrl-llm-fine-tuning-kubernetes-zh","Google OpenRL 把 RL 細調搬上 Kubernetes","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782572576166-gzxw.png","2026-06-27T15:02:27.036919+00:00",[86,91,96,101,106,111,112,117,122,127],{"id":87,"slug":88,"title":89,"created_at":90},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","2026-03-26T07:18:45.861277+00:00",{"id":92,"slug":93,"title":94,"created_at":95},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":97,"slug":98,"title":99,"created_at":100},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":102,"slug":103,"title":104,"created_at":105},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":107,"slug":108,"title":109,"created_at":110},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":4,"slug":5,"title":6,"created_at":26},{"id":113,"slug":114,"title":115,"created_at":116},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":118,"slug":119,"title":120,"created_at":121},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","2026-03-29T04:52:57.886544+00:00",{"id":123,"slug":124,"title":125,"created_at":126},"c679b51f-194a-463b-87fc-7695256ff752","mimo-v2-pro-vs-omni-vs-flash-2026-zh","MiMo V2 Pro、Omni、Flash 怎麼選","2026-04-02T01:18:43.576128+00:00",{"id":128,"slug":129,"title":130,"created_at":131},"3b988fd7-6749-4f01-ba25-c0ad7486dc31","z-ai-glm-5v-turbo-design2code-claude-zh","GLM-5V-Turbo 在 Design2Code 贏了…","2026-04-02T04:03:36.31741+00:00"]