[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-kimi-k25-brings-vision-code-and-swarm-agents-zh":3,"article-related-kimi-k25-brings-vision-code-and-swarm-agents-zh":28,"series-model-release-e1694231-0e5e-4476-ab60-b48d674a3f3b":84},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":11,"views":25,"created_at":26,"published_at":27,"topic_cluster_id":11},"e1694231-0e5e-4476-ab60-b48d674a3f3b","kimi-k25-brings-vision-code-and-swarm-agents-zh","Kimi K2.5 把視覺、程式碼和 Agent 放一起","\u003Cp>\u003Ca href=\"https:\u002F\u002Fkimi-ai.chat\u002Fmodels\u002Fkimi-k2-5\u002F\" target=\"_blank\" rel=\"noopener\">Kimi K2.5\u003C\u002Fa> 在 2026 年 1 月 27 日上線。數字很兇：256K context、1T total parameters、32B active parameters。講白了，\u003Ca href=\"https:\u002F\u002Fmoonshot.ai\u002F\" target=\"_blank\" rel=\"noopener\">Moonshot AI\u003C\u002Fa> 想把它做成一個能看圖、能寫 code、也能跑 agent 的模型。\u003C\u002Fp>\u003Cp>這種定位很實際。很多模型會聊天，少數能寫程式。能看截圖、讀長文件、再把工具串起來的，還真沒那麼多。K2.5 的重點，就是把這些能力塞進同一個系統。\u003C\u002Fp>\u003Cp>對台灣開發者來說，這代表一件事。你不一定要把視覺、文件、程式碼拆成三套工具。K2.5 想讓你用一個模型處理更多流程。\u003C\u002Fp>\u003Ch2>先看 Kimi K2.5 是什麼\u003C\u002Fh2>\u003Cp>\u003Ca href=\"https:\u002F\u002Fgithub.com\u002FMoonshotAI\u002FKimi-K2\" target=\"_blank\" rel=\"noopener\">Kimi K2\u003C\u002Fa> 是前一代。K2.5 是往前推一步。核心還是 sparse MoE 架構，但這次加上原生多模態、比較長的 context、還有更完整的 agent 行為。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775156810921-zcn3.png\" alt=\"Kimi K2.5 把視覺、程式碼和 Agent 放一起\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>Moonshot 的產品切法也很直接。網頁、App、API、coding 工具都能碰到它。使用模式則分成 Instant、Thinking、Agent、Agent Swarm。這不是單純聊天介面，而是把模型放進工作流。\u003C\u002Fp>\u003Cp>更有意思的是視覺能力不是外掛。它不是先 OCR，再丟文字給 LLM。它把影像理解放進底層設計。這對 UI 還原、圖表分析、文件處理都很有差。\u003C\u002Fp>\u003Cul>\u003Cli>發布時間：2026 年 1 月 27 日\u003C\u002Fli>\u003Cli>架構：Mixture-of-Experts\u003C\u002Fli>\u003Cli>總參數：1T\u003C\u002Fli>\u003Cli>啟用參數：32B\u003C\u002Fli>\u003Cli>Context：256K tokens\u003C\u002Fli>\u003Cli>視覺編碼器：MoonViT 400M\u003C\u002Fli>\u003Cli>Agent Swarm：最多 100 個 sub-agents\u003C\u002Fli>\u003Cli>並行 tool calls：最多 1,500 次\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>架構數字為什麼重要\u003C\u002Fh2>\u003Cp>1T total parameters 聽起來很大，但 MoE 的重點不是每次都全開。它是讓模型有很大的容量，推理時只啟用一部分 ex\u003Ca href=\"\u002Fnews\u002Fopera-neon-adds-mcp-support-for-ai-clients-zh\">per\u003C\u002Fa>t。這種設計比較像大倉庫，不是每次都把整間倉庫搬出來。\u003C\u002Fp>\u003Cp>真正有感的是 256K context。這個長度對 codebase、合約、研究筆記、跨檔案任務都很有用。你可以把更多背景一次丟進去，不用一直切段。對 agent 來說，這也代表它比較不容易忘記前面做過什麼。\u003C\u002Fp>\u003Cp>再來是視覺編碼器。Moonshot 文件提到 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FMoonshotAI\u002FKimi-K2\" target=\"_blank\" rel=\"noopener\">MoonViT\u003C\u002Fa> 400M encoder。這表示它不是只會看圖說故事，而是要能處理 UI mockup、圖表、截圖、混合文件這些真實場景。\u003C\u002Fp>\u003Cul>\u003Cli>MoE 適合大容量和較省推理成本\u003C\u002Fli>\u003Cli>256K context 對長文件和多步驟工具流程很實用\u003C\u002Fli>\u003Cli>MoonViT 400M 代表原生視覺理解\u003C\u002Fli>\u003Cli>61 layers、384 experts、每個 token 選 8 個 experts\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>Benchmark 看的是實戰感\u003C\u002Fh2>\u003Cp>K2.5 的 benchmark 不是那種「全部碾壓」的故事。比較像是：只要任務混合了 reasoning、tools、code、vision，它就很能打。這種模型比較像工作夥伴，不是考試機器。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775156817118-came.png\" alt=\"Kimi K2.5 把視覺、程式碼和 Agent 放一起\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>Moonshot 公開的數字裡，K2.5 在一些 agent 與多模態項目表現不錯。像 HLE with tools 是 50.2，AIME 2025 是 96.1，HMMT 2025 是 95.4，GPQA-Diamond 是 87.6，MMMU-Pro 是 78.5，MathVision 是 84.2，MathVista 是 90.1，SWE-Bench Verified 是 76.8，SWE-Bench Multilingual 是 73.0。\u003C\u002Fp>\u003Cp>這些數字的意思很簡單。它不是只會答題。它也能碰實際軟體任務。尤其 SWE-Bench 這種測試，對開發者來說比較接近真實工作。\u003C\u002Fp>\u003Cblockquote>“We believe that AI should be open, accessible, and beneficial to everyone.” — \u003Ca href=\"https:\u002F\u002Fwww.moonshot.cn\u002F\" target=\"_blank\" rel=\"noopener\">Yao Shunyu\u003C\u002Fa>, Moonshot AI co-founder and CEO\u003C\u002Fblockquote>\u003Cp>這句話很直白。Moonshot 想做的不是單一 demo。它要的是能真的進工作流的模型。開放模型、託管服務、API、工具鏈，全部一起上。\u003C\u002Fp>\u003Cp>如果拿它跟其他開放模型比，差異最明顯的地方是多模態 agent。純文字模型可以解題。K2.5 可以直接看截圖、讀圖表、再產出可執行的結果。這對前端、產品、研究都很有用。\u003C\u002Fp>\u003Cul>\u003Cli>HLE with tools：50.2\u003C\u002Fli>\u003Cli>AIME 2025：96.1\u003C\u002Fli>\u003Cli>MMMU-Pro：78.5\u003C\u002Fli>\u003Cli>SWE-Bench Verified：76.8\u003C\u002Fli>\u003Cli>對比一些閉源模型，K2.5 在部分純推理項目仍有差距\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>開發者會怎麼用它\u003C\u002Fh2>\u003Cp>最適合的場景，是一個模型要連做好幾件事。像是讀 UI 截圖、產出前端 code、再用自然語言解釋修改內容。這種流程以前常要拆成三段，現在可以試著壓在一個 agent 裡。\u003C\u002Fp>\u003Cp>對工程團隊來說，API 細節很重要。Moonshot 文件提到 visual input、text input、JSON mode、partial mode、tool calling、thinking 與 non-thinking modes，還有官方 web search。這些東西湊在一起，才像真的能上線。\u003C\u002Fp>\u003Cp>不過也有一個小坑。Moonshot 說 \u003Ccode>$web_search\u003C\u002Fcode> 跟 K2.5 的 thinking mode 目前不相容。這種事情很煩，但很真實。你如果做搜尋型流程，可能得改用 non-thinking mode，不然會卡住。\u003C\u002Fp>\u003Cul>\u003Cli>Visual coding：截圖轉前端 code\u003C\u002Fli>\u003Cli>Research workflow：拆成多個 sub-agents\u003C\u002Fli>\u003Cli>Office 任務：文件、簡報、表格、網站\u003C\u002Fli>\u003Cli>API 控制：JSON mode、tool use、長 context prompt\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>它跟別的模型差在哪\u003C\u002Fh2>\u003Cp>如果只看聊天體驗，很多模型差不多。但一進到工作流程，差距就很明顯。K2.5 的強項是把 vision、code、agent 串在一起，而不是只在單一任務上刷分。\u003C\u002Fp>\u003Cp>跟 \u003Ca href=\"https:\u002F\u002Fopenai.com\u002F\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa> 的 GPT 系列比，K2.5 的優勢是 open model 與可部署性。跟 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002F\" target=\"_blank\" rel=\"noopener\">Anthropic\u003C\u002Fa> 的 \u003Ca href=\"\u002Fnews\u002Fclaude-vs-chatgpt-copilot-gemini-enterprise-2026-zh\">Clau\u003C\u002Fa>de 比，它更強調多模態與開放權重。跟 \u003Ca href=\"https:\u002F\u002Fdeepmind.google\u002Ftechnologies\u002Fgemini\u002F\" target=\"_blank\" rel=\"noopener\">Gemini\u003C\u002Fa> 比，K2.5 的賣點則是長 context 加上 agent swarm 的工作型設計。\u003C\u002Fp>\u003Cp>當然，它不是每項都贏。公開比較裡，K2.5 在某些純推理與純 coding 測試，還是會落後 GPT-5.2 或 \u003Ca href=\"\u002Fnews\u002Fgemini-3-1-pro-googles-top-model-in-numbers-zh\">Gemi\u003C\u002Fa>ni 3 Pro 這類閉源旗艦。可是如果你的任務是混合型，這個差距就沒那麼單純。\u003C\u002Fp>\u003Cul>\u003Cli>開放權重：方便自架和客製化\u003C\u002Fli>\u003Cli>256K context：比很多模型更適合長工作流\u003C\u002Fli>\u003Cli>原生視覺：對 UI、圖表、文件很有用\u003C\u002Fli>\u003Cli>Agent Swarm：最多 100 個 sub-agents\u003C\u002Fli>\u003Cli>1,500 並行 tool calls：適合大規模自動化\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>這波對產業代表什麼\u003C\u002Fh2>\u003Cp>我覺得 K2.5 最值得看的地方，不是單點能力，而是工作方式。以前大家想的是「一個模型回答一個問題」。現在比較像「一個模型帶一群子任務」。這會影響產品設計，也會影響團隊分工。\u003C\u002Fp>\u003Cp>對新創來說，這種模型能縮短原型期。對企業來說，它可能變成內部知識搜尋、文件整理、客服輔助、報表分析的核心。當模型能直接吃圖、吃長文、吃工具，很多流程就不必再手工轉檔。\u003C\u002Fp>\u003Cp>台灣團隊如果想導入，建議先從低風險場景試。像是截圖轉規格、簡報摘要、程式碼審查、研究整理。這些任務有明確輸入輸出，容易驗證，也比較好抓錯誤率。\u003C\u002Fp>\u003Cp>接下來要觀察的是產品穩定度。模型強不代表流程穩。Agent Swarm 很猛，但一旦 tool chain 出錯，整條流程就會亂掉。這才是上線時最常見的痛點。\u003C\u002Fp>\u003Ch2>我會怎麼看 Kimi K2.5\u003C\u002Fh2>\u003Cp>如果你只想要短答案，K2.5 可能太重。可是一旦你要處理截圖、長文件、code、工具呼叫，它就很值得試。它不是聊天玩具，比較像一個可編排的工作引擎。\u003C\u002Fp>\u003Cp>我自己的判斷很直接。K2.5 會先在開發者圈子打開。因為開發者最知道長 context、tool use、vision workflow 有多麻煩。只要 API 和穩定性夠好，它就有機會進到更多產品裡。\u003C\u002Fp>\u003Cp>如果你現在要選一個測試清單，我會建議先做三件事：看它能不能讀你的 UI 截圖、能不能穩定處理長 prompt、能不能在 tool calling 裡少出包。這三項過了，才談得上真的能上線。\u003C\u002Fp>\u003Cp>說白了，Kimi K2.5 值不值得追，不看宣傳詞。看它能不能把 vision、code 和 agent 真正接起來。這才是重點。\u003C\u002Fp>","Moonshot AI 推出 Kimi K2.5，主打 256K context、原生視覺和 Agent Swarm。這篇拆解它對開發者、團隊與自動化流程的實際影響。","kimi-ai.chat","https:\u002F\u002Fkimi-ai.chat\u002Fmodels\u002Fkimi-k2-5\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775156810921-zcn3.png","model-release","zh","465ff868-0532-49a3-8e00-843bf34845c7",[17,18,19,20,21,22,23,24],"Kimi K2.5","Moonshot AI","Agent Swarm","256K context","MoE","多模態模型","AI agent","開發者工具",2,"2026-04-02T19:06:36.581036+00:00","2026-04-02T19:06:36.353+00:00",{"tags":29,"relatedLang":43,"relatedPosts":47},[30,31,32,34,36,39,41],{"name":24,"slug":24},{"name":22,"slug":22},{"name":18,"slug":33},"moonshot-ai",{"name":23,"slug":35},"ai-agent",{"name":37,"slug":38},"agent swarm","agent-swarm",{"name":21,"slug":40},"moe",{"name":20,"slug":42},"256k-context",{"id":15,"slug":44,"title":45,"language":46},"kimi-k25-brings-vision-code-and-swarm-agents-en","Kimi K2.5 Brings Vision, Code, and Swarm Agents","en",[48,54,60,66,72,78],{"id":49,"slug":50,"title":51,"cover_image":52,"image_url":52,"created_at":53,"category":13},"1985ce38-03c6-4968-96fa-b751553bbef3","why-claude-opus-48-is-not-the-big-story-zh","為什麼 Claude Opus 4.8 不是大新聞","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780531367297-nrfs.png","2026-06-04T00:02:24.633987+00:00",{"id":55,"slug":56,"title":57,"cover_image":58,"image_url":58,"created_at":59,"category":13},"8810b91a-9aa2-4cd6-a58b-18fad5897423","devin-booker-sedona-mcdonalds-shoe-launch-zh","Booker把Sedona麥當勞變鞋款發表場","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780510686292-fm1k.png","2026-06-03T18:17:31.966783+00:00",{"id":61,"slug":62,"title":63,"cover_image":64,"image_url":64,"created_at":65,"category":13},"d4d7e664-cc7f-4211-a733-b7c111b86bd6","best-open-source-llms-2026-ranked-zh","2026 最佳開源 LLM 排名","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780396385004-yyka.png","2026-06-02T10:32:37.264398+00:00",{"id":67,"slug":68,"title":69,"cover_image":70,"image_url":70,"created_at":71,"category":13},"06774dfe-08eb-4a53-a8f7-36389b462c2b","llama-3-1-70b-specs-benchmarks-deployment-zh","Llama 3.1 70B：規格與部署","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780395481064-5yri.png","2026-06-02T10:17:33.072306+00:00",{"id":73,"slug":74,"title":75,"cover_image":76,"image_url":76,"created_at":77,"category":13},"e8ee6f00-cf62-41e6-83b7-92ce148fe46e","kill-bill-whole-bloody-affair-4k-blu-ray-zh","《追殺比爾：血腥全集》4K 藍光上市","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780364908972-15qn.png","2026-06-02T01:48:00.707278+00:00",{"id":79,"slug":80,"title":81,"cover_image":82,"image_url":82,"created_at":83,"category":13},"893178f1-7aba-4a0c-a3cf-1812c9d3283e","almalinux-10-2-9-8-new-stacks-zh","AlmaLinux 10.2 與 9.8 更新了什麼","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780291073047-7bxy.png","2026-06-01T05:17:27.940241+00:00",[85,90,95,100,105,110,115,120,125,130],{"id":86,"slug":87,"title":88,"created_at":89},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","2026-03-26T07:18:45.861277+00:00",{"id":91,"slug":92,"title":93,"created_at":94},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":96,"slug":97,"title":98,"created_at":99},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":101,"slug":102,"title":103,"created_at":104},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":106,"slug":107,"title":108,"created_at":109},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":111,"slug":112,"title":113,"created_at":114},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","xiaomi-mimo-v2-pro-1t-moe-agents-zh","小米 MiMo-V2-Pro 登場：1T MoE 模型","2026-03-28T03:06:19.002353+00:00",{"id":116,"slug":117,"title":118,"created_at":119},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":121,"slug":122,"title":123,"created_at":124},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","2026-03-29T04:52:57.886544+00:00",{"id":126,"slug":127,"title":128,"created_at":129},"c679b51f-194a-463b-87fc-7695256ff752","mimo-v2-pro-vs-omni-vs-flash-2026-zh","MiMo V2 Pro、Omni、Flash 怎麼選","2026-04-02T01:18:43.576128+00:00",{"id":131,"slug":132,"title":133,"created_at":134},"3b988fd7-6749-4f01-ba25-c0ad7486dc31","z-ai-glm-5v-turbo-design2code-claude-zh","GLM-5V-Turbo 在 Design2Code 贏了…","2026-04-02T04:03:36.31741+00:00"]