[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-kimi-long-context-models-moonshot-ai-zh":3,"article-related-kimi-long-context-models-moonshot-ai-zh":36,"series-model-release-8b0b6a07-b173-42ab-883a-77d720808276":85},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":27,"views":32,"created_at":33,"published_at":34,"topic_cluster_id":35},"8b0b6a07-b173-42ab-883a-77d720808276","kimi-long-context-models-moonshot-ai-zh","Kimi 的長上下文一路加大","\u003Cp data-speakable=\"summary\">\u003Ca href=\"\u002Ftag\u002Fmoonshot-ai\">Moonshot AI\u003C\u002Fa> 的 Kimi 從長上下文聊天機器人，變成一整組 agent 與大型\u003Ca href=\"\u002Fnews\u002Flifescibench-tests-biotech-models-zh\">模型\u003C\u002Fa>。\u003C\u002Fp>\u003Cp>\u003Ca href=\"https:\u002F\u002Fwww.kimi.com\" target=\"_blank\" rel=\"noopener\">Kimi\u003C\u002Fa> 在 2023 年 10 月登場。它一開始就主打長上下文。這點很直白，也很聰明。因為當時很多 AI 助手，連一份長文件都吃不乾淨。\u003C\u002Fp>\u003Cp>到了 2026 年 1 月，\u003Ca href=\"https:\u002F\u002Fwww.kimi.com\" target=\"_blank\" rel=\"noopener\">Kimi K2.5\u003C\u002Fa> 已經上場。它是 1 兆參數的 MoE 模型，32 億活躍參數。這不是單純把數字做大。它是在把聊天、搜尋、推理、工具使用，整包往前推。\u003C\u002Fp>\u003Ctable>\u003Cthead>\u003Ctr>\u003Cth>版本\u003C\u002Fth>\u003Cth>時間\u003C\u002Fth>\u003Cth>關鍵數字\u003C\u002Fth>\u003Cth>意義\u003C\u002Fth>\u003C\u002Ftr>\u003C\u002Fthead>\u003Ctbody>\u003Ctr>\u003Ctd>Kimi chatbot\u003C\u002Ftd>\u003Ctd>2023 年 11 月\u003C\u002Ftd>\u003Ctd>128,000 tokens\u003C\u002Ftd>\u003Ctd>早期公開版就支援超長上下文\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>Kimi Explore Edition\u003C\u002Ftd>\u003Ctd>2024 年 10 月\u003C\u002Ftd>\u003Ctd>3,600 萬+ MAU\u003C\u002Ftd>\u003Ctd>搜尋導向版本進入大規模使用\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>Kimi K2\u003C\u002Ftd>\u003Ctd>2025 年 7 月\u003C\u002Ftd>\u003Ctd>1 兆參數，32 億活躍\u003C\u002Ftd>\u003Ctd>開放權重，還有不錯的 coding 成績\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>Kimi K2.5\u003C\u002Ftd>\u003Ctd>2026 年 1 月\u003C\u002Ftd>\u003Ctd>1 兆參數，32 億活躍\u003C\u002Ftd>\u003Ctd>加入多模態與 agent 功能\u003C\u002Ftd>\u003C\u002Ftr>\u003C\u002Ftbody>\u003C\u002Ftable>\u003Ch2>Kimi 一開始就押長上下文\u003C\u002Fh2>\u003Cp>\u003Ca href=\"https:\u002F\u002Fwww.moonshot.cn\" target=\"_blank\" rel=\"noopener\">Moonshot AI\u003C\u002Fa> 成立於 2023 年 3 月。Kimi 則在同年稍晚推出。它的定位很清楚，就是先解長文件問題。這件事在 2023 年很有感。因為很多模型還在跟上下文長度纏鬥。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782231484525-xqgo.png\" alt=\"Kimi 的長上下文一路加大\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>第一版公開的 Kimi，支援 128,000 tokens。講白了，就是可以直接塞長論文、程式碼庫、研究筆記。你不用一直切段，也不用自己先做一輪摘要。對開發者來說，這很實用。\u003C\u002Fp>\u003Cp>Moonshot 之後又往前推。2024 年 3 月，Kimi beta 支援 200 萬字元上下文。到了 2024 年 7 月，又開放 context caching。這種功能很務實。它不是拿來做宣傳海報的。它是拿來省錢、省延遲的。\u003C\u002Fp>\u003Cul>\u003Cli>2023 年 10 月：closed beta 開始\u003C\u002Fli>\u003Cli>2023 年 11 月：公開版支援 128K tokens\u003C\u002Fli>\u003Cli>2024 年 3 月：200 萬字元上下文 beta\u003C\u002Fli>\u003Cli>2024 年 7 月：context caching 公測\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>產品線很快從聊天轉向 agent\u003C\u002Fh2>\u003Cp>到了 2024 年底，Kimi 已經不太像傳統聊天機器人。2024 年 10 月 11 日，Moonshot AI 推出 \u003Ca href=\"https:\u002F\u002Fkimi.com\" target=\"_blank\" rel=\"noopener\">Kimi Explore Edition\u003C\u002Fa>。它加了自主搜尋功能。後來官方也提到，月活躍使用者超過 3,600 萬。這數字不小，代表它不是只有 AI 圈內人在玩。\u003C\u002Fp>\u003Cp>同一年，Moonshot 也開始內部測試影片生成。這透露一個方向。Kimi 不再只是「回答問題」的工具。它開始往搜尋、規劃、草稿、執行這條路走。\u003C\u002Fp>\u003Cp>這裡可以直接講結論。長上下文只是入口。真正值錢的是，模型能不能把長資料變成可操作的\u003Ca href=\"\u002Fnews\u002Floop-engineering-claude-code-workflow-zh\">工作\u003C\u002Fa>流。能讀完，跟能做完，差很多。\u003C\u002Fp>\u003Cblockquote>\u003Cp>“We believe the best model is the one that can think, use tools, and solve real problems.” — Yang Zhilin, Moonshot AI\u003C\u002Fp>\u003C\u002Fblockquote>\u003Cp>這句話很符合 Moonshot 的路線。Yang Zhilin 一直把 Kimi 描述成推理與長任務系統。不是只會聊天的玩具。這也解釋了為什麼後續版本一直往 agent 功能靠。\u003C\u002Fp>\u003Cp>對台灣開發者來說，這種產品路線很值得看。因為它代表 API、工具調用、檔案處理、搜尋整合，會比單純 \u003Ca href=\"\u002Ftag\u002Fprompt-engineering\">prompt engineering\u003C\u002Fa> 更重要。\u003C\u002Fp>\u003Cul>\u003Cli>長文件處理\u003C\u002Fli>\u003Cli>自主搜尋\u003C\u002Fli>\u003Cli>多步驟任務\u003C\u002Fli>\u003Cli>未來還可能接影片生成\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>K1.5、K2、K2.5 的節奏很密\u003C\u002Fh2>\u003Cp>2025 到 2026 的更新速度，才是 Kimi 最值得看的地方。2025 年 1 月 20 日，Moonshot AI 推出 \u003Ca href=\"https:\u002F\u002Fwww.moonshot.cn\" target=\"_blank\" rel=\"noopener\">Kimi K1.5\u003C\u002Fa>。官方宣稱，它在數學、coding、multimodal reasoning 上，能對標 \u003Ca href=\"\u002Ftag\u002Fopenai\">OpenAI\u003C\u002Fa> o1。這種說法很硬，但至少說明它不只想做聊天產品。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782231484643-574o.png\" alt=\"Kimi 的長上下文一路加大\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>2025 年 4 月，Moonshot 又發表 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FMoonshotAI\u002FKimi-VL\" target=\"_blank\" rel=\"noopener\">Kimi-VL\u003C\u002Fa>。這是 160 億參數的開放模型，活躍參數 30 億。到了 2025 年 6 月，\u003Ca href=\"https:\u002F\u002Fgithub.com\u002FMoonshotAI\u002FKimi-Dev\" target=\"_blank\" rel=\"noopener\">Kimi-Dev\u003C\u002Fa> 上線。它是 72B coding 模型，基於 Qwen2.5-72B。官方還說，它在 \u003Ca href=\"\u002Ftag\u002Fswe-bench-verified\">SWE-bench Verified\u003C\u002Fa> 的開放模型裡，表現很強。\u003C\u002Fp>\u003Cp>接著是更大的版本。2025 年 7 月，\u003Ca href=\"https:\u002F\u002Fmoonshotai.github.io\u002FKimi-K2\u002F\" target=\"_blank\" rel=\"noopener\">Kimi K2\u003C\u002Fa> 發表。它是 1 兆參數 MoE 模型，32 億活躍參數，還用了修改版 MIT license。2025 年 9 月，\u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002Fmoonshotai\u002FKimi-K2-Instruct-0905\" target=\"_blank\" rel=\"noopener\">Kimi-K2-Instruct-0905\u003C\u002Fa> 把上下文從 128K 拉到 256K。到了 2026 年 1 月，K2.5 再補上多模態與 agent 模式。\u003C\u002Fp>\u003Cul>\u003Cli>Kimi K1.5：2025 年 1 月\u003C\u002Fli>\u003Cli>Kimi K2：2025 年 7 月，1T 參數，32B active\u003C\u002Fli>\u003Cli>Kimi-K2-Instruct-0905：2025 年 9 月，256K 上下文\u003C\u002Fli>\u003Cli>Kimi K2.5：2026 年 1 月，多模態與 agent\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>真正有意思的是記憶效率\u003C\u002Fh2>\u003Cp>很多人看到 1 兆參數，第一反應都是「哇，好大」。但說真的，參數大不等於好用。真正麻煩的是，長上下文會吃記憶體，也會拖慢生成速度。這時候，注意力機制才是重點。\u003C\u002Fp>\u003Cp>2025 年 10 月，Kimi Linear 上線。它用了 \u003Ca href=\"https:\u002F\u002Fwww.kimi.com\" target=\"_blank\" rel=\"noopener\">Kimi Delta Attention\u003C\u002Fa>，簡稱 KDA。這個設計重點很明確，就是減少記憶體用量，並加快長上下文生成。這種工程細節，比單純吹參數更有用。\u003C\u002Fp>\u003Cp>你可以把它想成兩種路線。第一種是硬堆模型大小。第二種是把同樣的算力，拿去做更有效率的 attention。後者更像真的產品思維。因為\u003Ca href=\"\u002Fnews\u002Fsia-openai-partner-network-enterprise-ai-services-game-zh\">企業\u003C\u002Fa>不會只看 demo，還會看成本、延遲、吞吐量。\u003C\u002Fp>\u003Cul>\u003Cli>128K tokens：早期公開版\u003C\u002Fli>\u003Cli>256K tokens：Kimi-K2-Instruct-0905\u003C\u002Fli>\u003Cli>1,000,000 行資料：OK Computer 的輸入規模\u003C\u002Fli>\u003Cli>3,600 萬+ MAU：Explore Edition 的使用量\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這也說明 Moonshot 的策略。它不是只押單一聊天介面。它同時在做長文件、agent、開放模型、效率優化。這種打法很像在做產品組合，不像只做一個 demo。\u003C\u002Fp>\u003Ch2>這條路也反映中國 AI 圈的節奏\u003C\u002Fh2>\u003Cp>Kimi 的演進，某種程度上也在看中國 AI labs 的節奏。它們不只在比 \u003Ca href=\"\u002Ftag\u002Fbenchmark\">benchmark\u003C\u002Fa>。它們也在比產品迭代、模型釋出、license 選擇，還有誰先把 agent 做得能用。\u003C\u002Fp>\u003Cp>開放權重這件事很重要。像 \u003Ca href=\"https:\u002F\u002Fmoonshotai.github.io\u002FKimi-K2\u002F\" target=\"_blank\" rel=\"noopener\">Kimi K2\u003C\u002Fa> 採用修改版 MIT license，代表開發者和研究者可以更快做測試、微調、比較。這比只有閉源 API 的玩法，多了很多彈性。\u003C\u002Fp>\u003Cp>對開發者來說，問題也變得很實際。你不會只問它會不會聊天。你會問它讀長文件的成本多少，coding 表現怎樣，agent 穩不穩，API 延遲高不高。這些才是工作現場會碰到的事。\u003C\u002Fp>\u003Cp>我覺得 Kimi 接下來的考驗很直接。它能不能把 K2.5 之後的功能，收斂成一個清楚介面。不要把產品做成一堆模式按鈕。模型再強，入口太亂，使用者還是會跑掉。\u003C\u002Fp>\u003Ch2>Kimi 下一步看的是穩定性，不只是尺寸\u003C\u002Fh2>\u003Cp>Kimi 現在的故事，已經不是「它能不能讀長文」。那題早就過了。真正要看的是，它能不能在長上下文、搜尋、coding、agent 任務之間，保持穩定表現。\u003C\u002Fp>\u003Cp>如果 Moonshot 繼續把記憶效率、工具調用、multimodal 能力做順，Kimi 會很適合長文件工作流。像法務、研究、資料分析、程式碼審查，這些場景都很吃這一套。台灣團隊如果有跨文件、跨系統的工作，也會很有感。\u003C\u002Fp>\u003Cp>我自己的判斷很簡單。Kimi 接下來比的不是誰的參數更大，而是誰能把 256K、agent、coding、搜尋，整合成好用的產品。這才是開發者會真的掏錢、或真的拿來接流程的地方。\u003C\u002Fp>\u003Cp>你如果正在評估長上下文模型，現在就該看三件事：成本、延遲、工具整合。這三個指標，比行銷文案誠實多了。\u003C\u002Fp>","Moonshot AI 的 Kimi 從長上下文聊天機器人，走到 agent 與 1T 參數模型。Kimi K2.5 在 2026 年 1 月登場，也把產品線推到更複雜的階段。","en.wikipedia.org","https:\u002F\u002Fen.wikipedia.org\u002Fwiki\u002FKimi_(chatbot)",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782231484525-xqgo.png","model-release","zh","6288131d-64e3-47ff-aeec-add641c952e2",[17,18,19,20,21,22,23,24,25,26],"Kimi","Moonshot AI","長上下文","LLM","agent","MoE","Kimi K2.5","中國 AI","OpenAI","SWE-bench",[28,29,30,31],"Kimi 的核心不是聊天，而是長上下文與 agent 工作流。","Kimi K2.5 把模型線推到 1 兆參數與多模態。","Kimi Linear 顯示效率優化比單純堆參數更重要。","對開發者來說，成本、延遲、工具整合比宣傳數字更值得看。",0,"2026-06-23T16:17:38.02879+00:00","2026-06-23T16:17:38+00:00","0ccb5d2e-69f1-4354-a3e0-cb370221cd95",{"tags":37,"relatedLang":44,"relatedPosts":48},[38,39,41,43],{"name":21,"slug":21},{"name":18,"slug":40},"moonshot-ai",{"name":20,"slug":42},"llm",{"name":19,"slug":19},{"id":15,"slug":45,"title":46,"language":47},"kimi-long-context-models-moonshot-ai-en","Kimi’s long-context push keeps getting bigger","en",[49,55,61,67,73,79],{"id":50,"slug":51,"title":52,"cover_image":53,"image_url":53,"created_at":54,"category":13},"af2a4196-8fef-4d27-acf9-674c2c901bb7","midjourney-medical-60-second-body-scan-claim-zh","Midjourney Medical 的 60 秒掃描，還沒到臨床","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782182888214-3tmt.png","2026-06-23T02:47:37.711898+00:00",{"id":56,"slug":57,"title":58,"cover_image":59,"image_url":59,"created_at":60,"category":13},"8d0595e5-788b-417c-a309-15d00e4558b8","glm-5-2-open-source-1m-context-long-tasks-zh","GLM-5.2 開源：1M 上下文上線","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782065872389-e3e7.png","2026-06-21T18:17:26.052006+00:00",{"id":62,"slug":63,"title":64,"cover_image":65,"image_url":65,"created_at":66,"category":13},"e64f73a5-2832-464c-a70b-13de61872630","apple-intelligence-ai-everyday-experiences-zh","Apple 把 AI 直接塞進日常 App","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782012781803-ghel.png","2026-06-21T03:32:34.372626+00:00",{"id":68,"slug":69,"title":70,"cover_image":71,"image_url":71,"created_at":72,"category":13},"a419fc45-bd6c-4ce2-a2ef-2a0467f6c02d","kimi-k27-code-highspeed-mode-skips-benchmarks-zh","Kimi K2.7-Code 主打快，但證據還不夠","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781795889545-t5hx.png","2026-06-18T15:17:40.944644+00:00",{"id":74,"slug":75,"title":76,"cover_image":77,"image_url":77,"created_at":78,"category":13},"2495916e-6109-4bd6-a948-f118ebd948ca","kimi-k27-whats-new-and-how-to-run-it-zh","Kimi K2.7 上線與驗證清單","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781791368143-oe0k.png","2026-06-18T14:02:24.876682+00:00",{"id":80,"slug":81,"title":82,"cover_image":83,"image_url":83,"created_at":84,"category":13},"98c49728-7b3d-4f35-8835-4bfeddb0aa12","linux-kernel-7-1-fred-ntfs-amd-fixes-zh","Linux 7.1 上線：FRED、NTFS、AMD 一次補齊","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781787771307-ptmn.png","2026-06-18T13:02:24.621368+00:00",[86,91,96,101,106,111,116,121,126,131],{"id":87,"slug":88,"title":89,"created_at":90},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","2026-03-26T07:18:45.861277+00:00",{"id":92,"slug":93,"title":94,"created_at":95},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":97,"slug":98,"title":99,"created_at":100},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":102,"slug":103,"title":104,"created_at":105},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":107,"slug":108,"title":109,"created_at":110},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":112,"slug":113,"title":114,"created_at":115},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","xiaomi-mimo-v2-pro-1t-moe-agents-zh","小米 MiMo-V2-Pro 登場：1T MoE 模型","2026-03-28T03:06:19.002353+00:00",{"id":117,"slug":118,"title":119,"created_at":120},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":122,"slug":123,"title":124,"created_at":125},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","2026-03-29T04:52:57.886544+00:00",{"id":127,"slug":128,"title":129,"created_at":130},"c679b51f-194a-463b-87fc-7695256ff752","mimo-v2-pro-vs-omni-vs-flash-2026-zh","MiMo V2 Pro、Omni、Flash 怎麼選","2026-04-02T01:18:43.576128+00:00",{"id":132,"slug":133,"title":134,"created_at":135},"3b988fd7-6749-4f01-ba25-c0ad7486dc31","z-ai-glm-5v-turbo-design2code-claude-zh","GLM-5V-Turbo 在 Design2Code 贏了…","2026-04-02T04:03:36.31741+00:00"]