Kimi 的長上下文一路加大

OraCore Editors

返回首頁

[MODEL] 2026年6月24日7 分鐘閱讀OraCore 編輯部

Kimi 的長上下文一路加大

Moonshot AI 的 Kimi 從長上下文聊天機器人，走到 agent 與 1T 參數模型。Kimi K2.5 在 2026 年 1 月登場，也把產品線推到更複雜的階段。

agent Moonshot AI LLM 長上下文

分享 LinkedIn

Moonshot AI 的 Kimi 從長上下文聊天機器人，變成一整組 agent 與大型模型。

Kimi 在 2023 年 10 月登場。它一開始就主打長上下文。這點很直白，也很聰明。因為當時很多 AI 助手，連一份長文件都吃不乾淨。

到了 2026 年 1 月，Kimi K2.5 已經上場。它是 1 兆參數的 MoE 模型，32 億活躍參數。這不是單純把數字做大。它是在把聊天、搜尋、推理、工具使用，整包往前推。

版本	時間	關鍵數字	意義
Kimi chatbot	2023 年 11 月	128,000 tokens	早期公開版就支援超長上下文
Kimi Explore Edition	2024 年 10 月	3,600 萬+ MAU	搜尋導向版本進入大規模使用
Kimi K2	2025 年 7 月	1 兆參數，32 億活躍	開放權重，還有不錯的 coding 成績
Kimi K2.5	2026 年 1 月	1 兆參數，32 億活躍	加入多模態與 agent 功能

Kimi 一開始就押長上下文

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

Moonshot AI 成立於 2023 年 3 月。Kimi 則在同年稍晚推出。它的定位很清楚，就是先解長文件問題。這件事在 2023 年很有感。因為很多模型還在跟上下文長度纏鬥。

第一版公開的 Kimi，支援 128,000 tokens。講白了，就是可以直接塞長論文、程式碼庫、研究筆記。你不用一直切段，也不用自己先做一輪摘要。對開發者來說，這很實用。

Moonshot 之後又往前推。2024 年 3 月，Kimi beta 支援 200 萬字元上下文。到了 2024 年 7 月，又開放 context caching。這種功能很務實。它不是拿來做宣傳海報的。它是拿來省錢、省延遲的。

2023 年 10 月：closed beta 開始
2023 年 11 月：公開版支援 128K tokens
2024 年 3 月：200 萬字元上下文 beta
2024 年 7 月：context caching 公測

產品線很快從聊天轉向 agent

到了 2024 年底，Kimi 已經不太像傳統聊天機器人。2024 年 10 月 11 日，Moonshot AI 推出 Kimi Explore Edition。它加了自主搜尋功能。後來官方也提到，月活躍使用者超過 3,600 萬。這數字不小，代表它不是只有 AI 圈內人在玩。

同一年，Moonshot 也開始內部測試影片生成。這透露一個方向。Kimi 不再只是「回答問題」的工具。它開始往搜尋、規劃、草稿、執行這條路走。

這裡可以直接講結論。長上下文只是入口。真正值錢的是，模型能不能把長資料變成可操作的工作流。能讀完，跟能做完，差很多。

“We believe the best model is the one that can think, use tools, and solve real problems.” — Yang Zhilin, Moonshot AI

這句話很符合 Moonshot 的路線。Yang Zhilin 一直把 Kimi 描述成推理與長任務系統。不是只會聊天的玩具。這也解釋了為什麼後續版本一直往 agent 功能靠。

對台灣開發者來說，這種產品路線很值得看。因為它代表 API、工具調用、檔案處理、搜尋整合，會比單純 prompt engineering 更重要。

長文件處理
自主搜尋
多步驟任務
未來還可能接影片生成

K1.5、K2、K2.5 的節奏很密

2025 到 2026 的更新速度，才是 Kimi 最值得看的地方。2025 年 1 月 20 日，Moonshot AI 推出 Kimi K1.5。官方宣稱，它在數學、coding、multimodal reasoning 上，能對標 OpenAI o1。這種說法很硬，但至少說明它不只想做聊天產品。

2025 年 4 月，Moonshot 又發表 Kimi-VL。這是 160 億參數的開放模型，活躍參數 30 億。到了 2025 年 6 月，Kimi-Dev 上線。它是 72B coding 模型，基於 Qwen2.5-72B。官方還說，它在 SWE-bench Verified 的開放模型裡，表現很強。

接著是更大的版本。2025 年 7 月，Kimi K2 發表。它是 1 兆參數 MoE 模型，32 億活躍參數，還用了修改版 MIT license。2025 年 9 月，Kimi-K2-Instruct-0905 把上下文從 128K 拉到 256K。到了 2026 年 1 月，K2.5 再補上多模態與 agent 模式。

Kimi K1.5：2025 年 1 月
Kimi K2：2025 年 7 月，1T 參數，32B active
Kimi-K2-Instruct-0905：2025 年 9 月，256K 上下文
Kimi K2.5：2026 年 1 月，多模態與 agent

真正有意思的是記憶效率

很多人看到 1 兆參數，第一反應都是「哇，好大」。但說真的，參數大不等於好用。真正麻煩的是，長上下文會吃記憶體，也會拖慢生成速度。這時候，注意力機制才是重點。

2025 年 10 月，Kimi Linear 上線。它用了 Kimi Delta Attention，簡稱 KDA。這個設計重點很明確，就是減少記憶體用量，並加快長上下文生成。這種工程細節，比單純吹參數更有用。

你可以把它想成兩種路線。第一種是硬堆模型大小。第二種是把同樣的算力，拿去做更有效率的 attention。後者更像真的產品思維。因為企業不會只看 demo，還會看成本、延遲、吞吐量。

128K tokens：早期公開版
256K tokens：Kimi-K2-Instruct-0905
1,000,000 行資料：OK Computer 的輸入規模
3,600 萬+ MAU：Explore Edition 的使用量

這也說明 Moonshot 的策略。它不是只押單一聊天介面。它同時在做長文件、agent、開放模型、效率優化。這種打法很像在做產品組合，不像只做一個 demo。

這條路也反映中國 AI 圈的節奏

Kimi 的演進，某種程度上也在看中國 AI labs 的節奏。它們不只在比 benchmark。它們也在比產品迭代、模型釋出、license 選擇，還有誰先把 agent 做得能用。

開放權重這件事很重要。像 Kimi K2 採用修改版 MIT license，代表開發者和研究者可以更快做測試、微調、比較。這比只有閉源 API 的玩法，多了很多彈性。

對開發者來說，問題也變得很實際。你不會只問它會不會聊天。你會問它讀長文件的成本多少，coding 表現怎樣，agent 穩不穩，API 延遲高不高。這些才是工作現場會碰到的事。

我覺得 Kimi 接下來的考驗很直接。它能不能把 K2.5 之後的功能，收斂成一個清楚介面。不要把產品做成一堆模式按鈕。模型再強，入口太亂，使用者還是會跑掉。

Kimi 下一步看的是穩定性，不只是尺寸

Kimi 現在的故事，已經不是「它能不能讀長文」。那題早就過了。真正要看的是，它能不能在長上下文、搜尋、coding、agent 任務之間，保持穩定表現。

如果 Moonshot 繼續把記憶效率、工具調用、multimodal 能力做順，Kimi 會很適合長文件工作流。像法務、研究、資料分析、程式碼審查，這些場景都很吃這一套。台灣團隊如果有跨文件、跨系統的工作，也會很有感。

我自己的判斷很簡單。Kimi 接下來比的不是誰的參數更大，而是誰能把 256K、agent、coding、搜尋，整合成好用的產品。這才是開發者會真的掏錢、或真的拿來接流程的地方。

你如果正在評估長上下文模型，現在就該看三件事：成本、延遲、工具整合。這三個指標，比行銷文案誠實多了。

// 相關文章

Kimi 的長上下文一路加大

Kimi 一開始就押長上下文

訂閱 AI 趨勢週報

產品線很快從聊天轉向 agent

K1.5、K2、K2.5 的節奏很密

真正有意思的是記憶效率

這條路也反映中國 AI 圈的節奏

Kimi 下一步看的是穩定性，不只是尺寸

Midjourney Medical 的 60 秒掃描，還沒到臨床

GLM-5.2 開源：1M 上下文上線

Apple 把 AI 直接塞進日常 App

Kimi K2.7-Code 主打快，但證據還不夠

Kimi K2.7 上線與驗證清單

Linux 7.1 上線：FRED、NTFS、AMD 一次補齊