標籤
coding agent
coding agent 指的是能在終端機、IDE 或雲端代理中理解需求、修改程式、呼叫工具並回傳結果的 AI 編碼系統。這個主題涵蓋 Codex、Claude Code、Cursor、Copilot 等產品,以及權限控管、工具鏈整合、RL 訓練與自架部署等實作差異。
9 篇文章

Devin AI 測試與採購判讀指南
這篇指南帶你實測 Devin AI 的存取、自治能力、基準數字、定價背景與工作流程限制,並用同一套任務比較它和其他 coding agent。

LiteLLM 推出 Rust 版輕量網關
LiteLLM-Rust 是一個用 Rust 寫的輕量 AI gateway,保留原本 config.yaml 與資料庫結構,目標是把 coding agent 的轉發延遲壓到 1ms 內。

Grok Build 把 xAI 變成寫碼代理
我拆 xAI 的 Grok Build 怎麼從聊天模型變成 coding agent,順手給你一份可直接拿去評估工具的模板。

Kimi K2.6 2026 變了什麼
Kimi K2.6 是 Moonshot AI 的開放權重旗艦,主打 300 個子代理、4,000 步協作、INT4 權重與頂級寫碼分數。

為什麼 Xiaomi 的 MiMo-V2.5-Pro 改變的是 Coding …
MiMo-V2.5-Pro 的重點不在聊天能力,而在長時間、重工具呼叫的 coding agent 工作;它代表 AI 競爭焦點正從會說話,轉向能把任務做完。

LongMemEval-V2:測 agent 長期記憶
LongMemEval-V2 用 451 題測試 agent 能否記住 Web 環境經驗,而不只是使用者歷史;結果顯示以 coding agent 蒐證的記憶法準確率最高,但延遲也更高。

OpenAI Codex 插件進駐 Claude Code
OpenAI 在 3 月 30 日推出 Codex 插件,讓 Codex 直接進入 Claude Code。這篇拆解它怎麼運作、和 GitHub Copilot、Cursor 比起來差在哪。

Claude Code 洩漏揭露內部架構
Claude Code 洩漏內容揭露 React 與 Ink 終端介面、30+ 工具、以及 AsyncGenerator 分層流程。這篇拆解它怎麼運作,也比較 Copilot、Aider、Codex 的差異。

Cursor 推自架代理與即時 RL
Cursor 在 2026 年 3 月推出自架雲端代理,並公開 Composer 的即時 RL 訓練法。官方稱新 checkpoint 最快每 5 小時更新一次,企業可把程式碼與工具執行留在自家網路內。