標籤

agent

Agent 指的是能在多步驟流程中規劃、呼叫工具、讀取外部系統並持續修正行動的 AI 代理。這個主題涵蓋 SDK、MCP、OAuth、sandboxing 與長流程控管，也延伸到 coding agent、企業部署與工具整合。

26 篇文章

Codex App 4月升级：Agent 拆成工作单元

工具應用/6月28日

Codex App 4月升级：Agent 拆成工作单元

OpenAI 4 月更新 Codex App，把 Agent 从对话对象改成可调度的工作单元，开发者开始用“分派任务”而不是“单点问答”来操作 AI。

AI入行四件套，把门槛降到能上手

產業動態/6月26日

AI入行四件套，把门槛降到能上手

把AI入行拆成标注、提示词、RAG、Agent四条路，并附可直接套用的学习模板。

豆包专业版把Agent做成日常工具

AI Agent/6月26日

豆包专业版把Agent做成日常工具

我拆解豆包专业版的办公任务模式，整理成本地操作、财报分析、Skill 复用的可抄模板。

Loop Engineering 讓 Agent 做完事

AI Agent/6月26日

Loop Engineering 讓 Agent 做完事

我把 Loop Engineering 拆成一套能直接拿去用的 Agent 完成任務模板，重點是讓模型自己檢查、修正、收斂到交付。

Kimi 的長上下文一路加大

模型發布/6月24日

Kimi 的長上下文一路加大

Moonshot AI 的 Kimi 從長上下文聊天機器人，走到 agent 與 1T 參數模型。Kimi K2.5 在 2026 年 1 月登場，也把產品線推到更複雜的階段。

Skill-to-LoRA 讓技能別再吃 Token

技術研究/6月21日

Skill-to-LoRA 讓技能別再吃 Token

Skill-to-LoRA 把 SKILL.md 轉成 LoRA adapter，讓 agent 不必每次把長文件塞進 context，降低 token 成本。

openPangu 2.0 讓小藝會用工具

工具應用/6月19日

openPangu 2.0 讓小藝會用工具

我拆開華為 openPangu 2.0 的工具調用思路，整理成一份可直接套用的助手模板。

GLM-5.2把前沿模型变成工具

模型發布/6月14日

GLM-5.2把前沿模型变成工具

我拆解GLM-5.2全量开放背后的开发者信号，并给你一份可直接改用的模型选型模板。

Devin 定價把 agents 變 seats

工具應用/6月10日

Devin 定價把 agents 變 seats

我拆 Devin 的定價頁，整理出可直接套用的 quota、seat、team 控制模板。

Portainer 升級文把 Docker 更新變清單

工具應用/6月8日

Portainer 升級文把 Docker 更新變清單

我把 Portainer 的 Docker Standalone 升級流程拆成可直接複製的檢查清單，讓你不用邊升級邊猜。

Claude Code Dynamic Workflows：新原语來了

工具應用/6月5日

Claude Code Dynamic Workflows：新原语來了

Anthropic 的 Dynamic Workflows 被解讀為把編排邏輯寫進程式碼的新原語，焦點在於它到底是 workflow 還是 agent。

Vibe Research：用 AI 加速研究流程

工具應用/5月16日

Vibe Research：用 AI 加速研究流程

Vibe research 把 LLM、agent、coding 工具和 review loop 串成流程，讓研究從讀文獻到跑實驗都更可執行。

Claude 幫 Agent 加了做夢功能

AI Agent/5月16日

Claude 幫 Agent 加了做夢功能

Anthropic 為 Claude 托管智能體加入 Dreaming、Outcomes 和多智能體編排，任務完成率最高提升 6 倍。

RAGFlow 加入 Agent 與自架部署

工具應用/5月12日

RAGFlow 加入 Agent 與自架部署

RAGFlow 把開源 RAG、Agent、自架部署和新模型支援整合在一起，適合處理 PDF、表格和多來源文件的團隊。

為什麼開源 LLM 應該按工作負載來選，不該看熱度

技術研究/5月7日

為什麼開源 LLM 應該按工作負載來選，不該看熱度

2026 年選開源 LLM，應該先看工作負載是否匹配，而不是追逐排行榜與發布熱度。

OpenAI Agents SDK 加強企業控管

AI Agent/4月18日

OpenAI Agents SDK 加強企業控管

OpenAI 為 Agents SDK 加上 sandboxing 與 harness 支援，讓企業能把長流程代理人放進更可控的環境，API 也維持標準計價。

GLM-5 登場：Z.AI 的寫程式旗艦

模型發布/4月2日

GLM-5 登場：Z.AI 的寫程式旗艦

GLM-5 是 Z.AI 的新旗艦模型。744B 總參數、200K context、SWE-bench Verified 77.8、Terminal Bench 2.0 56.2，直接挑戰頂級 coding 模型。

CrewForm 讓 Agent 直接變 MCP 工具

AI Agent/4月2日

CrewForm 讓 Agent 直接變 MCP 工具

CrewForm 把已發布的 agents 直接暴露成 MCP tools，Claude Desktop 和 Cursor 只要一份設定檔就能呼叫。這篇拆解它怎麼做、為何重要，以及和其他 agent 整合方式的差別。

OpenCode 加入 MCP 與 OAuth

工具應用/4月2日

OpenCode 加入 MCP 與 OAuth

OpenCode 把 MCP server 接進 LLM，支援本機與遠端連線、OAuth 驗證、每個 agent 的工具控制，還有 token 風險提示。

OpenClaw v2026.3.24 重置與整合指南

AI Agent/4月2日

OpenClaw v2026.3.24 重置與整合指南

OpenClaw v2026.3.24 仍是 beta，但重置流程、Ark Coding Plan 與 Feishu 整合，已經很像可落地的 agent 工作流。

MiMo V2 Pro、Omni、Flash 怎麼選

模型發布/4月2日

MiMo V2 Pro、Omni、Flash 怎麼選

MiMo 2026 三款模型分工很清楚：Flash 主打開源與 coding，Pro 提供 1M context，Omni 則處理圖像、音訊與影片。這篇直接比 benchmark、價格與適用場景。

Agent 基礎設施正在重寫 AI

產業動態/4月1日

Agent 基礎設施正在重寫 AI

SWE-agent、Anthropic 與 MCP 讓人看見，Agent 表現越來越取決於介面、狀態與排程，不再只看模型大小。

MiniMax首份財報：收入年增159%

產業動態/3月28日

MiniMax首份財報：收入年增159%

MiniMax首份港股財報顯示收入年增158.9%，海外收入占73%，毛利率升至25.4%。這家公司正把模型、應用和平台一起做，Agent業務也開始放大商業化。

Kimi K2.5 評測：更強，但還不是神作

AI Agent/3月27日

Kimi K2.5 評測：更強，但還不是神作

Kimi K2.5 加入視覺、寫碼和多代理工具，長文理解更強，但長跑慢、設計感弱、付費牆明顯，還沒到頂級行列。

2026 科技趨勢：AI 進入實戰

產業動態/3月26日

2026 科技趨勢：AI 進入實戰

IBM 對 2026 的觀察很直接：多代理系統會開始進入正式環境，AI 硬體焦點從堆算力轉向效率，量子運算也要面對一次可驗證的實際考驗。重點不再是最大模型，而是能不能在企業裡穩定、便宜、可治理地跑起來。

2026 年 3 月 AI 模型新聞重點

模型發布/3月26日

2026 年 3 月 AI 模型新聞重點

2026 年 3 月的 AI 圈看起來很安靜，其實重點早就不在新模型。真正有料的是推論速度、KV cache 壓縮、Agent 權限控制，還有 OpenAI 內部重組。對開發者來說，這些變化比排行榜多 1 分更實際。