返回首頁

標籤

agent

Agent 指的是能在多步驟流程中規劃、呼叫工具、讀取外部系統並持續修正行動的 AI 代理。這個主題涵蓋 SDK、MCP、OAuth、sandboxing 與長流程控管,也延伸到 coding agent、企業部署與工具整合。

26 篇文章

Codex App 4月升级:Agent 拆成工作单元
工具應用/6月28日

Codex App 4月升级:Agent 拆成工作单元

OpenAI 4 月更新 Codex App,把 Agent 从对话对象改成可调度的工作单元,开发者开始用“分派任务”而不是“单点问答”来操作 AI。

AI入行四件套,把门槛降到能上手
產業動態/6月26日

AI入行四件套,把门槛降到能上手

把AI入行拆成标注、提示词、RAG、Agent四条路,并附可直接套用的学习模板。

豆包专业版把Agent做成日常工具
AI Agent/6月26日

豆包专业版把Agent做成日常工具

我拆解豆包专业版的办公任务模式,整理成本地操作、财报分析、Skill 复用的可抄模板。

Loop Engineering 讓 Agent 做完事
AI Agent/6月26日

Loop Engineering 讓 Agent 做完事

我把 Loop Engineering 拆成一套能直接拿去用的 Agent 完成任務模板,重點是讓模型自己檢查、修正、收斂到交付。

Kimi 的長上下文一路加大
模型發布/6月24日

Kimi 的長上下文一路加大

Moonshot AI 的 Kimi 從長上下文聊天機器人,走到 agent 與 1T 參數模型。Kimi K2.5 在 2026 年 1 月登場,也把產品線推到更複雜的階段。

Skill-to-LoRA 讓技能別再吃 Token
技術研究/6月21日

Skill-to-LoRA 讓技能別再吃 Token

Skill-to-LoRA 把 SKILL.md 轉成 LoRA adapter,讓 agent 不必每次把長文件塞進 context,降低 token 成本。

openPangu 2.0 讓小藝會用工具
工具應用/6月19日

openPangu 2.0 讓小藝會用工具

我拆開華為 openPangu 2.0 的工具調用思路,整理成一份可直接套用的助手模板。

GLM-5.2把前沿模型变成工具
模型發布/6月14日

GLM-5.2把前沿模型变成工具

我拆解GLM-5.2全量开放背后的开发者信号,并给你一份可直接改用的模型选型模板。

Devin 定價把 agents 變 seats
工具應用/6月10日

Devin 定價把 agents 變 seats

我拆 Devin 的定價頁,整理出可直接套用的 quota、seat、team 控制模板。

Portainer 升級文把 Docker 更新變清單
工具應用/6月8日

Portainer 升級文把 Docker 更新變清單

我把 Portainer 的 Docker Standalone 升級流程拆成可直接複製的檢查清單,讓你不用邊升級邊猜。

Claude Code Dynamic Workflows:新原语來了
工具應用/6月5日

Claude Code Dynamic Workflows:新原语來了

Anthropic 的 Dynamic Workflows 被解讀為把編排邏輯寫進程式碼的新原語,焦點在於它到底是 workflow 還是 agent。

Vibe Research:用 AI 加速研究流程
工具應用/5月16日

Vibe Research:用 AI 加速研究流程

Vibe research 把 LLM、agent、coding 工具和 review loop 串成流程,讓研究從讀文獻到跑實驗都更可執行。

Claude 幫 Agent 加了做夢功能
AI Agent/5月16日

Claude 幫 Agent 加了做夢功能

Anthropic 為 Claude 托管智能體加入 Dreaming、Outcomes 和多智能體編排,任務完成率最高提升 6 倍。

RAGFlow 加入 Agent 與自架部署
工具應用/5月12日

RAGFlow 加入 Agent 與自架部署

RAGFlow 把開源 RAG、Agent、自架部署和新模型支援整合在一起,適合處理 PDF、表格和多來源文件的團隊。

為什麼開源 LLM 應該按工作負載來選,不該看熱度
技術研究/5月7日

為什麼開源 LLM 應該按工作負載來選,不該看熱度

2026 年選開源 LLM,應該先看工作負載是否匹配,而不是追逐排行榜與發布熱度。

OpenAI Agents SDK 加強企業控管
AI Agent/4月18日

OpenAI Agents SDK 加強企業控管

OpenAI 為 Agents SDK 加上 sandboxing 與 harness 支援,讓企業能把長流程代理人放進更可控的環境,API 也維持標準計價。

GLM-5 登場:Z.AI 的寫程式旗艦
模型發布/4月2日

GLM-5 登場:Z.AI 的寫程式旗艦

GLM-5 是 Z.AI 的新旗艦模型。744B 總參數、200K context、SWE-bench Verified 77.8、Terminal Bench 2.0 56.2,直接挑戰頂級 coding 模型。

CrewForm 讓 Agent 直接變 MCP 工具
AI Agent/4月2日

CrewForm 讓 Agent 直接變 MCP 工具

CrewForm 把已發布的 agents 直接暴露成 MCP tools,Claude Desktop 和 Cursor 只要一份設定檔就能呼叫。這篇拆解它怎麼做、為何重要,以及和其他 agent 整合方式的差別。

OpenCode 加入 MCP 與 OAuth
工具應用/4月2日

OpenCode 加入 MCP 與 OAuth

OpenCode 把 MCP server 接進 LLM,支援本機與遠端連線、OAuth 驗證、每個 agent 的工具控制,還有 token 風險提示。

OpenClaw v2026.3.24 重置與整合指南
AI Agent/4月2日

OpenClaw v2026.3.24 重置與整合指南

OpenClaw v2026.3.24 仍是 beta,但重置流程、Ark Coding Plan 與 Feishu 整合,已經很像可落地的 agent 工作流。

MiMo V2 Pro、Omni、Flash 怎麼選
模型發布/4月2日

MiMo V2 Pro、Omni、Flash 怎麼選

MiMo 2026 三款模型分工很清楚:Flash 主打開源與 coding,Pro 提供 1M context,Omni 則處理圖像、音訊與影片。這篇直接比 benchmark、價格與適用場景。

Agent 基礎設施正在重寫 AI
產業動態/4月1日

Agent 基礎設施正在重寫 AI

SWE-agent、Anthropic 與 MCP 讓人看見,Agent 表現越來越取決於介面、狀態與排程,不再只看模型大小。

MiniMax首份財報:收入年增159%
產業動態/3月28日

MiniMax首份財報:收入年增159%

MiniMax首份港股財報顯示收入年增158.9%,海外收入占73%,毛利率升至25.4%。這家公司正把模型、應用和平台一起做,Agent業務也開始放大商業化。

Kimi K2.5 評測:更強,但還不是神作
AI Agent/3月27日

Kimi K2.5 評測:更強,但還不是神作

Kimi K2.5 加入視覺、寫碼和多代理工具,長文理解更強,但長跑慢、設計感弱、付費牆明顯,還沒到頂級行列。

2026 科技趨勢:AI 進入實戰
產業動態/3月26日

2026 科技趨勢:AI 進入實戰

IBM 對 2026 的觀察很直接:多代理系統會開始進入正式環境,AI 硬體焦點從堆算力轉向效率,量子運算也要面對一次可驗證的實際考驗。重點不再是最大模型,而是能不能在企業裡穩定、便宜、可治理地跑起來。

2026 年 3 月 AI 模型新聞重點
模型發布/3月26日

2026 年 3 月 AI 模型新聞重點

2026 年 3 月的 AI 圈看起來很安靜,其實重點早就不在新模型。真正有料的是推論速度、KV cache 壓縮、Agent 權限控制,還有 OpenAI 內部重組。對開發者來說,這些變化比排行榜多 1 分更實際。