[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-ai-agent-workflows-context-actions-verification-zh":3,"article-related-ai-agent-workflows-context-actions-verification-zh":28,"series-ai-agent-e69f860c-dee7-4831-9ebd-c4485a6fb56f":80},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":11,"views":25,"created_at":26,"published_at":27,"topic_cluster_id":11},"e69f860c-dee7-4831-9ebd-c4485a6fb56f","ai-agent-workflows-context-actions-verification-zh","AI Agent 工作流怎麼運作","\u003Cp>\u003Ca href=\"\u002Fnews\u002Fblockchain-in-ai-real-use-cases-zh\">AI\u003C\u002Fa> Agent 常被講得很神。講白了，它比較像流水線。真正能用的系統，靠的是 4 步：收集上下文、執行動作、驗證結果、再重試。\u003C\u002Fp>\u003Cp>這個循環比模型大小更重要。你給 200k token，也不代表會做對。讀錯檔案、跳過驗證，一樣會翻車。\u003C\u002Fp>\u003Cp>說真的，Agent 不是一段 prompt。它是系統。這篇我用 \u003Ca href=\"https:\u002F\u002Faibuilderhub.dev\u002Fen\u002Fblog\u002Fai-agent-workflow-loop\" target=\"_blank\" rel=\"noopener\">AI Builder Hub\u003C\u002Fa> 的工作流觀點，拆給你看。你如果用 \u003Ca href=\"https:\u002F\u002Fopenai.com\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\" target=\"_blank\" rel=\"noopener\">Anthropic\u003C\u002Fa>，或 \u003Ca href=\"https:\u002F\u002Fwww.langchain.com\" target=\"_blank\" rel=\"noopener\">LangChain\u003C\u002Fa>，重點都一樣：流程有沒有辦法自己抓錯、縮小範圍、把事情做完。\u003C\u002Fp>\u003Ch2>Agent loop 才是核心\u003C\u002Fh2>\u003Cp>最實用的說法很簡單。可靠的 Agent 會先拿對資料，再動手，接著驗證，最後根據結果修正。這聽起來很基本，但很多團隊就是卡在這裡。做了一個能聊天、能呼叫工具的介面，就以為自己做出 Agent。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775116338426-p13x.png\" alt=\"AI Agent 工作流怎麼運作\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>實際工作沒那麼浪漫。寫程式的 Agent，要先看檔案，再改檔案。研究型 Agent，要先讀資料，再下結論。客服型 Agent，要先查政策，再回覆。少了這個循環，模型講話再順，也可能是在亂猜。\u003C\u002Fp>\u003Cp>我覺得這裡最容易被忽略的，是順序。先找上下文，再做動作。不是反過來。很多失敗案例都不是模型不夠強，而是流程一開始就拿錯資訊。\u003C\u002Fp>\u003Cul>\u003Cli>先找上下文：檔案、log、文件、歷史訊息都算。\u003C\u002Fli>\u003Cli>再做動作：要真的用工具，不是只講建議。\u003C\u002Fli>\u003Cli>接著驗證：測試、schema、lint、人工檢查都行。\u003C\u002Fli>\u003Cli>最後重試：失敗後縮小範圍，再跑一次。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這也是為什麼，很多 Agent 反而在「限制自由」後變穩。工具少一點，邊界清楚一點，檢查嚴一點，常常比把所有規則塞進超長 prompt 更有用。\u003C\u002Fp>\u003Cp>還有一個現實問題。每多跑一輪，就多吃 token 和時間。重點不是不要迭代，而是每一輪都要更精準。這才是工程，不是許願。\u003C\u002Fp>\u003Ch2>上下文工程，比大 prompt 更重要\u003C\u002Fh2>\u003Cp>很多人愛吹 context window。可是一個大視窗，不代表會用得好。Agent 拿到整個 codebase，卻只需要 3 個檔案，這種做法很浪費。注意力被雜訊吃掉，最後還是漏掉真正的 bug。\u003C\u002Fp>\u003Cp>這也是現在 production 系統的做法。團隊會用搜尋、檢索、檔案掃描，把真正需要的資料撈出來。像 grep、vector search、文件查詢、前一步的歷史紀錄，都是常見做法。目標不是拿最多內容。目標是拿最相關的內容。\u003C\u002Fp>\u003Cp>這裡可以直接對照 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fanthropics\u002Fclaude-code\" target=\"_blank\" rel=\"noopener\">Claude Code\u003C\u002Fa> 這類工具。它們真正有價值的地方，不是單純能讀很多 token，而是能幫你把問題縮小。你給它 500 個檔案，它不一定更準。你給它 3 個關鍵檔案，通常反而更快。\u003C\u002Fp>\u003Cblockquote>“The future of AI is not about replacing human intelligence, but about augmenting human capabilities.” — Fei-Fei Li\u003C\u002Fblockquote>\u003Cp>Fei-Fei Li 這句話放在這裡很貼切。好的 Agent，不是一直猜。它會先問對問題，再用對資料。這比幻想模型自己腦補全部上下文，實際多了。\u003C\u002Fp>\u003Cp>如果你在做程式碼助手、文件助手、資料分析助手，這個差別超大。上下文抓得準，模型就像有方向感。上下文抓不準，再強的 LLM 也會像在迷路。\u003C\u002Fp>\u003Ch2>驗證，才是 Agent 值不值得信任的地方\u003C\u002Fh2>\u003Cp>很多人做 Agent，最常跳過的就是驗證。模型先生出一段看起來很漂亮的答案，大家就信了。這習慣很危險。講得順，不代表做得對。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775116364668-qyce.png\" alt=\"AI Agent 工作流怎麼運作\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>驗證可以有很多種。程式碼可以跑測試。API 回應可以對 schema。UI 可以比對截圖。高風險操作，可以走人工審核。重點不是找一種萬能檢查，而是讓系統有回饋，而不是只有信仰。\u003C\u002Fp>\u003Cp>這裡我很喜歡把 Agent 當成軟體流程看。不是一個回答機器，而是一個會失敗、會檢查、會修正、會再試一次的系統。這種東西才接近可上線。\u003C\u002Fp>\u003Cul>\u003Cli>規則檢查：格式、欄位、命名先擋掉。\u003C\u002Fli>\u003Cli>Lint：語法和風格錯誤先抓出來。\u003C\u002Fli>\u003Cli>測試：回歸問題最容易在這裡現形。\u003C\u002Fli>\u003Cli>人工審核：高風險決策別全交給模型。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>如果你已經在用 \u003Ca href=\"https:\u002F\u002Fwww.pydantic.dev\" target=\"_blank\" rel=\"noopener\">Pydantic\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fdocs.python.org\u002F3\u002Flibrary\u002Funittest.html\" target=\"_blank\" rel=\"noopener\">Python unittest\u003C\u002Fa>，或 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Ffeatures\u002Factions\" target=\"_blank\" rel=\"noopener\">GitHub Actions\u003C\u002Fa>，你其實已經有一半的 Agent 骨架了。差的只是把這些檢查，接進 Agent 自己的迴圈裡。\u003C\u002Fp>\u003Cp>我也想吐槽一下。很多團隊嘴上說要做可靠 Agent，結果驗證只有「看起來像對的」。這種做法在 demo 可以，進 production 就很容易爆。\u003C\u002Fp>\u003Ch2>子 Agent 不是萬靈丹\u003C\u002Fh2>\u003Cp>子 Agent 這件事，常被講得太神。其實它只是分工工具。當任務可以拆成幾個界線清楚的小工作時，子 Agent 才有價值。不是每個任務都需要一堆小代理人。\u003C\u002Fp>\u003Cp>想像一個 orche\u003Ca href=\"\u002Fnews\u002Ftrust-wallet-agent-kit-ai-trade-25-chains-zh\">st\u003C\u002Fa>rator Agent。它把工作丟給不同子 Agent。A 去找資料。B 查安全問題。C 看效能。最後 orchestrator 收回結果，再決定下一步。這種方式適合範圍大、子任務窄的工作。\u003C\u002Fp>\u003Cp>但代價也很明顯。Agent 越多，協調成本越高。token 用量會上升。不同子 Agent 也可能給出互相衝突的答案。所以子 Agent 不是越多越好，而是要剛好切得動。\u003C\u002Fp>\u003Cul>\u003Cli>搜尋工作：適合平行蒐集來源。\u003C\u002Fli>\u003Cli>程式碼審查：可分安全、效能、風格三路看。\u003C\u002Fli>\u003Cli>研究整理：先分開讀，再統一寫摘要。\u003C\u002Fli>\u003Cli>方案比較：讓不同子 Agent 各自評估。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這種架構最實際的地方，是它很像真實開發流程。不是一個模型包山包海，而是有人負責協調，有人負責查證，有人負責執行。說白了，就是把大型任務拆開。\u003C\u002Fp>\u003Cp>如果你用 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude\" target=\"_blank\" rel=\"noopener\">Claude\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fgpt-4o\" target=\"_blank\" rel=\"noopener\">GPT-4o\u003C\u002Fa>，或透過 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Flangchain-ai\u002Flanggraph\" target=\"_blank\" rel=\"noopener\">LangGraph\u003C\u002Fa> 做流程編排，重點不是「能不能多開幾個 Agent」。重點是哪些工作真的值得獨立出去。\u003C\u002Fp>\u003Ch2>這件事背後的產業脈絡\u003C\u002Fh2>\u003Cp>Agent 熱潮會一直出現，原因很簡單。大家都想把重複工作交給軟體。尤其是客服、資料整理、程式碼維護、內部知識查詢，這些場景都很適合做成流程。\u003C\u002Fp>\u003Cp>但產業裡真正落地的案例，幾乎都不是靠單一大 prompt。它們靠的是資料管線、權限控管、工具串接、驗證機制。也就是說，Agent 成功的關鍵，常常不是模型本身，而是周邊工程。\u003C\u002Fp>\u003Cp>這也是為什麼，很多 \u003Ca href=\"\u002Fnews\u002Ftrust-wallet-ai-trading-agents-220m-users-zh\">AI\u003C\u002Fa> 專案最後會回到傳統軟體工程。你還是得處理 log、錯誤、權限、版本控制、測試環境。模型只是新零件，不是整台機器。\u003C\u002Fp>\u003Cp>再看成本面也很現實。每一次呼叫 API 都有費用。每一次重試都要算 token。每一次工具調用都可能卡在延遲。Agent 不是越聰明越好，而是越少浪費越好。\u003C\u002Fp>\u003Cp>所以我會說，真正成熟的 Agent 團隊，會把注意力放在三件事：上下文怎麼取、動作怎麼做、結果怎麼驗。這三件事做好，模型才有機會發揮。\u003C\u002Fp>\u003Ch2>結論：先把一個流程做穩\u003C\u002Fh2>\u003Cp>如果你現在要做 Agent，我的建議很直接。先挑一個任務。把它拆成上下文、動作、驗證、重試四步。不要一開始就想做全能助手。那通常只是把複雜度往後延。\u003C\u002Fp>\u003Cp>我自己的判斷是，接下來大家會更在意「完成率」而不是「聰明度」。Agent 能不能一次做對，或第二次修對，會比它講話多漂亮更重要。這才是能不能上線的差別。\u003C\u002Fp>\u003Cp>所以你可以問自己一個很實際的問題：你手上第一個能被做成 loop 的工作是什麼？如果你能替它加上一個明確檢查點，你就已經比很多只會聊天的 Agent 走得更遠了。\u003C\u002Fp>","AI Agent 不是靠一句提示詞就能跑。真正好用的系統靠的是「收集上下文、執行動作、驗證結果、重試」的工作流。","aibuilderhub.dev","https:\u002F\u002Faibuilderhub.dev\u002Fen\u002Fblog\u002Fai-agent-workflow-loop",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775116338426-p13x.png","ai-agent","zh","c006ce9e-1c5e-4091-b99e-e13eb02b643e",[17,18,19,20,21,22,23,24],"AI Agent","工作流","上下文工程","驗證機制","子 Agent","LangChain","Claude","GPT-4o",5,"2026-04-02T07:03:33.780133+00:00","2026-04-02T07:03:33.573+00:00",{"tags":29,"relatedLang":11,"relatedPosts":43},[30,32,34,35,37,39,41,42],{"name":24,"slug":31},"gpt-4o",{"name":22,"slug":33},"langchain",{"name":19,"slug":19},{"name":23,"slug":36},"claude",{"name":21,"slug":38},"子-agent",{"name":40,"slug":13},"AI agent",{"name":18,"slug":18},{"name":20,"slug":20},[44,50,56,62,68,74],{"id":45,"slug":46,"title":47,"cover_image":48,"image_url":48,"created_at":49,"category":13},"83c2f8f6-3710-466e-b52c-473b811f0535","how-to-set-up-openclaw-safely-zh","如何安全架設 OpenClaw","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780549368665-1t2l.png","2026-06-04T05:02:21.26625+00:00",{"id":51,"slug":52,"title":53,"cover_image":54,"image_url":54,"created_at":55,"category":13},"0ba5b1a8-82c5-464a-bea5-9a2c8730da74","aws-devops-agent-turns-incident-chaos-into-triage-zh","AWS DevOps Agent 把事故排查變成三步","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780466689960-g1sv.png","2026-06-03T06:03:14.154923+00:00",{"id":57,"slug":58,"title":59,"cover_image":60,"image_url":60,"created_at":61,"category":13},"841eac88-b0f0-4a4c-9e1e-efc3b5c16281","kimi-k26-live-300-agent-workflows-zh","Kimi K2.6 上線：300 代理工作流","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780430574285-hqpn.png","2026-06-02T20:02:24.972179+00:00",{"id":63,"slug":64,"title":65,"cover_image":66,"image_url":66,"created_at":67,"category":13},"f0411957-bcdb-42d9-a267-3e90ae7d9cb1","how-to-take-a-sabbatical-at-openai-zh","怎麼申請 OpenAI sabbatical","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780398216422-8fi7.png","2026-06-02T11:02:25.74372+00:00",{"id":69,"slug":70,"title":71,"cover_image":72,"image_url":72,"created_at":73,"category":13},"37a5e429-4235-439c-9b05-bb377085462c","8-steps-build-production-rag-with-langchain-zh","8 步驟打造可上線的 LangChain RAG","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780178597493-4hz7.png","2026-05-30T22:02:48.14022+00:00",{"id":75,"slug":76,"title":77,"cover_image":78,"image_url":78,"created_at":79,"category":13},"e73c041b-852b-44c3-85aa-0f1e2e5848e3","ai-agents-hit-chaos-mode-claude-code-openclaw-zh","Claude Code＋OpenClaw 讓 AI 代理失控升溫","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780160576178-yqcs.png","2026-05-30T17:02:25.725767+00:00",[81,86,91,96,101,106,111,116,121,126],{"id":82,"slug":83,"title":84,"created_at":85},"4ae1e197-1d3d-4233-8733-eafe9cb6438b","claude-now-uses-your-pc-to-finish-tasks-zh","Claude 開始幫你操作電腦","2026-03-26T07:20:48.457387+00:00",{"id":87,"slug":88,"title":89,"created_at":90},"5bede67f-e21c-413d-9ab8-54a3c3d26227","googles-2026-ai-agent-report-decoded-zh","Google 2026 AI Agent 報告解讀","2026-03-26T11:15:22.651956+00:00",{"id":92,"slug":93,"title":94,"created_at":95},"2987d097-563f-46c7-b76f-b558d8ef7c2b","kimi-k25-review-stronger-still-not-legend-zh","Kimi K2.5 評測：更強，但還不是神作","2026-03-27T07:15:55.277513+00:00",{"id":97,"slug":98,"title":99,"created_at":100},"95c9053b-e3f4-4cb5-aace-5c54f4c9e044","claude-code-controls-mac-desktop-zh","Claude Code 也能操控 Mac 了","2026-03-28T03:01:58.58121+00:00",{"id":102,"slug":103,"title":104,"created_at":105},"dc58e153-e3a8-4c06-9b96-1aa64eabbf5f","cloudflare-100x-faster-ai-agent-sandbox-zh","Cloudflare 的 AI 沙箱跑超快","2026-03-28T03:09:44.142236+00:00",{"id":107,"slug":108,"title":109,"created_at":110},"1c8afc56-253f-47a2-979f-1065ff072f2a","openai-backs-isara-agent-swarm-bet-zh","OpenAI 挺 Isara 的 agent swarm …","2026-03-28T03:15:27.513155+00:00",{"id":112,"slug":113,"title":114,"created_at":115},"7379b422-576e-45df-ad5a-d57a0d9dd467","openai-plan-automated-ai-researcher-zh","OpenAI 想做自動化 AI 研究員","2026-03-28T03:17:42.090548+00:00",{"id":117,"slug":118,"title":119,"created_at":120},"48c9889e-86df-450b-a356-e4a4b7c83c5b","harness-engineering-ai-agent-reliability-2026-zh","駕馭工程：從「馬具」到「作業系統」，AI Agent 可靠性的終極密碼","2026-03-31T06:42:53.556721+00:00",{"id":122,"slug":123,"title":124,"created_at":125},"96d8e8c8-1edd-475d-9145-b1e7a1b02b65","mcp-explained-from-prompts-to-production-zh","MCP 怎麼把提示詞變工作流","2026-04-01T09:24:39.321274+00:00",{"id":127,"slug":128,"title":129,"created_at":130},"f2ca7720-b471-4ce5-9336-2a9ac2a876fd","amazon-bedrock-agents-multi-agent-workflows-zh","Amazon Bedrock Agents 進入多代理工作流","2026-04-01T09:30:29.945429+00:00"]