[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-anthropic-dreaming-claude-managed-agents-zh":3,"article-related-anthropic-dreaming-claude-managed-agents-zh":31,"series-ai-agent-13f738eb-5b3a-4a33-8d89-4470e946d0f4":84},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":24,"views":28,"created_at":29,"published_at":30,"topic_cluster_id":11},"13f738eb-5b3a-4a33-8d89-4470e946d0f4","anthropic-dreaming-claude-managed-agents-zh","Anthropic 替 Claude 加上做夢功能","\u003Cp data-speakable=\"summary\">Anthr\u003Ca href=\"\u002Fnews\u002Fmicrosoft-365-copilot-glint-survey-summaries-zh\">opi\u003C\u002Fa>c 為 \u003Ca href=\"\u002Ftag\u002Fclaude\">Claude\u003C\u002Fa> Managed \u003Ca href=\"\u002Fnews\u002Fdeerflow-2-0-agent-orchestration-framework-zh\">Agen\u003C\u002Fa>ts 加入 dreaming、outcomes 和 multiagent orchestration，讓代理能記憶、評分與分工。\u003C\u002Fp>\u003Cp>說真的，這波更新很像在補作業。\u003Ca href=\"\u002Ftag\u002Fanthropic\">Anthropic\u003C\u002Fa> 才在上個月推出 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002F\" target=\"_blank\" rel=\"noopener\">Claude Managed Agents\u003C\u002Fa>，這週就把三個新功能端上來。重點不是炫技，而是把 agent 從「能跑」推到「能管、能評、能協作」。\u003C\u002Fp>\u003Cp>這次加的三個東西很直白。\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\" target=\"_blank\" rel=\"noopener\">dreaming\u003C\u002Fa> 負責整理記憶，outcomes 負責打分，multiagent orchestration 負責分工。講白了，就是讓 Claude 不只會做事，還會回頭檢討、接受考核，然後找同事一起做。\u003C\u002Fp>\u003Ctable>\u003Cthead>\u003Ctr>\u003Cth>功能\u003C\u002Fth>\u003Cth>用途\u003C\u002Fth>\u003Cth>狀態\u003C\u002Fth>\u003C\u002Ftr>\u003C\u002Fthead>\u003Ctbody>\u003Ctr>\u003Ctd>Dreaming\u003C\u002Ftd>\u003Ctd>回看過去對話，找出模式，更新記憶\u003C\u002Ftd>\u003Ctd>Research preview\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>Outcomes\u003C\u002Ftd>\u003Ctd>讓開發者定義成功標準，再由 grader 評分\u003C\u002Ftd>\u003Ctd>新功能\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>Multiagent orchestration\u003C\u002Ftd>\u003Ctd>主 agent 分派工作給多個專家 agent\u003C\u002Ftd>\u003Ctd>新功能\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>Claude Managed Agents 上線時間\u003C\u002Ftd>\u003Ctd>Anthropic 在上個月推出\u003C\u002Ftd>\u003Ctd>2026-04\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>本次更新時間\u003C\u002Ftd>\u003Ctd>這波功能在本週釋出\u003C\u002Ftd>\u003Ctd>2026-05-07\u003C\u002Ftd>\u003C\u002Ftr>\u003C\u002Ftbody>\u003C\u002Ftable>\u003Ch2>Dreaming 像是幫 agent 做記憶整理\u003C\u002Fh2>\u003Cp>Anthropic 的 dreaming，核心就是回頭看。它會檢查過去的 sessions，找出重複出現的模式，再把有用的東西寫回記憶系統。你可以把它想成排程版的復盤工具，不是每做一步就學一次，而是定期整理一次。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778206850098-hbiv.png\" alt=\"Anthropic 替 Claude 加上做夢功能\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這設計其實很務實。LLM 很會即興回答，但記憶很常亂掉。今天記住，明天忘記，後天又自己補故事。dreaming 的目的，就是把這種散掉的資訊重新收斂，讓下一輪執行更像真的有經驗。\u003C\u002Fp>\u003Cp>更實用的是控制權。Anthropic 說，dreaming 可以自動更新記憶，也可以先給開發者看過再套用。這點很重要。很多團隊不是不想讓 \u003Ca href=\"\u002Ftag\u002Fagent\">agent\u003C\u002Fa> 學習，而是不想讓它自己亂改行為。\u003C\u002Fp>\u003Cul>\u003Cli>Dreaming 不是即時學習。\u003C\u002Fli>\u003Cli>它會定期回看歷史 session。\u003C\u002Fli>\u003Cli>它能自動更新，也能人工審核。\u003C\u002Fli>\u003Cli>Anthropic 把它列成 research preview。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這裡可以看出 Anthropic 的思路。它不是只想做一個會聊天的模型，而是想做一個會累積經驗的系統。對做客服、內部知識庫、或流程自動化的人來說，這種記憶整理比單次回答漂亮多少，更有價值。\u003C\u002Fp>\u003Cblockquote>“A separate grader evaluates the output against your criteria in its own context window, so it isn’t influenced by the agent’s reasoning.”\u003C\u002Fblockquote>\u003Ch2>Outcomes 把模糊目標變成可測標準\u003C\u002Fh2>\u003Cp>Outcomes 這個功能，說白了就是把「你自己看著辦」變成「照這個規格打分」。Anthropic 讓開發者先寫 rubric，也就是成功標準，再交給獨立 grader 去評估結果。這種做法很像把 prompt 工程往評測工程推了一步。\u003C\u002Fp>\u003Cp>我覺得這點比 dreaming 更接近產品需求。因為很多 agent 專案死掉，不是因為不會做，而是因為沒辦法穩定驗收。今天看起來對，明天又歪掉。沒有評分系統，團隊根本不知道是模型爛，還是 prompt 爛。\u003C\u002Fp>\u003Cp>Anthropic 還特別把 grader 和 agent 的思考過程切開。grader 在自己的 context w\u003Ca href=\"\u002Fnews\u002Fwhy-deepmind-workers-are-right-to-unionize-over-pentagon-ai-zh\">ind\u003C\u002Fa>ow 裡評分，不看 agent 的推理鏈。這樣比較不會被 agent 的長篇大論帶偏。講難聽一點，就是少一點嘴砲，多一點結果。\u003C\u002Fp>\u003Cp>另外，outcomes 也支援 webhook。這代表你可以把 agent 丟出去跑，完成後再通知你。對做非同步流程的人來說，這比一直盯著 console 方便太多。尤其是內部工具、資料處理、報表產生這類工作，很適合這種模式。\u003C\u002Fp>\u003Cul>\u003Cli>先定 rubric，再讓 agent 跑。\u003C\u002Fli>\u003Cli>grader 和 agent 分開，降低互相干擾。\u003C\u002Fli>\u003Cli>支援 webhook，適合非同步流程。\u003C\u002Fli>\u003Cli>比起 demo，這更像正式驗收流程。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這邊的方向很明顯。Anthropic 想把 agent 開發，從「寫 prompt」拉到「設計評測」。這對\u003Ca href=\"\u002Ftag\u002F台灣開發者\">台灣開發者\u003C\u002Fa>很有感，因為很多團隊現在卡住的不是模型選哪個，而是怎麼驗證它真的有用。\u003C\u002Fp>\u003Ch2>Multiagent orchestration 讓工作真的能分工\u003C\u002Fh2>\u003Cp>如果說 dreaming 是記憶，outcomes 是考試，那 multiagent orchestration 就是開會分工。Anthropic 的設計是，主 agent 先拆解任務，再把子任務丟給不同專長的 subagents。每個 subagent 有自己的 model、prompt 和 tools。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778206848037-ztwd.png\" alt=\"Anthropic 替 Claude 加上做夢功能\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這種架構很適合複雜工作。像事故排查、支援分析、程式碼偵錯，都不是單一路徑能解完。你要看 deploy history，要翻 error logs，要比對 metrics，還要查 support tickets。讓一個 agent 來回切換，常常只會越看越亂。\u003C\u002Fp>\u003Cp>Anthropic 的做法是讓專家並行工作。主 agent 負責統整，子 agent 負責挖資料。它還提到 shared filesystem 和 persistent events。意思是大家能共用工作區，主 agent 也能中途回來看進度。這比一次性對話更像 workflow engine。\u003C\u002Fp>\u003Cul>\u003Cli>主 agent 負責拆解與統整。\u003C\u002Fli>\u003Cli>子 agent 各自處理不同資料源。\u003C\u002Fli>\u003Cli>shared filesystem 讓工作成果能共用。\u003C\u002Fli>\u003Cli>persistent events 讓流程可中途回查。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>Anthropic 還提到 \u003Ca href=\"https:\u002F\u002Fwww.netflix.com\u002F\" target=\"_blank\" rel=\"noopener\">Netflix\u003C\u002Fa> 已經在用 Claude Managed \u003Ca href=\"\u002Ftag\u002Fagents\">Agents\u003C\u002Fa> 做平台工作。這不代表每家公司都該照抄，但至少說明一件事：這套東西不是只給 demo 用，而是瞄準真的有流程壓力的團隊。\u003C\u002Fp>\u003Ch2>這次更新跟其他 agent 平台比起來怎樣\u003C\u002Fh2>\u003Cp>如果拿市場上的 agent 平台來看，Anthropic 這次走得很像「先把底層工具補齊」。OpenAI 的方向比較偏模型能力和工具呼叫。\u003Ca href=\"https:\u002F\u002Fplatform.openai.com\u002Fdocs\u002Fassistants\u002Foverview\" target=\"_blank\" rel=\"noopener\">OpenAI Assistants\u003C\u002Fa> 早就把檔案、工具、對話流程整合進去。Anthropic 則更明確地把記憶、評分、分工拆成三層。\u003C\u002Fp>\u003Cp>這種拆法有好處，也有代價。好處是清楚。你知道哪個功能管記憶，哪個管驗收，哪個管協作。代價是系統會更複雜。你不是在養一個 agent，而是在養一整組 agent。這對小團隊來說，門檻不低。\u003C\u002Fp>\u003Cp>如果看 \u003Ca href=\"https:\u002F\u002Fplatform.openai.com\u002Fdocs\u002Fguides\u002Fagents\" target=\"_blank\" rel=\"noopener\">OpenAI Agents\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fdevelopers.google.com\u002Fagent-builder\" target=\"_blank\" rel=\"noopener\">Google 的 agent 工具\u003C\u002Fa>，或 \u003Ca href=\"https:\u002F\u002Fwww.langchain.com\u002F\" target=\"_blank\" rel=\"noopener\">LangChain\u003C\u002Fa> 這類框架，大家都在往同一個方向走：讓 agent 不只是對話，而是能接流程、接評測、接多步驟任務。差別只在誰先把哪一塊做得比較完整。\u003C\u002Fp>\u003Cp>我自己的判斷是，Anthropic 這次比較像在補生產環境缺口。它不是在跟你說 agent 多神，而是在說：你要上線，就得有記憶、要有評分、還要能分工。這三件事少一件，系統都很難穩。\u003C\u002Fp>\u003Cul>\u003Cli>Anthropic：重視記憶、評分、協作三層。\u003C\u002Fli>\u003Cli>OpenAI：工具整合和模型生態較強。\u003C\u002Fli>\u003Cli>LangChain：彈性高，但要自己拼很多元件。\u003C\u002Fli>\u003Cli>對小團隊來說，Anthropic 的整合度更省事。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>如果你在做產品，差異會很直接。你要的是一個能 demo 的 agent，還是一個能每天跑、還能被驗收的系統？這次 Anthropic 明顯是把答案往後者推。\u003C\u002Fp>\u003Ch2>這代表 agent 開發開始走向工程化\u003C\u002Fh2>\u003Cp>Claude Managed Agents 的這波更新，透露出一個很現實的趨勢。大家已經不太滿足於「模型會回答」。現在更在意的是，它能不能記住、能不能評分、能不能跟別的 agent 協作。這些都不是聊天機器人的語言，而是工程的語言。\u003C\u002Fp>\u003Cp>這也解釋了為什麼 Anthropic 要把功能拆得這麼細。dreaming 處理長期記憶，outcomes 處理驗收，multiagent orchestration 處理分工。這三個拼起來，才像一個能上線的系統。單靠一個大 prompt，真的撐不久。\u003C\u002Fp>\u003Cp>更大的變化是，agent 開發開始像資料管線。你要管輸入、管中間狀態、管輸出、管回饋。這跟以前做 API 串接很像，只是現在多了一層 LLM 的不確定性。也因為這樣，評測和回饋機制會越來越重要。\u003C\u002Fp>\u003Cp>我會建議台灣團隊先想清楚一件事：你的 agent 是要處理單一任務，還是長流程工作？如果是後者，那 dreaming 和 outcomes 這類功能就不是花俏配件，而是基本盤。少了它們，agent 很容易只停在展示階段。\u003C\u002Fp>\u003Ch2>接下來該看什麼\u003C\u002Fh2>\u003Cp>接下來我會盯兩件事。第一，dreaming 會不會從 research preview 變成更穩定的正式功能。第二，outcomes 和 multiagent orchestration 會不會被更多開發者拿去做真實工作流，而不是只留在產品簡報裡。\u003C\u002Fp>\u003Cp>如果你現在就在做 Claude 上的 agent，我的建議很直接。先挑一個可量化任務，寫出 rubric，再試著把工作拆成兩到三個角色。不要一開始就做超大系統。先把評分和分工跑順，才知道哪裡真的有價值。\u003C\u002Fp>\u003Cp>講白了，Anthropic 這次不是在賣夢想。它是在把 agent 變成一個能被管理的軟體系統。這條路很務實，也很難走。你如果正在做 AI 產品，現在就該想：你的團隊，準備好把 agent 當成系統來管了嗎？\u003C\u002Fp>","Anthropic 為 Claude Managed Agents 加入 dreaming、outcomes 和 multiagent orchestration，讓代理能記憶、評分與分工。","9to5mac.com","https:\u002F\u002F9to5mac.com\u002F2026\u002F05\u002F07\u002Fanthropic-updates-claude-managed-agents-with-three-new-features\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778206850098-hbiv.png","ai-agent","zh","1ff8e36b-be06-4577-9bcd-7af4e3ae91bf",[17,18,19,20,21,22,23],"Anthropic","Claude Managed Agents","dreaming","outcomes","multiagent orchestration","LLM agent","AI 開發",[25,26,27],"dreaming 讓 Claude 透過回看歷史 sessions 來整理記憶。","outcomes 把成功標準變成可評分的 rubric。","multiagent orchestration 讓主 agent 可以分派工作給專家 agent。",3,"2026-05-08T02:20:34.356866+00:00","2026-05-08T02:20:34.312+00:00",{"tags":32,"relatedLang":43,"relatedPosts":47},[33,35,37,39,41],{"name":34,"slug":20},"Outcomes",{"name":18,"slug":36},"claude-managed-agents",{"name":38,"slug":19},"Dreaming",{"name":17,"slug":40},"anthropic",{"name":21,"slug":42},"multiagent-orchestration",{"id":15,"slug":44,"title":45,"language":46},"anthropic-dreaming-claude-managed-agents-en","Anthropic adds dreaming to Claude Managed Agents","en",[48,54,60,66,72,78],{"id":49,"slug":50,"title":51,"cover_image":52,"image_url":52,"created_at":53,"category":13},"83c2f8f6-3710-466e-b52c-473b811f0535","how-to-set-up-openclaw-safely-zh","如何安全架設 OpenClaw","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780549368665-1t2l.png","2026-06-04T05:02:21.26625+00:00",{"id":55,"slug":56,"title":57,"cover_image":58,"image_url":58,"created_at":59,"category":13},"0ba5b1a8-82c5-464a-bea5-9a2c8730da74","aws-devops-agent-turns-incident-chaos-into-triage-zh","AWS DevOps Agent 把事故排查變成三步","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780466689960-g1sv.png","2026-06-03T06:03:14.154923+00:00",{"id":61,"slug":62,"title":63,"cover_image":64,"image_url":64,"created_at":65,"category":13},"841eac88-b0f0-4a4c-9e1e-efc3b5c16281","kimi-k26-live-300-agent-workflows-zh","Kimi K2.6 上線：300 代理工作流","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780430574285-hqpn.png","2026-06-02T20:02:24.972179+00:00",{"id":67,"slug":68,"title":69,"cover_image":70,"image_url":70,"created_at":71,"category":13},"f0411957-bcdb-42d9-a267-3e90ae7d9cb1","how-to-take-a-sabbatical-at-openai-zh","怎麼申請 OpenAI sabbatical","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780398216422-8fi7.png","2026-06-02T11:02:25.74372+00:00",{"id":73,"slug":74,"title":75,"cover_image":76,"image_url":76,"created_at":77,"category":13},"37a5e429-4235-439c-9b05-bb377085462c","8-steps-build-production-rag-with-langchain-zh","8 步驟打造可上線的 LangChain RAG","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780178597493-4hz7.png","2026-05-30T22:02:48.14022+00:00",{"id":79,"slug":80,"title":81,"cover_image":82,"image_url":82,"created_at":83,"category":13},"e73c041b-852b-44c3-85aa-0f1e2e5848e3","ai-agents-hit-chaos-mode-claude-code-openclaw-zh","Claude Code＋OpenClaw 讓 AI 代理失控升溫","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780160576178-yqcs.png","2026-05-30T17:02:25.725767+00:00",[85,90,95,100,105,110,115,120,125,130],{"id":86,"slug":87,"title":88,"created_at":89},"4ae1e197-1d3d-4233-8733-eafe9cb6438b","claude-now-uses-your-pc-to-finish-tasks-zh","Claude 開始幫你操作電腦","2026-03-26T07:20:48.457387+00:00",{"id":91,"slug":92,"title":93,"created_at":94},"5bede67f-e21c-413d-9ab8-54a3c3d26227","googles-2026-ai-agent-report-decoded-zh","Google 2026 AI Agent 報告解讀","2026-03-26T11:15:22.651956+00:00",{"id":96,"slug":97,"title":98,"created_at":99},"2987d097-563f-46c7-b76f-b558d8ef7c2b","kimi-k25-review-stronger-still-not-legend-zh","Kimi K2.5 評測：更強，但還不是神作","2026-03-27T07:15:55.277513+00:00",{"id":101,"slug":102,"title":103,"created_at":104},"95c9053b-e3f4-4cb5-aace-5c54f4c9e044","claude-code-controls-mac-desktop-zh","Claude Code 也能操控 Mac 了","2026-03-28T03:01:58.58121+00:00",{"id":106,"slug":107,"title":108,"created_at":109},"dc58e153-e3a8-4c06-9b96-1aa64eabbf5f","cloudflare-100x-faster-ai-agent-sandbox-zh","Cloudflare 的 AI 沙箱跑超快","2026-03-28T03:09:44.142236+00:00",{"id":111,"slug":112,"title":113,"created_at":114},"1c8afc56-253f-47a2-979f-1065ff072f2a","openai-backs-isara-agent-swarm-bet-zh","OpenAI 挺 Isara 的 agent swarm …","2026-03-28T03:15:27.513155+00:00",{"id":116,"slug":117,"title":118,"created_at":119},"7379b422-576e-45df-ad5a-d57a0d9dd467","openai-plan-automated-ai-researcher-zh","OpenAI 想做自動化 AI 研究員","2026-03-28T03:17:42.090548+00:00",{"id":121,"slug":122,"title":123,"created_at":124},"48c9889e-86df-450b-a356-e4a4b7c83c5b","harness-engineering-ai-agent-reliability-2026-zh","駕馭工程：從「馬具」到「作業系統」，AI Agent 可靠性的終極密碼","2026-03-31T06:42:53.556721+00:00",{"id":126,"slug":127,"title":128,"created_at":129},"96d8e8c8-1edd-475d-9145-b1e7a1b02b65","mcp-explained-from-prompts-to-production-zh","MCP 怎麼把提示詞變工作流","2026-04-01T09:24:39.321274+00:00",{"id":131,"slug":132,"title":133,"created_at":134},"f2ca7720-b471-4ce5-9336-2a9ac2a876fd","amazon-bedrock-agents-multi-agent-workflows-zh","Amazon Bedrock Agents 進入多代理工作流","2026-04-01T09:30:29.945429+00:00"]