[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"tag-tool-use":3},{"tag":4,"articles":11,"peer_article_count":57},{"id":5,"name":6,"slug":7,"article_count":8,"description_zh":9,"description_en":10},"95d84e59-4a34-4d99-a04c-cf3218a596d4","tool use","tool-use",3,"工具使用指的是讓 LLM 或代理在需要時呼叫搜尋、程式執行、資料庫或外部 API，而不只是靠模型內部生成。重點不在多會用工具，而在何時該用、何時該停，牽涉推理正確率、延遲、成本與可觀測性，尤其在多模態代理與產品化工作流中更明顯。","Tool use refers to letting LLMs and agents call search, code execution, databases, or external APIs only when needed, instead of relying on generation alone. The hard part is deciding when a tool helps and when it just adds latency, cost, or failure modes, especially in multimodal agents and production workflows.",[12,21,28,36,43,50],{"id":13,"slug":14,"title":15,"summary":16,"category":17,"image_url":18,"cover_image":18,"language":19,"created_at":20},"f9ec6d6f-80a9-4a8e-b3ea-1eb5231aa796","new-nlp-papers-agent-memory-tool-use-zh","新 NLP 論文盯上代理記憶與工具使用","6 月 24 日的 arXiv 論文整理，聚焦 agent 記憶、工具使用評估與對話式搜尋，對做 AI 代理和搜尋助理的人很實用。","research","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782371888802-40t8.png","zh","2026-06-25T07:17:39.070441+00:00",{"id":22,"slug":23,"title":24,"summary":25,"category":17,"image_url":26,"cover_image":26,"language":19,"created_at":27},"f7bb2a7e-9b8a-45ec-bd48-c3dd41c8662a","benchlm-agent-tool-use-benchmarks-2026-zh","BenchLM 2026：AI Agent 模型排行","BenchLM 2026 用 26 個基準測 AI agent 模型，重點看工具呼叫、瀏覽器、終端機和電腦控制，GPT-5.5 Pro 目前拿下驗證榜首。","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780317190055-uee0.png","2026-06-01T12:32:37.6253+00:00",{"id":29,"slug":30,"title":31,"summary":32,"category":33,"image_url":34,"cover_image":34,"language":19,"created_at":35},"e005a4b5-a1cc-4b54-9fa6-48ae38483846","manus-ai-turns-workflows-into-agent-projects-zh","Manus AI 把工作流變成專案","拆 Manus AI 的代理工作流模型，順手給你一份可直接複製的多步任務模板。","ai-agent","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1779743783745-fe6j.png","2026-05-25T21:15:56.217317+00:00",{"id":37,"slug":38,"title":39,"summary":40,"category":17,"image_url":41,"cover_image":41,"language":19,"created_at":42},"adfa9b15-68b6-44cc-b34d-ebcb02c31210","code-becomes-the-agent-harness-zh","程式碼成了代理引擎","這篇綜述把程式碼定位成代理系統的運行層，串起推理、動作、記憶與驗證，重點在架構視角而非新模型。","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1779173040130-zcyg.png","2026-05-19T06:43:29.625994+00:00",{"id":44,"slug":45,"title":46,"summary":47,"category":17,"image_url":48,"cover_image":48,"language":19,"created_at":49},"5e4f3620-9a8e-4185-84d2-fa8ef42fc058","act-wisely-tool-use-agentic-multimodal-models-zh","教代理何時別叫工具","HDPO 把「答對」和「少叫工具」分開訓練，想修正多模態代理的盲目工具使用。摘要稱它能大幅減少呼叫次數，同時提升推理正確率。","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775801029065-5n2l.png","2026-04-10T06:03:34.31315+00:00",{"id":51,"slug":52,"title":53,"summary":54,"category":33,"image_url":55,"cover_image":55,"language":19,"created_at":56},"2e3a7869-d773-4c82-a8ab-d992934e0e47","hermes-agent-agent-harness-framework-zh","Hermes Agent：代理測試框架怎麼看","Hermes Agent 想把 agent 的工具呼叫、追蹤、評測和流程控制收進同一套框架。對要把 LLM 做進產品的團隊來說，這種 harness 比炫技 demo 更實用。","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775207571413-ex0h.png","2026-04-03T09:12:32.90367+00:00",4]