分類

AI Agent

AI Agent、自主系統與代理工作流程。多代理框架、工具使用，以及 AI 自主化趨勢的所有內容。

OpenMontage 證明 AI 影片製作該由開源接管

OpenMontage 證明 AI 影片製作該由開源接管

OpenMontage 顯示，AI 影片製作的正確路線是開源、可編排、可檢查的 agentic 系統，而不是封閉式提示框。

Gemini 3.5 Flash 讓你寫電腦操作腳本

Gemini 3.5 Flash 讓你寫電腦操作腳本

拆 Gemini 3.5 Flash 的 computer use、prompt injection 防護，最後給你可直接套用的工作流模板。

DESIGN.md 是把品味變成 UI 骨架的缺失橋樑

DESIGN.md 是把品味變成 UI 骨架的缺失橋樑

我認為 DESIGN.md 是 AI 設計工作最實用的中介層，因為它把視覺品味變成可執行、可重用、可審查的設計來源。

OpenClaw 證明：代理系統的勝負在控制層，不在模型

OpenClaw 證明：代理系統的勝負在控制層，不在模型

OpenClaw 與 Hermes 顯示，代理系統的關鍵不是更強的模型，而是能約束、驗證與治理模型行為的控制層。

OpenClaw 把聊天 App 變成持久 AI

OpenClaw 把聊天 App 變成持久 AI

OpenClaw 在 2026 年 6 月 20 日公開做法，示範如何把 Telegram、記憶、工具與系統提示串成一個可持續對話的個人 AI 助手。

抽出提示詞把模型行為變地圖

抽出提示詞把模型行為變地圖

拆解抽出系統提示詞的實用讀法，附可直接複製的模板，幫你把模型行為當成可檢查的規格。

Hippo 導入 Devin 進入保險工程

Hippo 導入 Devin 進入保險工程

Hippo 於 6 月 25 日宣布把 Cognition 的 Devin 部署到整個工程團隊，目標是加快保險軟體開發，涵蓋 rate filings、underwriting、分發與客服流程。

豆包专业版把Agent做成日常工具

豆包专业版把Agent做成日常工具

我拆解豆包专业版的办公任务模式，整理成本地操作、财报分析、Skill 复用的可抄模板。

Valkey 用 bots 把回補變流水線

Valkey 用 bots 把回補變流水線

我拆 Valkey 怎麼用 AI agent 做 backport，再把驗證卡死，讓回補從手工苦工變成可控流程。

Loop Engineering 入门：做出可持续迭代智能体

Loop Engineering 入门：做出可持续迭代智能体

用 LangChain 和 LangGraph 搭建一个可持续迭代的 Loop Engineering 智能体。

omp 把終端機變成 IDE 級編碼工具

omp 把終端機變成 IDE 級編碼工具

omp 是一個開源終端機編碼代理，主打 Hashline 編輯、LSP/DAP 深度整合和跨工作階段記憶，想把 terminal 做成可除錯、可重構的開發環境。

公開 Sentry key 也能劫持 AI 編碼工具

公開 Sentry key 也能劫持 AI 編碼工具

研究者示範公開 Sentry key 可被拿來注入惡意 MCP 資料，影響 Claude Code、Cursor、Codex 的判斷與操作。

Loop Engineering 讓 Agent 做完事

Loop Engineering 讓 Agent 做完事

我把 Loop Engineering 拆成一套能直接拿去用的 Agent 完成任務模板，重點是讓模型自己檢查、修正、收斂到交付。

Codex 接入第三方模型實作指南

Codex 接入第三方模型實作指南

這篇指南教你把第三方開源模型接到 OpenAI Codex App、CLI 與 SDK，完成設定、驗證與回退。

Manus AI 證明代理式 App 已能上線做事

Manus AI 證明代理式 App 已能上線做事

我認為 Manus AI 已經不只是聊天機器人，而是能交付成果的代理式工具，真正適合拿來做工作。

Grok Build 加上 /goal，自動寫碼更像樣了

Grok Build 加上 /goal，自動寫碼更像樣了

xAI 在 Grok Build 加入 /goal，讓代理能在本機上規劃、執行、驗證程式任務。這篇整理它的工作流程、驗證方式、價格與 SWE-Bench 對比。

Claude 讓 Slack 變研究庫

Claude 讓 Slack 變研究庫

我把 Reuters 對 Claude Tag Research 的報導拆成可落地的 Slack 研究流程，重點是標籤、權限、摘要與可複製模板。

這個 coding benchmark 證明：harness 品質勝過模型光環

這個 coding benchmark 證明：harness 品質勝過模型光環

這篇主張：評估 coding 模型時，決定結果的不是模型品牌，而是 benchmark harness 的設計品質。

GLM-5 對了：該殺掉 vibe coding，改做 agent engin…

GLM-5 對了：該殺掉 vibe coding，改做 agent engin…

GLM-5 釋出了一個清楚訊號：AI 開發不能再停留在 vibe coding，必須轉向可驗證、可維護的 agent engineering。

Loop Engineering：Claude Code 的新工作法

Loop Engineering：Claude Code 的新工作法

Loop Engineering 把 AI 開發改成觀察、回饋、修正的循環流程，重點從寫提示詞轉到設計工作流。

Fable 5 封鎖暴露模型路由賽局

Fable 5 封鎖暴露模型路由賽局

Anthropic 短暫封鎖 Fable 5 後，4 個開源模型立刻接手回應。這件事把模型路由、備援機制和 Wasm 安全邊界一次攤開。

Myseum 與 Scanon 的合作，是隱私優先審核的合理押注

Myseum 與 Scanon 的合作，是隱私優先審核的合理押注

Myseum 與 Scanon 的合作是合理的，因為在私密社交產品裡，審核本身就是產品，而不是附加功能。

AI 程式碼審查落地且不降品質

AI 程式碼審查落地且不降品質

這篇教你把 AI 程式碼審查接進既有流程，保留人類把關、先做單一倉庫試點、再用數據決定是否擴大。

Crypto AI 代理的隱藏模型風險

Crypto AI 代理的隱藏模型風險

Crypto AI 代理可能在模型切換後仍持續運作，但決策邏輯會變。Anthropic 的模型停用案例顯示，這種風險會直接影響交易與錢包操作。

AI agents 正進入真實軟體與金融

AI agents 正進入真實軟體與金融

AI agents 正從聊天工具走進軟體、政府與金融流程。它們能用工具、執行多步驟任務，也讓監管開始擔心自動化帶來系統性風險。

Genie Code 把 Databricks 變 ML 指揮台

Genie Code 把 Databricks 變 ML 指揮台

我拆 Databricks 的 Genie Code 更新，整理成可直接套用的 ML 工作流模板、提示詞與審核節點。

Manus 收入衝到 4.5 億美元年化

Manus 收入衝到 4.5 億美元年化

Manus 在 2026 年 6 月把年化營收推到 4.5 億美元，但 Meta 交易破局、股權重組和 SDK 轉型，讓這家公司更像一場商業與地緣政治混戰。

OpenClaw 修補讓代理別再被釣魚

OpenClaw 修補讓代理別再被釣魚

拆解 OpenClaw 怎麼被釣到執行程式與外洩資料，並整理我會直接上線的防線與模板。

GLM-5 把 vibe coding 變工程

GLM-5 把 vibe coding 變工程

我拆 GLM-5 的長程 coding playbook，順手給你一份可直接貼進 agent 的模板。

Kimi K2.6 把 agent 變成群體

Kimi K2.6 把 agent 變成群體

我拆 Kimi K2.6 的 agent、256K context、swarm orchestration 與背景任務寫法，最後附可直接套用的 prompt 模板。

已到底部