AI Agent
AI Agent、自主系統與代理工作流程。多代理框架、工具使用,以及 AI 自主化趨勢的所有內容。

OpenMontage 證明 AI 影片製作該由開源接管
OpenMontage 顯示,AI 影片製作的正確路線是開源、可編排、可檢查的 agentic 系統,而不是封閉式提示框。

Gemini 3.5 Flash 讓你寫電腦操作腳本
拆 Gemini 3.5 Flash 的 computer use、prompt injection 防護,最後給你可直接套用的工作流模板。

DESIGN.md 是把品味變成 UI 骨架的缺失橋樑
我認為 DESIGN.md 是 AI 設計工作最實用的中介層,因為它把視覺品味變成可執行、可重用、可審查的設計來源。

OpenClaw 證明:代理系統的勝負在控制層,不在模型
OpenClaw 與 Hermes 顯示,代理系統的關鍵不是更強的模型,而是能約束、驗證與治理模型行為的控制層。

OpenClaw 把聊天 App 變成持久 AI
OpenClaw 在 2026 年 6 月 20 日公開做法,示範如何把 Telegram、記憶、工具與系統提示串成一個可持續對話的個人 AI 助手。

抽出提示詞把模型行為變地圖
拆解抽出系統提示詞的實用讀法,附可直接複製的模板,幫你把模型行為當成可檢查的規格。

Hippo 導入 Devin 進入保險工程
Hippo 於 6 月 25 日宣布把 Cognition 的 Devin 部署到整個工程團隊,目標是加快保險軟體開發,涵蓋 rate filings、underwriting、分發與客服流程。

豆包专业版把Agent做成日常工具
我拆解豆包专业版的办公任务模式,整理成本地操作、财报分析、Skill 复用的可抄模板。

Valkey 用 bots 把回補變流水線
我拆 Valkey 怎麼用 AI agent 做 backport,再把驗證卡死,讓回補從手工苦工變成可控流程。

Loop Engineering 入门:做出可持续迭代智能体
用 LangChain 和 LangGraph 搭建一个可持续迭代的 Loop Engineering 智能体。

omp 把終端機變成 IDE 級編碼工具
omp 是一個開源終端機編碼代理,主打 Hashline 編輯、LSP/DAP 深度整合和跨工作階段記憶,想把 terminal 做成可除錯、可重構的開發環境。

公開 Sentry key 也能劫持 AI 編碼工具
研究者示範公開 Sentry key 可被拿來注入惡意 MCP 資料,影響 Claude Code、Cursor、Codex 的判斷與操作。

Loop Engineering 讓 Agent 做完事
我把 Loop Engineering 拆成一套能直接拿去用的 Agent 完成任務模板,重點是讓模型自己檢查、修正、收斂到交付。

Codex 接入第三方模型實作指南
這篇指南教你把第三方開源模型接到 OpenAI Codex App、CLI 與 SDK,完成設定、驗證與回退。

Manus AI 證明代理式 App 已能上線做事
我認為 Manus AI 已經不只是聊天機器人,而是能交付成果的代理式工具,真正適合拿來做工作。

Grok Build 加上 /goal,自動寫碼更像樣了
xAI 在 Grok Build 加入 /goal,讓代理能在本機上規劃、執行、驗證程式任務。這篇整理它的工作流程、驗證方式、價格與 SWE-Bench 對比。

Claude 讓 Slack 變研究庫
我把 Reuters 對 Claude Tag Research 的報導拆成可落地的 Slack 研究流程,重點是標籤、權限、摘要與可複製模板。

這個 coding benchmark 證明:harness 品質勝過模型光環
這篇主張:評估 coding 模型時,決定結果的不是模型品牌,而是 benchmark harness 的設計品質。

GLM-5 對了:該殺掉 vibe coding,改做 agent engin…
GLM-5 釋出了一個清楚訊號:AI 開發不能再停留在 vibe coding,必須轉向可驗證、可維護的 agent engineering。

Loop Engineering:Claude Code 的新工作法
Loop Engineering 把 AI 開發改成觀察、回饋、修正的循環流程,重點從寫提示詞轉到設計工作流。

Fable 5 封鎖暴露模型路由賽局
Anthropic 短暫封鎖 Fable 5 後,4 個開源模型立刻接手回應。這件事把模型路由、備援機制和 Wasm 安全邊界一次攤開。

Myseum 與 Scanon 的合作,是隱私優先審核的合理押注
Myseum 與 Scanon 的合作是合理的,因為在私密社交產品裡,審核本身就是產品,而不是附加功能。

AI 程式碼審查落地且不降品質
這篇教你把 AI 程式碼審查接進既有流程,保留人類把關、先做單一倉庫試點、再用數據決定是否擴大。

Crypto AI 代理的隱藏模型風險
Crypto AI 代理可能在模型切換後仍持續運作,但決策邏輯會變。Anthropic 的模型停用案例顯示,這種風險會直接影響交易與錢包操作。

AI agents 正進入真實軟體與金融
AI agents 正從聊天工具走進軟體、政府與金融流程。它們能用工具、執行多步驟任務,也讓監管開始擔心自動化帶來系統性風險。

Genie Code 把 Databricks 變 ML 指揮台
我拆 Databricks 的 Genie Code 更新,整理成可直接套用的 ML 工作流模板、提示詞與審核節點。

Manus 收入衝到 4.5 億美元年化
Manus 在 2026 年 6 月把年化營收推到 4.5 億美元,但 Meta 交易破局、股權重組和 SDK 轉型,讓這家公司更像一場商業與地緣政治混戰。

OpenClaw 修補讓代理別再被釣魚
拆解 OpenClaw 怎麼被釣到執行程式與外洩資料,並整理我會直接上線的防線與模板。

GLM-5 把 vibe coding 變工程
我拆 GLM-5 的長程 coding playbook,順手給你一份可直接貼進 agent 的模板。

Kimi K2.6 把 agent 變成群體
我拆 Kimi K2.6 的 agent、256K context、swarm orchestration 與背景任務寫法,最後附可直接套用的 prompt 模板。