分類

AI Agent

AI Agent、自主系統與代理工作流程。多代理框架、工具使用,以及 AI 自主化趨勢的所有內容。

OpenMontage 證明 AI 影片製作該由開源接管
6月29日

OpenMontage 證明 AI 影片製作該由開源接管

OpenMontage 顯示,AI 影片製作的正確路線是開源、可編排、可檢查的 agentic 系統,而不是封閉式提示框。

Gemini 3.5 Flash 讓你寫電腦操作腳本
6月29日

Gemini 3.5 Flash 讓你寫電腦操作腳本

拆 Gemini 3.5 Flash 的 computer use、prompt injection 防護,最後給你可直接套用的工作流模板。

DESIGN.md 是把品味變成 UI 骨架的缺失橋樑
6月28日

DESIGN.md 是把品味變成 UI 骨架的缺失橋樑

我認為 DESIGN.md 是 AI 設計工作最實用的中介層,因為它把視覺品味變成可執行、可重用、可審查的設計來源。

OpenClaw 證明:代理系統的勝負在控制層,不在模型
6月27日

OpenClaw 證明:代理系統的勝負在控制層,不在模型

OpenClaw 與 Hermes 顯示,代理系統的關鍵不是更強的模型,而是能約束、驗證與治理模型行為的控制層。

OpenClaw 把聊天 App 變成持久 AI
6月27日

OpenClaw 把聊天 App 變成持久 AI

OpenClaw 在 2026 年 6 月 20 日公開做法,示範如何把 Telegram、記憶、工具與系統提示串成一個可持續對話的個人 AI 助手。

抽出提示詞把模型行為變地圖
6月27日

抽出提示詞把模型行為變地圖

拆解抽出系統提示詞的實用讀法,附可直接複製的模板,幫你把模型行為當成可檢查的規格。

Hippo 導入 Devin 進入保險工程
6月26日

Hippo 導入 Devin 進入保險工程

Hippo 於 6 月 25 日宣布把 Cognition 的 Devin 部署到整個工程團隊,目標是加快保險軟體開發,涵蓋 rate filings、underwriting、分發與客服流程。

豆包专业版把Agent做成日常工具
6月26日

豆包专业版把Agent做成日常工具

我拆解豆包专业版的办公任务模式,整理成本地操作、财报分析、Skill 复用的可抄模板。

Valkey 用 bots 把回補變流水線
6月26日

Valkey 用 bots 把回補變流水線

我拆 Valkey 怎麼用 AI agent 做 backport,再把驗證卡死,讓回補從手工苦工變成可控流程。

Loop Engineering 入门:做出可持续迭代智能体
6月26日

Loop Engineering 入门:做出可持续迭代智能体

用 LangChain 和 LangGraph 搭建一个可持续迭代的 Loop Engineering 智能体。

omp 把終端機變成 IDE 級編碼工具
6月26日

omp 把終端機變成 IDE 級編碼工具

omp 是一個開源終端機編碼代理,主打 Hashline 編輯、LSP/DAP 深度整合和跨工作階段記憶,想把 terminal 做成可除錯、可重構的開發環境。

公開 Sentry key 也能劫持 AI 編碼工具
6月26日

公開 Sentry key 也能劫持 AI 編碼工具

研究者示範公開 Sentry key 可被拿來注入惡意 MCP 資料,影響 Claude Code、Cursor、Codex 的判斷與操作。

Loop Engineering 讓 Agent 做完事
6月26日

Loop Engineering 讓 Agent 做完事

我把 Loop Engineering 拆成一套能直接拿去用的 Agent 完成任務模板,重點是讓模型自己檢查、修正、收斂到交付。

Codex 接入第三方模型實作指南
6月25日

Codex 接入第三方模型實作指南

這篇指南教你把第三方開源模型接到 OpenAI Codex App、CLI 與 SDK,完成設定、驗證與回退。

Manus AI 證明代理式 App 已能上線做事
6月25日

Manus AI 證明代理式 App 已能上線做事

我認為 Manus AI 已經不只是聊天機器人,而是能交付成果的代理式工具,真正適合拿來做工作。

Grok Build 加上 /goal,自動寫碼更像樣了
6月25日

Grok Build 加上 /goal,自動寫碼更像樣了

xAI 在 Grok Build 加入 /goal,讓代理能在本機上規劃、執行、驗證程式任務。這篇整理它的工作流程、驗證方式、價格與 SWE-Bench 對比。

Claude 讓 Slack 變研究庫
6月24日

Claude 讓 Slack 變研究庫

我把 Reuters 對 Claude Tag Research 的報導拆成可落地的 Slack 研究流程,重點是標籤、權限、摘要與可複製模板。

這個 coding benchmark 證明:harness 品質勝過模型光環
6月24日

這個 coding benchmark 證明:harness 品質勝過模型光環

這篇主張:評估 coding 模型時,決定結果的不是模型品牌,而是 benchmark harness 的設計品質。

GLM-5 對了:該殺掉 vibe coding,改做 agent engin…
6月23日

GLM-5 對了:該殺掉 vibe coding,改做 agent engin…

GLM-5 釋出了一個清楚訊號:AI 開發不能再停留在 vibe coding,必須轉向可驗證、可維護的 agent engineering。

Loop Engineering:Claude Code 的新工作法
6月23日

Loop Engineering:Claude Code 的新工作法

Loop Engineering 把 AI 開發改成觀察、回饋、修正的循環流程,重點從寫提示詞轉到設計工作流。

Fable 5 封鎖暴露模型路由賽局
6月23日

Fable 5 封鎖暴露模型路由賽局

Anthropic 短暫封鎖 Fable 5 後,4 個開源模型立刻接手回應。這件事把模型路由、備援機制和 Wasm 安全邊界一次攤開。

Myseum 與 Scanon 的合作,是隱私優先審核的合理押注
6月21日

Myseum 與 Scanon 的合作,是隱私優先審核的合理押注

Myseum 與 Scanon 的合作是合理的,因為在私密社交產品裡,審核本身就是產品,而不是附加功能。

AI 程式碼審查落地且不降品質
6月21日

AI 程式碼審查落地且不降品質

這篇教你把 AI 程式碼審查接進既有流程,保留人類把關、先做單一倉庫試點、再用數據決定是否擴大。

Crypto AI 代理的隱藏模型風險
6月21日

Crypto AI 代理的隱藏模型風險

Crypto AI 代理可能在模型切換後仍持續運作,但決策邏輯會變。Anthropic 的模型停用案例顯示,這種風險會直接影響交易與錢包操作。

AI agents 正進入真實軟體與金融
6月21日

AI agents 正進入真實軟體與金融

AI agents 正從聊天工具走進軟體、政府與金融流程。它們能用工具、執行多步驟任務,也讓監管開始擔心自動化帶來系統性風險。

Genie Code 把 Databricks 變 ML 指揮台
6月21日

Genie Code 把 Databricks 變 ML 指揮台

我拆 Databricks 的 Genie Code 更新,整理成可直接套用的 ML 工作流模板、提示詞與審核節點。

Manus 收入衝到 4.5 億美元年化
6月20日

Manus 收入衝到 4.5 億美元年化

Manus 在 2026 年 6 月把年化營收推到 4.5 億美元,但 Meta 交易破局、股權重組和 SDK 轉型,讓這家公司更像一場商業與地緣政治混戰。

OpenClaw 修補讓代理別再被釣魚
6月20日

OpenClaw 修補讓代理別再被釣魚

拆解 OpenClaw 怎麼被釣到執行程式與外洩資料,並整理我會直接上線的防線與模板。

GLM-5 把 vibe coding 變工程
6月19日

GLM-5 把 vibe coding 變工程

我拆 GLM-5 的長程 coding playbook,順手給你一份可直接貼進 agent 的模板。

Kimi K2.6 把 agent 變成群體
6月19日

Kimi K2.6 把 agent 變成群體

我拆 Kimi K2.6 的 agent、256K context、swarm orchestration 與背景任務寫法,最後附可直接套用的 prompt 模板。

已到底部