標籤
AI security
AI security 聚焦模型、應用與基礎設施的風險管理,從 jailbreak、提示注入、資料外洩到自動化漏洞偵測都涵蓋在內。對開發者而言,它關乎模型上線前的評估、權限邊界與攻擊面控制。
4 篇文章

產業動態/6月25日
Mythos 把安全驚嚇變稽核流程
我把 Anthropic 的 Project Glasswing 拆成一套可直接複製的 cyber audit 工作流,讓你能拿去做模型安全測試。

AI Agent/5月28日
怎麼做 AI 助理端到端安全
這篇教你替 AI 助理建立最小權限、資料隔離、加密、稽核與高風險審批,做出可落地的安全基線。

技術研究/5月17日
為什麼瀏覽器 exploit 基準已證明 AI 安全威脅就在眼前
Claude Mythos 與 GPT-5.5 的 benchmark 結果顯示,自主瀏覽器漏洞利用已是現實能力,不是未來威脅。

技術研究/4月23日
AVISE 模組化測 AI 安全漏洞
AVISE 是一個開源 AI 安全評估框架,主打模組化漏洞測試。論文用 25 個 jailbreak 測試案例與自動判定流程,驗證 9 個模型都能被攻破。