標籤

AI security

AI security 聚焦模型、應用與基礎設施的風險管理，從 jailbreak、提示注入、資料外洩到自動化漏洞偵測都涵蓋在內。對開發者而言，它關乎模型上線前的評估、權限邊界與攻擊面控制。

4 篇文章

Mythos 把安全驚嚇變稽核流程

產業動態/6月25日

Mythos 把安全驚嚇變稽核流程

我把 Anthropic 的 Project Glasswing 拆成一套可直接複製的 cyber audit 工作流，讓你能拿去做模型安全測試。

怎麼做 AI 助理端到端安全

AI Agent/5月28日

怎麼做 AI 助理端到端安全

這篇教你替 AI 助理建立最小權限、資料隔離、加密、稽核與高風險審批，做出可落地的安全基線。

為什麼瀏覽器 exploit 基準已證明 AI 安全威脅就在眼前

技術研究/5月17日

為什麼瀏覽器 exploit 基準已證明 AI 安全威脅就在眼前

Claude Mythos 與 GPT-5.5 的 benchmark 結果顯示，自主瀏覽器漏洞利用已是現實能力，不是未來威脅。

AVISE 模組化測 AI 安全漏洞

技術研究/4月23日

AVISE 模組化測 AI 安全漏洞

AVISE 是一個開源 AI 安全評估框架，主打模組化漏洞測試。論文用 25 個 jailbreak 測試案例與自動判定流程，驗證 9 個模型都能被攻破。