標籤
AI safety
AI 安全關注模型在真實場景中的風險控制:從越獄、幻覺與惡意提示,到雙重用途、資安測試與法規責任。這個主題連結研究、產品限制與監管動態,直接影響聊天機器人、企業部署與高風險應用。
4 篇文章

產業動態/6月2日
7 項佛州告 OpenAI 的主張
7 項主張看佛州如何指控 OpenAI 與 Sam Altman 把成長放在安全之前,並牽動產品責任、未成年保護與警示義務。

產業動態/5月30日
Hassabis:AGI 只剩幾年準備期
Google DeepMind 執行長 Hassabis 在 Google I/O 表示,社會只剩幾年時間為 AGI 做準備,並把現況形容為「奇點的山麓」。

工具應用/5月24日
為什麼 Microsoft 的開源 AI 安全工具值得重視
Microsoft 把 RAMPART 和 Clarity 開源,等於把 AI 安全從事後審查拉進日常 agent 工程,這是正確方向。

技術研究/5月17日
為什麼 AI 安全團隊錯把問題全怪在對齊
AI 模型的危險行為不只來自對齊失敗,也來自訓練資料灌進去的有害敘事;安全團隊若只修對齊,會漏掉真正的風險來源。