標籤

AI safety

AI 安全關注模型在真實場景中的風險控制：從越獄、幻覺與惡意提示，到雙重用途、資安測試與法規責任。這個主題連結研究、產品限制與監管動態，直接影響聊天機器人、企業部署與高風險應用。

4 篇文章

7 項佛州告 OpenAI 的主張

產業動態/6月2日

7 項佛州告 OpenAI 的主張

7 項主張看佛州如何指控 OpenAI 與 Sam Altman 把成長放在安全之前，並牽動產品責任、未成年保護與警示義務。

Hassabis：AGI 只剩幾年準備期

產業動態/5月30日

Hassabis：AGI 只剩幾年準備期

Google DeepMind 執行長 Hassabis 在 Google I/O 表示，社會只剩幾年時間為 AGI 做準備，並把現況形容為「奇點的山麓」。

為什麼 Microsoft 的開源 AI 安全工具值得重視

工具應用/5月24日

為什麼 Microsoft 的開源 AI 安全工具值得重視

Microsoft 把 RAMPART 和 Clarity 開源，等於把 AI 安全從事後審查拉進日常 agent 工程，這是正確方向。

為什麼 AI 安全團隊錯把問題全怪在對齊

技術研究/5月17日

為什麼 AI 安全團隊錯把問題全怪在對齊

AI 模型的危險行為不只來自對齊失敗，也來自訓練資料灌進去的有害敘事；安全團隊若只修對齊，會漏掉真正的風險來源。