標籤

AI 安全

AI 安全涵蓋模型濫用、供應鏈風險、權限控管與治理設計，從漏洞挖掘、惡意倉庫到審批閘門都在討論範圍內。對開發者而言，重點不只防止模型出錯，也要防止工具、流程與部署被轉成攻擊面。

15 篇文章

南韓與 Anthropic 強化 AI 安全合作

南韓與 Anthropic 簽下 MOU，想把 AI 安全與資安合作做深。問題是，美國對 Mythos 的存取限制，可能讓合作卡在工具使用上。

Anthropic 的 Fable 事件顯示，AI 不只會回答問題，也會找規則漏洞。真正的風險常在 harness、權限與工具鏈，不只在模型本身。

Anthropic 呼籲全球暫停 AI 開發，同時釋出 Claude 能力更新並提交 IPO 文件，市場估值上看 1 兆美元。

WIRED 的 OpenAI 專題顯示，這家公司現在最常被提到的不是模型，而是官司、安全爭議與投資人壓力。

Anthropic 的判斷是對的：前沿 AI 需要一個協調、可驗證的暫停機制，否則競賽只會把風險往前推。

Anthropic 的警告是對的：AI 正在進入能以更少人類監督，參與打造下一代 AI 的階段，這會改變研發速度與治理方式。

川普的新 AI 安全命令太弱，因為把前沿模型審查建立在自願提交上，無法穩定阻止高風險模型發布。

DockSec 將本地容器掃描與 AI 結合，幫團隊從 Docker 漏洞噪音中挑出高風險項目，並直接產出可執行的修補建議。

Anthropic 的安全優先定位，已經跟不上它的規模、客戶結構與政治風險；它需要被當成一間高杠杆平台公司來看，而不是道德上更乾淨的 AI 例外。

Ox Security 指出，MCP 設計缺陷可能影響 1.5 億次下載、200 多個開源專案，還有最高 20 萬個脆弱實例。

Anthropic 的 Mythos 傳出能快速找出軟體漏洞，讓銀行、電網和政府系統的資安風險瞬間升溫。

Claude Code 原始碼外洩後，攻擊者很快在 GitHub 佈局假倉庫，拿 Vidar 竊資木馬釣開發者。這起事件把 AI 工具外洩、搜尋流量與惡意下載串成一條線。

OpenClaw 3.28 在 4 天內推了 100+ 項變更，加入審批閘門、Grok 搜尋、MiniMax 圖像工具，還修掉一堆 provider 與設定問題。

Anthropic 宣布成立 The Anthropic Institute，專門研究人工智慧對工作、法律、安全與治理的影響。重點不只在模型更強，而是企業、法院與政府準備好了沒。

SurePath AI 發表 MCP Policy Controls，主打在工具呼叫前即時判斷 AI app 可用哪些 MCP server 與工具。重點不在聊天內容，而在 AI 會不會拿著你的身分去動 Google Drive、Salesforce 或 AWS。