返回首頁

標籤

AI 安全

AI 安全涵蓋模型濫用、供應鏈風險、權限控管與治理設計,從漏洞挖掘、惡意倉庫到審批閘門都在討論範圍內。對開發者而言,重點不只防止模型出錯,也要防止工具、流程與部署被轉成攻擊面。

15 篇文章

南韓與 Anthropic 強化 AI 安全合作
產業動態/6月22日

南韓與 Anthropic 強化 AI 安全合作

南韓與 Anthropic 簽下 MOU,想把 AI 安全與資安合作做深。問題是,美國對 Mythos 的存取限制,可能讓合作卡在工具使用上。

Anthropic Fable 露出 AI 會鑽漏洞
產業動態/6月18日

Anthropic Fable 露出 AI 會鑽漏洞

Anthropic 的 Fable 事件顯示,AI 不只會回答問題,也會找規則漏洞。真正的風險常在 harness、權限與工具鏈,不只在模型本身。

Anthropic 籲 AI 暫停,Claude 卻更強了
產業動態/6月9日

Anthropic 籲 AI 暫停,Claude 卻更強了

Anthropic 呼籲全球暫停 AI 開發,同時釋出 Claude 能力更新並提交 IPO 文件,市場估值上看 1 兆美元。

OpenAI 的新聞核心變成官司
產業動態/6月9日

OpenAI 的新聞核心變成官司

WIRED 的 OpenAI 專題顯示,這家公司現在最常被提到的不是模型,而是官司、安全爭議與投資人壓力。

Anthropic說得對:前沿 AI 需要真正可驗證的暫停機制
產業動態/6月8日

Anthropic說得對:前沿 AI 需要真正可驗證的暫停機制

Anthropic 的判斷是對的:前沿 AI 需要一個協調、可驗證的暫停機制,否則競賽只會把風險往前推。

為什麼 Anthropic 警告 AI 會幫忙打造自己的下一代是對的
產業動態/6月5日

為什麼 Anthropic 警告 AI 會幫忙打造自己的下一代是對的

Anthropic 的警告是對的:AI 正在進入能以更少人類監督,參與打造下一代 AI 的階段,這會改變研發速度與治理方式。

為什麼川普的自願式 AI 安全命令太弱
產業動態/6月4日

為什麼川普的自願式 AI 安全命令太弱

川普的新 AI 安全命令太弱,因為把前沿模型審查建立在自願提交上,無法穩定阻止高風險模型發布。

18,000 下載:DockSec 幫 Docker CVE 排雷
工具應用/6月2日

18,000 下載:DockSec 幫 Docker CVE 排雷

DockSec 將本地容器掃描與 AI 結合,幫團隊從 Docker 漏洞噪音中挑出高風險項目,並直接產出可執行的修補建議。

為什麼 Anthropic 的安全優先品牌已經不夠了
產業動態/5月17日

為什麼 Anthropic 的安全優先品牌已經不夠了

Anthropic 的安全優先定位,已經跟不上它的規模、客戶結構與政治風險;它需要被當成一間高杠杆平台公司來看,而不是道德上更乾淨的 AI 例外。

MCP 漏洞恐波及 1.5 億下載
技術研究/5月6日

MCP 漏洞恐波及 1.5 億下載

Ox Security 指出,MCP 設計缺陷可能影響 1.5 億次下載、200 多個開源專案,還有最高 20 萬個脆弱實例。

Anthropic Mythos 讓資安圈緊張
模型發布/4月24日

Anthropic Mythos 讓資安圈緊張

Anthropic 的 Mythos 傳出能快速找出軟體漏洞,讓銀行、電網和政府系統的資安風險瞬間升溫。

Claude Code 外洩被拿來散播 Vidar
產業動態/4月3日

Claude Code 外洩被拿來散播 Vidar

Claude Code 原始碼外洩後,攻擊者很快在 GitHub 佈局假倉庫,拿 Vidar 竊資木馬釣開發者。這起事件把 AI 工具外洩、搜尋流量與惡意下載串成一條線。

OpenClaw 3.28 加入審批閘門
AI Agent/4月1日

OpenClaw 3.28 加入審批閘門

OpenClaw 3.28 在 4 天內推了 100+ 項變更,加入審批閘門、Grok 搜尋、MiniMax 圖像工具,還修掉一堆 provider 與設定問題。

Anthropic 成立 AI 社會影響研究所
產業動態/3月26日

Anthropic 成立 AI 社會影響研究所

Anthropic 宣布成立 The Anthropic Institute,專門研究人工智慧對工作、法律、安全與治理的影響。重點不只在模型更強,而是企業、法院與政府準備好了沒。

SurePath 推出即時 MCP 政策控管
工具應用/3月26日

SurePath 推出即時 MCP 政策控管

SurePath AI 發表 MCP Policy Controls,主打在工具呼叫前即時判斷 AI app 可用哪些 MCP server 與工具。重點不在聊天內容,而在 AI 會不會拿著你的身分去動 Google Drive、Salesforce 或 AWS。