[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-mythos-anthropic-unreleased-ai-model-explained-zh":3,"article-related-mythos-anthropic-unreleased-ai-model-explained-zh":30,"series-research-9ee3e460-4acf-4a82-b9d5-ae0ac3a09c90":84},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":11,"views":27,"created_at":28,"published_at":29,"topic_cluster_id":11},"9ee3e460-4acf-4a82-b9d5-ae0ac3a09c90","mythos-anthropic-unreleased-ai-model-explained-zh","Mythos 為何沒公開？","\u003Cp>\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\" target=\"_blank\" rel=\"noopener\">Anthropic\u003C\u002Fa> 最近丟出一顆震撼彈。它說新模型 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\" target=\"_blank\" rel=\"noopener\">Mythos\u003C\u002Fa> 太危險，不能直接公開。這種說法在 AI 圈很少見，因為大家通常只會比誰更強，不太會自己先踩煞車。\u003C\u002Fp>\u003Cp>數字也很硬。Anthropic 說，Mythos 在 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude\" target=\"_blank\" rel=\"noopener\">Opus 4.6\u003C\u002Fa> 的基礎上，USAMO 2026 數學測驗高了 31 分。外部資安測試裡，它在專家級 hacking 任務的成功率達 73%。這不是聊天機器人的小修小補，這是能力直接往實戰靠近。\u003C\u002Fp>\u003Cp>但真正耐人尋味的，不是模型多強。是 Anthropic 選擇不公開，改走限制性釋出。這代表 AI 產業開始面對一個很現實的問題：有些模型，真的不能像一般軟體一樣直接上線。\u003C\u002Fp>\u003Ch2>Mythos 到底是什麼\u003C\u002Fh2>\u003Cp>Mythos 是 Anthropic 的新一代大型語言模型。官方說法很直接，它在軟體工程、找 bug、數學推理上都很猛。配合那份 245 頁技術文件來看，Anthropic 想傳達的重點是：這模型不只會寫字，還很會拆解問題。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776738631894-ih8j.png\" alt=\"Mythos 為何沒公開？\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這種能力聽起來很香，對工程師也確實有用。你丟一段複雜程式碼給它，它可能會抓到你沒看到的邏輯錯誤。你叫它修 bug，它也可能自己回頭檢查前一步推論。講白了，就是像一個很會檢查自己作業的資深工程師。\u003C\u002Fp>\u003Cp>但同一套能力，對攻擊者也很有價值。會讀程式、會找弱點、會修正失敗路徑的模型，對防守方是助手，對攻擊方就是加速器。這也是 Anthropic 這次不敢直接開放的原因。\u003C\u002Fp>\u003Cp>Anthropic 沒把 Mythos 丟給所有人。它改用 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\u002Fproject-glasswing\" target=\"_blank\" rel=\"noopener\">Project Glasswing\u003C\u002Fa> 這種限制性方案，先讓少數組織做防禦性資安測試。首批名單包含 \u003Ca href=\"https:\u002F\u002Fwww.microsoft.com\" target=\"_blank\" rel=\"noopener\">Microsoft\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.google.com\" target=\"_blank\" rel=\"noopener\">Google\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.apple.com\" target=\"_blank\" rel=\"noopener\">Apple\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Faws.amazon.com\" target=\"_blank\" rel=\"noopener\">Amazon Web Services\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.jpmorganchase.com\" target=\"_blank\" rel=\"noopener\">JPMorgan Chase\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.nvidia.com\" target=\"_blank\" rel=\"noopener\">Nvidia\u003C\u002Fa>。\u003C\u002Fp>\u003Cul>\u003Cli>2026\u002F04\u002F07 公布，但沒有公開上線\u003C\u002Fli>\u003Cli>USAMO 2026 比 Opus 4.6 高 31 分\u003C\u002Fli>\u003Cli>U.K. AI Security Institute 測得 73% hacking 成功率\u003C\u002Fli>\u003Cli>Anthropic 說它找出多個主流作業系統與瀏覽器漏洞\u003C\u002Fli>\u003Cli>公司稱其中 99% 在揭露時還沒修補\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>為什麼資安數字這麼刺眼\u003C\u002Fh2>\u003Cp>Anthropic 的核心說法很簡單。Mythos 可以找出漏洞，還能把漏洞往 exploit 方向推進。這種能力如果落在防禦端，就是幫團隊更快找風險。落在攻擊端，就是讓攻擊鏈更短。\u003C\u002Fp>\u003Cp>最吸睛的是 73% 這個數字。\u003Ca href=\"https:\u002F\u002Fwww.aisi.gov.uk\" target=\"_blank\" rel=\"noopener\">U.K. AI Security Institute\u003C\u002Fa> 的測試顯示，Mythos 在專家級 hacking 任務裡成功率很高。可是測試環境不是實際企業環境。真實系統有權限控管、偵測機制、分段網路，還有一堆老舊設備在拖後腿。\u003C\u002Fp>\u003Cp>所以這個數字不能直接等於「世界要完蛋了」。它比較像警報器。它在提醒大家，AI 已經不只是寫文案或摘要資料。它開始碰到能影響基礎設施安全的區域。\u003C\u002Fp>\u003Cblockquote>“I would not be at the more apocalyptic end of the scale.” — Ciaran Martin, University of Oxford Blavatnik School of Government，前 U.K. National Cyber Security Centre CEO\u003C\u002Fblockquote>\u003Cp>這句話很有意思。Ciaran Martin 沒有說沒事，也沒有跟著喊災難。他的意思很清楚：模型很強，但現在還不到末日級別。說真的，這種態度比很多公關稿更接近現實。\u003C\u002Fp>\u003Cp>另一個值得看的人，是 \u003Ca href=\"https:\u002F\u002Fcybersecurity.gatech.edu\" target=\"_blank\" rel=\"noopener\">Georgia Institute of Technology School of Cybersecurity and Privacy\u003C\u002Fa> 的 Peter Swire。他直接說這場發表是「a PR success, if nothing else」。我覺得這句很毒，也很準。因為 Anthropic 的風險敘事，確實會放大外界對模型的注意力。\u003C\u002Fp>\u003Ch2>Mythos 跟前代模型差在哪\u003C\u002Fh2>\u003Cp>先看數字。Anthropic 說 Mythos 在 USAMO 2026 比 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude\" target=\"_blank\" rel=\"noopener\">Opus 4.6\u003C\u002Fa> 高 31 分。這在數學推理上是很大的差距，尤其是在高階題目裡，每一分都不好拿。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776738629435-9l1t.png\" alt=\"Mythos 為何沒公開？\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>再看資安。U.K. AI Security Institute 也提到，2025 年 4 月以前，沒有任何 AI 模型能完成那組 expert-level hacking 任務。Mythos 做到了 73%。這代表它不是只有會講話，它是真的能把推理接到行動。\u003C\u002Fp>\u003Cp>如果把時間拉長，這件事更明顯。\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fgpt-2-1-5b-release\u002F\" target=\"_blank\" rel=\"noopener\">GPT-2\u003C\u002Fa> 在 2019 年曾經延後釋出，當時大家覺得那已經很保守了。現在 Mythos 直接不公開，代表 frontier AI 的風險門檻又往前推了一段。\u003C\u002Fp>\u003Cul>\u003Cli>GPT-2 是延後釋出，不是永久封存\u003C\u002Fli>\u003Cli>Mythos 是限制性釋出，連公開下載都沒有\u003C\u002Fli>\u003Cli>Anthropic 這次強調 next-generation GPU 訓練\u003C\u002Fli>\u003Cli>銀行與雲端業者都很快開始關注\u003C\u002Fli>\u003C\u002Ful>\u003Cp>硬體也不能忽略。Mythos 是這波新模型裡，第一批在新一代 GPU 上訓練的系統之一。這代表訓練資源更大，模型上限也更高。你可以不喜歡這件事，但你不能假裝它不存在。\u003C\u002Fp>\u003Cp>我覺得更重要的是產業態度變了。以前大家講 AI 釋出，重點是速度。現在開始有人先問：這模型會不會被拿去做資安攻擊、詐騙，或打到關鍵基礎設施？這個問題一出現，整個遊戲就不一樣了。\u003C\u002Fp>\u003Ch2>跟其他 AI 產品比，差在哪\u003C\u002Fh2>\u003Cp>如果要拿 Mythos 跟其他模型比，最直觀的就是能力與管控。像 \u003Ca href=\"https:\u002F\u002Fwww.openai.com\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude\" target=\"_blank\" rel=\"noopener\">Claude\u003C\u002Fa> 這類產品，現在都在往更強的推理走。但 Mythos 的特別之處，不是它會推理，而是它被判定太敏感，不能直接放出去。\u003C\u002Fp>\u003Cp>這件事會影響競品策略。若一家公司把模型先放大眾市場，另一家公司卻先做封閉測試，外界很容易把後者解讀成更負責。可是在商業上，封閉也有代價。它少了曝光，也少了開發者社群的回饋。\u003C\u002Fp>\u003Cp>從資安角度看，Mythos 的比較對象不是一般聊天 AI，而是能做 c\u003Ca href=\"\u002Fnews\u002Fclaude-code-advanced-patterns-six-months-zh\">ode\u003C\u002Fa> review、漏洞掃描、滲透測試輔助的系統。這類工具本來就介於防守與攻擊之間。差別只在於誰拿來用，還有用在哪裡。\u003C\u002Fp>\u003Cul>\u003Cli>OpenAI 與 Anthropic 都在強化推理能力\u003C\u002Fli>\u003Cli>Mythos 的差異在於限制性釋出\u003C\u002Fli>\u003Cli>資安工具市場會更重視模型審核\u003C\u002Fli>\u003Cli>企業採購會先看資料隔離與權限控管\u003C\u002Fli>\u003C\u002Ful>\u003Cp>對買家來說，真正該問的不是「哪個模型最強」。而是「哪個模型最適合我的風險環境」。如果公司有大量 legacy system、舊版 browser、沒人管的 server，那再強的 AI 都只是放大器。\u003C\u002Fp>\u003Cp>這也是為什麼銀行、雲端業者、晶片廠會先跳出來看。因為他們知道，模型能力一旦進入攻擊鏈，修補速度就會變成競爭力的一部分。\u003C\u002Fp>\u003Ch2>這件事放在產業脈絡裡怎麼看\u003C\u002Fh2>\u003Cp>AI 產業現在有個很明顯的轉折。前幾年大家比的是參數、tok\u003Ca href=\"\u002Fnews\u002Fasmr-bench-sabotage-detection-ml-code-zh\">en\u003C\u002Fa>、上下文長度。現在開始比的是風險控管、審核流程、是否該封閉釋出。這不是行銷包裝，這是產品治理。\u003C\u002Fp>\u003Cp>從台灣開發者角度看，這件事也不遠。因為很多團隊的系統都跑在雲端，或接了第三方 API。只要你的軟體堆疊有舊版元件、弱密碼、沒更新的依賴套件，AI 幫你找漏洞的速度就會比你想像快。\u003C\u002Fp>\u003Cp>換句話說，Mythos 不是單一產品新聞。它是在提醒所有工程團隊：資安不再只是掃描器的工作。\u003Ca href=\"\u002Fnews\u002Fllms-knowledge-graphs-ml-explainability-zh\">LLM\u003C\u002Fa> 已經可以參與漏洞分析、程式審查、攻擊模擬，甚至幫忙整理修補優先順序。\u003C\u002Fp>\u003Cp>這也解釋了為什麼 Anthropic 要走限制性路線。它不是單純怕出事。它是在試著把「模型能力」和「公開風險」拆開處理。這種做法會不會變成常態，接下來幾個季度就會看得很清楚。\u003C\u002Fp>\u003Ch2>Mythos 接下來會怎麼影響大家\u003C\u002Fh2>\u003Cp>我的判斷很直接。Mythos 不會是最後一個被鎖起來的模型。只要 LLM 繼續往資安、詐騙、基礎設施方向走，更多公司都會面臨同樣選擇：公開，還是先關門測試。\u003C\u002Fp>\u003Cp>對開發者來說，現在最實際的動作不是焦慮。是盤點自己的系統。哪些服務還沒打補丁？哪些 browser 與 OS 版本太舊？哪些 API 權限給太大？這些問題比「模型到底多神」更重要。\u003C\u002Fp>\u003Cp>如果你在做產品或平台，我會建議你先把資安流程當成 AI 導入的一部分。不是事後補救，而是設計階段就放進去。因為接下來的 AI 競爭，不只比誰更會寫程式，也比誰更會管風險。\u003C\u002Fp>\u003Cp>說白了，Mythos 這種模型會逼整個產業做選擇。你要追求速度，還是先把門鎖好？我猜，接下來大家都得兩個都要，但先後順序會決定誰先出事。\u003C\u002Fp>","Anthropic 說 Mythos 太危險不能公開。它在 USAMO 2026 比舊模型高 31 分，資安測試成功率達 73%。這代表什麼？","www.scientificamerican.com","https:\u002F\u002Fwww.scientificamerican.com\u002Farticle\u002Fwhat-is-mythos-and-why-are-experts-worried-about-anthropics-ai-model\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776738631894-ih8j.png","research","zh","fd36cdcc-d9b7-4d57-b64d-f89c8ad531a5",[17,18,19,20,21,22,23,24,25,26],"Anthropic","Mythos","AI模型","資安","LLM","OpenAI","Claude","USAMO 2026","hacking","限制性釋出",11,"2026-04-21T00:03:42.694348+00:00","2026-04-21T00:03:42.481+00:00",{"tags":31,"relatedLang":43,"relatedPosts":47},[32,34,36,38,40,41],{"name":22,"slug":33},"openai",{"name":17,"slug":35},"anthropic",{"name":21,"slug":37},"llm",{"name":19,"slug":39},"ai模型",{"name":20,"slug":20},{"name":23,"slug":42},"claude",{"id":15,"slug":44,"title":45,"language":46},"mythos-anthropic-unreleased-ai-model-explained-en","Mythos, Anthropic’s unreleased AI model, explained","en",[48,54,60,66,72,78],{"id":49,"slug":50,"title":51,"cover_image":52,"image_url":52,"created_at":53,"category":13},"d6f25c66-98f5-4971-8d1d-487fb5fe1881","claude-sonnet-46-sre-benchmark-rootly-zh","Claude Sonnet 4.6 對上 SRE 工作更接近 Opus","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782750780131-xelc.png","2026-06-29T16:32:28.457338+00:00",{"id":55,"slug":56,"title":57,"cover_image":58,"image_url":58,"created_at":59,"category":13},"29321237-6e9a-4271-b9fb-e43e798d5dff","glm-52-beats-claude-semgrep-idor-test-zh","GLM 5.2 在 IDOR 測試贏過 Claude","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782749882713-7i5n.png","2026-06-29T16:17:31.911487+00:00",{"id":61,"slug":62,"title":63,"cover_image":64,"image_url":64,"created_at":65,"category":13},"5172bfc7-34c8-4477-a177-ffa615497ecf","opd-distillation-skills-without-bruteforce-rl-zh","OPD 讓你把技能蒸餾進模型","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782730101413-5wjx.png","2026-06-29T10:47:57.457072+00:00",{"id":67,"slug":68,"title":69,"cover_image":70,"image_url":70,"created_at":71,"category":13},"6f5be102-5764-44f1-ab3f-722fc5c32c23","google-deepmind-turns-science-into-tools-zh","Google DeepMind把AI變研究工具","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782721105628-g4op.png","2026-06-29T08:17:57.716568+00:00",{"id":73,"slug":74,"title":75,"cover_image":76,"image_url":76,"created_at":77,"category":13},"c649adb7-c8ae-4ade-a092-2c0d53beeb71","measuring-llm-behavior-portability-zh","LLM 行為不一定可移植","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782717472977-na8g.png","2026-06-29T07:17:29.597679+00:00",{"id":79,"slug":80,"title":81,"cover_image":82,"image_url":82,"created_at":83,"category":13},"637c3016-e364-4bfe-904e-5e60a18ed678","prompt-injection-ai-security-problem-zh","Prompt injection 已是 AI 資安問題","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782716580916-m1nm.png","2026-06-29T07:02:36.173749+00:00",[85,90,95,100,105,110,115,120,125,130],{"id":86,"slug":87,"title":88,"created_at":89},"f18dbadb-8c59-4723-84a4-6ad22746c77a","deepmind-bets-on-continuous-learning-ai-2026-zh","DeepMind 押注 2026 連續學習 AI","2026-03-26T08:16:02.367355+00:00",{"id":91,"slug":92,"title":93,"created_at":94},"f4a106cb-02a6-4508-8f39-9720a0a93cee","ml-papers-of-the-week-github-research-desk-zh","每週 ML 論文清單，為何紅到 GitHub","2026-03-27T01:11:39.284175+00:00",{"id":96,"slug":97,"title":98,"created_at":99},"c4f807ca-4e5f-47f1-a48c-961cf3fc44dc","ai-ml-conferences-to-watch-in-2026-zh","2026 AI 研討會投稿時程整理","2026-03-27T01:51:53.874432+00:00",{"id":101,"slug":102,"title":103,"created_at":104},"cf046742-efb2-4753-aef9-caed5da5e32e","adaptive-block-scaled-data-types-zh","IF4：神經網路量化的聰明選擇","2026-03-31T06:00:36.990273+00:00",{"id":106,"slug":107,"title":108,"created_at":109},"53a0dc54-0371-4e40-8d5e-74e94a73840c","geometry-aware-similarity-metrics-for-neural-representations-zh","超越距離測量：用微分幾何重新理解神經網路","2026-03-31T06:01:01.241968+00:00",{"id":111,"slug":112,"title":113,"created_at":114},"fee7d472-a775-4b1d-bbc2-1e8bca1bbf8b","on-the-fly-repulsion-in-the-contextual-space-for-rich-divers-zh","讓AI繪圖更有創意：用排斥力提升生成多樣性","2026-03-31T06:01:25.439673+00:00",{"id":116,"slug":117,"title":118,"created_at":119},"a9901203-d69b-447b-8854-15d14eab32b4","vision-aided-beam-prediction-cnn-eca-zh","影像輔助波束預測升級 CNN","2026-04-01T10:00:25.8073+00:00",{"id":121,"slug":122,"title":123,"created_at":124},"b55e7dd4-0a24-4b3d-804d-b0309a03f498","triple-band-fss-mimo-antenna-sub-6-ghz-zh","三頻 FSS MIMO 天線瞄準 sub-6 GHz","2026-04-01T13:18:36.857305+00:00",{"id":126,"slug":127,"title":128,"created_at":129},"f68290bd-e7f3-4b30-ba22-dcd4e0130a66","openclaw-1299-repos-eight-weeks-analysis-zh","OpenClaw 1299 個 Repo 的資料解讀","2026-04-02T05:03:45.208411+00:00",{"id":131,"slug":132,"title":133,"created_at":134},"ed9f80eb-eb02-4d35-8ad4-0ddf428751dd","beam-coherence-aware-combining-mmwave-mimo-zh","毫米波 MIMO 的雙階合併法","2026-04-02T05:27:26.897188+00:00"]