[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-mythos-anthropic-unreleased-ai-model-explained-zh":3,"tags-mythos-anthropic-unreleased-ai-model-explained-zh":34,"related-lang-mythos-anthropic-unreleased-ai-model-explained-zh":35,"related-posts-mythos-anthropic-unreleased-ai-model-explained-zh":39,"series-research-9ee3e460-4acf-4a82-b9d5-ae0ac3a09c90":76},{"id":4,"title":5,"content":6,"summary":7,"source":8,"source_url":9,"author":10,"image_url":11,"keywords":12,"language":23,"translated_content":10,"views":24,"is_premium":25,"created_at":26,"updated_at":26,"cover_image":11,"published_at":27,"rewrite_status":28,"rewrite_error":10,"rewritten_from_id":29,"slug":30,"category":31,"related_article_id":32,"status":33,"google_indexed_at":10,"x_posted_at":10},"9ee3e460-4acf-4a82-b9d5-ae0ac3a09c90","Mythos 為何沒公開？","\u003Cp>\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\" target=\"_blank\" rel=\"noopener\">Anthropic\u003C\u002Fa> 最近丟出一顆震撼彈。它說新模型 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\" target=\"_blank\" rel=\"noopener\">Mythos\u003C\u002Fa> 太危險，不能直接公開。這種說法在 AI 圈很少見，因為大家通常只會比誰更強，不太會自己先踩煞車。\u003C\u002Fp>\u003Cp>數字也很硬。Anthropic 說，Mythos 在 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude\" target=\"_blank\" rel=\"noopener\">Opus 4.6\u003C\u002Fa> 的基礎上，USAMO 2026 數學測驗高了 31 分。外部資安測試裡，它在專家級 hacking 任務的成功率達 73%。這不是聊天機器人的小修小補，這是能力直接往實戰靠近。\u003C\u002Fp>\u003Cp>但真正耐人尋味的，不是模型多強。是 Anthropic 選擇不公開，改走限制性釋出。這代表 AI 產業開始面對一個很現實的問題：有些模型，真的不能像一般軟體一樣直接上線。\u003C\u002Fp>\u003Ch2>Mythos 到底是什麼\u003C\u002Fh2>\u003Cp>Mythos 是 Anthropic 的新一代大型語言模型。官方說法很直接，它在軟體工程、找 bug、數學推理上都很猛。配合那份 245 頁技術文件來看，Anthropic 想傳達的重點是：這模型不只會寫字，還很會拆解問題。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776738631894-ih8j.png\" alt=\"Mythos 為何沒公開？\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這種能力聽起來很香，對工程師也確實有用。你丟一段複雜程式碼給它，它可能會抓到你沒看到的邏輯錯誤。你叫它修 bug，它也可能自己回頭檢查前一步推論。講白了，就是像一個很會檢查自己作業的資深工程師。\u003C\u002Fp>\u003Cp>但同一套能力，對攻擊者也很有價值。會讀程式、會找弱點、會修正失敗路徑的模型，對防守方是助手，對攻擊方就是加速器。這也是 Anthropic 這次不敢直接開放的原因。\u003C\u002Fp>\u003Cp>Anthropic 沒把 Mythos 丟給所有人。它改用 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\u002Fproject-glasswing\" target=\"_blank\" rel=\"noopener\">Project Glasswing\u003C\u002Fa> 這種限制性方案，先讓少數組織做防禦性資安測試。首批名單包含 \u003Ca href=\"https:\u002F\u002Fwww.microsoft.com\" target=\"_blank\" rel=\"noopener\">Microsoft\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.google.com\" target=\"_blank\" rel=\"noopener\">Google\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.apple.com\" target=\"_blank\" rel=\"noopener\">Apple\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Faws.amazon.com\" target=\"_blank\" rel=\"noopener\">Amazon Web Services\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.jpmorganchase.com\" target=\"_blank\" rel=\"noopener\">JPMorgan Chase\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.nvidia.com\" target=\"_blank\" rel=\"noopener\">Nvidia\u003C\u002Fa>。\u003C\u002Fp>\u003Cul>\u003Cli>2026\u002F04\u002F07 公布，但沒有公開上線\u003C\u002Fli>\u003Cli>USAMO 2026 比 Opus 4.6 高 31 分\u003C\u002Fli>\u003Cli>U.K. AI Security Institute 測得 73% hacking 成功率\u003C\u002Fli>\u003Cli>Anthropic 說它找出多個主流作業系統與瀏覽器漏洞\u003C\u002Fli>\u003Cli>公司稱其中 99% 在揭露時還沒修補\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>為什麼資安數字這麼刺眼\u003C\u002Fh2>\u003Cp>Anthropic 的核心說法很簡單。Mythos 可以找出漏洞，還能把漏洞往 exploit 方向推進。這種能力如果落在防禦端，就是幫團隊更快找風險。落在攻擊端，就是讓攻擊鏈更短。\u003C\u002Fp>\u003Cp>最吸睛的是 73% 這個數字。\u003Ca href=\"https:\u002F\u002Fwww.aisi.gov.uk\" target=\"_blank\" rel=\"noopener\">U.K. AI Security Institute\u003C\u002Fa> 的測試顯示，Mythos 在專家級 hacking 任務裡成功率很高。可是測試環境不是實際企業環境。真實系統有權限控管、偵測機制、分段網路，還有一堆老舊設備在拖後腿。\u003C\u002Fp>\u003Cp>所以這個數字不能直接等於「世界要完蛋了」。它比較像警報器。它在提醒大家，AI 已經不只是寫文案或摘要資料。它開始碰到能影響基礎設施安全的區域。\u003C\u002Fp>\u003Cblockquote>“I would not be at the more apocalyptic end of the scale.” — Ciaran Martin, University of Oxford Blavatnik School of Government，前 U.K. National Cyber Security Centre CEO\u003C\u002Fblockquote>\u003Cp>這句話很有意思。Ciaran Martin 沒有說沒事，也沒有跟著喊災難。他的意思很清楚：模型很強，但現在還不到末日級別。說真的，這種態度比很多公關稿更接近現實。\u003C\u002Fp>\u003Cp>另一個值得看的人，是 \u003Ca href=\"https:\u002F\u002Fcybersecurity.gatech.edu\" target=\"_blank\" rel=\"noopener\">Georgia Institute of Technology School of Cybersecurity and Privacy\u003C\u002Fa> 的 Peter Swire。他直接說這場發表是「a PR success, if nothing else」。我覺得這句很毒，也很準。因為 Anthropic 的風險敘事，確實會放大外界對模型的注意力。\u003C\u002Fp>\u003Ch2>Mythos 跟前代模型差在哪\u003C\u002Fh2>\u003Cp>先看數字。Anthropic 說 Mythos 在 USAMO 2026 比 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude\" target=\"_blank\" rel=\"noopener\">Opus 4.6\u003C\u002Fa> 高 31 分。這在數學推理上是很大的差距，尤其是在高階題目裡，每一分都不好拿。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776738629435-9l1t.png\" alt=\"Mythos 為何沒公開？\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>再看資安。U.K. AI Security Institute 也提到，2025 年 4 月以前，沒有任何 AI 模型能完成那組 expert-level hacking 任務。Mythos 做到了 73%。這代表它不是只有會講話，它是真的能把推理接到行動。\u003C\u002Fp>\u003Cp>如果把時間拉長，這件事更明顯。\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fgpt-2-1-5b-release\u002F\" target=\"_blank\" rel=\"noopener\">GPT-2\u003C\u002Fa> 在 2019 年曾經延後釋出，當時大家覺得那已經很保守了。現在 Mythos 直接不公開，代表 frontier AI 的風險門檻又往前推了一段。\u003C\u002Fp>\u003Cul>\u003Cli>GPT-2 是延後釋出，不是永久封存\u003C\u002Fli>\u003Cli>Mythos 是限制性釋出，連公開下載都沒有\u003C\u002Fli>\u003Cli>Anthropic 這次強調 next-generation GPU 訓練\u003C\u002Fli>\u003Cli>銀行與雲端業者都很快開始關注\u003C\u002Fli>\u003C\u002Ful>\u003Cp>硬體也不能忽略。Mythos 是這波新模型裡，第一批在新一代 GPU 上訓練的系統之一。這代表訓練資源更大，模型上限也更高。你可以不喜歡這件事，但你不能假裝它不存在。\u003C\u002Fp>\u003Cp>我覺得更重要的是產業態度變了。以前大家講 AI 釋出，重點是速度。現在開始有人先問：這模型會不會被拿去做資安攻擊、詐騙，或打到關鍵基礎設施？這個問題一出現，整個遊戲就不一樣了。\u003C\u002Fp>\u003Ch2>跟其他 AI 產品比，差在哪\u003C\u002Fh2>\u003Cp>如果要拿 Mythos 跟其他模型比，最直觀的就是能力與管控。像 \u003Ca href=\"https:\u002F\u002Fwww.openai.com\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fclaude\" target=\"_blank\" rel=\"noopener\">Claude\u003C\u002Fa> 這類產品，現在都在往更強的推理走。但 Mythos 的特別之處，不是它會推理，而是它被判定太敏感，不能直接放出去。\u003C\u002Fp>\u003Cp>這件事會影響競品策略。若一家公司把模型先放大眾市場，另一家公司卻先做封閉測試，外界很容易把後者解讀成更負責。可是在商業上，封閉也有代價。它少了曝光，也少了開發者社群的回饋。\u003C\u002Fp>\u003Cp>從資安角度看，Mythos 的比較對象不是一般聊天 AI，而是能做 c\u003Ca href=\"\u002Fnews\u002Fclaude-code-advanced-patterns-six-months-zh\">ode\u003C\u002Fa> review、漏洞掃描、滲透測試輔助的系統。這類工具本來就介於防守與攻擊之間。差別只在於誰拿來用，還有用在哪裡。\u003C\u002Fp>\u003Cul>\u003Cli>OpenAI 與 Anthropic 都在強化推理能力\u003C\u002Fli>\u003Cli>Mythos 的差異在於限制性釋出\u003C\u002Fli>\u003Cli>資安工具市場會更重視模型審核\u003C\u002Fli>\u003Cli>企業採購會先看資料隔離與權限控管\u003C\u002Fli>\u003C\u002Ful>\u003Cp>對買家來說，真正該問的不是「哪個模型最強」。而是「哪個模型最適合我的風險環境」。如果公司有大量 legacy system、舊版 browser、沒人管的 server，那再強的 AI 都只是放大器。\u003C\u002Fp>\u003Cp>這也是為什麼銀行、雲端業者、晶片廠會先跳出來看。因為他們知道，模型能力一旦進入攻擊鏈，修補速度就會變成競爭力的一部分。\u003C\u002Fp>\u003Ch2>這件事放在產業脈絡裡怎麼看\u003C\u002Fh2>\u003Cp>AI 產業現在有個很明顯的轉折。前幾年大家比的是參數、tok\u003Ca href=\"\u002Fnews\u002Fasmr-bench-sabotage-detection-ml-code-zh\">en\u003C\u002Fa>、上下文長度。現在開始比的是風險控管、審核流程、是否該封閉釋出。這不是行銷包裝，這是產品治理。\u003C\u002Fp>\u003Cp>從台灣開發者角度看，這件事也不遠。因為很多團隊的系統都跑在雲端，或接了第三方 API。只要你的軟體堆疊有舊版元件、弱密碼、沒更新的依賴套件，AI 幫你找漏洞的速度就會比你想像快。\u003C\u002Fp>\u003Cp>換句話說，Mythos 不是單一產品新聞。它是在提醒所有工程團隊：資安不再只是掃描器的工作。\u003Ca href=\"\u002Fnews\u002Fllms-knowledge-graphs-ml-explainability-zh\">LLM\u003C\u002Fa> 已經可以參與漏洞分析、程式審查、攻擊模擬，甚至幫忙整理修補優先順序。\u003C\u002Fp>\u003Cp>這也解釋了為什麼 Anthropic 要走限制性路線。它不是單純怕出事。它是在試著把「模型能力」和「公開風險」拆開處理。這種做法會不會變成常態，接下來幾個季度就會看得很清楚。\u003C\u002Fp>\u003Ch2>Mythos 接下來會怎麼影響大家\u003C\u002Fh2>\u003Cp>我的判斷很直接。Mythos 不會是最後一個被鎖起來的模型。只要 LLM 繼續往資安、詐騙、基礎設施方向走，更多公司都會面臨同樣選擇：公開，還是先關門測試。\u003C\u002Fp>\u003Cp>對開發者來說，現在最實際的動作不是焦慮。是盤點自己的系統。哪些服務還沒打補丁？哪些 browser 與 OS 版本太舊？哪些 API 權限給太大？這些問題比「模型到底多神」更重要。\u003C\u002Fp>\u003Cp>如果你在做產品或平台，我會建議你先把資安流程當成 AI 導入的一部分。不是事後補救，而是設計階段就放進去。因為接下來的 AI 競爭，不只比誰更會寫程式，也比誰更會管風險。\u003C\u002Fp>\u003Cp>說白了，Mythos 這種模型會逼整個產業做選擇。你要追求速度，還是先把門鎖好？我猜，接下來大家都得兩個都要，但先後順序會決定誰先出事。\u003C\u002Fp>","Anthropic 說 Mythos 太危險不能公開。它在 USAMO 2026 比舊模型高 31 分，資安測試成功率達 73%。這代表什麼？","www.scientificamerican.com","https:\u002F\u002Fwww.scientificamerican.com\u002Farticle\u002Fwhat-is-mythos-and-why-are-experts-worried-about-anthropics-ai-model\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776738631894-ih8j.png",[13,14,15,16,17,18,19,20,21,22],"Anthropic","Mythos","AI模型","資安","LLM","OpenAI","Claude","USAMO 2026","hacking","限制性釋出","zh",0,false,"2026-04-21T00:03:42.694348+00:00","2026-04-21T00:03:42.481+00:00","done","3dd4b1ef-0b97-48c0-8c0d-805c1cd50dff","mythos-anthropic-unreleased-ai-model-explained-zh","research","fd36cdcc-d9b7-4d57-b64d-f89c8ad531a5","published",[],{"id":32,"slug":36,"title":37,"language":38},"mythos-anthropic-unreleased-ai-model-explained-en","Mythos, Anthropic’s unreleased AI model, explained","en",[40,46,52,58,64,70],{"id":41,"slug":42,"title":43,"cover_image":44,"image_url":44,"created_at":45,"category":31},"7a04d752-3f1a-4df7-b7c5-8bcb1e69c565","bounded-ratio-reinforcement-learning-ppo-zh","BRRL 重新定義 PPO 剪裁目標","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776751794578-t5j7.png","2026-04-21T06:09:39.661696+00:00",{"id":47,"slug":48,"title":49,"cover_image":50,"image_url":50,"created_at":51,"category":31},"4700e9ba-80dd-47e9-9665-7461287fbbcb","sessa-attention-inside-state-space-memory-zh","Sessa 把注意力放進狀態空間記憶","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776751615013-ugp9.png","2026-04-21T06:06:37.215599+00:00",{"id":53,"slug":54,"title":55,"cover_image":56,"image_url":56,"created_at":57,"category":31},"ac5a1a8a-b0f6-46f6-85f5-47f01b5f6c51","mathnet-benchmark-math-reasoning-retrieval-zh","MathNet 把數學推理和檢索一起測","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776751441331-oooq.png","2026-04-21T06:03:38.63837+00:00",{"id":59,"slug":60,"title":61,"cover_image":62,"image_url":62,"created_at":63,"category":31},"6b0e0e51-acc2-46dc-a376-6b7fc78f7918","prompt-engineering-becoming-infrastructure-zh","Prompt 工程正在變成基礎設施","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776742218129-fisd.png","2026-04-21T00:15:42.239955+00:00",{"id":65,"slug":66,"title":67,"cover_image":68,"image_url":68,"created_at":69,"category":31},"b82d0062-8cef-4869-8a1e-e7a314d24478","why-prompt-standards-matter-for-ai-work-zh","AI 工作為何需要提示標準","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776738622916-xipq.png","2026-04-21T00:12:38.635108+00:00",{"id":71,"slug":72,"title":73,"cover_image":74,"image_url":74,"created_at":75,"category":31},"2ce35a50-85a1-42b5-8d74-af24ccaaf716","llms-knowledge-graphs-ml-explainability-zh","知識圖譜加 LLM 讓製造業 XAI 更好懂","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776665388382-t6m1.png","2026-04-20T06:09:32.525811+00:00",[77,82,87,92,97,102,107,112,117,122],{"id":78,"slug":79,"title":80,"created_at":81},"f18dbadb-8c59-4723-84a4-6ad22746c77a","deepmind-bets-on-continuous-learning-ai-2026-zh","DeepMind 押注 2026 連續學習 AI","2026-03-26T08:16:02.367355+00:00",{"id":83,"slug":84,"title":85,"created_at":86},"f4a106cb-02a6-4508-8f39-9720a0a93cee","ml-papers-of-the-week-github-research-desk-zh","每週 ML 論文清單，為何紅到 GitHub","2026-03-27T01:11:39.284175+00:00",{"id":88,"slug":89,"title":90,"created_at":91},"c4f807ca-4e5f-47f1-a48c-961cf3fc44dc","ai-ml-conferences-to-watch-in-2026-zh","2026 AI 研討會投稿時程整理","2026-03-27T01:51:53.874432+00:00",{"id":93,"slug":94,"title":95,"created_at":96},"9f50561b-aebd-46ba-94a8-363198aa7091","openclaw-agents-manipulated-self-sabotage-zh","OpenClaw Agent 會自己搞砸自己","2026-03-28T03:03:18.786425+00:00",{"id":98,"slug":99,"title":100,"created_at":101},"11f22e92-7066-4978-a544-31f5f2156ec6","vega-learning-to-drive-with-natural-language-instructions-zh","Vega：使用自然語言指示進行自駕車控制","2026-03-28T14:54:04.847912+00:00",{"id":103,"slug":104,"title":105,"created_at":106},"a4c7cfec-8d0e-4fec-93cf-1b9699a530b8","drive-my-way-en-zh","Drive My Way：個性化自駕車風格的實現","2026-03-28T14:54:26.207495+00:00",{"id":108,"slug":109,"title":110,"created_at":111},"dec02f89-fd39-41ba-8e4d-11ede93a536d","training-knowledge-bases-with-writeback-rag-zh","用 WriteBack-RAG 強化知識庫提升檢索效能","2026-03-28T14:54:45.775606+00:00",{"id":113,"slug":114,"title":115,"created_at":116},"3886be5c-a137-40cc-b9e2-0bf18430c002","packforcing-efficient-long-video-generation-method-zh","PackForcing：短影片訓練也能生成長影片","2026-03-28T14:55:02.688141+00:00",{"id":118,"slug":119,"title":120,"created_at":121},"72b90667-d930-4cc9-8ced-aaa0f8968d44","pixelsmile-toward-fine-grained-facial-expression-editing-zh","PixelSmile：提升精細臉部表情編輯的新方法","2026-03-28T14:55:20.678181+00:00",{"id":123,"slug":124,"title":125,"created_at":126},"cf046742-efb2-4753-aef9-caed5da5e32e","adaptive-block-scaled-data-types-zh","IF4：神經網路量化的聰明選擇","2026-03-31T06:00:36.990273+00:00"]