[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-claude-mythos-5-5000-zh":3,"article-related-claude-mythos-5-5000-zh":34,"series-model-release-a9be565a-5861-4371-898d-20b98794be42":87},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":26,"views":30,"created_at":31,"published_at":32,"topic_cluster_id":33},"a9be565a-5861-4371-898d-20b98794be42","claude-mythos-5-5000-zh","Claude Mythos 5：一天搬完5000萬行程式","\u003Cp data-speakable=\"summary\">\u003Ca href=\"\u002Ftag\u002Fanthropic\">Anthropic\u003C\u002Fa>推出\u003Ca href=\"\u002Ftag\u002Fclaude\">Claude\u003C\u002Fa> Fable 5和Mythos 5，把長任務、程式碼遷移和權限控制綁在一起。\u003C\u002Fp>\u003Cp>這次最吸睛的不是模型名稱，而是結果。官方說，\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002F\" target=\"_blank\" rel=\"noopener\">Anthropic\u003C\u002Fa> 的 Fable 5 一天搬完 5000 萬行 Ruby 程式。這種數字很粗暴，也很有效，因為它直接戳到開發者最在意的點：能不能真的做事，還有做事會不會太貴。\u003C\u002Fp>\u003Cp>另一個數字也很硬。API 價格壓到每百萬輸入 \u003Ca href=\"\u002Ftag\u002Ftoken\">Token\u003C\u002Fa> 10 美元、每百萬輸出 Token 50 美元。對比前幾代高階模型，這已經不是單純比聊天品質，而是把「長任務成本」拉到檯面上。\u003C\u002Fp>\u003Ctable>\u003Cthead>\u003Ctr>\u003Cth>項目\u003C\u002Fth>\u003Cth>數據\u003C\u002Fth>\u003Cth>含義\u003C\u002Fth>\u003C\u002Ftr>\u003C\u002Fthead>\u003Ctbody>\u003Ctr>\u003Ctd>全庫遷移\u003C\u002Ftd>\u003Ctd>5000萬行 Ruby 程式\u003C\u002Ftd>\u003Ctd>官方展示的長任務能力\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>遷移耗時\u003C\u002Ftd>\u003Ctd>1天\u003C\u002Ftd>\u003Ctd>對比人工團隊的2個多月\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>API定價\u003C\u002Ftd>\u003Ctd>$10 \u002F $50 每百萬Token\u003C\u002Ftd>\u003Ctd>輸入與輸出的統一價格\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>會話降級比例\u003C\u002Ftd>\u003Ctd>超過95%\u003C\u002Ftd>\u003Ctd>多數請求仍走高能力路徑\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>資料留存\u003C\u002Ftd>\u003Ctd>30天\u003C\u002Ftd>\u003Ctd>用於安全監控，不用於訓練\u003C\u002Ftd>\u003C\u002Ftr>\u003C\u002Ftbody>\u003C\u002Ftable>\u003Ch2>Claude 這次改的不是能力，而是產品形態\u003C\u002Fh2>\u003Cp>Anthropic這次端上桌的是兩個版本：\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\" target=\"_blank\" rel=\"noopener\">Claude Fable 5\u003C\u002Fa> 和 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\" target=\"_blank\" rel=\"noopener\">Claude Mythos 5\u003C\u002Fa>。前者面向所有使用者，後者只給少數受信任使用者。兩者差別不只是強弱，而是權限、場景和安全策略被拆開了。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781148791055-zocy.png\" alt=\"Claude Mythos 5：一天搬完5000萬行程式\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>Fable 5 帶著防護網。碰到高風險請求時，它會自動降級到上一代 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\u002Fclaude-opus-4-8\" target=\"_blank\" rel=\"noopener\">Claude Opus 4.8\u003C\u002Fa>。Mythos 5 則保留更完整的能力，官方把它放在網路安全和生物科研這類更敏感的場景裡。\u003C\u002Fp>\u003Cp>講白了，這不再像單一模型。它更像一套有路由、有分級、有權限的系統。普通寫作、程式、分析、研究請求走高能力路徑；一旦踩到攻擊、生物化學風險或蒸餾相關內容，就切到更保守的處理方式。\u003C\u002Fp>\u003Cul>\u003Cli>Fable 5 面向所有使用者\u003C\u002Fli>\u003Cli>Mythos 5 只給受信任使用者\u003C\u002Fli>\u003Cli>高風險請求會降級到 Opus 4.8\u003C\u002Fli>\u003Cli>官方稱超過 95% 的會話不會觸發降級\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>軟體工程，是這代模型最直接的戰場\u003C\u002Fh2>\u003Cp>如果只看開發者最在意的部分，Fable 5 的進步很直接。它在 \u003Ca href=\"https:\u002F\u002Fwww.swebench.com\u002F\" target=\"_blank\" rel=\"noopener\">SWE-bench Pro\u003C\u002Fa> 拿到 80.3%。文中提到的 \u003Ca href=\"https:\u002F\u002Fopenai.com\u002F\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa> 頂級主力模型 GPT-5.5 是 58.6%。這個差距不算小，尤其當評測已經接近真實工程問題時。\u003C\u002Fp>\u003Cp>更有意思的是 \u003Ca href=\"https:\u002F\u002Fwww.cognition.ai\u002F\" target=\"_blank\" rel=\"noopener\">Cognition\u003C\u002Fa> 的 Frontier Code 評測。Anthropic強調，Fable 5 在中等推理強度下，就拿到前沿模型最高分。這代表它的優勢不只是更會聊天，而是更能在少量人工介入下推進複雜工程任務。\u003C\u002Fp>\u003Cp>沃頓商學院教授 \u003Ca href=\"https:\u002F\u002Fwww.ethanmollick.com\u002F\" target=\"_blank\" rel=\"noopener\">Ethan Mollick\u003C\u002Fa> 的一句話，很適合形容這個感覺。\u003C\u002Fp>\u003Cblockquote>“It feels less like a tool and more like a small team.” — Ethan Mollick\u003C\u002Fblockquote>\u003Cp>他拿到測試權限後，讓 Fable 5 處理等時圈地圖專案。模型自己查航班、鐵路和道路速度，再把結果整合成可用產品。這已經不是補幾行程式，而是接住一個模糊目標，然後自己拆任務。\u003C\u002Fp>\u003Cul>\u003Cli>SWE-bench Pro：80.3%\u003C\u002Fli>\u003Cli>GPT-5.5：58.6%\u003C\u002Fli>\u003Cli>Stripe 5000萬行 Ruby 遷移：1天完成\u003C\u002Fli>\u003Cli>人工團隊預估時間：2個多月\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>視覺、長上下文和記憶，讓它更像持續工作的系統\u003C\u002Fh2>\u003Cp>Claude Fable 5 的另一個變化，是它對長上下文和記憶的處理更像持續執行，\u003Ca href=\"\u002Fnews\u002Fwindows-agent-runtime-not-human-desktop-zh\">而不是\u003C\u002Fa>單輪回答。Anthropic稱，它能在百萬級 Token 的長期任務裡維持專注，還能用自己的筆記改進輸出。對做 \u003Ca href=\"\u002Ftag\u002Fagent\">Agent\u003C\u002Fa> 的人來說，這比單次跑\u003Ca href=\"\u002Fnews\u002Fsequential-fine-tuning-essay-scoring-zh\">分更\u003C\u002Fa>實用。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781148795362-iid3.png\" alt=\"Claude Mythos 5：一天搬完5000萬行程式\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>真正難的從來不是開局，而是中途別把自己忘了。很多模型前 10 分鐘很猛，後面就開始亂掉。Fable 5 主打的，就是把這段長尾撐住，讓任務可以連續跑下去。\u003C\u002Fp>\u003Cp>視覺能力也有進步。\u003Ca href=\"https:\u002F\u002Fventurebeat.com\u002F\" target=\"_blank\" rel=\"noopener\">VentureBeat\u003C\u002Fa> 報導，Fable 5 和 Mythos 5 在 GDPpdf 基準拿到 29.8%，Opus 4.8 是 22.5%，GPT-5.5 是 24.9%，\u003Ca href=\"https:\u002F\u002Fblog.google\u002Ftechnology\u002Fai\u002F\" target=\"_blank\" rel=\"noopener\">Gemini\u003C\u002Fa> 3.1 Pro 是 16.7%。這類文件推理任務很吃圖像理解和結構化提取，差幾個百分點，體感就差很多。\u003C\u002Fp>\u003Cp>官方演示裡最有話題的，是《寶可夢·火紅版》。以前 Claude 玩這類 RPG，常常要外部腳手架幫它讀地圖、記狀態、處理導航。Fable 5 現在可以直接看原始截圖盲打推進，靠原生視覺自己通關。\u003C\u002Fp>\u003Cul>\u003Cli>GDPpdf：29.8%\u003C\u002Fli>\u003Cli>Opus 4.8：22.5%\u003C\u002Fli>\u003Cli>GPT-5.5：24.9%\u003C\u002Fli>\u003Cli>Gemini 3.1 Pro：16.7%\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>科研能力的重點，已經從回答變成提出假設\u003C\u002Fh2>\u003Cp>在更硬核的科研場景裡，Mythos 5 才是這次發布真正想傳達的訊號。Anthropic稱，它在生物醫藥領域可以獨立執行整套工作流：選擇蛋白質結合位點、呼叫生物資訊工具、失敗後自己除錯。官方還說，它設計出的 14 個蛋白質靶向複合物裡，9 個已進入實驗室的真實藥物研發管線。\u003C\u002Fp>\u003Cp>這類說法當然需要更長時間驗證，但方向很清楚。Anthropic想把模型從文獻整理器，推到假設生成器。模型不只是幫你找資料，而是先丟出一個可以拿去做實驗的方向。\u003C\u002Fp>\u003Cp>還有一個更關鍵的點。Mythos 5 在基因組學研究中自主工作了一週多，拼接了 138 個物種的單細胞資料，還訓練了一個定制微\u003Ca href=\"\u002Fnews\u002Fmistral-model-lineup-specialization-beats-giant-model-zh\">型模型\u003C\u002Fa>。Anthropic說，這個模型比原始方案小 100 倍，但表現還超過剛發表在 \u003Ca href=\"https:\u002F\u002Fwww.science.org\u002F\" target=\"_blank\" rel=\"noopener\">Science\u003C\u002Fa> 的新成果。\u003C\u002Fp>\u003Cp>如果你想看更日常的開發者用法，可以回頭看 OraCore.dev 的 \u003Ca href=\"\u002Fnews\u002Fclaude-code-usage-guide\" target=\"_blank\" rel=\"noopener\">Claude Code 工作流\u003C\u002Fa>。那篇講的是怎麼把模型接進日常編碼；這次講的，則是模型怎麼自己把任務做完。\u003C\u002Fp>\u003Ch2>安全、價格和留存，才是企業真正要算的帳\u003C\u002Fh2>\u003Cp>Anthropic這次最有爭議的地方，不是能力，而是安全機制。Fable 5 背後掛著獨立分類器，專門識別網路安全攻擊、生物和化學風險，以及模型蒸餾。一旦觸發，它不會直接拒絕，而是把請求轉給 Opus 4.8。\u003C\u002Fp>\u003Cp>這種做法比一句「抱歉，我不能幫你」更像產品設計，也更像企業軟體的權限分層。問題是，分類器越保守，誤傷就越多。做病毒研究的生物學家，或做授權攻防演練的安全工程師，都可能在合理任務裡被降級。\u003C\u002Fp>\u003Cp>Anthropic也承認，現在的護欄比理想狀態更嚴。這代表它還在調整，不是已經收工。對企業來說，這種不確定性會直接影響導入意願，因為誰都不想買一個會在關鍵時刻自動縮手的系統。\u003C\u002Fp>\u003Cp>另一個現實問題是資料留存。從 Fable 5、Mythos 5 開始，相關流量要保留 30 天，涵蓋第一方和第三方使用場景。官方說這些資料不用於訓練，只用於安全監控。對個人使用者來說，這只是條款裡的一個數字；對企業來說，這牽涉合規、稽核和內部資料治理。\u003C\u002Fp>\u003Cp>價格也很直白。Fable 5 和 Mythos 5 統一定價為每百萬輸入 Token 10 美元、每百萬輸出 Token 50 美元。比之前的預覽版便宜不少，但仍然是高價模型。Anthropic傳的訊號很清楚：這代產品適合高價值任務，不適合把所有普通請求都丟上去燒。\u003C\u002Fp>\u003Cul>\u003Cli>輸入 Token：$10 \u002F 100萬\u003C\u002Fli>\u003Cli>輸出 Token：$50 \u002F 100萬\u003C\u002Fli>\u003Cli>流量留存：30天\u003C\u002Fli>\u003Cli>會話降級觸發率：不到5%\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>這代 Claude，更像可委託的工作室\u003C\u002Fh2>\u003Cp>最能概括 \u003Ca href=\"\u002Ftag\u002Fclaude-mythos\">Claude Mythos\u003C\u002Fa> 5 的，不是更聰明，而是更像一個能接長單的團隊。Ethan Mollick 的體驗很說明問題：人類正在從逐句指揮模型，轉向交付目標、等待成品、最後驗收。\u003C\u002Fp>\u003Cp>這個變化一旦穩定下來，產品經理、工程師、研究員和分析師的工作方式都會被重新排序。你不再只是問模型一個問題，而是把一整段工作交出去，然後盯著它有沒有跑偏。\u003C\u002Fp>\u003Cp>接下來真正值得盯的，不是 Anthropic 還能放出多少 demo，而是企業會不會把這種權限分級、長上下文、自動路由的模型，接進真實業務系統。問題已經從「模型會不會做」變成「你願不願意讓它連續做 9 個小時」。\u003C\u002Fp>\u003Cp>如果 Fable 5 的誤傷率繼續下降、留存策略更清楚、價格再往下走一檔，下一輪競爭就不只是比單次回答品質，而是比誰更適合長期托管複雜任務。到那時，最先被改變的可能不是聊天體驗，而是軟體開發和知識工作的交付方式。\u003C\u002Fp>","Anthropic推出Claude Fable 5和Mythos 5，主打長任務、程式碼遷移、視覺推理與更嚴格權限控制，還把API價格壓到每百萬Token 10\u002F50美元。","zhuanlan.zhihu.com","https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F2047932995126956032",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781148791055-zocy.png","model-release","zh","ba5b0d8e-5854-4bf8-b26a-98dc46cebfdb",[17,18,19,20,21,22,23,24,25],"Claude","Anthropic","LLM","程式碼遷移","SWE-bench Pro","Token價格","視覺推理","長上下文","安全權限",[27,28,29],"Claude Fable 5把長任務、程式碼遷移和安全分級整合成一套產品。","官方展示的5000萬行Ruby遷移和SWE-bench Pro 80.3%是這次最強信號。","Mythos 5把模型推向科研工作流，但企業更該先看權限、留存和誤傷率。",0,"2026-06-11T03:32:40.554558+00:00","2026-06-11T03:32:40.549+00:00","0ccb5d2e-69f1-4354-a3e0-cb370221cd95",{"tags":35,"relatedLang":46,"relatedPosts":50},[36,37,39,41,43],{"name":20,"slug":20},{"name":18,"slug":38},"anthropic",{"name":19,"slug":40},"llm",{"name":17,"slug":42},"claude",{"name":44,"slug":45},"SWE-Bench Pro","swe-bench-pro",{"id":15,"slug":47,"title":48,"language":49},"claude-mythos-5-5000-en","Claude Mythos 5发布：5000万行代码一天迁移","en",[51,57,63,69,75,81],{"id":52,"slug":53,"title":54,"cover_image":55,"image_url":55,"created_at":56,"category":13},"42ca8c4e-e593-461b-b108-ec98c12cf678","unsloth-kimi-k25-gguf-hugging-face-zh","Unsloth 把 Kimi-K2.5 做成 GGUF 包","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781160488625-q93d.png","2026-06-11T06:47:33.607859+00:00",{"id":58,"slug":59,"title":60,"cover_image":61,"image_url":61,"created_at":62,"category":13},"8c573682-2528-4882-bff0-e1a06cd8f2ee","gpt-56-chasing-front-end-before-beating-mythos-zh","GPT-5.6先追前端，再談超越 Mythos","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781154168441-ovuw.png","2026-06-11T05:02:21.52852+00:00",{"id":64,"slug":65,"title":66,"cover_image":67,"image_url":67,"created_at":68,"category":13},"4fde468d-be9e-4013-a2e0-8b68ab4bf250","claude-fable-5-quiet-ai-release-week-zh","Claude Fable 5 讓這週像在降溫","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781143383988-o40t.png","2026-06-11T02:02:38.955757+00:00",{"id":70,"slug":71,"title":72,"cover_image":73,"image_url":73,"created_at":74,"category":13},"ef44efd1-dfaf-4d9e-8772-3a6d6f963f08","mistral-model-lineup-specialization-beats-giant-model-zh","Mistral 的模型陣容證明：專精勝過一個巨型模型","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781140675776-0e88.png","2026-06-11T01:17:28.295033+00:00",{"id":76,"slug":77,"title":78,"cover_image":79,"image_url":79,"created_at":80,"category":13},"19af5701-87e3-4774-be7a-8aebcbeef2a5","xiaomi-mimo-1t-model-1000-tokens-per-second-zh","小米 MiMo 把 1T 模型推到 1000 tokens\u002Fs","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781129889723-wz61.png","2026-06-10T22:17:35.161841+00:00",{"id":82,"slug":83,"title":84,"cover_image":85,"image_url":85,"created_at":86,"category":13},"5bbd81ab-3cf8-4ca5-9fb0-569d8454697a","mimo-1000-tps-1t-model-ultraspeed-zh","MiMo 在 1T 模型跑到 1000 TPS","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781128990637-k4n1.png","2026-06-10T22:02:42.710101+00:00",[88,93,98,103,108,113,118,123,128,133],{"id":89,"slug":90,"title":91,"created_at":92},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","2026-03-26T07:18:45.861277+00:00",{"id":94,"slug":95,"title":96,"created_at":97},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":99,"slug":100,"title":101,"created_at":102},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":104,"slug":105,"title":106,"created_at":107},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":109,"slug":110,"title":111,"created_at":112},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":114,"slug":115,"title":116,"created_at":117},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","xiaomi-mimo-v2-pro-1t-moe-agents-zh","小米 MiMo-V2-Pro 登場：1T MoE 模型","2026-03-28T03:06:19.002353+00:00",{"id":119,"slug":120,"title":121,"created_at":122},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":124,"slug":125,"title":126,"created_at":127},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","2026-03-29T04:52:57.886544+00:00",{"id":129,"slug":130,"title":131,"created_at":132},"c679b51f-194a-463b-87fc-7695256ff752","mimo-v2-pro-vs-omni-vs-flash-2026-zh","MiMo V2 Pro、Omni、Flash 怎麼選","2026-04-02T01:18:43.576128+00:00",{"id":134,"slug":135,"title":136,"created_at":137},"3b988fd7-6749-4f01-ba25-c0ad7486dc31","z-ai-glm-5v-turbo-design2code-claude-zh","GLM-5V-Turbo 在 Design2Code 贏了…","2026-04-02T04:03:36.31741+00:00"]