[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-claude-mythos-5-5000-en":3,"article-related-claude-mythos-5-5000-en":30,"series-model-release-ba5b0d8e-5854-4bf8-b26a-98dc46cebfdb":82},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":22,"views":26,"created_at":27,"published_at":28,"topic_cluster_id":29},"ba5b0d8e-5854-4bf8-b26a-98dc46cebfdb","claude-mythos-5-5000-en","Claude Mythos 5发布：5000万行代码一天迁移","\u003Cp data-speakable=\"summary\">\u003Ca href=\"\u002Ftag\u002Fanthropic\">Anthropic\u003C\u002Fa>发布\u003Ca href=\"\u002Fnews\u002Fclaude-fable-5-quiet-ai-release-week-en\">Claude Fable\u003C\u002Fa> 5和Mythos 5，把长任务、代码迁移和权限控制绑在了一起。\u003C\u002Fp>\u003Cp>这次发布最扎眼的数字不是参数，而是结果：一个5000万行Ruby代码库，官方称Fable 5一天就完成了迁移。与此同时，API价格也被砍到每百万输入Token 10美元、每百万输出Token 50美元，直接把开发者的注意力拉回到“能干活”和“干活贵不贵”这两个问题上。\u003C\u002Fp>\u003Ctable>\u003Cthead>\u003Ctr>\u003Cth>项目\u003C\u002Fth>\u003Cth>数据\u003C\u002Fth>\u003Cth>含义\u003C\u002Fth>\u003C\u002Ftr>\u003C\u002Fthead>\u003Ctbody>\u003Ctr>\u003Ctd>全库迁移\u003C\u002Ftd>\u003Ctd>5000万行 Ruby 代码\u003C\u002Ftd>\u003Ctd>官方展示的长任务能力\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>迁移耗时\u003C\u002Ftd>\u003Ctd>1天\u003C\u002Ftd>\u003Ctd>对比人工团队的2个多月\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>API定价\u003C\u002Ftd>\u003Ctd>$10 \u002F $50 每百万Token\u003C\u002Ftd>\u003Ctd>输入与输出的统一价格\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>会话降级比例\u003C\u002Ftd>\u003Ctd>超过95%\u003C\u002Ftd>\u003Ctd>多数请求仍走高能力路径\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>数据留存\u003C\u002Ftd>\u003Ctd>30天\u003C\u002Ftd>\u003Ctd>用于安全监控，不用于训练\u003C\u002Ftd>\u003C\u002Ftr>\u003C\u002Ftbody>\u003C\u002Ftable>\u003Ch2>Claude 这次不是只升级能力，而是改了产品形态\u003C\u002Fh2>\u003Cp>Anthropic这次端上桌的是两个版本：\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002F\" target=\"_blank\" rel=\"noopener\">Anthropic\u003C\u002Fa> 的 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\" target=\"_blank\" rel=\"noopener\">Claude Fable 5\u003C\u002Fa> 和 \u003Ca href=\"\u002Ftag\u002Fclaude-mythos\">Claude Mythos\u003C\u002Fa> 5。前者面向所有用户，后者只给少数受信任用户开放。两者的差别不只是“一个更强”，而是权限、场景和安全策略被拆开了。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781148787938-27wa.png\" alt=\"Claude Mythos 5发布：5000万行代码一天迁移\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>Fable 5带着防护网，碰到高风险请求时会自动降级到上一代 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002Fnews\u002Fclaude-opus-4-8\" target=\"_blank\" rel=\"noopener\">Claude Opus 4.8\u003C\u002Fa>。Mythos 5则保留更完整的能力，官方把它描述成在网络安全和生物科研上更接近“满血版”。这意味着用户看到的，不再只是一个统一模型，而是一套带路由和权限分层的系统。\u003C\u002Fp>\u003Cp>这类设计很像企业软件里的分级访问控制，只是对象从数据库权限换成了模型能力。普通写作、代码、分析、研究请求继续走高能力路径；一旦触发网络攻击、生物化学风险或蒸馏相关内容，系统就切换到更保守的处理方式。\u003C\u002Fp>\u003Cul>\u003Cli>Fable 5面向所有用户开放\u003C\u002Fli>\u003Cli>Mythos 5只给受信任用户\u003C\u002Fli>\u003Cli>高风险请求会自动降级到Opus 4.8\u003C\u002Fli>\u003Cli>官方称超过95%的会话不会触发降级\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>软件工程是这代模型最直接的战场\u003C\u002Fh2>\u003Cp>如果只看开发者最关心的部分，\u003Ca href=\"\u002Ftag\u002Fclaude\">Claude\u003C\u002Fa> Fable 5最明显的进步在软件工程。它在 \u003Ca href=\"https:\u002F\u002Fwww.swebench.com\u002F\" target=\"_blank\" rel=\"noopener\">SWE-bench Pro\u003C\u002Fa> 上拿到 80.3%，而文中提到的 \u003Ca href=\"https:\u002F\u002Fopenai.com\u002F\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa> 顶级主力模型 GPT-5.5 是 58.6%。这个差距不算小，尤其是当评测目标已经接近真实工程问题时。\u003C\u002Fp>\u003Cp>更值得注意的是 \u003Ca href=\"https:\u002F\u002Fwww.cognition.ai\u002F\" target=\"_blank\" rel=\"noopener\">Cognition\u003C\u002Fa> 的 Frontier Code 评测。Anthropic强调，Fable 5在中等推理强度下就拿到了前沿模型最高分。这说明它的优势不只是“更会聊天”，而是能在更少人工干预下推进复杂工程任务。\u003C\u002Fp>\u003Cblockquote>“It feels less like a tool and more like a small team.” — Ethan Mollick\u003C\u002Fblockquote>\u003Cp>这句话来自沃顿商学院教授 \u003Ca href=\"https:\u002F\u002Fwww.ethanmollick.com\u002F\" target=\"_blank\" rel=\"noopener\">Ethan Mollick\u003C\u002Fa>，他在拿到测试权限后写下了自己的体验。这个判断很贴切，因为他让 Fable 5 处理的是一个等时圈地图项目，模型自己去查了航班、铁路和道路速度信息，再把结果整合成可用产品。对开发者来说，这已经不是“补几行代码”的级别，而是“接住一个模糊目标并自己拆解任务”。\u003C\u002Fp>\u003Cul>\u003Cli>SWE-bench Pro：80.3%\u003C\u002Fli>\u003Cli>GPT-5.5：58.6%\u003C\u002Fli>\u003Cli>Stripe 5000万行 Ruby 迁移：1天完成\u003C\u002Fli>\u003Cli>人工团队预估时间：2个多月\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>视觉、长上下文和记忆，让它更像一个持续工作的系统\u003C\u002Fh2>\u003Cp>Claude Fable 5的另一个变化，是它对长上下文和记忆的处理更像“持续运行”而不是“单轮回答”。Anthropic称它能在百万级 Token 的长期任务里保持专注，还能使用自己的笔记改进输出。对做 \u003Ca href=\"\u002Ftag\u002Fagent\">Agent\u003C\u002Fa> 的人来说，这一项比单次跑分更实用，因为真正的难点从来不是开局，而是中途别把自己忘了。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781148789918-20fb.png\" alt=\"Claude Mythos 5发布：5000万行代码一天迁移\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>视觉能力也有明显进步。VentureBeat报道，Fable 5 和 Mythos 5 在 GDPpdf 基准上拿到 29.8%，而 Opus 4.8 是 22.5%，GPT-5.5 是 24.9%，\u003Ca href=\"\u002Ftag\u002Fgemini\">Gemini\u003C\u002Fa> 3.1 Pro 是 16.7%。这类文件推理任务对模型的图像理解和结构化提取要求很高，差几个百分点，实际体验可能就是“能不能直接用”。\u003C\u002Fp>\u003Cp>官方演示里最有传播力的是《宝可梦·火红版》。以前 Claude 想玩这类 RPG，往往要外部脚手架帮它读地图、记状态、处理导航。Fable 5 现在可以直接看原始截图盲打推进，靠原生视觉自己通关。这个 demo 听起来像玩具，但它说明了一件事：模型开始把视觉输入当作连续任务的一部分，而不是一次性识别。\u003C\u002Fp>\u003Cul>\u003Cli>GDPpdf：29.8%\u003C\u002Fli>\u003Cli>Opus 4.8：22.5%\u003C\u002Fli>\u003Cli>GPT-5.5：24.9%\u003C\u002Fli>\u003Cli>Gemini 3.1 Pro：16.7%\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>科研能力的重点，已经从“会回答”变成“会提出假设”\u003C\u002Fh2>\u003Cp>在更硬核的科研场景里，Mythos 5 才是这次发布真正想传达的信号。Anthropic称，它在生物医药领域可以独立执行一整套工作流：选择蛋白质结合位点、调用生物信息学工具、在失败后自己调试。更夸张的是，官方说它设计出的 14 个蛋白质靶向复合物里，9 个已经进入实验室的真实药物研发管线。\u003C\u002Fp>\u003Cp>这类说法当然需要更长时间验证，但它至少说明 Anthropic想把模型从“文献总结器”推进到“假设生成器”。在分子生物学盲测里，科学家在 80% 的情况下更偏向 Mythos 的假设。另一项关于大肠杆菌蛋白机制的假设，后来还在独立实验室的研究中得到证实。\u003C\u002Fp>\u003Cp>还有一个更值得注意的点：Mythos 5 在基因组学研究中自主工作了一周多，拼接了 138 个物种的单细胞数据，还训练了一个定制微型模型。Anthropic说，这个模型比原始方案体积小 100 倍，但表现反而超过了刚发表在《Science》上的新成果。即便把这类表述看得保守一点，它也说明高能力模型正在向“自动提出并筛选科学路线”靠近。\u003C\u002Fp>\u003Cp>如果你想看更广义的模型产品变化，可以参考 OraCore.dev 之前关于 \u003Ca href=\"\u002Fnews\u002Fclaude-code-usage-guide\" target=\"_blank\" rel=\"noopener\">Claude Code 工作流\u003C\u002Fa> 的文章。那篇文章讨论的是开发者如何把模型接进日常编码任务，这次 Claude Fable 5 讨论的则是模型如何自己把任务做完。\u003C\u002Fp>\u003Ch2>安全、价格和留存，才是企业真正要算的账\u003C\u002Fh2>\u003Cp>Anthropic这次最有争议的地方，不是能力，而是安全机制。Fable 5 背后挂着独立分类器，专门识别网络安全攻击、生物和化学风险，以及模型蒸馏。一旦触发，它不会直接拒绝，而是把请求转交给 Opus 4.8。这个做法比一句“抱歉我不能帮你”更像产品设计，也更像企业软件的权限分层。\u003C\u002Fp>\u003Cp>代价也很清楚。分类器越保守，误伤就越多。做病毒研究的生物学家、做授权攻防演练的安全工程师，都可能在合理任务里被降级。Anthropic也承认，当前护栏比理想状态更严格，后续会继续调。\u003C\u002Fp>\u003Cp>另一个现实问题是数据留存。从 Fable 5、Mythos 5 开始，Anthropic要求相关流量保留 30 天，覆盖第一方和第三方使用场景。官方说这些数据不用于训练，只用于安全监控。对个人用户来说，这可能只是条款里的一个数字；对企业来说，这直接关系到合规、审计和内部数据治理。\u003C\u002Fp>\u003Cp>价格方面，Fable 5 和 Mythos 5 统一定价为每百万输入 Token 10 美元、每百万输出 Token 50 美元。比之前的预览版便宜不少，但仍然是高价模型。Anthropic显然在传递一个信号：这代产品适合高价值任务，不适合把所有普通请求都丢上去烧。\u003C\u002Fp>\u003Cul>\u003Cli>输入 Token：$10 \u002F 100万\u003C\u002Fli>\u003Cli>输出 Token：$50 \u002F 100万\u003C\u002Fli>\u003Cli>流量留存：30天\u003C\u002Fli>\u003Cli>会话降级触发率：不到5%\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>结尾：这代 Claude 更像“可委托的工作室”\u003C\u002Fh2>\u003Cp>最能概括 Claude Mythos 5 的，不是“更聪明”，而是“更像一个能接长单的团队”。Ethan Mollick 的体验很说明问题：人类正在从逐句指挥模型，转向交付目标、等待成品、最后验收。这个变化一旦稳定下来，产品经理、工程师、研究员和分析师的工作方式都会被重新排序。\u003C\u002Fp>\u003Cp>接下来真正值得盯的，不是 Anthropic 还能放出多少 demo，而是企业会不会把这种权限分级、长上下文、自动路由的模型，接进真实业务系统。问题已经从“模型会不会做”变成“你愿不愿意让它连续做 9 个小时”。\u003C\u002Fp>\u003Cp>如果 Fable 5 的误伤率继续下降、留存策略更清晰、价格再往下走一档，下一轮竞争就不只是比单次回答质量，而是比谁更适合长期托管复杂任务。到那时，最先被改变的可能不是聊天体验，而是软件开发和知识工作的交付方式。\u003C\u002Fp>","Anthropic发布Claude Fable 5和Mythos 5，主打长任务、代码迁移、视觉推理和更严格的权限控制。","zhuanlan.zhihu.com","https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F2047932995126956032",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781148787938-27wa.png","model-release","en","a9be565a-5861-4371-898d-20b98794be42",[17,18,19,20,21],"Claude Mythos 5","Anthropic","长上下文","AI Agent","软件工程",[23,24,25],"Claude Fable 5和Mythos 5把能力、权限和安全分层绑定在一起。","Fable 5在SWE-bench Pro拿到80.3%，并被展示为能一天完成5000万行代码迁移。","Mythos 5把科研工作流进一步自动化，但企业要同时接受30天留存和更严格的安全审查。",0,"2026-06-11T03:32:40.961698+00:00","2026-06-11T03:32:40.956+00:00","1bae1133-d241-4581-9332-fbf39690c319",{"tags":31,"relatedLang":41,"relatedPosts":45},[32,33,35,37,40],{"name":19,"slug":19},{"name":17,"slug":34},"claude-mythos-5",{"name":18,"slug":36},"anthropic",{"name":38,"slug":39},"AI agent","ai-agent",{"name":21,"slug":21},{"id":15,"slug":42,"title":43,"language":44},"claude-mythos-5-5000-zh","Claude Mythos 5：一天搬完5000萬行程式","zh",[46,52,58,64,70,76],{"id":47,"slug":48,"title":49,"cover_image":50,"image_url":50,"created_at":51,"category":13},"2a09eaa4-4f46-41b4-8942-15e4902235b6","unsloth-kimi-k25-gguf-hugging-face-en","Unsloth’s Kimi-K2.5 GGUF pack lands on Hugging Face","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781160484739-zh44.png","2026-06-11T06:47:34.183541+00:00",{"id":53,"slug":54,"title":55,"cover_image":56,"image_url":56,"created_at":57,"category":13},"614d0ca9-7068-420a-8a34-c415fecad96c","gpt-56-chasing-front-end-before-beating-mythos-en","GPT-5.6先追前端，再谈超越Mythos","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781154169793-l9sq.png","2026-06-11T05:02:21.971796+00:00",{"id":59,"slug":60,"title":61,"cover_image":62,"image_url":62,"created_at":63,"category":13},"a1d8f44e-7017-4a26-b745-90e394368e59","claude-fable-5-quiet-ai-release-week-en","Claude Fable 5 leads a quiet AI release week","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781143385127-g0i2.png","2026-06-11T02:02:39.433393+00:00",{"id":65,"slug":66,"title":67,"cover_image":68,"image_url":68,"created_at":69,"category":13},"fcc083c3-dad0-40d7-8ed4-6d89bf1ae3f9","mistral-model-lineup-specialization-beats-giant-model-en","Mistral’s model lineup proves specialization beats one giant model","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781140679549-zq0x.png","2026-06-11T01:17:28.761627+00:00",{"id":71,"slug":72,"title":73,"cover_image":74,"image_url":74,"created_at":75,"category":13},"2c34e9fb-ebe7-46ca-996a-939d965159fd","xiaomi-mimo-1t-model-1000-tokens-per-second-en","Xiaomi MiMo pushes 1T model to 1000 tokens\u002Fs","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781129885712-1m6x.png","2026-06-10T22:17:35.756211+00:00",{"id":77,"slug":78,"title":79,"cover_image":80,"image_url":80,"created_at":81,"category":13},"5087c618-81f0-44cf-b851-933b509f28ce","google-gemini-latest-update-maps-en","Google Gemini’s latest update centers on Maps","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781119072999-p0wf.png","2026-06-10T19:17:28.002681+00:00",[83,88,93,98,103,108,113,118,123,128],{"id":84,"slug":85,"title":86,"created_at":87},"d4cffde7-9b50-4cc7-bb68-8bc9e3b15477","nvidia-rubin-ai-supercomputer-en","NVIDIA Unveils Rubin: A Leap in AI Supercomputing","2026-03-25T16:24:35.155565+00:00",{"id":89,"slug":90,"title":91,"created_at":92},"eab919b9-fbac-4048-89fc-afad6749ccef","google-gemini-ai-innovations-2026-en","Google's AI Leap with Gemini Innovations in 2026","2026-03-25T16:27:18.841838+00:00",{"id":94,"slug":95,"title":96,"created_at":97},"5f5cfc67-3384-4816-a8f6-19e44d90113d","gap-google-gemini-ai-checkout-en","Gap Teams Up with Google Gemini for AI-Driven Checkout","2026-03-25T16:27:46.483272+00:00",{"id":99,"slug":100,"title":101,"created_at":102},"f6d04567-47f6-49ec-804c-52e61ab91225","ai-model-release-wave-march-2026-en","Navigating the AI Model Release Wave of March 2026","2026-03-25T16:28:45.409716+00:00",{"id":104,"slug":105,"title":106,"created_at":107},"895c150c-569e-4fdf-939d-dade785c990e","small-language-models-transform-ai-en","Small Language Models: Llama 3.2 and Phi-3 Transform AI","2026-03-25T16:30:26.688313+00:00",{"id":109,"slug":110,"title":111,"created_at":112},"38eb1d26-d961-4fd3-ae12-9c4089680f5f","midjourney-v8-alpha-features-pricing-en","Midjourney V8 Alpha: A Deep Dive into Its Features and Pricing","2026-03-26T01:25:36.387587+00:00",{"id":114,"slug":115,"title":116,"created_at":117},"bf36bb9e-3444-4fb8-ab19-0df6bc9d8271","rag-2026-indispensable-ai-bridge-en","RAG in 2026: The Indispensable AI Bridge","2026-03-26T01:28:34.472046+00:00",{"id":119,"slug":120,"title":121,"created_at":122},"60881d6d-2310-44ef-b1fb-7f98e9dd2f0e","xiaomi-mimo-trio-agents-robots-voice-en","Xiaomi’s MiMo trio targets agents, robots, and voice","2026-03-28T03:05:08.899895+00:00",{"id":124,"slug":125,"title":126,"created_at":127},"f063d8d1-41d1-4de4-8ebc-6c40511b9369","xiaomi-mimo-v2-pro-1t-moe-agents-en","Xiaomi MiMo-V2-Pro: 1T MoE Model for Agents","2026-03-28T03:06:19.238032+00:00",{"id":129,"slug":130,"title":131,"created_at":132},"a1379e9a-6785-4ff5-9b0a-8cff55f8264f","cursor-composer-2-started-from-kimi-en","Cursor’s Composer 2 started from Kimi","2026-03-28T03:11:59.132398+00:00"]