[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-90-minute-takedown-turns-ai-ops-into-crisis-zh":3,"article-related-90-minute-takedown-turns-ai-ops-into-crisis-zh":30,"series-industry-bd0a5d0d-eb7f-4285-8ee3-680de6bbfb05":73},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":22,"views":26,"created_at":27,"published_at":28,"topic_cluster_id":29},"bd0a5d0d-eb7f-4285-8ee3-680de6bbfb05","90-minute-takedown-turns-ai-ops-into-crisis-zh","90 分鐘下線把 AI 變成事故演練","\u003Cp data-speakable=\"summary\">這篇把 90 分鐘下線事件拆成一份 AI 事故應對 playbook，重點是 rollback、溝通和權責分工。\u003C\u002Fp>\u003Cp>我做 AI 系統一陣子後，最煩的不是模型答錯，而是它一旦出事，整個團隊才發現自己根本不會「關掉它」。平常大家都在談 eval、prompt、context window，講得像把分數拉高就萬事大吉。結果真碰到外部要求你立刻停機，才知道你沒有 runbook、沒有 \u003Ca href=\"\u002Fnews\u002Fgithub-last30days-skill-ai-research-model-zh\">kill\u003C\u002Fa> switch、沒有對外說法，連誰能拍板都說不清楚。那種慌，不是技術慌，是組織慌。\u003C\u002Fp>\u003Cp>更尷尬的是，很多 AI 團隊把「上線」當成終點，卻沒把「下線」當成同樣重要的流程。我看過太多漂亮 dashboard，卻沒有一條真的能把流量切乾淨的路。看起來像有治理，實際上只是把風險藏得比較好而已。\u003C\u002Fp>\u003Cp>所以我不是把這件事當八卦看。我是把它當一個系統事故案例看：如果一個 AI 產品\u003Ca href=\"\u002Fnews\u002Fgpt-56-fix-and-upgrade-release-zh\">可能\u003C\u002Fa>被要求在很短時間內撤下，那每個團隊都該先想好，怎麼停、誰停、停了怎麼講。\u003C\u002Fp>\u003Cp>這份洞察的觸發點來自 \u003Ca href=\"https:\u002F\u002Fwww.nytimes.com\u002F2026\u002F06\u002F17\u002Ftechnology\u002Fanthropic-trump-administration-fable.html\">The New York Times\u003C\u002Fa> 對 \u003Ca href=\"\u002Ftag\u002Fanthropic\">Anthropic\u003C\u002Fa> 事件的報導。文中提到的硬資訊很直接：他們被告知只剩不到 90 分鐘要把最新 AI 下線。這個數字本身就夠刺眼，因為它代表的不是產品節奏，而是事故節奏。\u003C\u002Fp>\u003Ch2>上線和下線，其實是同一個流程\u003C\u002Fh2>\u003Cblockquote>Executives at the artificial intelligence start-up Anthropic received alarming news from the White House on Friday. They had less than 90 minutes, they were told, to take down their newest A.I.\u003C\u002Fblockquote>\u003Cp>翻譯一下就是：你不能只會 deploy，還要會 un-deploy，而且這兩件事要同樣熟。AI 產品不是一次性軟體，它更像一個一直在線上的服務，外面有人可以突然要求你停。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781759004216-23ns.png\" alt=\"90 分鐘下線把 AI 變成事故演練\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>我以前在基礎設施團隊就吃過這種虧。最成熟的團隊不會只問「能不能上」，而是先問「如果要關，怎麼關才不會炸」。AI 團隊常常把自己想成研究團隊，結果一上線就變成服務團隊，偏偏還沒補上服務該有的操作能力。\u003C\u002Fp>\u003Cp>實操寫法很簡單：你的 release checklist 要同時有 launch path 和 takedown path。不要只寫怎麼開，要把怎麼關、誰負責、誰確認、誰通知，全部寫進去。\u003C\u002Fp>\u003Cul>\u003Cli>先寫 rollback 步驟，再寫 launch 步驟。\u003C\u002Fli>\u003Cli>把 model 權重、API routing、前端開關拆開。\u003C\u002Fli>\u003Cli>任何一層出事，都要能單獨切斷，不要整包一起綁死。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這聽起來很基本，但很多團隊真的沒有。大家在 demo 時都很自信，真到要停機，才發現自己只是把風險包裝得比較好看。\u003C\u002Fp>\u003Ch2>沒有 kill switch 的 AI，就是等著出包\u003C\u002Fh2>\u003Cp>我最不愛聽的話之一，就是「先上，之後再補控制」。這句話在 AI 產品上特別危險，因為外部政策、平台條款、法遵要求，常常比你的 roadmap 變得更快。\u003C\u002Fp>\u003Cp>Anthropic 這件事提醒我，AI 系統需要的是操作控制，不只是 model card 和安全聲明。那些文件不是沒用，但它們頂多是說明書，不能代替真正的控制面。當外部環境突然變了，你需要的是能直接切流量、停功能、保留證據的機制。\u003C\u002Fp>\u003Cp>也就是說，你的架構要預設「會被迫中斷」。如果你不能把某個版本、某個 endpoint、某個 tenant 獨立停掉，那你根本不是在做可控系統，你是在堆依賴，順便祈禱今天不要出事。\u003C\u002Fp>\u003Cp>我碰過最典型的場景，是客戶一通電話來問：「可以只關掉這個功能嗎？」結果答案是不能，因為功能跟登入、計費、主應用 shell 全綁在一起。這種設計不叫整合，這叫把自己逼進角落。\u003C\u002Fp>\u003Cp>實操寫法：把 AI stack 切成可單獨關閉的層次，並且定期演練關閉。\u003C\u002Fp>\u003Cul>\u003Cli>模型存取放在 feature flag 後面。\u003C\u002Fli>\u003Cli>環境級控制要能直接關，不要靠臨時改 code。\u003C\u002Fli>\u003Cli>每季做一次「真的關掉」演練，量時間，不要只看文件。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>如果你對這些問題的答案是「到時候再看」，那你不是有 incident plan，你是有一份看起來很忙的樂觀清單。\u003C\u002Fp>\u003Ch2>法務和工程不能各講各的\u003C\u002Fh2>\u003Cp>AI 團隊最愛假裝有一道牆，叫做工程歸工程、法務歸法務。實際上這面牆很常只是拖延的藉口。工程嫌法務慢，法務嫌工程衝，最後真正出事時，兩邊都在看對方臉色，沒人知道下一步怎麼走。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781759001905-zy31.png\" alt=\"90 分鐘下線把 AI 變成事故演練\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這篇報導最有價值的地方，就是它讓我看到壓力不是從產品團隊內部來的，而是外部直接壓進來。這代表你不能等事情發生後，再讓法務幫你翻譯成可以執行的動作。runbook 必須先存在，而且要夠白話。\u003C\u002Fp>\u003Cp>翻譯一下就是：法遵流程不是放在文件夾裡的 PDF，而是控制平面的一部分。只要某個模型或功能有合規觸發條件，團隊就要知道誰能下指令、誰能執行、誰能對外回應。\u003C\u002Fp>\u003Cp>我看過最糟的情況，是工程已經有修法，卻卡在「到底能不能動」的灰區。這種延誤很貴，也很傷信任，因為外面的人只會看到你們在拖。\u003C\u002Fp>\u003Cp>實操寫法：寫一頁 escalation matrix，越短越好，越直接越好。\u003C\u002Fp>\u003Cul>\u003Cli>什麼事件由誰接手。\u003C\u002Fli>\u003Cli>外部要求來自誰時，誰有權批准。\u003C\u002Fli>\u003Cli>要停哪個功能、先停哪一層、誰負責驗證。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>你也可以參考 \u003Ca href=\"https:\u002F\u002Fwww.nist.gov\u002Fitl\u002Fsmallbusinesscyber\u002Fcybersecurity-basics\u002Fincident-response\">NIST incident response basics\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.iso.org\u002Fstandard\u002F27035\">ISO\u002FIEC 27035\u003C\u002Fa>，再把它們縮成你公司看得懂的版本。還有 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002F\">Anthropic\u003C\u002Fa> 本身的公開資料，也能拿來對照它們怎麼講安全與治理。\u003C\u002Fp>\u003Ch2>真正難的不是停機，是怎麼講清楚\u003C\u002Fh2>\u003Cp>很多團隊以為事故處理到「功能停掉」就算結束，其實最容易翻車的是溝通。使用者不在乎你內部會議開得多細，他只在乎他的工作流程是不是壞了、資料還在不在、你是不是在裝死。\u003C\u002Fp>\u003Cp>這也是 AI 團隊很常丟臉的地方：上線前文案寫得很會，出事後卻一句話都擠不出來。沉默不會讓你看起來謹慎，只會讓人覺得你在閃。\u003C\u002Fp>\u003Cp>也就是說，對外說法要先寫好，不是要你假裝沒事，而是要你在壓力下還能講人話。你只需要回答幾件事：發生什麼事、現在關掉了什麼、使用者會受到什麼影響、下一次更新什麼時候來。\u003C\u002Fp>\u003Cp>我以前看過團隊花三個小時修 status page 的措辭，結果 support 工單已經爆了。比較好的做法反而很土：先發一則白話公告，醜一點沒關係，重點是準確。\u003C\u002Fp>\u003Cp>實操寫法：先準備三種版本的通知，不要等 crisis 來才現寫。\u003C\u002Fp>\u003Cul>\u003Cli>內部通知：給員工看，講決策和責任。\u003C\u002Fli>\u003Cli>客戶通知：講影響範圍和替代方案。\u003C\u002Fli>\u003Cli>合作方或監管窗口：講狀態、證據、下一步。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>三種版本都要回答同一組問題，這樣你才不會每個窗口講不同版本，最後自己打自己臉。\u003C\u002Fp>\u003Ch2>別再把英雄主義當流程\u003C\u002Fh2>\u003Cp>我每次看到這種事件，都會對那種「大家熬夜救火」的故事很反感。不是因為人不努力，而是因為太多公司把熬夜當成美德，卻不去處理為什麼會需要熬夜。\u003C\u002Fp>\u003Cp>翻譯一下就是：英雄主義是壞系統的稅，不是管理能力。你可以偶爾靠人撐過去，但你不能把這件事當成制度。\u003C\u002Fp>\u003Cp>AI 團隊真正需要的是 rollback culture，像 SRE 訓練 outage 那樣訓練 reversals。不是因為你預期每週都會出大事，而是因為你承受不起第一次出事就手忙腳亂。\u003C\u002Fp>\u003Cp>我寧可跟一個能乾淨下線模型的團隊\u003Ca href=\"\u002Fnews\u002Fopenai-partner-network-delivery-strategy-zh\">合作\u003C\u002Fa>，也不要跟一個只會說「我們從沒需要關過」的團隊合作。前者知道風險，後者只是運氣還沒用完。\u003C\u002Fp>\u003Cp>實操寫法：把 rollback 能力列進「算不算真的上線」的標準裡。\u003C\u002Fp>\u003Cul>\u003Cli>10 分鐘內能不能停掉。\u003C\u002Fli>\u003Cli>停掉後誰會自動收到通知。\u003C\u002Fli>\u003Cli>怎麼驗證真的沒流量了。\u003C\u002Fli>\u003Cli>使用者失敗時要怎麼說。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這些問題答不出來，就別急著說你已經把 AI 產品做好了。你只是把風險先放上線而已。\u003C\u002Fp>\u003Ch2>可抄的模板\u003C\u002Fh2>\u003Cpre>\u003Ccode># AI takedown and rollback runbook（可直接改成你公司版本）\n\n## 觸發條件\n當以下任一情況發生，就啟動這份 runbook：\n- 監管、法務、平台方或高層要求下線\n- 安全審查判定不能繼續運作\n- 發生重大事故，需要立即停用模型或功能\n- 合作夥伴要求暫停服務\n\n## 角色分工\n- Incident Commander：負責決策與時間線\n- Engineering Lead：負責停用與驗證\n- Legal Lead：確認外部義務與限制\n- Comms Lead：負責內外部公告\n- Support Lead：處理客戶問題與回報\n\n## 立即動作\n1. 凍結所有新版本發布\n2. 透過 feature flag 關閉模型路由\n3. 確認 API 不再打到模型\n4. 保留 logs、metrics、trace\n5. 通知內部利害關係人\n\n## 驗證清單\n- [ ] 前端已關閉\n- [ ] API 已關閉\n- [ ] background jobs 已暫停\n- [ ] cache 已檢查\n- [ ] 監控顯示零 live traffic\n- [ ] support 與 sales 已收到最新狀態\n\n## 對外說法模板\n內部：\n- 發生了什麼：\n- 已關閉什麼：\n- 誰負責下一次更新：\n- 下一次更新時間：\n\n客戶：\n- 我們已暫停 [功能\u002F模型]，因為正在處理 [問題]\n- 期間請預期部分請求失敗或暫時不可用\n- 下一次更新時間：[時間]\n\n## 恢復條件\n只有在以下條件都成立時才恢復：\n- 法務已確認可以恢復\n- 工程已驗證修正有效\n- 產品已確認使用者影響範圍\n- Comms 已準備好更新公告\n\n## 事後檢討\n- 這次是什麼觸發下線？\n- 停用花了多久？\n- 哪一步最卡？\n- 哪些動作應該自動化？\n- 哪些 owner 一開始不夠清楚？\u003C\u002Fcode>\u003C\u002Fpre>\u003Cp>你可以直接複製這份，再把括號裡的通用字眼換成你自己的系統名稱和責任人。重點不是寫得漂亮，是讓你真的能在壓力來的時候，照著做。\u003C\u002Fp>\u003Cp>來源說明：我主要根據 \u003Ca href=\"https:\u002F\u002Fwww.nytimes.com\u002F2026\u002F06\u002F17\u002Ftechnology\u002Fanthropic-trump-administration-fable.html\">The New York Times\u003C\u002Fa> 的報導和 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002F\">Anthropic\u003C\u002Fa> 公開網站整理。上面這份 runbook、拆解和實操建議，都是我自己的延伸整理，不是原文照抄。\u003C\u002Fp>","我把 Anthropic 的 90 分鐘下線事件拆成 AI 事故應對模板，重點放在 rollback、溝通與權責分工。","www.nytimes.com","https:\u002F\u002Fwww.nytimes.com\u002F2026\u002F06\u002F17\u002Ftechnology\u002Fanthropic-trump-administration-fable.html",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781759004216-23ns.png","industry","zh","8d054c0f-5009-487a-91d9-8e364934b572",[17,18,19,20,21],"AI ops","incident response","rollback","runbook","feature flag",[23,24,25],"AI 產品要把下線流程當成和上線一樣重要的正式流程。","沒有 kill switch 和清楚權責的系統，遇到外部壓力就只剩混亂。","最好先準備好對內、對客戶、對監管的三種溝通模板。",0,"2026-06-18T05:02:57.07178+00:00","2026-06-18T05:02:57.057+00:00","caa87b65-9bbc-46fe-bba8-4f4158dd2d8b",{"tags":31,"relatedLang":32,"relatedPosts":36},[],{"id":15,"slug":33,"title":34,"language":35},"90-minute-takedown-turns-ai-ops-into-crisis-en","A 90-minute takedown turns AI ops into crisis","en",[37,43,49,55,61,67],{"id":38,"slug":39,"title":40,"cover_image":41,"image_url":41,"created_at":42,"category":13},"37c59cf0-5ad7-41c9-9edb-9228491d42a8","kubernetes-release-support-windows-explained-zh","Kubernetes 3 個支援窗口看懂升級時機","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781768878686-s1g2.png","2026-06-18T07:47:24.382267+00:00",{"id":44,"slug":45,"title":46,"cover_image":47,"image_url":47,"created_at":48,"category":13},"a9ba8f03-c03c-4302-a36d-4ebdb20202f2","gpt-56-fix-and-upgrade-release-zh","GPT-5.6 可能先修再升級，5 個變化先看","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781756273476-5m6b.png","2026-06-18T04:17:27.909445+00:00",{"id":50,"slug":51,"title":52,"cover_image":53,"image_url":53,"created_at":54,"category":13},"e654a80e-57ec-4690-8472-2259f23d0150","anthropic-paid-ai-monetization-path-zh","Anthropic 付費 AI 落地路徑","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781755369678-sep3.png","2026-06-18T04:02:25.602432+00:00",{"id":56,"slug":57,"title":58,"cover_image":59,"image_url":59,"created_at":60,"category":13},"db297e9e-d326-4005-8ca1-487a19c21ca6","github-hottest-repos-ai-agent-tools-zh","GitHub 熱門倉庫都在做 AI agent 工具","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781754478195-my4b.png","2026-06-18T03:47:22.438473+00:00",{"id":62,"slug":63,"title":64,"cover_image":65,"image_url":65,"created_at":66,"category":13},"0700f8ef-d447-41de-bfe4-52991d43746c","anthropic-fable-shows-ai-can-outsmart-constraints-zh","Anthropic Fable 露出 AI 會鑽漏洞","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781751777967-li5i.png","2026-06-18T03:02:33.373632+00:00",{"id":68,"slug":69,"title":70,"cover_image":71,"image_url":71,"created_at":72,"category":13},"2455fdb3-eaa3-475a-a1e7-1cd98a1c6128","5-ai-agent-papers-worth-tracking-zh","5 個值得追蹤的 AI agent 論文主題","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781744565308-wtdy.png","2026-06-18T01:02:21.448394+00:00",[74,79,84,89,94,99,104,109,114,119],{"id":75,"slug":76,"title":77,"created_at":78},"ee073da7-28b3-4752-a319-5a501459fb87","ai-in-2026-what-actually-matters-now-zh","2026 AI 真正重要的事","2026-03-26T07:09:12.008134+00:00",{"id":80,"slug":81,"title":82,"created_at":83},"83bd1795-8548-44c9-9a7e-de50a0923f71","trump-ai-framework-power-speech-state-preemption-zh","川普 AI 框架瞄準電力、言論與州權","2026-03-26T07:12:18.695466+00:00",{"id":85,"slug":86,"title":87,"created_at":88},"ea6be18b-c903-4e54-97b7-5f7447a612e0","nvidia-gtc-2026-big-ai-announcements-zh","NVIDIA GTC 2026 重點拆解","2026-03-26T07:14:26.62638+00:00",{"id":90,"slug":91,"title":92,"created_at":93},"4bcec76f-4c36-4daa-909f-54cd702f7c93","claude-users-spreading-out-and-getting-better-zh","Claude 用戶更分散，也更會用","2026-03-26T07:22:52.325888+00:00",{"id":95,"slug":96,"title":97,"created_at":98},"bd903b15-2473-4178-9789-b7557816e535","openclaw-raises-hard-question-for-ai-models-zh","OpenClaw 逼問 AI 模型價值","2026-03-26T07:24:54.707486+00:00",{"id":100,"slug":101,"title":102,"created_at":103},"eeac6b9e-ad9d-4831-8eec-8bba3f9bca6a","gap-google-gemini-checkout-fashion-search-zh","Gap 把結帳搬進 Gemini","2026-03-26T07:28:23.937768+00:00",{"id":105,"slug":106,"title":107,"created_at":108},"0740e53f-605d-4d57-8601-c10beb126f3c","google-pushes-gemini-transition-to-march-2026-zh","Google 把 Gemini 轉換延到 2026 年 3…","2026-03-26T07:30:12.825269+00:00",{"id":110,"slug":111,"title":112,"created_at":113},"e660d801-2421-4529-8fa9-86b82b066990","metas-llama-4-benchmark-scandal-gets-worse-zh","Meta Llama 4 分數風波又擴大","2026-03-26T07:34:21.156421+00:00",{"id":115,"slug":116,"title":117,"created_at":118},"183f9e7c-e143-40bb-a6d5-67ba84a3a8bc","accenture-mistral-ai-sovereign-enterprise-deal-zh","Accenture 攜手 Mistral AI 賣主權 AI","2026-03-26T07:38:14.818906+00:00",{"id":120,"slug":121,"title":122,"created_at":123},"191d9b1b-768a-478c-978c-dd7431a38149","mistral-ai-faces-its-hardest-year-yet-zh","Mistral AI 迎來最硬的一年","2026-03-26T07:40:23.716374+00:00"]