Skatteetaten 證明公部門 AI 應該看成果,不是看噱頭
Skatteetaten 的成功說明,公部門 AI 的評價標準應該是可量化成果、治理能力與公共信任,而不是模型新不新。

Skatteetaten 的案例說明,公部門 AI 應該用成果、治理與信任來評價,而不是用新奇程度來打分。
Skatteetaten 拿下 Nordic DAIR 獎,重點不在它用了多少 AI,而在它把 AI 變成了可驗證的公共價值。它的稅務模型一年可帶來超過 30 億挪威克朗的價值,房地產銷售模型也能增加約 10 億挪威克朗,這種結果已經不是試驗,而是基礎設施。
第一個論點:公部門 AI 的第一標準是可見成果
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
Skatteetaten 最強的地方,不是它會不會講 AI 故事,而是它能把成果寫進財務與服務指標。扣除額與第二住宅模型每年超過 30 億挪威克朗的價值,房地產銷售模型再加上約 10 億挪威克朗,代表它不是在做示範專案,而是在改造稅務行政的產出結構。

這種成果也反映在民眾體驗上。數位報稅與退稅服務每年帶來超過 2 億挪威克朗效益,且自動化計算讓納稅人能在結算後數週內收到退款。對公部門來說,速度本身不是價值,準確、可預期、可追溯的速度才是價值。
更重要的是,這種成果是可比較的。若一個 AI 專案只能展示模型精度,卻說不出節省多少工時、減少多少錯誤、縮短多少處理時間,那它最多是技術展示。Skatteetaten 的案例剛好相反,因為它把 AI 放進了稅務、評估與申報流程之中,直接對公共財政與公民服務負責。
第二個論點:規模化靠治理,不靠宣傳
很多政府機構都會做 PoC,但很少能把模型穩定運行到日常流程裡。Skatteetaten 的關鍵做法,是把模型、現代化 IT 平台、治理架構與 MLOps 一起建起來,讓 AI 不只是單點工具,而是可維運的系統能力。這一點非常重要,因為公部門最難的不是訓練一個模型,而是長期維持數十個模型在法規、營運與聲譽壓力下正常工作。
它的汽車出口處理就是最好的例子。據報導,流程從 60 天、30 名承辦人,縮短到 6 小時、4 名員工,這不是小幅優化,而是流程重構。若沒有明確的權責設計、資料品質控制與持續監測,這種效率提升根本不可能落地。
和私部門相比,公部門更不能靠「先上再說」的文化。企業即使出錯,往往還能用商業損失修補;政府機關若出錯,損失的是合法性與公信力。Skatteetaten 的做法證明,治理不是創新的阻力,而是讓創新能被大規模採用的前提。
第三個論點:公部門 AI 的真正護城河是信任
稅務機關處理的是敏感資料與高風險決策,因此透明度比酷炫功能更重要。Skatteetaten 採用法律評估、正式 AI 政策、倫理委員會,以及對偏移、偏誤、魯棒性與可解釋性的持續監控,這表示它把風險當成設計輸入,而不是上線後才補救的問題。這種做法看似保守,實際上才是高風險公共服務的正確姿勢。

人類仍保留最終決策權,這點尤其關鍵。當系統影響的是退稅、估價或合規判定時,民眾需要知道判斷依據,也需要知道申訴入口在哪裡。若 AI 只追求自動化率,卻無法說清楚決策邏輯,那它提升的不是效率,而是系統性不信任。
這也是為什麼 Skatteetaten 的模式比許多「智慧政府」口號更有說服力。它沒有把責任交給模型,而是把模型放進可審核、可追蹤、可問責的行政流程。對公部門來說,真正的競爭力不是跑得最快,而是能在高標準下長期被信任。
反方可能怎麼說
最強的反對意見是:這是一個太特殊的案例。稅務機關有結構化資料、規則明確、KPI 清楚,而且財務回報能直接量化,所以它的成功不一定能外推到醫療、社福或地方政府。批評者還會說,效率提升很容易被拿來宣傳,但民眾是否真的理解自動化決策、是否還能有效挑戰結果,才是更難的問題。
這個質疑不是空穴來風,甚至應該被認真對待。不是每個公共領域都能像稅務一樣把成果換算成金額,也不是每個部門都能像 Skatteetaten 一樣快速整合資料與流程。若把它當成萬能模板,確實會誤導其他機關。
但這個批評只是否定了「照抄模型」,沒有否定「用成果評價公部門 AI」這個原則。Skatteetaten 證明的不是所有機關都能複製同樣的技術,而是所有機關都應該用可量化成果、嚴格治理與人類問責來驗證 AI。這三項標準才是可移植的核心,而不是某一個模型本身。
你能做什麼
如果你是工程師、PM 或創辦人,別再先講模型架構,先講你要改善哪個流程、節省多少時間、降低多少錯誤、由誰負責。把 AI 專案拆成單一工作流、單一指標、單一責任人,並在上線前就定義法遵、人工覆核與監控機制。只要你說不出成果、風險與問責,這就不是公共價值方案,只是一個原型。