[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-ocr-4-turns-pdfs-into-cited-rag-input-zh":3,"article-related-ocr-4-turns-pdfs-into-cited-rag-input-zh":30,"series-tools-42fe01d4-37e4-44d0-811c-119a991c9069":75},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":22,"views":26,"created_at":27,"published_at":28,"topic_cluster_id":29},"42fe01d4-37e4-44d0-811c-119a991c9069","ocr-4-turns-pdfs-into-cited-rag-input-zh","OCR 4 把 PDF 變成可引用 RAG 輸入","\u003Cp data-speakable=\"summary\">OCR 4 能把亂 PDF \u003Ca href=\"\u002Fnews\u002Fschwab-crypto-exposure-theme-list-zh\">變成\u003C\u002Fa>有引用來源、可\u003Ca href=\"\u002Fnews\u002F15-ai-newsletters-by-use-case-zh\">直接\u003C\u002Fa>丟進 \u003Ca href=\"\u002Ftag\u002Frag\">RAG\u003C\u002Fa> 的資料。\u003C\u002Fp>\u003Cp>我做文件管線做到現在，最煩的不是抽不出字，是抽出來之後整份資料像被攪爛。表格變成一坨、腳註亂飛、圖片順序不對，最後丟進搜尋或 RAG，模型還一臉正經地引用錯段落。你看起來像\u003Ca href=\"\u002Fnews\u002Fmistral-ocr-4-document-ai-structure-zh\">把文件\u003C\u002Fa>「處理完」了，實際上只是把問題換個地方放。我以前也很愛這種假進度，直到使用者開始拿截圖問我：你這答案到底從哪裡來的？\u003C\u002Fp>\u003Cp>這次讓我停下來看的，是 \u003Ca href=\"https:\u002F\u002Faibusiness.com\u002Fgenerative-ai\u002Fmistral-ai-tackles-unstructured-data-challenge-ocr-4\">AI Business\u003C\u002Fa> 寫的 Mistral OCR 4 文章，作者是 Esther Shittu。它不是在吹「OCR 更準」這種老梗，而是直接把重點放在文件理解、引用、結構保留，這些才是做 RAG、內部搜尋、文件助理時真的會痛到的地方。\u003C\u002Fp>\u003Ch2>OCR 不是重點，保住文件原貌才是\u003C\u002Fh2>\u003Cblockquote>“What OCR typically does is just pull stuff out… It does not really look at it and understand it. Whereas this is saying we understand it.”\u003C\u002Fblockquote>\u003Cp>這句是 \u003Ca href=\"https:\u002F\u002Fomdia.tech.informa.com\u002F\">Omdia\u003C\u002Fa> 分析師 Mark Beccue 講的，我覺得很準。傳統 OCR 的思路很土：先把字撈出來，其他再說。問題是文件不是純文字，它有閱讀順序、有欄位、有表格、有圖說、有註解。你一旦把這些打散，後面的模型再聰明也只能在碎紙堆裡找線索。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782469113477-4epx.png\" alt=\"OCR 4 把 PDF 變成可引用 RAG 輸入\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>翻譯一下就是：OCR 4 想做的不是「文字擷取」，而是「文件還原」。它要保留頁面結構，讓文字、圖片、表格照著原本的順序出現，而不是把整份 PDF 壓成一串平面字串。這差很多，真的差很多。因為 RAG 最怕的不是沒資料，是資料被你自己先弄亂。\u003C\u002Fp>\u003Cp>我以前做內部搜尋時踩過這個雷。掃描版政策文件看起來都正常，直到有人問一個需要同時看表格標頭和下面備註的問題。系統答得很自信，但內容完全對不上。不是 \u003Ca href=\"\u002Ftag\u002Fllm\">LLM\u003C\u002Fa> 笨，是我前面的 extraction layer 已經先把文件肢解了。\u003C\u002Fp>\u003Cp>實操上，我現在會先問三件事：閱讀順序有沒有保住、表格有沒有被拆碎、圖片和文字是不是還在同一個上下文裡。如果沒有，先不要談 embedding、不要談 rerank、也不要急著怪 prompt。你拿碎片給模型，它只能幫你編故事。\u003C\u002Fp>\u003Cul>\u003Cli>先檢查輸出是否保留 page order，而不是只看文字量。\u003C\u002Fli>\u003Cli>表格、註解、圖說要當成結構單位，不是附屬雜訊。\u003C\u002Fli>\u003Cli>抽樣測試一定要包含掃描件、雙欄版面、混合圖文頁。\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>Bounding box 不是花活，是你跟使用者交代得過去的證據\u003C\u002Fh2>\u003Cp>AI Business 文章提到 OCR 4 有 bounding boxes，能把文字定位、標示、畫框，讓你知道抽出的內容到底在原始文件哪裡。這聽起來很工程、很無聊，但我跟你說，真正上線後，這種無聊功能最值錢。因為使用者不想聽你講「模型說的」，他要的是「哪一頁、哪一塊、哪一行」。\u003C\u002Fp>\u003Cp>也就是說，bounding box 做的不是視覺裝飾，是可追溯性。你如果在合約、法遵、政策文件裡回答問題，沒有 source region，所謂 citation 很容易退化成「檔名 + 頁碼」這種半吊子東西。能看見來源位置，才有辦法讓人信，也才有辦法人工複核。\u003C\u002Fp>\u003Cp>我以前很愛偷懶，只存 chunk text 跟 page number。結果到最後 review UI 做不出來，因為使用者點了引用，只能跳到頁面，不能直接高亮那段證據。這種體驗很煩，煩到人會懷疑你到底有沒有真的做文件系統。後來我才學乖：沒有 bbox，就不要嘴硬說自己有 citation。\u003C\u002Fp>\u003Cp>實操寫法很簡單：每個 chunk 至少存四個欄位，text、page、bbox、source_uri。然後 UI 要能直接跳到那個區塊，不是只顯示一段摘要。你甚至可以把 bbox 當成審核流程的核心資料，讓法務或營運直接看到答案是從哪裡抄出來的。\u003C\u002Fp>\u003Cul>\u003Cli>保留 bbox 的同時，也保留原始 PDF 或影像連結。\u003C\u002Fli>\u003Cli>讓引用可以點擊、定位、highlight，而不是只有文字片段。\u003C\u002Fli>\u003Cli>把 source provenance 當成資料模型的一部分，不是額外備註。\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>RAG 如果不懂版面，常常只是比較會亂講\u003C\u002Fh2>\u003Cp>文章裡說 OCR 4 是為了 retrieval-augmented generation 設計的。這句我認同。因為 RAG 的上限，常常不是 LLM 多強，而是你餵進去的 chunk 有多像原始文件。你如果先把版面弄壞，再把壞資料丟去做向量檢索，那後面再怎麼調參，也只是把錯誤包裝得比較漂亮。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782469113741-fhz9.png\" alt=\"OCR 4 把 PDF 變成可引用 RAG 輸入\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>翻譯一下就是：OCR 4 真正的價值，不是「能抽字」，而是它讓文件可以被檢索系統理解。它把文字、圖片、表格按原本順序交出來，等於幫你把 chunk 的品質拉回正軌。對企業文件來說，這超重要，因為資訊常常散在標題、表格、註解、圖說裡，少一塊就會歪掉。\u003C\u002Fp>\u003Cp>我看過太多團隊把心力花在 embedding model、reranker、prompt template，結果問題根本出在 chunking。表格標頭被切掉、圖說不見了、腳註獨立成一塊，retriever 當然抓不到真正有用的上下文。這不是模型問題，是你前處理把文件拆成垃圾。\u003C\u002Fp>\u003Cp>實操上，我會把流程切成四層：先抽取、再以語意區塊切 chunk、再索引、最後才回答。chunk 不要用純 \u003Ca href=\"\u002Ftag\u002Ftoken\">token\u003C\u002Fa> 數硬切，尤其表格和圖說要黏在一起。還有一個我很堅持的事：如果 chunk 沒有 provenance，就不要讓它進 RAG。沒有證據鏈的答案，後面一定會出事。\u003C\u002Fp>\u003Cp>如果你現在用 \u003Ca href=\"https:\u002F\u002Fwww.langchain.com\u002F\">LangChain\u003C\u002Fa> 或 \u003Ca href=\"https:\u002F\u002Fwww.llamaindex.ai\u002F\">LlamaIndex\u003C\u002Fa>，我會直接講白一點：loader 比 prompt 更重要。prompt 寫得再漂亮，前面的文件抽取如果爛，最後還是會得到一個很會講幹話的系統。\u003C\u002Fp>\u003Ch2>多語言支援不是加分項，是企業文件的基本盤\u003C\u002Fh2>\u003Cp>Mistral 說 OCR 4 支援 170 種語言、10 個語言群組。這數字我不會拿來當行銷話術看，我會把它當作產品定位。因為真實世界的企業文件從來不是單語系，尤其是跨國團隊、採購、法務、客服、技術手冊，常常一頁裡就混兩三種語言。\u003C\u002Fp>\u003Cp>也就是說，這不是「順便支援一下」，而是你要不要真的面對企業資料混亂現況的問題。只要 OCR 一碰到非拉丁字母、重音符號、雙語表單就爛掉，那你做的不是 enterprise tool，你做的是 demo tool。demo tool 很好看，但上線後會很吵。\u003C\u002Fp>\u003Cp>我之前看過一個很慘的 rollout。前期在單一區域測試都很順，結果一進到另一個辦公室，文件語言混雜、掃描品質又差，整條 pipeline 直接爆掉。最後救火的方法也沒什麼神秘，就是重新挑 extraction、重新驗證語言處理、重新做資料品質檢查。很無聊，但有效。\u003C\u002Fp>\u003Cp>實操寫法：不要只拿乾淨英文 PDF 測。你要把真實會進來的東西都丟進去，包含旋轉頁、低解析掃描、雙語頁、印章、手寫註記。你如果要做跨區域部署，最好一開始就把各地文件樣本都納進 \u003Ca href=\"\u002Ftag\u002Fbenchmark\">benchmark\u003C\u002Fa>，不然等正式上線才發現不行，會很痛。\u003C\u002Fp>\u003Cp>如果你要拿它跟 \u003Ca href=\"https:\u002F\u002Fcloud.google.com\u002Fdocument-ai\">Google Document AI\u003C\u002Fa> 或 \u003Ca href=\"https:\u002F\u002Fazure.microsoft.com\u002Fen-us\u002Fproducts\u002Fai-services\u002Fai-document-intelligence\">Azure AI Document Intelligence\u003C\u002Fa> 比，我建議不要只看準確率。你要看的是輸出能不能直接拿去做搜尋、引用、審核。那才是你真正要付錢買的東西。\u003C\u002Fp>\u003Ch2>速度很漂亮，但管線適配才是你每天會碰到的事\u003C\u002Fh2>\u003Cp>文章提到 OCR 4 在單一 GPU 上每分鐘可處理最多 2000 頁，還能透過 \u003Ca href=\"\u002Ftag\u002Fapi\">API\u003C\u002Fa> 和 Mistral Studio 使用。這數字很吸睛，我承認。但我做過幾輪系統後，現在看到吞吐量數字只會先冷靜一下，因為快不等於好用。你前面快，後面慢，整體還是卡。\u003C\u002Fp>\u003Cp>翻譯一下就是：Mistral 想把 OCR 4 同時做成批次處理和即時服務都能用的工具。這方向沒問題。大量歸檔時，速度可以省成本；做助理時，速度可以降延遲。但真正麻煩的通常不是 OCR 本身，而是後面那些補破網的工作：重試、格式修復、頁序修正、壞 chunk 清理。\u003C\u002Fp>\u003Cp>我以前有個系統，OCR 本身跑得飛快，結果最耗錢的是後處理。因為輸出格式不穩，工程師花一堆時間在 normalize、reconcile、repair。你看起來像在優化模型，其實是在幫垃圾資料打補丁。這種事做久了會很煩，因為你會發現瓶頸根本不在你以為的地方。\u003C\u002Fp>\u003Cp>實操上，我現在只看端到端 latency，不看單點 runtime。要把 file ingestion、OCR、chunking、embedding、indexing、retrieval、answer generation 全部算進去。只要 OCR 4 讓抽取快了，但把 cleanup 工作變更多，那就不算贏。\u003C\u002Fp>\u003Cp>文章也提到價格：API 是每 1000 頁 4 美元，Mistral Studio 的 Document AI 是每 1000 頁 5 美元。這種資訊很實用，因為你終於能拿來做 build vs buy 的粗估，不用只是憑感覺吵架。\u003C\u002Fp>\u003Ch2>開源搜尋能不能用，取決於文件層有沒有老實\u003C\u002Fh2>\u003Cp>文章說 OCR 4 整合進 \u003Ca href=\"https:\u002F\u002Fmistral.ai\u002Fnews\u002Fmistral-search\u002F\">Mistral Search toolkit\u003C\u002Fa>，這是 public preview 的開源可組合搜尋框架。這點我會特別注意，因為很多團隊做文件助理時，都是先有搜尋，再硬塞 OCR，最後整套東西的 citation 對不起來，答案也對不起來。\u003C\u002Fp>\u003Cp>也就是說，Mistral 想把 extraction 和 retrieval 綁得更緊。這是對的。你如果只把 OCR 當前處理，後面的搜尋層就很容易退化成「看起來很像智慧搜尋的 keyword index」。有些團隊會把這種東西包裝得很漂亮，但一問 citation 就露餡。\u003C\u002Fp>\u003Cp>我其實滿喜歡 composable 系統，但前提是每一層的 contract 要清楚。chunk 是什麼、page 怎麼對應、bbox 怎麼回跳、圖片和表格怎麼表示，這些要先定義好。你如果不先定義，之後就會在 Slack 裡面花三天吵「為什麼答案有引用但找不到原文」。\u003C\u002Fp>\u003Cp>實操寫法：先把 OCR 和 retrieval 的資料契約寫下來，然後整條 pipeline 都照這個契約走。不要今天 loader 這樣、明天 index 那樣、後天 UI 又自己發明一套。文件系統最怕的不是複雜，是每一層都自以為聰明。\u003C\u002Fp>\u003Cp>如果你要看更完整的官方脈絡，也可以一起對照 \u003Ca href=\"https:\u002F\u002Fmistral.ai\u002F\">Mistral AI\u003C\u002Fa> 的產品頁。我的習慣是 vendor docs 跟媒體報導一起看，因為前者常少講麻煩事，後者常幫你把工程細節拉回來。\u003C\u002Fp>\u003Ch2>可抄的模板\u003C\u002Fh2>\u003Cpre>\u003Ccode># OCR 4 風格的 RAG 文件管線模板（可直接改成你的專案版）\n\n## 目標\n把掃描 PDF、圖片、混合版面文件，轉成可引用、可檢索、可審核的 RAG 輸入。\n\n## 輸入\n- PDF \u002F 圖片 \u002F 掃描文件\n- 可選 metadata：source_system、document_id、language、owner、access_level\n\n## 抽取規則\n1. 保留閱讀順序。\n2. 文字、表格、公式、圖片要照文件原始順序輸出。\n3. 每個 extracted span 都要有 page number。\n4. 每個 extracted span 都要有 bounding box。\n5. 保留原始檔案參照，方便稽核與 review。\n\n## 建議輸出 schema\n{\n  \"document_id\": \"string\",\n  \"page\": 1,\n  \"block_id\": \"string\",\n  \"block_type\": \"text|table|equation|image|caption\",\n  \"text\": \"string\",\n  \"language\": \"string\",\n  \"bbox\": {\"x1\": 0, \"y1\": 0, \"x2\": 0, \"y2\": 0},\n  \"source_uri\": \"string\",\n  \"confidence\": 0.0\n}\n\n## Chunk 規則\n- 以語意區塊切 chunk，不要只看 token 數。\n- 表格列要跟表頭綁在一起。\n- 圖說要跟圖綁在一起。\n- 腳註不要脫離原始來源。\n- 每個 chunk 都要帶 provenance：page、bbox、source_uri。\n\n## Retrieval 規則\n- 先用語意相似度找候選。\n- 再用 page proximity 與 block_type 做 rerank。\n- 優先回傳有 source provenance 的 chunk。\n- citation 要能點回原始頁面區塊，不要只顯示 snippet。\n\n## 回答規則\n- 只能根據 retrieved chunks 回答。\n- 盡量直接引用原文 span。\n- 如果答案依賴表格或圖片，就顯示對應高亮區域。\n- 如果證據不夠，直接說不夠，不要硬掰。\n\n## 驗證清單\n- [ ] 閱讀順序有保住\n- [ ] 表格沒有被拆爛\n- [ ] 混合語言頁面可處理\n- [ ] bounding boxes 有存\n- [ ] citation 可回到 source region\n- [ ] 在髒掃描件上測過\n- [ ] 端到端 latency 有量\n\n## 給 assistant 的實用提示詞\n你正在根據抽取後的文件回答問題。\n只能使用提供的 chunks。\n每個事實都要附 page 與 source region。\n如果證據不完整，請明講缺了什麼。\n不要自己補附近文字沒講的內容。\n\n## 範例 chunk\n{\n  \"document_id\": \"policy-2026-04\",\n  \"page\": 12,\n  \"block_id\": \"p12-b3\",\n  \"block_type\": \"table\",\n  \"text\": \"Retention period: 7 years; Exceptions: legal hold\",\n  \"language\": \"en\",\n  \"bbox\": {\"x1\": 112, \"y1\": 404, \"x2\": 1450, \"y2\": 612},\n  \"source_uri\": \"s3:\u002F\u002Fdocs\u002Fpolicy-2026-04.pdf\",\n  \"confidence\": 0.97\n}\u003C\u002Fcode>\u003C\u002Fpre>\u003Cp>這段我會真的拿去改。它不花俏，但它逼你養成對的習慣：保留結構、保留來源、讓 citation 看得見。這才是 OCR 4 這類工具真正有價值的地方，不是單純「抽得更快」而已。\u003C\u002Fp>\u003Cp>如果是我明天要上線，我會先挑一批很髒的文件、一個明確的搜尋場景、再加一個 review UI。先別急著把整套系統做滿，先把文件弄老實。文件一旦老實，答案才有機會老實。剩下那些優化，慢慢來就好。\u003C\u002Fp>\u003Cp>來源我主要拆的是 \u003Ca href=\"https:\u002F\u002Faibusiness.com\u002Fgenerative-ai\u002Fmistral-ai-tackles-unstructured-data-challenge-ocr-4\">AI Business 這篇報導\u003C\u002Fa>，裡面的引用與產品資訊是原始素材；上面這套模板和實作建議則是我根據這些資訊整理出來的衍生版本。\u003C\u002Fp>","拆 Mistral OCR 4 怎麼把亂 PDF 變成有順序、可引用、適合 RAG 的輸入，連 bounding box、語言支援和模板都一起整理好。","aibusiness.com","https:\u002F\u002Faibusiness.com\u002Fgenerative-ai\u002Fmistral-ai-tackles-unstructured-data-challenge-ocr-4",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782469113477-4epx.png","tools","zh","e536577e-b10e-42f3-b0e8-2fb5f79a5c1f",[17,18,19,20,21],"OCR","RAG","bounding boxes","document AI","citation",[23,24,25],"OCR 的重點不是抽字，而是保住文件結構與閱讀順序。","bounding boxes 讓 citation 變成可追溯、可高亮的證據鏈。","RAG 的品質先看文件抽取與 chunking，不要先怪 prompt。",0,"2026-06-26T10:18:04.231073+00:00","2026-06-26T10:18:04.215+00:00","c3c88dd2-a940-438a-b359-0e5a24562273",{"tags":31,"relatedLang":34,"relatedPosts":38},[32],{"name":18,"slug":33},"rag",{"id":15,"slug":35,"title":36,"language":37},"ocr-4-turns-pdfs-into-cited-rag-input-en","OCR 4 turns PDFs into cited RAG input","en",[39,45,51,57,63,69],{"id":40,"slug":41,"title":42,"cover_image":43,"image_url":43,"created_at":44,"category":13},"c614316e-6910-49e8-83d1-da7e7c2c3e79","spec-kit-guided-ai-workflow-setup-zh","Spec Kit 把設定變成導引流程","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782505105249-9o62.png","2026-06-26T20:17:59.33633+00:00",{"id":46,"slug":47,"title":48,"cover_image":49,"image_url":49,"created_at":50,"category":13},"69cbfbfb-8532-4bd3-814b-559a260cdd4a","litefuse-agent-observability-single-binary-doris-zh","Litefuse 不是 Langfuse 的補丁，而是 Agent 可觀測的正…","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782500574117-ul0z.png","2026-06-26T19:02:21.266856+00:00",{"id":52,"slug":53,"title":54,"cover_image":55,"image_url":55,"created_at":56,"category":13},"4f42621b-c5ca-42ca-a567-c48e1cb34222","20-ai-coding-assistants-stripped-down-2026-zh","20 個 AI 寫碼助手，拆成可用清單","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782498806913-57hj.png","2026-06-26T18:32:53.614602+00:00",{"id":58,"slug":59,"title":60,"cover_image":61,"image_url":61,"created_at":62,"category":13},"0ca67afc-db75-48f7-8185-0a539685ce60","open-code-review-turns-ai-reviews-line-accurate-checks-zh","Open Code Review 把 AI 審查變準","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782490706378-ts02.png","2026-06-26T16:17:57.066004+00:00",{"id":64,"slug":65,"title":66,"cover_image":67,"image_url":67,"created_at":68,"category":13},"2d745abb-9cb8-4d94-b2a6-cb3558904f27","grok-imagine-1-5-turns-prompts-into-720p-video-zh","Grok Imagine 1.5把提示詞變720p短片","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782475410787-cu25.png","2026-06-26T12:03:02.703582+00:00",{"id":70,"slug":71,"title":72,"cover_image":73,"image_url":73,"created_at":74,"category":13},"f79f80f7-5632-4403-ad91-3e7b9e0a7282","ai-code-review-beating-human-teammates-zh","AI 程式碼審查正在壓過人類隊友","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782460982684-i0a9.png","2026-06-26T08:02:32.066092+00:00",[76,81,86,91,96,101,106,111,116,121],{"id":77,"slug":78,"title":79,"created_at":80},"855cd52f-6fab-46cc-a7c1-42195e8a0de4","surepath-real-time-mcp-policy-controls-zh","SurePath 推出即時 MCP 政策控管","2026-03-26T07:57:40.77233+00:00",{"id":82,"slug":83,"title":84,"created_at":85},"9b19ab54-edef-4dbd-9ce4-a51e4bae4ebb","mcp-in-2026-the-ai-tool-layer-teams-use-zh","2026 年 MCP：團隊真的在用的 AI 工具層","2026-03-26T08:01:46.589694+00:00",{"id":87,"slug":88,"title":89,"created_at":90},"af9c46c3-7a28-410b-9f04-32b3de30a68c","prompting-in-2026-what-actually-works-zh","2026 提示工程，真正有用的是什麼","2026-03-26T08:08:12.453028+00:00",{"id":92,"slug":93,"title":94,"created_at":95},"05553086-6ed0-4758-81fd-6cab24b575e0","garry-tan-open-sources-claude-code-toolkit-zh","Garry Tan 開源 Claude Code 工具包","2026-03-26T08:26:20.068737+00:00",{"id":97,"slug":98,"title":99,"created_at":100},"042a73a2-18a2-433d-9e8f-9802b9559aac","github-ai-projects-to-watch-in-2026-zh","2026 必看 20 個 GitHub AI 專案","2026-03-26T08:28:09.619964+00:00",{"id":102,"slug":103,"title":104,"created_at":105},"a5f94120-ac0d-4483-9a8b-63590071ac6a","claude-code-vs-cursor-2026-zh","Claude Code 與 Cursor 深度對比：202…","2026-03-26T13:27:14.279193+00:00",{"id":107,"slug":108,"title":109,"created_at":110},"0975afa1-e0c7-4130-a20d-d890eaed995e","practical-github-guide-learning-ml-2026-zh","2026 機器學習入門 GitHub 實用指南","2026-03-27T01:16:49.712576+00:00",{"id":112,"slug":113,"title":114,"created_at":115},"bfdb467a-290f-4a80-b3a9-6f081afb6dff","aiml-2026-student-ai-ml-lab-repo-review-zh","AIML-2026：像課綱的學生實驗 Repo","2026-03-27T01:21:51.467798+00:00",{"id":117,"slug":118,"title":119,"created_at":120},"80cabc3e-09fc-4ff5-8f07-b8d68f5ae545","ai-trending-github-repos-and-research-feeds-zh","AI Trending：把 AI 資源收成一張表","2026-03-27T01:31:35.262183+00:00",{"id":122,"slug":123,"title":124,"created_at":125},"3ce6e6e2-bac5-463e-9f8d-45caabcc61f7","awesome-ai-for-science-research-tools-map-zh","AI 科研工具清單，開始像地圖了","2026-03-27T01:46:50.521945+00:00"]