[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-qdrant-milvus-weaviate-rag-2026-comparison-zh":3,"article-related-qdrant-milvus-weaviate-rag-2026-comparison-zh":28,"series-tools-0ad0e45d-cb40-4267-bab8-d05ed973896a":85},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":11,"views":25,"created_at":26,"published_at":27,"topic_cluster_id":11},"0ad0e45d-cb40-4267-bab8-d05ed973896a","qdrant-milvus-weaviate-rag-2026-comparison-zh","2026 RAG 向量資料庫三選一","\u003Cp>2026 年做 RAG，向量資料庫早就不是看品牌。真正要看的是延遲、規模、查詢方式，還有你團隊願不願意養這套系統。\u003Ca href=\"https:\u002F\u002Fqdrant.tech\" target=\"_blank\" rel=\"noopener\">Qdrant\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fmilvus.io\" target=\"_blank\" rel=\"noopener\">Milvus\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fweaviate.io\" target=\"_blank\" rel=\"noopener\">Weaviate\u003C\u002Fa> 都很能打，但強項完全不同。\u003C\u002Fp>\u003Cp>講白了，RAG 最怕的不是 embedding 不準。最怕的是檢索慢、過濾難、資料一多就炸。你如果做客服聊天機器人，\u003Ca href=\"\u002Fnews\u002Fibm-100b-vector-database-single-server-zh\">100\u003C\u002Fa>ms 跟 300ms 的差距，使用者體感差很多。你如果做企業搜尋，查詢量一上來，架構選錯就會很痛。\u003C\u002Fp>\u003Cp>這篇不講空話。直接看三個產品怎麼選，哪個適合小團隊，哪個適合大規模，哪個適合混合搜尋。也順便把常見的部署成本和開發體驗攤開來看。\u003C\u002Fp>\u003Ch2>三者各自最擅長什麼\u003C\u002Fh2>\u003Cp>三個資料庫都在解同一題。就是把\u003Ca href=\"\u002Fnews\u002Fredis-vector-search-quick-start-guide-zh\">向量搜尋\u003C\u002Fa>做好。可是路線完全不同。\u003Ca href=\"https:\u002F\u002Fqdrant.tech\" target=\"_blank\" rel=\"noopener\">Qdrant\u003C\u002Fa> 主打低延遲和 payload filter。\u003Ca href=\"https:\u002F\u002Fmilvus.io\" target=\"_blank\" rel=\"noopener\">Milvus\u003C\u002Fa> 主打分散式擴展。\u003Ca href=\"https:\u002F\u002Fweaviate.io\" target=\"_blank\" rel=\"noopener\">Weaviate\u003C\u002Fa> 則是把向量搜尋和關鍵字搜尋放在同一條查詢路徑。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776126302600-xxf9.png\" alt=\"2026 RAG 向量資料庫三選一\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>如果你做的是 RAG，這個差異很重要。因為真實世界的查詢，常常不是純語意。使用者會打關鍵字、會輸入縮寫、會加時間條件、會指定部門。資料庫如果只會向量相似度，實戰就會卡住。\u003C\u002Fp>\u003Cp>Qdra\u003Ca href=\"\u002Fnews\u002Fuk-regulators-assess-anthropic-model-risks-zh\">nt\u003C\u002Fa> 用 Rust 寫，這點很討喜。它在記憶體使用和延遲穩定性上，通常表現很漂亮。Milvus 則是為叢集設計，適合資料量很大、節點很多的場景。Weaviate 的優勢是整合感強，團隊不用自己東拼西湊就能做 hybrid search。\u003C\u002Fp>\u003Cul>\u003Cli>\u003Cstrong>Qdrant：\u003C\u002Fstrong> Rust 架構，低延遲，filter 很強\u003C\u002Fli>\u003Cli>\u003Cstrong>Milvus：\u003C\u002Fstrong> 分散式架構，適合超大規模\u003C\u002Fli>\u003Cli>\u003Cstrong>Weaviate：\u003C\u002Fstrong> 混合搜尋強，API 直覺\u003C\u002Fli>\u003Cli>\u003Cstrong>共同點：\u003C\u002Fstrong> 都能做 RAG 檢索層\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>架構差異，決定你後面痛不痛\u003C\u002Fh2>\u003Cp>很多團隊一開始只看 demo。這很正常。可是 demo 跟上線是兩回事。\u003Ca href=\"https:\u002F\u002Fqdrant.tech\u002Fdocumentation\u002F\" target=\"_blank\" rel=\"noopener\">Qdrant 文件\u003C\u002Fa>會讓你很快上手，因為它的定位很清楚。就是向量搜尋加強力過濾。對中大型資料集來說，這種設計很實用。\u003C\u002Fp>\u003Cp>\u003Ca href=\"https:\u002F\u002Fmilvus.io\u002Fdocs\" target=\"_blank\" rel=\"noopener\">Milvus 文件\u003C\u002Fa>就完全是另一種風格。它很在意叢集、索引、節點分工、GPU 加速。你如果要撐到十億級向量，Milvus 的設計會比小型向量庫更對路。代價也很直接，就是維運複雜度高。\u003C\u002Fp>\u003Cp>\u003Ca href=\"https:\u002F\u002Fdocs.weaviate.io\" target=\"_blank\" rel=\"noopener\">Weaviate 文件\u003C\u002Fa>則偏向開發體驗。它把語意搜尋、關鍵字搜尋、資料模型整合得比較順。你可以少接幾個服務。對產品團隊來說，這通常代表少一點雜事，多一點時間做功能。\u003C\u002Fp>\u003Cblockquote>“The future is already here — it’s just not evenly distributed.” — William Gibson\u003C\u002Fblockquote>\u003Cp>這句話放在向量資料庫很貼切。技術都能用了。差別只在你要的是什麼。低延遲、超大規模、還是搜尋品質，三者很難一次全拿。\u003C\u002Fp>\u003Cp>我自己的看法很直接。你要穩定查詢和細緻過濾，先看 Qdrant。你要撐大資料量和高吞吐，先看 Milvus。你要混合搜尋，Weaviate 很順手。這不是信仰問題，是工程問題。\u003C\u002Fp>\u003Ch2>數字怎麼看，才不會被行銷話術帶走\u003C\u002Fh2>\u003Cp>看 benchmark 時，要先注意測試條件。不同廠商會用不同硬體、不同索引、不同 recall 設定。直接比數字，常常會誤判。不過，三者的方向還是很清楚。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776126298862-y2fu.png\" alt=\"2026 RAG 向量資料庫三選一\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>Qdrant 在公開資料裡，常見說法是 1 億向量、95% recall、延遲低於 100ms。Milvus 常被拿來展示 10 億級部署，QPS 可以到 100,000 以上，延遲低於 200ms。Weaviate 則常見在 5 億向量、92% recall、延遲約 150ms 的區間。\u003C\u002Fp>\u003Cp>這些數字的重點，不是誰最猛。重點是它們反映不同取捨。Qdrant 偏向低延遲和效率。Milvus 偏向極限吞吐和擴展。Weaviate 偏向搜尋品質和查詢彈性。你如果拿錯標準，選型就會歪掉。\u003C\u002Fp>\u003Cul>\u003Cli>\u003Cstrong>Qdrant：\u003C\u002Fstrong> 1 億向量，95% recall，低於 100ms\u003C\u002Fli>\u003Cli>\u003Cstrong>Milvus：\u003C\u002Fstrong> 10 億向量，100,000+ QPS，低於 200ms\u003C\u002Fli>\u003Cli>\u003Cstrong>Weaviate：\u003C\u002Fstrong> 5 億向量，92% recall，約 150ms\u003C\u002Fli>\u003Cli>\u003Cstrong>解讀方式：\u003C\u002Fstrong> 看你的瓶頸是延遲、吞吐，還是搜尋品質\u003C\u002Fli>\u003C\u002Ful>\u003Cp>硬體需求也很有參考價值。Qdrant 常見配置是 4 到 8 顆 CPU、8 到 16GB RAM、SSD。Milvus 則常看到 16 到 32 顆 CPU、32 到 64GB RAM、NVMe，還可能加 GPU。Weaviate 介於兩者之間，通常是 8 到 16 顆 CPU、16 到 32GB RAM、SSD。\u003C\u002Fp>\u003Cp>這代表什麼？代表 Milvus 的天花板最高，但你也要付出最多資源。Qdrant 最省心，單機或小叢集都好養。Weaviate 則在功能和成本之間，抓了一個中間值。\u003C\u002Fp>\u003Ch2>功能差異，才是開發者每天會碰到的事\u003C\u002Fh2>\u003Cp>功能面才是日常。因為你不是只在看向量。你還要看 tenant、文件類型、時間區間、權限。Qdrant 的 payload filtering 在這裡很有感。它讓你在檢索時直接加條件，不用繞一大圈。\u003C\u002Fp>\u003Cp>Milvus 的強項是索引選擇多。像 IVF、HNSW、SCANN 都能玩。這對想調 recall、速度、記憶體用量的團隊很重要。你可以根據資料分布和負載去調整，不會被單一路線綁死。\u003C\u002Fp>\u003Cp>Weaviate 的優勢則是混合搜尋。它把 BM25 和向量排序放一起，對搜尋產品很實際。使用者常常既想要精準詞，也想要語意相近。這種場景，單純向量搜尋往往不夠。\u003C\u002Fp>\u003Cul>\u003Cli>\u003Cstrong>Qdrant：\u003C\u002Fstrong> payload filter 強，適合多租戶和權限控制\u003C\u002Fli>\u003Cli>\u003Cstrong>Milvus：\u003C\u002Fstrong> 索引選擇多，適合調校型團隊\u003C\u002Fli>\u003Cli>\u003Cstrong>Weaviate：\u003C\u002Fstrong> hybrid search 直接整合\u003C\u002Fli>\u003Cli>\u003Cstrong>整合面：\u003C\u002Fstrong> Weaviate 對 ML 工具鏈比較友善\u003C\u002Fli>\u003C\u002Ful>\u003Cp>如果你團隊已經用 \u003Ca href=\"https:\u002F\u002Fhuggingface.co\" target=\"_blank\" rel=\"noopener\">Hugging Face\u003C\u002Fa>，Weaviate 會很順。它對多模態 embedding 也比較友善。你如果要做文字、圖片、音訊一起搜，這種整合會省很多工。\u003C\u002Fp>\u003Cp>成本也不能忽略。Qdrant 常常是每台機器效率最好。Milvus 雖然貴，但它買來的是容量和吞吐。Weaviate 的價值在於少接幾個元件，讓整體系統比較簡單。\u003C\u002Fp>\u003Ch2>產業背景，為什麼 2026 會這樣選\u003C\u002Fh2>\u003Cp>RAG 在 2026 年已經不是新玩具。它變成很多 AI 產品的標配。客服、知識庫、企業搜尋、推薦系統，都在用。問題也從「能不能做」變成「能不能穩定跑」。\u003C\u002Fp>\u003Cp>這也是為什麼向量資料庫會分化。早期大家都想做通用解法。現在不行了。你要的是低延遲、還是高吞吐、還是混合搜尋，答案會直接影響架構。資料庫選錯，後面就會一直補洞。\u003C\u002Fp>\u003Cp>另一個背景是資料治理。企業越來越在意 metadata、權限、租戶隔離。這讓 Qdrant 這類強 filter 的方案更有吸引力。反過來說，如果你的搜尋產品本來就很重 query relevance，Weaviate 的定位就更合理。\u003C\u002Fp>\u003Cp>還有一點很現實。很多團隊不是缺模型，是缺維運人力。你如果只有 2 到 3 個工程師，Milvus 的複雜度可能太重。你如果有成熟平台團隊，Milvus 的擴展性就很香。這就是選型的殘酷地方。\u003C\u002Fp>\u003Ch2>結論：先看瓶頸，再選資料庫\u003C\u002Fh2>\u003Cp>如果你要我一句話總結，我會這樣分。Qdrant 是速度和控制。Milvus 是規模和吞吐。Weaviate 是混合搜尋和整合體驗。這三個方向都合理，差別只在你的產品卡在哪裡。\u003C\u002Fp>\u003Cp>我的建議很直接。先拿你自己的資料做測試。看延遲、recall、filter 複雜度、部署成本。不要先信簡報。真實資料一跑，答案通常很快就出來。\u003C\u002Fp>\u003Cp>如果你的 RAG 服務要面對即時查詢，我會先試 Qdrant。 如果你的資料量已經往十億級走，我會優先看 Milvus。 如果你的產品需要語意加關鍵字一起搜，Weaviate 很值得先試。\u003C\u002Fp>\u003Cp>下一步最實際的做法，就是拿同一批 embeddings，跑三套原型。各自測 100、1,000、10,000 筆查詢。你會很快知道哪個最適合你的工作負載。這種答案，比任何型錄都準。\u003C\u002Fp>","2026 年做 RAG，Qdrant、Milvus、Weaviate 各有強項。這篇用延遲、規模、混合搜尋、成本與開發體驗，直接比較三者差異。","dasroot.net","https:\u002F\u002Fdasroot.net\u002Fposts\u002F2026\u002F04\u002Fvector-databases-rag-qdrant-milvus-weaviate-comparison-2026\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776126302600-xxf9.png","tools","zh","e8390502-7cb7-4bfa-878c-0d2685a39c2a",[17,18,19,20,21,22,23,24],"Qdrant","Milvus","Weaviate","RAG","vector database","hybrid search","向量資料庫","人工智慧",10,"2026-04-14T00:24:39.218956+00:00","2026-04-14T00:24:39.038+00:00",{"tags":29,"relatedLang":44,"relatedPosts":48},[30,32,33,35,37,39,41,42],{"name":20,"slug":31},"rag",{"name":24,"slug":24},{"name":22,"slug":34},"hybrid-search",{"name":17,"slug":36},"qdrant",{"name":21,"slug":38},"vector-database",{"name":18,"slug":40},"milvus",{"name":23,"slug":23},{"name":19,"slug":43},"weaviate",{"id":15,"slug":45,"title":46,"language":47},"qdrant-milvus-weaviate-rag-2026-comparison-en","Qdrant vs Milvus vs Weaviate for RAG in 2026","en",[49,55,61,67,73,79],{"id":50,"slug":51,"title":52,"cover_image":53,"image_url":53,"created_at":54,"category":13},"bef47dbc-b0b4-439e-bae9-abe9473a321c","wei-shen-me-tether-ba-ben-di-ai-ji-yi-tui-jin-ri-chang-zhuan-zh","為什麼 Tether 把本地 AI 記憶推進日常裝置是對的","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780542170805-opi6.png","2026-06-04T03:02:19.599329+00:00",{"id":56,"slug":57,"title":58,"cover_image":59,"image_url":59,"created_at":60,"category":13},"d3ec03a8-a805-4a21-9826-72a74a72b625","databricks-model-serving-llm-deploy-guide-zh","Databricks Model Serving 讓 LLM 部署變簡單","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780525998117-7ur8.png","2026-06-03T22:32:51.005996+00:00",{"id":62,"slug":63,"title":64,"cover_image":65,"image_url":65,"created_at":66,"category":13},"4dd225a8-bf6c-4768-a486-a27956c7033d","opencode-digitalocean-model-freedom-zh","OpenCode+DigitalOcean 讓你切換模型","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780525116428-1q7g.png","2026-06-03T22:18:06.969758+00:00",{"id":68,"slug":69,"title":70,"cover_image":71,"image_url":71,"created_at":72,"category":13},"4bdcf208-fb80-484e-b4b6-06af035a6df1","modulate-aws-voice-chats-into-signals-zh","Modulate 用 AWS 把語音聊天做成訊號","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780519733892-rxue.png","2026-06-03T20:48:22.697917+00:00",{"id":74,"slug":75,"title":76,"cover_image":77,"image_url":77,"created_at":78,"category":13},"f44a28d3-2305-43de-b5fa-21217d561054","amazon-rekognition-content-moderation-filter-zh","Amazon Rekognition把審核變成過濾器","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780517005409-bxfc.png","2026-06-03T20:02:57.634353+00:00",{"id":80,"slug":81,"title":82,"cover_image":83,"image_url":83,"created_at":84,"category":13},"80f6f40b-3217-45e4-acff-7b2f6d261779","codex-workspace-limits-tell-you-why-zh","Codex 讓工作區限額錯誤說人話","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780514293711-ltqa.png","2026-06-03T19:17:41.340056+00:00",[86,91,96,101,106,111,116,121,126,131],{"id":87,"slug":88,"title":89,"created_at":90},"855cd52f-6fab-46cc-a7c1-42195e8a0de4","surepath-real-time-mcp-policy-controls-zh","SurePath 推出即時 MCP 政策控管","2026-03-26T07:57:40.77233+00:00",{"id":92,"slug":93,"title":94,"created_at":95},"9b19ab54-edef-4dbd-9ce4-a51e4bae4ebb","mcp-in-2026-the-ai-tool-layer-teams-use-zh","2026 年 MCP：團隊真的在用的 AI 工具層","2026-03-26T08:01:46.589694+00:00",{"id":97,"slug":98,"title":99,"created_at":100},"af9c46c3-7a28-410b-9f04-32b3de30a68c","prompting-in-2026-what-actually-works-zh","2026 提示工程，真正有用的是什麼","2026-03-26T08:08:12.453028+00:00",{"id":102,"slug":103,"title":104,"created_at":105},"05553086-6ed0-4758-81fd-6cab24b575e0","garry-tan-open-sources-claude-code-toolkit-zh","Garry Tan 開源 Claude Code 工具包","2026-03-26T08:26:20.068737+00:00",{"id":107,"slug":108,"title":109,"created_at":110},"042a73a2-18a2-433d-9e8f-9802b9559aac","github-ai-projects-to-watch-in-2026-zh","2026 必看 20 個 GitHub AI 專案","2026-03-26T08:28:09.619964+00:00",{"id":112,"slug":113,"title":114,"created_at":115},"a5f94120-ac0d-4483-9a8b-63590071ac6a","claude-code-vs-cursor-2026-zh","Claude Code 與 Cursor 深度對比：202…","2026-03-26T13:27:14.279193+00:00",{"id":117,"slug":118,"title":119,"created_at":120},"0975afa1-e0c7-4130-a20d-d890eaed995e","practical-github-guide-learning-ml-2026-zh","2026 機器學習入門 GitHub 實用指南","2026-03-27T01:16:49.712576+00:00",{"id":122,"slug":123,"title":124,"created_at":125},"bfdb467a-290f-4a80-b3a9-6f081afb6dff","aiml-2026-student-ai-ml-lab-repo-review-zh","AIML-2026：像課綱的學生實驗 Repo","2026-03-27T01:21:51.467798+00:00",{"id":127,"slug":128,"title":129,"created_at":130},"80cabc3e-09fc-4ff5-8f07-b8d68f5ae545","ai-trending-github-repos-and-research-feeds-zh","AI Trending：把 AI 資源收成一張表","2026-03-27T01:31:35.262183+00:00",{"id":132,"slug":133,"title":134,"created_at":135},"3ce6e6e2-bac5-463e-9f8d-45caabcc61f7","awesome-ai-for-science-research-tools-map-zh","AI 科研工具清單，開始像地圖了","2026-03-27T01:46:50.521945+00:00"]