標籤
vector database
向量資料庫是 RAG、語意搜尋與 AI agent 記憶的核心基礎,負責把嵌入向量做高效檢索與相似度比對。這個主題會涵蓋 Qdrant、Milvus、Weaviate 等選型,以及延遲、規模、混合搜尋、成本與部署取捨。
16 篇文章

Zilliz 把向量搜尋收進單一 AI 資料層
4 個重點看懂 Zilliz Vector Lakebase:它把向量搜尋、儲存與分析整合進單一平台,也補上 Zilliz Cloud、Milvus 的定位差異。

Ricoh 下注 Weaviate 的 5 個訊號
4 個重點看 Ricoh 投資 Weaviate:文件資料如何變成 AI 可用資產、向量資料庫的企業價值,以及這筆交易對日本市場的意義。

2026 向量資料庫讓你把 RAG 做穩
拆向量資料庫在 2026 的實戰位置,順手給你一份可直接套進專案的選型模板。

開源 RAG 堆疊把混亂變計畫
拆開七層開源 RAG 堆疊,從 ingestion 到 frontend,直接拿去做自己的 build plan。

Qdrant 讓 RAG 先過濾再找相似
我拆 Raunaq 的向量資料庫比較,整理出 filter-first RAG 的選型邏輯與可直接貼上的設計模板。

2026 系統設計面試一頁模板
一頁版 2026 系統設計面試速查表,整理核心概念、取捨、常見模式,外加可直接套用的回答模板。

向量資料庫盯上 IoT 時序市場
The Business Research Company 透過 openPR 發布快訊,將向量資料庫市場對準 IoT 時序工作負載,但原文未提供規模、成長率或廠商細節。

2026 向量資料庫怎麼選
這篇教你用規模、價格和架構三步篩選 2026 年的向量資料庫,做出可落地的 shortlist。

如何在正式環境加入 Temporal RAG
這篇教你在既有 RAG 中加入時間感知重排層,讓新版本、有效期間內的事件與最新資料優先被 LLM 使用。

為什麼 Pinecone 的編譯式向量工件才是 AI agents 的正解
Pinecone 的方向是對的:AI agents 需要先編譯好的知識工件,而不是每次即時翻找原始向量。

如何用 LangGraph 打造 Agentic RAG
這篇教你用 LangGraph 建立一個會路由、檢索、驗證並回答問題的 Agentic RAG 工作流。

為什麼 RAG 正在結束,agentic AI 需要的是編譯式知識層
RAG 不再適合作為 agentic AI 的預設架構,因為代理需要可重用、可驗證的編譯式知識層,而不是每一步都重新檢索原始文本。

5 步完成 RAG 管線
這篇教你用 5 個步驟做出 RAG 管線,讓模型先檢索你的文件,再根據內容產生有依據的答案。

為什麼 Qdrant Cloud 的企業化推進,對 AI 檢索很重要
Qdrant Cloud 把向量檢索做成企業級基礎設施,因為 AI 檢索真正需要的是速度、可用性與可稽核性,而不是只會跑 demo。

2026 RAG 向量資料庫三選一
2026 年做 RAG,Qdrant、Milvus、Weaviate 各有強項。這篇用延遲、規模、混合搜尋、成本與開發體驗,直接比較三者差異。

AI Agent 記憶怎麼設計
AI agent 要能跨任務保持狀態,記憶設計就很重要。本文拆解短期、長期與外部記憶,並比較框架、資料庫與向量檢索的取捨。