標籤
向量資料庫
向量資料庫用來儲存與檢索高維嵌入,常見於 RAG、語意搜尋與推薦系統。這個主題會關注索引結構、混合搜尋、延遲、召回率、擴充性與成本,也會比較 Qdrant、Milvus、Weaviate、Rust 系方案等實作差異。
13 篇文章

2026 向量資料庫對比:10 款怎麼選
這篇比較 Pinecone、Weaviate、Qdrant、Milvus、pgvector、Vespa、Redis、Elasticsearch 與 LanceDB,幫你依照成本、規模、延遲與維運難度選出適合 2026 的向量資料庫。

Zvec 把本地向量搜尋變成函式庫
我把 Zvec 拆成一套可直接抄的本地向量搜尋做法:把檢索塞回應用程式、把混合搜尋和全文檢索放進同一個引擎。

Vector Lakebase 把 Milvus 變成 AI 資料平台
5 種能力看 Zilliz Vector Lakebase 如何把即時服務、探索與批次分析整合到同一個 AI 資料底座。

GitHub 49 星 RAG 生產清單
GitHub 上一份 49 星的 RAG 生產清單,把工具、評測、可觀測性與部署選項整理成實戰地圖,方便團隊選型。

為什麼 RAG 比 Prompting 更適合私有資料
RAG 才是回答私有、常變資料的正確架構,因為它把知識放在檢索層,而不是賭模型記得住。

8 步驟打造可上線的 LangChain RAG
這篇教你用 LangChain、向量資料庫、LangSmith 與 FastAPI,從文件匯入一路做到可部署、可追蹤、可維運的生產級 RAG。

Qdrant 為 AI 應用加上向量搜尋
Qdrant 是用 Rust 寫的向量資料庫,主打語意搜尋、混合檢索、雲端與邊緣部署,適合 AI 應用做資料查找。

AWS 怎麼看向量資料庫
AWS 這篇在講向量資料庫怎麼存 embeddings、怎麼做相似度搜尋,以及為什麼 Bedrock 常搭配 OpenSearch Service。

Oracle:AI 不必再加一個資料庫
InfoWorld 指出,多數企業 AI 應直接在既有資料庫做向量檢索,而不是再建一套向量庫。

RAG 是什麼?白話看懂
RAG 讓 LLM 先查文件再回答,能減少幻覺、補上引用,也更適合企業知識庫與即時資料。

2026 RAG 向量資料庫三選一
2026 年做 RAG,Qdrant、Milvus、Weaviate 各有強項。這篇用延遲、規模、混合搜尋、成本與開發體驗,直接比較三者差異。

IBM 單機塞進 1000 億向量
IBM 宣稱 CAS 原型在單一伺服器上索引 1000 億向量,平均延遲 694 毫秒、召回率超過 90%。這篇拆解它怎麼做、跟一般向量資料庫差在哪、以及對企業 RAG 架構的影響。

FerresDB 走向正式上線的 Rust 搜尋
FerresDB 新增 PolarQuant、HNSW 自動調參、PITR、reranking 與 Raft 分散式儲存,開始像一套可上線的 Rust 向量資料庫。