返回首頁

標籤

RAG

RAG(Retrieval-Augmented Generation)把檢索與生成接在一起,讓模型先找資料再回答,常見於企業知識庫、語意搜尋、客服與研究助理。這裡聚焦向量資料庫、混合搜尋、索引與召回評估等實作議題。

33 篇文章

13 步建出 Milvus RAG 堆疊
工具應用/5月23日

13 步建出 Milvus RAG 堆疊

這篇操作指南教你用 Python、Docker、Milvus、LangChain 一步一步做出可查詢、可過濾、可延伸到正式環境的 RAG 堆疊。

Prompt engineering 讓模糊需求變可用輸出
工具應用/5月21日

Prompt engineering 讓模糊需求變可用輸出

我把 prompt engineering 拆成可直接抄的幾個寫法:怎麼寫約束、塞例子、控上下文,還有一份可貼進工作流的模板。

怎麼做 AI Agent 提示工程
AI Agent/5月19日

怎麼做 AI Agent 提示工程

這篇教你先定義 AI agent 的職責、系統規則、輸出格式與決策邊界,做出可測試的提示框架。

Oracle:AI 不必再加一個資料庫
產業動態/5月17日

Oracle:AI 不必再加一個資料庫

InfoWorld 指出,多數企業 AI 應直接在既有資料庫做向量檢索,而不是再建一套向量庫。

2026 向量資料庫怎麼選
工具應用/5月17日

2026 向量資料庫怎麼選

這篇教你用規模、價格和架構三步篩選 2026 年的向量資料庫,做出可落地的 shortlist。

如何在正式環境加入 Temporal RAG
AI Agent/5月13日

如何在正式環境加入 Temporal RAG

這篇教你在既有 RAG 中加入時間感知重排層,讓新版本、有效期間內的事件與最新資料優先被 LLM 使用。

如何用 LangGraph 打造 Agentic RAG
AI Agent/5月7日

如何用 LangGraph 打造 Agentic RAG

這篇教你用 LangGraph 建立一個會路由、檢索、驗證並回答問題的 Agentic RAG 工作流。

為什麼 RAG 正在結束,agentic AI 需要的是編譯式知識層
AI Agent/5月7日

為什麼 RAG 正在結束,agentic AI 需要的是編譯式知識層

RAG 不再適合作為 agentic AI 的預設架構,因為代理需要可重用、可驗證的編譯式知識層,而不是每一步都重新檢索原始文本。

為什麼 RAG 需要自癒層,而不只是更好的提示詞
技術研究/5月7日

為什麼 RAG 需要自癒層,而不只是更好的提示詞

RAG 應被視為會失敗的系統,真正該補的是即時自癒層,而不是繼續迷信提示詞調校。

為什麼開源 LLM 應該按工作負載來選,不該看熱度
技術研究/5月7日

為什麼開源 LLM 應該按工作負載來選,不該看熱度

2026 年選開源 LLM,應該先看工作負載是否匹配,而不是追逐排行榜與發布熱度。

RAG 是什麼?白話看懂
技術研究/5月7日

RAG 是什麼?白話看懂

RAG 讓 LLM 先查文件再回答,能減少幻覺、補上引用,也更適合企業知識庫與即時資料。

Paperless-AI:把文件庫變聊天機器人
工具應用/5月6日

Paperless-AI:把文件庫變聊天機器人

Paperless-AI 把 Paperless-ngx 變成可聊天的文件庫,結合 RAG、hybrid search、AI 標籤與自架部署,適合大量合約、發票與內部文件。

RAG 精準調校反而害檢索
技術研究/5月6日

RAG 精準調校反而害檢索

Redis 研究指出,RAG embedding 若只追求 precision,檢索準確率可能掉 40%,還會拖累 agentic pipeline。

Agentic AI 為何開始跳過 RAG
AI Agent/5月6日

Agentic AI 為何開始跳過 RAG

Agentic AI 正從 RAG 轉向預先編譯的知識層,重點是減少推理時重複讀資料、降 token 成本,讓多步驟代理更好控。

AWS Bedrock Knowledge Bases 怎麼簡化 RAG
工具應用/5月5日

AWS Bedrock Knowledge Bases 怎麼簡化 RAG

AWS Bedrock Knowledge Bases 把 RAG 的擷取、向量庫、重排序和引用整合成託管服務,適合要接企業內部資料的 AI 應用。

為什麼 Databricks 的 RAG 是平台戰,不是功能
產業動態/5月5日

為什麼 Databricks 的 RAG 是平台戰,不是功能

Databricks 把 RAG 當成端到端平台問題,這不是包裝,而是正確的產品判斷。

5 步完成 RAG 管線
AI Agent/5月5日

5 步完成 RAG 管線

這篇教你用 5 個步驟做出 RAG 管線,讓模型先檢索你的文件,再根據內容產生有依據的答案。

RAG 是什麼,為何重要
技術研究/5月5日

RAG 是什麼,為何重要

RAG 讓 LLM 先查外部可信資料再回答,能降低幻覺、更新更快,也更適合企業文件與權限控管。

Actian VectorAI DB 主打 22 倍搜尋速度
工具應用/5月5日

Actian VectorAI DB 主打 22 倍搜尋速度

Actian 推出 VectorAI DB,把向量搜尋塞進資料庫內,主打比常見方案快 22 倍,也想少掉外部向量服務的整合成本。

為什麼 2026 AI 工程師路線圖不是最佳起點
產業動態/5月4日

為什麼 2026 AI 工程師路線圖不是最佳起點

2026 AI 工程師路線圖太寬,適合當參考,不適合當第一份學習計畫。

為什麼 Qdrant Cloud 的企業化推進,對 AI 檢索很重要
工具應用/5月4日

為什麼 Qdrant Cloud 的企業化推進,對 AI 檢索很重要

Qdrant Cloud 把向量檢索做成企業級基礎設施,因為 AI 檢索真正需要的是速度、可用性與可稽核性,而不是只會跑 demo。

MathNet 把數學推理和檢索一起測
技術研究/4月21日

MathNet 把數學推理和檢索一起測

MathNet 用 30,676 題、47 國、17 語言的奧賽數學題,同時測推理、相似題檢索與 RAG 效果。

2026 RAG 向量資料庫三選一
工具應用/4月14日

2026 RAG 向量資料庫三選一

2026 年做 RAG,Qdrant、Milvus、Weaviate 各有強項。這篇用延遲、規模、混合搜尋、成本與開發體驗,直接比較三者差異。

Redis 向量搜尋快速上手
工具應用/4月14日

Redis 向量搜尋快速上手

Redis 不只拿來快取。這篇看它怎麼存 embeddings、建索引、跑 KNN 查詢,順手把語意搜尋和 RAG 的實作路徑講清楚。

IBM 單機塞進 1000 億向量
技術研究/4月14日

IBM 單機塞進 1000 億向量

IBM 宣稱 CAS 原型在單一伺服器上索引 1000 億向量,平均延遲 694 毫秒、召回率超過 90%。這篇拆解它怎麼做、跟一般向量資料庫差在哪、以及對企業 RAG 架構的影響。

開源 AI 專案清單怎麼挑
工具應用/4月12日

開源 AI 專案清單怎麼挑

這份 GitHub 清單收錄可直接上線的開源 AI 專案,從 PyTorch 到 vLLM 都有,2,486 顆星,適合想找模型、推理、RAG 和代理工具的工程師。

Windsurf Flow 怎麼讓上下文不斷線
工具應用/4月4日

Windsurf Flow 怎麼讓上下文不斷線

Windsurf Flow 用索引、記憶與規則維持 AI 上下文。本文拆解 Cascade、Tab、RAG 與 .windsurfrules 的運作方式,並比較它和其他 AI 寫碼工具的差異。

ChatGPT 廣告越來越一致
產業動態/4月3日

ChatGPT 廣告越來越一致

40,000 筆廣告版位分析顯示,ChatGPT 廣告正變得更短、更直白、更標準化。這反映 OpenAI 在優化轉換,也透露 LLM 使用習慣正在往任務導向收斂。

FerresDB 走向正式上線的 Rust 搜尋
工具應用/4月3日

FerresDB 走向正式上線的 Rust 搜尋

FerresDB 新增 PolarQuant、HNSW 自動調參、PITR、reranking 與 Raft 分散式儲存,開始像一套可上線的 Rust 向量資料庫。

OpenRAG 在企業 AI 的用途
工具應用/4月3日

OpenRAG 在企業 AI 的用途

IBM OpenRAG 把檢索、索引和模型協調包成一套。適合用公司內部資料做 RAG,讓回答更貼近文件,也更好追查來源。

Amazon Bedrock Agents 進入多代理工作流
AI Agent/4月1日

Amazon Bedrock Agents 進入多代理工作流

AWS 為 Amazon Bedrock Agents 加入記憶、程式執行與多代理協作,目標是處理更複雜的企業工作流。

2026 必看 20 個 GitHub AI 專案
工具應用/3月26日

2026 必看 20 個 GitHub AI 專案

OpenClaw 衝到約 30.2 萬 GitHub stars 很吸睛,但 2026 年更大的變化其實是另一件事:開源 AI 焦點正從聊天介面,轉向 agents、工作流程、RAG 與多模態工具。這份名單反映的,是 AI 正在變成可部署的軟體基礎層。

2026 年企業 AI 為何更靠 RAG
產業動態/3月26日

2026 年企業 AI 為何更靠 RAG

RAG 已從展示用技術走進企業預算。原因很直接:公司要的是能讀取最新內部資料、可追溯、可控權限的 AI,而不是只會背舊訓練資料的聊天模型。到了 2026 年,真正有用的重點在檢索品質、權限治理、即時資料連接與合規設計。