返回文章列表

工程系统 ·

向量数据库基础

梳理向量数据库在 RAG 系统中的作用,包括 embedding、索引、召回和元数据过滤。

Vector DB Embedding RAG

向量数据库做什么

向量数据库负责存储文本、图片或其他数据的向量表示,并根据相似度快速召回相关内容。在 RAG 系统中,它通常承担知识检索入口的角色。

常见概念

  • embedding:把文本映射到语义向量空间。
  • index:加速近似最近邻检索的数据结构。
  • top-k:控制召回候选数量。
  • metadata filter:按文档来源、章节、时间等字段过滤。

工程注意

向量数据库不是越复杂越好。早期项目可以先用 FAISS 或 Chroma 验证流程,再根据数据规模、权限控制和部署需求选择更完整的方案。