Embedding 与语义检索入门

什么是 Embedding

Embedding（嵌入）是将文本、图片等数据转换为固定维度的数值向量的技术。语义相近的内容在向量空间中距离更近，从而支持基于相似度的检索、聚类与推荐。

在 RAG、向量数据库、语义搜索中，Embedding 是连接「原始数据」与「向量空间」的核心环节。

向量长度，常见有 384、768、1024、1536 等。维度越高通常表达力越强，但存储与计算成本增加。

将向量归一化到单位长度，相似度计算可用点积代替余弦相似度，计算更高效。

文档 → 分块 → Embedding → 向量存储 → 检索
查询 → Embedding → 向量相似度搜索 → Top-K → 上下文 → LLM 生成

与 RAG、向量数据库形成完整链路。

想全面了解模型选型、维度选择、归一化与 BGE/M3 等实践？请查看 Embedding 深度解析。