跳到主要内容

Embedding 最佳实践

模型选型

中文为主选 BGE、GTE 等
多语言选 M3、E5
云端快速接入选 OpenAI text-embedding-3
成本敏感选开源本地部署

提示与指令

BGE 查询时加 Represent this sentence for retrieval:
E5 等可能有类似指令，查阅模型文档
文档向量一般无需指令

维度与归一化

维度与向量库配置一致
检索前确认是否需 L2 归一化
相似度计算优先用点积（归一化后）或余弦

分块策略

与 RAG 分块策略配合
chunk 不宜过大，通常 256–512 token
适当 overlap 避免语义割裂

与 RAG 闭环

Embedding 质量直接影响 RAG 效果。结合 RAG 最佳实践、向量数据库做整体优化。

模型选型
提示与指令
维度与归一化
分块策略
与 RAG 闭环