Embedding 最佳实践
模型选型
- 中文为主选 BGE、GTE 等
- 多语言选 M3、E5
- 云端快速接入选 OpenAI text-embedding-3
- 成本敏感选开源本地部署
提示与指令
- BGE 查询时加
Represent this sentence for retrieval: - E5 等可能有类似指令,查阅模型文档
- 文档向量一般无需指令
维度与归一化
- 维度与向量库配置一致
- 检索前确认是否需 L2 归一化
- 相似度计算优先用点积(归一化后)或余弦
分块策略
- 与 RAG 分块策略配合
- chunk 不宜过大,通常 256–512 token
- 适当 overlap 避免语义割裂