跳到主要内容

Embedding 最佳实践

模型选型

  • 中文为主选 BGE、GTE 等
  • 多语言选 M3、E5
  • 云端快速接入选 OpenAI text-embedding-3
  • 成本敏感选开源本地部署

提示与指令

  • BGE 查询时加 Represent this sentence for retrieval:
  • E5 等可能有类似指令,查阅模型文档
  • 文档向量一般无需指令

维度与归一化

  • 维度与向量库配置一致
  • 检索前确认是否需 L2 归一化
  • 相似度计算优先用点积(归一化后)或余弦

分块策略

  • 与 RAG 分块策略配合
  • chunk 不宜过大,通常 256–512 token
  • 适当 overlap 避免语义割裂

与 RAG 闭环

Embedding 质量直接影响 RAG 效果。结合 RAG 最佳实践向量数据库 做整体优化。