LlamaIndex 最佳实践
数据加载
- 按类型选择合适连接器,避免重复加载
- 大文件先分块再索引,控制 chunk size 与 overlap
- 合理设置元数据,便于过滤与溯源
索引构建
- 向量索引适合语义检索,树索引适合层次化内容
- 按数据量选择内存索引或持久化到向量库
- 增量更新时使用
insert而非全量重建
检索策略
- 语义检索 + 关键词检索(Hybrid)可提高召回
- 使用 Reranker 提升 Top-K 精确度
- 根据问题复杂度选择简单检索或子问题分解
Embedding 选型
- 中文场景可选用 BGE、M3 等模型
- 维度与向量库、Embedding 服务保持一致
- 参考 Embedding 文档