跳到主要内容

LlamaIndex 最佳实践

数据加载

  • 按类型选择合适连接器,避免重复加载
  • 大文件先分块再索引,控制 chunk size 与 overlap
  • 合理设置元数据,便于过滤与溯源

索引构建

  • 向量索引适合语义检索,树索引适合层次化内容
  • 按数据量选择内存索引或持久化到向量库
  • 增量更新时使用 insert 而非全量重建

检索策略

  • 语义检索 + 关键词检索(Hybrid)可提高召回
  • 使用 Reranker 提升 Top-K 精确度
  • 根据问题复杂度选择简单检索或子问题分解

Embedding 选型

  • 中文场景可选用 BGE、M3 等模型
  • 维度与向量库、Embedding 服务保持一致
  • 参考 Embedding 文档

与 RAG 闭环

LlamaIndex + Embedding + 向量数据库 + RAG 最佳实践 可构成完整知识库方案。