常见问题
工具选型
Q: LangSmith 和自建 OpenTelemetry 如何选?
A: LangChain 技术栈、希望快速上手选 LangSmith;需要完全私有化、对接已有监控选 OpenTelemetry。
Q: Trace 数据量大会影响性能吗?
A: 会。建议异步输出、采样(如 10%)、或仅记录慢请求与错误请求的完整 Trace。
成本
Q: 如何估算单次调用的 Token 数?
A: 多数 SDK 和 API 返回 usage 字段。若没有,可按字符数粗略估算(中文约 1.5–2 字符/Token,英文约 4 字符/Token)。
Q: 多租户成本如何分摊?
A: 在每次调用中记录 tenant_id,按 tenant 聚合 input_tokens、output_tokens,再乘以模型单价。