跳到主要内容

GitHub 项目与资源

量化工具

项目说明链接
llama.cppGGUF 量化与 CPU 推理github.com/ggerganov/llama.cpp
AutoGPTQGPTQ 量化与推理github.com/AutoGPTQ/AutoGPTQ
AWQ激活感知权重量化github.com/mit-han-lab/awq
GPTQ-for-LLaMA早期 GPTQ 实现已被 AutoGPTQ 等替代
BitsAndBytes动态 8/4-bit 量化github.com/bitsandbytes-foundation/bitsandbytes

预量化模型

来源说明
TheBlokeHugging Face 上大量 GGUF、GPTQ、AWQ 模型
Ollama 模型库ollama.com 可拉取的预量化模型
Hugging Face搜索 awqgptqgguf 等标签

相关文档