需要至少一个NVIDIA 20系列或更高版本的GPU,并且具有超过12GB的显存。
git clone https://huggingface.co/openbmb/MiniCPM3-4B-GPTQ-Int4
-
获取MiniCPM模型权重
git clone https://huggingface.co/openbmb/MiniCPM3-4B
-
获取量化脚本
git clone https://github.com/OpenBMB/MiniCPM
-
安装AutoGPTQ分支 在这里,您将从我的fork分支获取代码。(已提交PR)
git clone https://github.com/LDLINGLINGLING/AutoGPTQ.git cd AutoGPTQ git checkout minicpm3 pip install -e .
-
开始量化
cd MiniCPM/quantize # 在以下命令中,将no_quant_model_path修改为保存MiniCPM3权重的位置,将quant_save_path修改为保存量化后模型的目录。 python gptq_quantize.py --pretrained_model_dir no_quant_model_path --quantized_model_dir quant_save_path --bits 4