AutoGPTQ

设备要求

需要至少一个NVIDIA 20系列或更高版本的GPU，并且具有超过12GB的显存。

方法1：直接获取量化后的GPTQ权重（推荐）

git clone https://huggingface.co/openbmb/MiniCPM3-4B-GPTQ-Int4

方法2：自行量化（推荐在进行微调后使用）

获取MiniCPM模型权重

git clone https://huggingface.co/openbmb/MiniCPM3-4B

获取量化脚本

git clone https://github.com/OpenBMB/MiniCPM

安装AutoGPTQ分支 在这里，您将从我的fork分支获取代码。（已提交PR）

git clone https://github.com/LDLINGLINGLING/AutoGPTQ.git
cd AutoGPTQ
git checkout minicpm3
pip install -e .

开始量化

cd MiniCPM/quantize
# 在以下命令中，将no_quant_model_path修改为保存MiniCPM3权重的位置，将quant_save_path修改为保存量化后模型的目录。
python gptq_quantize.py --pretrained_model_dir no_quant_model_path --quantized_model_dir quant_save_path --bits 4

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

gptq.md

gptq.md

AutoGPTQ

设备要求

方法1：直接获取量化后的GPTQ权重（推荐）

方法2：自行量化（推荐在进行微调后使用）

Files

gptq.md

Latest commit

History

gptq.md

File metadata and controls

AutoGPTQ

设备要求

方法1：直接获取量化后的GPTQ权重（推荐）

方法2：自行量化（推荐在进行微调后使用）