will you support quantize the embedding layer and lm_head layer? #18

geqian-9192 · 2024-09-06T03:37:18Z

As current quantization can only support quantize attention and ffn layers in transformer block, can you support quantize the embedding layer and the last layer named lm_head?

RanchiZhao · 2024-09-14T02:01:48Z

+1

synxlin · 2024-11-08T02:29:22Z

Hi,
We currently do not have plan to support embedding layer and lm_head layer.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

will you support quantize the embedding layer and lm_head layer? #18

will you support quantize the embedding layer and lm_head layer? #18

geqian-9192 commented Sep 6, 2024

RanchiZhao commented Sep 14, 2024

synxlin commented Nov 8, 2024

will you support quantize the embedding layer and lm_head layer? #18

will you support quantize the embedding layer and lm_head layer? #18

Comments

geqian-9192 commented Sep 6, 2024

RanchiZhao commented Sep 14, 2024

synxlin commented Nov 8, 2024