xxlarge模型微调时训不动 #152

bestbzw · 2020-12-01T04:34:15Z

同样的代码，用bert，robert都可以训练，但是用albert_xxlarge时，loss却不下降。请问是要在训练的时候设置什么超参数吗？我加载模型时用的是AutoModel.from_pretrained, 加载tokenizer的时候用的BertTokenizer.from_pretrained.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

xxlarge模型微调时训不动 #152

xxlarge模型微调时训不动 #152

bestbzw commented Dec 1, 2020

xxlarge模型微调时训不动 #152

xxlarge模型微调时训不动 #152

Comments

bestbzw commented Dec 1, 2020