使用自定义数据集运行出错 #21

lllllcccccyyyyy · 2024-04-14T09:25:24Z

我将自己的数据集处理成代码要求的格式并确保所有的token序列长度小于512，使用chinese-roberta-wwm-ext作为预训练模型，参数和genia数据集相同，出现如下错误

显示是data/padder.py文件下的 buffer[i, :len(f), :len(f)] = torch.from_numpy(f)出现错误
非常期待您的回复，谢谢

yhcc · 2024-05-20T02:13:44Z

看起来是由于那个f数据太长了，没有被截取成512长度的哇

wind1312 · 2024-07-02T14:01:38Z

我将自己的数据集处理成代码要求的格式并确保所有的token序列长度小于512，使用chinese-roberta-wwm-ext作为预训练模型，参数和genia数据集相同，出现如下错误显示是data/padder.py文件下的 buffer[i, :len(f), :len(f)] = torch.from_numpy(f)出现错误非常期待您的回复，谢谢

请问你自己的数据集是中文的吗，可以告知怎么处理的吗

houyuchao · 2024-07-15T08:12:33Z

我将自己的数据集处理成代码要求的格式并确保所有的token序列长度小于512，使用chinese-roberta-wwm-ext作为预训练模型，参数和genia数据集相同，出现如下错误显示是data/padder.py文件下的 buffer[i, :len(f), :len(f)] = torch.from_numpy(f)出现错误非常期待您的回复，谢谢

请问你自己的数据集是中文的吗，可以告知怎么处理的吗

同问中文数据集怎么处理呢？？

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

使用自定义数据集运行出错 #21

使用自定义数据集运行出错 #21

lllllcccccyyyyy commented Apr 14, 2024

yhcc commented May 20, 2024

wind1312 commented Jul 2, 2024

houyuchao commented Jul 15, 2024

使用自定义数据集运行出错 #21

使用自定义数据集运行出错 #21

Comments

lllllcccccyyyyy commented Apr 14, 2024

yhcc commented May 20, 2024

wind1312 commented Jul 2, 2024

houyuchao commented Jul 15, 2024