目前我使用yolov9-t已经完成了500轮次的训练，但是模型还没有收敛。我想继续训练该模型，应该怎么做？ #600

ljwiii · 2024-10-09T03:13:52Z

I have completed 500 rounds of training using YOLOV9, but the model has not yet converged. What should I do to continue training the model?

wgqhandsome · 2024-10-23T08:34:26Z

500 轮还没收敛，你多大的数据集啊，上点训练中的一些图我们看看

ljwiii · 2024-10-23T08:36:45Z

500 轮还没收敛，你多大的数据集啊，上点训练中的一些图我们看看

朋友你会部署yolov9吗

wgqhandsome · 2024-10-23T08:41:20Z

部署是在训练好之后，先把模型训练好。如果你的模型训练这么久还没有收敛，你应该提供一些图，比如 loss P R 或者 map 等指标随着epoch 变化的图，然后分析是不是真的没有收敛，为什么没有收敛（比如超参数设置不合理，数据集有问题，训练的 epoch 不够等）。

ljwiii · 2024-10-23T08:45:09Z

部署是在训练好之后，先把模型训练好。如果你的模型训练这么久还没有收敛，你应该提供一些图，比如 loss P R 或者 map 等指标随着epoch 变化的图，然后分析是不是真的没有收敛，为什么没有收敛（比如超参数设置不合理，数据集有问题，训练的 epoch 不够等）。

好的，我不太清楚。是做毕设来了解的。而后我发现v9部署不了我转用v8的模型进行部署了。

wgqhandsome · 2024-10-23T08:52:05Z

损失还在下降，precision 依然在上升，可能你的学习设置得太小了，可以调大一点。
另外你知道，这个论文在正式的期刊上发表了吗？

wgqhandsome · 2024-10-23T08:53:41Z

还有一个问题我比较好奇，你用的什么gpu，能用轻松训练 500 轮？

ljwiii · 2024-10-23T08:54:27Z

损失还在下降，precision 依然在上升，可能你的学习设置得太小了，可以调大一点。
另外你知道，这个论文在正式的期刊上发表了吗？

不清楚这些，我的目的是想先训练模型做一个简单的系统的时候尝试了很多次。导师也没有和我说过什么。想尝试部署失败了，换成v8部署了。

ljwiii · 2024-10-23T08:56:08Z

还有一个问题我比较好奇，你用的什么gpu，能用轻松训练 500 轮？

笔记本3060 但是我的batch-size是6，我数据集2w张。之前csdn刷到人家4090才畅跑16批次的好像。

wgqhandsome · 2024-10-23T09:01:53Z

我是用的 4090 跑的，你这个配置应该要跑很长时间。没有收敛除了学习率设置过大，还有一个原因是你的数据集规模太大，可能本身也需要跑很久。

ljwiii · 2024-10-23T09:03:40Z

我是用的 4090 跑的，你这个配置应该要跑很长时间。没有收敛除了学习率设置过大，还有一个原因是你的数据集规模太大，可能本身也需要跑很久。

是的跑了好多天。然后我现在想不如先做系统和硬件再训练模型来的轻松。

Zhuqing11223 · 2024-11-21T14:32:29Z

请问是用train.py跑的吗，我用train.py跑一直报这个错误pred_distri, pred_scores = torch.cat([xi.view(feats[0].shape[0], self.no, -1) for xi in feats], 2).split(
RuntimeError: shape '[144, 144, -1]' is invalid for input of size 921600

ljwiii · 2024-11-21T14:46:56Z

请问是用train.py跑的吗，我用train.py跑一直报这个错误pred_distri, pred_scores = torch.cat([xi.view(feats[0].shape[0], self.no, -1) for xi in feats], 2).split(
RuntimeError: shape '[144, 144, -1]' is invalid for input of size 921600

你可以试一下csdn上面的帖子，我一开始就从里面学习的。没有遇到这种问题。好像是源代码有点东西需要修改。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

目前我使用yolov9-t已经完成了500轮次的训练，但是模型还没有收敛。我想继续训练该模型，应该怎么做？ #600

目前我使用yolov9-t已经完成了500轮次的训练，但是模型还没有收敛。我想继续训练该模型，应该怎么做？ #600

ljwiii commented Oct 9, 2024

wgqhandsome commented Oct 23, 2024

ljwiii commented Oct 23, 2024

wgqhandsome commented Oct 23, 2024

ljwiii commented Oct 23, 2024

wgqhandsome commented Oct 23, 2024

wgqhandsome commented Oct 23, 2024

ljwiii commented Oct 23, 2024

ljwiii commented Oct 23, 2024

wgqhandsome commented Oct 23, 2024

ljwiii commented Oct 23, 2024

Zhuqing11223 commented Nov 21, 2024

ljwiii commented Nov 21, 2024

目前我使用yolov9-t已经完成了500轮次的训练，但是模型还没有收敛。我想继续训练该模型，应该怎么做？ #600

目前我使用yolov9-t已经完成了500轮次的训练，但是模型还没有收敛。我想继续训练该模型，应该怎么做？ #600

Comments

ljwiii commented Oct 9, 2024

wgqhandsome commented Oct 23, 2024

ljwiii commented Oct 23, 2024

wgqhandsome commented Oct 23, 2024

ljwiii commented Oct 23, 2024

wgqhandsome commented Oct 23, 2024

wgqhandsome commented Oct 23, 2024

ljwiii commented Oct 23, 2024

ljwiii commented Oct 23, 2024

wgqhandsome commented Oct 23, 2024

ljwiii commented Oct 23, 2024

Zhuqing11223 commented Nov 21, 2024

ljwiii commented Nov 21, 2024