-
Notifications
You must be signed in to change notification settings - Fork 44
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
训练效果和公开模型差异问题 #24
Comments
数据合成的脚本没有什么特别的地方,如果想要达到比较好的泛化性的话,需要使用比较大的数据量,这个比较关键。另外 batch size 以及 每条样本的长度 对训练效果也有一定影响,我一般使用小batch(例如4、8)以及使用较长的音频片段(例如 8 s)来训练。希望对你有借鉴作用。 |
非常感谢您的耐心解答,我再摸索摸索! |
作者你好,请问是对所有人声数据添加混响,还是设置了比例,若存在一个比例,是否方便告知 |
@hulucky1102 对所有人声数据都添加了混响 |
作者您好,感谢分享 |
@lhbing-ai 我使用的设置是“语音+噪声”合成,但是一段语音中一般都会含有静默片段,所以你所说的纯噪声片段已经隐含在其中了 |
我也是这样合成的,语音+噪声,按语音/噪声 随机信噪比(-10,20)合成噪声,但训练的模型对于静默片段时的噪声以及部分瞬态噪声总是过滤不干净,尤其“鼓掌”、“敲桌子”、“跺脚”、“订书机”这类瞬态噪声,有什么解决办法吗 |
你好,非常感谢你开源的模型,模型里面借鉴的东西也很多!在复现你的模型,除了训练数据制作方面有些差异外,其他都一样,但是出来的效果和你公开模型跑出来效果差异还挺大的,请问数据合成这块脚本可否提供借鉴,非常感谢!邮箱:[email protected]
The text was updated successfully, but these errors were encountered: