DDPG #1

MayeZhang · 2020-05-08T07:36:18Z

肖大神您好，我最近在做毕业设计用的您的DDPG代码，环境改成了我们专业的通信的场景。但是我发现reward已经没有那种抖动上升的趋势了，非常困惑，分析了一圈感觉是critic_evaluate_net这个网络效果不好，没有得出理想的loss_tensor，这之后应该又对actor_evaluate_net的更新有了影响，所以后面得到的action并不好。有时候还会卡在动作取值的边界，请问您有啥好的办法没啊？非常感谢！

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

DDPG #1

DDPG #1

MayeZhang commented May 8, 2020

DDPG #1

DDPG #1

Comments

MayeZhang commented May 8, 2020