https://gymnasium.farama.org/environments/classic_control/cart_pole/
Cart Pole 是一个倒立摆问题:一根杆子通过非驱动接头直立放置在小车上,小车沿着无摩擦的轨道移动。
目标是通过在小车上向左和向右施加力来平衡杆,坚持得越久越好。
- 训练命令:
python py/01_Classic_Control/02_Cart_Pole/train_DQN.py
- 查看训练过程参数:
tensorboard --logdir=./out/tensor/cart_pole
- http://localhost:6006/
- 模型输出目录:
./out/models/cart_pole
(默认每 500 回合保存一次)
默认使用 DQN 算法解题
- 测试所有模型:
python py/01_Classic_Control/02_Cart_Pole/test_DQN.py
- 测试单个模型:
python py/01_Classic_Control/02_Cart_Pole/test_DQN.py -m ./out/models/cart_pole/cart_pole_model_epoch_xxxx.pth
验证训练好的最优模型:
python py/01_Classic_Control/02_Cart_Pole/test_DQN.py -m ./optimal/01_Classic_Control/02_Cart_Pole/models/cart_pole_model_epoch_7500.pth -a