-
Notifications
You must be signed in to change notification settings - Fork 0
/
main.py
49 lines (44 loc) · 2 KB
/
main.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
import argparse
from learn import qmix_learning
def get_args():
parser = argparse.ArgumentParser()
parser.add_argument('--map-name', type=str, default='8m')
parser.add_argument('--batch-size', type=int, default=32)
parser.add_argument('--gamma', type=float, default=0.99)
parser.add_argument('--training-steps', type=int, default=2050000)
parser.add_argument('--anneal-steps', type=int, default=50000)
parser.add_argument('--anneal-start', type=float, default=1.0)
parser.add_argument('--anneal-end', type=float, default=0.05)
parser.add_argument('--replay-buffer-size', type=int, default=5000)
parser.add_argument('--target-update-freq', type=int, default=200)
parser.add_argument('--save-model-freq', type=int, default=2000)
parser.add_argument('--test-freq', type=int, default=10000)
parser.add_argument('--learning-rate', type=float, default=5e-4)
parser.add_argument('--grad-norm-clip', type=float, default=10)
# seed
parser.add_argument('--seed', type=int, default=None)
# ddqn
parser.add_argument('--is-ddqn', type=int, default=True)
# per
parser.add_argument('--is-per', type=int, default=False)
parser.add_argument('--alpha', type=float, default=0.6)
parser.add_argument('--beta', type=float, default=0.2)
parser.add_argument('--prior-eps', type=float, default=1e-6)
# multi_step
parser.add_argument('--multi-steps', type=int, default=1)
# share networks
parser.add_argument('--share-para', type=int, default=True)
# evaluate
parser.add_argument('--is-evaluate', type=int, default=True)
parser.add_argument('--evaluate-num', type=int, default=32)
# store hyper parameters
parser.add_argument('--store-hyper-para', type=int, default=True)
# optimizer
parser.add_argument('--optimizer', type=int, default=1, help="0: Adam--[3m, 2s_vs_1sc]; 1: RMSprop--[others]")
return parser.parse_args()
def main(args=get_args()):
qmix_learning(
args=args
)
if __name__ == '__main__':
main()