Releases · lucidrains/q-transformer

29 Nov 22:10

0.0.22

b7477b6

0.0.22

complete the autoregressive discrete formulation of q-learning for hi…

Assets 2

29 Nov 19:52

lucidrains

0.0.21

8bfb82c

0.0.21

multiple actions is ready for q-learning!

Assets 2

29 Nov 19:39

lucidrains

0.0.20

0750e9d

0.0.20

almost there

Assets 2

29 Nov 18:51

lucidrains

0.0.19

c496cd4

0.0.19

move single action q head into own module

Assets 2

29 Nov 17:45

lucidrains

0.0.18

e5573e0

0.0.18

final refactor before venturing out into multiple actions

Assets 2

29 Nov 17:00

lucidrains

0.0.17

faded0f

0.0.17

backup and bring code to only single actions, also fix adaptive layer…

Assets 2

28 Nov 20:29

lucidrains

0.0.16

e624c4a

0.0.16

fix non-nstep

Assets 2

28 Nov 19:16

lucidrains

0.0.15

641c1de

0.0.15

oops

Assets 2

28 Nov 18:28

lucidrains

0.0.14

1e46cb6

0.0.14

allow for min reward and monte carlo return to be set when instantiat…

Assets 2

28 Nov 18:21

lucidrains

0.0.12

5013ee7

0.0.12

allow for one to customize the min reward for the conservative reg lo…

Assets 2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Releases: lucidrains/q-transformer

0.0.22

0.0.21

0.0.20

0.0.19

0.0.18

0.0.17

0.0.16

0.0.15

0.0.14

0.0.12