A repository of DQN and PPO algorithms implemented in Pytorch Lightning, showcasing a zero-knowledge approach to Tetris.

Modifications made to state representation, reward structure and exploration strategy.

Implementations of VIME-PPO and Bootstrapped DQN.

VIME : https://arxiv.org/abs/1605.09674 Bootstrapped DQN: https://arxiv.org/abs/1602.04621

Name		Name	Last commit message	Last commit date
Latest commit History 316 Commits
.github		.github
Exp 2 - Reward		Exp 2 - Reward
Exp1 - State		Exp1 - State
Python files		Python files
gym_simplifiedtetris		gym_simplifiedtetris
tests		tests
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
BootDQN.py		BootDQN.py
DQN.py		DQN.py
DQN4histBigNet.py		DQN4histBigNet.py
DQNBigNet.py		DQNBigNet.py
DQNPot.py		DQNPot.py
Dockerfile		Dockerfile
DynamicsModel.py		DynamicsModel.py
PPO.py		PPO.py
PPOCNN.py		PPOCNN.py
PPOLSTM.py		PPOLSTM.py
README.md		README.md
TetrisWrapperNorm.py		TetrisWrapperNorm.py
TetrisWrapperPot.py		TetrisWrapperPot.py
TetrisWrapperScore.py		TetrisWrapperScore.py
examples.py		examples.py
min.py		min.py
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
setup.cfg		setup.cfg
setup.py		setup.py

Provide feedback