#

policy-gradient

Here are 420 public repositories matching this topic...

datawhalechina / easy-rl

强化学习中文教程（蘑菇书🍄），在线阅读地址：https://datawhalechina.github.io/easy-rl/

reinforcement-learning deep-reinforcement-learning q-learning dqn policy-gradient sarsa a3c ddpg imitation-learning double-dqn dueling-dqn ppo td3 easy-rl

Updated Nov 8, 2024
Jupyter Notebook

MorvanZhou / Reinforcement-learning-with-tensorflow

Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学

Updated Mar 31, 2024
Python

tianshou

thu-ml / tianshou

An elegant PyTorch deep reinforcement learning library.

pytorch dqn policy-gradient rl cql atari ddpg imitation-learning sac drl npg double-dqn trpo mujoco ppo a2c td3 bcq transferlab

Updated Nov 24, 2024
Python

sweetice / Deep-reinforcement-learning-with-pytorch

PyTorch implementation of DQN, AC, ACER, A2C, A3C, PG, DDPG, TRPO, PPO, SAC, TD3 and ....

algorithm deep-learning deep-reinforcement-learning pytorch dqn policy-gradient sarsa resnet a3c reinforce sac alphago actor-critic trpo ppo a2c actor-critic-algorithm td3

Updated Mar 24, 2023
Python

rlcode / reinforcement-learning

Minimal and Clean Reinforcement Learning Examples

machine-learning reinforcement-learning deep-learning deep-reinforcement-learning dqn policy-gradient a3c deep-q-network actor-critic

Updated Mar 24, 2023
Python

nikhilbarhate99 / PPO-PyTorch

Minimal implementation of clipped objective Proximal Policy Optimization (PPO) in PyTorch

reinforcement-learning deep-learning deep-reinforcement-learning pytorch policy-gradient reinforcement-learning-algorithms pytorch-tutorial proximal-policy-optimization ppo pytorch-implmention ppo-pytorch

Updated Jul 9, 2024
Python

SLM-Lab

kengz / SLM-Lab

Modular Deep Reinforcement Learning framework in PyTorch. Companion library of the book "Foundations of Deep Reinforcement Learning".

benchmark reinforcement-learning deep-reinforcement-learning pytorch dqn policy-gradient a3c sac ppo a2c

Updated Aug 26, 2022
Python

Khrylx / PyTorch-RL

PyTorch implementation of Deep Reinforcement Learning: Policy Gradient methods (TRPO, PPO, A2C) and Generative Adversarial Imitation Learning (GAIL). Fast Fisher vector product TRPO.

reinforcement-learning deep-reinforcement-learning pytorch generative-adversarial-network policy-gradient trpo fisher-vectors pytorch-rl proximal-policy-optimization ppo a2c

Updated Feb 9, 2021
Python

Kismuz / btgym

Scalable, event-driven, deep-learning-friendly backtesting library

reinforcement-learning time-series tensorflow deep-reinforcement-learning openai-gym unreal policy-gradient a3c hacktoberfest algorithmic-trading-library quantitive-finance backtesting-trading-strategies statistical-arbitrage gym-environment advantage-actor-critic backtrader policy-optimisation algoritmic-trading

Updated Aug 28, 2021
Python

sudharsan13296 / Hands-On-Reinforcement-Learning-With-Python

Master Reinforcement and Deep Reinforcement Learning using OpenAI Gym and TensorFlow

reinforcement-learning monte-carlo deep-reinforcement-learning openai-gym q-learning deep-learning-algorithms policy-gradient sarsa deep-q-network markov-decision-processes asynchronous-advantage-actor-critic double-dqn trpo dueling-dqn deep-deterministic-policy-gradient ppo deep-recurrent-q-network drqn hindsight-experience-replay policy-gradients

Updated Oct 7, 2020
Jupyter Notebook

yaserkl / RLSeq2Seq

Deep Reinforcement Learning For Sequence to Sequence Models

nlp reinforcement-learning policy-gradient actor-critic abstractive-text-summarization pointer-generator

Updated Mar 24, 2023
Python

omerbsezer / Reinforcement_learning_tutorial_with_demo

Reinforcement Learning Tutorial with Demo: DP (Policy and Value Iteration), Monte Carlo, TD Learning (SARSA, QLearning), Function Approximation, Policy Gradient, DQN, Imitation, Meta Learning, Papers, Courses, etc..

machine-learning tutorial reinforcement-learning deep-reinforcement-learning q-learning pomdps policy-gradient sarsa a3c dynamic-programming imitation-learning dyna td-learning actor-critic meta-learning

Updated Jan 22, 2019
Jupyter Notebook

awesome-monte-carlo-tree-search-papers

benedekrozemberczki / awesome-monte-carlo-tree-search-papers

A curated list of Monte Carlo tree search papers with implementations.

learning machine-learning reinforcement-learning deep-learning monte-carlo machine-learning-algorithms q-learning policy-gradient reinforcement-learning-algorithms rl tree-search atari policy-evaluation monte-carlo-tree-search deep-q-learning reinforcement-learning-agent

Updated Mar 16, 2024
Python

suragnair / seqGAN

A simplified PyTorch implementation of "SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient." (Yu, Lantao, et al.)

nlp natural-language-processing deep-learning generative-adversarial-network gan generative-model policy-gradient natural-language-understanding seqgan

Updated Sep 27, 2018
Python

germain-hug / Deep-RL-Keras

Keras Implementation of popular Deep RL Algorithms (A3C, DDQN, DDPG, Dueling DDQN)

reinforcement-learning keras openai dqn gym policy-gradient a3c ddpg ddqn keras-rl a2c d3qn dueling

Updated May 25, 2020
Python

theamrzaki / text_summurization_abstractive_methods

Multiple implementations for abstractive text summurization , using google colab

nlp machine-learning reinforcement-learning ai deep-learning tensorflow word2vec artificial-intelligence policy-gradient rnn text-summarization seq2seq machinelearning deeplearning encoder-decoder abstractive-text-summarization google-colab pointer-generator google-colaboratory

Updated Oct 6, 2020
Jupyter Notebook

medipixel / rl_algorithms

Structural implementation of RL key algorithms

reinforcement-learning deep-learning python3 pytorch dqn gym policy-gradient

Updated Apr 8, 2023
Python

yukezhu / tensorflow-reinforce

Implementations of Reinforcement Learning Models in Tensorflow

reinforcement-learning tensorflow deep-reinforcement-learning policy-gradient deep-q-network actor-critic

Updated Oct 31, 2017
Python

VinF / deer

DEEp Reinforcement learning framework

deep-reinforcement-learning q-learning policy-gradient

Updated May 1, 2024
Python

navneet-nmk / pytorch-rl

This repository contains model-free deep reinforcement learning algorithms implemented in Pytorch

Updated Jul 14, 2019
Python

Improve this page

Add a description, image, and links to the policy-gradient topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the policy-gradient topic, visit your repo's landing page and select "manage topics."