proximal-policy-optimization

You can see a reference for Books, Articles, Courses and Educational Materials in this field. Implementation of Reinforcement Learning Algorithms and Environments. Python, OpenAI Gym, Tensorflow.

machine-learning reinforcement-learning deep-learning atari2600 deep-reinforcement-learning artificial-intelligence dqn policy-gradient ddqn deeprl deep-rl proximal-policy-optimization

Updated Aug 22, 2022
Jupyter Notebook

jacobyxu / Crawler_using_PPO

Star

Implement PPO to solve Crawler problem in Unity

deep-reinforcement-learning python3 pytorch continuous-control actor-critic proximal-policy-optimization

Updated Dec 8, 2022
Python

tomasspangelo / proximal-policy-optimization

Star

An implementation from the state-of-the-art family of reinforcement learning algorithms Proximal Policy Optimization using normalized Generalized Advantage Estimation and optional batch mode training. The loss function incorporates an entropy bonus.

python machine-learning reinforcement-learning entropy deep-learning neural-network optimization gae pytorch rl actor-critic proximal-policy-optimization ppo open-ai open-ai-gym generalized-advantage-estimation ppo-pytorch

Updated Dec 26, 2022
Python

KaufmannLukas / ds-ultimate-tic-tac-toe

Star

XOXO² - Use Reinforcement Learning to train agent to play U_T-T-T.

machine-learning reinforcement-learning gaming mcts neural-networks web-interface monte-carlo-tree-search ultimate-tic-tac-toe agent-based-simulation proximal-policy-optimization ppo mcts-algorithm spicedacademy

Updated Jan 9, 2024
Jupyter Notebook

blahBlahhhJ / ProjectProcgen

Star

A pytorch project to easily run experiments on OpenAI's Procgen Benchmark

reinforcement-learning pytorch proximal-policy-optimization

Updated May 20, 2021
Python

sophiaas / rlbase

Star

Modular Deep RL infrastructure in PyTorch

reinforcement-learning deep-reinforcement-learning policy-gradient hierarchical-reinforcement-learning pytorch-rl proximal-policy-optimization ppo a2c option-critic

Updated Jun 21, 2022
Python

escribano89 / unir_tfm_reinforcement_learning

Star

Repositorio para el contenido relativo al trabajo de fin de máster desarrollado en el Máster de Inteligencia Artificial de la Universidad Internacional de La Rioja (UNIR).

machine-learning reinforcement-learning deep-learning robotics deep-reinforcement-learning artificial-intelligence policy-gradient proximal-policy-optimization td3 reinforcement-learning-environments ppo-pytorch

Updated Oct 18, 2022
Jupyter Notebook

sunoh-kim / deep-reinforcement-learning

Star

This repository contains my assignment solutions for the Deep Reinforcement Learning course (430.729_003) offered by Seoul National University (Spring 2020).

deep-reinforcement-learning imitation-learning deep-q-learning deep-deterministic-policy-gradient proximal-policy-optimization

Updated Apr 10, 2022
Jupyter Notebook

NikosNtigas / Rock-Paper-Scissors-RL

Star

A custom Gym environment for a Rock-Paper-Scissors game, where a reinforcement learning agent and a CNN model are trained, evaluated, and compared using Ray RLlib and TensorFlow.

reinforcement-learning raylib supervised-learning rock-paper-scissors gymnasium proximal-policy-optimization