Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

39,596

Full-text search

Active filters: deep-reinforcement-learning

amareelez/ppo-LunarLander-v2

Reinforcement Learning • Updated May 21, 2022 • 5

amareelez/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated May 21, 2022 • 5

domcermak/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated May 21, 2022 • 9

GKPro/PPO-LunarLander-v2

Reinforcement Learning • Updated May 21, 2022 • 7

forsc/unit12ppo-LunarLander-v2

Reinforcement Learning • Updated May 21, 2022 • 5

mmartu/ppo-LunarLander-v2

Reinforcement Learning • Updated May 21, 2022 • 5

wooihen/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated May 21, 2022 • 5

BioGeek/PPO-LunarLander-v2

Reinforcement Learning • Updated May 21, 2022 • 9

Astronomy88/LunarLander-v2-ppo_mlppolicy

Reinforcement Learning • Updated May 21, 2022 • 5

ptaylour/LunarLander-v2

Reinforcement Learning • Updated May 21, 2022 • 5

hvorost/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated May 22, 2022 • 5

9dogs/LunarLander-v2_PPO-MLP

Reinforcement Learning • Updated May 22, 2022 • 5

lucaordronneau/lo-ppo-LunarLander-v2_1

Reinforcement Learning • Updated May 22, 2022 • 5

venushong667/PPO-LunarLander-v2

Reinforcement Learning • Updated May 22, 2022 • 5

danieladejumo/ppo_lunar-lander-v2

Reinforcement Learning • Updated May 22, 2022 • 6

Skvayzer/PPO-LunarLander-v2

Reinforcement Learning • Updated May 22, 2022 • 5

shankinson/ppo-LunarLander-v2

Reinforcement Learning • Updated May 22, 2022 • 5

sb3/sac-Pendulum-v1

Reinforcement Learning • Updated Oct 11, 2022 • 41

sb3/tqc-Pendulum-v1

Reinforcement Learning • Updated Oct 11, 2022 • 12

Mugenor/ppo-LunarLander-v2

Reinforcement Learning • Updated May 22, 2022 • 5

Krill/ppo-LunarLander-v2

Reinforcement Learning • Updated May 23, 2022 • 5

bosemessi/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated May 23, 2022 • 5

stochastic/ppo-LunarLander-v2

Reinforcement Learning • Updated May 23, 2022 • 5

stochastic/ppo-LunarLander-v2adssadas

Reinforcement Learning • Updated May 23, 2022 • 5

LookParOf/ppo-LunarLander-v2

Reinforcement Learning • Updated May 23, 2022 • 5

turnip/class-ppo-lunarlander-v2

Reinforcement Learning • Updated May 23, 2022 • 5

Duuuscha/ppo-lunarlander2

Reinforcement Learning • Updated May 23, 2022 • 5

DwightGunning/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated May 23, 2022 • 5

PromptCoding/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated May 23, 2022 • 5

shivr/PPO-LunarLander-v2

Reinforcement Learning • Updated May 24, 2022 • 5