Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

39,524

Full-text search

Active filters: deep-reinforcement-learning

SusBioRes-UBC/ppo-LunarLander-v2

Reinforcement Learning • Updated May 7, 2022 • 7

Ifeanyi/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated May 7, 2022 • 9

AlexChe/ppo-LunarLander-v2

Reinforcement Learning • Updated May 7, 2022 • 7

lenant/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 7, 2024 • 7

lc-col/FirstTest-LunarLander-v2

Reinforcement Learning • Updated May 7, 2022 • 7

amirbnnsr/LunarLander-v2_PPO

Reinforcement Learning • Updated May 7, 2022 • 6

efawe/TESTppo-Lunar_lander_attempt2

Reinforcement Learning • Updated May 7, 2022 • 9

wwymak/ppo-LunarLander-v2

Reinforcement Learning • Updated May 11, 2022 • 17

nahumsa/ppo1-LunarLander-v2

Reinforcement Learning • Updated May 7, 2022 • 7

davidrd123/ppo-LunarLander-v2_try_9

Reinforcement Learning • Updated May 7, 2022 • 7

davidrd123/ppo-LunarLander-v2_try_10

Reinforcement Learning • Updated May 7, 2022 • 8

davidrd123/ppo-LunarLander-v2_try_11

Reinforcement Learning • Updated May 8, 2022 • 7

SuperSecureHuman/LunarLander_v2_PPO_wandb

Reinforcement Learning • Updated May 8, 2022 • 7

chris-kehl/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated May 11, 2022 • 12

rajistics/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated May 8, 2022 • 7

SuperSecureHuman/LunarLander_v2_PPO_TFBoard

Reinforcement Learning • Updated May 8, 2022 • 7

rajistics/ppo-LunarLander-v2

Reinforcement Learning • Updated May 8, 2022 • 8

davidrd123/ppo-LunarLander-v2_optim_v1

Reinforcement Learning • Updated May 8, 2022 • 7

davidrd123/ppo-LunarLander-v2_optim_v2

Reinforcement Learning • Updated May 8, 2022 • 7

davidrd123/ppo-LunarLander-v2_optim_v3

Reinforcement Learning • Updated May 8, 2022 • 7

davidrd123/ppo-LunarLander-v2_optim_v4

Reinforcement Learning • Updated May 8, 2022 • 7

davidrd123/ppo-LunarLander-v2_optim_v5

Reinforcement Learning • Updated May 8, 2022 • 7

davidrd123/ppo-LunarLander-v2_optim_v6

Reinforcement Learning • Updated May 8, 2022 • 7

btsas/ppo-LunarLander-v2

Reinforcement Learning • Updated May 8, 2022 • 7

davidrd123/ppo-LunarLander-v2_optim_v7

Reinforcement Learning • Updated May 8, 2022 • 7

linker81/PPO-LunarLander-v2

Reinforcement Learning • Updated May 19, 2022 • 28

exploiter345/ppo_lunar

Reinforcement Learning • Updated May 8, 2022 • 7

Yuriky/TestPPO-LunarLander-v2

Reinforcement Learning • Updated May 8, 2022 • 7

davidrd123/ppo-LunarLander-v2_optim_v8

Reinforcement Learning • Updated May 8, 2022 • 7

devetle/Test1ppo-LunarLander-v2

Reinforcement Learning • Updated May 8, 2022 • 7