Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

Transformers.js

Apps

Inference Providers

Models

1,091

Full-text search

Active filters: reinforcement-learning, transformers

ckauth/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 30, 2023 • 2

Mithul/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 31, 2023 • 1

eugene-d/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 30, 2023 • 3

dotunadegbite/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 25, 2023 • 1

asuzuki/PPO-LunarLander-v2

Reinforcement Learning • Updated Mar 22, 2023 • 1

akanametov/decision-transformer-HalfCheetah-v3

Reinforcement Learning • Updated Jan 10, 2023 • 2

vicfeuga/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 2, 2023 • 3

habanoz/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 2

FabioDataGeek/ppo-LunarLander-v2

Reinforcement Learning • Updated May 2, 2023 • 2

mkahari/RL_testing

Reinforcement Learning • Updated Jan 11, 2023 • 1

arenbeglaryan/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 8, 2023 • 2

MHaurel/ppo-LunarLander-v2

Reinforcement Learning • Updated May 30, 2023 • 3

akoshel/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 27, 2023 • 2

rootacess/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 5, 2023 • 2

morganjeffries/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 19, 2023 • 1

jrnold/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 1, 2023 • 1

lewtun/dummy-trl-model

Reinforcement Learning • Updated Jan 24, 2023 • 16 • 1

stinoco/PPO-LunarLander-v2

Reinforcement Learning • Updated Mar 6, 2023 • 1

mili7522/ppo-cleanrl-LunarLander-v2

Reinforcement Learning • Updated Apr 16, 2023 • 3

EdenYav/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 22, 2023 • 3

victorivus/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 3, 2023 • 1

slopezay/ppo-LunarLander-v2

Reinforcement Learning • Updated May 20, 2023 • 2

nikogarro/PPO-LunarLander-v2

Reinforcement Learning • Updated Feb 16, 2023 • 1

jamesthong/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 3

ybelkada/gpt-neo-125m-detox

Reinforcement Learning • Updated Feb 17, 2023 • 70

ybelkada/gpt-neo-125m-detoxified-long-context

Reinforcement Learning • Updated Feb 17, 2023 • 1

dungtd2403/CartPole-v1

Reinforcement Learning • Updated Mar 5, 2023 • 1

ZhihongDeng/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 30, 2023 • 1

mkuntz/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 1

Gabcsor/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 13, 2023 • 1