Edit Models filters

Apps

Apps with no match

Inference Providers

Inference Providers with no match

HF Inference API

Misc

Inference Endpoints

Misc with no match

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

7,251

Full-text search

Active filters: deep-rl-class

BoschAI/Reinforce-Cartpole-v1

Reinforcement Learning • Updated Mar 30, 2023

ManarAli/Reinforce-pixelcopter

Reinforcement Learning • Updated Mar 30, 2023

BoschAI/Reinforce-pixelcopter

Reinforcement Learning • Updated Mar 30, 2023

joe-hug/Reinforce-CartPole-v1

Reinforcement Learning • Updated Mar 29, 2023

cfalholt/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Mar 29, 2023

feratur/Reinforce-CartPole-v1

Reinforcement Learning • Updated Mar 29, 2023

kenzo4433/Reinforce-CartPole-v1

Reinforcement Learning • Updated Mar 29, 2023

kenzo4433/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Mar 29, 2023

stelladk/Reinforce-PixelCopter-PLE-v0

Reinforcement Learning • Updated Apr 19, 2023

JamesEJarvis/Reinforce-CartPole-v1

Reinforcement Learning • Updated Mar 29, 2023

mobiusmatt/Reinforce-CartPole-v1initial

Reinforcement Learning • Updated Mar 29, 2023

JamesEJarvis/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Mar 30, 2023

adavies25/Reinforce-Cartpole-1

Reinforcement Learning • Updated Mar 29, 2023

mobiusmatt/Reinforce-Pixelcopter-PLE-v0initial

Reinforcement Learning • Updated Mar 29, 2023

sofiapecora/Reinforce-cartpole2

Reinforcement Learning • Updated Mar 29, 2023

gf2rl/david1

Reinforcement Learning • Updated Mar 29, 2023

gf2rl/david2

Reinforcement Learning • Updated Mar 29, 2023

gf2rl/david3

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/david4

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/h_size_2

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/h_size_16_standard

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/h_size_100_fail

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/h_size_100_success_with_training_5000_episodes

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/max_t_50_fail

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/lr_1e-1_fail

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/lr_1e-3_not_perfect_but_not_a_complete_fail

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/gamma_0_05_fail

Reinforcement Learning • Updated Mar 30, 2023

OMARS200/Cartpole-v1

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/gamma_0_5_Partial_fail

Reinforcement Learning • Updated Mar 30, 2023

gf2rl/partial_observability_pole_pose_only

Reinforcement Learning • Updated Mar 30, 2023