Yanxiao Zhao's picture

4 15 8

Yanxiao Zhao

sdpkjc

·

https://sdpkjc.me

AI & ML interests

Reinforcement Learning

Recent Activity

updated a dataset 21 days ago

TheFactoryX/edition_0001_Rowan-hellaswag-readymade

published a dataset 21 days ago

TheFactoryX/edition_0001_Rowan-hellaswag-readymade

updated a dataset 21 days ago

TheFactoryX/edition_0000_fancyzhx-ag_news-readymade

View all activity

Organizations

sdpkjc 's models 95

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed5

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed4

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed3

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed2

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed1

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed5

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed4

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed3

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed2

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed1

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Walker2d-v4-ppo_fix_continuous_action-seed2

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Walker2d-v4-ppo_fix_continuous_action-seed4

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Walker2d-v4-ppo_fix_continuous_action-seed5

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Walker2d-v4-ppo_fix_continuous_action-seed3

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Walker2d-v4-ppo_fix_continuous_action-seed1

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Swimmer-v4-ppo_fix_continuous_action-seed2

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/HalfCheetah-v4-ppo_fix_continuous_action-seed1

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/HalfCheetah-v4-ppo_fix_continuous_action-seed4

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/HalfCheetah-v4-ppo_fix_continuous_action-seed5

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/HalfCheetah-v4-ppo_fix_continuous_action-seed3

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Swimmer-v4-ppo_fix_continuous_action-seed3

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Swimmer-v4-ppo_fix_continuous_action-seed5

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Swimmer-v4-ppo_fix_continuous_action-seed4

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/HalfCheetah-v4-ppo_fix_continuous_action-seed2

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Swimmer-v4-ppo_fix_continuous_action-seed1

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Hopper-v4-ppo_fix_continuous_action-seed5

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Hopper-v4-ppo_fix_continuous_action-seed3

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Hopper-v4-ppo_fix_continuous_action-seed4

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Hopper-v4-ppo_fix_continuous_action-seed2

Reinforcement Learning • Updated Jan 20, 2024

sdpkjc/Hopper-v4-ppo_fix_continuous_action-seed1

Reinforcement Learning • Updated Jan 20, 2024