Yuandong Tian's picture

5 1

Yuandong Tian

tydsh

·

https://yuandong-tian.com/

AI & ML interests

Reinforcement Learning, Optimization, Representation Learning

Recent Activity

authored a paper 12 days ago

Deep Think with Confidence

authored a paper 6 months ago

SWEET-RL: Training Multi-Turn LLM Agents on Collaborative Reasoning Tasks

authored a paper 7 months ago

Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning

View all activity

Organizations

None yet

tydsh 's models

None public yet