AdversarialRLHF
/

rloo_pythia410m_tldr6.9b_rm410mdata

Model card Files Files and versions Community

rloo_pythia410m_tldr6.9b_rm410mdata / checkpoint-168 /rng_state.pth

Commit History

Training in progress, step 168, checkpoint

6d06d11
verified

Muqeeth commited on Apr 29