AdversarialRLHF
/

rloo_pythia410m_tldr6.9b_rm410mdata

Model card Files Files and versions Community

rloo_pythia410m_tldr6.9b_rm410mdata / checkpoint-209 /optimizer.pt

Commit History

Training in progress, step 209, checkpoint

5597cd5
verified

Muqeeth commited on Apr 30