AdversarialRLHF
/

rloo_pythia410m_tldr6.9b_rm410mdata_allprefixsft_prefix

Model card Files Files and versions Community

rloo_pythia410m_tldr6.9b_rm410mdata_allprefixsft_prefix / checkpoint-12

Commit History

Training in progress, step 12, checkpoint

e5f4b4a
verified

Muqeeth commited on Apr 30