Manoj120
/

rm_checkpoint

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

Manoj120's picture

Manoj120/rlhf-reward-model

427d8e0 almost 2 years ago

.gitattributes

1.52 kB

initial commit almost 2 years ago
README.md

1.11 kB

Manoj120/rlhf-reward-model almost 2 years ago
added_tokens.json

445 Bytes

Manoj120/rlhf-reward-model almost 2 years ago
config.json

1.01 kB

Manoj120/rlhf-reward-model almost 2 years ago
generation_config.json

111 Bytes

Manoj120/rlhf-reward-model almost 2 years ago
merges.txt

442 kB

Manoj120/rlhf-reward-model almost 2 years ago
pytorch_model.bin

657 MB
LFS

Manoj120/rlhf-reward-model almost 2 years ago
special_tokens_map.json

556 Bytes

Manoj120/rlhf-reward-model almost 2 years ago
tokenizer.json

2.06 MB

Manoj120/rlhf-reward-model almost 2 years ago
tokenizer_config.json

4.25 kB

Manoj120/rlhf-reward-model almost 2 years ago
training_args.bin
Detected Pickle imports (8)
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.HubStrategy",
- "accelerate.state.PartialState",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.training_args.TrainingArguments",
- "transformers.trainer_utils.SchedulerType",
- "transformers.training_args.OptimizerNames",
- "torch.device"
How to fix it?
4.03 kB
LFS

Manoj120/rlhf-reward-model almost 2 years ago
vocab.json

777 kB

Manoj120/rlhf-reward-model almost 2 years ago