reaperdoesntknow
/

DeepReasoning_1R

Text Generation

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

reaperdoesntknow commited on Jan 31

Commit

ef945f9

·

verified ·

1 Parent(s): b4aaf2d

Create README.md

Files changed (1) hide show

README.md +8 -0

README.md ADDED Viewed

	@@ -0,0 +1,8 @@

+---
+datasets:
+- HumanLLMs/Human-Like-DPO-Dataset
+base_model:
+- Qwen/Qwen2.5-0.5B-Instruct
+pipeline_tag: text-generation
+library_name: transformers
+---