In a Training Loop 🔄

6 52 60

Lê Võ Quyết Thắng

thangvip

https://vualidon.icu

AI & ML interests

Adapting LLM to specific domain

Recent Activity

updated a model 5 days ago

thangvip/qwen2.5-1.5b-gspo-sgd-linear

published a model 6 days ago

thangvip/qwen2.5-1.5b-gspo-sgd-linear

updated a model 7 days ago

thangvip/qwen2.5-1.5b-seq-dspo-sgd-linear

View all activity

Organizations

updated a model 5 days ago

thangvip/qwen2.5-1.5b-gspo-sgd-linear

Text Generation • 2B • Updated 5 days ago • 183

published a model 6 days ago

thangvip/qwen2.5-1.5b-gspo-sgd-linear

Text Generation • 2B • Updated 5 days ago • 183

updated a model 7 days ago

thangvip/qwen2.5-1.5b-seq-dspo-sgd-linear

Text Generation • 2B • Updated 7 days ago • 611

published a model 11 days ago

thangvip/qwen2.5-1.5b-seq-dspo-sgd-linear

Text Generation • 2B • Updated 7 days ago • 611

published a model 16 days ago

thangvip/qwen2.5-1.5b-dspo-sgd-linear-5e

Updated 16 days ago

updated a model 17 days ago

thangvip/qwen2.5-1.5b-grpo-sgd-linear

Text Generation • 2B • Updated 17 days ago • 356

published a model 18 days ago

thangvip/qwen2.5-1.5b-grpo-sgd-linear

Text Generation • 2B • Updated 17 days ago • 356

updated a model 18 days ago

thangvip/qwen2.5-1.5b-grpo-no-sft-sgd-linear

Text Generation • 2B • Updated 18 days ago • 107

published a model 19 days ago

thangvip/qwen2.5-1.5b-grpo-no-sft-sgd-linear

Text Generation • 2B • Updated 18 days ago • 107

updated a model 19 days ago

thangvip/qwen2.5-1.5b-dspo-no-sft-sgd-linear-steps-13000-steps

Text Generation • 2B • Updated 19 days ago • 11

published a model 19 days ago

thangvip/qwen2.5-1.5b-dspo-no-sft-sgd-linear-steps-13000-steps

Text Generation • 2B • Updated 19 days ago • 11

updated a model 19 days ago

thangvip/qwen2.5-1.5b-dspo-no-sft-sgd-linear-steps-12800-steps

Text Generation • 2B • Updated 19 days ago • 13

published a model 19 days ago

thangvip/qwen2.5-1.5b-dspo-no-sft-sgd-linear-steps-12800-steps

Text Generation • 2B • Updated 19 days ago • 13

updated a model 19 days ago

thangvip/qwen2.5-1.5b-dspo-no-sft-sgd-linear-steps-12600-steps

Text Generation • 2B • Updated 19 days ago • 9

published a model 19 days ago

thangvip/qwen2.5-1.5b-dspo-no-sft-sgd-linear-steps-12600-steps

Text Generation • 2B • Updated 19 days ago • 9

updated a model 19 days ago

thangvip/qwen2.5-1.5b-dspo-no-sft-sgd-linear-steps-12400-steps

Text Generation • 2B • Updated 19 days ago • 8

published a model 19 days ago

thangvip/qwen2.5-1.5b-dspo-no-sft-sgd-linear-steps-12400-steps

Text Generation • 2B • Updated 19 days ago • 8

updated a model 19 days ago

thangvip/qwen2.5-1.5b-dspo-no-sft-sgd-linear-steps-12200-steps

Text Generation • 2B • Updated 19 days ago • 12

published a model 19 days ago

thangvip/qwen2.5-1.5b-dspo-no-sft-sgd-linear-steps-12200-steps

Text Generation • 2B • Updated 19 days ago • 12

updated a model 19 days ago

thangvip/qwen2.5-1.5b-dspo-no-sft-sgd-linear-steps-12000-steps

Text Generation • 2B • Updated 19 days ago • 11

Lê Võ Quyết Thắng

AI & ML interests

Recent Activity

Organizations

thangvip's activity