Prakamya Mishra's picture

14 5 4

Prakamya Mishra

Prakamya

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 18 days ago

On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models

updated a collection 22 days ago

updated a model 22 days ago

amd/SAND-Math-Qwen2.5-32B

View all activity

Organizations

upvoted a paper 18 days ago

On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models

Paper • 2512.07783 • Published 20 days ago • 36

updated a collection 22 days ago

SAND

5 items • Updated 22 days ago • 1

updated 2 models 22 days ago

amd/SAND-Math-Qwen2.5-32B

Text Generation • 33B • Updated 22 days ago • 249 • 3

amd/SAND-MathScience-DeepSeek-Qwen32B

Text Generation • 33B • Updated 22 days ago • 74 • 2

updated a dataset 22 days ago

amd/SAND-Post-Training-Dataset

Viewer • Updated 22 days ago • 27.9k • 313 • 3

published a dataset 22 days ago

amd/SAND-Post-Training-Dataset

Viewer • Updated 22 days ago • 27.9k • 313 • 3

published 2 models 22 days ago

amd/SAND-MathScience-DeepSeek-Qwen32B

Text Generation • 33B • Updated 22 days ago • 74 • 2

amd/SAND-Math-Qwen2.5-32B

Text Generation • 33B • Updated 22 days ago • 249 • 3

updated a collection 22 days ago

SAND

5 items • Updated 22 days ago • 1

updated 2 collections 25 days ago

SAND

5 items • Updated 22 days ago • 1

Quark Quantized PTPC FP8 Models

PTPC model quantized by quark • 7 items • Updated 18 days ago

updated a collection about 1 month ago

Instella ✨

Announcing Instella, a series of 3 billion parameter language models developed by AMD, trained from scratch on 128 Instinct MI300X GPUs. • 13 items • Updated 23 days ago • 10

commented a paper about 1 month ago

Instella: Fully Open Language Models with Stellar Performance

Paper • 2511.10628 • Published Nov 13 • 4 •

updated 5 models about 1 month ago

amd/AMD-OLMo-1B-SFT-DPO

Text Generation • 1B • Updated Nov 17 • 242 • 23

amd/AMD-OLMo-1B-SFT

Text Generation • 1B • Updated Nov 17 • 360 • 20

amd/AMD-OLMo-1B

Text Generation • 1B • Updated Nov 17 • 361 • 25

amd/AMD-OLMo

Text Generation • Updated Nov 17 • 82

amd/Instella-3B-Math-SFT

Text Generation • 3B • Updated Nov 14 • 11