3 11 167

Turbo Pascal

TurboPascal

AI & ML interests

None yet

Recent Activity

liked a model 4 days ago

Alibaba-NLP/WebDancer-32B

liked a model 7 days ago

zai-org/GLM-4.5V

upvoted a paper about 2 months ago

Skywork-Reward-V2: Scaling Preference Data Curation via Human-AI Synergy

View all activity

Organizations

upvoted a paper about 2 months ago

Skywork-Reward-V2: Scaling Preference Data Curation via Human-AI Synergy

Paper • 2507.01352 • Published Jul 2 • 53

upvoted a collection 3 months ago

GTE models

Collection

General Text Embedding Models Released by Tongyi Lab of Alibaba Group • 21 items • Updated Jan 21 • 30

upvoted 2 papers 5 months ago

AdaMMS: Model Merging for Heterogeneous Multimodal Large Language Models with Unsupervised Coefficient Optimization

Paper • 2503.23733 • Published Mar 31 • 11

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

Paper • 2503.22230 • Published Mar 28 • 46

upvoted 2 articles 6 months ago

Article

Open-source DeepResearch – Freeing our search agents

and 4 others •

Feb 4

• 1.28k

Article

Efficient LLM Pretraining: Packed Sequences and Masked Attention

•

Oct 7, 2024

• 46

upvoted a paper 6 months ago

DebCSE: Rethinking Unsupervised Contrastive Sentence Embedding Learning in the Debiasing Perspective

Paper • 2309.07396 • Published Sep 14, 2023 • 1

upvoted 2 papers 10 months ago

How to Train Long-Context Language Models (Effectively)

Paper • 2410.02660 • Published Oct 3, 2024 • 2

Differential Transformer

Paper • 2410.05258 • Published Oct 7, 2024 • 180

upvoted 2 papers over 1 year ago

MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs

Paper • 2402.15627 • Published Feb 23, 2024 • 39

Nemotron-4 15B Technical Report

Paper • 2402.16819 • Published Feb 26, 2024 • 47