1 8

Andrew Ceniccola

andrewsamce

aceniccola

AI & ML interests

Deep Reinforcement Learning of Concepts (and the intersection of RL and NLP).

Recent Activity

upvoted a paper 17 days ago

Skip a Layer or Loop it? Test-Time Depth Adaptation of Pretrained LLMs

commented on a paper 17 days ago

Skip a Layer or Loop it? Test-Time Depth Adaptation of Pretrained LLMs

updated a model about 1 month ago

andrewsamce/ppo-SnowballTarget

View all activity

Organizations

upvoted a paper 17 days ago

Skip a Layer or Loop it? Test-Time Depth Adaptation of Pretrained LLMs

Paper • 2507.07996 • Published Jul 10 • 32

commented a paper 17 days ago

Skip a Layer or Loop it? Test-Time Depth Adaptation of Pretrained LLMs

Paper • 2507.07996 • Published Jul 10 • 32 •

updated a model about 1 month ago

andrewsamce/ppo-SnowballTarget

Reinforcement Learning • Updated Jul 9 • 32

published a model about 1 month ago

andrewsamce/ppo-SnowballTarget

Reinforcement Learning • Updated Jul 9 • 32

updated a model about 2 months ago

andrewsamce/reinforce-pixelcopter

Reinforcement Learning • Updated Jun 24

published a model about 2 months ago

andrewsamce/reinforce-pixelcopter

Reinforcement Learning • Updated Jun 24

updated a model about 2 months ago

andrewsamce/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 24 • 10

published a model about 2 months ago

andrewsamce/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 24 • 10

updated a model about 2 months ago

andrewsamce/reinforce-cartpole-v1

Reinforcement Learning • Updated Jun 22

published a model about 2 months ago

andrewsamce/reinforce-cartpole-v1

Reinforcement Learning • Updated Jun 22

updated 2 models about 2 months ago

andrewsamce/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 20 • 1

andrewsamce/Taxi-v3

Reinforcement Learning • Updated Jun 20

published a model about 2 months ago

andrewsamce/Taxi-v3

Reinforcement Learning • Updated Jun 20

updated a model about 2 months ago

andrewsamce/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jun 20

published a model about 2 months ago

andrewsamce/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jun 20

upvoted a paper about 2 months ago

MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention

Paper • 2506.13585 • Published Jun 16 • 260

published a model 2 months ago

andrewsamce/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 20 • 1

upvoted 3 papers 4 months ago

TTRL: Test-Time Reinforcement Learning

Paper • 2504.16084 • Published Apr 22 • 120

Learning to Reason under Off-Policy Guidance

Paper • 2504.14945 • Published Apr 21 • 86

Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

Paper • 2504.13837 • Published Apr 18 • 134

Andrew Ceniccola

AI & ML interests

Recent Activity

Organizations

andrewsamce's activity