1 2

Aswin Ravikumar Rangsasamy Veerasamy

rrvaswin

AI & ML interests

Transformers, SSMs

Recent Activity

upvoted a paper 5 days ago

Mid-Training with Self-Generated Data Improves Reinforcement Learning in Language Models

submitted a paper 5 days ago

Mid-Training with Self-Generated Data Improves Reinforcement Learning in Language Models

updated a model 21 days ago

rrvaswin/qwen_STaR_RL

View all activity

Organizations

upvoted a paper 5 days ago

Mid-Training with Self-Generated Data Improves Reinforcement Learning in Language Models

Paper • 2605.08472 • Published 18 days ago • 5

submitted a paper to Daily Papers 5 days ago

Mid-Training with Self-Generated Data Improves Reinforcement Learning in Language Models

Paper • 2605.08472 • Published 18 days ago • 5

updated a model 21 days ago

rrvaswin/qwen_STaR_RL

8B • Updated 21 days ago • 246

published a model 21 days ago

rrvaswin/qwen_STaR_RL

8B • Updated 21 days ago • 246

updated a model 21 days ago

rrvaswin/qwen_4b_RL

8B • Updated 21 days ago • 244

published a model 21 days ago

rrvaswin/qwen_4b_RL

8B • Updated 21 days ago • 244

updated a model 21 days ago

rrvaswin/qwen_Vanilla_RL

8B • Updated 21 days ago • 13

published a model 21 days ago

rrvaswin/qwen_Vanilla_RL

8B • Updated 21 days ago • 13

updated a model 21 days ago

rrvaswin/qwen_8b_RL

8B • Updated 21 days ago • 17

published a model 21 days ago

rrvaswin/qwen_8b_RL

8B • Updated 21 days ago • 17

updated a model 21 days ago

rrvaswin/qwen_16b_RL

8B • Updated 21 days ago • 15

published a model 21 days ago

rrvaswin/qwen_16b_RL

8B • Updated 21 days ago • 15

updated a model 21 days ago

rrvaswin/qwen_32b_RL

8B • Updated 21 days ago • 13

published a model 21 days ago

rrvaswin/qwen_32b_RL

8B • Updated 21 days ago • 13

updated a model 21 days ago

rrvaswin/qwen_star_baseline

8B • Updated 21 days ago • 247

published a model 21 days ago

rrvaswin/qwen_star_baseline

8B • Updated 21 days ago • 247

updated a model 21 days ago

rrvaswin/qwen_32b_distill_baseline

8B • Updated 21 days ago • 39

published a model 21 days ago

rrvaswin/qwen_32b_distill_baseline

8B • Updated 21 days ago • 39

updated a model 21 days ago

rrvaswin/qwen_32b_SFT

8B • Updated 21 days ago • 47

published a model 21 days ago

rrvaswin/qwen_32b_SFT

8B • Updated 21 days ago • 47

Aswin Ravikumar Rangsasamy Veerasamy

AI & ML interests

Recent Activity

Organizations

rrvaswin's activity