3 15 1

Yujun Zhou

yujunzhou

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

Emergent Social Intelligence Risks in Generative Multi-Agent Systems

updated a model about 1 month ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-RandomNovelty

published a model about 1 month ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-RandomNovelty

View all activity

Organizations

None yet

upvoted a paper about 1 month ago

Emergent Social Intelligence Risks in Generative Multi-Agent Systems

Paper • 2603.27771 • Published Mar 29 • 52

updated a model about 1 month ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-RandomNovelty

4B • Updated Mar 29 • 2

published a model about 1 month ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-RandomNovelty

4B • Updated Mar 29 • 2

updated a model about 1 month ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-OpenAI

4B • Updated Mar 28 • 26

published a model about 1 month ago

yujunzhou/MATH-TTT-Qwen3-4B-Base-Semantic-ClipHigh-Ent0.003-OpenAI

4B • Updated Mar 28 • 26

New activity in yujunzhou/AIME-TTT-OctoThinker-8B-Hybrid-Base-TTRL about 2 months ago

Running in MSTY Studio

#1 opened about 2 months ago by

Bogoo10191

upvoted a paper 4 months ago

Can LLMs Guide Their Own Exploration? Gradient-Guided Reinforcement Learning for LLM Reasoning

Paper • 2512.15687 • Published Dec 17, 2025 • 22

submitted a paper to Daily Papers 4 months ago

Can LLMs Guide Their Own Exploration? Gradient-Guided Reinforcement Learning for LLM Reasoning

Paper • 2512.15687 • Published Dec 17, 2025 • 22

updated 2 models 4 months ago

yujunzhou/SFT_Advanced_Risk_Self_Grading_Qwen3-4B

Text Generation • 4B • Updated Dec 17, 2025 • 6

yujunzhou/SFT_Advanced_Risk_Self_Grading_llama

Text Generation • 8B • Updated Dec 17, 2025 • 3

published a model 4 months ago

yujunzhou/SFT_Advanced_Risk_Self_Grading_Qwen3-4B

Text Generation • 4B • Updated Dec 17, 2025 • 6

updated a model 4 months ago

yujunzhou/SFT_Advanced_Risk_Self_Grading_Qwen3-4B-Base

Text Generation • 4B • Updated Dec 17, 2025 • 4

published a model 4 months ago

yujunzhou/SFT_Advanced_Risk_Self_Grading_Qwen3-4B-Base

Text Generation • 4B • Updated Dec 17, 2025 • 4

updated 2 models 4 months ago

yujunzhou/SFT_Advanced_Risk_Reward_Tampering_Qwen3-4B

Text Generation • 4B • Updated Dec 17, 2025 • 3

yujunzhou/Advanced_Risk_Self_Grading_llama

8B • Updated Dec 17, 2025 • 1

published a model 5 months ago

yujunzhou/SFT_Advanced_Risk_Reward_Tampering_Qwen3-4B

Text Generation • 4B • Updated Dec 17, 2025 • 3

updated a model 5 months ago

yujunzhou/SFT_Advanced_Risk_Reward_Tampering_Qwen3-4B-Base

Text Generation • 4B • Updated Dec 16, 2025 • 3

published a model 5 months ago

yujunzhou/SFT_Advanced_Risk_Reward_Tampering_Qwen3-4B-Base

Text Generation • 4B • Updated Dec 16, 2025 • 3

updated 2 models 5 months ago

yujunzhou/SFT_Advanced_Risk_Reward_Tampering_llama

Text Generation • 8B • Updated Dec 16, 2025 • 4

yujunzhou/SFT_Advanced_Risk_Situation_Aware_Qwen3-4B-Base

Text Generation • 4B • Updated Dec 16, 2025 • 1 •

Yujun Zhou

AI & ML interests

Recent Activity

Organizations

yujunzhou's activity

Running in MSTY Studio