丁宁

助理教授

助理教授 博士生导师 硕士生导师

入职时间:2025-04-29

所在单位:清华大学 电子工程系

职务:助理教授

学历:博士研究生毕业

办公地点:中国北京市海淀区 清华大学 电子工程系

在职信息:在职

个人主页:https://www.stingning.cn/

邮编:

通讯/办公地址:

邮箱:

个人简介

丁宁,清华大学电子工程系助理教授,博士生导师。研究方向为人工智能,尤其注重探究具备强推理能力的通用人工智能理论、方法和系统,并致力于将其应用到创新科学发现中。他在Nature Machine IntelligenceICLRNeurIPSICMLACL等人工智能会议和期刊发表多篇论文,谷歌学术引用量超过10000次,主导的开源成果在GitHub上获得超过30000星标。他曾入选中国科协青年人才托举工程,获ACL最佳系统演示论文奖、世界人工智能大会青年优秀论文奖和云帆奖、中国算力大会最佳学术论文奖、清华大学优秀博士论文、百度奖学金、Stanford全球前2%科学家等荣誉(个人主页协同交互智能研究中心 )。

  

近期研究工作(课题组全部发表在Google Scholar

    • The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models.

    • SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning. 

    • A Survey of Reinforcement Learning for Large Reasoning Models. 

    • TTRL: Test-time Reinforcement Learning. 

    • Process Reinforcement through Implicit Rewards. 

    • Parameter-efficient Fine-tuning of Large-scale Pre-trained Language Models. 




教育经历

[1] 2018.9-2023.6
清华大学
[2] 2014.9-2018.6
华中科技大学

工作经历

[1].2025.4-至今

清华大学 | 电子工程系 | 助理教授 | 在职

[2].2023.7-2025.4

清华大学 | 电子工程系 | 博士后 | 博士后

社会兼职

暂无内容