助理教授 博士生导师 硕士生导师
入职时间:2025-04-29
所在单位:清华大学 电子工程系
职务:助理教授
学历:博士研究生毕业
办公地点:中国北京市海淀区 清华大学 电子工程系
在职信息:在职
个人主页:https://www.stingning.cn/
邮编:
通讯/办公地址:
邮箱:
丁宁,清华大学电子工程系助理教授,博士生导师。研究方向为人工智能,尤其注重探究具备强推理能力的通用人工智能理论、方法和系统,并致力于将其应用到创新科学发现中。他在Nature Machine Intelligence、ICLR、NeurIPS、ICML、ACL等人工智能会议和期刊发表多篇论文,谷歌学术引用量超过10000次,主导的开源成果在GitHub上获得超过30000星标。他曾入选中国科协青年人才托举工程,获ACL最佳系统演示论文奖、世界人工智能大会青年优秀论文奖和云帆奖、中国算力大会最佳学术论文奖、清华大学优秀博士论文、百度奖学金、Stanford全球前2%科学家等荣誉(个人主页、协同交互智能研究中心 )。
近期研究工作(课题组全部发表在Google Scholar)
• SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning.
• A Survey of Reinforcement Learning for Large Reasoning Models.
• TTRL: Test-time Reinforcement Learning.
• Process Reinforcement through Implicit Rewards.
• Parameter-efficient Fine-tuning of Large-scale Pre-trained Language Models.
[1].2025.4-至今
清华大学 | 电子工程系 | 助理教授 | 在职
[2].2023.7-2025.4
清华大学 | 电子工程系 | 博士后 | 博士后
[1] 强推理能力的通用智能