汪玉Yu WANG

教授

教授 博士生导师 硕士生导师

电子邮箱:

所在单位:清华大学电子工程系

职务:教授,系主任

学历:研究生(博士)毕业

办公地点:清华大学罗姆楼4-303

在职信息:在职

研究方向

当前位置: 中文主页 >>研究方向

多智能体强化学习算法

得益于人工智能技术的发展和算力的不断提升,单智能体的感知和推理能力得到了大幅度增强。一般来说,提升系统智能性有两条途径,(1)不断提升单体智能,(2)利用协同智能,也就是利用多智能体系统。多智能体系统可以通过共享信息、资源调度、配合行动等手段配合完成任务,达到比单体系统更高的效率,目前也广泛应用于机器人系统、分布式控制、协作决策支持系统、数据挖掘等各种领域。虽然我们可以通过人工设计多智能体策略,但随着任务复杂性和场景多样性的提高,人工设计难度增加,应用受到限制。深度学习算法具有利用梯度信息学习特征表示的能力,而强化学习算法可以利用环境信息特征产生梯度并学习最佳策略,两者结合的深度强化学习方法为解决复杂多智能体任务提供了新范式。我们致力于研究多智能体深度强化学习算法的相关问题,并基于多智能体深度强化学习解决一些实际应用问题。