清华大学王生进--中文主页--科学研究

获得了包括973、863、国家自然科学基金、教育部博士点基金、国家科技支撑计划等多个国家项目支持，并取得出色成果。在国际重要期刊IEEE和学术会议发表论文逾200余篇，其中近年发表IEEE Trans等顶级期刊18篇，CVPR/ICCV /ECCV 三大顶会30篇，其他顶会16篇。谷歌单篇引用逾4500次。申请发明专利15项。

发表AAAI2018 oral 1篇， ICCV2023 oral 1篇， ICASSP2023 oral 1篇, ICASSP2024 oral 1篇。王生进连续4年4次入选爱思唯尔中国高被引学者榜单（王生进2020、2021、2022、2023）。

获2008年国家科技进步二等奖1项、获2006北京市科学技术一等奖1项，获2019年吴文俊人工智能科学技术自然科学奖，2019年公安部科学技术奖，DAS最佳论文 1篇，ICPR最佳论文 1篇，2017年度中国人工智能学会优秀博士论文奖，2020年度中国图像图形学会优秀博士论文奖，获2021北京市科学技术奖技术发明一等奖1项。

14.2024年9月15日，我校电子工程系智能计算与自主系统研究中心王生进教授团队的侯雪格博士生和吴泽原、董光裕、王源三位研究生组队参加全球医学图像顶级会议MICCAI 2024竞赛取得出色成绩。参赛队提交的“AC-UNet: A Self-Adaptive Cropping Approach for Kidney Pathology Image Segmentation”以F1 Score 90.88的成绩获得了MICCAI KPIs 2024挑战赛WSI级病变肾小球检测赛道第二名，并应邀于2024年10月在摩洛哥召开的第27届国际医学图像计算与计算机辅助干预国际会议（International Conference on Medical Image Computing and Computer Assisted Intervention，简称MICCAI）上作特邀论文报告。

13.2024年7月3日，电子系王生进教授、李亚利副研究员团队的博士后程煜钧、博士后张哲为以题目为“针对无监督对比学习的样本最优选择方法”（Contrastive Unsupervised Representation Learning with Optimize-Selected Training Samples）的投稿论文，被计算机视觉领域顶刊之一的IEEE Transactions on Neural Networks and Learning Systems，（影响因子10.4）接收录用。论文提出了一种新颖的数据正负样本选择方法，解决了无监督对比学习中的正负数据样本类别冲突的问题，并通过严谨的数学分析证明了该方法的有效性。据知乎网信息，IEEE Transactions on Neural Networks and Learning Systems的有效投稿数约为11500篇，年文章数目1734篇论文被接收，综合接收率约为15%。

12.2024年7月2日，计算机视觉领域三大顶会之一的ECCV2024放榜，电子系王生进教授、李亚利副研究员团队的2篇投稿论文被接收录用。博士研究生王振宇的论文题目为“OV-Uni3DETR: 以跨模态环面向通用开放词汇3D目标检测”（OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation），论文通过对3D和2D两种模态之间的互相知识传播，构造了一个在模态、类别、场景三个层次均实现通用性的3D目标检测器，并在每个领域都显著超过现有方法。博士研究生樊懿轩的论文题目为“面向自动驾驶轨迹规划的风险感知-自一致模仿学习”（Risk-Aware Self-Consistent Imitation Learning for Trajectory Planning in Autonomous Driving），论文通过对人类驾驶动机建模，缓解了基于模仿学习的轨迹规划方法训练和部署目标不对齐问题，在数据驱动自动驾驶决策系统研究中取得了显著进展。ECCV 2024的有效投稿数约为12600篇，共有2395篇论文被接收，接收率约为18%。

11.2024年6月20日，电子工程系王生进教授、李亚利副研究员团队的研究生吴泽原、王源，分别以题目为“探索基于混合学习的姿态感知人-物交互”（Exploring Pose-Aware Human-Object Interaction via Hybrid Learning）、G3-LQ: 结合双曲对齐与显式语义几何建模的三维视觉定位（G3-LQ：Marrying Hyperbolic Alignment with Explicit Semantic-Geometric Modeling for 3D Visual Grounding）的2篇论文，在美国西雅图召开的本领域三大顶会之一的第41届IEEE计算机视觉与模式识别会议（2024 IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2024）大会上做了poster发表。CVPR 2024的有效投稿数为11532，共有2719篇论文被接收，接收率约为23.6%。

10.2024年6月，2024届博士毕业生豆朝鹏在校被评为优秀毕业生。

9.2024年6月5日，王生进、李亚利指导的博士生王振宇的学术论文“UniDetector: Towards Universal Object Detection with Heterogeneous Supervision”，被本领域顶级期刊PAMI接收。这是继去年团队ICCV2023 Oral, ICASSP2024 Oral，ICME2024 Oral之后深度学习与通用视觉感知模型研究领域又一篇高水平论文被接收。

8.2024年5月21日，王生进、李亚利指导的博士生刘鑫，投稿多媒体领域最重要的旗舰学术会议之一的IEEE International Conference on Multimedia and Expo（ICME2024）,论文被录用为Oral。这是继去年团队ICCV2023 Oral, ICASSP2024 Oral之后的又一篇Oral论文。

7.2024年4月26日，天津市人民政府颁布了2023年度天津市科学技术奖获奖名单，由天津市眼科医院及清华大学等高校单位共同完成的“人工智能辅助的生物医学新方法在提升视觉精准诊疗中的应用”项目荣获2023年度天津市科技进步一等奖。王生进教授为本次获奖项目的第3排名获奖人。主要贡献：带领团队基于深度学习等方法预测近视并发现视觉规律，开发基于眼底图像的新型智能化视网膜检影系统，实现在非散瞳状态下的精准验光，提升了临床诊疗效率。这是继王生进教授2021年获得北京市科学技术奖技术发明一等奖（排名2）后再次获得省部级科学技术奖励。

6.电子工程系王生进、李亚利团队的博士生刘鑫的论文“基于自监督信息瓶颈的通用视觉表征学习”（Learning Generalizable Visual Representations via Self-Supervised Information Bottleneck) 于2024年3月9日被第49届IEEE国际声学、语音和信号处理会议（2024 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2024）接收为口头报告(Oral)发表。当地时间4月18日，刘鑫在韩国首尔参加该学术会议并作大会口头报告。ICASSP 2024的有效投稿数为5796，共有738篇论文被接收为口头报告发表，接收率约为12.7%。

2024年4月14日至4月19日，第49届IEEE 国际声学、语音和信号处理会议（2024 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2024）在韩国首尔举办。ICASSP是国际规模最大、学科最全面的信号处理及其应用方面的顶会，是IEEE的旗舰会议，展示了信号处理研究和技术的最新进展。电子工程系王生进、李亚利团队在机器学习和计算机视觉研究领域取得了突出成果，多次获得学术奖励，论文单篇引用逾4000次。该篇论文是继该团队在AAAI 2020、ICASSP 2023、ICCV 2023上发表Oral论文之后的又一篇顶级国际学术会议Oral论文。

5.电子工程系王生进、李亚利团队的博士生豆朝鹏的论文《面向域泛化行人再识别的身份导向自监督表征学习》(Identity-Seeking Self-Supervised Representation Learning for Generalizable Person Re-identification)于2023年8月12日被国际计算机视觉大会（IEEE International Conference on Computer Vision, ICCV2023）接收为Oral。当地时间10月6日，豆朝鹏赴法国巴黎参加该学术会议并作大会口头报告。ICCV2023的有效投稿数为8088，最终接收了2160篇文章，接收率约26.7%，共有152篇论文被接收为口头报告（Oral），接收率仅1.9%。

ICCV会议由电气与电子工程师学会（The Institute of Electrical and Electronics Engineers, IEEE）举办，与计算机视觉模式识别会议（IEEE Conference on Computer Vision and Pattern Recognition , CVPR）和欧洲计算机视觉会议（European Conference on Computer Vision, ECCV）并称计算机视觉方向的三大会议，被中国计算机学会等机构评为最高级别的学术会议，在业内具有极高的评价，拥有极高的领域影响力。电子工程系王生进、李亚利团队在机器学习和计算机视觉研究领域取得了突出成果，多次获得学术奖励，论文单篇引用逾4000次。该篇论文是继该团队在国际先进人工智能协会的人工智能会议（AAAI Conference on Artificial Intelligence, AAAI）和国际声学、语音与信号处理会议（International Conference on Acoustics, Speech and Signal Processing, ICASSP）上发表Oral论文之后的又一篇顶级国际学术会议Oral论文。

4.Intel室内机器人学习全球挑战赛决赛在上海市长宁区成功举办。初赛共14支队伍于2022年3-6月相继进行线上测试，本次CV-AI团队共报名识别和操作两个赛道。在识别赛道中，CV-AI团队参与了物体识别与寻找子赛道，最终，CV-AI团队线上测试准确率为7/9，离线测试准确率为100%。清华大学电子工程系CV-AI团队（指导教师：王生进、李亚利，团队成员：鲁宇豪、智佩渊、陈祖煜、豆朝鹏、樊懿轩、潘明轩）参赛并荣获识别赛道一等奖、操控赛道二等奖、全球挑战赛决赛一等奖。

3.王重道博士论文被评选为2022年度清华大学博士论文，同时，在清华大学研究生毕业典礼上，邱勇校长表彰了全校共96名优秀毕业生。电子系博士毕业生王重道获得2022年度“清华大学优秀博士毕业生”奖项。

2.郑良博士论文被评选为2017年度中国人工智能学会优秀博士论文（全国10篇）

1.孙奕帆博士论文被评选为2020年度中国图像图形学会优秀博士论文（全国10篇）

研究内容包括人工智能、机器学习和计算机视觉等，主要研究方向包括人脸识别与行人再识别、多模态协同机器人、智能视频安防与智慧校园等。

在人脸识别研究中，2004年团队在国家863人脸识别认证评测中获第一；第17届国际模式识别会议(ICPR2004)人脸认证竞赛(FAT2004)中，以全部测试指标第一获“人脸认证算法全面性能最优成就奖”；2018年在国际权威人脸检测测试库FDDB取得国际第一。研究成果已经应用在贵州六盘水市公安局。在行人再识别研究中，2015年行人再识别研究成果被《麻省理工学院技术评论》高度评价。建立并公开了三个本领域权威测试行人数据集iLIDS-VID、Market1501、MARS。到目前为止，成为本领域标准测试集，三个数据集已经有超过13600次的下载量。

多模态协同机器人研究致力于研究与人在共同空间、近距离、协同工作的机器人，实现多模态人机物交互。研究的核心技术包括通用物体检测，语音识别与NLP，视觉图像的多模态语义理解，目标物体位姿估计与抓取点确定，视觉与触觉力反馈融合的物体抓取，持物移动中的平衡策略等。目前研究构建了面向人机交互短语命令的语音识别原型系统引擎，实现由语音指令控制的机器人物体抓取系统。

获得了包括973、863、国家自然科学基金、教育部博士点基金、国家科技支撑计划等多个国家项目支持，并取得出色成果。实验室在国际重要期刊IEEE和学术会议CVPR、ICCV等发表论文90篇以上。申请发明专利15项。获2008年国家科技进步二等奖1项、获2006北京市科学技术一等奖1项，获2019年吴文俊人工智能科学技术自然科学二等奖。

担任中国图象图形学学会视频监控与安全专委会主任、北京图象图形学会副理事长、全国安防标委会人体生物特征识别应用分技术委员会委员、公安部安全防范技术与风险评估公安部重点实验室学术委员会委员、自动化学会国防大数据分会副主任委员、危爆品扫描探测国家工程实验室副主任。

暂无内容

个人信息Personal Information

学术成果

研究概况

学术论文 More>>

专利 More>>

出版著作

科研项目 More>>