个人信息Personal Information
教授
教师英文名称:Shengjin WANG
教师拼音名称:wangshengjin
电子邮箱:
性别:男
学位:博士学位
毕业院校:东京工业大学
学科:信号与信息处理
-
6.电子工程系王生进、李亚利团队的博士生刘鑫的论文“基于自监督信息瓶颈的通用视觉表征学习”(Learning Generalizable Visual Representations via Self-Supervised Information Bottleneck) 于2024年3月9日被第49届IEEE国际声学、语音和信号处理会议(2024 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2024)接收为口头报告(Oral)发表。当地时间4月18日,刘鑫在韩国首尔参加该学术会议并作大会口头报告。ICASSP 2024的有效投稿数为5796,共有738篇论文被接收为口头报告发表,接收率约为12.7%。
2024年4月14日至4月19日,第49届IEEE 国际声学、语音和信号处理会议(2024 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2024)在韩国首尔举办。ICASSP是国际规模最大、学科最全面的信号处理及其应用方面的顶会,是IEEE的旗舰会议,展示了信号处理研究和技术的最新进展。电子工程系王生进、李亚利团队在机器学习和计算机视觉研究领域取得了突出成果,多次获得学术奖励,论文单篇引用逾4000次。该篇论文是继该团队在AAAI 2020、ICASSP 2023、ICCV 2023上发表Oral论文之后的又一篇顶级国际学术会议Oral论文。
5.电子工程系王生进、李亚利团队的博士生豆朝鹏的论文《面向域泛化行人再识别的身份导向自监督表征学习》(Identity-Seeking Self-Supervised Representation Learning for Generalizable Person Re-identification)于2023年8月12日被国际计算机视觉大会(IEEE International Conference on Computer Vision, ICCV2023)接收为Oral。当地时间10月6日,豆朝鹏赴法国巴黎参加该学术会议并作大会口头报告。ICCV2023的有效投稿数为8088,最终接收了2160篇文章,接收率约26.7%,共有152篇论文被接收为口头报告(Oral),接收率仅1.9%。
ICCV会议由电气与电子工程师学会(The Institute of Electrical and Electronics Engineers, IEEE)举办,与计算机视觉模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition , CVPR)和欧洲计算机视觉会议(European Conference on Computer Vision, ECCV)并称计算机视觉方向的三大会议,被中国计算机学会等机构评为最高级别的学术会议,在业内具有极高的评价,拥有极高的领域影响力。电子工程系王生进、李亚利团队在机器学习和计算机视觉研究领域取得了突出成果,多次获得学术奖励,论文单篇引用逾4000次。该篇论文是继该团队在国际先进人工智能协会的人工智能会议(AAAI Conference on Artificial Intelligence, AAAI)和国际声学、语音与信号处理会议(International Conference on Acoustics, Speech and Signal Processing, ICASSP)上发表Oral论文之后的又一篇顶级国际学术会议Oral论文。
4.Intel室内机器人学习全球挑战赛决赛在上海市长宁区成功举办。初赛共14支队伍于2022年3-6月相继进行线上测试,本次CV-AI团队共报名识别和操作两个赛道。在识别赛道中,CV-AI团队参与了物体识别与寻找子赛道,最终,CV-AI团队线上测试准确率为7/9,离线测试准确率为100%。清华大学电子工程系CV-AI团队(指导教师:王生进、李亚利, 团队成员:鲁宇豪、智佩渊、陈祖煜、豆朝鹏、樊懿轩、潘明轩)参赛并荣获识别赛道一等奖、操控赛道二等奖、全球挑战赛决赛一等奖。
3.王重道博士论文被评选为2022年度清华大学博士论文,同时,在清华大学研究生毕业典礼上,邱勇校长表彰了全校共96名优秀毕业生。电子系博士毕业生王重道获得2022年度“清华大学优秀博士毕业生”奖项。
2.郑良博士论文被评选为2017年度中国人工智能学会优秀博士论文(全国10篇)
1.孙奕帆博士论文被评选为2020年度中国图像图形学会优秀博士论文(全国10篇)
-
研究内容包括人工智能、机器学习和计算机视觉等,主要研究方向包括人脸识别与行人再识别、多模态协同机器人、智能视频安防与智慧校园等。
在人脸识别研究中,2004年团队在国家863人脸识别认证评测中获第一;第17届国际模式识别会议(ICPR2004)人脸认证竞赛(FAT2004)中,以全部测试指标第一获“人脸认证算法全面性能最优成就奖”;2018年在国际权威人脸检测测试库FDDB取得国际第一。研究成果已经应用在贵州六盘水市公安局。在行人再识别研究中,2015年行人再识别研究成果被《麻省理工学院技术评论》高度评价。建立并公开了三个本领域权威测试行人数据集iLIDS-VID、Market1501、MARS。到目前为止,成为本领域标准测试集,三个数据集已经有超过13600次的下载量。
多模态协同机器人研究致力于研究与人在共同空间、近距离、协同工作的机器人,实现多模态人机物交互。研究的核心技术包括通用物体检测,语音识别与NLP,视觉图像的多模态语义理解,目标物体位姿估计与抓取点确定,视觉与触觉力反馈融合的物体抓取,持物移动中的平衡策略等。目前研究构建了面向人机交互短语命令的语音识别原型系统引擎,实现由语音指令控制的机器人物体抓取系统。
获得了包括973、863、国家自然科学基金、教育部博士点基金、国家科技支撑计划等多个国家项目支持,并取得出色成果。实验室在国际重要期刊IEEE和学术会议CVPR、ICCV等发表论文90篇以上。申请发明专利15项。获2008年国家科技进步二等奖1项、获2006北京市科学技术一等奖1项,获2019年吴文俊人工智能科学技术自然科学二等奖。
担任中国图象图形学学会视频监控与安全专委会主任、北京图象图形学会副理事长、全国安防标委会人体生物特征识别应用分技术委员会委员、公安部安全防范技术与风险评估公安部重点实验室学术委员会委员、自动化学会国防大数据分会副主任委员、危爆品扫描探测国家工程实验室副主任。
- [1] Yifan Sun; Liang Zheng; Yali Li; Yi Yang; Qi Tian; Shengjin Wang. Learning Part-based Convolutional Features for Person Re-Identification. IEEE Trans. Pattern Anal. Mach. Intell. 43(3): 902-917 (2021)
- [2] Jiahe Shi, Yali Li, Shengjin Wang. Partial Off-policy Learning: Balance Accuracy and Diversity for Human-Oriented Image Captioning. ICCV 2021, accepted.
- [3] Xuege Hou, Yali Li, Shengjin Wang. Disentangled Representation for Age-Invariant Face Recognition: A Mutual Information Minimization Perspective. ICCV 2021, accepted.
- [4] Takashi Isobe, Dong Li, Lu Tian, Weihua Chen, Yi Shan, Shengjin Wang. Towards Discriminative Representation Learning for Unsupervised Person Re-identification. ICCV 2021, accepted.
- [5] Miao Hu, Yali Li, Lu Fang, Shengjin Wang. A2-FPN: Attention Aggregation Based Feature Pyramid Network for Instance Segmentation. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. pages 15343-15352, 2021.
- [6] Zhenyu Wang, Yali Li, Ye Guo, Lu Fang, Shengjin Wang. Data-Uncertainty Guided Multi-Phase Learning for Semi-Supervised Object Detection. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. pages 4568-4577, 2021.
- 暂无内容