张卫强

个人信息Personal Information

副研究员

教师英文名称:Wei-Qiang ZHANG

教师拼音名称:zhangweiqiang

电子邮箱:

办公地点:电子工程馆5-111

联系方式:010-62781847

学位:博士学位

毕业院校:清华大学

学科:信号与信息处理

教师博客

当前位置: 中文主页 >> 教师博客

喜讯|语音与音频技术实验室毕业生双双获奖

点击次数:

近日,语音与音频技术实验室(THUsatlab)毕业生赵靖获得北京市优秀毕业生。赵靖同学2020年入学,两年硕士毕业,硕士期间成绩优秀,获得研究生国家奖学金。2020年参加OpenSAT20语音分析技术国际评测和OpenASR20开放语音识别挑战赛分别取得多项国际第一名,2021年参加OpenASR21国际语音识别评测并取得16项国际第一名,在IEEE信号处理协会顶级期刊《IEEE Journal of Selected Topics in Signal Processing》、语音顶会INTERSPEECH、ASRU等发表多篇学术论文。

赵靖硕士论文主要研究方向为基于语音自监督预训练的低资源小语种语音识别,在低资源条件下,小语种自动语音识别面临巨大挑战,借助大规模语音预训练模型应对语音识别下游任务则可以取得明显性能提升。对不同的预训练数据和多个自监督学习架构进行了全面的对比,并在十几个不同的小语种上进行了探索与验证,提出了借助目标语种音频数据的两步微调策略、音素识别任务辅助等微调方法,进一步降低了目标语种语音识别的词错误率。此外,也利用表征相似度分析对预训练模型的各层输出表征进行了一系列可视化分析,为后续预训练表征的提取与应用提供了指导。

zj.png



语音与音频技术实验室(THUsatlab)直硕本科生李金朋喜获系优秀毕业论文和清华大学优良毕业生。李金朋同学于2021年通过清华大学大学生研究训练计划(SRT)项目进入实验室实习,不仅学习了科研的知识与技能,还开展了深入探索和研究,他作为第一发明人申请了发明专利一项,并获得清华大学挑战杯二等奖。在本科毕业设计期间,李金朋同学主要研究低资源小语种的语音识别优化方法以及发音词典学习方法。在国际权威评测OpenASR21中,实验室团队取得16项国际第一名的成绩,系统描述将在INTERSPEECH2022上发表。他的毕业设计方向为低资源小语种发音词典学习,提出了一种基于音素识别模型替代专家生成发音词典的方法,在多个低资源语种的实验中,该方法性能可与专家词典性能比肩。

李金朋同学已顺利通过清华大学直硕生推荐免试,将在语音与音频技术实验室继续攻读硕士学位。

ljp.png