张卫强

个人信息Personal Information

教师英文名称:Wei-Qiang Zhang

教师拼音名称:Zhang Wei Qiang

电子邮箱:

办公地点:电子工程馆5-111

联系方式:010-62781847

学位:博士学位

毕业院校:清华大学

学科:信号与信息处理

教师博客

当前位置: 中文主页 >> 教师博客

语音顶会InterSpeech2021放榜,清华语音与音频技术实验室4篇论文被接收

点击次数:

近日,语音顶会InterSpeech2021放榜,清华语音与音频技术实验室4篇论文被接收。我们来抢先了解一下论文的内容吧。

  • GigaSpeech: An Evolving, Multi-domain ASR Corpus with 10,000 Hours of Transcribed Audio

论文介绍开源数据集GigaSpeech,该工作由实验室毕业生陈果果领衔,实验室研究生柴树洲、助研王冠博为共同一作,语音界大神Daniel Povey, Sanjeev Khudanpur, Shinji Watanabe等多人为共同作者。GigaSpeech共10000小时训练数据,是目前全球最大的多领域英语开源数据集。

  • The TNT Team System Descriptions of Cantonese and Mongolian for IARPA OpenASR20

文介绍清华与腾讯组成的TNT联队参加OpenASR20语音识别挑战赛的系统描述,实验室研究生赵靖和毕业生吕志强为共同一作,腾讯TEG语音组负责人黄申为共同通信作者。该工作依托清华-腾讯互联网创新技术联合实验室,TNT联队在比赛中获得佳绩,取得六项国际冠军。

  • Language Recognition Based on Unsupervised Pretrained Models

论文介绍基于无监督预训练模型的语种识别,实验室本科实习生于海彬一作,好未来AI研究院科学家吴中勤、杨嵩等人为共同作者。该工作依托清华-好未来智能教育信息技术联合研究中心,是将无监督预训练技术用于语种识别的首次尝试。

  • AdaSpeech 3: Adaptive Text to Speech for Spontaneous Style

论文介绍自适应自然口语语音合成,实验室本科实习生严谕梓一作,由MSRA主管研究员谭旭指导,MSRA副院长刘铁岩、首席研究员秦涛等人为共同作者。该工作依托清华电子系-MSRA联合开设的“高等机器学习”课程,由严谕梓在MSRA实习期间完成。