个人信息Personal Information
教师英文名称:Wei-Qiang Zhang
教师拼音名称:Zhang Wei Qiang
电子邮箱:
办公地点:电子工程馆5-111
联系方式:010-62781847
学位:博士学位
毕业院校:清华大学
学科:信号与信息处理
语音顶会InterSpeech2021放榜,清华语音与音频技术实验室4篇论文被接收
点击次数:
近日,语音顶会InterSpeech2021放榜,清华语音与音频技术实验室4篇论文被接收。我们来抢先了解一下论文的内容吧。
GigaSpeech: An Evolving, Multi-domain ASR Corpus with 10,000 Hours of Transcribed Audio
论文介绍开源数据集GigaSpeech,该工作由实验室毕业生陈果果领衔,实验室研究生柴树洲、助研王冠博为共同一作,语音界大神Daniel Povey, Sanjeev Khudanpur, Shinji Watanabe等多人为共同作者。GigaSpeech共10000小时训练数据,是目前全球最大的多领域英语开源数据集。
The TNT Team System Descriptions of Cantonese and Mongolian for IARPA OpenASR20
论文介绍清华与腾讯组成的TNT联队参加OpenASR20语音识别挑战赛的系统描述,实验室研究生赵靖和毕业生吕志强为共同一作,腾讯TEG语音组负责人黄申为共同通信作者。该工作依托清华-腾讯互联网创新技术联合实验室,TNT联队在比赛中获得佳绩,取得六项国际冠军。
Language Recognition Based on Unsupervised Pretrained Models
论文介绍基于无监督预训练模型的语种识别,实验室本科实习生于海彬一作,好未来AI研究院科学家吴中勤、杨嵩等人为共同作者。该工作依托清华-好未来智能教育信息技术联合研究中心,是将无监督预训练技术用于语种识别的首次尝试。
AdaSpeech 3: Adaptive Text to Speech for Spontaneous Style
论文介绍自适应自然口语语音合成,实验室本科实习生严谕梓一作,由MSRA主管研究员谭旭指导,MSRA副院长刘铁岩、首席研究员秦涛等人为共同作者。该工作依托清华电子系-MSRA联合开设的“高等机器学习”课程,由严谕梓在MSRA实习期间完成。