张卫强

个人信息Personal Information

教师英文名称：Wei-Qiang Zhang

教师拼音名称：Zhang Wei Qiang

电子邮箱：

办公地点：电子工程馆5-111

联系方式：010-62781847

学位：博士学位

毕业院校：清华大学

学科：信号与信息处理

教师博客

当前位置：中文主页 >> 教师博客

语音顶会InterSpeech2021放榜，清华语音与音频技术实验室4篇论文被接收

点击次数：

近日，语音顶会InterSpeech2021放榜，清华语音与音频技术实验室4篇论文被接收。我们来抢先了解一下论文的内容吧。

GigaSpeech: An Evolving, Multi-domain ASR Corpus with 10,000 Hours of Transcribed Audio

论文介绍开源数据集GigaSpeech，该工作由实验室毕业生陈果果领衔，实验室研究生柴树洲、助研王冠博为共同一作，语音界大神Daniel Povey, Sanjeev Khudanpur, Shinji Watanabe等多人为共同作者。GigaSpeech共10000小时训练数据，是目前全球最大的多领域英语开源数据集。

The TNT Team System Descriptions of Cantonese and Mongolian for IARPA OpenASR20

论文介绍清华与腾讯组成的TNT联队参加OpenASR20语音识别挑战赛的系统描述，实验室研究生赵靖和毕业生吕志强为共同一作，腾讯TEG语音组负责人黄申为共同通信作者。该工作依托清华-腾讯互联网创新技术联合实验室，TNT联队在比赛中获得佳绩，取得六项国际冠军。

Language Recognition Based on Unsupervised Pretrained Models

论文介绍基于无监督预训练模型的语种识别，实验室本科实习生于海彬一作，好未来AI研究院科学家吴中勤、杨嵩等人为共同作者。该工作依托清华-好未来智能教育信息技术联合研究中心，是将无监督预训练技术用于语种识别的首次尝试。

AdaSpeech 3: Adaptive Text to Speech for Spontaneous Style

论文介绍自适应自然口语语音合成，实验室本科实习生严谕梓一作，由MSRA主管研究员谭旭指导，MSRA副院长刘铁岩、首席研究员秦涛等人为共同作者。该工作依托清华电子系-MSRA联合开设的“高等机器学习”课程，由严谕梓在MSRA实习期间完成。

上一条：长短视频多语种多模态识别挑战赛开赛啦

下一条：语音技术助力阿尔茨海默综合症诊断，AD竞赛邀您报名