张卫强

个人信息Personal Information

教师英文名称:Wei-Qiang Zhang

教师拼音名称:Zhang Wei Qiang

电子邮箱:

办公地点:电子工程馆5-111

联系方式:010-62781847

学位:博士学位

毕业院校:清华大学

学科:信号与信息处理

教师博客

当前位置: 中文主页 >> 教师博客

基于dVAE-BERT模型的阿尔茨海默症检测新进展

点击次数:

阿尔茨海默病(Alzheimer’s Disease,AD)是全球范围内最常见的神经退行性疾病之一。随着人口老龄化加剧,AD患者的数量也逐年增加,给社会医疗体系带来了巨大的压力。早期诊断对于减缓疾病进展至关重要,然而传统的诊断方法往往依赖于临床表现和昂贵的医学检查,难以实现大规模筛查。近期,清华大学语音与音频技术实验室(SATLab)研究团队提出了一种创新的检测方法——dVAE-BERT模型,通过分析患者的语言能力来辅助阿尔茨海默症的早期识别。

陈旭初, 蒲钰, 张卫强. 基于dVAE-BERT模型的阿尔茨海默症检测方法. 电子学报, vol. 52, no. 9, pp. 2971-2978, 2024. doi: 10.12263/DZXB.20230050.

工作原理

dVAE-BERT模型结合了离散变分自编码器(dVAE)和双向编码器表示(BERT)两种技术。首先,dVAE将语音信号转化为伪音素序列,这种转化有助于捕捉语音中的细微变化和非言语信息。然后,BERT模型对这些伪音素序列进行处理,利用其强大的上下文理解能力来挖掘语音中的语义信息。这种方法不仅能够有效提取语音中的语言维度特征,还能克服传统声学特征检测方法难以获得语义信息的问题。

fig1.jpg

实验结果

在ADReSSo数据集上的实验结果显示,dVAE-BERT模型的准确率达到70.42%,相较于基线系统提高了5.63%。更进一步地,当该模型与Wav2vec2.0、Hubert模型融合使用时,检测准确率分别达到了76.06%和71.83%。这一成果表明,结合多种技术手段可以显著提升阿尔茨海默症的检测精度。

tab1.jpg

技术优势

dVAE-BERT模型的一个重要优势在于它能够直接从语音中提取特征,避免了传统方法中耗时的手动转录过程。这对于老年人或患有语言障碍的人来说尤其有用,因为他们的口音和发音可能会影响转录的质量。

fig2.png

结束语

dVAE-BERT模型为阿尔茨海默症的早期检测提供了一种新的思路和技术支持,尤其是在无创、低成本的大规模筛查方面展现了巨大潜力。未来,随着技术的不断进步和完善,相信这一领域的研究将会为更多患者带来希望。