Indexed by:
Abstract:
声纹识别为阈下抑郁辨识诊断和干预评价提供客观的参考依据.本研究采用不同言语方式(读/a:/音、文本朗读、图片描述、自由访谈)和情绪刺激(正性、中性、负性),融合韵律、音色、频谱、共振峰等4类语音特征,提取出Mel频率倒谱系数、音速、基频、共振峰等16种特征参数,利用随机森林分类算法建立阈下抑郁风险预测模型,并与其他分类器对比.结果表明:未融合特征前图片描述和自由访谈的识别率高于其他言语方式,其中正性刺激的预测结果更好,准确率达72.50%和67.39%;融合特征后读/a:/音和自由访谈分别获得了 93.00%和85.00%的高准确率.由此可知,融合特征后模型学习到的语音信息不仅仅包含被试者的情感状态,也包含特征类型间的相互关系;读/a:/音和自由访谈保留更多的声道信息,其中读/a:/音发声持久、音强持续,自由访谈语量和特征全面,接近自然言语.本文结果对阈下抑郁早期风险预测有一定的参考意义.
Keyword:
Reprint 's Address:
Email:
Version:
Source :
复旦学报(自然科学版)
ISSN: 0427-7104
Year: 2024
Issue: 3
Volume: 63
Page: 344-350
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 1
Affiliated Colleges: