Indexed by:
Abstract:
本发明涉及一种人声音色的定量表征方法,该方法通过分析专业歌手演唱的多首歌曲的音频,计算每帧192维的CQT特征,再选取60个音频帧的CQT特征构成大小为60*192的输入矩阵对深度卷积神经网络进行训练,得到训练好的深度卷积神经网络及相应的人声音色嵌入空间;再对业余歌手的清唱音频进行相同的分析计算并送入训练好的深度卷积神经网络,即可得到同一人声音色嵌入空间中的音色向量,实现了用一种定量的、客观的方式表示主观的音色特征。
Keyword:
Reprint 's Address:
Email:
Patent Info :
Type: 发明授权
Patent No.: CN201710207110.9
Filing Date: 2017/3/31
Publication Date: 2020/9/1
Pub. No.: CN106997765B
公开国别: CN
Applicants: 福州大学
Legal Status: 授权
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 2
Affiliated Colleges: