发明

一种基于语音信号时域和频域的特征提取方法、装置、回声消除方法及装置

2023-07-09 07:07:36 发布于四川 1

申请专利号：CN202111119961.0
公开（公告）日：2024-09-13
公开（公告）号：CN113870888A
申请人：武汉大学

摘要：本发明提供了一种基于语音信号时域和频域的特征提取方法、装置、回声消除方法及装置，其中的方法包括：首先将语音信号经过短时傅里叶变换得到时频域特征，然后利用多层卷积神经网络得到中间映射特征，之后基于时域注意力模块得到时间权值向量，并将其扩展到与中间映射特征相同的维度后做哈达玛乘积，得到经过时域加权的映射特征，然后利用频域注意力模块得到频率权值向量，并将其扩展到与经过时间加权的映射特征相同的维度后做哈达玛乘积，得到最终的经过时域和频域加权的映射特征。本发明的时域和频域注意力模块可以很容易地嵌入到基于卷积神经网络的声学回声消除模型中，使模型自适应学习时频域特征的权重，以此提升模型性能的效果。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113870888 A (43)申请公布日 2021.12.31 (21)申请号 202111119961.0 (22)申请日 2021.09.24 (71)申请人武汉大学地址 430072 湖北省武汉市武昌区珞珈山武汉大学 (72)发明人涂卫平　韩畅　刘雅洁　肖立　杨玉红　刘陈建树　 (74)专利代理机构武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人罗飞 (51)Int.Cl. G10L 21/0224 (2013.01) G10L 21/0232 (2013.01) G10L 25/30 (2013.01) 权利要求书2页说明书9页附图4页 (54)发明名称一种基于语音信号时域和频域的特征提取方法、装置、回声消除方法及装置 (57)摘要本发明提供了一种基于语音信号时域和频域的特征提取方法、装置、回声消除方法及装置，其中的方法包括：首先将语音信号经过短时傅里叶变换得到时频域特征，然后利用多层卷积神经网络得到中间映射特征，之后基于时域注意力模块得到时间权值向量，并将其扩展到与中间映射特征相同的维度后做哈达玛乘积，得到经过时域加权的映射特征，然后利用频域注意力模块得到频率权值向量，并将其扩展到与经过时间加权的映射特征相同的维度后做哈达玛乘积，得到最终的经过时域和频域加权的映射特征。本发明的时 A 域和频域注意

一种基于语音信号时域和频域的特征提取方法、装置、回声消除方法及装置

专利内容

最新专利

相关专利