发明

一种基于语音信号时域和频域的特征提取方法、装置、回声消除方法及装置

2023-07-09 07:07:36 发布于四川 1
  • 申请专利号:CN202111119961.0
  • 公开(公告)日:2024-09-13
  • 公开(公告)号:CN113870888A
  • 申请人:武汉大学
摘要:本发明提供了一种基于语音信号时域和频域的特征提取方法、装置、回声消除方法及装置,其中的方法包括:首先将语音信号经过短时傅里叶变换得到时频域特征,然后利用多层卷积神经网络得到中间映射特征,之后基于时域注意力模块得到时间权值向量,并将其扩展到与中间映射特征相同的维度后做哈达玛乘积,得到经过时域加权的映射特征,然后利用频域注意力模块得到频率权值向量,并将其扩展到与经过时间加权的映射特征相同的维度后做哈达玛乘积,得到最终的经过时域和频域加权的映射特征。本发明的时域和频域注意力模块可以很容易地嵌入到基于卷积神经网络的声学回声消除模型中,使模型自适应学习时频域特征的权重,以此提升模型性能的效果。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113870888 A (43)申请公布日 2021.12.31 (21)申请号 202111119961.0 (22)申请日 2021.09.24 (71)申请人 武汉大学 地址 430072 湖北省武汉市武昌区珞珈山 武汉大学 (72)发明人 涂卫平 韩畅 刘雅洁  肖立  杨玉红 刘陈建树  (74)专利代理机构 武汉科皓知识产权代理事务 所(特殊普通合伙) 42222 代理人 罗飞 (51)Int.Cl. G10L 21/0224 (2013.01) G10L 21/0232 (2013.01) G10L 25/30 (2013.01) 权利要求书2页 说明书9页 附图4页 (54)发明名称 一种基于语音信号时域和频域的特征提取 方法、装置、回声消除方法及装置 (57)摘要 本发明提供了一种基于语音信号时域和频 域的特征提取方法、装置、回声消除方法及装置, 其中的方法包括:首先将语音信号经过短时傅里 叶变换得到时频域特征,然后利用多层卷积神经 网络得到中间映射特征,之后基于时域注意力模 块得到时间权值向量,并将其扩展到与中间映射 特征相同的维度后做哈达玛乘积,得到经过时域 加权的映射特征,然后利用频域注意力模块得到 频率权值向量,并将其扩展到与经过时间加权的 映射特征相同的维度后做哈达玛乘积,得到最终 的经过时域和频域加权的映射特征。本发明的时 A 域和频域注意

最新专利