一种基于语音信号时域和频域的特征提取方法、装置、回声消除方法及装置
- 申请专利号:CN202111119961.0
- 公开(公告)日:2024-09-13
- 公开(公告)号:CN113870888A
- 申请人:武汉大学
专利内容
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113870888 A (43)申请公布日 2021.12.31 (21)申请号 202111119961.0 (22)申请日 2021.09.24 (71)申请人 武汉大学 地址 430072 湖北省武汉市武昌区珞珈山 武汉大学 (72)发明人 涂卫平 韩畅 刘雅洁 肖立 杨玉红 刘陈建树 (74)专利代理机构 武汉科皓知识产权代理事务 所(特殊普通合伙) 42222 代理人 罗飞 (51)Int.Cl. G10L 21/0224 (2013.01) G10L 21/0232 (2013.01) G10L 25/30 (2013.01) 权利要求书2页 说明书9页 附图4页 (54)发明名称 一种基于语音信号时域和频域的特征提取 方法、装置、回声消除方法及装置 (57)摘要 本发明提供了一种基于语音信号时域和频 域的特征提取方法、装置、回声消除方法及装置, 其中的方法包括:首先将语音信号经过短时傅里 叶变换得到时频域特征,然后利用多层卷积神经 网络得到中间映射特征,之后基于时域注意力模 块得到时间权值向量,并将其扩展到与中间映射 特征相同的维度后做哈达玛乘积,得到经过时域 加权的映射特征,然后利用频域注意力模块得到 频率权值向量,并将其扩展到与经过时间加权的 映射特征相同的维度后做哈达玛乘积,得到最终 的经过时域和频域加权的映射特征。本发明的时 A 域和频域注意