一种基于多注意力机制的单通道语音增强方法2025
- 申请专利号:CN202310795845.3
- 公开(公告)日:2025-08-19
- 公开(公告)号:CN116863950A
- 申请人:昆明理工大学
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116863950 A (43)申请公布日 2023.10.10 (21)申请号 202310795845.3 (22)申请日 2023.07.01 (71)申请人 昆明理工大学 地址 650500 云南省昆明市呈贡区景明南 路727号 (72)发明人 高盛祥 莫尚斌 余正涛 (74)专利代理机构 昆明隆合知识产权代理事务 所(普通合伙) 53220 专利代理师 何娇 (51)Int.Cl. G10L 21/02 (2013.01) G10L 21/0316 (2013.01) G10L 21/0216 (2013.01) G10L 25/45 (2013.01) 权利要求书2页 说明书7页 附图1页 (54)发明名称 一种基于多注意力机制的单通道语音增强 方法 (57)摘要 本发明涉及一种基于多注意力机制的单通 道语音增强方法,属于音频信号处理技术领域。 本发明在复数U‑Net网络中引入复数Conformer 对语音幅度和相位的相关性进行建模,利用三维 度注意力机制构造更加丰富的特征来增强卷积 层的表示能力,通过门控注意力机制融合语音细 节特征和深层特征。该方法能提高语音质量和可 理解性,可用于嘈杂环境中的语音通信,口令控 制及与语音相关任务的前处理部分。在公开数据 集上的实验结果表明,所提方法在五种客观评价 指标PESQ、CSIG、CBAK、COVL、STOI上,分别取得了 A 的
原创力.专利