发明

一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法

2023-08-25 07:24:09 发布于四川 2

申请专利号：CN202310245365.X
公开（公告）日：2025-06-13
公开（公告）号：CN116631386A
申请人：桂林理工大学

摘要：本发明提供一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法，该方法采用了SE残差块对网络的特征提取能力和空间信息的融合进行了改进，同时可以实现同时进行声音事件检测和声音事件定位，减少了算法复杂度和计算量，使用联合训练的方法优化了声音事件检测和声音事件定位任务的损失函数，提高了模型的泛化能力和稳定性。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116631386 A (43)申请公布日 2023.08.22 (21)申请号 202310245365.X (22)申请日 2023.03.14 (71)申请人桂林理工大学地址 541004 广西壮族自治区桂林市七星区建干路12号 (72)发明人刘一欣　王玫　杨松铭　 (51)Int.Cl. G10L 15/16 (2006.01) G10L 25/18 (2013.01) G10L 25/78 (2013.01) G10L 15/06 (2013.01) 权利要求书2页说明书3页附图2页 (54)发明名称一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法 (57)摘要本发明提供一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法，该方法采用了SE残差块对网络的特征提取能力和空间信息的融合进行了改进，同时可以实现同时进行声音事件检测和声音事件定位，减少了算法复杂度和计算量，使用联合训练的方法优化了声音事件检测和声音事件定位任务的损失函数，提高了模型的泛化能力和稳定性。 A 6 8 3 1 3 6 6 1 1 N C CN 116631386 A 权　利　要　求　书 1/2页 1.一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法，其特征在于，包括如下步骤：

一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法

专利内容

最新专利

相关专利