一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法
- 申请专利号:CN202310245365.X
- 公开(公告)日:2025-06-13
- 公开(公告)号:CN116631386A
- 申请人:桂林理工大学
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116631386 A (43)申请公布日 2023.08.22 (21)申请号 202310245365.X (22)申请日 2023.03.14 (71)申请人 桂林理工大学 地址 541004 广西壮族自治区桂林市七星 区建干路12号 (72)发明人 刘一欣 王玫 杨松铭 (51)Int.Cl. G10L 15/16 (2006.01) G10L 25/18 (2013.01) G10L 25/78 (2013.01) G10L 15/06 (2013.01) 权利要求书2页 说明书3页 附图2页 (54)发明名称 一种基于融合通道注意力机制的残差模块 的声音事件定位与识别方法 (57)摘要 本发明提供一种基于融合通道注意力机制 的残差模块的声音事件定位与识别方法,该方法 采用了SE残差块对网络的特征提取能力和空间 信息的融合进行了改进,同时可以实现同时进行 声音事件检测和声音事件定位,减少了算法复杂 度和计算量,使用联合训练的方法优化了声音事 件检测和声音事件定位任务的损失函数,提高了 模型的泛化能力和稳定性。 A 6 8 3 1 3 6 6 1 1 N C CN 116631386 A 权 利 要 求 书 1/2页 1.一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法,其特征在 于,包括如下步骤:
最新专利
- 一种基于人工智能的电网运维语音交互系统公开日期:2025-07-11公开号:CN118098233A申请号:CN202410334804.9一种基于人工智能的电网运维语音交互系统
- 发布时间:2024-06-01 08:03:520
- 申请号:CN202410334804.9
- 公开号:CN118098233A
- 语音识别的方法、装置、电子设备及可读存储介质公开日期:2025-07-11公开号:CN117116268A申请号:CN202311041475.0语音识别的方法、装置、电子设备及可读存储介质
- 发布时间:2023-11-27 07:18:580
- 申请号:CN202311041475.0
- 公开号:CN117116268A
- 一种语音合成方法和相关装置公开日期:2025-07-11公开号:CN116778903A申请号:CN202210223272.2一种语音合成方法和相关装置
- 发布时间:2023-09-24 07:14:440
- 申请号:CN202210223272.2
- 公开号:CN116778903A
- 一种音频检测方法、检测装置以及存储介质公开日期:2025-07-11公开号:CN116434772A申请号:CN202211566590.5一种音频检测方法、检测装置以及存储介质
- 发布时间:2023-07-16 07:20:000
- 申请号:CN202211566590.5
- 公开号:CN116434772A
- 语音处理方法、装置、设备以及存储介质公开日期:2025-07-11公开号:CN113823313A申请号:CN202110783691.7语音处理方法、装置、设备以及存储介质
- 发布时间:2023-07-06 10:55:460
- 申请号:CN202110783691.7
- 公开号:CN113823313A
- 语音信号处理方法、装置、设备及存储介质公开日期:2025-07-11公开号:CN113707162A申请号:CN202110226589.7语音信号处理方法、装置、设备及存储介质
- 发布时间:2023-07-01 07:10:580
- 申请号:CN202110226589.7
- 公开号:CN113707162A