基于波形和频域信息融合网络的声音信号增强方法及装置
- 申请专利号:CN202210627965.8
- 公开(公告)日:2024-10-29
- 公开(公告)号:CN114783457A
- 申请人:中国科学院半导体研究所
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114783457 A (43)申请公布日 2022.07.22 (21)申请号 202210627965.8 (22)申请日 2022.06.01 (71)申请人 中国科学院半导体研究所 地址 100083 北京市海淀区清华东路甲35 号 (72)发明人 郭慧敏 鉴海防 王洪昌 朱文旗 李文昌 (74)专利代理机构 中科专利商标代理有限责任 公司 11021 专利代理师 孙蕾 (51)Int.Cl. G10L 21/0216 (2013.01) G10L 21/0224 (2013.01) G10L 21/0232 (2013.01) 权利要求书3页 说明书14页 附图6页 (54)发明名称 基于波形和频域信息融合网络的声音信号 增强方法及装置 (57)摘要 本公开提供了一种基于波形和频域信息融 合网络的声音信号增强方法及装置。该方法包括 获取声音训练样本集,其中,声音训练样本集包 括多个声音训练样本和对应的标签数据,每个声 音训练样本包括训练声音信号和训练幅度谱;将 声音训练样本输入初始融合网络模型,输出增强 后的训练声音数据,其中,初始融合网络模型为 用于融合声音信号时域信息和频域信息的多模 态融合网络模型;根据标签数据和增强后的训练 声音数据计算损失函数,得到损失结果;根据损 失结果迭代地调整初始融合网络模型的网络参 A 数,生成经训练的多模态融合网络模型;将待增
最新专利
- 一种文本生成音频方法及系统公开日期:2025-04-01公开号:CN117854475A申请号:CN202311844353.5一种文本生成音频方法及系统
- 发布时间:2024-04-11 07:27:280
- 申请号:CN202311844353.5
- 公开号:CN117854475A
- 语音数据的处理方法、装置、电子设备和可读存储介质公开日期:2025-04-01公开号:CN116564269A申请号:CN202310595157.2语音数据的处理方法、装置、电子设备和可读存储介质
- 发布时间:2023-08-11 23:08:340
- 申请号:CN202310595157.2
- 公开号:CN116564269A
- 一种基于覆膜机的薄膜收卷降噪机构公开日期:2025-04-01公开号:CN113870822A申请号:CN202111136811.0一种基于覆膜机的薄膜收卷降噪机构
- 发布时间:2023-07-09 07:08:080
- 申请号:CN202111136811.0
- 公开号:CN113870822A
- 一种音乐视频生成方法、装置、电子设备及存储介质公开日期:2025-04-01公开号:CN116386659A申请号:CN202310118537.7一种音乐视频生成方法、装置、电子设备及存储介质
- 发布时间:2023-07-06 10:27:590
- 申请号:CN202310118537.7
- 公开号:CN116386659A
- 一种古筝可调节指套公开日期:2025-04-01公开号:CN113450739A申请号:CN202110789963.4一种古筝可调节指套
- 发布时间:2023-06-23 08:29:140
- 申请号:CN202110789963.4
- 公开号:CN113450739A
- 发送装置、发送方法、接收装置和接收方法公开日期:2025-04-01公开号:CN113454712A申请号:CN202080015649.4发送装置、发送方法、接收装置和接收方法
- 发布时间:2023-06-23 08:26:100
- 申请号:CN202080015649.4
- 公开号:CN113454712A