发明

基于波形和频域信息融合网络的声音信号增强方法及装置

2023-05-17 11:47:44 发布于四川 1

申请专利号：CN202210627965.8
公开（公告）日：2024-10-29
公开（公告）号：CN114783457A
申请人：中国科学院半导体研究所

摘要：本公开提供了一种基于波形和频域信息融合网络的声音信号增强方法及装置。该方法包括获取声音训练样本集，其中，声音训练样本集包括多个声音训练样本和对应的标签数据，每个声音训练样本包括训练声音信号和训练幅度谱；将声音训练样本输入初始融合网络模型，输出增强后的训练声音数据，其中，初始融合网络模型为用于融合声音信号时域信息和频域信息的多模态融合网络模型；根据标签数据和增强后的训练声音数据计算损失函数，得到损失结果；根据损失结果迭代地调整初始融合网络模型的网络参数，生成经训练的多模态融合网络模型；将待增强的声音信号输入多模态融合网络模型，输出增强的语音信号。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114783457 A (43)申请公布日 2022.07.22 (21)申请号 202210627965.8 (22)申请日 2022.06.01 (71)申请人中国科学院半导体研究所地址 100083 北京市海淀区清华东路甲35 号 (72)发明人郭慧敏　鉴海防　王洪昌　朱文旗　李文昌　 (74)专利代理机构中科专利商标代理有限责任公司 11021 专利代理师孙蕾 (51)Int.Cl. G10L 21/0216 (2013.01) G10L 21/0224 (2013.01) G10L 21/0232 (2013.01) 权利要求书3页说明书14页附图6页 (54)发明名称基于波形和频域信息融合网络的声音信号增强方法及装置 (57)摘要本公开提供了一种基于波形和频域信息融合网络的声音信号增强方法及装置。该方法包括获取声音训练样本集，其中，声音训练样本集包括多个声音训练样本和对应的标签数据，每个声音训练样本包括训练声音信号和训练幅度谱；将声音训练样本输入初始融合网络模型，输出增强后的训练声音数据，其中，初始融合网络模型为用于融合声音信号时域信息和频域信息的多模态融合网络模型；根据标签数据和增强后的训练声音数据计算损失函数，得到损失结果；根据损失结果迭代地调整初始融合网络模型的网络参 A 数，生成经训练的多模态融合网络模型；将待增

基于波形和频域信息融合网络的声音信号增强方法及装置

专利内容

最新专利

相关专利