发明

一种基于多种设备有监督域自适应的声场景分类方法

2023-07-06 10:33:02 发布于四川 11

申请专利号：CN202310369908.9
公开（公告）日：2025-06-06
公开（公告）号：CN116386599A
申请人：桂林电子科技大学

摘要：本发明属于声音场景分类领域，具体是指一种基于多种设备有监督域自适应的声场景分类方法，其特征在于，包括如下步骤，S1：对场景音频信号进行预处理；S2：进行傅里叶变换，进行梅尔滤波处理，再进行频段标准化修正，提取三个特征频谱图，融合三个特征频谱图得到三维声学特征。S3：将步骤S2得到的三维声学特征输入数据增强模块，得到经过数据增强后的三维声学特征；S4：构建有监督域自适应声场景分类模型；S5：进行有监督训练，得到训练好的有监督域自适应声场景分类模型；S6：得到分类结果。本发明具有结构简单、分类效果好、适应范围广的优点。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116386599 A (43)申请公布日 2023.07.04 (21)申请号 202310369908.9 (22)申请日 2023.04.10 (71)申请人桂林电子科技大学地址 541004 广西壮族自治区桂林市七星区金鸡路1号 (72)发明人罗丽燕　王玫　刘展奇　仇洪冰　宋浠瑜　杨含悦　樊小青　 (74)专利代理机构桂林市华杰专利商标事务所有限责任公司 45112 专利代理师杨雪梅 (51)Int.Cl. G10L 15/02 (2006.01) G10L 15/16 (2006.01) G06N 3/09 (2023.01) 权利要求书2页说明书6页附图3页 (54)发明名称一种基于多种设备有监督域自适应的声场景分类方法 (57)摘要本发明属于声音场景分类领域，具体是指一种基于多种设备有监督域自适应的声场景分类方法，其特征在于，包括如下步骤，S1 ：对场景音频信号进行预处理；S2：进行傅里叶变换，进行梅尔滤波处理，再进行频段标准化修正，提取三个特征频谱图，融合三个特征频谱图得到三维声学特征。S3：将步骤S2得到的三维声学特征输入数据增强模块，得到经过数据增强后的三维声学特征；S4 ：构建有监督域自适应声场景分类模型； S5：进行有监督训练，得到训练好的有监督域自适应声场景分类模型；S6：得到分类结果。本发明 A 具有结构

一种基于多种设备有监督域自适应的声场景分类方法

专利内容

最新专利

相关专利