发明

一种基于多种设备有监督域自适应的声场景分类方法

2023-07-06 10:33:02 发布于四川 8
  • 申请专利号:CN202310369908.9
  • 公开(公告)日:2025-06-06
  • 公开(公告)号:CN116386599A
  • 申请人:桂林电子科技大学
摘要:本发明属于声音场景分类领域,具体是指一种基于多种设备有监督域自适应的声场景分类方法,其特征在于,包括如下步骤,S1:对场景音频信号进行预处理;S2:进行傅里叶变换,进行梅尔滤波处理,再进行频段标准化修正,提取三个特征频谱图,融合三个特征频谱图得到三维声学特征。S3:将步骤S2得到的三维声学特征输入数据增强模块,得到经过数据增强后的三维声学特征;S4:构建有监督域自适应声场景分类模型;S5:进行有监督训练,得到训练好的有监督域自适应声场景分类模型;S6:得到分类结果。本发明具有结构简单、分类效果好、适应范围广的优点。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116386599 A (43)申请公布日 2023.07.04 (21)申请号 202310369908.9 (22)申请日 2023.04.10 (71)申请人 桂林电子科技大学 地址 541004 广西壮族自治区桂林市七星 区金鸡路1号 (72)发明人 罗丽燕 王玫 刘展奇 仇洪冰  宋浠瑜 杨含悦 樊小青  (74)专利代理机构 桂林市华杰专利商标事务所 有限责任公司 45112 专利代理师 杨雪梅 (51)Int.Cl. G10L 15/02 (2006.01) G10L 15/16 (2006.01) G06N 3/09 (2023.01) 权利要求书2页 说明书6页 附图3页 (54)发明名称 一种基于多种设备有监督域自适应的声场 景分类方法 (57)摘要 本发明属于声音场景分类领域,具体是指一 种基于多种设备有监督域自适应的声场景分类 方法,其特征在于,包括如下步骤,S1 :对场景音 频信号进行预处理;S2:进行傅里叶变换,进行梅 尔滤波处理,再进行频段标准化修正,提取三个 特征频谱图,融合三个特征频谱图得到三维声学 特征。S3:将步骤S2得到的三维声学特征输入数 据增强模块,得到经过数据增强后的三维声学特 征;S4 :构建有监督域自适应声场景分类模型 ; S5:进行有监督训练,得到训练好的有监督域自 适应声场景分类模型;S6:得到分类结果。本发明 A 具有结构

最新专利