一种基于多种设备有监督域自适应的声场景分类方法
- 申请专利号:CN202310369908.9
- 公开(公告)日:2025-06-06
- 公开(公告)号:CN116386599A
- 申请人:桂林电子科技大学
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116386599 A (43)申请公布日 2023.07.04 (21)申请号 202310369908.9 (22)申请日 2023.04.10 (71)申请人 桂林电子科技大学 地址 541004 广西壮族自治区桂林市七星 区金鸡路1号 (72)发明人 罗丽燕 王玫 刘展奇 仇洪冰 宋浠瑜 杨含悦 樊小青 (74)专利代理机构 桂林市华杰专利商标事务所 有限责任公司 45112 专利代理师 杨雪梅 (51)Int.Cl. G10L 15/02 (2006.01) G10L 15/16 (2006.01) G06N 3/09 (2023.01) 权利要求书2页 说明书6页 附图3页 (54)发明名称 一种基于多种设备有监督域自适应的声场 景分类方法 (57)摘要 本发明属于声音场景分类领域,具体是指一 种基于多种设备有监督域自适应的声场景分类 方法,其特征在于,包括如下步骤,S1 :对场景音 频信号进行预处理;S2:进行傅里叶变换,进行梅 尔滤波处理,再进行频段标准化修正,提取三个 特征频谱图,融合三个特征频谱图得到三维声学 特征。S3:将步骤S2得到的三维声学特征输入数 据增强模块,得到经过数据增强后的三维声学特 征;S4 :构建有监督域自适应声场景分类模型 ; S5:进行有监督训练,得到训练好的有监督域自 适应声场景分类模型;S6:得到分类结果。本发明 A 具有结构
最新专利
- 一种模型训练方法、唤醒方法、装置及存储介质公开日期:2025-07-04公开号:CN117594046A申请号:CN202311360531.7一种模型训练方法、唤醒方法、装置及存储介质
- 发布时间:2024-03-02 07:34:220
- 申请号:CN202311360531.7
- 公开号:CN117594046A
- 语音增强公开日期:2025-07-04公开号:CN113870878A申请号:CN202010617322.6语音增强
- 发布时间:2023-07-07 07:11:560
- 申请号:CN202010617322.6
- 公开号:CN113870878A
- 一种基于语音特征的抑郁症检测方法公开日期:2025-07-04公开号:CN116364116A申请号:CN202211474725.5一种基于语音特征的抑郁症检测方法
- 发布时间:2023-07-03 10:02:420
- 申请号:CN202211474725.5
- 公开号:CN116364116A
- 用于文本到语音转换分析的持续时间知悉网络公开日期:2025-07-04公开号:CN113711305A申请号:CN202080028696.2用于文本到语音转换分析的持续时间知悉网络
- 发布时间:2023-07-01 07:10:390
- 申请号:CN202080028696.2
- 公开号:CN113711305A
- 语音的控制方法、装置、终端设备及计算机可读存储介质公开日期:2025-07-04公开号:CN112435665A申请号:CN202011326408.X语音的控制方法、装置、终端设备及计算机可读存储介质
- 发布时间:2023-06-02 12:02:250
- 申请号:CN202011326408.X
- 公开号:CN112435665A
- 语音数据处理方法及装置、语音数据处理系统及电子设备公开日期:2025-07-04公开号:CN114913879A申请号:CN202110169539.X语音数据处理方法及装置、语音数据处理系统及电子设备
- 发布时间:2023-05-20 10:59:240
- 申请号:CN202110169539.X
- 公开号:CN114913879A