课堂中不同声音的区分方法、装置、设备以及存储介质
- 申请专利号:CN202210339090.1
- 公开(公告)日:2025-04-04
- 公开(公告)号:CN114822557A
- 申请人:北京中庆现代技术股份有限公司
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114822557 A (43)申请公布日 2022.07.29 (21)申请号 202210339090.1 (22)申请日 2022.04.01 (71)申请人 北京中庆现代技术股份有限公司 地址 100089 北京市海淀区西北旺镇丰豪 东路9号院2号楼5单元901 (72)发明人 孙德宇 谷娜娜 (74)专利代理机构 北京维正专利代理有限公司 11508 专利代理师 赵万凯 (51)Int.Cl. G10L 17/02 (2013.01) G10L 17/04 (2013.01) G10L 17/14 (2013.01) G06K 9/62 (2022.01) 权利要求书2页 说明书9页 附图3页 (54)发明名称 课堂中不同声音的区分方法、装置、设备以 及存储介质 (57)摘要 本申请涉及一种课堂中不同声音的区分方 法、装置、设备以及存储介质,涉及声音分类的技 术领域,其方法包括采集课堂声音,将课堂声音 输入至训练好的声纹模型中,得到多段声音片段 的声纹向量;根据声纹向量,判断与声纹向量对 应的声音片段是否为非教师声音;若是,则将声 纹向量输入至训练好的声音分类模型中,根据声 纹向量,对与声纹向量对应的声音片段进行分 类;其中,声音分类模型的训练方法,包括:提取 训练样本集中每一个训练样本的梅尔谱特征;将 梅尔谱特征转化为二维的梅尔频谱图;将梅尔频 A 谱图输入至声音分类模型中,利用
最新专利
- 基于深度学习复合模型的环境声音识别方法及装置公开日期:2025-04-15公开号:CN117351995A申请号:CN202311247442.1基于深度学习复合模型的环境声音识别方法及装置
- 发布时间:2024-01-08 07:14:100
- 申请号:CN202311247442.1
- 公开号:CN117351995A
- 一种语音对抗样本生成方法、装置、终端设备及介质公开日期:2025-04-15公开号:CN117037843A申请号:CN202311165130.6一种语音对抗样本生成方法、装置、终端设备及介质
- 发布时间:2023-11-16 07:30:520
- 申请号:CN202311165130.6
- 公开号:CN117037843A
- 集线器设备、包括集线器设备和多个设备的多设备系统及其操作方法公开日期:2025-04-15公开号:CN113748458A申请号:CN202080031822.X集线器设备、包括集线器设备和多个设备的多设备系统及其操作方法
- 发布时间:2023-07-03 10:43:180
- 申请号:CN202080031822.X
- 公开号:CN113748458A
- 发音特征处理方法、装置、服务器及介质公开日期:2025-04-15公开号:CN113409770A申请号:CN202011345646.5发音特征处理方法、装置、服务器及介质
- 发布时间:2023-06-23 08:06:480
- 申请号:CN202011345646.5
- 公开号:CN113409770A
- 用于语音识别训练和评分的音译公开日期:2025-04-15公开号:CN113396455A申请号:CN201980082043.X用于语音识别训练和评分的音译
- 发布时间:2023-06-23 08:00:530
- 申请号:CN201980082043.X
- 公开号:CN113396455A
- 轻量级时域卷积网络语音增强方法与系统公开日期:2025-04-15公开号:CN112331224A申请号:CN202011329491.6轻量级时域卷积网络语音增强方法与系统
- 发布时间:2023-05-28 13:18:450
- 申请号:CN202011329491.6
- 公开号:CN112331224A