发明

课堂中不同声音的区分方法、装置、设备以及存储介质

2023-05-17 11:56:27 发布于四川 0

申请专利号：CN202210339090.1
公开（公告）日：2025-04-04
公开（公告）号：CN114822557A
申请人：北京中庆现代技术股份有限公司

摘要：本申请涉及一种课堂中不同声音的区分方法、装置、设备以及存储介质，涉及声音分类的技术领域，其方法包括采集课堂声音，将课堂声音输入至训练好的声纹模型中，得到多段声音片段的声纹向量；根据声纹向量，判断与声纹向量对应的声音片段是否为非教师声音；若是，则将声纹向量输入至训练好的声音分类模型中，根据声纹向量，对与声纹向量对应的声音片段进行分类；其中，声音分类模型的训练方法，包括：提取训练样本集中每一个训练样本的梅尔谱特征；将梅尔谱特征转化为二维的梅尔频谱图；将梅尔频谱图输入至声音分类模型中，利用VGG11网络结构对声音分类模型进行训练。本申请具有区分出课堂中的不同声音的效果。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114822557 A (43)申请公布日 2022.07.29 (21)申请号 202210339090.1 (22)申请日 2022.04.01 (71)申请人北京中庆现代技术股份有限公司地址 100089 北京市海淀区西北旺镇丰豪东路9号院2号楼5单元901 (72)发明人孙德宇　谷娜娜　 (74)专利代理机构北京维正专利代理有限公司 11508 专利代理师赵万凯 (51)Int.Cl. G10L 17/02 (2013.01) G10L 17/04 (2013.01) G10L 17/14 (2013.01) G06K 9/62 (2022.01) 权利要求书2页说明书9页附图3页 (54)发明名称课堂中不同声音的区分方法、装置、设备以及存储介质 (57)摘要本申请涉及一种课堂中不同声音的区分方法、装置、设备以及存储介质，涉及声音分类的技术领域，其方法包括采集课堂声音，将课堂声音输入至训练好的声纹模型中，得到多段声音片段的声纹向量；根据声纹向量，判断与声纹向量对应的声音片段是否为非教师声音；若是，则将声纹向量输入至训练好的声音分类模型中，根据声纹向量，对与声纹向量对应的声音片段进行分类；其中，声音分类模型的训练方法，包括：提取训练样本集中每一个训练样本的梅尔谱特征；将梅尔谱特征转化为二维的梅尔频谱图；将梅尔频 A 谱图输入至声音分类模型中，利用

课堂中不同声音的区分方法、装置、设备以及存储介质

专利内容

最新专利

相关专利