语音活动检测模型的训练方法、语音活动检测方法及装置2025
- 申请专利号:CN202311049011.4
- 公开(公告)日:2025-09-16
- 公开(公告)号:CN116895289A
- 申请人:中国科学技术大学
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116895289 A (43)申请公布日 2023.10.17 (21)申请号 202311049011.4 (22)申请日 2023.08.18 (71)申请人 中国科学技术大学 地址 230026 安徽省合肥市包河区金寨路 96号 (72)发明人 张结 王景渊 周叶萍 刘沛奇 (74)专利代理机构 中科专利商标代理有限责任 公司 11021 专利代理师 鄢功军 (51)Int.Cl. G10L 25/87 (2013.01) G10L 25/30 (2013.01) G10L 25/03 (2013.01) 权利要求书2页 说明书16页 附图5页 (54)发明名称 语音活动检测模型的训练方法、语音活动检 测方法及装置 (57)摘要 本公开提供了一种语音活动检测模型的训 练方法、语音活动检测方法及装置。该训练方法 包括获取训练集,其中,训练集包括多个语音训 练样本;对语音训练样本进行转换处理,得到目 标对数梅尔谱特征;利用门控卷积层和最大池化 层处理目标对数梅尔谱特征,得到编码结果,卷 积编码模块包括门控卷积层、最大池化层和第一 全连接层;利用第一全连接层处理编码结果,得 到预测标签,预测标签表征语音训练样本中是否 存在语音信号 ;利用残差解码模块处理编码结 果,得到预测结果,初始语音检测模型包括卷积 A 编码模块和残差解码模块;将预测标签和预测结 9 果输入损失函数,输出损失结果 ;根据
原创力.专利