发明

语音活动检测模型的训练方法、语音活动检测方法及装置2025

2023-10-22 07:17:34 发布于四川 1
  • 申请专利号:CN202311049011.4
  • 公开(公告)日:2025-09-16
  • 公开(公告)号:CN116895289A
  • 申请人:中国科学技术大学
摘要:本公开提供了一种语音活动检测模型的训练方法、语音活动检测方法及装置。该训练方法包括获取训练集,其中,训练集包括多个语音训练样本;对语音训练样本进行转换处理,得到目标对数梅尔谱特征;利用门控卷积层和最大池化层处理目标对数梅尔谱特征,得到编码结果,卷积编码模块包括门控卷积层、最大池化层;利用第一全连接层处理编码结果,得到预测标签,预测标签表征语音训练样本中是否存在语音信号;利用残差解码模块处理编码结果,得到预测结果;将预测标签和预测结果输入损失函数,输出损失结果;根据损失结果迭代地调整初始语音检测模型的网络参数,得到经训练的语音活动检测模型,初始语音检测模型包括卷积编码模块、第一全连接层和残差解码模块。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116895289 A (43)申请公布日 2023.10.17 (21)申请号 202311049011.4 (22)申请日 2023.08.18 (71)申请人 中国科学技术大学 地址 230026 安徽省合肥市包河区金寨路 96号 (72)发明人 张结 王景渊 周叶萍 刘沛奇  (74)专利代理机构 中科专利商标代理有限责任 公司 11021 专利代理师 鄢功军 (51)Int.Cl. G10L 25/87 (2013.01) G10L 25/30 (2013.01) G10L 25/03 (2013.01) 权利要求书2页 说明书16页 附图5页 (54)发明名称 语音活动检测模型的训练方法、语音活动检 测方法及装置 (57)摘要 本公开提供了一种语音活动检测模型的训 练方法、语音活动检测方法及装置。该训练方法 包括获取训练集,其中,训练集包括多个语音训 练样本;对语音训练样本进行转换处理,得到目 标对数梅尔谱特征;利用门控卷积层和最大池化 层处理目标对数梅尔谱特征,得到编码结果,卷 积编码模块包括门控卷积层、最大池化层和第一 全连接层;利用第一全连接层处理编码结果,得 到预测标签,预测标签表征语音训练样本中是否 存在语音信号 ;利用残差解码模块处理编码结 果,得到预测结果,初始语音检测模型包括卷积 A 编码模块和残差解码模块;将预测标签和预测结 9 果输入损失函数,输出损失结果 ;根据

最新专利