发明

基于自我知识蒸馏的虚假音频检测方法及其系统

2023-06-27 09:33:15 发布于四川 0
  • 申请专利号:CN202310135374.3
  • 公开(公告)日:2025-07-15
  • 公开(公告)号:CN116312628A
  • 申请人:安徽大学
摘要:本发明公开了一种基于自我知识蒸馏的虚假音频检测方法,包括以下步骤:S1:提取原始语音波形的对数功率谱特征的F0子带作为虚假音频检测的输入特征;S2:采用深度神经网络对输入特征进行建模,计算标签和网络输出的损失,用以提取训练集的隐藏知识;S3:划分网络,计算所有浅层网络和最深层网络预测输出的损失,将最深层网络作为教师模型,浅层网络后端添加分类器构成学生模型,教师模型根据预测结果指导学生模型,用以增强浅层网络;S4:在特征维度,教师模型蒸馏知识到学生模型,用以平衡深浅层网络的特征差异。还公开了一种基于自我知识蒸馏的虚假音频检测系统。本发明能够显著提高虚假音频检测的准确率。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116312628 A (43)申请公布日 2023.06.23 (21)申请号 202310135374.3 (22)申请日 2023.02.09 (71)申请人 安徽大学 地址 230601 安徽省合肥市经济技术开发 区九龙路111号 (72)发明人 范存航 薛军 吕钊 裴胜兵  李平 张超  (74)专利代理机构 合肥市上嘉专利代理事务所 (普通合伙) 34125 专利代理师 李璐 (51)Int.Cl. G10L 25/51 (2013.01) G10L 25/30 (2013.01) G10L 25/21 (2013.01) 权利要求书2页 说明书6页 附图2页 (54)发明名称 基于自我知识蒸馏的虚假音频检测方法及 其系统 (57)摘要 本发明公开了一种基于自我知识蒸馏的虚 假音频检测方法,包括以下步骤:S1:提取原始语 音波形的对数功率谱特征的F0子带作为虚假音 频检测的输入特征;S2:采用深度神经网络对输 入特征进行建模,计算标签和网络输出的损失, 用以提取训练集的隐藏知识;S3:划分网络,计算 所有浅层网络和最深层网络预测输出的损失,将 最深层网络作为教师模型,浅层网络后端添加分 类器构成学生模型,教师模型根据预测结果指导 学生模型,用以增强浅层网络;S4:在特征维度, 教师模型蒸馏知识到学生模型,用以平衡深浅层 A 网络的特征差异。还公开了一种基于自我知识蒸

最新专利