发明

基于时序多尺度特征表示学习的伪造语音检测方法及系统2024

2024-04-04 07:24:53 发布于四川 1
  • 申请专利号:CN202410024330.8
  • 公开(公告)日:2024-08-09
  • 公开(公告)号:CN117809694A
  • 申请人:哈尔滨理工大学
摘要:基于时序多尺度特征表示学习的伪造语音检测方法及系统,涉及一种伪造语音的检测方法及系统。为了解决没有充足利用语音各时序段特征信息的问题,以及现有的单一的深度神经网络进行伪造语音检测时存在的准确度较低的问题。本发明将预处理的语音信号输入wav2vec2.0提取初步特征,将初步特征矩阵输入基于多尺度时间序列的卷积网络提取特征矩阵,并将各组的输出进行拼接再通过一个最大池化层,然后将时序特征输入到SCG‑Res2Net50及分类器对语音进行打分,根据伪造语音的得分和真实语音得分进行真实语音与伪造语音的分类。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117809694 A (43)申请公布日 2024.04.02 (21)申请号 202410024330.8 (22)申请日 2024.01.08 (71)申请人 哈尔滨理工大学 地址 150080 黑龙江省哈尔滨市南岗区学 府路52号 (72)发明人 陈晨 白博超 麦凯钧 杨海陆  王莉莉 陈德运  (74)专利代理机构 哈尔滨市松花江联合专利商 标代理有限公司 23213 专利代理师 岳昕 (51)Int.Cl. G10L 25/51 (2013.01) G10L 25/30 (2013.01) G10L 21/0208 (2013.01) G10L 15/06 (2013.01) 权利要求书3页 说明书8页 附图4页 (54)发明名称 基于时序多尺度特征表示学习的伪造语音 检测方法及系统 (57)摘要 基于时序多尺度特征表示学习的伪造语音 检测方法及系统,涉及一种伪造语音的检测方法 及系统。为了解决没有充足利用语音各时序段特 征信息的问题,以及现有的单一的深度神经网络 进行伪造语音检测时存在的准确度较低的问题。 本发明将预处理的语音信号输入wav2vec2 .0提 取初步特征,将初步特征矩阵输入基于多尺度时 间序列的卷积网络提取特征矩阵,并将各组的输 出进行拼接再通过一个最大池化层,然后将时序 特征输入到SCG‑Res2Net50及分类器对

最新专利