一种基于不确定度的集成自监督说话人识别方法
- 申请专利号:CN202310476907.4
- 公开(公告)日:2025-05-13
- 公开(公告)号:CN116386646A
- 申请人:南京邮电大学
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116386646 A (43)申请公布日 2023.07.04 (21)申请号 202310476907.4 (22)申请日 2023.04.28 (71)申请人 南京邮电大学 地址 210003 江苏省南京市鼓楼区新模范 马路66号 (72)发明人 季薇 杨茗淇 李云 (74)专利代理机构 南京正联知识产权代理有限 公司 32243 专利代理师 王素琴 (51)Int.Cl. G10L 17/02 (2013.01) G10L 17/04 (2013.01) G10L 17/18 (2013.01) 权利要求书3页 说明书6页 附图2页 (54)发明名称 一种基于不确定度的集成自监督说话人识 别方法 (57)摘要 本发明属于说话人识别技术领域,公开了一 种基于不确定度的集成自监督的语音学习方法, 应用于说话人识别学习任务,本发明采用大量无 标签数据对掩蔽自监督模型、对比自监督模型以 及自回归预测自监督模型进行预训练,并将语音 数据的梅尔语谱图特征结果分别输入三个自监 督模型中,提取模型最后一层的输出,将其作为 全连接层的输入,并将全连接层的输出经过ReLU 激活函数计算得到各模型下输入语音数据的证 据,通过得到的证据以及狄利克雷分布参数,计 算出各个自监督模型输出的置信质量和不确定 A 度,使用Dempster规则将三个自监督模型输出的 6 分类决策质量集进行融合,从而得到每个类的最
最新专利
- 具有空间元数据输出的音乐合成器公开日期:2025-06-17公开号:CN117897765A申请号:CN202280059728.4具有空间元数据输出的音乐合成器
- 发布时间:2024-04-21 07:14:360
- 申请号:CN202280059728.4
- 公开号:CN117897765A
- 一种基于粗糙颈管亥姆霍兹共振器的低频宽带通风管道消声器公开日期:2025-06-17公开号:CN116386579A申请号:CN202310190513.2一种基于粗糙颈管亥姆霍兹共振器的低频宽带通风管道消声器
- 发布时间:2023-07-06 10:28:390
- 申请号:CN202310190513.2
- 公开号:CN116386579A
- 一种变压器噪声的多通道分布式有源噪声控制系统公开日期:2025-06-17公开号:CN116364044A申请号:CN202310100414.0一种变压器噪声的多通道分布式有源噪声控制系统
- 发布时间:2023-07-03 10:04:240
- 申请号:CN202310100414.0
- 公开号:CN116364044A
- 一种折叠型卷曲通道声学消音器公开日期:2025-06-17公开号:CN116312440A申请号:CN202310254819.X一种折叠型卷曲通道声学消音器
- 发布时间:2023-06-27 09:41:390
- 申请号:CN202310254819.X
- 公开号:CN116312440A
- 基于穿孔板的通风消声器公开日期:2025-06-17公开号:CN116312439A申请号:CN202310254818.5基于穿孔板的通风消声器
- 发布时间:2023-06-27 09:41:390
- 申请号:CN202310254818.5
- 公开号:CN116312439A
- 多声道音频信号的编码公开日期:2025-06-17公开号:CN113035212A申请号:CN202110304954.1多声道音频信号的编码
- 发布时间:2023-06-14 12:16:290
- 申请号:CN202110304954.1
- 公开号:CN113035212A