发明

一种目标说话人分离系统、设备及存储介质

2023-06-30 07:01:17 发布于四川 1
  • 申请专利号:CN202210602186.2
  • 公开(公告)日:2023-03-17
  • 公开(公告)号:CN115035907A
  • 申请人:中国科学院自动化研究所
摘要:本发明提供一种目标说话人分离系统、电子设备及存储介质,系统包括:首先基于掩蔽的预训练策略对多种线索进行联合统一建模,提升模型对缺失线索的推断能力,并增强被扰动线索的表征精度;其次,构建层级化的线索调制模块。分别在初级线索调制模块中引入空间线索定向增强说话人语音;在中级线索调制模块中基于动态线索与听觉信号分量的时间相干性增强说话人语音;并在高级线索调制模块中引入稳态线索进行选择性过滤;最后,充分发挥仿真数据的有监督学习能力和真实混合数据的无监督学习效果,构建多线索约束下更高效的半监督学习方法。将“分离‑再混合”的无监督学习融入到线索驱动目标说话人分离框架下,提升系统在真实嘈杂环境下的自适应能力。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 115035907 A (43)申请公布日 2022.09.09 (21)申请号 202210602186.2 (22)申请日 2022.05.30 (71)申请人 中国科学院自动化研究所 地址 100190 北京市海淀区中关村东路95 号 (72)发明人 许家铭 崔鉴 徐波  (74)专利代理机构 北京华夏泰和知识产权代理 有限公司 11662 专利代理师 邓菊香 (51)Int.Cl. G10L 21/0308 (2013.01) G10L 15/22 (2006.01) 权利要求书2页 说明书11页 附图2页 (54)发明名称 一种目标说话人分离系统、设备及存储介质 (57)摘要 本发明提供一种目标说话人分离系统、电子 设备及存储介质,系统包括:首先基于掩蔽的预 训练策略对多种线索进行联合统一建模,提升模 型对缺失线索的推断能力,并增强被扰动线索的 表征精度;其次,构建层级化的线索调制模块。分 别在初级线索调制模块中引入空间线索定向增 强说话人语音;在中级线索调制模块中基于动态 线索与听觉信号分量的时间相干性增强说话人 语音;并在高级线索调制模块中引入稳态线索进 行选择性过滤;最后,充分发挥仿真数据的有监 督学习能力和真实混合数据的无监督学习效果, 构建多线索约束下更高效的半监督学习方法。将 A “分离‑再混合”的无监督学习融入到线索驱动目 7 标说话人分离框架下,提升系统在真实嘈杂环境 0 9 5 下的自

最新专利