发明

一种目标说话人分离系统、设备及存储介质

2023-06-30 07:01:17 发布于四川 822

申请专利号：CN202210602186.2
公开（公告）日：2023-03-17
公开（公告）号：CN115035907A
申请人：中国科学院自动化研究所

摘要：本发明提供一种目标说话人分离系统、电子设备及存储介质，系统包括：首先基于掩蔽的预训练策略对多种线索进行联合统一建模，提升模型对缺失线索的推断能力，并增强被扰动线索的表征精度；其次，构建层级化的线索调制模块。分别在初级线索调制模块中引入空间线索定向增强说话人语音；在中级线索调制模块中基于动态线索与听觉信号分量的时间相干性增强说话人语音；并在高级线索调制模块中引入稳态线索进行选择性过滤；最后，充分发挥仿真数据的有监督学习能力和真实混合数据的无监督学习效果，构建多线索约束下更高效的半监督学习方法。将“分离‑再混合”的无监督学习融入到线索驱动目标说话人分离框架下，提升系统在真实嘈杂环境下的自适应能力。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 115035907 A (43)申请公布日 2022.09.09 (21)申请号 202210602186.2 (22)申请日 2022.05.30 (71)申请人中国科学院自动化研究所地址 100190 北京市海淀区中关村东路95 号 (72)发明人许家铭　崔鉴　徐波　 (74)专利代理机构北京华夏泰和知识产权代理有限公司 11662 专利代理师邓菊香 (51)Int.Cl. G10L 21/0308 (2013.01) G10L 15/22 (2006.01) 权利要求书2页说明书11页附图2页 (54)发明名称一种目标说话人分离系统、设备及存储介质 (57)摘要本发明提供一种目标说话人分离系统、电子设备及存储介质，系统包括：首先基于掩蔽的预训练策略对多种线索进行联合统一建模，提升模型对缺失线索的推断能力，并增强被扰动线索的表征精度；其次，构建层级化的线索调制模块。分别在初级线索调制模块中引入空间线索定向增强说话人语音；在中级线索调制模块中基于动态线索与听觉信号分量的时间相干性增强说话人语音；并在高级线索调制模块中引入稳态线索进行选择性过滤；最后，充分发挥仿真数据的有监督学习能力和真实混合数据的无监督学习效果，构建多线索约束下更高效的半监督学习方法。将 A “分离‑再混合”的无监督学习融入到线索驱动目 7 标说话人分离框架下，提升系统在真实嘈杂环境 0 9 5 下的自

一种目标说话人分离系统、设备及存储介质

专利内容

最新专利

相关专利