一种目标说话人分离系统、设备及存储介质
- 申请专利号:CN202210602186.2
- 公开(公告)日:2023-03-17
- 公开(公告)号:CN115035907A
- 申请人:中国科学院自动化研究所
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 115035907 A (43)申请公布日 2022.09.09 (21)申请号 202210602186.2 (22)申请日 2022.05.30 (71)申请人 中国科学院自动化研究所 地址 100190 北京市海淀区中关村东路95 号 (72)发明人 许家铭 崔鉴 徐波 (74)专利代理机构 北京华夏泰和知识产权代理 有限公司 11662 专利代理师 邓菊香 (51)Int.Cl. G10L 21/0308 (2013.01) G10L 15/22 (2006.01) 权利要求书2页 说明书11页 附图2页 (54)发明名称 一种目标说话人分离系统、设备及存储介质 (57)摘要 本发明提供一种目标说话人分离系统、电子 设备及存储介质,系统包括:首先基于掩蔽的预 训练策略对多种线索进行联合统一建模,提升模 型对缺失线索的推断能力,并增强被扰动线索的 表征精度;其次,构建层级化的线索调制模块。分 别在初级线索调制模块中引入空间线索定向增 强说话人语音;在中级线索调制模块中基于动态 线索与听觉信号分量的时间相干性增强说话人 语音;并在高级线索调制模块中引入稳态线索进 行选择性过滤;最后,充分发挥仿真数据的有监 督学习能力和真实混合数据的无监督学习效果, 构建多线索约束下更高效的半监督学习方法。将 A “分离‑再混合”的无监督学习融入到线索驱动目 7 标说话人分离框架下,提升系统在真实嘈杂环境 0 9 5 下的自
最新专利
- 基于改进的INMF的声学降噪方法及装置公开日期:2025-06-06公开号:CN116778945A申请号:CN202310562147.9基于改进的INMF的声学降噪方法及装置
- 发布时间:2023-09-24 07:18:030
- 申请号:CN202310562147.9
- 公开号:CN116778945A
- 车载语音信号的反馈方法、装置、电子设备及存储介质公开日期:2025-06-06公开号:CN116612756A申请号:CN202310606468.4车载语音信号的反馈方法、装置、电子设备及存储介质
- 发布时间:2023-08-21 07:09:460
- 申请号:CN202310606468.4
- 公开号:CN116612756A
- 一种基于多种设备有监督域自适应的声场景分类方法公开日期:2025-06-06公开号:CN116386599A申请号:CN202310369908.9一种基于多种设备有监督域自适应的声场景分类方法
- 发布时间:2023-07-06 10:33:020
- 申请号:CN202310369908.9
- 公开号:CN116386599A
- 一种基于云边协同的野外鸟类监测系统和方法公开日期:2025-06-06公开号:CN116386649A申请号:CN202310367657.0一种基于云边协同的野外鸟类监测系统和方法
- 发布时间:2023-07-06 10:32:550
- 申请号:CN202310367657.0
- 公开号:CN116386649A
- 一种篇章级别多尺度文本韵律分析方法、装置和设备公开日期:2025-06-06公开号:CN116386595A申请号:CN202310347958.7一种篇章级别多尺度文本韵律分析方法、装置和设备
- 发布时间:2023-07-06 10:31:550
- 申请号:CN202310347958.7
- 公开号:CN116386595A
- 在语音识别结果中实时地提供提示公开日期:2025-06-06公开号:CN113763943A申请号:CN202010517639.2在语音识别结果中实时地提供提示
- 发布时间:2023-07-03 10:58:590
- 申请号:CN202010517639.2
- 公开号:CN113763943A