发明

跨语句条件相干的语音编辑方法、系统及终端

2023-06-02 12:54:34 发布于四川 1
  • 申请专利号:CN202310146999.X
  • 公开(公告)日:2025-07-22
  • 公开(公告)号:CN116189653A
  • 申请人:上海科技大学
摘要:本发明的跨语句条件相干的语音编辑方法、系统及终端,通过具有将语音输入信息中的音频特征和上下文语义信息作为条件输入的变分自动编码器以及解码器的语音编辑模型,根据待编辑的语音信息获得对应的编辑梅尔谱图,能够高保真地重建原始波形的未修改区域。通过使用整体推断而非部分推断,拼接导致的衔接处不连贯得以被彻底避免。此外,与现有的部分推理编辑系统相比,本发明的整体推理方法不会消耗额外的资源。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116189653 A (43)申请公布日 2023.05.30 (21)申请号 202310146999.X G10L 19/04 (2013.01) G10L 19/20 (2013.01) (22)申请日 2023.02.21 G10L 25/03 (2013.01) (66)本国优先权数据 202310072603.1 2023.01.13 CN (71)申请人 上海科技大学 地址 201210 上海市浦东新区华夏中路393 号 (72)发明人 郁程 李阳 祖伟钦 孙芳蕾  田政 汪军  (74)专利代理机构 上海光华专利事务所(普通 合伙) 31219 专利代理师 倪静 (51)Int.Cl. G10L 13/033 (2013.01) G10L 13/08 (2013.01) 权利要求书2页 说明书12页 附图3页 (54)发明名称 跨语句条件相干的语音编辑方法、系统及终 端 (57)摘要 本发明的跨语句条件相干的语音编辑方法、 系统及终端,通过具有将语音输入信息中的音频 特征和上下文语义信息作为条件输入的变分自 动编码器以及解码器的语音编辑模型,根据待编 辑的语音信息

最新专利