发明

一种基于N元非自回归语音合成方法、装置及电子设备

2023-04-22 09:06:33 发布于四川 1
  • 申请专利号:CN202111096326.5
  • 公开(公告)日:2024-12-13
  • 公开(公告)号:CN113920981A
  • 申请人:北京百舸飞驰科技有限公司
摘要:本发明属于数据信息处理技术领域,提供一种基于N元非自回归语音合成方法方法、装置、电子设备和记录介质,方法包括:获取待合成的文本内容,对所述待合成的文本内容进行标准化处理;将标准化处理后的所述待合成的文本内容输入基于N元非自回归的语音模型,输出精细化梅尔谱,其中N为自然整数;将所述精细化梅尔谱转为语音合成文件。本发明将常规的非自回归网络的预测任务减少为原来的1/n,大大降低了梅尔特征解码器的工作要求,同时还提升了模型的鲁棒性。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113920981 A (43)申请公布日 2022.01.11 (21)申请号 202111096326.5 G10L 19/04 (2013.01) (22)申请日 2021.09.17 (71)申请人 作业帮教育科技(北京)有限公司 地址 100085 北京市海淀区上地信息产业 基地开拓路1号4层4002 (72)发明人 付涛 王鹏 王强强 宋旸  (74)专利代理机构 北京清诚知识产权代理有限 公司 11691 代理人 李博 (51)Int.Cl. G10L 13/047 (2013.01) G10L 13/04 (2013.01) G10L 13/08 (2013.01) G10L 25/24 (2013.01) G10L 25/30 (2013.01) 权利要求书1页 说明书9页 附图3页 (54)发明名称 一种基于N元非自回归语音合成方法、装置 及电子设备 (57)摘要 本发明属于数据信息处理技术领域,提供一 种基于N元非自回归语音合成方法方法、装置、电 子设备和记录介质,方法包括:获取待合成的文 本内容,对所述待合成的文本内容进行标准化处 理;将标准化处理后的所述待合成的文本内容输 入基于N元非自回归的语音模型,输出精细化梅 尔谱,其中N为自然整数;将所述精细化梅尔谱转 为语音合成文件。本发明将常规的非

最新专利