发明

音频合成方法和装置、存储介质及电子设备

2023-07-03 11:01:18 发布于四川 0
  • 申请专利号:CN202110517152.9
  • 公开(公告)日:2025-08-12
  • 公开(公告)号:CN113763922A
  • 申请人:腾讯科技(深圳)有限公司
摘要:本发明公开了一种音频合成方法和装置、存储介质及电子设备。其中,该方法包括:获取待处理的文本序列;将文本序列转换为抽象特征序列;将抽象特征序列输入具有单调性约束条件的权重分配网络,以得到抽象特征序列对应的语境向量,其中,权重分配网络是基于离散化的混合逻辑分布结构所构建的网络;获取与语境向量匹配的音频频谱信息;利用音频频谱信息合成与文本序列匹配的目标音频。本发明解决了由于音频合成模型不稳定造成的合成音频准确性较低的技术问题。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113763922 A (43)申请公布日 2021.12.07 (21)申请号 202110517152.9 (22)申请日 2021.05.12 (71)申请人 腾讯科技(深圳)有限公司 地址 518000 广东省深圳市南山区高新区 科技中一路腾讯大厦35层 (72)发明人 张泽旺  (74)专利代理机构 北京康信知识产权代理有限 责任公司 11240 代理人 周婷婷 (51)Int.Cl. G10L 13/08 (2013.01) G10L 13/027 (2013.01) G10L 25/30 (2013.01) 权利要求书3页 说明书13页 附图8页 (54)发明名称 音频合成方法和装置、存储介质及电子设备 (57)摘要 本发明公开了一种音频合成方法和装置、存 储介质及电子设备。其中,该方法包括:获取待处 理的文本序列;将文本序列转换为抽象特征序 列;将抽象特征序列输入具有单调性约束条件的 权重分配网络,以得到抽象特征序列对应的语境 向量,其中,权重分配网络是基于离散化的混合 逻辑分布结构所构建的网络;获取与语境向量匹 配的音频频谱信息;利用音频频谱信息合成与文 本序列匹配的目标音频。本发明解决了由于音频 合成模型不稳定造成的合成音频准确性较低的 技术问题。 A 2 2 9 3 6 7 3 1 1 N C CN 113763922 A

最新专利