发明

音频合成方法、装置、计算机可读存储介质及电子设备

2023-07-06 11:04:34 发布于四川 1
  • 申请专利号:CN202110815643.1
  • 公开(公告)日:2025-06-24
  • 公开(公告)号:CN113838443A
  • 申请人:腾讯科技(深圳)有限公司
摘要:本申请公开了一种音频合成方法、装置、计算机可读存储介质及电子设备,涉及人工智能领域,该方法包括:获取目标歌词的文本特征以及目标乐谱的乐谱特征;基于所述文本特征及乐谱特征进行时长预测处理,得到所述目标歌词中每个音素对应的预测音素时长;根据所述预测音素时长对所述文本特征及所述乐谱特征进行声学编码处理,生成声学编码;采用分层渐进训练的至少两层级联的解码网络,对所述声学编码进行渐进解码处理,得到目标梅尔频谱;基于所述目标梅尔频谱生成所述目标歌词及所述目标乐谱对应的合成歌声音频。本申请有效提升合成歌声音频的自然度,同时兼顾发音稳定性和表现力。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113838443 A (43)申请公布日 2021.12.24 (21)申请号 202110815643.1 G10L 13/08 (2013.01) G10L 19/16 (2013.01) (22)申请日 2021.07.19 (71)申请人 腾讯科技(深圳)有限公司 地址 518057 广东省深圳市南山区高新区 科技中一路腾讯大厦35层 (72)发明人 张泽旺 李新辉  (74)专利代理机构 深圳翼盛智成知识产权事务 所(普通合伙) 44300 代理人 李玉婷 (51)Int.Cl. G10H 1/00 (2006.01) G10H 5/00 (2006.01) G10L 13/033 (2013.01) G10L 13/04 (2013.01) G10L 13/07 (2013.01) 权利要求书3页 说明书16页 附图5页 (54)发明名称 音频合成方法、装置、计算机可读存储介质 及电子设备 (57)摘要 本申请公开了一种音频合成方法、装置、计 算机可读存储介质及电子设备,涉及人工智能领 域,该方法包括:获取目标歌词的文本特征以及 目标乐谱的乐谱特征;基于所述文本特征及乐谱 特征进行时长预测处理,得到所述目标歌词中每 个音素对

最新专利