发明

基于去噪扩散概率模型的歌唱合成方法、设备及介质

2023-08-11 23:08:34 发布于四川 0

申请专利号：CN202310595288.0
公开（公告）日：2025-09-16
公开（公告）号：CN116564270A
申请人：平安科技（深圳）有限公司

摘要：本申请实施例提出的基于去噪扩散概率模型的歌唱合成方法、设备及介质，涉及人工智能技术领域。该方法包括：获取预设乐谱的初始梅尔频谱特征；将所述初始梅尔频谱特征输入预设的去噪扩散概率模型进行加噪处理，得到先验噪声梅尔频谱特征；对所述先验噪声梅尔频谱特征的加噪时间步进行编码，得到加噪时间步特征；将所述先验噪声梅尔频谱特征、所述加噪时间步特征和所述初始梅尔频谱特征输入预设的目标生成器进行去噪处理，得到目标去噪梅尔频谱特征；对所述目标去噪梅尔频谱特征进行音频合成，得到目标合成音频数据。本申请实施例能够提高合成歌唱音频的自然度。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116564270 A (43)申请公布日 2023.08.08 (21)申请号 202310595288.0 (22)申请日 2023.05.24 (71)申请人平安科技（深圳）有限公司地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 (72)发明人张旭龙　王健宗　程宁　赵金凤　 (74)专利代理机构广州嘉权专利商标事务所有限公司 44205 专利代理师廖慧贤 (51)Int.Cl. G10L 13/02 (2013.01) G10L 25/24 (2013.01) G10L 21/0208 (2013.01) G10L 25/30 (2013.01) 权利要求书3页说明书14页附图7页 (54)发明名称基于去噪扩散概率模型的歌唱合成方法、设备及介质 (57)摘要本申请实施例提出的基于去噪扩散概率模型的歌唱合成方法、设备及介质，涉及人工智能技术领域。该方法包括：获取预设乐谱的初始梅尔频谱特征；将所述初始梅尔频谱特征输入预设的去噪扩散概率模型进行加噪处理，得到先验噪声梅尔频谱特征；对所述先验噪声梅尔频谱特征的加噪时间步进行编码，得到加噪时间步特征；将所述先验噪声梅尔频谱特征、所述加噪时间步特征和所述初始梅尔频谱特征输入预设的目标生成器进行去噪处理，得到目标去噪梅尔频谱

基于去噪扩散概率模型的歌唱合成方法、设备及介质

专利内容

最新专利

相关专利