发明

基于去噪扩散概率模型的歌唱合成方法、设备及介质

2023-08-11 23:08:34 发布于四川 0
  • 申请专利号:CN202310595288.0
  • 公开(公告)日:2025-09-16
  • 公开(公告)号:CN116564270A
  • 申请人:平安科技(深圳)有限公司
摘要:本申请实施例提出的基于去噪扩散概率模型的歌唱合成方法、设备及介质,涉及人工智能技术领域。该方法包括:获取预设乐谱的初始梅尔频谱特征;将所述初始梅尔频谱特征输入预设的去噪扩散概率模型进行加噪处理,得到先验噪声梅尔频谱特征;对所述先验噪声梅尔频谱特征的加噪时间步进行编码,得到加噪时间步特征;将所述先验噪声梅尔频谱特征、所述加噪时间步特征和所述初始梅尔频谱特征输入预设的目标生成器进行去噪处理,得到目标去噪梅尔频谱特征;对所述目标去噪梅尔频谱特征进行音频合成,得到目标合成音频数据。本申请实施例能够提高合成歌唱音频的自然度。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116564270 A (43)申请公布日 2023.08.08 (21)申请号 202310595288.0 (22)申请日 2023.05.24 (71)申请人 平安科技 (深圳)有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平安金融中 心23楼 (72)发明人 张旭龙 王健宗 程宁 赵金凤  (74)专利代理机构 广州嘉权专利商标事务所有 限公司 44205 专利代理师 廖慧贤 (51)Int.Cl. G10L 13/02 (2013.01) G10L 25/24 (2013.01) G10L 21/0208 (2013.01) G10L 25/30 (2013.01) 权利要求书3页 说明书14页 附图7页 (54)发明名称 基于去噪扩散概率模型的歌唱合成方法、设 备及介质 (57)摘要 本申请实施例提出的基于去噪扩散概率模 型的歌唱合成方法、设备及介质,涉及人工智能 技术领域。该方法包括:获取预设乐谱的初始梅 尔频谱特征;将所述初始梅尔频谱特征输入预设 的去噪扩散概率模型进行加噪处理,得到先验噪 声梅尔频谱特征;对所述先验噪声梅尔频谱特征 的加噪时间步进行编码,得到加噪时间步特征; 将所述先验噪声梅尔频谱特征、所述加噪时间步 特征和所述初始梅尔频谱特征输入预设的目标 生成器进行去噪处理,得到目标去噪梅尔频谱

最新专利