发明

模型训练方法和装置、语音合成方法、设备及存储介质

2023-07-06 10:30:32 发布于四川 5
  • 申请专利号:CN202310295801.4
  • 公开(公告)日:2025-08-19
  • 公开(公告)号:CN116386605A
  • 申请人:平安科技(深圳)有限公司
摘要:本申请实施例提供了一种模型训练方法和装置、语音合成方法、设备及存储介质,属于人工智能技术领域。该方法包括:获取并将训练文本信息和训练音色信息输入预设的原始语音合成模型进行语音合成处理得到初步特征信息和语音频谱预测信息;将初步特征信息输入预设的原始分类模型进行说话对象判别得到初步说话对象判别信息;对语音频谱预测信息、初步说话对象判别信息进行损失计算得到目标损失函数;根据目标损失函数对原始分类模型进行参数调整得到目标分类模型;获取并根据目标分类模型输出的目标说话对象判别信息对原始语音合成模型进行参数调整得到目标语音合成模型。本申请实施例能够训练得到的模型可以增强说话对象音色表达。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116386605 A (43)申请公布日 2023.07.04 (21)申请号 202310295801.4 G10L 13/08 (2013.01) G10L 25/18 (2013.01) (22)申请日 2023.03.15 G10L 19/00 (2013.01) (71)申请人 平安科技 (深圳)有限公司 G10L 15/02 (2006.01) 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平安金融中 心23楼 (72)发明人 张旭龙 王健宗  (74)专利代理机构 广州嘉权专利商标事务所有 限公司 44205 专利代理师 廖慧贤 (51)Int.Cl. G10L 15/06 (2013.01) G10L 15/18 (2013.01) G10L 17/04 (2013.01) G10L 13/02 (2013.01) 权利要求书2页 说明书15页 附图5页 (54)发明名称 模型训练方法和装置、语音合成方法、设备 及存储介质 (57)摘要 本申请实施例提

最新专利