发明

语音合成方法、装置、电子设备及可读存储介质

2023-05-29 12:12:19 发布于四川 0
  • 申请专利号:CN202011442571.2
  • 公开(公告)日:2024-11-19
  • 公开(公告)号:CN112397047A
  • 申请人:平安科技(深圳)有限公司
摘要:本发明涉及语音合成技术,揭露一种语音合成方法,包括:获取样本音频,对所述样本音频进行声音特征提取转换及向量化处理,得到标准语音向量;当接收待合成文本时,对所述待合成文本进行音素转换得到文本音素序列;对所述文本音素序列进行向量转换,得到文本矩阵;将所述标准语音向量与所述文本矩阵进行向量拼接,得到目标矩阵;对所述目标矩阵进行频谱特征提取,得到频谱特征信息;利用预设声码器对所述频谱特征信息进行语音合成,得到合成音频。本发明还涉及一种区块链技术,所述频谱特征信息可以存储在区块链中。本发明还提出一种语音合成装置、电子设备以及可读存储介质。本发明可以提高语音合成的灵活性。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 112397047 A (43)申请公布日 2021.02.23 (21)申请号 202011442571.2 (22)申请日 2020.12.11 (71)申请人 平安科技(深圳)有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平安金融中 心23楼 (72)发明人 陈闽川 马骏 王少军  肖京  (74)专利代理机构 深圳市沃德知识产权代理事 务所(普通合伙) 44347 代理人 高杰 于志光 (51)Int.Cl. G10L 13/02 (2013.01) G10L 13/08 (2013.01) G10L 13/04 (2013.01) 权利要求书2页 说明书11页 附图3页 (54)发明名称 语音合成方法、装置、电子设备及可读存储 介质 (57)摘要 本发明涉及语音合成技术,揭露一种语音合 成方法,包括:获取样本音频,对所述样本音频进 行声音特征提取转换及向量化处理,得到标准语 音向量;当接收待合成文本时,对所述待合成文 本进行音素转换得到文本音素序列;对所述文本 音素序列进行向量转换,得到文本矩阵;将所述 标准语音向量与所述文本矩阵进行向量拼接,得 到目标矩阵;对所述目标矩阵进行频谱特征提 取,得到频谱特征信息;利用预设声码器对所述 频谱特征信息进行语音合成,得到合成音频。本 发明还涉及一种区块链技术,所述频谱特征信息 A 可以存

最新专利