发明

语音合成方法、装置、电子设备及可读存储介质

2023-05-29 12:12:19 发布于四川 0

申请专利号：CN202011442571.2
公开（公告）日：2024-11-19
公开（公告）号：CN112397047A
申请人：平安科技（深圳）有限公司

摘要：本发明涉及语音合成技术，揭露一种语音合成方法，包括：获取样本音频，对所述样本音频进行声音特征提取转换及向量化处理，得到标准语音向量；当接收待合成文本时，对所述待合成文本进行音素转换得到文本音素序列；对所述文本音素序列进行向量转换，得到文本矩阵；将所述标准语音向量与所述文本矩阵进行向量拼接，得到目标矩阵；对所述目标矩阵进行频谱特征提取，得到频谱特征信息；利用预设声码器对所述频谱特征信息进行语音合成，得到合成音频。本发明还涉及一种区块链技术，所述频谱特征信息可以存储在区块链中。本发明还提出一种语音合成装置、电子设备以及可读存储介质。本发明可以提高语音合成的灵活性。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 112397047 A (43)申请公布日 2021.02.23 (21)申请号 202011442571.2 (22)申请日 2020.12.11 (71)申请人平安科技（深圳）有限公司地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 (72)发明人陈闽川　马骏　王少军　肖京　 (74)专利代理机构深圳市沃德知识产权代理事务所(普通合伙) 44347 代理人高杰　于志光 (51)Int.Cl. G10L 13/02 (2013.01) G10L 13/08 (2013.01) G10L 13/04 (2013.01) 权利要求书2页说明书11页附图3页 (54)发明名称语音合成方法、装置、电子设备及可读存储介质 (57)摘要本发明涉及语音合成技术，揭露一种语音合成方法，包括：获取样本音频，对所述样本音频进行声音特征提取转换及向量化处理，得到标准语音向量；当接收待合成文本时，对所述待合成文本进行音素转换得到文本音素序列；对所述文本音素序列进行向量转换，得到文本矩阵；将所述标准语音向量与所述文本矩阵进行向量拼接，得到目标矩阵；对所述目标矩阵进行频谱特征提取，得到频谱特征信息；利用预设声码器对所述频谱特征信息进行语音合成，得到合成音频。本发明还涉及一种区块链技术，所述频谱特征信息 A 可以存

语音合成方法、装置、电子设备及可读存储介质

专利内容

最新专利

相关专利