发明

文本转语音方法、装置、计算机设备及存储介质

2023-07-07 07:09:27 发布于四川 0

申请专利号：CN202111130534.2
公开（公告）日：2025-01-10
公开（公告）号：CN113851108A
申请人：平安科技（深圳）有限公司

摘要：本发明涉及语音合成领域，尤其涉及一种文本转语音方法、装置、计算机设备及存储介质。其方法包括：从音色数据库中获取音色信息，并从客户端获取目标文本，对目标文本和音色信息进行预处理，得到第一复合信息；将第一复合信息输入注意力层，通过注意力层中的注意力网络模型对第一复合信息的复合特征进行提取，得到注意力层输出的第二复合信息；将第二复合信息输入音色分类器，通过音色分类器对第二复合信息进行音色识别，判断第二复合信息是否为目标音；若第二复合信息为目标音，则通过语音生成器对第二复合信息进行解码，生成与目标文本对应的语音信息。本发明可以使生成的语音信息更加接近目标音，可提高语音合成的准确性。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113851108 A (43)申请公布日 2021.12.28 (21)申请号 202111130534.2 (22)申请日 2021.09.26 (71)申请人平安科技（深圳）有限公司地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 (72)发明人张旭龙　王健宗　 (74)专利代理机构深圳众鼎专利商标代理事务所(普通合伙) 44325 代理人谭果林 (51)Int.Cl. G10L 13/08 (2013.01) G10L 13/033 (2013.01) G10L 25/27 (2013.01) G10L 25/03 (2013.01) 权利要求书2页说明书10页附图2页 (54)发明名称文本转语音方法、装置、计算机设备及存储介质 (57)摘要本发明涉及语音合成领域，尤其涉及一种文本转语音方法、装置、计算机设备及存储介质。其方法包括：从音色数据库中获取音色信息，并从客户端获取目标文本，对目标文本和音色信息进行预处理，得到第一复合信息；将第一复合信息输入注意力层，通过注意力层中的注意力网络模型对第一复合信息的复合特征进行提取，得到注意力层输出的第二复合信息；将第二复合信息输入音色分类器，通过音色分类器对第二复合信息进行音色识别，判断第二复合信息是否为目标

文本转语音方法、装置、计算机设备及存储介质

专利内容

最新专利

相关专利