发明

一种基于正则表达式和WFST的TTS文本正则化方法和装置

2023-06-27 09:43:41 发布于四川 0
  • 申请专利号:CN202310276496.4
  • 公开(公告)日:2025-07-18
  • 公开(公告)号:CN116312540A
  • 申请人:上海元梦智能科技有限公司|||元梦人文智能国际有限公司
摘要:本发明提供一种基于正则表达式和WFST的TTS文本正则化方法和装置,其中方法包括步骤,获取待识别的目标文本;确定所述目标文本的类型;基于所述目标文本的类型,从预先构建的第二WFST中获取对应的正则表达式替换规则;基于所述对应的正则表达式替换规则,将所述目标文本转换为对应的正则文本;将所述对应的正则文本转化为语音信息。采用本发明提供的一种基于正则表达式和WFST的TTS文本正则化方法和装置,可有效使得普通软件开发者只需编写正则表达式,即可将大量正则表达式替换规则融合成一个WFST图结构,进而使得虚拟人TTS文本正则化方法更加易于扩展和维护。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116312540 A (43)申请公布日 2023.06.23 (21)申请号 202310276496.4 (22)申请日 2023.03.21 (71)申请人 上海元梦智能科技有限公司 地址 200120 上海市浦东新区锦康路389弄 2号206室 申请人 元梦人文智能国际有限公司 (72)发明人 陈锁 顾文元 张雪源  (74)专利代理机构 北京市隆安律师事务所 11323 专利代理师 何琦 (51)Int.Cl. G10L 15/26 (2006.01) G10L 25/03 (2013.01) G10L 25/27 (2013.01) G10L 25/48 (2013.01) 权利要求书2页 说明书8页 附图5页 (54)发明名称 一种基于正则表达式和WFST的TTS文本正则 化方法和装置 (57)摘要 本发明提供一种基于正则表达式和WFST的 TTS文本正则化方法和装置,其中方法包括步骤, 获取待识别的目标文本;确定所述目标文本的类 型;基于所述目标文本的类型,从预先构建的第 二WFST中获取对应的正则表达式替换规则;基于 所述对应的正则表达式替换规则,将所述目标文 本转换为对应的正则文本;将所述对应的正则文 本转化为语音信息。采用本发明提供的一种基于 正则表达式和WFST的TTS文本正则化方法和装 置,可有效使得普通软件开发者只需编写正则表