发明

一种基于实体替换的语音数据增强方法2024

2024-04-16 07:20:16 发布于四川 6
  • 申请专利号:CN202311776582.8
  • 公开(公告)日:2024-08-06
  • 公开(公告)号:CN117877466A
  • 申请人:中国电子科技集团公司第二十八研究所
摘要:本发明提供了一种基于实体替换的语音数据增强方法,包括:构建语音识别模型,获取语音样本并进行标注,得到带标注的语音;根据语音样本和标注构建关注实体集合;根据语音识别模型和关注实体集合,构建实体定位模型,用于寻找带标注语音中每个实体的起止时刻,输出全部起止时候集合;采用关注实体集合中同类实体替换文本中的实体,并根据起止时刻替换对应语音数据,形成新的带标注语音集合;将新的带标注语音集合与原先的带标注语音集合合并,形成新的语音识别训练样本集合。本发明可用于带标注语音的数据扩增,通过结合实体定位和实体替换方法,实现了语音识别训练样本的数据增强,提高了语音识别训练数据的规模。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117877467 A (43)申请公布日 2024.04.12 (21)申请号 202311847160.5 G10L 17/22 (2013.01) G10L 17/10 (2013.01) (22)申请日 2023.12.27 G10L 17/04 (2013.01) (71)申请人 武汉烽火普天信息技术有限公司 G10L 17/02 (2013.01) 地址 430000 湖北省武汉市东湖开发区关 G10L 17/18 (2013.01) 山二路附4号 (72)发明人 周逸聪 龚梁 钟刚 胡华  郭鹏程  (74)专利代理机构 武汉蓝宝石专利代理事务所 (特殊普通合伙) 42242 专利代理师 张东冬 (51)Int.Cl. G10L 15/06 (2013.01) G10L 15/22 (2006.01) G10L 15/02 (2006.01) G10L 15/16 (2006.01) 权利要求书2页 说明书6页 附图2页

最新专利