发明

一种针对粤语音频的拓展方法及语音识别方法

2023-05-14 12:29:39 发布于四川 0
  • 申请专利号:CN202210314205.1
  • 公开(公告)日:2025-07-08
  • 公开(公告)号:CN114694655A
  • 申请人:南方电网数字企业科技(广东)有限公司
摘要:本申请公开了一种针对粤语音频的拓展方法,包括:获取样本音频集中各样本音频对应的音素文本;根据样本音频集中各样本音频对应的音素文本,统计各音素的音素词频;对于各样本音频,将样本音频所对应音素文本中音素对应的音素词频进行均值计算,得到样本音频对应的第一平均词频;根据样本音频对应的第一平均词频,确定样本音频对应的拓展权重;根据各样本音频对应的拓展权重,在样本音频集中确定待拓展的目标样本音频;将目标样本音频进行音频拓展,得到拓展音频;拓展音频和样本音频集中的样本音频用于对语音识别模型进行训练。通过本申请的方法能够解决用于训练语音识别模型的音频发音分布不均衡的问题,保证语音识别模型的识别准确度。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114694655 A (43)申请公布日 2022.07.01 (21)申请号 202210314205.1 G10L 15/16 (2006.01) (22)申请日 2022.03.28 (71)申请人 广东电力信息科技有限公司 地址 510000 广东省广州市越秀区东风东 路808号509房 (72)发明人 郑颖龙 赖蔚蔚 吴广财 郑杰生  周昉昉 陈颖璇 林嘉鑫 黄宏恩  黄彬系 陈晓川 刘清源  (74)专利代理机构 深圳市智圈知识产权代理事 务所(普通合伙) 44351 专利代理师 苗燕 (51)Int.Cl. G10L 15/26 (2006.01) G10L 15/02 (2006.01) G10L 15/06 (2013.01) 权利要求书2页 说明书12页 附图4页 (54)发明名称 一种针对粤语音频的拓展方法及语音识别 方法 (57)摘要 本申请公开了一种针对粤语音频的拓展方 法,包括:获取样本音频集中各样本音频对应的 音素文本;根据样本音频集中各样本音频对应的 音素文本,统计各音素的音素词频;对于各样本 音频,将样本音频所对应音素文本中音素对应的 音素词频进行均值计算,得到样本音频对应的第 一平均词频;根据样本音频对应的第一平均词 频,确定样本音频对应的拓展权重;根据各样本 音频对

最新专利