一种针对粤语音频的拓展方法及语音识别方法
- 申请专利号:CN202210314205.1
- 公开(公告)日:2025-07-08
- 公开(公告)号:CN114694655A
- 申请人:南方电网数字企业科技(广东)有限公司
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114694655 A (43)申请公布日 2022.07.01 (21)申请号 202210314205.1 G10L 15/16 (2006.01) (22)申请日 2022.03.28 (71)申请人 广东电力信息科技有限公司 地址 510000 广东省广州市越秀区东风东 路808号509房 (72)发明人 郑颖龙 赖蔚蔚 吴广财 郑杰生 周昉昉 陈颖璇 林嘉鑫 黄宏恩 黄彬系 陈晓川 刘清源 (74)专利代理机构 深圳市智圈知识产权代理事 务所(普通合伙) 44351 专利代理师 苗燕 (51)Int.Cl. G10L 15/26 (2006.01) G10L 15/02 (2006.01) G10L 15/06 (2013.01) 权利要求书2页 说明书12页 附图4页 (54)发明名称 一种针对粤语音频的拓展方法及语音识别 方法 (57)摘要 本申请公开了一种针对粤语音频的拓展方 法,包括:获取样本音频集中各样本音频对应的 音素文本;根据样本音频集中各样本音频对应的 音素文本,统计各音素的音素词频;对于各样本 音频,将样本音频所对应音素文本中音素对应的 音素词频进行均值计算,得到样本音频对应的第 一平均词频;根据样本音频对应的第一平均词 频,确定样本音频对应的拓展权重;根据各样本 音频对
最新专利
- 基于MFF-ScSEnet的狗吠声情绪识别方法公开日期:2025-08-01公开号:CN116486837A申请号:CN202310426499.1基于MFF-ScSEnet的狗吠声情绪识别方法
- 发布时间:2023-07-28 07:17:090
- 申请号:CN202310426499.1
- 公开号:CN116486837A
- 一种针对传输语音的信噪比估计方法公开日期:2025-08-01公开号:CN116486836A申请号:CN202310329327.2一种针对传输语音的信噪比估计方法
- 发布时间:2023-07-28 07:16:010
- 申请号:CN202310329327.2
- 公开号:CN116486836A
- 语音交互系统及方法、智能设备公开日期:2025-08-01公开号:CN113192509A申请号:CN202110594436.8语音交互系统及方法、智能设备
- 发布时间:2023-06-16 07:22:280
- 申请号:CN202110594436.8
- 公开号:CN113192509A
- 降噪方法、装置、电子设备及计算机可读存储介质公开日期:2025-08-01公开号:CN114898765A申请号:CN202210416607.2降噪方法、装置、电子设备及计算机可读存储介质
- 发布时间:2023-05-19 11:21:090
- 申请号:CN202210416607.2
- 公开号:CN114898765A
- 音频摘要生成方法、装置、电子设备及可读存储介质公开日期:2025-08-01公开号:CN114842850A申请号:CN202210463130.3音频摘要生成方法、装置、电子设备及可读存储介质
- 发布时间:2023-05-18 12:52:150
- 申请号:CN202210463130.3
- 公开号:CN114842850A
- 将双耳信号转换为立体声音频信号公开日期:2025-08-01公开号:CN114762040A申请号:CN202080081512.9将双耳信号转换为立体声音频信号
- 发布时间:2023-05-16 10:40:570
- 申请号:CN202080081512.9
- 公开号:CN114762040A