发明

音频处理方法、装置、设备、存储介质及程序产品2025

2023-09-14 07:11:06 发布于四川 0
  • 申请专利号:CN202210203766.4
  • 公开(公告)日:2025-01-10
  • 公开(公告)号:CN116741147A
  • 申请人:腾讯科技(深圳)有限公司
摘要:本申请提供了一种音频处理方法、装置、设备、存储介质及程序产品,涉及音视频技术领域。该方法包括:获取第一音频;对第一音频进行语音定位,获得第一音频中的至少一个目标音频段落;该目标音频段落是包括语音的音频段落;获取至少一个目标音频段落的音频特征;基于至少一个目标音频段落的音频特征进行语种识别,获得至少一个目标音频段落各自的语种类型;基于至少一个目标音频段落各自的语种类型,获取第一音频的语种类型。通过上述方法,避免了获取第一音频的语种类型的过程中的人工标注过程,简化了语种识别的过程,提高了获取音视频内容的语种类型的效率,提高了获取语种类型的准确性。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116741147 A (43)申请公布日 2023.09.12 (21)申请号 202210203766.4 (22)申请日 2022.03.03 (71)申请人 腾讯科技 (深圳)有限公司 地址 518057 广东省深圳市南山区高新区 科技中一路腾讯大厦35层 (72)发明人 冯鑫  (74)专利代理机构 北京三高永信知识产权代理 有限责任公司 11138 专利代理师 李文静 (51)Int.Cl. G10L 15/00 (2013.01) G10L 15/02 (2006.01) 权利要求书3页 说明书19页 附图9页 (54)发明名称 音频处理方法、装置、设备、存储介质及程序 产品 (57)摘要 本申请提供了一种音频处理方法、装置、设 备、存储介质及程序产品,涉及音视频技术领域。 该方法包括:获取第一音频;对第一音频进行语 音定位,获得第一音频中的至少一个目标音频段 落;该目标音频段落是包括语音的音频段落;获 取至少一个目标音频段落的音频特征;基于至少 一个目标音频段落的音频特征进行语种识别,获 得至少一个目标音频段落各自的语种类型;基于 至少一个目标音频段落各自的语种类型,获取第 一音频的语种类型。通过上述方法,避免了获取 第一音频的语种类型的过程中的人工标注过程, A 简化了语种识别的过程,提高了获取音视频内容 7 的语种类型的效率,提高了获取语种类型的准确 4 1 1 性。 4 7 6

最新专利