发明

音频处理方法、装置、设备、存储介质及程序产品2025

2023-09-14 07:11:06 发布于四川 0

申请专利号：CN202210203766.4
公开（公告）日：2025-01-10
公开（公告）号：CN116741147A
申请人：腾讯科技（深圳）有限公司

摘要：本申请提供了一种音频处理方法、装置、设备、存储介质及程序产品，涉及音视频技术领域。该方法包括：获取第一音频；对第一音频进行语音定位，获得第一音频中的至少一个目标音频段落；该目标音频段落是包括语音的音频段落；获取至少一个目标音频段落的音频特征；基于至少一个目标音频段落的音频特征进行语种识别，获得至少一个目标音频段落各自的语种类型；基于至少一个目标音频段落各自的语种类型，获取第一音频的语种类型。通过上述方法，避免了获取第一音频的语种类型的过程中的人工标注过程，简化了语种识别的过程，提高了获取音视频内容的语种类型的效率，提高了获取语种类型的准确性。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116741147 A (43)申请公布日 2023.09.12 (21)申请号 202210203766.4 (22)申请日 2022.03.03 (71)申请人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层 (72)发明人冯鑫　 (74)专利代理机构北京三高永信知识产权代理有限责任公司 11138 专利代理师李文静 (51)Int.Cl. G10L 15/00 (2013.01) G10L 15/02 (2006.01) 权利要求书3页说明书19页附图9页 (54)发明名称音频处理方法、装置、设备、存储介质及程序产品 (57)摘要本申请提供了一种音频处理方法、装置、设备、存储介质及程序产品，涉及音视频技术领域。该方法包括：获取第一音频；对第一音频进行语音定位，获得第一音频中的至少一个目标音频段落；该目标音频段落是包括语音的音频段落；获取至少一个目标音频段落的音频特征；基于至少一个目标音频段落的音频特征进行语种识别，获得至少一个目标音频段落各自的语种类型；基于至少一个目标音频段落各自的语种类型，获取第一音频的语种类型。通过上述方法，避免了获取第一音频的语种类型的过程中的人工标注过程， A 简化了语种识别的过程，提高了获取音视频内容 7 的语种类型的效率，提高了获取语种类型的准确 4 1 1 性。 4 7 6

音频处理方法、装置、设备、存储介质及程序产品2025

专利内容

最新专利

相关专利