音频处理方法、装置及计算机可读存储介质
- 申请专利号:CN202110872240.0
- 公开(公告)日:2025-07-08
- 公开(公告)号:CN113823287A
- 申请人:腾讯科技(深圳)有限公司
专利内容
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113823287 A (43)申请公布日 2021.12.21 (21)申请号 202110872240.0 (22)申请日 2021.07.30 (71)申请人 腾讯科技(深圳)有限公司 地址 518057 广东省深圳市南山区高新区 科技中一路腾讯大厦35层 (72)发明人 马应龙 索郎王修 (74)专利代理机构 广州三环专利商标代理有限 公司 44202 代理人 熊永强 杜维 (51)Int.Cl. G10L 15/26 (2006.01) G10L 15/04 (2013.01) 权利要求书2页 说明书14页 附图9页 (54)发明名称 音频处理方法、装置及计算机可读存储介质 (57)摘要 本申请提出了一种音频处理方法、装置及计 算机可读存储介质,涉及计算机技术领域,该方 法包括:获取待处理音频,所述待处理音频包括 一个或多个音频帧;针对所述一个或多个音频帧 中的任一音频帧,对所述任一音频帧进行切分处 理得到多个音频片段,确定所述多个音频片段中 每个音频片段的音频类别,根据所述每个音频片 段的音频类别确定所述任一音频帧的语音识别 结果;根据各个音频帧的语音识别结果,将所述 待处理音频中语音识别结果为目标识别结果的 音频帧进行剔除,得到处理后的音频;对所述处 理后的音频进行风格转换处理,得到目标音频。 A 通过本申请实施例,可以提高音频风格转换所涉 7 及的语音的准确性。 8 2 3 2
最新专利
- 一种基于毫米波雷达的多模态语音识别系统及方法公开日期:2025-08-05公开号:CN116416996A申请号:CN202310469259.X一种基于毫米波雷达的多模态语音识别系统及方法
- 发布时间:2023-07-13 07:19:270
- 申请号:CN202310469259.X
- 公开号:CN116416996A
- 一种基于听力试题原文的听力音频自动化生成方法及系统公开日期:2025-08-05公开号:CN116312473A申请号:CN202310081217.9一种基于听力试题原文的听力音频自动化生成方法及系统
- 发布时间:2023-06-27 09:30:190
- 申请号:CN202310081217.9
- 公开号:CN116312473A
- 识别系统及其静态随机存取内存单元公开日期:2025-08-05公开号:CN116264076A申请号:CN202111530980.2识别系统及其静态随机存取内存单元
- 发布时间:2023-06-18 07:10:070
- 申请号:CN202111530980.2
- 公开号:CN116264076A
- 一种基于卷积循环神经网络的主动噪声控制系统及方法公开日期:2025-08-05公开号:CN116246606A申请号:CN202310248622.5一种基于卷积循环神经网络的主动噪声控制系统及方法
- 发布时间:2023-06-11 13:14:430
- 申请号:CN202310248622.5
- 公开号:CN116246606A
- 修改语音使能设备的一个或多个唤醒词的集合的方法公开日期:2025-08-05公开号:CN112927683A申请号:CN202011343264.9修改语音使能设备的一个或多个唤醒词的集合的方法
- 发布时间:2023-06-11 12:43:370
- 申请号:CN202011343264.9
- 公开号:CN112927683A
- 转场点的确定方法、装置、设备及存储介质公开日期:2025-08-05公开号:CN116189708A申请号:CN202310185019.7转场点的确定方法、装置、设备及存储介质
- 发布时间:2023-06-02 12:55:440
- 申请号:CN202310185019.7
- 公开号:CN116189708A