发明

一种基于图增强的音频分类方法、装置、设备及介质2024

2023-09-24 07:18:36 发布于四川 0
  • 申请专利号:CN202310599988.7
  • 公开(公告)日:2024-08-09
  • 公开(公告)号:CN116778951A
  • 申请人:上海蜜度科技股份有限公司
摘要:本发明涉及一种基于图增强的音频分类方法、装置、设备及介质,其中,方波包括:获取待分类的音频;将所述待分类的音频输入至分类模型中得到音频的分类结果;其中,所述分类模型包括:音频特征提取模块,用于从所述待分类的音频中提取出第一音频特征和第二音频特征;音频转换模块,用于将所述待分类的音频转换为图,并提取出图的顶点信息和边缘信息;特征融合模块,用于将第一音频特征、第二音频特征与所述图的顶点信息和边缘信息进行特征融合,得到融合特征;分类模块,用于基于融合特征对待分类的音频进行分类,得到音频的分类结果。本发明能够利用Graph信息来辅助音频分类,从而提升音频分类的准确性。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116778951 A (43)申请公布日 2023.09.19 (21)申请号 202310599988.7 (22)申请日 2023.05.25 (71)申请人 上海蜜度信息技术有限公司 地址 200120 上海市浦东新区自由贸易试 验区张衡路198弄10号301AB室 (72)发明人 孔欧  (74)专利代理机构 上海泰能知识产权代理事务 所(普通合伙) 31233 专利代理师 宋缨 (51)Int.Cl. G10L 21/12 (2013.01) G10L 15/08 (2006.01) G10L 15/02 (2006.01) 权利要求书2页 说明书6页 附图3页 (54)发明名称 一种基于图增强的音频分类方法、装置、设 备及介质 (57)摘要 本发明涉及一种基于图增强的音频分类方 法、装置、设备及介质,其中,方波包括:获取待分 类的音频;将所述待分类的音频输入至分类模型 中得到音频的分类结果;其中,所述分类模型包 括:音频特征提取模块,用于从所述待分类的音 频中提取出第一音频特征和第二音频特征;音频 转换模块,用于将所述待分类的音频转换为图 , 并提取出图的顶点信息和边缘信息;特征融合模 块,用于将第一音频特征、第二音频特征与所述 图的顶点信息和边缘信息进行特征融合,得到融 合特征;分类模块,用于基于融合特征对待分类 A 的音频进行分类,得到音频的分类结果。本发明 1 能够利用Gra

最新专利