发明

一种基于深度学习的全景音频编码方法

2023-07-21 07:14:46 发布于四川 0

申请专利号：CN202310424297.3
公开（公告）日：2025-08-12
公开（公告）号：CN116453527A
申请人：苏州鸿鹄骐骥电子科技有限公司

摘要：本发明涉及全景音频编码技术领域。一种基于深度学习的全景音频编码方法，将每个声源产生L帧的音频信号的驱动信号、每个声源相对于坐标原点的方位角、每个声源相对于坐标原点的高度角、每个声源相对于坐标原点的空间直线距离输入到反馈模块F的参考信号产生器R，参考声源S的每个声源受到驱动信号的驱动发出的声波广播至空间时，麦克风阵列A接收到声波后收录为L帧的音频信号输送给深度神经网络全景声编码模块N中，评价器E依据统计学指标得出差异性评价误差，如果差异性评价误差小于设置值，返回麦克风阵列A当前空间声场信号的全景音频编码。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116453527 A (43)申请公布日 2023.07.18 (21)申请号 202310424297.3 G10L 25/30 (2013.01) (22)申请日 2023.04.20 (71)申请人苏州鸿鹄骐骥电子科技有限公司地址 215008 江苏省苏州市姑苏区苏站路锦堂街8号0800室（B20） (72)发明人鲁逢源　温凯林　褚洁　李天红　张呈恺　孔亮　王鹍　蔡觉平　 (74)专利代理机构太原市科瑞达专利代理有限公司 14101 专利代理师耿联军 (51)Int.Cl. G10L 19/00 (2013.01) G10L 15/06 (2013.01) G10L 15/16 (2006.01) G10L 17/04 (2013.01) 权利要求书2页说明书6页 (54)发明名称一种基于深度学习的全景音频编码方法 (57)摘要本发明涉及全景音频编码技术领域。一种基于深度学习的全景音频编码方法，将每个声源产生L帧的音频信号的驱动信号、每个声源相对于坐标原点的方位角、每个声源相对于坐标原点的高度角、每个声源相对于坐标原点的空间直线距离输入到反馈模块F的参考信号产生器R，参考声源S的每个声源受到驱动信号的驱动发出的声波广播至空间时，麦克风阵列A接收到声波后收录为L帧的音

一种基于深度学习的全景音频编码方法

专利内容

最新专利

相关专利