发明

一种基于深度学习的全景音频编码方法

2023-07-21 07:14:46 发布于四川 0
  • 申请专利号:CN202310424297.3
  • 公开(公告)日:2025-08-12
  • 公开(公告)号:CN116453527A
  • 申请人:苏州鸿鹄骐骥电子科技有限公司
摘要:本发明涉及全景音频编码技术领域。一种基于深度学习的全景音频编码方法,将每个声源产生L帧的音频信号的驱动信号、每个声源相对于坐标原点的方位角、每个声源相对于坐标原点的高度角、每个声源相对于坐标原点的空间直线距离输入到反馈模块F的参考信号产生器R,参考声源S的每个声源受到驱动信号的驱动发出的声波广播至空间时,麦克风阵列A接收到声波后收录为L帧的音频信号输送给深度神经网络全景声编码模块N中,评价器E依据统计学指标得出差异性评价误差,如果差异性评价误差小于设置值,返回麦克风阵列A当前空间声场信号的全景音频编码。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116453527 A (43)申请公布日 2023.07.18 (21)申请号 202310424297.3 G10L 25/30 (2013.01) (22)申请日 2023.04.20 (71)申请人 苏州鸿鹄骐骥电子科技有限公司 地址 215008 江苏省苏州市姑苏区苏站路 锦堂街8号0800室 (B20) (72)发明人 鲁逢源 温凯林 褚洁 李天红  张呈恺 孔亮 王鹍 蔡觉平  (74)专利代理机构 太原市科瑞达专利代理有限 公司 14101 专利代理师 耿联军 (51)Int.Cl. G10L 19/00 (2013.01) G10L 15/06 (2013.01) G10L 15/16 (2006.01) G10L 17/04 (2013.01) 权利要求书2页 说明书6页 (54)发明名称 一种基于深度学习的全景音频编码方法 (57)摘要 本发明涉及全景音频编码技术领域。一种基 于深度学习的全景音频编码方法,将每个声源产 生L帧的音频信号的驱动信号、每个声源相对于 坐标原点的方位角、每个声源相对于坐标原点的 高度角、每个声源相对于坐标原点的空间直线距 离输入到反馈模块F的参考信号产生器R,参考声 源S的每个声源受到驱动信号的驱动发出的声波 广播至空间时,麦克风阵列A接收到声波后收录 为L帧的音

最新专利