发明

基于声学双谱的鸟鸣声源定位方法及系统2024

2024-03-25 07:23:23 发布于四川 0
  • 申请专利号:CN202410179288.7
  • 公开(公告)日:2024-04-19
  • 公开(公告)号:CN117724042A
  • 申请人:百鸟数据科技(北京)有限责任公司
摘要:本申请涉及语音处理技术领域,提出了基于声学双谱的鸟鸣声源定位方法及系统,包括:采集每个监控区域中的声音信号以及声音监测设备的空间位置向量;基于每个阵元麦克风采集声音信号的梅尔语谱图中每帧上不同频率带之间能量分布集中特征的分析结果确定梅尔频带能量聚集凸显度;基于每个频率带的梅尔频带能量聚集凸显度以及能量稳定变化持续时间的长短确定鸟类信息帧显著系数;采用VAD算法基于鸟类信息帧显著系数得到每个阵元麦克风采集声音信号的若干个声音信号片段;采用基于广义互相关时延估计的声源估计算法基于所有声音信号片段确定声音信号的定位结果。本申请自适应地对双门限端点检测算法中的阈值进行设定,提高声源定位结果的准确率。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117724042 A (43)申请公布日 2024.03.19 (21)申请号 202410179288.7 (22)申请日 2024.02.18 (71)申请人 百鸟数据科技(北京)有限责任公司 地址 100080 北京市海淀区学清路8号科技 财富中心B座11层B1101-B (72)发明人 舒璐 覃业锋  (74)专利代理机构 北京真致博文知识产权代理 事务所(普通合伙) 11720 专利代理师 覃金龙 (51)Int.Cl. G01S 5/18 (2006.01) 权利要求书3页 说明书9页 附图2页 (54)发明名称 基于声学双谱的鸟鸣声源定位方法及系统 (57)摘要 本申请涉及语音处理技术领域,提出了基于 声学双谱的鸟鸣声源定位方法及系统,包括:采 集每个监控区域中的声音信号以及声音监测设 备的空间位置向量;基于每个阵元麦克风采集声 音信号的梅尔语谱图中每帧上不同频率带之间 能量分布集中特征的分析结果确定梅尔频带能 量聚集凸显度;基于每个频率带的梅尔频带能量 聚集凸显度以及能量稳定变化持续时间的长短 确定鸟类信息帧显著系数;采用VAD算法基于鸟 类信息帧显著系数得到每个阵元麦克风采集声 音信号的若干个声音信号片段;采用基于广义互 相关时延估计的声源估计算法基于所有声音信 A 号片段确定声音信号的定位结果。本申请自适应 2 地对双门限端点检测算法中的阈值进行设定,提 4 0 4 高声源定位结果的准确率。 2

最新专利