基于深度迁移学习与XGBoost的混合鸟鸣识别方法
- 申请专利号:CN202210536031.3
- 公开(公告)日:2024-06-18
- 公开(公告)号:CN114863937A
- 申请人:武汉工程大学
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114863937 A (43)申请公布日 2022.08.05 (21)申请号 202210536031.3 (22)申请日 2022.05.17 (71)申请人 武汉工程大学 地址 430074 湖北省武汉市洪山区雄楚大 街693号 (72)发明人 刘玮 张飞 张彦铎 卢涛 陈灯 栗娟 邵俊杰 华鑫 张鹏 王凯 (74)专利代理机构 湖北武汉永嘉专利代理有限 公司 42102 专利代理师 樊凡 (51)Int.Cl. G10L 17/26 (2013.01) G10L 17/02 (2013.01) G10L 17/04 (2013.01) G10L 17/18 (2013.01) 权利要求书3页 说明书6页 附图3页 (54)发明名称 基于深度迁移学习与XGBoost的混合鸟鸣识 别方法 (57)摘要 本发明提供了基于深度迁移学习与XGBoost 的混合鸟鸣识别方法,通过计算log‑Mel频谱图 的一阶差分系数和二阶差分系数,反映鸟鸣信号 的变化过程,在保留物种有效信息的同时减少环 境噪声等无关因素的影响,提升了识别鸟类物种 的准确率;减少了环境背景噪声等无关因素的影 响,有效识别了自然场景下的多种鸟类物种。本 发明采用深度迁移学习微调VGG16模型构建特征 提取器,提升了少样本训练数据下深度卷积神经 网络的泛化能力,减少了参数训练,提升了运行
最新专利
- 音频处理方法、装置及计算机可读存储介质公开日期:2025-07-08公开号:CN113823287A申请号:CN202110872240.0音频处理方法、装置及计算机可读存储介质
- 发布时间:2023-07-06 10:55:560
- 申请号:CN202110872240.0
- 公开号:CN113823287A
- 语音增强方法及装置公开日期:2025-07-08公开号:CN116386653A申请号:CN202310573048.0语音增强方法及装置
- 发布时间:2023-07-06 10:36:590
- 申请号:CN202310573048.0
- 公开号:CN116386653A
- 多模型语音命令词的识别方法、系统、设备及储存介质公开日期:2025-07-08公开号:CN116189677A申请号:CN202310174256.3多模型语音命令词的识别方法、系统、设备及储存介质
- 发布时间:2023-06-02 12:55:280
- 申请号:CN202310174256.3
- 公开号:CN116189677A
- 一种基于文本及语音识别的口语测评方法及系统公开日期:2025-07-08公开号:CN114842875A申请号:CN202210402853.2一种基于文本及语音识别的口语测评方法及系统
- 发布时间:2023-05-18 12:50:330
- 申请号:CN202210402853.2
- 公开号:CN114842875A
- 语音序列的重点子序列识别与显示方法、系统与电子设备公开日期:2025-07-08公开号:CN114783422A申请号:CN202210403490.4语音序列的重点子序列识别与显示方法、系统与电子设备
- 发布时间:2023-05-17 11:42:080
- 申请号:CN202210403490.4
- 公开号:CN114783422A
- 一种针对粤语音频的拓展方法及语音识别方法公开日期:2025-07-08公开号:CN114694655A申请号:CN202210314205.1一种针对粤语音频的拓展方法及语音识别方法
- 发布时间:2023-05-14 12:29:390
- 申请号:CN202210314205.1
- 公开号:CN114694655A