基于可插拔模块的深度学习语音辅助文字识别方法与装置
- 申请专利号:CN202310111405.1
- 公开(公告)日:2025-07-18
- 公开(公告)号:CN116434732A
- 申请人:华中科技大学
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116434732 A (43)申请公布日 2023.07.14 (21)申请号 202310111405.1 G06N 3/0464 (2023.01) G06N 3/08 (2023.01) (22)申请日 2023.02.07 (71)申请人 华中科技大学 地址 430074 湖北省武汉市洪山区珞喻路 1037号 (72)发明人 刘明宇 刘禹良 余文文 杨彪 张恩铭 程建伟 白翔 (74)专利代理机构 深圳市六加知识产权代理有 限公司 44372 专利代理师 向彬 (51)Int.Cl. G10L 13/08 (2013.01) G10L 15/16 (2006.01) G10L 15/26 (2006.01) G06N 3/0455 (2023.01) 权利要求书2页 说明书6页 附图2页 (54)发明名称 基于可插拔模块的深度学习语音辅助文字 识别方法与装置 (57)摘要 本发明提出了一种基于可插拔模块的深度 学习语音辅助文字识别方法:使用公开合成文本 数据集作为图片训练数据,并提取出标签作为语 料库,使用语音合成工具配对生成一定数量的语 音数据;将图片‑语音数据送入识别网络中,分别 得到图像特征和语音特征;将图
最新专利
- 一种基于层次化迁移学习的蒙古语自动语音质量评估方法公开日期:2025-07-25公开号:CN116434778A申请号:CN202310145884.9一种基于层次化迁移学习的蒙古语自动语音质量评估方法
- 发布时间:2023-07-16 07:20:450
- 申请号:CN202310145884.9
- 公开号:CN116434778A
- 一种基于多任务学习和子域自适应的跨库语音情感识别方法公开日期:2025-07-25公开号:CN113870900A申请号:CN202111125098.X一种基于多任务学习和子域自适应的跨库语音情感识别方法
- 发布时间:2023-07-09 07:07:450
- 申请号:CN202111125098.X
- 公开号:CN113870900A
- 一种基于沃尔泰拉滤波器的非线性主动噪声控制系统公开日期:2025-07-25公开号:CN116386585A申请号:CN202310386499.3一种基于沃尔泰拉滤波器的非线性主动噪声控制系统
- 发布时间:2023-07-06 10:33:420
- 申请号:CN202310386499.3
- 公开号:CN116386585A
- 风噪抑制方法、装置、设备及计算机可读存储介质公开日期:2025-07-25公开号:CN116386654A申请号:CN202310180377.9风噪抑制方法、装置、设备及计算机可读存储介质
- 发布时间:2023-07-06 10:28:320
- 申请号:CN202310180377.9
- 公开号:CN116386654A
- 一种基于JDC-CRNN的鸟声检测方法与系统公开日期:2025-07-25公开号:CN116246640A申请号:CN202310084987.9一种基于JDC-CRNN的鸟声检测方法与系统
- 发布时间:2023-06-11 13:12:020
- 申请号:CN202310084987.9
- 公开号:CN116246640A
- 合唱处理的方法、服务器、终端、系统和存储介质公开日期:2025-07-25公开号:CN116206584A申请号:CN202310270230.9合唱处理的方法、服务器、终端、系统和存储介质
- 发布时间:2023-06-04 11:16:320
- 申请号:CN202310270230.9
- 公开号:CN116206584A