一种语音识别方法、装置、设备及可读存储介质
- 申请专利号:CN202310126931.5
- 公开(公告)日:2025-05-23
- 公开(公告)号:CN116312480A
- 申请人:之江实验室
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116312480 A (43)申请公布日 2023.06.23 (21)申请号 202310126931.5 (22)申请日 2023.02.10 (71)申请人 之江实验室 地址 311121 浙江省杭州市余杭区之江实 验室南湖总部 (72)发明人 赵颖 郏维强 陈志伟 马树楷 (74)专利代理机构 北京博思佳知识产权代理有 限公司 11415 专利代理师 林祥 (51)Int.Cl. G10L 15/02 (2006.01) G10L 15/26 (2006.01) G10L 15/16 (2006.01) 权利要求书3页 说明书18页 附图6页 (54)发明名称 一种语音识别方法、装置、设备及可读存储 介质 (57)摘要 本说明书公开了一种语音识别方法、装置、 设备及可读存储介质,响应于流式语音识别请 求,根据预设的时长,将连续接收的所述待识别 音频数据,划分为待识别语音块,将各待识别语 音块依次输入预训练的语音识别模型,通过特征 提取子网得到第一语音特征,将该待识别语音块 的第一语音特征和指定语音块的第一语音特征 输入到特征编码子网,通过注意力编码层得到第 一注意力得分和第二注意力得分,进而确定出该 待识别语音块的第二语音特征,将第二语音特征 输入解码器,确定该待识别语音块的预测文本。 A 可见,通过特征编码子网中的注意力编码层确定 0 第一注意力得分和第二注意力得分的方式,能够
最新专利
- 基于改进的INMF的声学降噪方法及装置公开日期:2025-06-06公开号:CN116778945A申请号:CN202310562147.9基于改进的INMF的声学降噪方法及装置
- 发布时间:2023-09-24 07:18:030
- 申请号:CN202310562147.9
- 公开号:CN116778945A
- 车载语音信号的反馈方法、装置、电子设备及存储介质公开日期:2025-06-06公开号:CN116612756A申请号:CN202310606468.4车载语音信号的反馈方法、装置、电子设备及存储介质
- 发布时间:2023-08-21 07:09:460
- 申请号:CN202310606468.4
- 公开号:CN116612756A
- 一种基于多种设备有监督域自适应的声场景分类方法公开日期:2025-06-06公开号:CN116386599A申请号:CN202310369908.9一种基于多种设备有监督域自适应的声场景分类方法
- 发布时间:2023-07-06 10:33:020
- 申请号:CN202310369908.9
- 公开号:CN116386599A
- 一种基于云边协同的野外鸟类监测系统和方法公开日期:2025-06-06公开号:CN116386649A申请号:CN202310367657.0一种基于云边协同的野外鸟类监测系统和方法
- 发布时间:2023-07-06 10:32:550
- 申请号:CN202310367657.0
- 公开号:CN116386649A
- 一种篇章级别多尺度文本韵律分析方法、装置和设备公开日期:2025-06-06公开号:CN116386595A申请号:CN202310347958.7一种篇章级别多尺度文本韵律分析方法、装置和设备
- 发布时间:2023-07-06 10:31:550
- 申请号:CN202310347958.7
- 公开号:CN116386595A
- 在语音识别结果中实时地提供提示公开日期:2025-06-06公开号:CN113763943A申请号:CN202010517639.2在语音识别结果中实时地提供提示
- 发布时间:2023-07-03 10:58:590
- 申请号:CN202010517639.2
- 公开号:CN113763943A