音频数据处理方法、装置、电子设备、存储介质及产品
- 申请专利号:CN202111539880.6
- 公开(公告)日:2024-12-31
- 公开(公告)号:CN114299997A
- 申请人:北京声智科技有限公司
专利内容
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114299997 A (43)申请公布日 2022.04.08 (21)申请号 202111539880.6 (22)申请日 2021.12.15 (71)申请人 北京声智科技有限公司 地址 100094 北京市海淀区北清路81号院 一区1号楼6层601 (72)发明人 李良斌 陈孝良 (74)专利代理机构 北京三高永信知识产权代理 有限责任公司 11138 代理人 王静 (51)Int.Cl. G10L 25/87 (2013.01) G10L 15/02 (2006.01) G10L 15/22 (2006.01) 权利要求书3页 说明书19页 附图4页 (54)发明名称 音频数据处理方法、装置、电子设备、存储介 质及产品 (57)摘要 本申请提供了一种音频数据处理方法、装 置、电子设备、存储介质及产品,属于语音交互技 术领域。方法包括:接收输入的音频数据,对音频 数据进行识别处理,输出识别结果;在识别结果 包括唤醒词的情况下,获取音频数据的解码图, 解码图包括音频数据对应的解码路径的跳转标 识序列,跳转标识序列用于表示音频数据中相邻 音频帧之间的音素变化情况;从跳转标识序列中 确定目标跳转标识,目标跳转标识满足目标条 件,目标条件表示跳转标识序列中的跳转标识属 于唤醒词的唤醒音素序列对应的跳转标识;基于 A 目标跳转标识,确定唤醒词对应的唤醒音频数据 7 的首端点。该方案实现了