发明

音视频唤醒方法、系统、设备及存储介质

2023-06-23 08:04:06 发布于四川 0
  • 申请专利号:CN202110665499.8
  • 公开(公告)日:2024-04-02
  • 公开(公告)号:CN113393833A
  • 申请人:中国科学技术大学
摘要:本发明公开了一种音视频唤醒方法、系统、设备及存储介质,引入视频模态来改善和提高唤醒系统性能,能够适应真实复杂场景下的唤醒任务,提高唤醒率,提升交互体验;而且,也针对音视频多模态唤醒数据量相对较少的特点,提出使用基于跨模态的师生模型,迁移并利用丰富的大数据量单模态声学数据训练得到的有效信息,改善因多模态音视频唤醒训练数据量较少带来的系统性能损失,提高唤醒率。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113393833 A (43)申请公布日 2021.09.14 (21)申请号 202110665499.8 G06N 3/04 (2006.01) G06N 3/08 (2006.01) (22)申请日 2021.06.16 (71)申请人 中国科学技术大学 地址 230026 安徽省合肥市包河区金寨路 96号 (72)发明人 周恒顺 杜俊  (74)专利代理机构 北京凯特来知识产权代理有 限公司 11260 代理人 郑立明 韩珂 (51)Int.Cl. G10L 15/06 (2013.01) G10L 15/16 (2006.01) G10L 15/22 (2006.01) G10L 15/26 (2006.01) G06K 9/62 (2006.01) 权利要求书2页 说明书8页 附图2页 (54)发明名称 音视频唤醒方法、系统、设备及存储介质 (57)摘要 本发明公开了一种音视频唤醒方法、系统、 设备及存储介质,引入视频模态来改善和提高唤 醒系统性能,能够适应真实复杂场景下的唤醒任 务,提高唤醒率,提升交互体验;而且,也针对音 视频多模态唤醒数据量相对较少的特点,提出使 用基于跨模态的师生模型,迁移并利用丰富的大 数据量

最新专利