模型训练方法及装置、语音唤醒方法及装置
- 申请专利号:CN202111137419.8
- 公开(公告)日:2025-06-20
- 公开(公告)号:CN113851113A
- 申请人:维沃移动通信有限公司
专利内容
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113851113 A (43)申请公布日 2021.12.28 (21)申请号 202111137419.8 (22)申请日 2021.09.27 (71)申请人 维沃移动通信有限公司 地址 523863 广东省东莞市长安镇维沃路1 号 (72)发明人 石杨 (74)专利代理机构 北京润泽恒知识产权代理有 限公司 11319 代理人 乔珊珊 (51)Int.Cl. G10L 15/02 (2006.01) G10L 15/06 (2013.01) G10L 15/18 (2013.01) 权利要求书2页 说明书13页 附图4页 (54)发明名称 模型训练方法及装置、语音唤醒方法及装置 (57)摘要 本申请公开了一种模型训练方法及装置、语 音唤醒方法及装置、电子设备和可读存储介质, 属于数据处理技术领域。其中,所述模型训练方 法包括:获取音频训练数据的第一特征信息,所 述音频训练数据包括唤醒音频和非唤醒音频;通 过待训练的声学模型、生成对抗网络模型,以及 所述第一特征信息,输出所述音频训练数据的音 素信息和语义信息;通过待训练的所述生成对抗 网络模型,以及所述音素信息、所述语义信息,输 出所述音频训练数据的第二特征信息;根据所述 第一特征信息和所述第二特征信息,对所述声学 模型和所述生成对抗网络模型进行训练。 A 3 1 1 1 5 8 3 1 1 N C
最新专利
- 吸声装置及吸声系统公开日期:2025-08-12公开号:CN117012175A申请号:CN202210466348.4吸声装置及吸声系统
- 发布时间:2023-11-11 07:14:170
- 申请号:CN202210466348.4
- 公开号:CN117012175A
- 一种基于声纹识别的音频鉴伪方法公开日期:2025-08-12公开号:CN116959455A申请号:CN202310875841.6一种基于声纹识别的音频鉴伪方法
- 发布时间:2023-10-31 07:22:260
- 申请号:CN202310875841.6
- 公开号:CN116959455A
- 一种信息化合成语音的识别方法公开日期:2025-08-12公开号:CN116805485A申请号:CN202310835802.3一种信息化合成语音的识别方法
- 发布时间:2023-09-29 07:10:160
- 申请号:CN202310835802.3
- 公开号:CN116805485A
- 一种基于深度学习的全景音频编码方法公开日期:2025-08-12公开号:CN116453527A申请号:CN202310424297.3一种基于深度学习的全景音频编码方法
- 发布时间:2023-07-21 07:14:460
- 申请号:CN202310424297.3
- 公开号:CN116453527A
- 声纹识别模型训练方法、声纹识别方法及相关设备公开日期:2025-08-12公开号:CN113870862A申请号:CN202111142575.3声纹识别模型训练方法、声纹识别方法及相关设备
- 发布时间:2023-07-09 07:08:190
- 申请号:CN202111142575.3
- 公开号:CN113870862A
- 音频合成方法和装置、存储介质及电子设备公开日期:2025-08-12公开号:CN113763922A申请号:CN202110517152.9音频合成方法和装置、存储介质及电子设备
- 发布时间:2023-07-03 11:01:180
- 申请号:CN202110517152.9
- 公开号:CN113763922A