一种基于语音驱动的真实感虚拟人生成方法及装置
- 申请专利号:CN202310081778.9
- 公开(公告)日:2025-06-10
- 公开(公告)号:CN116206607A
- 申请人:北京航空航天大学|||北京航空航天大学江西研究院
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116206607 A (43)申请公布日 2023.06.02 (21)申请号 202310081778.9 (22)申请日 2023.02.08 (71)申请人 北京航空航天大学 地址 100191 北京市海淀区学院路37号 (72)发明人 百晓 李嘉禾 王晨 郑锦 (51)Int.Cl. G10L 15/25 (2013.01) G10L 17/04 (2013.01) G10L 25/03 (2013.01) G10L 25/27 (2013.01) G10L 25/48 (2013.01) G06V 40/16 (2022.01) G06V 10/774 (2022.01) G06V 10/82 (2022.01) G06N 3/0475 (2023.01) G06N 3/09 (2023.01) 权利要求书3页 说明书5页 附图3页 (54)发明名称 一种基于语音驱动的真实感虚拟人生成方 法及装置 (57)摘要 本发明提出一种基于语音驱动的真实感虚 拟人生成方法 :输入源视频和驱动音频 ;以源视 频中的人物为虚拟人原型,从源视频中提取头部 姿态、面部形状信息以及纹理信息 ;以驱动音频 作为虚拟人说话的内容,输入驱动音频,合成与 驱动音频同步的面部表情参数和眨眼动作信息; 使用面部表情参数、眨眼动作信息、头部姿态、面 部形状信息以及纹理信息构建虚拟人3DMM模型 渲染图;引入Wav2Lip模块,将3DMM模型渲染
最新专利
- 车载语音交互方法、装置、计算机设备和存储介质公开日期:2025-06-24公开号:CN116403581A申请号:CN202310329850.5车载语音交互方法、装置、计算机设备和存储介质
- 发布时间:2023-07-09 07:14:560
- 申请号:CN202310329850.5
- 公开号:CN116403581A
- 音频合成方法、装置、计算机可读存储介质及电子设备公开日期:2025-06-24公开号:CN113838443A申请号:CN202110815643.1音频合成方法、装置、计算机可读存储介质及电子设备
- 发布时间:2023-07-06 11:04:340
- 申请号:CN202110815643.1
- 公开号:CN113838443A
- 音频识别方法、装置、计算机设备及存储介质公开日期:2025-06-24公开号:CN113823320A申请号:CN202110827135.5音频识别方法、装置、计算机设备及存储介质
- 发布时间:2023-07-06 10:55:500
- 申请号:CN202110827135.5
- 公开号:CN113823320A
- 一种语音识别方法、装置和计算机设备公开日期:2025-06-24公开号:CN113823265A申请号:CN202110815555.1一种语音识别方法、装置和计算机设备
- 发布时间:2023-07-06 10:55:480
- 申请号:CN202110815555.1
- 公开号:CN113823265A
- 语音识别方法、装置、计算机可读存储介质及计算机设备公开日期:2025-06-24公开号:CN113823264A申请号:CN202110731479.6语音识别方法、装置、计算机可读存储介质及计算机设备
- 发布时间:2023-07-06 10:55:410
- 申请号:CN202110731479.6
- 公开号:CN113823264A
- 语音交互方法及洗衣机公开日期:2025-06-24公开号:CN113793616A申请号:CN202010448371.1语音交互方法及洗衣机
- 发布时间:2023-07-05 07:10:500
- 申请号:CN202010448371.1
- 公开号:CN113793616A