发明

直播互动方法、装置、电子设备及可读存储介质

2023-06-02 13:35:40 发布于四川 0
  • 申请专利号:CN202011508099.8
  • 公开(公告)日:2024-12-31
  • 公开(公告)号:CN112562705A
  • 申请人:广州虎牙信息科技有限公司
摘要:本申请实施例提供一种直播互动方法、装置、电子设备及可读存储介质,通过将主播输入的第一音频数据进行切分,并从得到的多个音频片段中提取出内容特征图,然后通过提取该内容特征图的内容特征向量,并对该内容特征向量进行转换,得到具有目标音色风格的风格转换图。接着对内容特征图和风格转换图进行特征反转换,得到具有该目标音色风格的第二音频数据。最后,根据第二音频数据生成该主播对应的虚拟形象的互动视频流,并发送给客户端进行播放。如此,能够针对任意主播,在不改变音频内容的同时,将虚拟形象直播过程中的音色风格转换为目标音色风格以与观众进行互动,进而提高直播过程中的互动效果,更大程度上地调动观众与主播的互动。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 112562705 A (43)申请公布日 2021.03.26 (21)申请号 202011508099.8 (22)申请日 2019.05.05 (62)分案原申请数据 201910368510.7 2019.05.05 (71)申请人 广州虎牙信息科技有限公司 地址 511495 广东省广州市番禺区钟村街 (汉溪商业中心)泽溪街13号1401 (72)发明人 徐子豪 刘炉  (74)专利代理机构 北京超凡宏宇专利代理事务 所(特殊普通合伙) 11463 代理人 张欣欣 (51)Int.Cl. G10L 21/013 (2013.01) H04L 29/06 (2006.01) 权利要求书3页 说明书9页 附图7页 (54)发明名称 直播互动方法、装置、电子设备及可读存储 介质 (57)摘要 本申请实施例提供一种直播互动方法、装 置、电子设备及可读存储介质,通过将主播输入 的第一音频数据进行切分,并从得到的多个音频 片段中提取出内容特征图,然后通过提取该内容 特征图的内容特征向量,并对该内容特征向量进 行转换,得到具有目标音色风格的风格转换图。 接着对内容特征图和风格转换图进行特征反转 换,得到具有该目标音色风格的第二音频数据。 最后,根据第二音频数据生成该主播对应的虚拟 形象的互动视频流,并发送给客户端进行播放。 如此,能够针对任意主播,在不改变音频内容的 A 同时,将虚拟形象直播过程中的音

最新专利