PCT发明

使用合成图像特征来对音频场景进行分类

2022-10-24 10:22:49 发布于四川 1
  • 申请专利号:CN202080093349.8
  • 公开(公告)日:2025-10-03
  • 公开(公告)号:CN115004299A
  • 申请人:微软技术许可有限责任公司
摘要:一种计算系统包括接收输入图像并将该输入图像编码成真实图像特征的编码器;将该真实图像特征解码成经重构图像的解码器;生成器,该生成器接收对应于该输入图像的第一音频数据并从该第一音频数据中生成第一合成图像特征,并且接收第二音频数据并从该第二音频数据中生成第二合成图像特征;鉴别器,该鉴别器接收真实和合成图像特征这两者并确定目标特征是真实的还是合成的;以及分类器,该分类器基于第二合成图像特征来对第二音频数据的场景进行分类。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 115004299 A (43)申请公布日 2022.09.02 (21)申请号 202080093349.8 (74)专利代理机构 上海专利商标事务所有限公 司 31100 (22)申请日 2020.11.24 专利代理师 钱盛赟 胡利鸣 (30)优先权数据 (51)Int.Cl. 62/961,049 2020.01.14 US G10L 25/51 (2013.01) 16/844,930 2020.04.09 US G10L 25/30 (2013.01) (85)PCT国际申请进入国家阶段日 G06N 3/04 (2006.01) 2022.07.14 G06N 3/08 (2006.01) (86)PCT国际申请的申请数据 G10L 25/57 (2013.01) PCT/US2020/062101 2020.11.24

最新专利