PCT发明

使用基于前瞻的声学语言特征的智能音频分段2024

2024-04-04 07:14:47 发布于四川 0
  • 申请专利号:CN202180095035.6
  • 公开(公告)日:2024-04-02
  • 公开(公告)号:CN117813651A
  • 申请人:微软技术许可有限责任公司
摘要:提供了用于使用基于前瞻的声学语言特征的智能音频分段的系统和方法。例如,提供了用于获得音频、处理音频、标识音频内的潜在分段边界以及确定是否要在该潜在分段边界处生成分段中断的系统和方法。标识出现在潜在分段边界之后的一个或多个前瞻词,其中生成与该潜在分段边界和一个或多个前瞻词相关联的声学分段分数和语言分段分数。随后,系统基于声学和/或语言分段分数至少达到或超过分段分数阈值来避免在潜在分段边界处生成分段中断或者在潜在分段边界处生成分段中断。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117813651 A (43)申请公布日 2024.04.02 (21)申请号 202180095035.6 (74)专利代理机构 上海专利商标事务所有限公 司 31100 (22)申请日 2021.12.22 专利代理师 胡利鸣 (85)PCT国际申请进入国家阶段日 (51)Int.Cl . 2023.08.31 G10L 15/04 (2013.01) (86)PCT国际申请的申请数据 PCT/CN2021/140296 2021.12.22 (87)PCT国际申请的公布数据 WO2023/115363 EN 2023.06.29 (71)申请人 微软技术许可有限责任公司 地址 美国华盛顿州 (72)发明人 S ·D ·帕塔克 H ·A ·海莉尔  N ·帕瑞哈 P ·贝赫雷 S ·常  C ·H ·巴索格鲁 S ·W ·谭  E ·沙尔马 J ·吴 刘阳 林恒慷  A ·K ·阿加瓦尔  权利要求书2页 说明书15页 附图8页 (54)发明名称

最新专利