PCT发明

基于深度学习的语音增强

2023-07-30 07:13:17 发布于四川 1
  • 申请专利号:CN202180073792.3
  • 公开(公告)日:2025-01-10
  • 公开(公告)号:CN116508099A
  • 申请人:杜比实验室特许公司
摘要:公开了一种用于抑制噪声并增强语音的系统和相关方法。所述系统训练神经网络模型,所述神经网络模型获取与原始带噪声波形相对应的带能量并产生语音值,所述语音值指示每一帧处的每个频带中存在的语音量。所述神经模型包括实施某种前瞻的特征提取块。所述特征提取块之后是编码器,所述编码器沿频域进行稳定的下采样,从而形成收缩路径。所述编码器之后是对应的解码器,所述解码器沿频域进行稳定的上采样,从而形成扩大路径。所述解码器从对应级别的编码器接收经缩放的输出特征图。所述解码器之后是分类块,所述分类块生成语音值,所述语音值指示针对所述多个帧中的每一帧处的所述多个频带中的每个频带存在的语音量。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116508099 A (43)申请公布日 2023.07.28 (21)申请号 202180073792.3 (72)发明人 刘晓宇 M ·G ·霍根 R ·M ·菲金  P ·霍尔伯格  (22)申请日 2021.10.29 (74)专利代理机构 北京市汉坤律师事务所 (30)优先权数据 11602 63/115,213 2020.11.18 US 专利代理师 初媛媛 吴丽丽 63/221,629 2021.07.14 US (51)Int.Cl . (66)本国优先权数据 G10L 21/0208 (2006.01) PCT/CN2020/124635 2020.10.29 CN (85)PCT国际申请进入国家阶段日 2023.04.27 (86)PCT国际申请的申请数据 PCT/US2021/057378 2021.10.29 (87)PCT国际申请的公布数据 WO2022/094293 EN 2022.05.05

最新专利