发明

音乐文件的人声分离方法和装置

2023-04-24 09:45:17 发布于四川 0
  • 申请专利号:CN202111262469.9
  • 公开(公告)日:2024-09-17
  • 公开(公告)号:CN114005460A
  • 申请人:广州艾美网络科技有限公司
摘要:本申请涉及一种音乐文件的人声分离方法、装置、计算机设备以及计算机可读存储介质;所述方法包括:获取歌手的有效语料信息;对所述有效语料信息进行神经网络分析得到该歌手声纹的人声特征系数矩阵,并存储在所述歌手的特征库中;导入目标音乐,识别所述目标音乐的歌手,并从所述特征库查找出该歌手声纹的人声特征系数矩阵;将所述目标音乐的频谱信息与所述人声特征系数矩阵相乘得到目标音乐的人声文件;该技术方案,通过歌手人物的声纹特征提取和神经网络的训练从而得到该歌手最优的人声特征系数矩阵,利用该人声特征系数矩阵可以体现该歌手的发声音色,作用于目标音乐的频谱可使得纯人声还原度更高,提升了人声分离的纯净度,降低了失真度。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114005460 A (43)申请公布日 2022.02.01 (21)申请号 202111262469.9 (22)申请日 2021.10.28 (71)申请人 广州艾美网络科技有限公司 地址 510000 广东省广州市海珠区昌岗中 路238号2502-2506房 (72)发明人 徐焕芬 周跃兵  (74)专利代理机构 广州市律帆知识产权代理事 务所(普通合伙) 44614 代理人 余永文 (51)Int.Cl. G10L 21/028 (2013.01) 权利要求书2页 说明书10页 附图6页 (54)发明名称 音乐文件的人声分离方法和装置 (57)摘要 本申请涉及一种音乐文件的人声分离方法、 装置、计算机设备以及计算机可读存储介质;所 述方法包括:获取歌手的有效语料信息;对所述 有效语料信息进行神经网络分析得到该歌手声 纹的人声特征系数矩阵,并存储在所述歌手的特 征库中;导入目标音乐,识别所述目标音乐的歌 手,并从所述特征库查找出该歌手声纹的人声特 征系数矩阵;将所述目标音乐的频谱信息与所述 人声特征系数矩阵相乘得到目标音乐的人声文 件;该技术方案,通过歌手人物的声纹特征提取 和神经网络的训练从而得到该歌手最优的人声 特征系数矩阵,利用该人声特征系数矩阵可以体 A 现该歌手的发声音色,作用于目标音乐的频谱可 0 使得纯人声还原度更高,提升了人声分离的纯净 6 4 5 度,降低了失真度。 0 0 4

最新专利