物理
下拉
最新专利
-
基于自注意力变换网络的多特征融合回声消除方法及系统 公开日期:2024-09-13 公开号:CN113870874A 申请号:CN202111113340.1基于自注意力变换网络的多特征融合回声消除方法及系统
- 申请号:CN202111113340.1
- 公开号:CN113870874A
- 公开日期:2024-09-13
- 申请人:武汉大学
本发明公开了一种基于自注意力变换网络的多特征融合回声消除方法及系统,使用独立的卷积编码器对近端信号和远端信号分别提取潜在特征;将编码后的双端信号经过多头注意力计算注意力权重矩阵,与双端信号的潜在特征进行拼接,并使用一个深度可分离卷积网络对拼接信号进行融合;融合信号通过维度转换操作后生成块内特征,经过一个深度动态自注意力变换网络,再利用残差连接与注意力权重矩阵相加,转换为块间特征后再次经过深度动态自注意力变换网络;重复块内及块间操作,计算出掩码值;将掩蔽后的编码信号进行解码,得到消除回声后的近端信号。本发明能够在多种场景下消除回声,能够在保持近端语音完整性的情况下极大地提升回声消除的效果。- 发布时间:2023-07-09 07:07:29
- 1
-
判断通话是否有效拨出的方法及设备 公开日期:2024-09-13 公开号:CN113314152A 申请号:CN202110769012.0判断通话是否有效拨出的方法及设备
- 申请号:CN202110769012.0
- 公开号:CN113314152A
- 公开日期:2024-09-13
- 申请人:上海中通吉网络技术有限公司
本申请涉及一种判断通话是否有效拨出的方法及设备,方法包括:接收快递员移动终端发送的拨号请求,根据拨号请求向对应的用户进行拨号并进行录音,通话结束时根据录音生成录音文件,对录音文件进行解析,得到录音特征点,根据录音特征点判断拨号是否被接听。本申请中,通过对快递员向用户发出的通话进行录音,通话结束后根据录音文件判断该通话是否被接听,可以有效的判断快递员向用户拨出的电话是否被接听,进而完成对业务员的考核。- 发布时间:2023-06-23 07:18:24
- 0
-
高效DRC配置文件传输 公开日期:2024-09-13 公开号:CN113257275A 申请号:CN202110527052.4高效DRC配置文件传输
- 申请号:CN202110527052.4
- 公开号:CN113257275A
- 公开日期:2024-09-13
- 申请人:杜比国际公司
本公开涉及高效DRC配置文件传输。描述了一种用于对编码音频信号进行解码的方法。编码音频信号包括帧序列,并且指示用于对应的多个不同渲染模式的多个不同的动态范围控制(DRC)配置文件。所述方法包括:从所述多个不同的渲染模式确定第一渲染模式;从帧序列的当前帧内所包括的DRC配置文件子集确定一个或多个DRC配置文件;确定所述一个或多个DRC配置文件中的至少一个是否适用于第一渲染模式;如果所述一个或多个DRC配置文件都不适用于第一渲染模式,则选择默认DRC配置文件作为当前DRC配置文件;其中,默认DRC配置文件的定义数据在解码器处是已知的;并且使用当前DRC配置文件对当前帧进行解码。- 发布时间:2023-06-17 07:17:34
- 0
-
高效DRC配置文件传输 公开日期:2024-09-13 公开号:CN113257274A 申请号:CN202110526963.5高效DRC配置文件传输
- 申请号:CN202110526963.5
- 公开号:CN113257274A
- 公开日期:2024-09-13
- 申请人:杜比国际公司
本公开涉及高效DRC配置文件传输。描述了一种用于对编码音频信号进行解码的方法。编码音频信号包括帧序列,并且指示用于对应的多个不同渲染模式的多个不同的动态范围控制(DRC)配置文件。所述方法包括:从所述多个不同的渲染模式确定第一渲染模式;从帧序列的当前帧内所包括的DRC配置文件子集确定一个或多个DRC配置文件;确定所述一个或多个DRC配置文件中的至少一个是否适用于第一渲染模式;如果所述一个或多个DRC配置文件都不适用于第一渲染模式,则选择默认DRC配置文件作为当前DRC配置文件;其中,默认DRC配置文件的定义数据在解码器处是已知的;并且使用当前DRC配置文件对当前帧进行解码。- 发布时间:2023-06-17 07:17:34
- 1
-
高效DRC配置文件传输 公开日期:2024-09-13 公开号:CN113257273A 申请号:CN202110526962.0高效DRC配置文件传输
- 申请号:CN202110526962.0
- 公开号:CN113257273A
- 公开日期:2024-09-13
- 申请人:杜比国际公司
本公开涉及高效DRC配置文件传输。描述了一种用于对编码音频信号进行解码的方法。编码音频信号包括帧序列,并且指示用于对应的多个不同渲染模式的多个不同的动态范围控制(DRC)配置文件。所述方法包括:从所述多个不同的渲染模式确定第一渲染模式;从帧序列的当前帧内所包括的DRC配置文件子集确定一个或多个DRC配置文件;确定所述一个或多个DRC配置文件中的至少一个是否适用于第一渲染模式;如果所述一个或多个DRC配置文件都不适用于第一渲染模式,则选择默认DRC配置文件作为当前DRC配置文件;其中,默认DRC配置文件的定义数据在解码器处是已知的;并且使用当前DRC配置文件对当前帧进行解码。- 发布时间:2023-06-17 07:17:34
- 0
-
基于佛乐的音轨分离方法、装置、设备及存储介质 公开日期:2024-09-13 公开号:CN113012667A 申请号:CN202110284978.5基于佛乐的音轨分离方法、装置、设备及存储介质
- 申请号:CN202110284978.5
- 公开号:CN113012667A
- 公开日期:2024-09-13
- 申请人:平安科技(深圳)有限公司
本发明涉及人工智能领域,公开了一种基于佛乐的音轨分离方法、装置、设备及存储介质,用于提高分离音轨的灵活性和分离音轨的工作效率。基于佛乐的音轨分离方法包括:获取音乐数据,并将音乐数据拆分为多个时段音乐数据,音乐数据为佛乐数据;将音乐数据输入预置的权重参数生成器,得到多个参数权重;将多个参数权重和多个时段音乐数据输入预置的提取器模型,结合每个时段音乐数据的分辨率进行音轨分离,生成多个音乐音轨组,每个音乐音轨组包括多种类型音轨,提取器包括线性编码器、膨胀神经网络和解码器;按照多种类型音轨,对多个音乐音轨组进行整合,得到多个目标完整音轨。此外,本发明还涉及区块链技术,多个目标完整音轨可存储于区块链中。- 发布时间:2023-06-14 12:05:58
- 0
-
编码方法、装置以及记录介质 公开日期:2024-09-13 公开号:CN112992163A 申请号:CN202110191341.1编码方法、装置以及记录介质
- 申请号:CN202110191341.1
- 公开号:CN112992163A
- 公开日期:2024-09-13
- 申请人:日本电信电话株式会社
目的在于提供一种编码技术,与输入音响信号的特性无关地高效地进行编码,且能够得到收听者感到不自然的情况较少的解码音响信号。一种编码方法,将输入音响信号按规定时间区间的帧的每个,通过在频域上的多个编码处理之中被决定的编码处理来进行编码,其中,决定部(380)在前一帧的输入音响信号的高频分量的能量的大小与当前帧的输入音响信号的高频分量的能量的大小的至少其中一个为规定的阈值以下的情况下,设为能够将与前一帧不同的编码处理决定作为当前帧的编码处理。- 发布时间:2023-06-11 13:29:21
- 0
-
用于音频信号的高频重建的谐波转置器的后向兼容集成 公开日期:2024-09-13 公开号:CN112863528A 申请号:CN202110086189.0用于音频信号的高频重建的谐波转置器的后向兼容集成
- 申请号:CN202110086189.0
- 公开号:CN112863528A
- 公开日期:2024-09-13
- 申请人:杜比国际公司
本申请涉及用于音频信号的高频重建的谐波转置器的后向兼容集成。本申请揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流,及解码音频数据以产生经解码低带音频信号。所述方法进一步包含提取高频重建元数据,及使用分析滤波器组对所述经解码低带音频信号进行滤波以产生经滤波低带音频信号。所述方法还包含提取指示将对所述音频数据执行频谱变换还是谐波转置的旗标,及根据所述旗标使用所述经滤波低带音频信号及所述高频重建元数据再生所述音频信号的高带部分。- 发布时间:2023-06-11 12:07:39
- 0
-
解码装置、解码方法、解码程序、记录介质 公开日期:2024-09-13 公开号:CN112820304A 申请号:CN202110081890.3解码装置、解码方法、解码程序、记录介质
- 申请号:CN202110081890.3
- 公开号:CN112820304A
- 公开日期:2024-09-13
- 申请人:日本电信电话株式会社
提供一种能够将在由音响信号的基音周期引起的峰值附近的近似精度高的频域的包络序列以较少的码量再现的解码装置、解码方法、解码程序、记录介质。本发明的解码装置具有周期性综合包络生成部和可变长度解码部。周期性综合包络生成部生成频域的序列的周期性综合包络序列,所述周期性综合包络序列基于与线性预测系数码对应的频域的序列即谱包络序列、以及频域的周期。可变长度解码部对可变长度码进行解码而获得频域的序列。- 发布时间:2023-06-07 12:41:56
- 0
-
一种唢呐及芯子 公开日期:2024-09-13 公开号:CN112767898A 申请号:CN202110277078.8一种唢呐及芯子
- 申请号:CN202110277078.8
- 公开号:CN112767898A
- 公开日期:2024-09-13
- 申请人:厦门市音乐学校
本发明提供一种唢呐。所述唢呐包括芯子、管体与碗体。所述芯子与所述碗体分别连接于所述管体的两端。所述芯子、所述管体、与所述碗体均为径向贯通结构以实现吹奏气流的径向流动。所述芯子的侧壁上设有至少一芯子通孔。本发明还提供一种芯子,所述芯子的侧壁上设有至少一芯子通孔。本发明通过在芯子上开设芯子通孔,从而改变唢呐内空气柱的长度,优化唢呐结构,从而使演奏者可以完成对管体最上方两个孔的超吹操作,进而使演奏者在超吹情形下在这两个孔上能完成在其他六个孔上完成的各种吹奏技巧。- 发布时间:2023-06-07 12:16:29
- 0