物理
下拉
最新专利
-
音频自适应滤波方法、装置、电子设备及可读介质 公开日期:2024-04-02 公开号:CN117809670A 申请号:CN202311667091.X音频自适应滤波方法、装置、电子设备及可读介质
- 申请号:CN202311667091.X
- 公开号:CN117809670A
- 公开日期:2024-04-02
- 申请人:中国农业银行股份有限公司
本发明公开了音频自适应滤波方法、装置、电子设备及可读介质。将待处理的音频切割为音频片段;对每个所述音频片段进行预识别,得到每个所述音频片段的统计数据,所述统计数据表征音频片段包含的文字信息;根据所述统计数据确定所述音频片段中各采样点尺度;根据所述各采样点尺度确定自适应尺度滤波窗口,基于所述自适应尺度滤波窗口对所述音频片段的各采样点进行自适应均值滤波。本发明的方案能够根据音频的音频内容分布确定自适应均值滤波窗口,根据音频内容的分布尺度、采用均值滤波核进行有效滤波,从而提高音频去噪的效果。- 发布时间:2024-04-04 07:18:56
- 0
-
语音合成方法、装置、电子设备和存储介质 公开日期:2024-04-02 公开号:CN117809620A 申请号:CN202410088183.0语音合成方法、装置、电子设备和存储介质
- 申请号:CN202410088183.0
- 公开号:CN117809620A
- 公开日期:2024-04-02
- 申请人:网易有道信息技术(北京)有限公司
本发明的实施方式提供了一种语音合成方法、装置、电子设备和存储介质。该语音合成方法包括:获取待合成的文本信息;将所述文本信息输入预先训练的语音合成模型中,所述语音合成模型包括音频量化过程和语音合成过程,所述音频量化过程用于将所述文本信息中的文本转换为音素,得到初始音素信息;确定所述初始音素信息中每个音素的持续时长,并将所述音素与所述持续时长对齐,得到对齐音素信息,所述对齐音素信息进行音频量化,得到量化编码;所述语音合成过程用于将所述量化编码进行还原,得到音频信息,其中,音频量化过程与语音合成过程同时训练得到所述语音合成模型。以解决现有技术中,语音合成速度比较慢,效率较低的问题。- 发布时间:2024-04-04 07:25:47
- 0
-
一种变压器声纹异常检测方法 公开日期:2024-04-02 公开号:CN117809695A 申请号:CN202410068466.9一种变压器声纹异常检测方法
- 申请号:CN202410068466.9
- 公开号:CN117809695A
- 公开日期:2024-04-02
- 申请人:国网黑龙江省电力有限公司佳木斯供电公司|||国家电网有限公司
本申请涉及变压器检测领域,公开了一种变压器声纹异常检测方法,包括:S1、通过高质量传感器采集变压器声纹数据;S2、对采集到的声纹数据进行数据清洗和归一化处理;S3、使用预训练模型提取变压器声纹数据的初始特征表示;S4、使用微调技术调整预训练模型,使其适应变压器声纹数据的特定任务;S5、引入循环神经网络或注意力机制对声纹数据进行时序建模;S6、使用训练好的模型对声纹数据进行异常检测。本发明可以提高异常检测的准确性、增强特征表示的丰富性、考虑声音数据的时序关系,并具备适应不同数据情况的灵活性,使得变压器声纹异常检测方法能够更可靠地监测和判断变压器的状态,提高设备的可靠性和安全性。- 发布时间:2024-04-04 07:25:35
- 0
-
电子设备、语音识别方法、装置及存储介质 公开日期:2024-04-02 公开号:CN117809644A 申请号:CN202311014455.4电子设备、语音识别方法、装置及存储介质
- 申请号:CN202311014455.4
- 公开号:CN117809644A
- 公开日期:2024-04-02
- 申请人:海信视像科技股份有限公司
本发明实施例公开了一种电子设备、语音识别方法、装置及存储介质,涉及语音识别技术领域,该电子设备包括:接收器,被配置为接收用户输入的语音指令;与所述接收器耦接的控制器,所述控制器被配置为:响应于所述语音指令,对所述语音指令进行识别,得到所述语音指令对应的多个候选识别结果;根据所述候选识别结果确定所述候选识别结果对应的实体数量;在所述实体数量小于或等于阈值数量的情况下,利用场景决策模块对所述语音指令的场景信息进行分析,以在所述多个候选识别结果中确定所述语音指令的目标识别结果。应用本发明的技术方案,能够提高语音识别的准确率。- 发布时间:2024-04-04 07:17:13
- 0
-
服务器、语音唤醒方法及介质 公开日期:2024-04-02 公开号:CN117809640A 申请号:CN202310675722.6服务器、语音唤醒方法及介质
- 申请号:CN202310675722.6
- 公开号:CN117809640A
- 公开日期:2024-04-02
- 申请人:海信电子科技(武汉)有限公司
本公开涉及一种服务器、语音唤醒方法及介质,包括:获取待检测语音流,待检测语音流是根据多个关键词组成的,将待检测语音流输入至唤醒词概率预测模型中,获取各个关键词的概率值,唤醒词概率预测模型是基于样本训练集训练得到的,样本训练集包括:多个训练语音及训练语音对应的标签,训练语音包括:包含唤醒词的训练语音、包含非唤醒词的训练语音及包含中间词的训练语音,中间词是根据唤醒词确定的,标签包括:唤醒词对应的第一标签、非唤醒词对应的第二标签及中间词对应的第三标签;当存在概率值大于预设概率值时,确定在待检测语音流中检测到所述唤醒词,将检测结果发送给终端设备,以使终端设备进行语音唤醒,以提高确定唤醒词的准确性。- 发布时间:2024-04-04 07:16:58
- 0
-
用于键盘乐器的键盘装置 公开日期:2024-04-02 公开号:CN117809600A 申请号:CN202311279839.9用于键盘乐器的键盘装置
- 申请号:CN202311279839.9
- 公开号:CN117809600A
- 公开日期:2024-04-02
- 申请人:株式会社河合乐器制作所
一种用于键盘乐器的键盘装置,其能够从整个键盘装置上获得稳定的断连感觉。断连构件可移除地安装在键盘底座的肋中的相邻两个中的每一个上。在安置于两个肋之间的第一臂上,设置以下各者:第一接合部分,其在键压下时与安装在相邻两个肋上的两个断连构件中的一个的接合突起暂时接合,从而向已被压下的键的触感感觉增添断连感觉;以及第二接合部分,其与另一断连构件的引导部分接合,使得第二接合部分变得与引导部分滑动接触,从而沿竖直方向被引导。- 发布时间:2024-04-04 07:17:35
- 0
-
一种语音调试设备的方法、系统、计算机设备和存储介质 公开日期:2024-04-02 公开号:CN112382288A 申请号:CN202011255980.1一种语音调试设备的方法、系统、计算机设备和存储介质
- 申请号:CN202011255980.1
- 公开号:CN112382288A
- 公开日期:2024-04-02
- 申请人:湖南常德牌水表制造有限公司
本申请涉及一种语音调试设备的方法、系统、计算机设备和存储介质,该方法包括:通过获取唤醒语音并进入参数调试模式,接收参数调试过程中的调试语音;将所述调试语音进行音频切割,对切割后的单段音频进行语音转换,将所述单段音频转化为单段文字;接收所述单段文字并将所述单段文字转换为数字信号,利用预设调试数据和所述数字信号进行对比;将对比一致的所述数字信号发送到待调试设备的调试处理中心,根据所述待调试设备的调试结果反馈所述待调试设备的调试状态。本发明实施例采用智能语音修改采集设备参数的方法,既能保证设备参数的稳定,也能保证方便性,而且操作非常的方便及省时间。- 发布时间:2023-05-29 12:00:23
- 0
-
使用基于前瞻的声学语言特征的智能音频分段 公开日期:2024-04-02 公开号:CN117813651A 申请号:CN202180095035.6使用基于前瞻的声学语言特征的智能音频分段
- 申请号:CN202180095035.6
- 公开号:CN117813651A
- 公开日期:2024-04-02
- 申请人:微软技术许可有限责任公司
提供了用于使用基于前瞻的声学语言特征的智能音频分段的系统和方法。例如,提供了用于获得音频、处理音频、标识音频内的潜在分段边界以及确定是否要在该潜在分段边界处生成分段中断的系统和方法。标识出现在潜在分段边界之后的一个或多个前瞻词,其中生成与该潜在分段边界和一个或多个前瞻词相关联的声学分段分数和语言分段分数。随后,系统基于声学和/或语言分段分数至少达到或超过分段分数阈值来避免在潜在分段边界处生成分段中断或者在潜在分段边界处生成分段中断。- 发布时间:2024-04-04 07:14:47
- 0
-
一种语音识别方法、装置和电子设备 公开日期:2024-04-02 公开号:CN117809626A 申请号:CN202311020425.4一种语音识别方法、装置和电子设备
- 申请号:CN202311020425.4
- 公开号:CN117809626A
- 公开日期:2024-04-02
- 申请人:海信视像科技股份有限公司
本公开涉及人机交互技术领域,尤其涉及一种语音识别方法、装置和电子设备,用于解决如何提升电子设备的语音识别的准确率的问题。该方法包括:基于待识别音频数据实际得分、待识别音频数据实际长度、待识别音频数据预测长度、待识别音频数据理论长度和待识别音频数据理论得分五者,得到每个待识别音频数据候选识别结果的融合得分;基于待识别音频数据融合得分,确定待识别音频数据候选识别结果的实际识别结果。- 发布时间:2024-04-04 07:17:13
- 0
-
电子设备及电子设备的音频数据处理方法 公开日期:2024-04-02 公开号:CN117809652A 申请号:CN202311472288.8电子设备及电子设备的音频数据处理方法
- 申请号:CN202311472288.8
- 公开号:CN117809652A
- 公开日期:2024-04-02
- 申请人:海信电子科技(深圳)有限公司
本公开提供一种电子设备及电子设备的音频数据处理方法,涉及音频处理技术领域;方法包括:接收用户输入的待识别音频信号;之后,基于目标语音处理模型中的目标语音识别子模型对待识别音频信号进行处理,得到目标语音信号;再之后,基于目标语音处理模型中的目标关键词获取子模型对语音信号进行处理,得到关键词语音信号;最后,基于目标语音处理模型中的目标关键词分类子模型和预设的关键词集,对关键词语音进行分类处理,得到目标关键词;如此,通过目标语音处理模型对待识别音频信号进行多级判别,以获取目标关键词;这样能够提高关键词的识别精度,降低语音唤醒模块的误唤醒概率。- 发布时间:2024-04-04 07:17:45
- 0