物理
下拉
最新专利
-
一种回复模型的训练方法、装置和电子设备 公开日期:2024-04-02 公开号:CN117809643A 申请号:CN202310938148.9一种回复模型的训练方法、装置和电子设备
- 申请号:CN202310938148.9
- 公开号:CN117809643A
- 公开日期:2024-04-02
- 申请人:海信电子科技(武汉)有限公司
本公开涉及自然语言处理和人工智能技术领域,尤其涉及一种回复模型的训练方法、装置和电子设备,用于解决如何提高回复模型的训练效率成了一个亟待解决的问题。该方法包括:将历史提问数据输入至待优化模型进行学习,得到待优化模型对历史提问数据预测的至少一条候选回复数据,以及每条候选回复数据的评价得分;基于评价得分,确定待优化模型的实际回复结果为最大的评价得分对应的候选回复数据;将历史提问数据输入至奖励模型进行学习,得到奖励模型对历史提问数据的预测回复数据;基于实际回复结果和预测回复数据,确定待优化模型的损失值;基于损失值和损失阈值,调整待优化模型的网络参数,直至待优化模型收敛,得到回复模型。- 发布时间:2024-04-04 07:17:10
- 0
-
显示设备和意图识别方法 公开日期:2024-04-02 公开号:CN117809633A 申请号:CN202311270429.8显示设备和意图识别方法
- 申请号:CN202311270429.8
- 公开号:CN117809633A
- 公开日期:2024-04-02
- 申请人:VIDAA国际控股(荷兰)公司
本申请实施例提供一种显示设备和意图识别方法。该显示设备包括通信器、显示器和控制器,其中,控制器被配置为对语音指令进行意图识别,得到语音指令对应的意图识别结果;在意图识别结果满足重定向条件的情况下,若确定语音指令满足匹配关系,则根据匹配关系,确定语音指令对应的目标意图;其中,目标意图为非default意图;在多个微服务中确定目标意图对应的第一目标微服务;通过第一目标微服务对目标意图进行业务处理,并控制显示器显示业务处理结果界面。本申请实施例可以提高显示设备意图识别的准确性。- 发布时间:2024-04-04 07:17:34
- 0
-
一种终端设备和基于声纹特征的音频处理方法 公开日期:2024-04-02 公开号:CN117809660A 申请号:CN202310939391.2一种终端设备和基于声纹特征的音频处理方法
- 申请号:CN202310939391.2
- 公开号:CN117809660A
- 公开日期:2024-04-02
- 申请人:海信电子科技(深圳)有限公司
本申请提供一种终端设备和基于声纹特征的音频处理方法,方法包括:终端设备获取初始音频,以及获取目标声纹特征,其中目标声纹特征是用于生成目标音频数据的声纹特征,通过声纹编码器分离初始音频,得到频域信号,以及将频域信号发送至声纹解码器,再通过声纹解码器将频域信号还原为时域信号,最后基于时域信号和目标声纹特征生成带有目标声纹特征的目标音频。所述方法在执行音频处理时,不依赖文本内容的识别,可以直接通过目标声纹特征输出带有目标声纹特征的目标音频,减少对编码器、解码器等的训练时长,且不受限于初始音频的完整性,进而解决音频处理过程效率低、适用场景受限的问题。- 发布时间:2024-04-04 07:17:10
- 0
-
一种电子设备及音乐生成方法 公开日期:2024-04-02 公开号:CN117809596A 申请号:CN202310595084.7一种电子设备及音乐生成方法
- 申请号:CN202310595084.7
- 公开号:CN117809596A
- 公开日期:2024-04-02
- 申请人:海信电子科技(武汉)有限公司
本公开涉及一种电子设备及音乐生成方法,尤其涉及电子设备技术领域。控制器,被配置为:获取初代音乐作品数据,所述初代音乐作品数据包括:待选音符数据、待选音乐旋律数据和待选音乐节奏数据;获取待生成音乐对应的多个目标特征和约束条件,多个目标特征包括:旋律特征、节奏特征和音乐风格中的至少两种,约束条件包括音符选择范围和节奏选择范围中的至少一种;基于初代父音乐种群中的音乐作品数据以及约束条件生成初代子音乐种群;根据初代父音乐种群中的音乐作品数据、初代子音乐种群中的音乐作品数据以及多个目标特征,生成目标音乐作品数据。- 发布时间:2024-04-04 07:16:54
- 0
-
基于声学分析的工业设备健康评估与故障预测方法和系统 公开日期:2024-04-02 公开号:CN117809696A 申请号:CN202410224602.9基于声学分析的工业设备健康评估与故障预测方法和系统
- 申请号:CN202410224602.9
- 公开号:CN117809696A
- 公开日期:2024-04-02
- 申请人:南京迅集科技有限公司
本发明涉及工业设备在线监测技术领域,是基于声学分析的工业设备健康评估与故障预测方法和系统,具体方法包括:实时采集工业园区的生产车间中多个工业设备生产过程中的混合声学数据;提取分离处理后的单个工业设备的生产声学数据,构成原始声学数据集;筛选分析原始声学数据集中单个工业设备的异响特征数据,进行工业设备异常判断;调取下一周的工业园区预计产能信息,预测工业设备的异响故障变化量;动态评估计算单个工业设备剩余使用寿命和每日的健康状态指数,并对工业设备进行连续的维修预警监测。本发明解决了现有技术中,工业设备的故障监测误差大,实时性差,常常需要停线检修造成工业园区生产损失巨大的问题。- 发布时间:2024-04-04 07:27:24
- 0
-
语音转录设备、系统、方法、及电子设备 公开日期:2024-04-02 公开号:CN110875056A 申请号:CN201811004661.6语音转录设备、系统、方法、及电子设备
- 申请号:CN201811004661.6
- 公开号:CN110875056A
- 公开日期:2024-04-02
- 申请人:阿里巴巴集团控股有限公司
本申请公开了语音转录设备、系统和方法,以及电子设备。其中,语音转录设备,通过传声器阵列采集阵列接收范围内的语音信号;若所述语音信号包括话音信号,则确定所述话音信号的声源位置;若所述声源位置在目标范围内,则将所述话音信号作为目标话音信号;将所述目标话音信号发送至语音转录服务器,以使得所述服务器对所述目标话音信号进行语音转录。采用这种处理方式,使得基于传声器阵列对拾音区域内的话音信号进行多麦克增强,同时根据声源位置判断是否是目标话音,对于目标区域外的声音进行过滤,保证区域外声音不会传入到转录服务器;因此,可以有效确保拾到目标话音,提升对非目标话音的抗干扰能力,从而提升语音转录质量。- 发布时间:2024-04-04 07:28:47
- 0
-
语音识别方法及其装置 公开日期:2024-04-02 公开号:CN112489646A 申请号:CN202011295150.1语音识别方法及其装置
- 申请号:CN202011295150.1
- 公开号:CN112489646A
- 公开日期:2024-04-02
- 申请人:北京华宇信息技术有限公司
本申请公开了一种语音识别方法及其装置。其中,所述方法包括:获取输入的语音数据;通过解码模型解码所述语音数据,生成语音识别中间结果;基于核心词数据库中核心词拼音与声调序列,对所述语音识别中间结果进行匹配;根据所述拼音于声调序列与所述语音识别中的中间结果的匹配状态,输出匹配结果。通过语音识别中间结果与核心词数据库中核心词拼音与声调序列的匹配,可以解决语音识别结果偏离正常语境的问题。- 发布时间:2023-06-02 12:28:47
- 0
-
低资源的音频字幕生成方法、装置、电子设备及介质 公开日期:2024-04-02 公开号:CN117809654A 申请号:CN202311593526.0低资源的音频字幕生成方法、装置、电子设备及介质
- 申请号:CN202311593526.0
- 公开号:CN117809654A
- 公开日期:2024-04-02
- 申请人:北京邮电大学
本申请公开了一种低资源的音频字幕生成方法、装置、电子设备及介质。通过应用本申请的技术方案,可以在一个包含语言编码器与音频编码器的多模态预训练模型中,首先利用样本量比较充足的文本数据,为已有的语言编码器训练得到一个语言解码器。并在后续将该语言编码器替换为音频编码器,以达到间接为音频编码器训练得到语言解码器的目的。以使后续仅用样本量较少的音频配对数据也能训练得到一个精度较高的音频多模态预训练模型。从而实现了一种在仅有少量可供训练音频‑字幕数据对的情况下,仍能取得较高模型性能的技术方案。- 发布时间:2024-04-04 07:18:23
- 0
-
一种报警语音合成方法及系统 公开日期:2024-04-02 公开号:CN117809614A 申请号:CN202410011309.4一种报警语音合成方法及系统
- 申请号:CN202410011309.4
- 公开号:CN117809614A
- 公开日期:2024-04-02
- 申请人:湖南比扬医疗科技有限公司
本发明提供一种报警语音合成方法及系统,方法包括:确定目标报警语音类型,根据目标报警语音类型确定目标脉冲;根据目标脉冲的特征,将目标脉冲划分为多个目标脉冲信号;将每个目标脉冲信号划分为多个目标波形,计算每个目标波形的合成频率,得到目标脉冲信号的合成频率数组;将合成频率数组进行归一化处理,得到目标脉冲信号的离散化基础波形数组;确定每个脉冲的分布情况,根据离散化基础波形数组和分布情况,生成多个目标波形数组;将目标波形数组进行连接,得到目标报警语音脉冲,将目标报警语音脉冲输入到数字模拟转换器,输出目标报警语音。本发明可以省去语音烧录生产工艺控制,并且能输出一致性更好,符合标准报警信号。- 发布时间:2024-04-04 07:24:28
- 0
-
通过机器学习的直接的语音到语音翻译 公开日期:2024-04-02 公开号:CN112204653A 申请号:CN202080002715.4通过机器学习的直接的语音到语音翻译
- 申请号:CN202080002715.4
- 公开号:CN112204653A
- 公开日期:2024-04-02
- 申请人:谷歌有限责任公司
本公开提供训练和使用机器学习模型(诸如,例如,序列到序列模型)以执行直接且无文本的语音到语音翻译的系统和方法。特别地,本公开的方面提供一种基于注意力的序列到序列神经网络,其可以将语音从一种语言直接翻译成另一种语言的语音,而不依赖于中间文本表示。- 发布时间:2023-05-25 12:10:17
- 0