物理
下拉
最新专利
-
语音端点检测方法、装置、计算机设备及存储介质 公开日期:2024-04-02 公开号:CN110931048A 申请号:CN201911275318.X语音端点检测方法、装置、计算机设备及存储介质
- 申请号:CN201911275318.X
- 公开号:CN110931048A
- 公开日期:2024-04-02
- 申请人:广州酷狗计算机科技有限公司
本申请关于一种语音端点检测方法、装置、计算机设备及存储介质,涉及语音识别技术领域。所述方法包括:对待检测语音进行预检测,以从待检测语音中提取包含语音信号和非稳态噪声信号的第一混合音片段,对第一混合音片段进行音高检测,以从第一混合音片段中提取包含非稳态噪声信号和清音信号的第二混合音片段和浊音信号片段,根据第一混合音片段中的第一个浊音信号片段的起始点,确定第一混合音片段中的语音起始端点,根据第一混合音片段中的最后一个浊音信号片段的结束点,确定第一混合音片段中的语音结束端点。通过上述方法,使得在语音信号检测过程中,有效地区分非稳态噪声信号和有效语音信号,提高语音端点检测的准确性。- 发布时间:2024-04-04 07:30:18
- 0
-
高频带激励信号生成 公开日期:2024-04-02 公开号:CN110827842A 申请号:CN201911284342.X高频带激励信号生成
- 申请号:CN201911284342.X
- 公开号:CN110827842A
- 公开日期:2024-04-02
- 申请人:高通股份有限公司
本申请涉及高频带激励信号生成。本发明提供一种特定方法,其包含在装置处确定输入信号的浊音分类。所述输入信号对应于音频信号。所述方法也包含基于所述浊音分类控制所述输入信号的表示的包络的量。所述方法进一步包含基于所述包络的所述受控量调制白噪声信号。所述方法也包含基于所述经调制的白噪声信号生成高频带激励信号。- 发布时间:2024-04-04 07:30:18
- 0
-
一种终端设备及双模型校验的唤醒方法 公开日期:2024-04-02 公开号:CN117809625A 申请号:CN202310997773.0一种终端设备及双模型校验的唤醒方法
- 申请号:CN202310997773.0
- 公开号:CN117809625A
- 公开日期:2024-04-02
- 申请人:海信电子科技(武汉)有限公司
本申请一些实施例提供一种终端设备及双模型校验的唤醒方法,所述方法可以获取语音数据,并对语音数据执行音量归一化处理。再通过第一唤醒模型检测语音数据的第一置信度,以及通过第二唤醒模型检测语音数据的第二置信度。其中,训练第一唤醒模型时的正样本多于训练第二唤醒模型时的正样本。设置语音数据的输入步长,并计算第一目标置信度与第二目标置信度的和值。其中,第一目标置信度为大于第一唤醒阈值的第一置信度,第二目标置信度为大于第二唤醒阈值的第二置信度,且二者对应的语音数据间隔输入步长。在和值大于第三唤醒阈值时,唤醒终端设备。所述方法基于双模型对语音数据执行校验,并设置三个不同的唤醒阈值,可提高语音唤醒的精确度。- 发布时间:2024-04-04 07:17:12
- 0
-
一种智能语音质检方法及可读存储介质 公开日期:2024-04-02 公开号:CN117809693A 申请号:CN202410020493.9一种智能语音质检方法及可读存储介质
- 申请号:CN202410020493.9
- 公开号:CN117809693A
- 公开日期:2024-04-02
- 申请人:上海浩宜信息科技有限公司
本发明的一种智能语音质检方法及可读存储介质,属于客户服务技术领域。所述方法为根据用户的流程规范,定义可配置的质检流程,并通过流程画布将质检流程进行可视化,根据流程画布完成质检流程。本发明的方法可以根据不同客户流程规范,在系统重详细定义好每一个角色、流程节点、节点编码、下一节点导向完成质检流程配置,用户在界面操作时,后台系统通过配置的流程节点自动判断识别任务流转导向,从而完成整个任务流处理。且把规则模型、语义模型以流程画布方式在页面上画出来,每个画布节点可配置模型名称、分值、命中情况、是否致命项、下一流转节点,系统根据画布来完成流程质检。- 发布时间:2024-04-04 07:24:46
- 0
-
一种机器人多轮对话语音交互方法、系统和终端设备 公开日期:2024-04-02 公开号:CN112435669A 申请号:CN202011301188.5一种机器人多轮对话语音交互方法、系统和终端设备
- 申请号:CN202011301188.5
- 公开号:CN112435669A
- 公开日期:2024-04-02
- 申请人:福州灵医科技有限公司
本发明涉及语音处理技术领域,特别涉及一种机器人多轮对话语音交互方法、系统和终端设备。所述一种机器人多轮对话语音交互方法,包括步骤:终端设备接收语音数据,按帧读取语音数据;若存在连续多帧有效声音,若连续多帧有效声音的持续时间大于最大预设说话时间阈值,若用户停顿时间大于最小预设停顿时间且小于最大预设停顿时间,则进行语音识别,若用户停顿时间大于最大预设停顿时间,则分析得用户意图,根据所述用户意图播放目标音频文件。本方案中的处理方式可以使得处理效率大大提高,用户可以很快听到终端设备的回复,将大大提高互动效率,且当是有效声音的时候才发送给语音识别系统,亦可大大节约语音识别成本。- 发布时间:2023-06-02 12:01:38
- 0
-
语音活动检测方法、装置、电子设备及介质 公开日期:2024-04-02 公开号:CN113270108A 申请号:CN202110460098.9语音活动检测方法、装置、电子设备及介质
- 申请号:CN202110460098.9
- 公开号:CN113270108A
- 公开日期:2024-04-02
- 申请人:维沃移动通信有限公司
本申请公开了一种语音活动检测方法、装置、电子设备及介质,属于通信技术领域。该方法包括:确定第t帧音频信号的第一空间谱,第t帧音频信号包括M个麦克风采集的M个第一音频信号,且M个第一音频信号与M个麦克风一一对应,M为大于1的整数,t为正整数;确定第t帧音频信号中的背景干扰信号的第二空间谱;根据第一空间谱和第二空间谱,确定第t帧音频信号中的期望语音信号的第三空间谱;基于第三空间谱检测第t帧音频信号中的语音活动。- 发布时间:2023-06-17 07:23:05
- 0
-
显示设备和语义分析方法 公开日期:2024-04-02 公开号:CN117809649A 申请号:CN202310124921.8显示设备和语义分析方法
- 申请号:CN202310124921.8
- 公开号:CN117809649A
- 公开日期:2024-04-02
- 申请人:VIDAA国际控股(荷兰)公司
本申请一些实施例提供了一种显示设备和语义分析方法。声音采集器采集到语音指令后,显示设备可以识别语音指令对应的第一语音文本。显示设备检测声音采集器在预设周期内采集的历史语音指令,并识别历史语音指令对应的第二语音文本。显示设备基于第一语音文本和第二语音文本获取连续指令信息,获取连续指令信息中的实体,并获取实体对应的实体标签。显示设备基于实体标签对连续指令信息进行信息融合处理,得到融合指令信息,并对融合指令信息执行语义分析,从而确定语音指令对应的控制指令并执行。显示设备能够结合用户的历史语音指令,对当前语音指令进行分析,从而准确获取语义,能够准确响应语音指令,提高用户的使用体验。- 发布时间:2024-04-04 07:16:41
- 0
-
结合自适应线谱增强和同步压缩变换的直升机声信号增强方法 公开日期:2024-04-02 公开号:CN117809673A 申请号:CN202311737839.9结合自适应线谱增强和同步压缩变换的直升机声信号增强方法
- 申请号:CN202311737839.9
- 公开号:CN117809673A
- 公开日期:2024-04-02
- 申请人:南京理工大学
本发明公开了一种结合自适应线谱增强和同步压缩变换的直升机声信号增强方法,包括如下步骤:利用麦克风阵列采集低空直升机目标发出的声信号,并进行预处理,直升机声信号为典型的谐波信号;对各麦克风采集的直升机声信号分别做相位修正的频率重排同步压缩变换来进行频率聚焦处理;对相位修正的频率重排同步压缩变换后的频域结果进行短时逆傅里叶变换,得到相位修正的频率重排同步压缩变换后的时域多通道直升机信号;对相位修正的频率重排同步压缩变换后的时域多通道直升机信号进行自适应线谱增强,实现对直升机声信号的增强。本发明通过结合自适应线谱增强和同步压缩变换的方法,提高了低信噪比下直升机声信号的信噪比。- 发布时间:2024-04-04 07:19:40
- 0
-
一种便于矫正摆放水平度的触摸显示智能钢琴 公开日期:2024-04-02 公开号:CN117809595A 申请号:CN202410012074.0一种便于矫正摆放水平度的触摸显示智能钢琴
- 申请号:CN202410012074.0
- 公开号:CN117809595A
- 公开日期:2024-04-02
- 申请人:江西省华皓光电有限公司
本发明涉及钢琴调平技术领域,且公开了一种便于矫正摆放水平度的触摸显示智能钢琴,包括触摸显示智能钢琴、水平度矫正台,所述水平度矫正台设置在触摸显示智能钢琴的底部;通过触摸显示智能钢琴在水平度矫正台的顶部处于与水平底面平行的状态,避免了因底面不平行带来的重力作用不同,导致的触摸显示智能钢琴的琴键存在高度差异,使得演奏者在操作琴键时需要额外的力量来适应不同的高度,从而降低演奏的舒适度和技巧的情况出现,同时因避免了触摸显示智能钢琴的水平度不准确,出现无法均匀地振动的现象,导致音色失真、偏差或变得不稳定的情况出现,保证了触摸显示智能钢琴内部结构在最佳状态下工作,产生更好的音色和音质。- 发布时间:2024-04-04 07:24:29
- 0
-
一种语音识别方法、装置和电子设备 公开日期:2024-04-02 公开号:CN117809664A 申请号:CN202310998810.X一种语音识别方法、装置和电子设备
- 申请号:CN202310998810.X
- 公开号:CN117809664A
- 公开日期:2024-04-02
- 申请人:海信视像科技股份有限公司
本公开涉及语音识别技术领域,尤其涉及一种语音识别方法、装置和电子设备,用于解决如何保证电子设备在对音频流进行解码的过程中,所提示解码的结果的实时率和识别精度的问题。包括:基于待识别音频流中已识别的数据块的识别结果,确定当前周期的数据块的数据块大小;按照数据块大小对音频特征进行打包,得到当前周期的数据块;基于上一周期的数据块对应的声学信息的第一文本长度和上一周期的数据块对应的语言信息的第二文本长度,确定目标解码算法;基于目标解码算法对当前周期的数据块进行解码,得到至少一个理论识别结果;对理论识别结果进行重打分,得到每个理论识别结果对应的理论得分;基于理论得分,确定当前周期的数据块的识别结果。- 发布时间:2024-04-04 07:17:12
- 0