物理
下拉
最新专利
-
一种语音识别方法、装置和电子设备 公开日期:2024-04-02 公开号:CN117809627A 申请号:CN202311022913.9一种语音识别方法、装置和电子设备
- 申请号:CN202311022913.9
- 公开号:CN117809627A
- 公开日期:2024-04-02
- 申请人:海信视像科技股份有限公司
本公开涉及人机交互技术领域,尤其涉及一种语音识别方法、装置和电子设备,用于解决如何提升电子设备的语音识别的准确率的问题。该方法包括:获取电子设备发送的待识别音频流;对待识别音频流的音频特征进行识别,得到待识别音频流对应的声学特征,以及声学特征对应的实际得分;对声学特征进行预测,确定包含声学特征的至少一个理论文本;基于理论文本查询用户账号对应的用户实体字典,得到理论文本中包含的实体词的配置信息,以及用户实体字典中的最小词频;基于当前时刻、实际得分、配置信息和最小词频,确定每个理论文本的理论得分;基于理论得分,确定待识别音频流的实际识别结果为最大的理论得分对应的理论文本。- 发布时间:2024-04-04 07:17:13
- 0
-
用于键盘乐器的键引导结构 公开日期:2024-04-02 公开号:CN117809601A 申请号:CN202311280224.8用于键盘乐器的键引导结构
- 申请号:CN202311280224.8
- 公开号:CN117809601A
- 公开日期:2024-04-02
- 申请人:株式会社河合乐器制作所
本发明提供一种用于键盘乐器的键引导结构,该键盘乐器包括多个键,该键引导结构用于引导这些键中的每一个根据键的压下而枢转地移动。每个键包括:肋壁,其设置在键内部并沿左右方向在键的左侧壁和右侧壁之间延伸;以及左和右两个引导壁,其设置在键内部并沿左右方向以其间的预定间隔从肋壁向前延伸预定长度。键盘底座包括多个键引导件,每个键引导件在逐个键的基础上设置成使得每个键引导件向上突出,每个键引导件从下方插入于键中的每个相关联键的两个引导壁之间并且还使得其与这两个引导壁滑动接触。- 发布时间:2024-04-04 07:17:35
- 0
-
标注数据确定方法、装置、介质及电子设备 公开日期:2024-04-02 公开号:CN112712795A 申请号:CN202011592123.0标注数据确定方法、装置、介质及电子设备
- 申请号:CN202011592123.0
- 公开号:CN112712795A
- 公开日期:2024-04-02
- 申请人:北京有竹居网络技术有限公司
本公开涉及一种标注数据确定方法、装置、介质及电子设备,所述方法包括:从候选数据集中获取候选标注数据;将所述候选标注数据输入第一语音识别模型和第二语音识别模型,获得所述第一语音识别模型输出的第一识别结果和所述第二语音识别模型输出的第二识别结果,所述第一语音识别模型和所述第二语音识别模型是基于已标注语音数据训练出的识别率不同的模型;根据所述第一识别结果和所述第二识别结果确定所述候选标注数据对应的识别误差;在所述识别误差大于识别阈值的情况下,将所述候选标注数据确定为待标注语音数据。由此可以有效避免确定出的待标注语音数据与已标注语音数据的重复,提高确定出的待标注语音数据的有效性,同时降低标注工作量。- 发布时间:2023-06-05 18:09:43
- 0
-
弦乐器的配件组及弦乐器 公开日期:2024-04-02 公开号:CN113554995A 申请号:CN202010257347.X弦乐器的配件组及弦乐器
- 申请号:CN202010257347.X
- 公开号:CN113554995A
- 公开日期:2024-04-02
- 申请人:陈智泓
一种弦乐器的配件组及弦乐器,所述配件组包括一组由杨氏系数大于12GPa的材料制成的配件,以及至少一个由杨氏系数等于或小于3.5GPa的材料制成的声音纯化器,所述弦乐器包含至少一个配件组。- 发布时间:2024-04-04 07:30:30
- 0
-
音视频唤醒方法、系统、设备及存储介质 公开日期:2024-04-02 公开号:CN113393833A 申请号:CN202110665499.8音视频唤醒方法、系统、设备及存储介质
- 申请号:CN202110665499.8
- 公开号:CN113393833A
- 公开日期:2024-04-02
- 申请人:中国科学技术大学
本发明公开了一种音视频唤醒方法、系统、设备及存储介质,引入视频模态来改善和提高唤醒系统性能,能够适应真实复杂场景下的唤醒任务,提高唤醒率,提升交互体验;而且,也针对音视频多模态唤醒数据量相对较少的特点,提出使用基于跨模态的师生模型,迁移并利用丰富的大数据量单模态声学数据训练得到的有效信息,改善因多模态音视频唤醒训练数据量较少带来的系统性能损失,提高唤醒率。- 发布时间:2023-06-23 08:04:06
- 0
-
一种显示设备及语音识别方法 公开日期:2024-04-02 公开号:CN117809653A 申请号:CN202311477375.2一种显示设备及语音识别方法
- 申请号:CN202311477375.2
- 公开号:CN117809653A
- 公开日期:2024-04-02
- 申请人:海信电子科技(武汉)有限公司
本申请提供一种显示设备及语音识别方法,方法包括:获取声学训练语料;基于发音词典和声学文本信息构建声学训练语料的候选音节序列;根据候选音节序列中音节出现的时间戳和候选音节序列的置信度从候选音节序列中确定出目标音节序列;通过音频和目标音节序列生成声学模型;获取文本训练语料以及将文本训练语料输入至混合语音识别模型中的语言模型中,以得到概率统计文件;将概率统计文件转换为解码搜索图;获取用户输入的待识别语音,并将待识别语音输入到声学模型和解码搜索图,以及输出对待识别语音的语音识别结果。所述方法通过结合端到端语音识别方法以及解码搜索图综合确定待识别语音对应的语音识别结果,可以提升语音识别结果的准确率。- 发布时间:2024-04-04 07:17:45
- 0
-
一种可调的低频消声结构的设计方法 公开日期:2024-04-02 公开号:CN112233638A 申请号:CN202011095930.1一种可调的低频消声结构的设计方法
- 申请号:CN202011095930.1
- 公开号:CN112233638A
- 公开日期:2024-04-02
- 申请人:南京南大电子智慧型服务机器人研究院有限公司|||南京大学|||江苏南大电子信息技术股份有限公司
本发明公开了一种可调的低频消声结构的设计方法,包括获得扬声器的TS参数,确定分流扬声器闭箱体积V,计算背腔等效力顺Cmb,计算闭箱扬声器两端开路时的系统共振频率f0。获取消声目标频率f,比较共振频率f0和消声目标频率f,确定在分流电路中选用电容Cp还是中选用电感Lp,构建分流电路,在管道上设置两个流扬声器,两个分流扬声器的间距为目标频率f对应声波波长,本发明结构简单,体积小,便于调节,同时能够提高管道降噪量。- 发布时间:2023-05-25 12:26:13
- 0
-
一种消声件、消声结构及雾化装置 公开日期:2024-04-02 公开号:CN117809610A 申请号:CN202211171087.X一种消声件、消声结构及雾化装置
- 申请号:CN202211171087.X
- 公开号:CN117809610A
- 公开日期:2024-04-02
- 申请人:深圳市卓力能技术有限公司
本发明提供了一种消声件、消声结构及雾化装置,雾化装置包括消声结构,消声结构包括节流母体和消声件,消声件设置有贯穿其顶端和底端的中空通道、与中空通道间隔的共振腔以及连通共振腔和中空通道的旁流通道,旁流通道和共振腔共同构成空气弹簧,消声件和节流母体一体成型或者分体式设置;雾化装置的内部具有至少两个气道,节流母体设置于雾化装置内且位于两个气道之间,中空通道连通两个气道,两个气道的最小横截面面积均大于中空通道的最大横截面面积。本方案可通过共振方式消耗声波能量从而达到消声降噪的目的,可以有效降低中空通道处的最大气流噪声,让用户免于气流噪声困扰,提升用户抽吸体验的舒适度。- 发布时间:2024-04-04 07:15:19
- 0
-
键重锤和用于键盘乐器的键 公开日期:2024-04-02 公开号:CN117809602A 申请号:CN202311282875.0键重锤和用于键盘乐器的键
- 申请号:CN202311282875.0
- 公开号:CN117809602A
- 公开日期:2024-04-02
- 申请人:株式会社河合乐器制作所
本发明涉及键重锤和用于键盘乐器的键。一种用于键盘乐器的键的键重锤包括重锤本体、沿竖直方向延伸且比该重锤本体的前表面进一步向下延伸的引导部以及设置在该引导部的相对侧表面的相应下部处的一对左侧和右侧的第一被锁定部。当该键重锤在该对第一被锁定部与键侧锁定部接触的状态下被推入到该键的重锤容纳部中时,该引导部的下部通过来自该键侧锁定部的反作用力而弹性变形,使得该下部向后弯曲。然后,该引导部的下部通过该反作用力的消失而恢复,由此第一被锁定部与键侧锁定部从下方锁定。- 发布时间:2024-04-04 07:17:36
- 0
-
显示设备及声音克隆方法 公开日期:2024-04-02 公开号:CN117809615A 申请号:CN202310188978.4显示设备及声音克隆方法
- 申请号:CN202310188978.4
- 公开号:CN117809615A
- 公开日期:2024-04-02
- 申请人:VIDAA国际控股(荷兰)公司
本申请提供了一种显示设备及声音克隆方法,显示设备包括显示器、音频组件和控制器,控制器被配置为:响应于进入语音交互设置界面的用户操作,生成并控制显示器显示语音交互设置界面;响应于语言设置控件的触发操作,生成并控制显示器显示语言选择控件,获取用户触发的语言选择控件对应的语言标识,设置显示设备的播报语言为语言标识对应的语言;响应于连续命令控件的触发操作,生成并控制显示器显示音色选择控件,获取用户触发的音色选择控件对应的音色标识,设置显示设备的播报音色为音色标识对应的音色;控制音频组件通过播报语言播放音色标识对应音色的播报样例。本申请提高了跨语言声音克隆效果。- 发布时间:2024-04-04 07:16:42
- 0