物理
下拉
最新专利
-
可穿戴设备的震动处理方法、装置、可穿戴设备及介质 公开日期:2024-09-10 公开号:CN114613376A 申请号:CN202210302297.1可穿戴设备的震动处理方法、装置、可穿戴设备及介质
- 申请号:CN202210302297.1
- 公开号:CN114613376A
- 公开日期:2024-09-10
- 申请人:歌尔股份有限公司
本发明公开了一种可穿戴设备的震动处理方法、装置、可穿戴设备及介质,适用于可穿戴设备技术领域。当检测到终端设备产生待提醒业务时,获取当前的音频数据;将音频数据解码得到解码数据并获取对应的波形数据;根据波形数据控制马达驱动器驱动马达进行震动。该方法通过获取当前的音频数据进行解码后得到解码数据,并根据解码数据获取对应的波形数据,根据不同的音频数据得到的具体波形数据形成对应的震动效果,进而驱动马达震动,而不是现有的可穿戴设备有待提醒业务时,根据提前设置的震动效果驱动马达震动而导致震动效果单一,该方法提高了可穿戴设备的用户体验,进一步提升可穿戴设备的个性化服务。- 发布时间:2023-05-14 11:19:59
- 0
-
基于概率生成和非自回归模型的多说话人语音合成方法 公开日期:2024-09-10 公开号:CN114267329A 申请号:CN202111601179.2基于概率生成和非自回归模型的多说话人语音合成方法
- 申请号:CN202111601179.2
- 公开号:CN114267329A
- 公开日期:2024-09-10
- 申请人:厦门大学
本发明提出了一种基于概率生成和非自回归模型的多说话人语音合成方法,包括:S1、说话人个性化编码器和概率生成编码器接收目标梅尔频谱并分别提取说话人个性化向量和概率生成向量;S2、基于深度网络的编码器对拼接融合的输入向量进行编码得到音素级深层特征;S3、音素时长预测器接收拼接融合的融合特征并预测音素时长序列;S4、长度规整网络接收音素时长序列并对融合特征进行扩展,得到帧级特征;S5、基于深度网络的解码器接收帧级特征并映射为预测梅尔频谱,后处理网络补充预测梅尔频谱的残差信息;S6、声码器将补充了残差信息的预测梅尔频谱映射为声音波形,得到合成语音。本发明能够提高多说话人语音合成系统的泛化性和合成语音的相似性。- 发布时间:2023-05-05 09:35:33
- 0
-
建筑空间降噪方法、装置和系统 公开日期:2024-09-10 公开号:CN113920973A 申请号:CN202111184485.0建筑空间降噪方法、装置和系统
- 申请号:CN202111184485.0
- 公开号:CN113920973A
- 公开日期:2024-09-10
- 申请人:聊城大学
本申请提供一种建筑空间降噪方法、装置和系统。该方法包括:对于降噪网络中的任一个降噪器,根据降噪网络中全部降噪器的参考麦克风所拾取的参考噪声信号、该降噪器中误差麦克风拾取的残余噪声信号对该降噪器中参考麦克风所拾取的参考噪声信号进行滤波,或者,根据该降噪器的参考麦克风所拾取的参考噪声信号、降噪网络中全部降噪器误差麦克风拾取的残余噪声信号对该降噪器中参考麦克风所拾取的参考噪声信号进行滤波,其中,滤波结果用于供该降噪器的扬声器播放,以降低降噪网络中误差麦克风所拾取的残余噪声信号的平均功率。本申请可实现在较大空间内的良好的降噪。- 发布时间:2023-04-22 09:09:04
- 0
-
一种利用声音识别感知算法预防电缆外破的方法 公开日期:2024-09-10 公开号:CN115762529A 申请号:CN202211267984.0一种利用声音识别感知算法预防电缆外破的方法
- 申请号:CN202211267984.0
- 公开号:CN115762529A
- 公开日期:2024-09-10
- 申请人:国网青海省电力公司海北供电公司|||国网青海省电力公司|||国家电网有限公司
本发明涉及一种利用声音识别感知算法预防电缆外破的方法,通过目标定位以确定施工机械距地埋电缆线路的距离,通过目标识别以确定施工机械的类型;则达到提醒施工人员与配网人员的目的,以采取相应的措施预防电缆外破。在目标定位中,沿地埋电缆线路设置三个声音传感器,分别为点A、O和B,并且各点处于一条直线上,设定声音传感器的感知范围阈值为SO,当外力破坏源进入声音传感器的感知范围时,则声音传感器向外输出报警启动信号;在目标识别中,将MFCC音频静态特性转换为newMFCC特征数据,具有动态地表示音频的特性,进而提高了准确率。- 发布时间:2023-06-07 22:02:22
- 8
-
声音事件检测方法、电子设备、存储介质及芯片 公开日期:2024-09-06 公开号:CN118098275A 申请号:CN202410491015.6声音事件检测方法、电子设备、存储介质及芯片
- 申请号:CN202410491015.6
- 公开号:CN118098275A
- 公开日期:2024-09-06
- 申请人:荣耀终端有限公司
本申请公开了一种声音事件检测方法、电子设备、存储介质及芯片。该方法包括:获取待检测音频;利用声音事件检测模型对待检测音频进行M次去噪处理,以得到声音事件检测结果,其中,声音事件检测结果包括待检测音频中属于N类目标音频事件中每类目标音频事件的音频片段,以及音频片段位于待检测音频中的位置,M为正整数;其中,第1次去噪处理的输入是待检测音频,第M次去噪处理的输出是声音事件检测结果;在M为大于1的整数的情况下,第i次去噪处理的输入为第i‑1次去噪处理的输出,i为大于1的正整数。基于本申请提供的声音事件检测方法,可以提高声音事件检测结果的准确度,从而提高用户体验。- 发布时间:2024-06-01 08:08:29
- 1
-
一种人机交互判定方法及装置 公开日期:2024-09-06 公开号:CN118072765A 申请号:CN202410496021.0一种人机交互判定方法及装置
- 申请号:CN202410496021.0
- 公开号:CN118072765A
- 公开日期:2024-09-06
- 申请人:合众新能源汽车股份有限公司
本申请公开了一种人机交互判定方法及装置,涉及车载智能对话技术领域,主要目的在于提高对交互环境是人人交互还是人机交互的识别准确性。本申请主要的技术方案为:获取目标音频对的音频特征,所述目标音频对包括两段不同且均为指定长度的特定音频;将所述音频特征分别输入多个对应不同识别维度的子任务模型中,得到每个所述子任务模型对应的维度特征结果;将多个所述维度特征结果堆叠并输入至主任务模型中,得到所述主任务模型对应的综合判定结果,所述综合判定结果用于表征所述目标音频对的交互场景是否为人机交互。本申请用于人机交互的判定。- 发布时间:2024-06-01 07:31:12
- 1
-
语音识别方法、装置、电子设备及计算机可读存储介质 公开日期:2024-09-06 公开号:CN117789699A 申请号:CN202311708779.8语音识别方法、装置、电子设备及计算机可读存储介质
- 申请号:CN202311708779.8
- 公开号:CN117789699A
- 公开日期:2024-09-06
- 申请人:暗物质(北京)智能科技有限公司
本申请提供了一种语音识别方法、装置、电子设备及计算机可读存储介质,其中,该方法包括:获取使用通用训练样本训练得到的通用语音识别模型;使用目标垂域训练样本对通用语音识别模型进行迁移学习,以得到训练完成的垂域语音识别模型;将属于目标垂域的目标语音数据输入到训练完成的垂域语音识别模型,并结合目标垂域中的热词,以得到目标语音数据的识别结果。通过该方法,有利于保证使用垂域语音识别模型对属于目标垂域的目标语音数据进行语音识别的准确度。同时,还在使用垂域语音识别模型时,利用了热词进行辅助,进一步提高了识别结果的准确度。- 发布时间:2024-03-31 07:33:39
- 1
-
一种骨传导耳机的信号增强处理方法 公开日期:2024-09-06 公开号:CN117059120A 申请号:CN202311175585.6一种骨传导耳机的信号增强处理方法
- 申请号:CN202311175585.6
- 公开号:CN117059120A
- 公开日期:2024-09-06
- 申请人:深圳市匠心原创科技有限公司
本发明涉及语音信号处理领域,具体涉及一种骨传导耳机的信号增强处理方法,采集骨传导耳机的语音信号并得到各模态分量;根据模态分量各幅度谱剪切段内的幅度差异得到各幅度谱剪切段的干扰置信度;结合干扰置信度的分布以及模态分量的峰值得到模态分量的噪声干扰置信度;根据各模态分量噪声干扰置信度、中心频率序列及带宽序列得到各模态分量的噪声信号含量差异度;进而得到各模态分量先验估计系数;根据各模态分量先验估计系数得到各模态分量信噪权值;根据各模态分量信噪权值及信噪比得到语音信号的先验信噪比,采用维纳滤波算法结合语音信号的先验信噪比完成语音信号的增强处理。从而实现骨传导耳机信号的增强,提高信号质量。- 发布时间:2023-11-16 08:04:47
- 1
-
基于AIGC音乐内容生成的音乐公仔乐团 公开日期:2024-09-06 公开号:CN116798388A 申请号:CN202310915837.8基于AIGC音乐内容生成的音乐公仔乐团
- 申请号:CN202310915837.8
- 公开号:CN116798388A
- 公开日期:2024-09-06
- 申请人:东莞市星辰互动电子科技有限公司
本发明涉及人工智能技术,揭露了一种基于AIGC音乐内容生成的音乐公仔乐团,包括音乐公仔及音乐控制器,音乐控制器运行有AIGC应用软件或连接带有AIGC应用软件的云端服务器,其中:音乐控制器在时间尺度下通过AIGC应用软件对目标音频文件进行乐器属性分类,得到目标音频文件在不同时间尺度下的音轨标签,并生成音轨标签对应的音乐旋律,基于所述音轨标签,匹配不同音乐公仔的目标动作指令,并将目标动作指令及音乐旋律发送至对应的音乐公仔;每个所述音乐公仔根据接收到的音乐旋律播放音乐,并根据接收到的对应目标动作指令控制各个部位进行同步运动。本发明可以提高模拟乐器演奏和表演的公仔玩具音乐选择及动作生成在音乐学习及音乐聆听的多场景适应性。- 发布时间:2023-09-24 08:31:52
- 0
-
一种基于人工智能的倍率确定方法、音量调节方法及装置 公开日期:2024-09-06 公开号:CN113823318A 申请号:CN202110712666.X一种基于人工智能的倍率确定方法、音量调节方法及装置
- 申请号:CN202110712666.X
- 公开号:CN113823318A
- 公开日期:2024-09-06
- 申请人:腾讯科技(深圳)有限公司
本发明实施例公开一种基于人工智能的倍率确定方法、音量调节方法及装置,该基于人工智能的倍率确定方法包括:获取第一音频数据,所述第一音频数据包括多帧音频信号;确定所述多帧音频信号的平均音量,得到第一音量;使用第一神经网络提取所述多帧音频信号中每帧音频信号的风格特征,得到第一风格特征向量;将所述第一风格特征向量输入第二神经网络,得到第二音量;根据所述第一音量和所述第二音量确定第一音量调节倍率。本发明实施例,可以提高用户体验。- 发布时间:2023-07-06 10:55:41
- 1