物理
下拉
最新专利
-
音频数据处理方法、装置、电子设备及存储介质 公开日期:2024-11-19 公开号:CN117423336A 申请号:CN202311309889.7音频数据处理方法、装置、电子设备及存储介质
- 申请号:CN202311309889.7
- 公开号:CN117423336A
- 公开日期:2024-11-19
- 申请人:阿波罗智联(北京)科技有限公司
本公开提供了一种音频数据处理方法、装置、电子设备及存储介质,涉及音频处理技术领域。具体实施方案为:获取音频数据,并对音频数据进行关键字检测,得到音频数据的关键帧;基于关键帧确定第二语音应用,并向第二语音应用发送关键帧的帧标识;根据关键帧,从音频数据中截取第一音频数据,并向第二语音应用发送第一音频数据以进行语音识别。由此,本方案通过检测音频数据中的关键字得到关键帧,并向第二语音应用发送关键帧的帧标识。从音频数据中截取第一音频数据,并发送给第二语音应用以进行语音识别。通过将关键字检测和语音识别解耦成两个应用来进行,可以做到多元化的音频数据处理,提升音频数据处理的可配置性和灵活性。- 发布时间:2024-01-26 08:29:13
- 0
-
一种鱼群摄食强度分类方法、系统及设备 公开日期:2024-11-19 公开号:CN116665701A 申请号:CN202310657873.9一种鱼群摄食强度分类方法、系统及设备
- 申请号:CN202310657873.9
- 公开号:CN116665701A
- 公开日期:2024-11-19
- 申请人:中国农业大学
本发明提供了一种鱼群摄食强度分类方法、系统及设备,涉及水产养殖领域。该方法包括:对待测音频段进行特征提取,确定基于Mel频谱的鱼群摄食深度语谱特征向量、基于CQT的鱼群摄食深度语谱特征向量以及基于STFT的鱼群摄食深度语谱特征向量;融合所述基于Mel频谱的鱼群摄食深度语谱特征向量、所述基于CQT的鱼群摄食深度语谱特征向量以及所述基于STFT的鱼群摄食深度语谱特征向量,生成融合特征语谱图;将所述融合特征语谱图输入至由不同类型的摄食强度对应的历史音频段构建的深度卷积神经网络模型中,确定所述待测音频段对应的摄食强度类型。本发明实现了自动按需投喂,避免了投喂不足或过度投喂而造成水质污染和资源浪费。- 发布时间:2023-08-31 08:45:40
- 0
-
吸音材料 公开日期:2024-11-19 公开号:CN116438340A 申请号:CN202080106536.5吸音材料
- 申请号:CN202080106536.5
- 公开号:CN116438340A
- 公开日期:2024-11-19
- 申请人:三菱电机株式会社
本发明能够得到一种吸音材料(1),其构成如下:纤维块(2),其中,一根或多根纤维(6)相互缠绕而成块,在块的内部具有第一空隙(8)和在第一空隙(8)中捕捉的第一树脂粒子(3);和第二树脂粒子(4),其配置于在多个纤维块(2)之间形成的第二空隙(9)中、具有比第一树脂粒子(3)的粒径大的粒径。利用在第一空隙(8)中捕捉的第一树脂粒子(3),提高高频范围的吸音性能;利用配置于第二空隙(9)中的第二树脂粒子(4),提高低频范围的吸音性能。该吸音材料在低频范围和高频范围均具有优异的吸音性能。- 发布时间:2023-07-16 07:18:41
- 0
-
一种语音处理方法、装置、设备及存储介质 公开日期:2024-11-19 公开号:CN113744728A 申请号:CN202111012283.8一种语音处理方法、装置、设备及存储介质
- 申请号:CN202111012283.8
- 公开号:CN113744728A
- 公开日期:2024-11-19
- 申请人:阿波罗智联(北京)科技有限公司
本公开提供了一种语音处理方法、装置、设备及存储介质,涉及人工智能领域,尤其涉及车联网和智能座舱技术。具体实现方案为:确定发送方输入的语音信息的语境信息;获取所述语音信息的至少两个语义解析结果;根据所述语境信息,从所述至少两个语义解析结果中选择目标解析结果。根据本公开的技术,能够精准定位用户意图。- 发布时间:2023-07-03 10:48:46
- 0
-
一种自动化音频测试方法、装置、计算机设备及存储介质 公开日期:2024-11-19 公开号:CN113129903A 申请号:CN201911419076.7一种自动化音频测试方法、装置、计算机设备及存储介质
- 申请号:CN201911419076.7
- 公开号:CN113129903A
- 公开日期:2024-11-19
- 申请人:深圳市航盛电子股份有限公司
本申请实施例属于自动化技术领域,涉及一种应用于平台即服务的自动化音频测试方法,通过向行人警示系统发送汽车工作数据,从而使得该行人警示系统依据该汽车工作数据发出实际音频,并采集该实际音频判断是否与标准的音频一致,当一致是则说明该行人警示系统满足测试要求,否则不满足。本申请还提供一种应用于平台即服务的自动化音频测试装置、计算机设备及存储介质。本申请实现音频测试的自动化操作,有效提高测试效率以及测试的准确性。- 发布时间:2023-06-14 12:57:54
- 0
-
设备唤醒方法、存储介质及电子装置 公开日期:2024-11-19 公开号:CN116206618A 申请号:CN202211711795.8设备唤醒方法、存储介质及电子装置
- 申请号:CN202211711795.8
- 公开号:CN116206618A
- 公开日期:2024-11-19
- 申请人:海尔优家智能科技(北京)有限公司|||青岛海尔科技有限公司|||海尔智家股份有限公司
本申请公开了一种设备唤醒方法、存储介质和电子装置,涉及智能家居/智慧家庭技术领域,该设备唤醒方法包括:确定已接收到初始音频的、至少两个待唤醒的智能设备,并获取至少两个待唤醒的智能设备中每个智能设备对初始音频的接收数据;对每个智能设备的接收数据进行声源分离处理,得到每个智能设备各自对应的每对唤醒音频数据与噪声音频数据;获取每对唤醒音频数据与噪声音频数据的音频数据和,并计算每个唤醒音频数据在各自对应的音频数据和中的比例系数;基于比例系数计算距离数值,并从至少两个待唤醒的智能设备中确定出距离数值最小的智能设备进行唤醒。本申请解决了相关技术中存在设备唤醒的准确性低下的技术问题。- 发布时间:2023-06-04 11:12:55
- 1
-
基于深度神经网络的自适应有源噪声控制系统及其方法 公开日期:2024-11-19 公开号:CN112562628A 申请号:CN202011416763.6基于深度神经网络的自适应有源噪声控制系统及其方法
- 申请号:CN202011416763.6
- 公开号:CN112562628A
- 公开日期:2024-11-19
- 申请人:苏州静声泰科技有限公司|||天津大学
本发明涉及一种基于深度神经网络的自适应有源噪声控制系统及其方法,其技术特点是:该系统包括参考麦克风、控制器、作动器和误差麦克风,控制器包括深度神经网络模块和驱动电路;参考麦克风设置于噪声声源附近用于收集参考信号;误差麦克风设置于控制点处用于收集误差信号;深度神经网络模块生成与待控制噪声信号振幅相同相位相反的控制信号并更新网络参数,并将生成的控制信号输出给驱动电路;驱动电路将控制信号输出给作动器;作动器将控制信号转化为控制声波,在控制点处与待控制噪声叠加,进行有源消声。本发明结合RNN循环神经网络和MLP多层感知机网络,解决了最小均方误差算法无法控制非线性噪声的缺陷,提高了有源噪声控制技术的适用范围。- 发布时间:2023-06-02 13:32:12
- 0
-
虚拟人脸构建方法、装置、计算机设备及计算机可读介质 公开日期:2024-11-19 公开号:CN112420014A 申请号:CN202011285914.9虚拟人脸构建方法、装置、计算机设备及计算机可读介质
- 申请号:CN202011285914.9
- 公开号:CN112420014A
- 公开日期:2024-11-19
- 申请人:平安科技(深圳)有限公司
本申请属于人工智能技术领域,本申请提供了一种基于音素文本的虚拟人脸构建方法、装置、计算机设备及计算机可读存储介质。本申请通过获取目标文本,并将目标文本通过预设TTS方式生成音频,将音频进行音素切分,以得到音频所对应的音素文本,将音素文本输入至预设循环神经网络模型,以得到音素文本所对应的预设真人主播的人脸特征,根据预设真人主播的人脸特征,构建音素文本所对应的预设真人主播的虚拟人脸,可直接根据输入的目标文本构建预设真人主播所对应虚拟人脸,简化了将真人主播转化成所对应的虚拟主播的生成程序,提高了虚拟主播的生成效率和准确性。- 发布时间:2023-05-29 12:21:42
- 0
-
语音合成方法、装置、电子设备及可读存储介质 公开日期:2024-11-19 公开号:CN112397047A 申请号:CN202011442571.2语音合成方法、装置、电子设备及可读存储介质
- 申请号:CN202011442571.2
- 公开号:CN112397047A
- 公开日期:2024-11-19
- 申请人:平安科技(深圳)有限公司
本发明涉及语音合成技术,揭露一种语音合成方法,包括:获取样本音频,对所述样本音频进行声音特征提取转换及向量化处理,得到标准语音向量;当接收待合成文本时,对所述待合成文本进行音素转换得到文本音素序列;对所述文本音素序列进行向量转换,得到文本矩阵;将所述标准语音向量与所述文本矩阵进行向量拼接,得到目标矩阵;对所述目标矩阵进行频谱特征提取,得到频谱特征信息;利用预设声码器对所述频谱特征信息进行语音合成,得到合成音频。本发明还涉及一种区块链技术,所述频谱特征信息可以存储在区块链中。本发明还提出一种语音合成装置、电子设备以及可读存储介质。本发明可以提高语音合成的灵活性。- 发布时间:2023-05-29 12:12:19
- 0
-
婴儿哭声识别方法及终端设备 公开日期:2024-11-19 公开号:CN112382302A 申请号:CN202011391118.3婴儿哭声识别方法及终端设备
- 申请号:CN202011391118.3
- 公开号:CN112382302A
- 公开日期:2024-11-19
- 申请人:漳州立达信光电子科技有限公司
本发明适用于声音识别技术领域,公开了一种婴儿哭声识别方法及终端设备,上述方法包括:获取数字化声音信号;采用定点运算,对数字化声音信号进行特征提取,得到定点数特征向量;对定点数特征向量进行滤波运算,得到浮点数特征向量;将浮点数特征向量输入预先训练完成的声音识别神经网络模型中,识别数字化声音信号是否包含婴儿哭声。本发明可以在保证低运算量的同时提高婴儿哭声识别的准确率。- 发布时间:2023-05-29 12:03:51
- 0