物理
下拉
最新专利
-
一种终端硬件和算法软件处理相结合的离线语音识别方法 公开日期:2024-06-04 公开号:CN114944155A 申请号:CN202110186016.6一种终端硬件和算法软件处理相结合的离线语音识别方法
- 申请号:CN202110186016.6
- 公开号:CN114944155A
- 公开日期:2024-06-04
- 申请人:成都启英泰伦科技有限公司
一种终端硬件和算法软件处理相结合的离线语音识别方法及芯片,包括如下步骤:S1.麦克风实时抓取外部的模拟语音信号;S2.将第一缓存中的数据搬运到语音预处理模块;S3.得到洁净语音信号,将该洁净语音信号存放;S4.直接内存访问模块将洁净语音信号同时发送到语音端点检测模块和硬件计算模块;S5.语音端点检测模块计算判断所述洁净语音信号是否是有效语音信号;S6.计算语音声学特征;S7.神经网络计算模块针对语音声学特征进行计算,CPU进行语音识别处理。本发明将芯片中的CPU和各个硬件计算模块,通过有效的并行处理方式进行了连接,通过数据并行搬运,可以降低CPU处理能力要求,降低了芯片成本。- 发布时间:2022-10-24 10:22:05
- 0
-
音频播放方法及装置 公开日期:2023-08-15 公开号:CN114999438A 申请号:CN202110498738.5音频播放方法及装置
- 申请号:CN202110498738.5
- 公开号:CN114999438A
- 公开日期:2023-08-15
- 申请人:中移互联网有限公司|||中国移动通信集团有限公司
本申请公开了一种音频播放方法及装置,该音频播放方法,包括:获取目标用户的用户信息,其中,所述用户信息包括:自定义词库,所述自定义词库中记录有所述目标用户定义的词汇的音频;获取待合成的文本;利用目标语音合成模块对所述待合成的文本进行语音合成,得到所述待合成的文本对应的合成音频;在所述待合成的文本中包括所述目标用户的自定义词库中的第一词汇的情况下,使用第一音频替换所述合成音频中与所述第一词汇对应的音频部分,得到目标音频,其中,所述第一音频为所述自定义词库中的所述第一词汇的音频;播放所述目标音频。- 发布时间:2022-10-24 10:25:50
- 0
-
防误入间隔的监测方法、装置、设备、介质和程序产品 公开日期:2024-04-02 公开号:CN115019809A 申请号:CN202210534414.7防误入间隔的监测方法、装置、设备、介质和程序产品
- 申请号:CN202210534414.7
- 公开号:CN115019809A
- 公开日期:2024-04-02
- 申请人:中国南方电网有限责任公司超高压输电公司广州局
本申请涉及电力安全领域,提供了一种防误入间隔的监测方法、装置、设备、介质和程序产品。本申请能够在不依赖服务器的通讯信号状态的前提下,准确地对电力运行人员进行身份验证,且仅需通过结构较简单、制造成本较低的设备即可实现。该方法包括:获取操作票的名称;接收监护人朗读的操作票名称,将所述监护人朗读的操作票名称与所述操作票的名称进行分段识别,得到第一分段识别结果;若所述第一分段识别结果表征所述监护人朗读的操作票名称正确,则接收操作人朗读的操作票名称,并将所述操作人朗读的操作票名称与所述操作票的名称进行分段识别,得到第二分段识别结果;根据所述第二分段识别结果,确定是否需要开启间隔的电子锁。- 发布时间:2024-04-04 07:00:07
- 0
-
一种在线学习语音识别应答装置及方法 公开日期:2024-03-08 公开号:CN115019777A 申请号:CN202210695667.2一种在线学习语音识别应答装置及方法
- 申请号:CN202210695667.2
- 公开号:CN115019777A
- 公开日期:2024-03-08
- 申请人:华南理工大学
本发明公开了一种在线学习语音识别应答装置及方法,用于将电话通话的语音识别为文字,并根据这些文字给出相关的机器语音回答,尤其是这种电话自动应答装置有在线学习的功能,可以用于替代电话人工客服,电话咨询系统、电话指挥决策系统等。本发明利用一台普通电脑的声卡实现2路模拟语音识别,结合差频原理识别和提取对话语音中的专用词汇,提高了语音识别率和回答的准确率。- 发布时间:2024-03-10 07:00:07
- 0
-
一种目标说话人分离系统、设备及存储介质 公开日期:2023-03-17 公开号:CN115035907A 申请号:CN202210602186.2一种目标说话人分离系统、设备及存储介质
- 申请号:CN202210602186.2
- 公开号:CN115035907A
- 公开日期:2023-03-17
- 申请人:中国科学院自动化研究所
本发明提供一种目标说话人分离系统、电子设备及存储介质,系统包括:首先基于掩蔽的预训练策略对多种线索进行联合统一建模,提升模型对缺失线索的推断能力,并增强被扰动线索的表征精度;其次,构建层级化的线索调制模块。分别在初级线索调制模块中引入空间线索定向增强说话人语音;在中级线索调制模块中基于动态线索与听觉信号分量的时间相干性增强说话人语音;并在高级线索调制模块中引入稳态线索进行选择性过滤;最后,充分发挥仿真数据的有监督学习能力和真实混合数据的无监督学习效果,构建多线索约束下更高效的半监督学习方法。将“分离‑再混合”的无监督学习融入到线索驱动目标说话人分离框架下,提升系统在真实嘈杂环境下的自适应能力。- 发布时间:2023-06-30 07:01:17
- 0
-
车用语音唤醒方法、装置、电子设备及存储介质 公开日期:2023-05-23 公开号:CN115035896A 申请号:CN202210609856.3车用语音唤醒方法、装置、电子设备及存储介质
- 申请号:CN202210609856.3
- 公开号:CN115035896A
- 公开日期:2023-05-23
- 申请人:中国第一汽车股份有限公司
本发明公开了一种车用语音唤醒方法、装置、电子设备及存储介质,该方法包括:获取目标车辆的车联网数据以及预设帧数的座舱语音数据;根据所述车联网数据,确定车联网编码数据,并根据所述座舱语音数据,确定音频特征编码数据;根据所述车联网编码数据以及所述音频特征编码数据,确定特征融合数据;将所述特征融合数据输入至预先训练完成的唤醒模型中,得到与所述特征融合数据相对应的唤醒数据;其中,所述唤醒模型基于多尺度深度可分时域卷积网络构建;基于所述唤醒数据,对所述目标车辆的语音交互系统进行处理。通过本发明实施例的技术方案,实现了提高车用语音唤醒的场景适应性,并提高用户体验度的技术效果。- 发布时间:2023-06-30 07:01:18
- 0
-
噪声生成模型训练方法、装置、设备及介质 公开日期:2023-05-02 公开号:CN115035911A 申请号:CN202210614008.1噪声生成模型训练方法、装置、设备及介质
- 申请号:CN202210614008.1
- 公开号:CN115035911A
- 公开日期:2023-05-02
- 申请人:中国第一汽车股份有限公司
本申请实施例公开了一种噪声生成模型训练方法、装置、设备及介质。该方法包括:获取预设时间步长的参考噪声数据和期望噪声类别;将参考噪声数据和期望噪声类别输入至预设的噪声生成模型,以根据预设时间步长和期望噪声类别,生成期望类别特征,并提取参考噪声数据中的预测噪声特征,且根据期望类别特征和预测噪声特征,生成预设时间步长对应未来时刻的未来噪声数据;根据未来时刻的标准噪声数据和未来噪声数据,调整噪声生成模型中的待训练参数。本申请实施例提高了生成噪声的准确度,以及实现了对车辆行驶过程中噪声场景的全面覆盖。- 发布时间:2023-06-30 07:01:18
- 0
-
语音识别模型的训练方法、装置、电子设备及存储介质 公开日期:2023-12-05 公开号:CN115035890A 申请号:CN202210719500.5语音识别模型的训练方法、装置、电子设备及存储介质
- 申请号:CN202210719500.5
- 公开号:CN115035890A
- 公开日期:2023-12-05
- 申请人:北京百度网讯科技有限公司
本公开提供了一种语音识别模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及深度学习、语音识别等领域。具体实现方案为:根据正例样本构建负例样本,得到用于约束语音解码路径的目标负例样本;根据正例样本及目标负例样本,得到训练数据;根据训练数据对第一语音识别模型进行训练,得到第二语音识别模型。采用本公开,可以提高语音识别的准确率。- 发布时间:2023-12-07 07:00:08
- 0
-
一种中华白海豚哨叫声信号自动检测和提取方法 公开日期:2024-05-28 公开号:CN115050386A 申请号:CN202210541058.1一种中华白海豚哨叫声信号自动检测和提取方法
- 申请号:CN202210541058.1
- 公开号:CN115050386A
- 公开日期:2024-05-28
- 申请人:哈尔滨工程大学
本发明公开了一种中华白海豚哨叫声信号自动检测和提取方法,步骤1:对采集到的包含中华白海豚哨叫声信号的数据进行预处理;步骤2:得到的包含中华白海豚哨叫声信号的数据进行截取,切分成若干个时间片段,对全部时间片段逐个执行如下操作,得到含有中华白海豚哨叫声信号的信号起止时间结果;步骤3:根据步骤2中自动检测并保存的含有中华白海豚哨叫声信号的信号起止时间结果,重新对步骤1预处理后的信号进行切分,然后对切分后得到的包含中华白海豚哨叫声信号的信号生成时频图,并自动将每段信号生成的时频图保存。本发明实现针对在海豚研究中进行长期声呐信号采集获得的海量数据的全自动检测和提取,降低对人工干预的依赖,提升效率。- 发布时间:2024-05-30 07:00:22
- 0
-
一种气泡型水下宽频漫反射编码声学超表面及其使用方法 公开日期:2024-03-22 公开号:CN115050348A 申请号:CN202210646964.8一种气泡型水下宽频漫反射编码声学超表面及其使用方法
- 申请号:CN202210646964.8
- 公开号:CN115050348A
- 公开日期:2024-03-22
- 申请人:青岛大学
本发明属于水下声学超材料技术领域,涉及一种气泡型水下宽带漫反射编码声学超表面及其使用方法,该声学超表面包括多个第一阵元和多个第二阵元,每个第一阵元的四个侧面分别连接第一阵元或第二阵元,第一阵元由N×N个第一超表面单元组成,第二阵元由N×N个第二超表面单元组成;第一超表面单元中的立方体框架具有疏水特性,在水环境中,立方体框架会捕获空气形成气泡,第一超表面单元与第二超表面单元在较宽频带内声波反射相位差接近180度,且保持基本稳定,通过调整阵元编码序列的空间排布,实现声学RCS缩减;通过3D打印方式制作超表面,制作精度高,成本低,在水下声音探测、水中通信和隐身领域具有巨大的发展潜能和重要的研究价值。- 发布时间:2024-03-25 07:00:16
- 3