物理
下拉
最新专利
-
话者识别的方法、装置、设备、存储介质以及程序产品 公开日期:2024-09-17 公开号:CN112634880A 申请号:CN202011526184.7话者识别的方法、装置、设备、存储介质以及程序产品
- 申请号:CN202011526184.7
- 公开号:CN112634880A
- 公开日期:2024-09-17
- 申请人:上海明卉实业有限公司
本公开提供了话者识别的方法、装置、设备、存储介质及程序产品,涉及人工智能领域,具体涉及语音识别、深度学习、大数据以及云计算等领域。具体实现方案为:获取初始模型,初始模型包括特征提取网络;获取源域样本音频和目标域样本音频的样本特征,源域样本音频包括话者标签和领域标签,目标域样本音频包括领域标签;基于特征提取网络对源域样本音频和目标域样本音频的样本特征逐帧提取,得到源域子句特征和目标域子句特征;利用源域子句特征和目标域子句特征,训练初始模型,以生成话者识别模型,话者识别模型用于识别目标域待识别音频的说话者。根据本公开的技术,可以提高话者识别模型的训练效率、减少训练周期。- 发布时间:2023-06-03 12:16:44
- 0
-
电子乐器、控制方法以及存储介质 公开日期:2024-09-17 公开号:CN112634847A 申请号:CN202010828464.7电子乐器、控制方法以及存储介质
- 申请号:CN202010828464.7
- 公开号:CN112634847A
- 公开日期:2024-09-17
- 申请人:卡西欧计算机株式会社
一种电子乐器、控制方法及存储介质。电子乐器具备音源和处理器,处理器向音源指示与自动伴奏式样相应的伴奏音的发音,向音源指示基于第1设定发出与根据第1用户操作而指定的音高相应的乐音,第1设定与设定数据的第1定时对应,第1用户操作与自动伴奏式样的第1定时对应,向音源指示基于第2设定发音发出与根据第2用户操作而指定的音高相应的乐音,第2设定与设定数据的第2定时对应且与第1设定不同,第2用户操作与自动伴奏式样的第2定时对应。通过实施本发明,能够进行更丰富的演奏表现。- 发布时间:2023-06-03 12:10:58
- 0
-
棒式打击乐器的音棒和与之相连的连接元件 公开日期:2024-09-17 公开号:CN112599110A 申请号:CN202010975783.0棒式打击乐器的音棒和与之相连的连接元件
- 申请号:CN202010975783.0
- 公开号:CN112599110A
- 公开日期:2024-09-17
- 申请人:索诺公司
本发明涉及一种棒式打击乐器的音棒和一种与之相连的连接元件以及一种棒式打击乐器,该棒式打击乐器具有至少一个按本发明的音棒和至少一个按本发明的连接元件。- 发布时间:2023-06-02 13:54:52
- 0
-
具有至少一个音棒的棒式打击乐器 公开日期:2024-09-17 公开号:CN112599109A 申请号:CN202010973704.2具有至少一个音棒的棒式打击乐器
- 申请号:CN202010973704.2
- 公开号:CN112599109A
- 公开日期:2024-09-17
- 申请人:索诺公司
本发明涉及一种棒式打击乐器,其具有至少一个音棒、用于固定音棒的保持元件和至少一个带有上侧和下侧的共鸣体。- 发布时间:2023-06-02 13:54:52
- 0
-
吸隔音结构 公开日期:2024-09-17 公开号:CN112513975A 申请号:CN201980049302.9吸隔音结构
- 申请号:CN201980049302.9
- 公开号:CN112513975A
- 公开日期:2024-09-17
- 申请人:丰田车体株式会社
吸隔音构件(13)是以交替地与第一划分构件(11)和第二划分构件(12)抵接的方式弯曲形成的板状构件,具有多个中空的凸部(15),该凸部(15)以填埋两个划分构件之间的间隙的方式突出,在第一划分构件(11)与第二划分构件(12)之间,形成有被第一划分构件(11)封闭的凸部(15)内的第一空间部和设置在相邻的凸部(15)彼此之间且被第二划分构件(12)封闭的第二空间部,第一空间部与第二空间部通过连通部(30)而相连,该连通部(30)由凸部(15)的一部分形成且将凸部(15)的内外连通,连通部(30)的第二空间部侧的开口设置于配置在第一划分构件(11)与第二划分构件(12)之间的凸部(15)的侧壁部。- 发布时间:2023-06-02 12:38:42
- 0
-
在数字和非数字表面上使用手绘图案/文本进行音乐合成的方法和系统 公开日期:2024-09-17 公开号:CN112262428A 申请号:CN201980038548.6在数字和非数字表面上使用手绘图案/文本进行音乐合成的方法和系统
- 申请号:CN201980038548.6
- 公开号:CN112262428A
- 公开日期:2024-09-17
- 申请人:三星电子株式会社
本公开涉及用于创建和合成音乐的方法和设备。所公开的方法包括:获得包括与至少一个第一乐器相关的至少一个对象的至少一个图像,识别与所述至少一个对象相关联的用户输入,将所述至少一个对象映射到至少一个第二乐器,并且基于用户输入和所述至少一个第二乐器的声音数据生成声音。- 发布时间:2023-05-28 12:02:44
- 0
-
神经网络训练方法、装置、电子设备及介质 公开日期:2024-09-17 公开号:CN114783449A 申请号:CN202210293128.6神经网络训练方法、装置、电子设备及介质
- 申请号:CN202210293128.6
- 公开号:CN114783449A
- 公开日期:2024-09-17
- 申请人:武汉大学
本发明公开了神经网络训练方法、装置、电子设备及介质,涉及音频信号编解码技术领域。训练方法包括以下步骤:基于神经网络的编码器将音频信号编码为深层次特征;量化器将深层次特征量化;解量化器将深层次特征量化索引解量化;基于神经网络的解码器将解量化的深层次特征解码,得到解码音频信号;基于心理声学模型计算输入音频信号的信掩比;听觉感知损失计算模块计算解码音频信号的听觉感知损失;训练模块基于引入听觉感知特性的损失函数训练编码器、量化码本以及解码器,直至损失收敛。根据本发明训练方法得到的编解码器,能够使解码音频信号的每一个频率成分的重建噪声尽可能地控制在掩蔽阈值内,从而达到提升解码音频信号感知质量的效果。- 发布时间:2023-05-16 11:01:49
- 0
-
一种音频识别方法、装置、电子设备及存储介质 公开日期:2024-09-17 公开号:CN114550731A 申请号:CN202210343564.X一种音频识别方法、装置、电子设备及存储介质
- 申请号:CN202210343564.X
- 公开号:CN114550731A
- 公开日期:2024-09-17
- 申请人:北京百度网讯科技有限公司
本公开提供了一种音频识别方法、装置、电子设备、可读存储介质以及计算机程序产品,涉及人工智能、安全认证技术以及声纹识别技术领域。具体实现方案为:基于待识别音频在频域对应的第一音频特征,确定所述待识别音频在实数域对应的第二音频特征;利用目标压缩函数对所述第二音频特征进行特征压缩,获得所述待识别音频对应的非线性音频特征,所述目标压缩函数为预先对可平滑对数压缩函数进行参数学习得到的,所述可平滑对数压缩函数中包括预设的可学习参数;基于所述非线性音频特征,确定所述待识别音频对应的音频识别结果。该方案能够在无需人工提取音频特征的情况下,高效的模拟出待识别音频的非线性,进而能够提高音频识别的安全性和识别效率。- 发布时间:2023-05-12 11:40:53
- 0
-
一种用于还原亲人生前声音并智能互动的方法及系统 公开日期:2024-09-17 公开号:CN114530155A 申请号:CN202210149598.5一种用于还原亲人生前声音并智能互动的方法及系统
- 申请号:CN202210149598.5
- 公开号:CN114530155A
- 公开日期:2024-09-17
- 申请人:北京肿瘤医院(北京大学肿瘤医院)
本发明公开了一种还原亲人生前声音并智能互动的方法及系统,其中,所述方法应用于一智能互动系统,所述系统与第一声音采集装置、第一图像采集装置通信连接,所述方法包括:获得第一用户需求信息;获得第一场景化参数需求集合;获得第二用户的采集许可信息,获得第一声音采集集合和第一图像采集集合;获得第一契合度识别结果;进行所述第一声音采集集合进行场景标签标识;获得第一场景化声音采集集合;根据所述第一场景化声音采集集合进行声音模拟和互动。解决了缅怀方式固定传统且无法满足缅怀需求的技术问题,达到了基于用户需求,综合已逝亲人与用户之间契合度、已逝亲人的声音特征实现还原亲人生前声音并智能互动的技术效果。- 发布时间:2023-05-10 11:53:14
- 0
-
一种检测助听器语音质量的方法及设备 公开日期:2024-09-17 公开号:CN114400023A 申请号:CN202210075565.0一种检测助听器语音质量的方法及设备
- 申请号:CN202210075565.0
- 公开号:CN114400023A
- 公开日期:2024-09-17
- 申请人:天津中科听芯科技有限公司
本发明涉及语音质量评价技术领域,具体涉及一种检测助听器语音质量的方法及设备。该方法包括:接收助听器在噪声测试环境下传输的语音信息;以语音信息作为自编码网络的输入,对隐含层中的隐变量进行分组替换,输出重构语音信息,来训练自编码网络;同时依据分组替换前后的隐变量对应的特征张量的相似度判断重构语音信息为正常语音还是失真语音;以语音信息作为分类网络的输入,以对应的重构语音信息的判断结果作为标签,输出语音信息的类别以及该语音信息为正常语音的置信度,训练分类网络;将接收的助听器传输的待检测语音输入训练完成的分类网络中,根据输出评估助听器的语音质量。本发明实施例能够对助听器的语音质量进行准确的检测。- 发布时间:2023-05-09 10:38:50
- 0