物理
下拉
最新专利
-
智能设备的高效和低延迟自动化助理控制 公开日期:2024-10-29 公开号:CN113068410A 申请号:CN201980022670.4智能设备的高效和低延迟自动化助理控制
- 申请号:CN201980022670.4
- 公开号:CN113068410A
- 公开日期:2024-10-29
- 申请人:谷歌有限责任公司
各种实施方式涉及用于控制智能设备的技术,这些技术具有低延迟和/或提供计算效率(客户端和/或服务器)和/或网络效率。这些实施方式涉及在控制各种智能设备(例如,智能灯、智能恒温器、智能插头、智能设备、智能路由器等)时,生成和/或利用本地存储在助理客户端设备上的高速缓存的缓存条目。每个缓存条目包括文本到一个或多个对应的语义表示的映射。- 发布时间:2023-06-14 12:28:39
- 0
-
语音信息的处理方法、装置、存储介质及电子设备 公开日期:2024-10-29 公开号:CN113056784A 申请号:CN201980076330.X语音信息的处理方法、装置、存储介质及电子设备
- 申请号:CN201980076330.X
- 公开号:CN113056784A
- 公开日期:2024-10-29
- 申请人:深圳市欢太科技有限公司|||OPPO广东移动通信有限公司
本实施例公开了一种语音信息的处理方法,该方法包括采集语音信息,提取出目标语音特征信息并输入至预设模型中,以得到目标声纹参数,获取待识别语音,并提取出待识别语音的第一声纹参数,将第一声纹参数与目标声纹参数进行匹配,根据匹配结果获取标识信息,并标识信息标识至所述播放视频中。提升了语音信息的处理准确性。- 发布时间:2023-06-14 12:21:43
- 0
-
隔音壳 公开日期:2024-10-29 公开号:CN112753068A 申请号:CN201980065048.1隔音壳
- 申请号:CN201980065048.1
- 公开号:CN112753068A
- 公开日期:2024-10-29
- 申请人:神钢压缩机株式会社
隔音壳(1)具备壳主体(3)、门(4)、隔音构造(5),前述壳主体(3)在内部容纳噪声源,并且具备开口部(2),前述门(4)能够将壳主体(3)的开口部(2)封闭,前述隔音构造(5)设置于壳主体(3)和门(4)之间而能够隔音,在开口部(2)的周围,形成均位于同一平面上的开口周围面(13),在门(4)的外周侧,设置有向壳主体(3)侧折回且壳主体(3)侧的端部均位于同一平面上的折回片(15),隔音构造(5)具有垫料(17)和吸音部件(16),前述垫料(17)设置于折回片(15)的壳主体(3)侧,并且在使开口部(2)呈关状态时,与开口周围面(13)接触,前述吸音部件(16)被比折回片(15)靠门中央侧地设置,并且在开口部(2)呈关状态时,与开口周围面(13)接触,由此厚度变得比开状态薄。- 发布时间:2023-06-05 18:31:41
- 0
-
用于原始音频的基于小占用空间流的模型 公开日期:2024-10-29 公开号:CN112634936A 申请号:CN202010979804.6用于原始音频的基于小占用空间流的模型
- 申请号:CN202010979804.6
- 公开号:CN112634936A
- 公开日期:2024-10-29
- 申请人:百度(美国)有限责任公司
WaveFlow是用于原始音频的小占用空间生成流,可以以最大的似然度直接对其进行训练。WaveFlow使用扩展的二维(2D)卷积架构处理波形的远程结构,同时使用表达性自回归函数对局部变化进行建模。WaveFlow可以为原始音频提供基于似然度模型(包括WaveNet和WaveGlow)的统一视图,这可视为特殊情况。它生成高保真语音,同时合成速度比现有系统快几个数量级,因为它仅使用几个序列步骤来生成相对较长的波形。WaveFlow显著减小了自回归模型与基于流的模型之间存在的似然度差距,从而实现有效合成。它具有5.91M参数的小占用空间使其比一些现有模型小15倍。WaveFlow可在V100图形处理单元(GPU)上以比实时快42.6倍的速度生成22.05kHz高保真音频,而无需使用工程化推理内核。- 发布时间:2023-06-03 12:11:05
- 0
-
选择性注册到自动助理 公开日期:2024-10-29 公开号:CN112313741A 申请号:CN201880094608.1选择性注册到自动助理
- 申请号:CN201880094608.1
- 公开号:CN112313741A
- 公开日期:2024-10-29
- 申请人:谷歌有限责任公司
本文描述了以下技术,该技术用于通过自动助理进行单模式识别和/或多模式识别的个人用户的基于对话的注册,以及基于特定用户已注册和/或识别的事实来确定如何响应该特定用户的请求。与要求操作图形用户界面来进行个人注册不同,基于对话的注册使用户能够通过与自动助理的人机对话来注册其自身(或其它人)。- 发布时间:2023-05-28 12:34:59
- 0
-
语音识别方法、装置、计算机设备和存储介质 公开日期:2024-10-29 公开号:CN114913848A 申请号:CN202210446103.5语音识别方法、装置、计算机设备和存储介质
- 申请号:CN202210446103.5
- 公开号:CN114913848A
- 公开日期:2024-10-29
- 申请人:北京绝影智联科技有限公司
本公开提供了一种语音识别方法、装置、计算机设备和存储介质,其中,该方法包括:基于待识别的语音序列中的语音特征的数量,确定所述语音序列对应的查询矩阵中的每个初始查询特征的第一余弦权重,和语音序列对应的键矩阵中的每个所述初始键特征的第二余弦权重;基于第一余弦权重和第二余弦权重,确定每个初始查询特征分别与各个初始键特征之间的相似度;针对语音序列中的每个语音特征,基于语音特征对应的初始查询特征与各个初始键特征之间的相似度、以及语音序列对应的值矩阵中的每个目标值特征,确定语音特征对应的注意力特征;基于语音序列中各个语音特征分别对应的注意力特征,确定语音序列对应的语音识别结果。- 发布时间:2023-05-20 11:02:28
- 0
-
基于改进FxLMS算法的噪声主动控制方法及系统 公开日期:2024-10-29 公开号:CN114842821A 申请号:CN202210485877.9基于改进FxLMS算法的噪声主动控制方法及系统
- 申请号:CN202210485877.9
- 公开号:CN114842821A
- 公开日期:2024-10-29
- 申请人:齐鲁工业大学(山东省科学院)
本公开属于噪声主动控制技术领域,提供了一种基于改进FxLMS算法的噪声主动控制方法及系统,包括:获取噪声源信号数据;基于所获取的噪声源数据构建相邻噪声源信号之间的信号插值;计算与所述信号插值异步执行的误差;结合所得到的误差和归一化变步长,控制噪声学习步长,实现噪声的主动控制。本公开采用信号插值与归一化变步长相结合的方式进行FxLMS算法上的改进,收敛速度快,鲁棒性强,提高降噪效果。- 发布时间:2023-05-18 12:52:55
- 0
-
基于波形和频域信息融合网络的声音信号增强方法及装置 公开日期:2024-10-29 公开号:CN114783457A 申请号:CN202210627965.8基于波形和频域信息融合网络的声音信号增强方法及装置
- 申请号:CN202210627965.8
- 公开号:CN114783457A
- 公开日期:2024-10-29
- 申请人:中国科学院半导体研究所
本公开提供了一种基于波形和频域信息融合网络的声音信号增强方法及装置。该方法包括获取声音训练样本集,其中,声音训练样本集包括多个声音训练样本和对应的标签数据,每个声音训练样本包括训练声音信号和训练幅度谱;将声音训练样本输入初始融合网络模型,输出增强后的训练声音数据,其中,初始融合网络模型为用于融合声音信号时域信息和频域信息的多模态融合网络模型;根据标签数据和增强后的训练声音数据计算损失函数,得到损失结果;根据损失结果迭代地调整初始融合网络模型的网络参数,生成经训练的多模态融合网络模型;将待增强的声音信号输入多模态融合网络模型,输出增强的语音信号。- 发布时间:2023-05-17 11:47:44
- 0
-
针对语音识别系统的对抗音频生成的方法和装置 公开日期:2024-10-29 公开号:CN114783431A 申请号:CN202210273221.0针对语音识别系统的对抗音频生成的方法和装置
- 申请号:CN202210273221.0
- 公开号:CN114783431A
- 公开日期:2024-10-29
- 申请人:腾讯科技(深圳)有限公司
本申请提供了一种针对语音识别系统的对抗音频生成的方法、装置、设备和存储介质,涉及语音识别领域。本申请实施例中,获取语音识别系统的系统模型参数和源音频数据,并根据源音频数据确定第一扰动噪音和掩码矩阵,再根据该掩码矩阵对该第一扰动噪音进行掩码操作得到第二扰动噪音,最后根据该系统模型参数、目标语句、该源音频数据和该第二扰动噪音生成对抗音频。本申请实施例能够让噪音隐藏在语音片段中,使得攻击的扰动难以察觉,从而可以有助于提升端对端语音识别系统的安全鲁棒性,以及使得端对端语音识别系统更加安全,性能更好。- 发布时间:2023-05-16 11:01:18
- 0
-
一种声音侦测方法、装置及设备 公开日期:2024-10-29 公开号:CN114765032A 申请号:CN202110049515.0一种声音侦测方法、装置及设备
- 申请号:CN202110049515.0
- 公开号:CN114765032A
- 公开日期:2024-10-29
- 申请人:漳州立达信光电子科技有限公司
本申请适用于警报器技术领域,提供一种声音侦测方法、装置及设备,通过对待侦测声音信号的每个音框进行频谱转换,获得每个音框的幅值频谱图;获取每个音框的幅值频谱图的峰值振幅的频率;侦测所有峰值振幅的频率中是否存在连续相同的频率;当所有峰值振幅的频率中存在连续相同的频率时,根据所有音框的幅值频谱图,侦测待侦测声音信号的周期;根据待侦测声音信号的周期,确定待侦测声音信号是否为预设声音信号;当待侦测声音信号为预设声音信号时,向客户端发送警报信号,可以与警报器进行通信及联动,能够在侦测到警报器发出警报声音信号时,及时通知远距离处的用户或相关救援单位进行紧急救援处理。- 发布时间:2023-05-16 10:55:47
- 0