一种用于聊天机器人的编译次数优化方法、设备及介质2025
- 申请专利号:CN202410100506.3
- 公开(公告)日:2025-06-24
- 公开(公告)号:CN118092927A
- 申请人:上海人工智能创新中心
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 118092927 A (43)申请公布日 2024.05.28 (21)申请号 202410100506.3 (22)申请日 2024.01.24 (71)申请人 上海人工智能创新中心 地址 200232 上海市徐汇区云锦路701号 37、38层 (72)发明人 陈驰宇 金旻玺 裴芝林 张行程 (74)专利代理机构 上海科盛知识产权代理有限 公司 31225 专利代理师 应小波 (51)Int.Cl. G06F 8/41 (2018.01) G06N 5/04 (2023.01) G06N 3/0455 (2023.01) G06N 3/045 (2023.01) 权利要求书2页 说明书6页 附图3页 (54)发明名称 一种用于聊天机器人的编译次数优化方法、 设备及介质 (57)摘要 本发明涉及一种用于聊天机器人的编译次 数优化方法、设备及介质,该方法基于深度学习 编译器来实现,通过对大模型推理的部分流程进 行修改,包括对大模型推理阶段输入提示令牌和 历史推理的键值缓存进行补齐,同时对指数归一 化之前进行掩码数据处理。与现有技术相比,本 发明具有减少了静态输入形状深度学习编译器 编译的执行次数,从而提高了编译优化加速方案 的推理效率等优点。 A 7 2 9 2 9 0 8 1 1 N C CN 118092927 A 权 利 要 求
最新专利
- 一种仿真数据验证方法、装置、设备和存储介质公开日期:2025-08-12公开号:CN118095126A申请号:CN202410214290.3一种仿真数据验证方法、装置、设备和存储介质
- 发布时间:2024-06-01 07:59:130
- 申请号:CN202410214290.3
- 公开号:CN118095126A
- 零样本的MRI脑肿瘤图像生成方法公开日期:2025-08-12公开号:CN117911557A申请号:CN202410069295.1零样本的MRI脑肿瘤图像生成方法
- 发布时间:2024-04-21 07:48:170
- 申请号:CN202410069295.1
- 公开号:CN117911557A
- 一种以太坊智能合约历史交易的漏洞检测方法公开日期:2025-08-12公开号:CN117911030A申请号:CN202311795616.8一种以太坊智能合约历史交易的漏洞检测方法
- 发布时间:2024-04-21 07:45:550
- 申请号:CN202311795616.8
- 公开号:CN117911030A
- 一种单阶段实时多人姿态估计方法公开日期:2025-08-12公开号:CN117912051A申请号:CN202311706461.6一种单阶段实时多人姿态估计方法
- 发布时间:2024-04-21 07:44:500
- 申请号:CN202311706461.6
- 公开号:CN117912051A
- 一种资源匹配方法、装置、电子设备及存储介质公开日期:2025-08-12公开号:CN117827458A申请号:CN202410012479.4一种资源匹配方法、装置、电子设备及存储介质
- 发布时间:2024-04-07 07:32:170
- 申请号:CN202410012479.4
- 公开号:CN117827458A
- 一种基于半监督学习的医学图像器官分割方法公开日期:2025-08-12公开号:CN117808837A申请号:CN202311850926.5一种基于半监督学习的医学图像器官分割方法
- 发布时间:2024-04-04 07:22:280
- 申请号:CN202311850926.5
- 公开号:CN117808837A