发明

基于隐私保护的联合训练大语言模型的方法、系统及装置2026

2024-04-21 07:48:24 发布于四川 2
  • 申请专利号:CN202410072309.5
  • 公开(公告)日:2026-06-05
  • 公开(公告)号:CN117910042A
  • 申请人:浙江蚂蚁密算科技有限公司
摘要:本说明书实施例提供一种基于隐私保护的联合训练大语言模型的方法、系统及装置,该大语言模型被划分为第一部分网络和第二部分网络,第一部分网络部署于各客户端且参数固定,第二部分网络部署于服务端的TEE中;方法包括:服务端从各个客户端接收其各自的数据集密文,单个数据集密文为,客户端对其私有样本的嵌入特征和标签数据进行加密所得;嵌入特征由该客户端所部署的第一部分网络处理所得;在TEE中,执行模型更新,该模型更新包括:解密各数据集密文,得到各数据集明文;利用各数据集明文中的各嵌入特征,通过第二部分网络,得到各私有样本对应的预测数据;利用各私有样本对应的预测数据和标签数据之间的差异,调整第二部分网络中的指定参数。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117910042 A (43)申请公布日 2024.04.19 (21)申请号 202410072309.5 (22)申请日 2024.01.17 (71)申请人 支付宝(杭州)信息技术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-11 (72)发明人 黄炜 王莹桂 余超凡 周爱辉  王磊  (74)专利代理机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 专利代理师 陈霁 周良玉 (51)Int.Cl. G06F 21/62 (2013.01) G06F 21/60 (2013.01) G06N 3/045 (2023.01) G06N 3/08 (2023.01) 权利要求书2页 说明书12页 附图5页 (54)发明名称 基于隐私保护的联合训练大语言模型的方 法、系统及装置 (57)摘要 本说明书实施例提供一种基于隐私保护的 联合训练大语言模型的方法、系统及装置,该大 语言模型被划分为第一部分网络和第二部分网 络,第一部分网络部署于各客户端且参数固定, 第二部分网络部署于服务端的TEE中;方法包括: 服务端从各个客户端接收其各自的数据集密文, 单个数据集密文为,客户端对其私有样本的嵌入 特征和标签数据进行加密所得;嵌入特征由该客 户端所部署的第一部分网络处理所得;在TEE中, 执行模型更新,该模型更

最新专利