发明

基于隐私保护的联合训练大语言模型的方法、系统及装置2026

2024-04-21 07:48:24 发布于四川 2

申请专利号：CN202410072309.5
公开（公告）日：2026-06-05
公开（公告）号：CN117910042A
申请人：浙江蚂蚁密算科技有限公司

摘要：本说明书实施例提供一种基于隐私保护的联合训练大语言模型的方法、系统及装置，该大语言模型被划分为第一部分网络和第二部分网络，第一部分网络部署于各客户端且参数固定，第二部分网络部署于服务端的TEE中；方法包括：服务端从各个客户端接收其各自的数据集密文，单个数据集密文为，客户端对其私有样本的嵌入特征和标签数据进行加密所得；嵌入特征由该客户端所部署的第一部分网络处理所得；在TEE中，执行模型更新，该模型更新包括：解密各数据集密文，得到各数据集明文；利用各数据集明文中的各嵌入特征，通过第二部分网络，得到各私有样本对应的预测数据；利用各私有样本对应的预测数据和标签数据之间的差异，调整第二部分网络中的指定参数。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117910042 A (43)申请公布日 2024.04.19 (21)申请号 202410072309.5 (22)申请日 2024.01.17 (71)申请人支付宝（杭州）信息技术有限公司地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-11 (72)发明人黄炜　王莹桂　余超凡　周爱辉　王磊　 (74)专利代理机构北京亿腾知识产权代理事务所(普通合伙) 11309 专利代理师陈霁　周良玉 (51)Int.Cl. G06F 21/62 (2013.01) G06F 21/60 (2013.01) G06N 3/045 (2023.01) G06N 3/08 (2023.01) 权利要求书2页说明书12页附图5页 (54)发明名称基于隐私保护的联合训练大语言模型的方法、系统及装置 (57)摘要本说明书实施例提供一种基于隐私保护的联合训练大语言模型的方法、系统及装置，该大语言模型被划分为第一部分网络和第二部分网络，第一部分网络部署于各客户端且参数固定，第二部分网络部署于服务端的TEE中；方法包括：服务端从各个客户端接收其各自的数据集密文，单个数据集密文为，客户端对其私有样本的嵌入特征和标签数据进行加密所得；嵌入特征由该客户端所部署的第一部分网络处理所得；在TEE中，执行模型更新，该模型更

基于隐私保护的联合训练大语言模型的方法、系统及装置2026

专利内容

最新专利

相关专利