发明

一种在线整合多来源单细胞数据的方法和系统

2023-04-25 09:42:18 发布于四川 0
  • 申请专利号:CN202111213929.9
  • 公开(公告)日:2024-06-14
  • 公开(公告)号:CN114038505A
  • 申请人:清华大学
摘要:本发明公开了一种在线整合多来源单细胞数据的方法,该方法包括:输入多个不同来源的具有批次效应的单细胞数据;通过批次效应无关的编码器将所述单细胞数据投射到与批次效应无关的、泛化的仅保留生物学信息的单细胞空间;将不同来源的相同类型的细胞在所述单细胞空间对齐,不同类型的细胞分别各自进行定位,彼此分开;通过特异性解码器将特定批次变量信息加入到单细胞空间的各单细胞信息,以重建单细胞数据;本发明实现了与批次无关的单细胞数据整合,具有非常好的泛化性特性,模型训练后对数据能够很好的拟合(align to),对新的批次的数据也能很好的拟合,能够不断整合新产生的数据,实现在线整合(online integrate)功能。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114038505 A (43)申请公布日 2022.02.11 (21)申请号 202111213929.9 (22)申请日 2021.10.19 (71)申请人 清华大学 地址 100084 北京市海淀区清华大学 (72)发明人 张强锋 熊磊  (74)专利代理机构 北京知联天下知识产权代理 事务所(普通合伙) 11594 代理人 张迎新 (51)Int.Cl. G16B 40/00 (2019.01) 权利要求书2页 说明书8页 附图1页 (54)发明名称 一种在线整合多来源单细胞数据的方法和 系统 (57)摘要 本发明公开了一种在线整合多来源单细胞 数据的方法,该方法包括:输入多个不同来源的 具有批次效应的单细胞数据;通过批次效应无关 的编码器将所述单细胞数据投射到与批次效应 无关的、泛化的仅保留生物学信息的单细胞空 间;将不同来源的相同类型的细胞在所述单细胞 空间对齐,不同类型的细胞分别各自进行定位, 彼此分开;通过特异性解码器将特定批次变量信 息加入到单细胞空间的各单细胞信息,以重建单 细胞数据;本发明实现了与批次无关的单细胞数 据整合,具有非常好的泛化性特性,模型训练后 A 对数据能够很好的拟合(align to),对新的批次 5 的数据也能很好的拟合,能够不断整合新产生的 0 5 8 数据,实现在线整合(online  integrate)功能。 3 0 4 1 1 N C CN 114038505

最新专利