发明

一种基于肽语言模型的苦肽预测方法2025

2023-12-08 07:10:23 发布于四川 0
  • 申请专利号:CN202310901746.9
  • 公开(公告)日:2025-08-19
  • 公开(公告)号:CN117153246A
  • 申请人:中国人民解放军军事科学院军事医学研究院
摘要:本发明公开了一种基于肽语言模型的苦肽预测方法,其步骤包括:1)选取多条蛋白质序列作为原始语料;将所选蛋白质序列分为两个子集,针对第一子集中的每条蛋白质序列进行酶切得到多个肽段序列;对第二子集中的每条蛋白质序列随机分割得到多个氨基酸序列;然后将所得序列生成由Token表示的肽段序列;2)利用Token表示的肽段序列训练ALBERT模型,得到肽段语言模型;利用Text‑CNN构建微调层并对其进行训练;3)对目标肽段的Token表示输入肽段语言模型得到该目标肽段的向量化表示;4)利用训练后的微调层对该目标肽段的向量化表示进行卷积,并将卷积结果进行拼接后通过Softmax层输出该目标肽段为苦肽的概率。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117153246 A (43)申请公布日 2023.12.01 (21)申请号 202310901746.9 G06N 3/0464 (2023.01) G06N 3/047 (2023.01) (22)申请日 2023.07.21 G06N 3/084 (2023.01) (71)申请人 中国人民解放军军事科学院军事医 G06N 3/0895 (2023.01) 学研究院 地址 100850 北京市海淀区太平路27号 (72)发明人 陈涛 朱云平 徐小放 韩明飞  陈洨清  (74)专利代理机构 北京君尚知识产权代理有限 公司 11200 专利代理师 司立彬 (51)Int.Cl. G16B 20/00 (2019.01) G16B 5/20 (2019.01) G16B 40/00 (2019.01) G06N 3/0455 (2023.01) 权利要求书1页 说明书5页 附图2页 (54)发明名称 一种基于肽语言模型的苦肽预测方法 (57)摘要 本发明公开了一种基于肽语言模型的苦肽

最新专利