发明

基于深度稀疏表示网络的DNA结合蛋白识别方法

2023-05-18 13:01:08 发布于四川 0
  • 申请专利号:CN202210362641.6
  • 公开(公告)日:2024-09-13
  • 公开(公告)号:CN114863998A
  • 申请人:苏州科技大学
摘要:一种基于深度稀疏表示网络的DNA结合蛋白识别方法,包括以下具体步骤:获取DNA结合蛋白序列数据集,分为训练集和测试集;采用PSL‑BLAST软件计算DNA结合蛋白序列数据集内所有序列的特异性打分矩阵;将所有的特异性打分矩阵分别填充或裁剪成相同尺寸的新特异性打分矩阵;采用深度稀疏表示网络构建并训练DNA结合蛋白识别分类器模型,将新特异性打分矩阵输入DNA结合蛋白识别分类器模型内,完成对DNA结合蛋白序列的识别。构建并训练出的DNA结合蛋白识别分类器模型是一种端到端的网络,能够明显的提高预测精度,误差较小,采用卷积自编码器可以鲁棒地学习特异性打分矩阵的潜在特征,并通过稀疏表示层进行分类,提高了模型的泛化能力。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114863998 A (43)申请公布日 2022.08.05 (21)申请号 202210362641.6 (22)申请日 2022.04.08 (71)申请人 苏州科技大学 地址 215004 江苏省苏州市虎丘区学府路 99号 (72)发明人 钱昱磬 丁漪杰 吴宏杰  (74)专利代理机构 苏州科仁专利代理事务所 (特殊普通合伙) 32301 专利代理师 郭杨 (51)Int.Cl. G16B 20/00 (2019.01) 权利要求书2页 说明书4页 附图2页 (54)发明名称 基于深度稀疏表示网络的DNA结合蛋白识别 方法 (57)摘要 一种基于深度稀疏表示网络的DNA结合蛋白 识别方法,包括以下具体步骤:获取DNA结合蛋白 序列数据集,分为训练集和测试集;采用PSL‑ BLAST软件计算DNA结合蛋白序列数据集内所有 序列的特异性打分矩阵;将所有的特异性打分矩 阵分别填充或裁剪成相同尺寸的新特异性打分 矩阵;采用深度稀疏表示网络构建并训练DNA结 合蛋白识别分类器模型,将新特异性打分矩阵输 入DNA结合蛋白识别分类器模型内,完成对DNA结 合蛋白序列的识别。构建并训练出的DNA结合蛋 白识别分类器模型是一种端到端的网络,能够明 A 显的提高预测精度,误差较小,采用卷积自编码 8 器可以鲁棒地学习特异性打分矩阵的潜在特征, 9 9 3 并通过稀疏表示层进行分类,提高了模型的泛化 6 8 4 能力。 1 1

最新专利