发明

RNA序列编码潜力预测方法及系统

2023-05-14 12:35:38 发布于四川 0
  • 申请专利号:CN202210419773.8
  • 公开(公告)日:2025-04-18
  • 公开(公告)号:CN114694757A
  • 申请人:中南民族大学
摘要:本发明提供一种RNA序列编码潜力预测方法及系统。该方法包括:从训练样本集合中选取ORF长度小于303nt的编码RNA作为待增强样本;对待增强样本进行数据增强处理,得到36类不同的伪RNA序列;将36类不同的伪RNA序列与原始训练数据结合,得到36个训练集合;通过36个训练集合训练36个基础分类器,得到36个基础分类模型;将36个基础分类模型的输出结果串联成36维特征向量;从36维特征向量中选取结果特征向量;将结果特征向量以及标签输入最终分类器进行训练,得到RNA序列编码潜力预测模型,通过RNA序列编码潜力预测模型进行RNA序列编码潜力预测。通过本发明,提高了RNA序列编码潜力预测准确性。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114694757 A (43)申请公布日 2022.07.01 (21)申请号 202210419773.8 G06K 9/62 (2022.01) (22)申请日 2022.04.20 (71)申请人 中南民族大学 地址 430000 湖北省武汉市洪山区民族大 道182号 (72)发明人 谌先敢 阳小飞 李臣鸿 陈素  林显光  (74)专利代理机构 武汉智权专利代理事务所 (特殊普通合伙) 42225 专利代理师 罗成 (51)Int.Cl. G16B 40/00 (2019.01) G16B 40/20 (2019.01) G16B 25/00 (2019.01) G16B 20/00 (2019.01) 权利要求书2页 说明书7页 附图3页 (54)发明名称 RNA序列编码潜力预测方法及系统 (57)摘要 本发明提供一种RNA序列编码潜力预测方法 及系统。该方法包括:从训练样本集合中选取ORF 长度小于303nt的编码RNA作为待增强样本;对待 增强样本进行数据增强处理,得到36类不同的伪 RNA序列;将36类不同的伪RNA序列与原始训练数 据结合,得到36个训练集合;通过36个训练集合 训练36个基础分类器,得到36个基础分类模型; 将36个基础分类模型的输出结果串联成36维特 征向量;从36维特征向量中选取

最新专利