发明

基于机器学习的生物信息学数据处理方法、系统及介质2024

2024-06-01 07:30:44 发布于四川 1
  • 申请专利号:CN202410474853.2
  • 公开(公告)日:2024-09-17
  • 公开(公告)号:CN118072835A
  • 申请人:宁波甬恒瑶瑶智能科技有限公司
摘要:本发明提供基于机器学习的生物信息学数据处理方法、系统及介质,涉及数据处理技术领域,包括:创建样品数据库和已知数据库;对样品数据库中的蛋白质分子进行编码,得到样品编码库,对已知数据库中的蛋白质分子进行编码,得到已知编码库;对样品编码库中的蛋白质分子编码进行识别分类,得到缺失数据集和正常数据集;对正常数据集进行特征提取,得到正常特征集;对缺失数据集进行预补全,得到估计值数据集;训练随机森林模型对正常特征集进行分类;基于训练完成的随机森林模型对估计值数据集进行特征补全,得到补全数据;本发明用于解决现有的识别方法不能有效地对缺失的生物信息学数据进行精准补全,因此在后续的分类上也会存在缺陷的问题。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 118072835 A (43)申请公布日 2024.05.24 (21)申请号 202410474853.2 G06F 18/15 (2023.01) G06F 18/213 (2023.01) (22)申请日 2024.04.19 G06F 18/243 (2023.01) (71)申请人 宁波甬恒瑶瑶智能科技有限公司 G06N 5/01 (2023.01) 地址 315000 浙江省宁波市镇海区庄市街 道中官西路1277号启迪科技园(宁波) 1号11-1室(A栋1101室) (72)发明人 何加铭 王钦文 吴东舒 单丹丹  江文玲 金錱 洪锐 郑国俊  张济鹏 雷宣龙 周林  (74)专利代理机构 苏州科权知识产权代理事务 所(普通合伙) 32561 专利代理师 邹宇 (51)Int.Cl. G16B 40/00 (2019.01) G16B 50/30 (2019.01) 权利要求书3页 说明书8页 附图3页 (54)发明名称 基于机器学习的生物信息学数据处理方法、 系统及介质 (57)摘要 本发明提供基于机器学习的生物信息

最新专利