发明

一种基于神经网络语言模型的药物潜在不良反应发现方法

2023-06-02 13:02:31 发布于四川 8
  • 申请专利号:CN201910039475.4
  • 公开(公告)日:2023-05-30
  • 公开(公告)号:CN109767817A
  • 申请人:南通大学
摘要:一种基于神经网络语言模型的药物潜在不良反应发现方法,涉及药物潜在不良反应发现方法领域,包括以下步骤,数据获取及清洗;模型优化,修改原始的Skip‑gram算法,用于从FDA的AERS报告和DrugBank DDI数据集中进行特征提取;拓展相互作用库,选取5种不良反应大类:肾损伤、心脏毒性、肝毒性、血压异常和神经毒性,以这5种不良反应大类作为Logistic回归验证药物、不良反应向量的范围并在这5大类范围内拓展DrugBank药物相互作用库;Logistic回归验证向量效果,使用Scikit‑learn完成CM‑TF‑IDF模型构建及分布式向量生成。该基于神经网络语言模型的药物潜在不良反应发现方法,解决了现有的方法数据处理速度较慢,不适合处理大规模数据集,同时不能快速进行特征学习的问题。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 109767817 A (43)申请公布日 2019.05.17 (21)申请号 201910039475.4 (22)申请日 2019.01.16 (71)申请人 南通大学 地址 226500 江苏省南通市崇川区啬园路9 号 (72)发明人 王理 姜磊 施维 张远鹏  (74)专利代理机构 北京科亿知识产权代理事务 所(普通合伙) 11350 代理人 汤东凤 (51)Int.Cl. G16C 20/50(2019.01) G16C 20/70(2019.01) G06F 16/31(2019.01) G06F 16/35(2019.01) 权利要求书3页 说明书12页 附图3页 (54)发明名称 一种基于神经网络语言模型的药物潜在不 良反应发现方法 (57)摘要 一种基于神经网络语言模型的药物潜在不 良反应发现方法,涉及药物潜在不良反应发现方 法领域,包括以下步骤,数据获取及清洗;模型优 化,修改原始的Skip-gram算法,用于从FDA的 AERS报告和DrugBank DDI数据集中进行特征提 取;拓展相互作用库,选取5种不良反应大类:肾 损伤、心脏毒性、肝毒性、血压异常和神经毒性, 以这5种不良反应大类作为Logistic回归验证药 物、不良反应向量的范围并在这5大类范围内拓 展Dru

最新专利