发明

多任务序列标注的药物实体和相互作用联合抽取方法

2024-04-18 07:00:09 发布于四川 2
  • 申请专利号:CN202210628078.2
  • 公开(公告)日:2024-04-16
  • 公开(公告)号:CN115019906A
  • 申请人:电子科技大学
摘要:本发明公开了一种多任务序列标注的药物实体和相互作用联合抽取方法,包括以下步骤:S1、数据预处理,包括通用数据预处理、药物实体识别序列标注数据集构建、药物相互作用抽取序列标注数据集构建、类别关键词词典获取;S2、药物命名实体识别;S3、药物相互作用抽取;S4、模型训练与损失函数。本发明将药物实体识别和相互作用抽取问题转化为一种两阶段序列标注任务,合理利用两个任务之间的相互联系和数据集已有的先验知识,将类别关键词的先验知识融入药物相互作用的抽取任务中,从大量的生物医学文献中快速高效地抽取药物实体和相互作用,是一种简单、通用、高效的标注模式。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 115019906 A (43)申请公布日 2022.09.06 (21)申请号 202210628078.2 G06F 40/30 (2020.01) (22)申请日 2022.06.06 (71)申请人 电子科技大学 地址 611731 四川省成都市高新区(西区) 西源大道2006号 (72)发明人 邓皓瀚 朱嘉静 刘勇国 张云  李巧勤  (74)专利代理机构 成都虹盛汇泉专利代理有限 公司 51268 专利代理师 王伟 (51)Int.Cl. G16C 20/70 (2019.01) G16C 20/50 (2019.01) G06N 3/04 (2006.01) G06N 3/08 (2006.01) 权利要求书5页 说明书12页 附图3页 (54)发明名称 多任务序列标注的药物实体和相互作用联 合抽取方法 (57)摘要 本发明公开了一种多任务序列标注的药物 实体和相互作用联合抽取方法,包括以下步骤: S1、数据预处理,包括通用数据预处理、药物实体 识别序列标注数据集构建、药物相互作用抽取序 列标注数据集构建、类别关键词词典获取;S2、药 物命名实体识别;S3、药物相互作用抽取;S4、模 型训练与损失函数。本发明将药物实体识别和相 互作用抽取问题转化为一种两阶段序列标注任 务,合理利用两个任务之间的相互联

最新专利