发明

一种基于石油业务模型的油气企业大模型构建方法2024

2024-03-25 07:54:35 发布于四川 15
  • 申请专利号:CN202311789160.4
  • 公开(公告)日:2024-09-27
  • 公开(公告)号:CN117744770A
  • 申请人:北京侏罗纪软件股份有限公司
摘要:本发明公开了一种基于石油业务模型的油气企业大模型构建方法,属于模型构建技术领域,包括数据准备、数据预处理、数据标注、训练数据生成、模型再训练/微调/RLHF、模型部署和应用运营,数据预处理由结构化数据预处理和非结构化文档预处理组成,数据预处理的核心目的是将非标准的各种来源物理数据处理为业务标准粒度的“标准数据”。本发明可以利用语义理解和生成等能力抽取知识,提高知识抽取的准确性和覆盖度,也可以抽取出隐含的、复杂的、多模态的知识,降低图谱构建成本,可以利用其语义理解和指令遵循等能力辅助知识图谱的半自动化构建设计、增加知识的全面性和覆盖度,协助更好的完成知识融合和更新。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117744770 A (43)申请公布日 2024.03.22 (21)申请号 202311789160.4 (22)申请日 2023.12.25 (71)申请人 北京侏罗纪软件股份有限公司 地址 100085 北京市海淀区学清路9号汇智 大厦B楼908室 (72)发明人 包世界  (74)专利代理机构 安徽中辰臻远专利代理事务 所(普通合伙) 34175 专利代理师 韩永佳 (51)Int.Cl. G06N 5/02 (2023.01) G06Q 50/02 (2024.01) G06F 16/36 (2019.01) 权利要求书2页 说明书5页 附图3页 (54)发明名称 一种基于石油业务模型的油气企业大模型 构建方法 (57)摘要 本发明公开了一种基于石油业务模型的油 气企业大模型构建方法,属于模型构建技术领 域,包括数据准备、数据预处理、数据标注、训练 数据生成、模型再训练/微调/RLHF、模型部署和 应用运营,数据预处理由结构化数据预处理和非 结构化文档预处理组成,数据预处理的核心目的 是将非标准的各种来源物理数据处理为业务标 准粒度的“标准数据”。本发明可以利用语义理解 和生成等能力抽取知识,提高知识抽取的准确性 和覆盖度,也可以抽取出隐含的、复杂的、多模态 的知识,降低图谱构建成本,可以利用其语义理 A 解和指令遵循等能力辅助知识图谱的半自动化 0 构建设计、增加知识的全面性和

最新专利