发明

一种面向应用程序调用的大模型资源分配和交易结算方法2025

2024-04-21 07:49:23 发布于四川 2
  • 申请专利号:CN202410092969.X
  • 公开(公告)日:2025-05-30
  • 公开(公告)号:CN117909078A
  • 申请人:广东跃昉科技有限公司
摘要:本申请适用于人工智能技术领域,提供了一种面向应用程序调用的大模型资源分配和交易结算方法。包括:当目标模型被应用程序调用时,对目标模型中的参与计算数据进行引用计数,得到引用计数值,并记录进行调用的应用程序,得到记录结果;根据引用计数值和记录结果分别统计得到每个应用程序对应的参与计算数据的总引用次数;根据应用程序对应的参与计算数据的总引用次数,对目标模型的所有模型数据进行分类,分别存储到不同的存储资源;根据每个应用程序的总调用计数,对应用程序分类,分别提供不同的计算资源。该方法通过对应用程序调用大模型过程进行记录,并根据记录结果对模型的存储资源、应用程序的计算资源进行分配,实现了对于资源合理分配。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117909078 A (43)申请公布日 2024.04.19 (21)申请号 202410092969.X (22)申请日 2024.01.22 (71)申请人 广东跃昉科技有限公司 地址 519000 广东省珠海市横琴新区环岛 东路1889号18栋218室 (72)发明人 江朝晖 袁博浒 袁穗聪  (74)专利代理机构 深圳中一联合知识产权代理 有限公司 44414 专利代理师 匡睿 (51)Int.Cl. G06F 9/50 (2006.01) G06Q 40/04 (2012.01) 权利要求书2页 说明书12页 附图7页 (54)发明名称 一种面向应用程序调用的大模型资源分配 和交易结算方法 (57)摘要 本申请适用于人工智能技术领域,提供了一 种面向应用程序调用的大模型资源分配和交易 结算方法。包括:当目标模型被应用程序调用时, 对目标模型中的参与计算数据进行引用计数,得 到引用计数值,并记录进行调用的应用程序,得 到记录结果;根据引用计数值和记录结果分别统 计得到每个应用程序对应的参与计算数据的总 引用次数;根据应用程序对应的参与计算数据的 总引用次数,对目标模型的所有模型数据进行分 类,分别存储到不同的存储资源;根据每个应用 程序的总调用计数,对应用程序分类,分别提供 A 不同的计算资源。该方法通过对应用程序调用大 8 模型过程进行记录,并根据记录结果对模型的存 7 0 9 储资源、应用

最新专利