发明

GPU直通及资源混合调度方法、系统及芯片2025

2024-04-16 07:19:22 发布于四川 5
  • 申请专利号:CN202311734812.4
  • 公开(公告)日:2025-07-29
  • 公开(公告)号:CN117873706A
  • 申请人:天翼云科技有限公司
摘要:本申请提供了GPU直通及资源混合调度方法、系统及芯片,该方法包括:S1:获取各节点的GPU的资源信息并保存至调度缓存区中;S2:基于混合量化计算,获取各节点的GPU的算力数据和总显存需求信息;S3:基于各节点的GPU的总显存需求信息,对节点进行第一筛选以得到第一筛选结果;S4:基于全排列组合函数和剪枝函数,获取精简二维全排列数组;S5:基于第一筛选结果,对节点进行第二筛选操作以获取优选节点结果。该方法可通过不再区分GPU直通及虚拟化调度场景,利用新混合调度方法来拓展GPU调度的应用场景,获取最优节点,进一步提升GPU资源的使用率和利用率,节约人力物力成本,具有调度性能较优和调度准确度高等优点。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117873707 A (43)申请公布日 2024.04.12 (21)申请号 202311754649.8 (22)申请日 2023.12.19 (71)申请人 曙光云计算集团股份有限公司 地址 100089 北京市海淀区东北旺西路8号 院36号楼5层 (72)发明人 任超 孙会首 李明达  (74)专利代理机构 华进联合专利商标代理有限 公司 44224 专利代理师 关志琨 (51)Int.Cl. G06F 9/50 (2006.01) 权利要求书2页 说明书14页 附图8页 (54)发明名称 算力资源调度方法、装置、计算机设备和存 储介质 (57)摘要 本申请涉及一种算力资源调度方法、装置、 计算机设备和存储介质,涉及云服务技术领域。 方法包括:获取执行目标计算任务所需的算力资 源需求;根据算力资源需求,从云平台所支持的 各候选算力服务中选取目标算力服务,并创建目 标算力服务对应的目标算力集群;根据目标算力 集群和云平台所支持的各候选容器规格的规格 信息,调度目标容器执行目标计算任务。采用本 方法所选取的目标算力服务可以包含多种算力 类型,使得目标计算任务可以使用多种算力类型 的目标算力集群,提升算力资源调度的灵活性, A 标准化调度流程可以提升算力资源调度的可靠 7 性。 0 7 3 7 8 7 1 1 N C CN 117873707 A 权 利 要 求 书

最新专利