发明

一种时序数据存储引擎的索引构建方法2026

2024-04-11 07:32:18 发布于四川 2
  • 申请专利号:CN202410070820.1
  • 公开(公告)日:2026-05-12
  • 公开(公告)号:CN117851537A
  • 申请人:南开大学
摘要:本发明提供一种时序数据存储引擎的索引构建方法,属于数据库存储技术领域。具体包括:根据标签键的文档频率及标签值的出现频率对数据块进行预筛选;通过标签键的历史访问频率,对预筛选集合进行特征提取,获得数据特征并进行机器学习以进一步筛选,获得包括每条时间线的指标标签组的目标集合;根据指标标签组中多个不同的指标对目标集合进行目标标签提取,获得多个组标签集合;对指标标签相同的组标签集合置入对应的时间线,获得多个时间线集合;对每个时间线集合分配唯一的组ID,建立标签键值对与组ID映射的倒排索引,并建立目标标签与倒排索引映射的前置索引。本发明能够提升时序数据的写入效率与索引构建效率。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117851537 A (43)申请公布日 2024.04.09 (21)申请号 202410070820.1 (22)申请日 2024.01.18 (71)申请人 南开大学 地址 300071 天津市南开区卫津路94号 (72)发明人 刘晓光 徐子越 王刚 黄苏童  费迪 刘欣瑀 余文清 魏子敬  刘少治  (74)专利代理机构 天津展誉专利代理有限公司 12221 专利代理师 任海波 (51)Int.Cl. G06F 16/31 (2019.01) G06F 16/35 (2019.01) G06N 20/20 (2019.01) 权利要求书1页 说明书7页 附图2页 (54)发明名称 一种时序数据存储引擎的索引构建方法 (57)摘要 本发明提供一种时序数据存储引擎的索引 构建方法,属于数据库存储技术领域。具体包括: 根据标签键的文档频率及标签值的出现频率对 数据块进行预筛选;通过标签键的历史访问频 率,对预筛选集合进行特征提取,获得数据特征 并进行机器学习以进一步筛选,获得包括每条时 间线的指标标签组的目标集合;根据指标标签组 中多个不同的指标对目标集合进行目标标签提 取,获得多个组标签集合;对指标标签相同的组 标签集合置入对应的时间线,获得多个时间线集 合;对每个时间线集合分配唯一的组ID,建立标 签键值对与组ID映射的倒排索引,并建立目标标 A 签与倒排索引映射的

最新专利