(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 生活中数据库系统的实际例子CN 103365923 A
(43)申请公布日 2013.10.23
(21)申请号 CN201210102386.8
(22)申请日 2012.03.30
(71)申请人 伊姆西公司
    地址 美国马萨诸塞州
(72)发明人 曹逾 陈继东 郭小燕
(74)专利代理机构 北京市金杜律师事务所
    代理人 王茂华
(51)Int.CI
      G06F17/30
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      用于评估数据库的分区方案的方法和装置
(57)摘要
      本发明的各实施方式涉及用于评估数据库的分区方案的方法和装置。具体地,提供了一种用于评估数据库的分区方案的方法,包括:加载描述数据库的数据文件以及定义针对数据库执行的操作的工作负载;解译数据库的分区方案以形成分区信息;基于分区信息,对数据库执行工作负载中定义的至少一部分操作以获得统计日志;以及基于统计日志,根据评估标准来评估分区方案。在另一实施方式中,提供了一种用于评估数据库的分区方案的装置。
法律状态
法律状态公告日
法律状态信息
法律状态
权 利 要 求 说 明 书
1.一种用于评估数据库的分区方案的方法,包括:
加载描述数据库的数据文件以及定义针对数据库执行的操作的工作负载;
解译所述数据库的分区方案以形成分区信息;
基于所述分区信息,对所述数据库执行所述工作负载中定义的至少一部分操作以获得统计日志;以及
基于所述统计日志,根据评估标准来评估所述分区方案。
2.根据权利要求1所述的方法,其中所述分区信息至少包括:分区键、查表以及系统配置。
3.根据权利要求1所述的方法,其中在加载描述所述数据库的数据文件以及定义针对所述数据库执行的操作的工作负载之前还包括:针对所述数据文件和/或所述工作负载进行压缩。
<Claim>4.根据权利要求1至3中的任一项所述的方法,其中基于所述分区信息、对所述数据库执行所述工作负载中定义的至少一部分操作以获得统计日志包括,通过实际执行以及模拟执行中的至少一项来获得所述统计日志。
5.根据权利要求4所述的方法,其中所述实际执行包括:
将所述数据库部署至分区节点;
将所述工作负载中的操作路由至相应的分区节点并执行;以及
在执行期间记录所述统计日志。
6.根据权利要求4所述的方法,其中所述模拟执行包括:
基于所述数据库和所述分区信息,构建按照所述分区方案进行分区后的数据库的伪表;以及
基于所述伪表执行所述工作负载中的操作以获得所述统计日志。
<Claim>7.根据权利要求1至3中的任一项所述的方法,其中所述评估标准包括以下至少一项:数据分布、工作负载分布、分布式事务的数量以及重分区数据迁移、执行时间、响应时间、单位时间内执行的工作负载。
<Claim>8.根据权利要求1至3中的任一项所述的方法,其中所述分区方案包括预定义的分区方案以及自定义的分区方案。
<Claim>9.根据权利要求1至3中的任一项所述的方法,其中描述所述数据库的数据文件是数据库实例和/或纯文本文件。
<Claim>10.根据权利要求1至3中的任一项所述的方法,还包括:调整所述分区方案的设置以获得新的分区方案。
11.一种用于评估数据库的分区方案的装置,包括:
加载装置,配置用于加载描述所述数据库的数据文件以及定义针对所述数据库执行的操作的工作负载;
解译装置,配置用于解译所述数据库的分区方案以形成分区信息;
执行装置,配置用于基于所述分区信息,对所述数据库执行所述工作负载中定义的至少一部分操作以获得统计日志;以及
评估装置,配置用于基于所述统计日志,根据评估标准来评估所述分区方案。
12.根据权利要求11所述的装置,其中所述分区信息至少包括:分区键、查表以及系统配置。
13.根据权利要求11所述的装置,其中还包括:压缩装置,配置用于针对所述数据文件和/或所述工作负载进行压缩。
<Claim>14.根据权利要求11至13中的任一项所述的装置,其中所述执行装置包括以下至少一项:实际执行装置以及模拟执行装置。
15.根据权利要求14所述的装置,其中所述实际执行装置包括:
部署装置,配置用于将所述数据库部署至分区节点;
路由装置,配置用于将所述工作负载中的操作路由至相应的分区节点并执行;以及
记录装置,配置用于在执行期间记录所述统计日志。
16.根据权利要求14所述的装置,其中所述模拟执行装置包括:
构建装置,配置用于基于所述数据库和所述分区信息,构建按照所述分区方案进行分区后的数据库的伪表;以及
获得装置,配置用于基于所述伪表执行所述工作负载中的操作以获得所述统计日志。
<Claim>17.根据权利要求11至13中的任一项所述的装置,其中所述评估标准包括以下至少一项:数据分布、工作负载分布、分布式事务的数量以及重分区数据迁移、执行时间、响应时间、单位时间内执行的工作负载。
<Claim>18.根据权利要求11至13中的任一项所述的装置,其中所述分区方案包括预定义的分区方案以及自定义的分区方案。
<Claim>19.根据权利要求11至13中的任一项所述的装置,其中描述所述数据库的数据文件是数据库实例和/或纯文本文件。
<Claim>20.根据权利要求11至13中的任一项所述的装置,还包括:调整装置,配置用于调整所述分区方案的设置以获得新的分区方案。
21.一种具有可执行计算机程序代码指令的计算机可读存储介质,当由数据处理装置执行时,所述可执行计算机程序代码指令使得所述数据处理装置执行根据权利要求1至10中的任一项所述的方法。
说  明  书
技术领域   
本发明的各实施方式涉及数据库系统,更具体地,涉及用于评估数据库的分区方案的方法、装置和相关计算机程序产品。
背景技术   
计算机技术的发展为人们的工作和生活提供了诸多便利,越来越多的数据采用数字化方式在数据库中存储和管理。在提供方便的同时,长期以来如何以更有效的方式存储和管理这些数
据一直是数据库领域的研究重点。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。