(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
(10)申请公布号 CN 105279171 A (43)申请公布日 2016.01.27 | ||
(21)申请号 CN201410301261.7
(22)申请日 2014.06.27
(71)申请人 国际商业机器公司
地址 字符串常量占几个字符美国纽约阿芒克
(72)发明人 陈星 刘少蓉
(74)专利代理机构 北京市柳沈律师事务所
代理人 胡琪
(51)Int.CI
G06F17/30
G06F17/27
权利要求说明书 说明书 幅图 |
(54)发明名称
在压缩的可变长度字符串上进行谓词评估的方法和设备 | |
(57)摘要
公开了一种在压缩的可变长度字符串上进行谓词评估的方法和设备。所述方法包括:确定谓词的假阳性范围的上下界,所述假阳性范围是所述谓词评估的结果可能产生假阳性错误的范围;对所述假阳性范围的上下界进行压缩编码;将所述压缩的可变长度字符串与压缩编码后的假阳性范围的上下界进行第一比较;以及至少根据第一比较的结果确定谓词评估的结果。该方法充分利用了在压缩数据上进行谓词评估的性能优势,提高了查询处理的性能。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
权 利 要 求 说 明 书
1.一种在压缩的可变长度字符串上进行谓词评估的方法,包括:
确定谓词的假阳性范围的上下界,所述假阳性范围是所述谓词评估的结果 可能产生假阳性错误的范围;
对所述假阳性范围的上下界进行压缩编码;
将所述压缩的可变长度字符串与压缩编码后的假阳性范围的上下界进行第 一比较;以及
至少根据第一比较的结果确定谓词评估的结果。
2.如权利要求1所述的进行谓词评估的方法,所述至少根据第一比较的结 果确定谓词评估的结果进一步包括:
响应于所述压缩的可变长度字符串在由所述压缩编码后的假阳性范围的上 下界限定的范围内,确定谓词评估的结果为真。
3.如权利要求1所述的进行谓词评估的方法,还包括:
确定所述谓词的假阴性范围的上下界,所述假阴性范围是所述谓词评估的 结果可能产生假阴性错误的范围;
对所述假阴性范围的上下界进行压缩编码;以及
将所述压缩的可变长度字符串与压缩编码后的假阴性范围的上下界进行第 二比较,
其中所述至少根据第一比较的结果确定谓词评估的结果包括根据第一比较 的结果和第二比较的结果确定谓词评估的结果。
4.如权利要求3所述的进行谓词评估的方法,所述根据第一比较的结果和 第二比较的结果确定谓词评估的结果进一步包括:
响应于所述压缩的可变长度字符串在由压缩编码后的假阳性范围的上下界 限定的范围内,确定第一评估结果为真,否则确定第一评估结果为假;
响应于所述压缩的可变长度字符串在由压缩编码后的假阴性范围的上下界 限定的范围内,确定第二评估结果为真,否则确定第二评估结果为假;
响应于第一评估结果和第二评估结果一致,确定谓词评估的结果为该第一 评估结果。
5.如权利要求4所述的进行谓词评估的方法,所述根据第一比较的结果和 第二比较的结果确定谓词评估的结果进一步包括:
响应于第一评估结果和第二评估结果不一致,解压缩所述压缩的可变长度 字符串,并对该解压缩的可变长度字符串进行谓词评估以得到谓词评估的结果。
6.如权利要求1-5中任一项所述的进行谓词评估的方法,所述假阳性错误 是在谓词评估的正确结果为假的情况下错误地确定结果为真的错误,所述假阴 性错误是在谓词评估的正确结果为真的情况下错误地确定结果为假的错误。
7.如权利要求1-5中任一项所述的进行谓词评估的方法,其中在尾部空格 不敏感语义下进行该谓词评估。
8.如权利要求1-5中任一项所述的进行谓词评估的方法,其中所述压缩的 可变长度字符串是利用使得压缩编码后的数据的顺序与尾部空格敏感语义下的 顺序一致的压缩编码方法得到的。
9.如权利要求7所述的进行谓词评估的方法,其中在所述谓词包含等于运 算符的情况下,假阳性范围的下界为该谓词中的常量字符串中从最高位字符到 第一个小于空格的字符的前一个字符形成的字符串,其上界为在所述常量字符 串最低位字符之后填充空格至等于所述可变长度字符串的设定长度所形成的字 符串;假阴性范围的上下界均是该谓词中的常量字符串自身。
10.如权利要求7所述的进行谓词评估的方法,其中在所述谓词包含大于 运算符的情况下,假阳性范围的下界为该谓词中的常量字符串中从最高位字符 到第一个小于空格的字符的前一个字符形成的字符串,上界为正无穷;假阴性 范围的下界为在所述常量字符串最低位字符之后填充空格至等于所述可变长度 字符串的设定长度所形成的字符串,上界为正无穷。
11.如权利要求7所述的进行谓词评估的方法,其中在所述谓词包含小于 运算符的情况下,假阳性范围的下界为负无穷,上界为在该谓词中的常量字符 串最低位字符后填充空格至等于所述可变长度字符串的设定长度所形成的字符 串;假阴性范围的下界为负无穷,上界为所述常量字符串中从最高位字符到第 一个小于空格的字符的前一个字符形成的字符串。
12.一种在压缩的可变长度字符串上进行谓词评估的设备,包括:
范围确定单元,配置为确定谓词的假阳性范围的上下界,所述假阳性范围 是所述谓词评估的结果可能产生假阳性错误的范围;
编码单元,配置为对所述假阳性范围的上下界进行压缩编码;
比较单元,配置为将所述压缩的可变长度字符串与压缩编码后的假阳性范 围的上下界进行第一比较;以及
结果确定单元,配置为至少根据所述第一比较的结果确定谓词评估的结果。
13.如权利要求12所述的进行谓词评估的设备,其中所述结果确定单元响 应于所述压缩的可变长度字符串在由压缩编码后的假阳性范围的上下界限定的 范围内,确定谓词评估的结果为真。
14.如权利要求12所述的进行谓词评估的设备,其中
所述范围确定单元进一步配置为确定所述谓词的假阴性范围的上下界,所 述假阴性范围是所述谓词评估的结果可能产生假阴性错误的范围;
所述编码单元进一步配置为对所述假阴性范围的上下界进行压缩编码;
所述比较单元进一步配置为将所述压缩的可变长度字符串与压缩编码后的 假阴性范围的上下界进行比较。
15.如权利要求14所述的进行谓词评估的设备,其中所述结果确定单元进 一步包括:
第一子确定单元,配置为响应于所述压缩的可变长度字符串在由所述压缩 编码后的假阳性范围的上下界限定的范围内,确定第一评估结果为真,否则确 定第一评估结果为假;
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论