近似查询mysql_近似查询处理简介
什么是近似查询处理?
近似查询处理,英⽂全称Approximate Query Processing,是针对SQL聚集查询结果进⾏估计的技术。举⼀个简单的例⼦,假设我们要查询数据库中表A的某⼀列a的均值,则SQL语句如下:
SELECT AVG(A.a) FROM A
如果数据库所存放的数据的数量⼗分庞⼤,要完成完整查询,则会需要花费较长的时间。如果我们使⽤近似查询技术,就可以以采样的⽅式,对均值的结果进⾏估计,以⼀定的精度损失,快速的获取对精确值的估计。这在某些场景下,会有⼀定的应⽤。不⽌是
COUNT,SUM,AVG等常⽤的聚集估计⽅法都可以得到⽀持。除了简单的查询之外,近似查询还可以处理关联查询(join),嵌套查询,范围查询等复杂查询场景。
近似查询处理主要关注点有两个⽅⾯:
如何在庞⼤的数据中获取样本
如何根据样本选择合适的样本估计技术
在这个专题中,我将针对近似查询处理的学术论⽂,对近似查询处理技术进⾏⼀个完整的总结,同时也会对数据库技术。在专题中,涉及到的论⽂是在SIGMOD2017数据库国际顶级会议上发表的⼀个keynote演讲⽂章总结的,该keynote的名字是Approxiamte query processing:No silver bullet。这篇⽂章是你对近似查询处理技术的⼀篇综述性⽂章,涉及⾯很⼴。,这个链接是微软提供了⽂章下载地址,因为keynote演讲者是微软研究⼈员Surajit Chaudhuri,其是近似查询技术的主要推动者,感兴趣的读者可以去先读⼀下这篇⽂章。此外,另外⼀⽚发表在springer上的综述论⽂,也对近似查询技术进⾏⼀定的总结,名字是:Approximate Query Processing: What is New and Where to Go?。在以上两篇⽂章中,还提到了在2017年之前发表的⼀些关于近似查询技术的综述性⽂章。阅读这些⽂章,有助于了解这项技术的始末。
在接下来的⽂章中,我会⾸先切⼊近似查询处理的第⼀篇⽂章:Random samping from database,这是⼀篇发表在80年代的博⼠论⽂,⾸次系统的介绍了这⼀个⽅法。
>mysql下载完如何使用

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。