MongoTemplate聚合操作
Aggregation简单来说,就是提供数据统计、分析、分类的⽅法,这与mapreduce有异曲同⼯之处,只不过mongodb做了更多的封装与优化,让数据操作更加便捷和易⽤。Aggregation操作,接收指定collection的数据集,通过计算后返回result数据;⼀个aggregation操作,从input源数据到output结果数据,中间会依次经过多个stages,整体⽽⾔就是⼀个pipeline;⽬前有10种stages,我们稍后介绍;它还提供了丰富的Expression(表达式)来辅助计算。
聚合管道是⼀个基于数据处理管道概念的框架。通过使⽤⼀个多阶段的管道,将⼀组⽂档转换为最终的聚合结果。
管道的概念
管道在Unix和Linux中⼀般⽤于将当前命令的输出结果作为下⼀个命令的参数。
MongoDB的聚合管道将MongoDB⽂档在⼀个管道处理完毕后将结果传递给下⼀个管道处理。管道操作是可以重复的。
表达式:处理输⼊⽂档并输出。表达式是⽆状态的,只能⽤于计算当前聚合管道的⽂档,不能处理其它的⽂档。
语法:
pipeline Array
语法⽰例:
db.school.aggregate(
[
{$match:{time:{$gt:1513612800}}},
{$group:{_id:{insituteName:"$institute",class:"$name"},count:{$sum:1}}},
{$sort:{count:-1}},
{$limit:10}]
)
这⾥我们介绍⼀下聚合框架中常⽤的⼏个操作:
:修改输⼊⽂档的结构。可以⽤来重命名、增加或删除域,也可以⽤于创建计算结果以及嵌套⽂档。
:⽤于过滤数据,只输出符合条件的⽂档。$match使⽤MongoDB的标准查询操作,放在group前相当于where使⽤,放在group后⾯相当于having使⽤
:排序,1升、-1降。sort⼀般放在group后,也就是说得到结果后再排序,如果先排序再分组没什么意义;
:⽤来限制MongoDB聚合管道返回的⽂档数。相当于limit m,不能设置偏移量
:聚合管道中跳过指定数量的⽂档,并返回余下的⽂档。跳过第⼏个⽂档
:将⽂档中的某⼀个数组类型字段拆分成多条,每条包含数组中的⼀个值。
:将集合中的⽂档分组,可⽤于统计结果。其中_id固定写法:
{ _id: <expression>, <field1>: { <accumulator1> : <expression1> }, ...
按什么字段分组,注意所有字段名前⾯都要加$,否则mongodb就为以为不加$的是普通常量,其中ac
cumulator⼜包括以下⼏个操作符:$sum,$avg,$first,$last,$max,$min,$push,$addToSet
如果按照多个字段分组,则字段必须都在_id对象中,可以取别名,例如上⾯⽰例,输出结果为:
{ "_id" : { "insituteName" : "数学系",class: "⼀班"}, "count" : 200 }
{ "_id" : { "insituteName" : "英语系",class: "⼆班" }, "count" : 201 }
如果按照⼀个字段分组,则可以写为{$group:{_id:"$institute",count:{$sum:1}}},此时,查询结果为:
{ "_id" : "数学系", "count" : 1000 }
{ "_id" : "英语系", "count" : 800 }
若没有分组字段,则{$group:{_id:null,count:{$sum:1}}}。即:如果group by null就是 count(*)的效果
:取某⼀点的最近或最远,在LBS地理位置中有⽤
:把结果写进新的集合中。注意1,不能写进⼀个分⽚集合中。注意2,不能写进
count:{$sum:1},1表⽰统计查询结果数量,如果想统计time字段和则使⽤ count:{$sum:"$time"}。
聚合函数有:min,max,sum,avg
下表展⽰了⼀些聚合的表达式:
表达式描述实例
$sum计算总和。db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
$avg计算平均值db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$min获取集合中所有⽂档对应值得最⼩值。db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min :
"$likes"}}}])
$max获取集合中所有⽂档对应值得最⼤值。db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$push在结果⽂档中插⼊值到⼀个数组中。db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}]) $addToSet在结果⽂档中插⼊值到⼀个数组中,但不创建副
本。
mysql操作官方文档db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}]) $first根据资源⽂档的排序获取第⼀个⽂档数据。db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}]) $last根据资源⽂档的排序获取最后⼀个⽂档数据db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])
Aggregation agg = wAggregation(
Aggregation.match(criteria),//条件
Aggregation.sort(sort),//排序
Aggregation.FirstResult()),//过滤
Aggregation.limit(pageSize)//页数
);
AggregationResults<Test> outputType=mongoTemplate.aggregate(agg,"test",Test.class);
List<Test> MappedResults();
⽰例:
上⾯是mysql的,下⾯是mongoTemplate的代码:
mongoTemplate的代码:
Aggregation aggregation = wAggregation(
Aggregation.match(Criteria.where("agent_id").AgentId()).and("order_status").is(9)),
count().as("totalCount").sum("amount").as("totalAmount").sum("agent_redeem_fee").as("agentFee")
).wAggregationOptions().allowDiskUse(true).build());
AggregationResults<BasicDBObject> outputTypeCount = moneySupportOrderDao.aggregate(aggregation, BasicDBObject.class);
参考:《》
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论