mongodb聚合的使用

摘要:
聚合:主要用于计算和统计。它类似于sum()avg()db。SQL聚合集({pipeline:{expression}})公共管道:$group:按字段对集合中的文档进行分组$match:筛选数据并输出限定文档$project:修改文档的结构,重命名、添加和删除字段,创建结果,如投影,并指定要显示结果的字段$sort:sort$limit:限制返回的文档数$skip:跳过指定的文档数$unwrind:
聚合:
主要用于计算和统计等,类似sql种的sum() avg()
db.集合.aggregate( { 管道:{表达式} } )

常用的管道:
$group:将集合中的文档按照字段进行分组
$match:过滤数据,输出符合条件的文档
$project:修改文档的结构,重命名、增加、删除字段,创建结果,类似投影,指定字段显示结果
$sort:排序
$limit:限制返回文档条数
$skip:跳过指定数量的文档
$unwind:对列表类型字段内容拆分

常用表达式: $表达式:"$字段"
$sum:计算总数量,$sum:1 代表按照1倍进行统计总数量
$avg:计算平均值
$min:获取最小值
$max:获取最大值
$push:结果文档插入到一个数组给配合分组使用
$first:获取排序后第一个文档数据
$last:获取排序后最后一个文档数据




$group: {_id:"$字段"} 指定字段分组,id为null代表全部数据为一组
例如:统计男生、女生的人数
db.stu.aggregate(
{$group:{
_id:"$gender", //按照gender进行排序
total:{$sum:1} //自己设置一个字段total用于保存统计每个组的人数
// $sum:1 代表按照一倍进行统计总数量
}}
)

_id:null 代表所有数据分为一组
例如: 求总人数和平均年龄
db.stu.aggregate(
{$group:{
_id:null, //整个数据分为一组
total:{$sum:1}, //按照一倍统计总数量
avg_age:{$avg:"$age"} //按照字段年龄求平均数
}}
)



$push: 透视数据,将符合分组条件的字段插入到结果列表当中,"$$ROOT"可以令整个文档插入列表
例如:按照性别统计姓名:
db.stu.aggregate(
{$group:{
_id:"$gender", //按照性别进行分组
names:{$push:"$name"} //将符合分组的name字段值插入 names的列表里
}}
)


例如: 按照性别,统计文档
db.stu.aggregate(
{$group:{
_id:"$gender", //按照性别进行分组
info:{$push:"$$ROOT"} //将符合分组的文档插入到info列表当中
}}
)

$match: 过滤数据,输出符合条件的文档
例如:查询年龄大于20的学生
db.stu.aggregate(
{$match:{age:{$gt:20}}} //年龄大于20
)

例如:查询年龄大于20的男生女生分别的人数。(多个管道进行并列)
db.stu.aggregate(
{$match:{age:{$gt:20}}}, //年龄大于20 筛选出符合条件的数据
{$group:{
_id:"$gender", //按照性别分组
total:{$sum:1} //求出总数量
}}
)

$project: 类似投影,指定字段进行显示结果
例如: 查询学生的姓名、年龄
db.stu.aggregate(
{$project:{
_id:0,
name:1, //指定为1代表显示,指定为0代表不显示
age:1
}}
)

例如:查询男女生,输出人数
db.stu.aggregate(
{$group:{ //按照性别分组后统计人数
_id:"$gender",
total:{$sum:1}
}},
{$project:{
_id:0, //指定只输出总数 不输出_id
total:1
}}
)

$sort: 排序后输出,1为升序 -1为降序
例如: 查询学生信息,按年龄升序
db.stu.aggregate(
{$sort:{age:1}}
)

例如: 查询男女生的人数并按人数降序
db.stu.aggregate(
{$group:{ //按年龄排序求出总人数
_id:"$gender",
total:{$sum:1}
}},
{$sort:{total:-1}} //按照total的降序排列
)

$skip和$limit:
$skip:num 越过前num条文档
$limit:num 显示num条文档
先skip再limit实现分页的功能

例如:查询3到7条(略过前2条,查询5条)
db.stu.aggregate(
{$skip:2},
{$limit:5}
)

$unwind:对文档中包含列表类型按照列表内元素个数数据进行拆分成多条
构造数据:db.t2.insert({_id:1,item:'t-shirt',size:['S','M','L']})
拆分: db.t2.aggregate( {$unwind:"$size"} )
结果: { "_id" : 1, "item" : "t-shirt", "size" : "S" }
{ "_id" : 1, "item" : "t-shirt", "size" : "M" }
{ "_id" : 1, "item" : "t-shirt", "size" : "L" }

处理空数组、非数组、无字段、null情况:(按如上操作会丢失查询结果)
需要指定preserveNullAndEmptyArrays: true代表保留空文档,false代表不保留空文档
构造数据:db.t3.insert([
{ "_id" : 1, "item" : "a", "size": [ "S", "M", "L"] },
{ "_id" : 2, "item" : "b", "size" : [ ] },
{ "_id" : 3, "item" : "c", "size": "M" },
{ "_id" : 4, "item" : "d" },
{ "_id" : 5, "item" : "e", "size" : null }
])
丢数据的拆分: db.t3.aggregate({ $unwind:"$size" })
空的size仍然保留信息: db.t3.aggregate({ $unwind:"$size",preserveNullAndEmptyArrays:true })

免责声明:文章转载自《mongodb聚合的使用》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇开源文字识别软件tesseractDocker之Dockfile下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

mongodb创建用户密码

自从接手这个项目以来,真的被坑惨了。测试服的mongodb经常被删,原因是没有设置账户密码,相应的端口也没有限。只要知道连接地址谁都可以删库。这要归功于mongodb的默认机制。就这样竟然度过了两年多,我一来就特么删库。 以mongo3.4.24为例,首先在mongo.conf中开启认证。还没创建用户密码的可以创建用户了再开启。 security:...

windows 安装mongodb

1.mongodb官网下载:http://www.mongodb.org/downloads 2.将下载的mongodb压缩包解压到对应文件夹,我的是:D:pcmongodb,请注意,我的bin目录是:D:pcmongodbin,注意自己的bin目录是否和我的相同 3.用管理员权限打开cmd,进入到mongodb安装的文件夹,cd D:pcmongodbi...

MongoDB Python官方驱动 PyMongo 的简单封装

最近,需要使用 Python 对 MongodB 做一些简单的操作,不想使用各种繁重的框架。出于可重用性的考虑,想对 MongoDB Python 官方驱动 PyMongo 做下简单封装,百度一如既往的未能给我一个满意的结果,于是有了下文。 【正文】 PyMongo,MongoDB Python官方驱动 docs: https://api.mongo...

Mongodb学习笔记五(C#操作mongodb)

mongodb c# driver(驱动)介绍 目前基于C#的mongodb驱动有两种,分别是官方驱动(下载地址)和samus驱动(下载地址)。本次我们只演示官方驱动的使用方法。官方驱动文档查看 第一步:引用驱动dll 引用驱动有两种方式:1. 根据上面的下载地址下载对应的版本,然后引用到项目中。2. 在项目的引用上右击->管理NuGet程序包(首先...

浅尝key-value数据库(二)——MongoDB的优与劣

浅尝key-value数据库(二)——MongoDB的优与劣 MongoDB的名字取自英文单词"humongous"的中间五个字母,是一个C++开发的基于分布式文件存储的数据库开源项目。他的文件存储格式是BSON(Binary JSON),因此可以高效存储二进制数据,例如图像、视频等大对象。 由于我是CentOS x86_64的系统,于是安装MongoD...

[轉]redis;mongodb;memcache三者的性能比較

先说我自己用的情况: 最先用的memcache ,用于键值对关系的服务器端缓存,用于存储一些常用的不是很大,但需要快速反应的数据 然后,在另一个地方,要用到redis,然后就去研究了下redis. 一看,显示自己安装了php扩展,因为有服务器上的redis服务端,自己本地就没有安装,其实用法和memcache基本一样,可能就是几个参数有所不 同。当然 它们...