• Mongo聚合分析命令浅析


    在很多时候,我们需要临时统计下数据库中的数据,一般的做法是写一个脚本,通过代码来统计分析。
    在mongo中,其实可以直接使用命令就可以实现,主要得益于其非常强大的统计命令支撑。

    下面通过一个例子来看下mongo中强大的统计分析命令。

    有这样一个集合,test集合字段示例如下:

    1. cmgo-dho4eog7_0:PRIMARY> db.resource_f57ddf3fa743426b93cd6390e748699b.findOne({})
    2. {
    3.         "_id" : NumberLong(688),
    4.         "created_at" : ISODate("2022-10-27T12:42:39.256Z"),
    5.         "updated_at" : ISODate("2023-07-13T04:55:38.060Z"),
    6.         "deleted_at" : ISODate("0001-01-01T00:00:00Z"),
    7.         "deleted" : false,
    8.         "name" : "",
    9.         "labels" : {
    10.         },
    11.         "properties" : {
    12.                 "disk" : 550,
    13.                 "mem" : 16,
    14.                 "tag" : "DAILY_BUILD_COMMON",
    15.                 "ip" : "x.x.x.x",
    16.                 "monitorItem" : "all",
    17.                 "password" : "xxx",
    18.                 "assetId" : "xxxxx",
    19.                 "rackId" : 265093,
    20.                 "cabinet" : "G160501-C03",
    21.                 "serverOperator" : "hobohuang",
    22.                 "cpu" : 12,
    23.                 "idcName" : "xxxxx",
    24.                 "cmdbModuleId" : 1604826,
    25.                 "osVersion" : ""
    26.         },
    27.         "creator" : "xxx",
    28.         "editor" : "xxx",
    29.         "status" : 3,
    30.         "project_id" : "7879",
    31.         "res_def_id" : NumberLong(2),
    32.         "group" : "IDLE",
    33.         "description" : "",
    34.         "tags" : [
    35.                 ""
    36.         ],
    37.         "message" : "",
    38.         "type" : 1,
    39.         "external_props" : null,
    40.         "source" : 0
    41. }

    现在要统计test集合properties中的cpu总和,如果cpu没空,则默认为2,命令如下:

    1. cmgo-dho4eog7_0:PRIMARY> db.test.aggregate([{$project: {"cpu": {"$ifNull": ["$properties.cpu", 2]}}}, {$group: {_id: "cpu", total: {$sum: "$cpu"}}}])
    2. { "_id" : "cpu", "total" : 3479 }

    下面来解释下这个命令的含义

    1. db.test.aggregate()
      表示对test集合进行聚合操作,聚合操作就是通过aggregate()函数来完成一系列的聚合查询,主要用于处理如:统计,平均值,求和等,并返回计算后的结果。
      表达式:db.collection. aggregate(pipeline,options)

    2. $project
      aggregate的管道命令,表示对集合中的字段值进行预处理并返回指定key及其值。
      在这个例子中,就表示对properties中的cpu进行预处理,判断是否null,如果null则设置为2,并且将字段properties的cpu整体替换为cpu属性,用于后面其他管道读取。

    3. $ifNull
      表达式:[ expression, replacement-expression-if-null ] ,用于判断第一个表达式是否为 null,如果为 null 则返回第二个参数的值,如果不为 null 则返回第一个参数的值。

    4. $group
      aggregate的管道命令,表示对集合数据进行分组统计,这里一定要有一个_id:key作为分组的表示,比如集合中有一个字段为user,那么就表示以user分组统计。
      但是对于不想分组统计,想要统计整个集合怎么办呢?
      那么就直接定义一个集合不存在的字段即可,比如这里的例子_id: "cpu"就是随便取得一个名字。

    5. $sum
      表示对指定字段求和,这里就是对前面$project管道返回的cpu字段进行求和

    上面的$project和$group都是appreciate中的pipeline,也就是聚合操作中的管道命令,

    管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。

    MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。下面是一些常见的命令:

    • $project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。

    • :用于过滤数据,只输出符合条件的文档。����ℎ:用于过滤数据,只输出符合条件的文档。match使用MongoDB的标准查询操作。

    • $limit:用来限制MongoDB聚合管道返回的文档数。

    • $skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。

    • $unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。

    • $group:将集合中的文档分组,可用于统计结果。

    • $sort:将输入文档排序后输出。

    • $geoNear:输出接近某一地理位置的有序文档。

    更多管道命令可以查看mongo的官方文档:
    https://www.mongodb.com/docs/manual/reference/operator/aggregation-pipeline/

  • 相关阅读:
    Spring整合tomcat的WebSocket详细逻辑(图解)
    【第3章】MyBatis-Plus持久层接口之Service Interface(上)
    【redis】--springboot集成redisson
    AI制药,噱头还是未来?
    Android studio配置Flutter开发环境报错问题解决
    删除Github仓库中的指定的文件或文件夹
    leetcode做题笔记165. 比较版本号
    洛谷 P4720 【模板】扩展卢卡斯定理/exLucas
    leetcode 第 361 场周赛
    今年上半年,我国公路建设总体形势持续向好
  • 原文地址:https://blog.csdn.net/m0_47495420/article/details/133223872