• 尚医通 (二十三) --------- MongoDB 入门



    一、常用操作

    1. insert

    > db.User.save({name:'zhangsan',age:21,sex:true})
    > db.User.find()
    {"_id": Objectld("4f69e680c9106ee2ec95da66"), "name": "zhangsan", "age": 21, "sex": true}
    
    • 1
    • 2
    • 3

    _id 组合:

    Objectld 是 _id 的默认类型。Objectld 使用 12 字节的存储空间,每个字节二位十六进制数字, 是一个 24 位的字符串。

    • 时间戳:时间不断变化的
    • 机器:主机的唯一标识码。通常是机器主机名的散列值,这样可以确保不同主机生成不同的 Objectld,不产生冲突。
    • PID:为了确保在同一台机器上并发的多个进程产生的 Objectld 是唯一的,所以加上进程标识符(PID)。
    • 计数器:前9个字节保证了同一秒钟不同机器不同进程产生的 Objectld 是唯一的。 后3个字节就是一个自动增加的计数器,确保相同进程同一秒产生的 Objectld 也是不一样。同一秒最多允许每个进程拥有 IS 7772 托个不同的 Objectld。

    2. query

    A、where

    # select * from User where name = 'zhangsan'
    > db.User.find({name:"zhangsan"})
    
    • 1
    • 2

    B、field

    # select name, age from User where age = 21
    > db.User.find({age:21}, {'name':1, 'age':1})
    
    • 1
    • 2

    C、sort

    在 MongoDB 中使用 sort() 方法对数据进行排序,sort() 方法可以通过参数指定排序的字段,并使用 1 和 -1 来指定排序的方式,其中 1 为升序排列,而 -1 是用于降序排列。

    # select * from User order by age
    > db.User.find().sort({age:1})
    
    • 1
    • 2

    D、limit、skip

    在 MongoDB 中使用 limit() 方法来读取指定数量的数据,skip() 方法来跳过指定数量的数据

    # select * from User skip 2 limit 3
    > db.User.find().skip(0).limit(3)
    
    • 1
    • 2

    E、in

    # select * from User where age in (21, 26, 32)
    > db.User.find({age:{$in:[21,26,32]}})
    
    • 1
    • 2

    F、count

    # select count(*) from User where age >20
    > db.User.find({age:{$gt:20}}).count()
    
    • 1
    • 2

    G、or

    # select * from User where age = 21 or age = 28
    > db.User.find({$or:[{age:21}, {age:28}]})
    
    • 1
    • 2

    3. update

    可直接用类似 T-SQL 条件表达式更新,或用 Save 更新从数据库返回到文档对象。

    # update Userset age = 100, sex = 0 where name = 'user1'
    > db.User.update({name:"zhangsan"}, {$set:{age:100, sex:0}})
    
    • 1
    • 2

    update()有几个参数需要注意。

    db.collection.update(criteria, objNew, upsert, mult)
    
    • 1
    • criteria:需要更新的条件表达式
    • objNew:更新表达式
    • upsert:如FI标记录不存在,是否插入新文档。
    • multi:是否更新多个文档。

    4. remove

    remove 用于删除单个或全部文档,删除后的文档无法恢复。

    > db.User.remove(id)
    //移除对应id的行
    > db.User.remove({})
    //移除所有
    
    • 1
    • 2
    • 3
    • 4

    5. aggregate

    MongoDB 中聚合 (aggregate)主要用于处理数据 (诸如统计平均值,求和等),并返回计算后的数据结果。有点类似 sql 语句中的 count(*)

    A、插入数据

    >db.article.insert({
        title: 'MongoDB Overview', 
       description: 'MongoDB is no sql database',
       by_user: 'runoob.com',
       url: 'http://www.runoob.com',
       tags: ['mongodb', 'database', 'NoSQL'],
       likes: 100
    })
    >db.article.insert({
       title: 'NoSQL Overview', 
       description: 'No sql database is very fast',
       by_user: 'runoob.com',
       url: 'http://www.runoob.com',
       tags: ['mongodb', 'database', 'NoSQL'],
       likes: 10
    })
    >db.article.insert({
       title: 'Neo4j Overview', 
       description: 'Neo4j is no sql database',
       by_user: 'Neo4j',
       url: 'http://www.neo4j.com',
       tags: ['neo4j', 'database', 'NoSQL'],
       likes: 750
    })
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24

    B、统计 sum

    现在我们通过以上集合计算每个作者所写的文章数

    # select by_user, count(*) from article group by by_user
    > db.article.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}])
    {
    	"result" : [
    		{
    			"_id" : "runoob.com",
    			"num_tutorial" : 2
    		},
    		{
    			"_id" : "Neo4j",
    			"num_tutorial" : 1
    		}
    	],
    	"ok" : 1
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    在上面的例子中,我们通过字段 by_user 字段对数据进行分组,并计算 by_user 字段相同值的总和。

    C、常见的聚合表达式

    表达式描述实例
    $sum计算总和db.mycol.aggregate([{KaTeX parse error: Expected '}', got 'EOF' at end of input: …roup : {_id : "by_user", num_tutorial : { s u m : " sum : " sum:"likes"}}}])
    $avg计算平均值db.mycol.aggregate([{KaTeX parse error: Expected '}', got 'EOF' at end of input: …roup : {_id : "by_user", num_tutorial : { a v g : " avg : " avg:"likes"}}}])
    $min获取集合中所有文档对应值得最小值db.mycol.aggregate([{KaTeX parse error: Expected '}', got 'EOF' at end of input: …roup : {_id : "by_user", num_tutorial : { m i n : " min : " min:"likes"}}}])
    $max获取集合中所有文档对应值得最大值db.mycol.aggregate([{KaTeX parse error: Expected '}', got 'EOF' at end of input: …roup : {_id : "by_user", num_tutorial : { m a x : " max : " max:"likes"}}}])
    $push在结果文档中插入值到一个数组中db.mycol.aggregate([{KaTeX parse error: Expected '}', got 'EOF' at end of input: …roup : {_id : "by_user", url : { p u s h : " push: " push:"url"}}}])
    $addToSet在结果文档中插入值到一个数组中,但不创建副本db.mycol.aggregate([{KaTeX parse error: Expected '}', got 'EOF' at end of input: …roup : {_id : "by_user", url : { a d d T o S e t : " addToSet : " addToSet:"url"}}}])
    $first根据资源文档的排序获取第一个文档数据db.mycol.aggregate([{KaTeX parse error: Expected '}', got 'EOF' at end of input: …roup : {_id : "by_user", first_url : { f i r s t : " first : " first:"url"}}}])
    $last根据资源文档的排序获取最后一个文档数据db.mycol.aggregate([{KaTeX parse error: Expected '}', got 'EOF' at end of input: …roup : {_id : "by_user", last_url : { l a s t : " last : " last:"url"}}}])

    二、索引

    索引通常能够极大的提高查询的效率,如果没有索引,MongoDB 在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录。

    这种扫描全集合的查询效率是非常低的,特别在处理大量的数据时,查询可以要花费几十秒甚至几分钟,这对网站的性能是非常致命的。

    索引是特殊的数据结构,索引存储在一个易于遍历读取的数据集合中,索引是对数据库表中一列或多列的值进行排序的一种结构。

    >db.User.createIndex({"name":1})
    
    • 1

    语法中 name 值为你要创建的索引字段,1 为指定按升序创建索引,如果你想按降序来创建索引指定为 -1 即可。

  • 相关阅读:
    何为整型提升(实例)
    丝丝入扣,毫不违和,AI一键换脸和微调,基于Rope-Ruby,2024最新整合包
    Jupyter部署和使用教程
    WebStorm 2024.1.1 JavaScript集成开发环境 mac/win
    学习Java8 Stream流,让我们更加便捷的操纵集合
    【分布式】NCCL部署与测试 - 01
    英语——分享篇——每日200词——2601-2800
    Stm32_标准库_5_呼吸灯_按键控制
    lua协程
    JavaEE中进程、线程的知识点
  • 原文地址:https://blog.csdn.net/m0_51111980/article/details/127901331