• python数据库——Mongodb


    一、Mongodb简介

    MongoDB 是一个开源的 NoSQL数据库系统,它是一个面向文档的数据库,使用 JSON 格式来存储和查询数据。MongoDB 是一个非关系型数据库,它的设计目标是以高性能、高可用性和可扩展性为特点,适用于处理大量的非结构化数据。

    特点:

    • MongoDB 是一个面向文档存储的数据库,操作起来比较简单和容易。
    • 你可以在MongoDB记录中设置任何属性的索引 (如:FirstName="Sameer",Address="8 Gandhi Road")来实现更快的排序。
    • 你可以通过本地或者网络创建数据镜像,这使得MongoDB有更强的扩展性。
    • 如果负载的增加(需要更多的存储空间和更强的处理能力) ,它可以分布在计算机网络中的其他节点上这就是所谓的分片。
    • Mongo支持丰富的查询表达式。查询指令使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组。
    • MongoDb 使用update()命令可以实现替换完成的文档(数据)或者一些指定的数据字段 。
    • Mongodb中的Map/reduce主要是用来对数据进行批量处理和聚合操作。
    • Map和Reduce。Map函数调用emit(key,value)遍历集合中所有的记录,将key与value传给Reduce函数进行处理。
    • Map函数和Reduce函数是使用Javascript编写的,并可以通过db.runCommand或mapreduce命令来执行MapReduce操作。
    • GridFS是MongoDB中的一个内置功能,可以用于存放大量小文件。
    • MongoDB允许在服务端执行脚本,可以用Javascript编写某个函数,直接在服务端执行,也可以把函数的定义存储在服务端,下次直接调用即可。
    • MongoDB支持各种编程语言:RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。
    • MongoDB安装简单。

    附:数据存储形式(json)

    JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式,常用于前后端数据传输和存储。它使用键值对的方式来表示数据,数据类型包括字符串、数字、布尔值、数组、对象等。

    1. {
    2. "_id": ObjectId("5f8d5d7634f4a71e4c2e6a1a"),
    3. "name": "John Doe",
    4. "age": 30,
    5. "email": "johndoe@example.com",
    6. "address": {
    7. "street": "123 Main St",
    8. "city": "New York",
    9. "state": "NY",
    10. "zip": "10001"
    11. },
    12. "interests": ["sports", "music", "reading"],
    13. "created_at": ISODate("2021-01-01T10:30:00Z")
    14. }

    在这个例子中,我们有一个名为"users"的集合,其中包含一个文档。文档有多个字段,包括_id、name、age、email、address、interests和created_at。

    _id字段是一个唯一的主键,用于标识文档。它是一个ObjectId类型的值。

    其他字段包含不同类型的数据。例如,name字段是一个字符串,age字段是一个整数,email字段是一个字符串,address字段是一个嵌入文档,interests字段是一个数组,created_at字段是一个日期。

    附:json与python中的数据字典

    在上述例子中,我们不难发现json的格式与数据字典高度相似,因为它们都采用了键值对的形式来表示数据。

    以下是一些导致JSON格式和数据字典相似的原因:

    1. 键值对表示:JSON和数据字典都使用键值对的形式来表示数据。键用于标识字段或属性的名称,值则表示对应的数据。

    2. 嵌套结构:JSON和数据字典都支持嵌套结构,可以在一个字段的值中包含另一个键值对集合,形成层级结构。

    3. 多种数据类型:JSON和数据字典都支持多种数据类型,包括字符串、数字、布尔值、数组和嵌套对象等。

    4. 可读性:JSON和数据字典都以人类可读的格式表示数据,易于理解和解析。

    主要存在的区别:

    1. 数据表示方式:JSON是一种数据交换格式,用于在不同系统之间传输和存储数据。它使用键值对的形式表示数据,并支持多种数据类型。数据字典是一种文档或定义,用于描述数据的结构和含义,通常用于数据建模、数据管理和文档化数据。

    2. 用途和背景:JSON主要用于数据交换和存储,特别是在Web应用程序之间传输数据。它是一种轻量级的格式,易于解析和处理。数据字典主要用于描述数据的结构、含义和元数据。它可以用于数据管理、数据文档化、数据查询等方面。

    3. 基于标准:JSON是一种开放标准,由ECMA国际组织(ECMA-404标准)和RFC 7159定义。它具有通用性和跨平台的优势。数据字典没有一个特定的标准,通常是由组织或个人定义的,可以根据需求进行定制和扩展。

    4. 应用范围:JSON广泛用于前后端数据传输、API交互、配置文件等领域。数据字典主要用于数据建模、数据管理、数据文档化等领域,通常与数据库和数据管理工具配合使用。

    二、pymongo库

    pymongo为python提供了丰富的操作mongodb数据库的方法,我们可以通过pymongo库中的函数方便地连接到mongodb数据库,并进行数据操作和查询。

    安装 pymongo

    pip install pymongo

    三、连接到数据库

    1. from pymongo import MongoClient
    2. # 连接到本地MongoDB服务器
    3. client = MongoClient()
    4. # 连接到指定数据库
    5. db = client.mydatabase
    6. # 连接到指定集合(相当于关系型数据库中的表)
    7. collection = db.mycollection

    四、数据操作与查询

    在pymongo库中,用于进行数据操作和查询的一些常用函数包括:

    1. insert_one(): 插入一条数据到集合中。
    2. insert_many(): 插入多条数据到集合中。
    3. find_one(): 查询并返回集合中的第一条数据。
    4. find(): 查询并返回满足条件的所有数据。
    5. update_one(): 更新满足条件的第一条数据。
    6. update_many(): 更新满足条件的所有数据。
    7. delete_one(): 删除满足条件的第一条数据。
    8. delete_many(): 删除满足条件的所有数据。
    9. count_documents(): 统计满足条件的数据数量。
    10. distinct(): 返回满足条件的字段的去重值。
    11. aggregate(): 使用聚合管道进行数据处理和分析。
    12. create_index(): 创建索引以提高查询性能。
    13. drop_index(): 删除索引。
    14. list_indexes(): 列出集合中的所有索引。

    示例:

    1. import pymongo
    2. # 连接MongoDB数据库
    3. client = pymongo.MongoClient("mongodb://localhost:27017/")
    4. db = client["mydatabase"]
    5. # 插入一条数据
    6. collection = db["customers"]
    7. data = { "name": "John", "address": "Highway 37" }
    8. inserted_data = collection.insert_one(data)
    9. print(inserted_data.inserted_id)
    10. # 插入多条数据
    11. data_list = [
    12. { "name": "Amy", "address": "Apple st 652" },
    13. { "name": "Hannah", "address": "Mountain 21" },
    14. { "": "Michael", "address": "Valley 345" },
    15. ]
    16. inserted_data = collection.insert_many(data_list)
    17. print(inserted_data.inserted_ids)
    18. # 查询所有数据
    19. results = collection.find()
    20. for result in results:
    21. print(result)
    22. # 根据条件查询数据
    23. query = { "address": "Mountain 21" }
    24. results = collection.find(query)
    25. for result in results:
    26. print(result)
    27. # 更新一条数据
    28. query = { "address": "Mountain 21" }
    29. new_data = { "$set": { "address": "Canyon 123" } }
    30. collection.update_one(query, new_data)
    31. # 更新多条数据
    32. query = { "address": { "$regex": "^S" } }
    33. new_data = { "$set": { "name": "Minnie" } }
    34. collection.update_many(query, new_data)
    35. # 删除一条数据
    36. query = "address": "Highway 37" }
    37. collection.delete_one(query)
    38. # 删除多条数据
    39. query = { "address": { "$regex": "^S" } }
    40. collection.delete_many(query```

  • 相关阅读:
    flutter系列之:flutter中的变形金刚Transform
    Leetcode刷题——单链表2
    python项目之AI动物识别工具的设计与实现(django)
    (附源码)计算机毕业设计SSM基于的扶贫产品展销平台
    RestClient操作Elasticsearch(Java)
    The Multiversity 的 “非常重要的生命体” NFT 推出
    有依次对应关系的数组X、Y、Z,如何排序其中一个X数组,使得另外的数组还与排序完成后的数组相对应(C语言实现)
    【单片机原理及应用】第一篇——单片机概述
    spark(HA)集群安装
    IOday1
  • 原文地址:https://blog.csdn.net/m0_65995252/article/details/133347834