python数据库——Mongodb

一、Mongodb简介

MongoDB 是一个开源的 NoSQL数据库系统,它是一个面向文档的数据库,使用 JSON 格式来存储和查询数据。MongoDB 是一个非关系型数据库,它的设计目标是以高性能、高可用性和可扩展性为特点,适用于处理大量的非结构化数据。

特点:

  • MongoDB 是一个面向文档存储的数据库,操作起来比较简单和容易。
  • 你可以在MongoDB记录中设置任何属性的索引 (如:FirstName="Sameer",Address="8 Gandhi Road")来实现更快的排序。
  • 你可以通过本地或者网络创建数据镜像,这使得MongoDB有更强的扩展性。
  • 如果负载的增加(需要更多的存储空间和更强的处理能力) ,它可以分布在计算机网络中的其他节点上这就是所谓的分片。
  • Mongo支持丰富的查询表达式。查询指令使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组。
  • MongoDb 使用update()命令可以实现替换完成的文档(数据)或者一些指定的数据字段 。
  • Mongodb中的Map/reduce主要是用来对数据进行批量处理和聚合操作。
  • Map和Reduce。Map函数调用emit(key,value)遍历集合中所有的记录,将key与value传给Reduce函数进行处理。
  • Map函数和Reduce函数是使用Javascript编写的,并可以通过db.runCommand或mapreduce命令来执行MapReduce操作。
  • GridFS是MongoDB中的一个内置功能,可以用于存放大量小文件。
  • MongoDB允许在服务端执行脚本,可以用Javascript编写某个函数,直接在服务端执行,也可以把函数的定义存储在服务端,下次直接调用即可。
  • MongoDB支持各种编程语言:RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。
  • MongoDB安装简单。

附:数据存储形式(json)

JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式,常用于前后端数据传输和存储。它使用键值对的方式来表示数据,数据类型包括字符串、数字、布尔值、数组、对象等。

{
  "_id": ObjectId("5f8d5d7634f4a71e4c2e6a1a"),
  "name": "John Doe",
  "age": 30,
  "email": "[email protected]",
  "address": {
    "street": "123 Main St",
    "city": "New York",
    "state": "NY",
    "zip": "10001"
  },
  "interests": ["sports", "music", "reading"],
  "created_at": ISODate("2021-01-01T10:30:00Z")
}

在这个例子中,我们有一个名为"users"的集合,其中包含一个文档。文档有多个字段,包括_id、name、age、email、address、interests和created_at。

_id字段是一个唯一的主键,用于标识文档。它是一个ObjectId类型的值。

其他字段包含不同类型的数据。例如,name字段是一个字符串,age字段是一个整数,email字段是一个字符串,address字段是一个嵌入文档,interests字段是一个数组,created_at字段是一个日期。

附:json与python中的数据字典

在上述例子中,我们不难发现json的格式与数据字典高度相似,因为它们都采用了键值对的形式来表示数据。

以下是一些导致JSON格式和数据字典相似的原因:

  1. 键值对表示:JSON和数据字典都使用键值对的形式来表示数据。键用于标识字段或属性的名称,值则表示对应的数据。

  2. 嵌套结构:JSON和数据字典都支持嵌套结构,可以在一个字段的值中包含另一个键值对集合,形成层级结构。

  3. 多种数据类型:JSON和数据字典都支持多种数据类型,包括字符串、数字、布尔值、数组和嵌套对象等。

  4. 可读性:JSON和数据字典都以人类可读的格式表示数据,易于理解和解析。

主要存在的区别:

  1. 数据表示方式:JSON是一种数据交换格式,用于在不同系统之间传输和存储数据。它使用键值对的形式表示数据,并支持多种数据类型。数据字典是一种文档或定义,用于描述数据的结构和含义,通常用于数据建模、数据管理和文档化数据。

  2. 用途和背景:JSON主要用于数据交换和存储,特别是在Web应用程序之间传输数据。它是一种轻量级的格式,易于解析和处理。数据字典主要用于描述数据的结构、含义和元数据。它可以用于数据管理、数据文档化、数据查询等方面。

  3. 基于标准:JSON是一种开放标准,由ECMA国际组织(ECMA-404标准)和RFC 7159定义。它具有通用性和跨平台的优势。数据字典没有一个特定的标准,通常是由组织或个人定义的,可以根据需求进行定制和扩展。

  4. 应用范围:JSON广泛用于前后端数据传输、API交互、配置文件等领域。数据字典主要用于数据建模、数据管理、数据文档化等领域,通常与数据库和数据管理工具配合使用。

二、pymongo库

pymongo为python提供了丰富的操作mongodb数据库的方法,我们可以通过pymongo库中的函数方便地连接到mongodb数据库,并进行数据操作和查询。

安装 pymongo

pip install pymongo

三、连接到数据库

from pymongo import MongoClient

# 连接到本地MongoDB服务器
client = MongoClient()

# 连接到指定数据库
db = client.mydatabase

# 连接到指定集合(相当于关系型数据库中的表)
collection = db.mycollection

四、数据操作与查询

在pymongo库中,用于进行数据操作和查询的一些常用函数包括:

  1. insert_one(): 插入一条数据到集合中。
  2. insert_many(): 插入多条数据到集合中。
  3. find_one(): 查询并返回集合中的第一条数据。
  4. find(): 查询并返回满足条件的所有数据。
  5. update_one(): 更新满足条件的第一条数据。
  6. update_many(): 更新满足条件的所有数据。
  7. delete_one(): 删除满足条件的第一条数据。
  8. delete_many(): 删除满足条件的所有数据。
  9. count_documents(): 统计满足条件的数据数量。
  10. distinct(): 返回满足条件的字段的去重值。
  11. aggregate(): 使用聚合管道进行数据处理和分析。
  12. create_index(): 创建索引以提高查询性能。
  13. drop_index(): 删除索引。
  14. list_indexes(): 列出集合中的所有索引。

示例:

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")
db = client["mydatabase"]


# 插入一条数据
collection = db["customers"]
data = { "name": "John", "address": "Highway 37" }
inserted_data = collection.insert_one(data)
print(inserted_data.inserted_id)

# 插入多条数据
data_list = [
  { "name": "Amy", "address": "Apple st 652" },
  { "name": "Hannah", "address": "Mountain 21" },
  { "": "Michael", "address": "Valley 345" },
]
inserted_data = collection.insert_many(data_list)
print(inserted_data.inserted_ids)


# 查询所有数据
results = collection.find()
for result in results:
    print(result)

# 根据条件查询数据
query = { "address": "Mountain 21" }
results = collection.find(query)
for result in results:
    print(result)

# 更新一条数据
query = { "address": "Mountain 21" }
new_data = { "$set": { "address": "Canyon 123" } }
collection.update_one(query, new_data)

# 更新多条数据
query = { "address": { "$regex": "^S" } }
new_data = { "$set": { "name": "Minnie" } }
collection.update_many(query, new_data)

# 删除一条数据
query = "address": "Highway 37" }
collection.delete_one(query)

# 删除多条数据
query = { "address": { "$regex": "^S" } }
collection.delete_many(query```

你可能感兴趣的:(数据库,mongodb)