__Pythoner__

用pymongo对mongoDB增删改查（CRUD）

pymongo操作mongoDB的增删改查 | CRUD

pymongo简介
- 连接本地mongoDB
- - 连接远程MongoDB
- 数据库CRUD
- - 使用现有数据库
  - 增
  - 删
  - 改
  - 查
- 集合CRUD
- - 增
  - 删
  - 改
  - 查
- 文档CRUD
- - 增
  - - 插入一条document
    - 插入多条document
  - 删
  - - 删除一条document
    - 删除多条document
  - 改
  - - replace_one 替换
    - update 更新多条
    - update_one 更新一条
    - 修改器
    - - $set
      - $unset
      - $inc
      - $push $pushAll
      - $addToSet
      - $pull & $pullAll
      - $each
      - $pop
  - 查
  - - 基础用法
    - - find()
      - find_one()
    - 按条件查询
    - - 比较操作符
      - $in和 $nin 操作符
      - $or
      - null 值查询和 $exists 条件判定
      - 查询数组
      - $sort() 排序
      - limit() 限制
      - skip() 跳过
      - where
      - count_documents() 统计文档数据量
      - IOSDate 查询某一段时间的数据
      - 模糊查询
- 索引
- - 增 Create
  - 删 drop_index
  - 改
  - 查 query
- 聚合
- - 聚合管道 aggregation pipline
  - - 聚合管道阶段

环境：python3.6.4，pymongo4.2

pymongo简介

PyMongo是驱动程序，使python程序能够使用Mongodb数据库，使用python编写而成。
mongoDB包含数据库database、集合collection、文档document，接下来也主要对这三个层面上的内容进行增删改查的学习！
【如有不足之处，还望指正】

连接本地mongoDB

# 从pymongo中导入MongoClient
from pymongo import MongoClient

# 实例化
client = MongoClient()

连接远程MongoDB

client=MnogoClient(host="远程服务器地址", post="端口号")

# URI风格连接远程MongoDB
client=MongoClient("mongodb://远程服务器地址:端口号/")

数据库CRUD

使用现有数据库

from pymongo import MongoClient
client = MongoClient()
# 假设已存在名称为 test_database的数据库
test_database = client.test_database   
# 也可以使用访问字典的方式访问数据库
test_database = client['test_database'

 - [ ] List item

]

增

【语法】client.数据库名.集合名(需要插入的数据)

from pymongo import MongoClient
client = MongoClient()
new_db_name = client.new_db_name
new_db_name.new_doc.insert_one({'key1':'value1', 'key2':'value2'})
#  插入数据时，如果数据库（new_db_name）不存在，系统自动创建数据库（new_db_name）

删

【语法】client.drop_database(‘数据库名’)

from pymongo import MongoClient
client = MongoClient()
client.drop_database('new_db_name') 
# 删除现有数据库

改

以下方法是复制一份数据到新的数据库，复制后如不需要老数据库，需删除

use admin  # 需要在命令行下使用该命令
db.runCommand({renameCollection:"数据库名.集合名", to:"改后的数据库名.改后的集合名"})

查

【语法】client.list_database_names()
【栗子】列出当前所有数据库名称

from pymongo import MongoClient
client = MongoClient()
database_names = client.list_database_names()
print(database_names)

集合CRUD

增

【语法】client.数据库名.集合名.insert_one(需要插入的一条BSON类数据)
【栗子】如果mongoDB中不存在集合’collection_name’，系统会自动创建’collection_name’

from pymongo import MongoClient
client = MongoClient()
client.new_db_name.collection_name.insert_one({'key1':'value1'})

删

【语法】client.数据库名.集合名.drop()
【栗子】删除数据库’db_name’中的集合’collection_name’

from pymongo import MongoClient
client = MongoClient()
client.db_name.collection_name.drop()

改

以下方法是复制一份数据到新的文档，复制后如不需要老文档，需删除

use admin  # 需要在命令行下使用该命令
db.runCommand({renameCollection:"数据库名.集合名", to:"数据库名.改后的集合名"})

查

【语法】client.db_name.list_collection_names()
【栗子】

from pymongo import MongoClient
client = MongoClient()
client.db_name.list_collection_names()

文档CRUD

增

插入一条document

【语法】client.数据库名.集合名.insert_one(需要插入的一条BSON类数据)
【栗子】如果mongoDB中不存在集合’collection_name’，系统会自动创建’collection_name’

from pymongo import MongoClient
client = MongoClient()
client.new_db_name.collection_name.insert_one({'key1':'value1'})

插入多条document

【语法】client.数据库名.集合名.insert_many([需要插入的多条BSON类数据])
【栗子】如果mongoDB中不存在集合’collection_name’，系统会自动创建’collection_name’

from pymongo import MongoClient
client = MongoClient()
datas = [
{'key1':'value1'},
{'key2':'value2'},
{'key3':'value3'},
{'key4':'value4'}
]
client.new_db_name.collection_name.insert_many(datas)

删

删除一条document

【语法】client.db_name.collection_name.delete_one({‘key’:‘value’})
【栗子】从数据库‘db_name’的集合‘collection_name’删除第一条匹配{‘name’:‘2222’}的文档‘document’

from pymongo import MongoClient
client = MongoClient()
client.db_name.collection_name.delete_one({'name':'2222'})

删除多条document

【语法】client.db_name.collection_name.delete_many({‘key’:‘value’})
【栗子】从数据库‘db_name’的集合‘collection_name’删除多条匹配{‘name’:‘111’}的文档‘document’

from pymongo import MongoClient
client = MongoClient()
client.db_name.collection_name.delete_many({'name':'111'})

改

replace_one 替换

【作用】更新与选择器匹配的所有文档
【语法】replace_one({条件dict},{新doc})
【栗子】

# replace_one 替换
client.db_name.collection_name.replace_one({条件dict},{新doc})

update 更新多条

【作用】更新与选择器匹配的所有文档
【语法】update(dict)
【栗子】

update_one 更新一条

【作用】更新与选择器匹配的第一个文档
【语法】update_one(dict)
【栗子】

# 将集合new3中{'name': 'joe'}换成{'age': 33}
client.test12.new3.update_one({'name': 'joe'}, {'$set':{'age': 33}})

修改器

$set

【作用】更新与选择器匹配的文档字段，如果该字段不存在。则新增字段
【语法】db_name.collection_name.update_many({‘name’: ‘joe’},{’$set’:{‘age’: 33}})
【栗子】

# 修改集合new3中一条文档的字段
client.test12.new3.update_many({'name': 'joe'},{'$set':{'age': 33}})
client.test12.new3.update_many({'name': 'joe'},{'$set':{'gender': 'male'}})

from pprint import pprint
for i in client.test12.new3.find({}, {'_id':0}):
    pprint(i)
    print('\n')

# 【输出结果】
# {'age': 33,     
     # 原文档age值为28，执行{'$set':{'age': 33}}后修改为33
# 'gender': 'male',   
     # 原文档不存在‘gender’字段，执行{'$set':{'gender': 'male'}}后自动添加
# 'location': 'Wisconsin',
# 'name': 'joe',
# 'sex': 'male'}

# {'age': 33,
# 'gender': 'male',
# 'location': 'Wisconsin',
# 'name': 'joe',
# 'sex': 'male'}

# {'age': 50, 'location': 'Wisconsin', 'name': 'ree', 'sex': 'fmale'}

$unset

【作用】删除与选择器匹配的文档字段。
【语法】db_name.collection_name.update_many({‘name’: ‘joe’},{’$set’:{‘gender’: ‘male’}})
【栗子】

# 删除文档的字段
client.test12.new3.update_many({'name': 'joe'},{'$unset':{'gender': 'male'}})

【结果】
# {'age': 33, 'location': 'Wisconsin', 'name': 'joe', 'sex': 'male'}  
   # 删除'gender'为 'male'的字段
# {'age': 33, 'location': 'Wisconsin', 'name': 'joe', 'sex': 'male'}

$inc

【作用】修改与{‘name’: ‘joe’}匹配的文档int型字段，仅支持修改数值型字段。
【语法】db_name.collection_name.update_many({‘name’: ‘joe’},{’$inc’:{‘age’:-390}})
【栗子】

# inc 修改器
client.test12.new3.update_one({'name': 'joe'},{'$inc':{'age':-390}})

【结果】
# {'age': -747, 'location': 'Wisconsin', 'name': 'joe', 'sex': 'male'}  
   # ‘age’值是被减390后的结果

$push $pushAll

【作用】向已有的数组末尾添加一个元素
【语法】update_one({dict条件},{’$push’:{dict文档内容}})
【栗子】

# 向匹配{'author.email':'[email protected]'}的文档'comments'字段追加ac。
# 如果comments不存在，会在匹配的文档中自动创建

ac = {'content': 'nice post.', 'email': '[email protected]', 'name': 'joe'}
new3.update_one({'author.email':'[email protected]'},{'$push':{'comments':ac}})

$addToSet

【作用】向现有文档添加不重复的字段，如果key不存在则自动创建.
【语法】update_one({条件语句dict},{’$addToSet’:dict})
【栗子】

# $addToSet
new_c={'content': 'nice post.', 'email': '[email protected]', 'name': 'joe'}
new3.update_one({'author.email':'[email protected]'},{'$addToSet':{'comments':new_c}})

$pull & $pullAll

【作用】删除文档重复的 emails 值 ($pull 会删除所有符合条件的记录)
【语法】
【栗子】

# $pull
new3.update_one({'author.email':'[email protected]'},{'$pull':{'comments':new_c}})

$each

【作用】添加多个元素（我的理解是：先遍历出list的每一项，每遍历出一项就添加到对应value中）
【语法】’$each’:list
【栗子】

# $push + $each
new3 = client.test12.new3
new_c=[{'content': 'nice post.', 'email': '[email protected]', 'name': 'joe'},
       {'content': 'nice post.', 'email': '[email protected]', 'name': 'joe'}]
new3.update_one({'author.email':'[email protected]'},{'$push':{'comments':{'$each':new_c}}})

$pop

【作用】删除列表元素(按数组下标移除)
【语法】{’$pop’:{‘key’:索引下标}
【栗子】

# 删除gf列表中的第一个值
client.test12.new3.update_one({'name': 'joe'},{'$pop':{'gf':-1}})
  # 执行后结果为： 'gf': ['mary', 'hero']  原值为：'gf': ['lily', 'mary', 'hero']


# 删除gf列表中的最后一个值
client.test12.new3.update_one({'name': 'joe'},{'$pop':{'gf':1}})
  # 执行后结果为：'gf': ['lily', 'mary']   原值为：'gf': ['lily', 'mary', 'hero']

查

基础用法

find()

【作用】查询出所有匹配的文档，并返回游标类型。
【语法】find(条件语句dict)
【栗子】

# 查询出完整文档
for i in client.test12.new3.find({}):
    print(i)


# 查询出name==ree的文档
for data in client.test12.new3.find({'name': 'ree'}):
    print(data)

find_one()

【作用】查询出第一条匹配的文档，并返回dict类型。
【语法】find_one(条件语句dict)
【栗子】

# 查询出第一条文档
for i in client.test12.new3.find_one({}):
    print(i)

# 查询出name==ree的第一条文档
for data in client.test12.new3.find_one({'name': 'ree'}):
    print(data)

按条件查询

比较操作符

$lt 小于
【作用】value值小于指定值的文档
【语法】find({‘key’:{’ $lt’:num}})
【栗子】

# 【$lt】查询出high_school小于410的文档
for i in client.test12.new3.find({'school.high_school':{'$lt':410}}):
    print(i)

【结果】
{'_id': ObjectId('5d2a3e0403b7995ac9f9249a'), 'name': 'Lee', 'school': {'high_school': 400, 'uni': 'nanjing'}}

$lte 小于等于
【作用】value值小于等于指定值的文档
【语法】find({‘key’:{’ $lte’:num}})
【栗子】

# 【$lte】查询出high_school小于等于500的文档
for i in client.test12.new3.find({'school.high_school':{'$lte':500}}):
    print(i)

【结果】
{'_id': ObjectId('5d2a3e0403b7995ac9f9249a'), 'name': 'Lee', 'school': {'high_school': 500, 'uni': 'beijing'}}
{'_id': ObjectId('5d2a3e0403b7995ac9f9249a'), 'name': 'Lee', 'school': {'high_school': 400, 'uni': 'nanjing'}}

$gt 大于
【作用】value值大于指定值的文档
【语法】find({‘key’:{’ $gt’:num}})
【栗子】

# 【$gt】查询出high_school大于500的文档
for i in client.test12.new3.find({'school.high_school':{'$gt':500}}):
    print(i)

【结果】
{'_id': ObjectId('5d2a3e0403b7995ac9f9249a'), 'name': 'Lee', 'school': {'high_school': 600, 'uni': 'xiada'}}

$gte 大于等于
【作用】value值大于等于指定值的文档
【语法】find({‘key’:{’ $gte’:num}})
【栗子】

# 【$gte】查询出high_school大于等于600的文档
for i in client.test12.new3.find({'school.high_school':{'$gte':600}}):
    print(i)

【结果】
{'_id': ObjectId('5d2a3e0403b7995ac9f9249a'), 'name': 'Lee', 'school': {'high_school': 800, 'uni': 'beida'}}
{'_id': ObjectId('5d2a3e0403b7995ac9f9249a'), 'name': 'Lee', 'school': {'high_school': 600, 'uni': 'qinghua'}}

$in和 $nin 操作符

$nin
【作用】匹配集合中没有 XX值的文档记录
【语法】{‘条件key’: {’ $nin’: [‘条件value1’, ‘条件value2’]}}
【栗子】

# 【'$nin'】匹配 new3 集合中 用户名不是 joe 和 Lee 的文档记录
for data in client.test12.new3.find({'name': {'$nin': ['joe', 'Lee']}}):
    print(data)

$in
【作用】匹配集合中有XX值的文档记录，匹配一个值即可
【语法】{‘条件key’: {’ $in’: [‘条件value1’, ‘条件value2’]}}
【栗子】

# 【'$in'】匹配 new3 集合中 用户名为 joe 和 Lee 的文档记录
for data in client.test12.new3.find({'name': {'$in': ['joe', 'Lee']}}):
    print(data)

$or

【作用】查询两个条件中其中一个为真的查询结果，可以使用 $or 操作符
【语法】{’ $or’: [{‘条件1key1’: ‘条件1value1’}, {‘条件2key2’: ‘条件2value2’}]}
【栗子】

# 【'$or'】匹配 new3 集合中 'name'为 joe 或 'school.high_school'的值为400 的文档记录
for data in client.test12.new3.find({'$or': [{'name': 'joe'}, {'school.high_school': 400}]}):
    print(data)

null 值查询和 $exists 条件判定

【作用】查找value为None的文档需要加 $exists
【语法】db_name.col_name.find({‘key’: {’ $in’:[None], ’ $exists’:1}})
【栗子】

# 查找出name的值为None的文档
for data in db_name.col_name.find({'name': {' $in':[None], ' $exists':1}}):
	print(data)

查询数组

$all
【作用】list中完全匹配多个元素的文档 ===》跟 $in 的区别是， $in是匹配条件表达式中的任何一个value
【语法】find({‘key’:{’ $all’:[列表形式的多个元素]}})
【栗子】

# 查找data=》列表形式的value里都包含2,3,4的文档
for u in db.users.find({'data':{'$all':[2,3,4]}}): 
    print(u)

$size
【作用】匹配指定长度的list文档
【语法】db_name.col_name.find({},{‘key’:{’ $size’:int_num}})
【栗子】

# 查找数组大小为4的文档
for data in db_name.col_name.find({},{'name':{' $size':4}}):
	print(data)

$slice
【作用】返回某个键匹配的数组的一个指定长度子集
【语法】db_name.col_name.find({‘key1’:‘value1’}, {‘key2’:{’ $slice’:±num}})
【栗子】

# num为正数时，查找出匹配{'title': 'A Blog Post'}的文档，并'comments'只返回前两个值
for i in client.test12.new3.find({'title': 'A Blog Post'},{'comments':{'$slice':2}}):
    pprint(i)

# num为负数时，查找出匹配{'title': 'A Blog Post'}的文档，并'comments'只返回最后一个值
for i in client.test12.new3.find({'title': 'A Blog Post'},{'comments':{'$slice':-1}}):
    pprint(i)

【结果】
==》conmments原值为 
'comments': [{'content': 'nice post.',
               'email': '[email protected]',
               'name': 'ma'},
              {'content': 'nice post.',
               'email': '[email protected]',
               'name': 'joe'},
              {'content': 'nice post.',
               'email': '[email protected]',
               'name': 'joe'},
              {'content': 'nice post.',
               'email': '[email protected]',
               'name': 'joe'},
              {'2email': '[email protected]',
               '2name': '2joe',
               'content': '2nice post.'}],

==》执行 'comments':{'$slice':2}时，结果为
'comments': [{'content': 'nice post.',
               'email': '[email protected]',
               'name': 'ma'},
              {'content': 'nice post.',
               'email': '[email protected]',
               'name': 'joe'}],


==》执行 'comments':{'$slice':-1}时，结果为
 'comments': [{'2email': '[email protected]',
               '2name': '2joe',
               'content': '2nice post.'}],

min()
【作用】
【语法】
【栗子】

具体用法后期补充

max()
【作用】
【语法】
【栗子】

具体用法后期补充

$sort() 排序

ASCENDING 升序
【作用】如果是string型的值按照asc码按先后排序，如果是数值型的值按数值从小到大排序
【语法】db_name.collection_name.find(条件语句).sort([(‘按这个字段排序’, ASCENDING)]):
【栗子】

# 从集合new3中查询name中含有Maria字段的文档,并按name的值 升序排序
from pymongo import ASCENDING
for i in client.test12.new3.find({'name':{'$in':['Maria']}}).sort([('name', ASCENDING)]):
    print(i)

DESCENDING 降序
【作用】如果是string型的值按照asc码按先后排序，如果是数值型的值按数值从大到小排序
【语法】db_name.collection_name.find(条件语句).sort([(‘按这个字段排序’, DESCENDING)]):
【栗子】

# 降序
from pymongo import DESCENDING
for i in client.test12.new3.find({'name':{'$in':['Maria']}}).sort([('name', DESCENDING)]):
    print(i)

limit() 限制

【作用】查询前num条文档
【语法】limit(num)
【栗子】

# 从集合new3中查询前三条文档
for data in client.test12.new3.find().limit(3):
    print(data)

skip() 跳过

【作用】跳过前num条开始查询文档
【语法】skip(num)
【栗子】

# 从第4条开始查出3条文档
for data in client.test12.new3.find().skip(3).limit(3):
    print(data)

where

【作用】用来执行JS
【语法】
【栗子】

具体用法后期补充

count_documents() 统计文档数据量

【作用】统计集合内有多少条文档
【语法】count_documents()
【栗子】

client.test12.new3.count_documents()

IOSDate 查询某一段时间的数据

【作用】查询某一段时间的documents
【语法】IOSDate(“2017-04-20T00:00:00Z”)
【栗子】

db.CollectionAAA.find({ "CreateTime" : { "$gte" : ISODate("2017-04-20T00:00:00Z")
, "$lt" : ISODate("2017-04-21T00:00:00Z") } }).count()

模糊查询

【作用】查询包含某个字段的documents
【语法】{‘字段名’:{’$regex’:‘条件参数’}}
【栗子】

db_name.Collection_name.find_many({"title":{'$regex':"医院"}})

索引

添加索引可以帮助加速查询。使用感受：100多万条document不加索引查询一般需要几十秒甚至1、2分钟，加完索引后基本上0.001-0.003sec就能查询完毕。想了解索引原理的话，可以官网了解一下。

【分类】===》目前仅介绍单索引、复合索引、TTL索引

单索引
是指在单个字段上创建的索引
复合索引
是指在多个字段上创建索引
TTL索引
是指可以设置过期时间的索引，到期后文档自动删除
多键索引
是指在文档数组的字段上创建索引
地理空间索引
- 2d索引
- 2dphere索引
文字索引
散列索引
稀疏索引
通配符索引 Partial Indexes
geoHaystack索引

增 Create

【作用】
【语法】

创建单个升序索引：

db_name.collection_name.ensure_index('字段名', pymongo.ASCENDING)

或者

db_name.collection_name.create_index('字段名', pymongo.ASCENDING)

创建单个降序索引：

db_name.collection_name.ensure_index('字段名', pymongo.DESCENDING)

或者

db_name.collection_name.create_index('字段名', pymongo.DESCENDING)

创建复合索引:

db_name.collection_name.ensure_index([('字段1名', pymongo.ASCENDING),('字段2名', pymongo.DESCENDING)])

或者

db_name.collection_name.create_index([('字段1名', pymongo.ASCENDING),('字段2名', pymongo.DESCENDING)])

【参数】

unique(boolean) # 默认为False
name(字符串) # 默认为使用字段名+排序方式组合，也可自定义索引名称
background(boolean) # 默认为False，后台创建索引
partialFilterExpression # 用于部分索引
spare(boolean) # 主要用户稀疏索引，索引指定字段的文档
expireAfterSeconds(整数) # 用户TTL索引，设置过期时间
storageEngine # 允许用户在创建索引是基于每个索引配置存储引擎

【栗子】

# 单索引
db_name.collection_name.create_index('title':ASCENDING)

# 符合索引
db_name.collection.create_index([('title':1),('year':-1)])
# 注意：1 = ASCENDING ，-1 = DESCENDING

删 drop_index

【作用】删除索引
【语法】db_name.collection_name.drop_index(“索引名”)

改

需要删除后，重新创建

查 query

【作用】查询数据库中有哪些索引
【语法】db_name.profiles.index_information()
希望打印更清晰一些，使用：
list(db_name.profiles.index_information())

聚合

聚合管道 aggregation pipline

「概念」聚合管道是基于数据处理流水线概念建模的数据聚合框架。
如图，聚合管道就像一个流水线，分成一道一道工序，最后产出成果。

第一阶段：$match阶段按status字段过滤文档，并将那些status等于"A"的文档传递给下一阶段。

第二阶段：$group阶段按cust_id字段对文档进行分组，以计算每个唯一的数量总和cust_id。

聚合管道阶段

$ addFields(aggregation) == 等效的阶段 ==》$ set 本例中所有addFields均可替换成set实现相同功能

【作用】向文档添加新字段。$ addFields输出包含输入文档和新添加字段中所有现有字段的文档。

「栗子」
STEP1、数据库中有这样两个文档

{
  _id: 1,
  student: "Maya",
  homework: [ 10, 5, 10 ],
  quiz: [ 10, 8 ],
  extraCredit: 0
}
{
  _id: 2,
  student: "Ryan",
  homework: [ 5, 6, 5 ],
  quiz: [ 8, 8 ],
  extraCredit: 8
}

STEP2、在$ addField阶段添加如下三个字段

db.scores.aggregate( [
   {
     $addFields: {
       totalHomework: { $sum: "$homework" } ,
       totalQuiz: { $sum: "$quiz" }
     }
   },
   {
     $addFields: { totalScore:
       { $add: [ "$totalHomework", "$totalQuiz", "$extraCredit" ] } }
   }
] )

STEP3、返回结果如下

{ 
 {
  "_id" : 1,
  "student" : "Maya",
  "homework" : [ 10, 5, 10 ],
  "quiz" : [ 10, 8 ],
  "extraCredit" : 0,
  "totalHomework" : 25,
  "totalQuiz" : 18,
  "totalScore" : 43
}
{
  "_id" : 2,
  "student" : "Ryan",
  "homework" : [ 5, 6, 5 ],
  "quiz" : [ 8, 8 ],
  "extraCredit" : 8,
  "totalHomework" : 16,      ====》输出新字段
  "totalQuiz" : 16,     ====》输出新字段
  "totalScore" : 40     ====》输出新字段
}

-> 向嵌入式文档添加字段
STEP1、现有文档

{ _id: 1, type: "car", specs: { doors: 4, wheels: 4 } }
{ _id: 2, type: "motorcycle", specs: { doors: 0, wheels: 2 } }
{ _id: 3, type: "jet ski" }

STEP2、向specs中添加新字段“fuel_type”

db.vehicles.aggregate( [
        {
           $addFields: {
              "specs.fuel_type": "unleaded"
           }
        }
   ] )

STEP3、输出结果

{ _id: 1, type: "car",
   specs: { doors: 4, wheels: 4, fuel_type: "unleaded" } }        ====》输出新字段    fuel_type: "unleaded"
{ _id: 2, type: "motorcycle",
   specs: { doors: 0, wheels: 2, fuel_type: "unleaded" } }         ====》输出新字段   fuel_type: "unleaded"
{ _id: 3, type: "jet ski",
   specs: { fuel_type: "unleaded" } }            ====》输出新字段   fuel_type: "unleaded"

-> 覆盖现有字段
STEP1、现有animals文档

{ _id: 1, dogs: 10, cats: 15 }

STEP2、用$ addFields修改现有文档

db.animals.aggregate( [
  {
    $addFields: { "cats": 20 }
  }
] )

STEP3、输出结果

{ _id: 1, dogs: 10, cats: 20 }

-> 用另一个字段替换现有字段
STEP1、现有的fruit文档

{ "_id" : 1, "item" : "tangerine", "type" : "citrus" }
{ "_id" : 2, "item" : "lemon", "type" : "citrus" }
{ "_id" : 3, "item" : "grapefruit", "type" : "citrus" }

STEP2、以下聚合操作用于$addFields将_id每个文档的字段替换为字段的值item ，并使用item静态值替换该字段。

db.fruit.aggregate( [
  {
    $addFields: {
      _id : "$item",    =====》 _id的值替换成 item的值
      item: "fruit"       =====》 item的值替换成  fruit
    }
  }
] )

STEP3、替换后的输出结果

{ "_id" : "tangerine", "item" : "fruit", "type" : "citrus" }
{ "_id" : "lemon", "item" : "fruit", "type" : "citrus" }
{ "_id" : "grapefruit", "item" : "fruit", "type" : "citrus" }

-> 将元素添加到数组
STEP1、使用以下内容创建scores样本集合：

db.scores.insertMany([
   { _id: 1, student: "Maya", homework: [ 10, 5, 10 ], quiz: [ 10, 8 ], extraCredit: 0 },
   { _id: 2, student: "Ryan", homework: [ 5, 6, 5 ], quiz: [ 8, 8 ], extraCredit: 8 }
])

STEP2、使用 $ concatArrays 配合 $ addFields 将元素添加到数组中：

db.scores.aggregate([
   { $match: { _id: 1 } },
   { $addFields: { homework: { $concatArrays: [ "$homework", [ 7 ] ] } } }
])

STEP3、插入数据后的结果

{ "_id" : 1, "student" : "Maya", "homework" : [ 10, 5, 10, 7 ], "quiz" : [ 10, 8 ], "extraCredit" : 0 }

$ match(aggregation)
【作用】将符合指定条件的文档传递到下一个管道阶段；
【语法】{ $match: { } }
$ unset(aggregation)
【作用】用于删除某些字段（可以是顶级字段也可以是嵌入式文档等），然后传入下一阶段；
【语法】{ $ unset: { <字段1>: “”, … } }
⚠️注意：$ unset与$ project等效，但语法有小差异 ({ $project: { “”: 0, “”: 0, … } })

【栗子】

排除单个字段的栗子
STEP1、先创建两个文档：

db.books.insertMany([
   { "_id" : 1, title: "Antelope Antics", isbn: "0001122223334", author: { last:"An", first: "Auntie" }, copies: [ { warehouse: "A", qty: 5 }, { warehouse: "B", qty: 15 } ] },
   { "_id" : 2, title: "Bees Babble", isbn: "999999999333", author: { last:"Bumble", first: "Bee" }, copies: [ { warehouse: "A", qty: 2 }, { warehouse: "B", qty: 5 } ] }
])

STEP2、排除单个字段：

# 排除 copies 字段
db.books.aggregate([ { $unset: "copies" } ])

STEP3、结果：

{ "_id" : 1, "title" : "Antelope Antics", "author" : { "last" : "An", "first" : "Auntie" } }
{ "_id" : 2, "title" : "Bees Babble", "author" : { "last" : "Bumble", "first" : "Bee" } }

排除多个字段的栗子
STEP1、排除 isbn 、copies 字段：

db.books.aggregate([
   { $unset: [ "isbn", "copies" ] }
])

STEP2、输出结果:

{ "_id" : 1, "title" : "Antelope Antics", "author" : { "last" : "An", "first" : "Auntie" } }
{ "_id" : 2, "title" : "Bees Babble", "author" : { "last" : "Bumble", "first" : "Bee" } }

排除内嵌文档字段
STEP1、排除内嵌文档字段：

db.books.aggregate([
   { $unset: [ "isbn", "author.first", "copies.warehouse" ] }
])

STEP2、输出结果

{ "_id" : 1, "title" : "Antelope Antics", "author" : { "last" : "An" }, "copies" : [ { "qty" : 5 }, { "qty" : 15 } ] }
{ "_id" : 2, "title" : "Bees Babble", "author" : { "last" : "Bumble" }, "copies" : [ { "qty" : 2 }, { "qty" : 5 } ] }

$ unwind(aggregation)
【作用】展开文档中的数组，并输出每个元素的文档
【语法】{$unwind:{path: , includeArrayIndex: , preserveNullAndEmptyArrays:}}
【参数】

【栗子】
STEP1、数据库有以下文档

{ "_id" : 1, "item" : "ABC1", sizes: [ "S", "M", "L"] }

STEP2、使用 $ unwind 展开 sizes 数组

db.inventory.aggregate( [ { $unwind : "$sizes" } ] )

STEP3、输出结果

{ "_id" : 1, "item" : "ABC1", "sizes" : "S" }
{ "_id" : 1, "item" : "ABC1", "sizes" : "M" }
{ "_id" : 1, "item" : "ABC1", "sizes" : "L" }

包含数据数组索引（ includeArrayIndex）
STEP1、数据库已有文档

{ "_id" : 1, "item" : "ABC", "sizes": [ "S", "M", "L"] }
{ "_id" : 2, "item" : "EFG", "sizes" : [ ] }
{ "_id" : 3, "item" : "IJK", "sizes": "M" }
{ "_id" : 4, "item" : "LMN" }
{ "_id" : 5, "item" : "XYZ", "sizes" : null }

STEP2、展开sizes数组，并要求标注数组索引位置

db.inventory.aggregate( [ { $unwind: { path: "$sizes", includeArrayIndex: "arrayIndex" } } ] )

STEP3、返回结果是一样的，如下

{ "_id" : 1, "item" : "ABC", "sizes" : "S", "arrayIndex" : NumberLong(0) }
{ "_id" : 1, "item" : "ABC", "sizes" : "M", "arrayIndex" : NumberLong(1) }
{ "_id" : 1, "item" : "ABC", "sizes" : "L", "arrayIndex" : NumberLong(2) }
{ "_id" : 3, "item" : "IJK", "sizes" : "M", "arrayIndex" : null }

保留null和空值的文档（ preserveNullAndEmptyArrays ）
STEP1、将preserveNullAndEmptyArrays设置为True

db.inventory.aggregate( [
   { $unwind: { path: "$sizes", preserveNullAndEmptyArrays: true } }
] )

STEP2、返回结果

{ "_id" : 1, "item" : "ABC", "sizes" : "S" }
{ "_id" : 1, "item" : "ABC", "sizes" : "M" }
{ "_id" : 1, "item" : "ABC", "sizes" : "L" }
{ "_id" : 2, "item" : "EFG" }
{ "_id" : 3, "item" : "IJK", "sizes" : "M" }
{ "_id" : 4, "item" : "LMN" }
{ "_id" : 5, "item" : "XYZ", "sizes" : null }

统计 $ count(aggregation)
【作用】统计传入到该阶段的文档数量。
【语法】{ $ count: }
是输出字段的名称，其计数值为其值。必须是非空字符串，不能以字符串开头$且不得包含该.字符。
【栗子】
STEP1、现有文档如下

{ "_id" : 1, "subject" : "History", "score" : 88 }
{ "_id" : 2, "subject" : "History", "score" : 92 }
{ "_id" : 3, "subject" : "History", "score" : 97 }
{ "_id" : 4, "subject" : "History", "score" : 71 }
{ "_id" : 5, "subject" : "History", "score" : 79 }
{ "_id" : 6, "subject" : "History", "score" : 83 }

STEP2、用两个管道阶段演示 $ count 功能

db.scores.aggregate(
  [
    {
      $match: {              #  =====》   在 $ match 阶段筛选出  score大于80的文档
        score: {
          $gt: 80
        }
      }
    },
    {
      $count: "passing_scores"      #  =====》   统计出上一阶段传到  $ count  阶段的总文档数，并将  passing_scores  作为结果的 key
    }
  ]
)

STEP3、输出结果

{ "passing_scores" : 4 }      #  统计出 score 大于80 的文档有4个

$bucket (aggregation) 存储桶
【作用】根据指定的表达式和存储区边界，将传入的文档分组
【语法】

{
  $bucket: {
      groupBy: ,
      boundaries: [ , , ... ],
      default: ,
      output: {
         : { <$accumulator expression> },
         ...
         : { <$accumulator expression> }
      }
   }
}

【参数】

【栗子】
STEP1、数据库中有以下文档

{ "_id" : 1, "title" : "The Pillars of Society", "artist" : "Grosz", "year" : 1926,
    "price" : NumberDecimal("199.99") }
{ "_id" : 2, "title" : "Melancholy III", "artist" : "Munch", "year" : 1902,
    "price" : NumberDecimal("280.00") }
{ "_id" : 3, "title" : "Dancer", "artist" : "Miro", "year" : 1925,
    "price" : NumberDecimal("76.04") }
{ "_id" : 4, "title" : "The Great Wave off Kanagawa", "artist" : "Hokusai",
    "price" : NumberDecimal("167.30") }
{ "_id" : 5, "title" : "The Persistence of Memory", "artist" : "Dali", "year" : 1931,
    "price" : NumberDecimal("483.00") }
{ "_id" : 6, "title" : "Composition VII", "artist" : "Kandinsky", "year" : 1913,
    "price" : NumberDecimal("385.00") }
{ "_id" : 7, "title" : "The Scream", "artist" : "Munch", "year" : 1893
    /* No price*/ }
{ "_id" : 8, "title" : "Blue Flower", "artist" : "O'Keefe", "year" : 1918,
    "price" : NumberDecimal("118.42") }

STEP2、根据price字段放入存储桶

db.artwork.aggregate( [
  {
    $bucket: {
      groupBy: "$price",              #  =====》  根据 price 放入存储桶
      boundaries: [ 0, 200, 400 ],                #  =====》   price 的值根据 0<=price<200  和 200<=price<400分成两组存入存储桶
      default: "Other",
      output: {
        "count": { $sum: 1 },                      #  =====》  统计每个阶段的总文档量
        "titles" : { $push: "$title" }                    #  =====》   title中push进 存储桶中文档的title值 
      }
    }
  }
] )

$ facet
在 $ facet 内可以使用多个 $ bucket 管道阶段。
【栗子】例子按price和year两个管道输出值

db.artwork.aggregate( [
  {
    $facet: {
      "price": [
        {
          $bucket: {                                  #   ======》 第一个  bucket  管道
              groupBy: "$price",
              boundaries: [ 0, 200, 400 ],
              default: "Other",
              output: {
                "count": { $sum: 1 },
                "artwork" : { $push: { "title": "$title", "price": "$price" } }
              }
          }
        }
      ],
      "year": [
        {
          $bucket: {              #      ======》 第二个  bucket  管道
            groupBy: "$year",
            boundaries: [ 1890, 1910, 1920, 1940 ],
            default: "Unknown",
            output: {
              "count": { $sum: 1 },
              "artwork": { $push: { "title": "$title", "year": "$year" } }
            }
          }
        }
      ]
    }
  }
] )

「输出结果如下」

{
  "year" : [                   #   ========》   由 year  管道产生出的值
    {
      "_id" : 1890,
      "count" : 2,
      "artwork" : [
        {
          "title" : "Melancholy III",
          "year" : 1902
        },
        {
          "title" : "The Scream",
          "year" : 1893
        }
      ]
    },
    {
      "_id" : 1910,
      "count" : 2,
      "artwork" : [
        {
          "title" : "Composition VII",
          "year" : 1913
        },
        {
          "title" : "Blue Flower",
          "year" : 1918
        }
      ]
    },
    {
      "_id" : 1920,
      "count" : 3,
      "artwork" : [
        {
          "title" : "The Pillars of Society",
          "year" : 1926
        },
        {
          "title" : "Dancer",
          "year" : 1925
        },
        {
          "title" : "The Persistence of Memory",
          "year" : 1931
        }
      ]
    },
    {
      // Includes the document without a year, e.g., _id: 4
      "_id" : "Unknown",
      "count" : 1,
      "artwork" : [
        {
          "title" : "The Great Wave off Kanagawa"
        }
      ]
    }
  ],
      "price" : [                              #   ========》   由   price  管道产生出的值
    {
      "_id" : 0,
      "count" : 4,
      "artwork" : [
        {
          "title" : "The Pillars of Society",
          "price" : NumberDecimal("199.99")
        },
        {
          "title" : "Dancer",
          "price" : NumberDecimal("76.04")
        },
        {
          "title" : "The Great Wave off Kanagawa",
          "price" : NumberDecimal("167.30")
        },
        {
          "title" : "Blue Flower",
          "price" : NumberDecimal("118.42")
        }
      ]
    },
    {
      "_id" : 200,
      "count" : 2,
      "artwork" : [
        {
          "title" : "Melancholy III",
          "price" : NumberDecimal("280.00")
        },
        {
          "title" : "Composition VII",
          "price" : NumberDecimal("385.00")
        }
      ]
    },
    {
      // Includes the document without a price, e.g., _id: 7
      "_id" : "Other",
      "count" : 2,
      "artwork" : [
        {
          "title" : "The Persistence of Memory",
          "price" : NumberDecimal("483.00")
        },
        {
          "title" : "The Scream"
        }
      ]
    }
  ]
}

$bucketAuto (aggregation) 自动分组的存储桶
【作用】自动按给定的数量平均划分界限，并将文档分组到每个桶中
【语法】

{
  $bucketAuto: {
      groupBy: ,
      buckets: ,
      output: {
         : { <$accumulator expression> },
         ...
      }
      granularity: 
  }
}

【参数】

【栗子】
STEP1、数据库有以下文档

{ "_id" : 1, "title" : "The Pillars of Society", "artist" : "Grosz", "year" : 1926,
    "price" : NumberDecimal("199.99"),
    "dimensions" : { "height" : 39, "width" : 21, "units" : "in" } }
{ "_id" : 2, "title" : "Melancholy III", "artist" : "Munch", "year" : 1902,
    "price" : NumberDecimal("280.00"),
    "dimensions" : { "height" : 49, "width" : 32, "units" : "in" } }
{ "_id" : 3, "title" : "Dancer", "artist" : "Miro", "year" : 1925,
    "price" : NumberDecimal("76.04"),
    "dimensions" : { "height" : 25, "width" : 20, "units" : "in" } }
{ "_id" : 4, "title" : "The Great Wave off Kanagawa", "artist" : "Hokusai",
    "price" : NumberDecimal("167.30"),
    "dimensions" : { "height" : 24, "width" : 36, "units" : "in" } }
{ "_id" : 5, "title" : "The Persistence of Memory", "artist" : "Dali", "year" : 1931,
    "price" : NumberDecimal("483.00"),
    "dimensions" : { "height" : 20, "width" : 24, "units" : "in" } }
{ "_id" : 6, "title" : "Composition VII", "artist" : "Kandinsky", "year" : 1913,
    "price" : NumberDecimal("385.00"),
    "dimensions" : { "height" : 30, "width" : 46, "units" : "in" } }
{ "_id" : 7, "title" : "The Scream", "artist" : "Munch",
    "price" : NumberDecimal("159.00"),
    "dimensions" : { "height" : 24, "width" : 18, "units" : "in" } }
{ "_id" : 8, "title" : "Blue Flower", "artist" : "O'Keefe", "year" : 1918,
    "price" : NumberDecimal("118.42"),
    "dimensions" : { "height" : 24, "width" : 20, "units" : "in" } }

STEP2、使用单个自动分组的存储桶

db.artwork.aggregate( [
   {
     $bucketAuto: {
         groupBy: "$price",
         buckets: 4
     }
   }
] )

STEP3、返回结果，按 buckets值分成4组

{
  "_id" : {
    "min" : NumberDecimal("76.04"),
    "max" : NumberDecimal("159.00")
  },
  "count" : 2
}
{
  "_id" : {
    "min" : NumberDecimal("159.00"),
    "max" : NumberDecimal("199.99")
  },
  "count" : 2
}
{
  "_id" : {
    "min" : NumberDecimal("199.99"),
    "max" : NumberDecimal("385.00")
  },
  "count" : 2
}
{
  "_id" : {
    "min" : NumberDecimal("385.00"),
    "max" : NumberDecimal("483.00")
  },
  "count" : 2
}

也可以使用 $ facet 创建多个存储桶
【栗子】

db.artwork.aggregate( [
  {
    $facet: {
      "price": [
        {
          $bucketAuto: {
            groupBy: "$price",
            buckets: 4
          }
        }
      ],
      "year": [
        {
          $bucketAuto: {
            groupBy: "$year",
            buckets: 3,
            output: {
              "count": { $sum: 1 },
              "years": { $push: "$year" }
            }
          }
        }
      ],
      "area": [
        {
          $bucketAuto: {
            groupBy: {
              $multiply: [ "$dimensions.height", "$dimensions.width" ]
            },
            buckets: 4,
            output: {
              "count": { $sum: 1 },
              "titles": { $push: "$title" }
            }
          }
        }
      ]
    }
  }
] )

输出结果如下：

{
  "area" : [                        #   ========》   area存储桶结果
    {
      "_id" : { "min" : 432, "max" : 500 },
      "count" : 3,
      "titles" : [
        "The Scream",
        "The Persistence of Memory",
        "Blue Flower"
      ]
    },
    {
      "_id" : { "min" : 500, "max" : 864 },
      "count" : 2,
      "titles" : [
        "Dancer",
        "The Pillars of Society"
      ]
    },
    {
      "_id" : { "min" : 864, "max" : 1568 },
      "count" : 2,
      "titles" : [
        "The Great Wave off Kanagawa",
        "Composition VII"
      ]
    },
    {
      "_id" : { "min" : 1568, "max" : 1568 },
      "count" : 1,
      "titles" : [
        "Melancholy III"
      ]
    }
  ],
  "price" : [                       #   ========》   price 存储桶结果
    {
      "_id" : { "min" : NumberDecimal("76.04"), "max" : NumberDecimal("159.00") },
      "count" : 2
    },
    {
      "_id" : { "min" : NumberDecimal("159.00"), "max" : NumberDecimal("199.99") },
      "count" : 2
    },
    {
      "_id" : { "min" : NumberDecimal("199.99"), "max" : NumberDecimal("385.00") },
      "count" : 2 },
    {
      "_id" : { "min" : NumberDecimal("385.00"), "max" : NumberDecimal("483.00") },
      "count" : 2
    }
  ],
  "year" : [                       #   ========》   year   存储桶结果
    { "_id" : { "min" : null, "max" : 1913 }, "count" : 3, "years" : [ 1902 ] },
    { "_id" : { "min" : 1913, "max" : 1926 }, "count" : 3, "years" : [ 1913, 1918, 1925 ] },
    { "_id" : { "min" : 1926, "max" : 1931 }, "count" : 2, "years" : [ 1926, 1931 ] }
  ]
}

$ currentOp(aggregate)
【作用】返回包含有关活动和/或休眠操作的信息的文档流，以及作为事务的一部分持有锁的非活动会话
原文地址： https://docs.mongodb.com/manual/reference/operator/aggregation/currentOp/
$ collStats(aggregate)
【作用】返回有关集合或视图的统计信息
原文地址： https://docs.mongodb.com/manual/reference/operator/aggregation/collStats/
$ facet(aggregate)
【作用】在同一组输入文档的单个阶段内处理多个聚合管道。每个子管道在输出文档中都有自己的字段，其结果存储为文档数组。
【语法】

{  $ facet ：
   { 
      < outputField1 >： [  < stage1 > ， < stage2 > ， ...  ]，
      < outputField2 >： [  < stage1 > ， < stage2 > ， ...  ]，
      ...

   } 
}

原文地址： https://docs.mongodb.com/manual/reference/operator/aggregation/facet/

$ geoNear(aggregate) # ===》这是一个基于地理信息的聚合阶段，暂时只贴出原文地址
【作用】以距离指定点最近的顺序输出文档。
原文地址： https://docs.mongodb.com/manual/reference/operator/aggregation/geoNear/
$ graphLookup(aggregate)
【作用】对集合执行递归搜索，其中包含通过递归深度和查询过滤器限制搜索的选项。
【语法】

{
   $graphLookup: {
      from: ,
      startWith: ,
      connectFromField: ,
      connectToField: ,
      as: ,
      maxDepth: ,
      depthField: ,
      restrictSearchWithMatch: 
   }
}

【参数】

原文地址： https://docs.mongodb.com/manual/reference/operator/aggregation/graphLookup/

你可能感兴趣的:(pymongo,Python,python第三方库,pymongo,mongoDB,Python,增删改查)

python 一小时教程 wsf_123456 python Python 编程 C C#C++
1序言面向读者本文适合有经验的程序员尽快进入Python2.x世界.特别地,如果你掌握Java和Javascript,不用1小时你就可以用Python快速流畅地写有用的Python程序.Python3.x用户请参考:http://www.cnitblog.com/yunshichen/archive/2009/04/01/55924.html(由于Django不支持python3,所以为了你的发展
python合并多个pdf_Python实现按序合并多个pdf文件 weixin_39647458 python合并多个pdf
技术交流QQ群:1027579432，欢迎你的加入！欢迎关注我的微信公众号：CurryCoder的程序人生1.整体实现步骤在日常办公中，我们可能会有一个需求，需要将多个pdf文件合并成一个文件。例如：需要将每个章节的pdf文件学习资料合并成一个pdf文件，便于我们进行学习资料的归档与整理。如何才能合并多个pdf文件呢？我查了一下网上现有的资料(详见参考资料1)，发现python中有一个第三方库Py
android sqlite 自增主键,SQLite设置自增主键洛岗 android sqlite 自增主键
心血来潮想做一个网站，具体干什么暂时还是不透露了，因为我也不确定能不能搞出来，这不，刚开始就踩到坑了。这算是第一次近距离接触SQLite吧，算是脱离文本数据库的一小步(虽然SQLite也有类似文本数据库的味道)，第一次用php+sql，操作起来有点小激动，按照教程来做，感觉无比顺利，成功完成了增删改查，于是打算开始着手写点什么，比如一个简单的记事本。Runoob给的创建表的代码如下：$sql=<<
练手代码之使用Python实现合并PDF文件 Wcowin Python python pdf 前端
如果你有合并PDF的需要，你会怎么办我们无所不能的程序员会选择写一个Python代码来实现（谁会这么无聊？是我），如果真的有PDF操作需要，我推荐你使用PDFExpert这个软件哈~话不多说直接上代码：importosimportPyPDF2fromtkinterimportTkfromtkinter.filedialogimportaskopenfilenamesdefcombine_pdfs(
Python面向对象面试题及参考答案大模型大数据攻城狮 python 面试继承封装接口隔离弱引用元类
目录什么是面向对象编程？Python中的类和对象是什么？什么是继承？Python如何实现继承？什么是多态？Python如何实现多态？Python中的类属性和实例属性有什么区别？类属性和实例属性的访问优先级规则是什么？Python中的实例方法、类方法和静态方法有什么区别？静态方法、类方法、实例方法的参数传递差异是什么？什么是构造函数（init）？解释__init__方法与__new__方法的区别Py
Python中dataframe的to_list和to_list()差距 emmmmXxxy python list
先新建一个dataframe数据框df=pd.DataFrame({'a':[1,2,3],'b':[3,4,5],'c':[5,6,7]})df结果然后看一下两者的区别dataframe的to_list1df['b']结果031425Name:b,dtype:int642df['b'].to_list结果3看一下数据类型type(df['b'].to_list)结果methoddataframe
Python实现观察者模式麦田里走一夜 PYTHON python 观察者模式开发语言
请关注【来玩AI】公众号体验人工智能来玩AI>>>Python实现观察者模式观察者模式python代码实现说明应用场景观察者模式模式是一种常用的设计模式，可以在对象之间建立一对多的依赖关系。Python中实现观察者模式有多种方式，下面给出一种基于类和装饰器的实现方式：python代码实现classObserver:defupdate(self,observable,*args,**kwargs):
自然语言处理系列（5）——情感分析的原理与实战 DoYangTan 自然语言处理人工智能
自然语言处理系列（5）——情感分析的原理与实战情感分析（SentimentAnalysis）是自然语言处理中的一项经典任务，目的是通过分析文本，判断其表达的情感倾向性。情感分析广泛应用于社交媒体监控、市场调研、客户服务等领域，帮助企业和机构快速了解用户的情感态度。在本文中，我们将深入探讨情感分析的基本概念、常用方法，并展示如何使用Python和现代NLP工具实现情感分析任务。1.情感分析的基本概念
【2025年】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽黑客鹏哥 web安全 CTF 网络安全大赛 python Linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
anaconda 创建虚拟环境 yuweififi 环境搭建
1.打开AnacondaPrompt2.创建环境condacreate--nametorchpython=3.62.输入activatetorch安装的anacondapython虚拟环境打开，torch为创建的env名字3.condainfo--env查看所有创建的环境4.关闭环境deactivate切记先激活环境
Python连接SQL SEVER数据库全流程 m0_74824865 面试学习路线阿里巴巴数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
网络安全工具 AWVS 与 Nmap：原理、使用及代码示例阿贾克斯的黎明网络安全安全 web安全网络
目录网络安全工具AWVS与Nmap：原理、使用及代码示例AWVS：Web漏洞扫描的利器1.工具概述2.工作原理3.使用方法4.代码示例（Python调用AWVSAPI进行扫描）Nmap：网络探测与端口扫描的神器1.工具概述2.工作原理3.使用方法4.代码示例（Python调用Nmap进行扫描）总结在网络安全领域，AWVS（AcunetixWebVulnerabilityScanner）和Nmap是
深入剖析 Weblogic、ThinkPHP、Jboss、Struct2 历史漏洞阿贾克斯的黎明网络安全 web安全
目录深入剖析Weblogic、ThinkPHP、Jboss、Struct2历史漏洞一、Weblogic漏洞（一）漏洞原理（二）漏洞利用代码（Python示例）（三）防范措施二、ThinkPHP漏洞（一）漏洞原理（二）漏洞利用代码（示例，假设存在漏洞的代码片段）（三）防范措施三、Jboss漏洞（一）漏洞原理（二）漏洞利用代码（Java示例，用于构造恶意序列化数据）（三）防范措施四、Struct2漏洞
【Python专栏】Python的发展历程雾岛心情 Python入门到精通 python 开发语言
Python的创始人为吉多·范罗苏姆（GuidovanRossum），人称龟叔1989年，为了打发圣诞节假期，Guido开始写Python语言的编译器。Python这个名字，来自Guido所挚爱的电视剧MontyPython’sFlyingCircus。他希望这个新的叫做Python的语言，能符合他的理想：创造一种C和shell之间，功能全面，易学易用，可拓展的语言。Python的具体发展历史和版
Stable diffusion 3.5本地运行环境配置记录寸先生的牛马庄园扩散模型 stable diffusion
1.环境配置创建虚环境condacreate-nsd3.5python=3.10Pytorch(>2.0)condainstallpytorch==2.2.2torchvision==0.17.2torchaudio==2.2.2pytorch-cuda=12.1-cpytorch-cnvidiaJupyter能使用Anaconda虚环境condainstallipykernelpython-mi
阿里巴巴DIN模型原理与Python实现 eso1983 python 开发语言算法推荐算法
阿里巴巴的DeepInterestNetwork(DIN)是一种用于点击率预测（CTR）的深度学习模型，特别针对电商场景中用户兴趣多样化和动态变化的特性设计。其核心思想是通过注意力机制动态捕捉用户历史行为中与当前候选商品相关的兴趣。1.DIN模型原理1.核心问题传统推荐模型（如Embedding+MLP）将用户历史行为视为固定长度的向量，忽略了用户兴趣的多样性。例如，用户历史行为中可能包含多个互不
pytorch基础-比较矩阵是否相等 yuweififi pytorch 人工智能
1、使用NumPy库NumPy是Python中用于科学计算的常用库，它提供了array_equal和allclose函数来判断矩阵是否相等。array_equal用于精确比较，allclose用于考虑一定误差范围的近似比较，适合浮点数矩阵。importnumpyasnp#创建示例矩阵matrix_a=np.array([[1,2,3],[4,5,6]])matrix_b=np.array([[1,
一学就会：A*算法详细介绍（Python）不去幼儿园人工智能（AI）#启发式算法算法 python 人工智能机器学习开发语言
本篇文章是博主人工智能学习以及算法研究时，用于个人学习、研究或者欣赏使用，并基于博主对相关等领域的一些理解而记录的学习摘录和笔记，若有不当和侵权之处，指出后将会立即改正，还望谅解。文章分类在启发式算法专栏：【人工智能】-【启发式算法】（6）---《一学就会：A*算法详细介绍（Python）》一学就会：A*算法详细介绍（Python）目录A*算法介绍A*算法的核心概念A*算法的特点A*算法示例：迷宫
电竞赛事数据分析：LNG vs BLG的胜利背后烧瓶里的西瓜皮 python 自动驾驶人工智能数据可视化机器学习
电竞赛事数据分析：LNGvsBLG的胜利背后摘要在S14瑞士轮次日，LNG以1:0战胜BLG，取得了开赛二连胜。本文将通过Python进行数据处理与分析，结合机器学习算法预测比赛结果，并使用数据可视化工具展示关键指标。通过对这场比赛的数据深入挖掘，揭示LNG获胜的关键因素。引言电子竞技（Esports）已经成为全球范围内的一项重要娱乐活动，而《英雄联盟》（LeagueofLegends,LoL）作
如何使用Python编程实现捕获笔记本电脑麦克风的音频并通过蓝牙耳机实时传输 winfredzhang python 音视频实时传输蓝牙耳机
在现代的工作和生活环境中，音频传输的需求日益增加。无论是远程会议、在线教育，还是家庭娱乐，音频的实时传输都扮演着至关重要的角色。今天，我将向大家介绍一个简单而实用的应用程序，它能够捕获笔记本电脑麦克风的音频，并通过蓝牙耳机实时传输。这款应用程序特别适用于需要在会议室等场景中远程听取声音的情况。接下来，我将详细讲解这个应用程序的实现过程，并提供完整的代码和使用指南。引言想象一下这样的场景：你需要离开
网络安全加密python代码黑客Ash web安全安全
点击文末小卡片，免费获取网络安全全套资料，资料在手，涨薪更快网络信息安全中遇到的各种攻击是防不胜防的，采取适当的防护措施就能有效地保护网络信息的安全,包括防火墙、入侵检测系统、漏洞扫描技术以及加密技术等多种防护措施。而信息安全的本质就是要保护信息本身和信息系统在存储、传输中的完整性和保密性,保障不被攻击和篡改,上述的主动攻击、被动攻击和病毒袭击都会造成信息的破坏和泄密,我们以信息安全中的基础理论出
Day5 --- Flask-RESTful请求响应与SQLAlchemy基础 laufing 问题 flask restful python
文章目录昨日回顾今日内容1.请求解析1.1RequestParser处理请求1.2参数详解1.3处理请求案例2.返回响应2.1序列化数据:2.2返回JSON格式3.ORM与Flask-SQLAlchemy3.1ORM介绍ORM框架3.2Flask-SQLAlchemy扩展3.3定义模型类3.4数据库迁移操作4.数据增删改查4.1新增数据4.2简单查询4.3更新数据4.4删除数据5.数据操作案例昨日
python 商城性能,python商城项目总结 Yvetzy python 商城性能
importhashlib#实例化md5对象md5=hashlib.md5()#md5.update()方法的参数必须是字节型数据md5.update(bytes(request.POST['password'],encoding="UTF-8"))#以16进制格式存储md5.hexdigest()'''这里有个坑必须注意：md5.update()方法会将每次加密的字符进行拼接，所以每次加密前都要
用Python写一个商城系统潮水岩
如果要用Python写一个商城系统，可以先定义需要实现的功能，再按照功能模块分别进行开发。下面是一个简单的开发流程：数据模型设计：需要定义商品、订单、用户等数据模型，并且将它们存储在数据库中。用户模块：用户可以注册、登录、查看个人信息、修改密码等。商品模块：商家可以发布商品、管理商品信息、查看商品列表等；用户可以查看商品详情、加入购物车等。订单模块：用户可以下单、查看订单详情、取消订单、评价订单等
python pandas 读取数据库_Python+Pandas 获取数据库并加入DataFrame的实例 weixin_39955149 python pandas 读取数据库
Python+Pandas获取数据库并加入DataFrame的实例实例如下所示：importpandasaspdimportsysimportimpimp.reload(sys)fromsqlalchemyimportcreate_engineimportcx_Oracledb=cx_Oracle.connect('userid','password','10.10.1.10:1521/dbins
python导出结果_Python连接Oracle数据查询导出结果 weixin_39712821 python导出结果
python连接oracle，需用用到模块cx_oracle，可以直接pip安装，如网络不好，可下载离线后本地安装本人由于工作需要，期望便捷查询所得结果，且固定输出某个格式具体代码如下：#!coding:utf-8importcx_Oracleconn=cx_Oracle.connect('username/password@IP/连接名')cur=conn.cursor()cur.execute
Python—kafka操作蓝魔Y Python编程 kafka
文档结构1、概念简介2、环境搭建3、操作实践1、概念简介2、环境搭建接口手册：https://kafka-python.readthedocs.io/en/master/Python操作kafka的模块为：kafka-python模块安装pipinstallkafka-python3、操作实践=============================================over====
python使用kafka原理详解_Python操作Kafka原理及使用详解形象顧問Aking
Python操作Kafka原理及使用详解一、什么是KafkaKafka是一个分布式流处理系统，流处理系统使它可以像消息队列一样publish或者subscribe消息，分布式提供了容错性，并发处理消息的机制二、Kafka的基本概念kafka运行在集群上，集群包含一个或多个服务器。kafka把消息存在topic中，每一条消息包含键值(key)，值(value)和时间戳(timestamp)。kafk
python把oracle的查询结果导出为insert语句优游的鱼 oracle python 数据库开发语言
可以使用cx_Oracle库在Python中连接Oracle数据库并执行查询。然后，可以使用pandas库将查询结果读取为DataFrame，并使用to_sql()方法将其导出为insert语句。示例代码如下：importcx_Oracleimportpandasaspd#ConnecttoOracledatabaseconn=cx_Oracle.connect('username/passwor
python画出roc曲线 auc计算逻辑_Python画ROC曲线和AUC值计算路过炊烟 python画出roc曲线 auc计算逻辑
前言ROC(ReceiverOperatingCharacteristic)曲线和AUC常被用来评价一个二值分类器(binaryclassifier)的优劣。这篇文章将先简单的介绍ROC和AUC，而后用实例演示如何python作出ROC曲线图以及计算AUC。AUC介绍AUC(AreaUnderCurve)是机器学习二分类模型中非常常用的评估指标，相比于F1-Score对项目的不平衡有更大的容忍性，
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l