Python 实战:week2 在 MongoDB 中筛选房源

作业效果:

> show dbs
local    0.000GB
xiaozhu  0.000GB
> use xiaozhu
switched to db xiaozhu
> show collections
duanzhufang
> db.duanzhufang.find().count()
72
> db.duanzhufang.find()[0]
{
    "_id" : ObjectId("5749a313e002823df42c62b1"),
    "name" : "北京海韵之家",
    "title" : "天坛前门崇文门新世界精装温馨舒适大床房",
    "gender" : "女",
    "price" : 398,
    "fangdong_img_url" : "http://image.xiaozhustatic2.com/21/5,0,3,1063,496,496,904259a0.jpg",
    "address" : "北京市东城区西花市",
    "img_url" : "http://image.xiaozhustatic3.com/00,800,533/6,0,4,439,1800,1200,62007875.jpg"
}
> db.duanzhufang.find()[71]
{
    "_id" : ObjectId("5749a383e002823df42c62f8"),
    "name" : "iHOME望喜",
    "title" : "百子湾、地铁七号线、国贸CBD北欧简约公寓",
    "gender" : "女",
    "price" : 448,
    "fangdong_img_url" : "http://image.xiaozhustatic1.com/21/2,0,27,3262,373,373,16f7694a.jpg",
    "address" : "北京市朝阳区后现代城6号楼",
    "img_url" : "http://image.xiaozhustatic2.com/00,800,533/3,0,27,1207,1800,1200,99f27baa.jpg"
}
>

价格大于等于500的房源

> db.duanzhufang.find({price:{$gte:500}})
{ "_id" : ObjectId("5749a31be002823df42c62b6"), "name" : "ocheese", "title" : "到鸟巢去散步,安慧东里敞亮大三居", "gender" : "女", "price" : 698, "fangdong_img_url" : "http://image.xiaozhustatic2.com/21/1,0,45,5961,260,260,6e0c45fc.jpg", "address" : "北京市朝阳区新都市计划大厦", "img_url" : "http://image.xiaozhustatic3.com/00,800,533/3,0,89,2758,1800,1200,1490009a.jpg" }
{ "_id" : ObjectId("5749a31de002823df42c62b7"), "name" : "暖阳洋Sunny", "title" : "紧邻798、望京、酒仙桥,精品大三居。", "gender" : "男", "price" : 798, "fangdong_img_url" : "http://image.xiaozhustatic2.com/21/2,0,86,206,375,375,d46c51ef.jpg", "address" : "北京市朝阳区彩虹路", "img_url" : "http://image.xiaozhustatic3.com/00,800,533/3,0,86,2879,1800,1200,c654a19b.jpg" }
{ "_id" : ObjectId("5749a320e002823df42c62b9"), "name" : "uujaa", "title" : "劲松双井国贸华腾园大三室整租家庭朋友聚好居所", "gender" : "女", "price" : 698, "fangdong_img_url" : "http://image.xiaozhustatic3.com/21/4,0,97,7907,320,320,708221d7.jpg", "address" : "北京市朝阳区东三环南路54号8号楼", "img_url" : "http://image.xiaozhustatic1.com/00,800,533/5,0,68,984,1800,1200,e7fee234.jpg" }
{ "_id" : ObjectId("5749a333e002823df42c62c5"), "name" : "uujaa", "title" : "双井、九龙山地铁附近首城国际三室一厅整租", "gender" : "女", "price" : 650, "fangdong_img_url" : "http://image.xiaozhustatic3.com/21/4,0,97,7907,320,320,708221d7.jpg", "address" : "北京市朝阳区广渠路36号首城国际", "img_url" : "http://image.xiaozhustatic1.com/00,800,533/5,0,23,1659,1800,1200,c1dcc86c.jpg" }
{ "_id" : ObjectId("5749a344e002823df42c62d0"), "name" : "甜蜜城堡", "title" : "颐和园圆明园清华北大309西苑医院农大西校区", "gender" : "女", "price" : 898, "fangdong_img_url" : "http://image.xiaozhustatic2.com/21/2,0,33,1767,375,375,e6fe566d.jpg", "address" : "北京市海淀区圆明园西路", "img_url" : "http://image.xiaozhustatic3.com/00,800,533/2,0,17,2154,825,550,982bfb60.jpg" }

作业项目地址

小结

需要安装 pymongo,是 python 中的 mongodb 客户端。用于连接 python 和 mongodb 服务器。

  • 导入 pymongo 模块

import pymongo

  • 连接到服务器

在 python 中用 pymongo 创建一个客户端实例对象,激活客户端,指定连接的服务器的地址和端口。

client = pymongo.MongoClient()

如果不指定任何参数,那么MongoClient默认连接到运行在localhost``27017端口的MongoDB实例。一个实例可以有多个数据库。

client = MongoClient('localhost', 27017)

这相当于连接到了运行在localhost``27017端口的一个 MongoDB 实例。

client = MongoClient('mongodb://localhost:27017/')

这相当于连接到了运行在mongodb0.example.net系统27017端口的的一个 MongoDB 实例。

  • 创建数据库

获取指定名称的数据库,同时在 python 中赋值给一个变量名。如果当前数据库中没有,会自动以这个名称创建新数据库。

db = client['']

  • 创建集合

在数据库中获取集合,如果没有,会自动创建集合

sheet = db['']

在 MongoDB 中,collections and databases 懒惰地创建,以上的命令并不会实际地在 MongoDB server 上执行任何操作。Collections and databases 会在第一个 document 被插入时才创建。

  • 插入文档

文档保存在集合中。文档是类似 JSON 的 BSON 格式。BSON 字符串是用utf-8编码的。

向集合写入数据,填写一行

data = {"author": "Mike",
        "text": "My first blog post!",
        "tags": ["mongodb", "python", "pymongo"],
        "date": datetime.datetime.utcnow()
       }

sheet.insert_one(data)

插入后会自动生成_id字段,类似 excel 行号和列号。并建立数据索引。

一次性插入多个文档

>>> new_posts = [{"author": "Mike",
...               "text": "Another post!",
...               "tags": ["bulk", "insert"],
...               "date": datetime.datetime(2009, 11, 12, 11, 14)},
...              {"author": "Eliot",
...               "title": "MongoDB is fun",
...               "text": "and pretty easy too!",
...               "date": datetime.datetime(2009, 11, 10, 10, 45)}]
>>> posts.insert_many(new_posts)

数据库的操作应该完全在 terminal 中完成,或者用脚本进行

  • 查询单个文档

sheet.find_one() # 获取一个集合中的第一个文档

sheet.find_one({"author": "Mike"}) # 获取一个集合中符合某个条件的第一个文档

  • 查询多个文档

sheet.find() # 获取一个集合中所有文档
sheet.find({'words':0}) # 筛选有特定数据的行 ('words'=0)

  • 范围查询

条件查找,大于小于等于

$lt/$lte/$gt/$gte/$ne,/>=/!=,less greater equal not

query 官方文档

sheet.find({'words':{"$lt":5}}) # 筛选 words 小于 5 的行

有没有引号无所谓

> db.duanzhufang.find({price:{$lt:500}}).count()
67
> db.duanzhufang.find({"price":{$lt:500}}).count()
67
> db.duanzhufang.find({"price":{"$lt":500}}).count()
67
  • 计数

如果想知道一个集合中有多少文档,可以使用count()

>>> posts.count()
3

或者匹配指定查询条件的文档数量

>>> posts.find({"author": "Mike"}).count()
2

PyMongo Tutorial 快速简介

  • 命令行客户端mongo

使用命令行客户端mongo连接运行的MongoDB实例

$ mongo
MongoDB shell version: 3.2.4
connecting to: test
> show dbs
local    0.000GB
xiaozhu  0.000GB
>
> use xiaozhu
switched to db xiaozhu
> db
xiaozhu
> show collections
duanzhufang
> db.duanzhufang.remove({})
WriteResult({ "nRemoved" : 24 })
> db.duanzhufang.find()

mongo

创建、读取、更新、删除 文档

MongoDB CRUD Operations

你可能感兴趣的:(Python 实战:week2 在 MongoDB 中筛选房源)