Python学习笔记6——使用MongoDB数据库

一、如何在Python中使用MongoDB数据库。

在Python中使用MongoDB的方法,其实和我们平时使用EXCEL的方法相类似。当使用EXCEL时会经历以下步骤:①对EXCEL进行命名;②在EXCEL中增加sheet工作簿;③输入数据;④对数据进行分析,以表格、图像等方式展现数据。

类似的,在使用MongoDB时也同样会经历相似的四步:①给数据库命名;②在文件下创建表单;③将数据放入数据库中;④展示数据库中的数据。

在进行以上的步骤之前,还需要完成两个准备工作:

1)要想使用MongoDB同样需要先引入第三方库,和引入Request的方法一样,首现输入:import pymongo

2)与MongoDB客户端进行连接,输入:client = pymongo.MongoClient('localhost',27017),其中localhost表示是在本地创建创建数据库,27017表示本地端口(如果将MongoDB部署在网络环境中,端口会有所改变)。

1.给数据库命名

输入的代码为:A1= client['A2'],其中A1为在Python中的变量名称,A2为对应放入MongoDB数据库中的名称,为了便于管理,通常将两者取同样的名称。如要爬取knewone的数据,可以将数据库命名为knewone,代码写为:knewone = client['knewone']。

2.在文件下创建表单

输入的代码为:B1= A1['B2'],这段代码可以理解为在刚才创建的文件下创建表单。其中B1为Python中的变量名称,B2为刚才创建文件的表单名称。同样的道理,为了方便,B1和B2的名称最好相同。为了与EXCEL进行类比,在写代码的过程中获得熟悉感,可以将代码写为sheet1 = knewone['sheet1']。

3.将数据放入数据库中

输入的代码为:B1.insert_one(data),其中B1为创建的表单,data为我们抓取的数据,insert() 函数用于将指定对象插入列表的指定位置。

insert()方法语法:list.insert(index, obj)

index -- 对象obj 需要插入的索引位置。

obj -- 要插入列表中的对象。

4.展示数据库中的数据

在之前Python学习笔记5中,已经安装了mongo插件,这个插件就是帮助我们直观地去观察所存储的数据。

就如使用EXCEL一样,我们通常会去筛选我们需要的数据和信息,在MongoDB中,常用的条件操作符有:

$gt: (>) 大于  - 

$lt :(<) 小于 - 

$gte :(>=) 大于等于 - 

$lte :(<= ) 小于等于 - 

lt表示less than

,gt表示greater than,e表示equal,n表示not。

通过以上条件操作符,便可从众多数据中筛选出我们所需要的信息。

二、实战

存储学习笔记3中所爬取的小猪短租相关数据,并从中筛选出价格小于等于300的数据。

1.导入pymongo第三方库

2.给数据库命名并创建表单

创建一个名字为xiaozhu_bj的数据库,并在数据库中创建一个名字为sheet1的表单。

3.插入数据

将抓取的data数据存入sheet1中。

在Pycharm右侧的Mongo Explorer中,选择xiaozhu_bj数据库中的sheet1表单,便能查看所有存储数据。

存入数据库中的数据如下:

4.筛选出价格小于等于300的数据

利用for循环,筛选出价格≤300的数据。

如果输出的数据为空的情况,原因是在之前爬取数据时,没有定义价格的数据类型,需要将价格数据定义为整数后,才能进行大小判定。

最终筛选出的数据结果如下:

完整代码如下:

总结:

1.在Python中使用MongoDB数据库,就犹如我们平常使用EXCEL,通常需要经历数据库命名、创建表单、数据存储、数据展示4步;

2.MongoDB中常见的条件操作符有:$gt(>) 、$lt :(<) 、$gte :(>=) 、$lte :(<= ) ;

3.需要注意的坑:在筛选数据时,需要先将爬取的数据定义为整数后,才能进行大小判定。

你可能感兴趣的:(Python学习笔记6——使用MongoDB数据库)