活学活用Python04:让你的程序更有内涵——Python玩转Mongodb(上)

[TOC]

一、为什么要写这个小程序?

最近在玩爬虫,在《活学活用Python02:实时爬取NBA比赛分数,并显示在电脑屏幕》中就使用了爬虫,不过是实时获取的,显示出来。可是我的学习过程中需要一些数据集做分析,而这些数据需要保存下来,那么我就想到了需要数据库来帮我。Python跟数据库结合很方便,这里选择了当下比较火爆的数据库mongodb,说说把数据爬取下来并保存在数据库中。

二、整体思路要做的事情简单说来有:

  1. 安装配置mongodb2. 连接Python程序和mongodb,并用程序创建一个数据库3. 爬取比赛分数并保存到数据库中

三、梳理细节,形成导图

3.1安装配置mongodb

3.1.1 下载mangodb安装文件

mongodb官网,下载community版本即可,地址是:https://www.mongodb.com/download-center#community

活学活用Python04:让你的程序更有内涵——Python玩转Mongodb(上)_第1张图片

选择跟自己操作系统对应的版本,我的电脑是win10,选择了2008以上版本,这里我选择默认的64bit支持SSL版本,下载后的文件是:
mongodb-win32-x86_64-2008plus-ssl-3.4.5-signed.msi

3.1.2 安装mangodb

安装过程比较简单,一路accept即可,默认安装在C盘C:\Program Files,我更改安装位置选择了D盘根目录,其他的默认设置即可。
安装完成后去安装目录瞅一眼,看看都有啥,如图。


活学活用Python04:让你的程序更有内涵——Python玩转Mongodb(上)_第2张图片
3.1.3 配置 MongoDB

要运行MongoDB,需要首先设置一下运行环境,MongoDB配置起来有点麻烦,需要做的事情包括以下几步:

  • 需要一个配置文件记录data和log目录,以及一些配置信息
  • 设置一个data目录来保存数据
  • 另外还需要一个log目录保存日志
    下面我们分别来看一下每一步如何操作。
a. 新建一个配置文件记录data和log目录

在D:\MongoDB下创建一个配置文件mongod.cfg,并指定systemLog.path和storage.dbPath。编辑mongod.cfg,输入下面内容并保存,需要注意的是里面的空格不能用tab键和每个字母的大小写,尤其是dbPath。

systemLog:
    destination: file
    path: D:\MongoDB\data\log\mongod.log
storage:
    dbPath: D:\MongoDB\data\db
b.设置一个data目录来保存数据

在D:\MongoDB中新建一个目录\data\db


活学活用Python04:让你的程序更有内涵——Python玩转Mongodb(上)_第3张图片
c. 设置一个log目录保存日志

在D:\MongoDB\data下建立一个log文件夹,方法同上
至此MongoDB配置完毕,可以运行了,在终端中运行下面的命令

D:\MongoDB\Server\3.4\bin\mongod.exe --config D:\MongoDB\mongod.cfg

3.2 连接Python程序和mongodb,并用程序创建一个数据库

这部分工作包含以下几个步骤:

  • 安装Python操作mangodb的库pymango
  • 在新建Python,并在里面创建数据库
a. 安装Python操作mangodb的库pymango

pip install pymango


活学活用Python04:让你的程序更有内涵——Python玩转Mongodb(上)_第4张图片

安装好以后就可以import它了


活学活用Python04:让你的程序更有内涵——Python玩转Mongodb(上)_第5张图片
b. 新建Python,并在里面创建数据库
import pymongo
client = pymongo.MongoClient('localhost',27017)
NBA = client['NBA']
sheet_tab = NBA['sheet_tab']

(未完待续)

你可能感兴趣的:(活学活用Python04:让你的程序更有内涵——Python玩转Mongodb(上))