python爬虫教程(8)-数据存储之MySQL

欢迎来到python爬虫大讲堂,现在开始你的爬虫旅程吧!

存储到MySQL

MySQL是一种关系式数据库,使用SQL语言,MySQL将数据保存到不同表中,而不是将数据存放在一个大仓库里,因此比较灵活flexible。

MySQL安装

  1. 进入mysql官网下载页面:https://dev.mysql.com/downloads/mysql/,进入msi下载页面(点击Go to Download Page):
    python爬虫教程(8)-数据存储之MySQL_第1张图片
  2. 下载文件较大的那个msi文件,下载时间可能较长:
    python爬虫教程(8)-数据存储之MySQL_第2张图片
  3. 点开安装页面,选择custom安装,其中MySQL Servers必须安装,workbench是图形化操作界面,其它可以自己定制
  4. 选好了点击next-execute
  5. 接下来选择develop machine,点击next
  6. 在password框中输入你想要的密码,点击ok
  7. 接下来就安装完毕

因为我已经安装完毕,所以没有图片,敬请谅解!

安装完成后我们打开WorkBench:
python爬虫教程(8)-数据存储之MySQL_第3张图片
点击local instance MySQL80,输入你的密码,接下来我们开始学习mysql的基本操作:
python爬虫教程(8)-数据存储之MySQL_第4张图片

创建数据库

首先创建一个数据库,输入:

CREATE DATABASE scraping;

接下来使用这个数据库:

USE scraping

创建表格

现在我们在数据库中创建数据表:

CREATE TABLE urls{
id INT NOT NULL AUTO_INCREMENT,
url VARCHAR(300) NOT NULL,
need VARCHAR(500) NOT NULL,
PRIMARY KEY(id)
};

在这个数据表中,我们创建了id,url,need三个,id是整数,NOT NULL代表不能为空,AUTO_INCREMENT代表自动增长,一般将id作为主键(PRIMARY KEY)

url和need中的VARCHAR代表最长的长度,VARCHAR(100)就代表最长长度为100。

接下来查看数据表结构:

DESCRIBE urls;

插入数据

插入一些数据:

INSERT INTO urls(url,need) VALUES ('www.baidu.com','requests');

id为自动增加,所以不用手动添加。

提取数据

提取id为1的数据:

SELECT * FROM urls WHERE id=1;

*代表所有数据,加入我们只要看need:

SELECT need FROM urls WHERE id=1;

包含部分内容的选取:

SELECT * FROM urls WHERE need LIKE '%re%';

删除数据

删除一行数据:

DELETE FROM urls WHERE id=1;

删除表中所有数据:

truncate table urls;

修改数据

首先插入:

INSERT INTO urls(url,need) VALUES ('www.baidu.com','requests');

现在修改:

UPDATE urls SET url='www.google.com',content='selenium' WHERE id =2;

如果想了解更多,可以参见:http://www.runoob.com/mysql/mysql-tutorial.html

下次见!

你可能感兴趣的:(python入门爬虫教程,python,网络爬虫,MySQL,数据存储)