MySQL数据库与Python

RDBMS和数据库的关系

SQL

Structured Query Language

SQL是结构化查询语言,是一种用来操作RDBMS的数据库语言,当前关系型数据库都支持使用SQL语言进行操作,也就是说可以通过 SQL 操作 oracle,sql server,mysql,sqlite 等等所有的关系型的数据库

  • SQL语句主要分为:
    • DQL:数据查询语言,用于对数据进行查询,如select
    • DML:数据操作语言,对数据进行增加、修改、删除,如insert、udpate、delete
    • TPL:事务处理语言,对事务进行处理,包括begin transaction、commit、rollback
    • DCL:数据控制语言,进行授权与权限回收,如grant、revoke
    • DDL:数据定义语言,进行数据库、表的管理等,如create、drop
    • CCL:指针控制语言,通过控制指针完成表的操作,如declare cursor
  • 对于web程序员来讲,重点是数据的crud(增删改查),必须熟练编写DQL、DML,能够编写DDL完成数据库、表的操作,其它语言如TPL、DCL、CCL了解即可
  • SQL 是一门特殊的语言,专门用来操作关系数据库
  • 不区分大小写

学习要求

  • 熟练掌握数据增删改查相关的 SQL 语句编写

  • 在 Python代码中操作数据就是通过 SQL 语句来操作数据

    创建Connection连接

    conn = connect(host=‘localhost’, port=3306, user=‘root’, password=‘mysql’, database=‘python1’, charset=‘utf8’)

    得Cursor对象

    cs = conn.cursor()

    更新

    sql = ‘update students set name=“刘邦” where id=6’

    删除

    sql = ‘delete from students where id=6’

    执行select语句,并返回受影响的行数:查询一条学生数据

    sql = ‘select id,name from students where id = 7’

    sql = ‘SELECT id,name FROM students WHERE id = 7’

    count=cs.execute(sql)

    打印受影响的行数

    print(count)

MySQL 简介

  • 点击查看MySQL官方网站
  • MySQL是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,后来被Sun公司收购,Sun公司后来又被Oracle公司收购,目前属于Oracle旗下产品

特点

  • 使用C和C++编写,并使用了多种编译器进行测试,保证源代码的可移植性
  • 支持多种操作系统,如Linux、Windows、AIX、FreeBSD、HP-UX、MacOS、NovellNetware、OpenBSD、OS/2 Wrap、Solaris等
  • 为多种编程语言提供了API,如C、C++、Python、Java、Perl、PHP、Eiffel、Ruby等
  • 支持多线程,充分利用CPU资源
  • 优化的SQL查询算法,有效地提高查询速度
  • 提供多语言支持,常见的编码如GB2312、BIG5、UTF8
  • 提供TCP/IP、ODBC和JDBC等多种数据库连接途径
  • 提供用于管理、检查、优化数据库操作的管理工具
  • 大型的数据库。可以处理拥有上千万条记录的大型数据库
  • 支持多种存储引擎
  • MySQL 软件采用了双授权政策,它分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择MySQL作为网站数据库
  • MySQL使用标准的SQL数据语言形式
  • Mysql是可以定制的,采用了GPL协议,你可以修改源码来开发自己的Mysql系统
  • 在线DDL更改功能
  • 复制全局事务标识
  • 复制无崩溃从机
  • 复制多线程从机

开源 免费 不要钱 使用范围广,跨平台支持性好,提供了多种语言调用的 API

是学习数据库开发的首选

服务器端安装

  • 安装服务器端:在终端中输入如下命令,回车后,然后按照提示输入

    sudo apt-get install mysql-server

  • 当前使用的ubuntu镜像中已经安装好了mysql服务器端,无需再安装,并且设置成了开机自启动

  • 服务器用于接收客户端的请求、执行sql语句、管理数据库

  • 服务器端一般以服务方式管理,名称为mysql

  • 启动服务

    sudo service mysql start

  • 查看进程中是否存在mysql服务

    ps ajx|grep mysql

  • 停止服务

    sudo service mysql stop

  • 重启服务

    sudo service mysql restart

配置

  • 配置文件目录为/etc/mysql/mysql.cnf

  • 进入conf.d目录,打开mysql.cnf,发现并没有配置

  • 进入mysql.conf.d目录,打开mysql.cnf,可以看到配置项

  • 主要配置项如下

    bind-address表示服务器绑定的ip,默认为127.0.0.1

    port表示端口,默认为3306

    datadir表示数据库目录,默认为/var/lib/mysql

    general_log_file表示普通日志,默认为/var/log/mysql/mysql.log

    log_error表示错误日志,默认为/var/log/mysql/error.log

客户端

  • 客户端为开发人员与dba使用,通过socket方式与服务端通信,常用的有navicat、命令行mysql

图形化界面客户端navicat

  • 可以到Navicat官网下载

  • 将压缩文件拷贝到ubuntu虚拟机中,放到桌面上,解压

    tar zxvf navicat112_mysql_cs_x64.tar.gz

  • 进入解压的目录,运行如下命令

    ./start_navicat

  • 启动如下图,详细功能见下节

  • 点击两次“取消”按钮后如下图

  • 点击“试用”按钮后如下图

  • 问题一:中文乱码

  • 解决:打开start_navicat文件

    将export LANG="en_US.UTF-8"改为export LANG=“zh_CN.UTF-8”

  • 问题二:试用期

  • 解决:删除用户目录下的.navicat64目录

    cd ~
    rm -r .navicat64

命令行客户端

  • 在终端运行如下命令,按提示填写信息

    sudo apt-get install mysql-client

  • 当前使用的ubuntu镜像中已经安装好了mysql客户端,无需再安装

  • 详细连接的命令可以查看帮助文档

    mysql --help

  • 最基本的连接命令如下,输入后回车

    mysql -u root -pmysql

  • 连接成功后提示如下图

  • 按ctrl+d或输入如下命令退出

    quit 或者 exit

数据完整性

  • 一个数据库就是一个完整的业务单元,可以包含多张表,数据被存储在表中
  • 在表中为了更加准确的存储数据,保证数据的正确有效,可以在创建表的时候,为表添加一些强制性的验证,包括数据字段的类型、约束

数据类型

  • 可以通过查看帮助文档查阅所有支持的数据类型
  • 使用数据类型的原则是:够用就行,尽量使用取值范围小的,而不用大的,这样可以更多的节省存储空间
  • 常用数据类型如下:
    • 整数:int,bit
    • 小数:decimal
    • 字符串:varchar,char
    • 日期时间: date, time, datetime
    • 枚举类型(enum)
  • 特别说明的类型如下:
    • decimal表示浮点数,如decimal(5,2)表示共存5位数,小数占2位
    • char表示固定长度的字符串,如char(3),如果填充’ab’时会补一个空格为’ab ’
    • varchar表示可变长度的字符串,如varchar(3),填充’ab’时就会存储’ab’
    • 字符串text表示存储大文本,当字符大于4000时推荐使用
    • 对于图片、音频、视频等文件,不存储在数据库中,而是上传到某个服务器上,然后在表中存储这个文件的保存路径
  • 更全的数据类型可以参考http://blog.csdn.net/anxpp/article/details/51284106

约束

  • 主键primary key:物理上存储的顺序
  • 非空not null:此字段不允许填写空值
  • 惟一unique:此字段的值不允许重复
  • 默认default:当不填写此值时会使用默认值,如果填写时以填写为准
  • 外键foreign key:对关系字段进行约束,当为关系字段填写值时,会到关联的表中查询此值是否存在,如果存在则填写成功,如果不存在则填写失败并抛出异常
  • 说明:虽然外键约束可以保证数据的有效性,但是在进行数据的crud(增加、修改、删除、查询)时,都会降低数据库的性能,所以不推荐使用,那么数据的有效性怎么保证呢?答:可以在逻辑层进行控制

数值类型(常用)

类型 字节大小 有符号范围(Signed) 无符号范围(Unsigned)
TINYINT 1 -128 ~ 127 0 ~ 255
SMALLINT 2 -32768 ~ 32767 0 ~ 65535
MEDIUMINT 3 -8388608 ~ 8388607 0 ~ 16777215
INT/INTEGER 4 -2147483648 ~2147483647 0 ~ 4294967295
BIGINT 8 -9223372036854775808 ~ 9223372036854775807 0 ~ 18446744073709551615

字符串

类型 字节大小 示例
CHAR 0-255 类型:char(3) 输入 ‘ab’, 实际存储为’ab ‘, 输入’abcd’ 实际存储为 ‘abc’
VARCHAR 0-255 类型:varchar(3) 输 ‘ab’,实际存储为’ab’, 输入’abcd’,实际存储为’abc’
TEXT 0-65535 大文本

日期时间类型

类型 字节大小 示例
DATE 4 ‘2020-01-01’
TIME 3 ‘12:29:59’
DATETIME 8 ‘2020-01-01 12:29:59’
YEAR 1 ‘2017’
TIMESTAMP 4 ‘1970-01-01 00:00:01’ UTC ~ ‘2038-01-01 00:00:01’ UTC

查询

创建数据库、数据表

-- 创建数据库
create database python_test_1 charset=utf8;

-- 使用数据库
use python_test_1;

-- students表
create table students(
    id int unsigned primary key auto_increment not null,
    name varchar(20) default '',
    age tinyint unsigned default 0,
    height decimal(5,2),
    gender enum('男','女','中性','保密') default '保密',
    cls_id int unsigned default 0,
    is_delete bit default 0
);

-- classes表
create table classes (
    id int unsigned auto_increment primary key not null,
    name varchar(30) not null
);

准备数据

-- 向students表中插入数据
insert into students values
(0,'小明',18,180.00,2,1,0),
(0,'小月月',18,180.00,2,2,1),
(0,'彭于晏',29,185.00,1,1,0),
(0,'刘德华',59,175.00,1,2,1),
(0,'黄蓉',38,160.00,2,1,0),
(0,'凤姐',28,150.00,4,2,1),
(0,'王祖贤',18,172.00,2,1,1),
(0,'周杰伦',36,NULL,1,1,0),
(0,'程坤',27,181.00,1,2,0),
(0,'刘亦菲',25,166.00,2,2,0),
(0,'金星',33,162.00,3,3,1),
(0,'静香',12,180.00,2,4,0),
(0,'郭靖',12,170.00,1,4,0),
(0,'周杰',34,176.00,2,5,0);

-- 向classes表中插入数据
insert into classes values (0, "python_01期"), (0, "python_02期");
  • 查询所有字段

    select * from 表名;
    例:
    select * from students;

  • 查询指定字段

    select 列1,列2,… from 表名;
    例:
    select name from students;

  • 使用 as 给字段起别名

    select id as 序号, name as 名字, gender as 性别 from students;

  • 可以通过 as 给表起别名

    – 如果是单表查询 可以省略表明
    select id, name, gender from students;

    – 表名.字段名
    select students.id,students.name,students.gender from students;

    – 可以通过 as 给表起别名
    select s.id,s.name,s.gender from students as s;

消除重复行

  • 在select后面列前使用distinct可以消除重复的行

    select distinct 列1,… from 表名;
    例:
    select distinct gender from students;

条件

使用where子句对表中的数据筛选,结果为true的行会出现在结果集中

  • 语法如下:

    select * from 表名 where 条件;
    例:
    select * from students where id=1;

  • where后面支持多种运算符,进行条件的处理

    • 比较运算符
    • 逻辑运算符
    • 模糊查询
    • 范围查询
    • 空判断

比较运算符

  • 等于: =
  • 大于: >
  • 大于等于: >=
  • 小于: <
  • 小于等于: <=
  • 不等于: != 或 <>

例1:查询编号大于3的学生

select * from students where id > 3;

例2:查询编号不大于4的学生

select * from students where id <= 4;

例3:查询姓名不是“黄蓉”的学生

select * from students where name != '黄蓉';

例4:查询没被删除的学生

select * from students where is_delete=0;

逻辑运算符

  • and
  • or
  • not

例5:查询编号大于3的女同学

select * from students where id > 3 and gender=0;

例6:查询编号小于4或没被删除的学生

select * from students where id < 4 or is_delete=0;

模糊查询

  • like
  • %表示任意多个任意字符
  • _表示一个任意字符

例7:查询姓黄的学生

select * from students where name like '黄%';

例8:查询姓黄并且“名”是一个字的学生

select * from students where name like '黄_';

例9:查询姓黄或叫靖的学生

select * from students where name like '黄%' or name like '%靖';

范围查询

  • in表示在一个非连续的范围内

例10:查询编号是1或3或8的学生

select * from students where id in(1,3,8);
  • between … and …表示在一个连续的范围内

例11:查询编号为3至8的学生

select * from students where id between 3 and 8;

例12:查询编号是3至8的男生

select * from students where (id between 3 and 8) and gender=1;

空判断

  • 注意:null与’'是不同的
  • 判空is null

例13:查询没有填写身高的学生

select * from students where height is null;
  • 判非空is not null

例14:查询填写了身高的学生

select * from students where height is not null;

例15:查询填写了身高的男生

select * from students where height is not null and gender=1;

优先级

  • 优先级由高到低的顺序为:小括号,not,比较运算符,逻辑运算符
  • and比or先运算,如果同时出现并希望先算or,需要结合()使用

排序

为了方便查看数据,可以对数据进行排序

语法:

select * from 表名 order by 列1 asc|desc [,列2 asc|desc,...]

说明

  • 将行数据按照列1进行排序,如果某些行列1的值相同时,则按照列2排序,以此类推
  • 默认按照列值从小到大排列(asc)
  • asc从小到大排列,即升序
  • desc从大到小排序,即降序

例1:查询未删除男生信息,按学号降序

select * from students where gender=1 and is_delete=0 order by id desc;

例2:查询未删除学生信息,按名称升序

select * from students where is_delete=0 order by name;

例3:显示所有的学生信息,先按照年龄从大–>小排序,当年龄相同时 按照身高从高–>矮排序

select * from students  order by age desc,height desc;

聚合函数

为了快速得到统计数据,经常会用到如下5个聚合函数

总数

  • count(*)表示计算总行数,括号中写星与列名,结果是相同的

例1:查询学生总数

select count(*) from students;

最大值

  • max(列)表示求此列的最大值

例2:查询女生的编号最大值

select max(id) from students where gender=2;

最小值

  • min(列)表示求此列的最小值

例3:查询未删除的学生最小编号

select min(id) from students where is_delete=0;

求和

  • sum(列)表示求此列的和

例4:查询男生的总年龄

select sum(age) from students where gender=1;

-- 平均年龄
select sum(age)/count(*) from students where gender=1;

平均值

  • avg(列)表示求此列的平均值

例5:查询未删除女生的编号平均值

select avg(id) from students where is_delete=0 and gender=2;

分组

group by

  1. group by的含义:将查询结果按照1个或多个字段进行分组,字段值相同的为一组

  2. group by可用于单个字段分组,也可用于多个字段分组

    select * from students;
    ±—±----------±-----±-------±-------±-------±----------+
    | id | name | age | height | gender | cls_id | is_delete |
    ±—±----------±-----±-------±-------±-------±----------+
    | 1 | 小明 | 18 | 180.00 | 女 | 1 | |
    | 2 | 小月月 | 18 | 180.00 | 女 | 2 | |
    | 3 | 彭于晏 | 29 | 185.00 | 男 | 1 | |
    | 4 | 刘德华 | 59 | 175.00 | 男 | 2 | |
    | 5 | 黄蓉 | 38 | 160.00 | 女 | 1 | |
    | 6 | 凤姐 | 28 | 150.00 | 保密 | 2 | |
    | 7 | 王祖贤 | 18 | 172.00 | 女 | 1 | |
    | 8 | 周杰伦 | 36 | NULL | 男 | 1 | |
    | 9 | 程坤 | 27 | 181.00 | 男 | 2 | |
    | 10 | 刘亦菲 | 25 | 166.00 | 女 | 2 | |
    | 11 | 金星 | 33 | 162.00 | 中性 | 3 | |
    | 12 | 静香 | 12 | 180.00 | 女 | 4 | |
    | 13 | 周杰 | 34 | 176.00 | 女 | 5 | |
    | 14 | 郭靖 | 12 | 170.00 | 男 | 4 | |
    ±—±----------±-----±-------±-------±-------±----------+

    select gender from students group by gender;
    ±-------+
    | gender |
    ±-------+
    | 男 |
    | 女 |
    | 中性 |
    | 保密 |
    ±-------+

根据gender字段来分组,gender字段的全部值有4个’男’,‘女’,‘中性’,‘保密’,所以分为了4组 当group by单独使用时,只显示出每组的第一条记录, 所以group by单独使用时的实际意义不大

group by + group_concat()

  1. group_concat(字段名)可以作为一个输出字段来使用,

  2. 表示分组之后,根据分组结果,使用group_concat()来放置每一组的某字段的值的集合

    select gender from students group by gender;
    ±-------+
    | gender |
    ±-------+
    | 男 |
    | 女 |
    | 中性 |
    | 保密 |
    ±-------+

    select gender,group_concat(name) from students group by gender;
    ±-------±----------------------------------------------------------+
    | gender | group_concat(name) |
    ±-------±----------------------------------------------------------+
    | 男 | 彭于晏,刘德华,周杰伦,程坤,郭靖 |
    | 女 | 小明,小月月,黄蓉,王祖贤,刘亦菲,静香,周杰 |
    | 中性 | 金星 |
    | 保密 | 凤姐 |
    ±-------±----------------------------------------------------------+

    select gender,group_concat(id) from students group by gender;
    ±-------±-----------------+
    | gender | group_concat(id) |
    ±-------±-----------------+
    | 男 | 3,4,8,9,14 |
    | 女 | 1,2,5,7,10,12,13 |
    | 中性 | 11 |
    | 保密 | 6 |
    ±-------±-----------------+

group by + 集合函数

  1. 通过group_concat()的启发,我们既然可以统计出每个分组的某字段的值的集合,那么我们也可以通过集合函数来对这个值的集合做一些操作

    select gender,group_concat(age) from students group by gender;
    ±-------±---------------------+
    | gender | group_concat(age) |
    ±-------±---------------------+
    | 男 | 29,59,36,27,12 |
    | 女 | 18,18,38,18,25,12,34 |
    | 中性 | 33 |
    | 保密 | 28 |
    ±-------±---------------------+

    分别统计性别为男/女的人年龄平均值
    select gender,avg(age) from students group by gender;
    ±-------±---------+
    | gender | avg(age) |
    ±-------±---------+
    | 男 | 32.6000 |
    | 女 | 23.2857 |
    | 中性 | 33.0000 |
    | 保密 | 28.0000 |
    ±-------±---------+

    分别统计性别为男/女的人的个数
    select gender,count() from students group by gender;
    ±-------±---------+
    | gender | count(
    ) |
    ±-------±---------+
    | 男 | 5 |
    | 女 | 7 |
    | 中性 | 1 |
    | 保密 | 1 |
    ±-------±---------+

group by + having

  1. having 条件表达式:用来分组查询后指定一些条件来输出查询结果

  2. having作用和where一样,但having只能用于group by

    select gender,count() from students group by gender having count()>2;
    ±-------±---------+
    | gender | count(*) |
    ±-------±---------+
    | 男 | 5 |
    | 女 | 7 |
    ±-------±---------+

group by + with rollup

  1. with rollup的作用是:在最后新增一行,来记录当前列里所有记录的总和

    select gender,count() from students group by gender with rollup;
    ±-------±---------+
    | gender | count(
    ) |
    ±-------±---------+
    | 男 | 5 |
    | 女 | 7 |
    | 中性 | 1 |
    | 保密 | 1 |
    | NULL | 14 |
    ±-------±---------+

    select gender,group_concat(age) from students group by gender with rollup;
    ±-------±------------------------------------------+
    | gender | group_concat(age) |
    ±-------±------------------------------------------+
    | 男 | 29,59,36,27,12 |
    | 女 | 18,18,38,18,25,12,34 |
    | 中性 | 33 |
    | 保密 | 28 |
    | NULL | 29,59,36,27,12,18,18,38,18,25,12,34,33,28 |
    ±-------±------------------------------------------+

获取部分行

当数据量过大时,在一页中查看数据是一件非常麻烦的事情

语法

select * from 表名 limit start,count

说明

  • 从start开始,获取count条数据

例1:查询前3行男生信息

select * from students where gender=1 limit 0,3;

示例:分页

  • 已知:每页显示m条数据,当前显示第n页

  • 求总页数:此段逻辑后面会在python中实现

    • 查询总条数p1
    • 使用p1除以m得到p2
    • 如果整除则p2为总数页
    • 如果不整除则p2+1为总页数
  • 求第n页的数据

    select * from students where is_delete=0 limit (n-1)*m,m

连接查询

当查询结果的列来源于多张表时,需要将多张表连接成一个大的数据集,再选择合适的列返回

mysql支持三种类型的连接查询,分别为:

  • 内连接查询:查询的结果为两个表匹配到的数据

  • 右连接查询:查询的结果为两个表匹配到的数据,右表特有的数据,对于左表中不存在的数据使用null填充

  • 左连接查询:查询的结果为两个表匹配到的数据,左表特有的数据,对于右表中不存在的数据使用null填充

语法

select * from 表1 inner或left或right join 表2 on 表1.列 = 表2.列

例1:使用内连接查询班级表与学生表

select * from students inner join classes on students.cls_id = classes.id;

例2:使用左连接查询班级表与学生表

  • 此处使用了as为表起别名,目的是编写简单

    select * from students as s left join classes as c on s.cls_id = c.id;

例3:使用右连接查询班级表与学生表

select * from students as s right join classes as c on s.cls_id = c.id;

例4:查询学生姓名及班级名称

select s.name,c.name from students as s inner join classes as c on s.cls_id = c.id;

自关联

  • 设计省信息的表结构provinces
    • id
    • ptitle
  • 设计市信息的表结构citys
    • id
    • ctitle
    • proid
  • citys表的proid表示城市所属的省,对应着provinces表的id值

问题:

能不能将两个表合成一张表呢?

思考:

观察两张表发现,citys表比provinces表多一个列proid,其它列的类型都是一样的

意义:

存储的都是地区信息,而且每种信息的数据量有限,没必要增加一个新表,或者将来还要存储区、乡镇信息,都增加新表的开销太大

答案:

定义表areas,结构如下

  • id
  • atitle
  • pid

说明:

  • 因为省没有所属的省份,所以可以填写为null
  • 城市所属的省份pid,填写省所对应的编号id
  • 这就是自关联,表中的某一列,关联了这个表中的另外一列,但是它们的业务逻辑含义是不一样的,城市信息的pid引用的是省信息的id
  • 在这个表中,结构不变,可以添加区县、乡镇街道、村社区等信息

创建areas表的语句如下:

create table areas(
    aid int primary key,
    atitle varchar(20),
    pid int
);
  • 从sql文件中导入数据

    source areas.sql;

  • 查询一共有多少个省

    select count(*) from areas where pid is null;

  • 例1:查询省的名称为“山西省”的所有城市

    select city.* from areas as city
    inner join areas as province on city.pid=province.aid
    where province.atitle=‘山西省’;

  • 例2:查询市的名称为“广州市”的所有区县

    select dis.* from areas as dis
    inner join areas as city on city.aid=dis.pid
    where city.atitle=‘广州市’;

子查询

子查询

在一个 select 语句中,嵌入了另外一个 select 语句, 那么被嵌入的 select 语句称之为子查询语句

主查询

主要查询的对象,第一条 select 语句

主查询和子查询的关系

  • 子查询是嵌入到主查询中
  • 子查询是辅助主查询的,要么充当条件,要么充当数据源
  • 子查询是可以独立存在的语句,是一条完整的 select 语句

子查询分类

  • 标量子查询: 子查询返回的结果是一个数据(一行一列)
  • 列子查询: 返回的结果是一列(一列多行)
  • 行子查询: 返回的结果是一行(一行多列)

标量子查询

  1. 查询班级学生平均年龄
  2. 查询大于平均年龄的学生

查询班级学生的平均身高

select * from students where age > (select avg(age) from students);

列级子查询

  • 查询还有学生在班的所有班级名字

    1. 找出学生表中所有的班级 id
    2. 找出班级表中对应的名字

    select name from classes where id in (select cls_id from students);

行级子查询

  • 需求: 查找班级年龄最大,身高最高的学生

  • 行元素: 将多个字段合成一个行元素,在行级子查询中会使用到行元素

    select * from students where (height,age) = (select max(height),max(age) from students);

子查询中特定关键字使用

  • in 范围
    • 格式: 主查询 where 条件 in (列子查询)

总结

查询的完整格式 _ 不要被吓到 其实很简单 ! _ !

SELECT select_expr [,select_expr,...] [      
      FROM tb_name
      [WHERE 条件判断]
      [GROUP BY {col_name | postion} [ASC | DESC], ...] 
      [HAVING WHERE 条件判断]
      [ORDER BY {col_name|expr|postion} [ASC | DESC], ...]
      [ LIMIT {[offset,]rowcount | row_count OFFSET offset}]
]
  • 完整的select语句

    select distinct *
    from 表名
    where …
    group by … having …
    order by …
    limit start,count

  • 执行顺序为:

    • from 表名
    • where …
    • group by …
    • select distinct *
    • having …
    • order by …
    • limit start,count
  • 实际使用中,只是语句中某些部分的组合,而不是全部

MySQL与Python交互:

准备数据

创建数据表

-- 创建 "京东" 数据库
create database jing_dong charset=utf8;

-- 使用 "京东" 数据库
use jing_dong;

-- 创建一个商品goods数据表
create table goods(
    id int unsigned primary key auto_increment not null,
    name varchar(150) not null,
    cate_name varchar(40) not null,
    brand_name varchar(40) not null,
    price decimal(10,3) not null default 0,
    is_show bit not null default 1,
    is_saleoff bit not null default 0
);

插入数据

-- 向goods表中插入数据

insert into goods values(0,'r510vc 15.6英寸笔记本','笔记本','华硕','3399',default,default); 
insert into goods values(0,'y400n 14.0英寸笔记本电脑','笔记本','联想','4999',default,default);
insert into goods values(0,'g150th 15.6英寸游戏本','游戏本','雷神','8499',default,default); 
insert into goods values(0,'x550cc 15.6英寸笔记本','笔记本','华硕','2799',default,default); 
insert into goods values(0,'x240 超极本','超级本','联想','4880',default,default); 
insert into goods values(0,'u330p 13.3英寸超极本','超级本','联想','4299',default,default); 
insert into goods values(0,'svp13226scb 触控超极本','超级本','索尼','7999',default,default); 
insert into goods values(0,'ipad mini 7.9英寸平板电脑','平板电脑','苹果','1998',default,default);
insert into goods values(0,'ipad air 9.7英寸平板电脑','平板电脑','苹果','3388',default,default); 
insert into goods values(0,'ipad mini 配备 retina 显示屏','平板电脑','苹果','2788',default,default); 
insert into goods values(0,'ideacentre c340 20英寸一体电脑 ','台式机','联想','3499',default,default); 
insert into goods values(0,'vostro 3800-r1206 台式电脑','台式机','戴尔','2899',default,default); 
insert into goods values(0,'imac me086ch/a 21.5英寸一体电脑','台式机','苹果','9188',default,default); 
insert into goods values(0,'at7-7414lp 台式电脑 linux )','台式机','宏碁','3699',default,default); 
insert into goods values(0,'z220sff f4f06pa工作站','服务器/工作站','惠普','4288',default,default); 
insert into goods values(0,'poweredge ii服务器','服务器/工作站','戴尔','5388',default,default); 
insert into goods values(0,'mac pro专业级台式电脑','服务器/工作站','苹果','28888',default,default); 
insert into goods values(0,'hmz-t3w 头戴显示设备','笔记本配件','索尼','6999',default,default); 
insert into goods values(0,'商务双肩背包','笔记本配件','索尼','99',default,default); 
insert into goods values(0,'x3250 m4机架式服务器','服务器/工作站','ibm','6888',default,default); 
insert into goods values(0,'商务双肩背包','笔记本配件','索尼','99',default,default);

SQL演练

  1. SQL语句的强化
  • 查询类型cate_name为 ‘超极本’ 的商品名称、价格

    select name,price from goods where cate_name = ‘超级本’;

  • 显示商品的种类

    select cate_name from goods group by cate_name;

  • 求所有电脑产品的平均价格,并且保留两位小数

    select round(avg(price),2) as avg_price from goods;

  • 显示每种商品的平均价格

    select cate_name,avg(price) from goods group by cate_name;

  • 查询每种类型的商品中 最贵、最便宜、平均价、数量

    select cate_name,max(price),min(price),avg(price),count(*) from goods group by cate_name;

  • 查询所有价格大于平均价格的商品,并且按价格降序排序

    select id,name,price from goods
    where price > (select round(avg(price),2) as avg_price from goods)
    order by price desc;

  • 查询每种类型中最贵的电脑信息

    select * from goods
    inner join
    (
    select
    cate_name,
    max(price) as max_price,
    min(price) as min_price,
    avg(price) as avg_price,
    count(*) from goods group by cate_name
    ) as goods_new_info
    on goods.cate_name=goods_new_info.cate_name and goods.price=goods_new_info.max_price;

  1. 创建 “商品分类”" 表

    – 创建商品分类表
    create table if not exists goods_cates(
    id int unsigned primary key auto_increment,
    name varchar(40) not null
    );

  • 查询goods表中商品的种类

    select cate_name from goods group by cate_name;

  • 将分组结果写入到goods_cates数据表

    insert into goods_cates (name) select cate_name from goods group by cate_name;

  1. 同步表数据
  • 通过goods_cates数据表来更新goods表

    update goods as g inner join goods_cates as c on g.cate_name=c.name set g.cate_name=c.id;

  1. 创建 “商品品牌表” 表
  • 通过create…select来创建数据表并且同时写入记录,一步到位

    – select brand_name from goods group by brand_name;

    – 在创建数据表的时候一起插入数据
    – 注意: 需要对brand_name 用as起别名,否则name字段就没有值
    create table goods_brands (
    id int unsigned primary key auto_increment,
    name varchar(40) not null) select brand_name as name from goods group by brand_name;

  1. 同步数据
  • 通过goods_brands数据表来更新goods数据表

    update goods as g inner join goods_brands as b on g.brand_name=b.name set g.brand_name=b.id;

  1. 修改表结构
  • 查看 goods 的数据表结构,会发现 cate_name 和 brand_name对应的类型为 varchar 但是存储的都是数字

    desc goods;

  • 通过alter table语句修改表结构

    alter table goods
    change cate_name cate_id int unsigned not null,
    change brand_name brand_id int unsigned not null;

  1. 外键
  • 分别在 goods_cates 和 goods_brands表中插入记录

    insert into goods_cates(name) values (‘路由器’),(‘交换机’),(‘网卡’);
    insert into goods_brands(name) values (‘海尔’),(‘清华同方’),(‘神舟’);

  • 在 goods 数据表中写入任意记录

    insert into goods (name,cate_id,brand_id,price)
    values(‘LaserJet Pro P1606dn 黑白激光打印机’, 12, 4,‘1849’);

  • 查询所有商品的详细信息 (通过内连接)

    select g.id,g.name,c.name,b.name,g.price from goods as g
    inner join goods_cates as c on g.cate_id=c.id
    inner join goods_brands as b on g.brand_id=b.id;

  • 查询所有商品的详细信息 (通过左连接)

    select g.id,g.name,c.name,b.name,g.price from goods as g
    left join goods_cates as c on g.cate_id=c.id
    left join goods_brands as b on g.brand_id=b.id;

  • 如何防止无效信息的插入,就是可以在插入前判断类型或者品牌名称是否存在呢? 可以使用之前讲过的外键来解决

  • 外键约束:对数据的有效性进行验证

  • 关键字: foreign key,只有 innodb数据库引擎 支持外键约束

  • 对于已经存在的数据表 如何更新外键约束

    – 给brand_id 添加外键约束成功
    alter table goods add foreign key (brand_id) references goods_brands(id);
    – 给cate_id 添加外键失败
    – 会出现1452错误
    – 错误原因:已经添加了一个不存在的cate_id值12,因此需要先删除
    alter table goods add foreign key (cate_id) references goods_cates(id);

  • 如何在创建数据表的时候就设置外键约束呢?

  • 注意: goods 中的 cate_id 的类型一定要和 goods_cates 表中的 id 类型一致

    create table goods(
    id int primary key auto_increment not null,
    name varchar(40) default ‘’,
    price decimal(5,2),
    cate_id int unsigned,
    brand_id int unsigned,
    is_show bit default 1,
    is_saleoff bit default 0,
    foreign key(cate_id) references goods_cates(id),
    foreign key(brand_id) references goods_brands(id)
    );

  • 如何取消外键约束

    – 需要先获取外键约束名称,该名称系统会自动生成,可以通过查看表创建语句来获取名称
    show create table goods;
    – 获取名称之后就可以根据名称来删除外键约束
    alter table goods drop foreign key 外键名称;

  • 在实际开发中,很少会使用到外键约束,会极大的降低表更新的效率

数据库的设计

创建 “商品分类” 表(之前已经创建,无需再次创建)

create table goods_cates(
    id int unsigned primary key auto_increment not null,
    name varchar(40) not null
);

创建 “商品品牌” 表(之前已经创建,无需再次创建)

create table goods_brands (
    id int unsigned primary key auto_increment not null,
    name varchar(40) not null
);

创建 “商品” 表(之前已经创建,无需再次创建)

create table goods(
    id int unsigned primary key auto_increment not null,
    name varchar(40) default '',
    price decimal(5,2),
    cate_id int unsigned,
    brand_id int unsigned,
    is_show bit default 1,
    is_saleoff bit default 0,
    foreign key(cate_id) references goods_cates(id),
    foreign key(brand_id) references goods_brands(id)
);

创建 “顾客” 表

create table customer(
    id int unsigned auto_increment primary key not null,
    name varchar(30) not null,
    addr varchar(100),
    tel varchar(11) not null
);

创建 “订单” 表

create table orders(
    id int unsigned auto_increment primary key not null,
    order_date_time datetime not null,
    customer_id int unsigned,
    foreign key(customer_id) references customer(id)
);

创建 “订单详情” 表

create table order_detail(
    id int unsigned auto_increment primary key not null,
    order_id int unsigned not null,
    goods_id int unsigned not null,
    quantity tinyint unsigned not null,
    foreign key(order_id) references orders(id),
    foreign key(goods_id) references goods(id)
);

说明

  • 以上创建表的顺序是有要求的,即如果goods表中的外键约束用的是goods_cates或者是goods_brands,那么就应该先创建这2个表,否则创建goods会失败
  • 创建外键时,一定要注意类型要相同,否则失败

Python 中操作 MySQL 步骤

引入模块

  • 在py文件中引入pymysql模块

    from pymysql import *

Connection 对象

  • 用于建立与数据库的连接

  • 创建对象:调用connect()方法

    conn=connect(参数列表)

  • 参数host:连接的mysql主机,如果本机是’localhost’

  • 参数port:连接的mysql主机的端口,默认是3306

  • 参数database:数据库的名称

  • 参数user:连接的用户名

  • 参数password:连接的密码

  • 参数charset:通信采用的编码方式,推荐使用utf8

对象的方法

  • close()关闭连接
  • commit()提交
  • cursor()返回Cursor对象,用于执行sql语句并获得结果

Cursor对象

  • 用于执行sql语句,使用频度最高的语句为select、insert、update、delete

  • 获取Cursor对象:调用Connection对象的cursor()方法

    cs1=conn.cursor()

对象的方法

  • close()关闭
  • execute(operation [, parameters ])执行语句,返回受影响的行数,主要用于执行insert、update、delete语句,也可以执行create、alter、drop等语句
  • fetchone()执行查询语句时,获取查询结果集的第一个行数据,返回一个元组
  • fetchall()执行查询时,获取结果集的所有行,一行构成一个元组,再将这些元组装入一个元组返回

对象的属性

  • rowcount只读属性,表示最近一次execute()执行后受影响的行数
  • connection获得当前连接对象

增删改

from pymysql import *

def main():
    # 创建Connection连接
    conn = connect(host='localhost',port=3306,database='jing_dong',user='root',password='mysql',charset='utf8')
    # 获得Cursor对象
    cs1 = conn.cursor()
    # 执行insert语句,并返回受影响的行数:添加一条数据
    # 增加
    count = cs1.execute('insert into goods_cates(name) values("硬盘")')
    #打印受影响的行数
    print(count)

    count = cs1.execute('insert into goods_cates(name) values("光盘")')
    print(count)

    # # 更新
    # count = cs1.execute('update goods_cates set name="机械硬盘" where name="硬盘"')
    # # 删除
    # count = cs1.execute('delete from goods_cates where id=6')

    # 提交之前的操作,如果之前已经之执行过多次的execute,那么就都进行提交
    conn.commit()

    # 关闭Cursor对象
    cs1.close()
    # 关闭Connection对象
    conn.close()

if __name__ == '__main__':
    main()

查询一行数据

from pymysql import *

def main():
    # 创建Connection连接
    conn = connect(host='localhost',port=3306,user='root',password='mysql',database='jing_dong',charset='utf8')
    # 获得Cursor对象
    cs1 = conn.cursor()
    # 执行select语句,并返回受影响的行数:查询一条数据
    count = cs1.execute('select id,name from goods where id>=4')
    # 打印受影响的行数
    print("查询到%d条数据:" % count)

    for i in range(count):
        # 获取查询的结果
        result = cs1.fetchone()
        # 打印查询的结果
        print(result)
        # 获取查询的结果

    # 关闭Cursor对象
    cs1.close()
    conn.close()

if __name__ == '__main__':
    main()

查询多行数据

from pymysql import *

def main():
    # 创建Connection连接
    conn = connect(host='localhost',port=3306,user='root',password='mysql',database='jing_dong',charset='utf8')
    # 获得Cursor对象
    cs1 = conn.cursor()
    # 执行select语句,并返回受影响的行数:查询一条数据
    count = cs1.execute('select id,name from goods where id>=4')
    # 打印受影响的行数
    print("查询到%d条数据:" % count)

    # for i in range(count):
    #     # 获取查询的结果
    #     result = cs1.fetchone()
    #     # 打印查询的结果
    #     print(result)
    #     # 获取查询的结果

    result = cs1.fetchall()
    print(result)

    # 关闭Cursor对象
    cs1.close()
    conn.close()

if __name__ == '__main__':
    main()

参数化

  • sql语句的参数化,可以有效防止sql注入

  • 注意:此处不同于python的字符串格式化,全部使用%s占位

    from pymysql import *

    def main():

      find_name = input("请输入物品名称:")
    
      # 创建Connection连接
      conn = connect(host='localhost',port=3306,user='root',password='mysql',database='jing_dong',charset='utf8')
      # 获得Cursor对象
      cs1 = conn.cursor()
    
    
      # # 非安全的方式
      # # 输入 " or 1=1 or "   (双引号也要输入)
      # sql = 'select * from goods where name="%s"' % find_name
      # print("""sql===>%s<====""" % sql)
      # # 执行select语句,并返回受影响的行数:查询所有数据
      # count = cs1.execute(sql)
    
      # 安全的方式
      # 构造参数列表
      params = [find_name]
      # 执行select语句,并返回受影响的行数:查询所有数据
      count = cs1.execute('select * from goods where name=%s', params)
      # 注意:
      # 如果要是有多个参数,需要进行参数化
      # 那么params = [数值1, 数值2....],此时sql语句中有多个%s即可 
    
      # 打印受影响的行数
      print(count)
      # 获取查询的结果
      # result = cs1.fetchone()
      result = cs1.fetchall()
      # 打印查询的结果
      print(result)
      # 关闭Cursor对象
      cs1.close()
      # 关闭Connection对象
      conn.close()
    

    if name == ‘main’:
    main()

MySQL高级:

视图

  1. 问题

对于复杂的查询,往往是有多个数据表进行关联查询而得到,如果数据库因为需求等原因发生了改变,为了保证查询出来的数据与之前相同,则需要在多个地方进行修改,维护起来非常麻烦

解决办法:定义视图

  1. 视图是什么

通俗的讲,视图就是一条SELECT语句执行后返回的结果集。所以我们在创建视图的时候,主要的工作就落在创建这条SQL查询语句上。

视图是对若干张基本表的引用,一张虚表,查询语句执行的结果,不存储具体的数据(基本表数据发生了改变,视图也会跟着改变);

方便操作,特别是查询操作,减少复杂的SQL语句,增强可读性;

  1. 定义视图

建议以v_开头

create view 视图名称 as select语句;
  1. 查看视图

查看表会将所有的视图也列出来

show tables;
  1. 使用视图

视图的用途就是查询

select * from v_stu_score;
  1. 删除视图

    drop view 视图名称;
    例:
    drop view v_stu_sco;

  2. 视图demo

  3. 视图的作用

  4. 提高了重用性,就像一个函数

  5. 对数据库重构,却不影响程序的运行

  6. 提高了安全性能,可以对不同的用户

  7. 让数据更加清晰

事务

  1. 为什么要有事务

事务广泛的运用于订单系统、银行系统等多种场景

例如:

A用户和B用户是银行的储户,现在A要给B转账500元,那么需要做以下几件事:

  1. 检查A的账户余额>500元;
  2. A 账户中扣除500元;
  3. B 账户中增加500元;

正常的流程走下来,A账户扣了500,B账户加了500,皆大欢喜。

那如果A账户扣了钱之后,系统出故障了呢?A白白损失了500,而B也没有收到本该属于他的500。

以上的案例中,隐藏着一个前提条件:A扣钱和B加钱,要么同时成功,要么同时失败。事务的需求就在于此

所谓事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。

例如,银行转帐工作:从一个帐号扣款并使另一个帐号增款,这两个操作要么都执行,要么都不执行。所以,应该把他们看成一个事务。事务是数据库维护数据一致性的单位,在每个事务结束时,都能保持数据一致性

事务四大特性(简称ACID)

  • 原子性(Atomicity)
  • 一致性(Consistency)
  • 隔离性(Isolation)
  • 持久性(Durability)

以下内容出自《高性能MySQL》第三版,了解事务的ACID及四种隔离级有助于我们更好的理解事务运作。

下面举一个银行应用是解释事务必要性的一个经典例子。假如一个银行的数据库有两张表:支票表(checking)和储蓄表(savings)。现在要从用户Jane的支票账户转移200美元到她的储蓄账户,那么至少需要三个步骤:

  1. 检查支票账户的余额高于或者等于200美元。
  2. 从支票账户余额中减去200美元。
  3. 在储蓄帐户余额中增加200美元。

上述三个步骤的操作必须打包在一个事务中,任何一个步骤失败,则必须回滚所有的步骤。

可以用START TRANSACTION语句开始一个事务,然后要么使用COMMIT提交将修改的数据持久保存,要么使用ROLLBACK撤销所有的修改。事务SQL的样本如下:

  1. start transaction;
  2. select balance from checking where customer_id = 10233276;
  3. update checking set balance = balance - 200.00 where customer_id = 10233276;
  4. update savings set balance = balance + 200.00 where customer_id = 10233276;
  5. commit;

一个很好的事务处理系统,必须具备这些标准特性:

  • 原子性(atomicity)

一个事务必须被视为一个不可分割的最小工作单元,整个事务中的所有操作要么全部提交成功,要么全部失败回滚,对于一个事务来说,不可能只执行其中的一部分操作,这就是事务的原子性

  • 一致性(consistency)

数据库总是从一个一致性的状态转换到另一个一致性的状态。(在前面的例子中,一致性确保了,即使在执行第三、四条语句之间时系统崩溃,支票账户中也不会损失200美元,因为事务最终没有提交,所以事务中所做的修改也不会保存到数据库中。)

  • 隔离性(isolation)

通常来说,一个事务所做的修改在最终提交以前,对其他事务是不可见的。(在前面的例子中,当执行完第三条语句、第四条语句还未开始时,此时有另外的一个账户汇总程序开始运行,则其看到支票帐户的余额并没有被减去200美元。)

  • 持久性(durability)

一旦事务提交,则其所做的修改会永久保存到数据库。(此时即使系统崩溃,修改的数据也不会丢失。)

事务命令

表的引擎类型必须是innodb类型才可以使用事务,这是mysql表的默认引擎

查看表的创建语句,可以看到engine=innodb

-- 选择数据库
use jing_dong;
-- 查看goods表
show create table goods;

开启事务,命令如下:

  • 开启事务后执行修改命令,变更会维护到本地缓存中,而不维护到物理表中

    begin;
    或者
    start transaction;

提交事务,命令如下

  • 将缓存中的数据变更维护到物理表中

    commit;

回滚事务,命令如下:

  • 放弃缓存中变更的数据

    rollback;

注意

  1. 修改数据的命令会自动的触发事务,包括insert、update、delete
  2. 而在SQL语句中有手动开启事务的原因是:可以进行多次数据的修改,如果成功一起成功,否则一起会滚到之前的数据

提交

  • 为了演示效果,需要打开两个终端窗口,使用同一个数据库,操作同一张表(用到之前的jing_dong数据,可以回到mysql第3天中查看)

step1:连接

  • 终端1:查询商品分类信息

    select * from goods_cates;

step2:增加数据

  • 终端2:开启事务,插入数据

    begin;
    insert into goods_cates(name) values(‘小霸王游戏机’);

  • 终端2:查询数据,此时有新增的数据

    select * from goods_cates;

step3:查询

  • 终端1:查询数据,发现并没有新增的数据

    select * from goods_cates;

step4:提交

  • 终端2:完成提交

    commit;

step5:查询

  • 终端1:查询,发现有新增的数据

    select * from goods_cates;

回滚

  • 为了演示效果,需要打开两个终端窗口,使用同一个数据库,操作同一张表

step1:连接

  • 终端1

    select * from goods_cates;

step2:增加数据

  • 终端2:开启事务,插入数据

    begin;
    insert into goods_cates(name) values(‘小霸王游戏机’);

  • 终端2:查询数据,此时有新增的数据

    select * from goods_cates;

step3:查询

  • 终端1:查询数据,发现并没有新增的数据

    select * from goods_cates;

step4:回滚

  • 终端2:完成回滚

    rollback;

step5:查询

  • 终端1:查询数据,发现没有新增的数据

    select * from goods_cates;

索引

  1. 思考

在图书馆中是如何找到一本书的?

一般的应用系统对比数据库的读写比例在10:1左右(即有10次查询操作时有1次写的操作),

而且插入操作和更新操作很少出现性能问题,

遇到最多、最容易出问题还是一些复杂的查询操作,所以查询语句的优化显然是重中之重

  1. 解决办法

当数据库中数据量很大时,查找数据会变得很慢

优化方案:索引

  1. 索引是什么

索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分),它们包含着对数据表里所有记录的引用指针。

更通俗的说,数据库索引好比是一本书前面的目录,能加快数据库的查询速度

  1. 索引目的

索引的目的在于提高查询效率,可以类比字典,如果要查“mysql”这个单词,我们肯定需要定位到m字母,然后从下往下找到y字母,再找到剩下的sql。如果没有索引,那么你可能需要把所有单词看一遍才能找到你想要的,如果我想找到m开头的单词呢?或者ze开头的单词呢?是不是觉得如果没有索引,这个事情根本无法完成?

  1. 索引原理

除了词典,生活中随处可见索引的例子,如火车站的车次表、图书的目录等。它们的原理都是一样的,通过不断的缩小想要获得数据的范围来筛选出最终想要的结果,同时把随机的事件变成顺序的事件,也就是我们总是通过同一种查找方式来锁定数据。

数据库也是一样,但显然要复杂许多,因为不仅面临着等值查询,还有范围查询(>、<、between、in)、模糊查询(like)、并集查询(or)等等。数据库应该选择怎么样的方式来应对所有的问题呢?我们回想字典的例子,能不能把数据分成段,然后分段查询呢?最简单的如果1000条数据,1到100分成第一段,101到200分成第二段,201到300分成第三段……这样查第250条数据,只要找第三段就可以了,一下子去除了90%的无效数据。

  1. 索引的使用
  • 查看索引

    show index from 表名;

  • 创建索引

    • 如果指定字段是字符串,需要指定长度,建议长度与定义字段时的长度一致

    • 字段类型如果不是字符串,可以不填写长度部分

      create index 索引名称 on 表名(字段名称(长度))

  • 删除索引:

    drop index 索引名称 on 表名;

  1. 索引demo

7.1. 创建测试表testindex

create table test_index(title varchar(10));

7.2 使用python程序(ipython也可以)通过pymsql模块 向表中加入十万条数据

from pymysql import connect

def main():
    # 创建Connection连接
    conn = connect(host='localhost',port=3306,database='jing_dong',user='root',password='mysql',charset='utf8')
    # 获得Cursor对象
    cursor = conn.cursor()
    # 插入10万次数据
    for i in range(100000):
        cursor.execute("insert into test_index values('ha-%d')" % i)
    # 提交数据
    conn.commit()

if __name__ == "__main__":
    main()

7.3. 查询

  • 开启运行时间监测:

    set profiling=1;

  • 查找第1万条数据ha-99999

    select * from test_index where title=‘ha-99999’;

  • 查看执行的时间:

    show profiles;

  • 为表title_index的title列创建索引:

    create index title_index on test_index(title(10));

  • 执行查询语句:

    select * from test_index where title=‘ha-99999’;

  • 再次查看执行的时间

    show profiles;

  1. 注意:

要注意的是,建立太多的索引将会影响更新和插入的速度,因为它需要同样更新每个索引文件。对于一个经常需要更新和插入的表格,就没有必要为一个很少使用的where字句单独建立索引了,对于比较小的表,排序的开销不会很大,也没有必要建立另外的索引。

建立索引会占用磁盘空间

账户管理

  • 在生产环境下操作数据库时,绝对不可以使用root账户连接,而是创建特定的账户,授予这个账户特定的操作权限,然后连接进行操作,主要的操作就是数据的crud
  • MySQL账户体系:根据账户所具有的权限的不同,MySQL的账户可以分为以下几种
    • 服务实例级账号:,启动了一个mysqld,即为一个数据库实例;如果某用户如root,拥有服务实例级分配的权限,那么该账号就可以删除所有的数据库、连同这些库中的表
    • 数据库级别账号:对特定数据库执行增删改查的所有操作
    • 数据表级别账号:对特定表执行增删改查等所有操作
    • 字段级别的权限:对某些表的特定字段进行操作
    • 存储程序级别的账号:对存储程序进行增删改查的操作
  • 账户的操作主要包括创建账户、删除账户、修改密码、授权权限等

注意:

  1. 进行账户操作时,需要使用root账户登录,这个账户拥有最高的实例级权限
  2. 通常都使用数据库级操作权限

授予权限

需要使用实例级账户登录后操作,以root为例

主要操作包括:

  • 查看所有用户
  • 修改密码
  • 删除用户
  1. 查看所有用户
  • 所有用户及权限信息存储在mysql数据库的user表中

  • 查看user表的结构

    desc user;

  • 主要字段说明:

    • Host表示允许访问的主机
    • User表示用户名
    • authentication_string表示密码,为加密后的值

查看所有用户

select host,user,authentication_string from user;

结果

mysql> select host,user,authentication_string from user;
+-----------+------------------+-------------------------------------------+
| host      | user             | authentication_string                     |
+-----------+------------------+-------------------------------------------+
| localhost | root             | *E74858DB86EBA20BC33D0AECAE8A8108C56B17FA |
| localhost | mysql.sys        | *THISISNOTAVALIDPASSWORDTHATCANBEUSEDHERE |
| localhost | debian-sys-maint | *EFED9C764966EDB33BB7318E1CBD122C0DFE4827 |
+-----------+------------------+-------------------------------------------+
3 rows in set (0.00 sec)
  1. 创建账户、授权
  • 需要使用实例级账户登录后操作,以root为例
  • 常用权限主要包括:create、alter、drop、insert、update、delete、select
  • 如果分配所有权限,可以使用all privileges

2.1 创建账户&授权

grant 权限列表 on 数据库 to '用户名'@'访问主机' identified by '密码';

2.2 示例1

创建一个laowang的账号,密码为123456,只能通过本地访问, 并且只能对jing_dong数据库中的所有表进行读操作

step1:使用root登录

mysql -uroot -p
回车后写密码,然后回车

step2:创建账户并授予所有权限

grant select on jing_dong.* to 'laowang'@'localhost' identified by '123456';

说明

  • 可以操作python数据库的所有表,方式为:jing_dong.*

  • 访问主机通常使用 百分号% 表示此账户可以使用任何ip的主机登录访问此数据库

  • 访问主机可以设置成 localhost或具体的ip,表示只允许本机或特定主机访问

  • 查看用户有哪些权限

    show grants for laowang@localhost;

step3:退出root的登录

quit

step4:使用laowang账户登录

mysql -ulaowang -p
回车后写密码,然后回车
  • 登录后效果如下图

2.3 示例2

创建一个laoli的账号,密码为12345678,可以任意电脑进行链接访问, 并且对jing_dong数据库中的所有表拥有所有权限

grant all privileges on jing_dong.* to "laoli"@"%" identified by "12345678"

账户操作

  1. 修改权限

    grant 权限名称 on 数据库 to 账户@主机 with grant option;

  2. 修改密码

使用root登录,修改mysql数据库的user表

  • 使用password()函数进行密码加密
    update user set authentication_string=password(‘新密码’) where user=‘用户名’;
    例:
    update user set authentication_string=password(‘123’) where user=‘laowang’;

  • 注意修改完成后需要刷新权限
    刷新权限:flush privileges

  1. 远程登录(危险慎用)

如果向在一个Ubuntu中使用msyql命令远程连接另外一台mysql服务器的话,通过以下方式即可完成,但是此方法仅仅了解就好了,不要在实际生产环境中使用

修改 /etc/mysql/mysql.conf.d/mysqld.cnf 文件

vim /etc/mysql/mysql.conf.d/mysqld.cnf

然后重启msyql

service mysql restart

在另外一台Ubuntu中进行连接测试

如果依然连不上,可能原因:

  1. 网络不通

通过 ping xxx.xxx.xx.xxx可以发现网络是否正常

2)查看数据库是否配置了bind_address参数

本地登录数据库查看my.cnf文件和数据库当前参数show variables like ‘bind_address’;

如果设置了bind_address=127.0.0.1 那么只能本地登录

3)查看数据库是否设置了skip_networking参数

如果设置了该参数,那么只能本地登录mysql数据库

4)端口指定是否正确

  1. 删除账户
  • 语法1:使用root登录

    drop user ‘用户名’@‘主机’;
    例:
    drop user ‘laowang’@’%’;

  • 语法2:使用root登录,删除mysql数据库的user表中数据

    delete from user where user=‘用户名’;
    例:
    delete from user where user=‘laowang’;

    – 操作结束之后需要刷新权限
    flush privileges

  • 推荐使用语法1删除用户, 如果使用语法1删除失败,采用语法2方式

  1. 忘记 root 账户密码怎么办 !!
  • 一般也轮不到我们来管理 root 账户,所以别瞎卖白粉的心了
  • 万一呢? 到时候再来查http://blog.csdn.net/lxpbs8851/article/details/10895085

MySQL主从同步配置

  1. 主从同步的定义

主从同步使得数据可以从一个数据库服务器复制到其他服务器上,在复制数据时,一个服务器充当主服务器(master),其余的服务器充当从服务器(slave)。因为复制是异步进行的,所以从服务器不需要一直连接着主服务器,从服务器甚至可以通过拨号断断续续地连接主服务器。通过配置文件,可以指定复制所有的数据库,某个数据库,甚至是某个数据库上的某个表。

使用主从同步的好处:

  • 通过增加从服务器来提高数据库的性能,在主服务器上执行写入和更新,在从服务器上向外提供读功能,可以动态地调整从服务器的数量,从而调整整个数据库的性能。
  • 提高数据安全,因为数据已复制到从服务器,从服务器可以终止复制进程,所以,可以在从服务器上备份而不破坏主服务器相应数据
  • 在主服务器上生成实时数据,而在从服务器上分析这些数据,从而提高主服务器的性能
  1. 主从同步的机制

Mysql服务器之间的主从同步是基于二进制日志机制,主服务器使用二进制日志来记录数据库的变动情况,从服务器通过读取和执行该日志文件来保持和主服务器的数据一致。

在使用二进制日志时,主服务器的所有操作都会被记录下来,然后从服务器会接收到该日志的一个副本。从服务器可以指定执行该日志中的哪一类事件(譬如只插入数据或者只更新数据),默认会执行日志中的所有语句。

每一个从服务器会记录关于二进制日志的信息:文件名和已经处理过的语句,这样意味着不同的从服务器可以分别执行同一个二进制日志的不同部分,并且从服务器可以随时连接或者中断和服务器的连接。

主服务器和每一个从服务器都必须配置一个唯一的ID号(在my.cnf文件的[mysqld]模块下有一个server-id配置项),另外,每一个从服务器还需要通过CHANGE MASTER TO语句来配置它要连接的主服务器的ip地址,日志文件名称和该日志里面的位置(这些信息存储在主服务器的数据库里)

  1. 配置主从同步的基本步骤

有很多种配置主从同步的方法,可以总结为如下的步骤:

  1. 在主服务器上,必须开启二进制日志机制和配置一个独立的ID

  2. 在每一个从服务器上,配置一个唯一的ID,创建一个用来专门复制主服务器数据的账号

  3. 在开始复制进程前,在主服务器上记录二进制文件的位置信息

  4. 如果在开始复制之前,数据库中已经有数据,就必须先创建一个数据快照(可以使用mysqldump导出数据库,或者直接复制数据文件)

  5. 配置从服务器要连接的主服务器的IP地址和登陆授权,二进制日志文件名和位置

  6. 详细配置主从同步的方法

主和从的身份可以自己指定,我们将虚拟机Ubuntu中MySQL作为主服务器,将Windows中的MySQL作为从服务器。 在主从设置前,要保证Ubuntu与Windows间的网络连通。

4.1 备份主服务器原有数据到从服务器

如果在设置主从同步前,主服务器上已有大量数据,可以使用mysqldump进行数据备份并还原到从服务器以实现数据的复制。

4.1.1 在主服务器Ubuntu上进行备份,执行命令:

mysqldump -uroot -pmysql --all-databases --lock-all-tables > ~/master_db.sql

说明

  • -u :用户名
  • -p :示密码
  • –all-databases :导出所有数据库
  • –lock-all-tables :执行操作时锁住所有表,防止操作时有数据修改
  • ~/master_db.sql :导出的备份数据(sql文件)位置,可自己指定

4.1.2 在从服务器Windows上进行数据还原

找到Windows上mysql命令的位置

新打开的命令窗口,在这个窗口中可以执行类似在Ubuntu终端中执行的mysql命令

将从主服务器Ubuntu中导出的文件复制到从服务器Windows中,可以将其放在上面mysql命令所在的文件夹中,方便还原使用

在刚打开的命令黑窗口中执行还原操作:

mysql –uroot –pmysql < master_db.sql

4.2 配置主服务器master(Ubuntu中的MySQL)

4.2.1 编辑设置mysqld的配置文件,设置log_bin和server-id

sudo vim /etc/mysql/mysql.conf.d/mysqld.cnf

4.2.2 重启mysql服务

sudo service mysql restart

4.2.3 登入主服务器Ubuntu中的mysql,创建用于从服务器同步数据使用的帐号

mysql –uroot –pmysql


GRANT REPLICATION SLAVE ON *.* TO 'slave'@'%' identified by 'slave';


FLUSH PRIVILEGES;

4.2.4 获取主服务器的二进制日志信息

SHOW MASTER STATUS;

File为使用的日志文件名字,Position为使用的文件位置,这两个参数须记下,配置从服务器时会用到

4.3 配置从服务器slave(Windows中的MySQL)

4.3.1 找到Windows中MySQL的配置文件

4.3.2 编辑my.ini文件,将server-id修改为2,并保存退出。

4.3.3 打开windows服务管理

可以在开始菜单中输入services.msc找到并运行

4.3.4 在打开的服务管理中找到MySQL57,并重启该服务

  1. 进入windows的mysql,设置连接到master主服务器

    change master to master_host=‘10.211.55.5’, master_user=‘slave’, master_password=‘slave’,master_log_file=‘mysql-bin.000006’, master_log_pos=590;

注:

  • master_host:主服务器Ubuntu的ip地址
  • master_log_file: 前面查询到的主服务器日志文件名
  • master_log_pos: 前面查询到的主服务器日志文件位置
  1. 开启同步,查看同步状态

  2. 测试主从同步

在Ubuntu的MySQL中(主服务器)创建一个数据库 在Windows的MySQL中(从服务器)查看新建的数据库是否存在

你可能感兴趣的:(MySQL数据库与Python)