MySql数据库设计

前言

开发一个特定的项目,构建最优的数据库模式,建立最优化的数据库系统,比如冗余较小、结构合理,来满足各种用户的应用需求,是每个开发者、维护者应具备的技能。

一、命名规范

命名就尽可能的见名知意

1.库名规范

范例:

  • ecshop 一个商城的数据库名
  • wifi_ecshop 通过加前缀区别不同业务
  • ecshop_20190429 加年月日用于做备份数据的标示

2.表名规范

范例:

  • article 文章表
  • jk_article 带有表前缀(jk_)的,通过加前缀来区分不同表名
  • article_details 文章详情表 单词之间用下划线连接
  • article_keyword_relation 文章和关键字的关系表

3.表字段的规范

范例:

  • id 作为自增用于主键的序号
  • title 文章标题字段
  • category_id 用于和分类表(category)的主键(id)进行关联的字段
  • create_time 单词间还是用下划线连接

三、选择合适的存储引擎

在选择存储引擎时,应根据应用特点选择合适的存储引擎,对于复杂的应用系统可以根 据实际情况选择多种存储引擎进行组合。

下面是常用存储引擎的适用环境。

MyISAM: 默认的 MySQL 插件式存储引擎。如果应用是以读操作和插入操作为主,只有很少的更新和删除操作,并且对事务的完整性、并发性要求不是很高,那么选择这个存 储引擎是非常适合的。MyISAM 是在 Web、数据仓储和其他应用环境下最常使用的存储引擎 之一。

InnoDB: 用于事务处理应用程序,支持外键。如果应用对事务的完整性有比较高的 要求,在并发条件下要求数据的一致性,数据操作除了插入和查询以外,还包括很多的更新、 删除操作,那么 InnoDB 存储引擎应该是比较合适的选择。InnoDB 存储引擎除了有效地降低 由于删除和更新导致的锁定,还可以确保事务的完整提交(Commit)和回滚(Rollback), 对于类似计费系统或者财务系统等对数据准确性要求比较高的系统,InnoDB 都是合适的选 择。

MEMORY:将所有数据保存在 RAM 中,在需要快速定位记录和其他类似数据的环境 下,可提供极快的访问。MEMORY 的缺陷是对表的大小有限制,太大的表无法 CACHE 在内 存中,其次是要确保表的数据可以恢复,数据库异常终止后表中的数据是可以恢复的。 MEMORY 表通常用于更新不太频繁的小表,用以快速得到访问结果。

MERGE:用于将一系列等同的 MyISAM 表以逻辑方式组合在一起,并作为一个对象 引用它们。MERGE 表的优点在于可以突破对单个 MyISAM 表大小的限制,并且通过将不同 的表分布在多个磁盘上,可以有效地改善MERGE表的访问效率。这对于诸如数据仓储等VLDB 环境十分适合。

四、选择合适的字符集

选择合适的字符集,无emoji使用utf8,有emoji使用utf8mb4无emoji使用utf8,有emoji使用utf8mb4

推荐阅读:再见乱码:5分钟读懂MySQL字符集设置

五、选择合适的数据类型

这里指的是数据列的数据类型,在选择合适的数据类型时,我们应尽量满足以下条件:

  • 尽量选择小,简单的数据类型。
  • 保持可读性。
  • 尽量避免Null
  • 我们尽可能选择小的数据类型,这样会有很多好处,比如服务端处理效率,传输等都会快些。
  • 几个常见的数据类型设计
  • 固定长度的数据最好选择char类型 比如:11位的手机号码、用户md5后的密码
  • 用户年龄字段 最好选用tinyint,无符号0-255 足够使用
  • 尽可能给每个字段准备默认值,最好不能为null
  • 对于二进制多媒体数据,流水队列数据(如日志),超大文本数据不要放在数据库字段中

六、添加合适的索引

  • 命名简洁明确,可见idx_或_index作为前缀或后缀。

  • 根据业务查询(SQL语句构造的where查询)添加索引

  • 确定唯一记录的字段建立主键索引或唯一索引,否则添加普通索引
    数据重复性高的不适合建立索引

七、遵循三范式设计

数据库设计对数据的存储性能、数据的操作都有很大的关系。为了避免不规范的数据库出现数据冗余,造成插入、删除、更新操作异常 的情况,就要满足一定的规范化要求。

1、第一范式 确保每列都是不可分割

第一范式是指设计数据表的时候,确保表中的每一列都是不可分割的数据,即同一列中不能有多个值

1.1. 如果一个商城的会员的数据如下。如果我要统计查询地址的城市数据,就很是麻烦
id name address
1 李四 广东省深圳市龙华区老围新村21栋
2 张三 湖南省永州市冷水滩区天明路404栋

改造成符合第一范式的设计

id name province city area address
1 聂哥 广东省 深圳市 龙华区 老围新村21栋
2 张三 湖南省 永州市 冷水滩区 天明路404栋
1.2.一个用户表数据存储用户的联系电话,如下
id username phone
1 李四 18682395281
2 王五 18612341234,18612345678

改造成符合第一范式的设计,用户表拆成

用户主表

id username
1 李四
1 王五

联系方式表

user_id phone
1 18682395281
2 18612341234
3 18612345678

2.第二范式 确保表中的每列都和主键相关

首先要先满足第一范式,然后确保表中的数据要一定完全依赖主键,而不能只依赖主键的一部分(复合主键)。即非主键字段完全依赖主键,不能部分依赖。

雇员信息表

employee department header
jack 运营部 马云
张三 宇宙科技部 神仙

这个表设计问题:修改数据时可能发生不一致,如果让马化腾来接管运营部门,那就要修改多行数据来反映这个变化,这是很痛苦又是很容易出错的操作。另外如果没有雇员信息的话,就没有办法表示新建一个新部门。且如果我们删除了jack、和张三的记录,你发现就没有任何关于运营部的信息了

正确的设计如下

部门表

id department header
1 宇宙科技部 神仙
2 运营部 马云

雇员信息表

id employee depart_id
1 jack 2
1 张三 1
3、第三范式 确保每列都和主键列直接相关,而不是间接相关

数据表中的每一列数据都和主键直接相关,而不能间接相关

订单表

orderno member_id member member_phone
jd123 1 李四 18612345678
jd321 2 jack 18682395280

订单表里有会员的手机号码、会员姓名字段,而这些字段并不会和订单编号直接相关,而是和会员编号直接接相关,会员编号和订单编号直接相关

符合第三范式的设计

订单表

orderno member_id
jd123 1
jd321 2

会员表

id member member_phone
1 李四 18682395280
2 jack 18682391234

八、反范式设计

顾名思义,就是不按照范式设计。按照三范式设计可以减少数据的大量的冗余,但是也增加了表的数量以及关联查询次数,我们知道关联查询会使查询性能降低。

反范式设计就是根据业务需要,适当的冗余查询频率高的字段,有时候配合索引优化提高查询效率。

你可能感兴趣的:(MySQL)