阿里数据库开发规范:谁还敢说你的数据库设计的“烂”

数据库设计几个规范:

数据库命名规范、数据库基本设计规范、数据库索引设计规范、数据库字段设计规范、数据库SQL开发规范、数据库操作行为规范

数据库命名规范

1、所有数据库对象名称必须使用小写字母并用下划线分割

不同的数据库名 DbName dbname

不同的表名 Table table tabLe

2、所有数据库对象名称禁止使用MySQL保留关键字

select id,username,from,age from tb_user from是关键字 ,但是可以用单引号括起来

3、数据库对象的命名要见名识义,并且最好不要超过32个字符

例如 用户数据库mc_userdb 用户账号表 user_account

4、临时库表必须以tmp为前缀并以日期为后缀

5、备份库、备份表必须以bak为前缀并以日期为前缀

6、所有存储相同数据的列名和列类型必须一致

比如两张表中有相同的数据,那么他们列名和列类型必须是一致的

数据库基本设计规范

1、所有表必须使用Innodb存储引擎,mysql 5.6后默认存储引擎,支持事务,行级锁,更好的恢复性,高并发下性能更好

2、数据库和表的字符集统一使用UTF8,避免由于字符集转换产生的乱码

mysql中utf8字符集汉字占3个字节,ASCII码占用1个字节

3、所有表和字段都需要添加注释,使用comment从句添加表和列的备注

4、尽量控制单表数据量的大小,建议控制在500万以内,500万并不是mysql数据库的限制,

mysql最多可以存储多少万数据?目前没有做限制,这种限制取决于存储设置和文件系统

可以用历史数据归档,分库分表等手段来控制数据量大小

5、谨慎使用mysql分区表

分区表在物理上表现为多个文件没在逻辑上表现为一个表

谨慎选择分区键,跨分区查询效率可能更低

建议采用物理分表的方式管理大数据

6、尽量做到冷热数据分离,减小表的宽度

mysql限制最多存储4096列,为了是减少磁盘IO,保证热数据的内存缓存命中率,利用更有效的利用缓存,避免读入无用的冷数据

经常使用的列放在一个表中

7、禁止在表中建立预留字段

预留字段的命名很难做到见名识义

预留字段无法确认存储的数据类型,所以无法选择合适的类型

对预留字段类型的修改,会对表进行锁定,修改字段类型的成本往往大于增加

8、禁止在数据库中存储图片、文件等二进制数据

9、禁止在线上做数据库压力测试

10、禁止从开发环境,测试环境直连生产环境数据库

索引设计规范

索引对数据库的查询性能来说非常重要,查询、更新,禁止滥用索引

1、限制每张表上的索引数量,建议单张表索引不超过5个

索引并不是越多越好的,索引可以提高效率同样可以降低效率

索引可以增加查询效率,但同样也会降低插入和更新的效率

2、禁止给表中的每一列都建立单独的索引

3、Innodb是按照主键索引的顺序来组织表的

4、每个Innodb表必须有一个主键

不使用更新频繁的列作为主键,不使用多列主键

不使用uuid、MD5、hash,字符串列作为主键

主键建议使用主键自增

常见的索引列建议:

select、update、delete语句的where从句中的列

包含在order by、group by 、destinct中的字段

多表join的关联列

如何选择索引列的顺序:

联合索引是从做到右的顺序来实现的

1、区分度最高的列放在联合索引的最左侧

2、尽量把字段长度小的列放在联合索引的最左侧

3、使用最频繁的列放到联合索引的左侧

5、避免建立冗余索引和重复索引

重复索引:如 primary key(id)、index(id)、unique index(id)

冗余索引:如 index(a,b,c) index(a,b) index(a)

6、对于频繁的查询优先使用覆盖索引

覆盖索引:就是包括了所有查询字段的索引

优点:避免Innodb表进行索引的二次查找,可以把随机IO变为顺序IO加快查询效率

7、尽量避免使用外键

不建议使用外键约束,但一定在表与表之间的关联键上建立索引

外键可用于保证数据的参照完整性,但建议在业务端实现

外键会影响父表和子表的写操作从而降低性能

数据库字段设计规范

1、优先选择符合存储需要的最小的数据类型

将字符串转化为数字类型存储

对于非负数据采用无符号整形进行存储

signed int -2147483648-2147483648

unsigned int 0-2147483648

有符号比无符号多出一倍的存储空间

varchar(n) n代表字符数,不是字节数,varchar(255)=765个字节

过大的长度会消耗更多的内存

2、避免使用text\BLOB数据类型

建议text\BLOB列分离到单独的扩展表中

text\BLOB类型只能使用前缀索引

3、避免使用enum数据类型

修改enum需要使用alter语句

enum类型的order by操作效率低,需要额外操作

禁止使用数值作为enum的枚举值

4、尽可能把所有列定义为not null

索引null列需要额外的空间来保存,所以要占用更多的空间

进行比较和计算时要对null值做特别的处理

5、禁止字符串存储日期型的数据

缺点1:无法用日期函数进行计算和比较

缺点2:用字符串存储日期要占用更多的空间

使用timestamp或datetime类型存储时间,timestamp存储空间更小

6、财务的相关金额使用decimal类型

decimal类型为精准浮点数,在计算时不会丢失精度

float、double非精准浮点数

数据库SQL开发规范

1、建议使用预编译语句进行数据库操作

好处:只传参数,比传递SQL语句更高效

相同语句可以一次解析,多次使用,提高处理效率

2、避免数据类型的隐式转换

隐式转换会导致索引失效

3、利用表上已经存在的索引

4、禁止连接不同的数据库使用不同的账号,禁止垮库查询

为数据库迁移和分库分表留出余地

减低业务耦合度

避免权限过大而产生的安全风险

5、禁止使用select * 必须用select 字段列表 查询

消耗更多的CPU和io以及网络带宽资源

无法使用覆盖索引

可减少表结构变更带来的影响

6、禁止使用不含字段列表的insert语句

如,insert into t values(‘a’,’b’,’c’)

7、避免使用子查询,可以把子查询优化为join操作

子查询的结果集无法使用索引

子查询会产生临时表,如果子查询数据量大则严重影响效率

消耗过多的CPU和io资源

8、避免使用join关联太多的表

每join一个表会多占用一部分内存join_buffer_size

会产生临时表操作,影响查询效率

mysql最多关联61个表,建议不超过5个

9、减少同数据库的交互次数

10、禁止使用order by rand()进行随机排序

11、where从句中禁止对列进行函数转换和计算

对列进行函数转换和计算会导致无法使用索引

如:where date(createtime)=’20160901’

优化后:where createtime>=’20160901’

目录展示

阿里数据库开发规范:谁还敢说你的数据库设计的“烂”_第1张图片

需要更多mysql相关资料,关注公众号:Java架构师联盟,后台回复mysql即可获取,更可以查看本文档的获取方式

你可能感兴趣的:(阿里数据库开发规范:谁还敢说你的数据库设计的“烂”)