1 命名规范
1.1表命名
- 实体表使用尽量准确的英文单数表示,若一个英文单词不足以表示表的意义,可用下横杠分割,小写命名。(目前都是以t_开头,那就继续吧)
- 按日期时间分表须符合_YYYY[MM][DD]格式
这也是为将来有可能分表做准备的,比如t_table_name_201403。不具有时间特性的,直接以 t_tbname_001 这样的方式命名。
1.2字段
字段命名含义明确,小写字母,下横杠分割, 字段名字中不要含有表名(表已经代表了这个实体的含义)。
1.3索引
非唯一索引命名为idx_列名1_列名2
唯一索引命名为uk_列名1_列名2
如果列名太长或列太多,可酌情精简
表名、字段名,索引名支持最多64个字符,但为了统一规范、易于辨识以及减少传输量,禁止超过32个字符。
2 库表基础规范
2.1存储引擎
统一使用Innodb存储引擎
5.5版本开始mysql默认存储引擎就是InnoDB,5.7版本开始,系统表都放弃MyISAM了
2.2字符集
字符集统一使用UTF8。如果遇到EMOJ等表情符号的存储需求,可使用UTF8MB4字符集
2.3注释
所有表和字段都尽量需要添加注释
2.4主键
所有表都必须要显式指定主键
主键尽量采用自增方式,InnoDB表实际是一棵索引组织表,顺序存储可以提高存取效率,充分利用磁盘空间。并且有利于bufferpool中储存更多的二级索引记录(二级索引里包含了主键值)
3 字段规范
3.1字符串类型
类型 范围(字节) char(N) 0-255 varchar(N) 0-65535 text 0-65535
注:N为字符数而不是字节数,根据编码不同占用不同的字节,UTF8编码下,一个中文字符占用3个字节,GBK编码下一个中文字符占用2个字节
varchar类型保存可变长度字符串,范围0-65535(但受到单行最大64kb的限制),尽量根据业务需求定义合适的字段长度,不要为了图省事,直接定义为varchar(1024)或更长等等。
eg.用varchar(30)去存放abcd,实际使用4+1=5个字节,因为还需要使用额外1个字节来标识字符串长度(0-255使用1个字节,超过255需要2个字节)。char类型是使用固定长度空间进行存储,不容易产生碎片,范围0-255。
eg.CHAR(30)能放30个字符,存放abcd时,尾部会以空格补齐,实际占用空间 30个字节 。检索它的时候尾部空格会被去除。对于text字段,MySQL不允许有默认值。varchar允许有默认值
varchar(768+)和text在存储形态是一样的(都是需要额外的2个字节来标识字符串长度,且都会进行overflow存储)
特别注意,varchar大字段一样的会降低性能,所以在设计中还是一个原则大字段要拆出去,主表还是要尽量的瘦
3.2 整数类型
类型 字节 最小值 最大值 (带符号的/无符号的) (带符号的/无符号的) TINYINT 1 -128 127 0 255 SMALLINT 2 -32768 32767 0 65535 MEDIUMINT 3 -8388608 8388607 0 16777215 INT 4 -2147483648 2147483647 0 4294967295 BIGINT 8 -9.22337E+18 9.22337E+18 0 1.84467E+19
- 所有整数类型的字段尽量使用合适的大小。可以为整数类型指定宽度(比如int(11),这种括号里的值),但大多数时候没有意义,它不会限制值的合法范围
- 可以使用tinyint存储状态值。比enum减少cpu开销,且容易维护。
- 建议使用 UNSIGNED 存储非负数值
相比不使用 unsigned,可以扩大一倍使用数值范围
3.3 实数类型
- 可以使用decimal存储比bigint还要大的整数
- float和double类型是不精确的类型,支持使用标准的浮点运算进行近似计算,float占4个字节,double占8个字节
- decimal类型用于存储精确的小数,占用字节数按照小数和整数分别计算,每9位数占4字节,小数点占一个字节。有效数字65,小数部分最多30。
- 使用decimal 需要额外的空间和计算开销,所以应该尽量只是在对小数进行精确计算的时候才使用,例如存储财务数据。如果数据量大,也可以考虑使用bigint来存储,这样能避免使用浮点存储不精确和decimal精确存储代价高的问题。
3.4 时间类型
时间类型统一用datetime,如涉及时区,则用timestamp
每个表中都必须包含2个字段:create_time和edit_time
create_time datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
edit_time datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改时间'
Datetime 和 Timestamp 几乎以同样的方式工作。两种都保存日期和时间信息,毫秒部分最高精确度都是 6 位数。在表示日期/时间部分时 Timestamp (4 字节) 比 Datetime (5 字节) 少使用 1 字节。当保存毫秒部分时两种都使用额外的空间 (1-3 字节)。Timestamp 存储范围从 ‘1970-01-01 00:00:01.000000’ 到 ‘2038-01-19 03:14:07.999999’ 。 Datetime 存储范围从 ‘1000-01-01 00:00:00.000000’ 到 ‘9999-12-31 23:59:59.999999’ 。
3.5 NOT NULL和默认值
除了必须为NULL,建议字段都定义为NOT NULL。因为null值会影响cordinate统计,影响优化器对索引的选择,而且需要额外的存储空间。
3.6 同一意义的字段定义必须相同
同一意义的字段定义包括字段类型和长度范围必须相同
比如t_item表中的id和t_item_batch表中的item_id,需要定义成一样的类型。如果类型不一样,关联的时候会发生强制类型转换,不会用到索引。如果范围不一样,那么一个表正常插入,另一个表就超出范围报错了。
4 SQL使用规范
4.1 不允许select * 查询
只取出需要的字段,减少网络带宽消耗,能有效利用覆盖索引,表结构变更对程序基本无影响
4.2 不建议使用join,left join
请将复杂查询拆分为多个简单查询,减少锁表的范围和时间
4.3 拒绝高并发的计数器
不允许在mysql中进行高并发的类计数器行为. 比如:字段+1操作
4.4 禁止where条件中使用函数
where条件中不要使用函数或进行(隐式)强制转换
例如,
1、date(create_time)='2016-11-01'改用create_time>='2016-11-01' and create_time>'2016-11-02'
2、t_preference表的latitude_no字段是varchar类型,所以在使用的时候一定要在值上加引号latitude_no='341245',不能直接latitude_no=341245,这样会无法利用索引
4.5 不建议使用union,union all
数据量大的情况下,或者有大字段的表,不建议使用union,union all,会创建磁盘上的临时表,影响性能。
4.6 不允许在数据库端进行复杂计算
影响sql效率,cpu消耗严重
4.7 拒绝大事务
比如在一个事务里进行多个select,多个update,如果是高频事务,会严重影响MySQL并发能力,因为事务持有的锁等资源只在事务rollback/commit时才能释放。
4.8 尽量采用批量SQL
减少与数据库交互的次数,尽量采用批量SQL语句,但需要控制好个数。
例如INSERT INTO VALUES(),(),(),合并插入。
本文参考
http://seanlook.com/2016/05/11/mysql-dev-principle-ec/