设计mysql表结构的时候,有很多数据类型供我们选择,下面来介绍下mysql8中常用的数据类型。
类型 | 大小 | 有符号范围 | 无符号范围 |
---|---|---|---|
TINYINT | 1 字节 | -128 to 127 | 0 to 255 |
SMALLINT | 2 字节 | -32768 to 32767 | 0 to 65535 |
MEDIUMINT | 3 字节 | -8388608 to 8388607 | 0 to 16777215 |
INT | 4 字节 | -2147483648 to 2147483647 | 0 to 4294967295 |
BIGINT | 8 字节 | -9223372036854775808 to 9223372036854775807 | 0 to 18446744073709551615 |
整数类型有可选的unsigned属性,表示不允许负值,这可以使正数的上限提高一倍(还多1)。有符号和无符号类型使用相同的存储空间,并且具有相同的性能,因此可以根据实际情况选择合适的类型。
mysql可以为整数类型指定宽度,例如INT(11),对大多数应用来说这是没有意义的:它不会限制合法范围,只是规定了mysql的一些交互工具(例如mysql命令行客户端)用来显示字符的个数。对于存储和计算来说,INT(1)和INT(20)是相同的。
类型 | 大小 | 有符号范围 | 无符号范围 |
---|---|---|---|
FLOAT | 4字节 | -3.402823466E+38 to -1.175494351E-38, 0, and 1.175494351E-38 to 3.402823466E+38 | 0, and 1.175494351E-38 to 3.402823466E+38 |
DOUBLE | 8字节 | -1.7976931348623157E+308 to -2.2250738585072014E-308, 0, and 2.2250738585072014E-308 to 1.7976931348623157E+308 | 0, and 2.2250738585072014E-308 to 1.7976931348623157E+308 |
DECIMAL | ? | 根据M和D的值 | 根据M和D的值 |
注意FLOAT和DOUBLE可表示的范围不是完全连续的浮点数,由于精度的限制,有些极小的小数是表示不了的,浮点相关的内容可以参考我的另一篇文章神奇的二进制(二)浮点数。
DECIMAL类型最多允许65个数字,表示为DECIMAL(M,D)的格式。例如DECIMAL(5,2)表示最多保存5个数字,其中2个是小数,表示的范围在-999.99 到 999.99之间。如果小数位数D为0,则DECIMAL值不包含小数点或小数部分。
FLOAT和DOUBLE类型只能使用标准的浮点运算进行近似运算,如果需要精确运算,例如金额计算,则需要使用DECIMAL类型。
因为cpu不支持对DECIMAL的直接计算,所以在mysql5.0以上的版本中,mysql服务器自身实现了DECIMAL的高精度计算。相对而言,cpu直接支持原生的浮点计算,所以浮点计算明显更快。
涉及到金额计算,在数据量比较大的时候,可以考虑用BIGINT代替DECIMAL。例如金额单位精确到分,99.99可以用9999表示,以分为单位存储在BIGINT字段里,这样可以同时避免浮点数计算的不精确和DECIMAL精确计算代价高的问题。
类型 | 大小 | 用途 |
---|---|---|
CHAR | 0-255 字节 | 定长字符串 |
VARCHAR | 0-65535 字节 | 变长字符串 |
BINARY | 0-255 字节 | 定长二进制 |
VARBINARY | 0-65535 字节 | 变长二进制 |
TINYBLOB | 0-255 字节 | 变长二进制 |
BLOB | 0-65535 字节 | 变长二进制 |
MEDIUMBLOB | 0-16,777,215 字节 | 变长二进制 |
LONGBLOB | 0-4,294,967,295 or 4GB (232 − 1) 字节 | 变长二进制 |
TINYTEXT | 0-255 字节 | 变长字符串 |
TEXT | 0-65535 字节 | 变长字符串 |
MEDIUMTEXT | 0-16,777,215 字节 | 变长字符串 |
LONGTEXT | 0-4,294,967,295 or 4GB (232 − 1) 字节 | 变长字符串 |
CHAR类型是定长的,会根据定义的长度分配空间。当存储CHAR值时,mysql会删除所有的末尾空格。
CHAR很适合存储很短的字符串,或者所有的值都接近同一个长度,例如,CHAR非常适合存储密码的MD5的值,因为这是一个定长的长度。对于经常变动的数据,CHAR也比VARCHAR更好,因为定长的CHAR类型不容易产生碎片。
对于非常短的列,CHAR比VARCHAR在存储空间上也更有优势,例如用CHAR(1)来存储只有Y和N的值,如果采用单字节字符集只需1个字节,但是VARCHAR(1)却需要2个字节,因为还需要一个记录长度的额外字节。
VARCHAR用于存储可变长的字符串,它比定长类型更节省空间。VARCHAR需要使用1或2个额外字节记录字符串的长度:如果列的最大长度小于或等于255字节,则只使用1个字节表示,如果列长度大于255字节,则需要使用2个字节表示长度。
假设采用latin字符集,一个VARCHAR(10)的列需要11个字节空间存储,一个VARCHAR(1000)的列则需要1002个字节空间存储,因为需要存储2个字节的长度信息。
哪些情况使用VARCHAR类型比较合适呢?
BINARY和VARBINARY它们存储的是二进制字符串。二进制字符串和常规的字符串非常相似,但是二进制字符串存储的字节码而不是字符。填充也不一样:mysql填充BINARY采用的是 \0(零字节)而不是空格,在检索时也不会去掉填充值。
当需要存储二进制数据时,可以使用 BINARY或VARBINARY,mysql比较二进制字符串时,每次按一个字节,并且根据该字节的数值进行比较。因此二进制比较比字符串比较简单的多,所以也更快。
BLOB和TEXT都是为了存储很大数据而设计的字符串数据类型,分别采用二进制和字符方式存储。
二进制类型:TINYBLOB,BLOB,MEDIUMBLOB,LONGBLOB
字符类型:TINYTEXT,TEXT,MEDIUMTEXT,LONGTEXT
与其他类型不同,mysql把每个BLOB和TEXT值当做一个独立的对象处理。存储引擎在存储是通常会做特殊处理,当BLOB和TEXT值太大时,InnoDB会使用专门的“外部”存储区域来进行存储,此时每个值在行内需要1~4个字节存储一个指针,然后在外部存储区域存储实际值。
BLOB和TEXT家族之间仅有的不同是,BLOB存储的是二进制数据,没有排序规则和字符集;而TEXT存储的是字符,有排序规则和字符集。
mysql对BLOB和TEXT列进行排序和其他数据类型不同:它只对每个列的前max_sort_length字节而不是整个字符串做排序。如果只需要排序前面的一小部分字符,则可以减少max_sort_length的值,或者使用ORDER BY SUBSTRING(column,length)。
mysql不能将BLOB和TEXT列全部长度的字符串进行索引,也不能使用这些索引消除排序。
类型 | 大小 | 范围 | 格式 | 用途 |
---|---|---|---|---|
DATE | 3 字节 | ‘1000-01-01’ to ‘9999-12-31’ | YYYY-MM-DD | 日期值 |
TIME | 3 字节 | ‘-838:59:59’ to ‘838:59:59’ | hh:mm:ss | 时间值 |
YEAR | 1 字节 | 1901 to 2155 | YYYY | 年份值 |
DATETIME | 8 字节 | ‘1000-01-01 00:00:00’ to ‘9999-12-31 23:59:59’ | YYYY-MM-DD hh:mm:ss | 日期和时间值 |
TIMESTAMP | 4 字节 | ‘1970-01-01 00:00:01’ UTC to ‘2038-01-19 03:14:07’ UTC | YYYY-MM-DD hh:mm:ss | 日期和时间值 |
DATETIME使用8个字节的存储空间,和时区无关。
TIMESTAMP使用4个字节的存储空间,显示的时间依赖时区,保存了从1970年1月1号午夜(格林尼治标准时间)以来的秒数,它和unix的时间戳相同。TIMESTAMP只能表示从1970年到2038年。
如果插入和更新数据时没有指定TIMESTAMP的值,mysql会默认的更新TIMESTAMP的值当前系统时间。
类型 | 范围 |
---|---|
BIT | 1 to 64 位 |
BIT(1)定义一个包含1个位的数据,BIT(2)包含2个位,以此类推,最大长度为64个位。
mysql把BIT当做字符串类型,而不是数字类型。当检索BIT的值时,结果是对应二进制表示的ASCII码转换后的字符,然而在数字上下文场景中检索的时候,会使用二进制表示的数字。
例如,如果存储一个值b’00111001’(十进制的值为57)到BIT(8)的列并检索它时,得到的结果是9(9的ASCII码是57),如果对该字段进行加减,则返回结果57。
mysql8支持直接存储json格式字符串,对应的是json数据类型。
对应json数据类型的操作方法有JSON_SET(), JSON_REPLACE(), JSON_REMOVE() 等,详情请见官方文档https://dev.mysql.com/doc/refman/8.0/en/json.html。
mysql设计表的数据类型的时候,下面几个简单的原则有助于设计出好的数据类型:
参考资料:
《高性能MYSQL(第三版)》
mysql官方文档