【MySQL—SQL编程】数据类型

类型属性

数据类型在数据库中扮演着基础但又非常重要的角色。对数据类型的选择将影响与数据库交互的应用程序的性能。通常来说,如果一个页内可以存放尽可能多的行,那么数据库的性能就越好,因此选择一个正确的数据类型至关重要。

首先来介绍两个属性:UNSIGNED和ZEROFILL,是否使用这两个属性对选择数据类型有着莫大的关系。

因为MySQL是用C语言编写的,所以一些在C语言里面出现的陷阱在MySQL里面也会出现。比如,在MySQL数据库中,对于UNSIGNED数的操作,其返回值都是UNSIGNED的。假设a和b是两个UNSIGNED INT,a的值为 1,b的值为 2,执行a - b的结果会等于 4294967295 ,而非 -1。

那么,怎么获得 -1 这个值呢?这需要对SQL_MODE这个参数进行设置,例如:
SET sql_mode='NO_UNSINED_SUBTRACTION';

推荐的做法是尽量不要使用UNSIGNED,因为可能会带来一些意想不到的效果。另外,对于INT类型可能存放不了的数据,INT UNSIGNED同样可能存放不了,与其如此,还不如在数据库设计阶段将INT类型提升为BIGINT类型。

另外,对于SQL_MODE的值,强烈建议开发人员在生产环境中将这个值设为严格模式,严格模式是指将SQL_MODE变量设置为STRICT_TRANS_TABLES或STRICT_ALL_TABLES中的至少一种

日期和时间类型

MySQL数据库中有五种与日期和时间有关的数据类型,各种日期数据类型所占空间如下所示。

图片.png

DATETIME 和 DATE

DATETIME占用8字节,是占用空间最多的一种日期类型。它既显示了日期,同时也显示了时间。其可以表达的日期范围为“1000-01-0100:00:00”到“9999-12-31 23:59:59”。

DATE占用3字节,可显示的日期范围为“1000-01-01”到“9999-12-31”。

从MySQL 5.6.4版本开始,MySQL增加了对秒的小数部分的支持,最大可以支持到微秒。

TIMESTAMP

TIMESTAMP占用4字节,显示的范围为“1970-01-0100:00:00”UTC到“2038-01-19 03:14:07”UTC。其实际存储的内容为“1970-01-01 00:00:00”到当前时间的秒数。

TIMESTAMP类型还有以下特点:

  • 在建表时,列为TIMESTAMP的日期类型可以设置一个默认值。
  • 在更新表时,可以设置TIMESTAMP类型的列自动更新时间为当前时间。

在MySQL 5.5及之前版本中,仅能对一个时间戳字段定义DEFUALT CURRENT_TIMESTAMP或ON UPDATE CURRENT_TIMESTAMP,但从MySQL 5.6版本开始取消了该限制。

在MySQL 5.6版本中参数explicit_defaults_for_timestamp默认值为1,在MySQL 5.7版本中参数explicit_defaults_for_timestamp默认值为0;在MySQL 5.5和MySQL 5.7版本中timestamp类型默认为NOT NULL,在在MySQL 5.6版本中timestamp类型默认为NULL。

YEAR和TIME

YEAR类型占用1字节,并且在定义时可以指定显示的宽度为YEAR(4)或YEAR(2),对于YEAR(4),其显示年份的范围为1901~2155;对于YEAR(2),其显示年份的范围为1970~2070。

TIME类型占用3字节,显示的范围为“-838:59:59”~“838:59:59”。

相关函数
NOW、CURRENT_TIMESTAMP和SYSDATE

CURRENT_TIMESTAMP是NOW的同义词,也就是说两者是相同的。SYSDATE函数返回的是执行到当前函数时的时间,而NOW返回的是执行SQL语句时的时间。

时间加减函数

如果想对时间类型值进行增加或减少,并不能直接加上或减去一个数字,而需要使用特定的函数,如DATE_ADD或DATE_SUB,前者表示增加,后者表示减少。其具体的使用方法有DATE_ADD(date,INTERVAL expr unit)和DATE_SUB(date,INTERVAL expr unit),例如:

SELCET NOW() AS now, SELECT DATE_ADD(NOW(), INTERVAL 1 DAY) AS tomorrow, SELECT DATE_SUB(NOW(), INTERVAL 1 YEAR) AS last_year)

字符类型

字符集和排序规则

可以通过命令SHOW CHARSET可以查看MySQL数据库支持的字符集,以及通过命令SHOW COLLATION来查看支持的各种排序规则,也可以通过information_schema架构下的表COLLATIONS来查看。每个字符集有一个默认的排序规则,对于排序规则有一些常用的命名规范。如_ci结尾表示大小写不敏感(caseinsensitive),_cs表示大小写敏感(case sensitive),_bin表示二进制的比较(binary)。

CHAR和VARCHAR

CHAR和VARCHAR是最常使用的两种字符串类型。一般来说,CHAR(N)用来保存固定长度的字符串,VARCHAR(N)用来保存变长字符类型。对于CHAR类型,N的范围为0~255,对于VARCHAR类型,N的范围为0~65535。CHAR(N)和VARCHAR(N)中的N都代表字符长度,而非字节长度。

VARCHAR类型存储变长字段的字符类型,其存储时需要在前缀长度列表加上实际存储的字符串长度,该长度占用1~2字节的空间。

对于多字节的字符集类型,CHAR类型和VARCHAR在存储方法上是一样的,同样需要为长度列表加上字符串的长度。

BLOB和TEXT

在数据库中,最小的存储单元是页(也可以称为块)。为了有效存储列类型为BLOB或TEXT的大数据类型,一般将列的值存放在行溢出页,而数据页存储的行数据只包含BLOB或TEXT类型数据列前一部分数据。

对于列类型为BLOB的数据,InnoDB存储引擎只存储前20字节,而该列的完整数据则存放在BLOB的行溢出页中。在这种方式下,数据页中能存放大量的行数据,从而提高了数据的查询效率。

此外,在InnoDB存储引擎内部,会将大VARCHAR类型字符串(如VARCHAR(65530))自动转化为TEXT或BLOB类型。

你可能感兴趣的:(mysql)