第五章 MySQL的数据类型及列类型
本文作者:印第安 ([email protected])
我们要把现实世界中的各种信息转换成计算机能理解的东西,这些转换后的信息就形成了数据。例如,某人的出生日期是“1987年5月23日”,他的身高是170厘米,等等。数据不仅包括数字、字母、文字和其他特殊字符组成的文本形式的数据,而且还包括图形、图像、动画、影像、声音等多媒体数据。但使用最多、最基本的仍然是文本数据。
5.1 MySQL的数据类型
在MySQL 有几种数据类型
1、数值型
数值是诸如32 或153.4 这样的值。MySQL 支持科学表示法。科学表示法由整数或浮点数后跟“e”或“E”、一个符号(“+”或“-”)和一个整数指数来表示。1.24E+12 和23.47e-1 都是合法的科学表示法表示的数。而1.24E12 不是合法的,因为指数前的符号未给出。
浮点数由整数部分、一个小数点和小数部分组成。整数部分和小数部分可以分别为空,但不能同时为空。
数值前可放一个负号“-”以表示负值。
2、字符(串)型
字符型(也叫字符串型,简称串)是诸如“Hello, world!”或“一个馒头引起的血案”这样的值,或者是电话号码87398413这样的值。既可用单引号也可用双引号将串值括起来。
初学者往往分不清数值87398143和字符串87398143的区别。都是数字啊,怎么一个要用数值型,一个要用字符型呢?关键就在于:数值型的87398143是要参与计算的,比如它是金融中的一个货款总额;而字符型的87398143是不参与计算的,只是表示电话号码,这样的还有街道号码、门牌号码等等,它们都不参与计算。
3、日期和时间型
日期和时间是一些诸如“2006-07-12”或“12:30:43”这样的值。MySQL还支持日期/时间的组合,如“2006-07-12 12:30:43”。
4、NULL值
NULL表示未知值。比如填写表格中通讯地址不清楚留空不填写,这就是NULL值。
我们用Create table语句创建一个表(参看前面4.4章节),这个表中包含列的定义。例如我们在4.4.1节中创建了一个joke表,这个表中有content和writer两个列:
CREATE TABLE
(
content varchar(20) NOT NULL,
writer varchar(10) NULL
)
定义一个列的语法如下:
col_name col_typy [col_attributes] [general_attributes]
其中列名由col_name 给出。列名可最多包含64个字符,字符包括字母、数字、下划线及美元符号。列名可以名字中合法的任何符号(包括数字)开头。但列名不能完全由数字组成,因为那样可能使其与数据分不开。MySQL保留诸如SELECT、DELETE和CREATE这样的词,这些词不能用做列名。但是函数名(如POS 和MIN)是可以使用的。
列类型col_type表示列可存储的特定值。列类型说明符还能表示存放在列中的值的最大长度。对于某些类型,可用一个数值明确地说明其长度。而另外一些值,其长度由类型名蕴含。例如,CHAR(10) 明确指定了10个字符的长度。而TINYBLOB值隐含最大长度为255个字符。有的类型说明符允许指定最大的显示宽度(即显示值时使用多少个字符)。浮点类型允许指定小数位数,所以能控制浮点数的精度值为多少。
可以在列类型之后指定可选的类型说明属性,以及指定更多的常见属性。属性起修饰类型的作用,并更改其处理列值的方式,属性有以下类型:
■ 专用属性用于指定列。例如,UNSIGNED 属性只针对整型,而BINARY属性只用于CHAR 和VARCHAR。
■ 通用属性除少数列之外可用于任意列。可以指定NULL 或NOT NULL 以表示某个列是否能够存放NULL。还可以用DEFAULT,def_value 来表示在创建一个新行但未明确给出该列的值时,该列可赋予值def_value。def_value 必须为一个常量;它不能是表达式,也不能引用其他列。不能对BLOB 或TEXT 列指定缺省值。
如果想给出多个列的专用属性,可按任意顺序指定它们,只要它们跟在列类型之后、通用属性之前即可。类似地,如果需要给出多个通用属性,也可按任意顺序给出它们,只要将它们放在列类型和可能给出的列专用属性之后即可。
5.2 MySQL的列(字段)类型
数据库中的每个表都是由一个或多个列(字段)构成的。在用CREATE TABLE语句创建一个表时,要为每列(字段)指定一个类型。列(字段)的类型比数据类型更为细化,它精确地描述了给定表列(字段)可能包含的值的种类,如是否带小数、是否文字很多。
5.2.1数值列类型
MySQL有整数和浮点数值的列类型,如表5-1所示。整数列类型可以有符号也可无符号。有一种特殊的属性允许整数列值自动生成,这对需要唯一序列或标识号的应用系统来说是非常有用的。
类型 |
说明 |
类型 |
说明 |
TINYINT SMALLINT MEDIUMINT INT |
非常小的整数 较小整数 中等大小整数 标准整数 |
BIGINT FLOAT DOUBLE DECIMAL |
较大整数 单精度浮点数 双精度浮点数 一个串的浮点数 |
表5-1 数值列类型
每种数值类型的名称和取值范围如表5-2所示。
类型说明 |
取值范围 |
TINYINT[ (M) ] |
有符号值:-128 到127(- 27到27 - 1) |
无符号值:0到255(0 到28 - 1) |
|
SMALLINT[ (M) ] |
有符号值:-32768 到 32767(- 215到215- 1) |
无符号值:0 到 65535(0 到216- 1) |
|
MEDIUMINT[ (M) ] |
有符号值:-8388608 到 8388607(-223 到 223- 1) |
无符号值:0 到 16777215 (0 到 224 - 1) |
|
INT[ (M) ] |
有符号值:-2147683648 到 2147683647(- 231 到 231- 1) |
无符号值:0 到 4294967295(0 到 232 - 1) |
|
BIGINT[ (M) ] |
有符号值:-9223372036854775808 到 9223373036854775807(- 263 到263 -1) |
无符号值:0 到 18446744073709551615(0 到 264 – 1) |
|
FLOAT[ (M, D) ] |
最小非零值:±1.175494351E - 38 |
DOUBLE[ (M, D) ] |
最小非零值:±2.2250738585072014E - 308 |
DECIMAL (M, D) |
可变;其值的范围依赖于M和D |
表5-2 数值列类型的取值范围
各种类型值所需的存储量如表5-3所示。
类型说明 |
存储需求 |
TINYINT[ (M) ] |
1字节 |
SMALLINT[ (M) ] |
2字节 |
MEDIUMINT[ (M) ] |
3字节 |
INT[ (M) ] |
4字节 |
BIGINT[ (M) ] |
8字节 |
FLOAT[ (M, D) ] |
4字节 |
DOUBLE[ (M, D) ] |
8字节 |
DECIMAL (M, D) |
M字节(MySQL < 3.23),M+2字节(MySQL > 3.23 ) |
表 5-3 数值列类型的存储需求
MySQL 提供了五种整型: TINYINT、SMALLINT、MEDIUMINT、INT和BIGINT。INT为INTEGER的缩写。这些类型在可表示的取值范围上是不同的。整数列可定义为UNSIGNED从而禁用负值;这使列的取值范围为0以上。各种类型的存储量需求也是不同的。取值范围较大的类型所需的存储量较大。
MySQL 提供三种浮点类型: FLOAT、DOUBLE和DECIMAL。与整型不同,浮点类型不能是UNSIGNED的,其取值范围也与整型不同,这种不同不仅在于这些类型有最大值,而且还有最小非零值。最小值提供了相应类型精度的一种度量,这对于记录科学数据来说是非常重要的(当然,也有负的最大和最小值)。
在选择了某种数值类型时,应该考虑所要表示的值的范围,只需选择能覆盖要取值的范围的最小类型即可。选择较大类型会对空间造成浪费,使表不必要地增大,处理起来没有选择较小类型那样有效。对于整型值,如果数据取值范围较小,如人员年龄或兄弟姐妹数,则TINYINT 最合适。MEDIUMINT 能够表示数百万的值并且可用于更多类型的值,但存储代价较大。BIGINT 在全部整型中取值范围最大,而且需要的存储空间是表示范围次大的整型INT类型的两倍,因此只在确实需要时才用。对于浮点值,DOUBLE占用FLOAT的两倍空间。除非特别需要高精度或范围极大的值,一般应使用只用一半存储代价的FLOAT型来表示数据。
在定义整型列时,可以指定可选的显示尺寸M。如果这样,M 应该是一个1 到255的整数。它表示用来显示列中值的字符数。例如,MEDIUMINT(4)指定了一个具有4个字符显示宽度的MEDIUMINT 列。如果定义了一个没有明确宽度的整数列,将会自动分配给它一个缺省的宽度。缺省值为每种类型的“最长”值的长度。如果某个特定值的可打印表示需要不止M个字符,则显示完全的值;不会将值截断以适合M个字符。
对每种浮点类型,可指定一个最大的显示尺寸M 和小数位数D。M 的值应该取1 到255。D的值可为0 到3 0,但是不应大于M - 2。(如果熟悉ODBC 术语,就会知道M 和D 对应于ODBC 概念的“精度”和“小数点位数”)M和D对FLOAT和DOUBLE 都是可选的,但对于DECIMAL是必须的。在选项M 和D时,如果省略了它们,则使用缺省值。
5.2.2字符串列类型
MySQL提供了几种存放字符数据的串类型,
其类型如下:
类型名 |
说明 |
CHAR |
定长字符串 |
VARCHAR |
可变长字符串 |
TINYBLOB |
非常小的BLOB(二进制大对象) |
BLOB |
小BLOB |
MEDIUMBLOB |
中等的BLOB |
LONGBLOB |
大BLOB |
TINYTEXT |
非常小的文本串 |
TEXT |
小文本串 |
MEDIUMTEXT |
中等文本串 |
LONGTEXT |
大文本串 |
ENUM |
枚举;列可赋予某个枚举成员 |
SET |
集合;列可赋予多个集合成员 |
表 5-4 字符串列类型
下表给出了MySQL 定义串值列的类型,以及每种类型的最大尺寸和存储需求。对于可变长的列类型,各行的值所占的存储量是不同的,这取决于实际存放在列中的值的长度。这个长度在表中用L 表示。
类型说明 |
最大尺寸 |
存储需求 |
CHAR( M) |
M 字节 |
M 字节 |
VARCHAR(M) |
M 字节 |
L + 1字节 |
TINYBLOB, TINYTEXT |
28 - 1字节 |
L + 1字节 |
BLOB, TEXT |
216 - 1 字节 |
L + 2字节 |
MEDIUMBLOB, MEDIUMTEXT |
224 - 1字节 |
L + 3字节 |
LONGBLOB, LONGTEXT |
232 - 1字节 |
L + 4字节 |
ENUM(“value1”, “value2”, ...) |
65535 个成员 |
1 或2字节 |
SET (“value1”, “value2”, ...) |
64个成员 |
1、2、3、4 或8字节 |
表5-5 串列类型最大尺寸及存储需求
L 以外所需的额外字节为存放该值的长度所需的字节数。MySQL 通过存储值的内容及其长度来处理可变长度的值。这些额外的字节是无符号整数。请注意,可变长类型的最大长度、此类型所需的额外字节数以及占用相同字节数的无符号整数之间的对应关系。例如,MEDIUMBLOB 值可能最多224 - 1字节长并需要3 个字节记录其结果。3 个字节的整数类型MEDIUMINT 的最大无符号值为224 - 1。这并非偶然。
5.2.3日期时间列类型
MySQL 提供了几种时间值的列类型,它们分别是: DATE、DATETIME、TIME、TIMESTAMP和YEAR。下表给出了MySQL 为定义存储日期和时间值所提供的这些类型,并给出了每种类型的合法取值范围。
类型名 |
说明 |
DATE |
“YYYY-MM-DD”格式表示的日期值 |
TIME |
“hh:mm:ss”格式表示的时间值 |
DATETIME |
“YYYY-MM-DD hh:mm:ss”格式 |
TIMESTAMP |
“YYYYMMDDhhmmss”格式表示的时间戳值 |
YEAR |
“YYYY”格式的年份值 |
表 5-6 日期时间列类型
类型名 |
取值范围 |
存储需求 |
DATE |
“1000-01-01”到“9999-12-31” |
3字节 |
TIME |
“-838:59:59”到“838:59:59” |
3字节 |
DATETIME |
“1000-01-01 00:00:00” 到“9999-12-31 23:59:59” |
8字节 |
TIMESTAMP |
19700101000000 到2037 年的某个时刻 |
4字节 |
YEAR |
1901 到2155 |
1字节 |
表 5-7 日前时间列类型的取值范围和存储需求
下面举个例子:
这个例子创建一个student表,这个表中有name字段,字符类型列,不允许NULL(空值)。有Chinese、Maths和English三个整数类型列。还有个Birthday日期类型列。