MySQL数据类型的作用:
对于数据类型分类,这里简单分为数值类型(入BIT,BOOL,INT),文本,二进制类型(如CHAR、VARCHAR),时间日期(DATE),String类(入ENUM类型)。
不同的类型所占字节数都是不一样的,如TINYINT所占字节数为1,而INT所占字节数为4,同时数值范围也是有区别,这些都需要我们去注意。
有符号tinyint范围测试
创建一个表,表当中包含一个tinyiny类型的列,默认其为有符号类型。
由于tinyint类型占用1字节,因此有符号tinyint的取值范围为 -128~127,插入该范围内的数据时都能插入成功。
如果插入的数据不在-128~127的范围内,那么插入数据时就会产生保错。
无符号tinyiny范围测试
创建一个表,表当中包含一个tinyiny类型的列,并指定其为无符号类型。
如果插入的数据不在0~255范围时,会报错。
对于MySQL,如果我们插入不合法的数据,MySQL一般都是直接拦截,而不是像C语言那样去截断数据。
反过来,我们如果已经有数据被插入到MySQL了,一定是插入的合法的数据。
所以MySQL中,数据类型本身也是一种约束,约束程序员尽可能地进行正确地插入,约束使用者,如果你不是一个很好的使用者,MySQL也能保证数据插入的合法性。
用时,我们还是尽量不适用unsigned。比如,对于int类型存不下的数据,int unsigned同样存不下,与其如此,还不如在设计时,将int类型提升为bigint类型。
bit类型的显示方式
创建一个表,表当中包含一个int类型的id列和一个8位bit类型的a列。
向表中插入一条记录,记录中指定id和a的值均为10,插入记录后查看表会发现a的值显示的并不是10。
根本原因是因为bit类型在显示时,是按照ASCII码对应的值进行显示的,而在ASCII码表中10对应的是控制字符LF,表示换行的意思。如果向表中插入记录时指定id和a的值均为65,由于ASCII码表中65对应的是字符A,因此插入记录后查看表就会发现a的值为A。
float[(m, d)] [unsigned] : M指定显示长度,d指定小数位数,占用空间4个字节
举个例子
此时要求浮点数小数位数是两位。
如果插入得到是23.456,那么会四舍五入为23.46。
如果插入99.995那就不允许了,因为这个数在四舍五入之后是不合法的。
总结一下就是:float(4,2)表示的范围是-99.99 ~ 99.99,MySQL在保持值时会进行四舍五入,所以实际可插入的范围为-99.994 ~ 99.994。
而如果是无符号float类型得到取值范围,实际就是把对应有符号float类型中的负数部分全部拿走了,因此float(4,2)的取值范围为0 ~ 99.99,实际可插入的范围为0 ~ 99.994。
decimal的精度更高
decimal和float类型的使用方式一样,但decimal的精度比float跟高。
创建一个表,表当中分别包含一个float(10,8)的列和一个decimal(10,8)的列。
向表中插入一条记录,指定float和decimal的值均为23.12345612,但最终查表时发现decimal保持了数据的原貌,而float则会存在一定的精度损失。
char(L): 固定长度字符串,L是可以存储的长度,单位为字符,最大长度值可以为255
如果插入汉字,对于gbk编码一个占用2个字节,utf8编码一个汉字占用3个字节。
而我们这里插入两个汉字能够成功,这说明对于char单位为字符,mysql的字符与C/C++语言不同,mysql的字符代表的是符号,所以能够插入成功。
总结就是char(2)表示可以存放两个字符,可以是字母或者汉字,但是不能超过两个。而char()括号内的值最多只能是255。
varchar(L): 可变长度字符串,L表示字符长度,最大长度65535个字节(mysql存储char类型,utf8默认是3字节,65535/3 = 21845)
举个例子
varchar类型最多占用65535字节,其中有1 ~ 2 的字节用于表示实际数据长度,还有1字节来存储其他控制信息,因此varchar类型的有效字节数为65532字节。
而varchar类型可指定的字符个数上限,与表的编码格式有关:
因此在定义编码格式为utf8的表时,varchar(L)中的L如果超过了21844,则会产生报错。
而在定义编码格式为gbk的表时,varchar(L)中的L如果超过了32766,则会产生报错。
char和varchar比较
char和varchar比较如下:
如何选取char和varchar?
char和varchar的优缺点如下:
需要要存储的数据是定长的,那么就使用char类型进行存储,比如身份证号码、手机号等。如果要存储的数据是变长的,那么就使用varchar类型进行存储,比如名字、地址等。
三种时间日期类型
常用的三种时间日期类型如下:
创建一个表,表当中包含date、datetime和timestamp三种时间日期类型的列。
查看表结构可以看到,timestamp类型的t3列是不允许为空的,它的默认值为CURRENT_TIMESTAMP。
因此如果插入数据时不插入t3列,那么就会自动插入当前的时间戳。
timestamp的使用
创建一个评论表,表当中包含评论人的昵称、评论的内容和评论的发布时间。
向评论表中插入记录时,只需要指明评论人的昵称和评论的内容,评论的发布时间默认就会设置成该记录的插入时间。
如果评论人修改了评论内容,那么就需要对其评论表进行更新,更新表的同时评论的发布时间也会更新为修改表的时间。
enum和set类型
enum和set的类型区别如下:
比如人的性别只能从男和女中进行二选一,因此可以定义成enum类型,而人的爱好在提供的选项中可能存在多个,因此可以定义成set类型。
调查表案例
创建一个调查表,表中包含被调查人的姓名、性别和爱好。
向表中插入记录时,被调查人的性别只能从男和女中进行二选一,被调查人的爱好可以从提供的若干个选项中进行多选一或者多选多,多个爱好直接需要通过英文逗号隔开。
通过数字设置num
在插入记录时,除了通过指明男女来设置性别,还可以通过插入数字1和2来设置性别。
根本原因在于,MySQL处于效率考虑,在存储enum值时实际存储的都是数字,enum中提供的选项值依次对应数字1、2、3 … 最多65515个。因此在设置enum值时可以通过数字的方式进行设置。
通过数字设置set
在插入记录时,除了通过指明多个选项来设置爱好,还可以通过数字的方式来设置。
因为MySQL存储set值时实际存储的也是数字,set中提供的选项值依次对应数字1、2、4、8、…,最多64个,因此在设置set值时可以通过数字的方式进行设置。
注意:
enum和set查找
如果想要筛选出调查表中所有女同志的信息,那么直接在筛选时指明 gender=‘女’ 即可,因为enum类型的值只能多选一。
但如果要筛选出调查表中爱好写代码的人的信息就比较麻烦了,如果继续使用上述方式,那么最终筛选出来的是爱好仅为写代码的人的信息。
这时就需要借助 find_in_set(str, strlist) 函数,该函数的作用是查询strlist中是否包含str,如果包含则返回str在strlist中的位置(从1开始),否则返回0。
通过select可以对 find_in_set 函数进行验证,依此查找集合a,b,c中是否包含字符a、b、d,这时在查找字符a和b时就会得到其在集合的下标,而在查找字符d时就会得到0值。