两三个月没写java代码了,最近开始做一部分后台应用,主要功能是下载XML,然后切割解析保存至mysql,并重新生成小段xml文件。
保存至db时,碰到一些小问题,大文本的中文数据会出现乱码。之前解决过mysql的中文乱码问题,基本上都是因为client,connectin及server端的编码方式不一致造成的。而这次是别的普通的varchar类型的中文没有问题,但是大文本数据是乱码,找了一下相关内容,发现如果是Text文本类型的话就会没有问题
于是就专门查了下mysql下的数据类型定义:
Blob类型是二进制大对象类型,存储的内容是不做任何形式的转换而直接存储和访问。对于数码照片,视频和扫描文件等比较有用。
mysql下的字符串数据类型包括:char,varchar,long varchar,longtext。
字符数据类型的列有特定的字符集和校对。这样在存储字符串数据类型的内容时就有一个转换的过程,以便在不同的环境中访问都是相同的内容,这个转换时mysql内部的转换,是自动且透明的进行的。
所以对于文本类型的最好还是使用text类型存储,使用JPA做栏位映射可以使用:
@Lob
@Basic(fetch = FetchType.LAZY)
@Column(columnDefinition = "TEXT",name = "entry_summary")
public String getSummary() {
return summary;
}
附字符集和校对:
字符集可以简单理解为编码方案
校对:为了解决排序或字符分组的问题。字符集和校对是一对多的关系,即一个字符集有多个校对,而一个校对只属于一个字符集
属于两个不同校对的列不能比较,带有两个不同字符集的两个表达式也不能比较。
默认字符集可以在三个级别上定义:表级别,数据库级别和数据库服务器级别