java web问题收集

1.java 中文 乱码 问号

在基于Java的编程中,经常会碰到汉字的处里及显示的问题,比如一大堆乱码或问号。 
这是因为JAVA中默认的编码方式是UNICODE,而中国人通常使用的文件和DB都是基于GB2312或者BIG5等编码,故会出现此问题。

 java web问题收集_第1张图片

1、在网页中输出中文。 
JAVA在网络传输中使用的编码是"ISO-8859-1",故在输出时需要进行转化,如: 
String str="中文"; 
str=new String(str.getBytes("GB2312"),"8859_1"); 
但假如在编译程序时,使用的编码是“GB2312”,且在中文平台上运行此程序,不会出现此问题,一定要注重。 
2、从参数中读取中文 
这正好与在网页中输出相反如: 
str=new String(str.getBytes("8859_1"),"GB2312"); 
3、操作DB中的中文问题 
一个较简单的方法是:在“控制面扳”中,把“区域”设置为“英语(美国)”。假如还会出现乱码,还可进行如下设置: 
取中文时:str=new String(str.getBytes("GB2312")); 
向DB中输入中文:str=new String(str.getBytes("ISO-8859-1"));

4、在jsp中的中文解决:

在“控制面扳”中,把“区域”设置为“英语(美国)”. 
在JSP页面中加入: 
假如还不行正常显示,则还要进行下面的转换: 
如:name=new String(name.getBytes("ISO-8859-1"),"GBK"); 
就不会出现中文问题了。 

ANSI:泛指最早每种国家语言各自实现的编码方式,各个编码互相之间不兼容,比较省空间。

ASCII:

它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO 646。可显示字符:英文大小写字符、阿拉伯数字和西文符号。

 

ISO-8859-1:

是四方国家所使用的编码机,单字节的字符集。

GB2312:

GB2312是中国国家标准的简体中文字符集。它所收录的汉字已经覆盖99.75%的使用频率,基本满足了汉字的计算机处理需要。在中国大陆和新加坡获广泛使用。

GBK:

除了完全兼容GB2312之外,还对繁体中文,不常用汉字和特殊符号进行了编码。

UTF-8:

UTF-8便于不同的计算机之间使用网络传输不同语言和编码的文字,使得双字节的Unicode能够在现存的处理单字节的系统上正确传输。

UTF-8使用可变长度字节来储存 Unicode字符,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节。

Unicode:

一种通用字符集,每个字符都用2个字节来表示,对于英文字符采用前面补0的方法实现等长兼容。

UTF-16,UTF-32:另外的unicode存储编码,结构简单,不能和ASCII混用。

BOM:一种为了跨平台设计的文件起始标记,但很多程序没去处理这个,用了BOM反而常造成问题。

 java web问题收集_第2张图片

 

2.maven用命令行部署乱码,eclipse打包部署不乱码

打包项目涉及编码格式  mvn clean package -Ponline -DskipTests=true -Dfile.encoding=UTF-8

 java web问题收集_第3张图片

解决了该问题后,顺便找了些JAVA的中文乱码的资料看了下,简单的总结下:

从Java 源代码到得到正确的结果,要经过 “Java 源代码-> Java 字节码-> 虚拟机->操作系统->显示设备”的过程。在上述过程中的每一步骤,我们都必须正确地处理中文的编码,才能够使最终显示正确的结果。

"Java 源代码-> Java 字节码":该阶段就是调用javac 进行编译的阶段,javac默认采用系统字符集,比如我们本地机器急就是GBK,如果想用其他的编码,比如UTF-8,可以加上 -encoding UTF-8

"Java 字节码-> 虚拟机->操作系统" :该阶段首先需要JRE或者JDK支持多语言(下载JRE的时候会让你选择英文版还是多语言版),然后就是虚拟机启动的时候使用什么字符集,默认也是采用 当前系统的字符集,如需要修改字符集,加上JAVA的启动参数,-Dfile.encoding=GBK

"操作系统->显示设备":该阶段主要就是需要操作系统支持显示中文就可以,就是安装了中文字体。

看到这里后重新看我们的乱码问题,我们在本地编译(Java 源代码-> Java 字节码 阶段)默认采用了GBK字符集,而"Java 字节码-> 虚拟机->操作系统" 阶段是在法国服务器上进行,也是采用了默认的字符集,但这里的默认字符集确实Cp1252,因字符集不一致,所以就会乱码。

System.getProperty("file.encoding")  得到当前系统字符集
content.getBytes(System.getProperty("file.encoding")),"GBK") 通过当前字符集转码

 

 locale             //查看当前系统的语言环境
locale -a          //查看系统支持的所有语言
/etc/sysconfig/i18n  //修改操作系统编码
vim /etc/profile        //修改全局,可影响jetty/resin
source /etc/profile

 

你可能感兴趣的:(java web问题收集)