关于UTF-8

    Unicode编码中,19968-40869为汉字:

 

摘自一部分:

&#19968-19978一丁丂七丄丅丆万丈三
&#19978-19988上下丌不与丏丐丑丒专
&#19988-19998且丕世丗丘丙业丛东丝
&#19998-20008丞丟丠両丢丣两严並丧
&#20008-20018丨丩个丫丬中丮丯丰丱
&#20018-20028串丳临丵丶丷丸丹为主
&#20028-20038丼丽举丿乀乁乂乃乄久
&#20038-20048乆乇么义乊之乌乍乎乏
&#20048-20058乐乑乒乓乔乕乖乗乘乙

 

 

得到某汉字的编码:

String str = "黎明你好";
for(int j=0; j<str.length(); j++){
	char temp = str.charAt(j);
	System.out.print( "&#" + (int)temp);
}

输出结果:&#40654&#26126&#20320&#22909

把他保存成html,就可以显示汉字。

 

微软word转的mht文件,有的时候title不对,用工具打开直接改title,改完肯定是乱码。

用上面的代码找到他的Unicode编码,copy进去,OK了。

 

 

 

 

你可能感兴趣的:(html,J#)