UTF-8的BOM头

来源:http://blog.csdn.net/oscar999/article/details/6280006



字符编码相关信息  http://baike.baidu.com/view/1204863.htm



UTF-8 编码的文件可以分为no BOM 和 BOM两种格式。

有bom头的存储或者字节流,它一定是unicode字符集编码。到底属于那一种(utf-8还是utf-16或是utf-32),通过头可以判断出来。

在utf-8编码文件中BOM在文件头部,占用三个字节,用来标示该文件属于utf-8编码

UTF-8的BOM是 EFBBBF,因为UE载入UTF-8文件会转成Utf16,上述的EFBBBF 在Utf16中是FFFE(Unicode-LE的BOM)

1、editplus去BOM头的方法

编辑器调整为UTF8编码格式后,保存的文件前面会多出一串隐藏的字符(也即是BOM),用于编辑器识别这个文件是否是以UTF8编码。

运行Editplus,点击工具,选择首选项,选中文件,UTF-8标识选择 总是删除签名,


然后对PHP文件编辑和保存后的PHP文件就是不带BOM的了。

2、ultraedit去除bom头办法

打开文件后,另存为选项的编码格式里选择(utf-8 无bom头),确定就ok了





utf without BOM转换成utf-8 BOM的批量处理工具

ultracodingswitch下载地址:http://www.duote.com/soft/12486.html

你可能感兴趣的:(utf-8)