删除uft-8文件bom头信息的方法

当我们保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM),而(www.111cn.net)这个bom头可能导致一些不必要的问题,下面我整理了一些关于删除uft-8文件bom头信息一些常用方法,有兴趣的朋友可进入参考。from:http://www.111cn.net/wy/96/62144.htm

如果您在修改任何PHP文件发生:
 
* 不能登入或者不能登出; * 页顶出现一条空白; * 页顶出现错误警告; * 其它不正常的情况。
 
bom文件是怎么产生呢?
 
window编辑器如果保存为utf8文件就会帮你加上BOM头,以告诉其他编辑器以utf8来显示字符
 但是在网页上并不需要添加BOM头识别,因为网页上可以使用 head头 指定(www.111cn.net)charset=utf8告诉浏览器用utf8来解释.但是你用window自动的编辑器,编辑,然后有显示在网页上这样就会显示出0xEF 0xBB 0xBF这3个字符。
 这样网页上就需要去除0xEF 0xBB 0xBF,可以使用editplus 选择不带BOM的编码,这样就可以去除了
 
bom文件头信息删除
 
我最常用的方法来处理php文件处理

':'只检测文件BOM不执行去除BOM操作
'; checkdir($basedir,$loop); function checkdir($basedir='',$loop=true){ $basedir=empty($basedir)?'.':$basedir; if($dh=opendir($basedir)){ while (($file=readdir($dh))!==false){ if($file!='.'&&$file!='..'){ if(!is_dir($basedir.'/'.$file)){ echo '文件: '.$basedir.'/'.$file .checkBOM($basedir.'/'.$file).'
'; }else{ if(!$loop) continue; $dirname=$basedir.'/'.$file; checkdir($dirname); } } } closedir($dh); } } function checkBOM($filename){ global $auto; $contents=file_get_contents($filename); $charset[1]=substr($contents,0,1); $charset[2]=substr($contents,1,1); $charset[3]=substr($contents,2,1); if(ord($charset[1])==239&&ord($charset[2])==187&&ord($charset[3])==191){ if($auto==1){ $rest=substr($contents,3); rewrite($filename,$rest); return (' 找到BOM并已自动去除'); }else{ return (' 找到BOM'); } }else{ return (' 没有找到BOM'); } } function rewrite($filename,$data){ $filenum=fopen($filename,'w'); flock($filenum,LOCK_EX); fwrite($filenum,$data); fclose($filenum); }


linux下查找包含BOM头的文件和清除BOM头命令


查找包含BOM头的文件,命令如下:
 
grep -r -I -l $'^\xEF\xBB\xBF' ./
 
这条命令会查找当前目录及子目录下所有包含BOM头的文件,并把文件名在屏幕上输出。
 
但是,删除BOM头,网上找到的命令大多不能用,比较常见的命令是:
 
grep -r -I -l $'^\xEF\xBB\xBF' /path(www.111cn.net) | xargs sed -i 's/^\xEF\xBB\xBF//;q'
 但这条命令会把除了首行之外所有的行删除,所以毫无意义。
 
经测试如下命令是可行的:
 
 find . -type f   -exec  sed -i 's/\xEF\xBB\xBF//' {} \;
 
这个命令会把当前目录及所有子目录下的BOM头删除掉。
from:http://www.111cn.net/wy/96/62144.htm

你可能感兴趣的:(PHP)