linux GB2312转UTF-8 shell脚本

转载请注明来源 http://blog.csdn.net/imred/article/details/40951125

在linux下看一些txt文件经常出现一些乱码问题,所以就自己编写了一个shell脚本来将GB2312码转换成UTF-8码

#!/bin/bash
#格式:./gb2312_2_utf8.sh 路径名

IFSBACKUP=$IFS							#备份IFS变量
IFS=$(echo -en "\n\b")						#设置IFS变量不含空格,防止文件名中有空格时出现异常

dst=$(echo $1|sed 's/\/$//')					#如果路径末尾有“/”,删除掉,后面再添加
for file in $(ls "$dst"|grep .txt)
do
  gb2312file=$dst\/$file
  utf8file=$(echo "$gb2312file"|sed 's/.txt$/-utf8.txt/')
  string=$(file "$gb2312file"|grep Unicode)			#简单判断文件是否为Unicode文件,如果是,则不转换
  if [ "$string" = "" ]
  then
    iconv -f GB18030 -t utf-8 "$gb2312file" > "$utf8file"	#GB18030编码,它是GB2312的一个超集
  else
    echo "$gb2312file" is Unicode text file
  fi
done

IFS=$IFSBACKUP

exit 0

转载请注明来源 http://blog.csdn.net/imred/article/details/40951125




你可能感兴趣的:(linux,shell,编码,乱码,utf-8)