编码转换

    windows下写的代码,copy到ubuntu下,用kdevelop、gedit打开,代码的中文都显示为乱码,baidu一下 ,找到原因:
1)windows现在内核是unicode,所以只要是utf8的字符他都能正确显示;
2) windows提供default encoding for non-unicode的选项,中文用户都会选chinese,PRC, 这时windows就会用gb18030来解码中文字符。
    而ubuntu下字符编码格式是utf-8,所以正常显示中文需要转换编码。ubuntu提供了iconv命令进行编码转换:
   
   iconv -f gb18030 -t utf-8 test.cpp > newtest.cpp
   
    再打开,中文显示正常。
    写了一个脚本对当前目录的所有文件进行编码转换:
# !/bin/bash
conv()
{
    
for  file  in  $(ls) ;do
        
if  [  - d $file ];then
            cd $(eval pwd)
/ ${file}
            conv 
            cd ..
        fi
        
if  [  - f $file ];then
            iconv 
- f gb18030  - t utf - 8  ${file}  >  ${file}.new
            mv ${file}.new ${file} 
- f
        fi
    done
}

conv

   

你可能感兴趣的:(windows,File,ubuntu,脚本,encoding)