ubuntu 修改txt文件编码方式(iconv)

  1. 查看文件编码方式
    file **.txt
    这里写图片描述

  2. 修改文件编码方式
    2.1编码的问题
    GB2312是国家制定的汉字编码标准,使用双子节进行编码,共收入6763个汉字和682个非汉字图形字符。GBK即对国标编码的扩展,在GB2312的基础上进行扩展形成的,使用双子节编码方式,共收入21003个汉字,从而大大满足了汉字使用的需要。
    如上图所示:
    文件编码为iso8859
    ps:我想直接iso8859转换编码不行,于是曲线救国了一下,说没有这个字符集,可能是我打错了吧
    iso8859采用单字节编码
    gb2312采用双字节编码,兼容iso8859
    而GBK是对gb2312的扩展,在双字节上增加了更多的汉字
    所以可以采用GBK的方式进行转码
    最好提前备份一下
    cp /home/ubuntu/Downloads/test2.txt /home/ubuntu/Downloads/test2cp.txt

    开始修改

 sudo iconv -f 'gbk' -t 'utf-8' 源文件 > 目标文件

比如:sudo iconv -f ‘gbk’ -t ‘utf-8’ Downloads/test2.txt > Downloads/123.txt
这里写图片描述
可以看到文件编码方式的改变

你可能感兴趣的:(编码,转码,iconv,ubuntu)