ubuntu12.04 ThundBird导入csv文件与乱码问题,gedit乱码问题

一、Ubuntu12.04 ThundBird导入csv文件与乱码问题

系统环境:ubuntu12.04

面向人群:有一点点编程基础的读者

相关软件:ThunderBird, Emacs

问题描述:对于windows下由outlock导出的csv文件,用雷鸟直接导入时会出现中文乱码

解决方案:1.  下载来的CSV文件打开如图所示

                                  

                    2.  用Emacs打开(Emacs一般会自动转码)          

                   3. 全选内容,然后点击Copy按钮

                           

                          

             4. 新建一个空白文本文档,将内容复制进去

       

             5. 关键 一步:将中间的逗号再增加加三个(注意是英文逗号),如

                    息,[email protected]                ----->          息,,,,[email protected]

                  所以如果对于大批量的数据,对于开发人员来说,写一段小代码可以很快实现这个功能

                      ubuntu12.04 ThundBird导入csv文件与乱码问题,gedit乱码问题_第1张图片


         6. 然后thunderbird导入通讯录,会看到

                  ubuntu12.04 ThundBird导入csv文件与乱码问题,gedit乱码问题_第2张图片

                     知道为什么要用 四个逗号 了吧?就是要让email处在“主要电子邮件”一栏的位置上


          7. OK,Finish!



二、关于gedit显示乱码问题

ubuntu下汉字是以UTF-8为编码的,但实际许多来自Windows的文件编码都是GB*(GB18030 GBK GB2312),许多时候变成了乱码,

另外,GB2312相对字库小一点。

总结了网上几种方法:

1、用gedit打开一个编码为GBK的文档,保存的时候,选择对应的字符编码


2、在终端输入dconf-editor来配置gedit的字符编码

->org->gnome->gedit->preference->encodings修改auto-detected为['GB2312', 'UTF-8', 'CURRENT', 'ISO-8859-15', 'UTF-16']

show in Menu['GB2312', 'GBK', 'ISO-8859-12']

以上最好将UTF-8放在最开始的地方,表示gedit默认选择UTF8编码格式来保存数据。


3、不少人经过上述设置gedit就正常了,但是也有情况gedit还是在显示乱码,可能是系统不支持GB18030,添加

GB18030支持的方法如下:

sudo vim /var/lib/locales/supported.d/zh_hans

加入以下配置参数:

zh_CN.GB18030 GB18030
zh_CN.GBK GBK
zh_CN.GB2312 GB2312
zh_HK.BIG5 BIG5
zh_TW.BIG5 BIG5
然后执行 sudo locale-gen

提示以下信息,成功了(可能比较慢,耐心等待)
zh_CN.GB18030… done
zh_CN.GBK… done
……


4、vim /etc/environment


LANG="zh_CN.UTF-8"
改成
LANG="zh_CN.GB18030"


5、还有种可能情况是字符编码虽然选择对了,但是如果存在格式不对的话,可能显示的总是乱码。


参考文章地址

http://blog.csdn.net/yangxy81118/article/details/8088202

http://blog.sina.com.cn/s/blog_490eb4170100x9vl.html

http://www.linuxdiyf.com/viewarticle.php?id=193950



你可能感兴趣的:(ubuntu12.04 ThundBird导入csv文件与乱码问题,gedit乱码问题)